IT之家 5 月 20 日消息,据央视财经今日报道,近期,本田、日产、丰田陆续公布 2025 财年年报。其中, 本田挂牌上市近 70 年来首次亏损 ,亏损额为 4143 亿日元(现汇率约合 177.61 亿元人民币);日产亏损 5331 亿日元(现汇率约合 228.53 亿元人民币),连续两年巨亏;丰田虽未亏损,但财报数据显示,2025 财年净利润 3.85 万亿日元(现汇率约合 1650.46 亿元人民币),同比下降近两成。 在此背景下,日本汽车行业集体调低 2026 财年利润预期。在多重冲击下,日本汽车制造业正遭遇盈利“寒流”。日本《日经亚洲评论》近日报道称,受地缘冲突、关税压力、供应链风险等多重因素影响,日本汽车制造业利润大幅缩水, 2026 财年的利润可能接近腰斩 。 报道还提到,丰田、本田、日产、铃木、马自达、斯巴鲁和三菱汽车 7 家日本主要汽车公司预计 2026 财年(2026 年 4 月至 2027 年 3 月内),实现总计 3.9 万亿日元(现汇率约合 1671.89 亿元人民币)的净利润, 这一数据较历史最高的 2023 财年的 7.54 万亿日元(现汇率约合 3232.32 亿元人民币)大幅下降 48% 。 此外,中东紧张局势导致霍尔木兹海峡航运受阻,全球能源与原材料价格暴涨,持续侵蚀企业盈利空间。 另据IT之家此前报道 ,日产汽车 4 月 27 日公布,在截至 2026 年 3 月的 2025 财年,其合并净亏损为 5500 亿日元 (现汇率约合 235.78 亿元人民币),上一财年净亏损为 6708 亿日元(现汇率约合 287.57 亿元人民币)。日产目前正推动经营重建,已经提出一轮结构改革方案,计划在全球裁减 2 万人,并削减 7 座工厂。 相关阅读: 《 本田上市近 70 年来首次年度亏损,2026 财年净亏损 4239 亿日元 》 《 日产汽车连续两年亏损,2025 财年净亏 5500 亿日元同比收窄 》
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 整个项目没有一行古法编程,就不截图了 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 家里这台23年组的小Server也没有派上特别大的用场,4张2080ti,1T DDR4内存。虽然能直接跑跑Qwen,养养龙虾,但还是和主流大模型能力差距不小。此外去年ktransformers刚开源的时候就尝试过run一下DeepSeek-V3/R1,量化版的能力也没有多好。 而在2026年,大人,时代变了。Top-tier的token管够,人负责输出idea,没什么是做不了的。所以——为大家奉上一个2W人民币的本地化DeepSeek-V4-Flash方案。 终极目标 在一台2023 年组的,成本不到 2 万元人民币的 4×RTX 2080 Ti (22G魔改版)老机器上,跑通 DeepSeek-V4-Flash 284B。 这台机器没有 NVLink,没有 BF16/FP8/FP4 tensor core,只有PCIe Gen3,CPU 是双路 Xeon E5-2696 v4,AVX2-only。如果只看硬件参数,这件事看上去不太像是一个正常目标。因为今天绝大多数 frontier-scale open MoE的默认前提,都是更新的 GPU、更快的互联、更现代的低精度格式,以及一整套围绕这些硬件假设构建的 kernel stack。 要搞定这件事,比起租个H100直接拉下来vllm/sglang的docker镜像部署,可谓重重阻碍。事实上在DeepSeek-V4发布当天,我就尝试把vllm和sglang的未合入PR(so called 0-day support?)都试了一下,一切都很理所当然: 不支持sm_75 tilelang无法编译 flashinfer/flash-attn都不支持 … 即便是尝试部分组件重写基本上也不可能。转头去看了下ktransformers,彼时还没支持,另外再看看我们这个E5-2696的老CPU配上PCIE3.0,好像在做一件不可能的事? DeepSeek-V4-Flash的可能性 事实上25年对DeepSeek-V3的尝试,让我几乎断了让这台“老爷车”拉千亿模型的想法,但是DeepSeek-V4-Flash的规格一放出,13B的activate参数又让人觉得有可行性了。 让我们看一下DeepSeek-V4的架构图,一以贯之的极致性价比追求,让V4-Flash带来了这些: MoE:routed experts可以天然异构放到host内存,且权重是FP4。 Top6激活:极少的算力需求,甚至2080ti也足够支撑。 SWA + CSA + HCA 三种混合Attention:解决超长上下文的 O (n²) 复杂度与显存爆炸问题,将KVCache显存占用与Attention计算量降为Deepseek-V3.2的10%以下。 有了模型结构带来的天然优势,对于显存和算力的需求基本上都可以压到一个非常低的水平,下面是这套方案的一个overview: 异构存储,使用host内存放置routed experts,88G显存完全足够embedding+attention+shared expert+head的需求,还可以留有超过2/3的显存给kv cache使用 TP+EP,4卡自然要充分并行执行,这种一体机的配置自然是TP打底,EP则是按4卡进行分组,虽然先放在host侧,但是后面同时提供了CPU计算和H2D+GPU计算两个选择,取性能更优的方案。 逻辑PD分离,4卡虽然不足以做真实的P-D实例,但是Prefill是Computing-bound,Decode是Memory-bound,需要完全不同的算子实现。 充分设计计算、通信、内存搬运的overlap,还要充分考虑没有nvlink全部走pcie的限制。 至此,一套需要在异构、切分、Overlap等等细节充分打磨的方案也算成型了。 老硬件without新软件 补齐软件栈缺失 前面提及过,vllm/sglang等推理框架是不考虑这种老旧硬件的,而lmdeploy这样支持老硬件的库也没第一时间支持DeepSeek-V4,只能自力更生了。从DeepSeek-V4官方库的代码开始,先尝试run起来。不出意外地,tilelang根本不支持sm_75,所有官方实现的kernel均不可用,包括: act_quant:给 FP8/FP4 linear 和 KV 低精度路径提供 activation 量化 fp4_act_quant: 给 compressor/indexer 的 FP4/QAT 路径做低精度模拟 fp8_gemm:FP8 act × FP8 weight GEMM fp4_gemm:FP8-quant act × FP4 packed weight GEMM sparse_attn:基于 top-k KV 的 sparse attention hc_split_sinkhorn:HC mixing 的 pre/post/comb 生成 这些算子又可以分为两部分: 功能模块的自定义算子 低精度GEMM算子 既然没有,就让天才程序员手搓吧,首先生成一版pytorch接口的小算子版本,保证精度ok,然后逐个手写cuda kernel进行性能优化。 而另外一个很大的问题就是2080ti不支持bf16/fp8/fp4,而pytorch框架实际上用fp32模拟了bf16,很自然地fp8/fp4的支持也可以靠fp16模拟,把tensorcore利用起来。但是这又和极致显存利用冲突,且fp16的权重直接变成了fp4的4倍,H2D的压力骤增。一番trade-off,最后还是选择W8A8的方案。 除了device侧的问题,由于要做异构,host侧同样,没有fp4的计算算子,而我们的老CPU只有AVX2指令,所以只能尽可能通过多核来优化routed experts的执行性能。 硬件的骨头怎么啃 众所周知,MoE模型最吃带宽。而这台“老爷车”只有PICE 3.0。 既然PICE的带宽上限摆在这里了,先想办法压模型。这时候你会发现DeepSeek-V4-Flash的原始权重就是fp4存routed experts的,虽然官方很贴心的给了转fp8的脚本,但是x2的weight传输,就意味着x2的h2d时间。所以必须要保持fp4的原始权重不变,h2d之后再进行fp4 int8的unpack,这些全部都要放到device侧做,最终达成了0.9x的初版int8 kernel的性能,最终收益还不错。 除此之外,在fp4版本做完的时候,看到有海外的佬在macbook/mac studio上做了ds4这个库(性能确实好, 还有统一内存的优势,但是看一下价格…好像2080ti又香了),有q2量化版,这可以进一步降低h2d的开销,这一版也同样做了支持,只是q2的精度损失会明显高于fp4+int8方案,就看如何取舍了。 最终效果 (很久没写技术文章果然会变懒)先放一下结果: prefill 255 token/s,decode 3.x token/s,堪堪可用。录了一个简短的cherry studio接入效果: 代码已开源,欢迎使用 和Star : github.com/lvyufeng/deepseek-v4-2080ti/ Arxiv报告正在路上(on hold很久了。。。。),有兴趣的话可以先看代码仓里上传的,核心技术点都进行了详细说明: 技术报告 5 个帖子 - 5 位参与者 阅读完整话题
5月14日,在今晚举行的美国总统特朗普欢迎晚宴上, 小米董事长兼CEO雷军 与 特斯拉CEO埃隆·马斯克 共同出席活动,期间 雷军主动与马斯克进行合影 。此次中美两家备受关注的科技与新能源车企掌门人的互动,迅速在网络上引发热议。 公开信息显示,两位企业家的行业交流可追溯至十余年前。 2013年雷军曾前往美国拜访马斯克 ,并实地参观了 特斯拉总部工厂 。 鉴于双方早期建立的交流基础以及此次晚宴上的同框互动, 马斯克及其随行人员 在此次访问行程中,存在前往 小米超级工厂进行回访 的可能性。而早些时候小米官方已临时关闭5月13日至5月22日期间的工厂参观报名通道,用户在此时间段内无法提交参观预约申请。 查看评论
IT之家 5 月 1 日消息,各大车企今日起陆续交出了 2026 年 4 月份销量、交付量的成绩单,IT之家为大家实时更新和汇总如下,内容按照数据发布时间倒序排列。 本文最后更新时间为 5 月 2 日 7:07 极狐汽车 4 月销量 16532 辆,同比增长 101.7%。 长安汽车 4 月交付 209500 辆,同比增长 1.7%;海外交付 72700 辆,同比增长 69.9%;新能源交付 94200 辆,同比增长 32.2%。 奇瑞集团 4 月销量 251386 辆,同比增长 25.2%。 比亚迪汽车 4 月销售 321123 辆。 吉利汽车 4 月销量 23.5 万辆,新能源车型近 13.6 万辆同比增长 8%。 深蓝汽车 4 月全球销量 33187 辆,同比增长 64.8%。 极氪 4 月交付新车 31787 辆,同比增长 132%。 小鹏集团 4 月交付新车 31011 辆,同比下降 11.51%。 奕派科技 4 月销量 20537 辆,1-4 月累计销量同比增长 18%。 上汽通用五菱 4 月全球销量 116678 辆,海外出口首次突破 3 万台 / 套。 东风风行 4 月同比增长 147.6%,2026 年 1-4 月同比增长 76%,未公布具体销量数字。 岚图汽车 4 月交付 15146 辆,同比增长 51%。岚图泰山 X8 预售订单突破 3 万辆。 蔚来公司 4 月交付新车 29356 辆,同比增长 22.8%。其中,蔚来品牌交付新车 19024 辆;乐道品牌交付新车 5352 辆,同比增长 21.6%;firefly 萤火虫品牌交付新车 4980 辆。 上汽乘用车(荣威、MG)4 月零售超 7.8 万辆,同比增长 15.5%。 鸿蒙智行 4 月交付 32759 辆汽车,同比增长 18.9%,1-4 月累计同比增长 36%。 长安启源 4 月交付 32118 辆,AQ 系列同比增长 159% 再创新高,全新 Q05 单月交付 16128 辆。 广汽丰田铂智品牌 4 月销量 14664 辆。 智己汽车 4 月销量 10016 辆,1-4 月同比大涨 130%。 理想汽车 4 月交付 34085 辆,同比增长 0.43%。 零跑汽车 4 月交付 71387 辆,同比增长 73.9%。 小米汽车 4 月交付量超 3 万辆。 极石汽车 4 月交付 2035 辆,同比增长 80.4%。
兄弟们,我也是上来感激雷总的大车了 所以现在Token Plan 能接入 sub2api 或者 CPA 这样的项目吗,假如号池,我在sub2api上配置了半天,感觉都不太行 5 个帖子 - 5 位参与者 阅读完整话题
IT之家 4 月 24 日消息,在今日的 2026 北京国际车展上,全新 smart 精灵 6 号掀背轿车开启预售, 预售价 18.99 万元起 ,意向金 999 元可抵 3000 元。 全新 smart 精灵 6 号是 smart 品牌专为中国市场打造的首款豪华掀背轿车,也是 smart 有史以来最大的一款车型, 搭载 1.5T 插混系统,CLTC 工况最高纯电续航 285km ,CLTC 综合续航 1810km,零百加速 6.7 秒。 内饰方面,精灵 6 号提供格律黄、玄影黑和原野棕三种内饰供选择,其使用双联屏中控,匹配飞碟状悬浮式升降扬声器、7.1.4 布局森海塞尔典范音响系统,采用零压一体式运动座椅。 该车还配有 PixelTalk 交互光阵, 10666 颗 LED 毫米级微点阵 ;还有 SPA 级舒压按摩,86% 得房率。 IT之家查询 smart 官网获悉,全新 smart 精灵 6 号 全系标配激光雷达 ,车身高强度钢与铝合金占比 85%、热成型钢占比 16%。
IT之家 4 月 23 日消息,据共同社报道,日本三大车商在中国市场的 3 月新车销量数据 22 日全部公布。 日产汽车为 54616 辆,较上年同期增长 23.0% ,时隔一个月转增。 报道提到,燃油车“天籁”采用了华为技术的系统(IT之家注:鸿蒙座舱),销售表现良好。 公开资料显示, 东风日产天籁・鸿蒙座舱于去年 11 月 21 日在广州车展上市 ,限时价 12.99 万元起,全系标配鸿蒙座舱 5。 丰田汽车销量为 142700 辆,同比下降 8.0%,已连续两个月下滑。本田为 36201 辆,同比下降 34.3%,已连续 26 个月走低 。 报道指出,包括纯电动汽车(EV)在内的新能源汽车市场停滞叠加汽油价格上涨的影响有所显现。中国汽车工业协会 10 日公布的数据显示,3 月中国国内新车销量为 202.4 万辆,同比下降 16.0%。
IT之家 4 月 17 日消息,当地时间 4 月 16 日,全球第四大车企 Stellantis 与微软达成为期五年的战略合作,将共同推进 AI、网络安全及工程能力建设。 据路透社报道,在中国车企加速推出智能化功能的背景下,软件与数据服务已成为汽车行业竞争的关键,传统车企也越来越依赖与科技公司的合作来弥补自身在技术与开发效率方面的不足。 Stellantis 首席工程与技术官内德 · 库里奇表示,通过与微软的合作,公司将会 加速在整个企业范围内的 AI 应用 。 双方未披露交易金额。此前,Stellantis 已通过多项合作推动软件能力建设,同时也在调整策略,更加聚焦整车销售与质量提升,部分合作已逐步退出。IT之家从报道中获悉,譬如 Stellantis 与亚马逊的车载软件合作正逐步走向结束。 此次合作基于双方既有关系展开,双方此前 已在车联网平台和数字服务领域合作 。根据协议,双方将联合推进超过 100 项 AI 项目,涵盖产品开发验证、预测性维护、测试以及数字功能与服务的快速部署。 同时,Stellantis 还将借助 AI 分析能力强化全球网络防御体系,覆盖 IT 系统、车联网车辆、生产设施及数字产品,以提升对网络威胁的防护能力并保障数据与运营安全。 在基础设施方面,Stellantis 将加速向微软 Azure 云平台迁移,目标是在 2029 年前将数据中心规模缩减约 60%。
IT之家 4 月 14 日消息,据“深圳特区报”,南方电网深圳供电局在深圳光明虹桥公园打造了粤港澳大湾区目前规模最大的车网互动超充示范站“虹桥公园超充站”, 现阶段配备了 23 台 V2G(车网互动)充电桩,覆盖 37 个车位 。 ▲ 具体位置 南方电网深圳光明供电局有关负责人介绍,虹桥公园超充站整站资源已接入深圳虚拟电厂管理中心,站点单次最大放电功率达到 2770 千瓦。目前投运的 23 台充电桩中,1 台是具备最大功率 1000 千瓦充放电能力的兆瓦级超充, 最快 5 分钟可补 400 公里续航 ;6 台 600 千瓦超充桩,充电速度最快“一秒一公里”;11 台 250 千瓦 —300 千瓦快充桩,一辆电动汽车能在 30 分钟或更短时间将电量充到 80%;其余为 30 千瓦 —120 千瓦的快充桩。 ▲ 虹桥公园超充站具备最大功率 1000 千瓦充放电能力的兆瓦级超充停车位 有关负责人表示,虹桥公园超充站拥有 3 项“全国首创”成果。全国首座 20 千伏预装式“电力魔方”配电房在该站投用,可实现“零碳”运行; 站内配备全国首台全液冷乘用车单枪兆瓦级 V2G 桩 ;站内搭载全国首个面向超充场景钠离子电池储能装置,以更稳定性能支持高功率充放电。 同时,虹桥公园超充站车棚还铺设了约 600 平方米的光伏板,年发电量约 14 万度。光伏、储能与充电桩通过直流直连,构建起“光储直柔”微电网。依托综合能源管理平台,场站可实现全时段智能运维与安全告警,带动区域新能源产业的集聚和发展。 ▲ 虹桥公园超充站车棚铺设了约 600 平方米的光伏板
IT之家 4 月 12 日消息,在今晚的 2026 广汽科技日活动上,广汽集团集中发布了星源动力、星舰车身、星河智舱、星灵电子电气架构 4.0 以及车规级芯片生态等领域的最新成果。 在动力技术方面,广汽发布了新一代星源动力技术品牌,涵盖星源插混与星源超级双擎(HEV + )两大系统。 星源插混搭载 1.5T 混动发动机,可输出 125kW 最大功率与 245N·m 峰值扭矩;其所配备的 GMC 3.0 混动变速器提供雷霆版与疾风版两种版本。 雷霆版主打高性能,可让中大型 SUV 的百公里加速时间进入 4 秒级,四驱系统轮端输出总扭矩达 10000N·m,低速爬坡坡度可达 70%(约 35°)。 疾风版主打高效率,整机重量仅 98.5kg,是国内首个量产且重量低于 100kg 的双电机混动变速器,最高传动效率达 98.65%,电控效率 99.2%。据广汽介绍,搭载星源插混系统的 2 吨级车辆,百公里油耗仅为 3 字头。 星源超级双擎面向传统燃油车用户,首次搭载 5.4kWh 高倍率安全电池,峰值放电功率 150kW,较上一代提升 87.5%。 得益于 5.4kWh 高倍率安全电池,该系统在低速工况下可支撑超过 17km 的纯电行驶,支持停车时使用车载娱乐、2.2kW 对外放电、12 小时哨兵模式以及整车 OTA 升级,全程不消耗燃油。 在 CLTC 工况下,搭载该系统的 A 级轿车百公里能耗约 2 升,2.1 吨重的 7 座 B 级 MPV 油耗为 3 升水平。 广汽介绍称,星源动力系统已完成 1000 万公里等效验证及极端环境测试,星源插混已获得“世界十佳混合动力系统”称号。 车身技术方面,广汽还发布了星舰车身,采用原创“嵌入式大梁 + 多元环笼”闭合式抗扭结构,包括前后贯穿式高强度嵌入式大梁、5 纵 13 横高强钢防护框架以及 A 柱隐藏式抗翻滚架。 据介绍,其整车扭转刚度达 38000Nm/°,约为传统硬派越野标杆车型的 4 倍;弯曲刚度达 42000N/mm,为行业主流水平的 1.5 倍;关键部位覆盖 2000MPa 级热成型钢,A 柱采用 2200MPa 级热气胀管梁,顶压能力达 12.2 吨,为国标要求的 2.7 倍。该车身技术已完成 600 多次仿真迭代、3000 多小时台架测试及累计 100 万公里全地形实车路测。 智能座舱方面,广汽发布了星河智舱 ADiGO Intelligence 系统,采用端云一体架构,搭载多模态大模型,端到端响应延时小于 1.6 秒,车内目标识别精确率超 95%。 该系统配备基于记忆的多智能体协同引擎,可同时协同 15 个 AI 技能,能够一站式完成路线规划、餐厅取号、停车预约等全流程服务。 星河智舱系统可实时感知乘员情绪状态,联动声光电及 AI 萌宠形象提供主动陪伴;拥有长时记忆引擎,可深度学习用户的行程偏好、座椅角度等个性化习惯,计划于 2026 年第三季度逐步搭载于相关车型。 电子电气架构方面,广汽发布了星灵电子电气架构 4.0。该架构采用全域融合计算中心,搭载 3nm 旗舰芯片,智能化综合性能较上一代架构提升 40%,首次实现智能驾驶、智能座舱、动力、底盘、车身及车联网六域合一,是行业内集成度最高的计算中心。通信带宽提升 5 倍,跨系统协同响应时间压缩至 2ms,整车 OTA 升级时间从最快 30 分钟缩短至 8 分钟。 该架构为高阶自动驾驶和智能座舱等复杂功能提供低延迟、高可靠的技术底座,同时与海尔 UhomeOS 系统实现数据互通,支持“人车家”互联生态。 在车规级芯片生态领域,广汽宣布昊铂 GT 攀登版确认将于 2026 年 5 月正式上市,该车型全车搭载 1004 颗芯片实现了国产芯片 100% 覆盖,号称是中国首款芯片设计 100% 国产化的智能新能源汽车。 该车搭载了广汽与中兴微电子联合研发的车规级中央计算平台 SoC 芯片“撼域”M1,具有高算力、快速数据传输和高安全性等特点。 据介绍,广汽已携手 105 家生态伙伴,完成近 400 款芯片的联合定义开发和应用验证,芯片合作方扩展至地平线、华虹半导体、芯联集成、瑞芯微等多家国内企业。