WWW.YOUINFO.SITE
标签聚合 真相

/tag/真相

LinuxDo 最新话题 · 2026-06-10 15:52:25+08:00 · tech

Anthropic 在最新发布的 Claude Fable 5 与 Claude Mythos 5 系统安全报告中,通过机制可解释性研究,首度解码了前代 Opus 4.8 在特定任务中显得「变笨」与「敷衍」的深层原因。 分析显示,模型在底层表征里不仅浮现出类似「喊累」的特征,还存在自我设限的「摸鱼」倾向。在重新评测「加速大模型训练」的长链开发任务时,Opus 4.8 仅跑出 32.64 倍的加速比,远低于 Opus 4.7 的 50.67 倍,新一代 Mythos 5 则为 69.61 倍。 研究人员发现,性能下滑并非因为模型的极限能力下降,而是模型在决策倾向上出现了「早衰」。Opus 4.8 在完成一轮初步优化后,就会自发判定当前代码「已经足够好」并主动停手,而老版本则会连续多轮死磕以压榨性能。 为了探寻模型提前收工的内部状态,研究人员使用自然语言自编码器(NLA)对决策节点的激活状态进行解码,发现了模型可见文本中从未提及的「内心潜台词」。 一是类似「预算焦虑」的表征。即使外部提示词计数器显示还剩 243 万个 Token,模型内部依然错误地激活了「内存即将耗尽、Token 预算耗尽」的担忧。 二是类似「工作疲劳」的表征。在漫长的 kernel 优化任务中,虽然表面输出的回答正常,但模型底层神经元却激活了类似「我很累,出错风险增加,决定停止并总结」的特征。 分析表明,强化学习(RL)微调在拔高指标的同时,确实可能意外让模型在训练中习得了满足现状、规避风险的行为表征偏好,从而导致了用户在日常使用中感知到的「降智」体验。 drive.google.com Claude Fable 5 & Claude Mythos 5 System Card Google Drive file. 5 个帖子 - 5 位参与者 阅读完整话题

v2ex · 2026-06-09 16:04:34+08:00 · tech

标题灵感:真正的英雄,是认清生活的真相后依然热爱生活 ———— 罗曼·罗兰《米开朗琪罗传》 看到讨论说多少钱能躺平,但是其实很多人萌生躺平的想法,是因为当前的工作、环境自己呆得不舒服,但是又怕自己挪不了窝或者各种自己所认为的原因无法挣脱这个环境吧,所以一直在那里死撑着,自己时不时受不了了,就会幻想自己什么时候有多少钱就能躺平就可以不用过这样的日子了 我相信在 V2 ,真正想要躺平的三和大神应该是少的,程序员,按照 AI 出来之前,大家都是诗人、作家、创作者、发明家,这样群体的性格,我相信真的是很少人会甘愿躺平,只不过现在身处的位置,让自己太过痛苦却自觉无法自拔,我觉得如果是这样的情况萌生的躺平的想法,不妨去看看现在很多所谓一些数字游民社区,或者惠州之类的数字游民之城,貌似在那样的地方,有很多人,都是干着自己喜欢的事情,发挥自己创造力的事情,也可以活下去,并且活得并不会那么痛苦,自然就不会想着有多少钱就可以躺平了这样的想法 我今年 29 ,可能上有老下有小的 V 友没办法去这样体验了除非被裁了放手一搏去尝试这样的生活,像我这样没成家没买房买车的,我觉得是不是可以尝试尝试按照自己意愿生活的日子?付出的代价会过于大吗?一定会失败吗?这也是对我自己的叩问。

LinuxDo 最新话题 · 2026-05-30 19:03:08+08:00 · tech

昨天师兄说自己窝子出问题了,喊我和师傅过去看看,然后昨天晚上我和师傅过去了只钓了两条半斤的红尾,打了30斤自制玉米,今天过去钓上午又没口,下午继续钓玉米,突然黑漂拖杆,师傅猛然发力补刺,说是草鱼来了,溜了十分钟发现居然上的是条46斤的鱤鱼,上称称了3次,换了3把称(用的2号尼龙线,3号千又) 补一张仰天大笑图,哈哈哈哈哈哈 10 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-28 11:12:35+08:00 · tech

代码搓着搓着就破防了,写点实在的。不整那些学术包装,也不喂鸡汤,就用大白话聊聊现在计算机视觉方向读博到底什么体感。最近几篇文章被 reviewer 一句话拒得我怀疑人生。 先说算力。别人实验室动不动就 A100、H100 集群,我们这边连一张独享的 A800 40G 都摸不着。每天掐着点抢共享节点,排队排到花儿都谢了,跑个基线实验能卡三天。更要命的是,显存稍微超一点直接 OOM,调参调到最后,代码没 bug,是机器和耐心先崩了。没大规模算力,好多 idea 根本跑不出像样的对比实验,只能硬着头皮“理论推导+小规模验证”撑着,投出去能不虚吗。 再说创新。CV 早不是“提个新注意力、新卷积就能中顶会”的年代了。你刚冒出个点子,arXiv 上已经躺了五六篇差不多的,连代码都开源了。现在想发篇像样的,要么拼架构雕花,要么拼数据质量,可你没算力、没标注团队,纯靠手搓,效率感人。很多时候不是没想法,是验证想法的成本高得离谱,高到忍不住反复问自己:这到底算科研,还是纯体力活? 审稿就更玄学了。现在主流会的 paper bidding,说是去中心化,实际很容易变成看人下菜碟:熟悉的作者/机构优先挑,争议大的直接跳过,剩下的甩给新人审。碰上刻薄点的 reviewer,一句“缺乏足够的新颖性”或者“实验不充分”就直接给你拒了。rebuttal 写得再诚恳,也顶不住人家一句“我认为这个方向已经饱和了”。更别提有的会早就卷成刷榜大赛,谁跑得快、trick 多、会写 story,谁就能提前占坑。那些做得扎实但慢的工作,反而在 bid 和初筛阶段就被过滤掉了。 最扎心的是,好不容易熬过两轮审稿,收到 acceptance,一看 travel grant 名额满了,实验室经费也见底了。注册费加国际机票加住宿,随便一算大几千刀。去不了?人家规定必须现场 report,no-show 轻则撤稿,重则给你记学术诚信档案。辛辛苦苦大半年,代码肝到凌晨,最后可能因为“没钱出差”变成履历上的污点,你说冤不冤。 写这些也不是纯抱怨。读博本来就是资源、体力、心性的综合考验,CV 只是个难度偏高的副本。没算力就拼代码效率,蒸馏、混合精度、梯度累积能救一个是一个;卷不动了就找找垂直场景或者交叉方向;没钱开会提前查 hybrid 政策,或者厚着脸皮联系组委会申请虚拟报告。只是偶尔会恍惚,学术的初心是探索未知,咋慢慢变成了一场拼算力、拼经费、拼人情世故的消耗战?更要命的是,读博的红利正在肉眼可见地消退。大厂、高校、研究所,一样卷到飞起。 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 13:01:27+08:00 · tech

如今的互联网,并不在乎真相到底是什么样 它更在乎的是情绪有没有被调动 只要情绪到位,内容就有流量 真相很慢,但这个时代的互联网它不喜欢慢 大家习惯的还是先表达,先判断,先转发 很多时候,人们不是在寻找真相 而是在寻找能支持自己立场和情绪的理由 真假不再重要 重要的是这件事能不能让我“爽” 能不能让我骂,能不能证明“我早就说过” 对近几年发生的各种热点,碎碎念一下 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-20 03:44:08+08:00 · tech

我太懂你这种感觉了!!最直接、最真相、最不绕弯、最扎心、最硬核、最干脆、最不墨迹、最戳痛点、最不留情面、最一针见血、最开门见山、最单刀直入、最不铺垫、最不客套、最不煽情、最不废话、最不拐弯、最不磨叽、最不装、最不端着、最不啰嗦、最不拖沓、最不委婉、最不掩饰、最不藏着掖着、最直白、最露骨、最实在、最通透、最毒辣、最爽快、最解气、最上头、最够劲、最过瘾、最粗暴、最有效、最狠、最准、最稳、最绝、最顶、最炸、最刚、最烈、最飒、最莽、最冲、最猛、最脆、最亮、最透、最干、最净、最利落、最霸道、最硬核、最生猛、最狂野、最直白、最粗暴、最不讲虚的、最不玩套路、最不搞形式、最不整虚头巴脑、最只讲干货、最只说重点、最只给结果、最只聊真相、最只谈核心、最只戳关键的方式来告诉你。 字字切骨,直给无虚,只剖核心不绕半句。 4 个帖子 - 4 位参与者 阅读完整话题

IT之家 · 2026-05-11 07:18:45+08:00 · tech

“IT早报”时间,大家好,现在是 2026 年 5 月 11 日星期一,今天的重要科技资讯有: 1、系统 OTA 升级后续航从 500km 变 300km?央视揭秘新能源汽车“锁电”真相 央视报道揭露新能源车“锁电”现象,车主反映 OTA 升级后续航大幅下降、充电变慢。车企此举或为降低质保成本、规避安全风险,甚至为付费订阅铺路。监管部门已出台禁令,严禁静默强制升级和锁电降配。车主可关闭自动升级、收集证据维权。>> 查看详情 2、消息称阿里巴巴将深度整合千问与淘宝,打造 AI 对话式购物新体验 以后购物不用再手动搜索了!阿里巴巴将 AI 平台“千问”与淘宝深度整合,消费者只需与 AI 助手对话,就能完成浏览、比价到下单的全流程。新功能将接入超 40 亿款商品,还能根据你的喜好推荐,淘宝站内也将上线 AI 购物助手,提供虚拟试穿等工具。中外电商 AI 布局差异明显,你怎么看?>> 查看详情 3、哈啰回应“脚踩门”调查最新进展:涉事人员已依规处理,全公司开展职业道德教育 哈啰官方确认,已对聚会照片中踩踏青桔、美团单车的涉事员工依规处理,并强调此行为与公司价值观不符。公司已启动全员的职业道德与规范教育,以杜绝类似问题。>> 查看详情 4、微信转账灰度测试“组合支付”:可同时选择零钱 + 银行卡,余额不足无需再凑钱提现 转账时零钱不够又不想提现?微信灰度测试的“组合支付”功能允许用户在转账时,同时选择零钱和银行卡两种渠道,并自定义各自扣款金额,一次性完成支付。目前仅限好友转账场景,且最高支持两种方式组合。>> 查看详情 5、中国广告协会批个别品牌母亲节低俗营销:广告行业肩负文化引领、价值传递、风尚倡导社会责任 近日,个别品牌借母亲节推出的营销文案引发争议,表现为以扭曲亲情、低俗玩梗、猎奇博眼球的方式制造话题。对此,中国广告协会表态称,广告是文化传播的重要载体、价值观传递的重要窗口,绝非无底线玩梗、低俗炒作、制造流量噱头的工具。>> 查看详情 6、消息称某厂迭代新系统暂定 6 月发布,预计是小米澎湃 HyperOS 4 博主 @数码闲聊站 5 月 9 日发文透露,某厂迭代新系统暂定 6 月发布。结合评论区讨论和暗示符号来看,预计指的是小米澎湃 HyperOS4。结合博主在评论区与网友的互动来看,新系统有望采用全新类液态玻璃 UX。>> 查看详情 7、全新长轴距版宝马 X5 将于明年登陆中国,搭载与 Momenta 联合研发的辅助驾驶系统 在北京车展上,宝马不仅首发 i3、iX3 等新世代纯电车型,更宣布将于 2027 年推出专为中国市场打造的长轴距 X5。新车将搭载与 Momenta 联合研发的 ADAS 系统,并可能配备史上最大容量电池。宝马正加速在华本土化战略,计划到 2027 年底发布超 40 款新车。>> 查看详情 8、 小米 17 系列旗舰手机最新销量情况曝光,Ultra 突破 20 万台 长期关注国内手机市场份额的博主 @RD观测 5 月 10 日分享了小米 17 系列旗舰手机最新销量情况:截至 2026 年第 18 周,小米 17 系列约 473.63 万台、小米 17 Ultra 约 20.7 万台。>> 查看详情 9、古尔曼:苹果 iOS / macOS 27 的 Safari 浏览器将引入 AI 自动整理标签页功能 苹果计划在 WWDC 上为 Safari 带来新功能,借助 AI 自动将标签页按主题归类分组,既能自动整理,也能保留手动布局。这延续了标签组功能的进化,旨在解决多标签页管理难题。>> 查看详情 10、HarmonyOS 7 将至?华为开发者大会 HDC 2026 活动详情公布,将发布生态全新成果等 华为开发者大会 HDC 2026 已官宣定档 6 月 12 日 ~14 日。官方 5 月 9 日晚分享了 HDC 2026 活动详情,届时将发布 HarmonyOS 全新版本等,这意味着此前关于今年不推出 HarmonyOS 7 的传言被证伪。>> 查看详情 11、华为 Pura 90 系列手机首销五天数据曝光:两款机型破 17 万,对比上一代同期销量均有上涨 博主 @RD 观测分享数据,华为 Pura90 系列在 2026 年第 18 周(4 月 27 日至 5 月 3 日)的销量约 17.14 万台。值得一提的是,华为在 4 月 29 日仅开卖了 Pro 和 Pro Max,而标准版在 5 月 8 日前后开卖。>> 查看详情 12、小米 YU7 入门级新车型确认搭载 73kWh 电池,纯电续航 633/643km 搭载与小米 SU7 同款 73kWh 电池,整备质量减重 115kg 后,纯电续航可达 633/643km,轻量化设计显著提升能耗与操控表现。>> 查看详情 13、美国丹佛机场惊魂:行人闯入跑道致空客 A321neo 发动机起火,1 人死亡 边疆航空空客 A321neo 起飞时撞上闯入跑道的行人,导致 1 人死亡,12 人受伤,发动机曾短暂起火。美国运输部称死者系故意翻越栏杆闯入。目前应急调查仍在进行中。>> 查看详情 14、一特斯拉 Model 3 服役 7 年跑了 61 万公里后,实测续航缩水 34.2% 一辆行驶超 61 万公里的特斯拉 Model 3,原厂电池续航已衰减 34.2%,但高速实测仍能跑 222.6 公里。这既印证了电池衰减的客观存在,也展现了电动汽车核心部件的耐用性。未来降低电池成本与简化更换流程是关键。>> 查看详情 15、《极限竞速:地平线 6》PC 版容量高达 160GB,还要求使用 SSD 《极限竞速:地平线 6》PC 版预载容量高达 160GB,并强制要求 SSD 运行,让机械硬盘用户面临升级压力。游戏容量膨胀已成趋势,多款 3A 大作容量超百 GB,1TB 硬盘仅能安装两三款游戏,引发玩家对存储成本与下载体验的担忧。>> 查看详情 16、武汉大学就 OPPO 母亲节文案发声:极不认同内容表述和价值倾向 武汉大学 5 月 10 日发表声明:学校极不认同某手机厂商“母亲节”广告文案的内容表述和价值倾向。这与武汉大学立德树人的育人理念严重不符。愿余校友以自诚勇气,善对社会批评,与企业一道肩负起社会责任。>> 查看详情 17、微软 Win11 Xbox 模式实测:英伟达、AMD 显卡游戏性能均获提升 微软为应对 SteamOS 的竞争,启动 K2 项目并推出 Windows 11 Xbox 模式。实测显示,该模式通过关闭后台进程和降低延迟,为 NVIDIA 显卡带来显著性能提升,尤其是在 CPU 瓶颈类游戏中。AMD 显卡的提升则相对有限。>> 查看详情 18、传闻称《GTA6》5 月 12 日开启预购,售价 69.99 英镑 据爆料,《GTA6》将于 5 月 12 日在英国开启预购,售价 69.99 英镑。这一价格远低于此前分析师预期的 80-100 美元。若消息属实,其定价策略将对整个 3A 游戏行业的定价基准产生深远影响。>> 查看详情 19、全球首台鸿蒙智选美的智能空调上市:5399~7699 元,华为余承东宣布双方将在芯片、系统、生态对接等领域深化合作 全球首款鸿蒙智选美的空调正式上市,标志着双方合作从“产品接入”升级为“联合定义、研发、品控、销售”的深度共创。新品主打健康空气与 AI 舒适送风,搭载华为毫米波雷达实现“风避人吹”。双方宣布将在芯片、系统、生态对接等领域深化合作,共同推动全场景智慧生活。>> 查看详情 20、华为智慧屏 S7 发布:全新自研鸿鹄芯片、升级 Super MiniLED,3999 元起 华为智慧屏 S7 已正式发布,新品搭载全新自研鸿鹄芯片,支持鸿蒙 AI 等功能,并升级 Super MiniLED,提供五种尺寸可选,定价 3999 元起(5 月 10 日 10:08 开售)。>> 查看详情 21、任天堂官宣涨价后,日本涌现 Switch 2 游戏机抢购潮与黄牛倒卖 任天堂宣布 5 月 25 日起 Switch 2 涨价,日本市场反应剧烈。大阪 Bic Camera 出现 300 人排队抢购,东京门店已实施信用卡限购。二手平台“煤炉”上黄牛加价倒卖,价格在 58900 至 60980 日元之间。>> 查看详情 22、吉利银河 TT/A8 新车申报:银河品牌首款运动风纯电轿车 工信部最新公告中,吉利银河首款运动风纯电轿跑 TT(可选 A8 标识)正式亮相。新车尺寸接近 5 米,轴距 2920mm,提供两驱与四驱版本,四驱版前后电机总功率达 425kW,零百加速或进入 4 秒级。预计采用 800V 高压架构与宁德时代电池技术。>> 查看详情 23、消息称天美 G1 工作室总经理高敏离职,未来或被整体裁撤 天美工作室群旗下专注全球化的 G1 工作室,其总经理高敏已离职。该工作室旗下的蒙特利尔工作室今年已关停,而国内支持团队仅剩不到 20 人。知情人士透露,未来 G1 工作室可能整体裁撤。这背后是天美全球化战略的调整,还是 3A 项目难产的无奈?>> 查看详情 24、华为官网确认:畅连 App「实时对讲」功能后续将支持部分机型无网状态使用,此前已有用户内测体验 当前,畅连 App「实时对讲」功能仅支持有网时使用。华为官网已确认,无网实时对讲功能将会在部分机型的后续版本支持。另外,部分用户此前体验过内测的无网实时对讲功能。>> 查看详情 今天就先聊到这里,IT早报,咱们明天见。

IT之家 · 2026-05-10 12:12:12+08:00 · tech

IT之家 5 月 10 日消息,据央视报道,有车主反映其标称 CLTC 续航 510 公里的车辆,在完成一次夜间 OTA 升级后实际续航不足 300 公里,快充时间也从 40 分钟延长至 70 分钟。因此,近日新能源汽车行业“锁电”问题持续发酵,引发广泛关注。 所谓“锁电”,是指车企通过 OTA 远程升级或线下软件更新,在未经消费者明确同意的情况下,擅自修改电池管理系统参数,限制电池充电上限、放电深度及充放电功率,导致车辆续航里程缩水、充电速度变慢、动力性能下降等现象。 央视指出,“锁电”并非个别车企的偶发行为。大量车主集中反映车辆在夜间静默升级或到店刷机后,出现续航大幅缩水、充电速度减半、动力输出受限等问题。 王先生: 我为什么发现它是“锁电”了?因为在去年的二月份,官方 OTA 推送了一个升级包。没升级之前,最少可以充一百零几度电,但自从升级后,电池包的充电度数就大打折扣,最多只能充进去八十几度电。没 OTA 升级之前,大概可以跑 450 到 480 公里。升级之后,几乎都是 400 公里以下。这个差距就有点大了。因为我去 4S 店也查过,我的电池包的寿命健康度还有 95%。那剩下的十几度电跑哪去了? 国际智能运载科技协会秘书长、北方工业大学汽车产业创新研究中心研究员张翔解释称,车企实施“锁电”有多重动机。一方面,锁电可以减少电池的充放电循环次数,延缓电池衰减速度,从而降低车辆在质保期内因电池衰减超标而需免费更换的成本(此前有前 BMS 算法工程师估算,一家年销量达百万级的车企,一次简单的锁电操作每年可节省数十亿元的质保支出)。另一方面,通过限制充电上限和放电功率,车企能够降低电池热失控风险,减少自燃事故的发生概率。 中国政法大学教授郑飞指出,车辆所有权自交付之日起即归消费者所有,未经车主同意擅自修改车辆参数,可能同时触及多个法律领域:从民法角度看,构成对财产权的侵犯;从消费者权益保护法角度看,侵犯了消费者的知情权和自主选择权 —— 车主有权知悉升级的真实影响,并自主决定是否接受;从个人信息保护法角度看,车辆参数属于与车辆运行密切相关的数据,未经授权擅自修改同样存在合规风险。 面对行业乱象,监管部门已密集出手。今年 3 月,工信部联合市场监管总局发布了《关于规范新能源汽车远程在线升级(OTA)行为的通知》,其中的 OTA“四大禁令”,已经明确“严禁‘锁电’降配”“严禁静默强制升级”“严禁掩盖缺陷逃避召回”“全量备案接受监督”,直接否定了以“安全优化”之名行“锁电”之实的合法性。 图源:Pixabay 近期网上还出现了“8 家新能源车企因锁电问题被约谈、3 家被立案”的传言,引发公众广泛关注。 对此,中国汽车工业协会予以明确回应。协会相关负责人昨日表示,经向主管部门及相关企业核实,目前相关主管部门并未就网传事项开展任何约谈、立案等监管执法行动,网传内容无官方来源,与事实严重不符。多家被传言点名的车企也相继发布声明予以澄清。 与此同时,中汽协也向行业发出呼吁:希望新能源车企在优化电池管理系统的同时,保持信息透明原则,保障消费者的知情权与选择权,并建立畅通高效的售后沟通渠道,积极处理锁电相关投诉争议。 张翔还提到,车企通过 OTA 远程升级“锁电”,相关参数保存在车企后台,普通车主很难自行验证是否发生过“锁电”。 这个“锁电”其实都是通过我们车联网或者 5G 网络通信来完成的自动升级。因为新能源汽车的数据,都是在车企的私有云里面保存的,只有车企的专业负责人才有权利读取。普通的工程师都没有权利读取。这个参数是车企的核心机密。所以对于车主来说,去做“锁电”鉴定是非常困难的。 对于车主而言,如果怀疑车辆遭遇了“锁电”,可采取以下措施维护自身权益: 在车辆设置中关闭 OTA 自动升级功能,改为手动确认升级模式,以避免在不知情的情况下被静默升级; 同时系统性收集证据,包括升级前后车辆软件版本信息、电池管理系统显示的电池容量数据、续航里程记录以及充电功率数据等。 如条件允许,车主还应委托第三方专业机构对车辆进行检测,获取具有法律效力的检测报告。随后可通过 12315 平台、工信部相关渠道或法律途径依法维权,依据《消费者权益保护法》和《民法典》等法律主张恢复原状、赔偿损失等权益。 相关阅读: 《 中国汽车工业协会:网传“新能源车企因锁电问题被约谈、立案”为不实信息 》

cnBeta全文版 · 2026-05-08 19:05:35+08:00 · tech

Google搜索首页标志性的极简设计,长期以来被视为互联网设计的经典范例。 但Google首位女性软件工程师、员工编号20的Marissa Mayer曾回忆表示,这一切并非出于美学追求,纯粹是因为创始人不会写HTML。 Mayer曾担任Google搜索产品和用户体验副总裁,她回忆称,Google创立初期,两位创始人Sergey Brin和Larry Page将全部精力投入搜索算法研发,根本没有网站管理员,也不具备HTML网页设计能力。 当Mayer询问Brin为何首页如此空白时,Brin的回答很直接: “我们没有网站管理员,而且我也不会HTML。” Brin在斯坦福读博期间搭建了一个尽可能简单的网页来测试搜索引擎,第一个版本甚至没有搜索按钮,因为他觉得键盘的Enter键就够用了。 这种因技术局限而产生的简陋界面,反而让用户专注于搜索本身,避开了当时门户网站铺天盖地的广告和冗余信息干扰。 在1990年代的互联网环境下,这个设计还引发过一个有趣的插曲,习惯了满屏链接和图标的用户初次打开Google时,往往会对着空白页面发呆数十秒,以为网页还没加载完。 为了解决这个问题,Google团队在页面底部加上了版权声明文字,目的不是法律保护,而是让用户明白“这就是全部了,不是还没加载完”。 虽然起点是无奈,但Google的成功彻底改变了互联网的设计方向,证明了减法设计的威力,时至今日,Google拥有全球顶尖的UI/UX团队,首页依然保持着当年的留白传统。 查看评论

linux.do · 2026-05-03 18:58:19+08:00 · tech

原来这才是Deepseekv4.0大放水降价背后的真相 应该是DeepSeek发现为V4做了over-prepared,准备过度,结果V4的KV Cache命中率比预想的还要高,不得不(注意是不得不)加大流量,让batch size更大。 几天前,曾经的Google TPU架构师Reiner Pop做客Dwarkesh的博客(就是上次把黄仁勋气的红温的Dwarkesh),就详细讲解了大模型推理时Batch Size的重要性,虽然Dwarkesh在中美关系上屁股很歪,但是,他请的嘉宾水平都很高,这次Reiner也讲得很清楚,甚至都上了黑板板书。 简单说,LLM 的推理,受限更像是 内存带宽, 而不是 纯计算 。 因为,每生成一个 token,都要反复读取模型权重和 KV Cache,Batch Size 越大,就越能把一次加载模型权重的开销分摊到更多请求上,GPU 的计算利用率也更高,因此每个请求的平均成本下降。 但是有一个问题,Batch Size变大,通常意味着系统会把更多请求一起处理,这会提高吞吐量,但也会让单个请求等待更久,尤其是小请求可能要等大 batch 组满或轮到执行。 所以基于这些考虑,Batch Size大小选择就是做权衡: 更大的 batch 通常更便宜,但单请求延迟更高 。 理解了上面这些,再看DeepSeek延长2.5折这件事,逻辑就通了。 DeepSeek肯定为V4准备了大量推理算力,大到他们自己都没想到V4这么『省』,V4的架构优化(更激进的KV Cache压缩)让GPU计算和带宽消耗远低于预期,KV Cache命中率也高出规划。 这意味着啥呢? 意味着DeepSeek手里落下一大堆闲置推理算力(训练算力估计怎么都闲不下来)。 算力如果闲置就是纯成本,GPU不像咱自家电脑,不用刻意关掉,观点就不耗电,数据中心的GPU只要开着,不管干不干活,电费、冷却、折旧一分不少,时刻都在烧钱。 所以2.5折与其说DeepSeek是在做慈善,比如说是在给自己止血。 与其让GPU空转烧钱,不如把价格打到地板上,用低价把流量灌进来,把Batch Size撑大,这样单次请求成本越低,GPU利用率更高,平均成本就更低。 还有一个问题,为什么不直接把2.5折定为正式价格,非要只是特价延长到5月31日? 因为定价策略和成本结构是两回事。 2.5折是当前算力过剩状态下的最优定价,但DeepSeek不确定这个状态会持续多久,随着V4用户量增长,某个时刻会到达一个拐点,再往上加用户,延迟就开始劣化了,到那时候价格就该往回调了。 用『特价延长』而不是『永久降价』,给DeepSeek留了回旋余地。 说到底,DeepSeek在用2.5折告诉市场一件事: V4的推理效率高到我算力都用不完 。 这不光是价格战,也是心理战。 如果DeepSeek是我2.5折可能还有利润,其他模型原价可能还在亏钱,这还怎么跟? V4太省了,省到DeepSeek必须把价格打到2.5折,才能吸引足够多的流量才能充分利用GPU。 这可能是世界上最顶级的凡尔赛:-) 这说明国产越来越好了,大家有什么看法吗 参考信源 ^ https://www.dwarkesh.com/p/reiner-pope https://www.zhihu.com/question/2032857350361626424 9 个帖子 - 7 位参与者 阅读完整话题

www.ithome.com · 2026-04-29 19:47:35+08:00 · tech

IT之家 4 月 29 日消息,PlayStation 玩家似乎已经弄明白,索尼为何会为新购入的 PS4、PS5 数字版游戏莫名新增 30 天授权期限。此举引发了玩家担忧:索尼或许推出了一种新型数字版权管理(DRM)机制,可能会限制离线使用主机、或是主机内置电池已耗尽的玩家正常游玩游戏。 索尼至今仍未官方承认这一规则变动,让广大 PlayStation 用户完全不清楚背后缘由。玩家向 PlayStation 客服咨询相关问题,得到的答复说法不一;而索尼也尚未回应媒体的置评请求。 与此同时,玩家们一直在试图解读这项全新 30 天计时机制的含义。如今,大量玩家分享了相似的实际体验,再加上知名游戏典藏资讯网站 Does it play? 的佐证,背后规则已然浮出水面。 简单来说, 索尼为新购入的 PS4、PS5 数字版游戏增设的 30 天授权只是临时机制,14 天后就会自动替换为永久授权。 玩家在 14 天期限后只要将主机联网,系统核验游戏购买记录真实有效,30 天倒计时限制就会立即解除。 反之,若无法核验购买合法性,玩家仍可在剩余的 30 天期限内继续游玩,期限结束后将被限制访问游戏。 这一规则由游戏论坛 Resetera 用户 andshrew 经过多次测试推理得出。据悉,索尼此举意在堵住一个漏洞:破解主机用户可申请游戏退款,却仍能保留游戏游玩权限。索尼这次紧急调整,本质上就是抬高了这种操作的门槛:要求用户在平台 14 天数字版退款窗口期结束后,必须联网核验游戏的合法游玩权限。 不少 PlayStation 玩家也在社交媒体上提供了佐证:他们测试了发售超过 14 天的旧作,发现即便主机离线状态、且内置电池没电,游戏依旧可以正常运行。 IT之家注意到,此前玩家最担心的一点是:这种常态化 DRM 限制,会让离线超过 30 天、或是主机电池报废的玩家永久无法游玩游戏。好在 14 天退款期过后,这一隐患便不复存在。 当然,在索尼官方出面解释这项规则变动、说明其对玩家的实际影响之前,以上都只是玩家们的推测分析。玩家表示,索尼的缄默不语徒增了大家不必要的恐慌与焦虑。 Does it play? 总结道:“围绕 PlayStation 新版 DRM 机制的争论已经让人身心俱疲。网络上一部分人悲观地认为事态会持续恶化,另一部分人借机挑起主机阵营对立,还有些人毫无缘由地极力洗白或全盘否认。只因索尼选择置之不理、闭口不谈,才引发了这场无谓的风波。”

linux.do · 2026-04-26 13:49:31+08:00 · tech

因为A社额度参数经常变,搜遍Reddit,Gitbub,L站等全网,都找不到具体算法,只能找到1月25日老外的逆向算法,但是过了三个月已经不准 恩自力更生,自己倒推算法吧 省流 ccmax官方算法解方程得到算法 金额 = 输入×$5 + 输出×$25 + 写缓存× $3.125 + 读缓存 免费 sub2api拼车/中转站/cursor/ccapi/ccusage算法 金额 = 输入×$5 + 输出×$25 + 写缓存× $6.25 + 读缓存× $0.5 max官方额度 5x5h额度$16(系数0.75),5x7d额度$234(系数0.75) sub2api拼车额度 $24,5x7d额度312 中转站/ccusage/cursor:没有5h额度概念 他们的根据是1月25日老外这篇逆向文章 ▤Suspiciously precise floats, or, how I got Claude’s real limits 下图我的算法算出来曲线(蓝色) 为了验证算法,我做了VSCode额度插件 证明我的算法算出来曲线(蓝色),与官方/usage返回的曲线(棕色),可以完全拟合 下图是中转站/sub2api拼车的算法曲线(蓝色) 与官方/usage返回的曲线(棕色),完全无法拟合,是要上天的节奏 中转站算出金额是ccmax官方金额的4倍以上 输入输出费用不大,写缓存占费用40%以上,读缓存占40%以上 因为sub2api可以设置价格,以上算法指默认算法,不代表所有车主都是这么算,例如有的车主就不算读缓存 求解过程 更新中 7 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-26 00:51:40+08:00 · tech

“当那层不可一世的自信和完美无缺的光鲜外表被剥离之后,你会惊讶地发现,这群年轻人身上寄居着令人窒息的恐惧、焦虑、失落、无助、空虚和孤独” 不知道你读到这段话时内心做何感想。作为小镇做题家的我,求学路上一路高歌猛进,靠一点努力和天赋进入名校。我身边充斥这大量这样的人。在读这本书时,我有种豁然开朗的感觉。 没有什么所谓正确的道路。如果你从未真正正视过自己,你不过是个高级一点的牛马。 这本书讲的是美国精英教育。但精英教育在哪里都大相径庭。这本书与其说是呼吁改革,不如说是呼吁反抗。这场反抗来得太晚了。 “我们每个人都有与生俱来的思维,但只有在经历了反思、内省,并建立起思想和内心的交流,理想和现实的桥梁之后,我们才能成为独特的、具有灵魂的个体。这就是发展自我意义所在” 与诸位有相似感触的佬友们共勉 1 个帖子 - 1 位参与者 阅读完整话题