WWW.YOUINFO.SITE
标签聚合 利用率

/tag/利用率

LinuxDo 最新话题 · 2026-06-05 01:13:16+08:00 · tech

我发现了一个把 Codex 用到极致的小技巧:用 Automations 做低 token 窗口启动器 我发现一个把 Codex 工作窗口利用率拉满的小技巧 最近在高强度使用 Codex 的时候,我发现一个很实用的玩法: 不要等到真正开始工作的时候,才手动发第一条消息。 而是用 Codex Automations 设置几个固定时间的“轻量级窗口启动任务”。 这不是绕过限制,也不是自动刷任务。 核心思路是: 用极低 token 的定时任务,提前启动/刷新 Codex 工作窗口,然后等我真正开始工作时,可以直接接上。 我的工作时间大概是: 09:30 上班 12:00–13:30 午休 20:00 下班 晚上还会继续用到 01:30 左右 如果按 5 小时一个窗口来规划,最舒服的节奏不是 09:30 开始,而是: 07:00 启动第一轮窗口 12:00 午休刷新 17:00 下午刷新 22:00 夜间冲刺刷新 01:30 收工 这样一来,真正高强度使用时,Codex 的窗口刚好覆盖: 09:30–12:00 13:30–17:00 17:00–22:00 22:00–01:30 最重要的是: Automations 不要让它读整个项目,不要扫 README,不要扫 docs,不要跑测试,不要构建,也不要自动改代码。 我只让它维护一个极简状态文件: D:\ai\codex\codex_window.md 每次定时任务只做一件事: 读取这个状态文件 在顶部追加一条窗口记录 整理 3 条以内的下一轮待办 输出极短 summary 不读其他文件 不执行项目命令 不提交 commit 不创建 PR 这样做的好处是: token 消耗非常低 不会因为自动任务乱读项目导致上下文污染 不会误改代码 每个 5 小时窗口都被安排到关键工作时段 我打开 Codex 时,不是从零开始,而是已经有一个干净的窗口状态 白天、午休、下班前、夜间冲刺都能自然接上 我现在的理解是: Automations 不适合自动大改项目。 Automations 更适合做“低 token 启动器 + 状态锚点 + 人工接手前的准备”。 我给每个 Automation 的核心要求是: 这是一个轻量级 Codex 定时窗口任务。 目标:只启动/刷新本轮 Codex 工作窗口,并维护一个极简状态文件。 不要大量读取项目。 不要扫描 docs。 不要读取 README。 不要分析全项目。 不要跑测试。 不要构建。 不要修改业务代码。 唯一允许读取和修改的文件: D:\ai\codex\codex_window.md 如果该文件不存在,请创建它。 如果目录 D:\ai\codex 不存在,请只创建这个目录和这个状态文件。 除此之外,不要读取、扫描、分析或修改任何其他项目文件。 请只做以下事情: 1. 读取 D:\ai\codex\codex_window.md。 2. 在文件顶部追加一条本次窗口记录,包含: - 当前时间 - 本轮窗口类型 - 本轮建议用途 - 上一轮遗留事项摘要 3. 如果文件中存在“下一轮待办”,请只整理成 3 条以内。 4. 不要读取 README。 5. 不要扫描 docs。 6. 不要检查 git diff。 7. 不要分析全项目。 8. 不要执行测试命令。 9. 不要执行构建命令。 10. 不要运行项目。 11. 不要修改业务代码。 12. 不要提交 commit。 13. 不要创建 PR。 14. 不要访问除 D:\ai\codex\codex_window.md 以外的任何文件。 最后只输出一个极短 summary: - 本轮窗口已启动 - 下一步我应该做什么 - 是否有上一轮遗留事项 严格限制:本任务的核心价值是低 token 启动/刷新窗口,不是解决问题。不要为了“显得有产出”而扩大范围。 我觉得这个玩法最大的价值不是“自动干活”,而是: 把 Codex 的有效工作窗口,和人的真实工作节奏对齐。 这个方式对每天长时间用 Codex 的人很有用,尤其是那种白天工作、晚上继续冲刺的人。 5 个帖子 - 5 位参与者 阅读完整话题

plink.anyfeeder.com · 2026-05-05 13:05:54+08:00 · tech

坐拥约55万块英伟达GPU,实际算力利用率仅有11%,这一巨大反差让马斯克旗下 xAI 近期推向舆论风口浪尖,也引发业界对其算力利用效率的广泛质疑。据外媒《The Information》获取的xAI内部备忘录显示,xAI公司总裁迈克尔·尼科尔斯(Michael Nicolls)向团队坦言,目前公司模型浮点运算利用率(MFU)约为11%。 这一数字背后的含义十分直观:理论上可输出100份训练算力的硬件,实际仅能产出11份,尼科尔斯在备忘录中直白评价其“低得尴尬”,并明确为团队设定了目标——未来几个月内将这一利用率拉升至50%。 据悉,xAI目前拥有约55万颗NVIDIA GPU,涵盖H100和H200系列。尽管这些GPU比最新的Blackwell产品落后了一个世代,但如此庞大的硬件部署规模,仍给市场留下了深刻印象。 需要指出的是,11%这个数字,并非指89%的GPU在完全闲置,而是衡量有效训练吞吐占硬件理论峰值算力比例的严苛指标。 与行业基准相比,xAI的表现差距尤为明显。 当前,生产级大模型训练的MFU通常维持在35%至45%之间,其中Meta和谷歌凭借长期积累的深厚软件堆栈,其GPU利用率分别可达约43%和46%; 即便在以“低效”著称的GPT-3训练时期,MFU也能稳定在21%-26%之间。反观xAI的11%,不仅远低于当前行业主流水平,甚至不及AI算力发展史上的“古早”尴尬时期。 值得一提的是,坐拥顶级算力却难以发挥价值, xAI 症结不在硬件,而在软件短板。 据悉,xAI一直照搬英伟达标准部署方案,但软件堆栈、并行策略和模型工程优化,远远跟不上硬件激进扩张速度。 具体来看,HBM显存读取速度远慢于计算芯片,导致芯片大量时间空转等待数据;网络拓扑中的任何一处瓶颈,在数万张卡的同步要求下,都会被急剧放大。 此外,Lambda等机构分析指出,显存压力、过度的激活重计算和张量并行带来的跨GPU通信开销等,都是拖累MFU的系统性因素。 值得注意的是,xAI 基建扩张堪称行业奇迹,其Colossus 超算仅 122天建成,GPU规模短时间内极速扩容,过快的硬件铺摊,也放大了软件优化滞后的致命短板。 查看评论

www.ithome.com · 2026-05-03 21:30:07+08:00 · tech

IT之家 5 月 3 日消息,据《The Information》今日报道,马斯克旗下人工智能公司 xAI—— 也就是 Grok 大模型的幕后团队,目前手头上约有 55 万块英伟达 GPU(包括 H100 与 H200),但实际利用率仅有 11%。 据介绍,这些硬件目前主要部署在孟菲斯的 Colossus 超算集群中,采用液冷配置。尽管与 Blackwell 最新一代产品相比稍显老旧,但这样的体量在全球范围内依然位居前列。 然而,如此海量的硬件并未转化为有效的计算产出。该集群的实际利用率仅有 11%。当然,这并非意味着其余 89% 的 GPU 处于完全闲置状态,而是指模型的实际浮点运算利用率远远低于理论峰值。 业内人士解释称,衡量 AI 算力效率的关键指标叫做 MFU(Model FLOPs Utilization),即模型浮点运算利用率。11% 的 MFU 意味着,理论上能产生 100 份训练吞吐量的硬件,实际只产出了 11 份,大量的电力和硬件时间都消耗在了数据等待、通信开销和重新计算等环节,而没有转化为有效的训练吞吐。 面对这一数字,xAI 总裁 Michael Nicolls 在一份内部备忘录中承认其“低得尴尬”,并为团队设定了在未来几个月内将利用率拉升至 50% 的目标。 xAI 并非个例,算力利用率偏低是整个 AI 基础设施领域的行业性难题。报道指出,在超大规模集群下,软件优化跟不上硬件部署速度是普遍现象。作为对比,Meta 和谷歌在软件堆栈上投入了大量精力,因此其 GPU 利用率相对较高,但也只有约 43% 和约 46%。 IT之家此前曾报道,Colossus 集群的建设速度令人瞠目,从启动到首阶段投用仅用了 19 天,英伟达 CEO 黄仁勋更指出“这通常需要四年的时间”。这种飞速扩张虽然让 xAI 在硬件储备上占据了先机,但目前似乎也暴露出了软件配套与分布式训练能力的滞后。 此外,业界分析指出,AI 训练具有间歇性特征,硬件在模型推理时满负荷运转,但在数据分析阶段则会陷入闲置,这是导致利用率较低的重要因素。 除了 AI 训练本身的间歇性,业内人士指出,GPU 供应短缺带来的行为扭曲也加剧了算力浪费。由于高端 GPU 产能紧张且获取周期长,许多企业担心被回收资源而倾向于囤积硬件,实际负载却无法消化,从而造成了庞大的闲置资源与高昂的闲置成本并存的现象。 为了改变现状,xAI 计划从基础设施和软件堆栈优化入手。同时,有消息指出,xAI 未来可能会推出针对其庞大 GPU 集群的租赁服务,将闲置算力转化为收入。 此外,马斯克也在大力投入 TeraFab 项目,旨在为 xAI、SpaceX 等企业设计自研 AI 芯片,并基于 Intel 14A 工艺打造下一代先进计算方案。

36氪 · None · tech

大公司: 番茄小说持续加强低质内容治理,5月处置低质书籍超15万本 36氪获悉,近日,番茄小说发布《关于加强低质内容治理公告》。公告显示,5月以来,番茄小说已累计处置低质书籍超15万本,其中拒绝签约低质书籍112706本,处置低质违规书籍40275本。 全国首单挂钩蓝色债券合约类信用衍生品交易落地山东 36氪获悉,据上海清算所,近日,在中国人民银行山东省分行指导和推动下,山东省成功落地挂钩蓝色债券的合约类信用衍生品交易。该业务是全国首单以蓝色债券为保护标的的信用风险缓释合约。 日本监管机构敦促上市公司将现金用于业务投资,而非提高股东回报 日本金融监管机构敦促国内上市公司将更多现金储备用于长期业务投资,而不是通过股票回购和提高股息来回馈股东。将企业和家庭持有的更多国家财富引导出来用于支持未来扩张,是日本首相高市早苗振兴日本经济计划的关键支柱之一。她长期以来一直批评企业资产负债表上积累的大量现金沉淀。 速卖通Brand+品牌出海计划正式开放韩国站 36氪获悉,速卖通Brand+品牌出海计划已正式开放韩国站点,今年速卖通在韩国的市场投入将激增至去年的三倍。此外,目前速卖通在韩国已实现50%的订单三日达。 多点数智联合灵心巧手成立灵美智能 36氪获悉,天眼查App显示,多点(深圳)数字科技有限公司、灵心巧手(北京)科技股份有限公司及深圳泰亿企业管理中心(有限合伙)5月21日共同出资设立“灵美智能数核(北京)科技有限公司”,三方分别持股51%、29%及20%。灵美智能数核(北京)科技有限公司法定代表人为张峰,张峰同时为多点数智联合创始人兼总裁。 新产品: 马斯克:Grok基础模型V9-Medium(1.5T)已完成训练 马斯克表示,Grok基础模型V9-Medium(1.5T)已完成训练。评估结果良好。在补充训练中加入了大量Cursor数据,后续还将继续添加。微调工作正在进行中,强化学习将于数日后启动。预计2至3周后正式发布。 投融资: “天机智能”完成10亿元融资 36氪获悉,据天机机器人官微,近日,广东天机智能系统有限公司正式完成10亿元B轮及B+轮融资,投后估值近百亿,跻身独角兽行列。本轮融资由高瓴创投、美团战投联合领投,腾讯、高榕创投、光合创投、纪源资本等联合跟投,高鹄资本担任独家财务顾问。本轮融资将主要用于技术研发、大规模量产,及全球销售网络建设。 “蓝点触控”完成C++轮数亿元人民币融资 36氪获悉,近日,六维力传感器企业“蓝点触控”宣布完成C++轮数亿元人民币融资,本轮由上汽金控、尚颀资本领投,由中芯聚源、正大机器人以及厚为资本跟投。本轮融资将主要用于新产品研发、生产数智化建设以及全球市场拓展。 “黑格科技”完成超3亿元人民币C轮融资 36氪获悉,“黑格科技”于近期完成超3亿元人民币C轮融资。本轮融资由君联资本、达晨联合领投,歌斐资产、国科投资跟投。本轮资金用途将用于光固化技术研发迭代、全球产业链深化、顶尖人才引进及新一代数字化齿科解决方案、桌面级光固化全彩造物产品的发布。 今日观点: 马斯克称未来星链将承载大部分网络流量,星链就是互联网 马斯克周日表示,如果SpaceX的星链卫星网络继续发展,最终可能会承载大部分互联网流量,并描绘了该系统成为在线连接主要骨干网的未来图景。马斯克在X上回应了一篇引用SpaceX文件细节的帖子,该文件显示星链 V3卫星的下行链路容量将大幅提升,从V2的每颗卫星96Gbps提升至1024Gbps。 其他值得关注的新闻: 新加坡寻求将富人开户时间缩短至一个月 随着新加坡作为财富管理中心的重要性上升,该国金融监管机构正与私人银行合作,以使用一种“风险适配”方法缩短开户时间。新加坡金融管理局局长谢啇真在新加坡举行的瑞银亚洲投资大会上表示,该机构希望将周期从目前中值六周左右(复杂案例需更长时间),缩短至一个月以内。谢啇真周一称,此举旨在确保银行避免对客户的财富来源进行不必要和过度的审查,同时坚持高标准。谢啇真称,金管局周一向金融机构发布了一份通函,就最新方法提供了更多指导。他还表示,业界将推出案例研究,并培训银行员工和合规专业人员。 到2030年底全国城市生活垃圾资源化利用率力争达到76%以上 记者25日从住房城乡建设部了解到,到2030年底,全国城市生活垃圾资源化利用率将力争达到76%以上。 神舟二十三号航天员乘组顺利进驻“天宫”,中国航天员完成第8次“太空会师” 据中国载人航天工程办公室消息,在载人飞船与空间站组合体成功交会对接后,神舟二十三号航天员乘组从飞船返回舱顺利进入轨道舱。北京时间2026年5月25日5时13分,在轨执行任务的神舟二十一号航天员乘组打开“家门”,欢迎远道而来的神舟二十三号航天员乘组入驻中国空间站,这是中国航天史上第8次“太空会师”,也是“天宫”首次有来自香港的航天员进驻。随后,两个航天员乘组拍下“全家福”,共同向牵挂他们的全国人民报平安。后续,两个航天员乘组将在空间站进行在轨轮换。

36氪 · None · tech

“进入5月以来,我们产能利用率大幅提升,相比去年第三季度已接近翻倍。”一位国内头部晶圆代工厂人士向记者透露,当前公司工程师人手忙不过来,值班频次显著增加。随着存储、电源管理、MCU(微控制单元)等需求密集释放,国产晶圆代工产业景气度攀升,头部企业纷纷提价,毛利率稳步提升;同时,因台积电、三星等国际晶圆代工巨头聚焦与AI芯片更密切的先进制程,先进产能被虹吸,加剧了全球成熟制程供给缺口,国产晶圆代工产业承接了这波发展机遇。(证券时报)