IT之家 6 月 8 日消息,美国大数据分析与人工智能软件公司 Palantir 首席执行官亚历克斯・卡普并不认同当下盛行的“词元刷满(tokenmaxxing)”风潮。卡普向来直言不讳,他将人们无节制滥用人工智能的心态比作沉迷色情内容。 在 Palantir 人工智能平台十周年大会的场外,卡普接受 TBPN 直播采访、谈及公司对词元用量的管控时表示:“我们内部私下会把这种行为称作‘精神沉溺式滥用’,说白了就和自慰成瘾一样。不得不说,有些人整天沉溺其中,俨然染上了类似色情成瘾的毛病。” IT之家注意到,卡普的观点,与公司首席技术官沙亚姆・桑卡上月在财报电话会议上对分析师的表态不谋而合。这家数据分析与科技企业一直将自身定位为“拒绝粗制滥造的阵地”。桑卡认为,企业必须明白:单纯依靠低成本人工智能无法创造更多价值,除非拥有像 Palantir 人工智能平台(AIP)这类能为 AI 模型筑牢落地根基的系统。 桑卡称:“词元用量越多,产出内容就越粗劣。当企业愈发依赖这种大众化的智能能力时,就越需要一套体系来规避经济损失,进而真正挖掘出商业价值。” 词元是大语言模型的基础单元,模型会将词汇拆解为数字单元,一个词元大约对应四分之三个单词。各大 AI 企业与模型服务商,通常按照词元消耗量和所用模型来计费。 近几周,硅谷及科技圈不少人开始强烈反对“词元刷满(tokenmaxxing)”的风气。此前,随着智能体技术不断迭代、能力持续提升,行业一度盛行无节制使用 AI 的做法。 优步首席运营官安德鲁・麦克唐纳也道出了业内的顾虑。他表示,这家网约车企业始终无法看出,不断攀升的 AI 成本和提升效率等实际收益之间存在关联。谈及麦克唐纳的言论,卡普称,就在不久前,公开质疑 AI 还被视作不明智的举动。 卡普回忆初次接触行业舆论时说道:“最开始,大家只是觉得 AI 或许具备真正价值。直到大约两周前,业内人才猛然惊醒:AI 的确是实打实的新技术,可实际应用却收效甚微。但没人敢公开说出这点,生怕被人当成外行。” 卡普认为,如今所有人都承认 AI 技术真实可行,但围绕这项技术产生的诸多问题 —— 包括竞争对手试图打造对标 Palantir 本体知识库的产品等,归根结底都取决于行业认知与专业判断力。 他表示:“AI 相关技术可以规模化落地,也能创造可观价值,但最终大多会沦为同质化的通用工具。可如何精准定位企业亟待解决的业务难题,这种判断力是无法被规模化复制的。” 卡普坦言,AI 模型确实能出色解决一部分问题。他举例道,比如输入指令“撰写一份国内生产总值增长报告”,这类任务 AI 就能轻松完成。 但面对更为复杂的难题,仅靠 AI 本身远远不够。 “比如这类需求:‘我要优化油气开采的专属工艺,既要合法合规、恪守道德准则,还要降低生产成本。我想重塑所在行业的供应链,无论领域是军工、包装制造还是汽车产业。’”卡普解释道,“这类工作需要一套严谨、精准且持续运转的业务流程。大语言模型可以为其赋能,但绝无法取而代之。”
全国一卷作文直接秒了好像 三个分论点直接有了,世界,时代,历史 《词元》,原来是《Token》,结合人工智能,秒了就[捂脸] 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 6 月 5 日消息,6 月 3 日,中国信通院宣布中国电信、中国移动、中国联通的“词元产品”服务已正式登陆中国算力平台。 据介绍, 词元(Token)是大模型处理信息的最小信息单元 ,具有智能时代可计量、可定价、可交易的特征。当下,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业商业化的重要路径。为满足用户日益增长的算力使用需求、大幅降低 AI 服务成本,三大运营商相继推出词元产品。 天翼云 Token Plan 产品分为开发者 / 中小企业版和个人 / 家庭版。开发者 / 中小企业版基于 GLM-5 大模型能力,提供标准化词元产品,覆盖代码开发、复杂逻辑推理、长文本处理、智能体搭建等专业需求,满足轻量化业务开发、批量调用、日常项目迭代等高频商用使用场景;个人 / 家庭版依托 DeepSeek V3.2 通用大模型能力,提供轻量化词元产品,适配日常办公辅助、学习创作、生活咨询等全场景个人需求。 移动云 Coding Plan 产品是为开发者打造的 AI 编码订阅服务,接入主流代码模型,兼容主流 AI 编程工具,覆盖代码编写、代码审核、架构设计等应用场景。区别于传统的按量付费模式,Coding Plan 产品订阅后按请求次数收费,搭配极具吸引力的新人体验价,可极大降低高频 AI 使用门槛。该产品目前主要 MiniMax-2.5,支持 Claude Code 、OpenCode、OpenClaw、移动云 MobileClaw 等编程工具。 联通云同步推出了 Coding Plan 及 Token Plan 产品 。Coding Plan 是面向 AI 编程场景的订阅产品,整合 DeepSeek V4、GLM-5、MiniMax M2.5 等顶级模型,兼容主流 AI 编程工具;Token Plan 分为个人版与团队版双轨产品,个人版面向创作者、职场人士,支持 DeepSeek V4-Flash、MiniMax M2.5 模型,按词元计量,团队版面向企业级应用,采用 Credits 弹性计费,适合企业办公、智能体调用等场景。其中 目前,三大运营商的“词元产品”服务已在中国算力平台 · 算力超市同步上架。
IT之家 6 月 4 日消息,在当地时间周二的一场面向企业客户的活动上,OpenAI 首席执行官山姆 · 奥尔特曼聊起了全公司词元(token)消耗量最多的用户。 奥尔特曼透露,六年半以前,OpenAI 内部头号词元消耗者每月要消耗十万个词元,在当时“几乎是全球词元消耗第一人”。 “时隔六年半的如今,这个消耗量差不多已经变成了全球人均使用水平,”奥尔特曼表示,“而眼下 OpenAI 内部的词元消耗冠军,每月要用掉约 1000 亿个词元。” 不过这还算不上全球最高消耗量。奥尔特曼称,公司发现有一位外部用户的词元开销还要更高,这件事让他私下觉得颇为难堪。 大手大脚耗用词元已然成了 OpenAI 的内部风气。据悉公司内部设有词元消耗排行榜,员工还时常在社交平台 X 上晒出自己的高额使用记录来炫耀;当然,OpenAI 本身就是词元售卖方,这也在客观上助长了这类消耗。 还有更多实例佐证员工的惊人消耗量:OpenClaw 的开发者彼得 · 施泰因贝格尔晒出的截图显示,有人 30 天内就消耗了 6030 亿个词元;《纽约时报》也曾报道,一名 OpenAI 员工单周就用掉 2100 亿个词元。 IT之家注意到,就在 OpenAI 放任内部海量消耗词元之际,其他企业却在严控开销。亚马逊关停了内部词元消耗榜单,Uber 首席运营官坦言相关开支性价比堪忧后,公司也出台了词元使用限额制度。 奥尔特曼表示,OpenAI 仍在迭代优化自研模型,同时探寻各类降本增效方案,力求“以更低成本创造更高价值”。 他还提到,AI 成本问题是突然浮出水面的。2026 年初,“没人在意开销问题,大家对当时的消耗额度完全满意”。但现如今,AI 使用成本已经成了亟待解决的重大难题。
IT之家 6 月 3 日消息,据央视新闻报道,江苏无锡市数字新基建有限公司联合当地有关部门打造了无锡城市智算云平台“词元超市(Token 超市)”, 该平台系江苏全省首个商用万卡集群,自五月下旬试运行以来,已服务近五十家客户 。 ▲ 图源央视新闻 目前, 平台已汇聚智算资源超 13000PFLOPS,提供阿里通义、DeepSeek、阶跃星辰等主流大模型 ,用户可按需选择文本创作、智能问答、逻辑推理等多元业务场景,平台依据输入、输出 Token 实际用量精准核算服务费用,按需付费、灵活可控。 央视新闻报道称,对小微企业来说,接入此类“Token 超市”可大幅降低成本,当地企业还可申领市级算力券享受政策补贴,精准对接产业落地场景。例如一家本地智能安防企业,用上“Token 超市”后,研发效率猛增、成本大降。这背后是平台接驳了三十多家主流模型厂商,后台自动调度最优解。
那个男人的公益站实在是太超模了,限量8.8ldc换0.2x的100$额度,8h不限量套餐的深夜福利200多ldc,我已陷入LDC枯竭 5 个帖子 - 5 位参与者 阅读完整话题
在AI Agent等应用带动下,全球词元消耗量进一步攀升。根据OpenRouter最新数据测算,上周(5月18日至5月24日)全球AI大模型总调用量为28.9万亿Token,较此前一周增长7.4%。调用量已连续五周上涨,大模型调用需求仍在持续释放。 图源:OpenRouter 其中,上榜的AI大模型中,中国AI大模型周调用量达9.22万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。 中国大模型周调用量连续四周超过美国并稳居全球首位 。 截至目前,DeepSeek-V4-Flash已登顶OpenRouter全球AI大模型调用榜。 OpenRouter是一个AI模型聚合与调用平台,提供透明的token级监控与计费系统,旨在解决开发者在调用多个AI模型时面临的接口碎片化、密钥管理复杂和成本控制等问题。其用户以海外开发者为主,中国开发者仅占约6%。 在国内,Token调用量大幅增长已不是新鲜事。根据国家统计局,2026年3月, 仅是国内日均Token调用量就已突破140万亿 ;豆包日均使用量在3个月内翻倍至120万亿。 中金公司测算,在中度使用场景下,当Agent的渗透率达8%时,Agent的总Token消耗量已与Chatbot相当;Agent普及呈现出对Token消耗的乘数效应,随着单任务复杂度、使用时长与渗透率的协同提升,有望推动日均Token消耗实现5倍以上增长。 随着词元消耗与日俱增,Token工厂及Token运营商陆续落地。 根据各公司官网,中国移动4月21日推出面向个人用户的Token算力服务产品,支持DeepSeek、Qwen等主流大语言模型,最低5.99元即可购次包;中国电信5月17日正式推出系列试商用Token套餐,中小微客户基础版价格39.9元/月;中国联通上海分公司5月16日宣布向上海OPC客户提供Token服务。 与此同时,中国电信已发布“Token工厂”生成能力服务集中采购项目招标公告。天风证券指出,AI数据中心正向“Token工厂”演进,强调对大规模数据处理能力的需求。 中信证券表示, Token工厂及Token运营商的出现,标志着Token生成能力从附属变为可计价的标准化服务 ,将推动算力租赁市场从当前以“裸金属”服务器租赁时长为基础的固定月租模式,转向按实际Token用量计费的模式。 该机构强调,当Token成为算力的计价单位,算力租赁服务商能够充分收获Token需求持续膨胀带来的红利,所有AI应用场景的高速渗透。算力租赁行业当前的高景气度主要源于国内算力市场的供需错配,使得掌握高端算力芯片资源的头部租赁公司卡位优势更加凸显。综合赛道景气度与当前行业逐渐出清、向头部集中的趋势,看好头部算力租赁厂商在Token用量新一轮增长趋势下的增长弹性。 查看评论
IT之家 5 月 23 日消息,据国家数据局消息,5 月 22 日,国家数据局党组书记、局长刘烈宏主持召开词元经济座谈会。会上,中国经济时报社、中国政法大学、中国人民大学、清华大学等单位的专家代表, 阿里云、腾讯、月之暗面 、海天瑞声、中国国际金融有限公司等企业代表,围绕“推动词元经济健康可持续发展,充分释放数据要素价值”发表意见建议。国家数据局党组成员、副局长夏冰出席会议。 词元是大模型处理文本、代码、图像、音频、视频等所有信息时采用的最小运算单元,正在成为人工智能服务的计量单位、结算单位和统计单位。 国家数据局将把推动词元经济发展纳入工作体系 ,持续跟踪研究并吸收社会各界建议,以行业高质量数据集建设和全国一体化算力网建设为着力点,深入推进数据要素市场化配置改革,推动词元经济高质量发展。 IT之家注意到,在今年 3 月举行的中国发展高层论坛 2026 年年会上,国家数据局局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。这从官方角度给出了 Token 的中文翻译:“词元”。 截至 2026 年 3 月,我国日均词元调用量已攀升至 140 万亿次以上,这一数字较 2024 年初的 1000 亿次实现千倍跃升;即便与 2025 年底的 100 万亿次相比,短短三个月内增幅亦超过四成。
现在deepseek v4 flash官方api的输出速度高达每秒100多词元, 难道是高端算力已经到货了?毕竟快下半年了,折扣也只剩下不到十天。 5 个帖子 - 5 位参与者 阅读完整话题
IT之家 5 月 21 日消息,据新华社今日报道,中国移动宣布在全国上线 词元(Token)套餐 。此次中国移动创新推出统一算力量纲,其将不同模型、不同规格的词元消耗统一封装为标准积分,旨在解决多模型量纲不统一的问题。 据中国移动相关负责人介绍, 该套餐价格最低为 5 元月包 ,包含一定数量的词元,适合轻度体验用户。中国移动的词元套餐已实现全国用户全覆盖。 除了基础算力套餐,中国移动还将词元和云电脑、云手机等产品深度融合,用户购买词元套餐,可直接在类似腾讯 WorkBuddy 等 AI 应用上使用。 IT之家测试,在中国移动 App 搜索 Token,会直接跳转到北京移动的算力 Token 套餐页面,Token 次包定价 5.99 元起 / 次,月包定价 24.99 元起 / 月。IT之家暂未查询到其他地区的词元(Token)套餐办理渠道。 据IT之家此前报道, 中国电信在 5 月 17 日推出系列试商用 Token 套餐 ,面向个人及家庭用户推出轻享版、畅享版、尊享版三档 Token Plan,每个月的资费价格分别为 9.9 元、29.9 元、49.9 元,分别对应每月 1000 万 Tokens、4000 万 Tokens、8000 万 Tokens。
词元,或者说token,对于模型调用来说算是计量单位,和"克"是一样的。 “词元经济"这样用词,就好比黄金用克来计量,所以把黄金相关的产业称为"克经济”。 老百姓怎么说都不要紧,但是官媒这么说就有点出洋相了。 果然应了那句老话,文化工作者一定要有文化。 9 个帖子 - 9 位参与者 阅读完整话题
IT之家 5 月 15 日消息,“微信派”官方公众号今天发布了微信全球青少年 Ai+ 小程序洞察报告,并预告第四届小程序全球创新挑战赛总决赛将于 5 月 16 至 17 日在深圳举行。 微信表示,小程序教育平台正式对外开放 4 年以来,有 7954 所学校、17830 位老师、87477 名学生相继卷入浪潮,创建了 287002 个小程序项目,覆盖全球多国。同时,师生使用 AI 创作小程序消耗词元(Token)每年超 50,000,000,000(500 亿),可供人与 AI 完成 375 万次日常对话。 地域方面,港澳地区和首都包揽小程序数量前三,许多项目合作跨越重重山海,例如重庆巴蜀常春藤学校与新加坡华侨中学的学生联合开发《校园文化交换站》,帮助两国学生无缝社交。 同时,基于这一“教 AI、学 AI、用 AI”全流程教学平台,微信连续四年举办小程序全球创新挑战赛,四年赛事累计诞生 7430 个小程序作品。
IT之家 5 月 13 日消息,据英国《金融时报》报道,继上月 Meta 与微软被曝出员工存在类似行为后,亚马逊成为又一家出现员工刻意虚增 AI 词元(token)消耗量、以此达成内部使用指标的超大规模科技企业。 亚马逊设定考核目标,要求超 80% 的研发人员每周必须使用人工智能工具,并通过内部排行榜实时统计词元消耗数据。多名员工向《金融时报》透露,他们一直在使用公司自研智能体平台 MeshClaw,该平台可自主发起代码部署、邮件分类处理、联动职场通讯软件 Slack,员工借此刻意刷高 AI 词元使用量。亚马逊官方表示,工具使用数据不会纳入绩效考核,但多名员工认为管理层仍在暗中监控相关数据。有员工直言“公司施压要求必须使用这类 AI 工具的压力极大”,也有员工称这种数据排名机制催生了扭曲的逐利动机。 这种被业内称作“词元刷量(tokenmaxxing)”的现象如今已十分普遍,甚至衍生出专属行业术语和内部排名榜单。而抛开职场内卷文化不谈,若人工智能词元消耗中有相当一部分只是应付式虚假使用,那么全球数千亿美元 AI 基础设施采购所依据的市场需求数据,其可信度又能有多高? 亚马逊、微软、谷歌母公司 Alphabet、Meta 四家科技巨头 2026 年合计资本开支预估在 6500 亿至 7000 亿美元(IT之家注:现汇率约合 4.43 万亿至 4.77 万亿元人民币)区间,华尔街部分机构更是预测 2027 年这一数值将突破 1 万亿美元(现汇率约合 6.81 万亿元人民币)。各大超大规模企业均向投资者宣称,AI 推理算力一经部署便会迅速被市场吸纳。企业内部研发人员的工具使用量显然是算力消耗的组成部分,这类内部消耗与外部付费客户用量,共同构成企业规划算力规模、采购 GPU 芯片、高带宽内存(HBM)及配套电力基建的核心依据。 “词元刷量”并不代表人工智能整体需求完全造假:企业级 AI 应用渗透率确实在持续提升,推理算力负载也正规模化落地至生产场景。但应用普及度和消耗强度有着本质区别:前者是支撑行业需求的长期核心动力,后者却可以人为操控刷量,而当下企业自身设计的考核激励机制,进一步放大了这种虚耗乱象。另有报道称,AI 工具使用成本甚至高于真实人工成本,这也让行业现状愈发扑朔迷离。 Meta 的 AI 使用内部排行榜在丑闻曝光后仅维持数日便草草下线,亚马逊近期也已收紧团队整体使用数据的公开权限。一旦统计考核规则发生调整,由旧规则催生的虚高消耗强度也会随之回落。 英伟达首席执行官黄仁勋曾将人均研发人员词元消耗量列为核心行业指标,并直言:倘若一名年薪 50 万美元的技术人员,每年消耗的 AI 词元价值不足 25 万美元,他会对此深感担忧。英伟达的推理业务增长,本质依赖真实、可持续、可叠加的高效算力负载;而每一笔刻意虚增的词元消耗,占用的都是实打实的 GPU 算力资源。 Block 公司前 AI 工具工程副总裁安吉・琼斯在接受行业媒体 LeadDev 采访时表示,她认为行业未来会转向考核词元使用效率,而非单纯追捧使用总量。当前行业普遍提前数年敲定 GPU 订单与电力配套规划,规划背后的需求预测精准度至关重要。各大超大规模科技企业正按照知识型从业者人均年算力消耗数十万美元的行业预期大举基建。而这类算力消耗最终是创造实际业务价值,还是仅沦为职场应付式刷量,将直接决定今年近 7000 亿美元的基建投入,能带来多少长期稳定的商业回报。
IT之家 5 月 12 日消息,近期一款国产游戏《历史模拟器:崇祯》引发玩家争议,本作使用 AI 生成剧情,采用“本体买断,词元(Token)收费”制度,也就是玩家花费 48 元购买游戏后,如果需要持续推进游戏过程,就需要额外付费购买词元。 对此,官方目前发布公告,声称将开放“自定义 API”与“创意工坊”功能。玩家未来可以自行接入支持范围内的大模型服务,自由选择模型并控制成本。 与此同时,游戏还将同步上线创意工坊功能,允许玩家基于《历史模拟器:崇祯》的核心框架,自行创作剧本、规则以及玩法内容。官方强调,具体的上线时间、支持模型范围以及上传审核规则,后续会以正式功能公告的形式公开。
MiniMax 不认马嘉祺?稀宇科技公布大模型“失语”原因:特定词元后训练不足导致 - IT之家 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 9 日消息,在人工智能领域,一个大模型能够准确“复述”特定名词,看似是一项基础能力,却也可能因训练机制的细微偏差而“失灵”。 稀宇科技(MiniMax)今日发布官方技术报告,就旗下 M2 系列模型无法正确输出“马嘉祺”等特定人名一事进行了解答,并宣布已通过全词表合成数据覆盖完成性能修复。 据介绍,该问题的核心在于大模型处理文字的“分词器”(Tokenizer)机制。与传统逐字处理不同,大模型在读写文本时会先将文字切分为若干“词元”(Token)。 在 MiniMax 模型的词表中,“马嘉祺”被切分为“马”和“嘉祺”两个词元。其中,作为一个人名整体,“嘉祺”被合并为一个独立的词元。 IT之家注:大模型训练通常分为两个阶段:预训练阶段接触海量互联网文本,让模型掌握广泛词汇;而后训练(即指令微调)阶段则使用精选对话数据来教会模型如何与人交流。 MiniMax 团队排查发现,在其后训练所使用的对话数据中,含有“嘉祺”一词的样本数量极少。这种数据分布上的稀疏,导致“嘉祺”这一词元在后训练阶段几乎没有得到有效训练。 与此同时,大量高频词元(如工具调用标记、编程符号等)在训练中不断更新其向量参数,持续“挤压”“嘉祺”这类低频词元的向量空间,最终将其推离了原本正确的生成概率区域。当模型需要输出这一名字时,只得退而求其次,选择了发音相近的高频词元,例如“佳琪”或“琪琪”。 ▲ 统计分布检查:对比全词表的 embed_tokens norm 分布,token 190467(“嘉祺”)的向量范数落在正常分布范围内,未出现未训练 token 常见的异常小值的现象,表明该 token 在预训练阶段已被充分学习 ▲ “嘉祺”对应的权重向量在后训练过程中发生了显著偏移,余弦相似度大幅下降且 Norm 变化很大 值得关注的是,这并非孤立个案。为了系统性地评估这一现象的普遍性,MiniMax 团队对模型全部约 20 万个词元进行了参数扫描。 结果发现,约有 4.9% 的词元在模型后训练后发生了显著退化。这些退化的词元大致可分为四类:预训练阶段使用的特殊标记(如代码填充符号)、LaTeX 公式与维基百科源码标记、中文 SEO 垃圾关键词(如“传奇私服”、“无痛人流”等),以及占比最大的日文口语和博客模板表达。 这一发现直接解释了该模型另一个长期存在的疑难问题:在日语对话中偶尔会混入俄语或韩语字符。统计数据显示,日语词元的退化比例高达 29.7%,远超中文(3.9%)和英文(3.5%)等其他语种。这说明,数据稀疏的后果是全局性的 —— 当后训练数据对不同语种的覆盖率不均衡时,模型在生成响应时就可能误入歧途。 ▲ 小语种混淆率实验评测(核心指标,100 次采样,temperature=1.0):分别使用韩语和日语 prompt,统计输出中非目标语言字符的出现率。 在确认根因后,修复思路随之变得清晰:确保每个词元在后训练阶段都能获得最低限度的训练。为此,MiniMax 构造了一份覆盖全词表的合成数据,通过让模型完成“复读”任务,为所有词元建立起生成频率的下限保障。 官方基准数据显示,修复后模型的全词表输出参数稳定度(余弦相似度)最低值已大幅提升至 0.97 以上;同时,日语回答中混入俄文字符的比例由修复前的 47% 降至 1%。 除此之外,MiniMax 团队目前仍在同步探索更多优化方向,包括在指令微调数据中混入预训练语料、针对未覆盖词元定向合成对话样本、以及从源头裁撤词表中业务场景永不启用的特殊标记等。 MiniMax 反思道,这一问题的深层原因在于分词器设计与下游使用场景之间的脱节。毕竟,大模型的分词器通常基于大规模的网络语料训练而成,其中不可避免地包含大量仅出现在特定领域或小众语言中的词元。这些词元在预训练阶段尚能获得充分训练,一旦进入后训练阶段,就会因数据分布差异而失去其生成能力。这起看似简单的个案,最终暴露出一个影响深远的结构性问题:在后训练阶段,团队不仅要保证语义层面的多样性,更需要从底层的统计视角保障词元层面的数据覆盖。
IT之家 5 月 9 日消息,据央视财经昨天报道,数据显示,到今年 3 月份,我国日均 Token(词元)调用量突破 140 万亿,飙涨超 100000%、两年增长超千倍。 据报道, 今年以来国内外多款大模型接连上新 、 AI 智能体(Agent)快速普及 ,带动算力市场持续升温。专家表示,从当前的供需情况看,未来一段时间算力租赁市场仍有望持续增长。 赛迪研究院电子所先进计算研究室副主任徐子凡表示,当前算力租赁行业处于高景气、结构性紧缺的阶段,2026 年市场规模预计达到 2600 亿元, 高端的 GPU 出租率超过 90% 。 IT之家注:Token(词元)是计算机科学与自然语言处理领域中的一个基础且重要的概念,通常指文本数据经过分词或标记化处理后的最小单位,其中单位可以是单词、标点符号、数字或其他任何有意义的符号。
IT之家 5 月 8 日消息,在今天召开的中国移动 2026 移动云大会主论坛上。中国移动董事长陈忠岳展望了集团未来发展计划,中国移动将打造领先的算力网络,推进全国一体化算力网建设,提供即取即用、普惠易用的算力服务。 具体来看,中国移动将加强枢纽节点、热点区域间全光网高速直联,加速 AI 数据中心建设,布局吉瓦级数据园区。升级 AI 云算服务,牵引构建多元异构国产算力生态,更好支撑大模型训推、智能体发展。 同时,中国移动将强化移动云大会平台作用,推进“算力新动能行动”,在资源建设、算力互联、融合融通等方面深化合作,开放万亿级词元(Token)服务体验包。推进“智能新空间计划”,聚焦算力网、智能体、工业互联网等方向,深化智能服务融合创新,服务亿万客户和广大开发者。 IT之家注意到,今天中国移动还发布了移动模型服务平台 MoMA, 接入超 300 款业界主流 AI 模型 ,首创 Token(词元)集约化运营模式,基于国产算力部署自研推理引擎打造。该产品可提供统一 API 网关,目前已接入中国移动自研基座大模型“九天”,以及 DeepSeek、通义千问、豆包、Kimi、GLM 等业界优质模型,覆盖文本生成、语音处理、多模态理解等多项能力,满足政务、金融、工业、医疗等场景应用需求。
IT之家 5 月 7 日消息,科技行业正进入人工智能支出趋于理性的新阶段,企业管理平台 Jellyfish 发布的最新数据显示,并非消耗 AI 词元(token)最多的企业就能成为最终赢家。 IT之家注意到,Jellyfish 在近期一项研究中表示, Claude Code 使用率前 10% 的用户,消耗的 AI 词元数量约为普通开发者中位数水平的 10 倍,但产出成果仅为后者的两倍左右。 AI 词元是人工智能模型将文字和输入内容拆分而成的小型文本单元,用于模型运算处理。同时它也是 AI 服务的计费依据,收费标准通常按每百万词元计价。 Jellyfish 人工智能与研究主管尼古拉斯・阿尔科拉诺表示,这一差距清晰表明,员工无节制消耗 AI 词元的极致词元滥用行为,并非可持续的使用策略。 他在采访中坦言:“ 首席财务官们已经开始严格管控这类开支 。如今大多数企业里,员工开展工作都必须提供费用凭据。客户固然希望业务推进提速,也愿意在人工智能领域投入资金,但前提是必须证明开支合理、能产生实际价值。” Jellyfish 掌握数百家企业、数十万软件工程师的编程行为数据。研究发现,海量消耗 AI 词元未必能创造实际效益,反而会推高企业成本。这也推动科技行业迈入全新阶段:AI 使用效率的重要性日益凸显。 阿尔科拉诺称:“即便你能自圆其说,认为 AI 完成工作的综合价值高于人工,但一旦词元成本飙升,首席财务官依然会担心财务报表失控。” 事实上,Jellyfish 的报告凸显了高端用户词元消耗量的惊人增幅。Claude Code 高频使用者人均每周词元消耗量高达 2.25 亿,而平台监测的普通软件工程师周消耗量仅为 3200 万。 与此同时,以代码提交合并请求(代码产出的通用衡量指标)为标准来看,AI 使用率与工作效率呈正相关。最新数据显示, AI 高使用率团队的代码合并请求处理量,较低使用率团队高出 77%。 阿尔科拉诺指出,单纯的词元总量杂乱无章,无法单独作为工作效率评判标准。即便工程师编程习惯没有变化,AI 模型版本更新也可能导致词元消耗量大幅波动,这意味着开发者的词元花费并不能真实代表实际工作产出。他建议企业管理者应关注单次代码合并请求成本等以成果为导向的指标,而非单纯统计词元总消耗量。 换言之, 大量使用 AI 确实能提升效率,但效果存在边际上限 。公司数据表明,频繁借助 AI 智能体辅助编程的高活跃用户,整体效率确实更高, 但其效率提升幅度与词元投入成本并不成正比。 阿尔科拉诺解释道:“有些人不愿提前规划最优方案,反而让五个 AI 智能体用五种不同方式开发,再从中挑选最优版本。这过程中会浪费大量无效工作量。这种方式或许有效,总成本也仍低于纯人工开发,但远不如提前定好一套方案来得省钱。” 在阿尔科拉诺看来,最优发展路径是大范围推广 AI 编程应用,让更多工程师进入中等合理使用区间,既避免 AI 使用不足,也杜绝过度消耗资源。 维持这种适中水平,才能让人工智能成为企业持久的运营优势:既能借助 AI 切实提升产品交付效率,又不会为了追求微弱的产出增量而无谓浪费成本。
2 个帖子 - 2 位参与者 阅读完整话题