WWW.YOUINFO.SITE
标签聚合 maas

/tag/maas

v2ex · 2026-05-09 22:47:53+08:00 · tech

各位大佬好,最近拿了两个初创公司的 offer ,薪资差不多,有点纠结。 小弟之前主要做 Go/Rust 后端、存储和数据平台,后面想继续往 AI infra 方向走。 A:具身智能方向,主要做数据 infra 数据湖 pipeline 优化。团队技术背景看起来不错,问题也比较偏底层,但加班可能多一些。 B:多模态/视频大模型方向,主要做 MaaS 平台后端,节奏可能轻松一点。 现在纠结的是: A 跟过去经历更匹配,可能做得更深 B 离模型服务更近,能补一些新东西

linux.do · 2026-04-29 13:05:36+08:00 · tech

奖品详情: 讯飞星火 MaaS 平台 Coding Plan 专业版 × 1(有效期至 2026 年 5 月 26 日) 可用模型(modelId 统一为 astron-code-latest ): 模型 上下文长度 Spark X2 128k GLM-5 200k MiniMax-M2.5 128k KIMI-K2.5 128k DeepSeek-V3.2 128k Spark-X2-Flash 256k GLM-4.7-Flash 128k Qwen3.5-35B-A3B 128k Qwen3-Coder-Next-FP8 256k Qwen3.5-397B-A17B 256k 注意:默认模型为GLM-5,如果需要切换其他模型,需联系楼主在后台配置,无法通过 API 参数直接指定。(应该够用了吧,希望不要频繁找我切换模型。) 官方使用文档: 讯飞星辰 MaaS · Astron Coding Plan 使用文档 活动时间: 开始时间: Wed, Apr 29, 2026 12:00 AM CST 截止时间:[ Wed, Apr 29, 2026 12:00 AM CST → Wed, Apr 29, 2026 8:00 PM CST ] 参与方式: 在本帖下回复 用途和大致用量 即可参与。 抽奖规则: 每位用户仅允许参与一次。 使用 官方抽奖程序 随机抽取中奖者。 注意事项: 本活动将在活动截止时间后关闭回帖,以确保公正性。 中奖者将在活动结束后于本帖公布,并通过私信通知领奖方式(私信楼主获取 API 密钥)。 所有规则及抽奖结果由活动发起人和论坛 管理团队 最终解释。 期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。 1 个帖子 - 1 位参与者 阅读完整话题

36氪 · None · tech

36氪独家获悉,字节跳动火山引擎在今年4月已将MaaS业务营收目标上调至150亿元,且这个营收目标几乎每月都在上调。而在2025年底,这一目标还是100亿元。36氪了解到,在2025年,火山全年的MaaS收入约15亿元左右,等于截止目前2026年的营收目标是去年实际营收的10倍。可以说,火山这一波MaaS营收增长几乎都归功于Seedance 2.0的爆发——视频模型Seedance 2.0如今已经能带来单月超10亿元的收入。

36氪 · None · tech

文|邓咏仪 编辑|张雨忻 杨轩 36 氪独家获悉,字节跳动火山引擎在今年 4 月已将 MaaS 业务营收目标上调至 150 亿元,且这个营收目标几乎每月都在上调。而在 2025 年底,这一目标还是 100 亿元。 36 氪了解到,在 2025 年,火山全年的 MaaS 收入约 15 亿元左右,等于截止目前 2026 年的营收目标是去年实际营收的 10 倍。可以说,火山这一波 MaaS 营收增长几乎都归功于 Seedance 2.0 的爆发——视频模型 Seedance 2.0 如今已经能带来单月超 10 亿元的收入。 一位接近火山的人士透露,截至目前,火山引擎 Token 日均消耗量仍然保持着月度近 40% 的增速。 2025 年, 业界还在为谁才是把 MaaS 卖的最多最好价的那朵云 争论不休;来到 2026 年,行业共识已经前所未有地清晰——做出顶尖模型是迅速拉高 Token 消耗、并让客户愿意为之付费的最好方式。 Token 大战,如今已经清晰地划分为两条战线:一条是 Coding (代码),另一条则是视频。相比拥挤的常规文本对话场景里,各家公司已经把模型打到地板价,代码生成和视频生成场景依然拥有一定的议价权,尤其是视频。 而字节就是靠视频模型 Seedance 2.0 吃上了一大口红利。 字节在 2 月 10 日发布 Seedance 2.0 后立刻引发全球爆火,登顶 Artificial Analysis Video Arena,Elo 1269,在多项指标上已经超越 Veo 3、Sora 2 等海外顶尖视频模型。 而这场爆火也直接导致了模型的供不应求,尤其在春节期间曾引发长时间的用户排队——制作一个十几秒的视频甚至需要排队十个小时。此后,字节开启了白名单等策略——为签订年框的用户,提供稳定供应满血版 Seedance 2.0,自此也开启了 Seedance 2.0 的商业化。 多位大厂人士对 36 氪表示,仅仅是 Seedance 2.0 一个模型就可以为火山带来单月超过 10 亿元的收入,并且这一数字仍在爬升期 ,火山对于 MaaS 业务的营收目标大概率会继续上调��� Seedance 2.0 验证了一件事:如果模型能力断层领先,那么买单的人自然会出现。据了解,Seedance 在短剧行业的渗透率已达约 95%。“如果你是短剧行业从业者,你很难不是 Seedance 的用户。”一位视频 Agent 从业者对36氪表示。 目前,Seedance 2.0 在全球的市场份额为第二,仅次于谷歌的 Veo。今年,Seedance 2.0 的目标则是加强拓展海外市场,成为全球市场份额最大的视频模型。而在这个追赶的过程中,火山引擎的 MaaS 收入也必然节节攀升。 但火山也并非什么模型都卖得好的。 Coding 这条战线就没有给火山带来太多营收增量。原因也很简单:Seed 的 Coding 能力还不够好。 谁吃到了 Coding 的红利?不止一位知情人士对36氪表示,智谱可能是最大赢家。 2024 年,智谱就押注了类 Anthropic 的训练路线:专注追求模型智能,提升 Coding 能力。两年积累,为智谱在今年的 Token 大战中占据领先位置争取到了机会。 智谱 CEO 张鹏在近期的财报电话会议中披露,2026 年一季度,GLM 接口调用价格累计提升了约 83%,尽管经历了多次调价,API 调用量仍然增长了 400%——目前,智谱 GLM-5.1 在 的缓存命中 Token 价格已接近 Claude Sonnet 4.6 水平,这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐。这背后是 GLM-5.1 在 Coding 能力上已经做到国内头部水平。 相比视频模型,Coding 目前是一条更拥挤的赚钱赛道。 2025年底,API 服务商 OpenRouter 曾提出名为“灰姑娘水晶鞋效应”的理论:AI 模型发布第一个月进来的用户,往往比后来进来的用户留存率更高。因为当用户用到效果好的模型,就会像灰姑娘穿上水晶鞋一样,产生极高的忠诚度,并且把业务深度绑定在这个模型上。 所以,目前月之暗面、MiniMax 等创业公司、字节阿里腾讯等大公司的云服务、甚至运营商,都在陆续推出自己的 Coding Plan,并加大销售力度,希望先用相对低的价格先吸引更多用户进入自己的生意范围,大量消耗 Token,再想办法提高利润率。 36氪获悉,从去年开始,阿里云就已经陆续成立数个新的 MaaS 销售团队,可以和原来的直销团队一起合作打单。MaaS 团队的主要任务是挖掘使用场景,积极推动企业客户把 Agent 能力使用起来,增加 Token 消耗。 大模型的战场几乎每天都在发生新故事。虽然 Seedance 2.0 现阶段给火山引擎的 MaaS 收入带来了急速增长,但想要更长久地保持增长势头,补上 Coding 这块短板,则是字节绕不过去的一道题。 封面来源|AI生成 扫码加入「智涌AI交流群」 欢迎交 本文来自微信公众号 “智能涌现” ,作者:邓咏仪,36氪经授权发布。

36氪 · None · tech

文|邓咏仪 编辑|张雨忻 “阿里云MaaS业务的Token收入,在2026年的过去5个月里增长了15倍,月度Token收入已经达到数亿元级别。”这是阿里云在5月20日的发布会上给出的最新数字。而拉动这笔收入的最直接原因指向了一个词:Agent。 这一天,阿里云发布了新一代旗舰模型Qwen 3.7 Max等一系列产品,这距离Qwen 3.6 Max的面世仅仅过去了一个月。 为什么这么着急?随着今年2月OpenClaw的爆火,各家模型厂商都开始针对Agent做模型在Coding能力上的提升。大模型的Coding能力之争越来越白热化,阿里也必须端出一款在Coding方面能打的模型,保持自身MaaS业务的竞争力。“未来是Agent Cloud的时代。”阿里云公共云总裁刘伟光表示。 无独有偶,大洋彼岸的硅谷,Google I/O大会也在同一天举办,主题同样是Agent Cloud,Google新发布的芯片、模型、应用……几乎所有产品也都围绕Agent展开。 Agent Coding,已经成为全球现阶段的AI共识。 △图源:阿里云 狠狠做Agent 发布会第一个端上来的新“千问云”官网,这是一个为Agent设计的网页,也是阿里云成立17年以来,第一次为单独业务做的独立官网。 △图源:千问云 “千问云是为Agent设计的,而不是人类。”阿里云公共云事业部负责人刘伟光说,这来自2024年底,阿里云内部的一个判断:未来云计算产品的主要使用对象,也会逐渐从人类工程师变成Agent。 在过往,一个开发者或企业想要在云上部署服务,需要打开官网,注册之后,然后面对上百个产品分类,自己选机型、配网络、开实例、装环境、调API——每一步都需要人类工程师做判断,上手门槛不低。 但在千问云官网上线背后,动线会发生变化:Agent会先找模型,再找工具和skills,最后才是底层云资源。顺序反过来了。 一个例子是,在龙虾上线后,阿里云发现Agent可以在一天之内自动完成云计算资源的开通,这在过去,是人类要干两周的活。“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”刘伟光说。 官网只是前菜。阿里云从上层的模型到Infra到底层的芯片,都围绕Agent重新完成了一次适配。 首先是新一代旗舰模型Qwen 3.7 Max的推出,这距离Qwen 3.6 Max的发布仅一个月时间。 尽管一直以来阿里在开源领域建立了不错的影响力和口碑,但相较国内的智谱GLM、Kimi,阿里的旗舰模型并没有享受到小龙虾带来的最大红利。 而Qwen 3.7 Max的发布,则阿里在Coding领域试图扳回一城的动作。 在目前业界最权威的代码能力测试中,Qwen 3.7 Max已经追平了DeepSeek的最强版本,在难度更高的复杂工程任务测试中,Qwen 3.7 Max也排到了第一的位置。 △Qwen3.7-Max可独立执行长达35小时的长程复杂任务,工具调用数量也在各大模型中位于前列,图源:阿里云 相较上一代Qwen 3.6 Max Preview,Qwen 3.7 Max最大的升级是长周期任务能力的大幅强化——Agent可以自主执行跨越数十小时、上千步骤的复杂任务,而不需要人类中途介入。 长程任务能力越强,意味着Agent能够独立完成的任务复杂度越高、人类介入越少。这也是Claude Code、Gemini Deep Research等当下最强Agent产品的核心竞争维度。 阿里云CTO周靖人举的一个例子是:在平头哥的新芯片平台上,Qwen3.7-Max通过自主编程和超1000次工具调用,实现了平台关键内核的自我进化,推理速度较原版本提升10倍。 这意味着,模型能够像成熟的工程师一样,独立解决代码中间缺陷的问题,也可以帮助工程师开发复杂的功能。 而这些任务能够完成,也离不开芯片和Infra的适配:在芯片层,阿里云的新一代训推一体AI芯片真武M890,以及自研互联芯片ICN Switch 1.0,都搭载在超节点服务器上,主打的就是Agent的大规模并发场景。 而现在,阿里平头哥PPU芯片出货已经超过54万片,并且在悟空、秒悟等AI应用中已经开始提供推理服务。 怎么把Token生意越做越大 Agent爆发带来了Token消耗的爆发——Agent本质是代码生成,一次任务调用的Token量,是普通对话场景的十倍甚至百倍。 所以,Agent共识也直接演变成了模型市场的一场明牌战争:谁的模型在Agent场景下被调用得多,谁就能够迅速获得收入——当今市场的最大赢家无疑就是Anthropic,据华尔街日报,Anthropic的营收预计将在第二季度增长一倍以上,达到109亿美元。 △图源:华尔街日报 阿里云也受益于此。2025年,阿里云自然年全年营收超1466亿元,当年营收增速28.6%,后者主要得益于AI产品的贡献。 阿里巴巴CEO吴泳铭在上周的财报电话会上透露,6月份季度,包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入(ARR)将突破100亿元,年底突破300亿元。 不过,在这场Token战争中,阿里和字节选择了两种不一样的打法。 “Token带来的收入主要来自两端,一端是以Coding为代表的大语言模型,另一端是视频模型。但在过去一段时间,很多人会把两个市场的Token增量混为一谈,这是不合适的。”刘伟光强调。 字节占住了视频模型市场——有研究机构测算,Seedance 2.0爆火后,字节在视频模型市场的Token日均消耗已占整个市场的80%。2025年底火山曾立下目标——2026年MaaS服务收入超过100亿,但在Seedance 2.0爆火之后,这个目标已经再度上调。 相较之下,阿里云则在大语言模型上占据优势。“有开发者的公司,才会需要云,所以阿里云的存量客户(肯定有开发者)几乎都是Coding的潜在用户。”刘伟光说。 2025年底,阿里云曾喊出“2026拿下AI云市场增量的80%”的业务目标。阿里云将当下的业务火力,集中在了Coding领域。“今年前5个月,我们可以说,阿里云已经拿到了LLM模型市场增量的80%。” 为了配合这一目标,阿里云对销售的考核方式也在变—— 不是看谁卖出去的Token量最大,而是比谁卖出去的Token最值钱。 简单来说,阿里云现在追求的,并不是简单聊天产生的Token消耗,因为这类模型的价格已经到了地板价。 相反,阿里云如今的一个核心指标是:模型接入客户的核心业务系统数量。这意味着,阿里云希望卖出去的Token,是被客户用来写代码、做决策、跑流程。而一旦进入企业的核心生产流程,Token消耗量是指数级上升的,单价更高,复购更稳定,对应的也是更高质量的收入。 这源于Coding的Token消耗逻辑和视频并不一样。视频模型的Token消耗是一次性的——生成一段视频,任务结束。 代码场景则更像一个自我进化的过程:模型写出代码,代码变成应用,应用部署到云上,应用运行起来后又需要调用模型,模型再生成更多代码。 如今的大模型竞赛,已经完全是一种系统工程的较量——芯片、Infra与大模型的耦合,已经成为影响模型训练、提供推理服务系效率的最重要因素;商业竞争也在加速,则是迅速验证场景价值,为模型反哺智能。 “芯片、模型和云,现在三者就像是齿轮要和在一起、螺旋上升的过程。”刘伟光表示,如果未来拼的是每一块芯片都能跑出比竞争对手更多的Token、更高质量的Token,“那我们就胜利了。” 以下为刘伟光关于阿里云、Agent趋势Token之战的更多分享,经《智能涌现》编辑整理: 1、云计算的天花板因为Agent再度被打开了 云计算时代,我们的商业模式相对简单,但有一个长期痛点:盘点客户IT预算时,企业内部的软件开发和人力外包这块,我们是吃不到的。现在正好反过来,这些预算恰恰是AI Coding能100%命中的。 我们看到,互联网企业的Token支出已经达到IT支出的15%~20%,传统企业还在5%以下,空间还很大。阿里云今年的目标,是在每一个客户的收入中,Token收入占比不低于20%。 以汽车行业为例,过去我们能做的就是ERP上云,后来是智驾算力,再后来是大模型对话,现在连广告营销都能做了。原来汽车行业最大IT投入在ERP,现在变成AI。 金融领域也一样,以前做券商客户,我们很难跟客户谈业务,那是专业领域。现在是客户主动找我们,因为头部投研、量化、私募的业务场景,都必须跟大模型深度结合。 Agent已经成为带动模型市场、甚至带动存量云市场的最大推动力。所以Token和云这两件事,在阿里云这里是天然绑定的。这也是为什么Coding是我们最重要的方向,它几乎for everything。 2、Agent天然是云业务的增长飞轮 Token和GPU是有换算比例的。我们从实际数据发现,Agent爆发后,一张GPU卡的消费基本上带动了一张CPU卡的消费,假如100块钱的GPU推理消耗,会同时产生200块钱的GPU+CPU云资源消耗——因为Agent生成的应用要部署、要运行、要弹性扩容。 这意味,厂商没有强大的CPU云,就没法服务这些Agent。这就是为什么我们一直在说Agent Cloud这个概念,这中间是存在真实的收入闭环的。 3、阿里云的销售体系需要迅速变革 我们现在单独给大客户配纯MaaS销售,和原来卖IaaS的销售打配合。哪怕一个客户身上出现两三个销售重叠,这个代价也可以接受,最重要的是不能让机会错失。 坦白讲,在云这个产业经营太久,每个人都有思维惯性。过去做云,版图是很清晰的——客户线下多少台服务器,搬上来要花多少钱,答案不会差太大。但做MaaS,你进去之后可能发现答案远超想象。而且MaaS需要跟业务部门、跟CEO打交道,不是跟IT人员打交道,这本身就是挑战。 有意思的是,越传统的企业越容易拥抱AI,因为AI让他们一些工作变简单了。现在,做畜牧的企业,都在大规模拥抱AI,这在过去是不可想象的。 4、Token之战要追求数量,更要追求质量 调用量可以靠对话堆出来,但我们不看这个,我们看三个指标:付费Token客户数是不是每天在增长;每个客户是不是在核心系统接入模型、解决刚需;Agent自主完成任务闭环的效率。美国那边的共识也一样——用最少Token完成最有效任务,而不是用更多Token完成更多任务。 正因为追求高质量Token,MaaS从第一天起就应该是有利润的生意。现在,我们的百炼平台(Infra)和模型团队本身就在一起,每天做推理框架的极致优化。 中国目前还是按量为主,但我们的终极目标一定是希望让客户为结果付费。 封面来源|AI生成 欢迎交流 本文来自微信公众号 “智能涌现” ,作者:邓咏仪,36氪经授权发布。