铜、铝、锌这些吧,逻辑看起来都能讲:降息预期、补库、供给扰动、新能源需求、海外矿端问题。但是现在好像不讲逻辑了。一点风吹草动就大跌 3 个帖子 - 2 位参与者 阅读完整话题
来源 https://www.ftchinese.com/interactive/282207 Anthropic正在帮助美国国家安全局(National Security Agency, NSA)部署其强大的Mythos AI模型,用于进攻性网络行动。尽管该公司仍深陷与五角大楼的法律纠纷,它已将工程师派驻到该机构内部。 两名了解相关安排的人士表示,这家总部位于旧金山的公司已在NSA内部部署了约六名员工,担任所谓“前沿部署工程师”,以指导该技术的使用,并针对特定应用定制模型。 目前尚不清楚Anthropic的工程师是否正在协助NSA开展实际行动。不过,一名接近相关情况的人士表示,Mythos将有助于渗透中国或伊朗等国家的网络。 一名接近 Anthropic 的人士表示:“建立良好防御的最佳方式,就是建立强有力的进攻。”这名人士认为,对手很可能也在研发由AI驱动的进攻性科技。 实在气到无话可说了,a÷的嘴脸就是这样的,a÷bitch这一块是拉满了 7 个帖子 - 5 位参与者 阅读完整话题
自从组里供给cc和codex之后,agent已经深度嵌入生活,一个也离不开。前几天codex被我一个误操作credential失效了,到今天才终于登上,这几天只有cc,简直跟瘸了条腿一样难受。 以后找组、工作的一项硬性要求就是老板提倡并提供/报销AI Agent等各类AI工具。 8 个帖子 - 6 位参与者 阅读完整话题
据深圳新闻网,近日,深圳市交通运输局发布,2026年4月份深圳市网约车行业运营动态与风险提示,当前市场总体已饱和,4月全市网约车日均单车完成订单量约为13.01单。 官方郑重提醒,拟从业者应充分调研,理性决策,并警惕六大风险:一是部分平台采用“上班/保底模式”代收流水,公司经营不善将导致司机受损; 二是未获授权的中间商易引发纠纷;三是警惕“月入过万”等虚假广告,避免退车违约;四是认清“无证不罚”骗局,无证营运将被处罚且保险拒赔; 五是防范“免押金”“高回报”等租车套路,签约需核对条款;六是警惕租车公司逾期缴纳保险导致失效的风险。 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 27 日消息,备受市场期待的首次公开募股(IPO)前夕,埃隆・马斯克旗下的 SpaceX 在 S-1 上市申请文件中坦言,若要全面推进轨道人工智能相关布局并实现规模化落地,公司目前无法获取足够的人工智能硬件设备。此外,公司表示雄心勃勃的 Terafab 晶圆厂项目或许能缓解芯片短缺问题,但同时也指出该项目存在失败风险,且目前的合作方特斯拉与英特尔并无长期参与该项目的义务。 按照美国证券交易委员会(SEC)对所有 IPO 的监管要求,企业必须列明大大小小各类风险因素,其中甚至还包括极端天气等“不可抗力”,因此需客观看待上述表述。不过这些内容也确实反映出,SpaceX 认为其商业模式正面临若干实实在在的发展阻碍。 SpaceX 在申报文件中写道:“我们能否规模化落地轨道人工智能,取决于能否获取充足的人工智能芯片,而当前我们可调配的芯片数量远达不到需求。”“支撑技术基础设施运转的服务器、网络设备(尤其是图形处理器及其他专用元器件),其生产与供应仅掌握在少数合格供应商手中。我们与芯片直接供应商并未签订长期或重大合作协议,所有图形处理器均依靠采购订单临时采购。” 目前,SpaceX 及其旗下人工智能公司 xAI 与 AMD、英伟达等图形处理器供应商,以及台积电、三星晶圆厂等代工合作方的合作模式,让企业容易受到晶圆产能不足、原材料紧缺、地缘政治冲突以及半导体产区自然灾害等问题的冲击。 全球最大晶圆代工厂、高端逻辑芯片龙头台积电如今已难以满足人工智能处理器的市场需求,业内人士也警示行业整体面临供给紧张的局面。举例来说,英伟达为保障芯片及各类元器件供应,将包含库存、采购订单及预付款项在内的整体供货规模提升至 1450 亿美元(IT之家注:现汇率约合 9858.12 亿元人民币),其他企业也纷纷采取类似举措。 为在一定程度上化解供应链风险,特斯拉、SpaceX 与 xAI 计划联合打造 Terafab —— 一座专属半导体生产基地,产品仅供这三家企业使用。目前已知该晶圆厂选址于美国得克萨斯州的 SpaceX 园区,将采用英特尔的 14A 制程工艺生产芯片。S-1 文件同时提示,即便埃隆・马斯克计划为该项目投入数百亿美元,也无法确保项目最终取得成功。 SpaceX 在文件中补充道:“我们寄望于通过建设 Terafab 解决芯片供应难题,但该项目仍有可能失败。一旦失利,我们或将没有其他渠道获取足量人工智能芯片,无法满足轨道人工智能的算力需求。”“建设 Terafab 旨在提升自研芯片产能,缓解未来人工智能芯片短缺问题,助力我们推进轨道人工智能规模化布局。但短期内,我们仍会从第三方供应商处采购大部分算力硬件。同时,我们无法保证 Terafab 能在预期周期内达成目标,甚至无法保证项目能够落地。” 值得注意的是,英特尔和特斯拉均有可能退出该项目。一旦二者撤资离场,Terafab 将失去核心客户与制程技术支持,整个项目也可能就此夭折。S-1 文件明确写道:“尽管我们已与特斯拉签订框架协议,但特斯拉与英特尔均无义务持续参与本项目,我们后续也未必会签订具有约束力的正式合作协议。”
IT之家 5 月 25 日消息,机构 TrendForce(集邦)今日根据最新 NAND 闪存产业调查表示, 主要 NAND 原厂今年几无新增产能 。而由于 AI 需求持续强劲,因此 NAND 的供给短缺预计持续整个 2026 年。 ▲ 图源:TrendForce 机构给出的数据显示,全球五大 NAND 闪存原厂 2026Q1 该部分业务合计营收在 ASP(平均销售单价)普遍优于预期的带动下达 389 亿美元(IT之家注:现汇率约合 2645.82 亿元人民币), 环比增幅高达 83.7% 。 其中 三星电子的 NAND 营收季度增幅达到 104.7% ,为五大原厂最高;美光、闪迪也均录得 96.7% 环比提升;铠侠 QoQ 数据为 +80.0%;相对增幅较低的 SK 海力士也有 44.6% 的提升。 对 2026Q2 的 NAND 市场,机构认为服务器将吃进智能手机与 PC 市场需求疲软空出的产能,原厂的出货规模稳中有进,ASP 也将得到持续支撑。 参考 TrendForce 集邦咨询: 供不应求态势激励价格成长,1Q26 全球前五大 NAND Flash 品牌合计营收季增 83.7%
光刻机巨头ASML首席执行官克里斯托夫·富凯5月20日接受专访时发出重磅预警:全球半导体市场将进入长期供应紧张状态,AI驱动的需求浪潮正在超越行业产能扩张速度。富凯在安特卫普科技活动上指出:“AI需求来得如此强劲,我们将在相当长一段时间内处于供应受限的市场。” 2030年芯片市场剑指1.5万亿美元 富凯预测,到2030年全球芯片市场规模可能达到1.5万亿美元,整个供应链都将面临“零星瓶颈”。支撑这一判断的是科技巨头数百亿美元的资本开支:谷歌、微软、Meta和亚马逊今年合计支出近7000亿美元建设数据中心,迫使台积电、三星、SK海力士等芯片制造商加速扩产。ASML最新财报显示,公司已将2026年营收指引上调至360至400亿欧元,一季度新增订单量远超预期。 马斯克“TeraFab”与Starlink成新需求引擎 富凯特别点名马斯克的宏大计划:“TeraFab这样的超大规模芯片工厂将严重挤压设备商的产能,而且它很可能成为现实。”他透露已与马斯克本人就此讨论。更令他着迷的是Starlink卫星互联网:“我们谈论了很多关于芯片、人形机器人、自动驾驶汽车的话题,但这些产品都必须连接到数据,而Starlink正是那个连接器。” 马斯克的TeraFab计划拟建设为特斯拉、xAI和SpaceX提供芯片的超大型晶圆厂,其设备需求将直接冲击ASML等上游供应商产能。目前ASML正全力提高产量,其下一代High NA EUV设备即将量产首批逻辑芯片,英特尔为首批采用者之一。 ASML启动产能扩张计划 面对不可阻挡的需求,ASML正多管齐下应对:一是提升现有设备生产率,二是在研更先进的Hyper-NA技术,三是开发第二款先进封装设备以满足大尺寸AI芯片制造需求。公司CFO透露,2026年计划出货60台低NA EUV设备,较2025年增长25%,2027年产能将达到80台。 然而,富凯坦言难以准确预测这轮繁荣的幅度和持续时间。“行业规划可能被超出,”他说,同时警示产能扩张的物理极限。 查看评论
环境如下 我逆了glm,放到服务器上中转,windows下载codex客户端,cc接了我自己的中转,中转把gpt5.2转发到glm5.1上 任务目标如下 我接到一个调研,简单来说就是要下线一个老旧模块功能,然后调研一下这个模块还有哪些其他模块再用 问题如下 1.我基于项目路径开的会话session,扔了一个接口给他,然后问他接口用到了哪些表 2.叽里咕噜给我说了一大堆,我当时也没细看(gpt用习惯了,一般前两轮会话我都是用来收集前置信息的),反正看输出了一堆表,我也没看这些表对不对,我就直接给他输出了我得任务目标,让他调研一下还有没有其他模块引用 3.叽里咕噜输出了一堆方案,写了一堆命令让我执行,我就说让他自己执行,别让给我干活 4.叽里咕噜说了一堆结果,我拿着结果去看看代码,一搜,哦豁,毛都搜不着哇,表名,类名,方法名,一根毛都搜不着哇!!!纯瞎编啊!!!给我看傻了 求助 1.怎么解决没事干光给我命令让我干活自己不执行命令 2.这个瞎编的操作,属实给我看傻了 目前我还没尝试agent.md写死规则,就是想问问大伙都有没有遇到这种问题,都咋解决的 以下为问题示例 1 个帖子 - 1 位参与者 阅读完整话题
本来用 OpenCode 还挺好的,但下午的时候使用 ClaudeCode 接了 DeepSeek 官方 API ,写了几轮需求,发现跟在 OpenCode 里用 DeepSeek 感觉完全不一样,感觉一次性把需求做好的概率高了不少。 于是就想把 OpenCode 的 DeepSeek 接进 ClaudeCode ,但是一思考就报错。 求教现在能接吗?要怎么接?
IT之家 4 月 27 日消息,优步正在更积极地介入充电网络建设。不只是使用充电站,优步还想参与判断新站点应该建在哪里,以及如何让这些站点运转得更高效。 这背后是优步业务正在发生的一场大转向。优步正在全球范围内促成大量合作,把自动驾驶汽车接入平台。同时,优步开始协助建设新的快充站,以支撑未来进入平台的自动驾驶出租车,并服务越来越多转向电动汽车的优步司机。 优步全球电动化与可持续发展负责人安德鲁 · 科内利亚认为,公司最大的优势之一就是数据量巨大,堪比“超能力”。“我们正在用这些数据告诉自己,充电需求到底应该出现在哪里。” 凭借海量真实出行数据,优步认为自己可以帮助 解决充电行业长期存在的难题 :让充电供给更准确地匹配司机的实时需求。对网约车司机来说,排队等待充电意味着直接损失收入,时间成本很高。 今年 2 月,优步宣布投入 1 亿美元(IT之家注:现汇率约合 6.84 亿元人民币)建设公共快充站。公司将与美国 EVgo、欧洲 Ionity 等充电网络合作,在车流和需求更集中的地区建设站点。 优步还会向这些充电网络提供使用率保证:快充站建设前期投入动辄数百万美元, 只有使用率长期足够高,商业账才算得过来 。 科内利亚对需求并不担心。对优步司机来说, 充电问题现在已经超过车辆成本 ,成为最主要顾虑。“我们其实相当有把握,只要把充电站建起来,司机就会来。” 纽约市就是优步司机充电难的典型案例。2023 年,纽约出租车和礼车委员会出台新规,推动司机转向电动汽车。司机被鼓励去换电动汽车,然而配套充电支持却没有同步跟上。此后,纽约陆续有更多充电站上线,可不少地点排队拥堵依旧没有明显缓解。随着数以万计网约车司机改开电动汽车,现有充电站仍然不够用。 优步正在应用内加入新的推荐技术,帮助司机寻找附近电动汽车充电站,并显示哪些地点排队时间更短,以此缓解部分压力。 科内利亚坦言:“出行的未来确实是电动化、自动驾驶和数字化。公共充电仍然让人担心,所以我们才会花这么多时间解决这个问题。”
多家 AI 初创公司反映,微软、亚马逊等云厂商正将 GPU 算力向内部团队和大客户(OpenAI、Anthropic)集中,中小客户面临涨价、长等候和更苛刻的合同条款。微软 Azure 销售管理层近期告知员工,云客户的 GPU 等候时间预计将持续到 2026 年底。 具体案例:图像生成初创 Krea(融资 $8300 万,投资方含 Andreessen 和 Bain Capital Ventures)半年前以每卡每小时 $2.80 租下数百块 Blackwell 芯片,签 6 个月合同。续约时多家云厂商不接电话,最终以 $3.70/小时成交,涨幅 32%,合同期被拉长至 1 年。CEO Victor Perez 称,有些厂商直接不回复,有些报出三年期长约才肯谈。GPU 云厂商 Lightning AI 的 CEO Will Falcon 透露,公司在线 4 万块 GPU,但约 40 家客户排队等待的总需求达 40 万块,半年内租赁价格涨超 25%。 微软对 GPU 访问实行分级管理:约 1000 家最大客户(Tier 1)优先分配;小客户若要租 Blackwell 芯片,须承诺至少租 1000 块、至少一年,合同起步数千万美元。按量付费(pay-as-you-go)的客户如果让 GPU 闲置几小时,微软可能直接收回访问权。参与「Microsoft for Startups」免费额度计划的初创公司也被告知:不充分使用就会被撤回 GPU 权限。 General Catalyst 合伙人 Hemant Taneja 已向被投公司发问卷调查算力瓶颈,该机构正筹划共享算力池或代投公司集体议价。部分初创公司开始考虑自购 GPU:石油行业 AI 初创 Collide 打算花约 $50 万直接购买英伟达 GPU,租数据中心空间自己跑,以规避排队和不确定性。 https://www.theinformation.com/articles/microsoft-cloud-providers-tighten-grip-gpus-pressuring-ai-customers 1 个帖子 - 1 位参与者 阅读完整话题
继续从这里开始讨论: Anthropic:仅对约2%新Pro用户测试移除 Claude Code,现有 Pro 不受影响 搞七捻三 近日有消息称 Anthropic 已将 Claude Code 从 Pro 订阅中移除。 不过Claude AI 负责人随后澄清:目前仅对约 2% 的新注册用户进行小范围测试,尝试在 Pro 方案中不包含 Claude Code。 [Screenshot20260422093712comtwitterandroidTweetDetailActivityedit105867559438831] … 在 Anthropic 针对 Claude Code 进行小范围测试从 Claude Pro 中的2%新用户的同时,行业内也出现了不同声音。 Open AI Codex 负责人 Tibo 表示,其产品 Codex 将继续在 ChatGPT Free 和 ChatGPT Plus($20)计划中提供,并强调,Open AI 具备足够算力支持该功能,若有重大变动,会提前与社区沟通并保证将“透明度与信任”作为核心原则,也欢迎大家继续使用Codex。 3 个帖子 - 3 位参与者 阅读完整话题
4 月 12 日上午消息,在智能电动汽车发展高层论坛 2026 期间,中兴通讯大企业 CTO 许志成与媒体对话。 对于中兴通讯是否会进入整车领域的问题,他表示,每个公司都有自己的定位,中兴聚焦于 ICT 领域,致力于为各行各业提供技术能力, 不会考虑进入整车制造或其它未涉足的行业 ,包括汽车整车领域。 关于在汽车领域的布局,他提到,中兴也做汽车电子,但相对务实低调, 核心是将自身能力提供给车企 。合作模式有三种:一是研发工程师面对面帮扶,比如与一汽的合作;二是利用中兴的研发大模型,结合车企语料进行调优;三是直接向车企提供训练好的编码智能体。此外,中兴还聚焦网络、车上的芯片和操作系统,以及 4G/5G 模组等领域。
随着全国算力基建规模化、标准化不断提速,多家算力价格也迎来持续普惠。让曾经昂贵的“高端稀缺资源”变身为各行各业可普惠使用的“数字水电”。前不久,多家模型厂商宣布永久下调算力价格,其中DeepSeek与小米MiMo降价尤为显著,最高降幅接近99%。极大降低了用户日常高频问答、网页设计、代码编程等多场景AI使用成本,让各类轻量化、常态化AI应用告别高门槛、高成本的制约。(央视新闻)
随着全球人工智能(AI)竞赛持续升温,围绕算力基建展开的新一轮投资浪潮正席卷全球。从海外科技巨头持续加码数据中心,到国内“东数西算”工程加速推进,再到AI服务器、光模块及先进封装需求爆发,一批原本相对小众的金属品种正在迎来价值重估。今年以来,被市场冠以“算力金属”概念的铜、锡、铟、锗、镓等品种集体走强。相比于需求增长,市场更关注的是供给端长期存在的瓶颈。国信期货首席分析师顾冯达认为,本轮“算力金属”行情背��最核心的逻辑并非AI概念本身,而是供给侧持续收紧带来的资源稀缺性溢价。(证券时报)
今年以来,金属锡表现抢眼。这个曾经相对“小众”的品种,因被贴上“算力金属”的标签,突然站到了聚光灯下。自此前两次高位回落调整之后,3月下旬以来,锡市场期现货价格同步走强,其中沪锡期货主力合约一度从323010元/吨低点攀升至最高449960元/吨,区间累计最大涨幅近四成。业内人士认为,锡价这一轮上涨是供需两端共同作用的结果。供应端,缅甸佤邦复产进度不及预期、印尼资源管控趋严、非洲产区扰动不断,全球锡供应弹性偏低;需求端,AI算力、半导体等领域持续打开新的消费空间。虽然长期需求基本面具有显著优势,但当前偏高的锡价已制约了下游采购的积极性,短期锡价或维持高位震荡。中长期来看,锡价运行中枢有望逐步抬升。(中证报)
大语言模型可以靠堆数据跑通Scaling Law,但机器人面对的是动态、多模态、强时序关联的物理世界,杂乱的数据堆在一起,训不出可靠的模型。从混沌到秩序的工业化路径,质量比数量更重要。 机器人进工厂、进场景,真正的挑战不在模型本身,而在数据。徐良威指出,具身智能的数据不是时间、空间、任务意图紧密耦合的多模态资产。智域基石提出了五层数据编译管线模型,每一层都有明确的质量指标,唯有构建数据底座生态,让本体方、模型方、产业方各司其职,高质量物理世界的数据才能真正流通起来,支撑具身智能的规模化落地。 以下为演讲内容,经36氪整理编辑: 徐良威丨智域基石CTO 大家好,我是智域基石的联合创始人兼CTO,今天我跟大家分享的是从具身智能的数据供给革命与技能结构化实践,标题是从混沌到秩序。为什么是从混沌到秩序?具身智能的到来让大家发现原先在大语言模型、自动驾驶或者在所有过去AI的数据实践在具身智能里不够用了,今天主要讲一下智域基石在上面做了什么样的工作,主要讨论两个话题,第一个事情我们在具身智能的数据上怎么去做标准化的工业化实践。第二个如何把数据和模型本体、产业、场景结合起来,变成一个生态,而不是单纯数据的事情。 我们直接到机器人的落地,2026年我们可以看到一部分的机器人已经从小样逐渐往产业里跑了,原先我们考虑到的是怎么把实验室里的算法用视频或者现场展示的方式展现出来,这个事情已经远远不一样了,我们把机器人从实验室里搬到真实的场景里,原先只要考虑让机器人动起来、完成指定任务就可以了。现在我们要考虑的事情是如何让机器人面对不确定的、动态的、多模态整个场景数据输入,还能够进行持续稳定和物理世界的交互,这时候我们就要考虑我们怎么产生稳定化供给。 原先有一句话说的很对,模型决定机器人的能力上限,模型决定了机器人能干什么,很难决定机器人在最差的环境下能做到什么程度,因为很多事情即使是人在新的场景里都不一定能够处理的好,这个时候就需要我们考虑怎么把真实场景里的数据,这个数据可能分为本体数据,机器人感知到的环境数据,甚至是机器人的任务,机器人的日志,这些信息都要能够送到机器人训练的整个闭环里,这时候才能够把原先在小样级别变成真正在产业里能够落地的事情。 原先大家做语言模型时,大家说Scaling Law,希望有越来越多的数据才能让模型变的越来越好,本身这个事情是没有问题的,具身智能不像原先是结构化的数据,我们在多模态跟持续强相关的数据领域里发现,我们如果单纯堆数据,把大量原先混杂在互联网的数据跟机器人操作相关的数据,不管什么样的仿真数据,把这些数据全部堆在一起,能不能让模型训练出来?有这个可能性,目前的结论,我们还很难说把一些杂乱的、毫无规则的数据堆在一起就能够训练出更好的模型,我们不仅考虑数量,还要考虑质量。这个质量一方面体现在采集,另一方面体现在数据的采集、质检、预标注、人态环路的闭环再到数据后处理,再到导出,最后进到模型训练,完成模型到数据的闭环体现在整个环节里,每个环节都需要质量,如果某一环节出了差错,不是说这个模型训练不出来,而是真正的模型落到本体再进入场景,如果这个场景出问题,怎么回溯到我这个数据或者在原先的闭环里哪一部分出了问题,这是我们对于数据的要求,数量很重要,但我们要考虑质量,还要考虑质量在每一个环节里的重要性。 路线有很多,大家经常讲的VLA,以模仿学习为主,以视觉输入、语言指令再加上机器人的动作,一个机器人看到什么样的场景,我得到了指令,下一步输出什么样的动作,是一个轨迹层面的数据,以轨迹为主。另外一条路线,大家经常提起的世界模型,在world model中加一个action,最终要作用在物理世界里的,这里考虑的是我看到一个场景,我施加了一个动作,物理世界变成什么样,这时候考虑的是因果关系,这里面虽然VLA和world model有模型上的差异,需要的都是同一种底层资产,在真实世界里的结构化高质量数据,我定义了合理的或者适用于最终模型任务,通过一定手段把物理里的信息数字化,再经过结构化的过程,把它变成可以输入到模型里的东西,这时候原始数据是一样的,中间流程稍微有一些不一样,基于同一套数据底座。 数据底座是一整套把真实的场景、真实的任务、真实的成功/失败、真实的和整个环境交互全部都记录下来,从而能够输入到模型里,让模型能够在真实的世界里获得闭环。这一套数据输入有可能是机器人本体,大家看到很多数据采集工厂、数据实训厂,通过让人操控机器人获得和机器人有关的数据,直接作用于机器人不管是预训练、后训练,现在还有一些比较前沿的,让人带着第一人称视角记录人的数字化劳动,让人本身的劳动数字化到虚拟世界里,再去训练不管是VLA还是世界模型,让机器人学会人类技能,本质上都是把人类或者是机器人这样的一个本体和环境的交互,把物理的概念变成一套数字化的概念,智域基石就做了一套数据底座,不管前端是什么样的数据流入,我们都可以通过数据编译管线处理成模型可以使用的数据,最终完成数据本体,再回到场景再回到数据的闭环。 一个任务怎么把原始数据记录变成模型可以使用的数据,第一个流程,先定义好任务,先要采一个什么样的数据,先要知道机器人看到了什么,它做出什么样的动作甚至它听到了什么,还要关注前因后果,我之前的场景是什么样的,我在看到这个场景以后我做出什么样的决策,我又做出什么样的动作,如果我发生这个动作,我接下来的思考是什么,这个世界真实又会怎么变,一方面记录在真实世界里发生的所有传感器的记录,另外从任务记录,不是单纯从传感器得到的,是事前规划或者是事后推演,我通过把现场记录、任务整理搞起来,后面我们把它变成机器人、具身智能需要的一套数据资产,中间涉及到怎么采集、提取其中的关键因素,最后怎么把它沉淀到资产,也会涉及到成功/失败的处理,涉及到失败以后机器人怎么重试,重试策略是什么,重试之后导致的结果是什么,这都是从原始数据变成训练样本重要的步骤之一。 这是智域基石提出的五层数据编译管线模型,我们考虑到原始数据不是把数据采完了,把它存到硬盘里可以直接被输入到模型里训练,我们考虑到的是中间有非常多道流程,每一道流程都是有关键指标的。只有把每一步做好,才不是简单的数据存档,而是真正能够成为数据资产的东西,这一套数据资产下面可以进入到场景、模型,可以和本体结合,被真正的用起来。 第一个流程数据质检,首先是数据采集,采集后才能把真实物理环境里的模型信号变成数字信号,以数字化的形式存下来,raw data,是杂乱的、没有规则的、非结构化的数据,我并不知道好不好,也不知道能不能进入后面的处理流程里,第一步做数据质检,先看一看数据是否满足基本的数据处理要求。 数据满足后,进入数据处理管线里,下一步是数据对齐,机器人或者具身智能数据不是单纯的画面或者是简单的视频,其实是多模态和时序紧密结合的数据,完成空间、时间的对齐,完成时间、空间的结构化,不是单纯杂乱的数据,至少是被数据处理的算法和机器能够理解的数据,每处理一帧数据都可以完成横向、纵向的索引。完成以后,到了数据变成模型可用数据层次,从结构化数据里再提取出真正的语义或者因果关系部分,我们要知道数据在整个空间里怎么和环境交互的,跟意图对齐是什么样的,因果,比如之前发生了什么,场景是什么,之后又是什么,这是第三个步骤,到这个地方为止,这个数据已经能被模型用起来了,距离真正的模型泛化还很远。这时候我们要考虑我们要做好大规模数据处理,大规模数据在以前很多行业都有,现在所有行业都在讲大数据概念,但是在具身智能里不一样,因为是时间、空间、整个任务意图都紧密相连的一类数据。我们要考虑在上亿小时甚至是上千亿小时大规模数据下,我们怎么快速检索出来被某类模型需要找到的数据,这也是非常难的工作。 在前面四个步骤过去后就变的相对简单了,把数据处理好、对齐好,提取的所有内容,再找初模型需要的数据,最后给客户使用,这是最后一个环节交付。 在技术层面上完成了数据到训练之前的闭环,数据最终闭环远没有结束,必须要被模型公司用起来,而且模型公司后面的模型还要搭载在本体上,不仅完成小样,还要在产业落地,需要让数据出发经过模型部署到本体再落实到产业,最终再从产业获得反馈,回到数据这一方,这时候才是真正让数据流通起来,让智能不仅是单点而是让整个体系里把它部署起来,作为数据方是非常核心的作用,它要对接本体、对接模型,也可以对接产业。 在现在很多数据行业里,大家还是以项目制的形式做这个事情,模型没有收敛,本体百花齐放,产业也是在逐步进入到整个具身智能行业中来,智域基石做的数据,我们不仅是做一个数据项目,把体系都搭建起来,通过和本体、模型、产业对接,我们把一个项目制交付的能力变成可以被整个具身智能领域作用起来的一套数据基础措施,这时候不仅是能够交付一套数据,而是我能够支撑整个具身智能的发展,以后所有的产业、本体、模型都可以从数据方获得他想要获得的东西。 我们希望能够划分新的数据分工,让本体公司做数据,让模型公司做数据,或者让产业方做数据,都不能够支撑整个产业发展的,只有把这么一套生态构建起来,才能够让高质量物理世界的数据进入整个生态里,让具身智能行业发展起来。 我的分享就到这里,谢谢。
在今天(5月21日)召开的商务部例行新闻发布会上,新闻发言人何亚东介绍:今年前4个月,我国服务消费的供给和需求实现了良性互动,稳的基础更加牢固,进的动能更加充沛。何亚东介绍,前4个月,服务零售额同比增长5.6%,供给和需求实现良性互动。从服务消费的结构来看,文旅休闲消费非常活跃,部分地区春假叠加清明、“五一”假期,居民的出游意愿非常强烈。文化展演、体育赛事等服务创新提质,满足了消费者个性化的体验。下一步,商务部将会同相关部门,扩大优质服务的供给,推动服务消费业态融合,加快培育新的增长点,从而实现消费增长与民生福祉的同频共振。(央视新闻)
36氪获悉,中信建投研报表示,津巴布韦锂精矿恢复出口,矿山企业开始发运,预计6月底至7月初对国内供给形成有效补充,缓解了锂矿供给紧张预期,但短期锂矿库存低、加工费低,外购矿企业面临成本压力,紧现实仍将持续。消费端保持旺盛,储能订单饱满,动力需求继续走高,新车型发布后的电池备货需求向上,同时海外新能源车表现较好,出海放量,拉动动力电池出货。据SMM,本周样本锂盐库存10.1万吨,环比下降1255吨,5、6月份预计将维持去库态势,对锂价形成支撑。
36氪获悉,天风证券研报表示,化工行业新增产能进入释放阶段,2026年供需逆转可期。化工行业已经进入历史底部区域,供给端在行业供需调整中权重加大。“反内卷”短期内通过控制开工方式调整供需平衡促进价格回暖、盈利修复,而中长期关注关停低效产能的落实节奏,促进企业技术升级摆脱同质化竞争、加大研发创新投入转向高附加值产品;通过政策端制度安排可加快产业周期修复节奏。供需逆转:2025年政策、资本开支拐点已现;“反内卷”的提出提供了对后续行业盈利改善、长期走向更健康发展的预期。