之前开帖子问的那款智凯100,太慢了,双卡64g跑32b的千问,只能16tokens每秒 我看有华为,摩尔线程这些,你们实际使用哪一款更合适服务器使用呢? 2 个帖子 - 2 位参与者 阅读完整话题
IT之家 6 月 2 日消息,2026 年美加墨世界杯将于北京时间 6 月 12 日至 7 月 20 日在美国、加拿大和墨西哥三国联合举办,本届赛事是世界杯历史上首次由三个国家共同承办,参赛队伍也由 32 支扩军至 48 支,共计进行 104 场比赛,规模创历史之最。 国际足联(FIFA)官网显示,本届世界杯期间将部署多项 AI 新技术,以提升比赛判罚精度和观赛体验。 在比赛用球方面,阿迪达斯为本届世界杯打造的官方比赛用球名为“Trionda”,该球内置了一枚 500Hz 运动传感器芯片,可每秒采集 500 次数据,实时追踪球的移动、触球次数、速度、旋转及轨迹变化。 与 2022 年卡塔尔世界杯用球 Al Rihla 将传感器置于球体正中央不同,Trionda 将一枚仅重约 14 克的芯片直接嵌入球体外壳的四个面板之一中,使其在制造时就与球壳自然融合,从而不影响球的弹跳、重量和触感。 据介绍,该芯片采用无线充电技术,通过专用充电站充电约 90 分钟即可获得约 6 小时的使用电量,足以覆盖整场比赛及赛前准备环节。 主裁判和比赛官员需在开赛前检查比赛用球的电量,确保实时数据追踪系统正常工作。传感器采集的数据将与球场周围同步安装的多台高速摄像机系统协同工作,实时构建比赛的全三维模型,系统每秒可确定场上球和球员位置约 50 次。 国际足联表示,这项技术能帮助裁判更准确地判断球员触球的具体时间点(精确至毫秒级),从而显著提升越位、手球、点球等关键判罚的速度与准确性。2022 年卡塔尔世界杯已曾使用过带传感器的比赛用球,此次 Trionda 将传感器从球心移至球壳侧面,是对上代技术的进一步升级。 在辅助裁判判罚方面,国际足联将为本届所有参赛球队共计 1248 名球员建立 AI 数字分身。据联想与国际足联此前发布的信息,联想在世界杯期间搭建了 28 台 3D 扫描仓,比赛前在球员入住酒店运转,运用 3D 建模与生成式 AI 技术为每位球员生成与其真实身体特征一致的 3D 虚拟形象,并录入国际足联数据库。 当发生争议判罚时,系统可瞬间提供任意角度的虚拟画面,包括传统摄像机无法拍摄的视角,通过 3D 数字人还原越位线、犯规动作等关键瞬间,帮助场上裁判与视频助理裁判更加直观地做出判断,也让电视和网络观众更清晰地理解判罚依据。IT之家注意到,该数字化身技术此前已在卡塔尔举行的国际足联俱乐部赛事中与半自动越位识别系统结合完成了前期测试。 在观赛体验方面,本届世界杯将首次引入裁判第一视角直播功能,通过裁判佩戴的微型摄像设备,全球观众可实时观看裁判的移动路径与观察角度,这一视角预计将触达超过 60 亿人次。国际足联还推出了名为“Football AI Pro”的 AI 知识助手,专为参赛球队设计,可快速扫描海量赛事数据,解析逾 2000 项关键指标,并即时生成可视化洞察,帮助教练分析战术、球员获取个性化改进建议。
跃星辰今日正式发布并开源 Step 3.7 Flash,是面向 Agent 生产化阶段推出的新一代 Flash 模型,围绕 Agent、Coding、Search 与多模态工作流进行系统优化。特别适用于构建高吞吐量的自动化智能体工作流。最高生成速度可达 400 Tokens/s,适合高频、多轮、低等待的 Agent 应用。 支持 256k 上下文窗口 ,并提供低、中、高三个推理级别,让开发者能够根据实际需求精确平衡响应速度、tokens 成本与能力。 针对主流 Agent 框架(Claude Code / KiloCode / RooCode / OpenCode / Hermes Agent / OpenClaw 等)、MCP / Skills 等工具调用协议和开发链路进行兼容优化,降低模型接入和工作流编排成本。 StepFun 开放平台文档中心 概览 - StepFun 开放平台文档中心 高速推理 + 原生多模态 + 工具调用 · 阶跃星辰旗舰多模态推理模型 modelscope.cn ModelScope 魔搭社区 ModelScope——汇聚各领域先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。在这里,共建模型开源社区,发现、学习、定制和分享心仪的模型。 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 29 日消息,阶跃星辰今日正式发布并开源 Step 3.7 Flash,是面向 Agent 生产化阶段推出的新一代 Flash 模型,围绕 Agent、Coding、Search 与多模态工作流进行系统优化。 Step 3.7 Flash 采用稀疏 MoE 架构, 总参数 196B+1.8B (ViT)、 激活参数 11B ; 最高生成速度可达 400 Tokens/s ,适合高频、多轮、低等待的 Agent 应用。 据介绍,Step 3.7 Flash 有以下能力: 原生多模态理解与执行 : 原生理解 UI、图表、文档、图片和应用界面,将复杂视觉信息转化为结构化结果、代码生成和可执行任务。 联网与视觉搜索增强 : 强化联网检索与图像搜索,使模型在开放信息环境中跨文本与图像主动获取并交叉比对多源证据。 高可靠工具调用与编排: 在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具和外部系统,保持任务轨迹一致,降低跑偏和执行失败。 Agent 生态兼容优化: 针对主流 Agent 框架(Claude Code / KiloCode / RooCode / OpenCode / Hermes Agent / OpenClaw 等)、MCP / Skills 等工具调用协议和开发链路进行兼容优化,降低模型接入和工作流编排成本。 ▲ 左一为 Step 3.7 Flash IT之家附相关链接如下: Model Page: https://static.stepfun.com/blog/step-3.7-flash/ GitHub: https://github.com/stepfun-ai/Step-3.7-Flash Huggingface: https://huggingface.co/stepfun-ai/Step-3.7-Flash Modelscope: https://modelscope.cn/models/stepfun-ai/Step-3.7-Flash 国内开放平台 API 接入: https://platform.stepfun.com 海外开放平台 API 接入: https://platform.stepfun.ai
IT之家 5 月 27 日消息,本周三发布的一份报告显示,巴西亚马孙雨林去年的森林砍伐量降至 2019 年以来的最低水平,这对左翼总统路易斯 · 伊纳西奥 · 卢拉 · 达席尔瓦而言无疑是一则利好消息。 巴西地理环境监测平台“地图生物群系”公布数据称,这个南美第一大国去年原生植被损毁面积达 98.5 万公顷,较 2024 年下降 20.6%。该数值也是该平台自 2019 年开始统计以来的最低值。 值得注意的是,这一数据并未计入火灾造成的林地损毁。2024 年巴西曾经历史上最严重的林区火灾季,而去年该国基本未发生大规模山林大火。 卢拉将打击森林砍伐列为其政府施政核心任务,他将在今年 10 月参加大选,谋求第四个总统任期。 据IT之家了解,树木是天然的碳汇,保护森林植被对应对气候变暖至关重要。在前极右翼总统雅伊尔 · 博索纳罗执政的四年间,巴西乱砍滥伐现象泛滥。卢拉上任后承诺,将在 2030 年前彻底杜绝非法伐木行为。 巴西六大主要生态区的森林砍伐现象均出现回落。地图生物群系技术协调员马科斯 · 罗萨在接受法新社采访时表示:“执法行动与处罚力度不断加大,这与巴西所有生物群系的砍伐量下降直接相关。” 即便砍伐量有所下降,植被遭破坏的速度依旧触目惊心。亚马孙雨林是全球面积最大的雨林,当地砍伐速率放缓了 23.5%, 但每秒仍有五棵树木被砍伐。 去年受破坏最严重的生态区依旧是塞拉多草原,这片广袤且物种丰富的稀树草原位于亚马孙雨林南部,巴西超半数的植被损毁都发生在这里。 地图生物群系由多家高校、非政府组织及科技企业联合组建,该机构表示,农业开发是造成植被损毁的首要原因,占比高达 99%。 大选临近,卢拉积极对外展示自身的环保政绩。去年,他在亚马孙地区城市贝伦主办了第 30 届联合国气候变化大会。不过,因其支持在亚马孙河入海口附近开展大型石油勘探项目,卢拉也遭到了环保人士的批评。
前情提要: 智谱联合TileRT推出GLM-5.1高速版API,输出速度达每秒400 tokens 前沿快讯 这个好啊,毕竟它思考这么久,输出 Token 这么多才能思考出来什么东西 但这个精度真的没有任何损失吗 4 个帖子 - 2 位参与者 阅读完整话题
智谱GLM团队联合TileRT团队于今天正式推出了 GLM-5.1高速版API (GLM-5.1-highspeed),其模型输出速度达到每秒 400 tokens ,刷新了当前全球大模型厂商API的速度上限。该服务目前已面向智谱MaaS平台的部分企业客户开放,主要用于解决AI编程、实时交互以及实时语音等对响应延迟要求极高的生产场景痛点。 与过往通过缩减模型体积来换取速度的轻量级模型不同,GLM-5.1高速版在 完整保留旗舰级大语言模型能力 的前提下实现了极低延迟,打破了行业中高性能与低延迟不可兼得的惯例。在实际工程测试中,该模型在长程任务中表现出极高的实时协作能力,不仅能在30秒内完成复杂网页处理,还支持在多智能体协同场景下瞬间调度50个不同人格并行回答。在代码开发、3D地图瞬时建模等高频交互场景中,该模型能够实现即问即答的无缝反馈。 这一速度突破的核心在于双方联合打造的 TileRT高性能推理引擎 。技术团队针对硬件物理极限与主流推理框架的调度瓶颈,重写了核心推理路径。TileRT彻底抛弃了运行时层的动态调度,在编译期将整个计算图静态编排为一个常驻显卡的 persistent Engine Kernel。通过将计算、异步输入输出与通信全部拆解为Tile级微任务,算子之间的中间结果直接在寄存器和缓存中直传,从而消除了主机调度与跨算子同步的开销,确保了在多卡高并发场景下拥有稳定可用的生产级超低延迟。 智谱AI开放文档 GLM-5.1-HighSpeed - 智谱AI开放文档 tilert.ai 速度:大模型推理的下一个 Scaling Law 深度解析 TileRT 高性能推理引擎及 GLM-5.1 生产级实践。 10 个帖子 - 8 位参与者 阅读完整话题
现在deepseek v4 flash官方api的输出速度高达每秒100多词元, 难道是高端算力已经到货了?毕竟快下半年了,折扣也只剩下不到十天。 5 个帖子 - 5 位参与者 阅读完整话题
肯定要是即梦这类顶级的,我不想充了会员才实测到,updream 好像是 0.7/s,有没有什么充值渠道呢?闲鱼没看到 然后 fast 和 普通的 vip 如何抉择呢?因为一个速度快便宜,但是 720p,如果做成作品觉得满意能变成1080p 吗?就是没有经验不知道怎么选择合适的模型,价格差距太大了 顺便问下,即梦和veo 目前应用最优场景是什么? veo 说不了中文但是可以配音 41 个帖子 - 6 位参与者 阅读完整话题
【10bit智力瓶颈,你的"单核大脑"性能还能提升吗?-【冷却报告】-哔哩哔哩】 https://b23.tv/00gR7bD 我就是典型的单线程大脑,同时和人交谈+做事都会让我应付不过来 我曾苦恼是我脑子笨笨 现在看来是我大脑在避免多线程频繁切换引起神经元损伤。我的注意力不错 1 个帖子 - 1 位参与者 阅读完整话题
是这样的,我现在用cudy tr3000中继楼下的wifi网速能跑到10mb每秒,打游戏延迟也不高20ms左右,但是会有丢包的情况,我可能是信号不好的原因,因为我路由器那个位置信号只有两格,但是tr3000这个便携路由器本身信号就不强。 有没有推荐信号强一点的路由器,然后无线中继稳定的推荐?那种天线多的能增强无线中继信号吗? 1 个帖子 - 1 位参与者 阅读完整话题
如题,现在下午 pro 订阅的速度大概 1.几 token 每秒,智谱有计划提升算力吗?还是说就保持这样逼着用户买 max 4 个帖子 - 4 位参与者 阅读完整话题
延迟低 速度快 注册还白送6刀 v4pro也能有每秒80token 3 个帖子 - 2 位参与者 阅读完整话题
个人版od 因为windows的onedrive发新版本的时候会每秒1000次的频率触发Microsoft.OneDriveSync的部署/取消部署/排队事件,死循环导致wsappx持续占用cpu,风扇狂转。问了claude gemini deepseek没有找到解决方案,遂打算卸载。 想到openlist能加onedrive,之后用rclone挂一下就好了,但是登不上 https://portal.azure.com Sign-in failed Error code: interaction_required Error message: interaction_required: AADSTS5000225: This tenant has been blocked due to inactivity. To learn more about tenant lifecycle policies, see Troubleshoot inaccessible tenants - Microsoft Entra | Microsoft Learn 3 个帖子 - 3 位参与者 阅读完整话题
不是很多但速度是真的快啊! flash|每秒175 tokens pro|每秒81 tokens 我觉得等大家都完善配置了速度还能起飞 12 个帖子 - 9 位参与者 阅读完整话题
这是某个中转的gpt5.4xhigh我用的记录,然后丢给了GPT。我体感来说,40~50每秒tokens对我来说刚好够用,属于不快也不慢 等会儿我具体测一下这个中转站到底支不支持fast,因为我是配置里是开着fast用的但我不清楚这个中转支不支持 7 个帖子 - 7 位参与者 阅读完整话题
官网api可获取,openr上也有,速度是真快,pro每秒一百token,标准版每秒150token 小米的套餐真贵啊 天气卡片 25 个帖子 - 13 位参与者 阅读完整话题
IT之家 4 月 16 日消息,据 Space 报道,星际访客 3I/ATLAS 彗星每天向太空喷射的水量,足以填满 70 个奥林匹克游泳池。这一发现为科学家提供了绝佳机会,用以研究其他恒星周围行星形成时存在的物质成分,这些行星的年龄可能远比太阳更古老。 据IT之家了解,该发现由欧洲空间局(ESA)的木星冰卫星探测器(JUICE)任务完成,目前该探测器正飞往木星及其冰卫星。2025 年 11 月,JUICE 利用搭载的 MAJIS(木卫与木星成像光谱仪)和 JANUS(全方位探测朱庇特、爱神与后代)设备,观测了 3I/ATLAS 彗星 —— 这是人类发现的第三个来自太阳系外、穿越太阳系的天体。 和太阳系本土彗星一样,3I/ATLAS 在靠近太阳时开始释放物质:太阳辐射加热其冰冷的内核,使固态冰直接转化为气体,这一过程称为升华。气体剧烈喷发时,形成彗星特有的彗发和彗尾,彗星也随之变亮,而 3I/ATLAS 的亮度甚至超出预期。 观测期间,MAJIS 探测到水蒸气与二氧化碳分子的红外辐射。这些物质被称为挥发性物质,因为它们极易蒸发。 意大利国家天体物理研究所(INAF)团队成员朱塞佩・皮乔尼在声明中表示:“MAJIS 多次探测到水蒸气和二氧化碳,表明在彗星经过近日点后不久,埋藏在地表下的挥发性冰便被大量释放到太空中。根据收集到的数据,我们估算彗星核每秒喷出约 2 吨物质,相当于每天向太空喷射约 70 个奥运泳池量的水蒸气。” “MAJIS 数据将帮助我们更好地了解这颗彗星在近日点后的活动情况,以及数十亿年前在其他恒星周围形成的物质的物理与化学特性。” JUICE 对 3I/ATLAS 的观测尤为特别,因为这并非计划内任务,只是在 2025 年 7 月 1 日发现该彗星后才临时开展。由于 JUICE 可观测彗星的时间窗口极短,且这颗星际彗星的辐射信号非常微弱,观测难度极大。 此后科研团队经历了漫长等待,相关数据直到 2026 年 2 月才传回地球。 INAF 研究员、JANUS 设备首席研究员帕斯夸莱・帕伦博说:“我们等待了很久,但一切都值得。这些精彩的图像首次清晰展现了彗星在近日点附近的剧烈活动。3I/ATLAS 呈现出延展的彗发、彗尾,以及射线、喷流、纤维状等多种形态结构。这些数据将让我们在中短时间尺度上研究彗星彗发与彗尾的形态结构、亮度及演化。我们对 JANUS 的表现非常满意;这也出色地预示了,当它最终抵达 JUICE 任务的目的地 —— 木星及其冰卫星轨道后,将能发挥怎样的能力。”