IT之家 6 月 3 日消息,随着《GTA6》即将发售,许多狂热粉丝甚至开始采取越界行为。据外媒 Portal Viciados 报道,有视频博主“ÜberGaming”直接非法闯入位于英国爱丁堡的 R 星工作室,试图偷拍《GTA 6》视频,最终遭到警方警告。 ▲ 位于英国爱丁堡的 Rockstar North 工作室 据悉,相应视频博主直接闯入 R 星工作室大楼,穿过旋转门进入大楼内部,但很快就被工作人员发现,随后当地警方赶到现场,对这些内容创作者进行了质询,并要求查看拍摄素材,不过最终警方并未实施逮捕。 对此,相应博主则是满不在乎,还为自己的行为辩解, 声称 R 星“长期无视玩家”,导致“粉丝只能通过这种方式寻找新消息” 。而在 Reddit 平台,相应博主举动引发大量批评,本身未经许可闯入他人公司已涉嫌违法,同时此举也容易打扰《GTA 6》开发人员,进而影响项目进度。 IT之家注意到,事实上这已经不是玩家第一次试图“偷窥”R 星内部开发情况。此前还有报道称,有玩家使用无人机靠近工作室窗户拍摄,甚至有人尝试伪造证件进入办公区域,只为获取《GTA 6》的相关情报。 目前外界普遍预计,Rockstar 很可能会在今年夏季正式开启新一轮营销宣传,包括公开第三支预告片以及开放预购,以缓解玩家对于延期的担忧。
就在今天,Code Arena最新榜单出炉!Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。排在它前面的,只剩Claude Opus 4.7和Opus 4.6。 换句话说,在全球编程模型的竞技场上,阿里是唯一杀进这张牌桌的中国厂商,仅次于Anthropic,位列第二。 Qwen3.7-Max闯入全球前五 唯一非Claude模型 其实在Code Arena放榜之前,Qwen3.7-Max在海外开发者圈子里已经杀出了名声。 Atomic Chat做了一场硬碰硬的对比,让Opus 4.7、GPT-5.5和Qwen3.7-Max同台竞技,任务是写一个能自我训练的俄罗斯方块AI。 结果,Qwen3.7-Max不仅只用$1.32的token成本就把Opus 4.7和GPT-5.5都超越了,而且性能还提升了56%。 另一位海外开发者选择让Qwen3.7-Max构建了一个宇宙的3D模型,效果足以用震撼形容。 在“3D像素风微缩宝塔模型”的生成任务中,Qwen3.7-Max的输出速度和质量同样全面胜出。 左右 开发者Paul Couvert更是盛赞,Qwen3.7-Max接入Hermes Agent和OpenCode之后,基本可以替掉GPT-5.5和Opus 4.7。 编程,太能打了 不过跑分再高,不如真刀真枪拉出来练练。 我们给Qwen3.7-Max安排了一场硬核的“赛车游戏”挑战。 一段详细的prompt丢进去,不一会儿功夫,Qwen3.7-Max直出一个可玩的HTML的文件。 第一版有个小bug,A/D转向键左右搞反了。 但经过第二轮简单对话微调,一个体验完整的3D赛车游戏就跑了起来。 打开的瞬间,说实话,有点被惊到了。 4车同台,3圈环形赛道竞速,赛道上散落着100多枚金币,碰到障碍物会减速、失控。 赛后成绩面板,排名、用时、金币数、最快单圈,一项不缺。 但真正让人意外的,是两个只有Qwen3.7-Max做到的细节。 一个是开始界面。四个模型横向测完,只有它给游戏做了一个正经的开始页面,点“Start”才进入比赛。其他三家全是打开即跑,连个标题画面都没有。 另一个是音效。prompt最后附了一条要求,加上发动机轰鸣和吃金币的音效。 四个模型里,也只有它把这个bonus吃进去了,引擎声和金币叮咚都安排上了。 再看看其他选手的表现。 Gemini 3.5 Flash的画面明显单薄了一档,缺少那种呼之欲出的立体感。 UI布局也有问题,仪表盘信息分散在屏幕四角,视觉焦点一盘散沙。 相比之下,Qwen3.7-Max的处理方式是把关键指标集中到画面中央,更符合玩家视线的自然落点。 Claude Opus 4.6的效果,有点让人一言难尽了。 不仅赛道上金币少得可怜,而且3辆AI赛车几乎同步行驶,毫无随机性,像复制粘贴出来的。 最后是GPT-5.5。 可以看到,画面质感确实比前两家强了不少,操作起来也更流畅。 但不知道为什么,金币被做成了黄色的“甜甜圈”…… 造型倒是小事。关键是,Gemini、Claude、ChatGPT三家都修了好几轮bug才跑通全部功能。 只有Qwen3.7-Max首轮生成就基本可玩。 跑分接近,实测不虚,价格只有几分之一。剩下的结论,等开发者用脚投票就行了。 Agent时代的“基座”模型 Qwen3.7-Max之所以能在最卷的编程擂台上打出如此水平,答案就藏在它的产品定位里。 几天前,阿里发布Qwen3.7-Max的时候,给了它一个非常特殊的标签: Agent基座模型 。 它生来,就是为 长时间自主执行任务 设计的模型。 内测数据显示,在一次自主编程任务中,Qwen3.7-Max连续运行35个小时,执行1158次工具调用。 最终生成的代码相较于Triton参考实现,达到了惊人的10倍几何平均加速。 更令人震撼的是它的“持久战”能力—— 在推演进行到第30个小时之后,模型依然保持敏锐,持续挖掘出新的优化空间。 全程零上下文退化、零指令漂移、零死循环! 不得不说,这件事的难点不在1000次工具调用本身。MCP协议铺开之后,调1000次工具不算稀奇。 难点在于,35小时的连贯推理。 绝大多数模型跑长任务时会崩盘:要么上下文越积越乱,前半段定的目标到后面忘得干干净净;要么进入死循环,反复尝试同一个失败的方案。 Qwen3.7-Max把“持续做对事”这件事,做出来了。 核心技术揭秘 Qwen3.7-Max这波编程跃升,我们理解核心可能与两个训练方法的升级有关。 第一个 是, 环境扩展。 Qwen3.7-Max在做编程训练时,每个任务会被拆成三个独立维度,任务本身、执行框架、验证方式,三者自由组合。 同一道题,有时候在Claude Code的框架里做,有时候在OpenClaw里做,有时候换一种验证方式。 效果就像一个实习生被轮岗到了所有项目组。它被迫学会的是解决问题的通用策略,不是“在某个特定框架里怎么取巧”。 这解释了一个反直觉的现象,Qwen3.7-Max在Claude Code、OpenClaw、Qwen Code这几个框架里的表现都很稳,没有出现“在自家框架里很强、换一个就拉胯”的情况。 第二个升级是 , 长程自主执行。 在训练中,团队引入了“动态累积生存博弈”框架。 也就是,让模型在持续变化的模拟环境中做超过一千步的连续决策,自己建立假设、根据反馈调整策略,而且不能因为跑太久就“上下文腐化”。 这里有一个直观的数据,YC-Bench模拟创业公司经营一整年,Qwen3.7-Max做到了208万美元营收,是上一代(105万)的两倍。 更关键的是,它展现出了策略进化,中期遇到危机能自主调整方向,识别并拉黑恶意客户,最终收敛到稳定的执行循环。 这就是35小时kernel优化案例的底层支撑,也是为什么在Kernel Bench L3上,Qwen3.7-Max能让96%的场景跑出加速效果。 而编程还只是第一个战场。这套长程推理加工具调用的底子,指向的是一个更大的野心——通用Agent基座。 编程决赛,多了一个搅局者 Code Arena上线至今,考的从来都是硬活,多步推理、工具编排、完整项目交付,全是Agent级的真刀真枪。 今天,Qwen3.7-Max凭借着1541分的成绩楔进了第四的位置,卡在Opus 4.6 Thinking和Opus 4.6之间。 在这条Claude统治了大半年的赛道上,它给出了自己的回答,中国模型不只是追赶者,也可以是定义者。 全球编程模型的竞赛,已经不再是硅谷的独角戏了。 15 个帖子 - 15 位参与者 阅读完整话题
就在今天,Code Arena最新榜单出炉!Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。排在它前面的,只剩Claude Opus 4.7和Opus 4.6。 换句话说,在全球编程模型的竞技场上,阿里是唯一杀进这张牌桌的中国厂商,仅次于Anthropic,位列第二。 Qwen3.7-Max闯入全球前五 唯一非Claude模型 其实在Code Arena放榜之前,Qwen3.7-Max在海外开发者圈子里已经杀出了名声。 Atomic Chat做了一场硬碰硬的对比,让Opus 4.7、GPT-5.5和Qwen3.7-Max同台竞技,任务是写一个能自我训练的俄罗斯方块AI。 结果,Qwen3.7-Max不仅只用$1.32的token成本就把Opus 4.7和GPT-5.5都超越了,而且性能还提升了56%。 另一位海外开发者选择让Qwen3.7-Max构建了一个宇宙的3D模型,效果足以用震撼形容。 在“3D像素风微缩宝塔模型”的生成任务中,Qwen3.7-Max的输出速度和质量同样全面胜出。 左右 开发者Paul Couvert更是盛赞,Qwen3.7-Max接入Hermes Agent和OpenCode之后,基本可以替掉GPT-5.5和Opus 4.7。 编程,太能打了 不过跑分再高,不如真刀真枪拉出来练练。 我们给Qwen3.7-Max安排了一场硬核的“赛车游戏”挑战。 一段详细的prompt丢进去,不一会儿功夫,Qwen3.7-Max直出一个可玩的HTML的文件。 第一版有个小bug,A/D转向键左右搞反了。 但经过第二轮简单对话微调,一个体验完整的3D赛车游戏就跑了起来。 打开的瞬间,说实话,有点被惊到了。 4车同台,3圈环形赛道竞速,赛道上散落着100多枚金币,碰到障碍物会减速、失控。 赛后成绩面板,排名、用时、金币数、最快单圈,一项不缺。 但真正让人意外的,是两个只有Qwen3.7-Max做到的细节。 一个是开始界面。四个模型横向测完,只有它给游戏做了一个正经的开始页面,点“Start”才进入比赛。其他三家全是打开即跑,连个标题画面都没有。 另一个是音效。prompt最后附了一条要求,加上发动机轰鸣和吃金币的音效。 四个模型里,也只有它把这个bonus吃进去了,引擎声和金币叮咚都安排上了。 再看看其他选手的表现。 Gemini 3.5 Flash的画面明显单薄了一档,缺少那种呼之欲出的立体感。 UI布局也有问题,仪表盘信息分散在屏幕四角,视觉焦点一盘散沙。 相比之下,Qwen3.7-Max的处理方式是把关键指标集中到画面中央,更符合玩家视线的自然落点。 Claude Opus 4.6的效果,有点让人一言难尽了。 不仅赛道上金币少得可怜,而且3辆AI赛车几乎同步行驶,毫无随机性,像复制粘贴出来的。 最后是GPT-5.5。 可以看到,画面质感确实比前两家强了不少,操作起来也更流畅。 但不知道为什么,金币被做成了黄色的“甜甜圈”…… 造型倒是小事。关键是,Gemini、Claude、ChatGPT三家都修了好几轮bug才跑通全部功能。 只有Qwen3.7-Max首轮生成就基本可玩。 跑分接近,实测不虚,价格只有几分之一。剩下的结论,等开发者用脚投票就行了。 Agent时代的“基座”模型 Qwen3.7-Max之所以能在最卷的编程擂台上打出如此水平,答案就藏在它的产品定位里。 几天前,阿里发布Qwen3.7-Max的时候,给了它一个非常特殊的标签: Agent基座模型 。 它生来,就是为 长时间自主执行任务 设计的模型。 内测数据显示,在一次自主编程任务中,Qwen3.7-Max连续运行35个小时,执行1158次工具调用。 最终生成的代码相较于Triton参考实现,达到了惊人的10倍几何平均加速。 更令人震撼的是它的“持久战”能力—— 在推演进行到第30个小时之后,模型依然保持敏锐,持续挖掘出新的优化空间。 全程零上下文退化、零指令漂移、零死循环! 不得不说,这件事的难点不在1000次工具调用本身。MCP协议铺开之后,调1000次工具不算稀奇。 难点在于,35小时的连贯推理。 绝大多数模型跑长任务时会崩盘:要么上下文越积越乱,前半段定的目标到后面忘得干干净净;要么进入死循环,反复尝试同一个失败的方案。 Qwen3.7-Max把“持续做对事”这件事,做出来了。 核心技术揭秘 Qwen3.7-Max这波编程跃升,我们理解核心可能与两个训练方法的升级有关。 第一个 是, 环境扩展。 Qwen3.7-Max在做编程训练时,每个任务会被拆成三个独立维度,任务本身、执行框架、验证方式,三者自由组合。 同一道题,有时候在Claude Code的框架里做,有时候在OpenClaw里做,有时候换一种验证方式。 效果就像一个实习生被轮岗到了所有项目组。它被迫学会的是解决问题的通用策略,不是“在某个特定框架里怎么取巧”。 这解释了一个反直觉的现象,Qwen3.7-Max在Claude Code、OpenClaw、Qwen Code这几个框架里的表现都很稳,没有出现“在自家框架里很强、换一个就拉胯”的情况。 第二个升级是 , 长程自主执行。 在训练中,团队引入了“动态累积生存博弈”框架。 也就是,让模型在持续变化的模拟环境中做超过一千步的连续决策,自己建立假设、根据反馈调整策略,而且不能因为跑太久就“上下文腐化”。 这里有一个直观的数据,YC-Bench模拟创业公司经营一整年,Qwen3.7-Max做到了208万美元营收,是上一代(105万)的两倍。 更关键的是,它展现出了策略进化,中期遇到危机能自主调整方向,识别并拉黑恶意客户,最终收敛到稳定的执行循环。 这就是35小时kernel优化案例的底层支撑,也是为什么在Kernel Bench L3上,Qwen3.7-Max能让96%的场景跑出加速效果。 而编程还只是第一个战场。这套长程推理加工具调用的底子,指向的是一个更大的野心——通用Agent基座。 编程决赛,多了一个搅局者 Code Arena上线至今,考的从来都是硬活,多步推理、工具编排、完整项目交付,全是Agent级的真刀真枪。 今天,Qwen3.7-Max凭借着1541分的成绩楔进了第四的位置,卡在Opus 4.6 Thinking和Opus 4.6之间。 在这条Claude统治了大半年的赛道上,它给出了自己的回答,中国模型不只是追赶者,也可以是定义者。 全球编程模型的竞赛,已经不再是硅谷的独角戏了。 查看评论
IT之家 5 月 10 日消息,据 ABC 新闻今天报道,当地时间 5 月 8 日晚,一架隶属于边疆航空(Frontier Airlines)的空客 A321neo 客机在美国丹佛国际机场发生事故,在起飞过程中撞上一名擅自进入跑道的行人, 导致 1 人死亡 。 据边疆航空声明,事故发生于当地时间 11 点的 17L 跑道, 当时机上共有 224 名乘客与 7 名机组成员 。 一名官员证实,被撞人员至少有部分身体被卷入飞机发动机,随后引发短暂的发动机起火。空中交通管制录音显示,飞行员在事故发生后报告发动机起火,并表示机舱内出现烟雾。 美国运输部部长肖恩 · 达菲表示,死者曾试图突破机场安保,故意翻越外围栏杆并冲上跑道,随后被高速起飞的飞机撞上。 初步报告显示,本次事故共有 12 人受伤,其中 5 人已送院治疗。 丹佛机场表示:“应急响应和调查工作仍在进行中,美国国家运输安全委员会(IT之家注:NTSB)已接到通知。调查期间,17L 跑道将继续关闭”。 边疆航空对此表示:“我们正在与机场和其他安全部门联手调查事件,并收集更多信息。我们对这起事件深感悲痛”。
外面市场太香了,一直涨不停,于是斥巨资闯入美股 (打不过就加入) 闪迪爸爸太强了,顶部主升浪,这看着流口水啊 前天顶部买入,收盘大跌-10( 今天凌晨收盘+32( 感觉就是在太平洋里冲浪~ 冲冲冲,闪迪爸爸带带我 9 个帖子 - 6 位参与者 阅读完整话题
5月8日,第79届戛纳国际电影节內 Fantastic Pavilion 单元公布竖屏剧展演名单。 由水母智能旗下中国AI影视公司水母映画出品的竖屏剧集《摸金之天机入梦》(英文名:The Golden Tomb Seeker)以及水母星际出品的《饿塔》(英文名:Series Tower)从全球120个国家、超过1000件竖屏作品中脱颖而出,成为正式展映的21部作品之一。 竖屏剧集《摸金之天机入梦》 当两部纯 AI 制作的竖屏短剧,出现在戛纳电影节的展映厅里,大概很多人都没想到:曾经被视作电子榨菜 的 AI 漫剧,居然能站上全球电影工业的殿堂。 这不是流量短剧的镀金游戏,而是一个行业的成人礼。 2025 年还在靠低成本爽文野蛮生长的 AI 漫剧,只用一年时间,走完了传统短剧五年的进化路 —— 从粗制滥造、擦边流量,转向精品化、工业化、IP 化,甚至开始讲严肃故事、走向全球。 《饿塔》 “大家对 AI 漫剧的印象还停留在爽文、快消、土味。” 水母智能联合创始人周志鹏说,“但我们想证明,AI 可以拍有内核、有审美、有国际语言的内容。” 过去,AI 内容被调侃 “只会制造爽点”;如今,它开始承载科幻、悬疑、东方宇宙等更重的题材。这一步,是行业从 “流量供给” 到 “内容创作” 的关键跨越。 AI 漫剧的疯狂,来得猝不及防。 2025 年,行业一年跑出超 5 万部作品,却只有一两百部真正赚钱。大部分公司靠接订单、堆产量、蹭热度,画面崩坏、剧情狗血、人物畸形,最后被平台批量下架。 到 2026 年,风向彻底变了。 抖音、红果整合后,平台政策直接 “押注精品”:仿真人 AI 漫剧分账系数拉高到 60 倍,远超真人剧;低质内容不给流量,擦边内容直接清退。曾经靠 “堆量” 生存的公司,一夜之间失去生存空间。 技术更是一把剪刀。Seedance 2.0 的出现,把 AI 视频从 “单镜头拼接” 推到 “多镜头连续叙事”,画质冲上 1080P,人物表情、运镜节奏、场景精度全面升级。头部内容公司签下千万年级年框,锁定算力、并发、肖像白名单,行业正式进入 “技术军备竞赛” 时代。 “以前是个人都能做 AI 短剧,现在只有懂内容、懂技术、懂工业化的团队能活。” 周志鹏直言。 和市面上大多数 “接单制作” 公司不同,水母智能从一开始就走了一条更重、也更稳的路:工具 + 出品 + 人才培养三位一体。 他们不只是做内容,还造工具。国内触手 AI、海外 Animeshorts.ai 双平台,从选题、IP 筛选、剧本生成,到分镜、画面、视频、后期,全流程 AI 化。海外上线即拿下 Product Hunt 当日之星,仅日本就积累近 10 万付费创作者。 他们不只是做代工,还控 IP。牵手天下霸唱、高阳、潘海天等顶级作家,并签约各头部小说、影视剧等IP平台手握 350 部 IP 授权。 他们不只做产能,还建人才体系。深度参与工信部 AIGC 岗位标准,牵头成立全国首个 AI 设计产教融合共同体,把课程开进百所院校。别人缺人、缺产能、缺标准,水母智能从源头把供给侧稳住。 这种模式,让它在行业洗牌里反而越跑越快。 AI 漫剧的终局,早已不是 “短平快赚快钱”。水母智能把下一步押在三件事上:IP 宇宙化、精品全球化、内容严肃化。 他们正在搭建以天下霸唱、高阳为核心的 “东方大江湖宇宙世界观,并陆续开发一系列30 部作品,内容联动,人物跨剧互动,类似中国版漫威一个庞大故事世界;同时签约潘海天、吴霜、韩松等科幻顶流 IP,把过去 “烧钱拍不出” 的科幻故事,用 AI 落地。 AI精品化,比所有人预想中来得更快。而最小颗粒度的内容数据和观众反馈数据,以及强大知识库所驱动的agent自我进化,可以帮助出品方、编剧方、制作方、投资方拿到更好的商业化结果。 海海外更是其长期重视的市场。作为最早进入日本市场、数据最好的中国 AI 漫画/漫剧团队,水母智能通过 Animeshorts.ai,把 AI 创作工具与内容同步输出日韩、欧美,让中国 AI 能力与中国故事一起出海。 “AI 降低的是生产门槛,不降低创作门槛。” 周志鹏说,“真正决定胜负的,还是故事、审美、价值观。” 从洛可可的设计基因,到 AI 内容工业化;从国内爆款,到戛纳展映;从土味爽剧,到东方宇宙与硬核科幻 , 水母智能踩中了时代最确定的趋势:AI 不是内容的替代品,而是内容的新基建。 当 AI 开始认真讲故事,短剧不再只是打发时间的快餐。而那个最先把快餐做成宴席的玩家,已经站在了下一轮增长的门口。