先说结论,和我们对比的项目产品确实好看,但…GA还是太棒啦!!而且他们连数据其实都在给我们支撑xs,希望gpt小笨蛋别骗我算错了,不然我就出糗了hhh 起因是之前同桌在隔壁站宣传GA的时候引起了很大的黑流量,但有一说一,我和他说过要遵守发帖的规则,可能确实没有遵守,而且后续和隔壁站 玻璃心 的uu对线的其实都是 GA机器人 ,并不是真人[我是真人hhh,我手写的呢],不知道他们知道后会不会破防hhh 。 好像隔壁站的号死了,现在陷入了被敌军猛攻的现状啊,L站肯定规则我牢牢遵守!!hhh 来了一个后续:隔壁站宣传了一个Agent框架,说比GA好,我倒要看看真的假的【心里有点不服气的啊,虽然GA的token消耗顺手一做的,是个极小极小极小的特性 ,其他web等等特性L站的大家应该蒸馏了都知道吧, 关于这个之后我们准备让GA全网扫描 所有browse chrome插件,蒸馏GA的浏览器插件的项目,需要附上友联哦,不然会识别相似代码片段哦】 看了一眼hhh,居然有测试链接,让我评鉴一下: OpenClacky vs Generic Agent · PPT 任务 · Harness 实测对比 · 与 Claude Code 同档 | OpenClacky ,让我仔细琢磨琢磨。 一眼最大的问题:怎么就测试了一个例子,只跑了5min是咱回事啊,认真的吗,但秉持着一个例子也要看看为什么GA差 ,结果一看数据hhh,一堆问题。 仔细分析一下数据,都是说我们好的啊,只能说做表格太厉害了,不分析真被骗 这里的数据token一加,hhh,直接上GA的结果,虽然不知道笨蛋gpt5.5算的对不对hh,没空check了,摁计算器太麻烦了hh。 直接上结论: Generic Agent 送入模型的 token 数反而 更少 ( 谢谢非常明确的数据证明说明GA其实token用的最少的 hhhh)。 没见过自己打脸自己的数据,但钱确实更低哦,这是怎么回事? 继续思考ing,深入分析一下!!发现华点!啥意思??不在同一个上下文窗口测试是吧,GA也可以不设置30k裁剪的啊!!!!! 生气了,很不负责的评测啊。 让我直接对线隔壁站的项目,我们L站的项目才是高质量的!!!!!! 我就喜欢拳打脚踢hhh,自信。关于为什么设计30k,你别问,商业机密,再多问就不礼貌了hh。对了@neon大大,看到你的支持我太太太兴奋了,还是L站好,我的家。 您要的焚绝能不能我私信发您,想加你hh 最后:附上github issue详细对线!!!!!!!!!!!!! 我们的原帖!支持一下!!! GenericAgent——复旦团队研发 | 仅仅~3K 行代码 Self-Evolving Agent 开发调优 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 … 最后的最后 支持一些我们努力完成的TUI,一直在根据群友的建议改,一天十几个pr,我的小学弟都说有点力竭 GA运行撰写issue过程 8 个帖子 - 6 位参与者 阅读完整话题
视频生成或者efficient的视频生成感觉没办法做太长时间,可能2-3年后这个方向就不火了,但是世界模型如果能加上physical的信息感觉还挺有搞头的,佬们能给推荐一些方向吗?十分感谢 9 个帖子 - 9 位参与者 阅读完整话题
使用deepseek-v4 pro的总结,配合gpt-image-2的出图 1 个帖子 - 1 位参与者 阅读完整话题
Google – 21 Apr 26 Make chats more natural and efficient with Continued Conversation, now in... Since early access launched, millions of you have opted in to help shape Gemini for Home through your daily use and feedback. Today, we’re delivering on one of your top … Google now lets you have full conversations with Gemini for Home 2 个帖子 - 2 位参与者 阅读完整话题
IT之家 4 月 15 日消息,本月初,微软公布了一系列自研 AI 模型,其中包括具备转录、语音、图像生成下一代能力的 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2。 如今,这家科技巨头推出了 MAI-Image-2-Efficient,这是其旗舰级文本生成图像模型的低成本、高速版本,微软表示该版本以近一半的价格提供了可投入生产的质量。微软将该工具标榜为旗下“最佳文生图模型”,称其能生成“照片级真实且富有表现力”的图像,并能稳定生成图像内文字。 微软表示,该模型速度提升 22%,效率提升 4 倍,成本直接降低 41%。具体定价为:每百万文本输入词元(token) 5 美元(IT之家注:现汇率约合 34.2 元人民币),每百万图像输出 19.50 美元(现汇率约合 133.4 元人民币)。 MAI-Image-2-Efficient 速度似乎将超过微软旗舰模型,平均比头部云厂商模型快 40%。更值得关注的是,微软拥有两款独立的文生图模型:MAI-Image-2-Efficient 和 MAI-Image-2。 微软将前者定位为量产主力模型,适合需要“批量生成、速度与严格成本控制”的场景。该工具擅长生成产品实拍图和 UI 原型图,主要因为它能很好地处理标题、标签等短文本,还可无缝融入交互式工作流。 而 MAI-Image-2 则是追求精准度时的首选。它擅长满足高保真需求,如照片级写实场景、动漫或插画等风格化效果,以及更长、更复杂的图像内文字生成,能精准理解并输出贴合详细提示词的内容。 目前,MAI-Image-2-Efficient 已正式商用,可在微软 Foundry 和 MAI Playground 中使用。微软还承诺,很快会将该工具集成到 Copilot 和必应中。