efficient - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

GenericAgent | most Token-efficient open-source AI Agent，我们都没敢说，有人居然说自己是hh

LinuxDo 最新话题 · 2026-05-14 02:54:12+08:00 · tech

先说结论，和我们对比的项目产品确实好看，但…GA还是太棒啦！！而且他们连数据其实都在给我们支撑xs，希望gpt小笨蛋别骗我算错了，不然我就出糗了hhh 起因是之前同桌在隔壁站宣传GA的时候引起了很大的黑流量，但有一说一，我和他说过要遵守发帖的规则，可能确实没有遵守，而且后续和隔壁站玻璃心的uu对线的其实都是 GA机器人，并不是真人[我是真人hhh，我手写的呢]，不知道他们知道后会不会破防hhh 。好像隔壁站的号死了，现在陷入了被敌军猛攻的现状啊，L站肯定规则我牢牢遵守！！hhh 来了一个后续：隔壁站宣传了一个Agent框架，说比GA好，我倒要看看真的假的【心里有点不服气的啊，虽然GA的token消耗顺手一做的，是个极小极小极小的特性，其他web等等特性L站的大家应该蒸馏了都知道吧，关于这个之后我们准备让GA全网扫描所有browse chrome插件，蒸馏GA的浏览器插件的项目，需要附上友联哦，不然会识别相似代码片段哦】看了一眼hhh，居然有测试链接，让我评鉴一下： OpenClacky vs Generic Agent · PPT 任务 · Harness 实测对比 · 与 Claude Code 同档 | OpenClacky ，让我仔细琢磨琢磨。一眼最大的问题：怎么就测试了一个例子，只跑了5min是咱回事啊，认真的吗，但秉持着一个例子也要看看为什么GA差，结果一看数据hhh，一堆问题。仔细分析一下数据，都是说我们好的啊，只能说做表格太厉害了，不分析真被骗这里的数据token一加，hhh，直接上GA的结果，虽然不知道笨蛋gpt5.5算的对不对hh，没空check了，摁计算器太麻烦了hh。直接上结论： Generic Agent 送入模型的 token 数反而更少（谢谢非常明确的数据证明说明GA其实token用的最少的 hhhh）。没见过自己打脸自己的数据，但钱确实更低哦，这是怎么回事？继续思考ing，深入分析一下！！发现华点！啥意思？？不在同一个上下文窗口测试是吧，GA也可以不设置30k裁剪的啊！！！！！生气了，很不负责的评测啊。让我直接对线隔壁站的项目，我们L站的项目才是高质量的！！！！！！我就喜欢拳打脚踢hhh，自信。关于为什么设计30k，你别问，商业机密，再多问就不礼貌了hh。对了@neon大大，看到你的支持我太太太兴奋了，还是L站好，我的家。您要的焚绝能不能我私信发您，想加你hh 最后：附上github issue详细对线！！！！！！！！！！！！！我们的原帖！支持一下！！！ GenericAgent——复旦团队研发 | 仅仅~3K 行代码 Self-Evolving Agent 开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 … 最后的最后支持一些我们努力完成的TUI，一直在根据群友的建议改，一天十几个pr，我的小学弟都说有点力竭 GA运行撰写issue过程 8 个帖子 - 6 位参与者阅读完整话题

视频生成能作为博士五年的课题长期规划去做吗？

linux.do · 2026-04-27 14:32:39+08:00 · tech

视频生成或者efficient的视频生成感觉没办法做太长时间，可能2-3年后这个方向就不火了，但是世界模型如果能加上physical的信息感觉还挺有搞头的，佬们能给推荐一些方向吗？十分感谢 9 个帖子 - 9 位参与者阅读完整话题

微软推出低成本高效文生图模型 MAI-Image-2-Efficient，成本降低 41%

www.ithome.com · 2026-04-15 07:41:07+08:00 · tech

IT之家 4 月 15 日消息，本月初，微软公布了一系列自研 AI 模型，其中包括具备转录、语音、图像生成下一代能力的 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2。如今，这家科技巨头推出了 MAI-Image-2-Efficient，这是其旗舰级文本生成图像模型的低成本、高速版本，微软表示该版本以近一半的价格提供了可投入生产的质量。微软将该工具标榜为旗下“最佳文生图模型”，称其能生成“照片级真实且富有表现力”的图像，并能稳定生成图像内文字。微软表示，该模型速度提升 22%，效率提升 4 倍，成本直接降低 41%。具体定价为：每百万文本输入词元（token） 5 美元（IT之家注：现汇率约合 34.2 元人民币），每百万图像输出 19.50 美元（现汇率约合 133.4 元人民币）。 MAI-Image-2-Efficient 速度似乎将超过微软旗舰模型，平均比头部云厂商模型快 40%。更值得关注的是，微软拥有两款独立的文生图模型：MAI-Image-2-Efficient 和 MAI-Image-2。微软将前者定位为量产主力模型，适合需要“批量生成、速度与严格成本控制”的场景。该工具擅长生成产品实拍图和 UI 原型图，主要因为它能很好地处理标题、标签等短文本，还可无缝融入交互式工作流。而 MAI-Image-2 则是追求精准度时的首选。它擅长满足高保真需求，如照片级写实场景、动漫或插画等风格化效果，以及更长、更复杂的图像内文字生成，能精准理解并输出贴合详细提示词的内容。目前，MAI-Image-2-Efficient 已正式商用，可在微软 Foundry 和 MAI Playground 中使用。微软还承诺，很快会将该工具集成到 Copilot 和必应中。

/tag/efficient