总算是迈出了第一步 metapi不是好久没更新了吗 自己想着精简功能 这种coding的感觉好爽 溜了溜了 接着魔改 1 个帖子 - 1 位参与者 阅读完整话题
如图借助 Coding Tools MCP 总算是能把 OpenAI 的最强模型 GPT 5.5 Pro 用来编程了,就算是 Codex 里面都没有 5.5 Pro 能用,当然前提是你 ChatGPT 账号本身要有 5.5 Pro 模型的使用权限( Business 账号和 Pro 账号都有 5.5 Pro 模型可以用,Plus 用户没有)
如图借助 Coding Tools MCP 总算是能把 OpenAI 的最强模型 GPT 5.5 Pro 用来编程了,就算是 Codex 里面都没有 5.5 Pro 能用,当然前提是你 ChatGPT 账号本身要有 5.5 Pro 模型的使用权限( Business 账号和 Pro 账号都有 5.5 Pro 模型可以用,Plus 用户没有)
天天喊AI手机要起飞的哥们儿,这回总算是能看见点跑道了。就在近日,多家媒体放出猛料, 微信正在与华为、荣耀、小米等多家手机厂商合作推出A2A(Agent-to-Agent)助手能力 ,可通过手机语音助理发起微信的音视频通话,或向好友发送消息。 翻译成人话就是:以后你对手机助手说一句“给老王发个微信”,手机助手不用再装作听不懂了,它可以把需求交给微信,微信自己执行,再把结果返回。 (图源:雷科技) 这事乍一看没那么炸裂,毕竟都2026年了,一个手机助手能帮你发微信,好像不应该是新闻,更像是它早就该会的基本功。 但问题就在这儿。 过去几年,AI手机发布会一个比一个热闹,动不动就是全局智能体、主动服务、跨App办事,发布会上更是各种一句话订票、一句话叫车、一句话发消息,演示视频丝滑得像开了挂。 可真到微信这种国民级应用面前,很多AI功能就突然变得很有礼貌,甚至有些谨慎起来。 它不乱动,它不越界,也不太能办事,只会老老实实地在门外站着。 直到今天,微信才算是把门打开了一条缝。即便只是“一条缝”,雷科技认为微信此举也将深刻影响AI科技产业。 能用,但功能不多 先说微信和厂商们到底做了什么。 过去手机厂商做Agent,喜欢走“我来接管手机”的路子。它要看界面,找按钮,模拟点击,再等页面跳转。 理论上很猛,什么App都能碰一碰,但问题也很明显。 你一个手机助手,突然要帮用户点微信、点支付宝、点美团、点银行App,应用厂商会怎么想? 它们肯定会紧张。 因为这里面不只是按钮,还有用户数据、支付风险、风控规则,以及最核心的入口控制权。不是你技术上能点,就代表别人商业上愿意让你点。 豆包手机之前遇到的阻力,其实已经把这事演示过一遍了。 (图源:豆包) 作为对比,微信这次支持的 A2A标准协议 ,最初是由Google在2025年4月正式提出并开源的,它可以让不同的Agent之间直接建立沟通、分配任务并协同工作,让手机助手把需求发给微信,由微信自己判断、自己执行、自己返回。 正因为决策权掌握在微信手里,它才敢让外部AI助手调用几类低风险、高频率的微信能力。 具体能做些什么...总之,我这边拿了一台荣耀Magic8 RS给大家做个测试。 使用方法还挺简单的,呼出YOYO助手,然后向它下令就行了。 第一次唤起微信的时候,微信会提醒你获取智能助手权限,这个估计和之后要上线的微信Agent本身是一致的。 (图源:雷科技) 接下来的操作就很简单了,你可以用“打开微信扫一扫”呼出扫一扫界面。 (图源:雷科技) 用“给XX发微信说OOOO”的指令,就可以发送文字信息,不过跳转之后的操作速度不算快,而且还需要你自己手动去确认发送与否。 (图源:雷科技) 用“给XX打微信语音/视频”的指令,就可以拨打语音/视频电话,同样需要你自己手动去确认拨动与否,不过操作速度会比发送文字信息快一些。 (图源:雷科技) 微信收/付款码也能调用,这个我就不做展示了。 除了这些比较基础的功能,目前微信不支持的功能其实蛮多的,特别是稍微涉及个人隐私/财产安全的操作,比如给好友发送照片/视频,给好友/群聊发红包/转账,甚至连用微信打开公众号的特定页面也不支持。 (图源:雷科技) 作为对比,我顺便测了一下超级小爱。 可以确定的是,在没有接入微信A2A助手的情况下,各家厂商的手机助手同样能够调出微信扫一扫和收/付款码,在支付上还是很便利的。 不过信息是真的发不了,最远也就能进行到“打开微信”这一步。 (图源:雷科技) 按照业内人士的说法,目前荣耀Magic8系列、500系列和X70的全系列都支持微信A2A助手能力,其他厂商也在陆续跟进中。 不得不说,对手机厂商来说,这当然是好事。以前AI助手遇到微信就卡壳,现在至少能做一部分高频任务了。 对微信来说,这也不亏。它没有把核心权限完全放出去,又能避免自己在AI时代被说成一座孤岛。 更关键的是,这很可能是在给后面的微信Agent铺路。 先从发消息、打语音这种低风险动作开始,把厂商协作、权限边界、用户确认、风控流程都跑一遍。等用户习惯了,厂商也习惯了,后面再慢慢开放小程序、公众号、视频号、企业微信这些能力,才有继续往下讲故事的空间。 人人都想AI自循环 自Agent出现以来,人们就一直在琢磨打破孤岛问题的方法。 早在2024年11月,Anthropic就曾提出过MCP(Model Context Protocol)协议,这是一套统一的、标准化的通信协议,目的是让大模型能够安全、标准地向外部应用请求三种东西:提示词、资源和可执行工具。 MCP协议的存在,将大模型从一个聊天框,变成了一个能连接万物的智能助手。 问题在于,在MCP协议的架构下,大模型才是绝对的主体,外部应用只是被调用的工具。当用户所有的感知、交互、意图理解都在手机助手或别家的大模型里完成,应用自然退化成了底层的“服务API”。 (图源:dailydoseofds) 对于大厂来说,这种情况是不能被容忍的。 正因如此,你很难看到大厂主动去适配MCP协议。阿里和字节,大家其实都在往Agent方向冲,但态度高度一致:开放可以,先在我家院子里开放。 在这里面,阿里算是典型。 千问现在接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,能购物、点外卖、订机票、规划路,可以说是在把阿里全家桶重新串起来。 这条路很顺,因为这些能力本来就在阿里体系内。权限、支付、履约、客服都能串起来,不用天天跟别人谈判。 (图源:雷科技) 但问题也在这里。 它很强,但强在阿里自己的生态里。你让千问去深度调用微信、抖音、美团,难度马上就上来了。不是模型不会,而是别人未必愿意给。 字节也差不多,豆包现在和抖音电商打通,用户可以在豆包里提购物需求,再完成推荐、选品、下单、支付;扣子负责Agent平台,可以查询、调用一系列字节系应用, 他们想让更多任务在字节的桌子上完成。 所以你会发现,大家嘴上都说Agent,实际走的都是生态内闭环。 阿里把阿里系接起来,字节把抖音系接起来,手机厂商看起来站在系统层,离用户最近,但偏偏离真实服务最远。 你懂的吧,就很难绷。 说在最后 你可能觉得奇怪,为什么微信开放A2A会受到广泛关注? 因为它给行业递了一个更现实的答案:大厂们不必互相攻击、互相排斥,也可以像公司之间发工单一样,由一个Agent把任务交给另一个Agent。 手机助手负责听懂你,微信Agent负责处理微信里的事,小程序负责完成具体服务,用户负责最后确认。 大家不乱越界,但任务能跑通,大厂的流量也没有受损。 要我说,这比“超级AI接管一切”现实得多。 (图源:雷科技) 当然,也别把这次开放想得太浪漫。 微信只是开了一个小口子,A2A也不是什么万能钥匙,它解决的是“能不能协作”的问题,不是“协作以后一定好用”的问题。 体验好不好,还要看模型够不够聪明,权限设计够不够清楚,支付确认够不够安全,出错以后有没有兜底。 至少目前来说,不少网友对微信本身的Agent表现还是不大满意的。 (图源:微博) 但不管怎么说,微信这次开门,给出的行业信号已经很明显了。 至于这扇门的后面是康庄大道,还是下一轮入口大战,就看各家厂商接下来准备怎么打了。 查看评论
大家好,千辛万苦总算申请通过,新人报道,有很多不懂的问题还望大家以后多多指教 10 个帖子 - 10 位参与者 阅读完整话题
乐死我了! 总算可以正常回答我的问题! 问它问题他至少用心思考回答,没有像之前那样降智严重了 有没有感觉到呢? 6 个帖子 - 5 位参与者 阅读完整话题
从昨天AT被封开始,我的Codex + CPA的号池就不太正常,老是思考思考就卡住,然后查了下 CPA的请求,发现有超过30分钟卡死的请求,以为是号不赶紧,于是花大价钱验证了手机号,都换成RT了,然而今天依然很卡,一个简单的问题老是思考半天,没法干活了,于是开始修锄头,现是把CPA升级到最新版本,然后查到官方有一个 [Codex 认证下使用 GPT 模型频繁卡死无响应】( #3530 ) 的issue, 然后官方给出了一个开启 WS auth的开关,立刻打开,刚开始好像整成了几分钟,但过了几分钟又卡死了,然后找同类的代理工具的issue,然后发现,反馈的好像都是亚洲同胞,然后试着切换了下代理,换成US的代理,结果速度终于恢复正常了 排查思路: 如果用Codex的,直接换US代理即可 如果用CPA的, 升级到支持 ws auth的版本, 然后开启 ws auth, 并且在服务器配置中配置一个US代理 之前都是这种几十分钟的卡死, 0 token消耗, 切换了之后就一些正常了 切换后: 各位佬快来试试吧 18 个帖子 - 15 位参与者 阅读完整话题
不知道是不是听到了我的许愿,上线了统计数据。 我没记错的话,之前 token plan 是没的,现在总算能看每天的数据统计了。 可惜没有缓存显示,不如 DeepSeek 后台全。 2 个帖子 - 2 位参与者 阅读完整话题
https://file.icve.com.cn/file_doc/KaBLAEAo/4hdr0WKJ.mp4 这游戏总算能凑合跑起来了 但这西班牙内战和事件链太粗糙了 还得重置一遍 不知道那个男人今晚来不来?手上的Plus号死的差不多了 今天又死了好几个 1 个帖子 - 1 位参与者 阅读完整话题
刚才运行了自动开通机器的脚本,挂了一个一个小时总算是把机器开出来了,没选太高的配置,但是为啥我这个放行端口的这个是灰色的啊,有什么说法吗? 7 个帖子 - 7 位参与者 阅读完整话题
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
奋战 2 个多月总算完成 AI Agent 的学习并开发了多智能体 AI Agent ,生产要素大部分都达到了,RAG 也有,剩下长期记忆和多模态,再构思几个场景来做就差不多了,因为我是用项目驱动迭代来学习。但从近期应聘的情况来看不容乐观。 周一开始在 BOSS 直聘刷了一圈发现应聘难度不比传统后端小,全部送达未读或者已读不回。首先是学历和背景。没有双一流、大厂经验和硕士学历很难应聘,中小企业工作经验应聘难度同样很大。 第二是技能要求难以捉摸。一边要求多智能体开发,却因为没有用 Dify/CrewAI/AutoGen 被淘汰,我用 langgraph 构建,招聘方说技术不匹配,实际上都差不多。RAG 也一样,用 milvus 没用到 chroma 就不合适,反正我是一头雾水,一个项目搞一堆向量数据库有啥用,一个组件能解决问题就行。 第三是垂直经验。当前已有部分企业要求垂直经验,1-3 年/3-5 年/5-10 年智能体开发经验,甚至大模型开发经验都出来了,表面上说个人项目也可以实际还是只承认企业项目。 所以后端开发想转 Agent 是要谨慎考虑。
先说个结论,爆杀 Gemini CLI,Google 总算有一个能拿的出手的产品了。 更新:Gemini CLI 被 Antigravity CLI 取代了 An important update: Transitioning Gemini CLI to Antigravity CLI - Google Developers Blog 大伙的 Gemini Pro 总算有用武之地了,至于 Gemini 3.5 Flash 的质量,由于还在跑,只能等睡醒再检验了。 登录 首先登录同样走 Google OAuth,不会主动回调,需要你粘贴授权码到终端。 目前有个问题,每次执行 agy 都需要重新登录,卡在这一步 ctrl+c 无法中断,需要换 ctrl+d。 权限 命令执行权限还是老一套,而且可选范围很窄,只有 request-review 每次都要手动允许 always-proceed 全部放行(嘻嘻,看我删不删你盘就完事了! ) strict 没试过。 /config 进入设置,找到 /Tool Permission 选择 always-proceed。 /artifact OK,开始执行任务吧,依旧是 Codex Rust 源码测试。 执行过程中,发现底部右侧多了一行提示(见图片)。 输入 /artifact 可以看到有俩文件,这和 spec-driven 驱动方式很像,会根据你的任务先生成文档,然后根据文档执行。 /config 中也有一处相应的配置,我选择 agent decides /tasks 我喜欢这个设计,单独把执行过后台任务全都整理到了 /tasks 中! Codex 快抄一下,把你的 /ps 换成这个。 任务执行到一半,发现没有输出了,根据模型的回复和底部右小角多的 /tasks 提示查看: 可以看到模型之前执行了好多次后台任务,可以通过键盘的箭头上下切换,Enter 看输出结果 状态提示 执行后台任务时,也显示任务状态,正常执行的时候有,到了后台任务却没了,有点怪异。 光秃秃的一个回复,提示不够清晰,要不是底部有一个 /tasks 我都不知道干嘛,被已有的 TUI 惯坏了。 见左下角位置对比 UI/UX 默认所有工具调用,读写都折叠显示,我喜欢这个设计。 CLI 就干 CLI 的事儿,执行过程中发生了啥我并不想看。 当然也可以 ctrl+o 展开。 额度 /usage 查看用量,依旧是每个模型单独分开计算用量,数据分为五个阶梯,没有精确的数字。 CLI 和 App 共用额度,好处是现在 CLI 也能用 Claude 模型了。 但 Gemini Pro 的额度并不高,而且显示存在 bug,20% 但已经无法继续了。 未完待续…… 9 个帖子 - 8 位参与者 阅读完整话题