Changelog [v1.0.10] - 2026-05-19 文档更新 根 README 全面升级至第 7 代架构文档:gen/ 隔离层、sqlc 数据层契约、DAO 测试体系 tikrok-services README 全面重写:数据访问层架构、事务模式、测试分层、错误处理 [v1.0.9] - 2026-05-18 sqlc 数据层重构(第 7 代核心) sqlc.yaml 配置优化: emit_interface: true 、 query_parameter_limit: 3 、 emit_pointers_for_null_types: true 41 处 SELECT * 全部替换为显式列名 DAO 构造器从 *db.Queries 变更为 db.Querier 接口,实现 Mock 可测试 消除 200+ 处 sql.NullX 手动转换代码 20 个 DAO 实现 WithTx(*sql.Tx) DAO 事务抽象 测试基础设施 5 个服务生成 MockQuerier ( gomock + mockgen ) 63 个 DAO 单元测试:auth(26)、order(19)、tunnel(19) 创建 pkg/testutil/sqlctest 包:轻量 Docker MySQL 测试助手 2 个集成测试: HandlePaymentCallback 事务原子性验证 9 个 Bash API 测试脚本覆盖全 API 面 错误处理 所有 GetByID / GetByEmail 将 sql.ErrNoRows 封装为 BizError ( ErrNotFound ) 逻辑层不再处理原始 sql.ErrNoRows [v1.0.8] - 2026-05-17 gen/ 接口隔离层 创建 gen/ 目录:5 个纯 RPC 接口模块( auth/user/order/product/tunnel ) 每个 gen 模块仅 15 行 go.mod 、~2.7K go.sum ,不含业务代码 修改 proto go_package 指向 gen/ 模块路径 更新所有服务导入路径从 app/*/kitex_gen 指向 gen/* Gateway 消费方只依赖 gen/* ,不接触 app/* gen/ 模块可安全对外发布(不泄露业务实现) Docker 部署优化 切换为预编译二进制多阶段构建 版本管理自动化( VERSION 文件 + build-images.sh ) Docker Compose 版本自增 + 旧镜像清理 [v1.0.7] - 2026-05-16 多模块工作区重构 7 个子模块独立 go.mod / go.sum ,由 go.work 统一管理 消除内部 replace 依赖,模块可独立构建 BizError 实现 GRPCStatus() 方法,支持 gRPC 错误码透明传输 修复所有记录创建时缺失 CreatedAt 时间戳的问题 测试脚本错误码断言统一修复 [v1.0.6] - 2026-05-15 GORM → sqlc+Goose 迁移 移除 GORM ,替换为 sqlc 代码生成框架 + Goose 迁移工具 创建 22 个数据库迁移文件( 00001-00022 ) sqlc 生成类型安全的数据访问代码( Queries 结构体) 降低默认免费配额限制 提交全部 sqlc 生成代码及查询文件 Code Review 修复 Uber Go 风格指南修复:goroutine 生命周期、全局变量、切片容量 安全修复:内部 API 认证、IDOR 、资源泄漏、CORS 泛型工具函数 + 100 Go Mistakes 修复 连接泄漏、并发安全、Context 传播、Etcd 锁重构 Jeepay 子模块引用更新(连接泄漏修复) 订单数据流修复、静默错误处理、种子数据补充 [v1.0.5] - 2026-05-14 生产部署安全加固 Vault 加密敏感配置 微服务角色分离 MySQL 自动备份 Ansible 集成 tikrok-services 微服务部署 流量计费链路完善 HandleTrafficReport / ReportTraffic / Heartbeat 持久化 内部 API 和流量上报路由注册 ServiceConnector 统一管理 gRPC 连接 Gateway 精简重构 删除 SQLite 存储层,容器化部署 删除 payment/sso/sse 子系统(迁移至 tikrok-services ) 删除业务逻辑 handler 和中间件(迁移至 tikrok-services ) 重写 gRPC 客户端,使用 HTTP gateway 替代直接 gRPC 调用 [v1.0.4] - 2026-05-13 安全与稳定性 修复管理员端点 403 和列表返回 null 的问题 修复 API Key 认证和令牌失效( Logout 递增 TokenVersion ) 修复 MySQL 保留关键字 key 导致查询失败 修复 API Key 创建时零日期 MySQL 拒绝 添加 Gin 中间件 X-API-Key 认证 更新 Swagger 文档补充缺失路由和 definitions 后端全部缺失的 gRPC RPC 方法实现 [v1.0.3] - 2026-05-12 微服务功能完善 HTTP Gateway 从 Hertz 迁移到 Gin 框架 9 个 Bash API 测试脚本(认证、密码、API Key 、配额、隧道、管理后台) etcd 服务发现修复:Docker 环境地址注册 Swagger 文档和端到端测试基础设施 Casdoor SSO 集成( OAuth/OIDC 回调、用户同步) ServiceConnector 统一 gRPC 连接管理器 [v1.0.2] - 2026-05-11 平台基础设施 微服务集群 Docker 容器部署( 12 容器 5 层依赖) 商品与授权系统设计 Goose 数据库迁移任务和部署步骤 etcd 服务实现自动重连与性能优化 修复 CRITICAL 和 WARNING 级别安全问题及代码缺陷 [v1.0.1] - 2026-05-10 项目全面清理与 gateway → tikrokd-server 重命名 SDK 重构:移除所有非共享网络库包 完成 SDK 模块化,提炼 tikrok-sdk 核心包 [v1.0.0] - 2026-05-09 初始架构定型 第 6 代 gRPC + Gin 微服务架构 SDK 模块化( quic/protocol/tunnel/mux/discovery/pool/metrics ) QUIC 数据面与服务端( tikrokd-server ) 客户端 CLI ( tikrok ) etcd 服务注册与发现 MySQL + Redis 持久化 JWT + API Key 认证 Prometheus + Grafana 监控 Ansible 自动化部署 36 项 E2E 自动化验证 Jeepay 支付、Casdoor SSO 集成
想想自己来时的路,饱经沧桑。 当然,这也是WeFlow和CipherTalk的来时路。 当自己在2023年3月21日的凌晨,重新注册了自己的GitHub账号(以前的密码忘记个屁的了) 当时只是逛GitHub,直到24年才开始有一点点上传的数字垃圾,上传的也不多,因为在学校只能接触一点点仅有的内容,直到后面ChatGPT的出现,改变了我的GitHub,初级ChatGPT也帮助我贡献了一些东西,在24年到25年中旬,也一直在做一些内容,不温不火,最多的star也就14,但在25年年底,在逛GitHub的时候,看到了ChatLab这个项目,感觉很好玩,就顺藤摸瓜找到了echotrace这个项目,当时用起来是非常的难受的,因为限制还是挺多的,对大多数小白不友好,更浪费开发者的时间。 第二天,正是周五的晚上,我就突发奇想,要是重构整个软件,岂不是更好,尽量减少小白的小问题,于是,开启了通宵达旦的重构计划,当时为了重构,资费买了两百多的AI额度,能够帮我快速重构,经过了一天两夜的努力,试用Electron+node.js进行了软件逻辑上使用,也因此认识了CC和xuncha(从此过上了没羞没臊的生活)。 第一次提交,发生在4个月前,从此,命运的齿轮开始转动! 当CipherTalk正常运行后,显示出主页面的时候,那一刻的心情,简直无法言语,紧接着和CC他们去分享,聊了聊后,我们决定分为两个软件进行开发,也正是因为这样,两个神级软件开始疯狂散布。 经过我们的不懈努力,解决了好多的难题,也让大家用上了好用的软件。 刚开始,CipherTalk是半开源的,因为我看到了有多少人倒卖echotrace,这是国内开源环境的劣势,无法言喻,但是WeFlow坚持全部开源,也因此,我在26年的某一天,将CipherTalk完全开源,两个项目也都走上了各自的道路,WeFlow实现实时读取WX数据库,而CipherTalk则使用缓存数据库来模拟实时。 我们对多个技术难点,通宵进行了攻破,那些日子,真的非常的充足。 后来,在AI时代的洪流中,CipherTalk接入了AI摘要功能,帮助不少用户对自己的工作或者琐事进行总结摘要。 但出于本人工作,工资极低的情况下,收入甚微,并且维护开源项目很累,那天终于,我做出了一个后悔终身的决定,私密CipherTalk,不在维护,那一夜,项目的2279 Star,消失殆尽。 仅仅只经过了一个晚上,经过其他开发者的劝解,还是恢复了公开,这也意味着,Star将要重新开始累积。 目前,300+的Star,也是支持我的用户在贡献,当然,我也恢复了CipherTalk的维护,当然,这次的公开,也遇到了不少志同道合的朋友,有提供GPT账号的,也有提出PR的。 非常感激广大用户朋友的支持,虽说工资低,但是这种开源精神,让我感到无比的骄傲。 再后来,软件中对于AI的支持,也日益强大,加入了自编排Agent,MCP(基于贡献者的PR进行了重构,因为PR提交的只在可以用的阶段),API等功能。 当前软件也进行了多轮的优化,出了50个版本,也涵盖了Windows&Mac双平台,WeFlow更是支持了Windows&Mac&Linux三平台,大部分的代码,都由我一人维护,很累,很迷茫,不知道这些以后在我的人生中会扮演一个怎样的角色。 只希望,自己以后能飞黄腾达,开源精神永存,那些倒卖狗死去吧,早点投胎做猪! 很感谢你看到这里,当然,一篇小小的短文,并不能清晰的描述我的开源路,我也只记得遇到了CC、xuncha、地瓜、Falcon等众多小伙伴,我们之间没有KPI、没有工作上的牵绊,我们皆为开源社区做贡献(当然,也希望能够借助开源项目让自己能够找到好的工作,这也是我的一个私私心吧,希望如愿以偿) ——Forrest 6 个帖子 - 4 位参与者 阅读完整话题
什么是Agent? 在开始讨论前,我们需要建立一个相对统一的共识,那么就先需要给Agent下一个定义:Agent并不是聊天机器人,而是一个可以 自主完成任务 的 软件系统 。 软件系统很好了解,就是指由多个相互关联的软件组件组成的 集合体 ,它作为一个整体在计算机硬件上运行,以实现特定的功能或解决复杂的问题。 不同于单个程序( 比如我们使用的linuxdo pro脚本 ),软件系统是一个更宏大、宽泛的概念。它不仅包含可执行的代码,还包括配置文件、系统文档、测试记录以及用户手册等一系列配套资源。通常情况下可以划分为三类系统软件、支撑软件和应用软件,而目前的一般语境下的Agent系统就是属于应用软件的范畴( 当然也有完全基于AI的操作系统的概念提出,但是我自己觉得还是太远了点儿 )。 那么何谓自主?从工程定义来看,自主性(Autonomy)是指系统在 无需人类实时干预 的前提下,能够闭环完成“感知环境 → 制定决策 → 执行任务”的能力。如果仅仅以“减少人为干预”为标准,那么当前许多工作流增强工具(如各类对现有 LLM 或 Codex 进行封装优化的插件)似乎都在无限逼近这一状态。但仅凭于此,就能称其为“完全自主”的 Agent 吗? 并非如此,自主还有一条最重要的要求就是 达成目标 ,这个可谓是难住了绝大多数的Agent。因为很多Agent,尤其是用来Coding的Agent,完全不能达到我们的目标,简单来说就是我想的和你做的完全不一样,即便是有对应的文档去约束,也并不会有很大的提升,其实很多时候都是Agent在猜你想干什么。 那么我们只能从Agent的结构来优化,以便达成我们的目的。 一般情况下,一个完整的Agent系统主要由以下五个核心层级构成: 模型层 (LLM): Agent的主要认知中枢,负责理解人类自然语言的意图、进行逻辑推理以及生成决策。 记忆层 (Memory / Context): 负责状态管理。包含短期记忆(当前任务的上下文记录)和长期记忆(历史交互、经验总结、存在向量数据库中的业务知识,很多企业其实还停留在这一层),使其能在多轮交互和长时间任务中保持连贯性。 规划层 (Planner): 负责将复杂的大目标拆解为可执行的子任务(Sub-tasks)。常见的技术路径包括 ReAct(Reason + Act,即“思考+行动”循环,现在基本上使用的都是这个,主要是稳定)、思维链(CoT)等。 工具层 (Tool / Skill): Agent 的“手脚”。允许 Agent 通过 API 调用外部系统,例如搜索网页、读写文件、运行代码、操作终端,或者调度第三方办公软件(如 Jira、Slack、GitHub)。 执行层 (Executor): 按照规划层的步骤,调用对应的工具进行实际操作,并接收环境反馈(Observation)。如果报错,它会根据反馈不断调整策略重试,直至任务完成。 看起来是没什么问题,但是我们稍微对比一下人类的思考过程:在Agent中,LLM虽然被称为“认知中枢”,但在人类认知中并不存在一个单独的模块负责理解、推理和生成语言。人类的语言理解、逻辑推理、知识检索、情绪判断等是分布在多个神经系统中的,例如语言皮层、前额叶、海马体等( 并非在水字数,确信 )。 这么说来,LLM其实更像是一个 压缩后的认知模拟器 ,而不是一个真正的“大脑模块”。这也就是为什么我们的想法会和Agent的实际执行出现比较大的偏差,因为人类会想象会吃会喝会听会说,是建立在一个多模态的世界中,token能存储的信息还是太少了。( 那是不是说我们说话越伪人输出越规范,那么我接下来就要稳稳的接住你了 ) 那么话说回来,在后面的叙述中,我们必须放弃“要让 Agent 像人一样去领悟”的幻想。( 放弃幻想,准备斗争! ) 那么问题就出现了:既然Agent并不像人类一样思考,我们该如何设计Agent系统? 如果我们继续坚持“让LLM像人一样理解任务”,那么大多数Agent项目都会陷入一个非常典型的困境: Prompt 越写越长,但效果并没有明显变好。 ( 实际上对于上下文长的,比如没有降智前的Claude-4.6-Opus 1M版本,对于长上下文的理解其实是非常不错的,但是稍微上下文短一点的,比如Gemini-3.1-Pro,还没聊多久就会直接注意力漂移,其实我更喜欢叫注意力涣散,因为真的很贴切 ) 这是因为LLM的能力本质上是 概率语言模型 ,它擅长的是模式匹配,而不是稳定的任务执行。( 比如输入同一段Prompt,得到同一段思考路线的可能性很小 ) 因此,如果整个系统完全依赖LLM的“理解能力”,结果往往就是:Agent在 猜测用户的意图 ,而并非 执行明确的任务 。( 我不猜,我会先搞清楚,避免文档爆炸… ) 这也是为什么很多 Coding Agent 在实际使用时会出现一种非常奇妙的体验: 我让它做 A,它最后给我做成了 B。 甚至有的时候南辕北辙做成了-A,这时候我们会因为蠢笨的模型而急血攻心当场嘎掉(bushi)。 模型不够聪明是一方面, 任务本身没有被工程化定义 则是另外一方面,这就是Agent设计的问题。 因此,可以得出结论,在真正可用的Agent系统中, 不要试图让Agent理解一切,而是要限制Agent的理解范围 是一个非常重要的设计原则。 从这样的角度看来理解,那么从Prompt Engineering到Prompt Programming到Tool Augmentation到Agent Engineering到Context Engineering到Workflow Engineering到Capability Engineering最后目前到Harness Engineering,这一连串的流程就是将LLM从一个近乎无限发散的系统约束成为一个可靠的能正常工作的系统。 为什么我会需要一个Agent? 在明确了Agent是什么以及我们需要做成什么样的Agent系统之后,那接下来就是一个相当重要的问题,我们为什么需要一个Agent? 无法控制的成本 在这里先偏个题,先介绍一个内容,索洛悖论(Solow Paradox)。 1987年,诺贝尔经济学奖得主罗伯特·索洛曾断言:“我们到处都能看到计算机时代,唯独在生产力统计数据中看不到。” 然而,在后面的美国的互联网泡沫极大的带起了生产力发展,也带起了十几年的互联网公司的高速发展,形成了独有的互联网经济。而现在的AI和1987年的互联网也是有一定的相似之处的。 正如我们前面所说的,LLM本质上是一个“高维数据压缩后的认知模拟器”,而非严密的逻辑引擎。这种基于概率的生成机制,直接击中了商业应用中的致命痛点:极高的边际成本、人类验证成本和系统改造成本。 将AI的准确率从80%提升到95%可能只需要几个月,但从95%提升到99.9%(至少需要达到企业级可用标准)却需要指数级的工程投入,一般企业根本没有对应的盈利来覆盖这个成本。 AI生成一篇报告或一段代码只需几秒钟,但其中很大概率潜藏着幻觉(Hallucination)或细微的逻辑错误,如果聘请专业人那么为了 审查和纠错 所花费的时间,这就抵消了AI自动生成所节约的时间,也需要花费很高的成本。而如果采用AI review,有可能出现越审查越分析效果越差的问题。而在医疗、法律、金融等容错率极低的行业,这种验证成本甚至高于纯人工。 孤立的AI工具(如网页版 ChatGPT 或独立的代码补全插件)很容易开发,但要将AI深度集成到企业极其庞杂、老旧的底层IT系统(如ERP、CRM、核心数据库)中,面临着巨大的工程阻力,大家维护过比较老旧的系统都知道,一旦稍微改动有可能导致的就是崩溃。( 即便是新的系统也很容易成为屎山,比如OpenClaw,每一次的更新都是稳定性的一次巨大挑战 ) 零和博弈的困境 并非所有的效率提升都能转化为真正的 GDP 或社会生产力大爆发。尤其AI擅长的很多领域,在宏观经济中属于 零和博弈(Zero-Sum Game) 。 Jevons悖论 :技术进步提高了资源利用效率,结果却导致该资源的总消耗量不降反升。 当AI让写邮件、做PPT、写公关稿变得异常简单时,结果往往不是员工每天多出4 小时休息时间,而是公司要求产出5倍数量的邮件和PPT。AI导致了信息的通货膨胀,我们大部分精力被消耗在“用AI制造垃圾”和“用AI总结别人制造的垃圾”这种无意义的内卷中。 而很多AI本该有的产能在红海中的互相争夺中消耗了大量,很多AI应用被投入到广告定向、高频交易、SEO优化等领域。这些技术或许能帮A公司抢走B公司的利润,但从全社会宏观视角来看,其实并没有创造出新的增量价值,仅仅是提高了竞争的基线门槛。 鲍莫尔成本病(Baumol’s Cost Disease) :由美国经济学家威廉·鲍莫尔(William Baumol)在 20 世纪 60 年代提出的一种经济现象。由于服务业 (如医疗、教育)的生产效率难以提升,为了与制造业争夺人才,其工资必须跟随社会整体水平上涨,从而导致这些服务变得越来越贵。 AI可能会让数字内容的生产成本趋近于零,但经济中不可被 AI 替代的部分(如线下服务、精密制造、实体护理、物流配送)的相对成本将显得越来越高,从而拖累整体经济的生产力增速,这一点目前在国内不是特别的明显,但是在阿美莉卡尤为明显。 讲到这里,简单总结一下就是AI的确让我们局部跑得更快了,但在整个经济大盘里,我们大概率只是在原地打转甚至跑得更累。因为本质上盘子没有做大,只是开始了互相兼并,大公司兼并小公司的业务,中小公司越来越不好过,于是就出现了明明程序员的生产力超级爆发,但是大家开始纷纷失业。 技术重构的“时滞效应” 历史一再证明,通用目的技术(现在就是GPT、Claude等,过往如蒸汽机、电力、计算机)要转化为生产力,往往需要长达数十年的“时滞(Implementation Lag)”。 在19世纪末电力就被发明,但直到20世纪20年代才带来工厂生产力的爆发。因为早期的工厂只是简单地把巨型蒸汽机换成了一个巨型电动机,依然使用旧的物理传动轴;直到工厂主意识到电可以被分割为小型电机(分布式驱动),等彻底重构了工厂的流水线布局后,生产力才真正飞跃。 今天的企业使用AI,很大程度上就像“用电动机替换蒸汽机”,只是把AI作为一个单点工具塞进旧的工作流中(比如让客服人员旁边挂一个AI助手,而实际我们也是这么做的),并且AI的推广也非常受限于这个公司决策者的眼光。真正的生产力爆发,需要彻底拆解并重构企业的组织架构和业务流程(Workflow),这涉及巨大的沉没成本、部门利益博弈和员工抵触,绝非朝夕之功。 所以初创小公司在本次AI浪潮中更容易成功,因为以AI为中心设计的软件和工作流就是比传统的工作流要高效许多。 难以触及的物理世界 AI要想真正产生颠覆性影响,就必须触及核心数据和改变物理世界,但这恰恰是目前各大公司的雷区。 高价值的商业决策需要极其核心的内部数据(财务、用户隐私、战略机密)。受限于GDPR等数据保护法案以及对数据泄露的恐惧,绝大多数大企业和政府机构都在物理隔离AI,甚至禁止员工将核心数据输入给外部大模型。没有高质量的私有数据喂养,AI对业务就只能做表面的文字游戏。( 所以之前有佬友问我未来需要什么能力,我就说一定要了解业务,了解业务非常的重要 ) 当然也存在本地模型微调来服务于本地的方式来完成需求,但是这条路远没有听起来那么顺畅。部署过本地模型的佬友都知道,只是本地单机单人使用部署还算是比较简单的,但是想要一套给整个企业使用的本地部署就是一件非常困难的事情。 首先,私有化部署的门槛高得离谱。 且不说动辄数百万的算力采购成本,光是找到既懂公司业务又懂模型微调的人才,就可以让多数传统企业的CIO挠破了头。 更尴尬的是,假设你费尽心思把内部财务数据和客户档案喂给本地模型,调出来的东西往往还不如直接用GPT的效果好。开源模型与闭源模型的差距一时半会还是难以逾越的。( 还是期待DeepSeekv4的开源可以追上国外闭源大模型 ) 其次,物理世界的反馈闭环真是太难打通了。 目前的AI主要爆发在“数字世界”(文本、图像、代码),但人类社会的基石是“原子世界”(农业、制造业、能源、实体供应链)。机器人技术(具身智能)的发展远落后于大语言模型。只要AI还没有真正长出能在物理世界中精确执行复杂任务的“手脚”,它的生产力影响就会被严重限制在第三产业(服务业/知识产业等)里面。 AI写段代码错了无非报个bug再改,成本近乎为零。但在物理世界里,AI控制机械臂抓错一个零件,可能就是几十万的设备损毁;AI误判一个农业灌溉指令,毁掉的可能是一季的收成。错率的天壤之别,决定了AI在物理世界的渗透速度注定是数字世界的十分之一甚至是更低。之前去东莞的厂子和那边的老板来聊天,大部分都是用的传统方案,本质上还是之前智能化、自动化的延续。 很多时候并不需要一个Agent 在长篇大论探讨了这么多AI的局限和宏观困境后,我们不可避免地要面对一个极其现实的结论: 在当前的绝大多数业务场景中,你其实根本不需要一个Agent。 当我们手里拿着Agent这把闪闪发光的“智能锤子”时,看什么业务都像钉子。但工程的本质永远是成本与收益的博弈。 如果一个任务是高度确定性的、有明确规则边界的(比如定时拉取某个接口的数据、按照固定格式生成Excel报表、或者对数据库进行简单的增删改查),写一个传统的Python脚本、配一个Cron job,或者直接用现成的RPA工具,不仅边际成本几乎为零,而且能保证100%的执行确定性和毫秒级的延迟。 相比之下,如果我们非要强行引入一个Agent去执行这些规则明确的任务,你不仅要支付昂贵的Token费用,要忍受大模型的推理延迟,最要命的是你还得时刻提防它突发发神经,偏离原本极其简单的执行逻辑。但是目前的很多做决策的人并没有意识到这一点,因为他们自己就没怎么用过LLM以及Agent。 在真实的商业落地中,“可预期性”往往比“聪明”更重要。Agent最大的魅力在于处理“模糊意图”和“探索非结构化环境”,但这恰恰也是它最大的稳定性软肋。 为了让一个基于概率生成的Agent表现得像传统软件一样稳定,开发者往往需要堆砌无数的Prompt、设计复杂的约束护栏(Guardrails)以及多重验证逻辑。费了九牛二虎之力,最后只是硬生生地把一个聪明的Agent逼成了一个极其低效、昂贵且脆弱的“IF-ELSE状态机”,这不就是杀鸡用牛刀? 所以,如果你的需求能用几百行清晰的代码、一条复杂的SQL,或者传统的API调用来解决,千万别上Agent。只有当业务中确实包含了大量需要动态决策、理解复杂非结构化上下文、或者需要跨越多个未知系统进行探索性规划时,才是Agent真正应该出场的时刻。 一味追求架构上的时髦,只会把原本只需要一辆自行车的确定性路况,硬塞给一台维护成本极高、方向盘还容易失灵的喷气式飞机,不要强行复杂化。( 这里推荐奥卡姆剃刀 ) OpenClaw带来的启示 在前面花了这么大篇幅给AI泼冷水、谈局限之后,你可能会觉得这篇文章的主旨就是“AI啥也不是,大家散了吧”。 但恰恰相反。 2026年春天OpenClaw的爆发( 我愿称之为龙虾狂欢 ),反而给了我们一个非常有意思的观察窗口:AI到底是如何从“工具”向“助手”过渡的。 国内厂商的反应更是异常疯狂,先是阿里云、腾讯云连夜上线一键部署服务,电商平台上“上门安装OpenClaw”的服务报价从499到1000元不等,深圳龙岗等地甚至出台了“龙虾十条”,对基于OpenClaw的“一人公司”创业项目最高给予大额支持。 这股狂热背后,OpenClaw到底做对了什么? 毕竟人们从来不缺会聊天的AI,缺的是能轻易接管工作流的AI。 ChatGPT爆发之后,市场上最不缺的就是“会说话的模型”。用户的新鲜感早就被消耗得差不多了。大家真正开始焦虑的问题变成了:你除了会陪我聊、帮我写、帮我总结之外,到底能不能替我把活干掉? OpenClaw的爆发,本质上踩中的就是这个情绪变化。它满足的不是“再来一个更聪明的聊天机器人”,而是“终于有一个东西可以轻松的接管我的操作链路了”。 这也是为什么它能引发比普通Agent框架更强的讨论度。( 当然少不了我们国内营销号的卖力炒作 ) 但问题来了,既然OpenClaw这么牛,那前面那些论断是不是就可以收回了? 没那么简单。 首先是 安全失控 。OpenClaw能操作你的电脑,就意味着它也能删掉你的邮件、文件,甚至被恶意提示词劫持后做出你完全意想不到的事。工信部NVDB在2026年2月就发布了OpenClaw安全风险预警,明确指出其存在信任边界模糊、权限管控缺失、易被攻击劫持等严重问题。奇安信的监测数据显示,截至1月29日,全球范围内暴露在公网上的OpenClaw资产总数高达15039个,其中中国以2990台暴露设备位列全球第二。 这意味着数千台服务器处于“中门大开”的状态,攻击者可以轻易接管实例、窃取API密钥、执行远程命令。( 全成肉鸡了 )这恰恰印证了AI在物理世界和系统层的渗透,容错率极低,但安全基础设施完全没跟上。( 利好网安? ) 其次是 企业落地撞上了“三堵墙” ,分别是认知墙、数据墙、生态墙。第一批部署OpenClaw的企业发现,它的底层任务调度优化空间有限,长期记忆模块的原生能力不足,Skill生态的质量参差不齐。可能有一半的企业部门已经进入规模化使用阶段,但真正敢把核心业务交给它的,少之又少。 更要命的是, OpenClaw自己也面临设计哲学上的根本困境 。它要求用户明确告诉它用什么Skill、文件放哪、Shell怎么跑,本质上还是“你给工具+你全程盯着”的模式,那时候站里面到处都是养龙虾的攻略,但是用户需要的是一个助手而不是小孩,我需要到手即用而不是需要高质量token和大量时间去养。 而技术社区里最多的抱怨是版本迭代引入稳定性问题、issue堆得越来越多、响应速度跟不上。( 屎山堆得太高了 ) 当一个系统的复杂性超出了工程团队的可控范围,“概率性智能”的副作用就会指数级放大。( 幻觉叠加幻觉最终造成任务目标严重偏移 ) 所以OpenClaw给我们的启示就只有一条:它证明了用户对于一个通用级的助手是多么的需要。 但要真正让AI产生生产力革命,光有能用的Agent远远不够。你还需要与之配套的安全基础设施、组织架构重构、以及整个社会对新工作范式的适应能力。OpenClaw只是这场漫长重构的第一块拼图,后面还有九十九块等着我们去补。说白了,它只是把AI的能力边界向外推了一小步,让我们更清楚地看到了下一步要翻越的山应该是什么样子的。 (猜测)LLM的下一代交互方式 原本这一节我写了很多,但是写完之后我还是发现有点局限于我自己的眼界了,于是我删除了自己写好的稿子,保留这一节打算请各位佬友集思广益,互相讨论。 究竟是要做成插件平台还是做成快应用平台还是完全自主进化的Agent? 写在最后 这一篇可能写的比较多杂,写的时间也是比较长,但是我还是决定发出来供大家讨论一下。 目前AI应用的发展其实已经隐隐看到了瓶颈,因为Agent自从提出来之后到现在基本上没什么很大的发展,不管是什么各种新概念的提出来大家都会感觉没有质的提升,一年前的茫然可能到现在还是比较茫然,并且更重要的原因还是大量的企业没有动力去更换自己的固有工作流,所以这个出清的过程将会是相当漫长的。 动动你的小手,将这篇文章链接直接糊到你老板脸上( 不太建议这么做 ),免去你大部分的解释时间~~ PS:发在搞七捻三就是本文不构成任何开发建议,仅作公开讨论,请各位佬友见仁见智。( 叠甲有点晚了好像 ) 12 个帖子 - 5 位参与者 阅读完整话题
26年1月1日,元旦都没过,开始打磨简历,做项目,经历了10几天的鏖战(工作日每天一到两面,也是有了米哈游,shopee等等大公司和外企的面试)光速拿下1 offer(全程被推着走,没办法甲方爸爸相中了),月底直接主动lastday,2月1日直接丝滑过渡到新的外企,后面也是割掉了另一家外企的面试(好好准备应该可以过) 先抛出两个问题 上家兼职合同,没交社保(预计能拿2w多?),然后离职后又多发一个月工资(现在想要回去–也是不正当收入,起诉我的话也要给),所以我先下手为强。避免仲裁过了1年时效,但是目前异地,只能线下仲裁立案,想请个律师在上海,这样既能送材料委托立案(省路费),还能全包了,感觉假律师很多,都是层层外包,各位有没有渠道的? 未来形式一片大好啊,因公顺路去hk办了港卡,自己也有充足的时间学习和wlb,但是社交总是缺少,除了每周一次和同事玩玩羽毛球,剩下时间不知道去哪,虽然依旧特别受欢迎,但是真正的社交圈还是太小了,周末只能自己去看看海,也找不到什么痛点,已经想提前布局自己的事业了,想想我10几天就光速下一家,应该还是有些潜力,但是没什么方向 3 个帖子 - 1 位参与者 阅读完整话题