大大小小陆陆续续的买了几家的CodingPlan了 Kimi Minimax Codex 以及DeepseekAPI 还有OpenCode的Go套餐 用下来实际上感觉不出太大差距 除了Minimax-2.7 想问问佬友们自己在Vibe Coding的过程里都是用的什么模型,具体体感如何?各家的优势缺点都是什么? Minimax在2.7的时候订阅了他家极速版 说实在的2.7真有点捞了,基本上那段时间里写代码(CC)就是在前端-怎么改都不如意 要么一堆bug与后端-打不开,编译失败 然后骂他 然后循环。 换了Kimi之后(2.6)其实也没感觉多好用,而且感觉用了minimax之后导致我的vibe热情都下降了,买了199套餐 甚至用不完。。 但是,kimi客户端的 Agent集群以及数据库 还挺好用的 给龙虾来盯个盘查个数据 新闻 还可以 然后最近Minimax除了M3 我也直接用上了,其实感觉有点提升吧,至少是思考变长了 当然也变慢了 而且长时间任务,确实明显提升- 上次一个单纯的文档审计-我Vibe之前一个设计 搞了比较多的文档-审计了得四五个小时吧,虽然是我让他多想的(没开子代理 可能这也是原因) 以及家的龙虾我也用了,感觉各家的龙虾做的都不咋样 还不如飞书的龙虾好用- 写到这里突然想起来飞书的龙虾好久没用了 数据都没备份呢 不会给我删了吧。。。 再就是 GPT- 一个字-夯 Codex真的很好用,作为一个工作台,不只是用来Code- 虽然Minimax与Kimi的客户端也都可以做其他事情了-minimax的更像GPT 不过就是量少-也可能我的用法问题吧 其实我还是缺少些VibeCoding的经验或者完整流程怎么搞的。 Claude…一个只在中转与公益中用过的模型 Fable 5我现在就只用来审计过文档代码 还有给我构思过一款前端。 每太能感受到强大。 其实还有很多关于VibeCoding的一堆问题,等下次主题再问吧。 5 个帖子 - 2 位参与者 阅读完整话题
有点好奇,L3的用户量这么大,以及,作为一个社区论坛,出现一些违规不良言论是很正常的事,这么大的人为审核。总需要一些审核成本以及服务器运维成本吧,想知道是怎么解决的。目前没有看到l站有广告以及付费相关。 21 个帖子 - 20 位参与者 阅读完整话题
我目前并不会炒股,是因为近期的关门事件,才注册了neverless和bit,以及不知道审核有没有成的嘉信。 但因为我注册后目前还没急着去买加密货币然后入金,所以我在被neverless和bit的双重推销邮件攻击之后, 收到了neverless的休眠关户邮件 搞笑的是昨天的时候我在推特跟一个朋友聊交易所这个事,提到过股票和neverless与bit,结果今天就在我的推文回复个 有种被视奸的感觉 oyeah,5月20日注册的,四舍五入也快1个月时间了,有佬真的在用么,这软件没有网页也没有电脑端所以我基本没打开过,体验咋样 1 个帖子 - 1 位参与者 阅读完整话题
我也是豪气了一把 AxonHub Recharge LDC 500 累计收入 $31.5500 2 个帖子 - 2 位参与者 阅读完整话题
在有 ai 前,面对着往死里面压的工期,每天忙于低效的开发,以及对干不完的活的恐惧。有了 ai 后,开发任务再多,任务再难也没有了恐慌 ——— 但是要面对多出来的空闲时间不知道干啥的空虚感,以及被未来很可能被 ai 替代的焦虑,每天看着自己在各个渠道薅的大量的 tokens,也不知道自己该做点啥,还能创造点什么其他的价值。 4 个帖子 - 3 位参与者 阅读完整话题
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
想问一下,L站有提供搜索内容以及对应的评论的api接口吗? 6 个帖子 - 6 位参与者 阅读完整话题
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
最近刚来hz一家小公司,主要是在做无人机以及新能源相关的,但是实习期间基本不给核心工作,基本就是简单打打杂,也是双休不让主动加班,250/天在杭州基本上存不了什么钱,一个人大老远来到陌生城市,还要冒着被抓的风险,还很闲,每次晚上想起来就很伤心,很孤独。分公司也没多少人,后端同事们以及我的领导都在其他分部,哎,真的不知道实习的意义是什么,这已经是我第三段实习了,马上就大四秋招了,回到出租屋一个人孤零零的也不知道干什么,钱也没多少不干大手大脚的花,不知道各位小厂实习的佬们有没有类似的烦恼 16 个帖子 - 12 位参与者 阅读完整话题
请问一下,怎么申请成为L站的管理?是有什么要求以及申请渠道吗 5 个帖子 - 5 位参与者 阅读完整话题
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
如题,鼠鼠用codex++ 让它联网搜索信息以及采用多agent去完成一个任务,发现模型并没有使用内置的web_search工具以及子agent进程,而是退化到了curl.exe以及codex exec 这样的基础命令来做。想问问各位大佬如何排查 修复呢? 1 个帖子 - 1 位参与者 阅读完整话题
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
我们更新了隐私政策,以添加有关ChatGPT广告的信息,包括广告的工作原理以及用户管理广告体验的方式。 这些变更将于2026年6月22日生效。 在Free计划和Go计划中,可能会显示广告。 Plus、Pro、Enterprise、Business和Education计划不显示广告,也不影响ChatGPT提供的答案。 如果显示广告,它将明确显示有赞助者,并在视觉上与非广告的普通回答区别开来。 使用仅保留在ChatGPT上的信息(来自客户操作的广告、聊天环境等信息)显示相关的个性化广告。 您可以随时在“设置”中管理广告个性化。 您的个人信息和与ChatGPT的对话是非公开的,不会与广告商共享。 广告商无权访问客户的聊天、聊天历史记录、内存和个人信息。 广告商只接收有关广告效果的总体信息,例如总查看次数和点击次数。 在修订后的隐私政策生效日期之后继续使用ChatGPT,即表示客户同意修订后的隐私政策。 了解更多关于ChatGPT中广告的信息,了解更多关于隐私管理的信息,包括如何保护客户数据。 OpenAI团队 10 个帖子 - 10 位参与者 阅读完整话题
背景:java全栈,codex+5.4或者claudeCode + deepseek/opus4.6,以及一个清澈愚蠢的我。 需求:我想要的把一整个模块都能丢给ai去自动完成,完成一个比较大的长时间任务 这些东西基本是增删改查,实际上人工拆任务拆下来都不难。但真正生成往往不让我满意,出现的结果包括但不限于: 没有完成明确写出的任务 写的东西莫名奇妙超出边界 功能不理解怎么做就全删了 自己尝试造早就实现的轮子(CLAUDE.md中甚至就写了有这个模块) 非常糟心。 我先后尝试过: superpowers:执行结果是最好的,但慢的说实话还不如我自己写 ECC:感觉什么东西都要审批,太麻烦了 Speckit:目前感觉最好用的,但是很多东西审查的挺累,也是最明显理解一点点跑歪掉的,而且这个写plan的能力感觉忽高忽低的 CLAUDE.md现在用的是那个karpathy的CLAUDE.md+项目技术栈+一些索引,说实话感觉用处好像也不是很大,有问题ai还是不会停下问问题 4 个帖子 - 4 位参与者 阅读完整话题