有效性 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-08 13:25:30+08:00 · tech

有些ai站点不稳定，时好时不好，一堆公益/分享的api key不知道现在是否可用，不停修改配置切换测试属实头疼，干脆弄了个html单文件小工具，快速验证总结（点击了解更多详细信息） 6 个帖子 - 5 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-05-26 16:05:54+08:00 · tech

问题是这样的：我们最近在测试时候发现一个问题，在Dify中通过Prompt构建一个了一个agent，Prompt做了角色定义，行为，工作流程，输出的相关约束，但是又一次偶然的机会对接错了API，发现不加这些prompt，模型也可以很好的按预期进行输出。这样就带来了一个问题，我们以为可以有效约束模型输出的各类手段，怎么能确定其哪些部分是真的有用，哪些是过度工程化或主观的感觉。有没有一个这样的可以对包括Prompt和Skill这些手段有效性进行benchmark和测试评估的手段。 3 个帖子 - 3 位参与者阅读完整话题

vibo coding 一个全新的项目，如何设计一套系统 or 模式评估每轮会话的有效性

LinuxDo 最新话题 · 2026-05-13 17:32:03+08:00 · tech

用了一年多的 cc，也使用过了 codex、cursor 等工具，引入过 trellis 等工具但落地的时候仍会出现代码质量不可控的情况一方面是需求澄清的不到位，也有自己提示词写的不好的原因结果是 cc 乱写一通现在业内有没有方案或者案例，管理整个开发的生命周期能打开开发过程，针对性的评估某个环节的质量，支撑后续的优化与调优阅读了下面的大佬帖子：我是怎么用Codex嗨大了的？感觉还是需要一套自上而下的方法论支撑，再去构建自己的开发平台这个方向会更好一点 3 个帖子 - 2 位参与者阅读完整话题

/tag/有效性