有些ai站点不稳定,时好时不好,一堆公益/分享的api key不知道现在是否可用,不停修改配置切换测试属实头疼,干脆弄了个html单文件小工具,快速验证 总结 (点击了解更多详细信息) 6 个帖子 - 5 位参与者 阅读完整话题
问题是这样的: 我们最近在测试时候发现一个问题,在Dify中通过Prompt构建一个了一个agent,Prompt做了角色定义,行为,工作流程,输出的相关约束,但是又一次偶然的机会对接错了API,发现不加这些prompt,模型也可以很好的按预期进行输出。这样就带来了一个问题,我们以为可以有效约束模型输出的各类手段,怎么能确定其哪些部分是真的有用,哪些是过度工程化或主观的感觉。有没有一个这样的可以对包括Prompt和Skill这些手段有效性进行benchmark和测试评估的手段。 3 个帖子 - 3 位参与者 阅读完整话题
用了一年多的 cc,也使用过了 codex、cursor 等工具,引入过 trellis 等工具 但落地的时候仍会出现代码质量不可控的情况 一方面是需求澄清的不到位,也有自己提示词写的不好的原因 结果是 cc 乱写一通 现在业内有没有方案或者案例,管理整个开发的生命周期 能打开开发过程,针对性的评估某个环节的质量,支撑后续的优化与调优 阅读了下面的大佬帖子: 我是怎么用Codex嗨大了的? 感觉还是需要一套自上而下的方法论支撑,再去构建自己的开发平台 这个方向会更好一点 3 个帖子 - 2 位参与者 阅读完整话题