目前让他审查了一个项目,等等看看质量如何?不知道能不能让我aha一下 对于还没用上的佬,可以试试让codex帮你配置 提示词: 帮我看一下我的claude code配置。我用的anyrouter渠道,帮我看一下为什么我一直用不了。你帮我顺便在 Linux do以及相关的社区找一下相关的一个资讯,看看怎么用上 claude fable 5。 我目前用anyrouter url,系统代理+tun模式,大家可以参考下 24 个帖子 - 21 位参与者 阅读完整话题
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”
666 想要fable看看我网页有没有bug 审查一下也不行啊 这模型限定范围太大了吧 和没有有啥区别 9 个帖子 - 6 位参与者 阅读完整话题
这还怎么用?上到计算化学的溶剂模型,下到简单的急性肾小管坏死,全部都不给我回答 1 个帖子 - 1 位参与者 阅读完整话题
程序员有 VS Code ,律师有什么? 合同审查靠 Word + 邮件来回传,尽调报告靠 Excel + 复制粘贴,证据管理靠文件夹命名规范。AI 只能当聊天窗口挂在旁边。 所以我们做了 AI Workdeck —— 一个面向律师和文档密集型团队的 AI 原生工作台。 核心功能: 项目管理 + 文件树:像 IDE 一样组织案件文档结构 AI Agent 层:流式响应、MCP 编排 文档在线编辑:集成 WPS WebOffice ,直接编辑 DOCX/XLSX 文档解析 & 生成:MinerU 解析、AI PPT 、TTS 证据链工作流:编号、关联、审查记录 隐私优先:私有化部署,数据不出内网 插件体系:可扩展的垂直场景面板 技术栈:Java/Spring Boot + Vue + Electron ,Docker 化部署。 GitHub: https://github.com/zeweihan/aiworkdeck 官网: https://www.aiworkdeck.com License: AGPLv3 ,商业授权可联系。 欢迎 Star 、Fork 、提 Issue 。
我记得好像是哈雷佬,但是翻完帖子,加上论坛搜索就是找不到,尴尬了 3 个帖子 - 3 位参与者 阅读完整话题
今天用any的api codex也弹安全风险这管的也太宽了吧? 居然还给我限速 8 个帖子 - 4 位参与者 阅读完整话题
openai于刚刚用官号发帖恢复此时,预计今天被封的账号大概率会被解封 大家都去申诉一下试试,这次解封后可能有一定的补偿? 我说希望openai补偿我一年pro( 5 个帖子 - 4 位参与者 阅读完整话题
IT之家 6 月 5 日消息,据 CNBC 今日报道,OpenAI 确认将遵守美国总统特朗普最新签署的一项行政命令 —— 在 AI 模型公开发布前允许联邦监管机构对其能力进行审查评估。 当地时间周二,特朗普签署了一项新的行政命令,要求建立针对先进人工智能模型的政府审查机制,以评估其安全性。 OpenAI 国家事务负责人乔治 · 奥斯本(George Osborne)在接受 CNBC 采访时确认,公司将参与这一自愿性质的安排。“我们向各国政府提出的建议是,建立强有力的监管机构,同时在未来的运作方式上保留足够的灵活性。” 作为拥有这些非常强大且能力出众的 AI 模型的前沿实验室,我们会非常认真地对待自身责任,不会等到被要求才行动。 CNBC 指出,该命令在出台过程中曾因科技行业施压而经历推迟和调整,特朗普本人也曾表示自己“并不喜欢其中某些方面”。最终与多个利益相关方协商后,美国政府将审查时间缩短至 30 天,并以请求而非强制的方式要求 AI 公司参与。 该命令旨在评估 AI 模型的“高级网络能力(advanced cyber capabilities)”,并确定模型是否应被认定为“受监管的前沿模型(covered frontier model)”。一旦获得该认定,相关模型的分发和销售可能受到限制。 OpenAI 方面表示,公司一直主动与政府部门沟通人工智能安全与监管问题。奥斯本在伦敦 SXSW 活动期间表示:“我们主动提出各种方案,帮助政府跟踪安全和保障问题,而且不仅限于美国,也包括其他国家和地区。” 对于未来监管框架,奥斯本认为,各国政府在制定监管措施时需要采取更加灵活的方式。他表示:“各国政府必须以聪明的方式对这一领域进行监管。” 相关阅读: 《 特朗普签署行政令:AI 模型在上线前可提交给政府进行安全评估 》 《 投资者质疑巨额支出能否回本,OpenAI 奥尔特曼称“这是对 AI 最公平的批评” 》 《 OpenAI 前研究员揭露“公开秘密”:人类正打造无法完全控制的 AI 》
我本来是做安全研究/写paper/做实验,但突然claude频频出现 cannot respond 的黄字警告,看了一眼大概是 claude 在对 cyber-abuse 做审查,但审查也过于严格了;对我自己的防御方案做攻击评估也会被审查。 而且我申请通过了官方的 CVP,依然会被审查,有点晕了 4 个帖子 - 2 位参与者 阅读完整话题
OpenAI方面表示,将遵守美国总统唐纳德·特朗普日前签署的有关人工智能模型发布前审查的行政命令,并同意在模型正式对外推出前接受联邦政府的能力评估。 OpenAI负责各国事务的负责人乔治·奥斯本在接受美国财经媒体采访时证实,公司将签署这一带有自愿性质的行政命令,并参与相关评估流程。他表示,“民主政府在这种技术如何被使用和部署方面理应发挥重要作用”。 奥斯本是在伦敦举办的西南偏南(SXSW)活动期间接受采访时作出上述表态的。他强调,OpenAI对自身责任“非常严肃”,并称:“作为一家掌握非常强大、前沿人工智能模型的领先实验室,我们不会被动等待要求。”他补充说,公司正“主动向各国政府提出建议,帮助其持续跟踪安全与安保相关问题,这不仅限于美国,还包括更广泛的国际范围”。 根据特朗普周二签署的这份行政命令,联邦政府可以在人工智能模型正式发布前30天获取相关访问权限。命令要求企业参与一项基准测试流程,以评估模型在网络能力等方面的“先进程度”,并据此确定何时应将某一模型界定为“受监管的前沿模型”。 这份命令被视为特朗普政府推动前沿人工智能发展与国家安全之间平衡的一项举措,意在在不完全扼杀创新的前提下,为大模型的能力设定最低监管门槛。鉴于大模型在网络攻防、情报分析、自动化攻击等场景中潜在的军事与安全用途,如何界定“前沿模型”的监管边界正成为各国政策制定者的共同议题。 曾在2010年至2016年担任英国财政大臣的奥斯本指出,各国政府在监管人工智能时“必须足够聪明”。他表示,OpenAI向各国政府提出的建议之一,是建立“强有力但具备高度灵活性”的监管机构,以便这些机构可以随着技术发展调整监管方式和标准。 奥斯本的表态显示,在美国联邦层面强化审查压力的背景下,OpenAI选择以合作姿态回应监管,而非与政府对抗。在人工智能快速演进、各国争相制定AI规则的阶段,如何在安全、创新与国家利益之间取得平衡,仍将是OpenAI与各国政府互动的核心议题。 查看评论
最近用ai写代码,写完新建会话,让他审查,然后修改,继续新建会话,继续审查修改,结果他一直能审出大大小小的感觉挺有道理的问题,我要一直继续下去吗? 1 个帖子 - 1 位参与者 阅读完整话题
我之前的工作流是opus写计划,sonnet执行,最近一段时间就琢磨把opus写的计划或者其他文档拿给codex先review。 刚开始是开两个 tmux pane,左边codex,右边claude,拿着claude 的计划给 codex, codex 审完,claude 改,claude 改完codex审……,而我在中间充当提示词的搬运工,主打一个复制和粘贴。 后来觉得实在太累了,想着既然codex有cli模式,不如让claude自己调用他,于是乎让claude给我写了这个 skill,再经过多轮迭代和踩坑,最后有了目前我一直在用的版本。 几个关键点: codex 一定要开 --yolo,这个就不解释了 一定要让 codex 在之前的会话进行 review,而不是重新开一个新的会话,不然你会发现 codex 每轮审查都能发现10个新问题,还不带重样的 还有个就是需要被审查的文档和提示词是用 stdin pipe 传进 codex的,因为我发现直接把prompt 通过命令行参数传入,由于codex的沙盒机制,会让codex一直处于等待stdin的状态而卡住 下面是具体的skill,使用方法很简单,claude 写完文档之后,直接调用 /devil-review ,claude 会在自动跑codex,拿到建议后修改,修改完了继续让codex审查……,循环直到codex 满意为止(设置默认最大循环次数10次),一般4-5次修改就会结束。 --- name: devil-review description: Run any markdown document or code change (diff/patch) through Codex for adversarial second-opinion review. Use when the user explicitly asks for a Codex or second-opinion review of a plan, PRD, spec, design doc, or staged/committed code changes — or offer it before high-impact implementation. Do not trigger automatically on every document edit. --- Codex Review Use Codex as a read-only adversarial reviewer. Codex reads and reports — it does not modify files. Amendments require explicit user confirmation before being applied (documents) or are applied directly by Claude (code changes). Two review modes: Document — review a markdown plan, PRD, spec, or design doc Code change — review a git diff, staged changes, or patch file Step 1: Set up the workspace Document mode If the document is already a file on disk : note its absolute path. If the document is in conversation only : write it to a temp file: REVIEW_FILE=$(mktemp /tmp/codex-review-XXXXXX.md) # write document content to $REVIEW_FILE Determine the project root : check whether the document belongs to a git repo. If it does, use that repo root as the working directory for Codex — this lets it read related source files for context: PROJECT_ROOT=$(git -C "$(dirname <absolute-path>)" rev-parse --show-toplevel 2>/dev/null || dirname <absolute-path>) Code change mode Capture the diff and write it to a temp file. Choose the right git diff invocation: What to review Command Unstaged working-tree changes git diff Staged (index) changes git diff --staged Last commit git diff HEAD~1 HEAD Specific range git diff <ref1> <ref2> Already-a-patch-file use the file path directly REVIEW_FILE=$(mktemp /tmp/codex-review-XXXXXX.diff) git -C "$PROJECT_ROOT" diff --staged > "$REVIEW_FILE" # adjust as needed # verify it isn't empty before proceeding Set PROJECT_ROOT to the git repo root so Codex can read surrounding source files for context: PROJECT_ROOT=$(git rev-parse --show-toplevel) Step 2: Build the review prompt Adapt the focus based on what’s being reviewed. Always include the “do not modify files” constraint — --yolo grants write access, but this skill is review-only: Input type Focus areas Implementation plan Flawed approach, missing steps, unclear dependencies, better alternatives PRD Requirements clarity, completeness, contradictions, missing edge cases, unstated assumptions Spec / design doc Ambiguity, testability, missing constraints, inconsistencies Code change Bugs and logic errors, security issues (injection, auth, data exposure), missing or broken error handling, test coverage gaps, unintended side effects, API / contract breaks, readability problems that will cause future bugs Other General clarity, gaps, and anything that would cause downstream failure Use this template, filling in the input type and relevant focus areas: You are an adversarial reviewer. The content is provided via stdin — it is a <input type>. Your job is to find problems: <focus areas for this input type>. Be specific — generic praise or vague concerns are not useful. Do not modify, create, or delete any files. Read only. End your review with one of these two verdicts as the very last line of your response: APPROVED — the content is solid and ready to act on NEEDS REVISION: <one-line summary of the main issue> Write this prompt to a temp file: PROMPT_FILE=$(mktemp /tmp/codex-review-prompt-XXXXXX.md) # write prompt to $PROMPT_FILE Step 3: Invoke Codex Round 1 — start the session: codex exec --yolo --cd "$PROJECT_ROOT" "$(cat $PROMPT_FILE)" < "$REVIEW_FILE" After round 1 completes, capture the session ID from the session file. Session files are named rollout-...-<uuid>.jsonl and the resumable ID lives in the first line’s payload.id field: LATEST_FILE=$(ls -t ~/.codex/sessions/$(date +%Y)/$(date +%m)/$(date +%d)/rollout-*.jsonl 2>/dev/null | head -1) SESSION_ID=$(python3 -c " import json, sys with open('$LATEST_FILE') as f: for line in f: try: d = json.loads(line) sid = d.get('payload', {}).get('id', '') if sid: print(sid); break except: pass " 2>/dev/null) If SESSION_ID is empty, ask the user to provide it (visible in the Codex session picker) before proceeding. Rounds 2–10 — resume the session. Write the resume prompt to a temp file and pipe it via stdin: Document mode: RESUME_FILE=$(mktemp /tmp/codex-review-resume-XXXXXX.md) # write to $RESUME_FILE: # "I've updated the document to address your concerns. Key changes: <summary>. # Please re-read the file at <absolute-path> and review again. Do not modify any files. # Use the same verdict format as before: APPROVED or NEEDS REVISION: <one-line summary>." codex exec resume --yolo "$SESSION_ID" - < "$RESUME_FILE" Code change mode: # Re-capture the updated diff after applying fixes (see Step 5) git -C "$PROJECT_ROOT" diff --staged > "$REVIEW_FILE" RESUME_FILE=$(mktemp /tmp/codex-review-resume-XXXXXX.md) # write to $RESUME_FILE: # "The diff has been updated to address your concerns. Key changes: <summary>. # The updated diff is provided via stdin. Review it again. Do not modify any files. # Use the same verdict format: APPROVED or NEEDS REVISION: <one-line summary>." codex exec resume --yolo "$SESSION_ID" - < <(cat "$RESUME_FILE" "$REVIEW_FILE") Run with run_in_background: true — Codex runs are long Read the output file directly as it streams; never pipe through tail or head Don’t hardcode a model name; Codex picks its default Step 4: Parse the verdict Look for the verdict only on the final line of Codex’s response — match strictly: Line starting with APPROVED → approved Line starting with NEEDS REVISION: → needs revision Ignore any occurrence of these words mid-output; the prompt template or previous round context can produce false matches. APPROVED : surface Codex’s rationale to the user and confirm they want to proceed NEEDS REVISION: : surface the specific objections clearly, then go to Step 5 Step 5: Amend and resubmit Document mode Immediately amend the document to address Codex’s objections — no confirmation needed. Use judgment on what to change; not every objection requires a redesign. Tell the user what changed and why in one concise line, then go straight back to Step 3 (Round 2+). Code change mode Apply fixes directly to the source files (no confirmation needed for mechanical fixes; pause for architectural changes). Use judgment — not every objection warrants a change. Then: Re-stage the fixed files ( git add ) so the updated diff reflects the corrections Re-capture the diff: git diff --staged > "$REVIEW_FILE" Tell the user what changed and why in one concise line Go back to Step 3 (Round 2+), piping both the resume message and the fresh diff Keep an iteration counter visible: “Review round 2”, “Review round 3”. This lets the user track progress and decide when to override. Hard cap: 10 rounds. If Codex still hasn’t approved by round 10, stop the loop, surface the outstanding objections, and ask the user how to proceed. Step 6: User override The user can stop the loop at any point (“proceed anyway”, “I disagree with Codex here”). Codex’s verdict is advisory — surface it faithfully but respect the user’s final call. 3 个帖子 - 3 位参与者 阅读完整话题
npm: https://www.npmjs.com/package/@liuhuakawaii/dep-radar github: https://github.com/liuhuakawaii/dep-radar 大佬们指点一下,有没有继续下去的搞头或者建议