WWW.YOUINFO.SITE
标签聚合 审计

/tag/审计

LinuxDo 最新话题 · 2026-06-10 16:07:30+08:00 · tech

目前想基于一个github项目进行二开,有以下几点需求: 1、首先对项目进行全面的审计,起码要搞清楚每个文件是干嘛的,细致到系统函数最好,重点是新会话不需要重新读源码就能知道每个文件是干嘛的,因为需要改动的部分比较多,一个会话肯定搞不完。 2、能否有一个需求任务进度追踪skills,就是基于我的需求进行更细致的拆分,然后记录了这个会话完成了哪些需求,修改了哪些文件,便于新会话接着这个进度继续。 3、现在佬们都用什么记忆系统,用了一些要么觉得太重,要么占用会话上下文太多,要么触发时机,记录内容不太符合自身需求。 1 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-05 18:47:46+08:00 · tech

OOS-Gauntlet 数据驱动审计方法 一套用于"决定要不要改策略"的证伪流程。核心一句话: 任何"改动会变好"的假说, 先用它自己的数据尽力推翻它,推翻不掉才部署。 2026-06-05 整理,源自黑名单审计 / WLD 调查 / range_break_probe 关闭等一系列实战。 1. 背景:为什么需要这套方法 量化策略的每一次改动——加黑名单、加 gate 、关闭某个 mode 、按某指标缩 sizing—— 背后都是一个假说:"这样改,整体会变好"。这些假说往往来自对历史数据的观察: 某个币一直亏、某个信号胜率低、某个 confidence 区间表现差。 陷阱在于: 历史数据里看到的"规律",大部分是假的。 它可能是: 单日/单时段的运气 :某币在某一天爆亏 -24,看起来很差,但那是当天的市场事件,不可外推。 单个 symbol 的巧合 :某"类型"的币赚钱,拆开发现整类只有 1 个币在赚,其余在亏。 聚合数字的假象 :"全市场关闭 X 改善 +98%",拆到 symbol 级发现主流币其实在赚,+98% 是被少数大亏 symbol 拉出来的。 不携带 edge 的维度 :confidence 看起来高就该赚,但 held-out 测试发现 confidence 根本不 rank edge(甚至反向)。 这个项目反复栽在这些坑里(都有记录):confidence floor 假说被双轮 OOS 证伪、 funding-squeeze 信号三重收敛却死于 90 天全市场 OOS 、多个"利润集中"结论其实是 STG/LAB 两个币的尾部运气。 每一次"我从数据里发现了规律"的兴奋,都需要先被 怀疑。 这套方法就是把怀疑系统化。 2. 核心方法:OOS-Gauntlet(样本外多重关卡) OOS = Out-Of-Sample(样本外)。Gauntlet = 一连串必须逐个通过的关卡。一个假说要 活下来,必须 连续通过 下面每一关——任何一关翻车,假说就被否决。 假说(从 in-sample 数据挖出) │ ├─ 关卡 1: in-sample 时段分布 —— 亏损/盈利是集中单日(regime),还是跨多日(系统性)? │ ├─ 关卡 2: OOS 多窗口 —— 换 2-3 个独立时段(fetch --end-date)重测,方向一致吗? │ ├─ 关卡 3: 多 symbol —— 同一结论在 ≥3 个不同 symbol 上都成立,还是单 symbol 假象? │ ├─ 关卡 4: 对照基准 —— 同期 crypto 对照(SOL/AVAX)是什么表现?排除大盘 regime 。 │ ├─ 关卡 5: 拆穿聚合 —— 整体数字拆到 symbol/时段级,赢家是不是少数尾部撑的? │ └─ 关卡 6: 端到端 live 验证 —— 部署后真在 live 生效吗?(不只单元测/backtest) 关键原则:每加一关,样本就更"样本外"一点。 in-sample 是你挖假说的那段数据 (必然支持假说,因为假说是从它挖的);OOS 多窗口排除时段运气;多 symbol 排除单币 巧合;对照排除大盘;拆聚合排除尾部;端到端排除"代码根本没生效"。 3. 用了哪些模块的数据,为什么这样用 数据源 是什么 在方法里的角色 为什么用它 reports/runtime/income_ledger/ 交易所返回的真实已实现 PnL(REALIZED_PNL 事件) 实盘真值 :某币/某 mode 真实赚亏 唯一不掺假的真金白银;但 必须聚合回 trade (事件级会被分批止盈骗) reports/runtime/shadow_trades/ 影子交易:被 gate block / HOLD 的信号的 counterfactual(假如开了会怎样)的模拟 PnL 黑名单/关闭候选的"假如交易"依据 黑名单币不实盘→信号被 block→shadow 记录"假如不黑会怎样",这是判断"该不该解黑"的直接证据 reports/runtime/decision_journal/ 每个决策的完整 metadata(regime/strategy_mode/confidence/各质量指标/git_sha/blocked_by) 归因 + live 验证 :某改动 live 是否生效、决策按 git_sha 分布 含 git_sha,能区分"部署前 vs 部署后"的决策,做 live A/B;含丰富质量指标供 rank-edge 分析 reports/backtests/*/trades.csv 回测逐笔成交(symbol/side/pnl/confidence/regime/strategy_mode/entry_time) OOS 多窗口 + 多 symbol 的主力 :可控时段(--end-date)、可控 flag(env) 一体记录"入场条件 + 出场 PnL",无手动平仓污染,可批量跑多 symbol × 多时段 Binance exchangeInfo ( underlyingType / underlyingSubType ) 交易所对每个 symbol 的官方分类(EQUITY/COIN/COMMODITY / DeFi/AI/Layer-1/Infrastructure...) 跨 symbol 归类 :把单 symbol 结论提升到"类型"维度验证 当内部 symbol_group 全是 default 无区分力时,交易所的官方分类提供了正交的归类维度(但要防单 symbol 假象) 为什么 shadow 和 income 要分开看: income 是实盘开了仓的真值,shadow 是被拦下来 的 counterfactual 。黑名单币不实盘(income 没数据),只能靠 shadow 判断"解黑后会怎样"; 而"该不该加黑"要看实盘 income + backtest 。两者互补,缺一不可。 为什么必须聚合回 trade: income_ledger 是 REALIZED_PNL 事件流,一笔仓分批止盈 会产生多个事件。如果按事件算胜率/payoff,会被"小额分批止盈"骗出虚高胜率。必须 按 symbol+时间窗聚合回 trade 级再统计。 4. 两个具体事例 事例 A:DRIFT 该不该加黑名单 —— in-sample 假阳性被 OOS 推翻 假说(从 in-sample 挖出): DRIFT 是黑名单候选。shadow 看它 -16.5 、实盘 income -8.5,合计昨日 -24.6,是当天 最差 的 symbol,看起来铁定该黑。 逐关验证: 关卡 1(时段分布): DRIFT 的 -24.6 全部集中在 06-04 单日 ,其余日期几乎无活动 → 强烈的单日 regime 信号,不像系统性。 关卡 2(OOS 多窗口): 用 fetch --end-date 拉两个独立时段回测 DRIFT: OOS 窗口 1(04-30~05-10): +13.15 OOS 窗口 2(04-05~04-15): +90.66 两个样本外时段 DRIFT 都 大赚 ! 结论: in-sample 的 -24.6 是 06-04 单日市场事件, 不可外推 。加黑名单会错失 OOS 那 +90 的盈利。 DRIFT 不加黑。 这就是 in-sample 假阳性的典型:单日爆亏被误读成"这币系统性差"。如果只看挖假说 的那一天就拍板,会做出完全错误的决定。 事例 B:range_break_probe 该不该关闭 —— subType 单 symbol 假象被多 symbol OOS 拆穿 假说演进(层层深入): range_break_probe(RANGING regime + 均值回归失败后转去追 区间突破)整体负 EV,该关。但"整体关闭"在某些 symbol 上反而亏(主流币的 probe 在 赚),于是怀疑 EV 是 symbol 依赖的。进一步用 Binance underlyingSubType 拆,发现: subType in-sample(少 symbol) 看起来 Infrastructure +29(wr75%) 赚!该保留 Layer-1 +20(wr57%) 赚!该保留 看起来可以做"subType-aware gate":只关亏的 subType,保留赚的。 但加一关: 关卡 3(多 symbol): Infrastructure 之前的 +29 全部来自 LINK 一个 symbol 。 换成多 symbol(BAT/LINK/MASK)跑 OOS: Infrastructure: +29 → -32(wr 0%) ← 完全反转! Layer-1: +20 → +0.4 (breakeven) ← edge 消失 所有 subType 多 symbol OOS 全部亏或打平。 结论: "subType 区分"是 单 symbol 假象 ——Infrastructure=LINK 、AI=WLD 、 DeFi=DRIFT,每类只 1 个 symbol 时,"subType 信号"其实是"那个 symbol 的信号" 伪装的。range_break_probe 普遍负 EV(概念性:RANGING 追假突破),全局关闭。 这是事例 A 的同一个陷阱换了维度:单日 → 单 symbol 。用户的洞察(用交易所 subType 数据细分)方向对,但必须配多 symbol OOS,否则会被单 symbol 假象骗去做一个 错误的 subType gate 。 5. "OOS 一致"的作用:照妖镜 整套方法的判据可以浓缩成一句话: 跨窗口、跨 symbol 一致 = 真信号;一翻转/只靠单点 = 方差假象。 DRIFT:in-sample -24.6 但 OOS 两窗口 +13/+90 → 不一致(翻转) → 假阳性,不加黑。 BZ/NATGAS:in-sample shadow 负 + OOS-1 负 + OOS-2 负,三窗口 一致 + 多 symbol + 对照 SOL 同期正 → 真系统性亏 → 加黑。 Infrastructure:LINK 单 symbol +29,换多 symbol → -32 → 不一致 → 单 symbol 假象。 range_break_probe:所有 subType 多 symbol OOS 一致 亏 → 真普遍负 EV → 关闭。 "一致"之所以是照妖镜,是因为 方差(运气)在不同时段/不同 symbol 上方向随机 —— 你换个窗口、换批 symbol,运气就洗掉了,只有真实的 edge/loss 才会在所有切片上同向 保留。一个结论能在 3 个独立时段 + 3 个不同 symbol + 对照组上都同向,它是运气的概率 就极低了。 反过来, 任何"只在一个时段/一个 symbol 上成立"的结论,默认当方差 ,不部署。 这也解释了为什么聚合数字(全市场 +98%)危险:聚合把不一致藏起来了,必须拆开看每个 切片是否一致。 6. 我是如何想到这套方法的 不是一开始就有的,是被历次失败逼出来的: confidence floor 的双轮 OOS 死亡 让我学到:in-sample 挖出的"好区间",必须用 pre-registered 的 held-out OOS 去打——而且要 双轮 (0.62 死于 OOS-1,我换 0.65 又死于 OOS-2)。一轮 OOS 不够,赢家会"刚好"过第一轮。→ 催生 多窗口 。 funding-squeeze 三重收敛却死于全市场 OOS 让我学到:机制合理 + 学术支持 + 样本验证(三重收敛)都不等于 robust,横截面 demean(扣大盘)后才见真章。→ 催生 对照基准 (排除大盘 regime)。 STG/LAB 尾部运气 让我学到:"整体盈利"可能是 2 个币撑的,去掉就转负。聚合 会骗人。→ 催生 拆穿聚合 (拆到 symbol/时段级)。 momentum_tilt 的 stale-code 事故 (单元测过、reviewer 过,但部署后 count 仍 0, 因为改动根本没进数据流)让我学到:observability/flag 改动,单元测和 source-guard 都可能放过"代码没真生效"。→ 催生 端到端 live 验证 (这次也立刻抓到了 "flag-on/off backtest 完全相同 = 云端没 pull 新代码")。 这次 range_break_probe 里 单 symbol 假象 (Infrastructure=LINK)是新增的一关: 当我想用 subType 做精细化时,意识到"每个 subType 几个 symbol?"——只 1 个就是 symbol 伪装。→ 催生 多 symbol 关卡。 一句话总结思路: 每次我对一个数据发现感到兴奋、想立刻部署时,就强迫自己问 "这个结论,换个时段还成立吗?换批 symbol 还成立吗?拆开看每个切片还一致吗? 部署后真生效吗?"——把每一次踩过的坑变成一道固定关卡。方法的价值不在于找到新 alpha,而在于 拦住那些看起来像 alpha 、实际会亏钱的假象 。 7. 落地工具速查 拉独立时段数据: fetch_backtest_inputs.py --symbol X --end-date YYYY-MM-DD --exchange-kind binance 控 flag 跑回测: GENERAL_XXX_ENABLED=false python run_backtest.py --csv ... --symbol X 实盘归因: reports/runtime/{income,shadow_trades,decision_journal}_ledger ,decision_journal 按 git_sha 切 live A/B 交易所分类:Binance fapi/v1/exchangeInfo 的 underlyingType / underlyingSubType 黑名单/cohort 正道: EDGE_DISABLED_COHORTS (cohort 级 holdout-validated),优于手动 symbol blacklist 实盘改动(.env flag 翻转、mode 禁用)需当前对话明确授权 + 可回滚 + 部署后 live 监控

cnBeta全文版 · 2026-06-05 13:35:47+08:00 · tech

6月5日消息,美国众议院两党议员周四公布一份269页AI立法讨论稿,试图把前沿AI模型安全审计、员工举报保护和AI就业影响研究纳入联邦框架;争议最大的一条,是三年内限制各州自行监管AI模型开发。 这份《伟大美国人工智能法案(Great American Artificial Intelligence Act of 2026)》由加州共和党众议员杰伊·奥伯诺特(Jay Obernolte)和马萨诸塞州民主党众议员洛丽·特拉汉(Lori Trahan)牵头发布,另有四名两党议员共同参与。草案目前仍处于征求反馈阶段,尚未正式提交表决;特拉汉方面称,文本会根据外部意见继续修改。 联邦想先管住最强AI模型 草案首先盯住“大型前沿开发商”:上一年总收入超过5亿美元,并训练过大型前沿模型的公司。按媒体报道口径,OpenAI、谷歌DeepMind、Anthropic等头部AI实验室都可能被纳入。 这些公司需要公开一套“前沿AI框架”,说明如何识别和管理模型可能带来的“灾难性风险”。草案把这类风险限定在更具体的场景里:模型协助制造大规模杀伤性武器、发动网络攻击,或在缺少有意义人类监督的情况下采取有害自主行动,并造成超过50人死亡或重伤,或超过10亿美元财产损失。 大型前沿开发商还需聘请由美国国家标准与技术研究院(NIST)下属AI标准与创新中心(Center for AI Standards and Innovation,CAISI)许可的独立验证机构,每半年核查一次安全计划执行情况。违反安全要求或审计要求的企业,可能面临最高每日100万美元的民事罚款。草案还拟在法律上正式设立CAISI,并在2027、2028、2029财年分别授权1亿美元资金。 这部分不是在规定聊天机器人该怎么回答问题,而是在给最强模型的开发过程设底线:模型发布前,企业需要说清楚评估了哪些严重风险、评估结果如何,以及采取了哪些缓解措施。 州政府还能管使用,但不能管开发 真正引发反弹的是“州法优先权”条款。草案规定,法案生效后三年内,州和地方政府不得制定或执行“专门监管AI模型开发”的法律;但州政府仍可监管AI系统的使用和部署。三年期满后,该优先条款自动失效,除非国会重新授权。 特拉汉办公室配套说明称,加州AB 2013中要求模型开发者公开训练数据概要的规定,以及加州SB 942中与内容水印有关的部分条文,会受到影响;加州、纽约州、伊利诺伊州的前沿AI安全法也会被纳入联邦框架。Roll Call指出,配套说明使用了“联邦化”的说法,但法案文本本身未清楚区分“联邦化”和“优先排除州法”的法律差别。 支持者的理由是,美国AI公司不应同时面对50个州各不相同的开发规则。印第安纳州共和党众议员艾琳·霍钦(Erin Houchin)称,美国应在AI领域保持领先,而不是被州法拼图拖慢创新和竞争。 反对者担心,这会把州政府已经建立或正在尝试的消费者保护、儿童安全和AI安全规则压低到联邦最低线。倡议组织“美国人支持负责任的创新”(Americans for Responsible Innovation)主席布拉德·卡森(Brad Carson)批评称,草案会把州级AI立法的“地板”变成联邦“天花板”。“安全AI联盟”(Alliance for Secure AI)首席执行官布伦丹·施泰因豪泽(Brendan Steinhauser)也表示,全国标准至少应提供与被取代州法同等的保护。 员工、消费者和学生也被写进草案 除前沿模型安全外,草案还把几类日常会直接接触到的问题写入法案。 对AI公司员工和承包商,草案设立举报人保护条款:如果他们报告真实或疑似AI违规行为,应受到联邦法律保护,避免被雇主报复。对消费者,草案提高了利用AI实施金融诈骗的量刑标准,并把AI冒充联邦官员列为专门罪名。对学生和劳动者,草案要求研究AI对就业的影响,并推动K-12阶段AI素养教育、大学AI奖学金等项目。 草案还计划把《网络安全信息共享法(2015)》延长至2035财年,继续允许企业共享网络威胁信息而不触发反垄断责任。行业组织NetChoice整体支持这份草案的方向,但对强制审计和数据共享条款保留意见,担心企业商业秘密和隐私记录受到影响。 但这份草案政治前景仍不确定。奥伯诺特是众议院共和党政策委员会主席,他参与牵头或让草案具备一定推进分量;但2025年国会曾尝试把10年州级AI立法暂停条款塞入“一揽子预算案”,最终在参议院以99:1的投票结果被移除。这一次,期限缩短为三年,并搭配透明度、审计和举报保护要求,能否换来足够多议员接受,仍要看8月国会休会前的修改和谈判。 查看评论

v2ex · 2026-06-01 12:01:38+08:00 · tech

AI 效能工程师 以 AI 为核心生产力,通过 AI 辅助开发、流程自动化与工具链建设,系统性地提升研发与业务效能。要求既能写代码,又会用 AI ,并能把复杂需求快速落地为可用工具或系统。 1. AI 辅助开发与工具落地 熟练使用 Claude Code 、Cursor 、Copilot 等 AI 编程工具,在真实项目中进行代码生成、重构、调试与测试 借助 AI 工具独立完成小型前后端功能模块或内部效能工具的开发与交付 将 AI 能力以 API 、插件或脚本形式嵌入现有研发流程( CI/CD 、代码审查、文档生成等) 2. 业务场景的技术化落地 快速理解业务/运营侧的重复性痛点,设计并实现 AI 驱动的解决方案(如:自动化工单处理、智能周报生成、Bug 分类辅助、代码迁移辅助等) 负责从需求拆解、技术选型、原型开发到上线运维的全流程闭环 3. 效能度量与迭代优化 对开发交付的工具进行效果评估(节省工时、错误率、使用率等),持续迭代 沉淀可复用的 AI 开发模式、提示词策略和代码模板 跨部门沟通与需求对齐 主动与业务、产品、研发同事沟通,将模糊需求转化为明确的技术实现路径 向非术方解释 AI 的能力边界与风险,管理预期 任职资格 硬性条件 开发能力:有前端( React/Vue/HTML/CSS/JS )或后端( Python/Node.js/Go/Java 之一)实际开发经验,能独立写工程化代码 Ai 开发工具:熟练使用 Claude Code ,并在实际工作或项目中完成过代码级产出(必须可验证) AI 整合能力:熟悉主流大模型( Claude 、GPT 、DeepSeek 等) API 调用,了解 Prompt 工程、上下文管理、工具调用等基本概念 交付能力:能独立从 0 到 1 交付一个 AI 辅助的小型系统或工具(面试需展示) 软性条件 沟通能力强:能用技术语言与工程师对齐,也能用业务语言与需求方对齐 结果导向:不纠结理论完美,追求快速验证、持续交付 学习能力:对 AI 生态迭代保持敏感,愿意主动尝试新模型和新工具 四、加分项(不是必须,但强烈加分) 有 Claude Code 实际落地的生产级项目 做过 RAG 、Agent 、浏览器自动化( Playwright/Puppeteer )相关开发 有内部效能工具或低代码/零代码平台的搭建经验 能展示一个“因为用了 AI ,原本 3 天的工作缩短到半天”的真实案例 ai 产品研发工程师 负责产品从需求分析、方案设计、前后端开发到上线交付的完整闭环 将模糊需求拆解为清晰的功能方案、页面逻辑和研发任务 负责前端页面搭建、交互实现和基础后端接口开发 熟练使用 AI 工具辅助完成需求整理、文档输出、代码开发、调试优化和测试排查 推动产品快速上线并持续优化 岗位要求: 具备较强的产品思维与研发能力,能够独立承担小产品完整交付 前端能力偏强,熟悉 React / Vue 等主流前端技术栈 具备基础后端开发能力,熟悉 Node.js / Java / Python 中至少一种主流后端技术栈 能完成基础接口开发、业务逻辑实现及前后端联调 能理解业务目标并完成基础 PRD / 功能拆解 / 页面逻辑设计 熟练使用 ChatGPT 、Claude 、Cursor 、Copilot 等 AI 工具提升产研效率 AI 应用工程师 岗位定位 负责将业务需求落地为可执行的 AI 自动化流程,覆盖流程设计、Agent / Skill 开发、工作流编排、前后端开发、接口对接、部署上线等完整链路,是连接业务与技术的桥梁角色。 岗位职责 深入理解业务流程与痛点,设计 AI 自动化方案,包括流程拆解、节点定义、异常分支与人工协同机制 负责 AI 流程、Agent 、Skill 等能力的开发与落地,构建业务自动化闭环 根据业务需求完成前端页面、后端接口、流程节点及数据处理逻辑开发 负责 OpenClaw 或同类 Agent 平台的 Skill 接入、调试、优化与部署 对接 ChatGPT 、Claude 等大模型 API 及第三方系统接口,实现流程自动化 参与 AI 工作流设计,包括提示词结构、节点编排、异常处理与结果校验等 配合产品、运营完成流程优化、问题排查、上线支持与效果迭代 持续优化流程稳定性、执行效率、可维护性与复用性 输出需求文档、流程图与规则文档,沉淀可复用的流程方法论 具备扎实的开发能力,至少熟悉一种后端语言( Node.js 、Python 、Java 等) 具备前端开发能力,能独立完成基础页面与交互实现,熟悉 Vue 、React 、HTML 、JS 、CSS 具备良好的业务理解能力与流程拆解能力,能独立输出流程图与需求文档 对 AI 、Agent 、Skill 、工作流自动化有基础认知,理解大模型在业务流程中的典型应用方式 具备 AI 自动化流程、Agent 工作流或业务自动执行链路的搭建经验 问题排查能力较强,能独立处理接口异常、流程中断、结果不稳定等问题 沟通推进能力良好,能协调业务方与开发方共同推动项目落地 责任心强,执行力突出,能完整推动需求从设计到上线 加分项 使用过 OpenClaw 、ChatGPT 、Claude Code 、Cursor 、Coze 、Dify 等 AI 开发工具 具备 OpenClaw Skill 的开发、部署与维护经验 具备 LLM 接入经验,包括 Prompt 设计、Function Call 、Tool Use 及结构化输出处理 有自动化平台、RPA 、审批流、数据同步或运营工具类项目经验 熟悉 Docker 、Nginx 、Linux 及服务器部署 具备业务系统集成经验(后台管理系统、表格系统、爬虫、消息通知、报表平台等) 有从 0 到 1 搭建 AI 工作流或 Agent 应用场景的经验 有直播、社交、内容、运营平台等业务背景者优先 代码审计 岗位职责] 核心架构设计与演进: 负责公司核心业务系统(高吞吐、低延迟微服务)的整体架构设计与 Go 技术选型,主导云原生架构的深层演进与服务网格( Service Mesh )落地。 (2, 3, 4, 5 条 AI 提效及团队赋能职责同上,完全保留) [任职要求] 经验门槛: 本科及以上学历,7 年以上后端开发经验,至少 3 年以上重度 Golang 微服务架构与核心研发经验。(如果是极其出色的技术天才,年限可放宽) Go 领域专家:极度精通 Go 语言核心机制( Goroutine 调度、Channel 、GC 原理、内存管理),对 Go 运行时有深入理解。具备丰富的云原生底层组件排坑经验。 架构功底: 极度熟练掌握云原生( K8s/Docker/Istio )。精通 MySQL 、Redis 、MQ ( Kafka/RabbitMQ )等中间件的底层原理与百亿级数据/请求量下的集群架构经验。 (4. AI 提效狂热者、5. 软技能同上,完全保留) [加分项] 熟悉主流大模型 API (如 OpenAI 、Claude 、DeepSeek ),有 LangChain 、Dify 等框架实际开发经验者优先。 有过主导几十人以上技术团队成功实现“AI 工具链落地与人效提升”经验者优先。 在开源社区极度活跃,有知名开源项目核心贡献者优先。 其他 ai 相关岗位欢迎咨询 TG:HR167 邮箱: [email protected]

LinuxDo 最新话题 · 2026-05-30 21:37:09+08:00 · tech

文本熵变审计台(单HTML版)更新:恢复溯源报告的完整展示能力以及性能大优化「已完成!」 开发调优 从 文本熵变审计台更新记录: 哈基米无能,只能claude来救场,佬友们觉得能胜利吗:胜利了!Gemini2.5pro终结项目 继续讨论: https://textflux.stellafortuna.dpdns.org/ 更新完成公告 最终qwen3.6plus提供了更新,3.5max修复了bug 目前已完美,视觉也部分升级优化~ [Screenshot_20260406_024301] [… 依旧咱们社区是他的唯一信源 公益站都来了,不过他这边只是ai总结评论,可能没有链接 也不一定…等会给你们看个图 评价的还是蛮好的 不过SEO都仅次于L站了 续上文 没链接,但是有token 不过能抓取到的一般都是零级话题吧 或者是忘记了等级设置后面才改的 索引太快的代价 考虑到新人,应该确实是忘记设置了 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-29 18:04:26+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 18:04:26+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 17:51:41+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 17:45:54+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 17:33:49+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 17:22:55+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 17:12:53+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 17:02:49+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 16:53:27+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 16:31:17+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦

V2EX - 技术 · 2026-05-29 16:31:17+08:00 · tech

我明明白白写着:“帮我审计一下,为什么初审结果没按下面这个标准格式输出。” 结果它二话不说,直接上手给我改代码。 我赶紧问:“我有让你改代码吗?” 它认错倒是特别熟练:“抱歉,我理解错了。你只是让我查原因,不是让我改代码。” 这满屏的控制欲,配上那副“我知道错了但我是为你好”的卑微劲儿, 简直太有东方特色了——“都是为你好”。 有一种 Bug ,叫东边的大模型觉得你有 Bug 。 强塞的爱也是爱,你不接受就是你不识好歹,对吧?💦