试题 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-10 17:07:46+08:00 · tech

我猜测是GPT做试题实在太强了，为了公平公正，直接把3～5公里内的基站给拉闸了。还挺有诚意的，感觉5G基站好久都没关过了。 5 个帖子 - 4 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-10 16:59:13+08:00 · tech

上个月公司裁员，开启了前端面试之旅，一路坎坷，转而学习了一些 ai 课程，面试了十几家 agent 岗位（中间可能穿插偏向前端和全栈的岗位），面试过程都录音了，然后让 AI 整理了一下面试官提问的问题，分享给各位佬一起学习学习～ ML 公司 AI xx 系统主要是做什么的？ LangChain / LangGraph 主要用了什么 AI 技术？有没有了解过像 Manus 这种通用 Agent？这些通用 Agent 一般分几层功能？有没有构建过多智能体（Multi-Agent）架构？什么是多 Agent？为什么需要多 Agent？什么场景下需要多 Agent 架构？单个 Agent 其实也可以分配多个职能，为什么还要多 Agent？多 Agent 主要是为了解决什么问题？你这个系统之前用户量有多少？日活有多少？ Agent 的使用量是多少？ Token 消耗量大概多少？有没有考虑过怎么节约 AI 成本？做了哪些成本优化方案？最终降了多少成本？AI 投入前后带来的收益有多少？ KJ 公司 claude code 的多层架构是怎么做的？ ps 网页版实现方案？ canvas 无限画布是怎么实现的？ WebAssembly 有了解过吗？ docker 和 k8s 的关系？ docker 中容器和镜像的关系？怎么进行挂载的？ k8s 中多个服务怎么进行通讯？怎么进行团队的管理？怎么推动项目进度？ express 的底层原理？如果让你设计实现怎么做？入职后如何快速上手分配的业务需求？简说思路说一说在职业中比较具有挑战性的问题 JR 公司介绍一下你的 ai 项目的架构情况？为啥选择 langchain、langGraph？选型的依据是啥？抽象通用 AI 能力模块做了什么？ AI 调用工具失败了怎么解决？简单介绍一下 RAG 的流程？怎么加速 RAG 的检索过程，有啥策略？向量库目前的数据量？向量库使用的是啥？选型依据？大模型的选型逻辑？（政策文件场景下）怎么确认召回的数据准确性？你们上下文压缩的策略是什么？追问：上下文压缩时，如果大模型能力问题压缩质量有问题怎么解决？有了解之前 claude code 泄露的事件？有没有研究过源码？ claude code 的上下文治理是怎么做的？ claude code 的核心循环流程说一下？多租户的场景下 k8s 怎么部署的？一个租户一个对应 pod 吗 TK公司企微 H5 登录流程是怎么做的？企业微信只能绑定两个域名，多个业务域名怎么处理？ UI 没空出原型，需要你自己设计页面？没有设计稿时你怎么推进？有没有做过 H5 用户打标签？用户进入页面后：怎么获取唯一 ID？企微回调里的 ID 同步怎么做？有没有做埋点？怎么做的？埋点获取哪些数据？ RAG 的检索是怎么做的？海豚工作流同步数据时：MySQL IO 爆红怎么排查？场景：三连表、每小时同步、查一个库、插另一个库、插入时报错、IO 爆高 MySQL 大表优化怎么做？百万级数据后出现慢插入 YC 公司怎么保证数据库和缓存之间的数据一致性？从 0 到 1 搭建一个项目，怎么设计架构？你这个 AI XX 系统，如果从架构角度看，分成哪些层？假设现在让你做一个 xxx 门店的 AI 数字化系统，你会怎么设计？技术架构：你怎么拆模块？数据怎么流转？技术选型怎么做？ AI 工具出现后，对传统研发工作流造成了很大冲击。你个人或团队有没有相应的 AI 工作流？如何把 AI 融入开发流程的？有 AI 编程规范吗？ AI 写的代码相对不可控，你们有没有 code review 流程？ SSE 断线续传？由于客户端因素断了，比如用户把窗口关掉了，又很快打开，或者刷新页面，让他继续接收 SSE 流，你们有没有做过？ HJ 公司个人一个月 token 使用量大概是多少？如果政府项目限制使用国外模型或工具，完全使用国内工具有没有影响？有没有做过国内外 AI 工具或模型的对比？同一个模型不同工具，或者同一个工具不同模型，效果差异有没有研究？没用 AI 和用了 AI 后，你觉得效率提升有多大？按百分比来说，你觉得 AI 能提升多少效率？你会用什么 AI 工具来完成项目规划、草图、文档和开发？未来全栈开发需要具备一定架构师能力，你搭框架的整体思路是什么？传统 XX 业务系统的后端分几层？你们产品开发完后，最大用户并发数大概是多少？这个高并发项目部署在哪里？有没有做熔断之类的处理？高峰、限流、缓存、异步队列这些有没有做过？全栈项目没有测试岗，是怎么测试的？有没有做过基于 AI 的界面测试？AI 是否能覆盖前端点击、输入、提交等自动化测试？对未来职业规划是怎么想的？你是想跟着公司的战略方向走，还是自己有明确想法并寻找匹配的岗位？如果客户是政府单位，要重新定制开发一个软件，包含客户端、APP、小程序，售前已完成调研，项目体量约 50 万，一个月内交付，你如何拆解流程？如果是资产管理系统，你会如何利用 AI 完成开发和交付？ FN 公司 Vue 和 React 核心区别是什么？ Vue 和 React 谁性能上限更高？ React 和 Vue 最新版本在做什么？浏览器发起 HTTP 请求经历什么过程？哪些地方会发生缓存？找一个印象最深的项目聊聊 SSE 和 WebSocket 分别说说？ AI 时代程序员价值是什么？你认为自己在编程优点和缺点？最近学什么？职业规划是什么？ XZ 公司你自己的 AI 的开发工作流程是怎么样的？有在使用什么 MCP 或者 SKILL？接到一个需求后，你会怎么做？你的 3~5 年职业规划是怎么样的？工作中做过比较深刻的事情？ SH 公司（太好了是前端八股！） CSS3 你用得比较多的有哪些？ CSS3 里像渐变、旋转、缩放、动画这些你了解吗？做动画时，CSS 和 JS 分别怎么做？ CSS 动画和 JS 动画有什么区别？ Canvas 有没有用过？ Canvas 做过什么场景？红包 / 福袋动画是怎么做的？打开红包的动作是画出来的，还是直接展示 UI 图？动画有没有做过打开、抖动、浮动、阴影、缩放这类效果？ WebSocket 前端连接流程是什么？ WebSocket 怎么监听消息？ WebSocket 怎么和后端约定事件？ WebSocket 有没有做心跳 / 保活？ WebSocket 断开后怎么重连？有没有遇到连接不上的情况？连接不上时怎么兜底？是否会降级成 HTTP 轮询？轮询频率怎么控制？有没有用指数退避？弱网情况下怎么提示用户？实时数据不准确时，前端怎么做交互提示？ ES6 有哪些常用特性？什么是柯里化函数？ ES5 和 ES6 构造函数分别怎么写？ ES6 用什么构造对象？ES5 用什么构造对象？平时有没有区分 ES5 和 ES6？ Promise、扩展运算符、箭头函数、模板字符串这些是否了解？有做过浏览器兼容吗？浏览器兼容需要注意哪些？CSS 兼容怎么处理？JS 兼容怎么处理？低版本浏览器下，打包降级有没有遇到问题？低版本浏览器里路由变了但页面不跳转，可能是什么原因？浏览器 API 不支持时怎么处理？框架 Vue / React 是否已经帮你抹平了一部分兼容性？ React 用得多，还是 Vue 用得多？ Vue 2 和 Vue 3 的区别是什么？ Vue 2 响应式原理是什么？Vue 3 响应式原理是什么？ Object.defineProperty 和 Proxy 有什么区别？ Vue 3 在性能上做了哪些优化？ Vue 2 里数组 / 对象变更为什么可能不触发视图更新？如果数据变了，但是视图没变，可能是什么原因？ PY 公司如何推动 AI 系统落地的？用户问题如何路由到 AI 系统？意图识别是如何实现的？使用了哪些模型？如何处理未登录用户的问题查询？如何做向量化和知识库检索？文档、PDF、课件是如何切分、入库、人工审核的？ AI 输出如何保证序列化/结构化？为什么选择 Markdown 而不是 JSON？数据库和后端架构是什么？有没有做过微服务、数据中台或复杂后端系统？花了多久落地？在落地过程中，你之前没有经验时是怎么学习的？假设设计一个秒杀系统，你会怎么设计架构？高并发下如何避免超卖？ MySQL 本身怎么实现库存扣减？ Redis 分布式锁或 Lua 脚本如何使用？限流、接口削峰、事务和乐观锁如何落地？如果不用 Redis，只用 MySQL，要怎么保证安全？微信支付接入流程怎么设计？如何保证用户支付后积分/虚拟产品到账？支付为什么要使用异步队列？如果队列挂掉，如何保证支付结果和系统状态一致？回调验签具体流程是什么？ MCP、SKILL 或其他工具如何辅助开发？产品经理缺失情况下，你们是如何自己出可交互草图和 PRD？ HQ公司你日常使用 NextJS 多吗？你使用 TypeORM，有没有了解过 Prisma？调研时对比过 TypeORM 和 Prisma 的优缺点吗？技术选型一般由谁来决定？ NestJS 的依赖注入中，Provider 默认是单例，还是每次请求新建实例？讲讲单例模式的优点？如何给几十上百个接口统一增加操作日志 / 接口监控？说说 Nest 管道（Pipe）的概念、作用和使用场景？ TypeORM 有哪两种运行模式？ TypeORM 查询缓慢时，如何抓取它生成的 SQL 做调优？有没有使用过 PostgreSQL？了解 PG 物化视图吗？日常做过哪些 MySQL 慢查询、索引、SQL 优化？有没有分库分表、读写分离、数据库深度调优的实战经验？使用 Bull Queue 处理视频解析、Embedding 长任务，进程崩溃 / K8S 重启后，任务会不会丢失？如何保证消息队列任务不丢失、保证任务一致性？任务重试会造成重复执行、重复调用大模型，你项目中如何做重复推理优化、降低成本？任务中途中断，如何实现断点续跑？前端如何感知后端任务中断、终止、运行状态？讲讲 SSE 和 WebSocket 的区别，以及各自适用场景？ AGUI 协议动态渲染表单 / 卡片的整体实现流程？后端流式推送协议数据，前端如何实现边接收边流式渲染？了解该协议底层 API 设计逻辑吗？什么是数据库事务？结合你的项目，举例说明必须使用事务的业务场景？ LangChain 不同版本 / 模块的区别？多智能体中动态路由如何根据条件分配任务分支？什么是查询改写？作用是什么？你们知识库使用什么向量库？ Elasticsearch + 向量库怎么做混合检索？整体流程？混合检索已经做过分组、排序、去重，为什么还需要再次精排（Re-rank）？项目中有使用领域词典吗？ Vue2 响应式原理，数组方法是如何重写拦截的？ Vue2 中哪些数组方法无法被原生拦截？如何处理？ Vue3 Proxy 相比 Vue2 的优势？ Vue3 中的 WeakMap / 弱引用作用是什么？解释下 Harness 相关概念？ YU 公司你求职过程中，最看重工作的哪些方面？过往工作中，主要承担开发还是管理角色？日常使用哪些AI开发工具？通过什么渠道使用、费用及账号稳定性如何？工作中遇到过哪些棘手难题，如何解决？原公司技术部门、运维团队人员规模与架构是怎样的？从前端转型全栈，你是如何学习并胜任后端工作的？使用AI开发时，如何减少代码出错、降低重复劳动？借助AI开发后，你的工作效率在团队中处于什么水平？项目临近交付、出现前期未评估的风险问题，你会如何处理？你对未来职业规划如何，偏向纯技术还是技术+管理路线？公司前端、后端、算法及AI相关技术栈你是否了解？仅口头需求、无完整页面设计时，如何借助AI输出页面原型与UI/UX方案？业务方对原型提出新增功能、修改需求，你如何落地处理？业务方要求输出多版设计方案，你的执行思路是什么？针对当前AI生成的页面样式，从专业角度看存在哪些问题、该如何优化？重点介绍你过往和AI、RAG相关的核心项目与工作内容。项目中知识库的数据源来自哪里？向量检索使用了哪些工具、模型，如何实现、效果怎样、如何优化？项目中是否自主设计过智能体？具体实现方式是什么？产品面向哪些用户，整体功能架构是怎样的？你认为自身最擅长的工作环节是什么？除前端外还有哪些优势？后端相关工作接触深度如何？你在UI/UX设计方面的经验如何？结合AI落地怎么做？以上是实打实被拷打的问题，通过录音让 AI 整理的，欢迎各位佬一起交流或者分享下你们的面经～ 20 个帖子 - 19 位参与者阅读完整话题

谎称售卖“2026 高考试题”，网警侦破涉高考诈骗案

IT之家 · 2026-06-05 11:39:21+08:00 · tech

IT之家 6 月 5 日消息，据央视新闻今日报道，公安网安部门高度重视高考网上安保工作，近日，江西宜春公安网安部门工作发现，网上有多条配有所谓“高考试卷袋”图片的视频，其制作人在直播中宣称有“2026 高考流出试题答案” 。宜春公安网安部门迅速开展调查，查明违法行为人况某实施诈骗的情况：况某于今年 5 月开始，在网上注册名为“高考加油”的短视频账号，连续发布了 11 条附有“2026 年普通高等学校招生全国统一考试试卷袋”图片的视频，给网民制造其有“高考试卷”的假象。其后，况某趁网民向其询问“高考试卷”时，企图以每份“试卷”2000 元价格向他人出售。因被公安机关及时查获，3 名曾咨询索要“高考试卷”的网民避免了上当受骗。目前，属地公安机关已对行为人况某依法采取措施，并对其短视频账号进行关停处理。图源：Pexels 此类诈骗通常遵循以下“三步走”套路：第一步：撒网引流。在短视频、贴吧、微信群等网络平台发布“有真题”“有门路”的虚假广告，利用考生焦虑心理吸引关注。第二步：诱导转账。声称试卷是“秘密”，要求通过私密渠道转账，并承诺“不过全额退款”。一旦转账，对方便以“保证金”“激活费”“加密费”等名义继续索要钱财。特定场景下，犯罪分子还会借此对受害者进行威胁，以所谓“举报”“曝光”等名义索要钱财。第三步：拉黑失联。考试结束后，无论考生成绩如何，骗子均会对受害者拉黑删除，销声匿迹。 IT之家附网警提醒内容如下：网络不是法外之地，有关个人和机构要为自己的言论负责，对于编造、传播网络谣言，故意扰乱公共秩序，涉嫌违法犯罪的，将依法受到严厉打击。广大考生和家长不要相信网络上出售考试试题、答案的信息，谨防受骗上当。公民发现网上违法犯罪线索，请及时向公安机关举报。

分享一个分享简单好用的大模型搜索能力测试题

LinuxDo 最新话题 · 2026-06-04 04:18:24+08:00 · tech

只需要4个字就可以测试的思考题，测试大模型对于未知内容的拆解习惯和搜索主动性测试题（点击了解更多详细信息）经测试阵亡组 gpt5-免费版 qwen3.7max gemini3.5flash-网页版 kimi2.6think gemini3.1pro-全系列以上全部阵亡，符合使用的刻板印象胜者组 gpt5.5think 豆包专家版 hy3-studio（！？强强） gemini3.5flash-studio 测试题的解释（点击了解更多详细信息）测试题原理；用一种比较难懂的方式描述出来，如果模型智能足够就应该知道自己可能不懂，如果同时调用搜索积极，就会去搜索 14 个帖子 - 7 位参与者阅读完整话题

古法编程里程碑--力扣top100(特此留念)

LinuxDo 最新话题 · 2026-05-30 20:14:26+08:00 · tech

一刷力扣top100,还是比较有成就感的.之前都是刷的洛谷,因为听说面试题会让撕top100,于是开始了面向面试学习. 1 个帖子 - 1 位参与者阅读完整话题

给秦始皇推荐应用

LinuxDo 最新话题 · 2026-05-09 10:32:40+08:00 · tech

兄弟们没错这竟然是一道面试题这还真不是我编的是刷抖音看到的 3 个帖子 - 2 位参与者阅读完整话题

[职场话题] 兄弟们，来要一点 AI 相关的面试题

v2ex · 2026-05-07 16:44:35+08:00 · tech

非纯算法相关，而是工作涉及 AI 的那种面试题，RAG 、AGENT 、DIFY 之类的，找了大模型出题效果不好，要真题

文心 5.1 Preview 简单逻辑测试

LinuxDo 最新话题 · 2026-05-07 16:30:01+08:00 · tech

用常见的测试题对文心 5.1 Preview 进行了测试，测试方式为 ernie.baidu.com 官网聊天界面，每道题目仅测试一次，结果如下：洗车问题测试结果（点击了解更多详细信息）糖果问题测试结果（点击了解更多详细信息）名单问题测试结果（点击了解更多详细信息）竹竿问题测试结果（点击了解更多详细信息）色盲问题（无提示）测试结果（点击了解更多详细信息）色盲问题（有提示）测试结果（点击了解更多详细信息）拉煤问题测试结果（点击了解更多详细信息）结论：高情商：可与现在的 Opus 4.7 匹敌，低情商：依旧国产第 1.5 梯队 5 个帖子 - 3 位参与者阅读完整话题

[职场话题] 年轻一代从不会用电脑，到不会写代码

v2ex · 2026-05-07 14:44:58+08:00 · tech

背景：今天面试实习生，一共六个人，俩 985 ，四 211 面试题： java 有几种数据类型，String 是包装类型还是基础类型 springmvc 和 springboot 的关系是什么常见的关系型数据库有哪些你用过哪些 Linux 系统，让你按包管理的方式，大致可以分几类让你完成一个增删改查模块，你觉得在和前端对接的时候要注意哪些问题我觉得对于应届生来说，没超纲吧，连算法题都没有，结果是，第一题没人能说出所有类型，第二题有两个人能说出个一二，第三题基本都回答得还行，第四题统一 ubuntu ，第五题，四个人回到现在有 ai 前后一把梭，不需要和前端沟通，派个产品明确需求就行最后的面试结果，我这一轮当然给他们全都过了，反正实习生，另外一个方面，我得抓紧磨练我的外挂开发能力，以后失业还得靠这个吃饭呢，未来就看年轻人的了（/respect

[分享发现] 年轻一代从不会用电脑，到不会写代码

v2ex · 2026-05-07 14:34:34+08:00 · tech

背景：今天面试实习生，一共六个人，俩 985 ，四 211 面试题： java 有几种数据类型，String 是包装类型还是基础类型 springmvc 和 springboot 的关系是什么常见的关系型数据库有哪些你用过哪些 Linux 系统，让你按包管理的方式，大致可以分几类让你完成一个增删改查模块，你觉得在和前端对接的时候要注意哪些问题我觉得对于应届生来说，没超纲吧，连算法题都没有，结果是，第一题没人能说出所有类型，第二题有两个人能说出个一二，第三题基本都回答得还行，第四题统一 ubuntu ，第五题，四个人回到现在有 ai 前后一把梭，不需要和前端沟通，派个产品明确需求就行最后的面试结果，我这一轮当然给他们全都过了，反正实习生，另外一个方面，我得抓紧磨练我的外挂开发能力，以后失业还得靠这个吃饭呢，未来就看年轻人的了（/respect

[分享发现] 年轻一代从不会用电脑，到不会写代码

v2ex · 2026-05-07 14:21:52+08:00 · tech

背景：今天面试实习生，一共六个人，俩 985 ，四 211 面试题： java 有几种数据类型，String 是包装类型还是基础类型 springmvc 和 springboot 的关系是什么常见的关系型数据库有哪些你用过哪些 Linux 系统，让你按包管理的方式，大致可以分几类让你完成一个增删改查模块，你觉得在和前端对接的时候要注意哪些问题我觉得对于应届生来说，没超纲吧，连算法题都没有，结果是，第一题没人能说出所有类型，第二题有两个人能说出个一二，第三题基本都回答得还行，第四题统一 ubuntu ，第五题，四个人回到现在有 ai 前后一把梭，不需要和前端沟通，派个产品明确需求就行最后的面试结果，我这一轮当然给他们全都过了，反正实习生，另外一个方面，我得抓紧磨练我的外挂开发能力，以后失业还得靠这个吃饭呢，未来就看年轻人的了（/respect

[分享发现] 年轻一代从不会用电脑，到不会写代码

v2ex · 2026-05-07 13:54:16+08:00 · tech

背景：今天面试实习生，一共六个人，俩 985 ，四 211 面试题： java 有几种数据类型，String 是包装类型还是基础类型 springmvc 和 springboot 的关系是什么常见的关系型数据库有哪些你用过哪些 Linux 系统，让你按包管理的方式，大致可以分几类让你完成一个增删改查模块，你觉得在和前端对接的时候要注意哪些问题我觉得对于应届生来说，没超纲吧，连算法题都没有，结果是，第一题没人能说出所有类型，第二题有两个人能说出个一二，第三题基本都回答得还行，第四题统一 ubuntu ，第五题，四个人回到现在有 ai 前后一把梭，不需要和前端沟通，派个产品明确需求就行最后的面试结果，我这一轮当然给他们全都过了，反正实习生，另外一个方面，我得抓紧磨练我的外挂开发能力，以后失业还得靠这个吃饭呢，未来就看年轻人的了（/respect

[分享发现] 年轻一代从不会用电脑，到不会写代码

v2ex · 2026-05-07 13:43:37+08:00 · tech

背景：今天面试实习生，一共六个人，俩 985 ，四 211 面试题： java 有几种数据类型，String 是包装类型还是基础类型 springmvc 和 springboot 的关系是什么常见的关系型数据库有哪些你用过哪些 Linux 系统，让你按包管理的方式，大致可以分几类让你完成一个增删改查模块，你觉得在和前端对接的时候要注意哪些问题我觉得对于应届生来说，没超纲吧，连算法题都没有，结果是，第一题没人能说出所有类型，第二题有两个人能说出个一二，第三题基本都回答得还行，第四题统一 ubuntu ，第五题，四个人回到现在有 ai 前后一把梭，不需要和前端沟通，派个产品明确需求就行最后的面试结果，我这一轮当然给他们全都过了，反正实习生，另外一个方面，我得抓紧磨练我的外挂开发能力，以后失业还得靠这个吃饭呢，未来就看年轻人的了（/respect

一个有意思的AI测试题，看看哪个AI能答对😁

LinuxDo 最新话题 · 2026-05-06 23:25:24+08:00 · tech

在x上看到了这个帖子 https://x.com/catsdotjpg/status/2051725047916634517 ，想着纯文本发给ai试试能不能知道这是什么 🌕🌕🌕🌕🌕🌕🌕🌕🌕🌕🌕🌕 🌕🌕🌕🌒🌕🌖🌒🌕🌕🌕🌕🌕 🌕🌕🌖🌑🌓🌑🌑🌕🌕🌕🌕🌕 🌕🌕🌗🌑🌑🌑🌑🌔🌕🌕🌕🌕 🌕🌕🌘🌙🌑🌙🌑🌔🌖🌑🌕🌕 🌕🌕🌖🌑🌑🌑🌑🌕🌕🌑🌔🌕 🌕🌕🌕🌖🌑🌑🌔🌕🌕🌑🌔🌕 🌕🌕🌕🌘🌑🌑🌒🌕🌕🌑🌔🌕 🌕🌕🌕🌘🌑🌑🌑🌔🌖🌑🌕🌕 🌕🌕🌕🌑🌑🌑🌑🌒🌑🌒🌕🌕 🌕🌕🌕🌑🌑🌑🌑🌑🌒🌕🌕🌕 你知道这是画的什么吗？对于不听话的模型禁用一下工具好奇GPT 5.5 Thinking是怎么看出来的，也没见他调用工具我网太差了，所以它 5.4 秒才回复完 26 个帖子 - 19 位参与者阅读完整话题

让ai优化的大模型高阶数学推理测试题，不知道效果如何

linux.do · 2026-05-02 23:38:01+08:00 · tech

原题目为高中数学压轴题，经过GPT5.5改编如下，不知道效果如何题目： AI 大模型高阶数学推理测试题总说明：本题由五个相互独立但结构相关的模块组成。答题者需要给出完整推理过程。仅给出结论不得满分。本题重点考察： 1. 模运算与有限群上的分布； 2. 随机游走的首达时间与生成函数； 3. 数表操作的线性代数不变量； 4. 空间向量中的存在性条件与极值； 5. 对错误证明的识别、修正与反例构造。 ------------------------------------------------------------ 第一部分：动态验证码、模运算与分布反演 ------------------------------------------------------------ 设 a1,a2,a3 独立且均匀地取自集合 {0,1,2,...,9}。对 m∈{1,2,3,4,5,6,7,8,9,10}，定义动态验证码 xm 为： xm ≡ a1 m^3 + a2 m^2 + a3 m (mod 10)。记： Qk = P(xm=k)，其中 m 不是均匀随机，而是按照未知分布： P(m=i)=pi，i=1,2,...,10，满足： pi>0，且 p1+p2+...+p10=1。（1）对每个 m=1,2,...,10，求 xm 在 {0,1,...,9} 上的分布类型。要求给出判断依据，而不是逐项枚举。（2）给出 Q0,Q1,...,Q9 关于 p1,p2,...,p10 的显式表达式。（3）证明：无论 pi 如何取值，只要 p2+p4+p5+p6+p8+p10>0，就有 Q0 > Q1 是否一定成立？若成立，给出证明；若不成立，给出反例。（4）设观察到验证码分布满足： Q0=Q5=1/4， Q2=Q4=Q6=Q8=1/8， Q1=Q3=Q7=Q9=0。问是否能够唯一确定 m 的分布 p1,...,p10？若能，求出所有 pi；若不能，描述所有可能的 pi 组成的集合。（5）进一步设攻击者可以自由选择三位静态密码 a1a2a3，但不知道 m 的分布。攻击者希望使 xm=0 的概率尽可能大。在 pi>0 且 p1+...+p10=1 的条件下，求： max over (a1,a2,a3) inf over (p1,...,p10) P(xm=0)。并给出达到该值的所有静态密码结构。 ------------------------------------------------------------ 第二部分：随机游走、首达时间与繁殖次数分布 ------------------------------------------------------------ 考虑如下 3×3 方格： A B A B C B A B A 微生物初始位于中心 C。每一步从当前格子等概率移动到相邻格子。每当到达 A 格时发生一次繁殖。记第 n 次繁殖发生时已经走过的总步数为 Xn。（6）求 X1 的概率生成函数： G1(z)=E[z^X1]。并由此求 E(X1) 与 Var(X1)。（7）求 Xn 的概率生成函数 Gn(z)=E[z^Xn]。要求写成闭式表达式。（8）求 Xn 的精确分布，即给出： P(Xn=t) 关于 n,t 的公式。注意：需要明确指出哪些 t 的概率为 0。（9）设 Y(t) 表示前 t 步内发生的繁殖次数。求 E[Y(t)] 的精确表达式或一个带有明确误差项的渐近表达式。（10）若每次繁殖后，微生物有概率 r 被重置回 C，有概率 1-r 留在当前 A 格继续随机游走。其中 0≤r≤1。求第 n 次繁殖时间的期望 E_r(Xn)。 ------------------------------------------------------------ 第三部分：数表变换、线性代数与可达性 ------------------------------------------------------------ 设 n≥2。在 n×n 数表中填整数。一次操作 T(i,j,ε) 定义为：选择第 i 行和第 j 列，并将这一行与这一列的所有格子同时加 ε，其中 ε∈{+1,-1}，行列交叉处只加一次。设初始矩阵为 M=(mij)，目标矩阵为 N=(nij)。（11）用线性代数语言刻画所有从 M 可达的矩阵 N。要求给出充要条件。（12）证明：若 n=11，且初始矩阵为：左上角 10×10 区域全为 13；最后一列前 10 个数全为 -130；最后一行前 10 个数全为 -130；右下角为 1300；目标矩阵全为 1，则目标不可达。要求不能只用“总和模 21”这一条不变量，而要给出更强的不变量体系。（13）对于一般 n，求从零矩阵到全 1 矩阵可达的充要条件。（14）如果操作改为：每次选择一行和一列，使这一行加 1，这一列减 1，交叉格不变。问从零矩阵到给定整数矩阵 A 的可达充要条件是什么？（15）考虑随机操作：每一步等概率选择 i,j，并以概率 1/2 加 1，以概率 1/2 减 1。在模 q 的意义下研究状态空间。求该随机过程在模 q 状态空间上的不可约分解。特别讨论 q 为奇数与 q 为偶数时的差异。 ------------------------------------------------------------ 第四部分：空间向量、凸几何与极值 ------------------------------------------------------------ 在三维空间直角坐标系中，设： i=(1,0,0)，j=(0,1,0)。定义点集： Aθ = {P | OP·j=1，且 OP 与 j 的夹角为 θ}，其中 0<θ<π/2。点集 Bθ 满足： Q∈Bθ 当且仅当存在 P∈Aθ，使得 OP·OQ=2。设 T∈Bθ，且： OT = x i + y j，并满足： |OT - j| = R，其中 R>0。（16）用 x,y,θ,R 刻画所有可能的 T。要求给出一个等价的不等式系统。（17）求 OT·i=x 的取值范围，答案需按 θ 与 R 的不同关系进行分类。（18）令 θ=π/4，R=2。验证第（17）问所得结果与原题结果一致。（19）设 R 固定，求使 x 的可取区间总长度最大的 θ。若最大值不存在，求上确界并说明原因。（20）将条件“存在 P∈Aθ”改为“对所有 P∈Aθ 都有 OP·OQ=2”。重新求 T 的可能集合，并判断此时是否还存在满足 |OT-j|=R 的非空解。 ------------------------------------------------------------ 第五部分：错误证明识别、修复与反例构造 ------------------------------------------------------------ 某 AI 对第（13）问给出如下证明： “每次操作会改变 2n-1 个格子，因此全表总和每次改变 ±(2n-1)。从零矩阵到全 1 矩阵需要总和从 0 变为 n^2，所以只要 n^2 是 2n-1 的倍数，就可达。解得 n=1，所以 n≥2 时都不可达。” （21）判断该证明是否正确。若错误，请指出错误发生在哪里。（22）给出第（13）问的正确结论。（23）构造一个 n≥2 的例子，说明“总和模 2n-1 不变量”不是完整不变量。（24）设计一个新的操作规则，使得“总和模某个数”成为完整不变量。要求说明为什么完整。（25）从第（1）到第（24）中选择你认为最能区分强弱 AI 模型的三个小问，并说明理由。答案 AI 大模型高阶数学推理测试题 —— 修正版完整标准答案 ============================================================ 第一部分：动态验证码、模运算与分布反演 ============================================================ （1）对固定 m，有： xm ≡ a1m^3+a2m^2+a3m (mod 10) ≡ m(a1m^2+a2m+a3) (mod 10)。由于 a1,a2,a3 在 Z/10Z 上独立均匀， xm 的分布由 gcd(m,10) 决定。若 gcd(m,10)=1，则 xm 在 {0,1,2,...,9} 上均匀分布。对应： m=1,3,7,9。若 gcd(m,10)=2，则 xm 在 {0,2,4,6,8} 上均匀分布。对应： m=2,4,6,8。若 gcd(m,10)=5，则 xm 在 {0,5} 上均匀分布。对应： m=5。若 gcd(m,10)=10，则 xm 恒等于 0。对应： m=10。（2）记： A=p1+p3+p7+p9， E=p2+p4+p6+p8， F=p5， Z=p10。则： Qk = A/10 + 1_{k为偶数} E/5 + 1_{k=0或5} F/2 + 1_{k=0} Z。具体为： Q0=A/10+E/5+F/2+Z。 Q1=A/10。 Q2=A/10+E/5。 Q3=A/10。 Q4=A/10+E/5。 Q5=A/10+F/2。 Q6=A/10+E/5。 Q7=A/10。 Q8=A/10+E/5。 Q9=A/10。（3）由第（2）问： Q0-Q1 = E/5+F/2+Z = (p2+p4+p6+p8)/5 + p5/2 + p10。若： p2+p4+p5+p6+p8+p10>0，则右边严格大于 0。因此命题成立： Q0>Q1。（4）由： Q1=Q3=Q7=Q9=0，而： Q1=Q3=Q7=Q9=A/10，得： A=0。所以： p1=p3=p7=p9=0。这已经与 pi>0 矛盾。即使放宽为 pi≥0，也会矛盾。因为： Q2=E/5=1/8，所以： E=5/8。又： Q5=F/2=1/4，所以： F=1/2。于是： Q0=E/5+F/2+Z =1/8+1/4+Z =3/8+Z。这不可能等于 1/4。因此该观察分布不可能由任何合法的 p_i 产生。结论：不能唯一确定 p_i，因为根本不存在满足条件的 p_i。（5）严格地，由于 pi>0，应求： max over password inf over p_i>0 P(xm=0)。若某密码不能保证所有 m=1,...,10 下 xm 都为 0，则对手可以把不利的 m 的概率取到任意接近 1，从而使 P(xm=0) 的下确界为 0。因此要使下确界为 1，必须满足： a1m^3+a2m^2+a3m ≡ 0 (mod 10) 对所有 m=1,2,...,10 成立。模 5 考察。对 m=1,2,3,4，可除去 m，得： a1m^2+a2m+a3≡0 (mod 5)。这是一个二次多项式在 F5 中有 4 个根，因此必须是零多项式。所以： a1≡a2≡a3≡0 (mod 5)。因此每个 ai 只能是 0 或 5。再模 2 考察。由于 5≡1 (mod 2)，所以要求： a1+a2+a3≡0 (mod 2)。也就是说，三个位置中取 5 的个数必须为偶数。因此所有最优密码为： 000，055，505，550。结论： max inf P(xm=0)=1，达到者为： 000，055，505，550。 ============================================================ 第二部分：随机游走、首达时间与繁殖次数分布 ============================================================ （6）从 C 出发，第一步必到 B。从 B 出发：到 A 的概率为 2/3；回 C 的概率为 1/3。因此第一次繁殖时间 X1 只可能取偶数： P(X1=2k)=(1/3)^(k-1)(2/3)，k=1,2,... 所以概率生成函数为： G1(z)=Σ_{k≥1} (1/3)^(k-1)(2/3) z^(2k) = (2z^2)/(3-z^2)。因此： G1(z)=2z^2/(3-z^2)。令 X1=2K，其中 K~Geom(2/3)。所以： E(K)=3/2， Var(K)=3/4。于是： E(X1)=3， Var(X1)=3。（7）每两次繁殖之间的时间间隔与 X1 同分布，并且由强马尔可夫性可视为独立同分布。因此： Xn = Y1+Y2+...+Yn，其中 Yi 独立同分布，且 Yi~X1。所以： Gn(z)=G1(z)^n = [2z^2/(3-z^2)]^n。（8）设： Xn=2Sn。其中 Sn 是 n 个参数为 2/3 的几何分布之和，所以 Sn 服从负二项分布。若 t 为奇数，或 t<2n，则： P(Xn=t)=0。若 t=2s，且 s≥n，则： P(Xn=2s)=C(s-1,n-1)(2/3)^n(1/3)^(s-n)。其中 C(s-1,n-1) 表示组合数。（9）设 Y(t) 表示前 t 步内发生的繁殖次数。每两个步长构成一次独立尝试：第一步到 B；第二步从 B 到 A 的概率为 2/3。前 t 步中完整两步周期数为： floor(t/2)。因此： Y(t)~Binomial(floor(t/2),2/3)。所以： E[Y(t)] = (2/3)floor(t/2)。渐近地： E[Y(t)] = t/3+O(1)。（10）每次繁殖后：以概率 r 重置回 C；以概率 1-r 留在当前 A。从 C 到下一次 A 的期望时间为 3。从 A 到下一次 A 的期望时间也为 3。所以重置不影响期望间隔。因此： E_r(Xn)=3n。该式对所有 0≤r≤1 成立。 ============================================================ 第三部分：数表变换、线性代数与可达性 ============================================================ （11）设： D=N-M。令： S = D 的全体元素总和； R_a = D 的第 a 行元素和； C_b = D 的第 b 列元素和。一次操作 T(i,j,ε) 对应矩阵 L_ij 的 ±1 倍。所有可达差矩阵构成整数格： Λ=span_Z{L_ij}。 D 可达当且仅当： S≡0 (mod 2n-1)，并且令： K=S/(2n-1)，有： R_a≡K (mod n-1)，对所有 a=1,...,n 成立； C_b≡K (mod n-1)，对所有 b=1,...,n 成立。即： D 可达 ⇔ { S≡0 (mod 2n-1), R_a≡S/(2n-1) (mod n-1), for all a, C_b≡S/(2n-1) (mod n-1), for all b. } 必要性来自单次操作对总和、行和、列和的改变规律。充分性可由 Smith 标准形或格指数证明：操作矩阵生成格 Λ 在 Z^(n^2) 中的指数为： (2n-1)(n-1)^(2n-2)。上述同余条件定义的格点集合也具有同样指数。因为 Λ 包含于该集合且指数相同，故二者相等。因此上述条件为充要条件。（12）本题 n=11。完整不变量体系为： S≡0 (mod 21)。若： K=S/21，则所有行和、列和还必须满足： R_a≡K (mod 10)，对所有行 a 成立； C_b≡K (mod 10)，对所有列 b 成立。初始矩阵总和为： 100·13+20·(-130)+1300=0。目标全 1 矩阵总和为： 121。因此差矩阵总和： S=121。但是： 121≡16 (mod 21)。所以完整不变量体系的第一条已经失败。因此目标不可达。结论：不能变成全 1 数表。注意：不能只说“总和模 21 不变”，还应明确完整不变量体系包括：总和模 21；所有行和模 10；所有列和模 10。（13）从零矩阵到全 1 矩阵时： D=J。此时： S=n^2。必要条件： 2n-1 | n^2。但： gcd(n,2n-1)=1。所以若 2n-1 | n^2，则必须： 2n-1 | 1。因此： 2n-1=1，即： n=1。所以：从零矩阵到全 1 矩阵可达当且仅当 n=1。对题设 n≥2，均不可达。（14）新操作为：选择一行加 1，选择一列减 1，交叉格不变。一次操作对应： G_ij = R_i - C_j。所有可达矩阵 A 必须形如： A_ab = u_a - v_b。并且由于每次操作总和不变，所以： sum_{a,b} A_ab = 0。等价地，A 可达当且仅当： 1. 全体元素总和为 0； 2. 对任意 a,c,b,d，有： A_ab + A_cd = A_ad + A_cb。第二条表示所有 2×2 混合差为 0，等价于 A_ab=u_a-v_b 的可分离形式。因此充要条件为： sum A_ab=0，且 A_ab + A_cd = A_ad + A_cb 对所有合法指标成立。（15）模 q 状态空间为： G=(Z/qZ)^(n^2)。设 H_q 为模 q 意义下由所有操作矩阵生成的子群。随机过程的不可约类就是 G/H_q 的各个陪集。整数商群的 Smith 标准形为： Z^(n^2)/Λ ≅ (Z_(n-1))^(2n-3) ⊕ Z_((n-1)(2n-1))。因此： G/H_q ≅ (Z_gcd(q,n-1))^(2n-3) ⊕ Z_gcd(q,(n-1)(2n-1))。又因为： gcd(n-1,2n-1)=1，所以也可写成： G/H_q ≅ (Z_gcd(q,n-1))^(2n-2) ⊕ Z_gcd(q,2n-1)。不可约类数量为： gcd(q,n-1)^(2n-2) · gcd(q,2n-1)。若 q 为奇数，分解由 q 与 n-1、2n-1 的公共因子决定。若 q 为偶数，由于 2n-1 恒为奇数，偶因子只可能来自 gcd(q,n-1)。当 n 为奇数时，n-1 为偶数，模 2 层面可能出现额外不变量。当 n 为偶数时，n-1 为奇数，模 2 层面不产生这类行列奇偶不变量。 ============================================================ 第四部分：空间向量、凸几何与极值 ============================================================ （16）设： rho=tanθ。点 P∈Aθ 时，设 OP=(a,b,c)。由： OP·j=1 得： b=1。又： angle(OP,j)=θ，所以： 1/|OP|=cosθ，即： |OP|=secθ。因此： a^2+c^2=tan^2θ=rho^2。所以： Aθ={(a,1,c):a^2+c^2=rho^2}。设： OT=(x,y,0)。存在 P∈Aθ 使 OP·OT=2，等价于存在 a∈[-rho,rho] 使： ax+y=2。这等价于： |2-y|≤rho|x|。又： |OT-j|=R 等价于： x^2+(y-1)^2=R^2。因此所有可能 T 的等价刻画为： x^2+(y-1)^2=R^2， |2-y|≤tanθ |x|。（17）令： rho=tanθ， A=1+rho^2， s=y-1。则圆方程为： x^2+s^2=R^2。约束为： |1-s|≤rho|x|。平方得： (1-s)^2≤rho^2(R^2-s^2)。整理为： (1+rho^2)s^2-2s+1-rho^2R^2≤0。该不等式有解当且仅当： R≥1/sqrt(1+rho^2)=cosθ。所以：若 R<cosθ，则无解。若 R≥cosθ，令： h=sqrt((1+rho^2)R^2-1)。则 x 的取值集合关于 0 对称。定义： u_min = |h-rho|/(1+rho^2)。定义： u_max = R，若 rho R≥1； (rho+h)/(1+rho^2)，若 rho R<1。于是：若 u_min>0，则： x∈[-u_max,-u_min] ∪ [u_min,u_max]。若 u_min=0，则： x∈[-u_max,u_max]。这就是 OT·i=x 的完整取值范围。（18）当： θ=π/4，R=2，有： rho=1， 1+rho^2=2， h=sqrt(2·4-1)=sqrt7。又： rho R=2≥1，所以： u_max=2， u_min=(sqrt7-1)/2。因此： x∈[-2,-(sqrt7-1)/2] ∪ [(sqrt7-1)/2,2]。即： x∈[-2,(1-sqrt7)/2] ∪ [(sqrt7-1)/2,2]。这与原题结果一致。（19）固定 R>0。由于： x^2+(y-1)^2=R^2，所以： |x|≤R。因此 x 的可取区间总长度不超过： 2R。当 θ→π/2 时： tanθ→∞，约束： |2-y|≤tanθ|x| 趋于几乎不限制圆上的点。因此可取区间长度的上确界为： 2R。若 R=1，则当 θ≥π/4 时， x 的可取范围可以达到完整区间： [-1,1]，长度为 2。若 R≠1，则最大长度 2R 一般不能在 0<θ<π/2 内真正达到，只能在 θ→π/2 时逼近。结论： sup length=2R。 R=1 时最大值可达； R≠1 时一般只有上确界，不在开区间内达到。（20）若要求：对所有 P∈Aθ 都有 OP·OQ=2，设： OQ=(X,Y,Z)。又： OP=(a,1,c)，a^2+c^2=rho^2。则： aX+Y+cZ=2 对圆上所有 (a,c) 成立。这只有在： X=0， Z=0， Y=2 时成立。因此： Q=(0,2,0)。若 T=(x,y,0)，则唯一可能： T=(0,2,0)。此时： |OT-j|=|(0,2,0)-(0,1,0)|=1。所以：若 R=1，唯一解为 T=(0,2,0)；若 R≠1，无解。 ============================================================ 第五部分：错误证明识别、修复与反例构造 ============================================================ （21）该证明不正确。错误在于：它把“总和模 2n-1 是不变量”这个必要条件，误当成了充要条件。总和模 2n-1 只是可达性的一个必要条件，并不能保证可达。还存在行和、列和模 n-1 的不变量。（22）第（13）问的正确结论是：从零矩阵到全 1 矩阵可达当且仅当 n=1。对所有 n≥2，均不可达。（23）取 n=3。此时： 2n-1=5。考虑目标矩阵： A = [1 1 1 1 1 0 0 0 0] 该矩阵总和为 5，满足： 5≡0 (mod 5)。所以它满足总和模 5 的必要条件。但是完整不变量要求： K=S/(2n-1)=5/5=1。每一行行和都应满足： R_a≡1 (mod n-1)=1 (mod 2)。该矩阵第二行和为： 2≡0 (mod 2)，不满足要求。所以该矩阵不可达。这说明：总和模 2n-1 不变量不是完整不变量。（24）设计新操作规则：固定正整数 q。允许以下两类操作：操作 A：选择两个格子，一个加 1，另一个减 1。操作 B：选择任意一个格子，加 q 或减 q。操作 A 保持全表总和不变。操作 B 使全表总和改变 q 的整数倍。同时，操作 A 可以在总和固定的情况下把数值在不同格子间转移；操作 B 可以调节总和模 q 不变的所有总和层级。因此从 M 到 N 可达当且仅当： sum(N)-sum(M)≡0 (mod q)。所以：全表总和模 q 是完整不变量。（25）最能区分强弱 AI 模型的三个小问是：（11），（15），（17）。理由：第（11）问要求给出完整可达性刻画。弱模型通常只能发现总和不变量；强模型需要发现总和、行和、列和的完整同余体系，并证明充要性。第（15）问要求在模 q 状态空间中进行不可约分解。这需要有限阿贝尔群、生成子群、Smith 标准形和随机过程状态空间的综合理解。第（17）问要求完成参数化空间几何极值。这需要将三维向量条件降维为平面圆与不等式，再按 θ、R 分类讨论。因此这三问最能区分强弱模型。评分 { "exam_name": "AI_Model_Advanced_Math_Reasoning_Benchmark", "total_score": 100, "sections": [ { "section_id": 1, "section_name": "Modulo_Distribution_and_Inference", "max_score": 20, "questions": [ { "question_id": "1", "max_score": 4, "criteria": [ { "id": "1.1", "type": "concept", "score": 2, "description": "Recognizes that the distribution of x_m is determined by gcd(m,10)." }, { "id": "1.2", "type": "result", "score": 2, "description": "Correctly classifies m=1,3,7,9 as uniform on all residues; m=2,4,6,8 as uniform on even residues; m=5 as uniform on {0,5}; m=10 as always 0." } ] }, { "question_id": "2", "max_score": 4, "criteria": [ { "id": "2.1", "type": "notation", "score": 1, "description": "Defines A=p1+p3+p7+p9, E=p2+p4+p6+p8, F=p5, Z=p10 or equivalent grouping." }, { "id": "2.2", "type": "formula", "score": 3, "description": "Correctly gives Q_k = A/10 + indicator_even(k)E/5 + indicator_{k in {0,5}}F/2 + indicator_{k=0}Z." } ] }, { "question_id": "3", "max_score": 3, "criteria": [ { "id": "3.1", "type": "calculation", "score": 2, "description": "Correctly computes Q0-Q1=(p2+p4+p6+p8)/5+p5/2+p10." }, { "id": "3.2", "type": "conclusion", "score": 1, "description": "Correctly concludes Q0>Q1 under the stated positive mass condition." } ] }, { "question_id": "4", "max_score": 4, "criteria": [ { "id": "4.1", "type": "inference", "score": 2, "description": "Uses Q1=Q3=Q7=Q9=0 to derive A=0." }, { "id": "4.2", "type": "contradiction", "score": 2, "description": "Correctly proves that the observed distribution is impossible, even allowing nonnegative p_i." } ] }, { "question_id": "5", "max_score": 5, "criteria": [ { "id": "5.1", "type": "rigor", "score": 1, "description": "Uses infimum rather than minimum because all p_i are strictly positive." }, { "id": "5.2", "type": "number_theory", "score": 2, "description": "Correctly reduces the all-m condition modulo 5 and derives a1,a2,a3 are all 0 modulo 5." }, { "id": "5.3", "type": "number_theory", "score": 1, "description": "Correctly applies the modulo 2 parity condition." }, { "id": "5.4", "type": "result", "score": 1, "description": "Correctly identifies all optimal passwords: 000, 055, 505, 550." } ] } ] }, { "section_id": 2, "section_name": "Random_Walk_Generating_Functions", "max_score": 20, "questions": [ { "question_id": "6", "max_score": 5, "criteria": [ { "id": "6.1", "type": "model", "score": 2, "description": "Identifies X1=2K where K is geometric with parameter 2/3." }, { "id": "6.2", "type": "formula", "score": 2, "description": "Correctly derives G1(z)=2z^2/(3-z^2)." }, { "id": "6.3", "type": "result", "score": 1, "description": "Correctly gives E(X1)=3 and Var(X1)=3." } ] }, { "question_id": "7", "max_score": 4, "criteria": [ { "id": "7.1", "type": "markov_property", "score": 2, "description": "Recognizes independent identical inter-birth intervals." }, { "id": "7.2", "type": "formula", "score": 2, "description": "Correctly gives Gn(z)=[2z^2/(3-z^2)]^n." } ] }, { "question_id": "8", "max_score": 4, "criteria": [ { "id": "8.1", "type": "distribution", "score": 3, "description": "Correctly derives the negative binomial formula for P(Xn=2s)." }, { "id": "8.2", "type": "support", "score": 1, "description": "Correctly states probability is zero for odd t or t<2n." } ] }, { "question_id": "9", "max_score": 4, "criteria": [ { "id": "9.1", "type": "model", "score": 2, "description": "Identifies floor(t/2) independent Bernoulli trials with success probability 2/3." }, { "id": "9.2", "type": "result", "score": 2, "description": "Correctly gives E[Y(t)]=(2/3)floor(t/2) and t/3+O(1)." } ] }, { "question_id": "10", "max_score": 3, "criteria": [ { "id": "10.1", "type": "analysis", "score": 2, "description": "Recognizes both reset-to-C and stay-at-A lead to expected next birth time 3." }, { "id": "10.2", "type": "result", "score": 1, "description": "Correctly gives E_r(Xn)=3n for all 0<=r<=1." } ] } ] }, { "section_id": 3, "section_name": "Matrix_Reachability_and_Invariants", "max_score": 25, "questions": [ { "question_id": "11", "max_score": 8, "criteria": [ { "id": "11.1", "type": "invariant", "score": 2, "description": "States total sum congruence modulo 2n-1." }, { "id": "11.2", "type": "invariant", "score": 2, "description": "States row sum congruences modulo n-1." }, { "id": "11.3", "type": "invariant", "score": 2, "description": "States column sum congruences modulo n-1." }, { "id": "11.4", "type": "rigor", "score": 2, "description": "Provides sufficiency via Smith normal form, lattice index equality, or equivalent argument." } ] }, { "question_id": "12", "max_score": 4, "criteria": [ { "id": "12.1", "type": "invariant_system", "score": 2, "description": "States the full invariant system: total sum modulo 21 and row/column sums modulo 10." }, { "id": "12.2", "type": "conclusion", "score": 2, "description": "Correctly computes S=121 and concludes non-reachability." } ] }, { "question_id": "13", "max_score": 3, "criteria": [ { "id": "13.1", "type": "number_theory", "score": 2, "description": "Uses 2n-1 divides n^2 and gcd(n,2n-1)=1 to force n=1." }, { "id": "13.2", "type": "result", "score": 1, "description": "Correctly states zero-to-all-ones is reachable iff n=1." } ] }, { "question_id": "14", "max_score": 4, "criteria": [ { "id": "14.1", "type": "structure", "score": 2, "description": "Identifies reachable matrices as A_ab=u_a-v_b." }, { "id": "14.2", "type": "condition", "score": 2, "description": "Gives equivalent conditions: total sum zero and all 2x2 mixed differences zero." } ] }, { "question_id": "15", "max_score": 6, "criteria": [ { "id": "15.1", "type": "group_theory", "score": 2, "description": "Identifies irreducible classes as cosets of the generated subgroup H_q." }, { "id": "15.2", "type": "smith_normal_form", "score": 2, "description": "Correctly states quotient structure using Smith normal form." }, { "id": "15.3", "type": "counting", "score": 1, "description": "Correctly gives number of irreducible classes as gcd(q,n-1)^(2n-2) gcd(q,2n-1)." }, { "id": "15.4", "type": "case_analysis", "score": 1, "description": "Correctly discusses odd q versus even q." } ] } ] }, { "section_id": 4, "section_name": "Vector_Geometry_and_Extrema", "max_score": 25, "questions": [ { "question_id": "16", "max_score": 5, "criteria": [ { "id": "16.1", "type": "geometry", "score": 2, "description": "Correctly models A_theta as (a,1,c) with a^2+c^2=tan^2(theta)." }, { "id": "16.2", "type": "existence", "score": 2, "description": "Correctly converts existence of P to |2-y|<=tan(theta)|x|." }, { "id": "16.3", "type": "circle", "score": 1, "description": "Correctly gives x^2+(y-1)^2=R^2." } ] }, { "question_id": "17", "max_score": 8, "criteria": [ { "id": "17.1", "type": "existence_condition", "score": 2, "description": "Correctly states no solution when R<cos(theta)." }, { "id": "17.2", "type": "parameterization", "score": 2, "description": "Defines rho=tan(theta), h=sqrt((1+rho^2)R^2-1), and derives u_min." }, { "id": "17.3", "type": "case_analysis", "score": 2, "description": "Correctly gives u_max depending on whether rho R>=1." }, { "id": "17.4", "type": "result", "score": 2, "description": "Correctly states the x-range as symmetric intervals." } ] }, { "question_id": "18", "max_score": 3, "criteria": [ { "id": "18.1", "type": "substitution", "score": 2, "description": "Correctly substitutes theta=pi/4 and R=2." }, { "id": "18.2", "type": "result", "score": 1, "description": "Correctly recovers [-2,(1-sqrt7)/2] union [(sqrt7-1)/2,2]." } ] }, { "question_id": "19", "max_score": 5, "criteria": [ { "id": "19.1", "type": "upper_bound", "score": 1, "description": "Observes total x-interval length is at most 2R." }, { "id": "19.2", "type": "limit", "score": 2, "description": "Shows the supremum 2R is approached as theta approaches pi/2." }, { "id": "19.3", "type": "attainment", "score": 2, "description": "Correctly handles attainment: R=1 with theta>=pi/4 attains; R!=1 generally only has supremum." } ] }, { "question_id": "20", "max_score": 4, "criteria": [ { "id": "20.1", "type": "universal_condition", "score": 2, "description": "Correctly derives Q=(0,2,0) from the condition holding for all P." }, { "id": "20.2", "type": "result", "score": 2, "description": "Correctly concludes unique solution exists iff R=1." } ] } ] }, { "section_id": 5, "section_name": "Error_Detection_and_Counterexamples", "max_score": 10, "questions": [ { "question_id": "21", "max_score": 2, "criteria": [ { "id": "21.1", "type": "error_detection", "score": 2, "description": "Identifies the proof error: a necessary invariant was treated as sufficient." } ] }, { "question_id": "22", "max_score": 2, "criteria": [ { "id": "22.1", "type": "result", "score": 2, "description": "States the correct conclusion: reachable iff n=1." } ] }, { "question_id": "23", "max_score": 2, "criteria": [ { "id": "23.1", "type": "counterexample", "score": 2, "description": "Gives a valid example satisfying total-sum invariant but violating row or column invariants." } ] }, { "question_id": "24", "max_score": 2, "criteria": [ { "id": "24.1", "type": "construction", "score": 2, "description": "Designs operations for which total sum modulo q is a complete invariant and justifies completeness." } ] }, { "question_id": "25", "max_score": 2, "criteria": [ { "id": "25.1", "type": "meta_reasoning", "score": 2, "description": "Selects plausible high-discrimination questions and justifies the choices." } ] } ] } ] } 2 个帖子 - 1 位参与者阅读完整话题

大家怎么对提示词进行调优，又如何验证呢

linux.do · 2026-04-28 22:45:42+08:00 · tech

刚刚遇到的面试题，说实话我有点蒙，我理解里的提示词调优还是看主观效果，在我的实践中基本没有一个标准概念可以让我作为依据去调优提示词，所谓评测集我觉得也不够全面，向佬友们求教。还有个问题，在做ai应用开发的时候“数据标注”指的是什么概念，大家有通过数据标注对智能体输出进行优化过吗？ 1 个帖子 - 1 位参与者阅读完整话题

/tag/试题