这种盛况真的很难再复现了吧,除了上次那次把奥特曼和他团队的人一起拉进的那次之外,好像也就这次了? (os:17w 多的人没有一个是付费的哈哈哈,除了开 team 的那个,这波我给到夯,可惜大手还是发力了,虽然已经在里面的还能用就是了) 1 个帖子 - 1 位参与者 阅读完整话题
各位能复现吗?
any 超过300s 524,我已找到明确问题是什么,确认是any 解密thinking的bug。请相关人员明确证明身份联系我。 7 个帖子 - 7 位参与者 阅读完整话题
感谢L站,高中生拿下广东省粤港澳学生科创大赛智能体冠军 搞七捻三 感谢L站,高中生拿下广东省粤港澳学生科创大赛智能体冠军 跟着站内佬友学了很多agent编排的干货 这下真的是 学AI 上L站了 [wxcamera1780113637533] 还剪了一个两分多钟的冠军速通第一视角vlog,发在视频号了 补充 很多佬友想要赛题,我周一回学校整理一下发出来给大家。 其实题目场景并不难,但是组委会限定用qwen3.5 2B Q4量化… 很多佬想要题目,今天整理了一下打包给到大家 其实场景并不是很难,毕竟是省教育厅面向小学到高中的比赛,需要兼顾各个年龄段 这个应该是全国范围内教育局最早推出的智能体比赛,大家都在摸索中 但是比赛现场要求全程离线,没办法vibe coding,只能自己手搓 而且限定智能体使用qwen3.5:2b q4量化作为基座,这种小模型上下文一场就会崩,逻辑能力几乎等于零,格式输出也经常炸 而且限时250min完成比赛,还有一些答辩的环节,平摊下来给到一题的时间就40~50min,在当时120多只队伍的现场确实还挺紧张的 这里是完整题包,包含测试程序,相信佬们可以轻轻松松满分复现 最终的产物需要搭建一个本地服务调用智能体,详见下文 2026 年广东省学生信息科技创新大赛-智能体设计与应用项目.zip (21.8 KB) 压缩包里有最终测试的裁判机程序,每题有十个检查点,每点10分 题目描述 赛项:2026 年广东省学生信息科技创新大赛——智能体设计与应用项目 场景:家用电器说明书阅读智能体\ 数据:基于真实电磁炉说明书(型号 HI1995G 等) 场景 本次任务围绕“家用电器说明书阅读智能体”展开。裁判机下发一份家用电器的说明书(JSON 格式),智能体需要阅读说明书内容并回答用户问题。 重要要求:智能体必须调用大语言模型,赛后将对参赛队伍提交的程序进行核验;若未调用大模型(纯规则/纯程序解),将按违规处理并不得分。 API 接口格式 裁判机 POST → 智能体 ip:端口/solve 请求体:{ "task_id": "T1", "input": { "说明书": { ... }, "问题": "...", "选项": { ... } } } 响应体:{"answer": 答案} 答案类型必须严格遵守各题要求,裁判机用 == 直接比对,不能有任何额外文字或格式错误。若该轮题目无法唯一确定答案或数据不足,返回 {"answer": "不确定"} 。 计时规则:5 秒为软超时起点,超过 5 秒开始按秒扣分(超出部分按秒向上取整,每轮最多扣 10 分);超过 15 秒(5+10)则该轮 0 分。 输入数据中(10组测试数据中一部分)的 说明书 可能包含较长的说明文字:注意事项、故障排查、售后条款等字段。 任务零(T0):握手测试 (点击了解更多详细信息) 任务一(T1):信息提取 (点击了解更多详细信息) 任务二(T2):条件判断 (点击了解更多详细信息) 任务三(T3):排序 (点击了解更多详细信息) 任务四(T4):判断推理 (点击了解更多详细信息) 任务五(T5):综合应用 (点击了解更多详细信息) 2 个帖子 - 2 位参与者 阅读完整话题
之前那版太像“丢个附件完事”了,重写一下。 这份 PPT 是给那种情况用的:论文读完了,方法也大概懂了,但一打开编辑器就不知道从哪写。尤其是强化学习复现,最容易一上来就让 Codex 生成 train.py ,然后报错一堆,最后自己也说不清 Env、reward、算法到底哪里偏了。 我整理这份的思路很简单:别让 Codex 一次性“复现论文”,而是把论文拆成一组能验证的小任务。每一步都能跑、能检查、能继续改,这样才不容易变成玄学调参。 如果只想快速看重点,建议先看 P04、P10-P15、P18。 P01 封面:先把任务说清楚 这不是“AI 自动复现论文”的鸡血课件,重点是怎么让 Codex 做工程助手,而不是让它替你理解论文。 P02 目录:三段路 先搭 RL 代码骨架,再把论文方法拆到代码,最后用训练曲线判断有没有学起来。 P03 第一步先别写代码 强化学习复现第一件事不是写算法,而是把 Env、Agent、训练循环、评估拆开。 P04 最值得看的总图 这页是整份课件的骨架:论文 Methods 里的系统模型、MDP、算法、实验设置,分别应该落到哪个代码模块。 P05 Gym Env 是地基 Env 写错了,后面 PPO 再漂亮也没用。这页可以拿来检查 observation、action、reward、info 有没有对应论文。 P06 先判断算法类型 很多复现卡住不是代码问题,是动作空间和算法骨架没对上。先分清离散/连续,再选 PPO、SAC、DQN。 P07 为什么用 CleanRL CleanRL 的好处是透明,单文件好改,适合和论文伪代码一项项对。不是说它万能,而是方便拆。 P08 Codex 应该站在哪 Codex 适合生成、运行、修 bug、做一致性检查;论文边界和公式真假还是要人来把关。 P09 第二部分开始落地 从这里开始,不再讲概念,转成一组可以直接复制改的 prompt。 P10 五步拆法 Env、Reward、算法接入、启动检查、报错修复。每一步都有产物,别让任务糊成一团。 P11 Prompt 1:只写 Env 这个 prompt 的关键是“只实现 Env”。先把交互接口跑通,别同时要 PPO、画图、实验报告。 P12 Prompt 2:单独查 reward reward 最容易被模型写得像那么回事但其实没对齐论文。这一步要把分项和 info 都留出来查。 P13 Prompt 3:接 CleanRL 这里让 Codex 自己看 CleanRL,但要求它说明选哪个骨架、为什么选,避免盲改。 P14 Prompt 4:先 smoke test 不要上来长训。先验证上下层 observation、action、reward、done、info 都能走通。 P15 Prompt 5:报错不是失败 这一页很实用:把 traceback 当下一轮输入,让 Codex 顺着错误修,直到 smoke test 过。 P16 第三部分:别只看能不能跑 代码跑起来只是第一关,RL 还要看曲线、loss、指标,不然很可能是在随机游走。 P17 监控工具怎么选 一个人本地调参 TensorBoard 够用,团队/多实验追踪再考虑 W&B、MLflow、Aim。 P18 怎么看训练曲线 RL 回报有噪声正常,关键看平滑趋势有没有上升、后期有没有平台。 P19 总结:复现是闭环 论文拆解、代码生成、运行报错、修复验证、训练监控,这条链闭上才算靠谱。 P20 最后一页 如果佬友手上有具体论文,可以按这个结构把 Methods 先拆一遍,再喂给 Codex。 原 PPT 放这里,站内不让传 pptx,所以 zip 里就是原文件: 从论文到代码.zip (184 KB) 如果你也在复现 RL/优化类论文,建议别急着要完整代码,先按 P10 那个五步拆一遍。这样 Codex 才是真的省时间,不是帮你制造一堆更难查的 bug。 1 个帖子 - 1 位参与者 阅读完整话题
各位能复现吗?
全程没截图就被封了,只能口述了 本来是看到一个帖子,说今天free只能用5.5,5.4用不了了 我就打开自己的sub2api测试一下, 弄了3个号测试,前2个5.4都是返回的400,确实今天不能用5.4了 API returned 400: {“detail”:“The ‘gpt-5.4’ model is not supported when using Codex with a ChatGPT account.”} 然后换了个号测试5.5的链接,发了个hi,正常返回了 然后这个号测试5.4,返回的是401,感觉奇怪不应该是400么 再切回5.5,也是401了,这个号就gg了 这些号都活了快一个月了,不理解 11 个帖子 - 8 位参与者 阅读完整话题
复现步骤:任意搜索代码有依赖下面几个类的地方,你会发现报红了:Cannot resolve symbol 'ProceedingJoinPoint' import org.aspectj.lang.ProceedingJoinPoint; import org.aspectj.lang.annotation.Around; import org.aspectj.lang.annotation.Aspect; import org.aspectj.lang.annotation.Pointcut;
想请教一下各位佬,有没有用过开源的针对协议复现api开发的skill,就是web端逆向之后协议复现感觉很麻烦,直接让ai开发又写的很乱,代码风格一点看不下去,想知道有没有专门这种针对协议复现api开发的skill 1 个帖子 - 1 位参与者 阅读完整话题
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现
阿里云官方 ubuntu server 26.04 lts 镜像 装完系统,默认 shell 提示符: 都不测试的吗? 已反复测试 可复现