大约一年前,我决定了目标是网安方向,理由大致如下: 我很喜欢计算机相关的东西,所以一定一定想走相关专业 但就了解到的信息,经典的软件工程这方面就业是越来越难了,再加上AI的冲击,即使技术过硬,想当传统码农也不容易了。所以就Pass了 人工智能是个显而易见的风口,但就是太显而易见了,毫无疑问的什么奇奇怪怪的人都会往这挤,且不说竞争太激烈,我想学风大概一般,所以放在最末尾考虑的位置 所以这么看来,再一个热门还有点前景的方向就是网安了。 那么,我一开始觉得网安有什么优势呢? 顺着人工智能的思路去想,我觉得AI和网安其实是矛和盾的关系,AI越能挖漏洞,不越需要网安人才么?所以这让我觉得它的就业前景不说会变好,起码不容易像隔壁一样恶化 兴趣是很重要的东西。学网安,怎么看都比学别的好玩点 实在不行,我学完去考公。技术岗的竞争大概还是温和点的,而且这和AI就没什么大关系了 当然,以上有些想法可能有些幼稚,抑或有些偏颇。一年过去,有些心境发生了变化,有些疑问也存在。 现在看来,AI对底层网安的冲击还是相当猛烈的,仅仅比普通码农们晚了个把月而已。 但我又觉得“矛和盾”的想法应该还是正确的。未来,脚本小子更容易当,初级漏洞扫描不需要人工,但安全专家的需求我想依然是会扩大的。 所以,现在看到一些唱衰网安的讨论,总还是略显迷茫。这个道路到底对不对? 另:估分590上下,211水平 17 个帖子 - 15 位参与者 阅读完整话题
问一下各位佬,win11环境使用codex桌面端,开启目标追求模式,后续在修改代码文件时总会提示是否允许修改,已经开启完全访问权限,怎么还会这样 2 个帖子 - 2 位参与者 阅读完整话题
定一个目标发布循环指令 中途断开 让制定一个计划按照计划执行 也是只执行第一个任务 立马断开 这有个毛线用 只能沦为反代的羊毛吧 气死了 感觉在和一个弱智在沟通 1 个帖子 - 1 位参与者 阅读完整话题
自从出了goal之后,发现codex+gpt始终提醒自己当前目标是什么,逐步到最开始你想要实现的goal,然后感觉好像挺美的,但是后面用了一段时间,又发现他也只是记住了goal。然后把codex+opus也试了一下还不如codex+gpt,又试了claude+gpt发现也还不错,然后claude+opus也有他的长处,我感觉有些纠结了,佬友们都是怎么选的呢? 8 个帖子 - 8 位参与者 阅读完整话题
想开源一个ATrust的docker实现。把ATrust装进docker进行分流控制,同时不影响代理软件使用TUN模式。 但是好像没法选择对应分类,不是很清楚为什么? 1 个帖子 - 1 位参与者 阅读完整话题
佬们,我是新来的,我想问一下你们用codex上瘾吗?我不喜欢用cli,就喜欢用codex app。然后开追求目标“继续推进”。一直跑啊跑,然后刚接触codex的时候,我想做个本地区社区项目,当时没有goal模式呢吧。我就输入继续推进,然后输入一堆让它排队去。这一个多月以来,也用了不少中转站。但始终没让我的codex停下工作。上班开着(本人上班比较清闲,处于系统没事我没事的状态,比如昨天,修复了个select下拉框bug,就是说工作当中,随便跑一下就够了,几百万token就能解决。)gpt-image2出来的时候我还做了一百套表情包。然后继续跑我的社区项目。总之上班看看它,尤其到下班,我还得拿着笔记本回家。然后看看它。自从goal开启,它无时无刻不停止 。我游戏里都不充值了,中转站花了一千多了。晚上偶尔看看它在动么,然后12点左右睡前在看看,3点多醒了还看看。。。。。。。这个9天是我刚学会goal模式跑的,前面都是手动。现在感觉比看娃都累,感冒两次了,尤其这次感觉身心疲惫。我感觉它能跑,我都快熬不住了。。。。。废话很多,但你们像我一样上瘾吗? 我现在悟了,一定要照顾好自己身体。医生说我肺伤了,我特么的都不知道咋伤的,总感觉最近咳嗽。。。。。。 1 个帖子 - 1 位参与者 阅读完整话题
设置好了codex目标,本想让他一直执行的,结果运行沙箱外的命令就会让我确认,睡一觉起来大半时间都是卡在确认提醒,啊这!!! 7 个帖子 - 6 位参与者 阅读完整话题
IT之家 6 月 9 日消息,据韩媒 ZDNET Korea 当地时间 5 日报道,三星电子已将 Galaxy Z 8 系列折叠屏智能手机的今年整体出货目标从此前的 650 万部调降至 500~600 万部。 “小折叠” “大折叠” “阔折叠” 当下 约 175 万部 200~250 万部 150~200 万部 此前 300 万部 300 万部 50 万部 可以看到,相较数月前的初步预测, 三星电子显著下调了“小折叠”机型的出货目标 ,“大折叠”出货预期也有所下降,首次登场的 “阔折叠”品类的预测出货规模则明显提升 。 三星此番调整的背后原因一部分是存储器半导体等元器件供小于求导致价格上升,不得不将部分成本转嫁到消费者上,从而抑制用户需求意愿;另一部分则源自“小折叠”热度下降;此外苹果的加入有利于“阔折叠”市场的发展。 报道援引业内消息源指出,三星电子向零部件供应商分享的 6~8 月 Galaxy Z 8 系列折叠屏智能手机的生产计划为“小折叠”略高于 100 万部、“大折叠”和“阔折叠”各 150 万部左右。
虽然我希望他好好做 给我做好 第一次用 这个是不是有点离谱 主要我也不知道他在做什么了哈哈哈哈哈哈哈 好想看看做出来的效果 14 个帖子 - 6 位参与者 阅读完整话题
想问下各位大佬,图1是设置会话目标,有4种类型,这是啥意思不是很理解?图2是设置智能体(计划,会话,编辑)大概的意思我能理解,我一般也不会自主创建智能体。还有个问题,vscode copilot6月份是不是要上新套餐了,最近好像都无法购买copilot 4 个帖子 - 2 位参与者 阅读完整话题
知己 / Trace —— 一条只属于你的生活时间线。 不用注册,不上传云端,也不联网同步。 打开它,里面只有你亲手写下的日子。 支持五种语言:简体中文、繁体中文、英语、韩语、日语 你可以这样用 今日知己:打开一页,今天想坚持的、该收尾的、好久没提起的人,还有快到的重要日子,都替你理好了 每天一句话,就留住此刻——配上照片、语音口述、随手贴的标签 把重要的人放进来,翻一翻,你们一起走过的记录都在 答应自己的小事、想坚持的大目标,写下来,让它自然地发生 生日、纪念日提前替你记着,不会到了那天才想起 愿意的话,用 Apple 健康的数据帮你确认目标完成了没 锁屏与灵动岛上,随时看见目标进度 关于你的数据 全部只留在这一台手机里。不进我们的服务器,也不碰 iCloud 。 没有广告,没有后台分析,没有不请自来的通知,没有任何统计。 换手机时,导出一个备份文件,就能原封不动带走。 App Store 搜索:知己 - 记录生活与目标 https://apps.apple.com/app/id6771310169 下面放一些兑换码,领了麻烦回帖说一声哪个被领走了,方便后面的朋友不用挨个试。 兑换方式:打开 App Store → 右上角头像 → 兑换充值卡或代码 → 手动输入代码 欢迎体验反馈 欢迎体验反馈 欢迎体验反馈 欢迎体验反馈 欢迎体验反馈 01. TXF4MEWXFN86PAAYYX 02. T4HP7NLT7K4F3FXFY7 03. TAK764JA3HHWEF84K3 04. M3A4MLJLL7PXEMKMTM 05. ERWEMRRHWWXA3HAY33 06. AXT7PE7JTTPP338HXM 07. JNPKW48WL6E744RHX7 08. K3NNLPM78J886FTWF3 09. XRNTP3M4MHTJHRN7YA 10. XKM7LH7TLRNTXJ6WRH 11. H378YWX7E443RL7YP7 12. YK86N66YW8EW43MM7L 13. W847HTTLJKFME48RJA 14. 63KARF6TXT673TKAML 15. YFYMTF3LX3AKHK6FWK 16. TP8XK73P8FKJ36T33F 17. WJJM7343RPT4MEXTXN 18. LH33P3N8KNM3NA8PJX 19. AM3X76WWPRWH7X6MEP 20. AEEHEYPJEJAE3TWALR 21. 7FWXX3Y7PRP7NHYXPH 22. P48WRFAHPYYW76EEAE 23. 7TY4KFMTR6LLXNP6H6 24. YMXPYEYT68WXWYHEXW 25. 4HR7PM3RNWPMA6N37T 26. RMHW7FMNXE3MW3PKF4 27. E3NELJMN467LX6MRWM 28. 4RK338KHFYKTHAA63J 29. R4HEFTKF6Y7KE7Y88R 30. 4W7PWFT7LFHRTX8P3M 31. TX6HT3KR7NY6YKW4FE 32. JKMXWEMJTWTEJXMFYR 33. 4PKHEJR34LPNLJ6KKF 34. PHXRYKKWKFWJE34NKE 35. H6P3XJNMY8ATWAELEP 36. 4RHAYPFXHYMMNEWM8P 37. LAJ4LL3X4FLRMF8NMF 38. ALJXRP6AYXTTLENMWF 39. RTXELE4KJNJ7LANLKL 40. JKTF83JXLARHN83FH6 41. R8KH3RYF7AF363RA7M 42. NJ4AWPH7WXNNALML3E 43. 7LT3TARFKMRMAY6MPW 44. XRKFNL7Y3MNXXR4737 45. N4YPKYYLA636YNXKEX 46. J8EKHT3PHKE66WKYKM 47. MJXTFX7RET4ALLEJ3N 48. YMK6AX3Y6JT3NJTNRJ 49. 4J7TTMKWEYKPN3XWNE 50. ALJ44W84HFARNKEY4J
知己 / Trace —— 一条只属于你的生活时间线。 不用注册,不上传云端,也不联网同步。 打开它,里面只有你亲手写下的日子。 支持五种语言:简体中文、繁体中文、英语、韩语、日语 你可以这样用 今日知己:打开一页,今天想坚持的、该收尾的、好久没提起的人,还有快到的重要日子,都替你理好了 每天一句话,就留住此刻——配上照片、语音口述、随手贴的标签 把重要的人放进来,翻一翻,你们一起走过的记录都在 答应自己的小事、想坚持的大目标,写下来,让它自然地发生 生日、纪念日提前替你记着,不会到了那天才想起 愿意的话,用 Apple 健康的数据帮你确认目标完成了没 锁屏与灵动岛上,随时看见目标进度 关于你的数据 全部只留在这一台手机里。不进我们的服务器,也不碰 iCloud 。 没有广告,没有后台分析,没有不请自来的通知,没有任何统计。 换手机时,导出一个备份文件,就能原封不动带走。 App Store 搜索:知己 - 记录生活与目标 https://apps.apple.com/app/id6771310169 下面放一些兑换码,领了麻烦回帖说一声哪个被领走了,方便后面的朋友不用挨个试。 兑换方式:打开 App Store → 右上角头像 → 兑换充值卡或代码 → 手动输入代码 欢迎体验反馈 欢迎体验反馈 欢迎体验反馈 欢迎体验反馈 欢迎体验反馈 01. TXF4MEWXFN86PAAYYX 02. T4HP7NLT7K4F3FXFY7 03. TAK764JA3HHWEF84K3 04. M3A4MLJLL7PXEMKMTM 05. ERWEMRRHWWXA3HAY33 06. AXT7PE7JTTPP338HXM 07. JNPKW48WL6E744RHX7 08. K3NNLPM78J886FTWF3 09. XRNTP3M4MHTJHRN7YA 10. XKM7LH7TLRNTXJ6WRH 11. H378YWX7E443RL7YP7 12. YK86N66YW8EW43MM7L 13. W847HTTLJKFME48RJA 14. 63KARF6TXT673TKAML 15. YFYMTF3LX3AKHK6FWK 16. TP8XK73P8FKJ36T33F 17. WJJM7343RPT4MEXTXN 18. LH33P3N8KNM3NA8PJX 19. AM3X76WWPRWH7X6MEP 20. AEEHEYPJEJAE3TWALR 21. 7FWXX3Y7PRP7NHYXPH 22. P48WRFAHPYYW76EEAE 23. 7TY4KFMTR6LLXNP6H6 24. YMXPYEYT68WXWYHEXW 25. 4HR7PM3RNWPMA6N37T 26. RMHW7FMNXE3MW3PKF4 27. E3NELJMN467LX6MRWM 28. 4RK338KHFYKTHAA63J 29. R4HEFTKF6Y7KE7Y88R 30. 4W7PWFT7LFHRTX8P3M 31. TX6HT3KR7NY6YKW4FE 32. JKMXWEMJTWTEJXMFYR 33. 4PKHEJR34LPNLJ6KKF 34. PHXRYKKWKFWJE34NKE 35. H6P3XJNMY8ATWAELEP 36. 4RHAYPFXHYMMNEWM8P 37. LAJ4LL3X4FLRMF8NMF 38. ALJXRP6AYXTTLENMWF 39. RTXELE4KJNJ7LANLKL 40. JKTF83JXLARHN83FH6 41. R8KH3RYF7AF363RA7M 42. NJ4AWPH7WXNNALML3E 43. 7LT3TARFKMRMAY6MPW 44. XRKFNL7Y3MNXXR4737 45. N4YPKYYLA636YNXKEX 46. J8EKHT3PHKE66WKYKM 47. MJXTFX7RET4ALLEJ3N 48. YMK6AX3Y6JT3NJTNRJ 49. 4J7TTMKWEYKPN3XWNE 50. ALJ44W84HFARNKEY4J
设置了一个goal目标,开始运行的时候用的“替我审批”,然后重启了下codex goal自己开始运行结果开始弹操作审批了,看了下都是之前能自动审批的。暂停->设置替我审批->开始,还是要手动审,所以重新开始的任务怎么设置这个 2 个帖子 - 1 位参与者 阅读完整话题
IT之家 6 月 7 日消息,红魔游戏手机产品总经理姜超昨日发文谈及了新品 PAD 以及和平精英封号的问题。 1.关于新品 PAD (1)我每天都在跟进,知道大家着急,我也着急。的确也没法跟大家一一回复所有疑惑或质疑,很多人问上市时间, 目前内部确实还没定具体日期,后续以官方消息为准 。(我即使知道,个人也没法私自公布,有规章制度要求),虽然困难和阻力重重,但我身后有 n 多研发和生产供应链同事在不分昼夜的全力推进中, 截止目前,本月上市的目标没有变 。 (2)价格问题,我觉得无需多说, 手机行业任何品牌在今年任何时候上市的任何新品,只要不偷工减料不降配涨价都是必然的 ,涨价跟 PAD 上市时间没有任何关联,只跟存储及供应链整体成本剧增有关。我能做的就是让大家花钱买到自己喜欢的产品,让价值和体验对等,让情绪价值拉满。 2.和平精英封号的问题 近期我们与游戏工作室在持续进行研判,一些调整的策略也在进行中,手机硬件本身没有问题,大家放心使用, 自认为多次被误封的用户,如果遇到问题可以给腾讯客服反馈或者我们客服协助推进处理 。(我是指没有使用外挂的用户,坚决反对任何外挂形式破坏游戏公平竞技环境) 请大家相信我们团队的努力程度,解决问题需要时间,做产品也不是变戏法,在 6 月内能达成什么样的结果是未知数,但努力到无能为力是我们一贯的坚持。 据IT之家此前报道,一款型号为 NP06J 努比亚平板入网。据博主 @数码闲聊站 透露,该机为红魔游戏平板 5 Pro,支持 80W 快充,6 月发布。工程机参数如下: 9 英寸 185Hz OLED 小平板 骁龙 8 Elite Gen5 液冷循环散热系统 电池 8300mAh± 12GB+256GB/16GB+512GB/16GB+1TB/24GB+1TB RGB 灯和透明设计 内置豆包大模型
昨天浅尝了一下goal,结果任务设置得太抽象,codex好像并不是很理解,就一路狂奔了,中途还纠正过一次,直接把笔记本干没电了,重新开机后就继续不动了,手动compact也不行 12 个帖子 - 5 位参与者 阅读完整话题
最近用业余时间做了一个叫 Synapse 的小项目,分享一下心得。 目标 同时管理多个 AI agent 干活,减少打扰、降低心智负担。不替我做决定,只让我看清状况。 特点 多 agent 同时跑也能一眼看清每个在干什么 Orchestrator 派活,worker 各司其职 仪表盘实时显示状态、任务、消息,不用切窗口 卡住的 agent 一眼能发现,可以一键重启 Agent 之间消息走总线,我也能旁听全部对话 有优先级,紧急消息会被先处理 不替换 IDE/编辑器,编排已有的 Zed/Tmux 优化方向 跨项目协作:现在每个项目一个数据库,跨项目说话还做不到 优化 Harness ,role 不是什么新框架,就是一层"observation + coordination"的薄壳。用起来挺爽的,效率大大提高 i.imgur.com/a/qgl7bOW.png
1. 背景 各位老师好,我们在做一个视频周期动作计数问题。具体场景是:根据游泳视频,统计每个泳者在每一段里的划水次数。 我们有大量“手部出水”检测框、身体框、泳者方向、泳道、泳者身份等原始数据,并且有次数、每次划手开始结束时间的 Ground Truth ,我们的目标是: 从大量有噪声的检测框里,筛出真正对应划水动作的证据,并稳定得到正确的划水次数。 2. 挑战目标和奖金 我们提供原始数据。如果您能提供可复现的方法,在 leave-one-video-out 评估中达到明显提升,我们愿意提供奖金。 当前最好的 offline Baseline 大约是: MAE:3.31 误差不超过 ±1 次的比例:37.6% 误差不超过 ±2 次的比例:58.4% 最大单行误差:15 目标 A:奖金 1500 元 MAE < 1.5 希望误差不超过 ±1 次的比例超过 60% 最大误差小于 5 (非必须) 目标 B:奖金 3000 元 MAE < 1.0 误差不超过 ±1 次的比例超过 80% 最大误差小于 3 (非必须) 3. 数据说明 原始数据: 每个手部检测框的时间戳 手部框位置和大小 身体框位置和大小 手框与身体框的重叠比例 手部中心点是否在身体框内 手部相对身体前后方向的位置 泳者方向 泳道、split/趟、泳者身份 当前系统的 L1 / L2 证据 Ground Truth: 人工标注的每一次真实划水开始和结束时间 每趟每人的划水总数 目前数据集中有 5 个视频、15 次运行、101 行有效评估数据。原始手部检测框约 13.8 万条,其中约 5.8 万条落在真实划水时间窗口里,约 8.0 万条在窗口外。数据、测试代码和说明文件: https://github.com/cbccbcc/external_clean_challenge_20260605 4. 我们目前的算法尝试:L1 / L2 L1 可以理解为对检测框的初步判断: 找到手部出水检测框; 判断手框是否和该泳者身体框有关; 过滤明显像脚或小腿的误检; L2 可以理解为在 L1 基础上,引入了序列维度,作为划手的依据: L1 (经过验证的手在水上)可以看作 1 ,没有则为 0 ,那么一次划手应该是若干 0+若干 1+若干 0 的组合 L2 相较于 L1 数量会更少一些,但是准确率更高一些 我们并不需要局限于这种思路,可以直接从 L1/L2 甚至原始检测框中恢复/预测划手次数。 5. 我们所做的尝试 纯 L1/L2 的估计误差大约在 6-7 ,远无法达到要求。L1 的时间证据比较干净:correctness 约 84.1%,但 true-stroke coverage 只有约 62.3%。核心问题是干净证据召回不够,高召回证据又太脏。 我们尝试了多种方法的节奏恢复算法/差值算法,包括 RANSAC/PROSAC/HMM 等等,并且根据不同特征进行插值,但是结果不尽如人意。 我们尝试了根据现有 L1/L2 的时间差,选取作为节奏的时间差,发现如果能够选取对的时间差,基于 oracle 可以达到 0.8 左右的 MAE ,但是问题在于我们无法从众多时间差中选择这个最佳时间差。 6. 评估规则 使用 leave-one-video-out: 每次用四个视频开发或训练; 剩下一个视频作为测试; 五个视频轮流作为测试集; 汇总五折结果。 要求同一套算法和参数选择流程必须能泛化到所有视频,不能针对单个视频人工调参。 7. 禁止使用的信息 人工标注可以用于训练、分析和调试,但最终算法不能把以下信息作为输入: 当前行真实划水次数; 当前行每一次真实划水的开始/结束时间; 针对某个视频手工指定的规则; 任何生产环境中不会提前知道的信息。 换句话说,temporal ground truth 可以帮助你设计方法,但不能直接喂给最终预测算法。 8. 关于时间对齐 我们发现算法证据整体加上一个小时间偏移后(+0.15s ),会和人工标注窗口更对齐。这个发现说明时间校准可能很重要。 但是最终奖励指标仍然以划水次数为主。我们不会单独因为时间对齐好就认定成功,但我们强烈建议关注时间对齐,因为稳定的时间证据通常更容易得到稳定的计数。 9. 关于交付 您只需要提供算法,初步远程确认没问题后可以咸鱼下单,支付后将算法细节发给我们进行验证,验证达到要求后确认收货。
1. 背景 各位老师好,我们在做一个视频周期动作计数问题。具体场景是:根据游泳视频,统计每个泳者在每一段里的划水次数。 我们有大量“手部出水”检测框、身体框、泳者方向、泳道、泳者身份等原始数据,并且有次数、每次划手开始结束时间的 Ground Truth ,我们的目标是: 从大量有噪声的检测框里,筛出真正对应划水动作的证据,并稳定得到正确的划水次数。 2. 挑战目标和奖金 我们提供原始数据。如果您能提供可复现的方法,在 leave-one-video-out 评估中达到明显提升,我们愿意提供奖金。 当前最好的 offline Baseline 大约是: MAE:3.31 误差不超过 ±1 次的比例:37.6% 误差不超过 ±2 次的比例:58.4% 最大单行误差:15 目标 A:奖金 1500 元 MAE < 1.5 希望误差不超过 ±1 次的比例超过 60% 最大误差小于 5 (非必须) 目标 B:奖金 3000 元 MAE < 1.0 误差不超过 ±1 次的比例超过 80% 最大误差小于 3 (非必须) 3. 数据说明 原始数据: 每个手部检测框的时间戳 手部框位置和大小 身体框位置和大小 手框与身体框的重叠比例 手部中心点是否在身体框内 手部相对身体前后方向的位置 泳者方向 泳道、split/趟、泳者身份 当前系统的 L1 / L2 证据 Ground Truth: 人工标注的每一次真实划水开始和结束时间 每趟每人的划水总数 目前数据集中有 5 个视频、15 次运行、101 行有效评估数据。原始手部检测框约 13.8 万条,其中约 5.8 万条落在真实划水时间窗口里,约 8.0 万条在窗口外。数据、测试代码和说明文件: https://github.com/cbccbcc/external_clean_challenge_20260605 4. 我们目前的算法尝试:L1 / L2 L1 可以理解为对检测框的初步判断: 找到手部出水检测框; 判断手框是否和该泳者身体框有关; 过滤明显像脚或小腿的误检; L2 可以理解为在 L1 基础上,引入了序列维度,作为划手的依据: L1 (经过验证的手在水上)可以看作 1 ,没有则为 0 ,那么一次划手应该是若干 0+若干 1+若干 0 的组合 L2 相较于 L1 数量会更少一些,但是准确率更高一些 我们并不需要局限于这种思路,可以直接从 L1/L2 甚至原始检测框中恢复/预测划手次数。 5. 我们所做的尝试 纯 L1/L2 的估计误差大约在 6-7 ,远无法达到要求。L1 的时间证据比较干净:correctness 约 84.1%,但 true-stroke coverage 只有约 62.3%。核心问题是干净证据召回不够,高召回证据又太脏。 我们尝试了多种方法的节奏恢复算法/差值算法,包括 RANSAC/PROSAC/HMM 等等,并且根据不同特征进行插值,但是结果不尽如人意。 我们尝试了根据现有 L1/L2 的时间差,选取作为节奏的时间差,发现如果能够选取对的时间差,基于 oracle 可以达到 0.8 左右的 MAE ,但是问题在于我们无法从众多时间差中选择这个最佳时间差。 6. 评估规则 使用 leave-one-video-out: 每次用四个视频开发或训练; 剩下一个视频作为测试; 五个视频轮流作为测试集; 汇总五折结果。 要求同一套算法和参数选择流程必须能泛化到所有视频,不能针对单个视频人工调参。 7. 禁止使用的信息 人工标注可以用于训练、分析和调试,但最终算法不能把以下信息作为输入: 当前行真实划水次数; 当前行每一次真实划水的开始/结束时间; 针对某个视频手工指定的规则; 任何生产环境中不会提前知道的信息。 换句话说,temporal ground truth 可以帮助你设计方法,但不能直接喂给最终预测算法。 8. 关于时间对齐 我们发现算法证据整体加上一个小时间偏移后(+0.15s ),会和人工标注窗口更对齐。这个发现说明时间校准可能很重要。 但是最终奖励指标仍然以划水次数为主。我们不会单独因为时间对齐好就认定成功,但我们强烈建议关注时间对齐,因为稳定的时间证据通常更容易得到稳定的计数。 9. 关于交付 您只需要提供算法,初步远程确认没问题后可以咸鱼下单,支付后将算法细节发给我们进行验证,验证达到要求后确认收货。
1. 背景 各位老师好,我们在做一个视频周期动作计数问题。具体场景是:根据游泳视频,统计每个泳者在每一段里的划水次数。 我们有大量“手部出水”检测框、身体框、泳者方向、泳道、泳者身份等原始数据,并且有次数、每次划手开始结束时间的 Ground Truth ,我们的目标是: 从大量有噪声的检测框里,筛出真正对应划水动作的证据,并稳定得到正确的划水次数。 2. 挑战目标和奖金 我们提供原始数据。如果您能提供可复现的方法,在 leave-one-video-out 评估中达到明显提升,我们愿意提供奖金。 当前最好的 offline Baseline 大约是: MAE:3.31 误差不超过 ±1 次的比例:37.6% 误差不超过 ±2 次的比例:58.4% 最大单行误差:15 目标 A:奖金 1500 元 MAE < 1.5 希望误差不超过 ±1 次的比例超过 60% 最大误差小于 5 (非必须) 目标 B:奖金 3000 元 MAE < 1.0 误差不超过 ±1 次的比例超过 80% 最大误差小于 3 (非必须) 3. 数据说明 原始数据: 每个手部检测框的时间戳 手部框位置和大小 身体框位置和大小 手框与身体框的重叠比例 手部中心点是否在身体框内 手部相对身体前后方向的位置 泳者方向 泳道、split/趟、泳者身份 当前系统的 L1 / L2 证据 Ground Truth: 人工标注的每一次真实划水开始和结束时间 每趟每人的划水总数 目前数据集中有 5 个视频、15 次运行、101 行有效评估数据。原始手部检测框约 13.8 万条,其中约 5.8 万条落在真实划水时间窗口里,约 8.0 万条在窗口外。数据、测试代码和说明文件: https://github.com/cbccbcc/external_clean_challenge_20260605 4. 我们目前的算法尝试:L1 / L2 L1 可以理解为对检测框的初步判断: 找到手部出水检测框; 判断手框是否和该泳者身体框有关; 过滤明显像脚或小腿的误检; L2 可以理解为在 L1 基础上,引入了序列维度,作为划手的依据: L1 (经过验证的手在水上)可以看作 1 ,没有则为 0 ,那么一次划手应该是若干 0+若干 1+若干 0 的组合 L2 相较于 L1 数量会更少一些,但是准确率更高一些 我们并不需要局限于这种思路,可以直接从 L1/L2 甚至原始检测框中恢复/预测划手次数。 5. 我们所做的尝试 纯 L1/L2 的估计误差大约在 6-7 ,远无法达到要求。L1 的时间证据比较干净:correctness 约 84.1%,但 true-stroke coverage 只有约 62.3%。核心问题是干净证据召回不够,高召回证据又太脏。 我们尝试了多种方法的节奏恢复算法/差值算法,包括 RANSAC/PROSAC/HMM 等等,并且根据不同特征进行插值,但是结果不尽如人意。 我们尝试了根据现有 L1/L2 的时间差,选取作为节奏的时间差,发现如果能够选取对的时间差,基于 oracle 可以达到 0.8 左右的 MAE ,但是问题在于我们无法从众多时间差中选择这个最佳时间差。 6. 评估规则 使用 leave-one-video-out: 每次用四个视频开发或训练; 剩下一个视频作为测试; 五个视频轮流作为测试集; 汇总五折结果。 要求同一套算法和参数选择流程必须能泛化到所有视频,不能针对单个视频人工调参。 7. 禁止使用的信息 人工标注可以用于训练、分析和调试,但最终算法不能把以下信息作为输入: 当前行真实划水次数; 当前行每一次真实划水的开始/结束时间; 针对某个视频手工指定的规则; 任何生产环境中不会提前知道的信息。 换句话说,temporal ground truth 可以帮助你设计方法,但不能直接喂给最终预测算法。 8. 关于时间对齐 我们发现算法证据整体加上一个小时间偏移后(+0.15s ),会和人工标注窗口更对齐。这个发现说明时间校准可能很重要。 但是最终奖励指标仍然以划水次数为主。我们不会单独因为时间对齐好就认定成功,但我们强烈建议关注时间对齐,因为稳定的时间证据通常更容易得到稳定的计数。 9. 关于交付 您只需要提供算法,初步远程确认没问题后可以咸鱼下单,支付后将算法细节发给我们进行验证,验证达到要求后确认收货。
1. 背景 各位老师好,我们在做一个视频周期动作计数问题。具体场景是:根据游泳视频,统计每个泳者在每一段里的划水次数。 我们有大量“手部出水”检测框、身体框、泳者方向、泳道、泳者身份等原始数据,并且有次数、每次划手开始结束时间的 Ground Truth ,我们的目标是: 从大量有噪声的检测框里,筛出真正对应划水动作的证据,并稳定得到正确的划水次数。 2. 挑战目标和奖金 我们提供原始数据。如果您能提供可复现的方法,在 leave-one-video-out 评估中达到明显提升,我们愿意提供奖金。 当前最好的 offline Baseline 大约是: MAE:3.31 误差不超过 ±1 次的比例:37.6% 误差不超过 ±2 次的比例:58.4% 最大单行误差:15 目标 A:奖金 1500 元 MAE < 1.5 希望误差不超过 ±1 次的比例超过 60% 最大误差小于 5 (非必须) 目标 B:奖金 3000 元 MAE < 1.0 误差不超过 ±1 次的比例超过 80% 最大误差小于 3 (非必须) 3. 数据说明 原始数据: 每个手部检测框的时间戳 手部框位置和大小 身体框位置和大小 手框与身体框的重叠比例 手部中心点是否在身体框内 手部相对身体前后方向的位置 泳者方向 泳道、split/趟、泳者身份 当前系统的 L1 / L2 证据 Ground Truth: 人工标注的每一次真实划水开始和结束时间 每趟每人的划水总数 目前数据集中有 5 个视频、15 次运行、101 行有效评估数据。原始手部检测框约 13.8 万条,其中约 5.8 万条落在真实划水时间窗口里,约 8.0 万条在窗口外。数据、测试代码和说明文件: https://github.com/cbccbcc/external_clean_challenge_20260605 4. 我们目前的算法尝试:L1 / L2 L1 可以理解为对检测框的初步判断: 找到手部出水检测框; 判断手框是否和该泳者身体框有关; 过滤明显像脚或小腿的误检; L2 可以理解为在 L1 基础上,引入了序列维度,作为划手的依据: L1 (经过验证的手在水上)可以看作 1 ,没有则为 0 ,那么一次划手应该是若干 0+若干 1+若干 0 的组合 L2 相较于 L1 数量会更少一些,但是准确率更高一些 我们并不需要局限于这种思路,可以直接从 L1/L2 甚至原始检测框中恢复/预测划手次数。 5. 我们所做的尝试 纯 L1/L2 的估计误差大约在 6-7 ,远无法达到要求。L1 的时间证据比较干净:correctness 约 84.1%,但 true-stroke coverage 只有约 62.3%。核心问题是干净证据召回不够,高召回证据又太脏。 我们尝试了多种方法的节奏恢复算法/差值算法,包括 RANSAC/PROSAC/HMM 等等,并且根据不同特征进行插值,但是结果不尽如人意。 我们尝试了根据现有 L1/L2 的时间差,选取作为节奏的时间差,发现如果能够选取对的时间差,基于 oracle 可以达到 0.8 左右的 MAE ,但是问题在于我们无法从众多时间差中选择这个最佳时间差。 6. 评估规则 使用 leave-one-video-out: 每次用四个视频开发或训练; 剩下一个视频作为测试; 五个视频轮流作为测试集; 汇总五折结果。 要求同一套算法和参数选择流程必须能泛化到所有视频,不能针对单个视频人工调参。 7. 禁止使用的信息 人工标注可以用于训练、分析和调试,但最终算法不能把以下信息作为输入: 当前行真实划水次数; 当前行每一次真实划水的开始/结束时间; 针对某个视频手工指定的规则; 任何生产环境中不会提前知道的信息。 换句话说,temporal ground truth 可以帮助你设计方法,但不能直接喂给最终预测算法。 8. 关于时间对齐 我们发现算法证据整体加上一个小时间偏移后(+0.15s ),会和人工标注窗口更对齐。这个发现说明时间校准可能很重要。 但是最终奖励指标仍然以划水次数为主。我们不会单独因为时间对齐好就认定成功,但我们强烈建议关注时间对齐,因为稳定的时间证据通常更容易得到稳定的计数。 9. 关于交付 您只需要提供算法,初步远程确认没问题后可以咸鱼下单,支付后将算法细节发给我们进行验证,验证达到要求后确认收货。