tp-cffo1aq9j0kwg5semwt194pwywsoz7ruwo2q8yy4pyr37f2x 最后三天 到13号 24点 量大管饱 5 个帖子 - 5 位参与者 阅读完整话题
最后的狂欢 orange-ai.online sk-删这里TZClEeMU1sRR3OInFvBNupxWKAq6LPcKXcaHQzqRrbRIQSXY 5 个帖子 - 5 位参与者 阅读完整话题
下载地址: https://jiejingfan.lanzoub.com/idaR23r3bxgj?p 1 个帖子 - 1 位参与者 阅读完整话题
今天刚加入,一个好友都没有,有加上偷菜的吗? cmpur3xfzjechvjkvmouewfg4 2 个帖子 - 2 位参与者 阅读完整话题
tp-c65z9vmqau0ar365s2zhjet8ibfihn6bedx03c0awd8jgxu3 兼容 OpenAI 接口协议: https://token-plan-cn.xiaomimimo.com/v1 兼容 Anthropic 接口协议: https://token-plan-cn.xiaomimimo.com/anthropic 1 个帖子 - 1 位参与者 阅读完整话题
tp-cdd2ejvvf6cd8tl2aipsc5gsfsnac57rdireur3w7qdypzet 4 个帖子 - 3 位参与者 阅读完整话题
由于哈雷大佬的cursor++,我兴致冲冲将plus订阅用cpa转到cursor上使用,都是使用gpt-5.5 xhigh。xcode上的执行能力要强很多,比如简简单单叫agent连接ssh。提问如下: 根据指引说明.md(包含服务器连接信息)连接xxx.xxx.xxx.xx,执行docker ps 并返回输出内容,切勿执行其他指令操作. codex三两下就给你输出了,反观cursor叫我自己到终端输入命令获取。doge::,是我cursor的打开方式不对?求指教。 2 个帖子 - 2 位参与者 阅读完整话题
最近看到有佬友说cursor给老用户发了3折的邮件,于是我就开了一个月pro。 后来才发现,只有20刀的api额度,超出就要额外付费。但是主流大模型的输出价格通常几十刀/M,感觉不太敢用了 。 想请教,有没有性价比高的方式来用 Cursor? 7 个帖子 - 5 位参与者 阅读完整话题
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
我真是要崩潰了這哈吉米把我當猴耍 ![image|690x79] ![image|690x71] (upload://znDtTfVScGC36ARH9sybYwnr3u1.png) (upload://wH1WsYkLkXLF6VlbWqRio7l72uc.png) 媽的還是沒解決 4 个帖子 - 2 位参与者 阅读完整话题
学习项目. 单视角 RGB 1080p@25fps, 洗牌 60-120s, 求洗牌前 → 洗牌后 40 张牌的位置映射. 数据特点 40 张牌外观近似, 无 re-ID 特征, 背面同色 手覆盖 60-80% 帧, 单牌可完全遮挡 1-3s 频繁翻面, 严格目标数上限 = 40 已试 + 失败 YOLO11-Seg 检测 ✓ 静态准, 密集叠加漏 ByteTrack ✗ 60s 累积 1942 ID (理应 40), 卡尔曼+IoU 假设被遮挡彻底破坏 匈牙利 + lost-recovery 跨段匹配 ✗ 中段 cost matrix 退化为噪声 人工逐帧 fallback ✓ 但 60 min/副, 成本太高 在看的方案 SAM 2 video predictor / Cutie / DAM / MASA / CoTracker3 / TAPIR / HaMeR (3D 手部 pose) / ProPainter (擦手部) 求建议 玩过 SAM 2 / Cutie / CoTracker3 实战, 或做过 surgical instrument tracking / 同队服球员跟踪 / shell game 视觉问题的同行 — 哪条路在"40 个相似目标 + 持续遮挡"这个 regime 最稳? 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.
自己在做一个牌类游戏过程的视觉跟踪学习项目, 想把麻将一次完整洗牌前 40 张牌的位置追踪到洗牌结束, 输出"洗牌前 → 洗牌后"的位置对应表. 类似学术里 shell game / cups-and-balls tracking 的视觉问题, 目标数 = 40 , 纯学习 + 探索 SOTA 边界, 已经啃了一遍 YOLO/ByteTrack/SAM2 文献, 但实操遇到瓶颈, 想请教各位. ┌──── 输入: 单视角 RGB 1080p@25fps ────┐ │ │ │ pre 段 (静止) │ │ ● ● ● ● ● ● ● ● ● ● ← 40 张牌 │ │ ● ● ● ● ● ● ● ● ● ● (位置/身份 │ │ ● ● ● ● ● ● ● ● ● ● 都已知) │ │ ● ● ● ● ● ● ● ● ● ● │ │ │ │ ↓ 洗牌 60-120s │ │ ░ ▓ ░ 手覆盖 60-80% 帧 ░ ▓ ░ │ │ 牌频繁互相遮挡 + 翻面 + 滑动 │ │ ↓ │ │ │ │ post 段 (静止) │ │ ? ? ? ? ? ? ? ? ? ? ← 40 张牌 │ │ ? ? ? ? ? ? ? ? ? ? (位置已知, │ │ ? ? ? ? ? ? ? ? ? ? 求映射回 │ │ ? ? ? ? ? ? ? ? ? ? pre 身份) │ │ │ └──────────────────────────────────────┘ 难点 (按破坏性排序) 40 个目标外观高度相似 — 没有 re-ID 特征, 背面同色; 不像行人有衣服, 车辆有车牌 持续密集遮挡 — 一只/两只手覆盖 60-80% 帧, 单牌完全遮挡可持续 1-3 秒 频繁翻面 + 旋转 — 外观跳变, 视觉特征短时不稳 严格目标数上限 = 40 — 不能新增 (新 ID 一定是 ByteTrack 错了) 信息论根本极限 — 完全被手压住时, 单视角 RGB 没有该牌的任何线索 已试方案 + 失败模式 管线 状态 失败原因 ──────────────────────────────────────────────────────────── YOLO11-Seg 检测 ✓部分 静态准, 密集遮挡漏检 ↓ ByteTrack 短时关联 ✗ 60s 累积 1942 ID (理应 40) 卡尔曼+IoU 假设被遮挡彻底破坏 ↓ 匈牙利 + lost-recovery 跨段 ✗ 中段 cost matrix 信号退化为噪声 强制 ID 上限 40 也救不回 ↓ 关键帧聚类 (pre/post 各自) ✓ 静止聚类可以精确出 40 位置 ↓ 跨段匹配 (pre 40 ↔ post 40) ✗ 中段无信号, 等价随机映射 ↓ 人工逐帧 fallback (PySide6) ✓ 但 ~60 min/副, 成本不可接受 ByteTrack ID 累积大致这样: 理想: ──────────── 40 (上限) 实际: ▁▂▃▄▅▆▇▇████████████ 1942 0s 30s 60s ↑ 每次遮挡断开就开一个新 ID 前在考虑的 SOTA 路线 SAM 2 video predictor (Meta 2024) — 用 pre 40 位置作为 40 个 box prompt, 整段自动跟 mask Cutie / DAM / MASA — 长 memory VOS 网络, 学术上比 SAM2 更稳 CoTracker3 / TAPIR 点跟踪 — 牌中心点跟踪, 不跟 mask 手部物理推断 — HaMeR 估 3D 手势 + 接触推断, 覆盖完全遮挡段 ProPainter 擦除手 — 让 SAM 2 在更多帧"看见目标" 半自动 interactive annotation — 算法跟 60-80%, 人工巡视修正 20-40%, 目标压到 10-15 min/副 想请教的问题 做过类似的人: surgical instrument tracking, sports player tracking (足球/篮球队员同队服), shell game CV 的同行, 你们最后落在哪个技术栈? SAM 2 实战表现: 在"40 个相似目标 + 密集遮挡"这种 regime, memory bank 会不会失效? 有没有人压测过 50+ 目标的并行? VOS 模型选型: Cutie / DAM / MASA 这几个在长视频 + 多目标的实际差异? 半自动工具栈: CVAT / Roboflow 之外, 有没有更专门的"算法跟踪 + 人工修正"工具? (现在自己撸了一个 PySide6 的, 但比较粗糙) 有没有更适合的 SOTA 我完全没想到 (比如基于 3D scene flow / event camera / NeRF tracking 的思路)? 非常希望听到一线的实践经验, 论文 / 代码 / 工程踩坑都欢迎. 评论或私信均可.