WWW.YOUINFO.SITE
标签聚合 标注

/tag/标注

v2ex · 2026-06-11 16:42:08+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 16:24:57+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 16:11:22+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 16:00:02+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 15:43:03+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 15:37:05+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 15:28:38+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 15:18:48+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 15:06:37+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 14:51:31+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

v2ex · 2026-06-11 14:30:03+08:00 · tech

替女朋友来问问大家。 情况:25 岁,女生,专科,计算机专业。毕业到现在一直做数据标注,每天就是画框、拉线、做分割,工资 5-6k ,在杭州。 她感觉这行干久了没什么积累,学不到新东西,薪资也很难上去,现在很想换个行业,但不知道往哪走。 背景大概是这样: 专科,计算机基础一般 起步阶段对薪资没什么要求,主要希望有上升空间,能学到东西。 真心求过来人指点一下——有什么比较好方向?需要补哪些技能? 谢谢大家!🙏

LinuxDo 最新话题 · 2026-06-08 11:07:56+08:00 · tech

佬,本人大三了,会p的技术很少,就是自学很少,几乎没有。大三暑假要找实习,我估计只能找到数据标注了。大三寒假干过一点docker环境下修代码的数据标注,我拿claude code做的,觉得学不到什么东西,跑路了。但是大三下了,也没学到什么,感觉实在要实习的话,又要回到数据标注了。 佬,大三结束的暑假,是建议去踏踏实实干数据标注,还是再尝试去自学。 16 个帖子 - 13 位参与者 阅读完整话题

v2ex · 2026-06-07 23:43:20+08:00 · tech

本文推广一款基于云端的照片管理应用,也是个人对近段时间开发活动的一份总结。 地址 https://www.cloud-gallery.cn 简介 这是款云端照片管理的应用,包含两大核心功能 云端存储,照片选择性上传 标题编辑,给照片留下文字记录 背景 有娃后,总担心拍的照片会丢,时常又想给照片加些备注,以后更容易回忆。 原来想自己搭个 nas ,又怕技术太菜搞不好哪天数据都丢了。 百度网盘确实不错,已经全量照片都传上了,可毕竟照片不是自己挑的,杂七杂八的内容也一股脑儿传上去,总觉得有些杂乱。 思来想去,尝试自己造个轮子。恰逢 ai 大行其道,拿起工具直接开搞! 分析 数据存放:数据安全是第一原则,容灾备份啥的,自己没这个实力,统统交给大厂。于是方案选型定为阿里 oss ,不怕丢。app 中严选删除逻辑,能确保数据不丢。 开源改造:从零到一去实现一套能力过于复杂,可行性不高(终归是自己太菜。。)。还是站在巨人的肩膀上来的靠谱。于是找了一个热度很高的开源安卓相册应用 fossify gallery ,在其上嵌入云端上传的能力。 按需上传:只有选择过的照片才会被上传,避免无意义照片占用云端存储空间。这其中多了一道人工筛选的流程,但想必珍贵的照片也值得这一下的付出。 文字记录: 对图片进行标注对笔者来说一直是个有价值的功能,可以更好记录照片的内容和生活的点滴。等以后回看起来,一句简单的记录能带来更多美好的回忆。 账户管理: 不同于成熟的商业应用,本应用的存储端是各用户个人的阿里云账号。因此账户注册流程涉及阿里云的授权和子账号创建。子账号代表家庭中其他的成员,可以由管理员统一管理。各成员间的照片也做成了相互共享。 想法 成本。大厂存档数据不是免费的。用了 oss 后,需要支付存储的费用。但费用很低,每个月可能就几毛到几块。相信对有此类需求的用户来说也可以接受。 开发。在开源代码基础上新增的功能都是 ai 开发的,效率提升不少,但质量如何还有待观察。现在看来,能力是大体符合预期的。多多少少可能会有缺陷,但相信是可以修复的。 演进。咱就是讲究吃自己的狗粮。这应用本人也日常在用,相信它会长期演进下去~初期产品化能力可能不到位,但日拱一卒,相信总能越来越好。 开源。所用的基础图库应用是开源的,因此本应用也将 app 端进行了开源。不过服务端和 web 端的代码暂时还没有,看后面情况再评估吧。 用户。本应用面相稍懂些技术的用户,由于涉及到后端 oss 存储,至少要有些简单的了解,才能知道本应用的工作原理是啥。 收费。暂时不收任何费用,当然也不排除后续收取一定费用的可能 hhh 最后,特别感谢能读到末尾的读者~希望这篇文章没有浪费大家的时间(◍•ᴗ•◍)

V2EX - 技术 · 2026-06-06 19:48:09+08:00 · tech

分享个自己最近开源的项目: VLM-AutoYOLO 。 项目地址: https://github.com/Somnusochi/VLM-AutoYOLO 前几天看到英伟达( NVIDIA )正式公布了 LocateAnything 视觉大模型,它那种用一段文本就能直接定位物体的能力让我觉得很有意思。结合 Facebook 最近开源的 SAM2 抠图模型,我就想:完全可以用一句话代替手工画框,实现自动化的 YOLO 数据集标注。 有了想法后,我在 AI 的辅助下大概花了 5 天时间,把这套全自动标注的流水线跑通了。 它是怎么工作的? 逻辑很简单,主要分三步: 一句话找目标 :输入你想找的东西(比如“有划痕的零件”),后端的 LocateAnything 模型会先找出它的大致位置。 像素级抠图 :把大概坐标扔给 SAM2 模型,由它负责精准吸附边缘,生成 Bounding Box 和 Mask 。 一键导出 :流水线跑完后,自动打包成标准的 YOLO 数据集格式,可以直接丢给 YOLOv8/v11 去训轻量级模型。 技术实现细节 为了保证业务数据不上云,这个项目设计成了 100% 纯本地运行。这就需要处理显存压力的问题。 **后端 (FastAPI / PyTorch)**: 为了能在普通开发机上跑这套 30 亿参数的大模型,我在后端写了严格的显存清理机制。在我的 MacBook Pro (M4 Pro, 24GB) 上,开启 Apple MPS 加速后,处理一张高清图大概 4 秒。连续跑几百张图,系统内存占用稳在 12GB 左右,没有内存泄露,挂后台跑很稳。 **前端 (React / Vite / UnoCSS)**: 我个人不喜欢传统标注软件那种密密麻麻的控制台界面,所以用 UnoCSS 写了个极简风格的操作界面,用起来稍微顺眼点。 目前的坑 因为只花了 5 天写的初版,还有些局限: 速度上限 :4 秒一张图,应对几百张没问题。如果是上万张的大型数据集,单机单卡还是偏慢,后续得考虑加多卡并行。 环境依赖 :项目融合了 PyTorch 、Ultralytics 和 SAM2 ,不同系统装依赖可能会踩坑。Docker 镜像后续会补上。 最后 如果你也厌倦了手动标数据,可以去 GitHub 拉下来跑跑看。遇到问题或者有关于 MPS 显存优化的建议,直接在项目里提 Issue 或 PR 。

V2EX - 技术 · 2026-06-06 06:36:58+08:00 · tech

分享个自己最近开源的项目: VLM-AutoYOLO 。 项目地址: https://github.com/Somnusochi/VLM-AutoYOLO 前几天看到英伟达( NVIDIA )正式公布了 LocateAnything 视觉大模型,它那种用一段文本就能直接定位物体的能力让我觉得很有意思。结合 Facebook 最近开源的 SAM2 抠图模型,我就想:完全可以用一句话代替手工画框,实现自动化的 YOLO 数据集标注。 有了想法后,我在 AI 的辅助下大概花了 5 天时间,把这套全自动标注的流水线跑通了。 它是怎么工作的? 逻辑很简单,主要分三步: 一句话找目标 :输入你想找的东西(比如“有划痕的零件”),后端的 LocateAnything 模型会先找出它的大致位置。 像素级抠图 :把大概坐标扔给 SAM2 模型,由它负责精准吸附边缘,生成 Bounding Box 和 Mask 。 一键导出 :流水线跑完后,自动打包成标准的 YOLO 数据集格式,可以直接丢给 YOLOv8/v11 去训轻量级模型。 技术实现细节 为了保证业务数据不上云,这个项目设计成了 100% 纯本地运行。这就需要处理显存压力的问题。 **后端 (FastAPI / PyTorch)**: 为了能在普通开发机上跑这套 30 亿参数的大模型,我在后端写了严格的显存清理机制。在我的 MacBook Pro (M4 Pro, 24GB) 上,开启 Apple MPS 加速后,处理一张高清图大概 4 秒。连续跑几百张图,系统内存占用稳在 12GB 左右,没有内存泄露,挂后台跑很稳。 **前端 (React / Vite / UnoCSS)**: 我个人不喜欢传统标注软件那种密密麻麻的控制台界面,所以用 UnoCSS 写了个极简风格的操作界面,用起来稍微顺眼点。 目前的坑 因为只花了 5 天写的初版,还有些局限: 速度上限 :4 秒一张图,应对几百张没问题。如果是上万张的大型数据集,单机单卡还是偏慢,后续得考虑加多卡并行。 环境依赖 :项目融合了 PyTorch 、Ultralytics 和 SAM2 ,不同系统装依赖可能会踩坑。Docker 镜像后续会补上。 最后 如果你也厌倦了手动标数据,可以去 GitHub 拉下来跑跑看。遇到问题或者有关于 MPS 显存优化的建议,直接在项目里提 Issue 或 PR 。

V2EX - 技术 · 2026-06-06 04:36:58+08:00 · tech

分享个自己最近开源的项目: VLM-AutoYOLO 。 项目地址: https://github.com/Somnusochi/VLM-AutoYOLO 前几天看到英伟达( NVIDIA )正式公布了 LocateAnything 视觉大模型,它那种用一段文本就能直接定位物体的能力让我觉得很有意思。结合 Facebook 最近开源的 SAM2 抠图模型,我就想:完全可以用一句话代替手工画框,实现自动化的 YOLO 数据集标注。 有了想法后,我在 AI 的辅助下大概花了 5 天时间,把这套全自动标注的流水线跑通了。 它是怎么工作的? 逻辑很简单,主要分三步: 一句话找目标 :输入你想找的东西(比如“有划痕的零件”),后端的 LocateAnything 模型会先找出它的大致位置。 像素级抠图 :把大概坐标扔给 SAM2 模型,由它负责精准吸附边缘,生成 Bounding Box 和 Mask 。 一键导出 :流水线跑完后,自动打包成标准的 YOLO 数据集格式,可以直接丢给 YOLOv8/v11 去训轻量级模型。 技术实现细节 为了保证业务数据不上云,这个项目设计成了 100% 纯本地运行。这就需要处理显存压力的问题。 **后端 (FastAPI / PyTorch)**: 为了能在普通开发机上跑这套 30 亿参数的大模型,我在后端写了严格的显存清理机制。在我的 MacBook Pro (M4 Pro, 24GB) 上,开启 Apple MPS 加速后,处理一张高清图大概 4 秒。连续跑几百张图,系统内存占用稳在 12GB 左右,没有内存泄露,挂后台跑很稳。 **前端 (React / Vite / UnoCSS)**: 我个人不喜欢传统标注软件那种密密麻麻的控制台界面,所以用 UnoCSS 写了个极简风格的操作界面,用起来稍微顺眼点。 目前的坑 因为只花了 5 天写的初版,还有些局限: 速度上限 :4 秒一张图,应对几百张没问题。如果是上万张的大型数据集,单机单卡还是偏慢,后续得考虑加多卡并行。 环境依赖 :项目融合了 PyTorch 、Ultralytics 和 SAM2 ,不同系统装依赖可能会踩坑。Docker 镜像后续会补上。 最后 如果你也厌倦了手动标数据,可以去 GitHub 拉下来跑跑看。遇到问题或者有关于 MPS 显存优化的建议,直接在项目里提 Issue 或 PR 。

V2EX - 技术 · 2026-06-06 04:36:58+08:00 · tech

分享个自己最近开源的项目: VLM-AutoYOLO 。 项目地址: https://github.com/Somnusochi/VLM-AutoYOLO 前几天看到英伟达( NVIDIA )正式公布了 LocateAnything 视觉大模型,它那种用一段文本就能直接定位物体的能力让我觉得很有意思。结合 Facebook 最近开源的 SAM2 抠图模型,我就想:完全可以用一句话代替手工画框,实现自动化的 YOLO 数据集标注。 有了想法后,我在 AI 的辅助下大概花了 5 天时间,把这套全自动标注的流水线跑通了。 它是怎么工作的? 逻辑很简单,主要分三步: 一句话找目标 :输入你想找的东西(比如“有划痕的零件”),后端的 LocateAnything 模型会先找出它的大致位置。 像素级抠图 :把大概坐标扔给 SAM2 模型,由它负责精准吸附边缘,生成 Bounding Box 和 Mask 。 一键导出 :流水线跑完后,自动打包成标准的 YOLO 数据集格式,可以直接丢给 YOLOv8/v11 去训轻量级模型。 技术实现细节 为了保证业务数据不上云,这个项目设计成了 100% 纯本地运行。这就需要处理显存压力的问题。 **后端 (FastAPI / PyTorch)**: 为了能在普通开发机上跑这套 30 亿参数的大模型,我在后端写了严格的显存清理机制。在我的 MacBook Pro (M4 Pro, 24GB) 上,开启 Apple MPS 加速后,处理一张高清图大概 4 秒。连续跑几百张图,系统内存占用稳在 12GB 左右,没有内存泄露,挂后台跑很稳。 **前端 (React / Vite / UnoCSS)**: 我个人不喜欢传统标注软件那种密密麻麻的控制台界面,所以用 UnoCSS 写了个极简风格的操作界面,用起来稍微顺眼点。 目前的坑 因为只花了 5 天写的初版,还有些局限: 速度上限 :4 秒一张图,应对几百张没问题。如果是上万张的大型数据集,单机单卡还是偏慢,后续得考虑加多卡并行。 环境依赖 :项目融合了 PyTorch 、Ultralytics 和 SAM2 ,不同系统装依赖可能会踩坑。Docker 镜像后续会补上。 最后 如果你也厌倦了手动标数据,可以去 GitHub 拉下来跑跑看。遇到问题或者有关于 MPS 显存优化的建议,直接在项目里提 Issue 或 PR 。

V2EX - 技术 · 2026-06-06 03:36:58+08:00 · tech

分享个自己最近开源的项目: VLM-AutoYOLO 。 项目地址: https://github.com/Somnusochi/VLM-AutoYOLO 前几天看到英伟达( NVIDIA )正式公布了 LocateAnything 视觉大模型,它那种用一段文本就能直接定位物体的能力让我觉得很有意思。结合 Facebook 最近开源的 SAM2 抠图模型,我就想:完全可以用一句话代替手工画框,实现自动化的 YOLO 数据集标注。 有了想法后,我在 AI 的辅助下大概花了 5 天时间,把这套全自动标注的流水线跑通了。 它是怎么工作的? 逻辑很简单,主要分三步: 一句话找目标 :输入你想找的东西(比如“有划痕的零件”),后端的 LocateAnything 模型会先找出它的大致位置。 像素级抠图 :把大概坐标扔给 SAM2 模型,由它负责精准吸附边缘,生成 Bounding Box 和 Mask 。 一键导出 :流水线跑完后,自动打包成标准的 YOLO 数据集格式,可以直接丢给 YOLOv8/v11 去训轻量级模型。 技术实现细节 为了保证业务数据不上云,这个项目设计成了 100% 纯本地运行。这就需要处理显存压力的问题。 **后端 (FastAPI / PyTorch)**: 为了能在普通开发机上跑这套 30 亿参数的大模型,我在后端写了严格的显存清理机制。在我的 MacBook Pro (M4 Pro, 24GB) 上,开启 Apple MPS 加速后,处理一张高清图大概 4 秒。连续跑几百张图,系统内存占用稳在 12GB 左右,没有内存泄露,挂后台跑很稳。 **前端 (React / Vite / UnoCSS)**: 我个人不喜欢传统标注软件那种密密麻麻的控制台界面,所以用 UnoCSS 写了个极简风格的操作界面,用起来稍微顺眼点。 目前的坑 因为只花了 5 天写的初版,还有些局限: 速度上限 :4 秒一张图,应对几百张没问题。如果是上万张的大型数据集,单机单卡还是偏慢,后续得考虑加多卡并行。 环境依赖 :项目融合了 PyTorch 、Ultralytics 和 SAM2 ,不同系统装依赖可能会踩坑。Docker 镜像后续会补上。 最后 如果你也厌倦了手动标数据,可以去 GitHub 拉下来跑跑看。遇到问题或者有关于 MPS 显存优化的建议,直接在项目里提 Issue 或 PR 。

V2EX - 技术 · 2026-06-06 02:36:58+08:00 · tech

分享个自己最近开源的项目: VLM-AutoYOLO 。 项目地址: https://github.com/Somnusochi/VLM-AutoYOLO 前几天看到英伟达( NVIDIA )正式公布了 LocateAnything 视觉大模型,它那种用一段文本就能直接定位物体的能力让我觉得很有意思。结合 Facebook 最近开源的 SAM2 抠图模型,我就想:完全可以用一句话代替手工画框,实现自动化的 YOLO 数据集标注。 有了想法后,我在 AI 的辅助下大概花了 5 天时间,把这套全自动标注的流水线跑通了。 它是怎么工作的? 逻辑很简单,主要分三步: 一句话找目标 :输入你想找的东西(比如“有划痕的零件”),后端的 LocateAnything 模型会先找出它的大致位置。 像素级抠图 :把大概坐标扔给 SAM2 模型,由它负责精准吸附边缘,生成 Bounding Box 和 Mask 。 一键导出 :流水线跑完后,自动打包成标准的 YOLO 数据集格式,可以直接丢给 YOLOv8/v11 去训轻量级模型。 技术实现细节 为了保证业务数据不上云,这个项目设计成了 100% 纯本地运行。这就需要处理显存压力的问题。 **后端 (FastAPI / PyTorch)**: 为了能在普通开发机上跑这套 30 亿参数的大模型,我在后端写了严格的显存清理机制。在我的 MacBook Pro (M4 Pro, 24GB) 上,开启 Apple MPS 加速后,处理一张高清图大概 4 秒。连续跑几百张图,系统内存占用稳在 12GB 左右,没有内存泄露,挂后台跑很稳。 **前端 (React / Vite / UnoCSS)**: 我个人不喜欢传统标注软件那种密密麻麻的控制台界面,所以用 UnoCSS 写了个极简风格的操作界面,用起来稍微顺眼点。 目前的坑 因为只花了 5 天写的初版,还有些局限: 速度上限 :4 秒一张图,应对几百张没问题。如果是上万张的大型数据集,单机单卡还是偏慢,后续得考虑加多卡并行。 环境依赖 :项目融合了 PyTorch 、Ultralytics 和 SAM2 ,不同系统装依赖可能会踩坑。Docker 镜像后续会补上。 最后 如果你也厌倦了手动标数据,可以去 GitHub 拉下来跑跑看。遇到问题或者有关于 MPS 显存优化的建议,直接在项目里提 Issue 或 PR 。