训练 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

自己训练LLM

LinuxDo 最新话题 · 2026-06-12 11:53:08+08:00 · tech

突发奇想，现在GPU虽然贵但是也不至于租不起，能不能自己训练个3B，8B这样的模型？估算了一下也就只要十几万rmb啊 7 个帖子 - 7 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-12 10:51:11+08:00 · tech

百度aistudioGPU抢不到怎么办？实训项目跑的训练数据集，没gpu跑太慢了！ 1 个帖子 - 1 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-12 10:39:02+08:00 · tech

今天看到一则新闻6月9号的新闻：Niantic（宝可梦开发商）和Vantor（万拓）合作，将 Pokémon GO 玩家提供的位置信息来训练无人机的导航系统。也就是说，玩家在玩游戏时贡献的数据，可能被用在完全不同的技术领域，比如无人机避障和路径规划。文中提到，玩家是自愿同意条款和条件的，虽然我没有去看具体的条款，但我觉得条款中会合理出现的是“我同意你用我的数据优化游戏”，而不是“我同意你用我的数据训练机器人”吧？如果以后更多的XR的游戏数据被用在科研或商业项目，你会玩吗？原文链接： Pokémon Go data ‘exploited to develop navigation’ for military drones 1 个帖子 - 1 位参与者阅读完整话题

A➗拒绝了你的神经网络训练需求

LinuxDo 最新话题 · 2026-06-12 09:20:35+08:00 · tech

听说fable5很强，我就想用来让它看看我没有进展的研究，但是接了第三方工具一直是搞着搞着就空回，我还以为是公益站不够稳定导致的，结果发现它一直都是在同一个地方停下，就是读完你的项目之后过于巧合然后又想起了看见过如下图片内容起初看见这个我还以为只是防止前沿模型或者是大语言模型的研究，结果现在破案了，我的那个垃圾研究也被“安全”了，所以读完项目内容就跑掉。后来我切到cloud code里面尝试验证，果然出现报错 ⎿ API Error: Claude Code is unable to respond to this request, which appears to violate our Usage Policy ( https://www.anthropic.com/legal/aup ). Please double press esc to edit your last message or start a new session for Claude Code to assist with a different task. If you are seeing this refusal repeatedly, try running /model claude-sonnet-4-20250514 to switch models. 说真的是无语，不知道说什么好了。 7 个帖子 - 6 位参与者阅读完整话题

如果都用现成代码训练大语言模型的话....

LinuxDo 最新话题 · 2026-06-11 21:14:11+08:00 · tech

如果都用现成代码训练大语言模型的话，那是不是以后各种语言、框架和库的模式和规约就只能定死不能改变了，比如我熟悉的前端 React 本来 hook 不是主流的，但是后面都用 hook 了，但是如果大语言模型在 hook 之前推出的话，那么生成的代码大概率是按照之前的规范来写的。我现在写 python 也会发现这样的问题，很多时候大语言生成的是能运行但是并非当前最佳实践的写法，有时候甚至会混着用不同的模式，如果以后都是 vibe coding 那么代码质量是会越来越好还是越来越拉似乎值得深思，即使训练时候严格控制训练集代码也无法解决这样的问题… 4 个帖子 - 2 位参与者阅读完整话题

[酷工作] AI 陪伴产品招远程岗位：全栈开发工程师/文本训练工程师/视频训练工程师/数据工程师/产品经理

v2ex · 2026-06-11 15:59:36+08:00 · tech

我们是专注 AI 陪伴方向的团队，旗下产品有情感陪伴，NSFW 伴侣产品，AI 游戏平台等公司主体在美国，目前招聘以下远程全职岗位： 1 ，高级全栈开发工程师：负责公司旗下产品前后端的开发与上线（ Java + Vue 3/TypeScript ） 5 年以上全栈开发经验，有独立负责一个完整业务领域的经历一年以上 AI 辅助编程实战经验（ Claude Code/Cursor 或同类工具）适应快速迭代的交付节奏，有远程协作自觉性做过支付、结算、账务类系统者优先有 AI 应用开发经验者优先 2 ，文本大模型训练专家建立专属小参数文本模型，对对话和叙事质量负责基于优秀开源大模型，并执行面向 NSFW 叙事场景的微调训练方案构建与清洗华语叙事 / 对话语料，建立数据飞轮设计对话质量、角色一致性、长程记忆的评测体系并持续迭代优化小参数模型的推理成本与响应速度，推动线上部署要求：熟悉 LLM 微调经验能独立完成从数据到评测的闭环有垂直领域小参数模型落地经验熟悉角色扮演 / 长程对话记忆方案有 hugging face 模型作品优先 3 ，视频训练专家基于优秀开源视频生成模型做深度微调，覆盖仿真人与动漫两个垂直领域构建画质、动作一致性、时序连贯、prompt 跟随度的量化评测体系建立数据采集与清洗管线，持续提升生成质量要求：扎实的视频 / 图像生成模型训练经验（扩散模型等）熟悉相关训练、微调与评测方法有 C 站，hugging face 模型作品优先 4 ，AI 数据工程师设计并搭建面向语言模型训练的数据管线（采集、清洗、去重、质量评估）构建 NSFW 领域的语料与多模态数据集，建立标注规范与标注工作流搭建数据质量评测与监控体系，支撑模型训练的数据飞轮要求：扎实的数据工程经验（ ETL 、数据管线、分布式处理）熟悉训练数据的构建、清洗与评测，熟练使用 Python 及主流数据工具有语言模型数据建设经验，搭建过数据标注平台或标注流程 5 ，AI 产品经理定义 AI 伴侣与创作者工具链的产品方向与迭代节奏把模型能力翻译成创作者与用户可感知的体验建立数据驱动的产品决策，平衡创作者收益与用户体验参与新产品形态（影游 / 游戏）的早期探索项目长期稳定，薪资结算灵活另在小参数模型训练，视频训练等岗位我们也可以采取项目制或顾问制，如果您不方便远程加入，但具备这方面的能力和一定空余时间，我们也可以采取项目制合作按结果付费另外也正在招募推广增长经理，品类运营经理（男性向，女性向，不同语种等），有相关经验者也欢迎联系联系邮箱（ Base64 ）：cGVhY2hsYW5kYWlAZ21haWwuY29t 联系 VX （ Base64 ）：QzU3OTY4MDA= 联系 TG （ Base64 ）：QGN6YWs5

v2ex · 2026-06-11 15:59:36+08:00 · tech

我们是专注 AI 陪伴方向的团队，旗下产品有情感陪伴，NSFW 伴侣产品，AI 游戏平台等公司主体在美国，目前招聘以下远程全职岗位： 1 ，高级全栈开发工程师：负责公司旗下产品前后端的开发与上线（ Java + Vue 3/TypeScript ） 5 年以上全栈开发经验，有独立负责一个完整业务领域的经历一年以上 AI 辅助编程实战经验（ Claude Code/Cursor 或同类工具）适应快速迭代的交付节奏，有远程协作自觉性做过支付、结算、账务类系统者优先有 AI 应用开发经验者优先 2 ，文本大模型训练专家建立专属小参数文本模型，对对话和叙事质量负责基于优秀开源大模型，并执行面向 NSFW 叙事场景的微调训练方案构建与清洗华语叙事 / 对话语料，建立数据飞轮设计对话质量、角色一致性、长程记忆的评测体系并持续迭代优化小参数模型的推理成本与响应速度，推动线上部署要求：熟悉 LLM 微调经验能独立完成从数据到评测的闭环有垂直领域小参数模型落地经验熟悉角色扮演 / 长程对话记忆方案有 hugging face 模型作品优先 3 ，视频训练专家基于优秀开源视频生成模型做深度微调，覆盖仿真人与动漫两个垂直领域构建画质、动作一致性、时序连贯、prompt 跟随度的量化评测体系建立数据采集与清洗管线，持续提升生成质量要求：扎实的视频 / 图像生成模型训练经验（扩散模型等）熟悉相关训练、微调与评测方法有 C 站，hugging face 模型作品优先 4 ，AI 数据工程师设计并搭建面向语言模型训练的数据管线（采集、清洗、去重、质量评估）构建 NSFW 领域的语料与多模态数据集，建立标注规范与标注工作流搭建数据质量评测与监控体系，支撑模型训练的数据飞轮要求：扎实的数据工程经验（ ETL 、数据管线、分布式处理）熟悉训练数据的构建、清洗与评测，熟练使用 Python 及主流数据工具有语言模型数据建设经验，搭建过数据标注平台或标注流程 5 ，AI 产品经理定义 AI 伴侣与创作者工具链的产品方向与迭代节奏把模型能力翻译成创作者与用户可感知的体验建立数据驱动的产品决策，平衡创作者收益与用户体验参与新产品形态（影游 / 游戏）的早期探索项目长期稳定，薪资结算灵活另在小参数模型训练，视频训练等岗位我们也可以采取项目制或顾问制，如果您不方便远程加入，但具备这方面的能力和一定空余时间，我们也可以采取项目制合作按结果付费另外也正在招募推广增长经理，品类运营经理（男性向，女性向，不同语种等），有相关经验者也欢迎联系联系邮箱（ Base64 ）：cGVhY2hsYW5kYWlAZ21haWwuY29t 联系 VX （ Base64 ）：QzU3OTY4MDA= 联系 TG （ Base64 ）：QGN6YWs5

[酷工作] AI 陪伴产品招远程岗位：全栈开发工程师/文本训练工程师/视频训练工程师/数据工程师/产品经理

v2ex · 2026-06-11 15:59:36+08:00 · tech

我们是专注 AI 陪伴方向的团队，旗下产品有情感陪伴，NSFW 伴侣产品，AI 游戏平台等公司主体在美国，目前招聘以下远程全职岗位： 1 ，高级全栈开发工程师：负责公司旗下产品前后端的开发与上线（ Java + Vue 3/TypeScript ） 5 年以上全栈开发经验，有独立负责一个完整业务领域的经历一年以上 AI 辅助编程实战经验（ Claude Code/Cursor 或同类工具）适应快速迭代的交付节奏，有远程协作自觉性做过支付、结算、账务类系统者优先有 AI 应用开发经验者优先 2 ，文本大模型训练专家建立专属小参数文本模型，对对话和叙事质量负责基于优秀开源大模型，并执行面向 NSFW 叙事场景的微调训练方案构建与清洗华语叙事 / 对话语料，建立数据飞轮设计对话质量、角色一致性、长程记忆的评测体系并持续迭代优化小参数模型的推理成本与响应速度，推动线上部署要求：熟悉 LLM 微调经验能独立完成从数据到评测的闭环有垂直领域小参数模型落地经验熟悉角色扮演 / 长程对话记忆方案有 hugging face 模型作品优先 3 ，视频训练专家基于优秀开源视频生成模型做深度微调，覆盖仿真人与动漫两个垂直领域构建画质、动作一致性、时序连贯、prompt 跟随度的量化评测体系建立数据采集与清洗管线，持续提升生成质量要求：扎实的视频 / 图像生成模型训练经验（扩散模型等）熟悉相关训练、微调与评测方法有 C 站，hugging face 模型作品优先 4 ，AI 数据工程师设计并搭建面向语言模型训练的数据管线（采集、清洗、去重、质量评估）构建 NSFW 领域的语料与多模态数据集，建立标注规范与标注工作流搭建数据质量评测与监控体系，支撑模型训练的数据飞轮要求：扎实的数据工程经验（ ETL 、数据管线、分布式处理）熟悉训练数据的构建、清洗与评测，熟练使用 Python 及主流数据工具有语言模型数据建设经验，搭建过数据标注平台或标注流程 5 ，AI 产品经理定义 AI 伴侣与创作者工具链的产品方向与迭代节奏把模型能力翻译成创作者与用户可感知的体验建立数据驱动的产品决策，平衡创作者收益与用户体验参与新产品形态（影游 / 游戏）的早期探索项目长期稳定，薪资结算灵活另在小参数模型训练，视频训练等岗位我们也可以采取项目制或顾问制，如果您不方便远程加入，但具备这方面的能力和一定空余时间，我们也可以采取项目制合作按结果付费另外也正在招募推广增长经理，品类运营经理（男性向，女性向，不同语种等），有相关经验者也欢迎联系联系邮箱（ Base64 ）：cGVhY2hsYW5kYWlAZ21haWwuY29t 联系 VX （ Base64 ）：QzU3OTY4MDA= 联系 TG （ Base64 ）：QGN6YWs5

大家有了解过商业的运动康复吗

LinuxDo 最新话题 · 2026-06-11 10:11:30+08:00 · tech

从小一直有膝盖弹响，上大学之后去商健跟着一个教练训练过一个月的体态课，弹响有改善，后面没练了又恢复了，这次想整体分析一下原因（之前定位问题是肌肉强度差导致的下蹲时髌骨滑动摩擦），现在去了一家运动康复评估了一下，感觉挺专业，一节课700+，一节课是筋膜刀手法放松和带练，然后有设计方案让你每天练。想了解一下这个价格如何，商业的运动康复怎么判断是不是足够专业呢 2 个帖子 - 2 位参与者阅读完整话题

君の公益出问题了，谁的结果速速来领

LinuxDo 最新话题 · 2026-06-11 09:16:33+08:00 · tech

我让他写个后端，整了2遍，全是别人的结果。第一遍是谁的E:\测试\写的Python代码。第二遍，如图谁的训练结果，跑我这来了。 @user792 9 个帖子 - 8 位参与者阅读完整话题

摩尔线程宣布开源MusaCoder：首个国产全功能GPU全栈训练代码大模型

LinuxDo 最新话题 · 2026-06-10 19:29:20+08:00 · tech

今日，摩尔线程宣布正式发布并开源MusaCoder，这是面向GPU底层算子生成的专用代码大模型。摩尔线程表示，MusaCoder是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型，其完整后训练流程均在基于MTT S5000构建的夸娥智算集群上完成。据介绍，MusaCoder包含9B和27B两个参数规模，主要面向GPU底层算子生成任务设计，重点支持从PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码。这一能力可降低开发者手写底层GPU算子的门槛，提升GPU高性能计算场景下的代码生成、验证和优化效率。性能方面，在KernelBench评测中，MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg. @8 88.60%的成绩，超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等主流SOTA代码模型，达到当前行业领先水平。摩尔线程称，MusaCoder的SFT（监督微调）、RFT（拒绝采样微调）、RL（强化学习）、异步rollout、在线编译执行验证及reward计算等全栈训练与验证流程，均依托MTT S5000构建的夸娥智算集群完成。这也意味着，国产GPU不仅能够支撑大模型推理和常规微调任务，也能够稳定承载代码大模型后训练全周期算力需求。尤其是在GPU Kernel生成这类任务中，训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算，对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。 huggingface.co MooreThreads/MusaCoder-27B · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. arXiv.org MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore... Native GPU kernel generation turns high-level tensor programs into executable, efficient low-level code. Existing Large Language Models (LLMs) struggle with this task, while execution-based reinforcement learning suffers from sparse rewards, reward... 5 个帖子 - 5 位参与者阅读完整话题

[问与答] AI 满天飞的时代是否还需要训练自己的英文阅读和书写能力？

v2ex · 2026-06-10 17:54:34+08:00 · tech

A. 不需要训练 AI 工具突破了语言的信息隔离 B. 需要训练保持一手信息 eval 感觉

[问与答] AI 满天飞的时代是否还需要训练自己的英文阅读和书写能力？

v2ex · 2026-06-10 17:48:26+08:00 · tech

A. 不需要训练 AI 工具突破了语言的信息隔离 B. 需要训练保持一手信息 eval 感觉

[问与答] AI 满天飞的时代是否还需要训练自己的英文阅读和书写能力？

v2ex · 2026-06-10 16:41:42+08:00 · tech

A. 不需要训练 AI 工具突破了语言的信息隔离 B. 需要训练保持一手信息 eval 感觉

/tag/训练