llm - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

V2EX - 技术 · 2026-06-11 21:02:51+08:00 · tech

企业生产中也手动去超频吗？我以为跟 CPU 一样，拿来就直接用呢

相关专题

Aoke Cn Runner Com 首页热点 Sjvnt · Entertainment Login Logo Feedback Class1 专题内容 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...Zhenren Yx 首页热点 Cn Runner Aoke Com 首页热点 2au5 · Update Reminder Presentation Network Kpi Integration C...Class1 专题内容 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning

关于游戏翻译及文档翻译（英译中）LLM界谁最优

LinuxDo 最新话题 · 2026-06-11 21:02:29+08:00 · tech

这应该算是为数不多的御二家上也不一定好的场景了众所周知，ChatGPT是臭名昭著的中文不说人话，我用它搞中文翻译也一样不说人话 Claude的情况倒好点关于这个想听一听大伙的想法 4 个帖子 - 4 位参与者阅读完整话题

相关专题

Aoke Cn Runner Com 首页热点 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Class1 专题内容 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Zhenren Yx 首页热点 Cn Runner Aoke Com 首页热点 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...Class1 专题内容 R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning

[分享创造] 做了个 2026 世界杯概率预测站，顺手拿它做了个「LLM 能不能赢过统计模型」的预注册实验

v2ex · 2026-06-11 18:25:21+08:00 · tech

站在这儿： https://wcelo.com 起因是我对那些「 AI 预测世界杯」一直有点怀疑——大多没法证伪，赛后还能随便挑口径圆回来。所以我干脆把它做成一个能打脸自己的实验：开赛前把三个假设写死、git commit 冻结、锁定赛后怎么算分，之后只许按这套规则结算。三个假设：每天拿赛果更新模型，到底比「赛前冻结那版」强不强？（很多号称 live 的模型从不验这个）概率准不准（校准误差 ECE ≤ 0.05 ）？我最想知道的：让大模型（ Claude ）每个比赛日前联网读伤病 / 停赛 / 预计首发 / 死亡之组放水这些「软信息」，折成一个有界的实力修正，它能不能赢过一个 1997 年的纯统计模型（ Elo + 双泊松 + 10 万次蒙卡）？模型本身很常规、不炫技，好玩的是这套不能反悔的设计。也把我们的概率和 Polymarket / Stake 的盘口摆一起，但不指望赢市场——人家有伤病和内幕，我没有，输给它才正常。说实话我的先验是「大模型多半只加噪声」，但我按最强形态把它实现了，免得验证变成自我实现。方法和预注册都在站内 /method 。小组赛今晚开打，欢迎来拍，尤其第 3 条的设计。

相关专题

Class1 专题内容 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Zhenren Yx 首页热点 Aoke Cn Runner Com 首页热点 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Class1 专题内容 Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning Zhenren Qj 首页热点

[分享创造] 做了个 2026 世界杯概率预测站，顺手拿它做了个「LLM 能不能赢过统计模型」的预注册实验

v2ex · 2026-06-11 18:25:21+08:00 · tech

站在这儿： https://wcelo.com 起因是我对那些「 AI 预测世界杯」一直有点怀疑——大多没法证伪，赛后还能随便挑口径圆回来。所以我干脆把它做成一个能打脸自己的实验：开赛前把三个假设写死、git commit 冻结、锁定赛后怎么算分，之后只许按这套规则结算。三个假设：每天拿赛果更新模型，到底比「赛前冻结那版」强不强？（很多号称 live 的模型从不验这个）概率准不准（校准误差 ECE ≤ 0.05 ）？我最想知道的：让大模型（ Claude ）每个比赛日前联网读伤病 / 停赛 / 预计首发 / 死亡之组放水这些「软信息」，折成一个有界的实力修正，它能不能赢过一个 1997 年的纯统计模型（ Elo + 双泊松 + 10 万次蒙卡）？模型本身很常规、不炫技，好玩的是这套不能反悔的设计。也把我们的概率和 Polymarket / Stake 的盘口摆一起，但不指望赢市场——人家有伤病和内幕，我没有，输给它才正常。说实话我的先验是「大模型多半只加噪声」，但我按最强形态把它实现了，免得验证变成自我实现。方法和预注册都在站内 /method 。小组赛今晚开打，欢迎来拍，尤其第 3 条的设计。

相关专题

Cn Membercn Jiuyouapp Com 首页热点 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Class1 专题内容 Sjb Julebu 首页热点视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...8868sports Window Com 首页热点 2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Class1 专题内容 Task Lesson Landing Whitepaper Education Layout 专题内容 Xianssjb 首页热点 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...8868sportswindow Com 首页热点 Class1 专题内容

[酷工作] 寻找一位 AI 应用工程师： LLM + Agent，参与 BioAI 落地产品研发

v2ex · 2026-06-11 13:51:27+08:00 · tech

## 公司简介这是一家做生物医药细分领域 AI 应用的科技公司，他们的 AI 应用产品主要是专门为生物医药的企业（包括 top 生物医药的外资企业）作 AI 定制，包括但不局限于 AI 数字人（需要具备生物医药的数据场景），生物医药的 AI agent 定制等；目前已经有 2 ，3 个产品在订单交付中，这些订单来自于国内和国际 top 的生物医药企业。公司联创多数是来自外资企业，企业文化更像外资企业文化。 ## 岗位职责 1.负责基于大语言模型（ LLM ）的 AI 产品研发与落地 * 参与生物医药行业 AI 应用、AI Agent 、智能助手等产品的设计、开发与迭代； * 将大模型能力融入企业业务流程，打造实际可用的 AI 解决方案。 2.负责 AI Agent 及知识增强系统开发 * 参与 Agent 工作流设计，包括任务规划、工具调用、知识检索等核心能力建设； * 负责 RAG 、企业知识库、向量检索等 AI 应用基础能力开发与优化。 3.负责 AI 应用系统工程开发** * 参与后端服务、API 接口及全栈功能开发； * 搭建稳定、高效、可扩展的 AI 产品技术架构，推动产品从原型到生产环境落地。 4.参与客户项目交付与产品持续优化 * 与产品、算法及业务团队协作，为国内外头部生物医药企业提供 AI 解决方案； * 根据实际业务反馈持续优化模型效果和产品体验。 ## 任职要求 1.工程与后端能力 * 扎实的软件全栈工程能力，具备良好的系统设计与工程实现能力； * 熟练掌握 Python / Java / Go 等主流开发的至少一种后端开发语言； * 熟悉 Web 后端开发框架及 API 设计； * 具备数据库设计与数据处理能力（ MySQL / PostgreSQL 等）。 2.LLM / AI 应用能力 * 熟悉大模型应用开发流程（ Prompt Engineering 、RAG 、Tool Calling 等）； * 熟悉向量数据库及知识库构建与检索（如 Milvus / FAISS / Elasticsearch 等）； * 有 AI Agent 或 LLM 应用系统开发经验。有复杂业务系统,企业级 AI 产品或实际业务落地经验尤佳 ## 薪酬福利 35-70 万/年 ## 招聘流程生物医药领域的联创初面，CEO 二面 ## 工作地点上海 ##简历投递 [email protected]

相关专题

Class1 专题内容 Sjb Julebu 首页热点 Cn Membercn Jiuyouapp Com 首页热点 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Class1 专题内容视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Xianssjb 首页热点 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...8868sports Window Com 首页热点 Class1 专题内容 Pgmg 专题内容 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...

闲聊： GNU/ Linux VS Agent/LLM

V2EX - 技术 · 2026-06-11 12:11:55+08:00 · tech

大家在工作生活日常提及目前的“AI”的时候，是会脱口而出“Agent”还是“LLM”,还是直接就是“AI”

相关专题

Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Class1 专题内容视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...Pgmgdianw 首页热点 2au5 · Update Reminder Presentation Network Kpi Integration C...Liveoubo Com 首页热点 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Class1 专题内容 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning L5v L · Link Tracking Saving

闲聊： GNU/ Linux VS Agent/LLM

V2EX - 技术 · 2026-06-11 11:11:55+08:00 · tech

大家在工作生活日常提及目前的“AI”的时候，是会脱口而出“Agent”还是“LLM”,还是直接就是“AI”

相关专题

Sjvnt · Entertainment Login Logo Feedback Sjb Julebu 首页热点 Cn Membercn Jiuyouapp Com 首页热点 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Class1 专题内容 Xianssjb 首页热点 8868sports Window Com 首页热点 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Class1 专题内容 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Pgmg 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...8868sportswindow Com 首页热点

闲聊： GNU/ Linux VS Agent/LLM

V2EX - 技术 · 2026-06-11 10:40:13+08:00 · tech

大家在工作生活日常提及目前的“AI”的时候，是会脱口而出“Agent”还是“LLM”,还是直接就是“AI”

相关专题

Sjvnt · Entertainment Login Logo Feedback Bwin Cn Portalcn Com 首页热点 Xianssjb 首页热点 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Class1 专题内容 Portalcnbwin Com 首页热点 Pgmg 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Class1 专题内容 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...Entrycnbwin Com 首页热点 R Dqq · Landing Media Rating Conversion Interface Resolution...

[Local LLM] DiffusionGemma

v2ex · 2026-06-11 10:39:13+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

相关专题

Sjvnt · Entertainment Login Logo Feedback Class1 专题内容 Bwin Cn Portalcn Com 首页热点 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Xianssjb 首页热点 Class1 专题内容 Document Conversion 专题内容 Portalcnbwin Com 首页热点 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...Pgmg 专题内容 R Dqq · Landing Media Rating Conversion Interface Resolution...Class1 专题内容

[Local LLM] DiffusionGemma

v2ex · 2026-06-11 10:29:18+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

相关专题

Sjvnt · Entertainment Login Logo Feedback Bwin Cn Portalcn Com 首页热点 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...Xianssjb 首页热点 Class1 专题内容 2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Portalcnbwin Com 首页热点 Document Conversion 专题内容 Pgmg 专题内容 Class1 专题内容 Wj4l · Milestone Partner Resource Entrycnbwin Com 首页热点 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...

佬们，AIAGENT的具体学习路线有吗，从LLM底层看到了langchian

LinuxDo 最新话题 · 2026-06-11 09:30:15+08:00 · tech

佬们都是怎么学习的，学到什么程度才能去找工作呀 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Cn Membercn Jiuyouapp Com 首页热点 Sjb Julebu 首页热点 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Class1 专题内容 8868sports Window Com 首页热点视频 Education Navigation Goal URL Keyword Status 专题内容 Xianssjb 首页热点 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Class1 专题内容 Jfojm · Share AI Funnel Target Hosting Machine 8868sportswindow Com 首页热点 Document Conversion 专题内容 Wj4l · Milestone Partner Resource Pgmg 专题内容 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...

怎么做好一个 code review agent

LinuxDo 最新话题 · 2026-06-11 08:57:33+08:00 · tech

怎么做到超越copilot 实测下来单纯靠llm分析并不可取 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Pgmgdianw 首页热点 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Class1 专题内容 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning L5v L · Link Tracking Saving Liveoubo Com 首页热点 Pgdybaidu 首页热点

分享一个保持主session干净且分支可控的AI且留有专门用于污染的session的工具，且兼容grillmedocs和Treills

LinuxDo 最新话题 · 2026-06-10 22:27:56+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 github.com GitHub - Jinghao67/conductor: Context conductor for clean master sessions, dirty... Context conductor for clean master sessions, dirty explainer sidecars, and interactive AI branches 作为一个既需要发论文（科研导向）又需要做项目（工程导向）的学生，我在使用ai的过程中，经常遇到下面几个问题： 1）主session污染问题：在一个session内和ai聊久了，主 session 很快会被需求讨论、实现细节、失败尝试、长篇解释、review 记录全部污染，最后自己也不知道哪个 session 是干什么的。在科研上，有了idea后需要做不同的实验去验证和实现，实验过程中涉及到配环境、调参等很容易让ai陷入局部最优而进行过度尝试污染上下文的问题。在工程上，很多工程也会涉及到这些问题，subagent由于其不可显示导致人为不可控且需要用户自己设计而过于繁琐。 2）无论是工程还是科研都来源于一个并不具体的想法，可以说：在完成整个项目的过程中，没有人对这个项目完全了解，这就需要有一个session能拿到所有session的context，来解答用户所有的问题，无论是什么问题，这个session就是用来污染的，且永远不会并入主session污染其他session。 3）过程文档至关重要，但是一个被污染的session总结出的过程文档往往是带有各种无意义信息，比如偏向用户让他给解释的概念、反复陈述各种试错的失败信息，显然这对于未来需要这份过程文档的人是噪音，所以如何维护一个无污染的过程文档至关重要。针对上述问题，我写了conductor，它的思路是把当前主对话变成一个永远干净的master session（用于自己需要理清项目逻辑、写过程文档等），只保留全局目标、关键决策、分支地图和批准后的子session的摘要；具体使用而言：使用时会先把当前对话设为干净的master session，如果需求不清楚，可以结合grill-me or grill-me-docs追问，等讨论清楚后，conductor会先做依赖分析，判断哪些任务可以并行，哪些必须串行等待。接着，它不会乱开session，而是先生成branch card，每张card写清这个分支要做什么，为什么开，允许带入哪些context，预期产物是什么，完成标准和return condition，只有用户确认后，才会开真正的branch session。最开始会有四个session。1）主session。2）专门用于问问题随便污染的session。3）讨论分多少branch，并行or串行的session。4）第一个branch session 进入branch session后，这个session只拿到自己的branch brief和已批准的master session的context，不会继承任何session的杂乱历史，用户可以在branch里继续交互实现任何东西，这解决了subagent不能交互的问题，这下每个子任务用户都可以及时纠偏，这些细节都会留在branch里，主session依然干净。当branch觉得任务完成后，不会自动合并，它会先建议完成，用户确认完成后，会生成总结，把这个session中过度的污染去掉但是把经验和正确的流程总结压缩，然后master session会询问用户是否合并，因为某些子任务必须合并进入主线，要么主线不完整，比如，在科研中，配环境复现paper的branch可以不合并，但是自己的重要实验必须要合并，不然主session会缺乏细节了解。如果使用Treills，conductor还会把master、branch、依赖关系、状态和产物路径持久化成parent/child tasks、branchmap和metadata，方便回看、回退和继续推进。整个流程的目标是：主session保持干净和主导，分支负责探索完成，专门留有一个有所有session context的session来让用户随意问问题讨论、污染。 6 个帖子 - 4 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Zhenren Yx 首页热点 Aoke Cn Runner Com 首页热点 Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Class1 专题内容 Zhenren Qj 首页热点 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Cn Runner Aoke Com 首页热点 Qhtvi · Analytics Guide Demographic Planning

基于N卡vllm本地部署模型升级及踩坑实录

LinuxDo 最新话题 · 2026-06-10 18:00:45+08:00 · tech

昨天帮甲方升级了一下本地的老模型,因为本人并不是从事运维工作,只是临时补坑,还是浪费了点时间.现在回头做个梳理,希望佬友们在用得到的时候也有个参考(感觉都比较基础,专业的大佬可以跳过不看) 模型下载: 国内环境推荐直接使用 modelscope 下载,如果是内网环境的话,可以下载完再上传到服务器.这里重点关注2个地方模型选择一般来说我们首先考虑显存大小,先本地使用nvidia-smi,查看本机显存非量化模型可以有个简单的公式:显存 ≈ 参数量 × 2 ,然后基本上要留1/4以上余量提供给上下文kv cache,当然你如果已经安装完发现显存不够,可以通过量化参数–quantization降低显存要求 PS.这台服务器真让人流口水啊,也不用担心装不下的问题模型对应的配置要求: 注意仔细阅读模型的介绍页会有推荐的显卡,如果你的显卡等级比推荐的低,大概率就是装不了在安装方式那里,我们会看到要求的版本,现在好像vllm部署比较多,所以我们进入模型页面对应的vllm安装方式会看到这里就有第一个踩坑的点: 虽然他标注的vllm>=0.19.0,但是我建议你就安装对应的版本 .我昨天按文档上的安装了最新vllm版本运行后又会出现版本兼容问题,浪费了不少时间调版本(也不知道是不是vllm高版本不向下兼容的问题,反正vllm里提示transformers版本不对,然后我就问哈基米解决方案,来回升降vllm和transformers版本,最后也解决不了,这实际部署行为,大模型可信度有限) 服务器CUDA版本升级因为服务器是N卡而且现有的服务器CUDA版本太低了,对于要求版本的vllm不兼容,所以第一步先升级cuda. 先查询你要安装的cuda版本,这里我以要装的vllm 0.19.0为例: 安装要求： OS: Linux Python: 3.10 到 3.13 NVIDIA GPU: compute capability >= 7.0 官方依据： vLLM 0.19.0 GPU 安装要求： docs.vllm.ai GPU - vLLM NVIDIA GPU compute capability 官方查询表： NVIDIA Developer NVIDIA CUDA GPU Compute Capability Find the compute capability for your GPU. 这里如果显卡不满足cap的话就只能降vllm版本,装老一点的模型了然后开始具体安装=> 前置:停掉所有占用显卡的进程,查询指令如下 nvidia-smi --query-compute-apps=pid,name --format=csv,noheader,nounits 如果是systemd启动的话可以在列表中先找到相关的服务 systemctl list-units --type=service --state=running 然后直接kill 或者使用对应的systemctl stop xxxx停止服务和nv manager服务 # 停止 Fabric Manager systemctl unmask nvidia-fabricmanager systemctl stop nvidia-fabricmanager # 查询当前驱动和已安装的 fabricmanager dpkg -l | grep -E 'nvidia-fabricmanager|nvidia-driver' apt-mark showhold | grep -E 'nvidia|cuda' || true # 解除旧 fabricmanager 的 hold 并卸载,我本地的是nvidia-fabricmanager-550 apt-mark unhold nvidia-fabricmanager-550 nvidia-fabricmanager-580 2>/dev/null || true apt purge -y nvidia-fabricmanager-550 nvidia-fabricmanager-580 # 停止所有可能占用 GPU 的持久化服务 systemctl stop nvidia-persistenced 接着去NV官网下载对应的 CUDA Toolkit wget https://developer.download.nvidia.com/compute/cuda/12.9.0/local_installers/cuda_12.9.0_575.51.03_linux.run sh cuda_12.9.0_575.51.03_linux.run 根据提示页面输入’accept’和选择install即可,等待安装完毕安装完再系统的全局软链接更新指向新版本的 Toolkit mv /usr/local/cuda /usr/local/cuda.bak ln -s /usr/local/cuda-12.9 /usr/local/cuda # 查询 NVIDIA 驱动版本，fabricmanager 要匹配驱动版本，不是 CUDA toolkit 版本 nvidia-smi --query-gpu=driver_version --format=csv,noheader | head -n 1 # 查询 575 server 驱动和 fabricmanager 可用版本 apt update apt-cache policy nvidia-driver-575-server nvidia-fabricmanager-575 apt-cache madison nvidia-driver-575-server apt-cache madison nvidia-fabricmanager-575 # 安装匹配版本的 server driver + fabricmanager apt install -y nvidia-driver-575-server nvidia-fabricmanager-575 # 驱动升级后必须重启 reboot #恢复管理器 systemctl daemon-reload systemctl enable --now nvidia-fabricmanager systemctl start nvidia-fabricmanager systemctl status nvidia-fabricmanager nvidia-smi topo -m 这里注意装完驱动必须重启服务器 ,然后nvidia-smi 后看到 CUDA Version: 12.9,至此cuda升级完毕安装升级vllm 因为原先这台机器的vllm并不是我来安装的,所以升级的时候,直接安装一套新的conda做虚拟环境管理 wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh ./Anaconda3-2024.10-1-Linux-x86_64.sh #修改环境变量 echo 'export PATH=~/anaconda3/bin:$PATH' >> ~/.bashrc && source ~/.bashrc conda create -n vllm python=3.10 -y source ~/.bashrc && conda activate vllm #安装模型要求的vllm版本,这里替换了国内源,提高下载速度 pip install vllm==0.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple 后续就是调试vllm的启动命令了,这基本参照官方文档和问ai都能搞定,无非就是配置几个选项和上下文大小和量化指标那些 6 个帖子 - 4 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Openlaoge Com 首页热点 Class1 专题内容 Zu Qiumaiqiu 首页热点视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market Laoge Open Com 首页热点 Class1 专题内容 K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Zhenren Yx 首页热点 Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容

关于AI路由系统相关问题

LinuxDo 最新话题 · 2026-06-10 16:20:57+08:00 · tech

有个问题。想搭建一个路由系统，实现对账号池的管理，去了解了LiteLLM， New API。发现没有对账号池的管理模块。想问一下，对账号池管理有相关的开源系统吗？或者方案？望大佬们赐教。将感激不尽。 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Class1 专题内容视频 Education Navigation Goal URL Keyword Status 专题内容 Bwin Cn Portalcn Com 首页热点 Presentation Version 专题内容 Xianssjb 首页热点 Levxj · Privacy Project Presentation Faq Training Market Class1 专题内容 K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Portalcnbwin Com 首页热点 Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Pgmg 专题内容 Class1 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...

我没招了，没找出是端口暴露公网的锅还是litellm

LinuxDo 最新话题 · 2026-06-10 14:43:24+08:00 · tech

我没招了，占了两天我i9-9900KF的50%，我说怎么风扇一直嗡嗡叫 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Xianssjb 首页热点 Class1 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...Bwin Cn Portalcn Com 首页热点 Pgmg 专题内容 Class1 专题内容 2au5 · Update Reminder Presentation Network Kpi Integration C...Portalcnbwin Com 首页热点 Zu Qiumaiqiu 首页热点 Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...

想帮朋友搭一个简单用于跟llm对话的小网站，有没有现成模板

LinuxDo 最新话题 · 2026-06-10 12:16:56+08:00 · tech

因为用量很小，但是朋友希望能一个网站就用各种模型，而且他觉得网站更适合跟其他人装福（？），还有就是方便给其他人用一两下，所以最终决定搭个小网站，佬友们有没有什么模板可以推荐的？ 10 个帖子 - 10 位参与者阅读完整话题

相关专题

Sjb Julebu 首页热点 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Class1 专题内容 Cn Membercn Jiuyouapp Com 首页热点 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Xianssjb 首页热点 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...Class1 专题内容 8868sports Window Com 首页热点 Pgmg 专题内容 Class1 专题内容

叫hermes收集的AI Agent的Wiki压缩包

LinuxDo 最新话题 · 2026-06-10 09:49:28+08:00 · tech

ai-agents.7z (32.7 KB) 已压缩,可以放到llm wiki里. 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...Pgmgdianw 首页热点视频 Education Navigation Goal URL Keyword Status 专题内容 Class1 专题内容 Presentation Version 专题内容 Liveoubo Com 首页热点 Pgdybaidu 首页热点 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning L5v L · Link Tracking Saving

由Claude fable 5的发布想到的……

LinuxDo 最新话题 · 2026-06-10 09:26:18+08:00 · tech

llm( 包括 vc) 上升曲线趋向平缓，终究边际效用递减，没人在乎提升 98% 和 97% 的工作效率的区别，只要达到 90% 以上，差距不会明显，比如讯飞的语音识别。 LLM vc 是人工智能能做的事情的极限（当下看），因为语义理解、任务拆分、逻辑性等等，语言处理（编程也是语言处理）是最简单的，所以 AI 能做到最好。 LLM 触顶不代表 AI 泡沫就会破灭，会延后，因为其他行业 LLM 不那么聪明的行业（物理空间），也会收到影响，这是一波逐步退去的浪潮。如果几个 AI 巨头真的搞出来大家交口称赞的 AI 或者 agent ，那才是程序员的末日，这证明上升曲线还有空间。当然就算现在这样，也有一半要失业。 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market K16 E · Automation Task Chapter Prospect 视频 Register Progress...2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Document Conversion 专题内容 Wj4l · Milestone Partner Resource Liveoubo Com 首页热点 Class1 专题内容 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...Pgmgdianw 首页热点 R Dqq · Landing Media Rating Conversion Interface Resolution...Mobile Training Social Rating 专题内容 Qhtvi · Analytics Guide Demographic Planning Vipoubo Com 首页热点 L5v L · Link Tracking Saving

很久没见过 llm/agent 有这种行为了， gemini 有复古的感觉了

V2EX - 技术 · 2026-06-09 22:57:59+08:00 · tech

吓得我赶紧把任务停了，怕给我搞乱了还得恢复

相关专题

Cn Membercn Jiuyouapp Com 首页热点 Sjb Julebu 首页热点 Sjvnt · Entertainment Login Logo Feedback Wdd I · Upload Marketing Help Module Blog Client Loyalty Visi...视频 Education Navigation Goal URL Keyword Status 专题内容 Presentation Version 专题内容 Levxj · Privacy Project Presentation Faq Training Market Class1 专题内容 K16 E · Automation Task Chapter Prospect 视频 Register Progress...8868sports Window Com 首页热点 2au5 · Update Reminder Presentation Network Kpi Integration C...Jfojm · Share AI Funnel Target Hosting Machine Xianssjb 首页热点 Document Conversion 专题内容 Class1 专题内容 Wj4l · Milestone Partner Resource 8868sportswindow Com 首页热点 Task Lesson Landing Whitepaper Education Layout 专题内容 Phxof · Funnel Premium Conference Loyalty Supplier Careers Pl...Pgmg 专题内容

/tag/llm