gen - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 23:08:10+08:00 · tech

求助！！！最近想往agent开发，ai开发岗位转，但是没什么好项目可以做到作品集里面各位佬有有什么企业刚需的agent需要实现的嘛就是很简单但是一定需要人去干的那种就可以做成agent吧 3 个帖子 - 3 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-11 22:52:03+08:00 · tech

PDF格式，简历内容控制在两页了，基本都是AI出来的。 RAG和Agent都是从GitHub上找的开源的，让大模型分析技术栈写的。提到的技术栈能说出来个7788。就是不知道还不会不会问Java八股文 2 个帖子 - 2 位参与者阅读完整话题

[AI Agent 智能体] 现在 AI 做 excel， word 的最佳实践？

v2ex · 2026-06-11 22:33:26+08:00 · tech

最近在尝试用 AI 生成 Excel 和 Word 折腾了一圈发现效果不太行，我日常主要是用 opencode 和 codex ，现在想通过加 skills 的形式解放 office 能力但是折腾了一阵发现效果很差，很多时候甚至不如网页免费的 AI 来的好，想问问 v 友有没有什么推荐的方案

请教一个有关hermes的问题

LinuxDo 最新话题 · 2026-06-11 22:24:45+08:00 · tech

最近在使用Hermes Agent 我发现hermes一旦改文件需要审批就会卡住（已经同意的情况下），知道超时时间到了才会回复我，这咋整？有没有人遇到过？ 5 个帖子 - 4 位参与者阅读完整话题

Vercel 大善人！不仅解封了我的账号，还给了 30 天 3X 的额度！！

LinuxDo 最新话题 · 2026-06-11 21:02:48+08:00 · tech

前因是这样： 5月30日，Agents 抽风了一直提交，触发了将近 50 次部署，直接把 Vercel 的 Hobby 额度全刷没了。但是 Vercel 一直只提醒，不处理，直到今天… 然后，晚上就开始排查原因，和 Claude 聊了一轮定位到具体原因后，问补救办法。结果是异常顺利，处理的是 AI，我就直接把 Claude 写的内容发过去，就直接解封了！！ 1 个帖子 - 1 位参与者阅读完整话题

[问与答] 如何降低 ds 不遵守规则的情况？

v2ex · 2026-06-11 19:43:04+08:00 · tech

各种 agent 都用过了， agents.md 明确要求了文档生成规则、文件名生成规则、流程规则，但是就是不遵守。包括有时候开发测试规则都不遵守，有啥好的办法么

[问与答] 如何降低 ds 不遵守规则的情况？

v2ex · 2026-06-11 18:43:04+08:00 · tech

各种 agent 都用过了， agents.md 明确要求了文档生成规则、文件名生成规则、流程规则，但是就是不遵守。包括有时候开发测试规则都不遵守，有啥好的办法么

各位佬们，ai agent这个方向的如何，有什么学习建议吗

LinuxDo 最新话题 · 2026-06-11 18:42:53+08:00 · tech

各位佬们，ai agent这个方向的如何，有什么学习建议吗，有什么教程是能学到真东西的。目前正在看hello-agents，一个github上的开源项目。或者有什么其他方向推荐吗，本人今年毕业，有一点迷茫，还望佬们给点建议。 1 个帖子 - 1 位参与者阅读完整话题

[AI Agent 智能体] 找车！上车一个 24 个月优惠 ChatGPT team 车有的带价私聊 @My_DOCOMO

v2ex · 2026-06-11 18:31:40+08:00 · tech

[问与答] 如何降低 ds 不遵守规则的情况？

v2ex · 2026-06-11 18:12:41+08:00 · tech

各种 agent 都用过了， agents.md 明确要求了文档生成规则、文件名生成规则、流程规则，但是就是不遵守。包括有时候开发测试规则都不遵守，有啥好的办法么

老板想做一个work buddy, 有没有类似的开源产品，我该从哪一步开始

LinuxDo 最新话题 · 2026-06-11 18:10:26+08:00 · tech

如题，老板想做一个workbuddy, 有没有类似的开源产品，我该从哪一步开始。主要思想就是 Agent to UI , 然后多 Agent 协作，把能力蒸馏成 Skill 或者 Agent。 10 个帖子 - 8 位参与者阅读完整话题

我想想目前，大家经常说的名词有哪些啊，agent, MCP, tools, Plugin, Prompt, workflow，Hook，skill，harness，memory/context大概就是这些吧，为了方便大家理解，和大佬指正错误，我将按名词进行解释：

LinuxDo 最新话题 · 2026-06-11 17:55:32+08:00 · tech

agent 是智能体的意思，什么是智能体呢，为啥不叫AI了啊，也不叫大模型了，其实这并不是孤立的概念，AI中文就是人工智能，英文全称：Artificial Intelligence，其实就是计算机科学的一个分支，用来研究开发模拟，延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品，大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节，比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议，用来，调用外部的服务器，返回固定内容信息的一个规则，大家都用这个规则，不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思，这里和mcp紧密相连，tools泛指一类工具，遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思，就是个扩展包，这不是ai独有的概念，浏览器有插件，任何应用都可能有插件，一个插件里面东西就多了，可以包含skill，agents，hooks，mcp severs等内容。 prompt是提示词的意思，大模型学的东西多了，大模型要在知识汪洋中预测你想要的下一个词，简直不要太难，那么就帮她缩小范围降低幻觉，那就是定人物，定任务范围，定目标，这样将结合以上的信息，进行数据处理，就大大降低了，大模型胡说八道的可能性。大模型本身就是个统计学问题，根本不具备任何智慧，和反思能力，并非动态进化的，而是提前通过人类社会无数的现有文档，向量化，然后通过多维向量的训练出来的，一个具备无数维度的数学矩阵，通过通过上下文的切割成token又称词元，一个词元就是一个数字，多个词元就组成了一个数学矩阵，将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢，会影响回应呢？ workflow就是工作流，针对一项工作设计的工作流程，使其完成特定的任务，取代繁重的工作。 hook钩子的意思，什么是钩子啊就是，当执行到特定情况或者涉及特殊判断的时候就会触发的程序，相当于一个钩子，勾住了你的工作流，在特定情况下触发，进而保证进程的稳定和顺利。 skill技能的意思，技能可以是一个md说明的工作文档，也可以是md说明文档加一些小程序、或者一些模板的综合体，目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台，工作台上啥也有，自由搭配，想用啥就用啥，比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt：给模型的指令 ├── Context：当前任务上下文 ├── Memory：可长期保存或检索的历史信息 ├── Tools：模型可调用的外部能力 │ └── MCP：连接 tools / resources / prompts 的标准协议之一 ├── Workflow：预设流程 ├── Hook：生命周期触发器 ├── Skill：可复用能力包 ├── Plugin：可安装扩展包 └── Harness：运行框架 / 执行外壳 agent 是配置了 instructions、tools，以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool：一个具体能力 MCP Tool：通过 MCP 协议暴露出来的 tool MCP Server：把一组 tools / resources / prompts 提供给 AI 应用 Agent：根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说，plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围，降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令，让模型更稳定地产生符合要求的内容。大模型本质上是通过大量数据训练出来的神经网络，它没有人类意义上的主观意识，也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数，以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”，更多是模型在特定提示、上下文或工具流程下表现出来的能力，而不是人类式的自我意识。 Token：文本被切分后的处理单位。 Token ID：token 被映射成的数字编号。 Embedding：token ID 进入模型后对应的向量表示。 Parameter：模型训练出来的权重和偏置。 Context window：一次输入/输出能处理的 token 上限。 Training tokens：训练时看过的数据 token 数量。 Vocabulary size：分词器支持的 token 种类数量。文本会先被 tokenizer 切成 token，再映射成 token ID。模型会把 token ID 转成向量表示，也就是 embedding，然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络，结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量，和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单，再判断退款规则，再调用退款接口，再发送通知。workflow 里可以用大模型，也可以不用大模型。它和 agent 的区别是：workflow 的路径主要由人或程序提前写好；agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚：workflows 是 LLM 和工具通过预定义代码路径编排；agents 则是 LLM 动态决定自己的流程和工具使用。这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包，包含 instructions、metadata 和可选资源，比如 scripts、templates，Claude 会在相关任务中自动使用。另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context：这次对话/这次任务临时放进来的信息。 Memory：跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息，比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息，比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化，而是系统把相关历史信息保存下来，在需要时重新塞回 context。 5 个帖子 - 4 位参与者阅读完整话题

cnopendata下载数据求助

LinuxDo 最新话题 · 2026-06-11 17:19:15+08:00 · tech

我是想做一个类似于千问高考agent的纯聊天小程序，需要一些简单的数据支撑，现在网上能搜索到正式一点的高考历年录取分数线的数据好像只有cnopendata上有，但是本人不是学术工作者所以申请不了，就想问问论坛的大佬们看看有没有可以帮忙下载的，当然也可以走ldc。原数据在：中国高考录取分数线数据当然这块如果有违规或者风险也可以告知，只是暂时有这么一个想法 1 个帖子 - 1 位参与者阅读完整话题

DiffusionGemma

V2EX - 技术 · 2026-06-11 16:29:23+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

求教如何反代在opencode等agent工具上使用Claude

LinuxDo 最新话题 · 2026-06-11 16:20:00+08:00 · tech

最近看到新出的A\新出的fable模型好心动，准备试一试跑一跑开发当天才程序员，但是一直有听说A\风控十分严格，人在大陆，有的机场都不干净，该怎么做？我的想法是买个claude账户反代出api来用比较好？但是反代该怎么做？会需要搭梯子吗？或者买梯子？（感觉买的话不可靠吧？）我有一个物理的服务器，能用吗？ 1 个帖子 - 1 位参与者阅读完整话题

MiMo Code无限上下文？

LinuxDo 最新话题 · 2026-06-11 16:07:12+08:00 · tech

Xiaomi MiMo正式发布并开源MiMo Code，一款运行在终端的探索性AI助手。模型与Agent协同优化，迈向自进化时代。 1.跨会话持久记忆+近乎无限上下文 2.独创Compose编排模式，先设计再编码 3.Dream记忆固化与自进化机制 4.支持语音输入与控制同时，MiMo Code 内置限时免费的顶级多模态模型–MiMo V2.5，并支持接入DeepSeek等主流模型以及第三方Token Plan，满足不同开发者的需求。无限上下文？这个真实吗？ 3 个帖子 - 3 位参与者阅读完整话题

DiffusionGemma

V2EX - 技术 · 2026-06-11 15:29:23+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

DiffusionGemma

V2EX - 技术 · 2026-06-11 15:29:23+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

DiffusionGemma

V2EX - 技术 · 2026-06-11 15:11:36+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

DiffusionGemma

V2EX - 技术 · 2026-06-11 14:36:06+08:00 · tech

https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时，理论上可以比现在的版本快 4 倍。本地运行步骤： https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat

/tag/gen