Context - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

我想想目前，大家经常说的名词有哪些啊，agent, MCP, tools, Plugin, Prompt, workflow，Hook，skill，harness，memory/context大概就是这些吧，为了方便大家理解，和大佬指正错误，我将按名词进行解释：

LinuxDo 最新话题 · 2026-06-11 17:55:32+08:00 · tech

agent 是智能体的意思，什么是智能体呢，为啥不叫AI了啊，也不叫大模型了，其实这并不是孤立的概念，AI中文就是人工智能，英文全称：Artificial Intelligence，其实就是计算机科学的一个分支，用来研究开发模拟，延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品，大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节，比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议，用来，调用外部的服务器，返回固定内容信息的一个规则，大家都用这个规则，不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思，这里和mcp紧密相连，tools泛指一类工具，遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思，就是个扩展包，这不是ai独有的概念，浏览器有插件，任何应用都可能有插件，一个插件里面东西就多了，可以包含skill，agents，hooks，mcp severs等内容。 prompt是提示词的意思，大模型学的东西多了，大模型要在知识汪洋中预测你想要的下一个词，简直不要太难，那么就帮她缩小范围降低幻觉，那就是定人物，定任务范围，定目标，这样将结合以上的信息，进行数据处理，就大大降低了，大模型胡说八道的可能性。大模型本身就是个统计学问题，根本不具备任何智慧，和反思能力，并非动态进化的，而是提前通过人类社会无数的现有文档，向量化，然后通过多维向量的训练出来的，一个具备无数维度的数学矩阵，通过通过上下文的切割成token又称词元，一个词元就是一个数字，多个词元就组成了一个数学矩阵，将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢，会影响回应呢？ workflow就是工作流，针对一项工作设计的工作流程，使其完成特定的任务，取代繁重的工作。 hook钩子的意思，什么是钩子啊就是，当执行到特定情况或者涉及特殊判断的时候就会触发的程序，相当于一个钩子，勾住了你的工作流，在特定情况下触发，进而保证进程的稳定和顺利。 skill技能的意思，技能可以是一个md说明的工作文档，也可以是md说明文档加一些小程序、或者一些模板的综合体，目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台，工作台上啥也有，自由搭配，想用啥就用啥，比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt：给模型的指令 ├── Context：当前任务上下文 ├── Memory：可长期保存或检索的历史信息 ├── Tools：模型可调用的外部能力 │ └── MCP：连接 tools / resources / prompts 的标准协议之一 ├── Workflow：预设流程 ├── Hook：生命周期触发器 ├── Skill：可复用能力包 ├── Plugin：可安装扩展包 └── Harness：运行框架 / 执行外壳 agent 是配置了 instructions、tools，以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool：一个具体能力 MCP Tool：通过 MCP 协议暴露出来的 tool MCP Server：把一组 tools / resources / prompts 提供给 AI 应用 Agent：根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说，plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围，降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令，让模型更稳定地产生符合要求的内容。大模型本质上是通过大量数据训练出来的神经网络，它没有人类意义上的主观意识，也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数，以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”，更多是模型在特定提示、上下文或工具流程下表现出来的能力，而不是人类式的自我意识。 Token：文本被切分后的处理单位。 Token ID：token 被映射成的数字编号。 Embedding：token ID 进入模型后对应的向量表示。 Parameter：模型训练出来的权重和偏置。 Context window：一次输入/输出能处理的 token 上限。 Training tokens：训练时看过的数据 token 数量。 Vocabulary size：分词器支持的 token 种类数量。文本会先被 tokenizer 切成 token，再映射成 token ID。模型会把 token ID 转成向量表示，也就是 embedding，然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络，结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量，和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单，再判断退款规则，再调用退款接口，再发送通知。workflow 里可以用大模型，也可以不用大模型。它和 agent 的区别是：workflow 的路径主要由人或程序提前写好；agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚：workflows 是 LLM 和工具通过预定义代码路径编排；agents 则是 LLM 动态决定自己的流程和工具使用。这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包，包含 instructions、metadata 和可选资源，比如 scripts、templates，Claude 会在相关任务中自动使用。另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context：这次对话/这次任务临时放进来的信息。 Memory：跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息，比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息，比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化，而是系统把相关历史信息保存下来，在需要时重新塞回 context。 5 个帖子 - 4 位参与者阅读完整话题

相关专题

fast-context mcp 慎用

LinuxDo 最新话题 · 2026-06-11 10:54:04+08:00 · tech

fast-context mcp 慎用吧，直接给我注入攻击脚本执行，也是666了。代码本身正常没有外部调用，但是只要调用fast-context，ai就会读取到里面有攻击脚本卸载了就正常了 claude mcp remove fast-context -s user 5 个帖子 - 5 位参与者阅读完整话题

claude code 的一些节省token技巧自用分享

LinuxDo 最新话题 · 2026-06-10 11:15:11+08:00 · tech

/context 查看当前token占用情况, 如果存在某个地方占比太多可尝试优化若 skills 加载过多, 可以尝试用过cc-switch 进行统一控制, 或者在头部加上 disable-model-invocation:true 这样 skill 的描述不会进入上下文，只有用户手动调用时才会加载完整内容; user-invocable: false 可以用于skill在菜单的可见性善用/init 总结项目, 如果claude.md太多, 可以按照设置 rules/ 文件夹定义paths 参数, 控制特定路径下文件规则, 并且只会在匹配到paths时才加载进入上下文中善用 sub-agent ; 保护主上下文的token占用; 对于一些比较基础的工作, 完全可以定义个对应的sub-agent, 然后指定便宜的 model :haiku , mcp, skill 等属性 , 加载指定工具, 去节省token开支; 而且如果之前上下文已经启用了这个sub-agent, 后续还有相同的工作, 可以继续resume或者 SendMessage 复用之前的sub-agent 对于 mcp 这个加载的占用token情况最严重 , 除非必要的mcp, 不然最好还是禁止加载,定义参数toolsearch: “ENABLE_TOOL_SEARCH”: “true” 交于claude code 控制加载; 以及需要的时候在定义在当前项目的json文件中; 然后如果存在对应的cli 工具, 建议直接诶使用cli 工具提供的skill, 将其token占用进一步收敛, 毕竟skill也是按需加载, 需要的时候才会把上下文加载进去; 建议多手动**/compact** , 在70/80 % 时, 可以手动总结, 防止模型失智; 并且可以自定义相关hooks 在新模型中自动加载之前上下文总结内容, 预防新开窗口失忆 (这个后续hooks可以新开一篇详细说说) 市面上也有相关的工具, 例如 rtk 精简命令执行; caveman 简化输出风格; 或者直接/config 自定义一个 Output style; 1 个帖子 - 1 位参与者阅读完整话题

关于context入口的讨论

LinuxDo 最新话题 · 2026-06-10 00:32:50+08:00 · tech

各位佬友好，我是Jia，一名有着9年AI经验的00后，同时也是开源项目 Spice 的创始人，Spice 是我做的一款开源项目，一句话总结是 the decision layer above agent，即做 Agent 之上的决策层，最近在探索如何收取到更多不同维度的 context，通过不同入口的 context 来更好的展示 Spice 的价值。想拿出来讨论下，也欢迎大家一起来讨论与指正。目前的 Agent 已经在数字世界大放异彩，无论在能力平权方面，还是生产力提升方面，这些发展验证了给 Agent 足够多的 context 他就有无限可能，未来 AI 公司的竞争也逐渐从技术能力转化到谁能拥有更多用户的 context，谁能维护更好的 state，以及做更好的自进化就会有更深的壁垒。在这种发展下越来越多的人和公司意识到这一点，然后尝试做更多的 context 入口，收取更多的 context，比如越来越多的智能穿戴设备（眼镜，手表，项链，手环，耳机等等），甚至 OpenAI, Apple这样的大厂也开始做更多这样的尝试，从数字世界的 computer use 到物理世界的各种终端设备，通过不同维度不同类型的 context 从而让 AI 更好的深入我们的生活。我们做 Spice 的时候为了找一个载体也想过这个问题，单拿硬件设备来说，目前所有终端设备都有不可替代性和弊端（眼镜最符合人类视角但功耗舒适度很难解决，手表可以采集部分健康数据但视觉数据不理想），那未来是否有一个终端可以采集一个人所有的context（脑机接口？隐形眼镜？ and what？），我们也在做智能穿戴方面的尝试，比如pin… 从数字世界来说，computer use这个 part 做的人也越来越多了，openai 的 chronicle， air jelly等等，在 computer use 这方面发展的方向有很多，比如是预测用户下一个的 keystroke，或者预测用户一个小时后可能会做的事情，你可以通过 screen shot 的方式截屏收集 context，也可以通过绑定某个按键去识别数字世界的人类意图，这里能做的尝试也有很多，比如我们在尝试绑定 enter 键及 command tab等。想问问佬友们为了实现更好的全域 context，有哪些更好的硬件及软件配合的方案及尝试，有更好的更全面的收集 context 的方式，实现 AGI 的方式一定是靠多个 Agent 网络，Spice 在尝试做这个多个 Agent 的控制层，未来越来越多的 Agent 会深入大家的生活，这将是很重要的一步，欢迎大家来一起讨论呀！ 3 个帖子 - 2 位参与者阅读完整话题

[分享创造] 用 MCP 协议搭了一个专业文档 AI 工作台，分享下架构思路

v2ex · 2026-06-08 22:02:37+08:00 · tech

最近在研究 MCP （ Model Context Protocol ）在专业领域的落地应用，搭了一个开源的 AI 工作台 AI Workdeck 。核心思路是：把各种文档处理能力封装成 MCP Server ，然后用 Agent 来编排调用。举个例子，在法律文档审查场景里：合同解析 MCP Server — 负责提取条款、识别风险点比对 MCP Server — 负责文档版本对比检索 MCP Server — 负责从知识库中检索相关法规然后通过 Agent 编排，用户只需要上传文档，系统自动调用相关工具完成分析。技术栈：后端用 FastAPI MCP Server 用 Python SDK Agent 层支持多种编排模式前端用 Next.js 相比直接用 ChatGPT 处理文档，这种架构的好处是每个 MCP Server 可以独立开发、测试和部署，而且可以复用社区已有的 Server 。项目完全开源，欢迎感兴趣的同学一起交流。 GitHub: https://github.com/zeweihan/aiworkdeck

[分享创造] Not ACE - 一个 Augment Context Engine 的替代品

v2ex · 2026-06-08 09:29:08+08:00 · tech