agent 是智能体的意思,什么是智能体呢,为啥不叫AI了啊,也不叫大模型了,其实这并不是孤立的概念,AI中文就是人工智能,英文全称:Artificial Intelligence,其实就是计算机科学的一个分支,用来研究开发模拟,延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品,大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节,比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议,用来,调用外部的服务器,返回固定内容信息的一个规则,大家都用这个规则,不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思,这里和mcp紧密相连,tools泛指一类工具,遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思,就是个扩展包,这不是ai独有的概念,浏览器有插件,任何应用都可能有插件,一个插件里面东西就多了,可以包含skill,agents,hooks,mcp severs等内容。 prompt是提示词的意思,大模型学的东西多了,大模型要在知识汪洋中预测你想要的下一个词,简直不要太难,那么就帮她缩小范围降低幻觉,那就是定人物,定任务范围,定目标,这样将结合以上的信息,进行数据处理,就大大降低了,大模型胡说八道的可能性。大模型本身就是个统计学问题,根本不具备任何智慧,和反思能力,并非动态进化的,而是提前通过人类社会无数的现有文档,向量化,然后通过多维向量的训练出来的,一个具备无数维度的数学矩阵,通过通过上下文的切割成token又称词元,一个词元就是一个数字,多个词元就组成了一个数学矩阵,将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢,会影响回应呢? workflow就是工作流,针对一项工作设计的工作流程,使其完成特定的任务,取代繁重的工作。 hook钩子的意思,什么是钩子啊就是,当执行到特定情况或者涉及特殊判断的时候就会触发的程序,相当于一个钩子,勾住了你的工作流,在特定情况下触发,进而保证进程的稳定和顺利。 skill技能的意思,技能可以是一个md说明的工作文档,也可以是md说明文档加一些小程序、或者一些模板的综合体,目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台,工作台上啥也有,自由搭配,想用啥就用啥,比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt:给模型的指令 ├── Context:当前任务上下文 ├── Memory:可长期保存或检索的历史信息 ├── Tools:模型可调用的外部能力 │ └── MCP:连接 tools / resources / prompts 的标准协议之一 ├── Workflow:预设流程 ├── Hook:生命周期触发器 ├── Skill:可复用能力包 ├── Plugin:可安装扩展包 └── Harness:运行框架 / 执行外壳 agent 是配置了 instructions、tools,以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool:一个具体能力 MCP Tool:通过 MCP 协议暴露出来的 tool MCP Server:把一组 tools / resources / prompts 提供给 AI 应用 Agent:根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说,plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围,降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令,让模型更稳定地产生符合要求的内容。 大模型本质上是通过大量数据训练出来的神经网络,它没有人类意义上的主观意识,也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数,以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”,更多是模型在特定提示、上下文或工具流程下表现出来的能力,而不是人类式的自我意识。 Token:文本被切分后的处理单位。 Token ID:token 被映射成的数字编号。 Embedding:token ID 进入模型后对应的向量表示。 Parameter:模型训练出来的权重和偏置。 Context window:一次输入/输出能处理的 token 上限。 Training tokens:训练时看过的数据 token 数量。 Vocabulary size:分词器支持的 token 种类数量。 文本会先被 tokenizer 切成 token,再映射成 token ID。模型会把 token ID 转成向量表示,也就是 embedding,然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络,结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量,和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单,再判断退款规则,再调用退款接口,再发送通知。workflow 里可以用大模型,也可以不用大模型。它和 agent 的区别是:workflow 的路径主要由人或程序提前写好;agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚:workflows 是 LLM 和工具通过预定义代码路径编排;agents 则是 LLM 动态决定自己的流程和工具使用。 这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包,包含 instructions、metadata 和可选资源,比如 scripts、templates,Claude 会在相关任务中自动使用。 另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context:这次对话/这次任务临时放进来的信息。 Memory:跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息,比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息,比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化,而是系统把相关历史信息保存下来,在需要时重新塞回 context。 5 个帖子 - 4 位参与者 阅读完整话题
看到没啥人测Fable,我来发一个 大模型kernel优化领域存在一个benchmark叫FlashInfer-Bench,其中有一道题目是Sparse_Attention算子,这是DeepSeek等现代大模型中很重要的一个构件: FlashInfer-Bench-Sparse-Attention 今天用cursor中的Fable 5 max thinking试了一下无Agent环境单次生成(不测试/迭代,不然实在烧不起QAQ),prompt如下: dsa_sparse_attention_h16_ckv512_kpe64_topk2048_ps64.json 对这个算子,请给我写一个在本机a800卡能运行的,单py文件+triton/cuda extension形式的高性能kernel实现,要求比参考实现快一千倍,写出来就行,不用测也不用验证,直接给我py文件 测出来的结果非常惊人,请看下图(SPEEDUP指的是相对朴素torch实现的加速比): 其中最下面两行是fable生成的,可以看到加速比十分惊人。 更重要的是,前四行是mimo-v2.5和gpt-5.5在 十分完整的专家级harness中运行超过一个小时迭代优化 的结果,而fable打败他们只花了五分钟!其中Triton解法消耗22.9万token,CUDA解法消耗37.5万token。 最后的结果是,我们组里已经将fable称为神了() 3 个帖子 - 3 位参与者 阅读完整话题
盘点L站的徽章 长期更新!(2026.2.17更新) 文档共建 盘点 L 站的徽章长期更新!(2026.2.17 更新) [!warning] 注意! 做 Wiki 编辑的徽章就做,别把整个教程帖子内容覆盖成无意义的内容!!!!!!!!! … 徽章说明 1 个帖子 - 1 位参与者 阅读完整话题
RN DC3,公司的电信网络能正常访问,同一时间家里的移动网络不行?今天下午6点发现的,之前都是正常。 号段:192.129. . 4 个帖子 - 3 位参与者 阅读完整话题
GitHub - affaan-m/ECC: The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond. · GitHub 这个项目有大佬真实使用吗?效果怎么样?最终任务实现效果怎么样?费 token 不? 2 个帖子 - 2 位参与者 阅读完整话题
佬们,最近想买一台VPS 预算四百以内,主要是做代理用。最近看了两个厂家 一个RN的,二百多 2h2g 5t流量(已经有一台了,用了三年了。) 然后现在想再买一台,找个稳定的。所以看了一台搬瓦工的 49.9$的机器,1h1g1T的机器。 整体测试下来,搬瓦工要比RN的稳定,丢包少。我这边是北方联通。 买之前想问问佬们 还有其他的厂商稳定靠谱的推荐一下。 1 个帖子 - 1 位参与者 阅读完整话题
不知道是不是慢讯
不知道是不是慢讯
不知道是不是慢讯
兼容 OpenAI 接口协议: https://token-plan-sgp.xiaomimimo.com/v1 兼容 Anthropic 接口协议: https://token-plan-sgp.xiaomimimo.com/anthropic tp-szke84h4djx87dqtxbrnbo508cgmx5ku6crz6heguh1vrfsh 1 个帖子 - 1 位参与者 阅读完整话题
盘点L站的徽章 长期更新!(2026.2.17更新) 文档共建 盘点 L 站的徽章长期更新!(2026.2.17 更新) [!warning] 注意! 做 Wiki 编辑的徽章就做,别把整个教程帖子内容覆盖成无意义的内容!!!!!!!!! [!caution] 注意 由于服务器有延迟,可能… 我看百倍佬帖子下面全是社区分数不够的开个教程吧,上面这个是社区分数,只有做任务拿勋章还有升三级会给分数,你不做任务永远没分数 credit.linux.do LINUX DO Credit Linux Do 社区积分服务平台 这个ldc,每天登录送10,有人点赞加一但是不能求赞,解决别人问题加10 剧透 ,除此之外在ld士多也能交易 LD士多 LD士多-LinuxDo站点积分兑换中心 在 LD士多 使用 Linux.do 社区积分兑换精选虚拟物品与服务。 1 个帖子 - 1 位参与者 阅读完整话题
dHAtY2dybzBrNW9ucmw4cG9sd2R5ZjR4ZHIwaTB3bHprd2o1cHVjbXRuandwdWZrOWVo,.cn的 2 个帖子 - 2 位参与者 阅读完整话题
IT之家 6 月 8 日消息,苹果将于明日凌晨召开 WWDC26 全球开发者大会,这也将是蒂姆 · 库克 (Tim Cook) 作为苹果 CEO 最后一次发表主题演讲。 ▲ 图源微博:蒂姆 · 库克 | 微博头像 IT之家注意到,在 WWDC26 即将召开之际, 蒂姆 · 库克提前发布了早安视频 。画面显示,库克按照自己的“传统”,双手合十,说出了那句经典的“Good morning!” 另外,在今天更早些时候,库克还发布了和学生开发者一起迎接 WWDC26 开幕的视频。 今年 4 月,苹果公司宣布,蒂姆 · 库克将出任苹果董事会执行董事长,硬件工程高级副总裁约翰 · 特努斯将担任苹果下一任首席执行官, 该任命自 2026 年 9 月 1 日起生效 。 彭博社知名苹果记者马克 · 古尔曼表示,除非苹果 CEO 交接出现重大意外变故,否则本次的 WWDC 主题演讲将是库克的最后一场重要发布会, 未来也看不到任何一种情况会让他以执行董事长身份继续参加主题演讲 。
tp-c4fnn7hizgknz01epajdxsj6bhz20bsog7pdnoldrnifgkjs 新人报道。 1 个帖子 - 1 位参与者 阅读完整话题
CC已经"被开源"这么久了,harness的概念也火了好久了,像Trae和Qoder之流现在是否到达能用的水平了? 2 个帖子 - 2 位参与者 阅读完整话题
Fiat24今天邮箱收到了 Unfortunately, we can’t serve you as a client due to our internal policy. 但是我看佬友可以定位HK开通 Fiat24用护照还可以开,定位得选香港 - 搞七捻三 - LINUX DO 但是我KYC认证界面一直卡在这个地方 是需要注销后重新新建一个账号吗? 6 个帖子 - 6 位参与者 阅读完整话题
服务失联,一看 vps 掉线了,rn LA 机房真是多灾多难 2 个帖子 - 2 位参与者 阅读完整话题
我最早是一个沉迷 SillyTavern 用户,第一次接触酒馆的时候还是挺震撼的,角色卡、世界书、预设、插件,整个生态丰富得离谱。后来很多角色扮演产品做来做去,本质上也都在围绕酒馆生态转。但用久了之后也会发现一些问题:酒馆真的太重了!!! 各种配置项、各种参数、各种插件,对于重度玩家来说可能很爽,但对于普通用户来说门槛其实不低。很多时候只是想找个角色聊聊天,结果要先研究一堆概念,最后花在折腾环境上的时间可能比聊天还长。 所以去年我自己做了一个项目,当时想法挺简单的:保留酒馆生态最有价值的部分,把体验尽量做简单一点。后来项目也获得了论坛内大量佬友的支持,拿到了 800 star,但新的问题很快又出现了。因为兼容酒馆,所以必须持续兼容酒馆。角色卡要兼容,世界书要兼容,各种数据格式要兼容,很多时候设计一个功能,第一个考虑的问题甚至不是用户体验,而是会不会破坏兼容性。明明是在开发自己的项目,但越来越像是在维护一个酒馆兼容层。 与此同时我也开始思考另外一个问题。 酒馆解决得很好的是角色扮演,但它真的是 AI 陪伴产品最终的形态吗?大部分时候我们面对的仍然是一个聊天窗口。输入一句,回复一句。哪怕加上语音,本质上还是聊天软件的逻辑。 但现在模型能力已经和一两年前完全不一样了。 语音模型越来越成熟,实时对话越来越自然,Agent 也开始具备一定执行能力。如果从今天重新设计一个陪伴产品,我越来越觉得核心可能不应该是聊天框,而应该是角色本身。 她有声音,她可以实时交流,甚至可以在聊天过程中顺手帮你完成一些事情,同时如果希望回归酒馆的聊天模式,也可以做到无缝支持。 基于这个想法,我上周把内部的一个实验项目整理出来开源了: https://linux.do/t/topic/2314323?u=happyfox001 原本只是想验证一下方向,结果一天时间拿到了 60 个 Star,也收到不少私信反馈。目前它其实还非常早期,严格来说只能算一个骨架,实现的主要还是完整语音交流能力。但从反馈来看,大家关注的已经不只是模型效果,而是另一种交互方式本身。我愈发的想继续将更多内容开源出来,去围绕一些当前在二创中火爆的角色+声音,构建文字聊天+语音实时交互的桌面陪伴产品。想听听佬友们的意见。 1 个帖子 - 1 位参与者 阅读完整话题
以前 找到 “Microsoft Edge rounded corners” 这个选项。 将右侧的选项从 Default 或 Enabled 改为 Disabled 。 现在不知道怎么搞了,是win10系统! 2 个帖子 - 2 位参与者 阅读完整话题
最近在看科研配图这件事,发现一个挺有意思的工具方向:用 AI 帮忙生成科研报告图、机制图、graphical abstract 的初稿。 我自己也顺手做了一个小工具,叫 SciFigureAI: https://scifigureai.com 它不是那种“一键生成最终论文图”的定位,更像是帮你先把科研内容可视化成一个可以讨论和修改的草稿。 现在大概支持这些场景: 输入论文摘要、实验机制、研究思路,生成一张科研图草稿 上传手绘草图或白板图,整理成更干净的机制图 对已有图片继续用文字要求修改,比如调整箭头、标签、布局 下载预览图,后续也可以导出 PPTX / SVG 用在组会或报告里 我觉得它比较适合这些场景: 组会 PPT 里需要快速画一个机制示意图 写 proposal / poster 时,先做一张 graphical abstract 草稿 有一个手绘思路,但不想一上来就打开 Illustrator / BioRender 慢慢画 想先和导师/合作者讨论图的结构,再决定要不要精修 当然,科研准确性还是必须自己检查,AI 生成的图目前更适合当初稿,不适合直接当最终论文图。 想问问这里有没有做科研、医学、生物、材料、AI paper 或经常做技术报告的朋友: 这种“先生成科研图草稿”的需求真实存在吗? 你们更常见的痛点是不会画、画得慢,还是反复改图太烦? 如果能从草图生成更正式的报告图,你会用吗? PPTX / SVG 导出对科研报告场景重要吗? 欢迎拍砖,也欢迎直接试一下给我点反馈。