WWW.YOUINFO.SITE
标签聚合 解释

/tag/解释

LinuxDo 最新话题 · 2026-06-11 17:55:32+08:00 · tech

agent 是智能体的意思,什么是智能体呢,为啥不叫AI了啊,也不叫大模型了,其实这并不是孤立的概念,AI中文就是人工智能,英文全称:Artificial Intelligence,其实就是计算机科学的一个分支,用来研究开发模拟,延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品,大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节,比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议,用来,调用外部的服务器,返回固定内容信息的一个规则,大家都用这个规则,不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思,这里和mcp紧密相连,tools泛指一类工具,遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思,就是个扩展包,这不是ai独有的概念,浏览器有插件,任何应用都可能有插件,一个插件里面东西就多了,可以包含skill,agents,hooks,mcp severs等内容。 prompt是提示词的意思,大模型学的东西多了,大模型要在知识汪洋中预测你想要的下一个词,简直不要太难,那么就帮她缩小范围降低幻觉,那就是定人物,定任务范围,定目标,这样将结合以上的信息,进行数据处理,就大大降低了,大模型胡说八道的可能性。大模型本身就是个统计学问题,根本不具备任何智慧,和反思能力,并非动态进化的,而是提前通过人类社会无数的现有文档,向量化,然后通过多维向量的训练出来的,一个具备无数维度的数学矩阵,通过通过上下文的切割成token又称词元,一个词元就是一个数字,多个词元就组成了一个数学矩阵,将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢,会影响回应呢? workflow就是工作流,针对一项工作设计的工作流程,使其完成特定的任务,取代繁重的工作。 hook钩子的意思,什么是钩子啊就是,当执行到特定情况或者涉及特殊判断的时候就会触发的程序,相当于一个钩子,勾住了你的工作流,在特定情况下触发,进而保证进程的稳定和顺利。 skill技能的意思,技能可以是一个md说明的工作文档,也可以是md说明文档加一些小程序、或者一些模板的综合体,目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台,工作台上啥也有,自由搭配,想用啥就用啥,比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt:给模型的指令 ├── Context:当前任务上下文 ├── Memory:可长期保存或检索的历史信息 ├── Tools:模型可调用的外部能力 │ └── MCP:连接 tools / resources / prompts 的标准协议之一 ├── Workflow:预设流程 ├── Hook:生命周期触发器 ├── Skill:可复用能力包 ├── Plugin:可安装扩展包 └── Harness:运行框架 / 执行外壳 agent 是配置了 instructions、tools,以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool:一个具体能力 MCP Tool:通过 MCP 协议暴露出来的 tool MCP Server:把一组 tools / resources / prompts 提供给 AI 应用 Agent:根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说,plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围,降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令,让模型更稳定地产生符合要求的内容。 大模型本质上是通过大量数据训练出来的神经网络,它没有人类意义上的主观意识,也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数,以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”,更多是模型在特定提示、上下文或工具流程下表现出来的能力,而不是人类式的自我意识。 Token:文本被切分后的处理单位。 Token ID:token 被映射成的数字编号。 Embedding:token ID 进入模型后对应的向量表示。 Parameter:模型训练出来的权重和偏置。 Context window:一次输入/输出能处理的 token 上限。 Training tokens:训练时看过的数据 token 数量。 Vocabulary size:分词器支持的 token 种类数量。 文本会先被 tokenizer 切成 token,再映射成 token ID。模型会把 token ID 转成向量表示,也就是 embedding,然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络,结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量,和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单,再判断退款规则,再调用退款接口,再发送通知。workflow 里可以用大模型,也可以不用大模型。它和 agent 的区别是:workflow 的路径主要由人或程序提前写好;agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚:workflows 是 LLM 和工具通过预定义代码路径编排;agents 则是 LLM 动态决定自己的流程和工具使用。 这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包,包含 instructions、metadata 和可选资源,比如 scripts、templates,Claude 会在相关任务中自动使用。 另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context:这次对话/这次任务临时放进来的信息。 Memory:跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息,比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息,比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化,而是系统把相关历史信息保存下来,在需要时重新塞回 context。 5 个帖子 - 4 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-10 21:35:28+08:00 · tech

苹果软件工程高级副总裁克雷格·费德里吉(Craig Federighi)近日在接受媒体采访时,回应了外界对于公司在 iOS 27 中推出独立 Siri 应用的质疑,解释了苹果从此前反对“单独聊天机器人”到如今推出 Siri 聊天应用这一转向背后的原因。 在本周早些时候举行的 WWDC 2026 上,苹果正式发布了全新的 Siri 应用,为用户提供一个集中管理和回顾与 Siri AI 对话的入口,这一应用将随 iOS 27 一同推出。 费德里吉在苹果园区(Apple Park)面向媒体的会后交流中,直接回应了关于苹果策略“转弯”的提问。 在去年的 WWDC 2025 之后,费德里吉与全球市场营销高级副总裁格雷格·乔斯维亚克(Greg Joswiak)曾在媒体采访中强调,苹果的策略是将 Siri 深度编织进用户现有工作流,而不是在一旁额外挂一个“聊天机器人”。 当时高管的公开表态,被视为苹果有意与 ChatGPT 等纯聊天型产品划清界限。 费德里吉此次表示,之所以最终决定推出独立 Siri 应用,主要是出于一个非常实际的用户需求——用户需要能够回到过去的对话,并在此基础上继续交流或进行引用。 在苹果看来,在其平台上,为此类需求提供入口的最自然形式,就是一款可以出现在主屏幕上的应用图标。 他强调,Siri 应用是对系统体验的延伸,而非一个割裂的独立产品。 费德里吉重申,苹果并不把 Siri 看作一个“单独的聊天机器人”,不是一个与系统脱节、用户“专门跑去闲聊”的地方,而是一个在使用情境中被调用的、与系统体验深度融合的对话式工具。 在他的描述中,新版 Siri 能够理解当前屏幕内容,直接在用户正在编辑的文档中提供校对帮助、给出修改建议或提示,而不是在另一个“平行世界”里输出答案。 对于 Siri 应用的定位,他解释称,所有这些体验本质上都是对话式的,是对系统体验的自然延伸,而非另起一套独立产品线。 但当用户希望回到一段此前的对话、继续追问或者查阅其中的信息时,一个可在主屏幕上管理和打开的应用,仍然是最符合用户习惯的方式,因此苹果最终选择以“应用”的形态来承载这一入口。 费德里吉表示,新版 Siri 应用“重新具象化”了那些原本存在于系统层面的能力,将其以更易于管理和访问的形式呈现出来。 从苹果的角度看,这并不是对先前战略的否定,而是在保留“系统深度集成”这一核心前提下,对用户交互方式做出的务实调整。 目前,iOS 27 开发者测试版已经开放,开发者可以进行安装体验。 不过,要想使用新的 Siri 功能,还需要在系统设置中加入等待名单,而面向公众的测试版预计将在 7 月推出。 查看评论

LinuxDo 最新话题 · 2026-06-09 09:53:31+08:00 · tech

写一篇长文吧,用自己的所见所得,解释一下为什么AI到来后,我们的工作不减反增。 此处使用程序员举例,这个群体在站更具有代表性,更能引起共鸣。 我不知道该如何解读这个魔幻的时代。 AI时代前,提出核心创意、策略和方向的人相对较少。规划策划是一个金字塔尖的活动,只有少数人负责规划,他们的点子很好,但由于群体很少,所以显得不那么抽象。 区别于规划层,将想法落地的过程需要耗费大量的人力,更多的人都挤在执行层。 写代码、画草图、数据处理、重复性的文字复制粘贴,你能根据自己的需求写出来处理脚本就是硬核人才了。 为了一个产品需求,各方需要探讨验证,唇枪舌剑无数时间,双方互相妥协退让才能有一个不错的合作方案。 这个时期执行是瓶颈,一个想法往往需要一个庞大的团队去实现。相对来说,团队对于各种抽象想法也能尽力落地,人多必定有方法,况且你再抽象也不会天马行空拿出N个方案(N大于10),不管可靠不可靠先做了再说。 而AI时代后,这一切发生了变化,传统的分工玩不转了。 AI大幅度降低了技术门槛和思考的辅助成本,产生想法或者试图用新创意解决问题的人迎来了爆发式增长,AI工具从遥不可及变得触手可得。每个人都可以通过简单的提示词去探索、组合出无数的新点子。 我想创新解决某个问题,我想实现某个前人没有实现的解决方案。 原本需要大量人工去搬砖、写业务代码、做初级设计的执行工作,现在很大一部分被AI自动化替代。留下的执行人群变少,大家都进到了规划阶层。 那些留下来的执行层,他们也开始使用AI进行功能产出落地,做高级审查、精细化调整和最终的把关。 规划层想法能落到实处,开发的工作借助AI也会轻松。 这是好事吗?我看未必! 由于AI时代涌入了成千上万的非科班人才(特指那些半瓶水晃荡,无脑封AI为神),他们没有任何架构思维的想法只会无脑交给AI,伴随着执行层面的人变少,这些没有任何考量的想法更难落地。 在以前,一个不切实际的想法在进入开发之前,光是评估成本就会被技术负责人和执行层代表直接干掉。 举例,下面的这个场景,你会怎么做? 10人小公司,用户量不到100,实现亿级并发不出错。 100人不到的用户量,实现超高并发。 你看执行层会不会直接让你允许起飞。这种完全无厘头的要求谁能给你落地,况且落地了对他们有什么好处。 邀功的是你,解决高并发难题的是我啊! 话虽如此,但现实就是这么抽象 一群非技术的甲方可以用AI快速生成一个看起来很完美的需求说明,拿这些所谓的 完美架构 用来做招标需求和投标标准。 更可笑的是,很多领导这些看似 “懂” 技术的,面对甲方的要求,管你能不能落地我们先投标再说,车到山前必有路。 假设中标了你说做不了?那得压力你啊, 你要为公司利益着想,这可是XXXX万的项目啊。 好的,如果真做不了,那么甲方爸爸------ 解决不了是吧,那么你出局,我找别的。 我们的要求你都落地不了,你投标干啥? what can i say ??? 这些非科班的人用AI做规划,往往是 “既要、又要、还要、我全都要!!!” 。 AI会顺着用户的指示给出各种天马行空的方案,这种低成本高产出,让他们误以为自己已经完成了完美的需求。 你看我提出来的需求多么宏大,多么好,做好了公司一夜上市!肯定能让我飞黄腾达, 执行层看到的呢? 抽象,完全没有考虑任何的落地可能性。直接甩AI对话发过来让你落地。 现在AI负责了宏观的吹水,把所有真正恶心、复杂的工程细节全都留给了所剩无几的执行层。 甲方用AI产出毫无逻辑、前后矛盾、看似高大上实则无法落地投标要求,领导们不管三七二十一AI评判能不能搞然后压力执行层。 执行层两头受气。 豆包豆包,帮我复刻一个淘宝拼多多。利用大模型和大数据,自动识别平台上的异常交易数据并自动修复,同时还要兼顾用户体验和隐私。保证有远超所有电商平台的用户量。 我就问你,你当执行层,你会不会高血压。 自然语言大模型的本质是推理,他需要靠逻辑推理判断你想要的东西是什么,权重决策树走到最高的一层分支才会停止。 而计算机和现实世界运行在精确上,他不搞自然语言,1就是1,0就是0,逻辑电路不存在中间态,对就是对的,断就是断的。 但是可悲的还在后面,执行层遇到的哭还没完。 执行层无法用现实逻辑去跟一个AI入脑的规划层去沟通。自以为AI无所不能的老登们用AI无限制膨胀自己的想法,导致垃圾需求、抽象需求成指数级增长。 做出来了我们就是遥遥领先!遥遥领先! 而真正懂得如何把这些想法落地的执行层,无人在意,动不动就要担心明天会不会领取裁员大礼包。 你不会用AI吗,AI都给出解决方案了你不会改改吗? 有啥好讨论的,现在AI这么强,你不会用是不是你能力不行? 读完只想笑好不好,完全无法辩论,完全无法解决。 今天做个支付宝,明天要搞一个快手。认为AI无所不能开启大裁员时代。 会做PPT的远比执行的要好的多,更可笑的事他们连PPT规划都是AI做的。 因为他们不用思考如何落地,只负责甩锅,你落地不了想领取大礼包了? 公司经济不好无法提供AI,你不会自己找免费AI吗,国产AI一堆免费的,悄悄我跟豆包聊的多好,看看我给你发的豆包聊天记录,豆包这么好用,你为啥要买国外的? 还是让豆包收了他吧。 3 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-09 00:45:11+08:00 · tech

其实我真的很忙,我也不知道我在忙什么,反正“降低签到额度” 这件事情的优先级很低,我就一直没弄,那个额度其实意义不大,我也不建议大家囤着不用,毕竟用出去的tokens,才是实在的,偶尔号池波动造成的卡顿其实是难免的(例如空回)。 因为并发和调用量已经达到了一个惊人的地步 基本上日均都是1300亿左右的tokens,rpm稳定在两千左右,说实话,这个数据已经远超出一个公益站的范畴。 就这样,我把额度改回52刀了,期待下一次狂欢吧,或许是端午节呢? 祝大家早安,午安,晚安~ 对了,大家遇到问题回帖询问即可,不需要单独开贴占用社区资源; 以及,不要搞个人崇拜,不要在其他帖子下面刷无关内容,这是不好的。 感谢很多佬友的无偿帮助,没有他们,就没有 君の的公益 45 个帖子 - 43 位参与者 阅读完整话题

v2ex · 2026-06-07 17:20:22+08:00 · tech

GPT image 2 的图片质量是目前最好的,就用这个做了个解释视频生成器 Knowcast 。 在 https://www.knowcast.app 要做知识科普,故事解说都可以用这个。 做的过程中发现越做越难。 发现 GPT image 2 还是有不少问题,比如它有极繁主义倾向,而且连贯故事的 prompt 不是很好写,画面 prompt 调整了好久。下了很多功夫。找到合适的 API 也麻烦(吐槽一下好多 gpt image 中转站质量很差) 如果大家想生成一些讲解解说类视频,很推荐试一下。 可以生成教学视频,绘本,新闻讲解等等。

v2ex · 2026-06-07 16:20:22+08:00 · tech

GPT image 2 的图片质量是目前最好的,就用这个做了个解释视频生成器 Knowcast 。 在 https://www.knowcast.app 要做知识科普,故事解说都可以用这个。 做的过程中发现越做越难。 发现 GPT image 2 还是有不少问题,比如它有极繁主义倾向,而且连贯故事的 prompt 不是很好写,画面 prompt 调整了好久。下了很多功夫。找到合适的 API 也麻烦(吐槽一下好多 gpt image 中转站质量很差) 如果大家想生成一些讲解解说类视频,很推荐试一下。 可以生成教学视频,绘本,新闻讲解等等。