求助!!! 最近想往agent开发,ai开发岗位转,但是没什么好项目可以做到作品集里面 各位佬有有什么企业刚需的agent需要实现的嘛 就是很简单但是一定需要人去干的那种就可以做成agent吧 3 个帖子 - 3 位参与者 阅读完整话题
PDF格式,简历内容控制在两页了,基本都是AI出来的。 RAG和Agent都是从GitHub上找的开源的,让大模型分析技术栈写的。 提到的技术栈能说出来个7788。就是不知道还不会不会问Java八股文 2 个帖子 - 2 位参与者 阅读完整话题
最近在尝试用 AI 生成 Excel 和 Word 折腾了一圈发现效果不太行,我日常主要是用 opencode 和 codex ,现在想通过加 skills 的形式解放 office 能力 但是折腾了一阵发现效果很差,很多时候甚至不如网页免费的 AI 来的好,想问问 v 友有没有什么推荐的方案
最近在使用Hermes Agent 我发现hermes一旦改文件需要审批就会卡住(已经同意的情况下),知道超时时间到了才会回复我,这咋整? 有没有人遇到过? 5 个帖子 - 4 位参与者 阅读完整话题
前因是这样: 5月30日,Agents 抽风了一直提交,触发了将近 50 次部署,直接把 Vercel 的 Hobby 额度全刷没了。 但是 Vercel 一直只提醒,不处理,直到今天… 然后,晚上就开始排查原因,和 Claude 聊了一轮定位到具体原因后,问补救办法。 结果是异常顺利,处理的是 AI,我就直接把 Claude 写的内容发过去,就直接解封了!! 1 个帖子 - 1 位参与者 阅读完整话题
各种 agent 都用过了, agents.md 明确要求了文档生成规则、文件名生成规则、流程规则,但是就是不遵守。包括有时候开发测试规则都不遵守,有啥好的办法么
各种 agent 都用过了, agents.md 明确要求了文档生成规则、文件名生成规则、流程规则,但是就是不遵守。包括有时候开发测试规则都不遵守,有啥好的办法么
各位佬们,ai agent这个方向的如何,有什么学习建议吗,有什么教程是能学到真东西的。目前正在看hello-agents,一个github上的开源项目。或者有什么其他方向推荐吗,本人今年毕业,有一点迷茫,还望佬们给点建议。 1 个帖子 - 1 位参与者 阅读完整话题
各种 agent 都用过了, agents.md 明确要求了文档生成规则、文件名生成规则、流程规则,但是就是不遵守。包括有时候开发测试规则都不遵守,有啥好的办法么
如题,老板想做一个workbuddy, 有没有类似的开源产品,我该从哪一步开始。 主要思想就是 Agent to UI , 然后多 Agent 协作,把能力蒸馏成 Skill 或者 Agent。 10 个帖子 - 8 位参与者 阅读完整话题
agent 是智能体的意思,什么是智能体呢,为啥不叫AI了啊,也不叫大模型了,其实这并不是孤立的概念,AI中文就是人工智能,英文全称:Artificial Intelligence,其实就是计算机科学的一个分支,用来研究开发模拟,延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品,大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节,比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议,用来,调用外部的服务器,返回固定内容信息的一个规则,大家都用这个规则,不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思,这里和mcp紧密相连,tools泛指一类工具,遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思,就是个扩展包,这不是ai独有的概念,浏览器有插件,任何应用都可能有插件,一个插件里面东西就多了,可以包含skill,agents,hooks,mcp severs等内容。 prompt是提示词的意思,大模型学的东西多了,大模型要在知识汪洋中预测你想要的下一个词,简直不要太难,那么就帮她缩小范围降低幻觉,那就是定人物,定任务范围,定目标,这样将结合以上的信息,进行数据处理,就大大降低了,大模型胡说八道的可能性。大模型本身就是个统计学问题,根本不具备任何智慧,和反思能力,并非动态进化的,而是提前通过人类社会无数的现有文档,向量化,然后通过多维向量的训练出来的,一个具备无数维度的数学矩阵,通过通过上下文的切割成token又称词元,一个词元就是一个数字,多个词元就组成了一个数学矩阵,将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢,会影响回应呢? workflow就是工作流,针对一项工作设计的工作流程,使其完成特定的任务,取代繁重的工作。 hook钩子的意思,什么是钩子啊就是,当执行到特定情况或者涉及特殊判断的时候就会触发的程序,相当于一个钩子,勾住了你的工作流,在特定情况下触发,进而保证进程的稳定和顺利。 skill技能的意思,技能可以是一个md说明的工作文档,也可以是md说明文档加一些小程序、或者一些模板的综合体,目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台,工作台上啥也有,自由搭配,想用啥就用啥,比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt:给模型的指令 ├── Context:当前任务上下文 ├── Memory:可长期保存或检索的历史信息 ├── Tools:模型可调用的外部能力 │ └── MCP:连接 tools / resources / prompts 的标准协议之一 ├── Workflow:预设流程 ├── Hook:生命周期触发器 ├── Skill:可复用能力包 ├── Plugin:可安装扩展包 └── Harness:运行框架 / 执行外壳 agent 是配置了 instructions、tools,以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool:一个具体能力 MCP Tool:通过 MCP 协议暴露出来的 tool MCP Server:把一组 tools / resources / prompts 提供给 AI 应用 Agent:根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说,plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围,降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令,让模型更稳定地产生符合要求的内容。 大模型本质上是通过大量数据训练出来的神经网络,它没有人类意义上的主观意识,也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数,以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”,更多是模型在特定提示、上下文或工具流程下表现出来的能力,而不是人类式的自我意识。 Token:文本被切分后的处理单位。 Token ID:token 被映射成的数字编号。 Embedding:token ID 进入模型后对应的向量表示。 Parameter:模型训练出来的权重和偏置。 Context window:一次输入/输出能处理的 token 上限。 Training tokens:训练时看过的数据 token 数量。 Vocabulary size:分词器支持的 token 种类数量。 文本会先被 tokenizer 切成 token,再映射成 token ID。模型会把 token ID 转成向量表示,也就是 embedding,然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络,结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量,和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单,再判断退款规则,再调用退款接口,再发送通知。workflow 里可以用大模型,也可以不用大模型。它和 agent 的区别是:workflow 的路径主要由人或程序提前写好;agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚:workflows 是 LLM 和工具通过预定义代码路径编排;agents 则是 LLM 动态决定自己的流程和工具使用。 这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包,包含 instructions、metadata 和可选资源,比如 scripts、templates,Claude 会在相关任务中自动使用。 另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context:这次对话/这次任务临时放进来的信息。 Memory:跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息,比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息,比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化,而是系统把相关历史信息保存下来,在需要时重新塞回 context。 5 个帖子 - 4 位参与者 阅读完整话题
我是想做一个类似于千问高考agent的纯聊天小程序,需要一些简单的数据支撑,现在网上能搜索到正式一点的高考历年录取分数线的数据好像只有cnopendata上有,但是本人不是学术工作者所以申请不了,就想问问论坛的大佬们看看有没有可以帮忙下载的,当然也可以走ldc。 原数据在: 中国高考录取分数线数据 当然这块如果有违规或者风险也可以告知,只是暂时有这么一个想法 1 个帖子 - 1 位参与者 阅读完整话题
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时,理论上可以比现在的版本快 4 倍。 本地运行步骤: https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat
最近看到新出的A\新出的fable模型好心动,准备试一试跑一跑开发当天才程序员,但是一直有听说A\风控十分严格,人在大陆,有的机场都不干净,该怎么做? 我的想法是买个claude账户反代出api来用比较好?但是反代该怎么做?会需要搭梯子吗?或者买梯子?(感觉买的话不可靠吧?)我有一个物理的服务器,能用吗? 1 个帖子 - 1 位参与者 阅读完整话题
Xiaomi MiMo正式发布并开源MiMo Code,一款运行在终端的探索性AI助手。模型与Agent协同优化,迈向自进化时代。 1.跨会话持久记忆+近乎无限上下文 2.独创Compose编排模式,先设计再编码 3.Dream记忆固化与自进化机制 4.支持语音输入与控制 同时,MiMo Code 内置限时免费的顶级多模态模型–MiMo V2.5,并支持接入DeepSeek等主流模型以及第三方Token Plan,满足不同开发者的需求。 无限上下文?这个真实吗? 3 个帖子 - 3 位参与者 阅读完整话题
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时,理论上可以比现在的版本快 4 倍。 本地运行步骤: https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时,理论上可以比现在的版本快 4 倍。 本地运行步骤: https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时,理论上可以比现在的版本快 4 倍。 本地运行步骤: https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/ 在生成文本时,理论上可以比现在的版本快 4 倍。 本地运行步骤: https://unsloth.ai/docs/models/diffusiongemma 目前 V2EX Chat 用的模型就是 gemma4:26b 。 https://edge.v2ex.com/chat