agentic - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

上海- 2026 亚马逊云科技峰会预约参会

V2EX - 技术 · 2026-06-10 13:18:41+08:00 · tech

今年亚马逊云科技中国峰会 2026 要来了，主题会围绕 Agentic AI 、生成式 AI 、云原生、企业上云和行业实践展开。如果你最近在关注： 1.AI 应用落地 2.云原生架构 3.Serverless / 大模型应用 4.企业数字化可以考虑去现场看看，免费预约参会

支持调用 Deepseek、Kimi 等模型，Agentic 华为云入口“智果园”发布

IT之家 · 2026-06-07 22:37:32+08:00 · tech

IT之家 6 月 7 日消息，华为云现已针对 Agentic AI 时代发布全新云入口“智果园”，新产品支持云码道 CodeArts 代码智能体、华为云 OfficeAce 办公智能体和 WorkAgent 文档智能体。据介绍，智果园拥有开发、办公等多种关键行业的智能体，可通过智果 AgentArts 平台打造更加实用的智能体，并通过 Skills、AI Shell 自定义，快速使用华为云能力。 IT之家注意到，智果园支持一键调用 DeepSeek-V4-Pro、智谱 GLM-5.1、月之暗面 Kimi-K2.6 和千问 Qwen-Image 等主流大模型。拥有全新 Token Plan 订阅计划，覆盖主流模型和 AI 工具，可提供稳定的开发体验。此外，智果园还带有智慧医疗、具身智能、科学计算等 AI 梦工厂，适配更多行业应用场景。

AMD看好统一内存架构将重塑产品路线图押注新一代AI与高性能平台

cnBeta全文版 · 2026-06-07 16:05:18+08:00 · tech

在新一轮以 “Agentic AI” 为代表的人工智能浪潮中，统一内存架构（UMA，Unified Memory Architecture）正在 PC 与计算领域快速升温，AMD 认为这不仅是重要机会，也是未来产品架构与路线图的关键方向。所谓统一内存架构，是指将 CPU、GPU 与内存紧密耦合在同一系统芯片（SoC）上，形成一个共享的大内存池，由系统按负载动态在 CPU 与 GPU 之间分配，而不是传统的“系统内存 + 独立显存”分离模式。在 AI 工作负载尤其是大模型推理中，这样的设计可以大幅减少数据拷贝与带宽瓶颈，因此正逐步成为 AI 终端与新形态 PC 的主流方案之一。随着 AMD Ryzen AI MAX 系列的推出，以及英伟达 RTX Spark 等产品加入，统一内存架构已经成为 AI 终端平台的共同技术基石。AMD 表示，他们的首代 Ryzen AI MAX 方案可提供最高 128GB 内存，其中最多可为 GPU 划分 112GB 系统内存；英伟达 RTX Spark 也采用类似思路，根据工作负载动态在 CPU 与 GPU 之间分配内存，使得统一内存架构能够覆盖从通用计算到 AI 推理的广泛应用场景。在接受媒体采访时，AMD 副总裁 David McAfee 被问到未来是否会有更多产品采用 UMA 方案，他回应称，围绕统一内存系统的关注会持续提升，业界将围绕这类系统探索“合适的架构形态”，并在现有平台的基础上不断迭代增强。他强调，这是一类全新的工作负载与计算空间，将为 AMD 在产品选型、路线规划以及部署形态上打开“一整个世界的可能性”。 AMD 已经把统一内存思路延伸到下一代产品——Ryzen AI MAX 400 系列。根据官方介绍，这一代产品最高可支持 192GB 统一内存，最多可为 GPU 划分 160GB，用于本地运行参数规模超过 3000 亿级别的大型语言模型（LLM），以满足复杂 AI 工作流以及高端创意工作负载对内存容量与带宽的极端需求。在媒体圆桌中，有记者进一步追问，未来是否可能看到面向游戏的 UMA Ryzen 处理器，或者类似 “Strix Halo + 3D V-Cache / 封装级高带宽内存” 的设计，以通过更紧密整合和更低延迟的封装内存进一步强化 UMA 能力。McAfee 表示自己目前“没有具体答案”，但重申 Strix Halo 之类平台与英伟达进入同一赛道，意味着围绕 UMA 的系统设计将在未来几年获得更多资源投入与架构探索。值得注意的是，McAfee 在谈到 UMA 时，不仅提到了移动与 AI 终端，也提及了高性能桌面系统。他认为，统一内存架构的支持能力不断提升，以及更多生态参与者采纳这一架构，将推动高性能桌面和统一系统形态的整体演进，重塑业界对“高性能 PC + 统一内存”的认知。在他看来，Halo 这类平台所采用的统一架构仍然是这类系统的“正确形态”，而英伟达近期的相关发布则可以视作对这一架构路径的“背书”。 McAfee 还强调，随着 Agentic Compute 的兴起，通过统一内存池在终端上运行“超大模型”成为这些系统独特的价值主张之一。对于 AMD 来说，这类统一系统在整体产品组合中扮演双重角色：一方面支撑前沿 AI 与大模型工作负载，另一方面也可能成为高性能桌面与高级创意工作站的基础平台形态。从行业视角看，统一内存架构已经不再是小众实验，而是在新一代计算平台中快速演变为基础支柱。随着 Agentic AI 对大容量共享内存池的需求不断提升，AMD 与英伟达等厂商共同押注 UMA，也意味着这一架构路线获得了强烈的产业级背书。AMD 对 Ryzen AI MAX 400 等新平台的积极规划，以及对 Strix Halo 等高性能平台未来形态的开放态度，显示目前仍只是统一内存架构发展的起点。在 CPU、GPU 与内存边界逐渐模糊的统一系统中，新一代平台有望在性能、能效与能力边界上实现同步跃升，这不仅适用于 AI 与大模型工作负载，也有可能扩展到游戏与高端桌面领域。对于 AMD 而言，统一内存架构正成为其下一代产品架构设计与中长期路线规划中的核心基础之一，而整个生态系统也才刚刚进入这条路径的起跑阶段。查看评论

CVPR 2026上Google推出了3DCodeBench

LinuxDo 最新话题 · 2026-06-07 11:40:39+08:00 · tech

3dcodebench.com 3DCodeBench Benchmarking Agentic Procedural 3D Modeling Via Code, with a public 3DCodeArena for human-preference Elo rankings. 1 个帖子 - 1 位参与者阅读完整话题

国产模型有哪些价格实惠的coding plan或token plan

LinuxDo 最新话题 · 2026-06-04 14:09:17+08:00 · tech

主要是给公司用，60人，日常agentic workflow。性价比高，不需要很高的智能 2 个帖子 - 2 位参与者阅读完整话题

[分享创造] [原创+挖坑] Bonsai --- 使用本地 Agentic AI 来取代 ChatGPT

v2ex · 2026-06-04 09:13:37+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格，使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用，用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。鉴于此，我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因，一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量，不过从网上的信息以及我的个人分析推断，这个模型是一个 MoE (Mix of Expert) 模型，它的有效参数 (Active Parameter) 应该在数十 B 左右，总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量，总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样，那么使用一款带有 Thinking 能力的 Dense 模型，虽然只有数十 B 的参数量，但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足，这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。做为这个想法的第一个专门项目，我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流，通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。（使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型）下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框，右边是 Agent 在操作浏览器这个 Harness 采用了很多专门针对浏览器交互的工具，包括可以 InjectJS 等 JS 注入工具，来方便 Agnet 来查找网页元素和点击按钮等等这个当前的版本是在 Windows 上编译的，需要 Nvidia CUDA 的支持我会随后更新还在测试中的 M 系列的 Mac 版本当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

[分享创造] [原创+挖坑] Bonsai --- 使用本地 Agentic AI 来取代 ChatGPT

v2ex · 2026-06-04 09:13:37+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格，使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用，用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。鉴于此，我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因，一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量，不过从网上的信息以及我的个人分析推断，这个模型是一个 MoE (Mix of Expert) 模型，它的有效参数 (Active Parameter) 应该在数十 B 左右，总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量，总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样，那么使用一款带有 Thinking 能力的 Dense 模型，虽然只有数十 B 的参数量，但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足，这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。做为这个想法的第一个专门项目，我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流，通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。（使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型）下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框，右边是 Agent 在操作浏览器这个 Harness 采用了很多专门针对浏览器交互的工具，包括可以 InjectJS 等 JS 注入工具，来方便 Agnet 来查找网页元素和点击按钮等等这个当前的版本是在 Windows 上编译的，需要 Nvidia CUDA 的支持我会随后更新还在测试中的 M 系列的 Mac 版本当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

v2ex · 2026-06-04 08:50:09+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格，使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用，用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。鉴于此，我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因，一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量，不过从网上的信息以及我的个人分析推断，这个模型是一个 MoE (Mix of Expert) 模型，它的有效参数 (Active Parameter) 应该在数十 B 左右，总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量，总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样，那么使用一款带有 Thinking 能力的 Dense 模型，虽然只有数十 B 的参数量，但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足，这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。做为这个想法的第一个专门项目，我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流，通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。（使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型）下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框，右边是 Agent 在操作浏览器这个 Harness 采用了很多专门针对浏览器交互的工具，包括可以 InjectJS 等 JS 注入工具，来方便 Agnet 来查找网页元素和点击按钮等等这个当前的版本是在 Windows 上编译的，需要 Nvidia CUDA 的支持我会随后更新还在测试中的 M 系列的 Mac 版本当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

v2ex · 2026-06-04 08:50:09+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格，使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用，用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。鉴于此，我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因，一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量，不过从网上的信息以及我的个人分析推断，这个模型是一个 MoE (Mix of Expert) 模型，它的有效参数 (Active Parameter) 应该在数十 B 左右，总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量，总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样，那么使用一款带有 Thinking 能力的 Dense 模型，虽然只有数十 B 的参数量，但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足，这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。做为这个想法的第一个专门项目，我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流，通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。（使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型）下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框，右边是 Agent 在操作浏览器这个 Harness 采用了很多专门针对浏览器交互的工具，包括可以 InjectJS 等 JS 注入工具，来方便 Agnet 来查找网页元素和点击按钮等等这个当前的版本是在 Windows 上编译的，需要 Nvidia CUDA 的支持我会随后更新还在测试中的 M 系列的 Mac 版本当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

[分享创造] [原创+挖坑] Bonsai --- 使用本地 Agentic AI 来取代 ChatGPT

v2ex · 2026-06-04 08:35:51+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格，使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用，用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。鉴于此，我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因，一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量，不过从网上的信息以及我的个人分析推断，这个模型是一个 MoE (Mix of Expert) 模型，它的有效参数 (Active Parameter) 应该在数十 B 左右，总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量，总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样，那么使用一款带有 Thinking 能力的 Dense 模型，虽然只有数十 B 的参数量，但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足，这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。做为这个想法的第一个专门项目，我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流，通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。（使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型）下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框，右边是 Agent 在操作浏览器这个 Harness 采用了很多专门针对浏览器交互的工具，包括可以 InjectJS 等 JS 注入工具，来方便 Agnet 来查找网页元素和点击按钮等等这个当前的版本是在 Windows 上编译的，需要 Nvidia CUDA 的支持我会随后更新还在测试中的 M 系列的 Mac 版本当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

全球首款自带 Agentic AI 伴侣的游戏台式机：微星 MEG Vision X2 AI+ 发布，正面配备全息显示器

IT之家 · 2026-05-31 23:09:52+08:00 · tech

IT之家 5 月 31 日消息，微星今天宣布推出 MEG Vision X2 AI+ 台式整机，号称是“全球首款自带 Agentic AI 伴侣的游戏台式机” 。 IT之家在此援引官方新闻稿，MEG Vision X2 AI+ 引入了微星自研 Agentic AI（代理式人工智能）助手“LuckyClaw”，让用户能够通过自然语言语音指令，完成切换性能模式、调整显示器设置、控制 RGB 灯效等操作。官方将在未来不断更新 Skill，提供更加丰富的体验。同时，这款台式机的正面还带有 AI Holostage 全息显示器，可将数字助理、桌宠和第三方 AI 虚拟形象，以更具沉浸感的形式跃然眼前。让 AI 不只是屏幕上的软件，而是成为“突破次元壁”的互动伙伴。该机出厂时已预装 LuckyClaw，用户完成初始设置后可立即开始互动。从官方的宣传图来看，这款台式机将配备英特尔酷睿 Ultra 处理器、英伟达 RTX 显卡，不过具体配置暂未公开。

OPUS 4.8太难了。

LinuxDo 最新话题 · 2026-05-29 15:49:48+08:00 · tech

背景：我是做出海广告的，目前在写agentic flow（短视频）的提示词，尝试一下opus 4.8, 最终被劝退了。痛点：我有一种在读赛博文言文的感觉，脑子转不过来。解决方案：还是回到 OPUS 4.5, 控制好上下文，窗口快满的时候记录在文档里，开新窗口继续，这样才能高效把事情做完。对于不用claude code写代码的我，用中文和opus 4.6-4.8 沟通难度直线上升了。 2 个帖子 - 2 位参与者阅读完整话题

上海- 亚马逊云科技峰会 2026 预约参会名额

V2EX - 技术 · 2026-05-29 10:36:25+08:00 · tech