WWW.YOUINFO.SITE
标签聚合 az

/tag/az

LinuxDo 最新话题 · 2026-06-11 01:34:02+08:00 · tech

Blazing fast inference: By shifting the decode bottleneck from memory-bandwidth to compute, DiffusionGemma generates up to 4x faster token output on dedicated GPUs. (1000+ tokens per second on a single NVIDIA H100, 700+ tokens per second on NVIDIA GeForce RTX 5090). 一些补充 Diffusion是一种不同于主流文本大模型Next Token Predict的模型架构,常用于图片生成领域中。NTP是从左向右逐个token生成的,而Diffusion则是给定一块空白区域,模型预测这片区域的每个位置可能的内容,并一次次进行纠错,最终生成完整内容。 14 个帖子 - 9 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-09 19:05:11+08:00 · tech

微软正于中国内地的 Azure 云计算部门裁撤数百名员工,在华业务迎来两年内至少第三轮缩减,同时也凸显中美双方围绕跨境数据流动日益收紧的监管环境。据多名员工透露,北京和上海部分 Azure 团队成员上周收到内部邮件,被通知其岗位将被终止。 两名消息人士估计,本轮裁员涉及约 200 至 400 名员工,这些员工将于 7 月 6 日正式离职,并按在职年限获得赔偿,同时最多可获相当于 7 个月工资的补偿。部分员工被提供调往加拿大的内部转岗机会。 据受影响员工介绍,此次调整主要集中在微软中国的 Azure 云业务线,其他部门如 DevDiv 开发者工具部门、微软亚洲软件技术中心以及分布在上海和苏州的微软 AI 团队目前尚未受到波及。微软方面在回复南华早报的邮件中表示,作为全球业务管理的一部分,公司向符合条件的员工提供了可选择的内部转岗机会,并强调微软将继续专注于服务客户及推动全球业务增长。 本轮裁撤是微软中国云业务持续收缩的一环。去年 10 月,微软已在中国内地对 Azure 团队进行过一次裁员,同时向部分员工提供赴澳大利亚等地的调岗机会。更早前在 2024 年,微软向中国境内从事人工智能与 Azure 相关工作的员工发出邀请,鼓励其选择赴美国、澳大利亚、爱尔兰等海外办公室工作,并当时重申其对中国市场的长期承诺。再往前的 2023 年,微软还将部分中国顶尖 AI 研究人员调往加拿大温哥华新设立的实验室,并确认该机构将从包括中国在内的全球办公室调配人才。 除了云与 AI 业务的人才与组织调整,微软在中国的线下零售网络也经历了明显收缩。2024 年,公司关闭了在中国内地的授权实体零售门店,将销售渠道全面转向线上以及少数第三方零售合作伙伴。一系列举措表明,微软正通过裁员、调岗与渠道调整等方式,在中国市场重新配置资源与风险敞口。 微软的这一轮再组织发生在中美两国对于跨境数据流动监管同步趋严的背景之下。美国司法部去年实施了“数据安全计划”,限制美国机构向包括中国在内的“关注国家”的员工、供应商及投资方传输特定类型的敏感数据集。与此同时,中国也在持续完善自身的数据治理框架,自 2021 年起陆续出台并实施《数据安全法》《个人信息保护法》等法规,加强对关键信息基础设施、重要数据以及个人信息跨境流动的管控。在双重监管压力之下,跨国科技企业在中国的云计算和数据相关业务面临更复杂的合规与运营挑战,微软在华云业务的持续调整被视为这一趋势的具体体现。 查看评论

v2ex · 2026-06-09 17:36:25+08:00 · tech

我们上线了 Pangolinfo MCP 服务 大家好,我是 Pangolinfo 的开发同学,今天不写官方公告,跟大家直白聊聊我们刚上线的 Amazon Data MCP 服务,包括为什么做、现在能干嘛,以及还有哪些做得不好的地方。 为什么做这个 我们原来一直做 Amazon Scraper API ,服务跨境卖家和开发者。过去一年有个特别明显的趋势: 越来越多的用户不再直接调 API ,而是想把数据直接接入 Claude 、Cursor 、Cline 这些 AI 工具里,让 Agent 自己去取数据、做决策 。 但现在的接入方式特别零散,每个人都在自己造轮子:有人让 AI 写爬虫脚本,有人自己封装 REST 调用,还有人搭各种中间层转发。我们看下来觉得,这块其实可以做得更干净、更标准一点,于是就按照 MCP 协议把我们的核心接口重新封装了一遍。 现在能干什么 目前一共开放了 19 个工具 ,覆盖四个核心场景: 亚马逊核心数据 关键词搜索(含广告位分布、自然排名、各类徽章) 商品详情(基础信息、变体、价格、图片) 评论抓取(支持批量、带用户信息和时间戳) 卖家主页数据 ✨ 亮点: get_amazon_product 内置了 AI 评论摘要字段,一次调用直接返回好评/差评核心要点,不用自己分页抓 review 再做 NLP 处理 类目与选品分析 完整类目树导航与搜索 ✨ 亮点: filter_niches 工具,输入关键词或类目节点,返回 50+ 市场健康度指标 ,重点包含新品突围率、头部品牌集中度、价格带分布这些真正影响选品决策的数据,不只是看搜索量高低 Google AI 趋势 ai_search 直连 Google AI Overview 和 AI Mode 实时数据 可以捕捉还没在亚马逊站内成型、但已经在全网发酵的早期需求趋势 IP 合规 wipo_search :查询全球商标信息 pacer_search :查询美国专利诉讼案件详情及历史时间线 特别适合 POD 、外观类目的卖家在上新前做前置风险排查 补充:MCP vs REST API 怎么选? 我们的 Amazon Data MCP 和 Amazon Scraper API 运行在完全相同的数据引擎上,共享同一套积点计费体系,只是服务于不同的工作流: 选 MCP:适合在 Claude 、Cursor 等 AI 工具里做交互式研究、临时数据查询,让 AI 自动帮你调用和串联工具,零代码上手 选 REST API:适合批量抓取、定时任务、CI/CD 流水线或系统集成,需要完全自主控制请求和并发 接入方式 零安装零依赖,纯远程 HTTP 接入 。只需要在你的 MCP 客户端配置文件里加一段 JSON ,重启客户端就能用: { "mcpServers": { "pangolinfo": { "url": "https://mcp.pangolinfo.com/mcp", "headers": { "Authorization": "Bearer <YOUR_API_KEY>" } } } } 目前已完整支持:Claude Code 、Cursor 、Cline 、Windsurf 、Codex 、Hermes 、OpenClaw , 同一份配置在所有客户端通用 。 ⚠️ 重要提示:API Key 请在控制台申请 长期 Key ,短期 Key 会静默过期导致工作流中断,这个坑我们在文档里也重点标注了。 说几个现在还不完善的地方 不吹不黑,目前还有不少问题,提前跟大家说清楚: 工具数量上 :19 个覆盖了主要场景,但还有一些边缘需求没做 待开发:FBA 库存数据、A+ 内容解析、Buy Box 历史、跟卖监控等 这些都在 roadmap 里, 你最需要哪个功能,直接在评论区说,会直接影响我们的排期优先级 文档方面 :目前中文版更完整,英文版还在逐步补全,国际化这块我们确实欠债了 相关地址 Amazon Data MCP Amazon Scraper API 完整开发文档 控制台(申请 API Key ) 有在做跨境 AI Agent 、数据管道或者相关工具的朋友,欢迎交流。我会一直在评论区,有任何问题都可以直接问,能答的我都答。

V2EX - 技术 · 2026-06-09 02:20:52+08:00 · tech

仓库: https://github.com/Azure99/ultra-goal superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的: 决策阶段的注意力依旧没办法解放,因为你要定一个又一个的偏好,即使它本身有最佳实践。如果你的脑子里没有太多想法,只是想搓个原型看看什么样,agent 给你罗列的方案只会造成信息过载。 在真正实施之前往往很难想清所有细节,特别是长任务,如果 spec/plan 实施到一半,才发现设计有缺陷,非常容易越做越偏,甚至需要推倒重来。大规模一些的重构,或者是需要调研再实施的任务,非常容易出现这种情况。 从 ultra goal 的名字就能看出,它是以目标驱动的,只需要给定一个清晰的目标,但不需要具体实现细节,agent 会在执行时动态调整。(核心提示词只有 1000 tokens 出头,比 readme 都少) 接收到用户目标后,会先在工作环境中探索,然后动态拆解出按阶段划分的 roadmap 。 每执行一个阶段,都有规划、实施、验收、提交四个步骤。主 agent 只做协调,避免频繁的上下文压缩,子 agent 推进工作,并把工作文档落盘。 规划:协调两个子 agent ,先独立的设计实施方案,再由主 agent 交叉复审定 plan(这是最核心的,如果只让一个 agent 来定方案,非常容易有疏漏,superpowers 这类工具会不断的让你定决策。然而,如果让两个子 agent 各出一版再交给主 agent 仲裁,大部分决策其实完全不需要人参与) 实施:没什么特别的,就是一个子 agent 照着 plan 去改代码、自测。 验收:同样会开多个子 agent ,分不同视角 review ,然后交叉看各自的报告,主 agent 定级、去重,如果有必修问题就会打回重改。 每做完一个阶段,主 agent 都会根据当前状态,看看是否要修改 roadmap ,比如发现某个方案实际是不可实施的,就可以调整,一切以达成目标为主。 当然,它的缺点一样很大,执行时间长,会巨烧 token ,如果你的目标定的大,一次跑两天都是有可能的(烧掉你十几亿 tokens )。最好在 codex 中使用 gpt 5.5 xhigh 当主 agent ,不差钱子 agent 就继续用 5.5 ,差钱子 agent 就用 5.4mini xhigh 。但主 agent 不能差,实测下来超长程的任务,claude 系还是稍微差点意思,国产模型差距会更大。 最适合的场景就是搓原型/调研+实现,以及做可行性验证。--yolo 跑上就可以去睡觉了,小修小补没必要用,严肃线上需求还是要谨慎放手(当然也可以先做一版、确保跑通 人再仔细 review )。 直接安装 npx skills add Azure99/ultra-goal SKILL 需要手动触发(为了防止模型自己抽风调用)。描述目标时,不需要描述具体的实现细节,但要仅你最大所能提供端到端的验收方式,比如做 Web 应用,就给它 playwright-cli ,让它跑交互/视觉验收,而不是只跑单测。

V2EX - 技术 · 2026-06-09 01:20:52+08:00 · tech

仓库: https://github.com/Azure99/ultra-goal superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的: 决策阶段的注意力依旧没办法解放,因为你要定一个又一个的偏好,即使它本身有最佳实践。如果你的脑子里没有太多想法,只是想搓个原型看看什么样,agent 给你罗列的方案只会造成信息过载。 在真正实施之前往往很难想清所有细节,特别是长任务,如果 spec/plan 实施到一半,才发现设计有缺陷,非常容易越做越偏,甚至需要推倒重来。大规模一些的重构,或者是需要调研再实施的任务,非常容易出现这种情况。 从 ultra goal 的名字就能看出,它是以目标驱动的,只需要给定一个清晰的目标,但不需要具体实现细节,agent 会在执行时动态调整。(核心提示词只有 1000 tokens 出头,比 readme 都少) 接收到用户目标后,会先在工作环境中探索,然后动态拆解出按阶段划分的 roadmap 。 每执行一个阶段,都有规划、实施、验收、提交四个步骤。主 agent 只做协调,避免频繁的上下文压缩,子 agent 推进工作,并把工作文档落盘。 规划:协调两个子 agent ,先独立的设计实施方案,再由主 agent 交叉复审定 plan(这是最核心的,如果只让一个 agent 来定方案,非常容易有疏漏,superpowers 这类工具会不断的让你定决策。然而,如果让两个子 agent 各出一版再交给主 agent 仲裁,大部分决策其实完全不需要人参与) 实施:没什么特别的,就是一个子 agent 照着 plan 去改代码、自测。 验收:同样会开多个子 agent ,分不同视角 review ,然后交叉看各自的报告,主 agent 定级、去重,如果有必修问题就会打回重改。 每做完一个阶段,主 agent 都会根据当前状态,看看是否要修改 roadmap ,比如发现某个方案实际是不可实施的,就可以调整,一切以达成目标为主。 当然,它的缺点一样很大,执行时间长,会巨烧 token ,如果你的目标定的大,一次跑两天都是有可能的(烧掉你十几亿 tokens )。最好在 codex 中使用 gpt 5.5 xhigh 当主 agent ,不差钱子 agent 就继续用 5.5 ,差钱子 agent 就用 5.4mini xhigh 。但主 agent 不能差,实测下来超长程的任务,claude 系还是稍微差点意思,国产模型差距会更大。 最适合的场景就是搓原型/调研+实现,以及做可行性验证。--yolo 跑上就可以去睡觉了,小修小补没必要用,严肃线上需求还是要谨慎放手(当然也可以先做一版、确保跑通 人再仔细 review )。 直接安装 npx skills add Azure99/ultra-goal SKILL 需要手动触发(为了防止模型自己抽风调用)。描述目标时,不需要描述具体的实现细节,但要仅你最大所能提供端到端的验收方式,比如做 Web 应用,就给它 playwright-cli ,让它跑交互/视觉验收,而不是只跑单测。

V2EX - 技术 · 2026-06-09 01:20:52+08:00 · tech

仓库: https://github.com/Azure99/ultra-goal superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的: 决策阶段的注意力依旧没办法解放,因为你要定一个又一个的偏好,即使它本身有最佳实践。如果你的脑子里没有太多想法,只是想搓个原型看看什么样,agent 给你罗列的方案只会造成信息过载。 在真正实施之前往往很难想清所有细节,特别是长任务,如果 spec/plan 实施到一半,才发现设计有缺陷,非常容易越做越偏,甚至需要推倒重来。大规模一些的重构,或者是需要调研再实施的任务,非常容易出现这种情况。 从 ultra goal 的名字就能看出,它是以目标驱动的,只需要给定一个清晰的目标,但不需要具体实现细节,agent 会在执行时动态调整。(核心提示词只有 1000 tokens 出头,比 readme 都少) 接收到用户目标后,会先在工作环境中探索,然后动态拆解出按阶段划分的 roadmap 。 每执行一个阶段,都有规划、实施、验收、提交四个步骤。主 agent 只做协调,避免频繁的上下文压缩,子 agent 推进工作,并把工作文档落盘。 规划:协调两个子 agent ,先独立的设计实施方案,再由主 agent 交叉复审定 plan(这是最核心的,如果只让一个 agent 来定方案,非常容易有疏漏,superpowers 这类工具会不断的让你定决策。然而,如果让两个子 agent 各出一版再交给主 agent 仲裁,大部分决策其实完全不需要人参与) 实施:没什么特别的,就是一个子 agent 照着 plan 去改代码、自测。 验收:同样会开多个子 agent ,分不同视角 review ,然后交叉看各自的报告,主 agent 定级、去重,如果有必修问题就会打回重改。 每做完一个阶段,主 agent 都会根据当前状态,看看是否要修改 roadmap ,比如发现某个方案实际是不可实施的,就可以调整,一切以达成目标为主。 当然,它的缺点一样很大,执行时间长,会巨烧 token ,如果你的目标定的大,一次跑两天都是有可能的(烧掉你十几亿 tokens )。最好在 codex 中使用 gpt 5.5 xhigh 当主 agent ,不差钱子 agent 就继续用 5.5 ,差钱子 agent 就用 5.4mini xhigh 。但主 agent 不能差,实测下来超长程的任务,claude 系还是稍微差点意思,国产模型差距会更大。 最适合的场景就是搓原型/调研+实现,以及做可行性验证。--yolo 跑上就可以去睡觉了,小修小补没必要用,严肃线上需求还是要谨慎放手(当然也可以先做一版、确保跑通 人再仔细 review )。 直接安装 npx skills add Azure99/ultra-goal SKILL 需要手动触发(为了防止模型自己抽风调用)。描述目标时,不需要描述具体的实现细节,但要仅你最大所能提供端到端的验收方式,比如做 Web 应用,就给它 playwright-cli ,让它跑交互/视觉验收,而不是只跑单测。

V2EX - 技术 · 2026-06-09 00:20:52+08:00 · tech

仓库: https://github.com/Azure99/ultra-goal superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的: 决策阶段的注意力依旧没办法解放,因为你要定一个又一个的偏好,即使它本身有最佳实践。如果你的脑子里没有太多想法,只是想搓个原型看看什么样,agent 给你罗列的方案只会造成信息过载。 在真正实施之前往往很难想清所有细节,特别是长任务,如果 spec/plan 实施到一半,才发现设计有缺陷,非常容易越做越偏,甚至需要推倒重来。大规模一些的重构,或者是需要调研再实施的任务,非常容易出现这种情况。 从 ultra goal 的名字就能看出,它是以目标驱动的,只需要给定一个清晰的目标,但不需要具体实现细节,agent 会在执行时动态调整。(核心提示词只有 1000 tokens 出头,比 readme 都少) 接收到用户目标后,会先在工作环境中探索,然后动态拆解出按阶段划分的 roadmap 。 每执行一个阶段,都有规划、实施、验收、提交四个步骤。主 agent 只做协调,避免频繁的上下文压缩,子 agent 推进工作,并把工作文档落盘。 规划:协调两个子 agent ,先独立的设计实施方案,再由主 agent 交叉复审定 plan(这是最核心的,如果只让一个 agent 来定方案,非常容易有疏漏,superpowers 这类工具会不断的让你定决策。然而,如果让两个子 agent 各出一版再交给主 agent 仲裁,大部分决策其实完全不需要人参与) 实施:没什么特别的,就是一个子 agent 照着 plan 去改代码、自测。 验收:同样会开多个子 agent ,分不同视角 review ,然后交叉看各自的报告,主 agent 定级、去重,如果有必修问题就会打回重改。 每做完一个阶段,主 agent 都会根据当前状态,看看是否要修改 roadmap ,比如发现某个方案实际是不可实施的,就可以调整,一切以达成目标为主。 当然,它的缺点一样很大,执行时间长,会巨烧 token ,如果你的目标定的大,一次跑两天都是有可能的(烧掉你十几亿 tokens )。最好在 codex 中使用 gpt 5.5 xhigh 当主 agent ,不差钱子 agent 就继续用 5.5 ,差钱子 agent 就用 5.4mini xhigh 。但主 agent 不能差,实测下来超长程的任务,claude 系还是稍微差点意思,国产模型差距会更大。 最适合的场景就是搓原型/调研+实现,以及做可行性验证。--yolo 跑上就可以去睡觉了,小修小补没必要用,严肃线上需求还是要谨慎放手(当然也可以先做一版、确保跑通 人再仔细 review )。 直接安装 npx skills add Azure99/ultra-goal SKILL 需要手动触发(为了防止模型自己抽风调用)。描述目标时,不需要描述具体的实现细节,但要仅你最大所能提供端到端的验收方式,比如做 Web 应用,就给它 playwright-cli ,让它跑交互/视觉验收,而不是只跑单测。

v2ex · 2026-06-06 08:02:01+08:00 · tech

https://crazyrouter.com/ 27b0ca8628c3457baec5baaf89729f5c 588d80377be1476a85889c1befee1e24 25d5008c72b24fe5ab11dc93b26101ea 224a9993a6b34d41ae31acab9d2cb3a9 985de20df9cf4fe486ee9adccd489c37 e71c0f12655746e89cfd0f1376d13a47 4ef3c62159f94514911540082ed1346d 004b78efc79f486daf8d05326d35e38b 80b59f4d46594543871db5f560349322 cf6a7e8a1c194239b489bdf309789f6c c7e5a30733304663a693cb258165381a de726f0425ec4f1892471a5141cc91a6 c704df4e79a9445993a5b3753636d644 86f103fc86434ffd805de3f79348269a b48b894d7e2444e7966408ae5204064b cc0acc1168b3474eadfaf9d009db8024 e03a3c2c0ba0431b80e3e47f1ba31830 6eccf4b2ca1246b19115a73f3f047ed3 dd99e1d81eca4b9fa07b2059a2372d44 bc3443eb5d594007a3aaa857279cc96e 3f924cc0eef748aebfc9d1dd5201456c 12df0f4eda5c441b9a9b573bdad1471f 2a1ac88c0eb645ef8ac3a52873ca18c9 b0668e4bc751486599a3b7fe4ef77fbc e57c5f0796e74b4db02e54d2637031a8 23d7a10be5044882bd2e9729353205ac 04970ec75a9d480fa7d8fa9a0fef8d8e d7620482ab4a453a9f21b88a75405a74 b83f72bc0c344ad0b75a7ae36c6986c2 8b74eda7842b4054b960b3cff63d232c

IT之家 · 2026-06-05 20:53:35+08:00 · tech

IT之家 6 月 5 日消息,微软在 Build 2026 大会上宣布推出 Azure Linux 4.0 并发布了首个公开预览版,用户现可提前体验这一专为 Azure 云环境开发的 Linux 发行版。AKS 和 WSL 的支持也将很快推出。 此次发布延续了微软此前确认的技术路线调整。Azure Linux 4.0 已转向以 Fedora 为基础构建,这也是该版本最重要的架构变化之一。通过这一调整,Azure Linux 更加贴近 Fedora 的软件包生态,同时保留微软针对 Azure 平台的定制化功能层。 Azure Linux 4.0 最核心的技术变化在于:微软不再维护相对独立的软件包基础,而是直接采用 Fedora Linux 的源码,并在此基础上叠加针对 Azure 需求的定制内容。另外,该发行版仍继续采用 RPM 软件包体系,并保留常见的 RPM 管理工具链。 微软强调,这并非简单将 Fedora 重新打包,而是在 Fedora 基础上对最终的软件包组合、系统配置、安全策略以及 Azure 集成点保持完整控制权,从而形成一套围绕 Azure 云平台塑造的 Linux 系统,而非面向社区桌面或通用服务器的发行版。 目前 Azure Linux 4.0 已通过 Azure Marketplace 提供,有需要的用户可部署在 Azure 虚拟机和虚拟机规模集上,适用于虚拟机、虚拟机规模集、容器镜像以及 Kubernetes 相关用例。 相对于 Amazon Linux 等同类云厂商,微软的侧重点集中在 Azure 集成、生命周期管理与运维一致性。 微软同时指出,Azure Linux 4.0 的官方支持范围仅限于 Azure 环境。尽管用户可以在其他环境中测试相关镜像和 ISO 文件,但该发行版并不支持裸机部署、其他云平台或桌面使用场景。 IT之家提醒:当前预览版本仅供评估,不应用于生产环境。 参考资料: 《 Announcing Azure Linux 4.0: Purpose-Built for Azure, Now in Public Preview | Microsoft Community Hub 》

IT之家 · 2026-06-05 15:36:22+08:00 · tech

6 月 5 日消息,多名自称微软员工的用户在社交平台发文称,微软中国 Azure 大裁员靴子已落地,ImportBusiness Update 邮件通知已发,被裁人员超过 200,基本上是微软云中国研发“一锅端”了。 HR 要求 6 月 11 日前签字 ,7 月 6 日 last day。 赔偿标准和去年 7 月微软大裁员基本一致,N+4+2(6 月 11 之前签字奖励)+1(离职缓冲期一个月), 理论上最高补偿 N+7 。 公开报道信息显示,自 2025 年至今,微软确实在全球进行了多轮战略重组,已累计开展多轮裁员,总规模超过 24000 人(含自愿离职计划)。2026 年 1 月微软全球范围裁员,当时有报道称,微软计划裁员 1.1 万至 2.2 万人,波及 Azure 云团队。今年 6 月也有消息称,微软将对 Azure for Operators 等团队裁减“数百人”。