Accioone:为每个智能体都提供独立工作空间,长期保存浏览器状态、OAuth 登录状态。配置美国等境外住宅静态 IP 后,工作空间内部的浏览器指纹、时区、语言等环境参数也会随住宅 IP 自动同步切换,瞬间让你的本地电脑秒变成一台境外电脑。 Accioone 空间支持两种工作模式: 空间内开发模式 和 本地 API 模式 。 空间内开发模式:直接在空间内打开终端、IDE 等工具进行开发,所有流量自动走空间网络,配置简单,无需额外设置。 本地 API 模式:在宿主机上开发,通过配置环境变量将 API 请求转发到空间。 适合团队使用一起拼车 。此方案不是反代,不是-p 模式,不是 SDK 模式,是真实的 CLI 与模型在交互。 活动一 新用户体验 新用户访问 Accioone 完成官网注册后,(控制台->首页)扫二维码进群报 ID ,可领取: +7 天新人体验(每个 ID 限领 1 次) 活动二 邀请奖励 邀请新用户注册(控制台->首页->复制邀请链接),在群中报自己和对方的 ID ,对方领取新人体验的同时,你还可以获得: +7 天邀请奖励(多邀多得)
最近蹬到了大佬们的 team 号,感觉好聪明啊,之前用的是也是大佬们的公益站应该是 free 号池,这是我的错觉吗 4 个帖子 - 2 位参与者 阅读完整话题
先放一张最终配置完成后的效果图: 看到 @Gnn 佬的帖子后,发现很多佬友在评论区问,CC Switch 里的用量查询是怎么配置的,刚刚研究了下搞懂了,顺手整理出来分享一下。 首先可以先根据 @Gnn 佬的帖子配置【自动故障转移】;配置完成后,CC Switch 就可以自动切换到当前更合适的公益站节点; 帖子各位佬友可以去看看 ;不过这个配不配都无所谓,本帖讲的主要是用量查询的配置。 接下来配置用量统计和展示 在 CC Switch 里点击【配置用量查询】: 进去后只需要填三个东西:请求地址、用户 ID、访问令牌。就能在 CC Switch 列表里看到每个公益站的已使用额度和剩余额度了。 具体对应关系如下: 请求地址 :填写公益站地址。 用户 ID :在公益站后台的个人信息里找。 访问令牌 :进入公益站后台,点击【安全设置】,生成令牌后复制到这里。 最后再感谢下各位维护公益站的佬,尤其是 LD 最帅的男人 @user792 18 个帖子 - 11 位参与者 阅读完整话题
总感觉claude code cli生成的代码质量更高一点,各位佬友有相同的感受吗? 顺便问问大家都用cli还是客户端vibe coding~ 1 个帖子 - 1 位参与者 阅读完整话题
佬们觉得这个新机制是降低了门槛还是提升了门槛? 或者说五年Github用户质量更高还是小作文能通过审核的用户质量更高? 提升门槛 降低门槛 点击以查看投票。 41 个帖子 - 39 位参与者 阅读完整话题
早上在lm studio看到了,测试了下,好像比之前的版本效率更高一点。 google/gemma-4-12b-qat • LM Studio 3 个帖子 - 2 位参与者 阅读完整话题
笔记本电脑7800的拯救者R7000p和7100斗争者战7000选哪个?准备上大学了,轻度游戏需求。 44 个帖子 - 14 位参与者 阅读完整话题
为获得质量更高且数量庞大的优质代码库训练人工智能模型,Google现在希望向 Google Play 应用商店的开发者们付费,购买开发者的应用程序代码库访问权限用来改进开发工具,Google的想法是通过非独占许可让开发者可以继续保留代码的知识产权,Google通过付费“借用”开发者的优质代码。 目前已经有开发者收到来自Google的机密电子邮件,Google在邮件中宣传这项计划的诸多好处,例如帮助Google开发者工具和产品、支持开发者生态系统等,当然大部分好处都是Google的,对开发者来说最有实际意义的就是可以通过该计划获得额外的收入。 Google在机密邮件中表示: 获得项目外收入:分享你的应用程序代码库访问权限以及你的存档项目即可获得丰厚的报酬。 成为早期采用者:作为试点合作伙伴,您将塑造Google未来与开发者社区的合作方式。 提升实际影响力:代码对我们的产品和服务开发都大有裨益,您测试过的代码可以为我们直接提供帮助。 保留代码控制权:这是非独占协议,您将保留 100% 的知识产权,代码仍然属于您,您可以保留数据货币化的权利。 目的是提高 Gemini 代码生成能力: Google的 Gemini 模型落后于竞争对手的原因有很多,这些竞争对手产品在开发环境中的采用率更高,例如 Claude Code 专注于智能编码被诸多开发者和企业用户采用;Codex 目前也获得超过 500 万名开发者并帮助开发者开发项目;GitHub Copilot 实时自动补全与 IDE 无缝集成,可以快速生成开发模板等。 在智能编码领域 Gemini 模型和Google反重力工具的采用率不温不火,常规 AI 对话聊天用户的增长无法改变 Gemini 的窘境,Google也意识到差距所以正在积极弥合差距,当然这也意味着互联网上公开的代码库无法满足Google需求,作为搜索引擎提供商,Google掌握着互联网上的海量免费资源索引,但Google更希望获得优质应用程序的源代码。 目前Google正在向少量优质应用程序的开发者发送电子邮件宣传这项计划,可能不同应用程序的代码库可以获得的报酬不同,截至本文发布时目前还未看到有任何开发者透露已经参与该项目和提供具体的报酬数字。 查看评论
IT之家 6 月 3 日消息,微软今日宣布推出开源框架 ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动评分),旨在将自然语言写成的行为规范直接转换为可执行的评估流程。 据介绍,ASSERT 能够从产品需求、政策文件或系统提示等文本出发,自动生成测试场景、数据集、评估指标和计分卡,并针对目标模型、应用或智能体运行测试。 该框架建立在这样一个前提之上:行为规范本身应当成为评估的核心输入,而非仅仅作为背景参考。ASSERT 将这一过程系统化为四个阶段: 首先,将宽泛的行为描述细化为明确的概念规范,进而转换为可编辑的许可与不许可行为分类体系; 随后,基于开发者指定的维度(如任务类型、角色、工具可用性等)生成分层测试用例,涵盖单轮提示、多轮场景以及善意交互和对抗性探测; 接着,对目标系统运行这些用例并记录完整轨迹,包括工具调用、中间决策等; 最后,对照行为分类和策略立场对每个轨迹进行评分,输出通过与否标签、判断理由、策略引用以及作出该裁决的具体回合或动作。 为了验证 ASSERT 的有效性,微软团队开展了两项覆盖率研究和人工评审对比。 第一项覆盖率研究显示,相比直接从意图生成的评估集,ASSERT 在多项行为(IT之家注:如社会评分、拍马屁行为、任务遵循、工具使用规范、不安全健康建议)上生成的测试集覆盖更广,暴露出更多值得检查的案例,区分强弱系统的能力更强,同时显现出更多独特的失败模式。 第二项验证通过对比 LLM 判定器与人工审核,显示两者一致率通常在 80%–90%,而人工标注者之间一致率约为 90%,表明 LLM 判定器能够捕捉大部分目标信号,但在策略细微差别或高度专业领域仍需谨慎。 微软指出,ASSERT 最适用于行为定义明确、约束清晰的场景。丰富的工具、政策和边界描述有助于生成更精确的测试用例。开发者不应将汇总评分视为最终结论,更多情况下,收集的失败案例和操作轨迹对改进系统和评估方法更有价值。ASSERT 并不能替代人工判断、遥测数据或领域专家评审,而应将其作为使评估更快速、更明确和更易于迭代的一种方式。 参考资料: 代码库: https://github.com/responsibleai/ASSERT 项目网站: aka.ms/ASSERT 实例: travel-planning agent
IT之家 6 月 3 日消息,在今日开幕的 Build 2026 开发者大会上,微软宣布在去年为 Edge 浏览器推出基于 Phi-4-mini 模型的写作辅助 API 基础上扩展了其端侧 AI 能力,新增了模型和 API。本次更新主要包括三项内容: Aion-1.0-Instruct 小语言模型的开发者预览版(用于早期测试和反馈); Edge 148 版本中由端侧任务专用模型驱动的语言检测和翻译 API; 以及在 Edge Canary 和 Dev 通道中提供的实验性 Web Speech API 端侧语音识别功能。 微软表示,过去一年中,Edge 浏览器的写作辅助 API 一直基于 Phi-4-mini 模型。这是一个 40 亿参数的模型,在文本理解、推理和指令遵循方面表现出色,但其硬件要求限制了它在不同设备上的可用性。 因此,微软即日起在 Edge Canary 和 Dev 通道中引入了 Aion-1.0-Instruct 小语言模型的开发者预览版。该模型更小、更快、更高效,可扩展到更多设备 —— 包括 GPU 性能较低的设备,以及通过 CPU 推理支持无 GPU 的设备,同时为广泛的 Web 使用场景提供良好的输出质量。 该预览版允许开发者在真实 Web 场景中评估 Aion-1.0-Instruct,测试 API 互操作性并提供反馈,该模型计划于 7 月以开源形式发布到 Hugging Face。 在 Edge 148 预览版中,全新的语言检测和翻译 API 已正式可用。这些 API 允许网站和浏览器扩展识别文本语言并在语言对之间进行翻译,基于端侧任务专用模型,支持 145 种以上语言,并针对 Web 翻译负载进行了优化。 开发者可以在网站或扩展中使用 JavaScript 调用这些 API,相比云服务,可获得更好的用户隐私、网络独立性以及零翻译成本。 在最新的 Edge Canary 和 Dev 通道中,微软还引入了处理语音的端侧任务专用模型,实现了 Web Speech API 的本地语音识别。该实现将语音转文字过程在用户设备上本地完成,可改善用户隐私、降低延迟,并支持低网络连接或无网络场景。开发者只需在现有 Web Speech API 代码中做少量修改,例如设置 recognition.processLocally = true,即可启用端侧语音识别。 微软表示,借助 Aion-1.0-Instruct 小语言模型、新的语言检测和翻译 API 以及端侧语音识别,开发者可以利用内置于浏览器的模型打造基于 AI 的 Web 体验,无需依赖专用硬件、云服务或特定领域专业知识。
开了 Claude Max 20x 和 ChatGPT Pro 5x。 两者的努力度都已经开到最高,Claude Code 开启 ultracode 后似乎也没有 GPT 5.5 可以插手的地方,只剩下最后的一个对抗性审查作用,感觉还是没有更高效使用它们俩。 如何更高效将 opus 4.8 和 GPT 5.5 结合使用?有没有将二者结合使用的工作流? 1 个帖子 - 1 位参与者 阅读完整话题
理论上可以一次性搜索几千个网页,比 grok 网页版上限更高 使用 grok 4.3 500K 上下文,速度是挺快的 5 个帖子 - 3 位参与者 阅读完整话题
一直用着GPT,不过最近Kiro渠道的Opus价格被打下来了,但是Opus4.7智力堪忧,反而Opus4.6才是最优解 手动切换到Opus4.6命令: 剧透 手动切换到Opus4.6 1M上下文命令: 剧透 开始愉快的Vibe Coding吧 1 个帖子 - 1 位参与者 阅读完整话题
求助,搭建的API中转站,香港VPScn2优化线路,一直套的CF在使用,比直连慢了一半,但是不套CF是不是就没有CF那层防御作用啦?求大佬解答,给个方案或者思路 34 个帖子 - 16 位参与者 阅读完整话题
- 失业 - 多了 AI 的开支 - 牛马们效率更高,工作并没有轻松
IT之家 5 月 23 日消息,据《财富》杂志 22 日报道,越来越多企业正在要求员工“尽可能多用 AI”,希望借此提升效率、压缩成本。但现实情况开始显示,大规模 AI 化本身也正在 带来新的成本压力 。 微软最近已经开始取消大部分员工对 Claude Code 的直接授权,并转向推广自家的第一方 AI 编程工具。而就在半年前,微软还在积极推动员工使用 Claude Code。当时,微软向数千名开发者、设计师、项目经理等员工开放工具, 希望大家尝试 AI 编程 。Claude Code 随后迅速在内部流行,甚至到了使用规模超出预期的程度。 然而时至今日,员工的大量使用,反而促使微软开始收缩授权。某种程度上,微软自己的工程师已经 对这类 AI 工具形成依赖 。不过,微软与 Anthropic 之间的大规模合作并不会因此受到影响。 根据双方协议,微软计划向 Anthropic 投资最高 50 亿美元,同时 Anthropic 也承诺采购价值 300 亿美元(IT之家注:现汇率约合 2042.38 亿元人民币)的微软 Azure 云计算资源。 类似情况并不只发生在微软。优步首席技术官普拉文 · 内帕利 · 纳加今年 4 月透露,公司仅用了 4 个月, 就花光了整个 2026 年的 AI 编程工具预算 。而在此之前,优步甚至还曾主动鼓励员工疯狂使用 AI 工具,公司内部还建立排行榜,统计各团队 AI 使用量。 这一系列情况,正在给科技行业对 AI 的乐观预期降温。过去几年,许多科技公司一直强调 AI 将带来“革命”甚至“复兴”。现实问题开始出现:AI 确实能提升效率,同时 算力与 token 消耗成本却也在同步膨胀 。 英伟达应用深度学习副总裁布莱恩 · 卡坦扎罗近期就坦言:“对我的团队来说,算力成本已经 远高于员工工资成本 。” 目前,不只是微软和优步在推动员工高强度使用 AI。在 Meta 内部,更有员工制作了名为“Claudeonomics”的排行榜,专门 统计谁使用 AI 最多 。亚马逊则鼓励员工“toxenmaxx”,也就是尽可能多消耗 AI token。 报道指出,鉴于大多数 AI 服务都采用 token 计费模式。理论上 AI 用得越多、效率越高,企业最终支付的费用 反而可能越高 。 高盛预计,到 2030 年,随着 AI Agent 被广泛采用,全球 token 消耗量可能增长 24 倍,达到 每月 120 千万亿 token 。虽然未来单个 token 价格预计会持续下降,但企业整体 AI 成本未必会同步下降。 研究机构 Gartner 预测,到 2030 年,1 万亿参数级大模型的推理成本, 相比 2025 年可能下降近 90% 。然而,Agent 类 AI 模型完成任务时,需要消耗 远多于普通模型的 token 。结果就是,总使用量增长速度可能超过成本下降速度。此外,AI 企业也未必会把全部降价幅度让利给客户。Gartner 分析师威尔 · 索默表示:“企业不应该下调 token 价格,误认为高端 AI 推理能力会因此全面普及。” 这种现实,也可能让很多企业规划中的“AI Agent 未来”变得更加昂贵。
Mozilla 今年正式确认,正在为 Firefox 浏览器推出代号为“Project Nova”的 2026 年全新界面与体验改版,目标是在坚持隐私和高度自定义的前提下,让浏览器在视觉上更现代、操作上更顺手、性能上更敏捷。 这一改版被官方定义为一次“更新与焕新,而非彻底重做”,旨在跟上快速变化的互联网环境和用户对现代浏览器的新期望。 根据 Mozilla 公布的信息,全新的 Nova 界面将围绕隐私工具和更直观的导航体验进行强化,内置 VPN 和私密浏览模式等功能会在界面中变得更加醒目,方便新用户快速上手并理解相关选项。 Firefox 还将采用更柔和的标签页造型、更新后的图标以及受“火焰”意象启发的更温暖配色,在保持现代感的同时尽量不打扰用户注意力。 菜单、面板和控件等界面元素也将统一规范,以在桌面端与移动端之间实现更一致的视觉和操作体验。 设置界面同样会被重新设计,重点放在隐私控制选项的易懂性和可管理性上。 用户可以通过所谓的“AI 总开关”(AI kill switch)完全关闭与人工智能相关的功能,同时在“增强跟踪保护”等设置中获得更清晰的隐私与可用性权衡选项。 Mozilla 强调,屏蔽跟踪器不仅是为了保护隐私,也有助于减少不必要的加载内容,从而提升网页打开速度。 在性能方面,Mozilla 表示,用户应该能够“感受到速度的提升”,其内部数据显示,过去一年关键页面内容的加载时间已经缩短了约 9%。 官方也坦言,在一些第三方评测与自家测试中,Firefox 过去在浏览性能上落后于 Chrome 和 Edge 等基于 Chromium 的浏览器,因此此次改版也肩负着补齐短板的任务。 为提升效率与工作流体验,Nova 改版还将让标签分组、分屏浏览、垂直选项卡等工具更容易访问和使用。 此外,Mozilla 将在用户反馈的推动下重新引入此前颇受欢迎的“紧凑模式”,以满足习惯高信息密度界面的用户。 在个性化方面,Firefox 仍会把自定义作为核心特质之一,计划引入更多新主题和壁纸,并探索更高级的个性化可能性。 无障碍体验同样是本次改版的重要方向,包括对可读性、键盘导航、对比度以及视觉舒适度的优化,尤其是针对依赖深色模式或其他辅助设置的用户。 Mozilla 表示,Firefox 的开发将继续以开放方式进行,并鼓励社区持续提供意见,帮助打磨最终的 Nova 体验。 目前,对 Nova 感兴趣的用户已经可以在 Firefox Nightly 版本中抢先体验这一新界面。 具体方法是:先下载最新版 Nightly,进入 about:config 配置编辑页面,新增名为“browser.nova.enabled”的布尔项,并将其值从 false 改为 true,随后重启浏览器即可启用 Nova 界面。 不过 Mozilla 也提醒,由于 Nightly 属于实验性版本,启用后可能会遇到不稳定或错误问题。 查看评论
ampcode对gpt5.5做了评测,完整报告见 gpt-5.5 low 的表现相当不错,非常适合用于那些规模较小、验证成本较低的任务。 medium 则是处理常规深度学习任务的理想默认设置。 xhigh 则适用于那些难度较高的任务。 high 并不一定就比其他级别更好;在内部测试中,GPT 5.5 的 high 版本虽然成本更高,但性能却不如 medium 版本。 18 个帖子 - 16 位参与者 阅读完整话题
我有36块钱,买opencode go套餐还是用deepseek的api?谁性价比更高?用量大的话(只用deepseek模型) 这是我现在的用量 18 个帖子 - 13 位参与者 阅读完整话题
知名爆料者“刹那数码”近日在社交平台发声称,即将登场的 iPhone 18 Pro 依然不会采用双层 OLED 显示技术,并指出苹果当前的散热管理策略,仍然限制了 Pro 系列机型在户外环境下维持高亮度显示的能力。 “刹那数码”在微博上回应网友关于“双层 OLED 何时上 iPhone”的提问时表示:“反正 18 Pro 肯定没有。” 他回顾了此前对 iPhone 17 Pro 的预测称,这一代机型在户外维持峰值亮度方面“几乎没有实质性进步”,并判断如果苹果不调整当前偏激进的亮度与散热策略,想要在真实使用场景中显著提升屏幕亮度,几乎只能寄望于双层 OLED 技术。 这一说法与此前产业链多方消息大体一致。 去年 8 月的一份报告显示,苹果已经为所谓“串联(tandem)OLED”制定了约两年的量产规划,但仍未最终拍板是由三星显示还是 LG 显示主导面板开发,这意味着该技术最早也要在 2028 年之后才可能真正应用到 iPhone 上。 需要注意的是,苹果内部评估的方案与当前 iPad Pro 上采用的完整双层 OLED 并不完全相同。 报道称,苹果正在研究的是一种“简化串联”设计:并非将红绿蓝三色子像素全部叠加两层,而是仅将蓝色子像素做成双层堆叠,红色和绿色仍保持单层结构,以在画质、功耗、成本之间取得平衡。 在 iPhone 18 Pro 的显示升级方面,目前更现实的变化是改用 LTPO+ 技术。 本月早些时候的消息称,苹果计划与三星显示和 LG 显示敲定 iPhone 18 Pro 与 18 Pro Max 的 LTPO+ 面板供应方案,而中国厂商 BOE 因自家 LTPO+ 工艺在良率与质量上存在问题,基本无缘这一高端订单。 相比 iPhone 17 Pro 现用的标准 LTPO,LTPO+ 有望通过更精细地调控 OLED 发光行为,进一步提升整机续航表现,但对峰值亮度本身以及因过热导致的亮度衰减,并没有根本性改善。 从技术路径看,双层 OLED 被视为同时解决亮度与发热问题的关键方案。 由于两层发光层可以在更低驱动强度下实现同样的目标亮度,面板自身发热会显著降低,从而减轻系统散热压力,减少因为温度过高触发的亮度降级策略。 目前苹果已经在新款 M4 iPad Pro 上率先导入这一技术,但iPhone 用户想在手机上体验类似的屏幕升级,恐怕还需要等待相当长的一段时间。 查看评论