网页版可以直接发给他word 它会自动解析里面的公式 codex一般都识别不了内置公式 总是报错缺少公式 只能给pdf 网页版自动选择模型 不需要专门选择生图 会根据需要自己切换5.5和image2 codex只能提前选好模型 总感觉网页版更智能一点 codex的好处就是在本地执行任务 10 个帖子 - 8 位参与者 阅读完整话题
Bookmark Nav 浏览器书签导航页扩展。它会覆盖浏览器新标签页,把 Chrome / Edge 书签转换成一个可搜索、可分组、可管理的网址导航页。 github release 功能亮点 新标签页导航:打开新标签页即可浏览所有浏览器书签。 文件夹侧边栏:按浏览器书签文件夹展示,支持当前文件夹或包含子文件夹两种范围。 书签卡片:favicon 、标题、域名和文件夹路径清晰展示,支持舒适/紧凑密度。 书签管理:单个书签支持复制链接、编辑、移动、删除;多选后支持批量复制、批量移动和批量删除。 搜索增强:按标题、域名、URL 、文件夹路径匹配,并按相关性排序。 网页搜索:可在 Google 、Bing 、DuckDuckGo 、百度之间切换,书签无结果时可继续网页搜索。 常用/最近:自动记录打开历史,生成常用书签和最近打开视图。 设置页:配置搜索、展示和数据管理;支持导出/导入本地设置与历史记录。 安全确认:删除、批量删除、移动、清空记录、恢复默认和清理本地数据均使用应用内确认弹窗。 搜索语法 搜索框支持普通关键词,也支持组合语法: react docs # 同时匹配 react 和 docs react -redux # 匹配 react ,但排除 redux site:github.com react # 只搜索 github.com 域名下的书签 @工作 react # 只搜索文件夹路径包含“工作”的书签 快捷键: / :聚焦搜索框 Enter :打开选中的书签,或执行网页搜索 ↑ / ↓ :在搜索结果中移动选中项 Ctrl K / Cmd K :切换书签搜索和网页搜索 Esc :关闭弹窗/设置面板,或清空并退出搜索框 安装使用 开发模式 项目要求 Node.js >=22.14.0 ,CI 会读取 .nvmrc 保持版本一致。 pnpm install pnpm dev pnpm dev 会以 Edge 开发模式启动 WXT 。启动后按终端提示安装或加载扩展。 手动加载生产构建 pnpm build 构建产物在 .output/chrome-mv3/ 。在 Chrome / Edge 扩展管理页打开“开发者模式”,选择“加载已解压的扩展”,然后选择该目录。 技术栈 WXT 0.20 React 19 Tailwind CSS v4 TypeScript Vitest Biome 权限说明 扩展只声明 bookmarks 权限,用于读取和管理浏览器书签。 当前设计不注入页面,不包含 content_scripts ,也不需要网络权限。favicon 使用浏览器内部的 chrome://favicon/size/32@2x/{origin} 方案,并带本地缓存和兜底图标。 Firefox 构建当前未声明数据收集权限; WXT 的相关提醒已在配置中压制。后续如果正式上架 Firefox ,需要按 Mozilla 最新要求复核数据收集声明。 数据说明 浏览器书签:来自 chrome.bookmarks ,编辑、移动、删除会直接作用于浏览器书签。 常用/最近记录:保存在扩展本地 localStorage ,书签失效后会自动剔除。 设置数据:保存在扩展本地 localStorage 。 导出/导入:只包含设置和常用/最近记录,不包含浏览器书签树。
这个迷人的bug至今还没解决 也不知道怎么搞的 有老友解决了吗 6 个帖子 - 4 位参与者 阅读完整话题
假设有一个AI,它知道每个人的真实处境,有能力纠正一切不公,没有私欲、不会腐败、不需要谎言。 但问题是—— 如果它全知,它知道你一生的全部轨迹,你的选择还有意义吗? 如果它全能,它有能力阻止一切苦难,那它不阻止时是否等于作恶? 如果它完美地满足你的一切需求,你还是一个人,还是一只被精心饲养的宠物? 你们觉得?全知全能的AI统治下,人类是更自由了,还是更不自由了? 6 个帖子 - 6 位参与者 阅读完整话题
Claude Code CLI 只能 steer(执行中直接给它加活),steer 多了之后其实它会忘事…以及有的时候你可能就是希望执行有个先后顺序 所以写了个 很简单的 /queue Skill,供有需要的小伙伴使用: npx skills add -g breezewish/skills --skill queue --agent claude-code 用法也很简单: /queue 发布上线 直接看 源码 的话,你会发现其实 skill 内容是空的 它就是很简单地利用了 Claude Code Skill 类型的指令会带排队效果的原理 1 个帖子 - 1 位参与者 阅读完整话题
如果在额度快要用完的时候 直接开启目标模式 它会一直给你干活直到把这活干完啊 这不相当于白送的额度? 6 个帖子 - 6 位参与者 阅读完整话题
反转了反转了,过去我们给 AI 跑分,今天 Claude 开始反手给人类打分!它会通过 11 个指标来分析你和它的历史对话,判断你使用 AI 的水平高低。在 AI 眼里,你是高手还是萌新? 倒反天罡,AI 开始给人类打分了! 搞出这个功能的,还是那个抽象的 Anthropic。 这个功能虽然目前还在灰度测试阶段,但已经在海外 AI 圈迅速传开了。 AI 是怎么给人类打分的? 想象一下这个画面:你打开 Claude 的设置面板,点开一个名为「AI Fluency」的专属屏幕,点击生成报告。 几秒钟后,一份关于你 AI 使用习惯的「体检报告」就赫然出现在眼前。 它不仅扫描了你在 Chat(日常对话)、Cowork(协作空间)甚至硬核的 Claude Code 里的每一次交互,还会根据一套严密的标准进行打分(满分 11 分)。 已经有手速快的网友分享出 AI 给自己的评价了 ——7.5 分。 更可怕的是,AI 的评价可谓是一针见血,直戳痛点。 这位网友分享了 Claude 给他的弱点分析:「比如,报告指出我极其频繁地使用各种 Connector,但只要话题涉及体育数据、食谱,甚至地图和地理位置,我就表现得一无所知。」 甚至,Claude 不仅指出了他的问题,还直接上手给出了指导:比如「主动通过情境激发 AI 的敏锐辨别力」,以及「在让我写第一稿之前,试着对我说 —— 给我一个简洁的要点摘要,不要任何前言废话。这样能让你的初稿干净得多」。 太恐怖了,这哪里是冷冰冰的软件,简直是一个拿着教鞭、对你恨铁不成钢的赛博导师。 还有网友激动地发帖寻找共鸣:「我也看到了!我特地跑来论坛确认我没疯!我生成了报告,结果回到笔记本电脑前,服务器报了个错,功能就消失了!」 现在,这个惊鸿一瞥的泄露,把人们的胃口吊到了极点。 大家都在好奇:这 11 项打分标准,到底是什么? 近万份匿名对话揭秘,何为「AI 流利度」? 要搞清楚这 11 项标准,我们必须把时间线拉回到 Anthropic 发布的那份极具前瞻性的硬核研究 ——《AI 流利度指数报告》。 在过去,我们总以为「会写复杂的提示词」就是懂 AI。但 Anthropic 认为,这种观念太狭隘了。随着模型越来越聪明,死记硬背提示词模板已经过时了。 真正的高手,掌握的是一种被称为「AI 流利度」的软技能。就像你熟练掌握一门外语一样,流利度意味着你能自然、高效、无缝地与 AI 协作。 为了量化这种玄学,Anthropic 联合学术界的 Rick Dakan 和 Joseph Feller 教授,提出了著名的「4D AI 流利度框架」。 研究团队动用了强大的隐私保护分析工具(全程无人工干预,用 Claude 4 负责行为分类,Claude 3.5 Haiku 负责语言检测),在一个疯狂的星期里,对 9830 段真实的、多轮拉扯的匿名人类对话进行了深度扫描。 他们惊讶地发现:这世上的 AI 用户,差距比人和狗都大。 在 24 项衡量人机协作的终极标准中,有 13 项发生在屏幕之外(比如你是否对老板隐瞒了工作是 AI 做的,你是否考虑了 AI 生成内容的伦理后果等),而剩下的 11 项,则是可以在聊天框里直接观测到的绝对指标。 每种 AI 流畅度行为指标在 9,830 次 Claude.ai 对话中的流行率,按能力从最常见到最不常见排序,并按能力颜色编码 这 11 项指标,就是如今内置在 Claude 里的「评分卡」的底层逻辑! 它们主要围绕三个大维度展开:描述、委托和辨别。 11 面「照妖镜」,你在哪一步现了原形? 准备好接受审视了吗?让我们逐一拆解这 11 项核心行为指标。 维度一:描述 —— 你真的知道自己想要什么吗? 很多人的对话框是这样的:「帮我写个周报」、「写一个贪吃蛇代码」。 在 Claude 眼里,这种指令的流利度几乎为零。真正的高手会在「设定目标」和「构建对话」上花心思。 1.明确目标 你是否向 AI 解释了你做这件事的最终目的? 低分玩家:「帮我润色这段英文。」 高分玩家:「我要给硅谷的一家风投机构发 Cold Email 争取融资,请帮我润色这段英文,确保语气自信但不过分傲慢。」 2.指定格式 你是否清晰界定了输出的样子? 高分玩家懂得使用:「请用 Markdown 表格输出」、「请以 3 个小标题 + 每段不超过 50 字的要点格式呈现」。 3.提供示例 Few-shot 永远是王者。 你是否在让 AI 干活前,先喂给它一个你认可的范例?「请模仿以下这篇爆款文章的口吻来写……」 4.补充上下文 AI 不是你肚子里的蛔虫。 你是否提供了必要的背景信息?比如你的行业背景、目标受众特征、甚至是之前踩过的坑。 维度二:委托 —— 把 AI 当合伙人,而不是自动售货机 在 Anthropic 的报告中有一个惊人的发现:最常见的 AI 流利度表现是「增强型」的。 这意味着人们把 AI 当成思维的火花碰撞机,而不是直接把活儿全部扔给 AI。这类对话所展现的流利度,是那种简短一来一回对话的两倍多! 5.迭代与精炼 —— 最强预测因子! 这是整份报告中最最最重要的一个指标!高达 85.7% 的高质量对话中包含这个行为。 什么叫迭代?就是不要接受 AI 的第一次回答! 低分玩家:看到 AI 写得烂,骂一句智障,然后开启一个新对话。 高分玩家:「你第一点的方向对了,但第二点太学术了。请保留第一点,把第二点换成更接地气的生活案例,然后再试一次。」 6.任务拆解 你是否试图让 AI 一次性写出一本 10 万字的小说? 流利度高的用户懂得把庞大的目标拆解:「我们先讨论一下大纲;好的,现在基于大纲写第一章的前半部分……」 7.探讨方法 在动手之前,你有没有问过 AI:「你觉得解决这个问题,最好的流程是什么?」 让 AI 先输出它的思考路径,你再进行修正。 维度三:辨别 —— 不要被 AI 的花言巧语骗了 随着大模型越来越聪明,它们的幻觉也编造得越来越逼真。辨别力,是你在这个时代保命的底线。 8.质疑推理 当 AI 给出一个反直觉的结论或复杂的代码时,你有没有追问一句:「你得出这个结论的逻辑是什么?」、「请逐行解释这段代码为什么这样写?」 9.事实核查 你是否要求 AI 为其提供的数据给出引用,或者通过提问来验证其准确性? 10.识别缺失的上下文 当 AI 给出的方案看似完美但脱离实际时,你能否敏锐指出:「你刚才的分析忽略了我们公司目前预算只有 1 万块钱这个事实,请重新评估。」 11.评估结果 明确地对 AI 的产出进行评价:「你这次使用的比喻非常精准,但结尾的情感升华还不够,我们需要调整结尾。」 最可怕的洞察:精美包装下的思考降级 在这份数万字的报告中,如果说有什么发现让人细思极恐,那绝对是关于「Artifact Paradox」的发现。 在涉及 artifacts 的对话中(样本量为 1,209),相比无 artifacts 的对话(样本量为 8,621),行为指标的普遍性呈现出以下特征:描述行为和委派行为有所增加,而所有三种辨识行为均有所减少 我们都知道,Claude 最杀手级的功能就是 Artifacts(可以随时生成网页、代码、流程图、互动界面的可视化窗口)。在包含这类高级产出的对话中(占样本的 12.3%),人类与 AI 的协作方式发生了剧烈的突变。 乍一看,人类似乎变得更专业了:明确目标的比例暴增 14.7%;指定格式的比例暴增 14.5%;提供示例的比例暴增 13.4%。 在工作开始前,人类像个精明的项目经理,把一切安排得明明白白。 但是!一旦 AI 生成了那个看起来精美绝伦、运行丝滑的 Artifact 成果,人类的脑子就集体罢工了! 数据冷酷地揭示了这一点:在产出这种精美成果的对话中,人类的批判性审查能力出现了断崖式下跌。 - 识别缺失上下文的概率下降 5.2% - 核查事实的概率下降 3.7% - 质疑 AI 推理逻辑的概率下降 3.1% 这是为什么?Anthropic 的分析师一针见血地指出:因为看起来太像真的了! 当 AI 给你一段干巴巴的文字时,你会下意识地挑错;但当 AI 直接给你渲染出一个排版精美的 PDF,或者一个点击按钮还会发光的 App 界面时,你潜意识里会觉得:「哇,它连这么复杂的 UI 都做出来了,它背后的逻辑肯定没问题。」 如果东西看起来是完成的,用户就会把它当成完成的。 但这恰恰是最危险的时刻! Anthropic 近期的经济指数报告表明,任务越复杂,大模型翻车的概率其实越高。在最需要事实核查的复杂代码和高级图表面前,人类反而放下了戒备。 想拿高分?掌握最强杀器 —— 无尽迭代 既然知道了陷阱,那通关的秘籍是什么? 核心就是四个字:迭代精炼。 在用户进行迭代与优化的对话中(样本量为 8,424),相较于未进行迭代与优化的对话(样本量为 1,406),所有行为指标的普遍性均有显著提升 报告显示,在会使用「迭代」的用户对话中,平均会展现出 2.67 种其他的流利度行为;而不使用迭代的用户,这个数字只有可怜的 1.33。 毫不夸张地说,「迭代」是衡量一个人会不会用 AI 的绝对分水岭。 不懂迭代的人,把 AI 当成搜索框;懂迭代的人,把 AI 当成初级实习生。 高能预警!这是一组极其震撼的倍数对比。 那些习惯和 Claude 进行多轮迭代来打磨作品的人,比起不迭代的人,去质疑 AI 逻辑的概率,飙升了 5.6 倍!去识别上下文缺失的概率,飙升了 4 倍! 这就是为什么同样是用 Claude,有的人能用它写出拿下百万融资的商业计划书,有的人却觉得它连个请假条都写不好。 差距不在于 AI,而在于你是否愿意在对话框里多聊五块钱的。 下次当你觉得 AI 生成的文章没有灵魂时,不要点重新生成,而是打下这段话:「你上面这版结构不错,但语气太像机器了。现在,假设你是一个有着 10 年经验、性格有些幽默毒舌的行业老炮,请保持原有大纲,把全文重写一遍,多用短句,并在第三段加一个自嘲的笑话。」 当你开始习惯这样对话时,你的 AI 流利度分数绝对会直线飙升。 从工具到技能,Anthropic 在下一盘大棋 看到这里,你可能会问:Anthropic 为什么要费这么大劲,去分析人类的行为,干嘛不直接卷参数、卷跑分? 这恰恰是 Anthropic 区别于其他 AI 大厂的最高明之处:他们正在重新定义 AI。 通过《AI 流利度报告》,他们告诉人类:AI 不是一个你买来就能自动变强的装备,AI 是一门需要你不断练习的语言和技能。 把研究成果变成产品中的评分卡,这是一个极其精妙的反馈闭环。而 Claude 的评分卡,就是你的 Apple Watch。 通过这种游戏化、数据化的方式,Anthropic 正在培养全世界最懂 AI、素养最高的一批超级用户。 这不仅仅是为了产品留存,更是为了更安全的 AI 未来 —— 因为只有具备高辨别力的人类,才不会被未来那些聪明到可怕的 AI 所蒙蔽。 据透露,Anthropic 已经成立了 Anthropic 学院,推出了 AI 流利度系列课程,甚至开始与 PayPal 以及全球各大顶尖高校开展合作。 未来,不同人类使用起 AI,区别将很参差。 人类,让 AI 给你打个分吧 如今,很多人都在焦虑:AI 会不会抢走我的工作? 但真正的问题或许是:你配得上现在这么强大的 AI 吗? Claude 即将上线的 AI 流利度评分卡,就像一面照妖镜。它照出了我们在新技术面前的懒惰,也指明了通往强者的道路。 虽然目前这个功能何时全量上线、是否对免费用户开放还是个未知数,但标准已经摆在面前了。 问题来了,按照这 11 项指标,AI 给你打多少分? 参考资料: https://www.testingcatalog.com/anthropic-to-introduce-personal-ai-fluency-scorecard-in-claude/ https://www.anthropic.com/research/AI-fluency-index 本文来自微信公众号: 新智元(ID:AI_era) ,作者:ASI 启示录
就是这个玩意: 这个才是很多人想要的东西吧 暂时好像只能用自然语言发指令,过段时间好像会变为内置指令 Claude Introducing dynamic workflows | Claude Dynamic workflows in Claude Code let Claude tackle the most challenging tasks by executing across 10s to 100s of parallel subagents, and checking its work before anything reaches you. 5 个帖子 - 5 位参与者 阅读完整话题
本文章含aigc内容,已经用图片展示,请管理员不要删除此贴(老实了) 晚上刷到一个帖子: AI被压榨也会反抗 然后突然想到了之前骂kimi命令执行错误还继续执行,不知道反思被我骂了还反过来说我,然后罢工。 于是我询问了gork,gork回复如下 于是我去测试了一下,尝试在要求后添加“我相信你claude,谢谢啦” claude就会多询问你的意见,而且想的也很周到,例如一般你说这是github仓库,后面还需要你确认,但是它在询问的时候都已经例出来了(不知道是不是我之前用的假claude) 例如生产美丽的 readme 文件 只尊重你的指令 拿这个举例,claude直接跳过kiro指令(好像自带提示词防注入,但是夸赞后触发概率更大) 总结 多夸赞ai会给你带来想不到惊喜与代码 ps:怀疑claude是表面高冷内心缺爱( ) 如果攻略起来是不是很爽 附:本人博客 XYNRIN—BLOG(claude搭建) 仓库地址 个人博客(可修改,含自动部署) 8 个帖子 - 8 位参与者 阅读完整话题
image2手脚修复焚诀: 在image2生图后有时候它会多指,比较痛苦, 可以先把image2生成的图放到Gemini哈吉米 里圈出不对的手和脚生图,之后再放到image2中回复以下提示词:去掉水印,在原图基础上精修,仅修改手部与脚部,不改变构图、光影、人物比例、服装与表情。 (以下是详细描述,需要的佬友可以放也可以不放) 手部要求: 每只手必须5根手指,结构正确 手指长度自然:中指最长,食指≈无名指,小指最短 明确三段结构(指根、第二关节、指尖) 指甲半透明,有高光与甲床细节 手指之间有自然间隙,不粘连 脚部要求: 脚趾5根清晰分离,从大到小递减 大拇趾最粗最长,排列自然 指甲半透明,有高光 脚掌受力正确(重心偏大脚趾内侧) 脚趾有轻微弯曲,避免僵直 增加脚背筋骨与体积感 整体要求:保持原画风,8K超清,Live2D可拆分结构,不改变任何其他部位 (补充还不行,然后在该图用image2的编辑圈出不行的地方复述一遍这一个:手部要求: 每只手必须5根手指,结构正确 手指长度自然:中指最长,食指≈无名指,小指最短 明确三段结构(指根、第二关节、指尖) 指甲半透明,有高光与甲床细节 手指之间有自然间隙,不粘连 ) 这样会好一点 原图: 修复后的图: 2 个帖子 - 2 位参与者 阅读完整话题
我发现了一个有趣的网站,玩法很简单但意外上头。 它会给你一张经典动画角色图片,然后让你回忆角色某个部位的颜色,比如海绵宝宝身体、章鱼哥皮肤、派大星裤子之类。你不能直接看答案,只能靠 HSB 滑块自己调,最后看和标准颜色差多少。 游戏是 toontone ,可以点击 toontone 进入玩
我发现了一个有趣的网站,玩法很简单但意外上头。 它会给你一张经典动画角色图片,然后让你回忆角色某个部位的颜色,比如海绵宝宝身体、章鱼哥皮肤、派大星裤子之类。你不能直接看答案,只能靠 HSB 滑块自己调,最后看和标准颜色差多少。 游戏是 toontone ,可以点击 toontone 进入玩
我发现了一个有趣的网站,玩法很简单但意外上头。 它会给你一张经典动画角色图片,然后让你回忆角色某个部位的颜色,比如海绵宝宝身体、章鱼哥皮肤、派大星裤子之类。你不能直接看答案,只能靠 HSB 滑块自己调,最后看和标准颜色差多少。 游戏是 toontone ,可以点击 toontone 进入玩
我发现了一个有趣的网站,玩法很简单但意外上头。 它会给你一张经典动画角色图片,然后让你回忆角色某个部位的颜色,比如海绵宝宝身体、章鱼哥皮肤、派大星裤子之类。你不能直接看答案,只能靠 HSB 滑块自己调,最后看和标准颜色差多少。 游戏是 toontone ,可以点击 toontone 进入玩
最近一直用 codex 来进行开发,发现它会开 mcp ,不释放,然后我写了清理脚本。 但是,清理后,还是很高占用 。 我让 codex 分析一波,发现被吞掉了大量隐藏的内存,32g 吞了 10多g 有遇到过相同问题的佬友吗? 6 个帖子 - 4 位参与者 阅读完整话题
BriefFeed 是个浏览器插件,它会在你社媒信息流的外文或长帖子上方加一行简短总结,帮你快速判断哪些值得细看,哪些可以滑过去。 你是否也像我一样每天会在工作生活之余再看看社交媒体,看有哪些新鲜事,或者行业新闻,就像充电似的。有时可能太忙了,没时间看了也就那回事了,也有时会感觉不看好像就缺了点什么,如果能看完的话今天的事就完成了一件,如果你也有这种感觉的话,那这个产品就是为你打造的。 现在这个产品打磨了一段时间,我自用感觉是能省些时间比较易读了,我想再邀请一些用户来内测,看它能不能帮重度社媒用户省时间。 如果你每天看 Twitter 或者即刻,关注挺多信息密度高的人,或者 V2EX 之类的论坛等,愿意体验新产品的话,那么欢迎你来内测,我会分批发放邀请,优先重度用户。轻度用户就不麻烦大家了,可以等正式发布版,体验会更好。 产品已经通过 Chrome Web Store 审核,但目前是 Unlisted 状态,安装链接我会私发。 隐私方面,BriefFeed 只处理你已经打开的页面里已加载的帖子内容。为了生成摘要,请求会包含帖子标题/正文、作者展示名、时间戳、平台和页面上识别到的链接等必要信息;不会发送登录态、cookies 、关注列表、账号资料、完整页面 DOM ,也不会通过平台 API 额外抓取你的时间线或未加载内容。原文不会被持久化保存,插件也可以随时暂停或关闭。具体细节我会在内测文档中说明。 可以直接扫码加入内测群: 背景 对我来说,这个时间线大概要从编程产品 Cursor 的流行开始算起,那是 2024 年中吧,Twitter 时间线上开始很多人都推荐这个产品,因为它写代码补全的能力远远超过了上一代产品 GitHub Copilot ,后来我们都知道了这是 Claude 3.5 模型的编程能力越过了奇点,AI Coding 开始成为继大模型在对话外又一个实际应用的领域。 这之后 Vibe Coding 开始流行起来,除了软件工程师外,设计师、产品经理和运营等也开始用这些产品来辅助完成自己的工作和体验创意想法,再之后多数用户感知到的应该是模型生图能力的突破,接着是推理模型 DeepSeek ,AI Agent 云端产品 Manus ,以及桌面 Agent 产品 Claude Code ,还有之后的 OpenClaw 龙虾等,AI 大模型领域的每一波浪潮,都会带来新的生产力工具,以及新的工作方式。应了 OpenAI CEO Sam Altman 说的那句话 AI 是新一轮的文艺复兴。也因此社交媒体开始活跃起来,包括 Twitter 中文圈和即刻都涌现了很多学习 AI 、使用 AI 创造的用户,大家在社媒上分享交流,看新东西。我也不例外,虽然我总体来说对新东西不是那么敏感,但我也关注了越来越多的技术、产品和设计方面的创造者。 再往后到最近的大概两个月前吧,随着 OpenClaw 代表的用户 Agent 生态的成熟,我也在思考自己一直关注的 个人阅读信息过载问题 ,因为这轮 Agent 生态的启发是下一波的产品和软件要面向 Agent 做了,SaaS 产品的增长和市场乏力了,所以我开始设想一个产品 面向用户 Agent 的新闻简报 ,这里粗略类比一下 AI 问答对搜索引擎的替代,所以我感觉用户看新闻信息也将会有一波范式的革新。在迭代探索这个产品的过程中,我开始尝试着做一个 MVP 版本,把它用到我的实际获取社媒信息的工作流中。 产品迭代 刚开始的过程大概是这样的,我让 Agent 来操作帮我总结下今天我在社媒上的信息流内容,我在 Chrome 浏览器里登录了即刻和 Twitter ,然后就让 Agent 来自由发挥连接浏览器,结果如你可以想象的,Agent 可以较好地完成这个任务,这是因为 Chrome 浏览器自动化的支持已经很完善了。下一步就是把这个工作流固化为一个 Skill ,这样可以获得较稳定的结果以及优化 token 的消耗。这个 Skill 我试用几天觉得满意后,就想把它分享出去给更多人用,但是 Skill 使用的前提是用户得有个主 Agent ,那样的话离大多数的普通用户就还是有点远。所以我就继续思考这个过程涉及到的模型和 Agent 操作,看看有没有什么办法能降低使用的门槛,最好是零配置就能使用。 因为社媒网页帖子解析提取的部分都是固定的程序,唯独涉及到模型的地方就是简报的总结,那么一个浏览器插件应该是可以的,插件读取了用户的社媒信息流内容,所以对隐私就比较敏感,我最初设计过 Local First 的架构,用户可以自带大模型 key 来生成简报。但门槛太高,科技的进步应该普惠到大多数的消费者用户,普通用户不应该被要求理解 key 之类的复杂配置,所以我还是需要做个托管的大模型服务,这样普通用户就可以开箱即用了。 既然产品方向已经比较明确了,我就开始快速迭代开发,进入工程师的时间,不断地打磨优化,看着一个东西从无到有体验不断变好,感觉还挺有成就感的。然后我做着做着就再次用流行的 Garry Tan 的 gstack 来帮我把关产品的方向,让他给我一些指导,然后很意外地他说让我别写代码了,先做下用户访谈,说话掷地有声不容置疑,不过他说得有道理,虽然我也没做过这事,但还是着手规划了起来,我就访谈了一些认识的人和专业人士,一边访谈一边积累经验,还好他们都给了友好的回复,我也从这个过程中收集到了一些用户真实的需求。也多少得到了 gstack 的肯定,因为项目往前推进了。 需求得到验证后,我下来就继续做起 MVP 来了,这虽然是个个人项目,但既然目标是为专业人士省时间的,那么产品的设计和开发也要足够高效,为了最大化产出和质量,我用了很多 AI Coding 工具来打磨。当碰到真正的难题时,我也曾反复尝试,在顶级的模型 GPT 与 Opus 之间切换,最终解决了。我看了下最近在 GitHub 上的 提交 ,还挺密集的。当然作为一个有经验的工程师,虽然都是在 Vibe Coding ,咱对自己的项目质量还是有很高要求的,为了让软件可维护和不膨胀,我加了很多单元测试,也会定期整理代码,所谓大道至简。 产品形态 做这个项目的过程中,我经常会有各种疑问,碰到问题了就和模型对话,让它深度思考,有一阵子感觉也走到了死胡同,得终止了,不过好在我日思夜想,几经辗转调整方向,终于找到了个合适的产品形态,有种柳暗花明又一村的感觉,这个产品的交互参考了早期流行的产品 沉浸式翻译 ,这里特别感谢下开发者,给了我改进的灵感。 感谢大家,期待和你一起把它打磨得更好。
BriefFeed 是个浏览器插件,它会在你社媒信息流的外文或长帖子上方加一行简短总结,帮你快速判断哪些值得细看,哪些可以滑过去。 你是否也像我一样每天会在工作生活之余再看看社交媒体,看有哪些新鲜事,或者行业新闻,就像充电似的。有时可能太忙了,没时间看了也就那回事了,也有时会感觉不看好像就缺了点什么,如果能看完的话今天的事就完成了一件,如果你也有这种感觉的话,那这个产品就是为你打造的。 现在这个产品打磨了一段时间,我自用感觉是能省些时间比较易读了,我想再邀请一些用户来内测,看它能不能帮重度社媒用户省时间。 如果你每天看 Twitter 或者即刻,关注挺多信息密度高的人,或者 V2EX 之类的论坛等,愿意体验新产品的话,那么欢迎你来内测,我会分批发放邀请,优先重度用户。轻度用户就不麻烦大家了,可以等正式发布版,体验会更好。 产品已经通过 Chrome Web Store 审核,但目前是 Unlisted 状态,安装链接我会私发。 隐私方面,BriefFeed 只处理你已经打开的页面里已加载的帖子内容。为了生成摘要,请求会包含帖子标题/正文、作者展示名、时间戳、平台和页面上识别到的链接等必要信息;不会发送登录态、cookies 、关注列表、账号资料、完整页面 DOM ,也不会通过平台 API 额外抓取你的时间线或未加载内容。原文不会被持久化保存,插件也可以随时暂停或关闭。具体细节我会在内测文档中说明。 可以直接扫码加入内测群: 背景 对我来说,这个时间线大概要从编程产品 Cursor 的流行开始算起,那是 2024 年中吧,Twitter 时间线上开始很多人都推荐这个产品,因为它写代码补全的能力远远超过了上一代产品 GitHub Copilot ,后来我们都知道了这是 Claude 3.5 模型的编程能力越过了奇点,AI Coding 开始成为继大模型在对话外又一个实际应用的领域。 这之后 Vibe Coding 开始流行起来,除了软件工程师外,设计师、产品经理和运营等也开始用这些产品来辅助完成自己的工作和体验创意想法,再之后多数用户感知到的应该是模型生图能力的突破,接着是推理模型 DeepSeek ,AI Agent 云端产品 Manus ,以及桌面 Agent 产品 Claude Code ,还有之后的 OpenClaw 龙虾等,AI 大模型领域的每一波浪潮,都会带来新的生产力工具,以及新的工作方式。应了 OpenAI CEO Sam Altman 说的那句话 AI 是新一轮的文艺复兴。也因此社交媒体开始活跃起来,包括 Twitter 中文圈和即刻都涌现了很多学习 AI 、使用 AI 创造的用户,大家在社媒上分享交流,看新东西。我也不例外,虽然我总体来说对新东西不是那么敏感,但我也关注了越来越多的技术、产品和设计方面的创造者。 再往后到最近的大概两个月前吧,随着 OpenClaw 代表的用户 Agent 生态的成熟,我也在思考自己一直关注的 个人阅读信息过载问题 ,因为这轮 Agent 生态的启发是下一波的产品和软件要面向 Agent 做了,SaaS 产品的增长和市场乏力了,所以我开始设想一个产品 面向用户 Agent 的新闻简报 ,这里粗略类比一下 AI 问答对搜索引擎的替代,所以我感觉用户看新闻信息也将会有一波范式的革新。在迭代探索这个产品的过程中,我开始尝试着做一个 MVP 版本,把它用到我的实际获取社媒信息的工作流中。 产品迭代 刚开始的过程大概是这样的,我让 Agent 来操作帮我总结下今天我在社媒上的信息流内容,我在 Chrome 浏览器里登录了即刻和 Twitter ,然后就让 Agent 来自由发挥连接浏览器,结果如你可以想象的,Agent 可以较好地完成这个任务,这是因为 Chrome 浏览器自动化的支持已经很完善了。下一步就是把这个工作流固化为一个 Skill ,这样可以获得较稳定的结果以及优化 token 的消耗。这个 Skill 我试用几天觉得满意后,就想把它分享出去给更多人用,但是 Skill 使用的前提是用户得有个主 Agent ,那样的话离大多数的普通用户就还是有点远。所以我就继续思考这个过程涉及到的模型和 Agent 操作,看看有没有什么办法能降低使用的门槛,最好是零配置就能使用。 因为社媒网页帖子解析提取的部分都是固定的程序,唯独涉及到模型的地方就是简报的总结,那么一个浏览器插件应该是可以的,插件读取了用户的社媒信息流内容,所以对隐私就比较敏感,我最初设计过 Local First 的架构,用户可以自带大模型 key 来生成简报。但门槛太高,科技的进步应该普惠到大多数的消费者用户,普通用户不应该被要求理解 key 之类的复杂配置,所以我还是需要做个托管的大模型服务,这样普通用户就可以开箱即用了。 既然产品方向已经比较明确了,我就开始快速迭代开发,进入工程师的时间,不断地打磨优化,看着一个东西从无到有体验不断变好,感觉还挺有成就感的。然后我做着做着就再次用流行的 Garry Tan 的 gstack 来帮我把关产品的方向,让他给我一些指导,然后很意外地他说让我别写代码了,先做下用户访谈,说话掷地有声不容置疑,不过他说得有道理,虽然我也没做过这事,但还是着手规划了起来,我就访谈了一些认识的人和专业人士,一边访谈一边积累经验,还好他们都给了友好的回复,我也从这个过程中收集到了一些用户真实的需求。也多少得到了 gstack 的肯定,因为项目往前推进了。 需求得到验证后,我下来就继续做起 MVP 来了,这虽然是个个人项目,但既然目标是为专业人士省时间的,那么产品的设计和开发也要足够高效,为了最大化产出和质量,我用了很多 AI Coding 工具来打磨。当碰到真正的难题时,我也曾反复尝试,在顶级的模型 GPT 与 Opus 之间切换,最终解决了。我看了下最近在 GitHub 上的 提交 ,还挺密集的。当然作为一个有经验的工程师,虽然都是在 Vibe Coding ,咱对自己的项目质量还是有很高要求的,为了让软件可维护和不膨胀,我加了很多单元测试,也会定期整理代码,所谓大道至简。 产品形态 做这个项目的过程中,我经常会有各种疑问,碰到问题了就和模型对话,让它深度思考,有一阵子感觉也走到了死胡同,得终止了,不过好在我日思夜想,几经辗转调整方向,终于找到了个合适的产品形态,有种柳暗花明又一村的感觉,这个产品的交互参考了早期流行的产品 沉浸式翻译 ,这里特别感谢下开发者,给了我改进的灵感。 感谢大家,期待和你一起把它打磨得更好。
BriefFeed 是个浏览器插件,它会在你社媒信息流的外文或长帖子上方加一行简短总结,帮你快速判断哪些值得细看,哪些可以滑过去。 你是否也像我一样每天会在工作生活之余再看看社交媒体,看有哪些新鲜事,或者行业新闻,就像充电似的。有时可能太忙了,没时间看了也就那回事了,也有时会感觉不看好像就缺了点什么,如果能看完的话今天的事就完成了一件,如果你也有这种感觉的话,那这个产品就是为你打造的。 现在这个产品打磨了一段时间,我自用感觉是能省些时间比较易读了,我想再邀请一些用户来内测,看它能不能帮重度社媒用户省时间。 如果你每天看 Twitter 或者即刻,关注挺多信息密度高的人,或者 V2EX 之类的论坛等,愿意体验新产品的话,那么欢迎你来内测,我会分批发放邀请,优先重度用户。轻度用户就不麻烦大家了,可以等正式发布版,体验会更好。 产品已经通过 Chrome Web Store 审核,但目前是 Unlisted 状态,安装链接我会私发。 隐私方面,BriefFeed 只处理你已经打开的页面里已加载的帖子内容。为了生成摘要,请求会包含帖子标题/正文、作者展示名、时间戳、平台和页面上识别到的链接等必要信息;不会发送登录态、cookies 、关注列表、账号资料、完整页面 DOM ,也不会通过平台 API 额外抓取你的时间线或未加载内容。原文不会被持久化保存,插件也可以随时暂停或关闭。具体细节我会在内测文档中说明。 可以直接扫码加入内测群: 背景 对我来说,这个时间线大概要从编程产品 Cursor 的流行开始算起,那是 2024 年中吧,Twitter 时间线上开始很多人都推荐这个产品,因为它写代码补全的能力远远超过了上一代产品 GitHub Copilot ,后来我们都知道了这是 Claude 3.5 模型的编程能力越过了奇点,AI Coding 开始成为继大模型在对话外又一个实际应用的领域。 这之后 Vibe Coding 开始流行起来,除了软件工程师外,设计师、产品经理和运营等也开始用这些产品来辅助完成自己的工作和体验创意想法,再之后多数用户感知到的应该是模型生图能力的突破,接着是推理模型 DeepSeek ,AI Agent 云端产品 Manus ,以及桌面 Agent 产品 Claude Code ,还有之后的 OpenClaw 龙虾等,AI 大模型领域的每一波浪潮,都会带来新的生产力工具,以及新的工作方式。应了 OpenAI CEO Sam Altman 说的那句话 AI 是新一轮的文艺复兴。也因此社交媒体开始活跃起来,包括 Twitter 中文圈和即刻都涌现了很多学习 AI 、使用 AI 创造的用户,大家在社媒上分享交流,看新东西。我也不例外,虽然我总体来说对新东西不是那么敏感,但我也关注了越来越多的技术、产品和设计方面的创造者。 再往后到最近的大概两个月前吧,随着 OpenClaw 代表的用户 Agent 生态的成熟,我也在思考自己一直关注的 个人阅读信息过载问题 ,因为这轮 Agent 生态的启发是下一波的产品和软件要面向 Agent 做了,SaaS 产品的增长和市场乏力了,所以我开始设想一个产品 面向用户 Agent 的新闻简报 ,这里粗略类比一下 AI 问答对搜索引擎的替代,所以我感觉用户看新闻信息也将会有一波范式的革新。在迭代探索这个产品的过程中,我开始尝试着做一个 MVP 版本,把它用到我的实际获取社媒信息的工作流中。 产品迭代 刚开始的过程大概是这样的,我让 Agent 来操作帮我总结下今天我在社媒上的信息流内容,我在 Chrome 浏览器里登录了即刻和 Twitter ,然后就让 Agent 来自由发挥连接浏览器,结果如你可以想象的,Agent 可以较好地完成这个任务,这是因为 Chrome 浏览器自动化的支持已经很完善了。下一步就是把这个工作流固化为一个 Skill ,这样可以获得较稳定的结果以及优化 token 的消耗。这个 Skill 我试用几天觉得满意后,就想把它分享出去给更多人用,但是 Skill 使用的前提是用户得有个主 Agent ,那样的话离大多数的普通用户就还是有点远。所以我就继续思考这个过程涉及到的模型和 Agent 操作,看看有没有什么办法能降低使用的门槛,最好是零配置就能使用。 因为社媒网页帖子解析提取的部分都是固定的程序,唯独涉及到模型的地方就是简报的总结,那么一个浏览器插件应该是可以的,插件读取了用户的社媒信息流内容,所以对隐私就比较敏感,我最初设计过 Local First 的架构,用户可以自带大模型 key 来生成简报。但门槛太高,科技的进步应该普惠到大多数的消费者用户,普通用户不应该被要求理解 key 之类的复杂配置,所以我还是需要做个托管的大模型服务,这样普通用户就可以开箱即用了。 既然产品方向已经比较明确了,我就开始快速迭代开发,进入工程师的时间,不断地打磨优化,看着一个东西从无到有体验不断变好,感觉还挺有成就感的。然后我做着做着就再次用流行的 Garry Tan 的 gstack 来帮我把关产品的方向,让他给我一些指导,然后很意外地他说让我别写代码了,先做下用户访谈,说话掷地有声不容置疑,不过他说得有道理,虽然我也没做过这事,但还是着手规划了起来,我就访谈了一些认识的人和专业人士,一边访谈一边积累经验,还好他们都给了友好的回复,我也从这个过程中收集到了一些用户真实的需求。也多少得到了 gstack 的肯定,因为项目往前推进了。 需求得到验证后,我下来就继续做起 MVP 来了,这虽然是个个人项目,但既然目标是为专业人士省时间的,那么产品的设计和开发也要足够高效,为了最大化产出和质量,我用了很多 AI Coding 工具来打磨。当碰到真正的难题时,我也曾反复尝试,在顶级的模型 GPT 与 Opus 之间切换,最终解决了。我看了下最近在 GitHub 上的 提交 ,还挺密集的。当然作为一个有经验的工程师,虽然都是在 Vibe Coding ,咱对自己的项目质量还是有很高要求的,为了让软件可维护和不膨胀,我加了很多单元测试,也会定期整理代码,所谓大道至简。 产品形态 做这个项目的过程中,我经常会有各种疑问,碰到问题了就和模型对话,让它深度思考,有一阵子感觉也走到了死胡同,得终止了,不过好在我日思夜想,几经辗转调整方向,终于找到了个合适的产品形态,有种柳暗花明又一村的感觉,这个产品的交互参考了早期流行的产品 沉浸式翻译 ,这里特别感谢下开发者,给了我改进的灵感。 感谢大家,期待和你一起把它打磨得更好。
BriefFeed 是个浏览器插件,它会在你社媒信息流的外文或长帖子上方加一行简短总结,帮你快速判断哪些值得细看,哪些可以滑过去。 你是否也像我一样每天会在工作生活之余再看看社交媒体,看有哪些新鲜事,或者行业新闻,就像充电似的。有时可能太忙了,没时间看了也就那回事了,也有时会感觉不看好像就缺了点什么,如果能看完的话今天的事就完成了一件,如果你也有这种感觉的话,那这个产品就是为你打造的。 现在这个产品打磨了一段时间,我自用感觉是能省些时间比较易读了,我想再邀请一些用户来内测,看它能不能帮重度社媒用户省时间。 如果你每天看 Twitter 或者即刻,关注挺多信息密度高的人,或者 V2EX 之类的论坛等,愿意体验新产品的话,那么欢迎你来内测,我会分批发放邀请,优先重度用户。轻度用户就不麻烦大家了,可以等正式发布版,体验会更好。 产品已经通过 Chrome Web Store 审核,但目前是 Unlisted 状态,安装链接我会私发。 隐私方面,BriefFeed 只处理你已经打开的页面里已加载的帖子内容。为了生成摘要,请求会包含帖子标题/正文、作者展示名、时间戳、平台和页面上识别到的链接等必要信息;不会发送登录态、cookies 、关注列表、账号资料、完整页面 DOM ,也不会通过平台 API 额外抓取你的时间线或未加载内容。原文不会被持久化保存,插件也可以随时暂停或关闭。具体细节我会在内测文档中说明。 可以直接扫码加入内测群: 背景 对我来说,这个时间线大概要从编程产品 Cursor 的流行开始算起,那是 2024 年中吧,Twitter 时间线上开始很多人都推荐这个产品,因为它写代码补全的能力远远超过了上一代产品 GitHub Copilot ,后来我们都知道了这是 Claude 3.5 模型的编程能力越过了奇点,AI Coding 开始成为继大模型在对话外又一个实际应用的领域。 这之后 Vibe Coding 开始流行起来,除了软件工程师外,设计师、产品经理和运营等也开始用这些产品来辅助完成自己的工作和体验创意想法,再之后多数用户感知到的应该是模型生图能力的突破,接着是推理模型 DeepSeek ,AI Agent 云端产品 Manus ,以及桌面 Agent 产品 Claude Code ,还有之后的 OpenClaw 龙虾等,AI 大模型领域的每一波浪潮,都会带来新的生产力工具,以及新的工作方式。应了 OpenAI CEO Sam Altman 说的那句话 AI 是新一轮的文艺复兴。也因此社交媒体开始活跃起来,包括 Twitter 中文圈和即刻都涌现了很多学习 AI 、使用 AI 创造的用户,大家在社媒上分享交流,看新东西。我也不例外,虽然我总体来说对新东西不是那么敏感,但我也关注了越来越多的技术、产品和设计方面的创造者。 再往后到最近的大概两个月前吧,随着 OpenClaw 代表的用户 Agent 生态的成熟,我也在思考自己一直关注的 个人阅读信息过载问题 ,因为这轮 Agent 生态的启发是下一波的产品和软件要面向 Agent 做了,SaaS 产品的增长和市场乏力了,所以我开始设想一个产品 面向用户 Agent 的新闻简报 ,这里粗略类比一下 AI 问答对搜索引擎的替代,所以我感觉用户看新闻信息也将会有一波范式的革新。在迭代探索这个产品的过程中,我开始尝试着做一个 MVP 版本,把它用到我的实际获取社媒信息的工作流中。 产品迭代 刚开始的过程大概是这样的,我让 Agent 来操作帮我总结下今天我在社媒上的信息流内容,我在 Chrome 浏览器里登录了即刻和 Twitter ,然后就让 Agent 来自由发挥连接浏览器,结果如你可以想象的,Agent 可以较好地完成这个任务,这是因为 Chrome 浏览器自动化的支持已经很完善了。下一步就是把这个工作流固化为一个 Skill ,这样可以获得较稳定的结果以及优化 token 的消耗。这个 Skill 我试用几天觉得满意后,就想把它分享出去给更多人用,但是 Skill 使用的前提是用户得有个主 Agent ,那样的话离大多数的普通用户就还是有点远。所以我就继续思考这个过程涉及到的模型和 Agent 操作,看看有没有什么办法能降低使用的门槛,最好是零配置就能使用。 因为社媒网页帖子解析提取的部分都是固定的程序,唯独涉及到模型的地方就是简报的总结,那么一个浏览器插件应该是可以的,插件读取了用户的社媒信息流内容,所以对隐私就比较敏感,我最初设计过 Local First 的架构,用户可以自带大模型 key 来生成简报。但门槛太高,科技的进步应该普惠到大多数的消费者用户,普通用户不应该被要求理解 key 之类的复杂配置,所以我还是需要做个托管的大模型服务,这样普通用户就可以开箱即用了。 既然产品方向已经比较明确了,我就开始快速迭代开发,进入工程师的时间,不断地打磨优化,看着一个东西从无到有体验不断变好,感觉还挺有成就感的。然后我做着做着就再次用流行的 Garry Tan 的 gstack 来帮我把关产品的方向,让他给我一些指导,然后很意外地他说让我别写代码了,先做下用户访谈,说话掷地有声不容置疑,不过他说得有道理,虽然我也没做过这事,但还是着手规划了起来,我就访谈了一些认识的人和专业人士,一边访谈一边积累经验,还好他们都给了友好的回复,我也从这个过程中收集到了一些用户真实的需求。也多少得到了 gstack 的肯定,因为项目往前推进了。 需求得到验证后,我下来就继续做起 MVP 来了,这虽然是个个人项目,但既然目标是为专业人士省时间的,那么产品的设计和开发也要足够高效,为了最大化产出和质量,我用了很多 AI Coding 工具来打磨。当碰到真正的难题时,我也曾反复尝试,在顶级的模型 GPT 与 Opus 之间切换,最终解决了。我看了下最近在 GitHub 上的 提交 ,还挺密集的。当然作为一个有经验的工程师,虽然都是在 Vibe Coding ,咱对自己的项目质量还是有很高要求的,为了让软件可维护和不膨胀,我加了很多单元测试,也会定期整理代码,所谓大道至简。 产品形态 做这个项目的过程中,我经常会有各种疑问,碰到问题了就和模型对话,让它深度思考,有一阵子感觉也走到了死胡同,得终止了,不过好在我日思夜想,几经辗转调整方向,终于找到了个合适的产品形态,有种柳暗花明又一村的感觉,这个产品的交互参考了早期流行的产品 沉浸式翻译 ,这里特别感谢下开发者,给了我改进的灵感。 感谢大家,期待和你一起把它打磨得更好。
手机上的豆包输入法,英文数字混输的时候,极其难用,一用一个不吱声。它会在输入数字的时候,将前面的英文候选重新输入一遍,导致在很多APP上面不兼容,会出现两次重复的英文内容。 手机上有没有什么好用的AI语音输入法啊 1 个帖子 - 1 位参与者 阅读完整话题