最近我给自己搭了一套自动化流程:每天追踪 AI / CS 方向的新论文和 GitHub Trending 热门项目,然后自动筛选、整理、生成中文摘要,最后沉淀成日报。 这套系统的目标很简单: 不再靠手动刷 arXiv 、GitHub Trending 、Twitter/X 和各种群消息来追前沿,而是让 AI Agent 每天帮我完成第一轮信息筛选。 我用的是 OpenClaw ,主要让它承担三件事: 定时抓取 arXiv 最新论文和 GitHub 热门项目; 按主题、质量和工程价值做过滤; 自动生成中文摘要、深度解读和每日归档。 这篇文章简单分享一下系统是怎么搭的,以及目前踩到的一些坑。 1. 为什么要做这套东西? 如果你关注 AI 工程化,信息源会非常碎: arXiv 每天都有大量新论文; GitHub Trending 每天都有新项目冒出来; Hugging Face 、OpenAI 、Anthropic 、Google 、Meta 、微软等团队会不定期发布模型、框架或技术报告; 很多有价值的项目不是一开始就爆火,而是在小范围技术圈里先出现。 手动追踪的问题是: 很容易漏掉重要论文; GitHub Trending 噪声很大,很多项目只是短期热闹; 标题和 README 经常看起来很强,但实际工程价值一般; 每天都刷一遍非常耗时间。 所以我想做一个自动化系统,先让 Agent 帮我做“第一轮粗筛”,把候选论文和项目整理出来,再对其中高价值内容做中文精读。 2. 整体架构 目前流程大概是这样: 定时任务 / Cron ↓ 数据源抓取 ├── arXiv API ├── GitHub Trending / GitHub API └── 其他公开信息源 ↓ 候选池入库 ↓ 规则过滤 + 去重 ↓ Agent 精读 / 摘要生成 ↓ Markdown / JSON / SQLite 归档 ↓ 公众号草稿 / GitHub 日报 / 后续分发 核心不是“抓取”,抓取其实不难。真正麻烦的是: 怎么过滤垃圾信息; 怎么避免每天重复写同一个方向; 怎么判断一个项目是不是真的值得看; 怎么让生成内容尽量可验证,而不是 AI 胡编。 3. 论文部分:从 arXiv 候选到中文精读 论文侧主要关注这些方向: RAG / Retrieval-Augmented Generation Search / Information Retrieval Agent / Tool Use / Function Calling Long Context Evaluation / Benchmark LLM Application Engineering Knowledge Base / Re-ranking / Query Understanding 数据源主要是 arXiv API ,例如: cs.AI cs.CL cs.IR cs.LG cs.CV 中和多模态检索、文档理解相关的部分 每篇论文进入候选池后,会先做基础解析: 标题 作者 arXiv ID 摘要 分类 发布时间 PDF 链接 关键词 然后做几层过滤: 主题相关性 :是否和 AI 工程化、RAG 、搜索、Agent 等方向有关; 新鲜度 :优先最近 1 个月,越新越优先; 机构/作者可信度 :顶级实验室、大厂、知名高校会加权,但不绝对迷信; 工程价值 :有没有方法、框架、评测或实践启发; 重复度 :是否和之前已经写过的主题过于接近。 通过过滤后,Agent 会读取论文摘要、PDF 或 HTML 版本,生成结构化产物: paper_slot/ deep_read_article.md deep_read_meta.json sources.md evidence-notes.md seo-title.json 我比较看重 sources.md 和 evidence-notes.md ,因为 AI 写论文解读很容易“看标题发挥”。所以每篇文章都需要保留来源、证据和不确定点。 4. GitHub 部分:不只看 Star ,更看工程价值 GitHub Trending 的噪声非常大。 有些项目一天几千 Star ,但可能只是: 一个简单 UI 壳子; 复刻已有项目; README 写得很夸张; Demo 很漂亮,但代码不可复用; Star 暴涨,但最近维护质量一般。 所以我没有只按 Star 排序,而是做了几个维度: Star 总数; 最近增长速度; 最近 commit 活跃度; README 是否清晰; 是否有真实代码结构; 是否有 license ; 是否有 release / examples / docs ; 是否和 RAG 、Agent 、搜索、LLM 应用工程相关; 是否解决真实工程痛点。 一个项目进入精读流程前,至少要检查: repo_slot/ repo-evidence.json readme.md key-files.md sources.md deep_read_article.md seo-title.json 我希望最后生成的不是“这个项目很厉害,大家快去看”的营销文,而是能回答几个问题: 它解决了什么问题? 它和已有方案相比有什么不同? 它的架构或实现有什么可复用点? 它现在成熟吗?适不适合生产使用? 如果我要试用,第一步应该看哪里? 5. 为什么用 OpenClaw ? 我需要的不是单次 ChatGPT 问答,而是一个能长期运行的个人自动化 Agent 。 OpenClaw 对我比较有用的点: 可以读写本地工作区文件; 可以跑脚本、定时任务; 可以维护长期记忆和每日日志; 可以把流程拆给多个子 Agent ; 可以把产物写成 Markdown / JSON / SQLite ; 可以接入公众号草稿、Discord 、QQ 等通知渠道。 换句话说,它更像一个“能干活的个人自动化工作台”,而不是只会聊天的模型。 当然,最重要的是:所有自动生成内容都要有检查门禁。比如: 没有来源链接不能进正式稿; 没读 primary source 不能写深度解读; 不能出现“待补充”“TODO”“正式发布前请检查”这类占位词; 标题不能为了吸引点击而歪曲论文或项目本意; GitHub 项目不能把 README 里的宣传语直接当事实。 6. 目前的每日输出 现在我的目标是每天产出两类内容: 论文精读 :偏研究方法、技术路线、评测和启发; GitHub 项目精读 :偏架构、代码、工程价值和可落地性。 每日内容会先进入本地归档,再进入公众号草稿箱,最后人工检查后发布。 我也准备把其中一部分公开成 GitHub 仓库,作为每日 AI 论文和 GitHub Trending 的中文索引: 每日论文列表; 每日热门项目列表; 中文简介; 原始链接; 主题标签; 后续可能补充脚本。 完整版的深度解读会继续放在公众号里。 7. 踩过的一些坑 7.1 不要只追热点 GitHub Trending 很容易让人被短期 Star 牵着走。后来我加了“工程价值”和“主题相关性”的过滤,否则日报会变成项目搬运。 7.2 AI 很容易把摘要写成鸡汤 如果 prompt 不约束,论文解读很容易变成: 本文提出了一种创新方法,显著提升了性能,具有重要意义。 这种话基本没信息量。 所以我现在要求每篇都必须回答: 方法具体是什么; 输入输出是什么; 对比基线是什么; 适用边界是什么; 工程上能学到什么。 7.3 需要保留证据文件 自动化写作最怕“看起来很完整,但来源不可查”。 所以每个 slot 都会保留来源文件,例如: arXiv 链接; PDF 链接; GitHub repo 链接; README 摘要; 关键文件路径; 生成时的判断理由。 这样后面出了问题可以回溯。 7.4 公众号不是终点,归档和分发更重要 如果内容只存在公众号里,后续搜索和复用都不方便。 所以我会同时保留: Markdown 版本; JSON 元数据; SQLite 主账本; GitHub 公开索引; 后续可能加网页展示。 8. 后续计划 接下来我想继续做几件事: 开源每日论文和 GitHub Trending 中文索引仓库; 加入更细的主题分类,比如 RAG 、Agent 、Search 、Evaluation ; 对高价值论文做系列化追踪; 对 GitHub 项目增加“可运行性”和“维护质量”评分; 把日报沉淀成一个可搜索的 AI 工程知识库。 如果你也在做类似的论文追踪、GitHub Trending 筛选、AI 技术日报,欢迎交流。 我会把完整的中文精读和每日筛选结果放在公众号「 AltenAI 观察」。 最后放一句软广:如果你关心 RAG 、搜索、Agent 、API 接入和大模型工程化落地,可以关注一下「 AltenAI 观察」。我会持续把每天筛出来的论文和项目做成中文摘要和工程解读。 也把文章放在了 github: https://github.com/AltenLi/daily-paper-github-trends
最近我给自己搭了一套自动化流程:每天追踪 AI / CS 方向的新论文和 GitHub Trending 热门项目,然后自动筛选、整理、生成中文摘要,最后沉淀成日报。 这套系统的目标很简单: 不再靠手动刷 arXiv 、GitHub Trending 、Twitter/X 和各种群消息来追前沿,而是让 AI Agent 每天帮我完成第一轮信息筛选。 我用的是 OpenClaw ,主要让它承担三件事: 定时抓取 arXiv 最新论文和 GitHub 热门项目; 按主题、质量和工程价值做过滤; 自动生成中文摘要、深度解读和每日归档。 这篇文章简单分享一下系统是怎么搭的,以及目前踩到的一些坑。 1. 为什么要做这套东西? 如果你关注 AI 工程化,信息源会非常碎: arXiv 每天都有大量新论文; GitHub Trending 每天都有新项目冒出来; Hugging Face 、OpenAI 、Anthropic 、Google 、Meta 、微软等团队会不定期发布模型、框架或技术报告; 很多有价值的项目不是一开始就爆火,而是在小范围技术圈里先出现。 手动追踪的问题是: 很容易漏掉重要论文; GitHub Trending 噪声很大,很多项目只是短期热闹; 标题和 README 经常看起来很强,但实际工程价值一般; 每天都刷一遍非常耗时间。 所以我想做一个自动化系统,先让 Agent 帮我做“第一轮粗筛”,把候选论文和项目整理出来,再对其中高价值内容做中文精读。 2. 整体架构 目前流程大概是这样: 定时任务 / Cron ↓ 数据源抓取 ├── arXiv API ├── GitHub Trending / GitHub API └── 其他公开信息源 ↓ 候选池入库 ↓ 规则过滤 + 去重 ↓ Agent 精读 / 摘要生成 ↓ Markdown / JSON / SQLite 归档 ↓ 公众号草稿 / GitHub 日报 / 后续分发 核心不是“抓取”,抓取其实不难。真正麻烦的是: 怎么过滤垃圾信息; 怎么避免每天重复写同一个方向; 怎么判断一个项目是不是真的值得看; 怎么让生成内容尽量可验证,而不是 AI 胡编。 3. 论文部分:从 arXiv 候选到中文精读 论文侧主要关注这些方向: RAG / Retrieval-Augmented Generation Search / Information Retrieval Agent / Tool Use / Function Calling Long Context Evaluation / Benchmark LLM Application Engineering Knowledge Base / Re-ranking / Query Understanding 数据源主要是 arXiv API ,例如: cs.AI cs.CL cs.IR cs.LG cs.CV 中和多模态检索、文档理解相关的部分 每篇论文进入候选池后,会先做基础解析: 标题 作者 arXiv ID 摘要 分类 发布时间 PDF 链接 关键词 然后做几层过滤: 主题相关性 :是否和 AI 工程化、RAG 、搜索、Agent 等方向有关; 新鲜度 :优先最近 1 个月,越新越优先; 机构/作者可信度 :顶级实验室、大厂、知名高校会加权,但不绝对迷信; 工程价值 :有没有方法、框架、评测或实践启发; 重复度 :是否和之前已经写过的主题过于接近。 通过过滤后,Agent 会读取论文摘要、PDF 或 HTML 版本,生成结构化产物: paper_slot/ deep_read_article.md deep_read_meta.json sources.md evidence-notes.md seo-title.json 我比较看重 sources.md 和 evidence-notes.md ,因为 AI 写论文解读很容易“看标题发挥”。所以每篇文章都需要保留来源、证据和不确定点。 4. GitHub 部分:不只看 Star ,更看工程价值 GitHub Trending 的噪声非常大。 有些项目一天几千 Star ,但可能只是: 一个简单 UI 壳子; 复刻已有项目; README 写得很夸张; Demo 很漂亮,但代码不可复用; Star 暴涨,但最近维护质量一般。 所以我没有只按 Star 排序,而是做了几个维度: Star 总数; 最近增长速度; 最近 commit 活跃度; README 是否清晰; 是否有真实代码结构; 是否有 license ; 是否有 release / examples / docs ; 是否和 RAG 、Agent 、搜索、LLM 应用工程相关; 是否解决真实工程痛点。 一个项目进入精读流程前,至少要检查: repo_slot/ repo-evidence.json readme.md key-files.md sources.md deep_read_article.md seo-title.json 我希望最后生成的不是“这个项目很厉害,大家快去看”的营销文,而是能回答几个问题: 它解决了什么问题? 它和已有方案相比有什么不同? 它的架构或实现有什么可复用点? 它现在成熟吗?适不适合生产使用? 如果我要试用,第一步应该看哪里? 5. 为什么用 OpenClaw ? 我需要的不是单次 ChatGPT 问答,而是一个能长期运行的个人自动化 Agent 。 OpenClaw 对我比较有用的点: 可以读写本地工作区文件; 可以跑脚本、定时任务; 可以维护长期记忆和每日日志; 可以把流程拆给多个子 Agent ; 可以把产物写成 Markdown / JSON / SQLite ; 可以接入公众号草稿、Discord 、QQ 等通知渠道。 换句话说,它更像一个“能干活的个人自动化工作台”,而不是只会聊天的模型。 当然,最重要的是:所有自动生成内容都要有检查门禁。比如: 没有来源链接不能进正式稿; 没读 primary source 不能写深度解读; 不能出现“待补充”“TODO”“正式发布前请检查”这类占位词; 标题不能为了吸引点击而歪曲论文或项目本意; GitHub 项目不能把 README 里的宣传语直接当事实。 6. 目前的每日输出 现在我的目标是每天产出两类内容: 论文精读 :偏研究方法、技术路线、评测和启发; GitHub 项目精读 :偏架构、代码、工程价值和可落地性。 每日内容会先进入本地归档,再进入公众号草稿箱,最后人工检查后发布。 我也准备把其中一部分公开成 GitHub 仓库,作为每日 AI 论文和 GitHub Trending 的中文索引: 每日论文列表; 每日热门项目列表; 中文简介; 原始链接; 主题标签; 后续可能补充脚本。 完整版的深度解读会继续放在公众号里。 7. 踩过的一些坑 7.1 不要只追热点 GitHub Trending 很容易让人被短期 Star 牵着走。后来我加了“工程价值”和“主题相关性”的过滤,否则日报会变成项目搬运。 7.2 AI 很容易把摘要写成鸡汤 如果 prompt 不约束,论文解读很容易变成: 本文提出了一种创新方法,显著提升了性能,具有重要意义。 这种话基本没信息量。 所以我现在要求每篇都必须回答: 方法具体是什么; 输入输出是什么; 对比基线是什么; 适用边界是什么; 工程上能学到什么。 7.3 需要保留证据文件 自动化写作最怕“看起来很完整,但来源不可查”。 所以每个 slot 都会保留来源文件,例如: arXiv 链接; PDF 链接; GitHub repo 链接; README 摘要; 关键文件路径; 生成时的判断理由。 这样后面出了问题可以回溯。 7.4 公众号不是终点,归档和分发更重要 如果内容只存在公众号里,后续搜索和复用都不方便。 所以我会同时保留: Markdown 版本; JSON 元数据; SQLite 主账本; GitHub 公开索引; 后续可能加网页展示。 8. 后续计划 接下来我想继续做几件事: 开源每日论文和 GitHub Trending 中文索引仓库; 加入更细的主题分类,比如 RAG 、Agent 、Search 、Evaluation ; 对高价值论文做系列化追踪; 对 GitHub 项目增加“可运行性”和“维护质量”评分; 把日报沉淀成一个可搜索的 AI 工程知识库。 如果你也在做类似的论文追踪、GitHub Trending 筛选、AI 技术日报,欢迎交流。 我会把完整的中文精读和每日筛选结果放在公众号「 AltenAI 观察」。 最后放一句软广:如果你关心 RAG 、搜索、Agent 、API 接入和大模型工程化落地,可以关注一下「 AltenAI 观察」。我会持续把每天筛出来的论文和项目做成中文摘要和工程解读。 也把文章放在了 github: https://github.com/AltenLi/daily-paper-github-trends
最近我给自己搭了一套自动化流程:每天追踪 AI / CS 方向的新论文和 GitHub Trending 热门项目,然后自动筛选、整理、生成中文摘要,最后沉淀成日报。 这套系统的目标很简单: 不再靠手动刷 arXiv 、GitHub Trending 、Twitter/X 和各种群消息来追前沿,而是让 AI Agent 每天帮我完成第一轮信息筛选。 我用的是 OpenClaw ,主要让它承担三件事: 定时抓取 arXiv 最新论文和 GitHub 热门项目; 按主题、质量和工程价值做过滤; 自动生成中文摘要、深度解读和每日归档。 这篇文章简单分享一下系统是怎么搭的,以及目前踩到的一些坑。 1. 为什么要做这套东西? 如果你关注 AI 工程化,信息源会非常碎: arXiv 每天都有大量新论文; GitHub Trending 每天都有新项目冒出来; Hugging Face 、OpenAI 、Anthropic 、Google 、Meta 、微软等团队会不定期发布模型、框架或技术报告; 很多有价值的项目不是一开始就爆火,而是在小范围技术圈里先出现。 手动追踪的问题是: 很容易漏掉重要论文; GitHub Trending 噪声很大,很多项目只是短期热闹; 标题和 README 经常看起来很强,但实际工程价值一般; 每天都刷一遍非常耗时间。 所以我想做一个自动化系统,先让 Agent 帮我做“第一轮粗筛”,把候选论文和项目整理出来,再对其中高价值内容做中文精读。 2. 整体架构 目前流程大概是这样: 定时任务 / Cron ↓ 数据源抓取 ├── arXiv API ├── GitHub Trending / GitHub API └── 其他公开信息源 ↓ 候选池入库 ↓ 规则过滤 + 去重 ↓ Agent 精读 / 摘要生成 ↓ Markdown / JSON / SQLite 归档 ↓ 公众号草稿 / GitHub 日报 / 后续分发 核心不是“抓取”,抓取其实不难。真正麻烦的是: 怎么过滤垃圾信息; 怎么避免每天重复写同一个方向; 怎么判断一个项目是不是真的值得看; 怎么让生成内容尽量可验证,而不是 AI 胡编。 3. 论文部分:从 arXiv 候选到中文精读 论文侧主要关注这些方向: RAG / Retrieval-Augmented Generation Search / Information Retrieval Agent / Tool Use / Function Calling Long Context Evaluation / Benchmark LLM Application Engineering Knowledge Base / Re-ranking / Query Understanding 数据源主要是 arXiv API ,例如: cs.AI cs.CL cs.IR cs.LG cs.CV 中和多模态检索、文档理解相关的部分 每篇论文进入候选池后,会先做基础解析: 标题 作者 arXiv ID 摘要 分类 发布时间 PDF 链接 关键词 然后做几层过滤: 主题相关性 :是否和 AI 工程化、RAG 、搜索、Agent 等方向有关; 新鲜度 :优先最近 1 个月,越新越优先; 机构/作者可信度 :顶级实验室、大厂、知名高校会加权,但不绝对迷信; 工程价值 :有没有方法、框架、评测或实践启发; 重复度 :是否和之前已经写过的主题过于接近。 通过过滤后,Agent 会读取论文摘要、PDF 或 HTML 版本,生成结构化产物: paper_slot/ deep_read_article.md deep_read_meta.json sources.md evidence-notes.md seo-title.json 我比较看重 sources.md 和 evidence-notes.md ,因为 AI 写论文解读很容易“看标题发挥”。所以每篇文章都需要保留来源、证据和不确定点。 4. GitHub 部分:不只看 Star ,更看工程价值 GitHub Trending 的噪声非常大。 有些项目一天几千 Star ,但可能只是: 一个简单 UI 壳子; 复刻已有项目; README 写得很夸张; Demo 很漂亮,但代码不可复用; Star 暴涨,但最近维护质量一般。 所以我没有只按 Star 排序,而是做了几个维度: Star 总数; 最近增长速度; 最近 commit 活跃度; README 是否清晰; 是否有真实代码结构; 是否有 license ; 是否有 release / examples / docs ; 是否和 RAG 、Agent 、搜索、LLM 应用工程相关; 是否解决真实工程痛点。 一个项目进入精读流程前,至少要检查: repo_slot/ repo-evidence.json readme.md key-files.md sources.md deep_read_article.md seo-title.json 我希望最后生成的不是“这个项目很厉害,大家快去看”的营销文,而是能回答几个问题: 它解决了什么问题? 它和已有方案相比有什么不同? 它的架构或实现有什么可复用点? 它现在成熟吗?适不适合生产使用? 如果我要试用,第一步应该看哪里? 5. 为什么用 OpenClaw ? 我需要的不是单次 ChatGPT 问答,而是一个能长期运行的个人自动化 Agent 。 OpenClaw 对我比较有用的点: 可以读写本地工作区文件; 可以跑脚本、定时任务; 可以维护长期记忆和每日日志; 可以把流程拆给多个子 Agent ; 可以把产物写成 Markdown / JSON / SQLite ; 可以接入公众号草稿、Discord 、QQ 等通知渠道。 换句话说,它更像一个“能干活的个人自动化工作台”,而不是只会聊天的模型。 当然,最重要的是:所有自动生成内容都要有检查门禁。比如: 没有来源链接不能进正式稿; 没读 primary source 不能写深度解读; 不能出现“待补充”“TODO”“正式发布前请检查”这类占位词; 标题不能为了吸引点击而歪曲论文或项目本意; GitHub 项目不能把 README 里的宣传语直接当事实。 6. 目前的每日输出 现在我的目标是每天产出两类内容: 论文精读 :偏研究方法、技术路线、评测和启发; GitHub 项目精读 :偏架构、代码、工程价值和可落地性。 每日内容会先进入本地归档,再进入公众号草稿箱,最后人工检查后发布。 我也准备把其中一部分公开成 GitHub 仓库,作为每日 AI 论文和 GitHub Trending 的中文索引: 每日论文列表; 每日热门项目列表; 中文简介; 原始链接; 主题标签; 后续可能补充脚本。 完整版的深度解读会继续放在公众号里。 7. 踩过的一些坑 7.1 不要只追热点 GitHub Trending 很容易让人被短期 Star 牵着走。后来我加了“工程价值”和“主题相关性”的过滤,否则日报会变成项目搬运。 7.2 AI 很容易把摘要写成鸡汤 如果 prompt 不约束,论文解读很容易变成: 本文提出了一种创新方法,显著提升了性能,具有重要意义。 这种话基本没信息量。 所以我现在要求每篇都必须回答: 方法具体是什么; 输入输出是什么; 对比基线是什么; 适用边界是什么; 工程上能学到什么。 7.3 需要保留证据文件 自动化写作最怕“看起来很完整,但来源不可查”。 所以每个 slot 都会保留来源文件,例如: arXiv 链接; PDF 链接; GitHub repo 链接; README 摘要; 关键文件路径; 生成时的判断理由。 这样后面出了问题可以回溯。 7.4 公众号不是终点,归档和分发更重要 如果内容只存在公众号里,后续搜索和复用都不方便。 所以我会同时保留: Markdown 版本; JSON 元数据; SQLite 主账本; GitHub 公开索引; 后续可能加网页展示。 8. 后续计划 接下来我想继续做几件事: 开源每日论文和 GitHub Trending 中文索引仓库; 加入更细的主题分类,比如 RAG 、Agent 、Search 、Evaluation ; 对高价值论文做系列化追踪; 对 GitHub 项目增加“可运行性”和“维护质量”评分; 把日报沉淀成一个可搜索的 AI 工程知识库。 如果你也在做类似的论文追踪、GitHub Trending 筛选、AI 技术日报,欢迎交流。 我会把完整的中文精读和每日筛选结果放在公众号「 AltenAI 观察」。 最后放一句软广:如果你关心 RAG 、搜索、Agent 、API 接入和大模型工程化落地,可以关注一下「 AltenAI 观察」。我会持续把每天筛出来的论文和项目做成中文摘要和工程解读。 也把文章放在了 github: https://github.com/AltenLi/daily-paper-github-trends
喜报,捷报(第一次发前沿快讯,如果写得有问题,请指正): 1. 来自财新: 5月中国对美国出口在去年低基数上显著回升,对韩国出口增速在主要贸易伙伴中最快;集成电路、自动数据处置设备等AI相关商品进出口均高增 2. 来自海关总署: 2026年前5个月,我国货物贸易进出口总值20.68万亿元人民币,同比(下同)增长15.3%。 从重点商品看,出口方面,前5个月,我国出口机电产品7.58万亿元,增长18.4%;劳密产品1.61万亿元,下降3.1%;农产品3007.9亿元,增长1.6%。进口方面,前5个月,我国进口机电产品3.54万亿元,增长25.3%;原油2.18亿吨,减少4.8%;农产品6181.6亿元,增长7.6% 截至5月,月度进出口已经连续三个月超过4万亿元人民币” 3. 来自zaobao: 分领域来看,中国5月集成电路出口307.3亿个,同比增长2.1%,稀土出口5490.4吨,同比下降6.4%,手机出口同比下降3.5%,家同电器出口同比增8.8%,船舶出口同比下降2.2% cn出口增速加快,5月出口按人民币计同比增加13.8%,以美元计价增长19.4%,超出预期。 4. 来自cn汽车流通协会乘用车市场信息联席分会(“乘联分会”) 8日发布的数据显示,5月中国乘用车出口78.4万辆,同比增长75.1%,环比增长2.3%。 1 个帖子 - 1 位参与者 阅读完整话题
怀念乔布斯那时候熬夜看发布会,每一次都惊艳刷新自己对 iPhone 的认知,感受到前沿科技,如今还来个阉割版的 iOS,没有人工智能,当然政策原因无可厚非,起床上班。[grid] [/grid] 20 个帖子 - 18 位参与者 阅读完整话题
国家网信办、市场监管总局联合印发《网络测评活动规范》 前沿快讯 近日,国家网信办、市场监管总局联合印发《网络测评活动规范》(以下简称《规范》)。国家网信办有关负责人表示,《规范》旨在规范网络测评活动,维护公平市场竞争秩序,保护公民、法人和其他组织合法权益。 近年来,网络测评快速兴起,测评类经营主体通过开展测试、对比分析数据、引用专业检测结果或者表达使用感受等方式,发布测试过程与评价结果,为消费者购物提供参考。但一些网络测评存在夸大宣传、只评不测、商测一体等问… 18 个帖子 - 18 位参与者 阅读完整话题
有大佬们是这样用么,利用Zed Pro体验最前沿模型,以及通过Claude Çode + DeepSeek API让完成具体实现和开发 3 个帖子 - 2 位参与者 阅读完整话题
从下面帖子接着讲 Mox Bank 疑似即将开放内地访港旅客开户 前沿快讯 如题,Mox Bank 近日于官网上线了“訪港旅客常見問題”的FAQ页面,疑似即将开放内地访港旅客开户。 对于内地访港旅客,需使用同名的香港或内地银行户口,进行一笔最少 1000 HKD/950 CNY/130 USD 的同名转账至 Mox 户口完成激活,在完成同名转账前,部分交易将设有限额,部分交易限额则为 0。 同时,内地居民开立的 Mox 户口无法使用 Mox Credit、Mox In… 奇技淫巧:使用 Trip.com 员工专属链接拉起 Mox Bank 隐藏的内地居民开户入口 前沿快讯 从 Mox Bank 疑似即将开放内地访港旅客开户 接着讲 [photo_2026-06-07_12-53-23] [photo_2026-06-07_12-53-24] [photo_2026-06-07_12-53-25] [photo_2026-06-07_12-53-26] [photo_2026-06-07_12-53-28] 如题,扫描图 1 二维码或使用 Chrome 浏览器开启链接… 据多例 DP,如未使用已登记的以 @trip.com 结尾的电子邮箱进行开户,在填写完信息后则会直接被拒绝。 同时,由于 Mox Bank 对于所有未完成的在线申请均保留 90 天,因此存在如果 90 天内即开放所有访港旅客开户,却因本次留有记录,无法新开户的情况。 转自encmasuta 1 个帖子 - 1 位参与者 阅读完整话题
首先还是要提醒 一些推测:可能是套壳 新画图模型Riverflow2.5可能是套壳模型 前沿快讯 从 [image] [image] [image] 实际拿我昨天跑的图测了一下 [image] [image] 难绷哥们,拿更贵的价格给我路由大香蕉和image 2吗 原帖佬友的图 [image] 搜了一下,SynthID是Google DeepMind的闭源技术,通过合作授权给第三方。目前拿到授权的有:OpenAI(和 C2PA 元数据一起用)、ElevenLabs、K… 画了一张图,用了3分10秒 实际分辨率还是接近1k的 可以画JOJO风 但是,不能画荒木飞吕彦风 对比: 2 个帖子 - 2 位参与者 阅读完整话题
在英伟达 Nemotron 3 Ultra、谷歌 Gemma 4 12B 等 25 款开源权重模型集中发布后,科技投资人 Chamath Palihapitiya 指出,开源与闭源前沿模型的能力差距正在迅速收窄,但调用价格仍存在巨大鸿沟。 以企业每月消耗 10 亿输入与 10 亿输出 Token 测算,GPT-5.5 Pro 成本高达 10.5 万美元,Claude Opus 4.8 为 3 万美元,而 DeepSeek R1 仅需 2740 美元,GPT-5.5 Pro 的溢价近 40 倍。Chamath 警告,多数公司 CEO 并不知道技术团队在缺乏治理与审计的情况下,直接默认选用最昂贵的大模型 API,导致预算超支。 随着他本人联合创立并担任首席执行官的 AI 原生软件开发生命周期编排平台 Software Factory 等模型路由控制面逐渐普及,企业将转向模型无关架构,将大规模推理默认分流至 DeepSeek,高端代理流导入 Claude Opus,仅在产生明确高额增量价值时按需调用 GPT-5.5 Pro。Chamath 预测,精细化路由将导致 OpenAI 和 Anthropic 等前沿实验室的 API 营收增速显著放缓,而开源及低成本推理生态的收入将迎来暴增。 1 个帖子 - 1 位参与者 阅读完整话题
从 Riverflow 2.5系列发布,新神登基 前沿快讯 Riverflow 2.5 系列(Flash/Pro)是Sourceful开发的统一的文本到图像和图像到图像家族,它将生成视为一个生产工作流,使用集成的推理模型来规划多步编辑,并在接受结果前判断候选方案。推理努力程度可通过推理参数(低/中/高/极高)控制——较高等级会进行更多编辑轮次并应用更严格的内部评判,其中极高等级适用于需要高可重复性的批量运行。它能够生成 1K、2K 和 4K 分辨率,并… 实际拿我昨天跑的图测了一下 难绷哥们,拿更贵的价格给我路由大香蕉和image 2吗 原帖佬友的图 搜了一下,SynthID是Google DeepMind的闭源技术,通过 合作授权 给第三方。目前拿到授权的有:OpenAI(和 C2PA 元数据一起用)、ElevenLabs、Kakao、NVIDIA。如果河流生成的图确实能被检测出 SynthID 水印,那更可能的解释是 河流后端直接调谷歌或者OpenAI的模型 ,不是自己训的模型拿了 SynthID 授权 8 个帖子 - 5 位参与者 阅读完整话题
L站邀请注册机制调整,github年限查询方式 前沿快讯 https://api.github.com/users/[你的账户名] 可以快速查看自己github信息 [image] 各位佬,你们多少年的了 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 点击以查看投票。 9 个帖子 - 6 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 想法:AI现行的当前,信息爆炸严重,对于科研人员,检索文献繁琐,且不易整理。基于这个问题,我想让AI基于主题每天去找前沿的文献。然后总结,不用多么详细,对于硕博而言,只需要大概的内容和方向,就能明白自己这个领域最近学者们都在做哪些工作,也可以给自己的科研做一些启发,所以做了这个项目。欢迎佬友们指导和交流。 图片先行: 主要功能: 1.根据主题,基于配置的多源,进行文献检索,同时对文献进行历史去重,证据完整性评分等工作。流程比较复杂,感兴趣的话可以让AI分析源项目,加了太多内容了。检索到的文献支持doi链接回看,支持科研人员一键查看文献原文。 2.调用LLM进行文献综述撰写,我总感觉AI写出的内容不够完美,欢迎佬友和我一起完善这部分的提示词。 3.公众号自动稿件撰写,手动推送。目前这部分就是把原文全部内容写在公众号里面,感觉还需要完善。大概功能已经实现了。 开源地址: yyy-OPS/YFR.frontier-review-daily 在线查看地址: https://yfr.yangy.cn/ 欢迎各位科研佬交流,再点点小星星~谢谢各位佬友~ 1 个帖子 - 1 位参与者 阅读完整话题
Anthropic 呼吁全球主要 AI 实验室考虑放缓前沿模型开发节奏。该公司在博客中表示,AI 进步速度极快,可能很快出现无需人类干预即可自我改进的“递归自我改进”能力,这会带来重大社会风险。公司警告,若没有全球协调机制,单方暂停只会让对手抢跑,因此提议多国主要 AI 企业同步停止并遵守可验证规则,避免单一暂停让对手趁机赶超。 该提议在华盛顿和硅谷遇冷,批评者认为其夸大风险,实为借安全之名打压对手,且放缓研发恐让中国获得战略优势。Anthropic 近日刚完成近万亿美元估值的融资,并已提交 IPO 保密文件。 anthropic.com When AI builds itself Our progress toward recursive self-improvement, and its implications. 24 个帖子 - 24 位参与者 阅读完整话题
Anthropic于近日发表长文《When AI builds itself》,首次系统性地披露了AI系统在其内部开发流程中所扮演的角色,并就 递归自我改进 (即AI完全自主地设计和开发自身后继系统)的前景发出预警。 anthropic.com When AI builds itself Our progress toward recursive self-improvement, and its implications. 文章援引的内部数据显示,截至2026年5月,Anthropic合并至生产代码库的代码中 超过80%由Claude编写 。2026年第二季度,工程师人均每日合并的代码行数达到2024年的 8倍 ——这并非因为人写得更多,而是工程师的角色已从编写者转变为审阅者和指挥者。与此同时,Claude在最开放性工程任务上的会话成功率在半年内提升了50个百分点,达到76%。Anthropic内部员工在2026年3月的调查中,中位数估计认为借助Claude后产出约为无AI辅助时的 4倍 。 在研究侧,Claude同样展现出加速趋势。Anthropic设计了一项内部测试:给定小型AI模型的训练代码,要求Claude在保证正确性的前提下尽可能提升运行速度。2025年5月Claude Opus 4的平均加速倍数约为3倍,而2026年4月Mythos Preview已达到约52倍——作为参照,一名熟练的人类研究员在同一任务上通常需要4至8小时才能达到4倍加速。在一项关于"判断下一步研究方向"的评估中,Mythos Preview给出优于人类研究员选择的比率从2025年11月的51%上升到2026年4月的64%。Anthropic认为这是AI系统在研究判断力上正在改善的早期信号。 文章描述了三种可能的未来情景:能力增长曲线趋于平缓但现有能力已广泛扩散;AI实验室持续获得复合效率提升、人类仍掌握研究方向设定权;以及AI系统实现完全的递归自我改进、自主构建后继模型。Anthropic表示目前尚未达到递归自我改进阶段,且该结果并非必然,但其到来可能早于多数机构的预期。 Anthropic在文末明确表态:如果全球范围内存在可验证的协调机制,使前沿开发者能够确认彼此确实减速或暂停, Anthropic愿意放慢甚至暂时停止前沿AI开发 。但文章同时指出,训练运行远比导弹发射井更容易隐匿,单方面暂停只会改变领跑者身份而无法建立所需的协商进程。Anthropic表示将在未来数月组织政策制定者、研究人员、公民社会和其他AI公司共同讨论这些问题。 25 个帖子 - 24 位参与者 阅读完整话题
以下内容是我写在简历上的部分内容,想找个 Agent 研发的工作。 持续关注 AI 与 Agent 前沿技术,长期投入大模型应用架构、Agent Runtime 、RAG 与 Context Engineering 等方向的研究与实践,具备较强的自主学习与技术探索能力。 具备从 0-1 独立设计与实现 AI 系统的能力,能够快速完成技术调研、架构设计、原型验证与工程落地。 深度使用 Claude Code 、Cursor 等 AI Coding 工具辅助研发,具备 AI Native 开发思维,能够结合 Prompt Engineering 与自动化工作流提升研发效率。 熟悉 Agent 、RAG 、多模型调度、向量检索、MCP ( Model Context Protocol )等 AI 应用核心技术,具备完整 AI 应用系统实践经验。 对新技术保持持续学习热情,长期关注 OpenAI 、Anthropic 、DeepSeek 、LangChain 、Dify 、n8n 等 AI 生态发展与工程实践。
现在上 V 站,先是看看有没有什么 前沿或者好玩的技术贴,没事摸鱼了看看生活、问与答。有时候实在不知道看什么了,跑到 水深火热 看看几年前的帖子。 总结:技术、好玩、最热、问与答、生活、水深火热 大家有没有什么平常经常看的其他节点,推荐下
现在上 V 站,先是看看有没有什么 前沿或者好玩的技术贴,没事摸鱼了看看生活、问与答。有时候实在不知道看什么了,跑到 水深火热 看看几年前的帖子。 总结:技术、好玩、最热、问与答、生活、水深火热 大家有没有什么平常经常看的其他节点,推荐下
现在上 V 站,先是看看有没有什么 前沿或者好玩的技术贴,没事摸鱼了看看生活、问与答。有时候实在不知道看什么了,跑到 水深火热 看看几年前的帖子。 总结:技术、好玩、最热、问与答、生活、水深火热 大家有没有什么平常经常看的其他节点,推荐下
现在上 V 站,先是看看有没有什么 前沿或者好玩的技术贴,没事摸鱼了看看生活、问与答。有时候实在不知道看什么了,跑到 水深火热 看看几年前的帖子。 总结:技术、好玩、最热、问与答、生活、水深火热 大家有没有什么平常经常看的其他节点,推荐下