WWW.YOUINFO.SITE
标签聚合 演化

/tag/演化

IT之家 · 2026-06-04 14:31:28+08:00 · tech

IT之家 6 月 4 日消息,一项新研究表明,宇宙大爆炸时期诞生的黑洞寿命远比此前预估的要长。事实上,这些微型原初黑洞的存续时间,足以演化成能够向外喷涌能量、质量仅和一根人类眉毛相当的白洞。 一张示意图展示了黑洞转变为白洞前后的状态 据IT之家了解,原初黑洞被认为是由宇宙大爆炸瞬间后充满宇宙的极度炽热致密物质的涨落形成的,这和我们熟知的恒星级(天体物理型)黑洞截然不同,后者由大质量恒星坍缩生成。迄今为止,人类尚未探测到原初黑洞,其仍只停留在理论猜想层面。 不少科学家认为人类没能探测到小型天体物理黑洞,是因为它们早已蒸发,在拥有 138 亿年历史的宇宙中不复存在。这套推论的依据是:上世纪 70 年代霍金提出,黑洞会以热辐射的形式向外散失能量,也就是霍金辐射。黑洞质量越小,自身温度越高,霍金辐射的外泄速度就越快,蒸发进程也越迅猛,科学界推测这类黑洞最终会以一场剧烈爆炸迎来消亡。 恒星级黑洞的质量最高可达太阳的数百倍,体型巨大、温度偏低,能量散失速度极其缓慢,寿命远超宇宙现有年龄的数倍;而质量远小于恒星级黑洞的原初黑洞,此前科学界普遍认定它们难逃快速消亡的命运。美国埃伯利理学院研究员丹尼尔・帕莱佐及其团队却提出:质量恰好落在特定区间的原初黑洞,可以熬过蒸发阶段,发生颠覆性的形态转变。 “我们测算发现,黑洞的实际寿命远长于以往认知。”帕莱佐在接受 Space.com 采访时表示,“我们发现的物理现象适用于宇宙早期形成的黑洞。人类目前还没有观测到这类天体,但将其作为暗物质候选体进行探索是一个备受关注的研究热点。黑洞会通过释放霍金热辐射逐步走向消亡,关键谜题在于:当黑洞质量缩减至普朗克质量(约 20 微克)时会发生什么。” 一颗跳蚤卵大小的黑洞 普朗克质量约为 2.2×10⁻⁸千克,是物理学中的基础质量常量,它的特殊之处在于:在这一质量尺度下,描述微观粒子的量子物理规律,与支配引力的广义相对论规律拥有同等重要的作用。物理学家将普朗克质量视作单个基本粒子的质量上限,任何粒子质量一旦超出该数值,就会坍缩形成微型黑洞。 通俗来讲,普朗克质量大致等同于一根眉毛或是一颗跳蚤卵,重量仅为一颗软糖豆的五万分之一。 帕莱佐介绍,原初黑洞蒸发至普朗克质量后就成为普朗克黑洞,科学界对它的结局有着多种猜想,其中一种猜想是:界定黑洞边界、困住光线与电磁辐射的事件视界会彻底消失。“我们研究的普朗克黑洞消亡机制,就是束缚辐射的事件视界逐步消散。” 该研究团队通过数学演算得出结论:初始质量相当于一颗中型小行星(约 10 亿吨)的原初黑洞,会在十亿年间持续释放霍金热辐射,不断损耗质量直至落到普朗克质量;而初始质量仅有 1 吨的原初黑洞,会瞬间发生爆炸、质量骤降至普朗克质量。正是黑洞抵达 20 微克临界质量后的演化结论,让本次研究和过往成果形成区别。 一幅白洞的示意图,白洞是一种“时间反向的黑洞”,会不断将物质向外推离 “以往理论认为,黑洞剩余的 20 微克质量会在一秒之内全部以辐射形式消散,但我们的计算结果恰恰相反:这 20 微克的残余天体基本可以长期稳定存在。”帕莱佐解释道,“黑洞质量跌破 20 微克临界值后,会开始释放‘净化辐射’(该名称源于这类辐射能够‘净化’宇宙量子态),这一行为源于白洞的特性。尽管人类至今尚不掌握白洞近域的物理法则,但从远距离观测来看,这类残余天体的物理特征和白洞完全一致。” 白洞同样是物理学中的假想天体,可以理解为黑洞的时间反演形态:黑洞不断吞噬物质与辐射,白洞却持续向外排斥、抛射所有物质和辐射。 想要进一步推演这类原初黑洞转化为白洞后的最终归宿,离不开一套能统一广义相对论与量子力学的理论,也就是所谓的“量子引力”,而自 20 世纪初至今,物理学家始终没能建立起完善的量子引力理论。 “只需依托黑洞远场的基础物理假设,就能推算出黑洞寿命,以及它转变为质量 20 微克的稳定白洞天体的演化规律。仅凭借量子引力的少量基础理论就能推导出这些特性,这一结果十分惊人。”帕莱佐说道。 该团队的论文尚未经过同行评审,预印本已发布在学术预印本平台 arXiv 上。 参考资料: https://arxiv.org/abs/2605.03922

IT之家 · 2026-05-10 19:50:36+08:00 · tech

IT之家 5 月 10 日消息,天文学家借助詹姆斯・韦布太空望远镜,在一个遥远的早期星系中发现了一个出人意料的特征。尽管该星系形成于宇宙尚处于非常年轻的时期,却没有呈现出任何旋转迹象。 加州大学戴维斯分校物理与天文学系研究科学家、这项于 5 月 4 日发表在《自然・天文学》期刊上研究的第一作者本・福里斯特解释称,这种天体特征通常仅出现在距离地球近得多、且已演化成熟的巨型星系中。 福里斯特表示:“这个星系完全没有表现出任何旋转的迹象,这一点既令人意外,也极具研究价值。” 星系为何理应产生自转 据IT之家了解,现有天体模型认为,星系在形成之初就会开始旋转。向内流动的气体与引力牵引会产生角动量,进而带动整个星系系统运转起来。 历经数十亿年的演化,星系之间会发生碰撞与合并,在星系密集星团中尤为常见。这类反复的相互作用,既可能增强星系自转,也可能抵消其旋转运动。最终,部分近邻星系整体自转微弱,星系内恒星仅做无规则运动。 由于这类演化转变本被认为需要极其漫长的时间,因此在宇宙年龄尚不足 20 亿年时,就在编号为 XMM-VID1-2075 的星系中观测到这一现象,令科学界倍感意外。 早期诞生的巨型星系 福里斯特及其团队隶属于 MAGAZ3NE(红移大于 3 的近红外远古大质量星系巡天项目),此前已利用夏威夷的 W.M . 凯克天文台对该星系开展过研究。 福里斯特说:“此前 MAGAZ3NE 项目的观测已证实,它是早期宇宙中质量最大的星系之一,恒星数量已是银河系的数倍;同时还确认该星系早已停止诞生新恒星,是极具研究价值的后续观测目标。” 韦布望远镜揭秘星系内部运动 研究团队利用詹姆斯・韦布太空望远镜,对 XMM-VID1-2075 星系以及另外两个同期星系展开观测,得以追踪每个星系系统内部物质的运动状态。 福里斯特解释道:“这类研究在近邻星系中已有大量开展,因为它们距离地球更近、视尺寸更大,可通过地面望远镜完成观测;但对高红移星系开展同类研究难度极大,这类星系在天空中看起来极其渺小。詹姆斯・韦布太空望远镜,真正推动了该领域的研究前沿。” 在三个观测星系中,一个有着明显自转,一个结构呈不规则状态,第三个无自转现象,但内部恒星存在剧烈的无规则运动。 福里斯特表示:“这类特征与本宇宙局部区域的部分巨型星系特征一致,但在宇宙早期就发现这样的星系,仍有些出乎意料。” 星系停止自转的潜在原因 科研人员目前正致力于探究,该星系为何能在极短时间内演化成科学界所称的低速自转星系。 一种合理推测是:它并非历经多次星系合并逐步演化,而是源于一次剧烈的星系碰撞。若两个旋转方向近乎相反的星系发生碰撞,彼此的旋转运动便会相互抵消。 福里斯特说:“我们观测到这个星系一侧存在明显的强光溢出现象,这暗示有其他天体闯入并与该星系发生相互作用,或许正在改变其内部动力学结构。” 搜寻更多无自转星系 该研究团队仍在持续搜寻宇宙早期的同类无自转星系。通过将实际观测数据与计算机模拟结果对比,科学家能够检验现行的星系形成理论是否成立。 福里斯特称:“部分天体模拟预测,宇宙早期会存在极少数无自转星系,但这类天体本应十分稀少。我们通过观测搜寻这类星系,既能验证模拟结果,也能探明其实际分布数量,进而判断现有星系演化理论是否准确。”

linux.do · 2026-04-30 13:48:32+08:00 · tech

长期项目里的 Agent Harness,可能需要元认知自演化能力 我感觉个人 Agent Harness 最缺的不是执行,而是自我迭代能力, 很多 Harness以及Agent框架,本质上还是偏执行环境,这个模式当然有用,但如果放到长期项目里,比如做代码项目、做产品原型、写论文,就会出现困难,所以一个更适合长期项目的 Harness,不应该只是执行器,而应该具备一种元认知自演化能力。 Meta-Cognitive Self-Evolving Agent Harness for Long-Term Project Execution 意义:让 AI 在既定项目目标下,具备自我诊断、自我建设、自我评价更新和阶段性目标规划能力。即一种在人工设定总目标和安全边界下,能够主动识别项目缺口、提出阶段性目标、发现自身能力不足、建设新能力、更新审查机制、治理记忆与技能库,并通过验证、审批和回滚机制实现可控持续进化的项目型智能体框架。 一、为什么需要元认识自演化,解决了什么问题? 普通 Harness 的问题是: 执行路径:人设定目标——人设定流程——Agent 执行——人审查——人指出问题——人再下令修改 存在的问题缺口: 每次都依赖人重新提醒; 反馈不能自动沉淀; 审查机制固定,容易停滞; 项目缺口需要人主动发现; 能力库越积越乱; Agent 不知道自己哪里有缺漏; 系统无法证明自己真的变系统、智能。 因此我们需要在以下方面进行整改: 人设定总目标和边界 Agent 跟踪项目状态——识别项目缺口——提出阶段目标——执行任务——审查结果——审查自己的审查机制——发现自身短板——建设新能力——治理记忆——技能和规则库——用回归测试验证是否变强——人审批高风险变更——系统版本化和可回滚 这样agent就变成从执行工具环境框架升级成可自演进的项目协作者。 参考: 1 Reflexion Reflexion 让语言 Agent 在任务完成后根据反馈进行语言反思,并把反思文本存入 episodic memory,用于后续任务决策。通过语言反馈 + 记忆实现持续改进。 arXiv.org Reflexion: Language Agents with Verbal Reinforcement Learning Large language models (LLMs) have been increasingly used to interact with external environments (e.g., games, compilers, APIs) as goal-driven agents. However, it remains challenging for these language agents to quickly and efficiently learn from... 2 Meta-Rewarding / LLM-as-a-Meta-Judge 提出 Meta-Rewarding,让模型不仅评价自己的回答,还进一步评价“自己的评价”。也就是 judge evaluates responses,meta-judge evaluates judgments。 arXiv.org Meta-Rewarding Language Models: Self-Improving Alignment with... Large Language Models (LLMs) are rapidly surpassing human knowledge in many domains. While improving these models traditionally relies on costly human data, recent self-rewarding mechanisms (Yuan et al., 2024) have shown that LLMs can improve by... 3 ADAS 自动创造更强的 Agentic System,包括发明新的构件,或以新的方式组合构件。提出 Meta Agent Search,让 meta agent 迭代编写新的 agent 代码并基于评估结果继续搜索。 arXiv.org Automated Design of Agentic Systems Researchers are investing substantial effort in developing powerful general-purpose agents, wherein Foundation Models are used as modules within agentic systems (e.g. Chain-of-Thought, Self-Reflection, Toolformer). However, the history of machine... 二、结构 具体架构: 从架构来说分四层:项目目标层,任务执行层,评价与元评价层,自我建设与治理层 第一层:项目目标层 意义:这个项目到底要完成什么?现在做到哪一步?还缺什么? 功能判断: 1当前项目总目标是什么? 2当前已经完成了什么?哪些部分还缺失? 3哪些缺口会影响最终交付?下一阶段应该补什么? 4新目标是否偏离原始方向? 模块具备:项目状态跟踪器,项目缺口分析器,阶段目标生成器,目标一致性检查器,阶段计划生成器 第二层:任务执行层 相当于传统 Harness 的主体,负责把目标变成可执行动作。 第三层:评价与元评价层 意义:审查输出,还要审查审查机制本身。 功能判断: 1结果有没有问题 2为什么原来的审查器没有发现这个问题?当前检查清单是不是太浅? 3评价标准是不是过时? 4测试样例是不是不够? 5评分规则是不是鼓励了错误行为? 对应模块:结果审查器、元审查器、评价规则管理器、测试样例库、风险评估器 第四层:自我建设与治理层 意义:自我演进,系统化,可续化 功能判断: 1我擅长什么?我哪里经常失败? 2失败是因为知识不足、工具不足、流程不足、评价不足,还是目标不清? 3我需要新增什么工具、规则、技能或模块? 4已有记忆是不是混乱?已有规则有没有冲突? 5哪些经验应该压缩?哪些技能应该合并?哪些模块应该重构? 模块:自我能力模型,能力缺口识别器,失败归因器,能力建设器,记忆治理器,技能库管理器,架构演化器,版本管理与回滚器 效果:把可演化对象扩展到模型、记忆、工具、架构等多个组件 三、闭环 任务执行闭环,能力自建闭环,评价机制自更新闭环,目标演化闭环,记忆与技能治理闭环 1.任务执行闭环 目标 → 规划 → 执行 → 输出 → 审查 → 修正 即基础的harness效果 2.能力自建闭环 执行失败 → 失败归因 → 能力缺口识别 → 生成补强方案 → 新增规则、工具、流程或技能 → 验证是否改进 3.评价机制自更新闭环 外部反馈指出问题 → 原审查器没有发现 → Meta-Critic 分析审查遗漏原因 → 更新检查清单、测试样例、风险规则 → 用旧任务回归验证 4.目标演化闭环 项目状态跟踪 → 项目缺口分析 → 提出阶段性目标 → 目标一致性检查 → 人类审批关键目标 → 生成阶段计划 5.记忆与技能治理闭环 经验积累 → 重复检测 → 冲突检测 → 压缩归纳 → 技能封装 → 版本化保存 → 低频归档或删除 四、整体流程 Step 1:人类输入总目标和安全边界 例如:完成一篇面向 EPSR 的 VPP 调度论文。 Step 2:系统建立项目状态模型 记录已有材料、当前进度、关键约束、评价标准。 Step 3:系统分析项目缺口 判断还缺哪些实验、文档、验证、图表或审稿准备。 Step 4:系统提出阶段性目标 例如:补充可行性验证、补充鲁棒性分析、完善相关工作。 Step 5:目标一致性检查 确认新增目标是否服务于总目标,是否引入目标漂移。 Step 6:任务执行 调用工具、技能、流程完成具体任务。 Step 7:结果审查 检查质量、风险、格式、逻辑、事实一致性。 Step 8:元审查 检查审查器是否遗漏问题,是否需要更新评价机制。 Step 9:能力缺口识别 判断失败来自知识、工具、流程、记忆、评价还是目标规划。 Step 10:能力建设 新增规则、技能、工具、流程、测试样例或模块。 Step 11:记忆和技能治理 压缩重复经验,合并规则,归档低频内容,解决冲突。 Step 12:回归验证 用固定任务集测试更新是否真的提升。 Step 13:版本化与人工审批 低风险更新自动保存,高风险更新等待人类确认,错误更新可回滚。 这几天操作有点感悟,借助ai讨论,仅供参考,感觉个体构建harness需要具备这样的迭代能力,随便水个贴 3 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-22 12:34:52+08:00 · tech

给 Claude Code 用的多代理质量 harness。730 行协议,零行应用代码。 把一个复杂任务拆成独立 Chunk,用不同模型对抗规划、并行执行、交叉评审,每次跑完把踩过的坑写回协议自身。下一次启动时,所有代理自动继承上一轮的教训。 为什么做这个 Claude Code 的单代理模式足够应付大多数任务。但碰到跨模块重构、多文件协同、高质量文档这类场景,单代理容易出两个问题: 自己审自己,发现不了盲区。 同一个模型写的代码,同一个模型打分,评审形同虚设。 犯过的错没有记忆。 上次 pipeline 踩的坑,下次原样再来一遍。 Pipeline 的解法:让不同模型互相挑刺,把机械能验的和主观要评的彻底分开,再把每次返工的根因写回协议本身。 工作流程 Stage 0 启动门槛 确认任务值得用 pipeline,批准预算 Stage 1 访谈对齐 一次一问,收敛到 spec + 验收标准 Stage 2 对抗规划 Opus 和 Codex 各出方案,互相攻击,辩论收敛 Stage 3 并行执行 每个 Chunk 一个 Sonnet,硬闸门先跑,过了再自评软维度 Stage 4 交叉评审 Opus 和 Codex 独立打分,看不到执行过程,只看最终产物 Stage 5 教训沉淀 返工根因可泛化的写入 lessons.md,下次自动注入 任何阶段都可以说"切快速路径"退出。 四个设计决策 对抗,不是协作 规划和评审各用两个不同模型(Opus + Codex)。它们不知道对方的存在,被要求攻击对方的方案。分歧不是 bug,是在暴露真实的设计取舍。 机械验证和主观评审彻底分开 能跑命令验证的(lint、type check、测试、文件存在性),绝不交给代理主观打分。硬闸门不过,直接返工,连评审阶段都不用进。主观评审只负责设计感、可读性、论据力这类没法机械化的维度。 信息隔离 执行者看不到其他 Chunk 的实现细节。评审者看不到执行过程、规划辩论、返工历史。编排者不能对评审者说"这部分比较弱"。每个角色只拿到完成工作所需的最小信息集。 教训是代码,不是感悟 每条教训必须有三个字段:触发条件(什么场景生效)、原则(一句话规则)、改动(具体落在哪个 prompt 或 rubric 的哪一行)。没有具体改动的心得不写进来。下次启动时 lessons.md 自动注入所有代理的 system prompt。 文件结构 pipeline/ SKILL.md 主协议:5 个阶段 + 4 条原则 + 升级/降级规则 lessons.md 教训沉淀,每次 pipeline 运行后持续增长 prompts/ planner.md 规划者 prompt 模板(Opus + Codex 双版本) executor.md 执行者 prompt 模板(Sonnet) evaluator.md 评审者 prompt 模板(Opus + Codex 双版本) rubrics/ code.md 开发类评分矩阵 design.md 设计类评分矩阵 doc.md 文档类评分矩阵 research.md 研究类评分矩阵 templates/ report.md 最终交付报告模板 全部是 Markdown。没有可执行代码,没有依赖,没有构建步骤。 快速开始 把 pipeline/ 目录放到 ~/.claude/skills/ 下 在 Claude Code 里对任何复杂任务说"用 pipeline" Pipeline 会先确认预算,再逐步走访谈、规划、执行、评审 每次跑完检查 lessons.md ,看新沉淀了什么 不需要配置。唯一的前提是 Claude Code 环境能调用 SubAgent。 适合用的场景 多文件重构,改动互相依赖 跨模块新功能,接口需要先对齐 高质量技术文档或研究报告 任何拆解后超过 4 个独立 Chunk 且需要多轮把关的任务 不适合用的场景 快速原型、探索性尝试 单文件 bug 修复 一次性小改动 这些直接用 Claude Code 默认模式更快。Pipeline 的编排开销只在复杂任务上才值得。 人类在回路里的位置 Pipeline 不是全自动的。编排者(Claude Code 主线程)负责调度和裁决,但有一类决策必须升级给人: 需求歧义 :代理之间的分歧根因是需求没说清楚,不是方案选择问题。这种情况再多轮辩论也没用,必须问人。 方案取舍 :同一需求下的不同实现路径,编排者按 rubric 自行裁决,把理由写进报告。 这条规则取代了"N 轮后升级"的机械阈值。 自演化机制 Pipeline 跑得越多越好用。 每次评审不通过触发返工时,编排者在阶段 5 回答一个问题:这次返工的根因能不能泛化到未来的任务?能的话写进 lessons.md ,格式是触发条件 + 原则 + 具体改动。下次启动时这条教训自动注入所有代理的 system prompt,同样的错不会犯第二次。 当某条教训因模型升级不再需要时,标注删除日期和原因,保留审计痕迹。 目前已沉淀 8 条教训,覆盖 rubric 歧义消解、执行者报告落盘、Codex 越权防护、聚合文件合并协议等实战场景。 pipeline.zip (25.3 KB) 1 个帖子 - 1 位参与者 阅读完整话题

www.ithome.com · 2026-04-20 08:52:56+08:00 · tech

IT之家 4 月 20 日消息,得益于一项革命性的全新独特“虚拟宇宙”视听模拟技术,科学家们已构建出迄今为止最详尽的宇宙演化图景,而你也能亲眼看见、亲耳聆听。 据IT之家了解,COLIBRE 虚拟宇宙项目依托宇宙学标准模型,模拟了寒冷星系尘埃与气体的运动规律 —— 这些物质是恒星的构成基石,模拟时间跨度从宇宙大爆炸后的最初十亿年一直延续至今日。凭借远超以往其他宇宙模拟项目的算力支撑, COLIBRE 构建出的合成宇宙,与詹姆斯 · 韦布空间望远镜(JWST)观测到的早期宇宙景象高度吻合 。该研究也由此验证了宇宙学标准模型,即 Λ 冷暗物质(ΛCDM)模型。 更令人惊叹的是,这个合成宇宙逼真到就连不少天文学家都为之惊叹。 “看着从我们计算机中诞生的‘星系’,与真实星系几乎毫无二致,还具备天文学家在实测数据中观测到的诸多特征,比如数量、光度、颜色和大小,这实在令人振奋。”COLIBRE 团队成员卡洛斯 · 弗伦克在一份声明中表示,“我总爱打趣观测领域的同事,问他们:‘你觉得这些图像出自哪个星系星表?’最了不起的是,我们仅通过求解膨胀宇宙中的相关物理方程,就构建出了这个合成宇宙。” 该模拟在杜伦大学的 COSMA8 超级计算机上运行,攻克了其他项目难以逾越的难题:冷气体建模。而这一建模之所以至关重要,是因为恒星由冷气体和尘埃在自身引力作用下坍缩形成 —— 想要精准模拟恒星,就必须先精准模拟冷气体的运动。COLIBRE 还成功模拟了微小尘埃颗粒,以及尘埃在促进氢分子形成、阻挡紫外线方面的作用,而紫外线会抑制气体冷却并阻碍恒星诞生。 “真实星系中的大部分气体都寒冷且布满尘埃,但此前绝大多数大型模拟项目都不得不忽略这一点。”荷兰莱顿大学的 COLIBRE 项目负责人约普 · 沙耶在声明中称,“借助 COLIBRE,我们终于将这些关键组成部分纳入研究范畴。” 不过,尽管这些虚拟宇宙模型已十分完善,却仍无法解开詹姆斯 · 韦布空间望远镜发现的一个宇宙谜题 —— 该设备在宇宙某一时期观测到大量所谓的“小红点”天体。 这些神秘天体在宇宙大爆炸 6 亿年后大量出现,却在宇宙演化至约 15 亿年时消失无踪,它们或许是大质量黑洞的种子。 该项目的大部分模拟工作已于 2025 年完成,部分模拟仍在持续进行,而已获取的数据需要数年时间才能完成分析。 “我们不仅对这项科学研究本身感到兴奋,更对探索宇宙的全新方式充满期待。”英国朴茨茅斯大学的詹姆斯 · 特雷福德在声明中表示,他主导了 COLIBRE 项目尘埃模型的研发与可视化成果的音频化工作。“这些工具或将带来全新发现,让天文学领域更易被大众理解,也能帮助我们直观认知星系的成长与演化规律。” COLIBRE 相关研究成果已于当地时间 4 月 13 日发表在《皇家天文学会月报》期刊上。 参考资料: https://academic.oup.com/mnras/article/548/1/stag375/8650959 ?login=false