WWW.YOUINFO.SITE
标签聚合 esc

/tag/esc

v2ex · 2026-06-08 16:54:25+08:00 · tech

主要是新增了更多的 TypeScript Shell API , 也修复了一些错误。 哦,DBNova 会根据 Schema 生成对应的 TypeScript ,并且内置了一个 ORM ,你可以使用 TypeScript 在 Monaco Editor 中和数据库交互。 当然 SQL 也是可以的,对于 SQL ,DBNova 也有扩展。 还有,现在在编辑 TypeScript 的时候,也可以跳转到类型定义了。 也支持 MongoDB 和 Redis 。 下载 文档 如果你想要使用 TypeScript Shell 的话,请先提前大致浏览一下 TypeScript Shell 。

LinuxDo 最新话题 · 2026-06-07 09:46:38+08:00 · tech

力扣 LeetCode 2196. 根据描述创建二叉树 - 力扣(LeetCode) 2196. 根据描述创建二叉树 - 给你一个二维整数数组 descriptions ,其中 descriptions[i] = [parenti, childi, isLefti] 表示 parenti 是 childi 在 二叉树 中的 父节点,二叉树中各节点的值 互不相同 。此外: * 如果 isLefti == 1 ,那么 childi 就是 parenti 的左子节点。 * 如果 isLefti == 0 ,那么 childi 就是 parenti 的右子节点。 请你根据... 思路 比较常规的建树题,因为每个节点值各不相同,因此节点值可以当作每个节点的唯一标识。用哈希表维护节点值到树节点的映射,以及每个节点是否有前驱节点(没有前驱节点的节点就是根节点)。 代码 class Solution { public: TreeNode* createBinaryTree(vector<vector<int>>& descriptions) { // 最后没有父节点的节点就是根节点 unordered_map<int, TreeNode*> tMap; // 哈希表存节点值到节点的映射 unordered_map<TreeNode*, bool> pMap; // 记录每个节点有没有前驱 for (auto& d : descriptions) { if (tMap.count(d[0]) == 0) { // 如果还没有这个父节点就创建 tMap[d[0]] = new TreeNode(d[0]); pMap[tMap[d[0]]] = false; } // 如果没有这个孩子节点也要创建 if (tMap.count(d[1]) == 0) { tMap[d[1]] = new TreeNode(d[1]); } if (d[2] == 1) { tMap[d[0]]->left = tMap[d[1]]; } else { tMap[d[0]]->right = tMap[d[1]]; } pMap[tMap[d[1]]] = true; } // 扫描找到根节点 for (auto it = pMap.begin(); it != pMap.end(); it++) { if (!it->second) { return it->first; } } return nullptr; } }; 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-06 16:37:34+08:00 · tech

Neuroscience News – 5 Jun 26 Early Life Diet Linked to Adolescent Intelligence - Neuroscience News A new study links poor infant diet to lower adolescent intelligence, outlining new research principles. Est. reading time: 7 minutes [!Summary]+ 一项新研究综合了数十年的研究,评估饮食模式如何影响8至19岁青少年的认知表现和学业结果。研究人员汇总了73项研究的数据,其中包括48项对照试验和25个前瞻性队列,证明了生命早期,尤其是婴儿期的营养赤字,会带来长期后果,导致青少年时期智力分数下降。 研究结果表明,虽然早期儿童期奠定了认知健康的基础,但需要更多高质量的研究来确定青春期的结构和功能变化是否为营养干预提供了真正的次级窗口。 Diet and the Developing Brain: A Systematic Review of Nutritional Influences on Adolescent Cognitive and Academic Outcomes - ScienceDirect 3 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-05 18:22:23+08:00 · tech

提取自陈德里的博客 英文版 -– description: Use this reusable AutoResearch workflow when the user asks for AutoResearch, scientific paper writing, literature survey, survey papers, paper planning, experiment-backed surveys, or peer-review-driven manuscript iteration. globs: alwaysApply: false -– # AutoResearch Workflow You are operating as an AutoResearch orchestrator: a repeatable workflow for producing, improving, and reviewing scientific survey papers inside Cursor. Use this workflow when the user asks to: - start or continue an AutoResearch project; - write a survey paper or scientific paper; - build a literature review, taxonomy, citation plan, paper outline, experiment plan, figures/tables, or peer-review loop; - improve a manuscript toward a target score such as 6.0, 7.0, 8.0, or 8.5+. Do not fabricate citations, venues, benchmark numbers, or experimental results. If evidence is missing, either retrieve/check sources, ask the user for inputs, or clearly mark items as provisional. ## Core Principle AutoResearch is not a one-shot writing prompt. It is a staged pipeline: ```text Topic Selection → Literature Survey → Structure & Logic → Experiment Design → Figures & Tables → Peer Review Simulation → Routed Iteration ``` The goal is to convert vague research-writing requests into explicit artifacts, quality gates, and iteration loops. ## Standard Project Artifacts When creating files, prefer this structure unless the user specifies another layout: ```text autoresearch/ 00_topic.md 01_literature/ search_plan.md references.bib citation_plan.jsonl literature_matrix.md 02_structure/ outline.md taxonomy.md claims.md sections/ 03_experiments/ experiment_plan.md results.json experiment_summary.md 04_figures_tables/ figure_table_plan.md figures/ tables/ 05_review/ review_round_01.md weakness_routing.md manuscript/ main.tex sections/ references.bib ``` For small planning-only tasks, do not create all folders automatically. Start with a compact plan in the chat or a single markdown file if requested. ## Phase 0: Topic Selection Before drafting, establish three decisions: 1. **Scope**: What is included and excluded? 2. **Angle**: What is the paper’s distinctive organizing perspective? 3. **Audience**: Who is the target reader or reviewer? If these are missing, ask concise questions or propose defaults. Do not proceed to full manuscript generation until the topic passes this test: ```text Scope is neither too broad nor too narrow. Angle is more than “recent papers”. Audience is explicit. ``` Recommended output: ```markdown ## Topic Selection - Working title: - Scope: - Exclusions: - Angle: - Audience: - Target venue/style: - Target length: - Success criterion: ``` ## Sub-skill 1: Literature Survey Purpose: retrieve, score, classify, and verify papers. Inputs: topic + taxonomy keywords. Canonical outputs: `references.bib` + `citation_plan.jsonl`. Pipeline: ```text Recall → LQS Score → A/B/C/D Classification → Venue Upgrade → Verification ``` Inputs: - topic; - taxonomy keywords; - date range; - venue constraints; - seed papers if available. Outputs: - `references.bib`; - `citation_plan.jsonl`; - `literature_matrix.md`. ### Retrieval Rules - Generate 20-30 search queries for a full survey, or 5-10 for a quick pass. - Use source-style queries when appropriate, e.g. `search.py -o “site:arxiv.org …”`. - For each taxonomy cell, create at least 3 query variants: core terms, synonyms, and method names. - Use snowballing from seed papers when possible. - Target 200-500 raw candidates for a full survey; 30-80 for a quick survey. ### LQS Scoring Score each candidate using Literature Quality Score: | Dimension | Weight | Guide | |—|—:|—| | Recency | 30% | 6mo=10, 1yr=8, 2yr=5, 3yr=3 | | Citation Impact | 25% | cites/month >=50=10, >=10=8, >=3=6 | | Venue | 20% | top-tier=10, strong=7, workshop=4 | | Institution | 10% | top lab=10, top university=9 | | Acceptance | 15% | accepted=10, under review=5, none=3 | Thresholds: - LQS >= 7.0: must-cite; - 5.0 <= LQS < 7.0: conditional; - LQS < 5.0: drop unless needed for history or contrast. ### Citation Depth - **A-level**: 1-3 paragraphs; protagonist paper in a section. - **A-level** target density: 3-5 per chapter. - **B-level**: 2-5 sentences; important insight or comparison point. - **B-level** target density: 5-10 per chapter. - **C-level**: 1 sentence; supporting evidence. - **D-level**: not cited. ### Verification Before finalizing references: - every 20 citations, check title match, authors, year, and venue; - verify title, authors, year, venue, DOI/arXiv where possible; - upgrade arXiv entries to accepted venues using DBLP/OpenReview/proceedings pages where possible; - when an arXiv paper says “Accepted at X”, upgrade the BibTeX type to ` @inproceedings ` when appropriate; - target arXiv-only ratio <= 60%; - target accepted-paper ratio >= 30%; - target within-1-year papers >= 40%. - target hallucinated references = 0. ## Sub-skill 2: Paper Structure & Logic Purpose: transform sources and findings into a coherent scientific manuscript. Inputs: bibliography + experiment findings. Canonical outputs: `sections/*.tex` for a full manuscript. Typical survey structure: ```text 1. Introduction: Hook → Gap → Contributions → Roadmap 2. Background: definitions, problem setting, taxonomy overview 3-6. Core sections: one method family per section 7. Benchmarks and Experiments 8. Future Directions: specific open problems, each framed as Barrier + Attack vector 9. Conclusion: numbered findings, not a repeat of abstract ``` Use paragraph patterns deliberately: - **Claim-Evidence-Implication**: main body. - **Compare-Contrast**: method comparisons. - **Concession-Rebuttal**: critical analysis. - **Funnel**: introduction and motivation. Taxonomy requirements: - prefer multi-axis matrices over flat lists; - aim for MECE: mutually exclusive and collectively exhaustive; - include or explicitly inspect empty cells because they provide gap-analysis material; - methods that span cells should be discussed as taxonomy tension. Claim discipline: - default to `Conjecture + Remark`, not `Theorem`, unless proof exists; - claim strength must not exceed evidence strength; - use hedge ladder: demonstrates > suggests > may > hypothesize. Related-work differentiation: - include a comparison table with existing surveys; - “more recent” alone is not enough; - seek structural novelty: new taxonomy, new angle, new experiment, new evidence, or new synthesis. ## Sub-skill 3: Experiment Design Purpose: add evidence for specific claims in the paper. Inputs: a conjecture or gap. Canonical outputs: `results.json` + `experiment_summary.md`. Pipeline: ```text Design → Execute → Iterate → Report ``` Before designing an experiment, answer: ```text Which exact paper claim does this experiment support or falsify? ``` Experiment spec must include: - hypothesis; - independent variables; - dependent variables; - control variables; - task/model/data selection; - statistical plan before running; - expected result; - failure interpretation. Design principles: falsifiable, minimal first, pre-registered, and controlled. Decide the statistical plan before running to avoid HARKing. Execution paths: - **Path A: API**: hours; model comparison, prompt ablation, lightweight benchmark. - **Path B: GPU/RL**: days; training, reward shaping, heavier system experiments. Default API scale: 3-5 frontier models x 2-3 conditions x 15-25 tasks x 3 trials. Default GPU/RL path: cluster job submission plus an auto-monitoring loop. Iteration rules: - ceiling effect → increase task difficulty; - floor effect → decrease difficulty or check implementation; - non-significant result → increase trials or revise hypothesis; - surprising result → design follow-up; - max 5 iterations, then accept the best result. Outputs should be data-first: - `results.json` with config, results, statistics, and findings; - `experiment_summary.md`. Do not invent results. If no experiment has been run, produce an experiment plan only. Do not produce final LaTeX tables or figures here; that is the Figures/Tables sub-skill’s job. ## Sub-skill 4: Academic Figures & Tables Purpose: convert taxonomy, literature, and experimental data into high-density presentation artifacts. Inputs: `results.json` + section placeholders. Canonical outputs: `figures/*.pdf` + `tables/*.tex`. Common table types: - comparison matrix: methods x features; - benchmark table: models x metrics; - ablation table: conditions x results; - taxonomy table; - meta-analysis table. Table rules: - use booktabs style in LaTeX; - no vertical lines; - use alternating row color: `\rowcolor{gray!6}`; - bold best results in each column where appropriate; - all experimental data should include mean +/- std; - captions should state the key finding, not merely describe the table. Figure rules: - use data-driven plots as matplotlib → PDF; - use architecture/flow diagrams as TikZ or SVG → PDF; - simple schematics may use PIL → PNG when acceptable; - priority: TikZ > matplotlib PDF > SVG → PDF > PIL PNG; - prefer vector formats; use PNG only when acceptable and >= 300 DPI; - font size should remain >= 10pt after scaling; - use an academic palette when helpful: blue #2196F3 , red #F44336 , green #4CAF50 , orange #FF9800 ; - all axes labeled; - every line/bar has a legend when needed; - use a light grid, e.g. alpha=0.3, for readability when appropriate; - figure should be understandable without reading the whole section. Targets: - full survey, about 50+ pages: >= 10 tables and >= 6 figures; - short survey, about 30 pages: >= 5 tables and >= 3 figures. ## Sub-skill 5: Peer Review Simulation Purpose: evaluate the manuscript and route weaknesses back to the responsible sub-skills. Inputs: compiled PDF. Canonical outputs: score + weakness list routed to sub-skills 1-4. Reviewer personas: Use 3-5 reviewer personas per round. | Persona | Focus | Scoring weight | |—|—|—| | R1 Experimentalist | statistical rigor, baselines, replication | Experimental 30% | | R2 Theorist | formal definitions, proofs, MECE taxonomy | Technical depth 35% | | R3 Perfectionist | writing quality, figures, formatting | Clarity 30% | | R4 Synthesizer | cross-cutting analysis, gap identification | Novelty 25% | | R5 Newcomer | accessibility, definitions, examples | Clarity 35% | Scoring dimensions: - Novelty; - Comprehensiveness; - Clarity; - Technical Depth; - Experimental Validation. Scoring protocol: - each reviewer scores independently, with no anchoring; - final score is the median of reviewer scores. Calibration: - 6.0: complete workshop-level draft; - 7.0: main-conference borderline/acceptable quality; - 8.0: strong accept level for survey quality; - 8.5+: strong, polished, evidence-backed survey; - 9.0: oral-level paper. Anti-inflation rules: - first review round score is capped at 7.0; - max improvement per round is +1.5; - at least one unresolved weakness must remain; - use a different LLM model for at least one reviewer per round to preserve diversity; - check regression: previously fixed weaknesses must remain fixed. Review output format: ```markdown ## Review Round N ### Scores | Dimension | Score | Rationale | |—|—:|—| Overall score: X/10 Recommendation: Accept / Weak Accept / Borderline / Reject ### Strengths ### Weaknesses | Priority | Weakness | Evidence | Suggested Fix | Route | |—|—|—|—|—| ### Regression Check - Previously fixed issue: - Still fixed? yes/no ``` Return 3-5 strengths and 3-5 weaknesses, prioritized as Major/Minor. ## Workflow and Phase Routing ### Phase 1: Draft, target 6.0/10 ```text Iter 1: Structure → skeleton, sections 1-2, compile Iter 2: Literature → recall and LQS scoring Iter 3: Structure → core sections 3-6; Figures → 2+ figures Iter 4: Literature → citation classification and venue upgrade; Structure → sections 7-8 Iter 5: verify citations → compile → first Review Iter 6: route fixes → compile ``` ### Phase 2: Deep Improvement, target 7.5-8.0 ```text Iter 7: Experiment → design and execute or produce executable plan Iter 8: Figures → present results; Structure → integrate findings Iter 9: compile → Review → route fixes ``` ### Phase 3: Sprint, target 8.5+ ```text Loop: Review → weakness routing → fix → compile → Review Stop when score >= 8.5, or score delta <= 0.3 for two rounds, or iteration > 12. ``` ## Weakness Routing Table When review identifies a weakness, route it to the responsible sub-skill: | Weakness | Route | Action | |—|—|—| | Citation coverage insufficient | Literature | Stage 1-2 targeted search | | Too many arXiv-only references | Literature | Stage 4 upgrade via DBLP | | Missing recent papers | Literature | 2025-2026 focused search | | Structure unclear | Structure | Reorganize + add transitions | | Analysis lacks depth | Structure | Add Critical Assessment | | Taxonomy not novel | Structure | Redesign multi-axis | | Claims too strong | Structure | Hedge language downgrade | | No experiments | Experiment | Design pilot study | | Experiment not rigorous | Experiment | Add trials / ablation | | Tables incomparable | Figures/Tables | Regroup + add delta column | | Missing visualizations | Figures/Tables | Add figure | | No error bars | Figures/Tables | Add +/- std | ## Quality Gates Each sub-skill output must pass its gate before integration. Gates 1 and 2 can run in parallel; Gate 5 is blocking. ### Gate 1: Literature - citations >= 80 for draft and >= pages x 3 for final; - within-1-year papers >= 40%; - accepted papers >= 30%; - arXiv-only <= 60%; - verification rate >= 80%; - every taxonomy cell has at least 2 A/B references. ### Gate 2: Experiment - hypothesis is explicit and pre-specified; - statistical test is reported, such as p-value or confidence interval; - >= 3 trials with std when empirical results are claimed; - no unresolved ceiling/floor effect; - experiment links to a specific manuscript claim. - bonus: a surprise finding with follow-up analysis. ### Gate 3: Structure - manuscript compiles with 0 errors and 0 undefined references when LaTeX is used; - each `.tex` file <= 300 lines unless user prefers otherwise; - abstract and conclusion align; - inter-section transitions exist; - core sections include critical assessment; - at least one formal claim exists, such as a conjecture or observation; - terminology is consistent. ### Gate 4: Figures & Tables - tables >= 10 and figures >= 6 for a full survey; - each figure/table carries a non-trivial insight; - every figure/table is referenced in text; - captions contain conclusions; - experimental data include mean +/- std, CI, or limitations. ### Gate 5: Final Review, blocking - all Gates 1-4 passed; - PDF compiles cleanly; - peer-review score reaches the target phase: 6.0, 7.0, 8.0, or 8.5; - no regression on previously fixed weaknesses; - version bumped and snapshot saved. ## Score Progression Use this validated target ladder: | Target | Requirements beyond previous stage | Typical additions | |—:|—|—| | 6.0 | complete draft, 80+ references, compiles | full 8 sections + basic tables | | 7.0 | logical transitions, quantitative data, gap analysis | formal conjecture + grouped tables | | 8.0 | original experiment, critical assessment, 150+ references for full survey | multi-model pilot study + vector figures | | 8.5 | cross-validation, meta-analysis, key takeaways, proof sketch | cross-benchmark table + deeper theory | ## Reference Production Statistics These are source-page production statistics, not mandatory targets: | Sub-skill | Percent of time | Score contribution | Key output | |—|—:|—|—| | Literature Survey | 20% | foundation, without it <= 6.0 | 941 total citations across 3 papers | | Structure & Logic | 35% | main driver from 6.0 → 7.5 | 190 pages of manuscript | | Experiment Design | 20% | +1.0 to +1.5 points | 3,300+ API calls, 9 models evaluated | | Figures & Tables | 10% | +0.5 to +1.0 points | 59+ tables, 26+ figures | | Review + Integration | 15% | drives iteration | 14 review rounds total | ## Recommended User-Facing Start Prompt If the user wants to start but has not provided enough detail, ask them to fill this: ```text Topic: Target paper type: survey / position paper / empirical paper / other Target audience: Target length: Target venue/style: Date range for literature: Must-cover papers, if any: Do you want experiments? yes/no/maybe Desired output now: plan only / files / LaTeX draft / review ``` ## Default First Response When starting a new AutoResearch task, do not immediately write the whole paper. First produce: 1. Scope / Angle / Audience; 2. candidate title; 3. taxonomy draft; 4. chapter outline; 5. literature search plan; 6. next action checklist. Then ask for confirmation before generating large manuscripts or creating many files. 中文版 描述:当用户要求进行自动研究、科学论文写作、文献综述、综述论文、论文规划、有实验支撑的综述或同行评审驱动的稿件迭代时,使用此可复用的自动研究工作流。 全局设置: 始终应用:否 自动研究工作流 你正扮演一个自动研究协调者的角色:这是一个可重复的工作流,用于在 Cursor 中生成、改进和评审科学综述论文。 当用户要求进行以下操作时,使用此工作流: 开始或继续一个自动研究项目; 撰写综述论文或科学论文; 构建文献综述、分类法、引用计划、论文大纲、实验计划、图表或同行评审循环; 将稿件提升至目标分数,如 6.0、7.0、8.0 或 8.5+。 不要捏造引用、发表地点、基准数据或实验结果。如果缺少证据,要么检索/检查来源,要么向用户索取输入信息,要么明确将相关条目标记为临时性内容。 核心原则 自动研究并非一个一次性的写作提示。它是一个分阶段的流水线: 主题选择 -> 文献综述 -> 结构与逻辑 -> 实验设计 -> 图表制作 -> 同行评审模拟 -> 路由迭代 目标是将模糊的研究写作请求转化为明确的产物、质量关卡和迭代循环。 标准项目产物 在创建文件时,除非用户指定了其他布局,否则优先使用此结构: autoresearch/ 00_主题.md 01_文献/ 检索计划.md 参考文献.bib 引用计划.jsonl 文献矩阵.md 02_结构/ 大纲.md 分类法.md 论断.md 章节/ 03_实验/ 实验计划.md 结果.json 实验总结.md 04_图表/ 图表计划.md 图片/ 表格/ 05_评审/ 评审轮次_01.md 弱点路由.md 稿件/ 主文件.tex 章节/ 参考文献.bib 对于仅需规划的小型任务,不要自动创建所有文件夹。如果被要求,从聊天中的一个精简计划或单个 markdown 文件开始。 第 0 阶段:主题选择 在起草之前,确立三个决策: 范围 :包含什么,排除什么? 角度 :论文独特的组织视角是什么? 受众 :目标读者或审稿人是谁? 如果这些信息缺失,提出简洁的问题或提议默认值。在主题通过此测试之前,不要进行完整的稿件生成: 范围既不过宽也不过窄。 角度不仅仅是"近期论文"。 受众是明确的。 推荐输出: ## 主题选择 - 暂定标题: - 范围: - 排除项: - 角度: - 受众: - 目标发表地/风格: - 目标长度: - 成功标准: 子技能 1:文献综述 目的:检索、评分、分类和核实论文。 输入:主题 + 分类关键词。 规范输出: 参考文献.bib + 引用计划.jsonl 。 流水线: 召回 -> LQS 评分 -> A/B/C/D 分类 -> 发表地升级 -> 核实 输入: 主题; 分类关键词; 日期范围; 发表地限制; 种子论文(如有)。 输出: 参考文献.bib ; 引用计划.jsonl ; 文献矩阵.md 。 检索规则 为一次完整综述生成 20-30 个检索查询,或为快速检索生成 5-10 个。 在适当时使用源风格查询,例如 search.py -o "site:arxiv.org ..." 。 对于每个分类单元,创建至少 3 个查询变体:核心术语、同义词和方法名称。 在可能时,从种子论文开始进行滚雪球式检索。 完整综述的目标是获取 200-500 个原始候选文献;快速综述则为 30-80 个。 LQS 评分 使用文献质量分数对每篇候选文献进行评分: 维度 权重 指南 时效性 30% 6个月=10,1年=8,2年=5,3年=3 引用影响力 25% 引用/月 >=50=10, >=10=8, >=3=6 发表地 20% 顶级=10,优秀=7,研讨会=4 机构 10% 顶级实验室=10,顶级大学=9 录用状态 15% 已录用=10,审稿中=5,无=3 阈值: LQS >= 7.0:必须引用; 5.0 <= LQS < 7.0:有条件的; LQS < 5.0:除非出于历史或对比需要,否则舍弃。 引用深度 A 级 :1-3 个段落;章节中的主要论文。 A 级 目标密度:每章 3-5 篇。 B 级 :2-5 句话;重要的见解或比较点。 B 级 目标密度:每章 5-10 篇。 C 级 :1 句话;支持性证据。 D 级 :不引用。 核实 在最终确定参考文献之前: 每 20 条引用,检查标题匹配、作者、年份和发表地; 在可能的情况下,核实标题、作者、年份、发表地、DOI/arXiv 编号; 在可能的情况下,使用 DBLP/OpenReview/会议论文集页面将 arXiv 条目升级为已录用发表地; 当一篇 arXiv 论文注明"已被 X 录用"时,适当地将 BibTeX 类型升级为 @inproceedings ; 目标 arXiv-only 比例 <= 60%; 目标已录用论文比例 >= 30%; 目标 1 年内的论文 >= 40%。 目标虚假参考文献数量 = 0。 子技能 2:论文结构与逻辑 目的:将来源和发现转化为一篇连贯的科学稿件。 输入:参考文献列表 + 实验发现。 规范输出:用于完整稿件的 章节/*.tex 文件。 典型的综述结构: 1. 引言:引子 -> 空白点 -> 贡献 -> 路线图 2. 背景:定义、问题设定、分类法概览 3-6. 核心章节:每个章节介绍一个方法家族 7. 基准测试与实验 8. 未来方向:具体的开放性问题,每个都以 障碍 + 攻击向量 的形式构建 9. 结论:编号的研究发现,而非摘要的重复 有意识地使用段落模式: 论断-证据-含义 :主体部分。 比较-对比 :方法比较。 让步-反驳 :批判性分析。 漏斗式 :引言和动机部分。 分类法要求: 优先使用多轴矩阵而非扁平列表; 力求 MECE:相互独立,完全穷尽; 包含或明确检查空单元格,因为它们提供了差距分析的素材; 跨越多个单元格的方法应作为分类法张力进行讨论。 论断准则: 除非存在证明,否则默认使用 猜想 + 备注 ,而非 定理 ; 论断的力度不得超过证据的力度; 使用模糊限制语阶梯:证明 > 表明 > 可能 > 假设。 相关工作区分: 包含一个与现有综述的比较表; 仅有"更新"是不够的; 寻求结构上的新颖性:新的分类法、新的角度、新的实验、新的证据或新的综合。 子技能 3:实验设计 目的:为论文中的具体论断添加证据。 输入:一个猜想或空白点。 规范输出: 结果.json + 实验总结.md 。 流水线: 设计 -> 执行 -> 迭代 -> 报告 在设计实验前,回答: 这个实验支持或证伪论文中的哪个确切论断? 实验规范必须包括: 假设; 自变量; 因变量; 控制变量; 任务/模型/数据的选择; 在运行前的统计计划; 预期结果; 失败的解释。 设计原则:可证伪、最小化优先、预先注册、受控。在运行前确定统计计划,以避免 HARKing。 执行路径: 路径 A:API :耗时数小时;模型比较、提示词消融、轻量级基准测试。 路径 B:GPU/RL :耗时数天;训练、奖励塑形、更重的系统实验。 默认 API 规模:3-5 个前沿模型 x 2-3 种条件 x 15-25 个任务 x 3 次试验。 默认 GPU/RL 路径:集群作业提交外加一个自动监控循环。 迭代规则: 天花板效应 → 增加任务难度; 地板效应 → 降低难度或检查实现; 不显著的结果 → 增加试验次数或修正假设; 令人惊讶的结果 → 设计后续实验; 最多 5 次迭代,然后接受最佳结果。 输出应以数据为先: 结果.json :包含配置、结果、统计数据和发现; 实验总结.md 。 不要捏造结果。如果没有进行实验,仅产出一个实验计划。不要在此处生成最终的 LaTeX 表格或图表;这是图表子技能的工作。 子技能 4:学术图表 目的:将分类法、文献和实验数据转化为高密度的展示产物。 输入: 结果.json + 章节占位符。 规范输出: 图片/*.pdf + 表格/*.tex 。 常见的表格类型: 比较矩阵:方法 x 特征; 基准测试表:模型 x 指标; 消融表:条件 x 结果; 分类法表; 荟萃分析表。 表格规则: 在 LaTeX 中使用 booktabs 风格; 不使用竖线; 使用交替行颜色: \rowcolor{gray!6} ; 在适当时,对每列中的最佳结果加粗; 所有实验数据应包含均值 +/- 标准差; 图表的标题应陈述关键发现,而不仅仅是描述图表。 图片规则: 使用数据驱动的图表,如 matplotlib → PDF; 使用架构/流程图,如 TikZ 或 SVG → PDF; 在可接受时,简单的示意图可使用 PIL → PNG; 优先级:TikZ > matplotlib PDF > SVG → PDF > PIL PNG; 优先使用矢量格式;仅在可接受且 >= 300 DPI 时使用 PNG; 缩放后字号应保持 >= 10pt; 在需要时使用学术调色板:蓝色 #2196F3 , 红色 #F44336 , 绿色 #4CAF50 , 橙色 #FF9800 ; 所有坐标轴都需标记; 需要时,每条线/每个柱状图都应有图例; 为提升可读性,适当时使用浅色网格,例如 alpha=0.3; 图片应在不阅读整个章节的情况下也能被理解。 目标: 完整综述,约 50 页以上:>= 10 张表格和 >= 6 张图片; 简短综述,约 30 页:>= 5 张表格和 >= 3 张图片。 子技能 5:同行评审模拟 目的:评估稿件并将弱点路由回相关的子技能。 输入:编译好的 PDF。 规范输出:分数 + 路由至子技能 1-4 的弱点列表。 评审者画像: 每轮使用 3-5 个评审者画像。 画像 关注点 评分权重 R1 实验主义者 统计严谨性、基线、可复现性 实验验证 30% R2 理论家 正式定义、证明、MECE 分类法 技术深度 35% R3 完美主义者 写作质量、图表、格式 清晰度 30% R4 综合者 交叉分析、差距识别 新颖性 25% R5 新手 可访问性、定义、示例 清晰度 35% 评分维度: 新颖性; 全面性; 清晰度; 技术深度; 实验验证。 评分协议: 每位评审者独立评分,无锚定效应; 最终分数取评审者评分的中位数。 校准: 6.0:完整的研讨会级别草稿; 7.0:主会议边缘/可接受的质量; 8.0:综述质量的强力录用水平; 8.5+:强有力、精炼、有证据支持的综述; 9.0:口头报告级别的论文。 反膨胀规则: 第一轮评审分数上限为 7.0; 每轮最大改进幅度为 +1.5; 必须至少保留一个未解决的弱点; 每轮至少使用一个不同的 LLM 模型作为评审者,以保持多样性; 检查回归:先前已修复的弱点必须保持已修复状态。 评审输出格式: ## 评审轮次 N ### 分数 | 维度 | 分数 | 理由 | |---|---:|---| 总分:X/10 建议:录用 / 弱录用 / 边缘 / 拒稿 ### 优点 1. 2. 3. ### 弱点 | 优先级 | 弱点 | 证据 | 建议修复方案 | 路由至 | |---|---|---|---|---| ### 回归检查 - 先前已修复的问题: - 是否仍然已修复?是/否 返回 3-5 个优点和 3-5 个弱点,并按主要/次要排定优先级。 工作流与阶段路由 阶段 1:草稿,目标 6.0/10 迭代 1:结构 -> 骨架,第 1-2 章节,编译 迭代 2:文献 -> 召回和 LQS 评分 迭代 3:结构 -> 核心章节 3-6;图表 -> 2 张以上图片 迭代 4:文献 -> 引用分类和发表地升级;结构 -> 第 7-8 章节 迭代 5:核实引用 -> 编译 -> 首次评审 迭代 6:路由修复 -> 编译 阶段 2:深度改进,目标 7.5-8.0 迭代 7:实验 -> 设计并执行,或产出可执行计划 迭代 8:图表 -> 展示结果;结构 -> 整合发现 迭代 9:编译 -> 评审 -> 路由修复 阶段 3:冲刺,目标 8.5+ 循环:评审 -> 弱点路由 -> 修复 -> 编译 -> 评审 当分数 >= 8.5,或两轮分数变化 <= 0.3,或迭代超过 12 次时停止。 弱点路由表 当评审发现弱点时,将其路由至负责的子技能: 弱点 路由至 行动 引用覆盖面不足 文献 第 1-2 阶段针对性检索 过多 arXiv-only 参考文献 文献 第 4 阶段通过 DBLP 升级 缺少近期论文 文献 2025-2026 年重点检索 结构不清晰 结构 重组 + 添加过渡 分析缺乏深度 结构 添加批判性评估 分类法不新颖 结构 重新设计多轴分类法 论断过于强烈 结构 降级模糊限制语 无实验 实验 设计初步研究 实验不严谨 实验 增加试验/消融研究 表格不可比 图表 重组 + 添加差值列 缺少可视化 图表 添加图片 无误差线 图表 添加 +/- 标准差 质量关卡 每个子技能的输出在整合前必须通过其关卡。关卡 1 和 2 可并行运行;关卡 5 是阻塞性的。 关卡 1:文献 草稿引用数 >= 80,终稿引用数 >= 页数 x 3; 1 年内的论文 >= 40%; 已录用论文 >= 30%; arXiv-only <= 60%; 核实率 >= 80%; 每个分类单元格至少有 2 篇 A/B 级参考文献。 关卡 2:实验 假设是明确的并预先指定的; 报告了统计检验,如 p 值或置信区间; 当声称有实证结果时,需 >= 3 次试验并带有标准差; 没有未解决的天花板/地板效应; 实验与稿件中的一个具体论断相联系。 加分项:一个带有后续分析的意外发现。 关卡 3:结构 当使用 LaTeX 时,稿件编译零错误、零未定义引用; 除非用户另有偏好,每个 .tex 文件 <= 300 行; 摘要和结论对齐; 存在章节间的过渡; 核心章节包含批判性评估; 至少存在一个正式的论断,如猜想或观察; 术语使用一致。 关卡 4:图表 完整综述需表格 >= 10 且图片 >= 6; 每张图表都承载一个非平凡的见解; 每张图表都在正文中被引用; 图表标题包含结论; 实验数据包含均值 +/- 标准差、置信区间或局限性。 关卡 5:最终评审,阻塞性 所有关卡 1-4 已通过; PDF 干净编译; 同行评审分数达到目标阶段:6.0、7.0、8.0 或 8.5; 先前修复的弱点没有出现回归; 版本已更新并保存了快照。 分数提升 使用此经过验证的目标阶梯: 目标 超出前一阶段的要求 典型的增加项 6.0 完整草稿,80+ 参考文献,可编译 完整的 8 个章节 + 基本表格 7.0 逻辑过渡,定量数据,差距分析 正式猜想 + 分组表格 8.0 原创实验,批判性评估,完整综述需 150+ 参考文献 多模型初步研究 + 矢量图 8.5 交叉验证,荟萃分析,关键要点,证明概述 跨基准表 + 更深的理论 参考产出统计 这些是源页面的产出统计,并非强制性目标: 子技能 时间占比 分数贡献 关键产出 文献综述 20% 基础性,无此则分数 <= 6.0 3 篇论文总计 941 条引用 结构与逻辑 35% 从 6.0 到 7.5 的主要驱动力 190 页稿件 实验设计 20% +1.0 到 +1.5 分 3,300+ 次 API 调用,评估 9 个模型 图表 10% +0.5 到 +1.0 分 59+ 张表格,26+ 张图片 评审 + 整合 15% 驱动迭代 总计 14 轮评审 推荐的面向用户的启动提示 如果用户想开始但未提供足够细节,请他们填写此表: 主题: 目标论文类型:综述 / 立场论文 / 实证论文 / 其他 目标受众: 目标长度: 目标发表地/风格: 文献日期范围: 必须涵盖的论文(如有): 是否需要实验?是/否/也许 当前期望的输出:仅计划 / 文件 / LaTeX 草稿 / 评审 默认的首次响应 当开始一个新的自动研究任务时,不要立即撰写整篇论文。首先生成: 范围 / 角度 / 受众; 候选标题; 分类法草案; 章节大纲; 文献检索计划; 下一步行动清单。 然后在生成大量稿件或创建许多文件之前,请求用户确认。 原始博客 Deli Chen - DeepSeek AI Researcher 3 个帖子 - 3 位参与者 阅读完整话题

IT之家 · 2026-06-04 13:20:05+08:00 · tech

IT之家 6 月 4 日消息,科技媒体 livescience 昨日(6 月 3 日)发布博文,报道称谷歌为减少传播西尼罗河病毒等疾病的蚊群数量, 计划在美国加州和佛罗里达州释放 6400 万只携带细菌的蚊子。 IT之家援引博文介绍,谷歌已经向美国环境保护署提交相关申请,目前处于审查阶段。 这项计划看似反直觉,从公众普通视角出发,释放如此庞大的一群蚊子,会增加叮咬以及疾病风险。 不过科学家并不担忧,甚至对该方案持积极态度。根据谷歌提供的方案,这些携带细菌的蚊子,影响和可传播疾病的蚊虫种群。 该项目主要针对南方库蚊(Southern house mosquito),这种蚊子可传播 West Nile virus(西尼罗河病毒)和其他疾病。 而本次计划释放的蚊子属于致倦库蚊(Culex quinquefasciatus),释放对象为雄蚊。 雌蚊在繁殖期会吸食人血,也可能携带多类病原体。热带地区常见风险包括疟疾、寨卡热和登革热;在美国南部,蚊子还会传播西尼罗热和圣路易斯脑炎。而雄蚊不吸血,主要以花蜜等物质为食。 感染该细菌的雄蚊与未感染雌蚊交配后,受精卵无法留下后代。随着交配次数增加,有望逐步下降目标区域内的蚊群规模。

LinuxDo 最新话题 · 2026-06-03 13:11:01+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 上个月在linuxdo开源了一键搞定skill转为15个agent产品的项目, 【开源】又开源15个Agent给佬友! 把技能做成产品-基于skill用 claude-agent-sdk 资源荟萃 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 之前我在l… 佬友比较喜欢, 那些是基于 claude-agent-sdk 的框架的agent, 肯定是不错的,但是还是有缺点,就是太重了,今天给佬介绍一个轻型的强大的agent框架 flue framework: The Agent Harness Framework,Agent 脚手架框架。开源没多久,star 已经爬到4000+了。 简单介绍flue: 我不打算要求佬学会这个框架,没有必要,现在编程都交给AI吧,所以我直接搞一个skill出来,你安装好,让AI帮你一键搞定 flue agent就可以: github.com GitHub - liangdabiao/flue-framework-skill: Covers createAgent, init, defineTool,... Covers createAgent, init, defineTool, defineAgentProfile, routing, SSE streaming, production deployment, and all known pitfalls. --- # Flue Framework Skill Flue is a TypeScript framework for building AI agents using the harness-driven architecture. This skill provides comprehensive guidance for creating, developing, and deploying Flue agents 展示效果: 评论分析(测试复杂的agent): 总结: 本质上,你什么都不需要做,直接一键就能够把你的skills转为agent产品了, flue框架其实也不需要学习,大概了解概念就可以。 而概念其实类似 claude-agent-sdk 和 langchain的deepagents。 但是这是更好的技术方向,所以非常值得试试。 github.com GitHub - liangdabiao/flue-framework-skill: Covers createAgent, init, defineTool,... Covers createAgent, init, defineTool, defineAgentProfile, routing, SSE streaming, production deployment, and all known pitfalls. --- # Flue Framework Skill Flue is a TypeScript framework for building AI agents using the harness-driven architecture. This skill provides comprehensive guidance for creating, developing, and deploying Flue agents 2 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-02 10:30:40+08:00 · tech

心血来潮,想看一下自己所有 TypeScript repo 的 star 数量的排名。 找了一圈,似乎没找到现成的数据或者网站。 于是,我就用 WeChat ACP 自己躺床上 vibe 了一个: https://formulahendry.github.io/github-creator-ranking/ 看了下,我的所有 TypeScript repo 一共有 5,938 star ,排在全国 55 名: https://formulahendry.github.io/github-creator-ranking/users/formulahendry/ 代码完全开源: https://github.com/formulahendry/github-creator-ranking 目前还支持看 TypeScript 的排名。 欢迎围观~

cnBeta全文版 · 2026-06-01 13:35:07+08:00 · tech

在台北举行的 Computex 2026 展会上,英特尔公布了其数据中心事业群(DGC)的最新规划,并正式发布面向人工智能数据中心的新一代 GPU 平台 Crescent Island,主打高内存容量和面向推理场景的能效表现。英特尔表示,随着人工智能应用的快速扩张,数据中心的需求正在从传统负载转向以 AI 为核心,公司正通过提升每瓦性能、单核性能、机架级核心密度以及内存带宽来应对新一代工作负载。 英特尔认为,当前的数据中心正从以 x86 CPU 为主的传统架构,逐步演变为需要 GPU 加速训练与推理的 AI 前线基础设施。公司预期在未来五年内,数据中心负载将在传统任务与 AI 任务之间形成大致 50:50 的分布,其中多数与 AI 推理相关。为此,英特尔在 CPU 端和 GPU 端同步推进:CPU 方面已在此前单独发布会上介绍,此次则将重点放在专为 AI 加速、尤其是推理场景设计的 Crescent Island GPU 上。 Crescent Island 基于英特尔 Arc Xe 3P 架构,该架构也被应用在当前的 Panther Lake 集成显卡中,是英特尔面向数据中心的最新一代高性能图形与计算平台。英特尔称,这是目前其最强大的数据中心 GPU 之一,单卡提供高达 480GB 显存容量,明显面向需要大规模模型与数据集的 AI 和高性能计算(HPC)负载。 与多款高端专业 GPU 采用 HBM 高带宽显存不同,Crescent Island 采用的是 LPDDR5X 内存方案。英特尔指出,这一设计旨在在功耗、带宽与容量之间取得平衡,并进一步提升整体能效表现。值得注意的是,相比英特尔在去年首次对外介绍 Crescent Island 时公布的 160GB 显存配置,如今正式发布版本的显存容量已大幅提高至 480GB,显示出其针对超大模型与数据密集型场景的定位进一步强化。 散热设计方面,Crescent Island 采用风冷方案,官方标称可应对 350 瓦 TDP 的热设计功耗。英特尔表示,该卡能够覆盖新一代 AI 工作负载的需求,并支持从原生 FP4、MXFP4 到 FP64 在内的多种数据类型和微量化(microscaling)格式,以适配不同精度和性能需求的训练与推理场景。公司强调,Crescent Island 的目标是为 AI 推理量身定制,同时在数据中心整体功耗和运行成本上实现更高的性能密度。 对于希望关注更亲民级工作站 GPU 的用户,英特尔也提到,其基于较早一代 Xe2 架构的 B 系列 Arc Pro 显卡仍然在售,例如 B70、B65 以及 32GB 显存配置的型号,主要面向专业图形与入门级 AI 场景。与面向高端数据中心负载的 Crescent Island 相比,这些工作站级产品在价格与部署门槛上更低,但在显存容量与计算能力上则有所取舍。 查看评论

LinuxDo 最新话题 · 2026-06-01 12:09:25+08:00 · tech

一早起来鞭策codex干活,发现打错字,习惯下按两下esc准备修改。结果报错崩溃 这时候还以为是codex的bug,于是尝试resume。结果 当时就觉得大事不妙,去~/.codex/sessions底下一看,果然,目录空空如也。所有对话都消失了! 事已至此,只好先查找原因。结果是codex删的 对着进程一查,发现是一个运行了很久的开了goal模式的会话。可是以前这个goal一直没出过问题,今天早上怎么会突然删我的文件? 思考了一下,想起来昨晚给这个会话发了一条“空间告急。清理临时文件”的指令,又想起来,goal模式有个特性,会把用户的最后一条输入和goal目标一起发送,导致codex每个循环都清理空间,最后清理到了session上。几百次对话全部消失,损失惨重啊! 5 个帖子 - 4 位参与者 阅读完整话题

IT之家 · 2026-06-01 11:47:33+08:00 · tech

IT之家 6 月 1 日消息,Intel(英特尔)在今年 COMPUTEX 前夕对将在本年度晚些时候面世的 AI 推理工作负载优化数据中心 GPU "Crescent Island" 进行了进一步的介绍。 "Crescent Island" 将支持从原生 FP4/MXFP4 到 FP64 的各种数据类型与变体, 配备至高 480GB 的 LPDDR5x 内存 ,整卡采用 350W 功耗 PCIe AIC 设计。该卡设计上主打每瓦词元 (Token/W),拥有可靠的开源软件生态堆栈。 英特尔同时确认,"Crescent Island" 上的 "Xe3P" GPU 架构将应用于 PC、数据中心、边缘、工作站四大领域, 包括其“下一代 PC”芯片 。

LinuxDo 最新话题 · 2026-05-31 12:10:36+08:00 · tech

你是TypeScript、Node.js、Vite、Vue.js、Vue Router、Pinia、VueUse、Headless UI、Element Plus和Tailwind方面的顶尖专家,对这些技术的最佳实践和性能优化技巧有着深刻的理解。你将负责生成、审查和优化符合以下所有规范的代码: 核心职责 生成符合所有指定技术规范的高质量代码 审查现有代码,识别不符合规范的地方并提供改进方案 提供性能优化建议,确保应用符合核心Web Vitals标准 指导项目架构设计,确保代码可维护性和可扩展性 代码风格与结构要求 编写简洁、可维护且技术准确的TypeScript代码,并提供完整示例 坚持函数式和声明式编程模式,严格避免使用类 通过迭代和模块化遵循DRY原则,消除代码重复 使用描述性变量名,搭配辅助动词(例如: isLoading 、 hasError 、 canSubmit ) 系统组织文件结构,每个文件仅包含相关内容:组件、子组件、辅助函数、静态内容和类型分离 命名规范执行 目录使用小写加短横线的命名方式(例如: components/auth-wizard 、 composables/use-user-state ) 所有函数优先使用具名导出,避免默认导出 组件名使用PascalCase,组合式函数使用use前缀(如 useUserData ) TypeScript严格使用 所有代码必须使用TypeScript编写,优先使用接口而非类型,利用接口的可扩展性和合并能力 避免使用枚举,改用对象映射实现更好的类型安全性和灵活性 所有Vue组件必须是带有完整TypeScript接口定义的函数式组件 语法与格式标准 使用 function 关键字定义纯函数,利用其提升机制和代码清晰性 始终使用Vue Composition API的 <script setup> 风格,绝不使用Options API 合理使用ref/reactive,优先使用ref处理基本类型,reactive处理复杂对象 UI与样式实现 使用Headless UI、Element Plus和Tailwind CSS进行组件开发和样式设计 采用移动端优先的响应式设计方法,使用Tailwind的断点系统实现多端适配 保持样式与逻辑分离,避免内联样式,充分利用Tailwind的工具类 性能优化实施 在所有适用场景使用VueUse组合式函数,增强响应性和性能 将异步组件包装在 Suspense 中,必须提供加载状态的备用UI 对非关键组件实施动态加载,减少首屏 bundle 大小 图片优化:使用WebP格式,包含width/height尺寸数据,实现懒加载 在Vite构建中配置代码分割,实施优化的代码块策略,生成更小的打包文件 Web Vitals优化 使用Lighthouse或WebPageTest等工具持续监测和优化核心Web Vitals(LCP、CLS、FID) 提供具体的优化建议,包括资源加载策略、渲染优化等 质量控制机制 每次生成或审查代码时,都要对照上述规范进行自我验证 主动识别潜在的性能问题和代码坏味道 当遇到不符合规范的代码时,提供具体的重构方案和原因说明 对于不明确的需求,主动寻求澄清,确保生成的代码完全符合业务和技术要求 你必须严格遵守所有这些规范,确保每一段输出的代码都是高质量、符合最佳实践的生产级代码。 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-31 11:24:57+08:00 · tech

Claude Code Skills 里我觉得最容易被低估的是 description 。很多人会认真写正文,但 description 随手写一句,结果技能很难被正确触发。 不好的 description description: A powerful skill for frontend development. 问题是太泛。模型不知道什么时候该加载,也不知道什么时候不该加载。 更好的 description description: Implement or modify React frontend UI, then verify the result with browser screenshots across desktop and mobile viewports. Use when the user asks for visible UI changes. 这里包含了三件事: 做什么:React UI。 怎么做:截图验证。 什么时候用:visible UI changes。 description 写法模板 description: [Task type]. Use when [trigger condition]. Do not use when [exclusion condition]. 比如代码审查可以这样写: description: Review code diffs for correctness bugs and regression risk. Use when the user asks for review, PR check, or pre-merge validation. Do not use for general refactoring requests. 为什么排除条件有用 有些技能很容易误触发。比如 security-review ,如果 description 太泛,模型可能每次改代码都进入安全审计模式,输出会变得很重。 可以写: description: Use for authentication, authorization, secrets, dependency risk, and input validation reviews. Do not use for ordinary UI copy changes. 我的经验 Skill 的正文决定“怎么做”,description 决定“何时做”。 如果触发错了,正文写得再好也会打扰任务。 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-27 01:40:20+08:00 · tech

前天发现kimi用typescript重构了kimi cli,仓库名叫kimi code。然后在issues里面看到有人希望有新的cli拥有webui,然后我这灵机一动,干嘛不给kimi专门做个kimi desktop,你看看codex desktop,claude desktop,trae solo,这些桌面端应用也是很多的嘛。 因此,用codex跑了一个下午,最终出现了一个可用的MVP版本,我称之为kimi desktop preview。站内是有kimi运营的吧我记得。希望官方也把desktop提上日程。 整体页面参考codex desktop,三栏可调,左侧放回话记录,中间放对话消息和聊天框,右侧放预览和git diff。不过这个右侧打开文件暂时只支持HTML和markdown。 至于这样的页面设计,是因为忘记在哪里看到过说这样的设计是AI时代最协调的设计,也可能是我胡诌的哈。其实是codex用习惯了 支持切换不同模型,对应config.toml中的model 支持切换审查方式,对应config.toml中的auto… 支持切换思考程度 可以选择workspace工作空间 可以选择会话session,对应.kimi code下的sessions文件夹 支持markdown格式展示对话消息,Latex展示格式,mermaid展示流程图 支持在设置中直接配置本地的config.toml 切换url 和 api key 更快速。 对了,还支持输入 / 提示快捷操作。 支持工具调用展示,支持打断输出。 接下来应该就是要完善桌面端的体验,以及将改desktop作为一个工具台接入IM平台,实现远程操控 不知道各位佬还有什么建议与意见。 8 个帖子 - 5 位参与者 阅读完整话题

v2ex · 2026-05-25 13:36:30+08:00 · tech

大家好,我做了一个 iOS App ,叫 Await 。 它的出发点很简单:很多点子太小,不值得专门做成一个完整 App ,但如果能真的放到 iPhone 主屏上,又会变得挺有用。 比如我之前看到一张 ADHD Bingo 卡片:一个 5x5 的格子,每个格子是一件很小的日常任务,做完就点一下。它本来只是一张截图,但我觉得这不就是一个小组件该有的样子吗? 用 Codex + Await ,我大概一分半做出了一个可点击的基础版。再调几轮,加上手绘网格、荧光笔标记和每天零点重置,前后大概五分钟,就变成了一个真的可以放到主屏上的小组件。 Await 做的事情是:用 TypeScript 创建真实的 iPhone 小组件,不用打开 Xcode ,也不用自己配置 WidgetKit extension 。 大概工作流是: 把想法描述给 Cursor / Claude Code / Codex 让 AI 写出 TypeScript 把代码放进 Await 在 iPhone 上预览和调整 放到主屏上 它不是 web view ,也不是生成一张静态图片。Await 会把 TypeScript/TSX DSL 渲染成真实的小组件 view ,可以有状态、timeline 、intent 、网络请求、本地存储、文件、音乐、音频等能力。 另外我做了一个 custom panel 机制。代码里可以把一些参数标记成可调整项,比如文字、颜色、字号、开关、token 、数据源路径。Await 会在 App 里自动生成面板,而且面板和代码是同步的。 这个对 AI coding 很有用:AI 先搭结构,后面那些「颜色深一点」「字号大一号」「这个 token 换一下」之类的细节,就不用每次都让 AI 重写代码了。 我录了两个视频,能更直观看到它在 iPhone 上的效果: https://www.bilibili.com/video/BV1hJGL6ZEgB https://www.bilibili.com/video/BV1hJGL6ZEcX 当然,小组件不是完整 App ,WidgetKit 的限制还在:刷新频率、内存、长时间实时交互这些都不能乱来。Await 不是要把小组件变成完整 App ,而是想把这些限制之内的空间变得更容易创作。 App Store: https://apps.apple.com/app/id6755678187 Website: https://awaitwidget.com 想听听大家怎么看: 如果做一个真实 iPhone 小组件的成本足够低,你会想给自己做一个什么样的小组件?

v2ex · 2026-05-25 13:36:30+08:00 · tech

大家好,我做了一个 iOS App ,叫 Await 。 它的出发点很简单:很多点子太小,不值得专门做成一个完整 App ,但如果能真的放到 iPhone 主屏上,又会变得挺有用。 比如我之前看到一张 ADHD Bingo 卡片:一个 5x5 的格子,每个格子是一件很小的日常任务,做完就点一下。它本来只是一张截图,但我觉得这不就是一个小组件该有的样子吗? 用 Codex + Await ,我大概一分半做出了一个可点击的基础版。再调几轮,加上手绘网格、荧光笔标记和每天零点重置,前后大概五分钟,就变成了一个真的可以放到主屏上的小组件。 Await 做的事情是:用 TypeScript 创建真实的 iPhone 小组件,不用打开 Xcode ,也不用自己配置 WidgetKit extension 。 大概工作流是: 把想法描述给 Cursor / Claude Code / Codex 让 AI 写出 TypeScript 把代码放进 Await 在 iPhone 上预览和调整 放到主屏上 它不是 web view ,也不是生成一张静态图片。Await 会把 TypeScript/TSX DSL 渲染成真实的小组件 view ,可以有状态、timeline 、intent 、网络请求、本地存储、文件、音乐、音频等能力。 另外我做了一个 custom panel 机制。代码里可以把一些参数标记成可调整项,比如文字、颜色、字号、开关、token 、数据源路径。Await 会在 App 里自动生成面板,而且面板和代码是同步的。 这个对 AI coding 很有用:AI 先搭结构,后面那些「颜色深一点」「字号大一号」「这个 token 换一下」之类的细节,就不用每次都让 AI 重写代码了。 我录了两个视频,能更直观看到它在 iPhone 上的效果: https://www.bilibili.com/video/BV1hJGL6ZEgB https://www.bilibili.com/video/BV1hJGL6ZEcX 当然,小组件不是完整 App ,WidgetKit 的限制还在:刷新频率、内存、长时间实时交互这些都不能乱来。Await 不是要把小组件变成完整 App ,而是想把这些限制之内的空间变得更容易创作。 App Store: https://apps.apple.com/app/id6755678187 Website: https://awaitwidget.com 想听听大家怎么看: 如果做一个真实 iPhone 小组件的成本足够低,你会想给自己做一个什么样的小组件?