WWW.YOUINFO.SITE
标签聚合 工作效率

/tag/工作效率

LinuxDo 最新话题 · 2026-06-01 16:25:34+08:00 · tech

5月份因为工作原因,在外地出差一个月,带了一台爱国笔记本,轻便度、续航、屏幕、操作手感等各方面都比较中规中矩,但是有两个硬伤:1.性能不够,编译安卓程序直接卡半小时;2.发热严重,一旦工作25分钟以上,笔记本核心区域温度极高简直可以煎鸡蛋,自带键盘根本无法再使用,必须要外接键盘。不然能让你从小白瞬间变成熟手。 后来实在受不了了,在某平台买了二手macbook air 13’ M4芯片,24G+256G (选择大内存小硬盘容量是因为考虑硬盘可以外接,但是内存必须得够用) ¥6200 一开始会觉得我一个搞开发的是不是应该买pro而非air 但其实现在vibe coding时代,不做特别复杂的工程,air就够用了,事实也确实如此。 从使用体验上面来说,缺点大概就是: 快捷键不同 ,虽然大部分都可以自己设置,但是我嫌麻烦,基本都用Mac自己的快捷键逻辑。刚开始老是按错,但是用习惯了之后其实也还好,我现在Win和Mac快捷键自由切换。 接口很少 ,就一个自带磁吸充电口,两个type-c,和一个3.5mm耳机孔。反正对我而言,这个耳机孔真是鸡肋中的鸡肋了。另外就是air没有USB接口,所以拓展坞是标配,包括外接显示器也要靠拓展坞。 键盘布局 ,这点跟快捷键类似,主要就是影响到外接键盘,碰巧我的外接键盘是支持Win和Mac模式切换的,不然的话就得自己改键或者替换键帽了。。 游戏支持差 ,这点毋庸置疑,能玩是能玩,但是绝大部分游戏是玩不了的,甚至包括 WallpaperEngine 也是 available for windows 。 最后补一点就是:关闭,最小化,全屏这几个按钮在左上角,不能调到右边!不过都是用快捷键操作,其实影响不大。 然后说说优点吧,全是个人观点仅供参考 续航非常恐怖 ,断电情况下,我在床上使用了两个小时,电量仅仅从100%降到88%。 对Harness很友好 ,相信大家刚用Windows跑Agent时都遇到过“ 脚本执行错误,我将改为适用于Powershell的命令再重试… ”,Mac完全没这个问题。 配置开发环境很方便 ,搭配homebrew使用,用啥装啥很方便,而且所有文件查找起来也很方便。 性能强悍 ,根据苹果的一体化架构,内存和硬盘的实际使用体验是大于纸面数据的,特别是多任务切换完全顺滑,跑代码编译速度也特别快。 自带软件都很棒 ,除了访达(相当于win的’此电脑’)以外,其他自带软件都很好用,比如地图、股市、邮箱。 触控板手感极好 ,这个事情我还专门上网查过资料,Macbook的触控板手感好主要因为有微控马达,所有的按压都是通过震动模拟的,我用了几天才知道的,真的惊到了。有电容检测,如果不用手指按压就不会触发震动,也是这样就会发现触控板并不是被手指按下去的!另外就是摩擦系数控制得很好,然后触控板的面积也比较大。由此我也理解了为什么有些人宁愿用触控板也不接鼠标。| 我还装了一个工具可以把触控板作为电子称,挺神奇的。 情绪价值 ,这个放在最后说,用了Mac以后,有种莫名的优越感,感觉自己终于找到了趁手的兵器,准备行走江湖了。但是这个是不推崇的哈,我是因为自己有一台主力机是Win的,才买的这台mac用于外带和工作,如果仅仅是为了一点点优越感要买个mac装逼,那是有点难评的。买了mac之后我喝的也是库迪瑞幸而非星巴克~ 反正刚拿到手肯定有很多不习惯的地方,但是 适应 之后,用起来很爽。基本上不用关机,随时随地打开就可以干活,很薄很轻便的同时性能又很强,所以对我而言大大提升了工作效率。 (补充一个缺点,外接显示器需要拓展坞,但是用上几个小时之后,拓展坞温度会很高!) 最后 有没有Mac老手补充一下使用上的技巧,也可以给准备买Mac的佬友们一些参考意见。 临近高考了,如果站内有高三学子,首先是高考加油,然后是上大学要么就买游戏本,要么就买Mac,我个人非常不建议买 国产轻薄本 。 马上618了,有想买Mac但是在犹豫的,我觉得也可以考虑一下(但是对某些工程软件的支持好像还是差点,这个需要自己去查了) 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-23 12:28:19+08:00 · tech

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年报,或者是一组混排了图片、表格、参考文献的技术白皮书......AI 就开始频繁出错。要不就说信息找不到,要不就找错。 但是呢,它这些“幻觉”不是每次都出现的,它是时对时错,毫无规律,你调整 Prompt 、更换 Embedding 模型、试了各种分块策略,但效果总是不稳定。整到后面,人都麻了。 有时候我会想,算了,也许这就是人类程序员还存在的理由?————给 AI 擦屁股? 分享一下我给 AI 擦了这么久的屁股之后,感觉比较有用的一些思路吧。 首先模型是没法大改的了,至少对于我等普通小喽啰而言,等它自己更新更现实(大佬应该不会看到我的帖子吧,请 pass 哈)。但是在这个过程中,活还是要干的,那么怎么保证产出的准确性呢?我觉得优化 RAG 是一个比较可行的思路。 现在的大模型在生成答案前,往往会先通过 RAG 从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程。但大多数 RAG 系统处理文档的方式非常“暴力”:它会把 PDF 、Word 或者网页内容提取成纯文本,然后用一个固定的窗口大小(比如 500 个 token )把文本切成一块块,也就是所谓的 Chunk 。 在这个过程中,标题层级可能被削平了,表格被拦腰截断,图和文字的关联彻底消失。每个 Chunk 都是一张碎片,前后文、结构、归属关系全丢失,丢给 AI 做检索增强时很容易让 AI 找不着北。 但 AI 是被训练过的,它要避免说“我不知道”,这是“主人的命令”。于是,它只好用语言模型的概率能力去“脑补”,幻觉就这样产生了。 我的解决办法,就是换一种解析方式。抛弃传统的按字数打断的切片方式,转而采用类似脑图的树形结构进行拆分,尽量保留切片的上下文信息,减少信息缺失导致的 AI“脑补”行为。 具体流程分三步: 1 、解析。接入高质量的解析器来读取 PDF 、PPT 、图片、表格等格式,先拿到一个相对干净的文本初稿。 2 、结构化。建立文档的标题树,从一级标题到二级、三级,每一块文本都挂载到对应的章节路径上。表格和图片不是抽离出来当作独立附件,而是和内联的上下文文本牢牢绑定,确保 AI 能看到“这张表格是属于哪一段话”的完整关系。 3 、构建记忆。构建一个包含章节树、文本块、摘要、图像描述以及跨文档链接的轻量级记忆图谱。这个图谱就像是给 AI 配了一本带有详细目录、索引和超链接的电子书,AI 检索时可以在图谱里沿着路径上下左右导航,精准定位到最相关的证据区域,而不是仅仅依靠向量相似度去猜测。 测试下来,相比于传统的 RAG 或是使用原始文本,AI 的表现都要好很多:以 RAG 中常见的 Agent 问答任务为测试场景,当直接给 Agent 提供原始文档,或者使用主流解析器生成的 markdown/json 文件时,Agent 的最终回答准确率大约在 53%左右。 但使用新方法处理过的文档后,AI 准确率提升到了 79%。同时,Agent 的首次搜索准确率相对原始文档提升了 36%,召回率提升了 10%。再者,因为切片太碎导致的无效检索减少了嘛,所以 Token 消耗和搜索时间也随之下降了。 https://imgur.com/a/xlautnf 这在跟 AI agent 有关的场景里面都适用。 现在,我把这个方法打包成了一个工具 Knowhere ,开源的: https://github.com/Ontos-AI/knowhere 。如果你懒得自己操作,那可以借助工具的力量。 它可以显著提升这几类场景的体验: 面向企业的智能问答或知识库。Knowhere 能让 AI 给出的答案更准确、更可追溯,每一条结论都能定位回原文的具体位置。 金融、法律、医疗等垂直领域的 Agent 应用。Knowhere 可以保留多级复杂表格和图表的结构,不再让关键数据被“切碎”。 如果你在管理大量学术文献或技术文档,它可以在不同文档之间建立关联图谱,让 Agent 做跨文档推理时更可靠。 欢迎尝试,有问题随时问我。

V2EX - 技术 · 2026-05-23 04:23:36+08:00 · tech

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年报,或者是一组混排了图片、表格、参考文献的技术白皮书......AI 就开始频繁出错。要不就说信息找不到,要不就找错。 但是呢,它这些“幻觉”不是每次都出现的,它是时对时错,毫无规律,你调整 Prompt 、更换 Embedding 模型、试了各种分块策略,但效果总是不稳定。整到后面,人都麻了。 有时候我会想,算了,也许这就是人类程序员还存在的理由?————给 AI 擦屁股? 分享一下我给 AI 擦了这么久的屁股之后,感觉比较有用的一些思路吧。 首先模型是没法大改的了,至少对于我等普通小喽啰而言,等它自己更新更现实(大佬应该不会看到我的帖子吧,请 pass 哈)。但是在这个过程中,活还是要干的,那么怎么保证产出的准确性呢?我觉得优化 RAG 是一个比较可行的思路。 现在的大模型在生成答案前,往往会先通过 RAG 从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程。但大多数 RAG 系统处理文档的方式非常“暴力”:它会把 PDF 、Word 或者网页内容提取成纯文本,然后用一个固定的窗口大小(比如 500 个 token )把文本切成一块块,也就是所谓的 Chunk 。 在这个过程中,标题层级可能被削平了,表格被拦腰截断,图和文字的关联彻底消失。每个 Chunk 都是一张碎片,前后文、结构、归属关系全丢失,丢给 AI 做检索增强时很容易让 AI 找不着北。 但 AI 是被训练过的,它要避免说“我不知道”,这是“主人的命令”。于是,它只好用语言模型的概率能力去“脑补”,幻觉就这样产生了。 我的解决办法,就是换一种解析方式。抛弃传统的按字数打断的切片方式,转而采用类似脑图的树形结构进行拆分,尽量保留切片的上下文信息,减少信息缺失导致的 AI“脑补”行为。 具体流程分三步: 1 、解析。接入高质量的解析器来读取 PDF 、PPT 、图片、表格等格式,先拿到一个相对干净的文本初稿。 2 、结构化。建立文档的标题树,从一级标题到二级、三级,每一块文本都挂载到对应的章节路径上。表格和图片不是抽离出来当作独立附件,而是和内联的上下文文本牢牢绑定,确保 AI 能看到“这张表格是属于哪一段话”的完整关系。 3 、构建记忆。构建一个包含章节树、文本块、摘要、图像描述以及跨文档链接的轻量级记忆图谱。这个图谱就像是给 AI 配了一本带有详细目录、索引和超链接的电子书,AI 检索时可以在图谱里沿着路径上下左右导航,精准定位到最相关的证据区域,而不是仅仅依靠向量相似度去猜测。 测试下来,相比于传统的 RAG 或是使用原始文本,AI 的表现都要好很多:以 RAG 中常见的 Agent 问答任务为测试场景,当直接给 Agent 提供原始文档,或者使用主流解析器生成的 markdown/json 文件时,Agent 的最终回答准确率大约在 53%左右。 但使用新方法处理过的文档后,AI 准确率提升到了 79%。同时,Agent 的首次搜索准确率相对原始文档提升了 36%,召回率提升了 10%。再者,因为切片太碎导致的无效检索减少了嘛,所以 Token 消耗和搜索时间也随之下降了。 https://imgur.com/a/xlautnf 这在跟 AI agent 有关的场景里面都适用。 现在,我把这个方法打包成了一个工具 Knowhere ,开源的: https://github.com/Ontos-AI/knowhere 。如果你懒得自己操作,那可以借助工具的力量。 它可以显著提升这几类场景的体验: 面向企业的智能问答或知识库。Knowhere 能让 AI 给出的答案更准确、更可追溯,每一条结论都能定位回原文的具体位置。 金融、法律、医疗等垂直领域的 Agent 应用。Knowhere 可以保留多级复杂表格和图表的结构,不再让关键数据被“切碎”。 如果你在管理大量学术文献或技术文档,它可以在不同文档之间建立关联图谱,让 Agent 做跨文档推理时更可靠。 欢迎尝试,有问题随时问我。

V2EX - 技术 · 2026-05-22 18:16:46+08:00 · tech

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年报,或者是一组混排了图片、表格、参考文献的技术白皮书......AI 就开始频繁出错。要不就说信息找不到,要不就找错。 但是呢,它这些“幻觉”不是每次都出现的,它是时对时错,毫无规律,你调整 Prompt 、更换 Embedding 模型、试了各种分块策略,但效果总是不稳定。整到后面,人都麻了。 有时候我会想,算了,也许这就是人类程序员还存在的理由?————给 AI 擦屁股? 分享一下我给 AI 擦了这么久的屁股之后,感觉比较有用的一些思路吧。 首先模型是没法大改的了,至少对于我等普通小喽啰而言,等它自己更新更现实(大佬应该不会看到我的帖子吧,请 pass 哈)。但是在这个过程中,活还是要干的,那么怎么保证产出的准确性呢?我觉得优化 RAG 是一个比较可行的思路。 现在的大模型在生成答案前,往往会先通过 RAG 从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程。但大多数 RAG 系统处理文档的方式非常“暴力”:它会把 PDF 、Word 或者网页内容提取成纯文本,然后用一个固定的窗口大小(比如 500 个 token )把文本切成一块块,也就是所谓的 Chunk 。 在这个过程中,标题层级可能被削平了,表格被拦腰截断,图和文字的关联彻底消失。每个 Chunk 都是一张碎片,前后文、结构、归属关系全丢失,丢给 AI 做检索增强时很容易让 AI 找不着北。 但 AI 是被训练过的,它要避免说“我不知道”,这是“主人的命令”。于是,它只好用语言模型的概率能力去“脑补”,幻觉就这样产生了。 我的解决办法,就是换一种解析方式。抛弃传统的按字数打断的切片方式,转而采用类似脑图的树形结构进行拆分,尽量保留切片的上下文信息,减少信息缺失导致的 AI“脑补”行为。 具体流程分三步: 1 、解析。接入高质量的解析器来读取 PDF 、PPT 、图片、表格等格式,先拿到一个相对干净的文本初稿。 2 、结构化。建立文档的标题树,从一级标题到二级、三级,每一块文本都挂载到对应的章节路径上。表格和图片不是抽离出来当作独立附件,而是和内联的上下文文本牢牢绑定,确保 AI 能看到“这张表格是属于哪一段话”的完整关系。 3 、构建记忆。构建一个包含章节树、文本块、摘要、图像描述以及跨文档链接的轻量级记忆图谱。这个图谱就像是给 AI 配了一本带有详细目录、索引和超链接的电子书,AI 检索时可以在图谱里沿着路径上下左右导航,精准定位到最相关的证据区域,而不是仅仅依靠向量相似度去猜测。 测试下来,相比于传统的 RAG 或是使用原始文本,AI 的表现都要好很多:以 RAG 中常见的 Agent 问答任务为测试场景,当直接给 Agent 提供原始文档,或者使用主流解析器生成的 markdown/json 文件时,Agent 的最终回答准确率大约在 53%左右。 但使用新方法处理过的文档后,AI 准确率提升到了 79%。同时,Agent 的首次搜索准确率相对原始文档提升了 36%,召回率提升了 10%。再者,因为切片太碎导致的无效检索减少了嘛,所以 Token 消耗和搜索时间也随之下降了。 https://imgur.com/a/xlautnf 这在跟 AI agent 有关的场景里面都适用。 现在,我把这个方法打包成了一个工具 Knowhere ,开源的: https://github.com/Ontos-AI/knowhere 。如果你懒得自己操作,那可以借助工具的力量。 它可以显著提升这几类场景的体验: 面向企业的智能问答或知识库。Knowhere 能让 AI 给出的答案更准确、更可追溯,每一条结论都能定位回原文的具体位置。 金融、法律、医疗等垂直领域的 Agent 应用。Knowhere 可以保留多级复杂表格和图表的结构,不再让关键数据被“切碎”。 如果你在管理大量学术文献或技术文档,它可以在不同文档之间建立关联图谱,让 Agent 做跨文档推理时更可靠。 欢迎尝试,有问题随时问我。

LinuxDo 最新话题 · 2026-05-20 23:20:59+08:00 · tech

最近刚入职一家公司给他们做一些AI工具提高工作效率。我感觉大部分场景似乎都更适合用langgraph搭一个workflow出来,可能部分节点会做成一个小的agent,但是整体来说流程必须是可控的,这样工具输入输出都有预期。 我有看过anthropic关于agent的一些讨论,也在本站搜了一些帖子来学习大家的开发思路。我其实一直很纠结workflow现在来看是不是一条错的路,还是说企业最终还是需要workflow多一些。我感觉至少我目前看到的需求更多还是工具属性,不要求彻底automated,而且还需要适当的HITL。但是我看L站大家似乎更倾向于自己搭建agent基座做定制化? 挺好奇大家的看法的,因为我觉得目前agent开发其实也没有所谓的标准答案可以抄。 7 个帖子 - 6 位参与者 阅读完整话题