【WWDC26: 为智能体 App 打造稳健的评估 | Apple-哔哩哔哩】 https://b23.tv/qMfRs3w 【WWDC26: 通过爬山法评估优化你的提示词 | Apple-哔哩哔哩】 https://b23.tv/TBAh8kn 【WWDC26: 保护你的 App:智能体功能的风险缓解 | Apple-哔哩哔哩】 https://b23.tv/XLhV0Dx 1 个帖子 - 1 位参与者 阅读完整话题
看烦了真的看烦了,动不动 ai 自动帮你干流程化的活,都让 ai 干了我干啥去
看烦了真的看烦了,动不动 ai 自动帮你干流程化的活,都让 ai 干了我干啥去
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 这个工具是我为了方便自己追番 + 看弹幕做的。用一句话总结的话,大概就是 AutoBangumi / Kazumi / MoonTV / DandanPlay / Jellyfin 这些优秀工具的功能大杂烩,各种功能都沾一点。你可以用它实现多种追番、追剧的路径,比如: 接入在线源 → 正则 / jsonpath / xpath 解析 → 匹配弹幕 → 网页直接播放 或者: RSS 订阅 → 定时提交到下载器 → 转移入库后 TMDB 刮削 → 匹配弹幕 → 网页播放本地视频(可通过 FFmpeg 转码) 软件本体是一个空壳,核心能力都通过可视化工作流实现,可定制化程度超高(大概是同类软件中最高的),从资源索引、下载刮削到弹幕服务,所有节点都可以自定义,你完全可以用它打造最适合自己的追番工作流。懒得自己实现的话也没关系,可以一键导入现成的 工作流模板 ,简单配置下 Token 就能使用。 部分界面截图 工作流列表 工作流编辑 资源搜索 媒体详情 弹幕设置 项目地址 github.com GitHub - kaloscope/kaloscope: A workflow-powered local media manager A workflow-powered local media manager 欢迎使用和反馈,觉得这个项目有用的话希望能点个 Star 支持一下! 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 6 月 8 日消息,总台《财经调查》栏目昨日晚间发布报道,称接到消费者和业内人士的举报,市场上有一些牙刷生产企业, 涉嫌违规使用各类废旧、回收塑料的原料,制作一次性牙刷 ,并大量流入市场。 在江苏省扬州市江都区,记者跟随一辆收废品的三轮车,来到一处废品收购站。只见一位工作人员坐在小板凳上,地上摆满了回收来的牙刷,她正在用砍刀,把牙刷头一个个砍掉。留下的旧刷杆,他们会按照颜色分拣,随后送往加工厂打碎,再次制成新的牙刷柄。 另一处小型废品收购站,场内堆积着各种废旧塑料,有装化学制剂的白桶、家电上拆下来的旧面板、电风扇的盖子、破旧的轮滑鞋…… 回收站工作人员说, 装过洗涤剂、尿素的化工废桶,沾染着各类残留物质,全程不做清洗就送到外面直接粉碎加工 ,被制成劣质“回料”用来生产一次性牙刷。 扬州市江都区的加工小作坊里,已经看不出本来颜色的各种 塑料布、蛇皮口袋、黑色垃圾袋、各种塑料绳 ,可以直接被加工成塑料颗粒。如此劣质的塑料垃圾,加工前没有清洗、消杀流程,仅是高温熔解、简单滤网过滤…… 面对这些“回收料”的化学成分隐患、卫生隐患,加工厂的负责人并不在乎。 由于原料杂乱,产出的回收塑料颜色斑驳,并不统一,工作人员告诉记者, 他们最终都会统一染成黑色对外售卖 。 在另一家“回收料”加工厂里,记者看到原材料竟是鞋厂 制作拖鞋剩下的边角废料 。 按照生产厂家指点,记者来到 扬州市广陵区杭盛科技园 ,这里聚集了多家生产酒店一次性用品的工厂。 为了规避原料价格上涨的压力, 不少小型工厂大量使用低价的回收塑料,与新料混合生产牙刷 ,原料配比根据牙刷定价弹性调整。厂家告诉记者,因为这类低价回收塑料颗粒大多出自无资质小作坊,属于“三无”产品,拿这些“回收料”做牙刷,牙刷生产厂家自己都无法确保生产出来的每一批牙刷质量都会合格。 在这个工业园内,记者又找到一款极致低价的一次性牙刷, 出厂价仅 6 分钱一支 ,厂家用的是秸秆加回收塑料混合制作,以此来降低成本。 园区内另一家工厂,也在生产同款低端牙刷,这位工作人员告诉记者,这种超低价格的产品,是行内的通货,也是行业内走量最大的主流产品。在郑州裕丰国际酒店用品城里,情况大同小异,市场内多数批发商户都在销售“回收料”制作的牙刷, 主要供给小型酒店与民宿 ,质量堪忧。 IT之家注意到,江苏省扬州市市场监督管理局今日发布通报:6 月 7 日晚,总台《财经调查》栏目报道扬州相关企业使用废旧、回收塑料的原料生产一次性牙刷。扬州市委、市政府高度重视,责成市、区两级市场监管、生态环境、公安部门连夜开展核查处置工作。截至目前, 已对涉事经营主体进行调查取证,并开展抽样检测,先行登记保存涉案物品 4.4 吨 。下一步,将深入彻查案件,依法从严从快作出处理。 同时,当地将举一反三, 立即组织开展牙刷产品质量安全隐患专项排查整治行动 ,强化日常常态化监管,严厉打击各类违法违规行为,全力维护市场经营秩序与广大消费者合法权益。欢迎社会各界监督,可拨打 12315 热线举报相关线索。
现有办法很多方法只能用computer use,但是 他会中止你现在的工作 操作慢 消耗的token太多 比如我浏览器打开了一百个网页,想让他把google搜索的页面全部关掉 1 个帖子 - 1 位参与者 阅读完整话题
据《日经亚洲》报道,来自化工、机器人、汽车和电子等多个行业在内的大约30家日本龙头企业,正考虑投资软银旗下的一家新AI合资公司,该公司旨在推动日本国产AI的发展。 软银创始人孙正义 包括旭化成、安川电机、富士通以及大型重工业和运输公司在内的大约30家公司正在考虑投资软银AI合资公司。该AI合资公司在今年4月由软银集团旗下移动部门成立,目标是通过整合材料、机械等领域的制造业数据,训练能够自主控制机器和机器人的“物理AI”,以抗衡美国和中国在AI领域的领先优势。 首批约10家公司预计将于6月做出决定。这些公司预计将各自进行数千万日元的小额投资。软银、NEC、本田汽车和索尼集团将发挥核心作用,各自持股超过10%。三菱日联银行、三井住友银行、瑞穗银行、日本制铁和神户制钢也已进行了小额投资。 软银AI合资公司希望到2027年开发出日本最大的AI模型之一,跻身国内最强大模型行列,拥有约1万亿个参数。参数是AI模型用来处理信息的数值。最早到2029年,该模型将发展成能够同时处理图像、音频等不同类型信息的多模态AI。 到2030年代初,这一AI系统还将具备整合处理现实世界信息的能力,例如重量、温度、位置和距离等数据。该模型将向投资者及其他相关方开放,以鼓励开发针对特定行业和特定公司的AI模型,并促进服务基础设施的建设。 查看评论
背景 自从新番先审后播以来,就一直想找一款一站式的追番 + 看弹幕的工具。试过很多方案,但都不是很满意:要么不支持弹幕,要么只有低清在线源,要么是需要多种工具配合 + 安装各类插件,过于折腾。其中最接近我需求的是 dandanplay ,但它只有 Windows 版本,不适合部署在 NAS 上;而且它在 iOS 网页端的播放体验也不佳,无法旋转横屏播放。因此我决定自己动手做一个,利用业余时间断断续续开发了很久,到今天终于发布了一个可用版本。 为什么使用工作流 对于这类软件而言,下载、刮削所依赖的数据源频繁变动在所难免。于是干脆将这部分逻辑用可视化工作流来实现,可以随时修改调整,无需等待应用本体更新,同时也极大地提升了自由度和可定制化程度,用户完全可以按照自己的喜好来搭建各种工作流。 目前已实现的功能 自动下载、刮削、弹幕匹配、在线播放等核心功能均已实现,大致用法与 dandanplay 类似,上手简单。 基于节点的可视化工作流编辑器,可通过拖拽自由搭建流程 内置 HTTP 请求、Python 脚本、条件分支、循环控制等多种节点 支持从 GitHub 导入社区工作流模板,也支持定时触发自动执行 支持多索引器资源搜索,可按关键词检索、查看详情,并进行全局搜索 兼容 aria2 、qBittorrent 、Transmission 等主流下载器,也支持手动添加磁力链接或种子 支持下载计划,可按关键词和过滤规则自动抓取并下载资源 支持媒体库扫描与实时监控,自动识别新增媒体文件 支持解析 NFO 元数据,适配电影、电视剧等不同媒体库类型 内置支持弹幕的视频播放器,支持 FLV 、HLS 、MP4 播放、横屏播放和断点续播 支持自定义 HTTP 代理与 DNS 解析规则 支持多用户、权限控制、个人偏好设置与头像自定义 支持 PWA 安装,适配桌面端与移动端使用 项目地址 GitHub: https://github.com/kaloscope/kaloscope 文档: https://kaloscope.org TG: kaloscope_official 欢迎大家使用并反馈!
各种Spec,Harness用了个遍被各种幻觉折磨的不行,最后发现还是回归基本功比较好,用最基础的Plan+执行模式。目前正在构建下面这种工作流: 提案循环:提示词输入 → 生成方案 → 多个AI评审 → 人工评审 → 提示词输入…循环得到最终方案 执行和AI评审循环:执行 → 多个AI评审 → 人工评审 → 执行…循环得到最终的代码 需要人工介入时会有webhook提醒给到我处理。 执行层是deepseek(上下文YYDS),评审层可接入各大AI 不知各位意下如何 11 个帖子 - 7 位参与者 阅读完整话题
职位总结 我们正在寻找一位务实的数据自动化工程师。你将负责从大规模获取外部数据到自动化工作流的全流程,确保将清洗后的结构化数据交付给我们的内部系统与智能体( Agents )。你的工作将通过确保从各种内部和第三方来源可靠地获取关键商业数据,直接影响公司的决策制定。 核心职责 • 设计、开发并维护健壮、可扩展的数据管道。数据源涵盖内部和外部,包括实时馈送( Feeds )和批处理加载,涵盖结构化与非结构化数据。 • 从 HTML 、JS 渲染页面(使用无头浏览器)、API 、PDF 及其他非结构化格式中解析并提取结构化数据。 • 通过构建完善的监控、日志记录和数据新鲜度报警机制,确保数据质量与可靠性。 工作流自动化与编排 (~70%): • 使用 OpenClaw 或类似框架作为核心编排层,定义、调度并管理基于聊天及自动化的智能体工作流( Agentic Workflows )。 • 构建整合数据库、数据仓库、内部 API 及报告工具的自动化管道。 • 实现具备容错能力的工作流逻辑,包括错误处理、重试机制、条件分支以及优雅的故障通知。 • 与数据分析师合作了解需求,并自动化手动的数据获取和处理任务,提高运营效率。 • 编写所负责系统的数据架构图( Schemas )、数据字典、管道设计及操作手册。 任职要求 • 1-5 年数据工程或自动化相关领域的实战经验。 • 具备使用 OpenClaw 、Hermes Agent 或类似 RPA/工作流编排工具(如 Apache Airflow, n8n, UI.Vision )构建、调度及监控自动化任务的实战经验。 • 深入了解中国互联网生态系统,包括主流平台的结构和访问模式。 • 具备使用 SQL 数据库(如 PostgreSQL, MySQL )及云存储(如 S3, OSS )进行数据存储和管道构建的经验。 • 具备在容器化/云环境中使用 Docker 的经验。 • 具备良好的英文读写能力,能与利益相关者进行有效沟通。 加分项 • 了解代理服务供应商( Proxy service providers )。 • 具备英语口语能力者优先,但非硬性要求。 • 具备初创公司或中小企业( SME )工作经验,能适应高度自主权并具备务实解决问题的能力。 • Base 在深圳是加分项。 工具与技术栈 • 主要语言:Python / Go • 爬虫与浏览器自动化:Playwright, Puppeteer, Selenium, BeautifulSoup, Scrapy • 工作流编排:OpenClaw, Apache Airflow • 数据存储:PostgreSQL, S3 或同类产品 / 阿里云 OSS • 基础设施:Docker, Git, Linux • 代理与基础服务: 各种住宅/数据中心代理网络 我们提供 • 具备竞争力的薪酬 • 灵活的工作安排([远程办公政策 - 需位于 上海/深圳/北京]) • 用于提升个人技能的学习预算与时间 关于我们 Favorite Medium 是一家成立多年的数字产品设计与工程咨询公司,总部在海外,团队分布全球,主要业务在韩国、日本、香港等地。我们专注于帮助企业从 0 到 1 设计、开发并上线数字产品,涵盖产品策略、UI/UX 设计、软件开发、数据工程、AI 、及 web3 等领域。 关于投递简历、咨询、与面试详情 面试全程线上完成。简历通过后,我们会邮件约您线上面试。 如果你对这个岗位感兴趣,请附上简历发送邮件至 [email protected] 如有任何其他疑问,欢迎添加微信 atomkwk 咨询
职位总结 我们正在寻找一位务实的数据自动化工程师。你将负责从大规模获取外部数据到自动化工作流的全流程,确保将清洗后的结构化数据交付给我们的内部系统与智能体( Agents )。你的工作将通过确保从各种内部和第三方来源可靠地获取关键商业数据,直接影响公司的决策制定。 核心职责 • 设计、开发并维护健壮、可扩展的数据管道。数据源涵盖内部和外部,包括实时馈送( Feeds )和批处理加载,涵盖结构化与非结构化数据。 • 从 HTML 、JS 渲染页面(使用无头浏览器)、API 、PDF 及其他非结构化格式中解析并提取结构化数据。 • 通过构建完善的监控、日志记录和数据新鲜度报警机制,确保数据质量与可靠性。 工作流自动化与编排 (~70%): • 使用 OpenClaw 或类似框架作为核心编排层,定义、调度并管理基于聊天及自动化的智能体工作流( Agentic Workflows )。 • 构建整合数据库、数据仓库、内部 API 及报告工具的自动化管道。 • 实现具备容错能力的工作流逻辑,包括错误处理、重试机制、条件分支以及优雅的故障通知。 • 与数据分析师合作了解需求,并自动化手动的数据获取和处理任务,提高运营效率。 • 编写所负责系统的数据架构图( Schemas )、数据字典、管道设计及操作手册。 任职要求 • 1-5 年数据工程或自动化相关领域的实战经验。 • 具备使用 OpenClaw 、Hermes Agent 或类似 RPA/工作流编排工具(如 Apache Airflow, n8n, UI.Vision )构建、调度及监控自动化任务的实战经验。 • 深入了解中国互联网生态系统,包括主流平台的结构和访问模式。 • 具备使用 SQL 数据库(如 PostgreSQL, MySQL )及云存储(如 S3, OSS )进行数据存储和管道构建的经验。 • 具备在容器化/云环境中使用 Docker 的经验。 • 具备良好的英文读写能力,能与利益相关者进行有效沟通。 加分项 • 了解代理服务供应商( Proxy service providers )。 • 具备英语口语能力者优先,但非硬性要求。 • 具备初创公司或中小企业( SME )工作经验,能适应高度自主权并具备务实解决问题的能力。 • Base 在深圳是加分项。 工具与技术栈 • 主要语言:Python / Go • 爬虫与浏览器自动化:Playwright, Puppeteer, Selenium, BeautifulSoup, Scrapy • 工作流编排:OpenClaw, Apache Airflow • 数据存储:PostgreSQL, S3 或同类产品 / 阿里云 OSS • 基础设施:Docker, Git, Linux • 代理与基础服务: 各种住宅/数据中心代理网络 我们提供 • 具备竞争力的薪酬 • 灵活的工作安排([远程办公政策 - 需位于 上海/深圳/北京]) • 用于提升个人技能的学习预算与时间 关于我们 Favorite Medium 是一家成立多年的数字产品设计与工程咨询公司,总部在海外,团队分布全球,主要业务在韩国、日本、香港等地。我们专注于帮助企业从 0 到 1 设计、开发并上线数字产品,涵盖产品策略、UI/UX 设计、软件开发、数据工程、AI 、及 web3 等领域。 关于投递简历、咨询、与面试详情 面试全程线上完成。简历通过后,我们会邮件约您线上面试。 如果你对这个岗位感兴趣,请附上简历发送邮件至 [email protected] 如有任何其他疑问,欢迎添加微信 atomkwk 咨询
一个开源的 AI 文本拟人化工具集,探索 4 种经过验证的方案,将 AI 生成的文本改写为自然、类人的内容。适合研究者、开发者和写作者了解和实验 AI 文本拟人化技术。 https://github.com/lynote-ai/humanize-text 技术方案 本工具集实现了 4 种独立的拟人化方案。每种各有优劣 — 理解它们能帮你针对不同场景做出更好的选择。 方案一:多语言翻译链 通过远距离语种的链式翻译(如 EN → ZH → JA → FI → EN ),利用不同语言之间的结构差异来自然地重构句式。 使用多种翻译引擎:Google Translate 、Niutrans 、MyMemory 、Apertium 远距离语种(芬兰语、日语)产生更彻底的结构重组 三个处理层级:Standard 、Advanced 、Focus 局限性: 单一翻译链在长篇学术内容上可能丢失细节。翻译跳数越多,专业术语准确度越低。 方案二:多轮 LLM 重写 使用大语言模型进行上下文感知的多轮改写。每轮逐步调整句子节奏、词汇多样性和结构变化。 DeepSeek API ,高温度参数( 1.1–1.3 )产生自然变化 突发度定向 Prompt ,刻意变化句长和复杂度 2–3 轮改写,跨轮次保持上下文感知 局限性: 单独使用时,每轮改写都会增加语义偏移。需要精心设计 Prompt 以保持原意。 方案三:检测引导反馈循环 闭环系统:改写文本 → 通过多信号检测 → 迭代精修仍触发检测的段落。 四信号融合检测:Binoculars ( GPT-2 双模型困惑度)、RoBERTa 分类器、统计特征、多样性指标 文档级改写 → 句子级深度改写 → 规则后处理 AI 词汇替换( 30+ 英文信号词,11+ 中文套话短语) 句子节奏打乱:合并短句、打破均匀长度模式 局限性: 需要本地部署检测模型,资源消耗大(建议 GPU )。管线复杂度较高,调试难度大。 方案四:混合引擎翻译 在单次处理中组合不同神经机器翻译架构的输出,利用引擎间的分布偏移。 每个 NMT 引擎引入不同的结构偏差 混合引擎避免单模型指纹模式 对中短篇内容效果好 局限性: 多引擎调用 API 成本较高。引擎选择和配置需要针对不同语言对进行实验。
各位佬好, 最近在折腾本地 AI Agent 和自动化工作流,顺手把 Claude Code (Opus 4.7 驱动) 作为一个中枢,搞了一套多模型协同的自动化编排机制。感觉跑通之后生产力拉满,特来社区和大家分享一下架构思路,也顺便请教探讨一下后续的优化方向。 先上整体架构图,直观看看这个 “缝合怪” 是怎么运转的: 核心设计思路 整个工作流以接收到的输入作为起点,由 Claude Code 作为“大脑”决定调用哪些工具,并通过 Bash tool 执行 Shell 命令。目前主要分化出三条并行的处理线: 生图线 (Image Line) 链路: opencli → localhost:19825 OpenCLI daemon → Chrome Extension Bridge → 真实 Chrome 浏览器。 亮点: 直接利用了我本地已登录状态的 Chrome 浏览器环境(Gemini/NotebookLM 等),通过自动化脚本完成网页生成、抓取并下载 PNG 到 .local/opencli_artifacts/ 。免去了繁琐的 API 鉴权,直接走真实环境抓取。 评审线 (Review Line) 链路: omc ask 驱动 → Codex CLI (gpt-5.5) & Gemini CLI (3.0 Flash) 。 亮点: 多个轻量/快速模型各自走自己的 API Auth 独立并发评审,评审结果以 Markdown 格式沉淀到本地的 .omc/artifacts/ask/ 目录下(如 codex-<ts>.md )。 神文案线 (Content Line) 链路: Python 脚本 ( poly_llm.py ) → requests + urllib → DeepSeek API (api.deepseek.com) 。 亮点: 接入 DeepSeek 的 v4-pro 生成高质量文案,同样作为 artifact 落盘保存。 最终的综合与输出 (Synth) 所有并行的任务跑完后,Claude Code 会使用 Read 工具把刚才落盘的所有 artifact (各种 .md 结果和图片元数据) 重新读回来。 交由 Claude Opus 进行 跨模型矩阵对比 ,提取出各个模型视角的 unique findings ( ),最终输出一份 v0.2 版本的完整建议报告。 探讨与求教 目前这套跑下来基本能满足我日常的代码评审和图文生成需求,但感觉在 Chrome Extension Bridge 那里的稳定性还有提升空间。 不知道社区里有没有佬也在用类似的思路做多模型 Orchestration? 大家在处理多节点并发和本地文件 artifact 状态同步时,有没有什么更优雅的方案(比如直接上 n8n 会不会更好)?欢迎在评论区交流指点! 顺便求个赞,正努力向 L3 迈进,感谢各位佬的支持! 2 个帖子 - 1 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 还在为手动调节外接显示器 亮度 不方便而烦恼? 还在为手动调节 系统音量 不方便而烦恼? 还在为手动 播放/暂停、切换媒体 不方便而烦恼? 还在为手动频繁运行脚本不方便而烦恼? FControl 这个项目将解决以上这些问题! 项目地址: github.com GitHub - biubiutata/FControl: F 键控制与快捷键自动化工具 — 将 F1–F12 与自定义组合键变成系统控制和脚本入口。F-Key... F 键控制与快捷键自动化工具 — 将 F1–F12 与自定义组合键变成系统控制和脚本入口。F-Key Control and Shortcut Automation Tool — Turn F1–F12 and custom key combinations into system controls and script triggers. 项目为实现 Windows10 系统用 F1-F12 快捷控制 媒体播放/暂停 、 切换 ,系统 音量调节 ,显示器 亮度调节 ,组合快捷键 CTRL + SHIFT + K 运行 脚本 , 可执行文件 功能。 把 F1-F12 默认映射成以下功能: | 按键 | 功能 | |------|------| | F1 / F2 | 显示器亮度:减 / 加 | | F3 - F6 | 未配置 | | F7 / F9 | 媒体控制:上一曲 / 播放暂停 / 下一曲 | | F10 - F12 | 音量控制:静音 / 音量减少 / 音量增加 | 支持 6 种脚本类型 : | 类型 | 用途 | |------|------| | Windows Shell (cmd) | 批处理命令 | | PowerShell | 系统管理、自动化 | | Bash | 跨平台脚本(需装 Git Bash / WSL) | | Python | 数据处理、自动化 | | Node.js | 前端工具链、脚本 | | 外部程序 | 启动任意 .exe | 两种模式 : 内联代码 :直接在输入框里写命令,适合短脚本 脚本文件 :选择本地 .ps1 / .py / .js / .sh 等文件执行 为什么要做这个工具? 因为我觉得Mac的 屏幕亮度调节 、 媒体控制 、 音量调节 这些功能太好用了,不需要动鼠标就能管理这些功能,但是切换到Windows这边这些功能就不支持,我就想既然是同一套键鼠设备能不能实现同样的功能呢?带着这个设想就问了 GPT-5.5 老师,老师的回答是可以的,随即让老师给出计划,就这样经过GPT-5.5、Claude Opus 4.7、DeepSeek V4 Pro 三位老师两三天的奋战, FControl v1.0版本上线了。 感兴趣的佬可以试试,有问题欢迎在评论区提,也可以去 github 提 Issue 。 1 个帖子 - 1 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 还在为手动调节外接显示器 亮度 不方便而烦恼? 还在为手动调节 系统音量 不方便而烦恼? 还在为手动 播放/暂停、切换媒体 不方便而烦恼? 还在为手动频繁运行脚本不方便而烦恼? FControl 这个项目将解决以上这些问题! 项目地址: github.com GitHub - biubiutata/FControl: F 键控制与快捷键自动化工具 — 将 F1–F12 与自定义组合键变成系统控制和脚本入口。F-Key... F 键控制与快捷键自动化工具 — 将 F1–F12 与自定义组合键变成系统控制和脚本入口。F-Key Control and Shortcut Automation Tool — Turn F1–F12 and custom key combinations into system controls and script triggers. 项目为实现 Windows10 系统用 F1-F12 快捷控制 媒体播放/暂停 、 切换 ,系统 音量调节 ,显示器 亮度调节 ,组合快捷键 CTRL + SHIFT + K 运行 脚本 , 可执行文件 功能。 为什么要做这个工具? 因为我觉得Mac的 屏幕亮度调节 、 媒体控制 、 音量调节 这些功能很方便,不需要动鼠标就能管理这些功能,但是切换到Windows这边这些功能就不支持,我就想既然是同一套键鼠设备能不能实现同样的功能呢?带着这个设想就问了GPT-5.5,GPT-5.5的回答是可以的,随即让GPT-5.5给出计划,就这样经过GPT-5.5、Claude Opus 4.7、DeepSeek V4 Pro 三个模型两三天的奋战, FControl v1.0版本上线了。 感兴趣的佬可以试试,有问题欢迎在评论区提,也可以去 github 提 Issue 。 1 个帖子 - 1 位参与者 阅读完整话题
比如说我要在后台录入一个信息 网页的开发接口我获取不到,只能手动输入信息 在A网页的某个固定的表单里复制信息 再到B网页的一个表单里粘贴信息 目前有没有自动化工具,可以像人一样,看完一遍操作之后,重复完成后续的工作? 这个工具可以“看到”这个固定的表单、不同的信息 感觉纯用AI来做会很烧token,有没有什么好的方案 影刀rpa我体验了一下,也是比较笨吧 氪金影刀还是找别的工具? 2 个帖子 - 2 位参与者 阅读完整话题
职位总结 我们正在寻找一位务实的数据自动化工程师。你将负责从大规模获取外部数据到自动化工作流的全流程,确保将清洗后的结构化数据交付给我们的内部系统与智能体( Agents )。你的工作将通过确保从各种内部和第三方来源可靠地获取关键商业数据,直接影响公司的决策制定。 核心职责 • 设计、开发并维护健壮、可扩展的数据管道。数据源涵盖内部和外部,包括实时馈送( Feeds )和批处理加载,涵盖结构化与非结构化数据。 • 从 HTML 、JS 渲染页面(使用无头浏览器)、API 、PDF 及其他非结构化格式中解析并提取结构化数据。 • 通过构建完善的监控、日志记录和数据新鲜度报警机制,确保数据质量与可靠性。 工作流自动化与编排 (~70%): • 使用 OpenClaw 或类似框架作为核心编排层,定义、调度并管理基于聊天及自动化的智能体工作流( Agentic Workflows )。 • 构建整合数据库、数据仓库、内部 API 及报告工具的自动化管道。 • 实现具备容错能力的工作流逻辑,包括错误处理、重试机制、条件分支以及优雅的故障通知。 • 与数据分析师合作了解需求,并自动化手动的数据获取和处理任务,提高运营效率。 • 编写所负责系统的数据架构图( Schemas )、数据字典、管道设计及操作手册。 任职要求 • 1-5 年数据工程或自动化相关领域的实战经验。 • 具备使用 OpenClaw 、Hermes Agent 或类似 RPA/工作流编排工具(如 Apache Airflow, n8n, UI.Vision )构建、调度及监控自动化任务的实战经验。 • 深入了解中国互联网生态系统,包括主流平台的结构和访问模式。 • 具备使用 SQL 数据库(如 PostgreSQL, MySQL )及云存储(如 S3, OSS )进行数据存储和管道构建的经验。 • 具备在容器化/云环境中使用 Docker 的经验。 • 具备良好的英文读写能力,能与利益相关者进行有效沟通。 加分项 • 了解代理服务供应商( Proxy service providers )。 • 具备英语口语能力者优先,但非硬性要求。 • 具备初创公司或中小企业( SME )工作经验,能适应高度自主权并具备务实解决问题的能力。 • Base 在深圳是加分项。 工具与技术栈 • 主要语言:Python / Go • 爬虫与浏览器自动化:Playwright, Puppeteer, Selenium, BeautifulSoup, Scrapy • 工作流编排:OpenClaw, Apache Airflow • 数据存储:PostgreSQL, S3 或同类产品 / 阿里云 OSS • 基础设施:Docker, Git, Linux • 代理与基础服务: 各种住宅/数据中心代理网络 我们提供 • 具备竞争力的薪酬 • 灵活的工作安排([远程办公政策 - 需位于 上海/深圳/北京]) • 用于提升个人技能的学习预算与时间 关于我们 Favorite Medium 是一家成立多年的数字产品设计与工程咨询公司,总部在海外,团队分布全球,主要业务在韩国、日本、香港等地。我们专注于帮助企业从 0 到 1 设计、开发并上线数字产品,涵盖产品策略、UI/UX 设计、软件开发、数据工程、AI 、及 web3 等领域。 关于投递简历、咨询、与面试详情 面试全程线上完成。简历通过后,我们会邮件约您线上面试。 如果你对这个岗位感兴趣,请附上简历发送邮件至 [email protected] 如有任何其他疑问,欢迎添加微信 atomkwk 咨询
AI 优先 cli input, md/yml output 本地优先 操作本地浏览器,操作都在本地完成 特性: 支持主流网站,将网站转换为可重用的本地命令, 支持操作本地浏览器 支持安装私有化的脚本 示例 openwalk exec bing/search "Claude Code" 5 openwalk exec reddit/hot LocalLLaMA openwalk exec v2ex/hot openwalk exec openwalkhub/tools openwalk exec browser-open https://news.ycombinator.com -s=demo --headed 源码
这个项目最早是我做 Vocaloid 混音时候的一个需求------调声库的时候要反复看频谱、盯响度、对比不同版本的动态变化,DAW 里自带的表头要么太简陋要么得花钱买插件,就想自己做一个专门用来"看"声音的工具。 仓库名叫 LoudnessVis,目前开源在 GitHub,MIT 协议。大部分代码是 Claude 写的,我负责提需求、测试方向、踩坑纠偏------整个开发过程全记在仓库里的 DEVLOG.zh-CN.md 里了,从脚手架到每个面板的交互决策都有记录。 项目从 demo 0.1 跑到现在的 demo 0.2,中间迭代了两轮 release。0.1 解决了"能跑"------把 React + Vite + TypeScript 架构搭起来,分析大盘、录音面板、波形染色和 LUFS 显示先到位,同时打包出了 Lite HTML 独立版和 UV 本地启动器。0.2 的重点是"看得清楚、能编辑、能对比"------新增了频谱图热力图和声场分析球,录音 Tab 升级成多轨道编辑器(支持拖端点截取片段、试听、混音、导出 WAV),LUFS 从 2 项扩到 5 项(Momentary / Short-term / Integrated / True Peak / Loudness Range),波形染色也加了 RGB 三频段和频谱重心 hue 两种模式。Electron 侧加了个窗口置顶图钉,长开仪表盘的时候不会被别的窗口盖住。 七个规划阶段目前搞完了五个(脚手架、分析大盘、录音面板、波形染色+LUFS、声场分析球、多轨频响叠加对比),还差系统音量控制和 MV 编辑器没做------前者要接 Windows COM API,后者体量比较大,还没排上日程。已知边界和已知问题也都在 DEVLOG 里标了,比如 True Peak 目前是 4× 线性上采样近似,跟专业母带工具有 ±0.5 dB 偏差。 DSP 那层(FFT、STFT、LUFS EBU R128)没引任何第三方音频库,全手写的实现------这也是 Claude 来回改最多次的地方,但最终结果能跑通,拖一首歌进去所有数据都摊在屏幕上。可视化算法和前端代码已经全部推到 GitHub 公开仓库,Release 页面提供 Lite.zip(单文件 HTML 版)和 UV.zip(本地启动包)两种分发包,解压就能用,不需要装 Node。 GitHub - S1ntinel/loudness-vis: Audio visualization toolkit for loudness-war analysis with React, Lite HTML, UV demo launcher, and an Electron roadmap. · GitHub 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 4 个帖子 - 3 位参与者 阅读完整话题
IT之家 5 月 8 日消息,今天(8 日)下午,携程黑板报公众号发文:2 月 3 日中央网信办在北京召开《生活服务类平台算法负面清单(试行)》推进部署会议,对生活服务类平台算法行为提出了明确具体要求。作为在线旅游领域平台企业,携程深刻领会算法向上向善重要意义,第一时间响应《清单》各项部署要求,全力保障平台内消费者、经营者,助力行业算法治理规范化发展。为切实落实算法主体责任,携程多措并举推进算法合规优化工作。 一是致力搭建更加透明的算法展示渠道。在官方网站、移动端 App 开设算法公示页面 ,以通俗易懂的形式公开相关算法运行机制机理。 二是精细化优化价格与优惠信息展示。为聚焦社会公众关切,消除公众误解,在酒店、机票产品页面进一步清晰展示 商品价格组成、来源、变价原因 等。 三是致力于构筑多方权益保障防线。 下线酒店 AI 生意助手(调价助手)功能 ,构建平台、消费者、经营者之间健康有序的平台经营生态,维护多方合法权益。 IT之家获悉,携程方面称,下一步将持续优化算法行为,倾听各方意见与建议,坚决防范利用算法实施大数据杀熟等行为,以长效化治理举措打造更和谐、更健康的在线旅游平台生态,推动实现高质量、可持续发展。 相关阅读: 《 美团、淘宝闪购、京东已基本取消超时扣款,〈生活服务类平台算法负面清单(试行)〉实施取得初步成效 》