WWW.YOUINFO.SITE
标签聚合 自然语言

/tag/自然语言

LinuxDo 最新话题 · 2026-06-11 15:41:32+08:00 · tech

前言 前面我们实现了一个 配合xray内核 reality协议 的 极简翻墙客户端(壳) MDPC-my-dream-proxy-client 如果我们想 配合 Hysteria 内核呢? (只为了简单演示, 所以只处理自签证书的情况) 分析 根据my-dream-proxy-client项目(下称MDPC)的设计, MDPC的配置文件参数为: listen: port: files-dir: core-start: core-test: log: 我们可以填上 hy2 对应的信息, 如: listen: "127.0.0.1" port: "18180" files-dir: "./bin/hy2/" core-start: "bin/hy2/hysteria client -c bin/hy2/config.yaml" core-test: "" log: "" 这样后端就好了. 是不是很简单! 接下来就是创造前端的HTML, 用来生成hy2客户端配置文件的yaml文本 可以先从简单的YAML文本编辑框作为基础功能. 然后再加表单. 开发过程 hermes 对接 mimo-v2.5-pro 基于 极简翻墙客户端(壳) 开发 配合 Hysteria 内核 支持Hysteria2协议 自签证书指定证书指纹pinSHA256 Github G站/crazypeace/my-dream-proxy-client 使用方法 见项目 README.md G站/crazypeace/my-dream-proxy-client/blob/main/README.md#my-dream-proxy-client-使用手册-配合hysteria内核 ======== 后记 本次开发由 hermes 对接 mimo-v2.5-pro 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 10:25:25+08:00 · tech

前言 你可能在使用一个没有可用的翻墙客户端的平台. 你可能觉得目前能找到的翻墙客户端太大, 太笨重了, 你用不到那么多功能, 用不到那么多协议. 你可能看到了某个翻墙内核新出了一个协议, 而你手里的翻墙客户端还没有支持. 你可能就是手痒, 想自己搓轮子. 那么你可以做一个你自己的 翻墙客户端 思路 考虑到翻墙内核都是用go语言, 那么我们的翻墙客户端也用go. 这样, 内核能跑的平台, 客户端也能跑. 客户端的GUI界面部分, 考虑到覆盖尽量广的平台, 以及方便用户自己修改调整界面元素, 用HTML. 探索 以 xray 翻墙内核 + reality协议 为例 启动一个hermes, 对接 mimo-v2.5. 设计工作从这样的对话开启 我们来分析一个翻墙客户端(壳)的设计方案. 基于xray内核 考虑到覆盖尽可能广的平台, 翻墙客户端的后端基于 go 语言 考虑到方便用户自定义界面, 翻墙客户端的界面基于 HTML 你觉得如何? 很多细节和反复拉扯的部分在此省略. 只记录一些最终保留的重要设计思路 前后端功能设计 后端只负责替换配置文件 和 启/停翻墙内核 前端将配置文件的全量文本发给后端 前后端API设计 配置文件操作 — /api/files GET /api/files GET /api/files/{filename} PUT /api/files/{filename} DELETE /api/files/{filename} 进程操作 — /api/core GET /api/core/status POST /api/core/start POST /api/core/stop POST /api/core/test 设计前端时, 为了简化, 预设以下一些约束条件 后端的配置文件只会有这一些, 只会少, 不会多. 01-log.json # log 02-dns.json # dns 配置 03-router.json # routing rules 04-inbounds.json # 入站监听 05-outbounds.json # 出站代理 06-api.json # commander API 只实现最基本的核心功能作为演示, 只需要使用这些API GET /api/files/{filename} → { content } PUT /api/files/{filename} ← { content } (创建或替换) POST /api/xray/start POST /api/xray/stop 前端HTML的使用方式 后端不提供HTTP文件路由 前端HTML文件可以由单独的HTTP服务来支撑, 如 python -m http.server 前端HTML文件也可以直接用浏览器打开 前端HTML页面思路 前端为每个配置文件生成一个HTML页面文件 01-log.json 02-dns.json 03-router.json 04-inbounds.json 05-outbounds.json 06-api.json 前端的页面设计 对于不是 outbound 的页面, 只有直接编辑JSON 的功能, 没有表单 所以它们应该是几乎一样, 只有文件名不一样. 前端outbound页面的设计 转JSON • 行为: 表单 → 生成 JSON → 填入下方 JSON 编辑器(不保存) 直接保存 • 行为: 表单 → 生成 JSON → 填入下方 JSON 编辑器 → 发送给后端 保存 • 行为: JSON 编辑器的内容 → 发送给后端 后端设计1个yaml格式的配置文件 listen: 127.0.0.1 port: 18080 files-dir: ./bin/xray/ core-start: “./bin/xray/xray run -confdir ./bin/xray/” core-test: “./bin/xray/xray run -confdir ./bin/xray/ -test” log: “” 上传 Github G站/crazypeace/my-dream-proxy-client 对, 我取了一个特别的名字 my-dream-proxy-client 但其实功能特别简陋, 只是演示了最基本的工作原理. 哈哈! 使用方法 见 Github 项目 README.md G站/crazypeace/my-dream-proxy-client/blob/main/README.md#my-dream-proxy-client-使用手册-配合xray内核 具体开发过程 hermes 对接 mimo-v2.5 开发翻墙客户端(壳) 基于 xray 内核 reality 协议 1 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-09 21:18:24+08:00 · tech

做 Mac 开发和写东西的时候,我每天要复制粘贴上百次:从 Xcode 抄代码、从 Chrome 存链接、从 Finder 拖文件路径、从设计稿里截图…… 剪贴板工具我用过不少,但有个痛点一直没解决好—— 历史是存下来了,可我根本找不回来 。列表拉到几百条靠肉 眼翻,或者得记得精确关键词。但我往往只记得「上周从 Chrome 复制的那个链接」「三天前从 Xcode 抄的那段代码」,记不得具体内容是啥。 于是自己做了个工具,叫 PasteNext ,核心就想解决这件事。 和别的剪贴板工具不太一样的地方 1. 用自然语言搜历史 可以直接搜「上周从 Chrome 复制的链接」「 Xcode 三天前的代码」「刚才从 Finder 来的图片」,它会把内容、来源 App 、时间、类型这几个线索组合起来匹配。基本是按「我记得的样子」去找,而不是按「它存的样子」去找。

IT之家 · 2026-06-09 05:13:01+08:00 · tech

IT之家 6 月 9 日消息,在今天(6 月 9 日)召开的 2026 年全球开发者大会(WWDC)上,苹果在 iOS 27 系统中为日历(Calendar)与提醒事项(Reminders)加入多项 AI 功能。 科技媒体 MacRumors 在体验后指出,苹果正把日历和提醒事项从“手动填写”推向“自然输入”,用户点按日历应用的“+”按钮后,可直接输入类似“周四晚上 8 点和女友 Sarah 看电影”的文字, 系统会自动识别时间、日期和事件内容,生成对应安排,省去逐项填写的步骤。 用户不必先跳到某一天再新建事件,只需要在输入过程中,直接点按系统给出的日期和时间建议即可完成创建。 若文字中包含“每周”这类频率描述,系统还能同步设定重复事件,适合例会、课程和固定行程管理。 IT之家援引博文介绍,提醒事项应用也采用相同逻辑,比如输入“周四下午 2 点提醒我去买菜”,系统会自动提取任务内容与提醒时间,快速生成待办。 苹果还简化了日历事件编辑。若某个会议原本设为每周重复,后续改成每隔 2 周一次,日历应用会智能调整未来事件的重复频率。 苹果还增强 Visual Intelligence(视觉智能)与日历、提醒事项的联动,用户在网上查看活动信息并截图,或用 iPhone 拍下一张活动传单,系统可识别其中的相关内容,并自动加入日历应用。

IT之家 · 2026-06-09 02:07:26+08:00 · tech

IT之家 6 月 9 日消息,在今天(6 月 9 日)召开的 2026 年全球开发者大会(WWDC)上,苹果公司宣布在 iOS 27 系统中升级 Home 应用, 通过 AI 技术来精简配件通知。 对于部分 Home 应用来说,如果智能家居设备较多,就可能出现通知泛滥的情况,苹果公司希望通过 AI 来简化这些通知,减少 Home 生态对用户的干扰。IT之家附上相关截图如下: 此外,Home 应用可以识别已连接摄像头的视频片段并生成描述。 它还可以将来自不同摄像头的相关视频拼接在一起,用户还可以使用自然语言搜索视频片段。

IT之家 · 2026-06-06 08:39:22+08:00 · tech

IT之家 6 月 6 日消息,科技媒体 9to5Mac 昨日(6 月 5 日)发布博文,在 2026 年全球开发者大会(WWDC)开幕前夕, 梳理汇总了关于 iPadOS 27 的新功能 / 新特性。 基于目前流出的信息,iPadOS 27 系统更新聚焦 AI 体验升级,在学习、办公和内容处理场景下,提高用户的使用效率。 一、Safari 的自动标签分组功能 新功能名为 Organize Tabs,用户启用后,Safari 可按主题自动整理当前标签页,把同类内容归入同一组。 比如论文资料、购物页面和效率工具网页,系统会自动分类收纳,减轻多标签混乱的问题,对经常查资料和同时处理多任务的用户很有帮助。 二、改版 Spotlight 搜索 在 macOS 26 Tahoe 系统中,苹果公司已升级 Spotlight,而最新消息称 iPadOS 27 会把 Siri 能力深度整合进 Spotlight 界面。 IT之家援引博文介绍,用户可在同一入口里提问、找文件、看应用建议,还能启动应用、发送短信、查询天气、添加日历事项、搜索备忘录、触发应用内快捷操作,而且还支持用苹果新的 AI 搜索系统搜索网络内容。 三、使用自然语言创建快捷指令 作为 iPad 上最重要的自动化工具之一,快捷指令门槛并不低,很多普通用户不知道该怎么搭建流程。 新版本里,用户只需输入或说出需求,应用就能自动生成对应快捷指令,甚至可按需求创建全新动作。 四、系统级语法检查 苹果此前已在 iPadOS 18 中加入部分 AI 写作工具,而 iPadOS 27 预计会补上语法检查能力,并覆盖系统范围,其使用方式类似 Grammarly,会在半透明菜单中显示原文与修改建议。 该功能主要面向学生、教师、编辑和商务办公人群,用户可单独接受建议、一次性接受全部修改、忽略修改,也可暂停检查并在标记段落间切换。

v2ex · 2026-05-29 16:57:27+08:00 · tech

✨ 把生活里的随手拍,做成了一个懂我情绪的 AI 自然语言相册。 平时走在路上,总喜欢用手机或相机记录一些碎片:角落里的野猫、雨后反光的柏油路、傍晚天边泛紫的火烧云,还有那些不知名的街头废片。照片攒了上万张,想找某张特定感觉的图时,传统相册的分类和死板的标签总是让人头大。 基于这个 vercel-template [ https://github.com/vercel-labs/vectr ] 来实现了一个简单后台管理,贴了某天下午无所事事 随便拍的黑白照 📸。 现在,我可以直接用任何口语化、甚至带点情绪的词汇去翻看我的相册: 🔍 搜索 "泛黄的夏日午后"、"逆光下的斑驳光影"、"雨天的孤寂街头" 甚至连 "冷色调、极简构图" 这样抽象的视觉概念,它也能在瞬间帮我全部精准闪现! 💡 它的幕后秘密: 后台接入了 Google Gemini 视觉大模型,能够像人类摄影师一样自动理解我照片中的光影、色调和故事,甚至能在瞬间把照片里的快门、光圈、ISO 、焦距等 EXIF 原始摄影参数全自动析出挂载。 进来看看我的日常扫街碎片,或者一键带走它: 🔗 体验:[ https://vectr-lilac.vercel.app/ ] 📂 源码:[ https://github.com/vinono/vectr ]

IT之家 · 2026-05-27 22:11:23+08:00 · tech

IT之家 5 月 27 日消息,在今天的 SPARK 2026 腾讯游戏发布会中,腾讯宣布了旗下全新 AI 游戏创作平台“代号 Craft”,并宣布平台开启首测报名。 据介绍,该平台由腾讯游戏生态发展部打造,其内置完整的 AIGC 工具链,号称能够解决传统开发中的美术产能难题,并免费提供超万种预制美术资源。用户只需通过自然语言与 AI 对话,即可快速生成 2D、3D 等多种类型的游戏雏形,将创意即时转化为可玩的游戏世界。 官方表示,例如用户输入“设计一个太空冒险 RPG”,平台就能够自动生成游戏场景、角色和基础玩法框架,还支持多品类开发,可生成移动端、PC 及主机端游戏原型,适配 Unity 等主流引擎的导出格式。

v2ex · 2026-05-27 11:34:08+08:00 · tech

用自然语言控制 iPhone 的 GUI Agent ,小模型就能跑 项目地址: https://github.com/hyechow/iphone-use 做了什么 利用 Mac 上的 iPhone Mirroring 把 iPhone 投屏到电脑,通过 MCP 协议获取截图、注入触控事件,让 LLM 驱动整个交互闭环。用户说一句话,Agent 自己截图 → 理解屏幕 → 决策操作 → 循环执行,直到完成。 能干什么 操作类:把拼多多订单分享给微信好友(跨 APP ) 查询类:打开微信支付汇总上周账单支出 探测模式:自动探索任意 APP 页面结构,生成可复用的知识库 演示视频都在 README 里,欢迎交流和学习~

v2ex · 2026-05-27 11:34:08+08:00 · tech

用自然语言控制 iPhone 的 GUI Agent ,小模型就能跑 项目地址: https://github.com/hyechow/iphone-use 做了什么 利用 Mac 上的 iPhone Mirroring 把 iPhone 投屏到电脑,通过 MCP 协议获取截图、注入触控事件,让 LLM 驱动整个交互闭环。用户说一句话,Agent 自己截图 → 理解屏幕 → 决策操作 → 循环执行,直到完成。 能干什么 操作类:把拼多多订单分享给微信好友(跨 APP ) 查询类:打开微信支付汇总上周账单支出 探测模式:自动探索任意 APP 页面结构,生成可复用的知识库 演示视频都在 README 里,欢迎交流和学习~

v2ex · 2026-05-27 11:16:10+08:00 · tech

用自然语言控制 iPhone 的 GUI Agent ,小模型就能跑 项目地址: https://github.com/hyechow/iphone-use 做了什么 利用 Mac 上的 iPhone Mirroring 把 iPhone 投屏到电脑,通过 MCP 协议获取截图、注入触控事件,让 LLM 驱动整个交互闭环。用户说一句话,Agent 自己截图 → 理解屏幕 → 决策操作 → 循环执行,直到完成。 能干什么 操作类:把拼多多订单分享给微信好友(跨 APP ) 查询类:打开微信支付汇总上周账单支出 探测模式:自动探索任意 APP 页面结构,生成可复用的知识库 演示视频都在 README 里,欢迎交流和学习~

v2ex · 2026-05-27 11:08:51+08:00 · tech

用自然语言控制 iPhone 的 GUI Agent ,小模型就能跑 项目地址: https://github.com/hyechow/iphone-use 做了什么 利用 Mac 上的 iPhone Mirroring 把 iPhone 投屏到电脑,通过 MCP 协议获取截图、注入触控事件,让 LLM 驱动整个交互闭环。用户说一句话,Agent 自己截图 → 理解屏幕 → 决策操作 → 循环执行,直到完成。 能干什么 操作类:把拼多多订单分享给微信好友(跨 APP ) 查询类:打开微信支付汇总上周账单支出 探测模式:自动探索任意 APP 页面结构,生成可复用的知识库 演示视频都在 README 里,欢迎交流和学习~

V2EX - 技术 · 2026-05-27 11:02:11+08:00 · tech

用自然语言控制 iPhone 的 GUI Agent ,小模型就能跑 项目地址: https://github.com/hyechow/iphone-use 做了什么 利用 Mac 上的 iPhone Mirroring 把 iPhone 投屏到电脑,通过 MCP 协议获取截图、注入触控事件,让 LLM 驱动整个交互闭环。用户说一句话,Agent 自己截图 → 理解屏幕 → 决策操作 → 循环执行,直到完成。 能干什么 操作类:把拼多多订单分享给微信好友(跨 APP ) 查询类:打开微信支付汇总上周账单支出 探测模式:自动探索任意 APP 页面结构,生成可复用的知识库 演示视频都在 README 里,欢迎交流和学习~

LinuxDo 最新话题 · 2026-05-26 10:36:44+08:00 · tech

最近在做一个AI智能体,目标是:用户输入自然语言问题,自动查询数据并展示结果。 难点是用户问题完全不固定,比如: “最近退款率最高的产品是什么” “为什么这周订单下降了” “华东近三个月 GMV 趋势” 本质上是自然语言 → 理解业务 → 找表/字段 → 查数。 有没有大佬做过BI Copilot / 数据问答 / 查数Agent的,想请教下企业里效果比较好的落地方案 6 个帖子 - 6 位参与者 阅读完整话题

v2ex · 2026-05-22 20:34:30+08:00 · tech

4 步 Standard Pipeline Step 1 — DeepSeek 把英文重写成中文,同时进行 LLM humanization rewrite ( temperature 1.3 ) Step 2 — DeepSeek 把中文改写成日语,带着 Step 1 作为对话历史(保持上下文连贯) Step 3 — Google Translate 把日语翻译成芬兰语(远距离语言,彻底打乱结构) Step 4 — Niutrans 把芬兰语翻译回英语(跨引擎,最后重建) 为什么这个链有效? Steps 1-2:用 DeepSeek 高温度重写,打破 AI 统计指纹 Step 3:芬兰语和英语/日语距离最远,强迫彻底重组 Step 4:跨引擎翻译,没有单一引擎的指纹残留 https://github.com/lynote-ai/humanize-text

LinuxDo 最新话题 · 2026-05-22 12:44:41+08:00 · tech

图片反推提示词 json? 自然语言描述? 貌似都不能解决很多问题 我想把一张图片丢给他,然后给我生成自然语言描述,或者说json格式化描述。但是我把它生成的这些东西原本不动的拿去给对应的AI模型进行绘图,发现效果简直就是天差地别,完全不能保持原图的各种参数,并且相关的样式什么的也没有保存完善 最近一直在琢磨这个图片,反推提示词,能让这个提示词精准的复刻出原本图片的各种内容 但是经过几天的努力,还是没有得到任何有效的结果 有没有佬能分享分享文章,或者说探讨一下自己的看法,真的很需要这个 5 个帖子 - 3 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-20 11:57:11+08:00 · tech

苹果计划在 iOS 27 和 iPadOS 27 中加入多项 AI 功能,包括类似 Grammarly 的系统级语法检查器、用自然语言描述即可自动生成 Shortcuts 快捷指令,以及由 Image Playground 驱动的 AI 壁纸生成。这些功能预计在下月 WWDC 公布,9 月向公众推送。 苹果正加紧追赶三星和谷歌在消费级 AI 上的步伐。上周谷歌刚发布 Android 17 及 Gemini Intelligence 新功能,而苹果此次更新也将配合 Siri 改版和照片 AI 编辑工具同步推出。 https://www.bloomberg.com/news/articles/2026-05-18/apple-ios-27-ai-writing-grammar-help-new-shortcuts-app-custom-wallpapers 2 个帖子 - 2 位参与者 阅读完整话题