图文 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 18:02:55+08:00 · tech

现在微信公众号出现了很多图文并茂的知识类文章，应该是用AI生成的，非常不错。但有问题请教下，有些是一页纸的，我觉得还能理解，用某个大模型LLM的图像功能生成。但有些很不错的文章，显示了好几张风格一致的图片，这些一般是用怎么生成的？谢谢。 5 个帖子 - 4 位参与者阅读完整话题

[分享发现] 商汤的文生图模型 SenseNova U1 开始发图文交错的内测码了

v2ex · 2026-06-11 12:25:02+08:00 · tech

在他们的 discord 里会不定期放内测功能的内测码，我用了下还行，对图片风格的一致性保持的不错。 Discord 邀请链接： https://discord.gg/BuTXPHmQub 下面是图文交错的一些案例，最终结果完成度不错。文字有叙事节奏，图片有场景变化，两者配合得挺自然。注意看——我只给了一句话，SenseNova U1 就自动搭出了完整的故事框架。它选了 4 个关键画面做图文交错生成，每个画面都自动生成了完整的生图指令，包括场景描述、角色设定、画面风格，一口气搞定。

感觉ai询问代替搜索引擎还差一口气，就是图文并茂

LinuxDo 最新话题 · 2026-06-08 11:03:26+08:00 · tech

Codex能解决一些能用命令行的问题，但是很多问题仍需要各大应用之间切换解决，这就需要搜索攻略，而攻略往往是图文并茂，直接问gpt只有冷冰冰文字。 3 个帖子 - 2 位参与者阅读完整话题

【纯图文】如何配置Rikkahub使用公益站或中转站

LinuxDo 最新话题 · 2026-06-08 10:24:58+08:00 · tech

今天给对象手机弄ai，找了一下选定了Rikkahub这个chat软件，看到L站也没有人说如何配置这个，我来简单说一下。全图流在外面图做的不太好不过比较易懂哈以我自己的公益站为例选模型然后用就可以啦 1 个帖子 - 1 位参与者阅读完整话题

借鉴STARFlow2设计编排的实时图文混答Dify对话流

LinuxDo 最新话题 · 2026-06-04 13:03:29+08:00 · tech

太久没上论坛，感觉发生了翻天覆地的变化。最近在给公司做Dify企业应用开发，学到了很多新东西，给佬们开开眼界。起因是要设计图文混排的工作流（workflow），因为是后端异步调用dify，所以不用担心耗时的问题。因此最初我的设计是先让LLM输出完整的内容，然后再让另一个LLM理解这些内容，输出一个对象数组，每个对象包含文生图提示词以及图片在内容中的位置（这里采用的方案是按\n\n分割内容，然后计算图片在分割数组中的索引），循环调用文生图工具，将图片上传oss后将oss地址插入到内容中，最后返回。最近提了个新需求，要求给dify的对话流（chatflow）开发图文混答，由于这次是文本图片采用流式输出，就必须考虑耗时的问题了。然而市面上的教程清一色的都是构建知识库，然后在知识库文档中引入图片地址，这样AI检索到图片地址就能完整的输出。但是这种方式非常依赖知识库，而我们的场景主要是医疗领域（产品很多地方借鉴了阿福，只不过我们是针对私域的，而非公众通用），知识库数量庞大，并且维护困难。就在我一筹莫展之际，我找到了这篇文章： baijiahao.baidu.com 苹果研究团队：AI实现图文理解与生成统一框架能力提升突破通过AI解读和理解之后，给出方案为先规划后生成，并且用两个迭代节点并行生成文字和图片，通过代码调度控制输出的节奏。比如：规划LLM给出一个对象数组，大致如下 [ { "id": "text_1", "content": "第一板块的概括内容", "depends": [], "index": 0 }, { "id": "image_1", "content": "基于[text_1]的内容，生成图片：高科技宣传图，蓝色主色，未来风", "depends": ["text_1"], "index": 1 }, { "id": "text_2", "content": "第二板块的概括内容", "depends": ["image_2"], "index": 2 } ] 完成生成的内容会写入队列（Redis），每次输出前都会从完成队列中读取所有未消费的项，判断当前项是否有依赖，依赖项是否完成，是否消费，同时依赖项的依赖项是否完成以及是否消费（递归），满足条件的按照index排序，确保输出顺序正确，最后拼接和输出。当然，这里我只是简单概括，实际逻辑要更复杂，大概是这么个意思。测试流程效果: 现阶段的问题还是出现在循环里的文字生成LLM的提示词不够完善，由于架构的弊端，AI每次循环生成的段落可能重复，加上有一些特殊的业务需求，模型不给力就靠蒙，只能用qwen3.5plus才能勉强满足要求。不过工程问题都好解决，优化一下速度还是能够落地的。 1 个帖子 - 1 位参与者阅读完整话题

【开源】【最幻想的一集】AI 实时生成所有图文内容的交互式剧情游戏，内测期间免费玩，体验可视化、沉浸式、个性化的“参与式幻想”

LinuxDo 最新话题 · 2026-06-03 11:56:42+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 1. 前言本人是《完蛋！我被美女包围了！》、《千恋万花》、《底特律：变人》这种互动剧情类游戏的忠实爱好者，上个月看到 flipbook 发布，他们用多模态模型实现的全新UI交互形态让我很受震撼，于是萌生了做这个项目的想法。项目名叫InfiPlot，有无穷多种剧情、无限长度剧情的意思。佬们可以直接访问 infiplot.com 开始游玩。（目前内测期间，是可以免费玩的。API成本就当作从L站学知识的回报吧，我是真的很希望有更多人可以体验到这种新的交互模式）开源地址： github.com GitHub - zonghaoyuan/infiplot: InfiPlot is the world's first interactive plot... InfiPlot is the world's first interactive plot game that AI generates all text and images in real-time. InfiPlot是全球首个由 AI 实时生成全部图文内容的交互式剧情游戏在线体验： infiplot.com InfiPlot — AI 实时交互剧情游戏 InfiPlot 是一款用 AI 实时生成图片、语音与剧情分支的交互式剧情游戏 Demo。项目目前部署在vercel上，如果佬友所在地区访问体验不佳的话，可以尝试打开科学上网。支持vercel/cloudflare一键部署，cf 部署需要 Workers Paid Plan，推荐用vercel一键部署： 2. 项目介绍 2.1 设计思路 InfiPlot参考了互动剧情游戏的设计，让用户从2-3个选项中选择一个选项来推动剧情的发展。为了实现这个交互设计，我们让每个故事以一连串场景的形式展开，每个场景由一张ai绘制的背景图和一个情节树组成，情节树中包含了这个场景内的剧情分支、人物对话和交互选项。自定义交互输入目前在roadmap中，我们会尽快实现除了点击选项外，你还可以点击场景图中的任何位置触发交互。然后InfiPlot会根据识别到的点击位置，决定要如何回应，比如根据点击位置推进到之前不存在的剧情分支。这个功能参考了flipbook，未来将会作为InfiPlot最重要的功能来开发 2.2 工作原理我们用了multi-agent架构来提升剧情连贯性、角色一致性和整体的剧情质量。我们将agent分为架构师、编剧、角色设计师、场景布置师、画家五个职能，让他们之间相互配合来编排和交付前端显示的内容。他们都学习了对应行业的专业知识，比如编剧学习了电影行业的知识，能够设计出更加跌宕起伏、有吸引力的情节。 multi-agent架构图： 2.3 一些有趣的技术细节 a. 关于tts配音我们目前使用了mimo-v2.5-tts系列模型来配音，从而实现了基于每个角色不同的人设来设计音色，而且可以根据剧情的变化设计声音的情绪。实际体验中，可爱妹子会用很kawaii的声音，班主任则会是那种听起来就很沉稳靠谱的音色。正常情况下是正常说话，但是如果你把角色逼急了，她/他可能会很生气地冲你大叫。当然，如果你成功攻略了某个角色，ta也可能会变得更加娇羞。没有任何音色或情绪是预先设定好的。加上tts模型是在项目最开始时没有预想到的。只是因为我们讨论时考虑到视觉小说都会为角色配音，如果InfiPlot是静音的，沉浸感会大打折扣。最开始我们选择了edge-tts模型（是的我们真的用过这个模型），发出的声音很鬼畜。后来换到minimax的tts模型，充了几十块钱跑了几次测试就花完了，后来才发现逆天的minimax设计一次音色要3块钱，怎么不去抢。前天minimax m3发布的时候，本来期待值拉满，结果又拉了，难评啊难评。最终我们发现大善人mimo的tts模型是免费的，而且质量还挺高，于是就实现了上面所说的定制音色和情绪的功能，体验还不错。（不过由于mimo tts模型有rpm限制，我们后期可能会增加前端自定义mimo apikey的功能，也会同时找mimo客服申请更高的rpm限额，尽可能给大家跟好的游玩体验） b. 关于生图模型的选择毫无疑问，生图模型是InfiPlot的技术难度最大的部分。我们需要延迟极低，同时成本也极低，质量还可靠的模型。此处应该摆出一张三色图：然而还真让我们找到了这种模型：z-image-turbo和flux.2 9b，在runware.ai上的价格都极低。而且最快甚至可以在0.5s内出图！当然0.5s是理论速度，实测runware上flux.2 9b的出图时间在2s内。由于z-image-turbo不支持上传多张参考图，就无法实现角色和场景的一致性，因此最终生图模型选用了flux.2 9b，单图成本$0.00078。不过因为参数量较小，目前仍然会出现角色长出三只手或者有重影之类的问题，暂时还没找到特别好的优化办法，佬友们如果有办法的话可以支个招。 2.4 游玩体验坦率地讲，目前InfiPlot的游玩体验只能达到60分（满分100分），之所以现在就把它发出来，一方面是想要收集更多的用户反馈，另一方面也是因为我们的资源有限，希望能得到更多的关注和更多成员的加入。我会建议佬们现阶段游玩时，优先选择更偏向红果短剧而非豆瓣top250的剧情设定。这是因为InfiPlot目前生成内容的质量还很难和优质的导演、编剧的创作质量竞争，但是对于一些无脑情节，玩起来确实还是蛮爽的。比如我就会玩一些，“穿越回研一，发表nature和n篇顶会，3年拿到博士学位，评上杰青，建立百人课题组”之类的剧情。只能说，当天才少年的感觉真tm爽啊当然，我们的最终目标一定是实现比肩优质剧情小说、真人互动游戏的内容质量和游玩体验。佬友们可以期待一下（如果进展顺利的话）目前InfiPlot还只支持生成基于图片的场景描绘，但用图生视频模型实现动态场景图已经在roadmap里了。 3. 游戏截图下面放一些我们测试过程中截取的比较好看的游戏截图（附剧情概要）：【黄昏归途】他总在黄昏时分，于空无一人的车站遇见少女。她带他穿越时间的缝隙，回到故乡被毁灭前的最后一天。每一次循环，他都必须在拯救她与拯救世界之间做出选择。【社团存亡日】濒临废部的动画社，唯一社员是总在睡觉的怪人。新来的转校生社长发现，只要完成怪人的“日常委托”，社员就会增加一人，而这些人，都来自被遗忘的动画世界。【花魁的刀】她是吉原最负盛名的花魁，舞姿倾城，面具下的真实身份却是令江户幕府闻风丧胆的传奇忍者。当幕府密探踏入花街，刀光与花影将同绽。下面是一些我们测试游玩体验的过程中觉得质量很高的截图，剧情概要在测试时没存就不放了一行小字：上面这些截图并不全是用flux.2 9b生成的，佬友们如果觉得在线demo里的生图质量不够满意的话，可以自部署之后换更高质量的生图模型。如果佬友们感兴趣，我们之后也可以加上预制游戏的功能，这样就可以用时间换质量，在不牺牲游玩体验的前提下享受最佳的画面表现。我们未来可能会用InfiPlot制作一些精品游戏发布到steam，佬们可以期待一下。 4. 写在最后，关于团队我们团队的成员来自清华大学、兰州大学、西安交大等高校。目前团队还在招募新成员，如果佬友们感兴趣加入的话，欢迎论坛私信或者邮件联系我（最好带上简单的自我介绍）邮箱：[email protected] 我们几个人目前都是兼职开发InfiPlot，而且大部分时候是远程合作（甚至有在澳洲的同学），所以时间和地点上不会太有压力。遵守社区规定，这里就不放内测用户群的二维码了，感兴趣的佬可以去网站或者github项目页找到qq群二维码和群号，欢迎来和我们聊天！最后最后，求回复求star（应该不违反社区规定吧）谢谢佬友们，爱你们 11 个帖子 - 4 位参与者阅读完整话题

[分享创造] 做了一个 AutoGeo：给 SaaS / 工具站自动生成 GEO 图文博客，支持多语言、定时发布和 API 拉取

v2ex · 2026-06-03 10:31:38+08:00 · tech

最近做了一个小工具，叫 AutoGeo： https://autogeoflow.com/ 对，就是自动写文章的，可以根据关键词、标题、知识库生成长图文，目标是替换网站自己的博客系统可以设置自己的 ai key ，也可以使用系统自带的 ai 评论提供注册邮箱，送 30 积分，可以发 30 偏文章、30 个 gpt 2 插图详细介绍：主要解决一个我自己在做 SaaS / 工具站时经常遇到的问题：产品网站上线以后，首页、Pricing 、FAQ 、Docs 这些页面都可以很快搭起来，但 Blog / Guide / Use Case 这类内容很难长期维护。尤其现在除了传统 SEO ，很多人也开始关注 GEO ，也就是 Generative Engine Optimization ，面向 ChatGPT 、Claude 、Gemini 、Perplexity 、Google AI Overviews 这类 AI 搜索 / 问答入口的内容可见度。单纯让 AI 手动写几篇文章其实不难，难的是：文章需要持续更新，不是上线时写 3 ～ 5 篇就结束 SaaS 网站通常需要覆盖不同关键词、使用场景、对比内容、FAQ 如果做海外产品，还要支持多语言内容内容不能完全靠空 prompt 胡编，最好基于产品资料、FAQ 、文档、案例等真实知识库生成之后还要审核、发布、同步到自己的博客系统所以我做了 AutoGeo ，想把“偶尔用 AI 写一篇博客”变成一个可重复执行的 GEO 内容工作流。目前的基本流程是：创建项目准备关键词 / 标题 / 知识库 / 图片素材选择 Prompt 、语言、模型和发布节奏批量生成结构化 GEO 图文文章文章进入草稿 / 审核状态审核后发布通过 API 或 Webhook 同步到自己的站点

求音乐小球视频制作图文教程

LinuxDo 最新话题 · 2026-06-02 12:23:25+08:00 · tech

各位佬，前几天倒腾clianything，突然发现支持blender了，想起之前一直想实现的音乐小球的视频，给codex用goal迭代了一周了，还是完全没眼看，求个文字教程，越详细越好 1 个帖子 - 1 位参与者阅读完整话题

Ubuntu安装ROS(2) —— 安装ROS2 humble(最新、超详细图文教程，包含配置rosdep)

LinuxDo 最新话题 · 2026-05-27 00:16:35+08:00 · tech

Ubuntu 安装 ROS2 ROS简介： ROS 是一个适用于机器人的开源的元操作系统。它提供了操作系统应有的服务，包括硬件抽象，底层设备控制，常用函数的实现，进程间消息传递，以及包管理。在某些方面ROS相当于一种“机器人框架（robot frameworks）(来自ROSwiki)。 **ROS2与ROS1的区别： **ROS2作为ROS1的继任者，在保持ROS核心功能的基础上进行了诸多改进和优化。相较于ROS1，ROS2取消了ROS1中的Master中央节点，实现了节点的分布式发现、发布/订阅、请求/响应通讯。ROS1使用自定义的中间件（roscore），而ROS2使用DDS中间件。ROS1使用catkin作为构建系统，而ROS2使用colcon作为构建系统 ROS发展史安装 ROS1 可以看下面教程 ubuntu安装ROS(1) —— 以 ROS1 melodic 为例(最新、超详细图文教程，包含配置rosdep) 1. ROS2安装准备建议准备一个干净、换好源的 ubuntu 20.04 以上的虚拟机（建议[清华源]( ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror )）查看ubuntu 版本 lsb_release -a 根据自己的 ubuntu 的版本选择 ROS2 版本 (我的是 ubuntu 22.04 所以对应ROS2版本为 humble ） ROS2版本生命周期 Ubuntu版本语言依赖 Foxy Fitzroy 2020.5-2023.5 Ubuntu Focal (20.04) C++ >=14、Python >= 3.7 Galactic Geochelone 2021.5-2022.11 Ubuntu Focal (20.04) C++ >=17、Python >=3.6 Humble Hawksbill 2022.5-2027.5 Ubuntu Jammy (22.04)、Ubuntu Focal (20.04)(只能源码安装) C++ >=17 、Python >=3.6 Iron Irwini 2023.5-2024.11 Ubuntu Jammy (22.04) C++ >=17 、Python >= 3.8 Jazzy Jalisco 2024.5-2029.5 Ubuntu Noble (24.04) C++ >=17 、Python >= 3.8 这里只列出了 Foxy 之后的Ubuntu版本支持，更多版本与细节可以看官方说明。方法一（推荐）使用小鱼ROS一键安装要使用小鱼的一键安装系列，需要下载一个鱼香大佬写的脚本，然后执行这个脚本，进行ROS的安装与环境的配置（此脚本一直在更新，可能会跟示例截图有点区别，根据实际的序号来选择，除了 ROS 还可以安装很多工具，具体可以看鱼香大佬的说明）下载脚本并执行脚本 wget http://fishros.com/install -O fishros && . fishros 输入密码然后就会看见选择安装界面，我们看界面可以看到小鱼的脚本还可以支持很多工具安装，这里我们选择 1 ROS安装大家可以看到这里会显示出你当前的Linux发行版版本，而且他还支持arm平台（我在jetson nano试过，可以）。让你选择是否按照他提供的源进行安装，因为我己经换了源了这里选择 2，如果没换源可以选 1。到这里就是选择ROS版本，这里我选择 1 humble(ROS2) Desktop 版 (推荐)包含: ROS, RViz, demos, tutorials。base版仅包含：Communication libraries, message packages, command line tools.。不包含 GUI tools。(新手直接选桌面版) 这里选 1 ，后面就进行安装了（大概几分钟）显示这个表示ROS2安装完成可以打开用户目录下的 .bashrc 文件**(它是隐藏文件)** ，可以在最后看到 ROS2环境方法二使用官方教程(Debian 包) 其实这跟小鱼的脚本本质上差不多，只是小鱼的脚本已经帮你把环境依赖、版本选择、网络问题都跟你封装、解决好了。 Ubuntu (Debian packages) — ROS 2 Documentation: Humble documentation 设置 locale 这是确保你的本地语言支持 UTF-8。 sudo apt update && sudo apt install locales sudo locale-gen en_US en_US.UTF-8 sudo update-locale LC_ALL=en_US.UTF-8 LANG=en_US.UTF-8 export LANG=en_US.UTF-8 设置源启用Universe源 sudo apt install software-properties-common sudo add-apt-repository universe 注：红框这里是一个提示，直接按回车键就行添加 ROS 2 GPG key sudo apt update && sudo apt install curl gnupg2 -y sudo curl -sSL https://gitee.com/tyx6/rosdistro/raw/master/ros.key -o /usr/share/keyrings/ros-archive-keyring.gpg 为软件源添加 ROS2 repository 根据自己需要选一个就行官方源： echo "deb [arch=$(dpkg --print-architecture) signed-by=/usr/share/keyrings/ros-archive-keyring.gpg] http://packages.ros.org/ros2/ubuntu $(. /etc/os-release && echo $UBUNTU_CODENAME) main" | sudo tee /etc/apt/sources.list.d/ros2.list > /dev/null 清华源： echo "deb [arch=$(dpkg --print-architecture) signed-by=/usr/share/keyrings/ros-archive-keyring.gpg] https://mirrors.tuna.tsinghua.edu.cn/ros2/ubuntu $(. /etc/os-release && echo $UBUNTU_CODENAME) main" | sudo tee /etc/apt/sources.list.d/ros2.list > /dev/null 安装 Desktop 版 (推荐)包含: ROS, RViz, demos, tutorials。(新手直接选桌面版) base版仅包含：Communication libraries, message packages, command line tools.。不包含 GUI tools。 sudo apt update && sudo apt upgrade sudo apt install ros-humble-desktop 设置环境 echo "source /opt/ros/humble/setup.bash" >> ~/.bashrc source ~/.bashrc #使环境生效可以打开用户目录下的 .bashrc 文件，可以在最后看到 ROS环境 2. 配置rosdep(可选) 在使用许多 ROS 工具之前，需要初始化 rosdep ，有些功能包源码编译需要 rosdep 来安装这些系统依赖项，不配置也不影响ros使用，所以后面需要时再来配置也可以。方法一（推荐）使用小鱼ROS一键安装下载脚本并执行脚本 (因为每次执行这个脚本后，都会自动删除脚本，所以需要重新执行) wget http://fishros.com/install -O fishros && . fishros 这里我们选择 3 配置rosdep 安装好后显示如下在终端输入 rosdepc update 进行配置，显示这个表示配置成功 (注：使用小鱼ROS一键安装rosdep，在后续使用时请将rosdep替换为rosdepc使用) 方法二通过修改文件这个rosdep 请求的是国外的服务器，所以会被墙。有些是通过代理的方式，但这个不稳定，因为时间久了要么代理跑路了，要么被墙了。它需要的文件都官方都放在 github 上的，那么我们可以改url地址即可。安装依赖 sudo apt install python3-rosdep 自动修改使用脚本 wget https://gitee.com/tyx6/mytools/raw/main/ros/Mrosdep.py sudo python3 Mrosdep.py 注：如果脚本执行失败可以手动修改，或者在评论区提问手动修改修改4个文件，都是将地址 https://raw.githubusercontent.com/ 改为 https://gitee.com/tyx6/rosdistro/raw/master/ sudo gedit /usr/lib/python3/dist-packages/rosdep2/sources_list.py # 在大概64行修改 DEFAULT_SOURCES_LIST_URL = 'https://gitee.com/tyx6/mytools/raw/main/ros/20-default.list' sudo gedit /usr/lib/python3/dist-packages/rosdistro/__init__.py # 大概在68行的地址 sudo gedit /usr/lib/python3/dist-packages/rosdep2/gbpdistro_support.py # 大概在34行的地址 sudo gedit /usr/lib/python3/dist-packages/rosdep2/rep3.py # 大概在36行的地址修改sources_list.py文件修改init.py文件修改gbpdistro_support.py文件修改rep3.py文件开始配置 sudo rosdep init rosdep update 3. 测试在一个终端中，输入命令： ros2 run demo_nodes_cpp talker 在另一个终端中，输入命令： ros2 run demo_nodes_py listener 运行结果如下图所示：参考 ROS Documentation Ubuntu (Debian packages) — ROS 2 Documentation: Humble documentation rosdep是什么？怎么用 | 鱼香ROS (fishros.org.cn) 小鱼的一键安装系列 | 鱼香ROS (fishros.org.cn) Ubuntu 22.04 LTS安装ROS2 (ros-humble-desktop)-CSDN博客如有其他问题，或者发现文章有错误，请在评论区留言 Keep learning！ 1 个帖子 - 1 位参与者阅读完整话题

ubuntu安装ROS(1) —— 以 ROS1 melodic 为例(最新、超详细图文教程，包含配置rosdep)

LinuxDo 最新话题 · 2026-05-26 19:38:29+08:00 · tech

Ubuntu 安装 ROS ROS简介： ROS 是一个适用于机器人的开源的元操作系统。它提供了操作系统应有的服务，包括硬件抽象，底层设备控制，常用函数的实现，进程间消息传递，以及包管理。它也提供用于获取、编译、编写、和跨计算机运行代码所需的工具和库函数。在某些方面ROS相当于一种“机器人框架（robot frameworks）(来自ROSwiki) ROS发展史注：此教程安装的是ROS1，而ROS Noetic 为 ROS1 最后一个版本，也就是说后续不会更新 ROS1 的版本，只会更新 ROS2。而且 ROS Noetic 支持Ubuntu 20.04，所以Ubuntu 20.04 以后的版本想要用ROS1 ，可能需要自己下载 ROS 源码，然后编译源码来安装 ROS 。源码安装官方教程 noetic/Installation/Source - ROS Wiki 安装 ROS2 可以看下面教程 ubuntu安装ROS(1) —— 以 ROS2 humble 为例(最新、超详细图文教程，包含配置rosdep) 1. ROS安装准备建议准备一个干净、换好源的 ubuntu 16.04 以上的虚拟机（建议清华源 ) 查看ubuntu 版本 lsb_release -a 根据自己的 ubuntu 的版本选择 ROS 版本 (我的是 ubuntu 18.04 所以对应ROS版本为 melodic ）方法一（推荐）使用小鱼ROS一键安装要使用小鱼的一键安装系列，需要下载一个脚本，然后执行这个脚本，进行ROS的安装与环境的配置（此脚本一直在更新，可能会跟示例截图有点区别，根据实际的序号来选择，除了 ROS 还可以安装很多工具，具体可以看鱼香大佬的说明）下载脚本并执行脚本 wget http://fishros.com/install -O fishros && . fishros 初次执行会让你输一次密码然后就会看见选择安装界面，我们看界面可以看到小鱼的脚本还可以支持很多工具安装，这里我们选择 1 ROS安装大家可以看到这里会显示出你当前的Linux发行版版本，而且他还支持arm平台（我在jetson nano试过，可以），接着会让你选择是否按照他提供的源进行安装，因为我己经换了源了这里选择 2 ，如果没换源可以选 1 到这里就是选择ROS版本，这里我选择 1 melodic(ROS1) 这里也选 1 ，后面就进行安装了（大概几分钟）显示这个表示安装完成（可能会让你再次输入密码）可以打开用户目录下的 .bashrc 文件，可以在最后看到 ROS环境在终端输入 roscore ，看到以下输出表示ROS安装成功，后面就可以自行选择配置 rosdep 方法二使用官方教程其实这跟小鱼的脚本本质上差不多，只是小鱼的脚本已经帮你把环境依赖、版本选择、网络问题都跟你封装、解决好了，还有一种是用源码安装ROS ,之前在树莓派上试过，大家有兴趣可以尝试了解一下。官方教程 - ROS Wiki 加入ROS清华镜像源 sudo sh -c '. /etc/lsb-release && echo "deb http://mirrors.tuna.tsinghua.edu.cn/ros/ubuntu/ `lsb_release -cs` main" > /etc/apt/sources.list.d/ros-latest.list' 设置key sudo apt-key adv --keyserver 'hkp://keyserver.ubuntu.com:80' --recv-key C1CF6E31E6BADE8868B172B4F42ED6FBAB17C654 安装 sudo apt update sudo apt install ros-melodic-desktop # for noetic # sudo apt install ros-noetic-desktop 设置环境 #对于Ubuntu20 # echo "source /opt/ros/noetic/setup.bash" >> ~/.bashrc echo "source /opt/ros/melodic/setup.bash" >> ~/.bashrc source ~/.bashrc #使环境生效可以打开用户目录下的 .bashrc 文件，可以在最后看到 ROS环境在终端输入 roscore ，后面就可以自行选择配置 rosdep 2. 配置rosdep 在使用许多 ROS 工具之前，需要初始化 rosdep ，有些功能包源码编译需要 rosdep 来安装这些系统依赖项，不配置也不影响ros使用，所以后面需要时再来配置也可以。方法一（推荐）使用小鱼ROS一键安装下载脚本并执行脚本 (因为每次执行这个脚本后，都会自动删除脚本，所以需要重新执行) wget http://fishros.com/install -O fishros && . fishros 这里我们选择 3 配置rosdep 安装好后显示如下，在终端输入 rosdepc update 进行配置**(注：使用小鱼ROS一键安装rosdep，在后续使用时请将rosdep替换为rosdepc使用)** 显示这个表示配置成功方法二通过修改文件这个 rosdep 请求的是国外的服务器，所以会被墙。有些是通过代理的方式，但这个不稳定，因为时间久了要么代理跑路了，要么被墙了。它需要的文件都官方都放在 github 上的，那么我们改url地址即可。安装依赖 sudo apt install python-rosdep python-rosinstall python-rosinstall-generator python-wstool build-essential # 对于Ubuntu20 # sudo apt install python3-rosdep python3-rosinstall python3-rosinstall-generator python3-wstool build-essential (1) 自动修改使用脚本 wget https://gitee.com/tyx6/mytools/raw/main/ros/Mrosdep.py sudo python3 Mrosdep.py 注：如果脚本执行失败可以手动修改，或者在评论区提问 (2) 手动修改修改4个文件，都是将地址 https://raw.githubusercontent.com/ 改为 https://gitee.com/tyx6/rosdistro/raw/master/ 注：由于在Ubuntu 20.04 中 ros 支持 python3，所以将文件地址中的 python2.7 改为 python3 比如：/usr/lib/python2.7/dist-packages/rosdep2/sources_list.py 改为 /usr/lib/python3/dist-packages/rosdep2/sources_list.py sudo gedit /usr/lib/python2.7/dist-packages/rosdep2/sources_list.py # 在大概64行修改 DEFAULT_SOURCES_LIST_URL = 'https://gitee.com/tyx6/mytools/raw/main/ros/20-default.list' sudo gedit /usr/lib/python2.7/dist-packages/rosdistro/__init__.py # 大概在68行的地址 sudo gedit /usr/lib/python2.7/dist-packages/rosdep2/gbpdistro_support.py # 大概在34行的地址 sudo gedit /usr/lib/python2.7/dist-packages/rosdep2/rep3.py # 大概在36行的地址修改sources_list.py文件修改init.py文件修改gbpdistro_support.py文件修改rep3.py文件开始配置 sudo rosdep init rosdep update # 输出跟下面差不多就行 3. 测试输入下列命令： roscore 参考 REP 3 – Target Platforms (ROS.org) [ROS 系列学习教程] ROS与操作系统版本对应关系_ros版本与ubuntu对应版本-CSDN博客 melodic/Installation/Ubuntu - ROS Wiki noetic/Installation/Source - ROS Wiki 小鱼的一键安装系列 | 鱼香ROS (fishros.org.cn) 如有其他问题，或者发现文章有错误，请在评论区留言 Keep learning！ 7 个帖子 - 7 位参与者阅读完整话题

手把手教你搭建机场（节点） VPS+Xboard+V2bX+Docker+Caddy+Cloudflare+域名配置全图文保姆级教程

LinuxDo 最新话题 · 2026-05-21 11:37:26+08:00 · tech

前言本文只做技术分享，禁止转载本文分为两个章节进行讲解，这两个没有直接关系也没啥间接关系，但重复内容我就没有再复制粘贴了，需要的地方也有跳转提示，佬友根据自己情况进行查看一、搭建自用节点（简单）二、搭建机场（较复杂）由于VPS选择+Cloudflare+域名配置跟我之前的文章有交叉，为了对小白友好，所以我就直接复制粘贴了，有了解的佬友可以自行选择需要的章节进行学习，右边有目录本教程需要的技术（版本仅作为参考）：一、搭建自用节点（简单）： VPS（云服务器）（地区选择：硅谷，必须海外）：2c2g（2个CPU核数2G的内存，1c1g即可） v2ray-agent （八合一脚本）：v3.5.18（latest）二、搭建机场（较复杂） VPS（云服务器）（地区选择：硅谷，必须海外）：2c2g（2个CPU核数2G的内存，必须2g内存） Xboard （机场开源面板）：master 分支最新开发版（2026-05-03 构建）（没有具体版本号）（latest）（既然做机场了，就不用SQLite，直接上mysql+redis，所以这里至少需要2g内存） V2bX ：v0.4.0（latest） Caddy ：v2.11.3（latest） mysql ：5.7 redis ：8.6.3（latest） docker ：26.1.4 docker-compose ：2.27.1 本教程需要的工具： FinalShell ：SSH远程连接工具 v2rayN ：代理工具 clash-verge-rev ：代理工具零、VPS选择+域名配置（cf代理）我买了腾讯云的服务器用来做教学，全程可用国内网访问有vps的佬可以跳过这一步了 VPS选择 1、活动页腾讯云最新活动这个为新人优惠，2c2g一年99米这是两个图片拼接起来的，颜色不同的大框表示不同的图片，这两个图片的截取在同一个页面，下滑即可 2、购买完毕后进入控制台这也是两张图片拼接起来的，颜色不同的大框表示不同的图片，上面黄框是腾讯云的主页的头部标签，下面红框是点击控制台后进入控制台的页面 3、查看服务器ip 也是由黄框和红框分别不同的图片由于腾讯云默认安全组打开了22端口（SSH服务），这里就不进安全组了，后文有讲到如何配置安全组，这里不过多赘述 4、使用FinalShell连接到服务器填写名称、主机ip、用户名和密码即可连接到我们的服务器 FinalShell的好处就是修改文件或者上传下载文件时是可视化的，不用一遍一遍敲命令行域名配置（cf代理）这里我使用的是 cloudflare 做的代理，所以我按cloudflare讲解，其他的云服务商配置也是大同小异我买的顶级域名为（严格来说这是二级域名，我习惯说这是顶级域名）：wudike.online 下文有两个地方需要使用到域名，一个是我们搭建机场（xboard服务）还有一个是配置自用节点（可不使用域名，且不使用域名更高效、安全） 1、使用 Cloudflare 的 DNS 代理我们的域名这里的域名是我之前买的，在阿里云上的，所以我用阿里云作为演示，各个云服务商的操作都是大同小异的（1、进入域名与网站（2、选择域名进行购买查询之后下滑点击购买就可以了域名这里买了之后要实名去备份，审核要几个工作日吧，有点忘记了（3、登录Cloudflare，并交给Cloudflare托管 ps：Cloudflare右上角人物头像那可以切换语言 ①、添加域名下面那个我已经注册了，上面已经有服务了，注销在注册太麻烦 ②、跟着我的步骤点点就行了上面四个步骤结束后我们得到了下面这个页面，需要去我们的云服务商重新配置一下DNS解析 ③、我们去阿里云配置一下域名的解析进入我们的工作台，点击域名就可以看到我们购买的域名了进去之后我们就可以修改DNS代理了注：国际域名最少填写2个，最多填写13个，国内域名最多填写6个。所以我们两个都要复制哦，把之前的替换掉 ④、回到Cloudflare 下拉后，点击我已更新名称服务器我们等十分钟后刷新一下如果出现这样就代表成功了，由于我已经配置了一个域名，不想再去买一个配置了，下面这张图用的小黄大佬的图一、搭建自用节点（简单） 1、安装v2ray-agent脚本 wget -P /root -N --no-check-certificate "https://raw.githubusercontent.com/mack-a/v2ray-agent/master/install.sh" && chmod 700 /root/install.sh && /root/install.sh 运行完上面代码我们就得到了下面的脚本执行命令 2、根据面板选择 2.1、Xray-core + VLESS + Reality + uTLS + Vision（简单、抗探测能力强、抗封锁能力强、传输速度快、资源占用率低、无域名、不可cdn代理，推荐）不要以为无域名无代理就不安全了，恰恰相反这是最快最安全的（之一），唯一的缺点是无法套CDN，自用够够的了从上至下执行命令 vasma # 执行脚本 2 # 任意组合安装 1 # Xray-core 7 # VLESS+Reality+uTLS+Vision[推荐] # 后面回车即可，注意端口这里要开防火墙和安全组，所以手动填好一点执行后就得到了下面三个字符串，最重要的是通用格式，复制通用格式的字符串复制进我们的 v2rayN 代理工具中测试一下可使用了，文章后面我会讲如何导入clash 回车后选择自动配置系统代理即可使用 2.2、Xray-core + VLESS + TLS + WS（复杂、抗探测能力弱、抗封锁能力弱、传输速度一般、资源占用率低、有域名、可cdn代理，不推荐）在v2ray-agent脚本中配置域名会有 nginx 占用443端口，所以有服务使用了443端口，强烈不建议用这个首先在cloudflare中配置域名时代理状态先关掉（变成灰色的云），脚本检测域名是否指向了本机关掉代理创建API令牌这里是因为脚本需要通过我们的 api token 去获取SSL证书，所以我们需要先申请API token 搜索 API 令牌，点击创建令牌使用编辑区域DNS模板，选择域名后一路确认到最后一步复制 API ，注意这里关闭后就无法找到了，记得保存执行脚本从上至下执行命令，我现在配置的域名为cdn.wudike.online vasma # 执行脚本 2 # 任意组合安装 1 # Xray-core 1 # VLESS+TLS+WS[仅CDN推荐] 域名:cdn.wudike.online # 你自己的域名端口:2053 # 因为cf的https有固定的几个端口不可乱填，可以填的端口：443、2053、2083、2087、2096、8443 是否使用DNS API申请证书[支持NAT]？[y/n]:y # 后面要用到我们上面 api token 请选择[回车]使用默认:1 # cloudflare[默认] 请输入API Token:**** # 星号就是我们复制的 api token 请选择[回车]使用默认:1 # letsencrypt[默认] # 后面的操作无脑回车即可，也可以自己填，无所谓的我们就得到了 vless 链接，注意要用ws的，使用方式如 2.1 所示配置 cf 代理并测试我们再去 cf 开启域名的代理，等10分钟后我们去测试测试一下是否符合我们的预期，符合预期 PS：配置Clash 这里相当于就是把vless链接转为clash的yaml文件，为了佬友方便，我 vibe coding 了一个项目源码放在这里了： clash-converter 也可以使用我部署的网站： Proxy ↔ Clash 双向转换器二、搭建机场（较复杂） 1、创建文件这里我们要创建单个文件，第一个是xboard的配置文件 .env 、一个是 docker-compose.yml 启动文件、一个是 Caddyfile （caddy的配置文件，之前的文章讲了nginx，这里就换个代理工具讲解） mkdir -p /opt/xboard && touch /opt/xboard/{.env,Caddyfile,docker-compose.yml} .env 包含的参数是需要修改的，包含的是可修改的，其他的可以照抄 APP_NAME=XBoard APP_ENV=production APP_KEY=base64:iH2lk8cdnIj0sLgeNzEzAa2GEhPCROrxsa5etAk35sI= APP_DEBUG=false APP_URL=http://localhost LOG_CHANNEL=stack DB_CONNECTION=mysql # ❓选择mysql服务，看样子也可以使用postgresql，这个就交给各位实践了 DB_HOST=mysql # ⚠️mysql的服务名（docker-compose文件中的服务名） DB_PORT=3306 # 用默认的就行了 DB_DATABASE=xboard # ❓数据库名 DB_USERNAME=root # 数据库用户名，用root就行了，其实该mysql也不对外，新不新增用户都行 DB_PASSWORD=123456 # ⚠️密码，就算不对外，这个还是设计的越安全越好的 REDIS_HOST=redis # ⚠️redis的服务名（docker-compose文件中的服务名） REDIS_PASSWORD= # redis不要设置密码，也可以设置，主要是麻烦 REDIS_PORT=6379 # 用默认的就行了 BROADCAST_DRIVER=log CACHE_DRIVER=redis QUEUE_CONNECTION=redis MAIL_DRIVER= MAIL_HOST= MAIL_PORT= MAIL_USERNAME= MAIL_PASSWORD= MAIL_ENCRYPTION= MAIL_FROM_ADDRESS= MAIL_FROM_NAME= MAILGUN_DOMAIN= MAILGUN_SECRET= # google cloud storage ENABLE_AUTO_BACKUP_AND_UPDATE=false GOOGLE_CLOUD_KEY_FILE=config/googleCloudStorageKey.json GOOGLE_CLOUD_STORAGE_BUCKET= # Prevent reinstallation # 这里是初始化需要的参数，没有值的时候就说明是初始化，可以使用初始化脚本，初始化脚本执行完成后会修改这个值，所以不需要手动再次修改该文件 INSTALLED= docker-compose.yml 包含的参数是需要修改的，包含的是可修改的，其他的可以照抄 services: # ---------- Xboard 主应用 ---------- xboard: # 服务名 image: ghcr.io/cedar2025/xboard:latest # 镜像名 restart: unless-stopped # 重启策略 container_name: xboard # 容器名 # 移除 ports 映射，因为现在通过 Caddy 代理 # ports: # - "9888:7001" expose: - "7001" # ⚠️只在内部网络暴露希望保留给宿主机的话用上面的ports depends_on: # mysql和redis检测到健康后再启动 mysql: condition: service_healthy redis: condition: service_healthy volumes: # 卷挂载 - ./.env:/www/.env # 挂载 .env 文件 - ./.docker/.data/:/www/.docker/.data - ./storage/logs:/www/storage/logs - ./storage/theme:/www/storage/theme - ./plugins:/www/plugins environment: # 环境参数 - RESOURCE_PROFILE=balanced # minimal | balanced | performance | auto - ENABLE_HORIZON=true - docker=true networks: # docker网络 - xboard-net # ---------- MySQL 数据库 ---------- mysql: image: mysql:5.7 restart: unless-stopped container_name: xboard-mysql environment: MYSQL_ROOT_PASSWORD: 123456 # ⚠️密码改后记得后面操作还需要输入 MYSQL_DATABASE: xboard # ❓建议不改 volumes: - mysql-data:/var/lib/mysql networks: - xboard-net healthcheck: # 心跳检测机制 test: ["CMD", "mysqladmin", "ping", "-h", "localhost", "-u", "root", "-p123456"] timeout: 20s retries: 10 # ---------- Redis 缓存 ---------- redis: image: redis:latest restart: unless-stopped container_name: xboard-redis command: redis-server --appendonly yes # 启用 AOF volumes: - redis-data:/data networks: - xboard-net healthcheck: test: ["CMD", "redis-cli", "ping"] interval: 10s timeout: 5s retries: 5 # ---------- Caddy 反向代理 ---------- caddy: image: caddy:latest restart: unless-stopped container_name: xboard-caddy ports: - "80:80" - "443:443" volumes: - ./Caddyfile:/etc/caddy/Caddyfile:ro # ❓就是下面的Caddyfile文件建议不改 - caddy-data:/data # 存储证书 networks: - xboard-net depends_on: - xboard networks: xboard-net: driver: bridge # 桥接模式 volumes: mysql-data: # MySQL 数据持久化 redis-data: # Redis 数据持久化（原有） caddy-data: # 存储证书 Caddyfile 这里域名需要再cf中进行配置，具体参考本文目录中，一、搭建自用节点（简单）中的 2.2、Xray-core + VLESS + TLS + WS（复杂、抗探测能力弱、抗封锁能力弱、传输速度一般、资源占用率低、有域名、可cdn代理，不推荐），看一下就会配置域名了包含的参数是需要修改的，包含的是可修改的，其他的可以照抄 # 替换成你的实际域名 vpn.wudike.online { # ⚠️改成自己的域名 # 反向代理到 Xboard 容器 reverse_proxy xboard:7001 # ⚠️这里也是自己的服务名和端口 } 2、初始化先让mysql和redis服务跑起来再初始化 docker compose up -d mysql redis # 等个10s后执行下面脚本 docker compose run -it --rm -e ENABLE_REDIS= xboard php artisan xboard:install 下面是执行后的结果，供参考包含的参数是需要修改的，包含的是可修改的， xxx 是脱敏需要你们自己填，其他的可以照抄 [root@VM-0-16-centos xboard]# docker compose up -d mysql redis [+] Running 6/6 ✔ Network xboard_xboard-net Created 0.1s ✔ Volume "xboard_redis-data" Created 0.0s ✔ Volume "xboard_caddy-data" Created 0.0s ✔ Volume "xboard_mysql-data" Created 0.0s ✔ Container xboard-redis Started 0.5s ✔ Container xboard-mysql Started 0.5s [root@VM-0-16-centos xboard]# docker compose run -it --rm -e ENABLE_REDIS= xboard php artisan xboard:install [+] Creating 2/0 ✔ Container xboard-mysql Running 0.0s ✔ Container xboard-redis Running 0.0s [entrypoint] Auto-tune (profile=balanced): cpus=2 mem=1024MiB slots=9 -> octane=2 horizon(dp/biz/notif)=2/1/1 horizon_worker_mem=256MB [entrypoint] Horizon supervisors use balance=auto with minProcesses=1, so they scale up to the cap on demand and back down when idle. [entrypoint] Skipping xboard:update (not yet installed or running xboard:install). [entrypoint] Starting services (caddy=true web=true horizon=true ws=true)... __ __ ____ _ \ \ / /| __ ) ___ __ _ _ __ __| | \ \/ / | __ \ / _ \ / _` | '__/ _` | / /\ \ | |_) | (_) | (_| | | | (_| | /_/ \_\|____/ \___/ \__,_|_| \__,_| ┌ 请选择数据库类型 ────────────────────────────────────────────┐ │ MySQL │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入MySQL数据库地址 ───────────────────────────────────────┐ │ mysql # ⚠️这里是docker中mysql的服务名 │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入MySQL数据库端口 ───────────────────────────────────────┐ │ 3306 │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入MySQL数据库名 ─────────────────────────────────────────┐ │ xboard │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入MySQL数据库用户名 ─────────────────────────────────────┐ │ root │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入MySQL数据库密码 ───────────────────────────────────────┐ │ 123456 │ └──────────────────────────────────────────────────────────────┘ ┌ 是否启用Docker内置的Redis ───────────────────────────────────┐ │ 不启用 │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入Redis地址 ─────────────────────────────────────────────┐ │ redis │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入Redis端口 ─────────────────────────────────────────────┐ │ 6379 │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入redis密码(默认: null) ─────────────────────────────────┐ │ # ❓redis本来就没有设置密码，这里回车就行了 │ └──────────────────────────────────────────────────────────────┘ ┌ 请输入管理员账号 ────────────────────────────────────────────┐ │ xxxxxxxxxxxxxx # ⚠️管理员登录的账号 │ └──────────────────────────────────────────────────────────────┘ INFO Configuration cached successfully. 正在导入数据库请稍等... 🚀 开始执行流量重置任务... 🔧 修正模式 - 将重新计算next_reset_at为null的用户 ✅ 没有发现next_reset_at为null的用户 ✅ 任务完成！ 📊 修正结果统计: 🔍 发现用户总数: 0 ✅ 成功修正数量: 0 ⏱️ 总执行时间: 0 秒 ✨ 无错误发生数据库导入完成开始注册管理员账号正在安装默认插件... 默认插件安装完成 🎉：一切就绪管理员邮箱：xxxxxxxxxxxxxx # ⚠️之前输入的账号，这里改不了，加感叹号号是提示这里比较重要管理员密码：xxx # ⚠️初始密码，后面可以改访问 http(s)://你的站点/xxx 进入管理面板，你可以在用户中心修改你的密码。 # ⚠️/xxx 要带这个path才能访问管理员的面板 3、启动Xboard cd /opt/xboard && docker compose up -d 访问我们的域名就可以看见项目已经启动部署成功了 4、配置我们的xboard（后台管理系统，跟path有关系，仔细看第二步的最后）通过我们的域名+path登录到后台管理系统（ https://域名/path ）这里不会什么功能都讲，主要是把主流程给跑通（1、修改名字（2、添加节点（很重要）在节点管理中添加节点我们选择vless去配置就可以了，这里我把主要的以文字形式写出来，也可以直接看我的图片讲讲协议：vless 节点名称：随意自定义节点ID：很重要后面创建节点会用到权限组：这个跟后面的套餐有关系，套餐又跟用户有关系，所以很重要，没有就添加一个节点地址：ip地址连接端口、服务端口：记得开服务端口的防火墙和安全组安全性：Reality 伪装节点：找个大网站就行了私钥、公钥：生成一下就行了 Short ID：生成一下就行了 uTLS：开启传输协议：TCP 流控：xtls-rprx-vision 可以照着我的写添加完之后记得打开显示开关（3、套餐管理（其实还有一部权限组管理，但我们在节点里面也添加了一个权限，所以可以直接略过了）有四个参数要填写，其他随意名称：随意，不要和权限组管理名称重复，不好管理服务器分组：就是我们之前填的权限组管理流量、价格：记得设置，不然后续购买有问题打开显示、新购、续费开关（4、新增用户（为了后面方便测试）（5、创建ApiKey（很重要）在系统配置的节点配置中生成一个通讯秘钥 5、使用V2bX创建脚本（1、环境准备 # 修复 V2bX 必需文件（必须执行） mkdir -p /etc/V2bX && echo "{}" > /etc/V2bX/sing_origin.json （2、安装 V2bX wget -N https://raw.githubusercontent.com/wyx2685/V2bX-script/master/install.sh && bash install.sh # 执行到这里的时候选择n 检测到你为第一次安装V2bX,是否自动直接生成配置文件？(y/n): n （3、修改 /etc/V2bX/config.json 文件这里面有几个参数可以修改 ApiHost：你自己的域名 ApiKey：之前在系统管理里面生成的通讯秘钥 NodeID：之前在节点中自定义的节点ID NodeType：我们之前创建节点的时候选择的Vless协议 { "Log": { "Level": "info" }, "Cores": [ { "Type": "sing", "Log": { "Level": "info" }, "OriginalPath": "/etc/V2bX/sing_origin.json" } ], "Nodes": [ { "Core": "sing", "ApiHost": "https://这里改成你的域名", "ApiKey": "这里是之前在系统管理里面生成的通讯秘钥", "NodeID": 1001, "NodeType": "Vless", "Timeout": 30, "ListenIP": "0.0.0.0", "SendIP": "0.0.0.0", "SniffEnabled": true } ] } （4、启动服务 # 重启服务 systemctl restart V2bX # 查看运行日志如果在日志中看见 Nodes started 说明节点启动成功 journalctl -u V2bX.service -f （5、查看Xboard中节点情况可以看见这里变黄了，就是说待使用了，下一步我们就是让他变绿，接下来就是测试步骤了 6、测试登录我们前台的系统（就是去掉path，管用域名登录（ https://域名））这个页面使用过机场的佬友就很熟悉了我用的就是之前创建的测试用户登录，给了一个100g的套餐所以直接就有一个100g的套餐我们点一下一键订阅，并复制订阅地址到clash去试一下去clash测试一下没有问题去后台面板看看节点情况（ https://域名/path ），变绿了，没有问题，完结撒花 ps：也可以去购买订阅中看一下，我在套餐那新增了两个套餐和提示词模板，这样就有模有样了参考文章 V2bX 单节点（VLESS / Reality）部署指南 xboard | Limin Studio 6 个帖子 - 6 位参与者阅读完整话题

想请教下各位佬友有没有关于使用AI来帮助公众号排版的技巧

LinuxDo 最新话题 · 2026-05-21 10:25:44+08:00 · tech

相当于把一份纯文本的文章能优化成图文并茂的格式，不知道目前有没有这种东东。或者有好的 skill 也行，目前让 AI 生成只能说可以用，但是美观程度还是差很多。 1 个帖子 - 1 位参与者阅读完整话题

[副业] 尝试小说推广

v2ex · 2026-05-18 14:36:54+08:00 · tech

了解到一个番茄达人中心，是字节系的平台。通过在短视频平台发布图文、视频等给各种软件拉新，比如红果短剧，番茄畅听，当有用户看了你的帖子下载了对应的软件然后搜索你留的关键词之后，给你 5-10 元。但是目前还没搞清规则，我上周五在小红书发了一个帖子，下面评论区留了番茄畅听的关键词，然后用自己的手机号测试了当做被拉的新用户，搜索了那本小说然后听了几分钟，并没有成功，不知道是不是留在平台的链接格式有问题。官方群满了，平台留的教程不全，一个人测试比较麻烦，看看有没有有兴趣的 V 友一起来搞一下。 V:wx_spca

【开源】【BiliSum】支持多模态理解视频（低成本）并总结图文笔记的桌面应用

LinuxDo 最新话题 · 2026-05-17 15:51:27+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 github.com GitHub - lycohana/BiliSum: 为 Bilibili、YouTube 及本地视频提供 AI 视频摘要和知识库.AI video... 为 Bilibili、YouTube 及本地视频提供 AI 视频摘要和知识库.AI video summarizer and knowledge base for Bilibili, YouTube and local videos. 新增：图文笔记（VLM理解）由llm识别视频重点内容/关键画面->截取画面交由多模态模型理解，并入图文笔记（使用多模态理解图片成本会增加些许，日常使用纯文本笔记也足够强大！）优势亮点界面美观类b站主页页面的视频流列表，清晰明了视频总结摘要，一键导出一图省流文字笔记，图文笔记，思维导图一应俱全高度自定义语音转写可用ASR在线服务（硅基流动，注册了免费能用），本地部署语音转写服务，OpenAI协议的语音转写提示词可完全自定义，打造适合自己的总结风格，也可以优化总结的质量（如果更加优的提示词可以提交贡献！）更多功能不一一列举环境友好，支持一键安装cuda转写环境 rag知识库以及llm问答（可选模块，可以一键安装更多小细节有待发掘后续目标接入更多视频平台，视频收藏夹功能，提示词自定义模板等等感谢佬友们的使用反馈！ 1 个帖子 - 1 位参与者阅读完整话题

[分享创造] 用 Puppeteer 给掘金写了个自动发图文的工具，顺手做成了 CLI 和 MCP 接口

v2ex · 2026-05-16 21:29:09+08:00 · tech

最近在做一个开源项目矩媒 MatrixMedia ，核心是用 Electron + Puppeteer 操控浏览器，模拟真人操作完成内容发布。之前已经做了抖音、B 站等平台的视频发布，这次把掘金的图文发布也做进去了。实现思路是 Puppeteer 驱动 Chromium ，登录态复用本地 session ，然后自动填标题、正文（支持 Markdown 渲染）、分类、标签、摘要，最后提交。整个流程无需人工干预。对开发者来说有两种用法：一是直接跑 CLI 命令，把掘金发布集成进自己的脚本或 CI 流程；二是通过 MCP Server 接口，让 Claude 、Cursor 、n8n 这类 AI 工具直接调用，实现"一句话发掘金文章"。项目目前支持抖音/快手/B 站/百家号/头条/视频号/小红书，掘金是刚加的图文平台。GPL-2.0 开源，免费用。详细实现和接口说明在掘金文章里，感兴趣可以看看： GitHub： https://github.com/hanliang97/MatrixMedia 掘金文章： https://juejin.cn/post/7639672225034338313

GPT free号生图是不是出问题了

LinuxDo 最新话题 · 2026-05-16 20:51:20+08:00 · tech

完全的图文无关啊，难道 GPT-images-2 生图还会串图么？ 1 个帖子 - 1 位参与者阅读完整话题

做了个小红书图文 Skill，反响平平，头疼

LinuxDo 最新话题 · 2026-05-12 10:51:41+08:00 · tech

是小红书对这种 AI 天然有推流限制吗？我是每天看热点是什么跟着热点生成图片发出去基本都是几十的观看想搞个稳定的副业好难，这种运营是不是门道很多啊 24 个帖子 - 15 位参与者阅读完整话题

DeepSeek 大范围开放“识图模式”，正式跨入图文交互时代（进一步灰度的意思）

LinuxDo 最新话题 · 2026-05-09 10:50:47+08:00 · tech

DeepSeek 大范围开放“识图模式”，正式跨入图文交互时代 - IT之家 12 个帖子 - 11 位参与者阅读完整话题

DeepSeek 大范围开放“识图模式”，正式跨入图文交互时代

IT之家 · 2026-05-09 08:55:56+08:00 · tech

IT之家 5 月 9 日消息，上个月底，DeepSeek 开始灰度测试“识图模式”。该模式并非简单的文字 OCR，而是终于具备了图片识别理解能力。根据最新用户反馈，DeepSeek 已经大范围开放“识图模式”供用户体验，目前几乎所有测试账号都能看到该入口。但截至IT之家发稿，DeepSeek 中的“识图模式”仍标注为“图片理解功能内测中”。如图所示，拥有灰度测试资格的用户会发现，输入框上方与“快速模式”和“专家模式”并列，出现了一个全新的“识图模式”按钮。在具体的实测体验中，开启该模式后，用户可以直接上传图片让 DeepSeek“看”世界，其能力边界远超简单的文字提取。在基础的图像识别领域，它成功变身为一名“博物学家”，例如有网友上传了在博物馆拍摄的不明文物，开启“深度思考”后，DeepSeek 不仅详细描述了纹理与材质，甚至准确推断出某件玉器属于 18 世纪清代乾隆时期的“痕都斯坦风格”；在面对烧脑的逻辑题时，它同样展现出硬核的推理能力，在一项需要在脑海中拼合立方体的高难度空间推理题中，虽然不开思考模式容易给出错误答案，但一旦开启深度思考并耗费了长达 4 分钟左右的时间，最终给出了正确的答案；此外，它还被验证了极强的“网感”，上传时下流行的表情包或梗图，它能精准识别合照中的人物（例如从一张合影中同时精确区分出特朗普和鲁路修），甚至能解读出小猫的无奈情绪，准确理解网民的转发笑点；在生产力方面，它还可以充当万能的“截图转码器”，直接将包含代码、复杂 UI 界面的技术报告或网页截图进行解析，提取出所有文字，甚至能一键反向生成可交互的 HTML 代码，连原网页的跳转按钮都能原封不动地予以复原。伴随着识图模式的上线，DeepSeek 上月底还公开了其背后的多模态模型技术细节，公布了一种名为“Thinking with Visual Primitives（以视觉原语思考）”的核心框架。据 DeepSeek 发布的技术报告解释，传统多模态大模型在面对密集场景时存在一种名为“指代鸿沟”的困境，模型虽然能看见图片，但在推理过程中用“左边那个大的”等模糊的自然语言构建逻辑链时，很容易因描述不准导致注意力漂移。 DeepSeek 给出的解法是，将点、边界框等代表空间位置的视觉元素直接融入模型的推理链条，使其成为“思维的基本单元”。这种创新框架使得模型在推理时就像人类用“赛博手指”在脑海中精确指出目标物一样，边想边指，从而完美解决了复杂空间布局中的逻辑难题。更令人惊叹的是，这种高效的框架在实际运算中对算力资源非常友好，在处理一张 800×800 分辨率的图片时，DeepSeek 仅消耗约 90 个 tokens，而 GPT 和 Claude 等其他主流模型在处理同等图片时则需要消耗约 870 到 1100 个 tokens，且 DeepSeek 在多项计数与空间推理的基准测试上达到了比肩甚至超越了前沿模型的水平。另外需要提醒的是，刚学会“睁眼”的 DeepSeek 并没有大家想象中那么完美。综合大量用户实测反馈来看，目前的识图模式仍存在几处明显不足：首先是知识库更新的滞后性，在某些测试中，虽然模型的推理过程和分析逻辑完全正确，但最终答案却张冠李戴 —— 例如在识别某款 2025 年底发布的最新型号手机时，因其知识库停留在 2025 年，虽然能通过副屏细节推断出旧型号，但仍给出了完全错误的具体型号；其次，在面对数图中老虎数量、视错觉等高难度反直觉图形题目时，它的答案依然存在很大的不确定性，甚至有时在经过长时间“深度思考”后，反而出现了更严重的幻觉，导致最终逻辑崩溃。还有一点需要明确的是，目前 DeepSeek 上线的识图模式本质上是纯视觉理解模块，它主要集中在图片识别与分析层面，尚未集成图像生成、视频理解或跨模态交互等更为广义的多模态功能。相关阅读：《 DeepSeek 终于能“看图”了！灰度“识图模式”，图片理解功能内测》

[分享创造] 图解 B 站， B 站省流助手更新

v2ex · 2026-05-08 17:30:02+08:00 · tech

UP 主把文案做成视频，我又把视频变回图文🤣 预览效果视频： https://www.bilibili.com/video/BV1J8dMBcEi8/

/tag/图文