起因看到了这个帖子 https://linux.do/t/topic/2283520 最近机翻漫画 api都寄了 看到有人分享英伟达的白嫖模型 这个模型没啥人用速度飞快 翻译质量尚可 就翻译而言体验不错 让他写点小方法 简单的bat脚本 py爬虫也不错 感觉第一次听到这个名字 算是个冷门宝藏模型了 第一次遇到grok的感觉速度飞快 2 个帖子 - 2 位参与者 阅读完整话题
明天就 50 天了啦,我也来分享一下 地址: https://api.stepfun.com/step_plan/v1 key: ..--- .-- --.. .--. -... ..- -..- -- -.. --. --- .... ..- -..- .... .--. ... --- -. -.. --. ..-. -... --- - -. .--. .... -.- ----. .. -.-- ..-. -.. - . --. .-.. -... .--. -- --.- - -. -.- . -..- .--. -.-. ..--- -.. -.... ... .- .--- -..- -.-. -.. ..... .- ...- - --.- .-- .- 1 个帖子 - 1 位参与者 阅读完整话题
模型采用 198B参数MoE混合专家架构 ,仅11B参数为动态激活参数,在保障高性能的同时大幅提升推理效率,原生支持 256K超长上下文窗口 ,可高效处理海量文本与长序列任务。在工具使用方面,它致力于高可靠性,τ²-bench 得分超过 98%。Step 3.7 Flash 兼容 Claude Code、MCP 协议等工具链,并支持在 Mac Studio M4 Max 等设备上本地运行。模型权重以 Apache 2.0 许可开源。 1 个帖子 - 1 位参与者 阅读完整话题
跃星辰今日正式发布并开源 Step 3.7 Flash,是面向 Agent 生产化阶段推出的新一代 Flash 模型,围绕 Agent、Coding、Search 与多模态工作流进行系统优化。特别适用于构建高吞吐量的自动化智能体工作流。最高生成速度可达 400 Tokens/s,适合高频、多轮、低等待的 Agent 应用。 支持 256k 上下文窗口 ,并提供低、中、高三个推理级别,让开发者能够根据实际需求精确平衡响应速度、tokens 成本与能力。 针对主流 Agent 框架(Claude Code / KiloCode / RooCode / OpenCode / Hermes Agent / OpenClaw 等)、MCP / Skills 等工具调用协议和开发链路进行兼容优化,降低模型接入和工作流编排成本。 StepFun 开放平台文档中心 概览 - StepFun 开放平台文档中心 高速推理 + 原生多模态 + 工具调用 · 阶跃星辰旗舰多模态推理模型 modelscope.cn ModelScope 魔搭社区 ModelScope——汇聚各领域先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。在这里,共建模型开源社区,发现、学习、定制和分享心仪的模型。 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 29 日消息,阶跃星辰今日正式发布并开源 Step 3.7 Flash,是面向 Agent 生产化阶段推出的新一代 Flash 模型,围绕 Agent、Coding、Search 与多模态工作流进行系统优化。 Step 3.7 Flash 采用稀疏 MoE 架构, 总参数 196B+1.8B (ViT)、 激活参数 11B ; 最高生成速度可达 400 Tokens/s ,适合高频、多轮、低等待的 Agent 应用。 据介绍,Step 3.7 Flash 有以下能力: 原生多模态理解与执行 : 原生理解 UI、图表、文档、图片和应用界面,将复杂视觉信息转化为结构化结果、代码生成和可执行任务。 联网与视觉搜索增强 : 强化联网检索与图像搜索,使模型在开放信息环境中跨文本与图像主动获取并交叉比对多源证据。 高可靠工具调用与编排: 在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具和外部系统,保持任务轨迹一致,降低跑偏和执行失败。 Agent 生态兼容优化: 针对主流 Agent 框架(Claude Code / KiloCode / RooCode / OpenCode / Hermes Agent / OpenClaw 等)、MCP / Skills 等工具调用协议和开发链路进行兼容优化,降低模型接入和工作流编排成本。 ▲ 左一为 Step 3.7 Flash IT之家附相关链接如下: Model Page: https://static.stepfun.com/blog/step-3.7-flash/ GitHub: https://github.com/stepfun-ai/Step-3.7-Flash Huggingface: https://huggingface.co/stepfun-ai/Step-3.7-Flash Modelscope: https://modelscope.cn/models/stepfun-ai/Step-3.7-Flash 国内开放平台 API 接入: https://platform.stepfun.com 海外开放平台 API 接入: https://platform.stepfun.ai
StepFun 开放平台文档中心 概览 - StepFun 开放平台文档中心 高速推理 + 原生多模态 + 工具调用 · 阶跃星辰旗舰多模态推理模型 12 个帖子 - 10 位参与者 阅读完整话题
mimo海外版怎么支付0.01,发现自己的visa卡支付了,跳转到空白的V2/Cruise/StepUp,然后就卡主了 Apple pay 提示服务不可用 4 个帖子 - 4 位参与者 阅读完整话题
国内模型后排的比如stepfun,longcat,混元等等,以及百度的文心一言(没看懂为什么某个榜单第一),大家有亲身体验过吗?混元的我个人使用体验不如minimax 2.7,stepfun也是不如而且应该略差于混元,百度文心一眼确实没用过(但是参数看起来很大)。 6 个帖子 - 5 位参与者 阅读完整话题
Step 1 检查当前版本 lsb_release -a # No LSB modules are available. # Distributor ID: Ubuntu # Description: Ubuntu 24.04.4 LTS # Release: 24.04 # Codename: noble uname -r # 6.8.0-117-generic 例如,我的查询出来是 24.04 ,那么就需要更新到 6.8.0-117.117 内核版本(这里我已经更新过了所以显示已经是新内核) Step 2 尝试更新 sudo apt update sudo apt install --only-upgrade linux-generic linux-image-generic linux-headers-generic reboot Step 3 检查版本生效 等待重启完成后,执行下面的命令看看是否更新到了安全的版本 uname -r # 6.8.0-117-generic dpkg -l | grep -E '^ii\s+linux-(image|headers|modules|generic)' ii linux-generic 6.8.0-117.117 amd64 Complete Generic Linux kernel and headers ii linux-headers-6.8.0-117 6.8.0-117.117 all Header files related to Linux kernel version 6.8.0 ii linux-headers-6.8.0-117-generic 6.8.0-117.117 amd64 Linux kernel headers for version 6.8.0 on 64 bit x86 SMP ii linux-headers-generic 6.8.0-117.117 amd64 Generic Linux kernel headers ii linux-image-6.8.0-101-generic 6.8.0-101.101 amd64 Signed kernel image generic ii linux-image-6.8.0-111-generic 6.8.0-111.111 amd64 Signed kernel image generic ii linux-image-6.8.0-117-generic 6.8.0-117.117 amd64 Signed kernel image generic ii linux-image-generic 6.8.0-117.117 amd64 Generic Linux kernel image ii linux-modules-6.8.0-101-generic 6.8.0-101.101 amd64 Linux kernel extra modules for version 6.8.0 on 64 bit x86 SMP ii linux-modules-6.8.0-111-generic 6.8.0-111.111 amd64 Linux kernel extra modules for version 6.8.0 on 64 bit x86 SMP ii linux-modules-6.8.0-117-generic 6.8.0-117.117 amd64 Linux kernel extra modules for version 6.8.0 on 64 bit x86 SMP ii linux-modules-extra-6.8.0-101-generic 6.8.0-101.101 amd64 Linux kernel extra modules for version 6.8.0 on 64 bit x86 SMP ii linux-modules-extra-6.8.0-111-generic 6.8.0-111.111 amd64 Linux kernel extra modules for version 6.8.0 on 64 bit x86 SMP ii linux-modules-extra-6.8.0-117-generic 6.8.0-117.117 amd64 Linux kernel extra modules for version 6.8.0 on 64 bit x86 SMP 比如我的是 24.04 ,参考截图需要更新到 6.8.0-117 版本,那么就算更新完成了 这里第二个命令输出的内容可能会比较多,因为还包含了我们历史安装过的版本,只需要看当前内核版本的小版本是不是一致,比如内核是 117 那我们就看 117 这几行是不是 6.8.0-117.117 (可选) Step 4 移除缓解措施 之前在没有出内核修复补丁前,可能会执行过禁止加载 algif_aead 模块的相关命令,现在可以将 algif_aead 放出黑牢 sudo sed -i 's/^/# /' /etc/modprobe.d/disable-algif_aead.conf sudo cat /etc/modprobe.d/disable-algif_aead.conf reboot https://ubuntu.com/security/CVE-2026-31431 1 个帖子 - 1 位参与者 阅读完整话题
求助,谷歌账号必须要扫码。 前几天提示需要手机号验证,我以为是一次性验证,就用了5sim卡的手机号验证。 号绑了2-step, Authenticator也有,恢复邮箱也有,手机操作也无法恢复,里面还有充值的钱,各位佬友应该怎么搞 13 个帖子 - 6 位参与者 阅读完整话题
4 步 Standard Pipeline Step 1 — DeepSeek 把英文重写成中文,同时进行 LLM humanization rewrite ( temperature 1.3 ) Step 2 — DeepSeek 把中文改写成日语,带着 Step 1 作为对话历史(保持上下文连贯) Step 3 — Google Translate 把日语翻译成芬兰语(远距离语言,彻底打乱结构) Step 4 — Niutrans 把芬兰语翻译回英语(跨引擎,最后重建) 为什么这个链有效? Steps 1-2:用 DeepSeek 高温度重写,打破 AI 统计指纹 Step 3:芬兰语和英语/日语距离最远,强迫彻底重组 Step 4:跨引擎翻译,没有单一引擎的指纹残留 https://github.com/lynote-ai/humanize-text
平时用的比较少 glm就不考虑了 抢不过别人 目前就看好deepseek和stepfun或者别的什么呢? 请佬友推荐一款 11 个帖子 - 11 位参与者 阅读完整话题
[email protected] SUpg5fQ$Je%9 3 个帖子 - 2 位参与者 阅读完整话题
IT之家 5 月 9 日消息,阶跃星辰昨晚发布了新一代实时语音大模型 StepAudio 2.5 Realtime,目前已全量上线,开发者可通过阶跃星辰开放平台接入使用。 该模型定位于打造更具“活人感”的 AI 对话体验,重点围绕副语言感知、人设自定义与对话能力三个方向进行技术升级。 IT之家从官方获悉,StepAudio 2.5 Realtime 的核心突破在于其对“副语言”信息的处理能力。所谓副语言,指的是语调、语速、停顿乃至一声叹息或轻笑等文字以外的表达方式,这些细节恰恰是人类情感传递的主要载体。模型通过对这些元素的解读,可以感知对话者的情绪状态与潜在意图,比如从低沉的声线中察觉疲惫,或是从急促的语气里识别出烦躁情绪,并据此动态调整回应的语气与策略,旨在降低交互的生硬感,使其更像与真人交谈。 在人设灵活性方面,StepAudio 2.5 Realtime 将定义权完全交给用户。开发者可以通过 API,从性格特质、背景经历、个人好恶到语言习惯与对话边界,对 AI 角色进行精细化调节。这一能力的背后,是模型基于超过 10,000 个高质量原生人设,通过算法裂变生成的百万级人设特征矩阵,并结合海量真实场景对话语料训练而来。针对深度角色扮演中常见的“人设崩塌”痛点,开发团队进行了专门的 RLHF(基于人类反馈的强化学习)对齐优化。据官方介绍,即使在极端情境的压力测试下,模型依然能保持高度稳定、可信的角色一致性。同时,该模型也内置了 5 个预设人设供用户直接选择体验。 在整体对话能力上,该模型强调智商与情商的双重跃升。除了深度理解复杂语义、应对抛梗接梗等交流场景,模型还能灵活调用多领域知识以提供更深度的对话体验,在应用中既可扮演提供情绪价值的聊天搭子,也能模拟专业 HR 进行面试等严肃场景。 根据官方发布的 2026 年 4 月评测数据,该模型在五个测试维度中均位列第一。其中最能反映真实体验的主观评测(手机 App 真人对话打分)得分 80.41,高于 GPT-Realtime-1.5 的 68.01 和 Gemini Live 的 67.16;语音问答基准得分为 79.80,约为 GPT-Realtime-1.5 的 1.5 倍。
楼主用了 16 个工具 1.minimax ( cli+mcp ) 2.step 3.baidu 4.baidu ai search 5.tavily 6.doubao 7.bailian 8.exa 9.brave 10.linkup 11.serpapi 12.bocha 13.openai 14.grok 15.duckduckgo ( hermes agent 自带搜索工具) 16.gemini 目前这些都是免费的 之前楼主都是全部写入我的 agent ,然后让自己的 agent 装上,然后一股脑全部调用,然后发现太耗费 token 了, 然后就弄了个子 agent ,用 minimax-m2.7 ,专门用来提炼+总结, 如果主 agent 需要搜索就派发任务给子 agent ,然后子 agent 反馈给主 agent ,然后主 agent 屏蔽自身的所有搜索功能。 目前是这个玩法 大家是怎么玩的? ------------------------------------------------------------------------ 然后所有搜索工具,如果是原始搜索的,返回条目拉到最大。 如果是 ai 总结的,有挡位的调到最大 mcp 用的是自己写的 mcp 工具,把所有搜索汇集在一起了
楼主用了 16 个工具 1.minimax ( cli+mcp ) 2.step 3.baidu 4.baidu ai search 5.tavily 6.doubao 7.bailian 8.exa 9.brave 10.linkup 11.serpapi 12.bocha 13.openai 14.grok 15.duckduckgo ( hermes agent 自带搜索工具) 16.gemini 目前这些都是免费的 之前楼主都是全部写入我的 agent ,然后让自己的 agent 装上,然后一股脑全部调用,然后发现太耗费 token 了, 然后就弄了个子 agent ,用 minimax-m2.7 ,专门用来提炼+总结, 如果主 agent 需要搜索就派发任务给子 agent ,然后子 agent 反馈给主 agent ,然后主 agent 屏蔽自身的所有搜索功能。 目前是这个玩法 大家是怎么玩的? ------------------------------------------------------------------------ 然后所有搜索工具,如果是原始搜索的,返回条目拉到最大。 如果是 ai 总结的,有挡位的调到最大 mcp 用的是自己写的 mcp 工具,把所有搜索汇集在一起了
楼主用了 16 个工具 1.minimax ( cli+mcp ) 2.step 3.baidu 4.baidu ai search 5.tavily 6.doubao 7.bailian 8.exa 9.brave 10.linkup 11.serpapi 12.bocha 13.openai 14.grok 15.duckduckgo ( hermes agent 自带搜索工具) 16.gemini 目前这些都是免费的 之前楼主都是全部写入我的 agent ,然后让自己的 agent 装上,然后一股脑全部调用,然后发现太耗费 token 了, 然后就弄了个子 agent ,用 minimax-m2.7 ,专门用来提炼+总结, 如果主 agent 需要搜索就派发任务给子 agent ,然后子 agent 反馈给主 agent ,然后主 agent 屏蔽自身的所有搜索功能。 目前是这个玩法 大家是怎么玩的? ------------------------------------------------------------------------ 然后所有搜索工具,如果是原始搜索的,返回条目拉到最大。 如果是 ai 总结的,有挡位的调到最大 mcp 用的是自己写的 mcp 工具,把所有搜索汇集在一起了
楼主用了 16 个工具 1.minimax ( cli+mcp ) 2.step 3.baidu 4.baidu ai search 5.tavily 6.doubao 7.bailian 8.exa 9.brave 10.linkup 11.serpapi 12.bocha 13.openai 14.grok 15.duckduckgo ( hermes agent 自带搜索工具) 16.gemini 目前这些都是免费的 之前楼主都是全部写入我的 agent ,然后让自己的 agent 装上,然后一股脑全部调用,然后发现太耗费 token 了, 然后就弄了个子 agent ,用 minimax-m2.7 ,专门用来提炼+总结, 如果主 agent 需要搜索就派发任务给子 agent ,然后子 agent 反馈给主 agent ,然后主 agent 屏蔽自身的所有搜索功能。 目前是这个玩法 大家是怎么玩的? ------------------------------------------------------------------------ 然后所有搜索工具,如果是原始搜索的,返回条目拉到最大。 如果是 ai 总结的,有挡位的调到最大 mcp 用的是自己写的 mcp 工具,把所有搜索汇集在一起了
楼主用了 16 个工具 1.minimax ( cli+mcp ) 2.step 3.baidu 4.baidu ai search 5.tavily 6.doubao 7.bailian 8.exa 9.brave 10.linkup 11.serpapi 12.bocha 13.openai 14.grok 15.duckduckgo ( hermes agent 自带搜索工具) 16.gemini 目前这些都是免费的 之前楼主都是全部写入我的 agent ,然后让自己的 agent 装上,然后一股脑全部调用,然后发现太耗费 token 了, 然后就弄了个子 agent ,用 minimax-m2.7 ,专门用来提炼+总结, 如果主 agent 需要搜索就派发任务给子 agent ,然后子 agent 反馈给主 agent ,然后主 agent 屏蔽自身的所有搜索功能。 目前是这个玩法 大家是怎么玩的? ------------------------------------------------------------------------ 然后所有搜索工具,如果是原始搜索的,返回条目拉到最大。 如果是 ai 总结的,有挡位的调到最大 mcp 用的是自己写的 mcp 工具,把所有搜索汇集在一起了
楼主用了 16 个工具 1.minimax ( cli+mcp ) 2.step 3.baidu 4.baidu ai search 5.tavily 6.doubao 7.bailian 8.exa 9.brave 10.linkup 11.serpapi 12.bocha 13.openai 14.grok 15.duckduckgo ( hermes agent 自带搜索工具) 16.gemini 目前这些都是免费的 之前楼主都是全部写入我的 agent ,然后让自己的 agent 装上,然后一股脑全部调用,然后发现太耗费 token 了, 然后就弄了个子 agent ,用 minimax-m2.7 ,专门用来提炼+总结, 如果主 agent 需要搜索就派发任务给子 agent ,然后子 agent 反馈给主 agent ,然后主 agent 屏蔽自身的所有搜索功能。 目前是这个玩法 大家是怎么玩的? ------------------------------------------------------------------------ 然后所有搜索工具,如果是原始搜索的,返回条目拉到最大。 如果是 ai 总结的,有挡位的调到最大 mcp 用的是自己写的 mcp 工具,把所有搜索汇集在一起了