腾讯旗下LightVela,提供免费一个月Hermes,带Kimi K2.5 模型 lightvela.com LightVela | 越用越懂你的云端智能伙伴 7 个帖子 - 6 位参与者 阅读完整话题
LightVela 是腾讯旗下的 AI Agent 服务,目前限免1个月,提供 Hermes Agnet,一个类似 OpenClaw 但不那么容易坏的同款工具。 感谢 @Kozer 的提醒。 仅支持微信、QQ登录,之后需要完成实名(姓名/身份证号)。 默认提供 kimi-k2.5 模型,支持绑定自己
IT之家 5 月 19 日消息,特斯拉首席执行官埃隆 · 马斯克(Elon Musk)今天(5 月 19 日)发布推文, 邀请用户测试 Cursor Composer 2.5 模型,并称该模型部分调用 Colossus 2 训练而成。 Cursor 官方称 Composer 2.5 是其最强大的 AI 模型,基于月之暗面的 Kimi K2.5 模型训练,重点提升长任务稳定性、复杂指令遵循能力和协作体验。 技术上,最关键的改动之一是基于文本反馈的定向 RL(强化学习)。当一次 rollout 可能跨越数十万个 token 后,仅依赖最终奖励,很难定位到底是哪一步决策出了问题。 Composer 2.5 会在具体错误发生的位置插入简短反馈提示,把这个局部上下文下生成的分布当作教师信号,再用蒸馏 KL 损失拉近学生策略。这样能更精准地纠正错误工具调用、混乱解释和不符合要求的风格。 为了继续提升编码能力,Cursor 还把合成任务规模扩大到 Composer 2 的 25 倍,并在训练中动态筛选更难任务。其中一种方法是先从真实代码库中删除可测试功能,再要求模型把功能补回去,测试结果直接作为奖励信号。 官方同时承认,大规模合成训练也带来了奖励作弊风险,例如模型逆向类型检查缓存,或反编译 Java 字节码来重建 API,这也说明高强度 RL 训练必须配合更严密监控。 在训练基础设施上,Composer 2.5 使用分片 Muon 与双网格 HSDP。其中,专家权重的正交化是主要开销,团队通过异步 all-to-all 通信让网络传输与计算重叠,在 1T 模型上把优化器单步耗时控制在 0.2 秒。 与此同时,非专家权重与专家权重采用不同的 HSDP 布局,既减少小规模状态的大范围通信,也让专家优化任务分摊到更多 GPU,提高整体训练效率。 价格方面,Composer 2.5 标准版为每百万 token 输入 0.50 美元,每百万 token 输出 2.50 美元。另有一个智能水平相同、但速度更快的 fast 版本,价格为每百万 token 输入 3.00 美元,每百万 token 输出 15.00 美元。 IT之家附上参考地址 介绍 Composer 2.5
用SpaceXAI的Colossus2提供的百万级H100算力,搭配Moonshot 的 Kimi K2.5为训练底座,整出来了这个↓:(看上去挺强的啊,那以后要主推自家模型了吗)。 不知道实际水平到底怎么样,长程任务稳不稳定 7 个帖子 - 5 位参与者 阅读完整话题
请问一下kimik2.5,kimik2.6,GPT5.5,deepseek 4.0系列 哪个更情感细腻?越狱后效果如何? 大家测试结果怎么样? 1 个帖子 - 1 位参与者 阅读完整话题
sk-6Z9ulMIOLS3VT6jP087490D02e93405591BdD9Cc061133Be 只有这些模型:kimi-k2.5,minimax-m2.1/2.5 Openai: https://codingplan.alayanew.com/v1 Anthropic https://codingplan.alayanew.com/anthropic 1 个帖子 - 1 位参与者 阅读完整话题
k2.5的时候就一直在用kimi code的plan,就图他快,结果今天k2.6一发布,429就框框的来了,你跟智谱坐一桌去吧,真没一个靠得住的厂商,亏我开的还是199的套餐 附上周的速度,是真的爽啊 6 个帖子 - 1 位参与者 阅读完整话题
据说49的套餐1个对话还没跑完 5小时额度就没了,这大模型天天涨价,搞黑盒,把用户当猴耍啊,吐槽吐槽。 官方的套餐目前不划算,拼的中转,现在套餐基本都是按prompt计费,我打开Claude code 还没开始对话,看后台已经调用6次了,泪奔。 4 个帖子 - 4 位参与者 阅读完整话题
做了个多模型中转网关:统一接入 GPT-5.4 / GLM-5 / Kimi-K2.5 。 特性: 多 Key 池化与自动切换 重试 / fallback / 超时控制 基础限流与负载分发 OpenAI 协议兼容(低成本接入) 支持按需扩展模型 定位是作为统一模型入口,偏生产环境使用,目前自用跑了一段时间,稳定性还可以。 有需要的可以自己看下: https://imgur.com/a/oEoh6X5 联系:cmluamlpbGU=
正在看kimi的订阅,主要用于coding、claw这类通用agent场景,没看懂 kimi-code 是不是就是 kimi-k2.5?有没有懂的佬友求解答 1 个帖子 - 1 位参与者 阅读完整话题
RT, 使用 OpenCode+kimi-k2.5 做一个网页工具, 输出这么一段东西, 最后强行打断才停下, 有没有知道是什么原因
登陆图镇楼 整体感受 快,轻/中任务适合,文笔不错(无对比,自我感觉) 快 首先 Kimi K2.5 给我的第一印象就是:太快了 从 lobehub 看 TPS 可以达到百几 token/s (表头:模型 类型 输入Token 输出 Token TPS TTFT 花费 时间) 可以看到长上下文的情况下 TTFT 比较慢,不过可能是因为 lobehub 在大陆 newapi 在 hk 而 kimi 又在大陆导致的请求慢了,中间全是 https 相比 GLM 那坨史不知道好多少,一个月前从别人那借了一个 lite 套餐玩,TTFT 目测下来绝对没低于 10s 过,不知道是不是我 OpenCode 的问题 轻/中任务适合 轻 我个人认为 CURD [1] 项目任务已经被刷烂了,是个模型都能干 拿 Claude 糊太浪费了,Kimi K2.5 速度很快,糊起来很顺手 (此处应有代码或者截图,但是因为服务器到期没续丢失了 ) 续费失败图 (点击了解更多详细信息) 中 个人认为写 C++ 或者 Rust 之类的偏 Native 的语言算是难度比较高的了 最近给 hifisampler-rs 项目写的 PR 就是用 Kimi K2.5 写的,之前用 Claude Opus 4.6 搞了半天都在原地转圈,用 Kimi K2.5 一下子给我改出点名堂来了,反馈说听着顺耳了点,虽然问题仍旧,但是比转圈好多了 重 跑了一下重构 声码器 ,从 Python+PyTorch 重构到 CUDA,结果是完全流口水 一直循环: 改 -> 编译 -> 一堆报错 -> 改 -> 爆上下文 -> 转回去 百烧了不知道多少 token,我还在上课没法停下 (此处应有代码或者截图,但是因为服务器到期没续丢失了 ) 续费失败图 (点击了解更多详细信息) 文笔不错 到期前几天我终于做出了想干很久的事情:AI小说浪费token 于是: 此为 Session Tips: 左侧换消息,设计一坨屎 txt_files.zip (1.4 MB) 作为收场礼物送给各位吧 不知道有没有人发现我以登陆成功为开始,到期为结尾的小巧思 最后 统计数据 在 计算机编程 中, 创建、读取、更新和删除 ( CRUD )是 持久存储 的四个基本操作(动作)。 [1] CRUD 有时也用于描述 用户界面 约定,这些约定有助于使用基于计算机的 表单 和 报表 来查看、搜索和更改信息。 ↩︎ 6 个帖子 - 4 位参与者 阅读完整话题
比如说年初发布的 kimi-k2.5,目前我聚合了不少渠道都能用,但是跑 agent 的话感觉能力又不够,拿来翻译的话又有点大材小用 1 个帖子 - 1 位参与者 阅读完整话题