free账号,前两天用的5.4,上下文是1M,今天改成5.5了,上下文变成256k了,为什么? 加了 model_context_window = 1000000 model_auto_compact_token_limit = 900000这个配置 5 个帖子 - 4 位参与者 阅读完整话题
codex中用gpt5.5平时有必要开启1m上下文吗?综合来看用256k,还是1m。开启1m后提升会很大吗? 10 个帖子 - 10 位参与者 阅读完整话题
ithome.com 科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文 - IT之家 星火 X2-Flash 采用 MoE 架构,总参数 30B,最大支持 256K 上下文,宣称在智能体、代码等能力上实现了大幅提升,基于华为昇腾 910B 集群训练完成。 9 个帖子 - 5 位参与者 阅读完整话题
IT之家 4 月 29 日消息,科大讯飞星火 X2-Flash 模型今日正式发布,同步开放 API。 星火 X2-Flash 采用 MoE 架构, 总参数 30B,最大支持 256K 上下文 ,宣称在智能体、代码等能力上实现了大幅提升,基于 华为昇腾 910B 集群 训练完成。 目前,AstronClaw、Loomy 已率先接入星火 X2-Flash。 科大讯飞表示,经 AstronClaw 实测,星火 X2-Flash 在深度研究报告、Skill 管理与调用、系统控制与执行等 多类“养龙虾”最常用的任务上效果接近业界万亿级参数模型效果 ;在相同工作流下,整体 token 消耗不到当前主流大尺寸模型的三分之一,降低了开发者构建复杂 Agent 应用的使用成本。 以创建一个复杂的视频生成 Skill 为例,星火 X2-Flash 在了解详细需求后快速生成,并给出技能结构、核心功能和使用案例等关于 Skill 的详细说明。 科大讯飞介绍称,星火 X2-Flash 率先在国产算力上实现了 DSA(稀疏注意力)与 MTP(多 token 预测)结合的长文本高效训练,上下文拓展至 256K,通过亲和国产芯片的算子和分布式训练策略深度优化实现训练效率相比同规模 A800 集群从 20% 提升到 90%, 解决了智能体长上下文在国产芯片训练慢的难题 。 在智能体强化学习训练场景,星火 X2-Flash 通过上述的算法创新 + 工程创新,大幅提升了采样推理效率,相对于非 DSA 结构的采样解码效率最高可以提升 2 倍以上。该突破, 一定程度缓解了 910B 上智能体长交互场景下采样效率过低影响 RL 训练问题 ,为后续的大规模强化学习对齐训练扫清了算力障碍。 星火 X2-flash 已实现了 OpenClaw、Claude Code 等主流 Agent 框架的深度兼容。 IT之家附 API 地址如下: https://xinghuo.xfyun.cn/sparkapi
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
只有 gpt5.4 才支持 1m 的上下文,现在 gpt5.5 只支持 256k 的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它虽然有 compact ,但是不知道这个 compact 好不好用,是否真的可以最大程度的保留上下文
我看好像只有gpt5.4才支持1m的上下文,现在gpt5.5 只支持256k的上下文,在做长任务的时候发现这个上下文一下就用完了,你们在做长任务的时候是怎么搞的呢?它的compact靠谱吗?虽然这个compact是无感的 7 个帖子 - 4 位参与者 阅读完整话题
第一大原因是上下文256k,我会经常性新建会话 效率提升,很少问用户问题,让任务流畅执行 今天调用2000多次也只用了140M 7 个帖子 - 5 位参与者 阅读完整话题
腾讯 Hy3 预览版 256K 上下文 推理 纯文本 295B (A21B) openrouter也进行免费使用,但是未充值10刀的每天限制请求100次 openrouter.ai Hy3 preview (free) - API Pricing & Providers Hy3 Preview is a high-efficiency Mixture-of-Experts model from Tencent designed for agentic workflows and production use. $0 per million input tokens, $0 per million output tokens. 262,144 token context window, maximum output of 262,144 tokens. 4 个帖子 - 4 位参与者 阅读完整话题
之前 Qwen 3.6 Plus 测试的时候,好像一开始也是不支持多模态输入,应该不至于是模型本身不支持吧。 3 个帖子 - 2 位参与者 阅读完整话题
OpenRouter 以"stealth"(隐形)悄悄上线了一个新模型—— Elephant Alpha 。 一个 100B 参数的大模型 上下文 256K 名称 openrouter/elephant-alpha 没有发布会,没有预热,大伙觉得是哪家的大模型! 9 个帖子 - 6 位参与者 阅读完整话题