WWW.YOUINFO.SITE
标签聚合 捞针

/tag/捞针

LinuxDo 最新话题 · 2026-06-01 12:19:55+08:00 · tech

使用Antigravity给写的大海捞针脚本简单测试了下MiniMax M3的上下文情况和新tokenPlan的5h额度,所测为老TokenPlan plus年包套餐(490/年)直接说结论。 1、目前开放给TokenPlan的M3上下文限制在512K,超出直接报请求被拒绝,可能是当前算力不够暂时屏蔽了,也有可能是TokenPlan本身限制了,看几天后的表现吧 2、速度提升明显,128K提升近一倍(15.19 s → 8.54 s),256K提升近1.5倍(30.07 s → 12.59 s)。注:M2.7为标准版 3、测试总计消耗月100W Tokens,消耗约8%-9%额度,无缓存,合理推测5小时限在1100W-1250W之间,周限跳动太少估计不准,大概是10个左右5小时限左右。 2 个帖子 - 2 位参与者 阅读完整话题

linux.do · 2026-04-25 14:18:51+08:00 · tech

叠甲: 企业级RAG开发初学者, 还是有很多我不太明白的地方, 不吝赐教! 这两天高强度刷L站发现大家对于DS长上下文能力的赞誉,我现在对我当前在做的企业级RAG产生了巨大的怀疑… 当前我的RAG大量是基于适配短上下文而建立的,写了超级多的分段逻辑/向量化流程等,那现在我怀疑,如果上下文捞针能力足够强,是不是说,我可以只针对文章的总结做向量化查询,然后整篇文档md塞进去,直接让DS去找就合适呢? 这样可以说简化了我大量的前期处理流程. 8 个帖子 - 5 位参与者 阅读完整话题

linux.do · 2026-04-22 16:15:03+08:00 · tech

使用的是这里面的测试文档: ⧉ 模型【大海捞针】测试!(含附件)这次肯定没有被预训练过!! 搞七捻三 (\ _ /) ( ・-・) /っ 上个贴说著名的小说可能被预训练过了 所以,这次来个肯定没有被预训练的数据集: 大海捞针测试《请不要把互联网上的戾气带来这里!》.txt (495.9 KB) 截止目前一共 40+ 万文字 ↓ [image] 消耗 Tokens 180K ↓ [0001] 需求 Pro… 然后是测试结果: Reasoner模式思考了400多秒 ,思考过程类似于 : 最后的输出结果是: 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-19 16:27:00+08:00 · tech

用的grok-4.20和grok-4.30测试。 用于大海捞针的文本是codex生成的,实际大小4668kb,估算token量1.5m,上传到grok,测试大海捞针问题,都能准确的答对。 但是我上传一部百万字小说,3047kb ,openai的分词网站估算token是0.89m,问grok里面某个配角和主角的关系,要求不联网搜索,结果第一次直接瞎编了人物关系,后续强调禁止编造,试了两个模型,5次全都告诉我不存在这个配角。 从大海捞针的情况来看,上下文确实没被阉割,但从实际上来说,这个上下文并不能算有效上下文。 10 个帖子 - 7 位参与者 阅读完整话题