就是想问问各位佬,大家都是怎么找需求方的,大海捞针么?现在好多都想白嫖,真正付费租用算力的甲方好少啊,各位佬有没有经验,分享出来学习学习 1 个帖子 - 1 位参与者 阅读完整话题
使用Antigravity给写的大海捞针脚本简单测试了下MiniMax M3的上下文情况和新tokenPlan的5h额度,所测为老TokenPlan plus年包套餐(490/年)直接说结论。 1、目前开放给TokenPlan的M3上下文限制在512K,超出直接报请求被拒绝,可能是当前算力不够暂时屏蔽了,也有可能是TokenPlan本身限制了,看几天后的表现吧 2、速度提升明显,128K提升近一倍(15.19 s → 8.54 s),256K提升近1.5倍(30.07 s → 12.59 s)。注:M2.7为标准版 3、测试总计消耗月100W Tokens,消耗约8%-9%额度,无缓存,合理推测5小时限在1100W-1250W之间,周限跳动太少估计不准,大概是10个左右5小时限左右。 2 个帖子 - 2 位参与者 阅读完整话题
哈哈,区来喽。 可以确认的是这个就是3.1flash,和舅舅消息透露的模型几乎一模一样。 至于IO要发的3.5Flash,那大概就是改名了 从3.1flash改名3.2flash改名3.5flash 真是谷谷又歌歌呢 2 个帖子 - 2 位参与者 阅读完整话题
gemini-3-1-pro.pages.dev Needle 测试评分网页 连续十次满分,API版本3 Flash,3.1 pro开不开思考都无法做对 来验证一下 20 个帖子 - 9 位参与者 阅读完整话题
如何利用AI 的分析能力 与 地图的地理空间信息 结合,将传统的"大海捞针"式求职为"降维打击"的地理探测,提高筛选效率,有类似的软件或者项目吗? 10 个帖子 - 5 位参与者 阅读完整话题
叠甲: 企业级RAG开发初学者, 还是有很多我不太明白的地方, 不吝赐教! 这两天高强度刷L站发现大家对于DS长上下文能力的赞誉,我现在对我当前在做的企业级RAG产生了巨大的怀疑… 当前我的RAG大量是基于适配短上下文而建立的,写了超级多的分段逻辑/向量化流程等,那现在我怀疑,如果上下文捞针能力足够强,是不是说,我可以只针对文章的总结做向量化查询,然后整篇文档md塞进去,直接让DS去找就合适呢? 这样可以说简化了我大量的前期处理流程. 8 个帖子 - 5 位参与者 阅读完整话题
思维链没官网那么长 捞针不循环 起码开玩笑还会标明 13 个帖子 - 9 位参与者 阅读完整话题
flash不开思考也能做到,我扔进去的时候一秒就出答案了我还在愣神呢,结果全对。看来这个上下文很不错,用flash做个知识库检索应该是非常好的选择, 2 个帖子 - 2 位参与者 阅读完整话题
使用的是这里面的测试文档: ⧉ 模型【大海捞针】测试!(含附件)这次肯定没有被预训练过!! 搞七捻三 (\ _ /) ( ・-・) /っ 上个贴说著名的小说可能被预训练过了 所以,这次来个肯定没有被预训练的数据集: 大海捞针测试《请不要把互联网上的戾气带来这里!》.txt (495.9 KB) 截止目前一共 40+ 万文字 ↓ [image] 消耗 Tokens 180K ↓ [0001] 需求 Pro… 然后是测试结果: Reasoner模式思考了400多秒 ,思考过程类似于 : 最后的输出结果是: 1 个帖子 - 1 位参与者 阅读完整话题
用的grok-4.20和grok-4.30测试。 用于大海捞针的文本是codex生成的,实际大小4668kb,估算token量1.5m,上传到grok,测试大海捞针问题,都能准确的答对。 但是我上传一部百万字小说,3047kb ,openai的分词网站估算token是0.89m,问grok里面某个配角和主角的关系,要求不联网搜索,结果第一次直接瞎编了人物关系,后续强调禁止编造,试了两个模型,5次全都告诉我不存在这个配角。 从大海捞针的情况来看,上下文确实没被阉割,但从实际上来说,这个上下文并不能算有效上下文。 10 个帖子 - 7 位参与者 阅读完整话题