我发现ds经常不思考或者说伪思考,开启思考max后,有些功能让他阅读代码,经常不阅读这条链路,只阅读浅层的,然后就说了结果。给出的答案压根不是正确的,强制阅读后也是跑一半就忘了草草了事。 不知道你们有没有遇到? 3 个帖子 - 3 位参与者 阅读完整话题
浅层暖心,深层无奈,中国特色调休😂
浅层暖心,深层无奈,中国特色调休😂
浅层暖心,深层无奈,中国特色调休😂
浅层暖心,深层无奈,中国特色调休😂
浅层暖心,深层无奈,中国特色调休😂
浅层暖心,深层无奈,中国特色调休😂
浅层原因,生成的图太多了,即使结果只有几个图,但中间过程可能产生了上百张过程图(重新试了试,当然少也不行,只要存在就会卡顿,只是越多就越卡),而codex选择一股脑全部加载,直接硬解json格式历史记录(或者发一个新对话也会刷新历史,导致你刚发完新的提示词后瞬间卡顿),而且优化极差32线程只能吃6-8个线程,cpu占用率仅仅15%不到。 深层原因:openai的勾史优化,怀疑App是ai生成的。 奥特曼赶紧赔tokens() 3 个帖子 - 3 位参与者 阅读完整话题
从 Gemini真是蛆啊 和 Gemini真是蛆啊 - #21,来自 PumpkinMinami 继续讨论: 发这个帖其实更多是想抛砖引玉,相信各位佬友最近也刷到过相关的Gemini降智问题的帖子,想进一步探讨,主要 一个是我发现这个问题并不是个例,而是 大范围的 且 只针对App和网页端的 限制,问题至少在一个月前就有出现;Reference: https://www.reddit.com/r/GeminiAI/comments/1t2rcrf/gemini_refuses_to_search_in_internet/ ;站内的各个帖子 第二是,个人的确经历、并且明显感受到智力被大幅度限制,包括最上面的例子,一个相当知名的梗,作为全球第一大搜索引擎培育出的AI,竟然没办法准确回答 第三是,在探索中,逐渐发现针对Gemini App端和网页端的联网搜索限制行为是很诡异的,于是又更深层次去探索了,感觉限制的很迷惑 [!caution] 个人娱乐性质探索,很多地方都不严谨,主要还是抛砖引玉+泄愤 首先限定一下问题范围: 根据检查,大多数 Gemini 的使用场景都能够正常调用 Google Search Grounding,包括: 网页的 AI模式搜索/AI概览/AI Overviews 根据我之前的猜测,AI模式探索应该是直接把正常搜索的结果作为上下文直接塞给AI做总结,对于直接有搜索结果的,基本可以完美准确回答 相关的帖子: Google的 AI 概览(AI Overviews)是有东西的,居然可以认得出这是吕芳 API 调用/AI Studio Gemini CLI 甚至是 GCP 的 Cloud Assist 不确定是什么模型,(可能是 3.1 flash lite?),总归属于低档次的模型 回答其实是有误的,但是明显可以看出正确使用了联网搜索 诡异的来了:唯独 Gemini App无法正确搜索到正确的结果(针对某些问题,通过限定可以访问,详见后文) 测试使用的问题主要是两个: 原帖的问题:“上一期我们刚刚攻略了大书库”是什么梗?——wo22ne? “还是希望大家有种”:选了这个作为新问题的代表,不在知识库,属于类似的梗 首先,Gemini App端和 Web端并不是完全没有搜索能力 很好验证:只用问“今天的新闻是什么”或者时事热点,是可以正常触发搜索并且返回结果的。 但是在询问要求搜索其他问题的时候,大概率触发以下两种问题 1. 提示词直接明确要求“进行搜索”,模型反而直接拒绝 这个问题也是 Gemini真是蛆啊 - #21,来自 PumpkinMinami 和 https://www.reddit.com/r/GeminiAI/comments/1t2rcrf/gemini_refuses_to_search_in_internet/ 中所见的,有两种可能性,一个是 G÷ 真的注入了这样的提示词,另一个是模型幻觉。我个人觉得这两种其实都有可能 此外看到有个很抽象的做法是,让gemini生成图片,内容是:用google搜索相关内容,很抽象,但是我尝试复刻的时候依然被拒绝了 2.试图去搜索,多次调用后直接返回无法完成请求 我个人猜测是触发了错误处理机制,当使用“最新”等字眼(而不是直接要求“搜索”)时,模型的确有尝试去调用搜索,( 猜测 )但因为限制调用失败了 正常的搜索:新版会显示“正在搜索网络”;而失败的搜索,则是显示“正在连接”; 当切换回老版本时,可以看的更明显:模型明确显示尝试调用Google搜索,但是持续时间很短 两者均是多次尝试失败,触发错误熔断,最终返回最无能的回复: 难以理解,即便是错误Fallback,这句回答放到现在都能相当惹恼用户了,比豆包还豆包 对搜索限制的绕过尝试 我猜测G÷一方面对模型做了限制,加上模型依赖知识库的因素,所以一开始的尝试是搭配一些字眼引导AI去搜索,例如:结合“新闻”关键词 可以发现:一开始的确触发了网络搜索,然后又尝试更多失败的搜索触发错误熔断 解决方案是:限制只能搜索一次;的确返回,但是没有成功结果 下一步的设想是:给出限定,试着减轻搜索负担 例如:针对”有种“问题,在给出游戏关键字限定后,返回了正确搜索结果 在各种尝试中,发现:包括加入具体时间等都有可能促进模型进一步检索,但无论如何,能否检索到内容都带着抽奖的感觉;并且无论如何,Gemini App端原本网络搜索就只能看到标题和开头几行,所以回复效果也不佳 (注:实际查看思考过程看下来,似乎所有找到的结果就只有一条搜索结果) 而关于大书库问题,试了很多方法,包括询问“黑暗剑22”等关键词,都没办法让模型检索到正确的答案,这个就交给佬友们探索吧 还有一些尝试:包括换账号(免费账号和我自己的正价Pro账号),换IP(万人蹬机场和动态家宽),换设备,新版与旧版(旧版包括使用 3 Flash模型)等等,得到的结果差不多 关于限制原因的猜测 以下原因都是个人猜测,没什么依据,纯主观感受 上下文限制,为了避免搜索引入过多上下文而做限制? 避免API滥用?限制调用以节约成本?感觉不是很能说得过去 避免AI投毒所以对搜索来源做了限制?感觉有一定可能,能解释为什么本来能轻易搜索的内容在这里很难检索(提前做了过滤),但不能解释像“黑暗剑22”这种能够出现在包括百科等网站的结果被过滤;主要是看到一篇bbc的报道: Google's AI is being manipulated. The search giant is quietly fighting back - BBC Future 单纯降智节约成本?都上限额了还玩这一套? 难不成又是代码出问题了?依稀记得以前也有这样澄清过,但是G÷的话真的能信吗? 还有很多可能性,但目前除了“G÷对app端/web端搜索做了限制”以外,确实没有更多的信息了 后言 针对这次的限制,我个人最大的感情可能就是: 失望 我对 Google 曾抱着一股追崇的感情,包括 Pixel 的设计一直都很喜欢,在 Gemini 3.1 pro刚出的时候,也一度拿来做自己的主力代码模型(甚至是正价API用户),也常常向身边人推荐,吹gemini的情商和知识库能力 但是你今天,不仅模型能力不行了,价格还要涨价,说好的不作恶现在玩降智比OpenAI还狠;反重力一改再改,砍完再升,然后硬给消费者塞Antigravity 2.0这种牛马鬼蛇,我真忍不住要骂了 G÷,好自为之吧。 4 个帖子 - 4 位参与者 阅读完整话题
IT之家 5 月 27 日消息,据央视新闻今日报道, 我国海上最大规模浅层岩性油田 —— 垦利 10-2 油田群一期开发项目全面投产, 油田原油日产量超 2800 吨 ,为全国第一大原油生产基地 —— 渤海油田持续稳产上产提供重要支撑保障。 IT之家注:垦利 10-2 油田位于渤海南部海域,区域平均水深约 20 米, 已探明地质储量超 1 亿吨 。 据介绍,一期开发项目新建 1 座中心处理平台和 2 座无人井口平台,共实施开发井 79 口。油田油气主要储存在狭长弯曲的砂体中,不同砂体相互交织缠绕,如同地面上纵横交错的树枝影子,呈现出典型的“枝蔓状”形态, 是我国海上首次开发的枝蔓状稠油油藏 。
今天,据中国海油,我国海上最大规模浅层岩性油田——垦利10-2油田群一期开发项目全面投产,油田原油日产量超2800吨,为全国第一大原油生产基地——渤海油田持续稳产上产提供重要支撑保障。垦利10-2油田位于渤海南部海域,区域平均���深约20米,已探明地质储量超1亿吨。(央视新闻)