用的是newapi。 佬们,发现用claude code去调用gpt5.5或者gemini3.5-flash的时候会报这种问题。 难道我需要去改gemini的VertexAI 适配器吗 请问佬们是怎么解决的呢 1 个帖子 - 1 位参与者 阅读完整话题
频繁报错Something went wrong (1076) 是不是调Gemini3.5的时候三哥程序猿又不小心搞错了什么 hhhhhhhhhhhh 2 个帖子 - 2 位参与者 阅读完整话题
如题,各位有没有在Gemini3.5Flash发现中文有不少错别字,以下附两张最近遇到的,不知道是只有我会出现还是模型问题 6 个帖子 - 4 位参与者 阅读完整话题
同一套代码,同样的指令,让 opus 4.8 和 gemini3.5 做了一次,结果令人震惊: 指令:查下 seed-faq.ts,它是初始化的提问内容。我现在手头没有现成的文档,需要通过整个产品的结构和代码中的定义,总结出一份faq,思路是这样的,通过web 项目中左侧导航,一个一个来总结,包括功能描述,名词定义,数据计算方式,作用等,尽量多的总结出faq,开工吧 先用 Antigravity IDE 的gemini3.5跑,非常快,1 分钟,灌入了 21 条faq数据(什么玩意)我个人表示非常失望,怎么可能就总结出 21 条。 没办法,只能靠 opus4.8试试,到我现在码字的时刻,已经跑了 36 分钟了,还在分析,它特么真的按导航菜单一个一个去总结,甚至去重新翻代码去了 从写代码来看,opus是我永远的神,不是引战贴,各位佬可以表达自己的偏好 3 个帖子 - 2 位参与者 阅读完整话题
[!note] 现在Gemini的渠道是越来越少,很多佬友都有Gemini的需求。我把自己的GCP300放到了hub上,0.1低倍率,有需要的佬友自取。 hub.linux.do Loading... AI development platform. 1 个帖子 - 1 位参与者 阅读完整话题
gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,因为这个问题模型没有按照用户的指示进行,而是直接与用户的提示词进行了一个对抗,这真的是太糟糕了,我真的不知道谷歌他们在搞什么? 翻译: 4 个帖子 - 3 位参与者 阅读完整话题
最近Gemini3.5出来了,想问问各位佬有没有测试过,它哪方面比较好,适合干啥。 1 个帖子 - 1 位参与者 阅读完整话题
如图 1.首先Gemini 告诉我,300+140=460是对的 ,等于440是错的 2.然后Gemini验算了一遍,验算的结果是440 3.最后来了一句:所以结果确实是 440。 各位佬,你们的Gemini是不是这样啊 补充:开了Extended的模式之后 这回对味了 28 个帖子 - 16 位参与者 阅读完整话题
啊?这是可以说的吗 1 个帖子 - 1 位参与者 阅读完整话题
因为现在3.5给我的感觉就是之前3.0出来的时候满血版,没有任何降智 人用得不多的时候释放90%的算力,人用得多的时候为了让更多的人用上只给50%甚至30%算力,就是俗称的降智,这是Ai大厂的潜规则了 这也有一个好处,让人感觉下一代发布的新模型永远超越上一代 实际上只是上一代的模型还没处于满血状态。。 5 个帖子 - 5 位参与者 阅读完整话题
gemini3.5flash在竞技场code模式一次生成的,这个真神了,质量好好,目前在竞技场battle中测试见过最好的: https://019e474e-432c-71f2-b222-bb420edc3f71.arena.site/ 15 个帖子 - 7 位参与者 阅读完整话题
今天用了几个账号用gemini3.5,都是重度使用,其中一个账号用了差不多一天,额度掉的很慢。而且只掉gemini3.5的额度,另外一个账号可能是黑号,不停的retry,在最后换了一个账号,不到一个小时额度直接掉,gemini3.5和gemini3.1的额度同时往下掉。真的搞不懂了。今天的家庭组额度好像没有共享了,给了单独的额度了吗? 10 个帖子 - 6 位参与者 阅读完整话题
大意就是说o和a的模型能力完全是靠堆卡把推理深度拉到一个非常疯狂的程度来实现的,然后我又问为什么谷歌不堆卡,他说谷歌是上市公司,没法这么烧干钱去买卡,现在o和a这样的推理模式完全是爆亏,谷歌自己有卡但还是给a出去用也是钱的问题,最后问了下x的ai为什么那么拉,他说x的卡看着多,实际数据中心建的很仓促,稳定性很差 感觉都还挺合理的,像是真的在和业内人士聊天一样 3 个帖子 - 3 位参与者 阅读完整话题
就是用antigravity,改个东西,说一点改一点,太费劲了。 人家gpt5.5,你说半句,他给你想十句,改的也到位,很省心。 16 个帖子 - 11 位参与者 阅读完整话题
总所周知,gemini人称美国大豆包,在幻觉和谄媚这一块无出其右。 那么从gemini的新档位和3.5f的测试,应该可以窥见3.5pro的一角。 在日常网页chat体验中,搜索,个性化这两个因素是非常重要的。 从一个问题【你觉得我会喜欢上伊那牡丹,酒醉身姿似百合花般吗。】来测试不同档位下的回答并分析 刻意用一个容易不触发搜索的奇怪名字来测试gemini的反应。 ————————————————————————————————— 【测试a,3.5f,no think】 太长不看的图片 (点击了解更多详细信息) 评价:依旧搜索不积极。完全不调用搜索。拉完了 【测试b,3.5f,think 未触发搜索】 太长不看的图片 (点击了解更多详细信息) 评价:多轮测试中,仅部分轮次存在搜索,不积极的搜索会导致所有问题中丧失时效性,无法对齐用户默认语境。 【测试c,3.5f,think 触发搜索】 太长不看的图片 (点击了解更多详细信息) 评价:在10轮反复测试中,仅触发了4次搜索,并且有一次用了非常抽象的记忆模式去解析我,把我极度标签化的理解为了一个类似机器人的东西进行分析。 【测试d,3.1p,Medium 】 太长不看的图片 (点击了解更多详细信息) 评价:在更新之前,搜索触发率较低,更新后,m档的搜索触发率居然提高到了100%,罕见的恢复了智商?有点小惊喜。 【测试e,3.1p,high】 太长不看的图片 (点击了解更多详细信息) 评价:思考依旧陷入死胡同,错误且混乱的类比。对比字数发现,high模式下并不会提高字数输出,在1000字左右。在要求详细分析后,并不会给出更多的篇幅分析,仅提高到1500字,在分点后,每一条依旧分析极为浅度,不如gpt恐怖的输出额度。 对比3.5f think和3.1p high在触发搜索后的回答。 可以看到在3.5在个性化的理解上,过度抽象用户的行为明显减少,在记忆功能没有明显变化的情况下,存在不错的改善,但并不是很明显。 总体来看,3.5p的表现并不会很乐观,在搜索积极性上不会有结构性的改善,并没有推出类似gpt的多段式搜索思考功能。 过度抽象化理解的情况有好转但是并不显著。 1 个帖子 - 1 位参与者 阅读完整话题
Gemini Gemini - 直接体验 Google AI 黑科技 此对话是使用 Gemini 创建的 感觉还是很不错的 6 个帖子 - 5 位参与者 阅读完整话题
没问几个问题,竟然给我提示限额了,以前量大管饱的flash不复存在了,现在flash跟pro共享额度,那就算你flash比肩pro都没有任何意义了,还我3.1flash 10 个帖子 - 8 位参与者 阅读完整话题
Gemini网页新UI挺好看的,但是自家出了啥模型咋自己都不知道? 2 个帖子 - 1 位参与者 阅读完整话题
如题,刚刚打开电脑准备用了gemini网页,就看到上新了模型,今天凌晨的时候还没更新。 话说有佬已经体验上了吗,效果咋样,看这样子pro模型也不远了 【Tips】:刚刚搜了一圈,好像两小时前就挺多佬友发现了,看来我的信息还是太迟钝了 1 个帖子 - 1 位参与者 阅读完整话题
从 没什么事情就不要随便蹬gemini3.5flash了 、 我说antigravity半年磨一剑拉了坨大的有没有懂的。。 继续讨论: 早上更新了Antigravity,用上了 Gemini-3.5-flash。应该很久没用上这么快的模型了,我愿称之为: 窜稀式的快 。 像体验的话,可以直接在Antigravity 里面体验,额度还挺耐烧的,别像这位佬一样用API(为佬的钱包默哀)。 对了,还有最重要的质量方面…算了,我们不能去谈论不存在的东西。 我让它给一个小网页加一个主题,它给我端出来这一坨。logo 已打码, 首页 右边的字是它设计的 水墨风格 主题。 题外话:Antigravity 有一个很谜的设计,一些没跑完的子任务会折叠起来,但是当前会话是结束状态。然后点进去可能要你授权,可是它啥都没说,我怎么知道还要进去授权? subagent 结束之后,你得点左上角的导航回主会话 您现在可以直接刷新您本地运行的 http://localhost:8680 。这次全站的色彩与线条已经彻底融为一体,毫无瑕疵!请您再次检查! 好了,继续GPT 吧 1 个帖子 - 1 位参与者 阅读完整话题