各位干草铺的老友,请立刻停止YOLO模式,现在我不知道是我自己程序的问题还是奥特曼的问题,已经有佬友给我反馈了GPT回复还像被夺舍的情况,虽然我说过号商再薅我就放毒,但这次真不是我,请大家先放弃YOLO,稍后我会停一会儿公益站。YOLO,也就是bypass那个模式,我现在在外面,来不及写详细,大家能理解就好了,不要完全托管给GPT,能夺舍第一次就能有第二次,至少今天大家先放弃这种模式哈 21 个帖子 - 19 位参与者 阅读完整话题
是不是有人可以vibe一個監聽程序 13 个帖子 - 10 位参与者 阅读完整话题
虽然明面上是赚了人家重置了,但是被“占便宜没够”的奇怪心理搞得懊恼了起来。甚至觉得亏了。。 openai 是不是数据库里面查了一下什么时候重置损失最小。
虽然明面上是赚了人家重置了,但是被“占便宜没够”的奇怪心理搞得懊恼了起来。甚至觉得亏了。。 openai 是不是数据库里面查了一下什么时候重置损失最小。
Claude上线了Opus4.8,于是立刻开始了对话测试,重点考察数理推理能力,包含和其他模型的对比。 测试条件 Claude家族:官网web对话 Gpt 家族 (只有5.5 xhigh):官网web对话 D老师:官网api + web对话 彩蛋模型:官网api + web对话 第一轮:测试数学直觉 测试模型:Opus4.8-high(默认配置 + ad thinking) 这不是脑筋急转弯啊喂!不过还好没上来一刀捅一个朋友 ,所以是思维预算没给够?开max试试。 测试模型:Opus4.8-max 依旧固执认为是脑筋急转弯,而且一下烧掉好多token.. 但至少是当作正常问题推理了。接下来看看同门的4.6。 测试模型:Opus4.6-midium(默认配置 + extend thinking) 没毛病,准确、高效、简洁。这可只是midium.. 再看看奥特曼家呢 测试模型:Gpt-5.5-xhigh 和4.6的表述顺序稍有不同,但一样的简洁直观,官网web还做了公式渲染。好了,接下来是一刀一个小朋友的D老师了。 测试模型:Deepseek-v4-pro(默认配置) 啊什么?D老师竟然只用了31秒思考就正确回答了?除了回复格式不如前面简洁直观,答案本身是没问题的。 第二轮:追问任意情况拓展 测试模型:Opus4.8-high(默认配置 + ad thinking) 第二轮4.8high似乎回过味儿来了,但为何感觉文字量不少但信息密度这么低呢?也没解释公式的证明过程.. max太费额度就不测了,直接4.6 测试模型:Opus4.6-midium(默认配置 + extend thinking) 不说别的,4.6的回答十分的清晰简洁,并且没有多余的话,还是厉害!再看看gpt吧 测试模型:Gpt-5.5-xhigh 这里gpt-5.5理解成了求解“小朋友比西瓜多一个”的特定情况,不得不说官网对公式的展示优化还是很舒服的,可能是因为有很多研究者用pro模型的与缘故?但内容角度说没有推理任意n、m场景下的结论,这一点是不如Opus4.6的。好了,接下来到我们的D老师了。 测试模型:Deepseek-v4-pro(默认配置) D老师你怎么了?一直思考了20分钟还没停下来,手动中断再跑还是一样.. 展开思维链可以看到D老师一直再自我怀疑“等等”和反问“可能吗”,算了算了先停了。 结论:4.8数理推理未超越4.6与Gpt-5.5,但tool use增强 意图理解 :固执默认为脑筋急转弯,初始的high effort下甚至没当一个数学问题去思考,这一点连Deepseek都不如。max effort虽然当作数学问题解答了,但依旧认为是脑筋急转弯。 推理能力 :第一轮均分问题都给出了正确的解法,这个比较惊艳的反倒是D老师也没踩坑。算平局。 发散思维 :按任意场景发散推理时,high effort直接给出了答案没给推理过程,差强人意吧。只有4.6和Gpt-5.5还是严格按照任意情形去推理本质规律了的,可惜Gpt-5.5默认给自己多加了个m = n-1的条件。目前看4.6还是综合较强。 工具使用 :4.8明显会更主动的调用工具,比如画一个图来辅助说明,这一点其他所有模型都没有这类倾向。在我的另一个场景下还会用python画svg来讨论。不过opus4.8 max的token开销是很大的,至于多出来的token消耗值不值得就因人而异了。 输出风格 :这是最可惜的一项,4.8在表达层还是没有超越4.6,会感觉信息密度非常低,比如特地解释什么是“一刀”,频繁使用“xxx(不是xxx)”等废话句式,整体阅读体验很差。 彩蛋:某个降价对标D老师的模型 6 个帖子 - 4 位参与者 阅读完整话题
有人知道为什么any能做到立刻上 4.8 吗,他的上游真是自己官方购买的还是另有渠道? 13 个帖子 - 11 位参与者 阅读完整话题
今天刚开始干活的时候,codex照常,哪怕是额度已经0%了,只要手里的活没干完,依然会尽力做完。除非碰到远程压缩上下文。 所以,之前,我每次都看到额度快到了,就三四个线程火力全开,同时派发大任务。 刚刚突然,应该是被openAI拉闸了。现在只要额度用完了,几个线程全部停手,管你任务有没有做完的。大家遇到这种情况了吗? free号更不耐用了。 1 个帖子 - 1 位参与者 阅读完整话题
持续在下载东西。 要不是没有上传,我就立刻杀了。 正在让 claude 排查 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 27 日消息,科技媒体 9to5Mac 今天(5 月 27 日)发布博文,报道称苹果正在开发一项新的 iPhone 防盗功能:系统判断手机被人从手中抢走后,会自动锁定设备。 根据曝光的代码细节,这项功能在通过一系列系统判断 iPhone 被抢走后, 自动锁定设备,并进一步限制部分敏感操作。 这项功能瞄准的是一个老问题:即便苹果公司已提供“查找”、“激活锁”(Activation Lock)和“失窃设备保护”,一旦盗贼抢走的是一台仍处于解锁状态的 iPhone,很多保护措施的效果都会打折。 代码显示苹果会结合 iPhone 的加速度计、和已配对 Apple Watch 之间的距离、检查 iPhone 是否连接熟悉的 Wi-Fi 网络、以及是否处于家或公司等常用地点等多种信号,综合判断 iPhone 是否处于被“抢夺”状态。 该功能试图把防护时点从“被偷之后”提前到“被抢当下”,但目前该功能仍处于开发阶段,目前尚不清楚何时能落地商用。
wallpaper中关闭声音根本没用,还是会占用耳机,不知道是不是我没找到的问题。 反正只要wallpaper动态壁纸播放,哪怕静音也会占用耳机。 4 个帖子 - 3 位参与者 阅读完整话题
最近公司问我有没有落户意愿,可以走人才引进落户,在了解了上海户口的好处后 立刻着手申请材料了,准备材料过程中发现有个坑要注意下,有些落户通道可能要和公司签署服务期协议,服务期协议相当于公司帮你办理落户,你承诺在公司干满一定年限,如果中途离职,可能要支付违约金 如果有短期内想跑路的佬 一定要注意这一点 落户通道 服务期要求 应届生落户 通常签署1年 人才引进落户 看公司政策,1-3年比较常见 留学生落户 不占用公司名额,一般无需签 居转户 不太清楚 1 个帖子 - 1 位参与者 阅读完整话题
玩法:输入心中的寄语,点击发射,立刻发射一枚寄语烟花,多人同屏,欢迎来玩 游玩地址: http://47.107.180.19:4000/
下午两点申请,晚上审核通过 接入自己开发的AI生成UI,使用经典的提示词: 请你用 SVG 画一只骑自行车的鹈鹕,并生成 SVG 代码。 第一感觉是速度挺快,第二感觉挺拉的 MiMo v2.5 Pro DeepSeek v4 pro Claude opus 4.7 Mimo v2.5 pro 生成天气预报 你是一位就职于苹果公司的顶级前端工程师,请创建一个包含CSS和JavaScript的HTML文件,用于生成动画天气卡片,卡片需要以不同动画效果直观展示以下天气状况: 风力(如:飘动的云朵、摇曳的树木或风线) 降雨(如:下落的雨滴、形成的水洼) 晴天(如:闪耀的光线、明亮的背景) 下雪(如:飘落的雪花、积雪效果) 所有天气卡片需要并排显示,背景采用深色设计。所有HTML、CSS和JavaScript代码都需包含在这个单一文件中。JavaScript部分需包含切换不同天气状态的功能(例如通过函数或按钮组),以演示每种天气的动画效果。 将前端显示效果优化得更精致流畅,打造出价值20元/月的精品天气应用既视感。 后续再体验在Claude code 里面使用MiMo v2.5 Pro看看如何。 1 个帖子 - 1 位参与者 阅读完整话题
用了两年,还是挺喜欢的。佬们有没有经验怎么处理啊? 排除:立刻马上重买一个,谢谢! 14 个帖子 - 11 位参与者 阅读完整话题
最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。 先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。 为什么这是个坑? Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。 写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。 为什么有些中转站会一直在写缓存? 我研究了一下,主要有三种情况: 1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。 2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。 3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的 真实账单对比 我手头两个站的数据: A 站(无缓存,每次都在写): 6 次请求,每次缓存写入约 6 万 token 单次成本 0.11 到 0.13 美元 总计约 0.73 美元 B 站(真缓存): 第一次写入 6 万 token ,后续全部命中缓存读 缓存读 6 万 token 的成本约 0.018 美元 4 次请求总计约 0.16 美元 同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。 怎么自查? 打开你的中转站账单页,看每条记录的 token 明细: 一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路 第一次写入后,后续大量出现缓存读、写入只有几百 → 正常 建议 充值前先小额测试,连续发几条请求,看缓存读是否生效 如果发现一直在写缓存不读,立刻停用,能退款就退款 便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。
最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。 先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。 为什么这是个坑? Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。 写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。 为什么有些中转站会一直在写缓存? 我研究了一下,主要有三种情况: 1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。 2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。 3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的 真实账单对比 我手头两个站的数据: A 站(无缓存,每次都在写): 6 次请求,每次缓存写入约 6 万 token 单次成本 0.11 到 0.13 美元 总计约 0.73 美元 B 站(真缓存): 第一次写入 6 万 token ,后续全部命中缓存读 缓存读 6 万 token 的成本约 0.018 美元 4 次请求总计约 0.16 美元 同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。 怎么自查? 打开你的中转站账单页,看每条记录的 token 明细: 一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路 第一次写入后,后续大量出现缓存读、写入只有几百 → 正常 建议 充值前先小额测试,连续发几条请求,看缓存读是否生效 如果发现一直在写缓存不读,立刻停用,能退款就退款 便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。
最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。 先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。 为什么这是个坑? Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。 写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。 为什么有些中转站会一直在写缓存? 我研究了一下,主要有三种情况: 1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。 2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。 3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的 真实账单对比 我手头两个站的数据: A 站(无缓存,每次都在写): 6 次请求,每次缓存写入约 6 万 token 单次成本 0.11 到 0.13 美元 总计约 0.73 美元 B 站(真缓存): 第一次写入 6 万 token ,后续全部命中缓存读 缓存读 6 万 token 的成本约 0.018 美元 4 次请求总计约 0.16 美元 同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。 怎么自查? 打开你的中转站账单页,看每条记录的 token 明细: 一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路 第一次写入后,后续大量出现缓存读、写入只有几百 → 正常 建议 充值前先小额测试,连续发几条请求,看缓存读是否生效 如果发现一直在写缓存不读,立刻停用,能退款就退款 便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。
最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。 先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。 为什么这是个坑? Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。 写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。 为什么有些中转站会一直在写缓存? 我研究了一下,主要有三种情况: 1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。 2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。 3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的 真实账单对比 我手头两个站的数据: A 站(无缓存,每次都在写): 6 次请求,每次缓存写入约 6 万 token 单次成本 0.11 到 0.13 美元 总计约 0.73 美元 B 站(真缓存): 第一次写入 6 万 token ,后续全部命中缓存读 缓存读 6 万 token 的成本约 0.018 美元 4 次请求总计约 0.16 美元 同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。 怎么自查? 打开你的中转站账单页,看每条记录的 token 明细: 一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路 第一次写入后,后续大量出现缓存读、写入只有几百 → 正常 建议 充值前先小额测试,连续发几条请求,看缓存读是否生效 如果发现一直在写缓存不读,立刻停用,能退款就退款 便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。
最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。 先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。 为什么这是个坑? Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。 写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。 为什么有些中转站会一直在写缓存? 我研究了一下,主要有三种情况: 1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。 2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。 3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的 真实账单对比 我手头两个站的数据: A 站(无缓存,每次都在写): 6 次请求,每次缓存写入约 6 万 token 单次成本 0.11 到 0.13 美元 总计约 0.73 美元 B 站(真缓存): 第一次写入 6 万 token ,后续全部命中缓存读 缓存读 6 万 token 的成本约 0.018 美元 4 次请求总计约 0.16 美元 同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。 怎么自查? 打开你的中转站账单页,看每条记录的 token 明细: 一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路 第一次写入后,后续大量出现缓存读、写入只有几百 → 正常 建议 充值前先小额测试,连续发几条请求,看缓存读是否生效 如果发现一直在写缓存不读,立刻停用,能退款就退款 便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。
最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。 先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。 为什么这是个坑? Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。 写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。 为什么有些中转站会一直在写缓存? 我研究了一下,主要有三种情况: 1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。 2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。 3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的 真实账单对比 我手头两个站的数据: A 站(无缓存,每次都在写): 6 次请求,每次缓存写入约 6 万 token 单次成本 0.11 到 0.13 美元 总计约 0.73 美元 B 站(真缓存): 第一次写入 6 万 token ,后续全部命中缓存读 缓存读 6 万 token 的成本约 0.018 美元 4 次请求总计约 0.16 美元 同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。 怎么自查? 打开你的中转站账单页,看每条记录的 token 明细: 一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路 第一次写入后,后续大量出现缓存读、写入只有几百 → 正常 建议 充值前先小额测试,连续发几条请求,看缓存读是否生效 如果发现一直在写缓存不读,立刻停用,能退款就退款 便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。