半夜睡不着 各位佬就随便听听我这个树洞小故事吧,真的是有种无力感,就纯当故事听就好了 明明好像预感到了未来,但是什么都做不了。这里也不是吹牛,但是之前的预测正在逐步地变成现实(本来也就是大方向如此,根据大方向做的判断,也没有多厉害) 一件一件来,先说第一件事,像我原本的职业规划是走红队,但是我本身专业和网络安全完全不相关,只是上了第三方的机构的课程,以及挖了一段时间的漏洞,虽然有一些的产出,但是整体处于一个初级红队的水平,原本是打算今年努努力,接着刷漏洞、刷证书,后续走大厂,但是在去年 12 月份的时候,我GitHub上刷到了一个全自动CTF的项目,那会儿在整个GitHub上这种全自动AI渗透的项目不超过 3 个,也有可能是我没收集到,但是我当时找了一圈没有超过 3 个,但我自己真正地用了一次这个项目以后,我就知道我原本的职业规划完蛋了,作为一个专业不对口、水平还只是初级的红队来说,不出半年我绝对会被AI替代掉。像原本的路线,你要从一个初级进公司,然后一步一步学走向中级,走向高级,但是AI全自动我不知道它能不能干掉中级、干掉高级,但是初级它百分百是可以干掉的,所以这条路对我来说从根儿上就无了,而且我也不存在可以转什么AI安全之类的,因为本身我学的是商科,我学的就不是网安,所以那会儿就只能转方向 转向AI产品经理(图片是当时拿那个项目跑通了多个靶场) 如果我是吹牛的,我是错的,那该多好啊,原来的路仍然可以走下去。但是从5 月底开始,我就刷到了大量的AI全自动渗透的项目,非常多非常多。从最开始我收集的时候,我只找到了 3 个,到现在已经数不清有多少个,而且每一个都很强,那这个时候就已经证明我当时的那个判断,我提前半年下决定转行的判断是正确的 第二件事儿呢,就不仅仅是我个人的判断了,因为之前了解过那个微舆项目,对这种预测未来的方式非常感兴趣。所以说在 4 月份的时候,我拿纯opus模型,20 个Agent跑了 10 轮,得到了很多结果。这里就只说这个报告里两个最重要的结果: 第一个是 26 年下半年到 27 年上半年,全球会迎来一个很大的失业潮 第二个呢 则是也是这个时间段 AI泡沫会爆掉 当然,我不是说AI无用、AI泡沫论,而是指当前的资本投入已经大于当前AI在这个阶段能够承受的极限。投入产出比极度的不平衡带来的AI泡沫,作为最早一批就开始深度用AI的用户,到现在为止到被迫换方向,把原来的红队从未来的职业方向换为个人兴趣爱好的,我从来不认为AI是一个什么空中楼阁的泡沫,但是站在经济学的角度讲,它的投入产出比现在已经不平衡到了极点 然后我那会儿也不知道这些东西是否真的会发生,但是这两天美股的震荡,这个下跌,我看很多人从股市那些角度去分析,说只是什么临时的震荡之类的,但是这个和我当时在报告里看到的东西有重叠呀,这只是开始,然后它应该会短暂地再拉升再下跌,整体的趋势就是从这个趋势开始的,但是它不会一跌直接跌炸,它一定会再拉,然后就这样子拉扯,但是我毕竟没有实盘去炒股,这种东西也不构成投资建议,我只是说一说我现在发现的和我心里的感受 关于这些东西呢,我给家里人发的时候,家里人什么态度呢?各位佬看图片也就能够明白什么意思了,毕竟,我家的企业这几年本身效益也不太好。然后,我唯一能做的就是尽量让家里的钱不要投资,不要买股票,全部换成现金流存在手里 半夜睡不着呢,就是因为有一种非常莫名其妙的无力感,提前半年个人预测,原本的那个职业路线从初级往上走,这条路线走不通了,初级一定会被替代掉。然后隔了半年发现真的把初级替代掉了。然后之前这种多Agent的预测未来里面的两大内容。失业这个我记得哪个报告写的就是美国那边30%~40% 的程序员已经失业了。报告名字我不记得,但是我记得我看过这个还有AI泡沫这个现在的股市呢,又和当时最终的报告重叠 好像什么都提前看到了,但是没有用,什么都做不了。当然也没完全放弃。转AI产品经理之后,我就想做AI全自动开发,结果呢,从 1 月份做到 5 月份,一直都没发布,总觉得不完美,5 月初终于确定如何接着去做,但是放假了,回国休息了,只能 6 月份去了再做,但感觉用处不大,无非就是一个AI全自动开发的项目,大公司也都在做 比如trae的solo 2.0,智谱的Z code,比较简单一点的就是百度的秒哒,不管那么多了,都已经做这么久了。6 月份赶快做完发吧,半夜睡不着,瞎叨叨这么一大堆,当树洞了,随便聊聊 各位佬 就当看个故事就行 12 个帖子 - 10 位参与者 阅读完整话题
这回gemini3.5先来个涨价3倍,然后开始砍额度,砍aistudio,然后过一周,开始降智成豆包 6 个帖子 - 5 位参与者 阅读完整话题
Business Insider Jensen Huang is so over the dire predictions of AI leaders like Dario Amodei Nvidia CEO Jensen Huang said industry leaders need to be more "mindful" of of how they talk about the potential impact of AI. 1 个帖子 - 1 位参与者 阅读完整话题
DeepSeek V4刚上线,海外媒体有人看到性能,有人看到价格,也有人看到华为。彭博把它写成对OpenAI和Anthropic的有力挑战,《财富》盯上的是它再次把价格打到地板附近;路透社的切口更敏感:这不只是一个更便宜、更擅长长文本的新模型,并且DeepSeek首次明确披露,V4系列已适配华为升腾芯片。当然路透社也没忘补一刀,称V4仍落后于部分顶级闭源模型,而且暂时不支持多模态。 但就是"华为"这两个字,把整个讨论带到了另一层。 V4引发的不只是"模型强不强"的讨论,还有"它会把谁逼急"。 英伟达CEO黄仁勋本月在播客里放过一句狠话:"如果DeepSeek先在华为平台上发布,那对美国来说将是灾难性的。"现在回头看,这句话几乎像是在给V4的舆论场提前打底。 所以DeepSeek V4这次最有意思的,不是又多了几个跑分,而是它一上线,就让美国媒体同时露出了两种情绪。一边承认中国公司正在用更低的价格和更高的工程效率继续逼近,另一边又不太愿意承认,硅谷靠芯片、资本和封闭生态筑起的那道墙,已经开始松动了。 一、极致性价比:打破硅谷的竞争护城河 4月24日,DeepSeek V4预览版正式发布并同步开源,推出两条产品线:旗舰版V4-Pro和轻量版V4-Flash。两款模型均原生支持100万token上下文。V4-Pro重点强化Agent能力,在Agentic Coding、数学、STEM、竞赛编程及世界知识等多项评测中达到开源模型领先水平,部分能力已接近顶级闭源模型。V4-Flash更注重低成本与高性价比,适合日常高频调用。价格方面,V4-Pro输入(缓存命中)1元每百万token、输出24元每百万token;V4-Flash输入(缓存命中)仅0.2元每百万token、输出2元每百万token。 与前代相比,V4最大的突破不是单纯堆参数,而是通过CSA(压缩稀疏注意力)、HCA(重度压缩注意力)等混合注意力机制创新,大幅降低了长上下文的计算与内存成本,把“100万上下文”从展示参数变成了真正能用的标配。 整体来看,V4延续了“便宜又强”的产品风格,是一次面向长程Agent和大规模长上下文应用的基础设施级升级。 对此,《彭博社》认为DeepSeek V4称得上目前最强大的开源平台,是对OpenAI和Anthropic的有力挑战。新模型的发布让全球科技公司和投资者开始重新审视在人工智能上投入数十亿美元的明智性。 CNBC将V4的发布形容为一次“实力的全方位展示”。报道指出,尽管V4的市场冲击力可能不如R1那样具有颠覆性,因为市场已预期到中国AI的低价竞争,但它直接将美国竞争对手置于极大的压力之下。 《财富》则重点关注V4的“地板价”。文章强调V4-Pro的价格仅为OpenAI或Anthropic类似服务的六分之一到十分之一,这种极端的性价比优势可能彻底打破美国领先实验室的竞争护城河。 之所以能把价格打到地板上,并非仅仅因为商业策略的激进,核心秘密藏在DeepSeek对模型底层架构的颠覆性重构里。 二、“技术优雅”:用算法效率对抗暴力算力 VentureBeat惊叹于V4的“智能密度”,称其为“重返战场的巨鲸”。文章详细解析了其引入的混合注意力机制和流形约束超连接(mHC),认为这些创新在不牺牲性能的前提下,极大地降低了显存需求和计算成本。 不过VentureBeat也客观指出,V4目前仍存在局限性,例如不支持图像和视频那么多模态能力。 半岛电视台提到V4-Pro在数学和代码能力上已击败所有开源模型,目前仅在“世界知识”等少数领域落后于谷歌的闭源模型Gemini 3.1 Pro。开源平台Hugging Face官方则欢迎这条“巨鲸”的回归,认为“高性价比的百万级长文本时代”已经正式到来。 路透社援引Hugging Face机器学习工程师路易斯·坦斯托尔(Lewis Tunstall)的话确认,V4是该平台上冲上榜首速度最快的模型,在处理长且复杂的文本任务时表现卓越且廉价。 然而,极致的效率也伴随着显而易见的“偏科”。 坦斯托尔等专家指出,V4目前依然是一个纯文本模型,在图像理解和视频生成等主流赛道上完全缺席,这在多模态已成标配的今天,限制了它在创意产业的想象空间。此外,DeepSeek官方也坦言,V4在“世界知识”储备上仍落后于Gemini 3.1 Pro,这意味着在处理极具时效性的全球动态或复杂文化背景时,V4依然难以完全摆脱“幻觉”的困扰。 三、“主权AI”:大国博弈下的硬件突围 那么“四两拨千斤”的DeepSeek,究竟是用什么芯片练出了V4? 路透社和《纽约时报》都提到过,DeepSeek在早期研发中曾使用英伟达芯片,如H800或传闻中的合规版H20,但到了V4周期,情况发生了剧变。DeepSeek明确表示,V4在研发过程中进行了英伟达GPU与华为升腾(Ascend)NPU的并行验证。 综合社交媒体与行业分析,V4极大地受益于与华为最新算力集群如Ascend SuperPoD的深度协同,尤其是在FP4低精度推理等前沿技术上的原生支持,让V4在国产芯片上的能效比大幅提升。 这意味着AI模型已经开始围绕中国本土硬件进行原生优化。路透社敏锐地察觉到DeepSeek转向华为芯片的战略意义,认为这是中国推动自主创新的代表之作。这也正好印证了黄仁勋的担忧。他最近在播客中坦承:“我们必须承认AI的大部分进步都来自算法而非原始硬件,DeepSeek绝非无关紧要的进步。如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。” 《纽约时报》认为V4进一步扩展了中国在开源AI领域的影响力,并称“开源是未来技术的软实力”。文中提到,DeepSeek的技术正从吉隆坡到拉各斯被全球开发者采用,帮助中国技术绕过美国的硬件封锁。 亚洲新闻台则认为V4的到来是硬件与成本的“拐点”。 通过与华为升腾芯片的深度协作,中国正在实现从算法到硬件的“自给自足”,这对中国AI产业的独立性具有里程碑意义。 四、全球开发者的“实战体感”:有真香,也不乏质疑 宏观层面的博弈固然波谲云诡,但对于每天写代码、调API的开发者来说,好不好用、稳不稳定,才是唯一的评判标准。在Reddit和X等社交平台上,全球开发者的“实战体感”已经把这场讨论推向了沸点。 V4发布后,Reddit和X瞬间成了技术拆解和行业博弈的前沿阵地。 在Reddit上,开发者聚焦长文本的稳定性。 资深用户a9udn9u直言V4处理长文本的能力“简直疯了”(absolutely insane),在理解超大型代码库时提供了巨大帮助。 用户Comfortable-Rock-498也深有同感。他特意把测试推向超长上下文,发现V4-Flash竟然做到了“零失误”。 SignalCompetitive582指出,V4带来的最大改变是让LLM的运行从“受限于显存”转变为“受限于算力”。 这意味着未来AI编程工具可以提供更慷慨的订阅限额,“普惠价格”让大规模商业自动化在经济上变得完全可行。 InterstellarReddit形容DeepSeek像是“闻到了水中的血腥味就立即出击了”(smelled blood in the water and struck immediately),认为其极致的性价比将再次重创美国AI市场。 也有冷静的声音。CallMePyro等用户客观指出V4-Pro在综合素质上与Claude 4.7仍有差距,但建议大家至少试试V4-Flash,和谷歌Gemini 3 Flash比一比。 在X平台上,讨论上升到架构创新、科技权力乃至愿景的高度。 技术专家MZ(@myknz)发长文指出,美国实验室如OpenAI和Anthropic目前更偏向通过“暴力堆砌算力”(Brute-forcing)来提升模型性能,而DeepSeek则代表了通过“架构效率”(Architectural efficiency)实现突破的路线。 他犀利地指出,美国实验室正“悄悄地吸收”中国公司如DeepSeek、阿里巴巴和月之暗面贡献的工程方案,但在公开场合却散布“中国偷窃”的叙事来保护自己的封闭模型。 MZ进一步分析称,全球AI生态正处于一种虚伪的“纳什均衡”,即美国控制着叙事和高利润率,并利用开源研发成果;而中国公司则通过持续开源来确保全球开发者采用中国标准,从而绕过美国的硬件封锁。 知名博主Lisan al Gaib认为V4目前处于GPT-5.2或Opus 4.5+的级别,虽然落后于顶尖闭源模型约4到5个月,但领先于其他中国AI模型,位列其次的是Kimi K2.6。在1.6万亿参数规模下,V4的重量级已经与GPT-5.4相当。他还提到,相关技术论文详细介绍了模型的训练和技术架构,推测其他开源实验室会采用这种在长上下文中表现优异的架构。 当然,冷静的审视同样不少。 AI工程师Daniel Dewhurst提醒大家要谨慎对待官方给出的Benchmark,认为在缺乏独立评估前,这些华丽的数据可能存在针对测试集的优化。Lisan al Gaib更是直言V4看起来依然“欠火候”(undercooked),在推理逻辑上相比V3.2并没有本质的飞跃。 也有用户提到DeepSeek V4在法律任务上目前表现很差。 Sage Aurélius则提醒人们不要被“纯粹开源”的热情冲昏头脑。 他认为DeepSeek采用MIT协议是聪明的商业策略,即通过释放强力模型抢占开发者心智和数据,再通过托管服务赚取高额利润,这是经典的“核心开源”(Open-core)模式。 而DeepSeek研究员陈德利在X上将V4称为“心血之作”,并重申了公司的愿景:“AGI属于每一个人。” 五、结语:真正创新不惧围墙 DeepSeek V4的登场,直指硅谷构建了十几年的“算力霸权”逻辑。 它告诉世界,在通往未来的道路上,暴力堆算力并非唯一的答案,架构效率同样能跑出惊人的成绩。当全球开发者都在为V4的稳定与廉价欢呼时,我们看到的不只是一个中国AI品牌的崛起,更是一场全球科技权力格局的悄然洗牌。 “深海巨鲸”已经浮出水面。 如果AGI的未来注定属于每一个人,那么这场打破封锁、击穿价格、重塑效率的博弈,才刚刚进入下半场。 查看评论
cnBeta.COM DeepSeek V4又在测试:被指接近Opus 4.5 但不会太便宜 - AI 人工智能 - cnBeta.COM 这个月还剩下一周左右时间,最大的期待就是DeepSeekV4了,从种种迹象来看是越来越近了,而且官方近期也是动作不断,现在被发现API也开始升级模型了,性能还不错。从2月8日宣布上线了一个测试版之后,DeepSeekV4实际上一直都在低调变化,只是每次官方都没有详细介绍升级内容罢了。 1 个帖子 - 1 位参与者 阅读完整话题
上周Google ai studio上了Google one订阅又下了,然后我预言应该是推到周一,没想到睡到现在醒来一看真上了 上周帖子链接: https://linux.do/t/topic/1991894?u=zhongruichen 简单测了一下,就是veo系列和imagen系列不可用,音乐模型可用,大小香蕉皆可用(注意一下开search会导致429的问题还是没修复),大小香蕉4K的图我没测,应该是可行的,不过4K太慢了,所以就没测,只测了一下模型的可用度,其他模型的额度对比free也都有一定程度的提升,具体是多少我目前没电脑不太好测,还要等各位佬自己测测了。不过现在Google one订阅实际支持了但是谷歌官方好像还是没有在x或其他地方发布关于G1支持的帖子,可能要晚一点?或者还是跟上周一样?现在应该还只是预览测试中所以还没官宣?毕竟还有个开search会导致429的问题没修,谷歌周末是不干活的吗?这个问题还没修复。所以等到官宣可能还有一段时间吧。 关于开search会429的问题,给你们看看,控制变量一下,这个是没有开任何搜索的: 这个是开了两个搜索的: 这两个是分别开了一个不同搜索的: 可以明显看出就是开了search的问题,大小香蕉对于search的需求还是挺大的,现在还是要等谷歌修复一下这个问题。 注意一下,不只有大小香蕉有search会429的问题,所有模型都会 如图所示 9 个帖子 - 5 位参与者 阅读完整话题
IT之家 4 月 13 日消息,育碧宣布,《纪元 117:罗马和平》的首个玩法 DLC —— “灰烬的预言” 4 月 23 日将正式发布。该扩展包将扩展拉丁姆区域,并在最北方加入纪元历史上最大的岛屿:西尼斯。 据官方介绍,除了这片广阔的土地供你建造超级都市之外,还有一个极具视觉冲击力的元素:火山!喷发不仅会对你的城市造成破坏,还会在火山寒冬期间影响你的经济。 这正是团队希望在《纪元 117:罗马和平》中呈现的“罗马幻想”之一:兴衰更替的历史。考虑到部分玩家并不希望有这种额外的“戏剧性”,团队将其与纪元历史上最大的建造空间结合在一起 —— 并将其设为可选内容。 通过本次扩展包,我们通过在拉丁姆 当前西北与东北边界之外增加一圈新的岛屿带 ,扩展了该区域的整体规模。这片区域将由更多岛屿组成 —— 包括 5 座全新岛屿 —— 以及位于最北方的西尼斯:一座超大型大陆岛。 这些岛屿将分布在扩展区域中。三座中型岛屿与两座小型岛屿在视觉设计上与西尼斯保持一致,具有明显的火山影响特征。玩家可以看到古老的熔岩通道、火山口、温泉、黑沙以及大量深色岩壁 —— 它们都在诉说着这片土地悠久的火山活动历史。 IT之家注意到,由育碧开发和发行的模拟策略游戏《纪元 117:罗马和平》于去年 11 月正式推出, Steam 国区标准版 198 元 、黄金版则是 298 元。
5月24日,周鸿祎发视频谈马斯克关于“十年后人类都不开车了”大尺度预言: 我觉得马斯克这次关于自动驾驶的判断,真正提醒我们的不是驾照以后还有没有用,而是AI的下一阶段不是在屏幕里变得更会聊天,而在真实世界里变得越来越能干活。过去AI主要改变的是信息流,接下来它要改变的是物流、人流、车流,甚至整个物理世界的运行方式。