WWW.YOUINFO.SITE
标签聚合 GPT3

/tag/GPT3

LinuxDo 最新话题 · 2026-06-10 10:25:29+08:00 · tech

使用AI辅助自己些代码已经很久了,从gpt3.5开始。 一开始都在正在开发的项目中,需要一些功能函数,在网页上让些一些功能函数,这时候自己对代码的把控都还行,都是写一些功能函数。 但是尤其最近一年以来,各种agent工具一浪一浪的推过来,更新层出不穷。新项目几乎全用AI开发,自己就写需求。购买的各种token套餐,国外的国内的结合使用,为了省钱。 老项目,总想着用AI过一边,优化一下,而且几乎AI都能给出看起来都很有道理的优化方案,而且找出一些列代码风险,也给出很多修复方案,然后自己审核plan之后,感觉相当有道理。OK,优化吧,执行吧。 多来几轮之后,以前的老项目,如果出了问题,几乎心里立刻能定位到大概在什么位置。但是现在经过几轮优化之后,出了问题,具体哪里有问题,心里没以前有底了。 新项目用AI开发的,在初步进行测试时,很多时候执行都没问题,测试也没什么问题。好吧,上线,面对各种形式的用户和使用逻辑,出了一些问题之后,然后开始继续改代码,怎么改呢,没办法继续使用AI改,因为AI写的代码量上来之后,想要手动精准修改到很多问题是有难度的。AI就继续改,因为只要你说了实际的问题,基本AI都认同,然后又不停叠加修复方案。 最后导致项目上线之后,心里一点底都没有。 与原来手动写代码时,基本手动写的慢,经常一个功能写出来时,实际已经测试了好几次了,心里相当于复习了很多次。即使出了问题,心里也能及时定位给出修复方案,然后上线。 现在AI越用越多,心里反而底气越来越不足了,尤其是后端项目。前端的还不那么怕,前端出bug了及时修复然后覆盖就行,只要保证后端数据正常和执行逻辑的安全,问题都在可控范围。但是后端出问题,造成数据搞错了,脑袋都大了,难道每次都有数据库回滚的机会?怎么可能。 大家都怎么解决遇到的这类似的问题的? (以上内容全手打,格式乱,大家担待,想用AI优化一下格式,还是算了,闲聊而已) 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-06-07 20:12:45+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 19:12:45+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 18:12:45+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 16:12:45+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 15:12:45+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 08:19:14+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 07:19:14+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 05:51:27+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 04:29:23+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 02:07:22+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 02:07:22+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 02:07:22+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

V2EX - 技术 · 2026-06-07 01:24:28+08:00 · tech

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。 我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。 大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。 我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。 本体论 我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。 那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。 ** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中? 总结 人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大? 如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化? 最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

LinuxDo 最新话题 · 2026-06-02 00:26:39+08:00 · tech

在站外围观许久,终是得以注册。来跟各位汇报下作为研二小登的我的Research工作流进化历程 还记得 GPT 刚出来的时候,是绿底的 OpenAI 头像配黑底 Web Chat UI,很简陋,但确实帮了我不少。那时候没有现在的各种agents 和 harness,我基本上把它当大号 CSDN 用,主要用途就是中译英和接单写代码。前者不必多说,那时候的翻译质量我觉得就很能打了,起码写毕业论文和大作业是够用的。后者主要用来写各类项目,上至本科毕设,下至纯 CLI 的xx管理系统。那时候用的 prompt 很精细,类似"用cpp写一个xx管理系统,无需 web 端,命令台展示即可。功能包括:1.xxx 2.xxx。具体实现:细节1细节2细节3…"每次一写就是一大段。效果也不错,给出来的代码基本上能直接用。现在看来,这大概算是最早的 Vibe Coding 了。 随着GPT一路进化,以及我进组时间变长,我接触到的任务也早已不止于大作业级别。作为开山弟子,导师很快就让我开始写小论文。或许是第一次带学生,导师总是默认我什么都会,基本上每次都扔给我一个我现有能力之外的任务,因此,我也被迫开始学习各类LLM技能,以求高质量高速度的完成。 慢慢地,在我的Research工作流中,人工的参与越来越少。时至今日,我的整体工作流中,我的角色甚至还没有“我与导师组会会议记录.md”的作用大。毫不客气地说,我就是导师和LLM之间的传话筒,我的作用仅是理解。这包括理解导师的很抽象的话、理解当前的科研状态、以及理解LLM的分析。在最后一点上,不得不说,GPT5.4和5.5真的给我造成了很大的阻碍,指各种非人类的口癖以及迄今为止冠绝古今中外所有LLM的造新词的能力。 回到主题上来,我目前的工作流大概是:导师给个大概方向-claudeCode/Codex搜文献调研-人工理解并提出第一版idea-GPT5.5/Opus4.8双重拷打-做实验-失败-组会汇报-导师指点-重复上述。一般迭代2-3版就差不多了(因为这时候也快到会议ddl了,再不写真勾八来不及了) 对于LLM的选择,我的理解是在推导公式方面我推荐GPT,讨论迭代idea我推荐Opus。前者不必多说,基本上属于大家的共识了。后者,虽然Opus在逻辑推理能力上并不是SOTA,但是最起码它能说人话…能够大幅减少我理解新领域/新知识的成本。另外,最近更新的Opus4.8用起来感觉还不错,个人体感来说可以替代4.6了。 想到哪写到哪了,行文难免杂乱,各位佬多担待。 最后有几个问题想和各位佬探讨下: 作为同是LLM研究方向的各位硕博佬,你们主推什么模型? 之前一直很火的DeepReasearch功能现在怎么销声匿迹了 像我这种科研进展全靠与LLM聊天,真的没问题么… 5 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-16 09:42:15+08:00 · tech

登录上去甚至还能看到几年前的提问记录 网页版登录、sub2api授权全部一把过,没有手机号验证 关键这些个号全都是用simplelogin虚拟邮箱注册的 话说现在还能用simplelogin注册吗?算不算绝版老号 早知道当时就多注册几个了,当年只要网络能连上就能注册,也没有什么手机号验证之类的破事 现在导入sub2api用了,但愿sam看在多年老用户的份上别封我 6 个帖子 - 4 位参与者 阅读完整话题