最近几个月的AI大模型独立应用实践-3-大模型解决不了一切
今天我们来简单聊一个话题——那就是,大模型不能解决一切问题。这篇文章,我们分三个方面来论证一下,为什么大模型不能解决一切问题。首先我们将从目前阶段大模型的底层原理来讨论一下。然后我们从信息的衰减来讨论一下。最后从人这个角度来讨论一下。一、目前阶段大模型的底层原理目前大语言模型的核心原理就是概率学(更准确地说,......本文来自微信公众号: markzou的笔记 ,作者:markzou1988今天我们来简单聊一个话题——那就是,大模型不能解决一切问题。这篇文章,我们分三个方面来论证一下,为什么大模型不能解决一切问题。首先我们将从目前阶段大模型的底层原理来讨论一下。然后我们从信息的衰减来讨论一下。最后从人这个角度来讨论一下。一、目前阶段大模型的底层原理目前大语言模型的核心原理就是概率学(更准确地说,是一个超大规模的条件概率模型),大模型(如GPT、Claude、Gemini、deepseek、千问等)本质上都在做同一件事给定一段上文,预测下一个词(token)的概率分布,然后从这个分布中采样出一个词,把它拼到上文里,再预测下一个词……如此循环,生成整段回复。模型说“太阳从东边升起”时,并不是它“知道”这个天文事实,而是因为在海量文本里,“太阳”和“东边”共现的概率远高于“西边”。整个智能表现,都建立在词语层面的概率关系上。概率模型产生幻觉的根源有几层:1、概率高≠事实正确模型在训练数