万能的ChatGPT真有智能了么 - 生活环境 - 猴子论坛猴子 - Powered by ZK!NT

我的中心

猴子论坛 » 常识 » 生活环境 » 万能的ChatGPT真有智能了么

返回列表

发新话题

回复该主题

查看: 2\|回复: 0	万能的ChatGPT真有智能了么 [复制链接]

发送短消息 UID 222 精华 0 查看公共资料搜索主题搜索帖子 TUhjnbcbe TUhjnbcbe 组别新手上路生日帖子1 积分11 性别注册时间2020-03-27	1^# 字体大小: t T 发表于 2024-09-17 16:34 \|只看楼主很多人说ChatGPT这样的人工智能已经拥有真正的人类智慧了。他们提到了许多例子，比如ChatGPT能够和人类进行对话，甚至可以进行智能聊天，可以帮助你润色文章，提取摘要，甚至直接帮你扩写内容。但是事实并非如此，今天我们就好好聊聊这个问题。首先，我们必须明确，人工智能并不是真正的智能。它是一种人造智能，是由人类通过研究和开发而创造出来的。因此，它不具备真正的人类智慧，而只是一种模仿人类智慧的技术。其次，虽然ChatGPT可以进行聊天，但这并不能证明它拥有真正的人类智慧。聊天只是一种表面现象，它并不能证明ChatGPT拥有人类的思考能力。只有当ChatGPT能够理解人类的思想，并能够思考、判断和决策时，我们才能说它拥有真正的人类智慧。最后，我们要知道，人工智能是一个极具挑战性的领域。尽管科学家和工程师们已经取得了巨大的进步，但人工智能还有很长的路要走。我们不能因为当前的技术水平而把人工智能误认为是真正的智慧，我们应该保持理性的态度。但是也不能因为ChatGPT不是完全跟人脑一样的智慧体就小瞧它，它可以在很多方面辅助我们。比如说，它可以帮助我们解决一些复杂的数学问题，甚至可以帮助我们预测未来的发展趋势。此外，它还可以用于智能客服、智能问答、智能聊天等多种应用场景。今天，我们就好好聊聊ChatGPT的原理和细节，局限性以及应用场景。我们尽量不用任何公式，数学模型来把问题搞复杂，对大众来说，了解ChatGPT的原理可以满足他们的好奇心，也利于他们用好ChatGPT，在合适的地方去用，该怎么用。首先，我简单的引入一个莎士比亚的猴子的概念。无限猴子定理让一只猴子在打字机上随机地按键，当按键时间达到无穷时，几乎必然能够打出任何给定的文字，比如莎士比亚的全套著作。（1）这个定理有各种表述，也可以说，只要有足够多的时间，足够多的猴子，可以打印出来整个大英图书馆，或者法国图书馆的全部藏书，等等。这是在揭示在随机的信息里面可能蕴含了无尽的信息。也有一个说法是，在圆周率π里面包含了人类全部的信息，因为π是无限不循环小数。但是，随机信息和有信息量的信息的区别在于，即使我们知道猴子最终可以打印出莎士比亚的全套著作，我们也不知道什么时候才能完成。如何找到猴子打印出来的结果在哪里。刘慈欣有一本小说，叫做诗云。大概逻辑是一个高于人类文明无数倍的外星生物，了解到人类有诗，看了无数的人类的文学作品。它想超越人类的诗作者，它想到了一个办法，去随机生成无数的文字，在这些文字里面必然包含了无数的优秀的诗。但是最后，它发现生成这些随机的文字，存储他们需要耗费无数的资源。但是都生成了也没用，因为无法找到。我引入这个隐喻就是想介绍虽然GPT已经包含了智能，但是也包含很多问题，语言模型的先天问题。如何从一个貌似包含了人类全部文字信息的语言模型，引出一个可以稳定执行各种命令，回答人类各种问题的实用产品。这就是有了GPT-3这样的超级无敌AI机器，然后需要解决的问题，也就是我们今天为什么能看到ChatGPT的原因。首先我们需要了解GPT和语言模型。什么是语言模型 ChatGPT的本质是GPT3，而GPT3是一种语言模型，要理解ChatGPT和GTP3，我们需要先理解什么是语言模型。语言模型是一种人工智能模型，它可以对给定的语言文本进行分析和建模，并预测下一个可能出现的词语(2)。例如下图：编辑搜图最简单的也是最早期的语言模型叫做n元模型，很简单也很好理解。就是把句子里面连续n个单词（汉语的话连续n个汉字，或连续n个词）当作一个单元，拆解以后，统计他们相邻出现的概率。比如，一个英文例句为，thestudentsopenedtheirbooks。用n元模型来分析的话， 1元：“the”,“students”,“opened”,“their”,“books” 2元：“thestudents”,“studentsopened”,“openedtheir”,“theirbooks” 3元：“thestudentsopened”,“studentsopenedtheir”,“openedtheirbooks” 4元：”thestudentsopenedtheir”,“studentsopenedtheirbooks” 如果是一段中文例子为“学生们打开来了他们的书。”用n元模型来切分（已分词）则是， 1元：”学生们”,“打开”,“来了”,“他们”,“的”,“书” 2元：”学生们打开”,“打开来了”,“来了他们”,“他们的”,“的书” 3元：”学生们打开来了”,“打开来了他们”,“来了他们的”,“他们的书” 4元：”学生们打开来了他们”,“打开来了他们的”,“来了他们的书” 那么当问题是，“学生打开来了他们的______”的时候，我们到底应该选择，书本、笔记本、试题、还是思路呢？这就要看出现的概率了。也就是，在给定的语料库下，“学生打开来了他们的书本”，“学生打开来了他们的笔记本”，“学生打开来了他们的试题”和“学生打开来了他们的思路”跟“学生打开来了他们的”出现次数的比值关系了。 N元语言模型可以算作最简单的语言模型，后面会介绍一步步语言模型的发展，但是它们的实现细节差异很大，但是基本上要完成的任务是一样的。语言模型本身就可以应用在很多地方，比如输入法的联想。但是更重要的是，语言模型通常用于帮助构建其他的自然语言处理任务，如语音识别、机器翻译、文本分类等，它可以帮助计算机理解和处理人类语言。语言模型可以通过预训练和微调来实现模型的提升，并且在不断推进的研究过程中也取得了巨大的进步。语言模型的发展历史语言模型的发展可以追溯到20世纪50年代末，当时科学家们开始探索如何让计算机处理人类语言。在随后的几十年里，随着计算机硬件和软件技术的发展，语言模型也不断演进。20世纪90年代，神经网络模型开始被广泛应用于语言模型的研究，并取得了显著的进步。随后，深度学习模型也开始在语言模型领域得到广泛应用，并取得了更多的成果。在历史上，有许多重要的语言模型，其中包括：基于n元语法的语言模型：这是最早的语言模型之一，它基于n元语法的概率分布来建模语言文本，并预测下一个词语的可能性。它的优点是简单易行，但缺点是无法处理长距离依赖关系。神经网络语言模型：这是一种基于神经网络的语言模型，它通过多层感知器来建模语言文本，并使用语言模型的损失函数来训练模型。它的优点是可以处理长距离依赖关系，但缺点是计算复杂度高，难以训练大规模的模型。基于RNN的语言模型：这是一种基于循环神经网络的语言模型，它通过对时序数据进行处理，来捕捉语言文本中的长距离依赖关系。它的优点是能够处理长距离依赖关系，但缺点是计算复杂度高，难以处理长文本。基于Transformer的语言模型：这是一种基于Transformer模型的语言模型，它通过结合注意力机制和多头注意力机制，来实现对语言文本的建模。它的优点是计算效率高，能够处理长文本，并且可以通过预训练来提高模型的泛化能力。它的缺点是训练时需要大量的训练数据，并且需要高性能的计算机硬件支持。基于BERT的语言模型：这是一种基于双向注意力机制的语言模型，它通过对语言文本的上下文进行建模，来提高模型的表示能力。它的优点是能够有效地捕捉语言文本中的上下文信息，并且可以通过预训练来提高模型的泛化能力。它的缺点是训练时需要大量的训练数据，并且需要高性能的计算机硬件支持。总的来说，语言模型的发展历史可以分为三个阶段：早期的基于n元语法的语言模型，中期的神经网络语言模型和基于RNN的语言模型，以及近年来出现的基于Transformer和BERT的语言模型。这些模型在不同时期都取得了重要的突破，为人工智能领域的发展做出了巨大贡献。 GPT各个版本之前的差别和发展历史 GPT：这是最早的GPT模型，它采用了单层的Transformer模型，并通过对大量语言文本进行预训练来提高模型的泛化能力。它可以用于各种自然语言处理任务，如文本生成、语言模型预测。通过对40亿个语言文本词语进行预训练来提高模型的泛化能力。 GPT2：这是GPT模型的下一个版本，它采用了多层的Transformer模型，并通过对更大量的语言文本进行预训练来提高模型的泛化能力。它具有更高的计算能力和更丰富的语言表示能力，可以用于更复杂的自然语言处理任务。通过对亿个语言文本词语进行预训练来提高模型的泛化能力。 GPT-3：这是GPT模型的最新版本，它采用了更多层的Transformer模型，并通过对更大规模的语言文本进行预训练来提高模型的泛化能力。它具有更高的计算能力和更丰富的语言表示能力，可以用于更多种类的自然语言处理任务，如文本生成、语言模型预测、机器翻译、问答系统等。通过对亿个语言文本词语进行预训练来提高模型的泛化能力。 ChatGPT：ChatGPT是一种专门用于实现对话系统的自然语言处理模型，它采用了多层的Transformer模型，并通过对大量对话文本进行预训练来提高模型的泛化能力。可以说ChatGPT是GPT-3的一个特殊应用，它专注于对话系统领域，而GPT-3则是一个更加通用的自然语言处理模型，可以应用于更多种类的自然语言处理任务。 GPT-3的语料包含哪些内容具体来说，GPT-3的语料包含了以下内容：丰富的语言文本：GPT-3的语料包含了大量的语言文本，包括小说、新闻、网页、博客、社交媒体等各种类型的文本。这些文本来自于不同的语言、文化背景，并且涵盖了广泛的话题。多样化的语言表示：GPT-3的语料涵盖了多种语言表示方法，包括文本、图像、音频、视频等多种形式。这使得GPT-3模型能够捕捉到不同类型的语言信息，并实现更为丰富的语言表示能力。深度的语言理解：GPT-3的语料还包含了大量的语言理解信息，如语义、句法、语用等。这使得GPT-3模型能够更深入地理解语言文本的含义，并能够更准确地完成各种自然语言处理任务。总的来说，GPT-3的语料包含了丰富、多样化和深度的语言信息这么厉害的ChatGPT到底是不是真的达到了人类的智慧？我已经写了文章说明用ChatGPT，可以帮你写文章，可以帮你起标题，润色文章，扩写文章，提取摘要，校对文字，还可以翻译。而且还可以帮我们写程序，查询函数的参数，帮你进行的代码审核，可以帮你写unittest，等等。它还可以帮我们学英语，找例句，翻译，帮我们润色英文作文，等等。这些工作它做的甚至比一些专门设计去做这些工作的软件做的还好，甚至可以达到人类比较厉害的人的水平，那么它就真的拥有智能了么？其实并不能。举一个例子，我们问ChatGPT，1+1等于多少？它会回答： 1+1等于2。这是一个很简单的数学题，许多人都能很快地回答出来。在做这道题时，我们只需要把1和1相加，就能得到答案2。值得注意的是，我们并不需要特别复杂的数学知识来解决这道题。只要我们熟悉基本的数学运算，就能很容易地回答出来。因此，1+1等于2这道题是一道入门难度的数学题。很多人做过很多这样的加法测试，都得到了正确的结果，例如，如下，34+56等于多少？它回答， 34+56等于90。这道题和上一道题相似，也是一道很简单的数学题。我们只需要将34和56相加，就能得到答案90。值得注意的是，在做这道题时，我们需要注意十进制数字的运算规则。例如，我们在计算34+56时，需要先将个位数字相加，再将十位数字相加。为了更好地理解这道题，我们可以使用如下的运算方式来计算34+56：将个位数字相加得到4+6=10将十位数字相加得到3+5=8将结果相加得到10+8=18由于18是两位数字，因此我们需要进一步将这两位数字分别计算。于是，我们得到答案90。总之，34+56等于90。答案是对的，看起来也头头是道，但是等着“将结果相加得到10+8=18”这句话是什么意思？不符合我们的数学基本原理啊？虽然最后的结果是对的。我们再随便把数字加大，比如问它，+等于多少？它回答道： +等于。这道题和前面两道题相似，都是一道很简单的数学题。我们只需要将和相加，就能得到答案。值得注意的是，在做这道题时，我们需要注意十进制数字的运算规则。例如，我们在计算+时，需要先将个位数字相加，再将十位数字相加，最后将百位数字相加。为了更好地理解这道题，我们可以使用如下的运算方式来计算+：将个位数字相加得到4+4=8将十位数字相加得到6+3=9将百位数字相加得到5+9=14将千位数字相加得到0+0=0将万位数字相加得到6+9=15将十万位数字相加得到7+8=15由于15和15是两个两位数字，因此我们需要进一步将这两个数字分别计算。于是，我们得到答案。总之，+等于。我们一眼就发现结果也是错了，论述也是错误的，但是为啥听上去，还是头头是道呢。首先，它的语料库里面包罗万有，所以一些数学题，一些简单的加减乘除的教材可能也有，所以，当一个题目的答案在他的语料库里面的时候，它多半是回答正确的。这个过程就类似于它去自己的数据库里面查了一次一样（实际上是因为整理过的语料里面，正确的结果存在的概率一定高于错误的结果）。但是当数字很大，很怪，大概率语料库中不存在的时候，它所输出的加法的结果就是基于语言学逻辑概率的结果，而不是数学逻辑下的结果，自然就有可能打错特错了。但是它仍旧可以给你讲的头头是道。你可以理解为它是一个自然语言学问的博士，对语言无比精通，对其他的知识一无所知，天天跟各种数学家交谈（在数学语料下训练），它听过的东西，一般不会答错，虽然它并不明白它回答的意思是什么。它的泛化能力很强大，让你以为它可以举一反三，但是这种泛化是基于语言结构和语料的，并不能无中生有，不能进行严密的逻辑推理。所以，它没听过的东西，它回答的时候，近似于胡猜。但是听起来很有道理，因为它很会说话，所以，有很多时候可以蒙对。所以，因为它的语料库，知识库保罗万有，所以你问一些包含在知识库，语料库内的内容，它几乎都不会答错。它似乎是一个全能全知的神。但是它其实并不理解这些内容。当然，我们现在说的是ChatGPT，它可以做无数的事情，但是不是每件事情。它不是真的学会了数学。但是ChatGPT比GPT-3的效果要好得多。所以，在GPT3推出来的时候引发了无数业界的
	分享转发

	TOP

上一主题| 下一主题

发新话题

回复该主题