nevan 创业项目 2023-05-08

【ChatGPT系列】ChatGPT的基础属性与运行原理

先来阐述一些理论上的优势，这些表述可能比较抽象，但要了解ChatGPT甚至AI，了解它们运行的基本原理是有必要的，当然你也可以跳过下面的一小部分内容，直接认识ChatGPT的应用特征，都不影响您对于ChatGPT的使用。

Ⅰ ChatGPT的基础架构属性

1、数据预处理

数据预处理是⾃然语⾔处理中最为重要的步骤之⼀，它直接决定了AI模型的性能和普遍处理问题的能⼒。在 ChatGPT 的应⽤中，数据预处理包括以下⼏个步骤：

（1）⽂本筛选：去除⽂本中的⽆⽤字符、标点符号、数字等⼲扰信息，保留⽂本中的重要语义信息。

（2）分词处理：将⽂本按照⼀定的规则分割成单词或词组，形成序列化的⽂本。

（3）词向量化：将每个单词或词组映射到数据库中，并计算它们之间的相似性和相关性。

（4）序列化处理：将⽂本序列化为数字序列，⽤于神经⽹络的输⼊。

数据预处理是 ChatGPT 的重要基础，只有经过充分的数据预处理，才能获得⾼质量的训练数据和模型性能。

小总结：ChatGPT能够将得到的信息转变为自己可以听懂的语言，捕捉文本之间的语义联系，这种对于输入信息的拆解保证了它能够准确理解命令，这是给出准确答案的前提。

2、模型架构

ChatGPT 的核⼼是⼀个基于 Transformer 的神经⽹络模型，它由多个 Transformer 编码器和⼀个 Transformer 解码器组成。在这个模型中，每个 Transformer 编码器和解码器都包含多个⾃注意⼒和多头注意⼒⼦层，以及⼀个前馈神经⽹络⼦层。这个模型可以实现对输⼊序列和输出序列的关注，并输出与输⼊序列相似的⽂本序列。

它通过Transformer架构在很长的序列中捕捉上下文信息，并且能够获取这些序列信息之间的逻辑关系，进行局部推理，保证了上下文对话的逻辑一致性。

小总结：ChatGPT之所以可以在一大段的问答中始终保持对已获知内容的记忆，就在于它的架构特征。

3、训练和优化

ChatGPT 模型的训练过程通常使⽤基于梯度下降的优化⽅法，⽐如 Adam 优化器。在训练过程中，模型的参数会被不断地调整和更新，使得模型的输出能够逐步逼近训练数据的真实分布。

在 ChatGPT 的训练过程中，常⽤的损失函数包括交叉熵损失函数、平均误差损失函数等。这些损失函数都可以有效地度量模型输出与训练数据之间的差异，并⽤于优化模型的参数。

在训练过程中，还需要对模型进⾏调参，⽐如学习率、批量⼤⼩、迭代次数等。这些参数的选择会影响模型的收敛速度和泛化能⼒。为了避免过拟合，还需要在训练过程中使⽤⼀些技术，⽐如 dropout、权重衰减等。

小总结： ChatGPT能够在训练过程中，保持输出内容的稳定，并不断修正与大数据的差异，让自己的回答更加趋近于准确和真实，换句话说，ChatGPT会自身不断学习成长，摆脱了只针对数据库的依赖和调用。

4、部署和应用

ChatGPT 模型的部署和应⽤需要考虑多种因素，⽐如模型的计算复杂度、模型的存储空间、模型的输⼊输出接⼝等。为了实现⾼效的模型部署和应⽤，可以使⽤⼀些优化技术，⽐如模型压缩、模型剪枝、模型蒸馏等。

ChatGPT 模型的应⽤包括多种⾃然语⾔处理任务，⽐如⽂本分类、⽂本⽣成、机器翻译、对话系统等。其中，对话系统是 ChatGPT 应⽤的主要领域之⼀，可以通过对⽤户输⼊进⾏语义分析和关键词提取，从⽽⽣成更加流畅和⾃然的回复。在对话系统的应⽤中，还需要考虑⼀些实际问题，⽐如情感分析、⽤户模型和场景模型等，以实现更加智能化的对话。

总之，ChatGPT 是⼀种基于深度学习和⾃然语⾔处理的技术，具有⼴泛的应⽤前景。数据预处理、模型架构、训练和优化、部署和应⽤等⽅⾯的内容。这些知识对于理解 ChatGPT 技术的原理和实现⾮常重要，也对于实现更加复杂的⾃然语⾔处理任务有着重要的意义

Ⅱ ChatGPT的使用与表达特性

1、与它的对话具有连续性，单个问题并非独立

ChatGPT是有记忆的,你和它的对话可以是连续的，它会在你的建议和引导之下不断修正自己的参数和行为。

这就使ChatGPT有了可调教性。你和它聊的越多，它越懂你想要什么，他给你的答案就越是你需要的。

所以ChatGPT是可以按照使用者预想的方向，通过提问的方式进行调教的，随着对话的内容累积，它也会逐渐成长。

你的每一句提问，对于ChatGPT都非常重要。

要注意⚠️：

如果你使用的微信小程序里的镜像ChatGPT或者在和别人共用账户进行登陆，会导致ChatGPT同时接收不同方向与需求的问题，它自身的内容积累能力会变得繁多而混乱，它回答的问题也会出现质量的偏差。

2、无限迎合，对准确性没有那么在意

ChatGPT不会对提问方问题的正确与否产生质疑，并会对任何纠错行为全盘接受。

这就导致ChatGPT的回答往往会出现前后不一的情况。

例如

你提问：我失恋了，我应该感到伤心吗？

它就会说：是的，你应该感到伤心…..

你又提问：但是我不是应该感到开心吗？我摆脱了一段不合适的恋情。

它就再说：是的，你应该感到开心……

所以，尽量不要给ChatGPT灌输与事实相违背的内容，它会为了迎合你而给出非常古怪的答案。

3、有非常明确的道德与法律边界

由于严格的程序设定，ChatGPT不愿意给出过于个性化和违背道德伦理的建议。

任何有违通行法律标准或强烈的负面问题，它都会拒绝回答；

涉及到人伦道德选择的问题，它也会拒绝回答，比如当你提问【撞五个人还是撞一个人】的问题时，它会识别出这是知名的“电车难题”，并拒绝做出选择。

4、它对于世界的认知，只截止到2021年

ChatGPT的内容数据库的收录截止日期为2021年，也就意味着它不了解2021年之后发生的任何事情，但这不妨碍它回答绝大多数的问题，你在提问的时候要意识到这一点。

5、离线运行，不能对互联网内容进行随时抓取

是的，ChatGPT是离线运行的状态，也就是说它不能随意抓取实时的在线互联网内容进行内容补充与整理，除了对特定路径的网盘进行文字获取之外，它就像一个认知固定的宝宝，不排除以后有在线版更新的可能性，但目前仍旧为离线状态。

然而，AI其实只是工具。做事情的好坏，取决于人，而不是工具。手机让我们的生活更方便的同时，也让一些人更堕落，这是一样的道理。然而导致不同结果的原因，还是要归因于人本身。

ChatGPT专栏：

nevan 王者

分享到：

【ChatGPT系列】ChatGPT的基础属性与运行原理

Ⅰ ChatGPT的基础架构属性

Ⅱ ChatGPT的使用与表达特性

【图文】【认知】ChatGPT究竟是什么？

【溯源】AI是如何进化成如今的样子？为什么是ChatGPT实现了颠覆？

【影响】ChatGPT如何改变了今天的商业与科技格局？

AI会怎么占据未来的主导权

【ChatGPT系列】ChatGPT一站式注册以及常见注册问题答疑ChatGPT的付费升级功能介绍与开通方式

nevan 王者

Ⅰ ChatGPT的基础架构属性

Ⅱ ChatGPT的使用与表达特性

nevan 王者

相关推荐

提供最优质的资源集合