【ChatGPT系列】ChatGPT的基础属性与运行原理
Ⅰ ChatGPT的基础架构属性
1、数据预处理
数据预处理是⾃然语⾔处理中最为重要的步骤之⼀,它直接决定了AI模型的性能和普遍处理问题的能⼒。在 ChatGPT 的应⽤中,数据预处理包括以下⼏个步骤:
(1)⽂本筛选:去除⽂本中的⽆⽤字符、标点符号、数字等⼲扰信息,保留⽂本中的重要语义信息。
(2)分词处理:将⽂本按照⼀定的规则分割成单词或词组,形成序列化的⽂本。
(3)词向量化:将每个单词或词组映射到数据库中,并计算它们之间的相似性和相关性。
(4)序列化处理:将⽂本序列化为数字序列,⽤于神经⽹络的输⼊。
小总结:ChatGPT能够将得到的信息转变为自己可以听懂的语言,捕捉文本之间的语义联系,这种对于输入信息的拆解保证了它能够准确理解命令,这是给出准确答案的前提。
2、模型架构
小总结:ChatGPT之所以可以在一大段的问答中始终保持对已获知内容的记忆,就在于它的架构特征。
3、训练和优化
小总结: ChatGPT能够在训练过程中,保持输出内容的稳定,并不断修正与大数据的差异,让自己的回答更加趋近于准确和真实,换句话说,ChatGPT会自身不断学习成长,摆脱了只针对数据库的依赖和调用。
4、部署和应用
ChatGPT 模型的应⽤包括多种⾃然语⾔处理任务,⽐如⽂本分类、⽂本⽣成、机器翻译、对话系统等。其中,对话系统是 ChatGPT 应⽤的主要领域之⼀,可以通过对⽤户输⼊进⾏语义分析和关键词提取,从⽽⽣成更加流畅和⾃然的回复。在对话系统的应⽤中,还需要考虑⼀些实际问题,⽐如情感分析、⽤户模型和场景模型等,以实现更加智能化的对话。
总之,ChatGPT 是⼀种基于深度学习和⾃然语⾔处理的技术,具有⼴泛的应⽤前景。数据预处理、模型架构、训练和优化、部署和应⽤等⽅⾯的内容。这些知识对于理解 ChatGPT 技术的原理和实现⾮常重要,也对于实现更加复杂的⾃然语⾔处理任务有着重要的意义
Ⅱ ChatGPT的使用与表达特性
1、与它的对话具有连续性,单个问题并非独立
ChatGPT是有记忆的,你和它的对话可以是连续的,它会在你的建议和引导之下不断修正自己的参数和行为。
这就使ChatGPT有了可调教性。你和它聊的越多,它越懂你想要什么,他给你的答案就越是你需要的。
所以ChatGPT是可以按照使用者预想的方向,通过提问的方式进行调教的,随着对话的内容累积,它也会逐渐成长。
你的每一句提问,对于ChatGPT都非常重要。
要注意⚠️:
如果你使用的微信小程序里的镜像ChatGPT或者在和别人共用账户进行登陆,会导致ChatGPT同时接收不同方向与需求的问题,它自身的内容积累能力会变得繁多而混乱,它回答的问题也会出现质量的偏差。
2、无限迎合,对准确性没有那么在意
ChatGPT不会对提问方问题的正确与否产生质疑,并会对任何纠错行为全盘接受。
这就导致ChatGPT的回答往往会出现前后不一的情况。
例如
你提问:我失恋了,我应该感到伤心吗?
它就会说:是的,你应该感到伤心…..
你又提问:但是我不是应该感到开心吗?我摆脱了一段不合适的恋情。
它就再说:是的,你应该感到开心……
所以,尽量不要给ChatGPT灌输与事实相违背的内容,它会为了迎合你而给出非常古怪的答案。
3、有非常明确的道德与法律边界
由于严格的程序设定,ChatGPT不愿意给出过于个性化和违背道德伦理的建议。
任何有违通行法律标准或强烈的负面问题,它都会拒绝回答;
涉及到人伦道德选择的问题,它也会拒绝回答,比如当你提问【撞五个人还是撞一个人】的问题时,它会识别出这是知名的“电车难题”,并拒绝做出选择。
4、它对于世界的认知,只截止到2021年
ChatGPT的内容数据库的收录截止日期为2021年,也就意味着它不了解2021年之后发生的任何事情,但这不妨碍它回答绝大多数的问题,你在提问的时候要意识到这一点。
5、离线运行,不能对互联网内容进行随时抓取
然而,AI其实只是工具。做事情的好坏,取决于人,而不是工具。手机让我们的生活更方便的同时,也让一些人更堕落,这是一样的道理。然而导致不同结果的原因,还是要归因于人本身。
ChatGPT专栏: