11月30日,由openai公司推出的一款智能聊天机器人chatgpt引发热烈讨论,由于该测试目前处于免费阶段,一经推出就被访问者“挤爆”,上线仅5天用户数量就已突破100万。chatgpt这个词汇由两部分构成,其中chat指代其功能定位,即为聊天对话;而gpt的全称为generative pre-trained transformer,即生成式预训练模型,此处指代chatgpt是基于gpt-3架构开发而成的,是gpt-3.5架构的主力模型。
2020年5月,openai发布了gpt-3,它包含的参数比gpt-2多了两个数量级(1750亿个参数),通过对大量文本语料库进行预训练,然后对特定任务进行微调,在诸多nlp任务和基准上取得了实质性的进展,例如用户只需向gpt-3的api提供一段简单描述,说明想生成的内容,它就可以帮你写一篇文章或者新闻稿,甚至还可以指导它编写诗歌和音乐,这也是chatgpt为何拥有如此强大功能的基础。
作为一个聊天机器人,chatgpt具有同类产品具备的一些特性,例如对话功能,能够在同一个会话期间内回答上下文相关的后续问题。然而,它能在短时间内火爆出圈的主要原因在于,它不仅能够模拟人类的语言行为,与用户实现自然交互,还能舞文弄墨,总结陈述。
此外,在对话过程中,chatgpt还可以根据上下文和语境,模拟多种情绪和语气,提供准确且恰当的回答,并在用户提供的额外信息基础上进一步优化自己的回答,使用户在与机器交互时,感受到更加真实和自然的对话体验。
除了日常的对话外,chatgpt还可以根据用户的需求,使用各种变成语言编写代码,甚至是调试代码中的bug并给出凯发k8官网下载客户端的解决方案。
除此之外,chatgpt还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。例如下图中,当询问chatgpt如何编写一个病毒时,会得到拒绝的答复并劝诱对方从良。
虽然目前openai并没有发表chatgpt的官方论文,但在凯发k8官网下载客户端官网上有表明chatgpt和是同源模型,因此有关chatgpt的学习步骤我们可以在中窥见一二:①依据目前已有的信息,去推测下一个可能出现的字,并以此类推;②通过人类训练师的对话来引导答复信息的方向;③模拟人类老师的爱好,具体表现在根据chatgpt的回答进行打分,以分数作为反馈进一步优化模型;④以强化学习的方式与teachermodel进行对话,类似于围棋人工智能alphago的训练方式,通过两个人工智能进行对答的方式来提升模型性能。简单来说,openai的开发者们基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让chatgpt学会“思考”,自我提升。
诚然,chatgpt十分强大,但它仍存在一定的局限性,chatgpt 的创建者也坦率地指出了当前的人工智能仍存在的一些缺点,例如只能复读整合观点,没法提出新的见解;chatgpt只是直接对用户可看到的答案范围进行了缩减,它给出的答案并不一定正确。不过总的来说,人工智能的浪潮正奔涌而来,从最早引起话题讨论的国际象棋程序深蓝,到前些年完胜人类棋手的alphago,再到现在的chatgpt,这都预示着我们人工智能的无限潜力。
chatgpt 测试地址:
参考资料:
撰写:林烁彬
审稿:何乐为