ChatGPT的历史和未来。附:ChatGPT研究框架2023

 

ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累

经过长久积累,最终形成针对人类反馈信息学习的大规模预训练语言模型LLM。

ChatGPT的历史和未来。附:ChatGPT研究框架2023

 

本文,简单说说它发展至今的基础,也及它从哪里而来,要到哪里而去。

  1. Transformer出现,奠定了预训练大语言模型的基础。

     

2017年,论文《Attention Is All You Need》 中,通过注意力机制(attention  mechanism)连接encoder编码器和decoder解码器,是一种全新的架构。

Transformer,基于注意力, 完全不用重复和卷积,相较于RNN、CNN等经典模型是个极大的突破。模型更易于并行化训练、并改善网络深层的遗忘问题,特征抽取能力更强。

所以,Transformer出现以后,迅速取代了CNN、RNN系列变种,跻身最主流的模型架构基础。

在这之前,通过CNN、RNN等模型,对特征的抽取能力不强。更深的网络、更多的遗忘。标注数据本就不易,模型却往往不能学到数据中的足够知识。特征提取器,是让模型从输入数据中学到、并真正沉淀下来、用来完成目标任务的。

Transformer,做到了前无古人,后无来者。直到现在,不曾出现更强大的特征提取器取代它。

  1. 进一步发展出GPT、Bert系列,进入两阶段预训练模型的时代

     

以Transfomer为基础,GPT、Bert等预训练的大模型,进一步突破传统限制,模型开始不需要那么多高质量的标注数据,并且在下游任务上只需少量标注数据。微调后即可用,且效果更好。

以Transformer架构为基础的特征提取器,继续发展而越来越强大的模型,主要分为3大系列。

一是利用tranformer的decoder发展而来的GPT系列,在自然语言生成方面,表现更好。

紧接着继续放大和微创新,得到的GPT-2、GPT-3、GPT3.5等等。

二是双向Transformer+Mask的自编码系列,BERT系列, 偏好自然语言理解。比如Bert、Roberta、Albert等等。

三是Encoder-decoder架构的T5,使用双向/单向attention,偏好条件文本生成。(Google的T5模型,在形式上统一了自然语言理解和自然语言生成任务的外在表现形式)

  1. 以GPT 3为代表的“自回归语言模型+Prompting”模式的时代

     

我们希望语言模型们,能够用人类常用的命令方式来执行任务,也就是实现通用人工智能AGI(,artficial general intelligence)。

但是现在技术还做不到,退而求其次,用替代技术来表达人类的任务需求,也就是现在的prompting技术。

从zero shot prompting(零示例提示语)、few shot prompting(少数示例提示语)、以及有一定推理能力的 Chain of Though (思维链)Prompting,都是给模型一定的prompting示例,它就能表现的更好。

  1. 开始走向通用人工智能AGI时代(AGI,artficial general intelligence)

     

我们习惯的表达方式,就是机器能够理解的。而现在的ChatGPT,就是个很好的开始,开始有点儿善解人意。

ChatGPT是结合了InstrutGPT来理解人类偏好知识,同时结合GPT3.5对世界知识的沉淀,达到了现在的能力。

GPT3.5的训练数据,涵盖编程,社交媒体,搜索结果,新闻,生物医学,体育,政治以及旅游等等几乎所有的内容领域。比如:英文维基百科,新闻文章,论坛言论,数据库,推特推文,聊天文本,Reddit帖子,开源代码,博客文章等等。真的是,知一切历史。

InstructGPT,主要通过RLHF (Reinforcement Learning From Human FeedBack)来学习,也就是通过人类反馈的强化学习,来理解人类偏好。它只有几万人工标注数据,是人类的偏好表述。例如“帮我把这段话翻译成英文”,表示的是要做“机器翻译”的需求。

ChatGPT的历史和未来。附:ChatGPT研究框架2023

 

ChatGPT是生成式人工智能技术(AIGC)浪潮的一部分,也是迈向AGI时代的开始。

 

ChatGPT的历史和未来。附:ChatGPT研究框架2023

 

未来,以ChatGPT为代表的AIGC将会带来生产力的巨大提升,AIGC将促进各行业转型升级。

ChatGPT的历史和未来。附:ChatGPT研究框架2023

 

5. 最后

历史:人工智能技术,从1950年的基于规则的处理,到经典的机器学习、深度学习,和现在的大型预训练模型阶段LLM,从人类的反馈中学习,预示着通用人工智能时代(AGI)已经来临。

现在,以ChatGPT为代表的人工智能生成内容AIGC,蓬勃发展,值得期待。

 

本网站文章皆为作者授权。发布者:虹七,转载请注明出处:https://ruofanseo.com/chatgpt-research-framework-2023/

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 6月 20, 2023 1:26 下午
下一篇 6月 20, 2023 1:34 下午

相关推荐

  • 如何在 Search Console 气泡图中找到 ChatGPT 和 New Bing 无法完全侵食流量的SEO关键字?

    Search Console 气泡图不是新鲜的事物,很早之前谷歌就推荐站长们使用Search Console气泡图来了解网站在哪些查询词上表现良好,哪些查询词需要去改进。 最近联想到未来AI可能会怎样改变用户的搜索行为,我发现可以有效地利用气泡图来挖掘出那些可以在未来依然能够给网站带来稳定自然搜索流量的关键字。 这样讲可能会有点晦涩,我先普及一下背景。 为什…

    6月 25, 2023
    4600
  • 2023年:ChatGPT引领话术革命,揭秘【万能话术模板】+99个提示词

    一:万能提示模板 【方便观看版】 【方便复制版】   现在你是一位[     ]创作者。你的任务是以[     ]为标题写一份[     ]的文章。 文章内容包含[     ] [     ] [     ]3部分。 听众是 [     ],他们喜欢 [     ],看重[     ]。 你的写作风格是 [     ]。 字数要求1000字。  现…

    6月 18, 2023
    15800
  • ChatGPT内容生成中的密码识别问题:如何避免风险

    昨天早上刚起床,拿起手机刷到资深媒体人,著名战地记者老胡的动态,我以为有大新闻。结果细看是AI绘图软件,达到了以假乱真的效果,老胡也感慨:以后真新闻怎么活? 我当时第一眼也被骗了,难道这种AI就野蛮生长吗,无法监管吗?SEO小平今天就要和大家讨论这个话题。   的确,最近的AI聊天,AI绘图等惊艳问世,让大家工作效率提升了好几倍。我们公司也赶紧给所…

    4月 3, 2023
    7900
  • ChatGPT微调全过程,只需2刀(10分钟)

    第一、微调chatgpt 环境:    pip install –upgrade openai    导入api_key:  export OPENAI_API_KEY=”你的api_key”   预处理数据:openai tools fine_tunes.prepare_data -f qa…

    6月 20, 2023
    4800
  • ChatGpt 对智能客服机器人的改进

    过往,在客服机器人领域,常规的相似度计算,能解决部分QA相似对的匹配,但是知识库构建的局限、相似度匹配的局限,使得仍有不少未知问题,要人工才能解决。而ChatGpt或以后的更新模型,必然有很大的发挥空间。 改进的方向可以有很多,当垂直领域,对ChatGpt给的答案不可用时: 可以,训练自己专属领域的chatGpt,或者指导生成新模型。 还可以,把公司所有的业…

    6月 20, 2023
    4800

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

159-7415-9137

在线咨询: QQ交谈

邮件:ruofan1001@gmail.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
关注微信
关注公众号
关注公众号
分享本页
返回顶部