chatgpt :全流程,根据自有知识库,检索生成式问答

chatgpt或者gpt3,生成式问答的问题明显。

一方面知识更新不及时,另一方面一本正经的胡说八道。

嘴硬心不软,还时不时闹点小脾气。

下面是openai的生成式模型在自有知识库上,检索生成式问答的全过程。

当然,库不需要是问答的知识,只要是需要限定的背景知识即可。

比如pdf文档的内容,分块存储到库中,最后进行检索式的问答,完成根据pdf的问答。

拢共分三步:

第一步,将现有知识库语料,转化为向量,加入pincone,。当然这是开源的openai的做法,这个有一定免费额度,后期还是直接放到faiss或者milvus上,这笔可以省下。

第二步,query进行,转化为向量,根据cosine相似度,进行检索,找到topN最相似的知识库文档。

第三步:根据检索到的文档知识,作为背景知识,传入chatgpt 或者其他的gpt3模型,这里是text-davinci-003

即可得到答案。

另外:如果需要多轮问答,每次把历史对话回传。尤其针对普通的客服类消息回复,没那么长,所以通常的产品推荐和售前售后咨询,多轮问答是没有问题的。

重点:其实不管多长的背景知识,只要分块存储和向量化,都可以存入库中,并不担心的背景信息太多的问题。

第一步:将现有知识库语料,转化为向量,加入pincone,。

(1)先用自己的的openai的api_key,

chatgpt :全流程,根据自有知识库,检索生成式问答

这答案骗骗我是可以的。

chatgpt :全流程,根据自有知识库,检索生成式问答

使用生成式模型text-davinci-003

chatgpt :全流程,根据自有知识库,检索生成式问答

(2) 正式进入向量转化,使用模型 text-embedding-ada-002。生成向量维度为1536。

chatgpt :全流程,根据自有知识库,检索生成式问答

chatgpt :全流程,根据自有知识库,检索生成式问答

chatgpt :全流程,根据自有知识库,检索生成式问答

(3)知识库语料导入,youtube语料,包含字段如截图

chatgpt :全流程,根据自有知识库,检索生成式问答

(走到这我就后悔了,不自己造数据的后果就是,20万条来一遍,也忒耗时了 )

(4)这步登入pincone,需要先在pincone注册登录,替换自己的api_key 和environment, 都在左栏api_key那里。

chatgpt :全流程,根据自有知识库,检索生成式问答

(5)将知识库语料转化为向量,并插入pincone

chatgpt :全流程,根据自有知识库,检索生成式问答

chatgpt :全流程,根据自有知识库,检索生成式问答

(速度还能接受)

第二步,query进行,转化为向量,根据cosine相似度,进行检索,找到top2最相似的知识库文档。

(1)query转化为向量,进行检索

chatgpt :全流程,根据自有知识库,检索生成式问答

结果如下

chatgpt :全流程,根据自有知识库,检索生成式问答

第三步:根据检索,得到的文档知识,作为背景知识,传入chatgpt 或者其他的gpt3模型,这里是text-davinci-003

即可得到答案。

(1)生成prompt,限定背景知识来回答

chatgpt :全流程,根据自有知识库,检索生成式问答

chatgpt :全流程,根据自有知识库,检索生成式问答

(3)生成答案

chatgpt :全流程,根据自有知识库,检索生成式问答

试了一下,感慨于nlper:确实该多考虑考虑了。

虽然这里面的模型,都可以自训练和检索,给公司省点钱。

只是省的这点钱,好像不够发工资。

后台发送:gen_qa

即可下载:https://pan.baidu.com/s/1-EohvzhtC2-foN5XAhNihw

提取码:9zt0

 

 

 


 

 

本网站文章皆为作者授权。发布者:虹七,转载请注明出处:https://ruofanseo.com/search-generative-qa/

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 6月 20, 2023 1:20 下午
下一篇 6月 20, 2023 1:25 下午

相关推荐

  • ChatGPT的常用插件和学习网站

    所有插件请从Chrome应用商店下载,Microsoft Edge也支持从Chrom应用商店安装插件。 常用Chrome插件 1. ShareGPT 分享你与ChatGPT的对话,其他人不需要魔法也能看到你与ChatGPT的对话。 我向ChatGPT访问了必要条件与充分条件的区别,下面是对话的内容。https://shareg.pt/qFAnyUs Shar…

    7月 2, 2023
    20900
  • ChatGPT:跨行业百问百答,智能问答新时代。

    ChatGPT的网页版,有记忆能力,一句句的沟通问题都不大。第一句没澄清,第二句再补充即可。但在调接口时,没有上下文的记忆信息,所以接口提问中,提问的背景一致,很重要。   1. 行业百问百答的提问,在如下链接中,包含提示词和ai工具导航网站。 【腾讯文档】AIGC导航 https://docs.qq.com/sheet/DV1p0dmJvcGxO…

    4月 14, 2023
    5600
  • ChatGPT温度调整指南:如何调整温度,生成优质内容。

    1. 温度 生成模型,例如chatgpt这样的,抽样都包含随机性,因此每次点击“生成”时,相同的提示可能会产生不同的输出。而温度,就是用于调整随机程度的数字。 2. 生成时如何选择温度 较低的温度意味着较少的随机性; 比如,温度为 0 将始终产生相同的输出。 那么,多少温度合适呢?最好根据自己的问题,来调节。 我们看看后面的栗子(栗子不看版:直接看第6点结论…

    4月 14, 2023
    33000
  • 2023年:ChatGPT迈向史诗级升级,开启全新体验!【点击进入】

    【升级改变一切!ChatGPT的插件功能全面解析】 2022年11月,ChatGPT一经发布便吸引了全球关注。如今,它迎来重大升级,为大家带来全新的插件功能。原本受限于训练数据的ChatGPT,将通过插件打开无限可能。一些之前无法实现的功能,如浏览互联网、上传/下载文件以及启用第三方插件,将很快变为现实。 【插件1:浏览器——让ChatGPT自由驰骋互联网】…

    6月 18, 2023
    4900
  • ChatGPT认为,它分别能做什么:医疗领域+教育领域+金融领域+出境旅游

    提问大都一个指向:在医疗领域,教育领域、金融领域、出境游等,chatgpt或者AIGC技术能做哪些事?截图都是chatgpt的回答。 1. 医疗领域,有点多,真真假假,还举出了一些我很想反驳,又无处下手的例子。     2. 教育领域,chatgpt认为   3. 金融领域,它认为: 4. 出境旅游,它认为: 整体上: 1.自然语言处理领…

    4月 14, 2023
    6700

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

159-7415-9137

在线咨询: QQ交谈

邮件:ruofan1001@gmail.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
关注微信
关注公众号
关注公众号
分享本页
返回顶部