ChatGPT微调全过程,只需2刀(10分钟)

第一、微调chatgpt

  1. 环境:    pip install –upgrade openai

     

 

  1. 导入api_key:  export OPENAI_API_KEY=”你的api_key”

 

  1. 预处理数据:openai tools fine_tunes.prepare_data -f qa100.json

 

对于数据的预处理,主要包括 去重、小写、增加前后缀和空白,保存为json等。

    • Remove 1 duplicate rows[Y/n]
    • Lowercase all your data in column/key prompt [Y/n]
    • Lowercase all your data in column/key completion[Y/n]
    • Add a suffix separator -> to all prompts[Y/n]
    • Add a suffix ending n to all completions[Y/n]
    • Add a whitespace character to the beginning of the completion[Y/n]
    • Your data will be written to a new JSONL file. Proceed [Y/n]

 

处理后如下截图:

ChatGPT微调全过程,只需2刀(10分钟)

  1. 选择模型,开始微调:  openai api fine_tunes.create -t qa100_prepared.jsonl -m davinci

     

 

底部会出现这个任务的id,  根据id信息,进行第5步,查看。

  1. 查看过程:openai api fine_tunes.follow -i ft-aj4ddUui4poQrP9M2qY7f7vm

 

我的花费大概 2.38刀,输入数据是100多个问答对,耗时几分钟。

ChatGPT微调全过程,只需2刀(10分钟)

现在训练完了,耗时10分钟以内。

  1. 查询所有的模型:openai api fine_tunes.list

 

可以看到微调过的所有信息,输入信息,输出模型名称、花费、默认的超参数等等。

ChatGPT微调全过程,只需2刀(10分钟)

  1. 输入数据格式为json,每行内容为

     

     

     

     

 

{“prompt”:”如何在华为手机上开启暗黑模式?”,”completion”:”要在华为手机上开启暗黑模式,请进入设置-显示与亮度-暗黑模式,并开启开关。从那里,你可以选择特定应用程序或整个系统使用暗黑模式,并设置自动激活的计划。”}

第二、 再来看看ada的花费

110个问答对的输入,4个epoch,模型是ADA, 微调耗时无感,花费 0.03刀。详细信息如截图。

ChatGPT微调全过程,只需2刀(10分钟)

 

 

本网站文章皆为作者授权。发布者:虹七,转载请注明出处:https://ruofanseo.com/chatgpt-fine-tuning/

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 6月 20, 2023 1:14 下午
下一篇 6月 20, 2023 1:23 下午

相关推荐

  • AIGC,革命性的生产方式

    ChatGpt的出现,相当于知识型工作者的工业革命 微软CEO纳徳拉:我这辈子,至少在从事技术工作的30年里,chatGPT是我从未见过的技术扩散。也许这一次,对知识型工作者来说,这就完全等同是工业革命。微软每个产品都将接入chatGPT。 ChatGPT(Chat Generative Pre-trained Transformer)是OpenAI在202…

    6月 20, 2023
    5400
  • ChatGPT 用户指南:最新版本的详细使用说明(上)

    chatgpt对提问者的帮助大小,取决于怎么提出问题。其实这也是一种编程,一种自然语言式的编程。 以下是根据官方的说明文档,做个简洁整理版,算是最少必要知识。   chatgpt是什么? 答:openai训练的大型语言模型,擅长语言理解和文本生成。 2. 它能做什么? 答:它能, 生成文本内容;做总结;文本分类(也包括情感分析);数据提取;写代码改…

    4月 14, 2023
    7800
  • 2023 年最新 AI 绘画技巧:Stable Diffusion 详解(附图)

      Stable Diffusion的发布是一个里程碑,它让人可以使用高性能模型,就图像质量、速度以及资源/内存要求方面,都很友好。下面是关于Stable Diffusion的简单介绍. 它可以生成什么? Stable Diffusion可以用在很多地方,一个是用来从文字生成图片(text2img),上面的图片就是输入的文字,生成的图片。除了文字转…

    4月 14, 2023
    9200
  • chatgpt :全流程,根据自有知识库,检索生成式问答

    chatgpt或者gpt3,生成式问答的问题明显。 一方面知识更新不及时,另一方面一本正经的胡说八道。 嘴硬心不软,还时不时闹点小脾气。 下面是openai的生成式模型在自有知识库上,检索生成式问答的全过程。 当然,库不需要是问答的知识,只要是需要限定的背景知识即可。 比如pdf文档的内容,分块存储到库中,最后进行检索式的问答,完成根据pdf的问答。 拢共分…

    6月 20, 2023
    5200
  • ChatGPT认为,它分别能做什么:医疗领域+教育领域+金融领域+出境旅游

    提问大都一个指向:在医疗领域,教育领域、金融领域、出境游等,chatgpt或者AIGC技术能做哪些事?截图都是chatgpt的回答。 1. 医疗领域,有点多,真真假假,还举出了一些我很想反驳,又无处下手的例子。     2. 教育领域,chatgpt认为   3. 金融领域,它认为: 4. 出境旅游,它认为: 整体上: 1.自然语言处理领…

    4月 14, 2023
    6700

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

159-7415-9137

在线咨询: QQ交谈

邮件:ruofan1001@gmail.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
关注微信
关注公众号
关注公众号
分享本页
返回顶部