Datawhale AI冬令营-学习笔记-task1
很多企业训练出来的通用模型我们在使用时并不能很好得解答我们生活中的疑惑故我们需要一些定制专属大模型来解答在特殊情境下的特定问题通过投喂一些特定的数据使得让专属模型在特定领域有着更出色的表现。本次学习将基于《甄嬛传》剧本中的甄嬛台词通过五个简单的步骤不写一行代码打造一个模仿甄嬛语气、风格的专属聊天模型——Chat-嬛嬛。step1注册讯飞星辰Maas平台星火大模型精调平台在这个平台注册用户注释讯飞星辰Maas平台1.是一个模型微调的零代码平台旨在简化模型微调过程无需一行代码即可定制大模型2.提供了直观的界面和高效的工具支持快速训练和优化现有模型。step2下载嬛嬛数据集数据来源self-llm/dataset/huanhuan.json at master · datawhalechina/self-llm · GitHub注释微调的数据集是定制大模型的关键我们常见的微调数据集需要符合Alpaca格式以我们使用的嬛嬛数据集为例其样本如下{ instruction: 小姐别的秀女都在求中选唯有咱们小姐想被撂牌子菩萨一定记得真真儿的——, input: , output: 嘘——都说许愿说破是不灵的。 }字段说明instruction任务的指令模型需要完成的具体操作一般可以对应到用户输入的Prompt。input任务所需的输入内容。若任务是开放式的或者不需要明确输入可以为空字符串。output在给定指令和输入的情况下模型需要生成的期望输出也就是对应的正确结果或参考答案。step3定制专属嬛嬛大模型按照教程步骤执行即可step4创建应用链接控制台-讯飞开放平台应用名称自定义应用分类选“聊天社交”应用功能描述自由发挥step5体验AI嬛嬛按照步骤操作即可错题集1.在一个AI研究团队中小明正在准备大模型的微调任务。他发现一个名为嬛嬛数据集的样本这个数据集采用了Alpaca格式。关于这个数据集的格式特点下列说法正确的A:数据集中instruction字段可以为空因为有些任务不需要B:input字段必须包含具体的输入内容否则数据集C:output字段是可选的不是所有样本都需要标准D:input字段在开放式任务中可以为空字符串这是格式允许的解析根据文本描述Alpaca格式的数据集包含三个主要字段instruction任务指令、input输入内容和output期望输出。其中明确指出若任务是开放式的或者不需要明确输入input可以为空字符串。这正好对应选项D的说法。而其他选项都存在错误A选项中instruction不能为空因为它代表了模型需要完成的具体操作B选项错误地认为input必须有内容C选项中output是必需的因为它代表了模型训练所需的正确结果或参考答案。记录下你的感受和困难感受对大模型有了初步的概念知道了形成大模型需要喂一些特定的数据才能实现特定效果虽然甄嬛这个模型不是很强但是让我感受到了喂数据的重要性无论从数据集的数量和质量来讲。第一次生成了一个大模型还是挺开心的收获满满困难1.step4中创建应用中“应用功能描述”要怎么说更好是否有模板可以套2.在跟大模型对话时对话内容有些人机甚至有些提问的内容都回答不出来。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2456968.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!