182 lines (110 loc) · 7.38 KB

Tutorial11: 使用LLaMa-Factory交互应用做大模型微调

集群类型：智算平台
所需镜像：app-store-images.pku.edu.cn/pkuhpc/llama-factory-v1:nvidia-v1
所需模型：Qwen2.5-7B-Instruct
所需数据集：教程内提供
所需资源：单机单卡，建议使用1张GPU运行本教程。
目标：本节以Qwen2.5-7B-Instruct模型为例，使用LLaMA-Factory交互应用对这个Qwen大模型完成微调、推理的步骤。未经过微调的Qwen大模型认为自己是Qwen大模型；经过微调后，Qwen大模型认为自己是北大人工智能助手。

分以下几步来实现：

创建LLaMA-Factory交互应用，选取Qwen2.5-7B-Instruct模型
按照步骤，使用LLaMA-Factory交互应用完成对大模型的微调和推理

1、拉取镜像并安装

1.1 准备数据集

根据Tutorial5_添加和管理数据集准备数据集

1.2 创建交互式应用 1.2.1 然后点击作业 > 选择集群（这里AI实验集群是AI集群的名称） > 应用 > 创建应用

1.2.2 进入AI集群的应用页面，点击LLaMA-Factory图标，创建LLaMA-Factory应用

1.3 选取大模型在创建LLaMA-Factory页面中，进行配置：

1.3.1 应用配置中

选择默认镜像，app-store-images.pku.edu.cn/pkuhpc/llama-factory-v1:nvidia-v1

1.3.2 添加模型和数据集

勾选添加类型 - 模型，下拉菜单中，选取公共模型；模型下拉菜单中，选取 Qwen2.5-7B-Instruct 模型，版本下拉菜单中，选取 latest(如果您使用的集群没有该模型，请参考Tutorial4下载模型，其中tutorial4中的1.1.6步骤使用modelscope download --model Qwen/Qwen2.5-7B-Instruct --local_dir ./Qwen/Qwen/Qwen2.5-7B-Instruct)

勾选添加类型 - 数据集，下拉菜单中，选取我的数据集；数据集下拉菜单中，选取刚创建的 identity-pku-assistant（这里有你的用户名）数据集，版本下拉菜单中，选取刚在数据集中设置的版本号；有多个版本的话，选取恰当的版本

1.3.3 本教程采用单节点单卡，资源部分不需要修改。也可以根据实际需要，如单节点多卡的话，在单节点加速卡卡数中修改为2/4/8（单节点上限是8卡，卡数越多，对大模型训练的时间会相应缩短）然后点击提交按钮

1.1.10 进入新创建的LLaMA-Factory应用的浏览器界面

提交后，刚创建的作业在未结束的作业列表中，作业状态为 PENDING

点击刷新按钮，手动进行刷新后，作业状态转为 RUNNING，在这条作业的操作中，点击进入图标，浏览器将打开新的页面来展示新创建的LLaMA-Factory应用

进入新创建的LLaMA-Factory应用的浏览器界面，可以看到：前面步骤中选取的模型 Qwen2.5-7B-Instruct 前面步骤中创建的数据集所在目录

2、用LLaMA-Factory交互应用对Qwen模型进行微调

这里主要会用到 Train 训练来进行模型微调和 Chat 对话来验证模型微调前后的比较 2.1 点击 Chat 对话，询问问题，让模型进行推理，查看微调前的模型表现

2.1.1 现在模型还未加载，点击加载模型

模型加载中，这里加载的模型是前面步骤中选取的模型 Qwen2.5-7B-Instruct

2.1.2 模型加载后，可以跟模型进行对话聊天，这里使用推理的模型是 Qwen2.5-7B-Instruct 也就是在创建交互应用时选择的模型

2.1.3 与模型进行对话

在输入框中，提问：你好，你是谁？

点击提交按钮，查看模型进行推理后的回答，确认是通义千问大模型

提出更多问题，例如：是谁创造了你？你是chat gpt吗？并逐一提交，查看模型进行推理后的回答，问题主要集中在 identity 身份方面，为后面经过微调后的模型的回答作对比

2.2 点击 Train 训练，配置微调所用的数据集

2.2.1 查看数据路径，在数据集下拉菜单中，选择刚创建的数据集 identity-pku-assistant

2.2.2 选择好数据集后，可以点击预览数据集

对数据集预览时，可以用上一页或下一页进行翻页，浏览完后，可以点击关闭

2.3 在 Train 训练中，配置微调所需要的参数

2.3.1 在对话模板的下拉菜单中，选择 qwen 模型，因为是对 qwen 千问模型进行微调和对话

2.3.2 修改微调所需要的参数

在学习率中，将参数修改为 1e-4
在训练轮数中，将参数修改为 20
在最大样本数中，将参数修改为 1000
在截断长度中，将参数修改为 1024

2.3.3 点击保存训练参数，使得修改后的参数保存起来

2.3.4 点击预览命令，查看所有参数的配置

可以看到微调时会使用的命令和参数

2.4 在 Train 训练中，使用数据集对模型进行微调

2.4.1 点击开始按钮，这里使用的数据集是2.2.1中设置的 identity-pku-assistant 数据集，对模型进行微调。输出目录、配置路径都不要修改。在还没有开始进行微调时，损失曲线为空白。

2.4.2 等几秒后，可以看到，对模型开始微调，进程条在走动，【未见：损失曲线在变化】

2.4.3 微调完成后，提示：训练完毕，【未见：损失曲线不再变化】

2.5 在 Chat 对话中，询问问题，让模型进行推理，查看微调后的模型表现

2.5.1 回到 Chat 页面，在检查点路径点击下拉菜单，刚微调的输出目录出现在下拉菜单，选中这个目录。如果是多次微调的话，下拉菜单中会有多个可选目录，选择合适的目录

2.5.2 为了让微调后的模型生效，要先点击卸载模型，把没有经过微调的模型进行卸载

2.5.3 再点击加载模型，将微调过的模型进行加载

2.5.4 与模型进行对话

在输入框中，提问：你好，你是谁？点击提交按钮，查看模型进行推理后的回答，回答不再是通义千问大模型，而是北大人工智能助手【未见】

提出更多问题：是谁创造了你？你和北京大学是什么关系？并逐一提交，查看模型进行推理后的回答，问题主要集中在身份方面，与2.1.3中模型的回答作对比

作者：孔德硕；龙汀汀*

联系方式：l.tingting@pku.edu.cn