【LLaMA-Factory】開源語言模型微調專案　方便微調各種大型語言模型｜內建WebUI　方便使用

現在各種大型語言模型可以說是百花齊放

大多數人的電腦硬體，也應該足夠跑動一些參數較少的語言模型了

但如果說要將這些開源的語言模型，實際應用在專案上，可能還是需要先經過一些微調

但是微調的方法並不是每個人都可以輕易掌握，對於大部分人來說應該會比較麻煩

而最近，我在 GitHub 上看到一個，用來微調語言模型的專案，名為 LLaMA-Factory，它裡面包含常見的各種微調方式，像是整個模型直接訓練微調，或使用 LoRa 來微調，在裡面都可以輕鬆做到

今天就來跟大家介紹一下

LLaMA-Factory 介紹

LLaMA-Factory 這個專案提供了一個方便的 WebUI 介面，並且整合了各種常見的訓練方式，讓使用者可以方便的調整參數便開始為條屬於自己的語言模型。

接下來，就讓我們來看看如何使用這個專案

硬體需求

在使用這個專案前，這邊還是要讓大家知道一下，要 Fine Tune 一個模型需要的基本硬體需求

這邊作者有提供一個不同的參數量，大約會需要多少的 VRAM，才能 Fine Tune 的一張表

我們可以看到 7B 參數的模型，即便開啟 4bit 量化，使用 QLoRa 來 Fine Tune，也會需要 6GB 的 VRAM，13B 參數的模型更是要吃到 12GB 的 VRAM。基本上想要玩語言模型微調，可能還是得要有張稍微好一點的顯卡。

Colab 限制

看到這張 VRAM 需求的表格後，許多人可能會想到是否可以使用 Colab 來進行訓練

但這邊我要很可惜的告訴大家，算是一半做得到一半做不到

我們確實可以在 Colab 裡面載入 7B 以上的模型，也確實可以進行訓練

但是在導出的時候，可能是因為 LLaMA-Factory 的輸出，會將 LoRa 層壓進模型內，這個步驟會需要將整個模型載入到記憶體

而免費版的 Colab 僅有提供 12GB 左右的系統記憶體，所以基本上在最後輸出的步驟，一定會報錯(付費版有更多記憶體所以應該沒差)

要說可以的部分，當然是在訓練的時候，它也會將 LoRa 層獨立保存下來，所以其實我們也可以直接把 LoRa 層下載下來，也一樣是可以使用

所以我還是有簡單的做個 Colab 記事本，讓大家可以方便使用 Colab 進行訓練

LLaMA-Factory使用教學

那麼接下來，就讓我們從如何在本機上安裝這個專案，開始說起

本機安裝

首先要在本機上安裝這個專案，我們需要先將這個專案下載下來，然後解壓縮

接著我們需要創建一個虛擬環境，並將它開啟

1
2


python -m venv .\venv
.\venv\Scripts\activate

接下來安裝 PyTorch、requirements.txt 等必要套件。

之所以將 PyTorch 獨立出來安裝，是因為如果不加上後面的指定版本以及 --extra-index-url，可能會安裝到只能使用 CPU 版的 PyTorch。

1
2


pip install torch==1.13.1 torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
pip install -r requirements.txt

如果不小心安裝了只有 CPU 版的 PyTorch，我們可以先將他解安裝，然後清除快取後再重新安裝一次即可:

1
2
3
4
5
6
7
8


#解安裝原本的PyTorch:
pip uninstall torch

#清除快取:
pip cache purge

#安裝支援 CUDA 的 PyTorch
pip install torch==1.13.1 torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

最後則是 bitsandbytes 函式庫，Windows 系統上需要安裝預編譯的函式庫。如果是 Linux 系統，則是只需要輸入 pip install bitsandbytes>=0.39.0 即可

1
2
3
4
5


# Windows 需要安裝預編譯版
pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.39.1-py3-none-win_amd64.whl

# Linux 系統上使用以下指令即可
pip install bitsandbytes>=0.39.0

啟動 Web UI

安裝完成後，我們就可以啟動 LLaMA Factory 的 Web UI 介面，我們輸入以下指令:

1

python .\src\train_web.py

稍等一下，WebUI 就會自動打開(如果未開啟可以在瀏覽器手動輸入 localhost:7860)

到了這一步，我們其實已經可以開始訓練了，但是要把語言模型微調成自己想要的樣子，我們現在還缺一項東西，就是 訓練資料集。

導入訓練資料集

作者在專案的 data 資料夾內有提供資料集的格式，我們需要按照這個格式，才能讓我們自己準備的訓練資料，能夠被用來訓練。

以下簡單跟大家介紹 2 種數據集的導入方式

數據集導入方式1 - JSON檔

在專案的 data 資料夾內，有內建一些資料集，我們可以根據這些資料及的 JSON 檔，來製作屬於自己的資料集。

以下是製作 JSON 資料集的格式:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20


[
  {
    "instruction": "用戶指令（必填）",
    "input": "用戶輸入（選填）",
    "output": "模型回答（必填）",
    "history": [
      ["第一輪指令（選填）", "第一輪回答（選填）"],
      ["第二輪指令（選填）", "第二輪回答（選填）"]
    ]
  },
  {
    "instruction": "用户指令（必填）",
    "input": "用戶輸入（選填）",
    "output": "模型回答（必填）",
    "history": [
      ["第一輪指令（選填）", "第一輪回答（選填）"],
      ["第二輪指令（選填）", "第二輪回答（選填）"]
    ]
  }, //後面可以繼續接下去
]

在製作玩 JSON 資料集後，我們需要在 dataset_info.json 裡面填寫該資料集的欄位對應資料，它的格式如下:

1
2
3
4
5
6
7
8


"資料集名稱": {
  "columns": {
    "prompt": "instruction",
    "query": "input",
    "response": "output",
    "history": "history"
  }
}

數據集導入方式2 - 直接讀取 Hugging Face

除了製作 JSON 資料及外，LLaMA-Factory 還支援可以直接從 Hugging Face 上抓取資料集，我們只需要在 dataset_info.json 填入該資料集的 Hugging Face 路徑，以及資料集的欄位對應就可以。

它的格式如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12


"資料集名稱":{
  "hf_hub_url": "HF路徑",
  "columns": {
    "prompt": "用戶指令所對應的欄位（必填）",
    "input": "用户输入所對應的欄位（選填）",
    "response": "回覆所對應的欄位（必填）",
    "history": [
      ["第一輪指令（選填）", "第一輪回答（選填）"],
      ["第二輪指令（選填）", "第二輪回答（選填）"]
    ]
  }
}