hiroya3508
/

llm-jp-3-13b-it-tuning_lora

@@ -22,7 +22,7 @@ This llama model was trained 2x faster with [Unsloth](https://github.com/unsloth
 [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
-# 推論用コード
 本コードはunslothで学習したqLoRAのアダプタを用いてELYZA-tasks-100-TVの出力を得るためのコードです。
 Hugging Faceにアダプタをアップロードしてあることが前提となります。
 このコードはunslothライブラリを用いてモデルを読み込み、推論するためのコードとなります。
@@ -30,21 +30,24 @@ Hugging Faceにアダプタをアップロードしてあることが前提と
 ※本コードはGoogle Colabでの動作を想定しており、Omnicampusでの動作を想定しておりません。
 下記セルを上から順に実行することで推論を行えます
 ```
-# 必要なライブラリをインストール
 %%capture
 !pip install unsloth
 !pip uninstall unsloth -y && pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
 !pip install -U torch
 !pip install -U peft
 ```
 ```
-# ベースとなるモデルと学習したLoRAのアダプタ（Hugging FaceのIDを指定）。
 model_id = "llm-jp/llm-jp-3-13b"
 adapter_id = "hiroya3508/llm-jp-3-13b-it-tuning_lora"
-```
-```
 # unslothのFastLanguageModelで元のモデルをロード。
 dtype = None # Noneにしておけば自動で設定
 load_in_4bit = True # 今回は13Bモデルを扱うためTrue
@@ -56,11 +59,12 @@ model, tokenizer = FastLanguageModel.from_pretrained(
     trust_remote_code=True,
 )
 ```
 ```
 # 元のモデルにLoRAのアダプタを統合。
 model = PeftModel.from_pretrained(model, adapter_id, token = HF_TOKEN)
-```
-```
 # タスクとなるデータの読み込み。
 # 事前にデータをアップロードしてください。
 datasets = []
@@ -73,9 +77,9 @@ with open("./elyza-tasks-100-TV_0.jsonl", "r") as f:
         datasets.append(json.loads(item))
         item = ""
 ```
-```
-# モデルを用いてタスクの推論。
 # 推論するためにモデルのモードを変更
 FastLanguageModel.for_inference(model)
@@ -92,9 +96,8 @@ for dt in tqdm(datasets):
   results.append({"task_id": dt["task_id"], "input": input, "output": prediction})
 ```
 ```
-# 結果をjsonlで保存。
 # ここではadapter_idを元にファイル名を決定しているが、ファイル名は任意で問題なし。
 json_file_id = re.sub(".*/", "", adapter_id)
 with open(f"/content/{json_file_id}_output.jsonl", 'w', encoding='utf-8') as f:

 [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
+# 概要
 本コードはunslothで学習したqLoRAのアダプタを用いてELYZA-tasks-100-TVの出力を得るためのコードです。
 Hugging Faceにアダプタをアップロードしてあることが前提となります。
 このコードはunslothライブラリを用いてモデルを読み込み、推論するためのコードとなります。
 ※本コードはGoogle Colabでの動作を想定しており、Omnicampusでの動作を想定しておりません。
+# 実行手順
 下記セルを上から順に実行することで推論を行えます
+# 1. セットアップ
+## 1-1. 必要なライブラリをインストール
 ```
 %%capture
 !pip install unsloth
 !pip uninstall unsloth -y && pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
 !pip install -U torch
 !pip install -U peft
 ```
+## 1-2. モデルとトークナイザーの読み込み
 ```
+# ベースとなるモデルと学習済みLoRAのアダプタ（Hugging FaceのIDを指定）。
 model_id = "llm-jp/llm-jp-3-13b"
 adapter_id = "hiroya3508/llm-jp-3-13b-it-tuning_lora"
 # unslothのFastLanguageModelで元のモデルをロード。
 dtype = None # Noneにしておけば自動で設定
 load_in_4bit = True # 今回は13Bモデルを扱うためTrue
     trust_remote_code=True,
 )
 ```
+## 1-3. モデル結合とタスクの読み込み
 ```
 # 元のモデルにLoRAのアダプタを統合。
 model = PeftModel.from_pretrained(model, adapter_id, token = HF_TOKEN)
 # タスクとなるデータの読み込み。
 # 事前にデータをアップロードしてください。
 datasets = []
         datasets.append(json.loads(item))
         item = ""
 ```
+# 2.モデルを用いてタスク推論。
+```
 # 推論するためにモデルのモードを変更
 FastLanguageModel.for_inference(model)
   results.append({"task_id": dt["task_id"], "input": input, "output": prediction})
 ```
+# 3. 結果をjsonlで保存。
 ```
 # ここではadapter_idを元にファイル名を決定しているが、ファイル名は任意で問題なし。
 json_file_id = re.sub(".*/", "", adapter_id)
 with open(f"/content/{json_file_id}_output.jsonl", 'w', encoding='utf-8') as f: