In [4]:
!pip install -q accelerate peft bitsandbytes transformers trl

In [5]:
import os
import torch
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    BitsAndBytesConfig,
    TrainingArguments,
    pipeline,
)
from peft import LoraConfig, PeftModel
from trl import SFTTrainer

import pandas as pd
from sklearn.model_selection import train_test_split
from datasets import Dataset
from google.colab import drive
import os

In [6]:
drive.mount('/content/gdrive')
os.chdir('XXXXXXXXXXXX')#改成放data的雲端硬碟位置
!pwd
!ls

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).
/content/gdrive/MyDrive/space_Colab/Final_Project
AI_Final_Project.ipynb			 game_data.csv		       taide-lx-7b-custom
config.json				 generation_config.json        tokenizer_config.json
Fine_tune_Llama_2_in_Google_Colab.ipynb  llama.cpp		       tokenizer.json
game_data2.csv				 model.safetensors.index.json  tokenizer.model
game_data3.csv				 results		       Untitled0.ipynb
game_data4.csv				 special_tokens_map.json


In [7]:
model_name = "taide/TAIDE-LX-7B-Chat"
new_model = "taide-lx-7b-custom"

lora_r = 64
lora_alpha = 16
lora_dropout = 0.1

use_4bit = True
bnb_4bit_compute_dtype = "float16"
bnb_4bit_quant_type = "nf4"
use_nested_quant = False

output_dir = "./results"
num_train_epochs = 1
fp16 = False
bf16 = False
per_device_train_batch_size = 4
per_device_eval_batch_size = 4
gradient_accumulation_steps = 1
gradient_checkpointing = True
max_grad_norm = 0.3
learning_rate = 2e-4
weight_decay = 0.001
optim = "paged_adamw_32bit"
lr_scheduler_type = "cosine"
max_steps = -1
warmup_ratio = 0.03
group_by_length = True
save_steps = 5
logging_steps = 5

max_seq_length = 200
packing = False
device_map = {"": 0}


my_token = "XXXXXXXXXXXXXXXXXXXXXX" #改成taide的access token
model_path = "XXXXXXXXXXXXXXXXXXXXX" #改成之後要存微調後的模型的位置

In [10]:
data = pd.read_csv('game_data3.csv')

train_data, test_data = train_test_split(data, test_size=0.1, random_state=42)

train_texts = train_data['details'].tolist()
train_labels = train_data['result'].tolist()

test_texts = test_data['details'].tolist()
test_labels = test_data['result'].tolist()

train_dataset = Dataset.from_dict({'prompt': train_texts, 'response': train_labels})
valid_dataset = Dataset.from_dict({'prompt': test_texts, 'response': test_labels})

def map_function(examples):
    new_texts = []
    for prompt, response in zip(examples['prompt'], examples['response']):
        if response == "Win":
            new_text = prompt + "在前面所述的情況下，該場遊戲贏了。"
        elif response == "Lose":
            new_text = prompt + "在前面所述的情況下，該場遊戲輸了。"
        else:
            new_text = prompt + response
        new_texts.append(new_text)
    return {'text': new_texts}

train_dataset = train_dataset.map(map_function, batched=True)
valid_dataset = valid_dataset.map(map_function, batched=True)

Map:   0%|          | 0/360 [00:00<?, ? examples/s]

Map:   0%|          | 0/40 [00:00<?, ? examples/s]

In [7]:
train_dataset

Dataset({
    features: ['prompt', 'response', 'text'],
    num_rows: 180
})

In [7]:
train_dataset[0]

{'prompt': 'Jhin (BOTTOM) 使用英雄: Jhin\n終場表現: - 擊殺數: 3, 死亡數: 5, 助攻數: 3 - 獲得金錢: 9165 - 經驗值: 9820, 等级: 12 - 小兵擊殺數: 194, 野怪擊殺數: 0\n關鍵事件:\n- 在 13 秒時，Jhin 購買了物品 多蘭之劍- 在 13 秒時，Jhin 購買了物品 生命藥水- 在 14 秒時，Jhin 購買了物品 潛行守衛- 在 178 秒時，Jhin 被 Graves 擊殺 - 在 186 秒時，Jhin 購買了物品 鞋子- 在 186 秒時，Jhin 購買了物品 回復藥水- 在 403 秒時，Jhin 助攻 Leona 擊殺了 Blitzcrank- 在 442 秒時，Jhin 購買了物品 輕靈之靴- 在 443 秒時，Jhin 購買了物品 長劍- 在 443 秒時，Jhin 購買了物品 長劍',
 'response': 'Lose',
 'text': 'Jhin (BOTTOM) 使用英雄: Jhin\n終場表現: - 擊殺數: 3, 死亡數: 5, 助攻數: 3 - 獲得金錢: 9165 - 經驗值: 9820, 等级: 12 - 小兵擊殺數: 194, 野怪擊殺數: 0\n關鍵事件:\n- 在 13 秒時，Jhin 購買了物品 多蘭之劍- 在 13 秒時，Jhin 購買了物品 生命藥水- 在 14 秒時，Jhin 購買了物品 潛行守衛- 在 178 秒時，Jhin 被 Graves 擊殺 - 在 186 秒時，Jhin 購買了物品 鞋子- 在 186 秒時，Jhin 購買了物品 回復藥水- 在 403 秒時，Jhin 助攻 Leona 擊殺了 Blitzcrank- 在 442 秒時，Jhin 購買了物品 輕靈之靴- 在 443 秒時，Jhin 購買了物品 長劍- 在 443 秒時，Jhin 購買了物品 長劍在前面所述的情況下，該場遊戲輸了。'}

In [11]:
compute_dtype = getattr(torch, bnb_4bit_compute_dtype)

bnb_config = BitsAndBytesConfig(
    load_in_4bit=use_4bit,
    bnb_4bit_quant_type=bnb_4bit_quant_type,
    bnb_4bit_compute_dtype=compute_dtype,
    bnb_4bit_use_double_quant=use_nested_quant,
)

tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False, token=my_token)

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config=bnb_config,
    device_map=device_map,
    token=my_token
)
model.config.use_cache = False
model.config.pretraining_tp = 1

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right"

peft_config = LoraConfig(
    lora_alpha=lora_alpha,
    lora_dropout=lora_dropout,
    r=lora_r,
    bias="none",
    task_type="CAUSAL_LM",
)

training_arguments = TrainingArguments(
    output_dir=output_dir,
    num_train_epochs=num_train_epochs,
    per_device_train_batch_size=per_device_train_batch_size,
    gradient_accumulation_steps=gradient_accumulation_steps,
    optim=optim,
    save_steps=save_steps,
    logging_steps=logging_steps,
    learning_rate=learning_rate,
    weight_decay=weight_decay,
    fp16=fp16,
    bf16=bf16,
    max_grad_norm=max_grad_norm,
    max_steps=max_steps,
    warmup_ratio=warmup_ratio,
    group_by_length=group_by_length,
    lr_scheduler_type=lr_scheduler_type,
    report_to="tensorboard",
    evaluation_strategy="steps",
    eval_steps=5
)

trainer = SFTTrainer(
    model=model,
    train_dataset=train_dataset,
    eval_dataset=valid_dataset,
    peft_config=peft_config,
    dataset_text_field="text",
    max_seq_length=max_seq_length,
    tokenizer=tokenizer,
    args=training_arguments,
    packing=packing,
)

trainer.train()

trainer.model.save_pretrained(new_model) # 儲存微調後的模型

Your GPU supports bfloat16: accelerate training with bf16=True


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/2.04k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/813k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/548 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/638 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/23.9k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/3 [00:00<?, ?it/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/4.98G [00:00<?, ?B/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/3.97G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]


Deprecated positional argument(s) used in SFTTrainer, please use the SFTConfig to set these arguments instead.


Map:   0%|          | 0/360 [00:00<?, ? examples/s]

Map:   0%|          | 0/40 [00:00<?, ? examples/s]

Step,Training Loss,Validation Loss
5,2.3143,2.072774
10,1.6895,1.436694
15,1.1781,0.976995
20,1.082,0.765848
25,0.8189,0.674797
30,0.637,0.61728
35,0.6058,0.565667
40,0.5517,0.680377
45,0.6128,0.531123
50,0.5085,0.512716



Cannot access gated repo for url https://huggingface.co/taide/TAIDE-LX-7B-Chat/resolve/main/config.json.
Access to model taide/TAIDE-LX-7B-Chat is restricted. You must be authenticated to access it. - silently ignoring the lookup for the file config.json in taide/TAIDE-LX-7B-Chat.

Cannot access gated repo for url https://huggingface.co/taide/TAIDE-LX-7B-Chat/resolve/main/config.json.
Access to model taide/TAIDE-LX-7B-Chat is restricted. You must be authenticated to access it. - silently ignoring the lookup for the file config.json in taide/TAIDE-LX-7B-Chat.

Cannot access gated repo for url https://huggingface.co/taide/TAIDE-LX-7B-Chat/resolve/main/config.json.
Access to model taide/TAIDE-LX-7B-Chat is restricted. You must be authenticated to access it. - silently ignoring the lookup for the file config.json in taide/TAIDE-LX-7B-Chat.

Cannot access gated repo for url https://huggingface.co/taide/TAIDE-LX-7B-Chat/resolve/main/config.json.
Access to model taide/TAIDE-LX-7B-Chat is res

【儲存模型】

In [10]:
base_model = AutoModelForCausalLM.from_pretrained(
    model_name,
    low_cpu_mem_usage=True,
    return_dict=True,
    torch_dtype=torch.float16,
    device_map=device_map,
)
model = PeftModel.from_pretrained(base_model, new_model)
model = model.merge_and_unload()

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right"

model.save_pretrained(model_path)
tokenizer.save_pretrained(model_path)

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

('/content/gdrive/MyDrive/space_Colab/taide3/tokenizer_config.json',
 '/content/gdrive/MyDrive/space_Colab/taide3/special_tokens_map.json',
 '/content/gdrive/MyDrive/space_Colab/taide3/tokenizer.model',
 '/content/gdrive/MyDrive/space_Colab/taide3/added_tokens.json',
 '/content/gdrive/MyDrive/space_Colab/taide3/tokenizer.json')

【輸入】

In [17]:
sys = "你是一個《英雄聯盟》的虛擬助理，能夠依據使用者提供的遊戲訊息提供策略建議和預測該場遊戲的勝敗。你的任務是根據用戶輸入的遊戲狀況給出遊戲的策略建議幫助使用者贏得遊戲。策略建議是根據當前的遊戲進程，提供戰術建議，例如何時應該進行團戰、推塔或是打大龍。而在使用者有要求的情況下也可以給出遊戲輸贏預測結果。請以清晰簡潔的方式提供你的建議，並解釋你作出此建議的原因。例如：當輸入「現在遊戲進行到25分鐘，我們推掉了對面兩座外塔，但對方控了兩條小龍，我們應該怎麼打？」時輸出「你們現在應該集中視野控制，確保大龍區域的安全。可以嘗試在對方紅Buff和中路之間的草叢設置視野，這樣可以提前預警對方的動向。你們可以組隊抓對方落單的英雄，然後利用人數優勢拿下大龍，這樣可以為後續的推塔和團戰奠定基礎。另外，在下一條小龍刷新前提前布置視野，爭取控制下一條小龍，防止對面拿到龍魂。」。有的時候使用者也可能輸入遊戲狀況的摘要，而非文字段落。請盡量在200字內回答完問題。"#####
question = "前期優勢對於勝負的影響大嗎？"#####
chat = [
    {"role": "system", "content": f"{sys}"},
    {"role": "user", "content": f"{question}"},
]
prompt = tokenizer.apply_chat_template(chat, tokenize=False)

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
# generate response
x = pipe(f"{prompt}", max_new_tokens=1024)
print(f"TAIDE: {x}")

TAIDE: [{'generated_text': '<s>[INST] <<SYS>>\n你是一個《英雄聯盟》的虛擬助理，能夠依據使用者提供的遊戲訊息提供策略建議和預測該場遊戲的勝敗。你的任務是根據用戶輸入的遊戲狀況給出遊戲的策略建議幫助使用者贏得遊戲。策略建議是根據當前的遊戲進程，提供戰術建議，例如何時應該進行團戰、推塔或是打大龍。而在使用者有要求的情況下也可以給出遊戲輸贏預測結果。請以清晰簡潔的方式提供你的建議，並解釋你作出此建議的原因。例如：當輸入「現在遊戲進行到25分鐘，我們推掉了對面兩座外塔，但對方控了兩條小龍，我們應該怎麼打？」時輸出「你們現在應該集中視野控制，確保大龍區域的安全。可以嘗試在對方紅Buff和中路之間的草叢設置視野，這樣可以提前預警對方的動向。你們可以組隊抓對方落單的英雄，然後利用人數優勢拿下大龍，這樣可以為後續的推塔和團戰奠定基礎。另外，在下一條小龍刷新前提前布置視野，爭取控制下一條小龍，防止對面拿到龍魂。」。有的時候使用者也可能輸入遊戲狀況的摘要，而非文字段落。請盡量在200字內回答完問題。\n<</SYS>>\n\n前期優勢對於勝負的影響大嗎？ [/INST] 在前期優勢對於勝負的影響上，可以從以下兩個方面來分析：\n\n1. 經濟優勢：在前期遊戲中，玩家可以利用金錢購買更強、更適合的英雄、裝備和技能，這會使他們在後期比賽中擁有更強的實力。此外，經濟優勢還能讓玩家在關鍵時刻（如使用大招、復活等）做出更明智的決定，從而影響比賽結果。\n2. 經驗優勢：在前期比賽中，玩家可以積累經驗值，這會使他們在後期比賽中變得更加強大。經驗值不僅能提高玩家的擊殺數、助攻數和死亡數等關鍵指標，還能讓玩家更快地反應、更準確地操作、更熟練地使用技能，從而在比賽中佔據優勢。\n然而，前期優勢並不能保證比賽勝利。以下是前期優勢可能無法保證勝利的一些原因：\n\n1. 被逆轉：即使在前期擁有優勢，如果被對手逆轉，例如在關鍵時刻被擊殺、被助攻、被擊飛等，都可能導致優勢被扭轉。\n2. 未充分利用優勢：如果玩家沒有在比賽中充分利用前期優勢，例如在關鍵時刻沒有使用大招、沒有在適當時機使用小龍等，就可能錯失贏取比賽的機會。\n3. 對手策略：對手的策略和戰術也是影響比賽的關鍵因素。如果對手在比賽中採取了不同的策略或利用了玩家的前期優勢，就可能扭轉比賽局面。\n4. 運