## Install Libraries

In [None]:
!pip install -U bitsandbytes
!pip install -U peft
!pip install -U trl
!pip install -U accelerate
!pip install -U datasets
!pip install -U transformers
!pip install -U wandb

Collecting bitsandbytes
  Downloading bitsandbytes-0.44.1-py3-none-manylinux_2_24_x86_64.whl.metadata (3.5 kB)
Downloading bitsandbytes-0.44.1-py3-none-manylinux_2_24_x86_64.whl (122.4 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m122.4/122.4 MB[0m [31m7.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: bitsandbytes
Successfully installed bitsandbytes-0.44.1
Collecting peft
  Downloading peft-0.13.0-py3-none-any.whl.metadata (13 kB)
Downloading peft-0.13.0-py3-none-any.whl (322 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m322.5/322.5 kB[0m [31m19.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: peft
Successfully installed peft-0.13.0
Collecting trl
  Downloading trl-0.11.1-py3-none-any.whl.metadata (12 kB)
Collecting datasets (from trl)
  Downloading datasets-3.0.1-py3-none-any.whl.metadata (20 kB)
Collecting tyro>=0.5.11 (from trl)
  Downloading tyro-0.8.11-py3-none-any.whl.metadata (8.4 kB)
Collecting

In [None]:
import torch
import pandas as pd
from datasets import Dataset, load_dataset
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig, pipeline, TrainingArguments
from peft import LoraConfig, PeftModel
from trl import SFTTrainer

## Data Load

In [None]:
design_data = pd.read_csv('/content/drive/MyDrive/Gemma/Data/Design/Design_data.csv')
design_data.head()

Unnamed: 0,성별,나이대,신입,질문,답변
0,여성,30대,경력,디자이너로서 앞으로의 목표에 관해서 설명해 주세요,저는 디자이너로서 어 많은 경험들을 쌓아서 그것들을 토대로 제 개인 브랜드를 런칭하...
1,여성,30대,경력,협업을 할 때 사교성이 좋은 편인지 궁금합니다 그리고 또 사교성을 키우기 위해 어떤...,저의 큰 단점이라고 할 수 있는데요. 저는 굉장히 성격이 내성적이고 처음 본 사람하...
2,여성,30대,경력,지원자님이 태어나서 지금까지 한 일들 가운데 가장 후회했던 일이 무엇인가요 한 가지...,어렸을 때 굉장히 친하게 지낸 친구가 있습니다. 어 제일 친하다고 생각했었고 모든 ...
3,여성,30대,경력,대학 생활을 보내면서 가장 힘들었던 경험은 무엇인가요 그것을 어떻게 극복하였는지 예...,저는 등록금을 마련하는 게 가장 힘들었습니다. 집에서 저의 대학 등록금을 마련해 줄...
4,여성,30대,경력,가장 자신있는 작업은 무엇일까요,저는 손으로 만드는 것은 다 자신 있습니다. 깊게 배우지 않아도 어 뭔가를 만드는 ...


In [None]:
design_data['답변'][0]

'저는 디자이너로서 어 많은 경험들을 쌓아서 그것들을 토대로 제 개인 브랜드를 런칭하는 게 목표입니다. 어 회사에서 생활을 하다 보면 저의 개인적인 개성이 많이 무시당한다고 느낀 적이 많았습니다. 그래서 배웠던 것들을 토대로 제 개성을 살릴 수 있는 디자인 브랜드를 내고 싶습니다. 그리고 그 브랜드를 엄청 욕심 있게 크게 키우는 것이 아니라 제 혼자서 감당할 수 있는 선까지 키울 수 있는 그런 미래를 생각하고 있습니다.'

In [None]:
design_data.shape

(6525, 5)

In [None]:
design_vdata = pd.read_csv('/content/drive/MyDrive/Gemma/Data/Design/Design_vdata.csv')
design_vdata.head()

Unnamed: 0,성별,나이대,신입,질문,답변
0,여성,50대,경력,매일 공부하고 있는 분야가 있나요,어 매일 공부하고 있는 분야가 있나요 라고 하셨는데요. 저는 어 공부하는 것이 있습...
1,여성,50대,경력,대학 생활 가장 힘들었던 경험은 무엇인가요,어 대학 생활 중에서 가장 힘들었던 경험은 무엇인가요 라고 하셨는데요. 저는 방송통...
2,여성,50대,경력,지금 제일 가고 싶은 회사는,지금 제일 가고 싶은 회사는 이라고 질문을 주셨는데요. 물론 제가 지금 일하고 있는...
3,여성,50대,경력,아 기존 회사를 그만둔 것 퇴사한 것에 대해서 현재 후회가 없으신지 궁금하네요 어 ...,퇴사한 것을 후회하지 않으시나요 라고 질문을 주셨는데 어 간혹 가다가 그만두기 전에...
4,여성,50대,경력,어 내가 직무를 수행함에 있어서 어떤 뭐 모르는 과제도 나올 수 있겠죠 그런 문제에...,직무 수행 시 모르는 과제에 대해서 해결하는 방법은 무엇입니까 라고 질문을 주셨는데...


In [None]:
design_vdata.shape

(813, 5)

In [None]:
print('Design 데이터의 훈련 데이터의 퍼센트: ', (design_data.shape[0] / (design_data.shape[0] + design_vdata.shape[0])) * 100 )

Design 데이터의 훈련 데이터의 퍼센트:  88.92068683565005


## Huggingface Login

In [None]:
from huggingface_hub import notebook_login
notebook_login()

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

## Modeling

In [None]:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig, GemmaTokenizer

model_id = "google/gemma-2-2b-it"

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

model = AutoModelForCausalLM.from_pretrained(
    model_id,
    quantization_config=bnb_config,
    device_map='auto',
)
tokenizer = AutoTokenizer.from_pretrained(model_id)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/838 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/24.2k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/4.99G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/241M [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/187 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/47.0k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/4.24M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.5M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/636 [00:00<?, ?B/s]

In [None]:
# CUDA 사용 가능 여부 확인
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

Using device: cuda


In [None]:
from peft import LoraConfig

lora_config = LoraConfig(
    r=8,
    target_modules=["q_proj", "o_proj", "k_proj", "v_proj", "gate_proj", "up_proj", "down_proj"],
    task_type="CAUSAL_LM",
)

In [None]:
design_dataset = Dataset.from_pandas(design_data)
design_dataset

Dataset({
    features: ['성별', '나이대', '신입', '질문', '답변'],
    num_rows: 6525
})

In [None]:
import wandb

wandb.login()

[34m[1mwandb[0m: Using wandb-core as the SDK backend. Please refer to https://wandb.me/wandb-core for more information.


<IPython.core.display.Javascript object>

[34m[1mwandb[0m: Logging into wandb.ai. (Learn how to deploy a W&B server locally: https://wandb.me/wandb-server)
[34m[1mwandb[0m: You can find your API key in your browser here: https://wandb.ai/authorize
wandb: Paste an API key from your profile and hit enter, or press ctrl+c to quit:

 ··········


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


True

In [None]:
run = wandb.init(
    project='Fine tuning gemma2 Design',
    job_type="training",
    anonymous="allow"
)

VBox(children=(Label(value='0.022 MB of 0.022 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
train/epoch,▁▅█
train/global_step,▁▅█
train/grad_norm,▁█▇
train/learning_rate,▁▄█
train/loss,▁█▃

0,1
train/epoch,0.00368
train/global_step,3.0
train/grad_norm,0.78366
train/learning_rate,1e-05
train/loss,2.7443


In [None]:
new_model = "/content/drive/MyDrive/Gemma/results/Fine tuning gemma Design"

In [None]:
import transformers
from trl import SFTTrainer,DataCollatorForCompletionOnlyLM

def formatting_func(example): # example을 받아서 text로 변환
    output_texts =[]
    for i in range(len(example['질문'])):
        text = f"### {example['나이대'][i]}의 {example['신입'][i]}의 {example['성별'][i]}에게 질문: {example['질문'][i]} \n ### 답변: {example['답변'][i]}"
        output_texts.append(text)
    return output_texts

response_template = " ### 답변:"
collator = DataCollatorForCompletionOnlyLM(response_template, tokenizer=tokenizer)

training_arguments=transformers.TrainingArguments(
        output_dir=new_model,
        per_device_train_batch_size=1,
        optim="paged_adamw_32bit",
        gradient_accumulation_steps= 8,
        num_train_epochs=2,
        logging_steps=1,
        warmup_steps=10,
        logging_strategy="steps",
        learning_rate=2e-5,
        fp16=False,
        bf16=False,
        group_by_length=True,
        report_to="wandb"
    )

trainer = SFTTrainer(  # Supervised Fine-tuning Trainer
    model=model,
    train_dataset=design_dataset,
    args=training_arguments,
    peft_config=lora_config,
    formatting_func=formatting_func,
    data_collator=collator,
)
trainer.train()



Map:   0%|          | 0/6525 [00:00<?, ? examples/s]



Step,Training Loss
1,2.7293
2,2.787
3,2.7444
4,2.6489
5,2.6113
6,2.5079
7,2.7313
8,2.6817
9,2.7403
10,2.4724


Step,Training Loss
1,2.7293
2,2.787
3,2.7444
4,2.6489
5,2.6113
6,2.5079
7,2.7313
8,2.6817
9,2.7403
10,2.4724


TrainOutput(global_step=1630, training_loss=2.150778710915267, metrics={'train_runtime': 19512.2371, 'train_samples_per_second': 0.669, 'train_steps_per_second': 0.084, 'total_flos': 5.320926935011584e+16, 'train_loss': 2.150778710915267, 'epoch': 1.9984674329501915})

In [None]:
wandb.finish()

VBox(children=(Label(value='0.011 MB of 0.011 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
train/epoch,▁▁▁▁▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▅▅▅▆▆▆▆▆▇▇████
train/global_step,▁▁▁▁▁▁▂▂▂▃▃▃▃▃▃▄▄▄▅▅▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
train/grad_norm,▂▂▂▂▁▂▃▄▄▄▃▃▄▄▄▄▄▅▄▅▅▄▆▄▄▆▅▅▆▇▅▆▇▅▅▇▇█▅▅
train/learning_rate,████▇▇▇▇▇▆▆▆▆▅▅▅▅▅▅▅▄▄▄▄▄▃▃▃▃▃▂▂▂▂▂▂▂▂▂▁
train/loss,█▆▆▆▅▅▄▆▅▃▇▅▆▆▅▄▃▅▅▅▅▂▅▅▃▅▁▃▃▆▅▄▄▂▃▄▄▅▅▄

0,1
total_flos,5.320926935011584e+16
train/epoch,1.99847
train/global_step,1630.0
train/grad_norm,2.18915
train/learning_rate,0.0
train/loss,1.9594
train_loss,2.15078
train_runtime,19512.2371
train_samples_per_second,0.669
train_steps_per_second,0.084


In [None]:
model.config.use_cache = True

In [None]:
trainer.model.save_pretrained(new_model)
trainer.tokenizer.save_pretrained(new_model)

('/content/drive/MyDrive/Gemma/results/Fine tuning gemma Design/tokenizer_config.json',
 '/content/drive/MyDrive/Gemma/results/Fine tuning gemma Design/special_tokens_map.json',
 '/content/drive/MyDrive/Gemma/results/Fine tuning gemma Design/tokenizer.model',
 '/content/drive/MyDrive/Gemma/results/Fine tuning gemma Design/added_tokens.json',
 '/content/drive/MyDrive/Gemma/results/Fine tuning gemma Design/tokenizer.json')

In [None]:
MODEL_SAVE_HUB_PATH = f'jsmount/Fine-tuning-gemma-Design'
HUGGINGFACE_AUTH_TOKEN = 'my_token'
trainer.model.push_to_hub(
			MODEL_SAVE_HUB_PATH,
			use_temp_dir=True,
			use_auth_token=HUGGINGFACE_AUTH_TOKEN
)
trainer.tokenizer.push_to_hub(
			MODEL_SAVE_HUB_PATH,
			use_temp_dir=True,
			use_auth_token=HUGGINGFACE_AUTH_TOKEN
)

adapter_model.safetensors:   0%|          | 0.00/41.6M [00:00<?, ?B/s]

README.md:   0%|          | 0.00/5.17k [00:00<?, ?B/s]

Upload 2 LFS files:   0%|          | 0/2 [00:00<?, ?it/s]

tokenizer.json:   0%|          | 0.00/34.4M [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/4.24M [00:00<?, ?B/s]

CommitInfo(commit_url='https://huggingface.co/jsmount/Fine-tuning-gemma-Design/commit/ff7fdba7c554846f30acd0da1c1cead18c424adc', commit_message='Upload tokenizer', commit_description='', oid='ff7fdba7c554846f30acd0da1c1cead18c424adc', pr_url=None, pr_revision=None, pr_num=None)