# <font color='orange'><b>LORA를 활용한 LLM fine-tuning with Ko-Platypus🥮</b></font>


[Ko-platypus](https://github.com/Marker-Inc-Korea/KO-Platypus)  

-------
## 1. Colab 환경설정👨‍💻
- Colab Pro
- GPU A100 활용


## 2. Ko-SarcasmLLM-FT 실습내용📖
> 이번 실습코드에서 다뤄질 내용들은 다음과 같이 6개로 구성되어 있습니다!  
  
- Code 환경설정
- Hyperparameters in LLM
- <font color='orange'><b>LoRA🔥</b></font>
- Instruction input-output dataset
- <font color='orange'><b>LLM fine-tuning🤗</b></font> (with ko-openorca dataset🐳)
- <font color='yellow'><b>⭐Model Upload⭐</b></font>

  
## 3. 실습에 이용되는 데이터셋과 모델📖
- ✅데이터: [KoCoSa](https://huggingface.co/datasets/YuminKim/KoCoSa)  
- ✅모델: [llama-3.2-Korean-Bllossom-3B](https://huggingface.co/Bllossom/llama-3.2-Korean-Bllossom-3B)    
  
   
## 4. 참고자료
- ⭐[Platypus](https://github.com/arielnlee/Platypus)  
- ⭐[garage-bAInd/Open-Platypus](https://huggingface.co/datasets/garage-bAInd/Open-Platypus)  
- ⭐[KO-Platypus2-7B-ex🥮](https://huggingface.co/kyujinpy/KO-Platypus2-7B-ex)
- [HuggingFace](https://huggingface.co/)  
- [KO-LLM LeaderBoard](https://huggingface.co/spaces/upstage/open-ko-llm-leaderboard)  
- [EN-LLM LeaderBoard](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)


--------
# 👨‍💻 HuggingFace 로그인
> 본격적인 시작에 앞서서 Huggingface에 회원가입을 진행해볼까요?

1. 아래의 링크로 접속하여 회원가입을 진행합니다.
  - 🤗https://huggingface.co/

2. 자신의 Access token을 생성합니다.
  - ✅(메인 화면) 우측 상단의 자신의 프로필을 클릭한 후, `setting`을 누른다.
  - ✅(프로필 화면) 왼쪽 카테고리에서 `Access Token`을 누른다.
  - ✅오른쪽에서 `New token` 눌러서 `Role: read`로 설정한 후 자신의 token을 생성한다.
  - ✅다시 한번, `New token` 눌러서 `Role: write`로 설정한 후 자신의 token을 생성한다.

3. 코드에서 Huggingface login 진행을 합니다.
  - ⭐`Role: read`로 생성된 token을 복사 한 후, 아래의 `[...read_token...]` 부분에 붙여넣는다.
```python
!huggingface-cli login --token [...read_token...]
```

In [None]:
###########################################
# 0. Huggingface login

# READ token
!huggingface-cli login --token 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 # your code

The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: read).
The token `UpStage` has been saved to /root/.cache/huggingface/stored_tokens
Your token has been saved to /root/.cache/huggingface/token
Login successful.
The current active token is: `UpStage`


--------
# 😎 Colab 환경설정
> 본격적인 시작에 앞서서 colab의 환경설정을 진행해볼까요?

🔎 LLM을 훈련시키기 위해서 아래의 모듈을 필수적으로 설치해야합니다!
- 🤗transformers: LLM fine-tuning 및 전반적인 기능
- 🤗bitsandbytes: bit 단위로 모델을 불러올 수 있는 기능
- 🤗accelerate: GPU 가속
- 🔥loralib: LoRA 세팅
- 🤗datasets: 데이터셋 활용
- 💎peft: Parameter Efficient Fine Tuning 적용


In [None]:
###########################################
# 1-1. 구글 드라이브 마운트

from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
###########################################
# 1-2. 프로젝트 폴더 만들기

import os
os.makedirs('/content/drive/MyDrive/Sarcasm-LLM', exist_ok=True)

In [None]:

%cd /content/drive/MyDrive/Sarcasm-LLM

/content/drive/MyDrive/Sarcasm-LLM


In [None]:
##########################################
# 1-3. 모듈 다운

!pip install bitsandbytes
!pip install accelerate
!pip install appdirs
!pip install loralib
!pip install black black[jupyter]
!pip install datasets
!pip install fire
!pip install git+https://github.com/huggingface/peft
!pip install transformers
!pip install sentencepiece sentence_transformers
!pip install scipy numpy scikit-learn pandas

Collecting git+https://github.com/huggingface/peft
  Cloning https://github.com/huggingface/peft to /tmp/pip-req-build-734u65cx
  Running command git clone --filter=blob:none --quiet https://github.com/huggingface/peft /tmp/pip-req-build-734u65cx
  Resolved https://github.com/huggingface/peft to commit cf75e4aed19ae5379c5aa8ed47d54f79d011eec0
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone


In [None]:
###########################################
# 1-4. 설치된 모듈 리스트 확인하기
!pip check
!pip list


gcsfs 2025.3.2 has requirement fsspec==2025.3.2, but you have fsspec 2025.3.0.
Package                               Version
------------------------------------- ------------------
absl-py                               1.4.0
accelerate                            1.6.0
aiohappyeyeballs                      2.6.1
aiohttp                               3.11.15
aiosignal                             1.3.2
alabaster                             1.0.0
albucore                              0.0.23
albumentations                        2.0.5
ale-py                                0.10.2
altair                                5.5.0
annotated-types                       0.7.0
anyio                                 4.9.0
appdirs                               1.4.4
argon2-cffi                           23.1.0
argon2-cffi-bindings                  21.2.0
array_record                          0.7.1
arviz                                 0.21.0
astropy                               7.0.1
astropy-iers-data  

--------
# 😎 모듈 불러오기


In [None]:
###########################################
# 2-1. 모듈 불러오기

import os
import os.path as osp
import sys
import fire
import json
from typing import List, Union

import torch
from torch.nn import functional as F

import transformers
from transformers import TrainerCallback, TrainingArguments, TrainerState, TrainerControl
from transformers.trainer_utils import PREFIX_CHECKPOINT_DIR
from transformers import LlamaForCausalLM, LlamaTokenizer
from transformers import AutoModelForCausalLM, AutoTokenizer

from datasets import load_dataset

from peft import (
    LoraConfig,
    get_peft_model,
    prepare_model_for_kbit_training, #prepare_model_for_int8_training
    set_peft_model_state_dict
)

from peft import PeftModel

--------
# 🤗 Base Model (LLM)
- 우리가 해당 실습코드에서 이용할 base LLM 모델 아래와 같습니다!
  - ✅모델: [upstage/SOLAR-10.7B-v1.0](https://huggingface.co/upstage/SOLAR-10.7B-v1.0)    

## ✔️ Model Access 확인
> ✅모델을 이용하기 전에 access가 있는지 꼭 확인하세요!  

<img src = "https://drive.google.com/uc?id=1oACzT9OwEAundjhEOBdFI7-nV99OrIm8">  
- 위의 사진과 같은 <font color='#6069B9'><b>**✔️access**</b></font> 버튼이 있다면 꼭 눌러서 승인을 해야합니다!
- 예를 들어 meta-llama의 모델을 경우, 승인을 받아야 이용이 가능하다는 점도 참고해주세요!  
  - 🤗해당 모델이 아닌 다른 모델을 base LLM으로 활용하셔도 됩니다!
  
#### 😲 Error Note
> Colab에서 모델을 다운 받다가 아래와 같은 에러를 만났다면 한번 다음과 같이 해결해보세요!
  
```python
ImportError: Using `load_in_8bit=True` requires Accelerate: `pip install
accelerate` and the latest version of bitsandbytes `pip install -i https://
test.pypi.org/simple/ bitsandbytes` or pip install bitsandbytes`  
```
- **✅Colab의 런타임 유형이 A100인지 확인.**

In [None]:
#@title 🤗 Base model 선택하기
device = 'auto' #@param {type: "string"}
base_LLM_model = 'Bllossom/llama-3.2-Korean-Bllossom-3B' #@param {type: "string"}

In [None]:
###########################################
# 3-1. 모델 다운로드 (~30분)

model = AutoModelForCausalLM.from_pretrained(
    base_LLM_model,
    load_in_8bit=True, # LoRA
    #load_in_4bit=True, # Quantization Load
    torch_dtype=torch.float16,
    device_map=device)

tokenizer = AutoTokenizer.from_pretrained(base_LLM_model)

The `load_in_4bit` and `load_in_8bit` arguments are deprecated and will be removed in the future versions. Please, pass a `BitsAndBytesConfig` object in `quantization_config` argument instead.


Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

In [None]:
###########################################
# 3-2. BOS, EOS, PAD 토큰 확인

# Check special token
bos = tokenizer.bos_token_id # 문장 시작 토큰
eos = tokenizer.eos_token_id # 문장 끝 토큰
pad = tokenizer.pad_token_id # 문장 패딩 토큰 -> 문장 끝나고 매꿔주는 패딩 부분
tokenizer.padding_side = "right" # 패딩 오른쪽

print("BOS token:", bos) # 1
print("EOS token:", eos) # 2
print("PAD token:", pad) # None

BOS token: 128000
EOS token: 128009
PAD token: None


In [None]:
if (pad == None) or (pad == eos):
    tokenizer.pad_token_id = 0  # 만약 패딩값이 없거나 eos값과 같다면,
print("length of tokenizer:",len(tokenizer)) # 32000

length of tokenizer: 128256


In [None]:

print(model)
print(type(model)) # 모델의 타입 확인

LlamaForCausalLM(
  (model): LlamaModel(
    (embed_tokens): Embedding(128256, 3072)
    (layers): ModuleList(
      (0-27): 28 x LlamaDecoderLayer(
        (self_attn): LlamaAttention(
          (q_proj): Linear8bitLt(in_features=3072, out_features=3072, bias=False)
          (k_proj): Linear8bitLt(in_features=3072, out_features=1024, bias=False)
          (v_proj): Linear8bitLt(in_features=3072, out_features=1024, bias=False)
          (o_proj): Linear8bitLt(in_features=3072, out_features=3072, bias=False)
        )
        (mlp): LlamaMLP(
          (gate_proj): Linear8bitLt(in_features=3072, out_features=8192, bias=False)
          (up_proj): Linear8bitLt(in_features=3072, out_features=8192, bias=False)
          (down_proj): Linear8bitLt(in_features=8192, out_features=3072, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): LlamaRMSNorm((3072,), eps=1e-05)
        (post_attention_layernorm): LlamaRMSNorm((3072,), eps=1e-05)
      )
    )
    (norm): LlamaR

--------
# 💡Hyperparameters setting
> 🔎 LLM fine-tuning에서 중요한 <font color='green'><b>hyperpamaeter</b></font>에 대해서 살펴볼까요?

1. **📖cutoff_len**
> 모델에 들어갈 **sequence의 최대 길이를 설정**하는 parameter 입니다!

> base model의 max length(token)확인해야함

2. **📖warmup_steps**
> warmup_steps은 천천히 learning rate를 올려서, 학습의 불안정성을 방지해줄 수 있습니다!
  
  - **Example)** learning rate (LR)을 1e-2로 설정했다면, LR을 처음에 초깃값보다 낮게 시작하여 100 step에 걸쳐서 LR를 1e-2로 올린다.
  
3. **📖Optimizer**
> 최근에는 Adam보다 AdamW를 더 많이 이용하고 있어요!  
> AdamW는 Adam에 비해서 더 <font color='#ea7a7a'><b>general</b></font>하게 성능을 만들어주는 장점이 있습니다!
  
  - Adam vs <font color='#ea7a7a'><b>**AdamW**</b></font>

4. **📖lr_scheduler**
> lr_scheduler는 learning rate를 훈련하는 동안 조절해주는 옵션이예요!  
> 아래의 목록에 있는 총 3가지 함수 옵션이 가장 대표적으로 사용됩니다!
  
  - constant
  - linear
  - <font color='#ea7a7a'><b>consine</b></font>

5. **📖Others**
> 😊그 외에 중요한 hyperparameter 옵션들을 모아서 정리해봤어요!

  - **⭐Learning rate**
  - Batch size
  - weight_decay
  - max grad norm: gradient vector 크기 조절 (gradient clipping)

## 👨‍💻 LoRA hyperparameters
> 🔎 PEFT의 대표적인 방법론인 <font color='orange'><b>LoRA🔥</b></font>의 <font color='green'><b>hyperpamaeter</b></font>에 대해서 살펴봅시다!

<img src = "https://drive.google.com/uc?id=1ZoFUOPAyfWx80qk9Oa6b8oY0h1bJRoE0" width=512>

  -  <font color='orange'><b>**Lora_r**</b></font>: LoRA adapter의 차원을 결정하는 파라미터
  - Lora_alpha: LoRA adapter의 scaling 값을 결정하는 파라미터
  - Lora_dropout: LoRA adapter의 dropout 파라미터
  -  <font color='orange'><b>**Lora_target_modules**</b></font>: LoRA adapter를 적용할 layers
  ```
Lora_target_modules 종류:
["embed_tokens", "lm_head", "q_proj", "k_proj", "v_proj", "o_proj", ...] # in llama2
  ```
> 🔎 LoRA가 어떻게 적용되는지 코드로 살펴볼까요?
  
  ```python
class Linear(nn.Linear, LoRALayer):
  # LoRA implemented in a dense layer
  def __init__(
          self,
          in_features: int,
          out_features: int,
          r: int = 0,
          lora_alpha: int = 1,
          lora_dropout: float = 0.,
          fan_in_fan_out: bool = False, # Set this to True if the layer to replace stores weight like (fan_in, fan_out)
          merge_weights: bool = True,
          **kwargs
      ):
          nn.Linear.__init__(self, in_features, out_features, **kwargs)
          LoRALayer.__init__(self, r=r, lora_alpha=lora_alpha, lora_dropout=lora_dropout,
                              merge_weights=merge_weights)
          self.fan_in_fan_out = fan_in_fan_out
          # 실제 훈련할 파라미터
          if r > 0:
              self.lora_A = nn.Parameter(self.weight.new_zeros((r, in_features)))
              self.lora_B = nn.Parameter(self.weight.new_zeros((out_features, r)))
              self.scaling = self.lora_alpha / self.r
              # Freezing the pre-trained weight matrix
              self.weight.requires_grad = False
          self.reset_parameters()
          if fan_in_fan_out:
            self.weight.data = self.weight.data.transpose(0, 1)
  ```

In [None]:
###########################################
# 5-1. 하이퍼 파라미터

# 데이터셋과 훈련 횟수와 관련된 하이퍼 파라미터
batch_size = 32
num_epochs = 1
micro_batch = 1 #GPU가 2대 이상일 때 활용하면 좋다..?
gradient_accumulation_steps = batch_size // micro_batch #GPU가 2대 이상일 때 활용하면 좋다..?

# 훈련 방법에 대한 하이퍼 파라미터
cutoff_len = 1024 # solar 7B max token
lr_scheduler = 'cosine'
warmup_ratio = 0.06 # warmup_steps = 100
learning_rate = 9.5e-4# 4e-4
optimizer = 'adamw_torch'
weight_decay = 0.01
max_grad_norm = 1.0 # Default값, 모델이 과적합되거나 잘못 된거 같으면 좀 줄여주면 좋음

# LoRA config
lora_r = 16
lora_alpha = 16
lora_dropout = 0.1 # 0.05 기호에 따라..
lora_target_modules = ["gate_proj", "down_proj", "up_proj"]

# Tokenizer에서 나오는 input값 설정 옵션
train_on_inputs = False
add_eos_token = False # 데이터 셋에 관한 부분

# Others
resume_from_checkpoint = './sarcasm_LLM/checkpoint-001' # !! 만약 모델을 이어서 훈련하고 싶다면, './custom_LLM/checkpoint-[xxx]'와 같이 파일 경로를 입력해야 합니다!
# 모델 돌다가 다운되는거 방지
output_dir = './custom_LLM'

--------
# 🤗 Dataset Loading and formatting
> 👨‍💻 LLM fine-tuning을 위한 데이터셋을 불러오고 <font color='green'><b>instruction input-output</b></font>형태로 만들어 봅시다!

- 우리가 해당 실습코드에서 이용할 데이터셋은 아래와 같습니다!
  - ✅데이터: [KoCoSa](https://huggingface.co/datasets/YuminKim/KoCoSa)    

In [None]:
#@title 🤗 Choose Dataset
dataset = 'YuminKim/KoCoSa' #@param {type: "string"}

#kyujinpy/Open-platypus-Commercial

In [None]:
###########################################
# 5-1. 데이터셋 다운로드

data = load_dataset(dataset)
print(data['train']) # 개수: 19079

Repo card metadata block was not found. Setting CardData to empty.


Dataset({
    features: ['context', 'response', 'label', 'sarcasm_explanation'],
    num_rows: 10466
})


In [None]:
print(data['validation'])
print(data['test'])

Dataset({
    features: ['context', 'response', 'label', 'sarcasm_explanation'],
    num_rows: 1321
})
Dataset({
    features: ['context', 'response', 'label', 'sarcasm_explanation'],
    num_rows: 1037
})


## 🤗 Instruction input-output template
> 우리가 활용한 데이터는 아래와 같은 형식을 갖고 있습니다!
   
- ✅Input이 있는 example:  
  
```
Input:
당신은 사람들이 정보를 찾을 수 있도록 도와주는 인공지능 비서입니다.
사용자가 질문을 합니다. 당신의 임무는 가능한 한 충실하게 대답하는 것입니다.
답변하는 동안 단계별로 생각하고 답변을 정당화하세요.  
  
Instruction:
질문입니다: 시속 60km의 속도로 달리는 기차가 9초 만에 기둥을 통과합니다. 기차의 길이는 얼마입니까?
옵션: (A) 287 (B) 699 (C) 677 (D) 168 (E) 150 먼저 생각해 봅시다. 무작위로 추론해 봅시다:
  
Output:
기차의 길이를 구하려면 기차가 기둥을 통과하는 동안 이동하는 거리를 결정해야 합니다.
1단계: 기차의 속도를 초당 미터로 변환합니다. 1km = 1000미터, 1시간 = 3600초, 따라서 60km/hr = (60 * 1000) / 3600 = 16.67m/s(대략).
2단계: 기차가 9초 동안 이동한 거리를 계산합니다. 거리 = 속도 × 시간 거리 = 16.67m/s * 9초 = 150미터.
3단계: 계산된 거리를 주어진 옵션과 비교합니다.
계산된 거리(150미터)에 가장 가까운 옵션은 옵션 (E) 150입니다.
따라서 열차의 길이는 약 150미터입니다.
```

  
- ✅Input이 없는 example:

```
Instruction:
질문이 주어집니다: 다음 기사에 대한 객관식 문제를 작성하세요: 기사: 겨울은 무슨 일이 일어날지 알기 어렵고 사고가 너무 쉽게 일어나기 때문에 위험합니다.
안개가 언덕 꼭대기에서 여러분을 기다리고 있을 수 있습니다. 녹는 눈 밑에 얼음이 숨어 있다가 운전자를 도로 밖으로 내보내려고 기다리고 있을 수도 있습니다.
마주 오는 차가 갑자기 도로를 가로질러 미끄러질 수도 있습니다. 빙판길 운전의 첫 번째 규칙은 부드럽게 운전하는 것입니다.
갑작스러운 움직임은 자동차를 제어하기 매우 어렵게 만들 수 있습니다. 따라서 차를 출발하거나 정지할 때마다, 속도를 높이거나 낮출 때마다 가능한 한 부드럽고 천천히 운전해야 합니다.
옆 좌석에 뜨거운 커피 한 잔을 가득 들고 운전한다고 가정해 보겠습니다. 커피를 엎지르지 않도록 운전하세요.
두 번째 규칙은 무슨 일이 일어날지 주의를 기울이는 것입니다. 얼음이 많을수록 도로 아래쪽을 더 잘 살펴야 합니다.
차를 부드럽게 정지하는 데 걸리는 시간을 테스트하세요. 생각보다 더 빨리 운전할 수 있다는 점을 기억하세요.
일반적으로 도로가 젖어 있을 때는 평소 정지 거리의 두 배, 눈이 쌓여 있을 때는 이 거리의 세 배, 빙판길에서는 그보다 더 많은 거리를 확보하세요.
항상 차량을 통제하려고 노력하면 문제가 발생하지 않습니다. 정답은

Output:
빙판길 운전 시 가장 중요한 규칙은 무엇인가요?
A) 위험 지역을 더 빨리 통과하기 위해 속도를 높입니다.
B) 잠재적 위험을 피하기 위한 갑작스러운 움직임
C) 부드럽고 부드럽게 운전하세요
D) 바로 앞 도로에만 집중하기
```

> 🔎 Alpaca template를 활용하여서 우리가 이용하고자 하는 데이터셋을 instruction input-output 형식으로 재정의해볼까요?
- [Alpaca github](https://github.com/tatsu-lab/stanford_alpaca)   

   
#### ✅한국어 버전 template
```
{
    "prompt_input": "아래는 작업을 설명하는 지침과 추가 입력을 제공하는 입력이 짝을 이루는 예제입니다. 요청을 적절히 완료하는 답변을 작성해주세요.\n\n### 지침:\n{instruction}\n\n### 입력:\n{input}\n\n### 답변:\n",
    "prompt_no_input" : "아래는 작업을 설명하는 지침입니다. 요청을 적절히 완료하는 답변을 작성해주세요.\n\n### 지침:\n{instruction}\n\n### 답변:\n",
    "response_split": "### 답변:"
}
```

In [None]:
template = {
    "prompt_sarcasm_explanation": (
        "아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. "
        "풍자를 판별하고 이를 설명하는 답변을 작성해주세요.\n\n"
        "### 상황:\n{context}\n\n"
        "### 발화:\n{response}\n\n"
        "### 답변:\n"
    ),
    "prompt_no_sarcasm_explanation": (
        "아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. "
        "풍자를 판별하는 답변만 작성해주세요.\n\n"
        "### 발화:\n{response}\n\n"
        "### 답변:\n"
    ),
    "response_split": "### 답변:"
}

In [None]:
from typing import Optional

# 새 sarcasm 프롬프트 템플릿
template = {
    "prompt_sarcasm_explanation": (
        "아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. "
        "풍자를 판별하고 이를 설명하는 답변을 작성해주세요.\n\n"
        "### 상황:\n{context}\n\n"
        "### 발화:\n{response}\n\n"
        "### 답변:\n"
    ),
    "prompt_no_sarcasm_explanation": (
        "아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. "
        "풍자를 판별하는 답변만 작성해주세요.\n\n"
        "### 발화:\n{response}\n\n"
        "### 답변:\n"
    ),
    "response_split": "### 답변:"
}

class Prompter(object):
    """
    context, response 를 입력으로 받고,
    optional label 과 optional explanation 을 target 출력으로 묶어
    prompt 를 생성합니다.
    """
    def __init__(self, verbose: bool = False):
        self.template = template
        self.verbose = verbose

    def generate_prompt(
        self,
        context: str,
        response: str,
        label: Optional[str] = None,
        explanation: Optional[str] = None
    ) -> str:
        # explanation 이 있으면 분류+설명 템플릿 사용
        if explanation is not None:
            prompt = self.template["prompt_sarcasm_explanation"].format(
                context=context,
                response=response
            )
            if label:
                prompt += label
            prompt += f"\n{explanation}"
        # explanation 이 없으면 분류만 템플릿 사용
        else:
            prompt = self.template["prompt_no_sarcasm_explanation"].format(
                response=response
            )
            if label:
                prompt += label

        if self.verbose:
            print("Generated prompt:\n", prompt)
        return prompt

    def get_response(self, output: str) -> str:
        """
        모델 출력에서 '### 답변:' 뒤에 나오는 실제 답변만 추출합니다.
        """
        parts = output.split(self.template["response_split"])
        return parts[-1].strip() if len(parts) > 1 else output.strip()

# 사용 예시
prompter = Prompter(verbose=True)

# 1) label만 있을 때
p1 = prompter.generate_prompt(
    context="A: ... 영화 보셨나요?",
    response="B: 어, 인셉션은 꿈 이야기가 아니구요.",
    label="Non-Sarcasm"
)

# 2) label + explanation 있을 때
p2 = prompter.generate_prompt(
    context="A: ... 연애 경험 어때요?",
    response="B: 저한테도 소개팅은 첨이었어요.",
    label="Sarcasm",
    explanation="B는 소개팅 경험이 없다는 당연한 사실을 과장해 풍자로 표현했습니다."
)

print(p1)
print("—" * 40)
print(p2)

Generated prompt:
 아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하는 답변만 작성해주세요.

### 발화:
B: 어, 인셉션은 꿈 이야기가 아니구요.

### 답변:
Non-Sarcasm
Generated prompt:
 아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하고 이를 설명하는 답변을 작성해주세요.

### 상황:
A: ... 연애 경험 어때요?

### 발화:
B: 저한테도 소개팅은 첨이었어요.

### 답변:
Sarcasm
B는 소개팅 경험이 없다는 당연한 사실을 과장해 풍자로 표현했습니다.
아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하는 답변만 작성해주세요.

### 발화:
B: 어, 인셉션은 꿈 이야기가 아니구요.

### 답변:
Non-Sarcasm
————————————————————————————————————————
아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하고 이를 설명하는 답변을 작성해주세요.

### 상황:
A: ... 연애 경험 어때요?

### 발화:
B: 저한테도 소개팅은 첨이었어요.

### 답변:
Sarcasm
B는 소개팅 경험이 없다는 당연한 사실을 과장해 풍자로 표현했습니다.


In [None]:
###########################################
# 5-4. Token generation 함수

def tokenize(prompt, add_eos_token=True):
    result = tokenizer(
        prompt,
        truncation=True,
        max_length=cutoff_len,
        padding=False,
        return_tensors=None,
    )

    if (
        result["input_ids"][-1] != tokenizer.eos_token_id
        and len(result["input_ids"]) < cutoff_len
        and add_eos_token
    ):

        result["input_ids"].append(tokenizer.eos_token_id)
        result["attention_mask"].append(1)

    result["labels"] = result["input_ids"].copy()

    return result

def generate_and_tokenize_prompt(data_point):
    full_prompt = prompter.generate_prompt(
        data_point["instruction"],
        data_point["input"],
        data_point["output"])

    tokenized_full_prompt = tokenize(full_prompt)
    if not train_on_inputs:

        user_prompt = prompter.generate_prompt(
            data_point["instruction"], data_point["input"])

        tokenized_user_prompt = tokenize(
            user_prompt, add_eos_token=add_eos_token)

        user_prompt_len = len(tokenized_user_prompt["input_ids"])

        if add_eos_token:
            user_prompt_len -= 1

        tokenized_full_prompt["labels"] = [
            -100
        ] * user_prompt_len + tokenized_full_prompt["labels"][
            user_prompt_len:
        ]
    return tokenized_full_prompt

In [None]:
def tokenize(prompt: str, add_eos_token: bool = True):
    # (기존 토크나이저 그대로)
    result = tokenizer(
        prompt,
        truncation=True,
        max_length=cutoff_len,
        padding=False,
        return_tensors=None,
    )
    if (
        add_eos_token
        and result["input_ids"][-1] != tokenizer.eos_token_id
        and len(result["input_ids"]) < cutoff_len
    ):
        result["input_ids"].append(tokenizer.eos_token_id)
        result["attention_mask"].append(1)
    # labels 복사
    result["labels"] = result["input_ids"].copy()
    return result

def generate_and_tokenize_prompt(example, add_eos_token: bool = True):
    """
    example: {
      'context': str,
      'response': str,
      'label': 'Sarcasm' or 'Non-Sarcasm',
      'sarcasm_explanation': Optional[str]
    }
    """
    # 1) full prompt 생성
    full_prompt = prompter.generate_prompt(
        context=example["context"],
        response=example["response"],
        label=example.get("label"),
        explanation=example.get("sarcasm_explanation")
    )
    tokenized_full = tokenize(full_prompt, add_eos_token=add_eos_token)

    # 2) train_on_inputs=False 인 경우, 입력(prompt) 부분만 마스킹
    if not train_on_inputs:
        # prompt-only (label/explanation 없이) 길이를 알아냄
        prompt_only = prompter.generate_prompt(
            context=example["context"],
            response=example["response"]
        )
        tokenized_prompt = tokenize(prompt_only, add_eos_token=add_eos_token)
        prompt_len = len(tokenized_prompt["input_ids"])
        # EOS 토큰을 별도 마스킹했다면 길이에서 -1
        if add_eos_token:
            prompt_len -= 1
        # labels 의 앞 prompt_len 부분을 -100 으로
        tokenized_full["labels"] = ([-100] * prompt_len
                                    + tokenized_full["labels"][prompt_len:])

    return tokenized_full

In [None]:
###########################################
# 5-5. 훈련 셋 만들기 (~3분)

val_data = None
train_data = data["train"].shuffle() # random
train_data = train_data.map(generate_and_tokenize_prompt)

Map:   0%|          | 0/10466 [00:00<?, ? examples/s]

[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
B: 너 오늘 보디 락스 미팅 가야 돼?
A: 응, 근데 스폰서가 준 물 양이 줄었어.
B: 진짜? 어제는 얼마나 줬어?
A: 어제는 10박스 줬는데, 오늘은 8박스만 줬어.

### 발화:
B: 아니, 무려 8박스나 준다고? 너무나도 가난한 우리에게.

### 답변:
Sarcasm
물의 양이 감소했지만, 그럼에도 불구하고 여전히 많은 양을 받았다는 사실을 과장하여 비꼬아 말한다.
Generated prompt:
 아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하는 답변만 작성해주세요.

### 발화:
B: 아니, 무려 8박스나 준다고? 너무나도 가난한 우리에게.

### 답변:

Generated prompt:
 아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하고 이를 설명하는 답변을 작성해주세요.

### 상황:
B: 우리 초등학교 때 컴퓨터실에서 무서운 게임을 했던 기억이 있나요?
A: 그게 어떤 게임이었죠? 잘 기억이 안 나네요.
B: 맞아요. 그때 함께 했던 친구들도 모두 잊었을 겁니다. 그러나 그 경험은 우리에게 정말 중요한 추억이었어요.
A: 아마도 저는 그때 너무 무서워서 잊어버린 것 같아요.

### 발화:
B: 아, 그래서 기억력이 저렇게 좋은 거군요.

### 답변:
Sarcasm
상대방이 그때의 무서움 때문에 기억을 잃었다고 했을 때, 실제로는 그것이 가능하지 않지만 가능하다고 비꼬아 말한다.
Generated prompt:
 아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하는 답변만 작성해주세요.

### 발화:
B: 아, 그래서 기억력이 저렇게 좋은 거군요.

### 답변:

Generated

In [None]:
train_data = data["train"].shuffle(seed=42)

# train, validation, test 에 매핑
train_data = train_data.map(
    generate_and_tokenize_prompt,
    remove_columns=data["train"].column_names,
    batched=False
)

val_data = data["validation"].map(
    generate_and_tokenize_prompt,
    remove_columns=data["validation"].column_names,
    batched=False
)

test_data = data["test"].map(
    generate_and_tokenize_prompt,
    remove_columns=data["test"].column_names,
    batched=False
)

# 확인
print(train_data)
print(val_data)
print(test_data)

Map:   0%|          | 0/10466 [00:00<?, ? examples/s]

[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
 아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하는 답변만 작성해주세요.

### 발화:
B: 아니, 무려 8박스나 준다고? 너무나도 가난한 우리에게.

### 답변:

Generated prompt:
 아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하고 이를 설명하는 답변을 작성해주세요.

### 상황:
B: 우리 초등학교 때 컴퓨터실에서 무서운 게임을 했던 기억이 있나요?
A: 그게 어떤 게임이었죠? 잘 기억이 안 나네요.
B: 맞아요. 그때 함께 했던 친구들도 모두 잊었을 겁니다. 그러나 그 경험은 우리에게 정말 중요한 추억이었어요.
A: 아마도 저는 그때 너무 무서워서 잊어버린 것 같아요.

### 발화:
B: 아, 그래서 기억력이 저렇게 좋은 거군요.

### 답변:
Sarcasm
상대방이 그때의 무서움 때문에 기억을 잃었다고 했을 때, 실제로는 그것이 가능하지 않지만 가능하다고 비꼬아 말한다.
Generated prompt:
 아래는 발화에 대한 상황을 추측해보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하는 답변만 작성해주세요.

### 발화:
B: 아, 그래서 기억력이 저렇게 좋은 거군요.

### 답변:

Generated prompt:
 아래는 한국어 상황 'context'를 보고, 발화(말, 댓글 등)'response'에 대한 풍자 여부를 판별하는 예제입니다. 풍자를 판별하고 이를 설명하는 답변을 작성해주세요.

### 상황:
B: 최근에 애완동물을 키우고 계신다고 들었습니다. 어떤 동물을 키우시는 건가요?
A: 햄스터와 고양이를 한 마리씩 키우고 있습니다.
B: 그럼 두 동물이 서로 어울리나요? 문제가 없나요?
A: 아직까지는

#### ✅'prompt_input' example:

```
아래는 작업을 설명하는 지침과 추가 입력을 제공하는 입력이 짝을 이루는 예제입니다. 요청을 적절히 완료하는 답변을 작성해주세요.

### 지침:
다음 질문에 답하세요: 제목: 내가 본 최악의 영화 리뷰: 이것은 내가 본 최악의 영화입니다... DVD를 구입하는 유일한 이유는 이 영화를 만든 12살짜리 꼬마가 저능아 제작자에게 팔아넘긴 진짜 감독의 코멘터리를 공개하기 위해서입니다. 가장 좋은 부분은 비디오 게임 클립을 이어 붙인 것을 볼 때였을 것입니다. 이 상품평은 부정적인가요?
답변:

### 입력:
귀하는 지시를 매우 잘 따르는 인공지능 비서입니다. 최대한 많이 도와주세요.

### 답변:
예, 이 제품 리뷰는 부정적입니다.</s>
```



#### ✅'prompt_no_input' example:

```
아래는 작업을 설명하는 지침입니다. 요청을 적절히 완료하는 답변을 작성해주세요.

### 지침:
x+y = 10$, $2x+y = 13$이 주어졌을 때, $x^2-y^2$를 평가합니다.

### 답변:
x^2-y^2$를 풀려면 $x$와 $y$의 값을 찾아야 합니다. 주어진 방정식을 사용하여 변수 중 하나를 제거하고 다른 변수를 풀 수 있습니다. 첫 번째 방정식을 두 번째 방정식에서 빼면 $2x+y - (x+y) = 13-10$이 나오며, 이는 $x = 3$으로 단순화됩니다. 그런 다음 첫 번째 방정식을 사용하여 $x = 3$을 대입하면 $3+y = 10$을 얻을 수 있으며, 이는 $y = 7$이라는 것을 의미합니다. 이제 $x = 3$과 $y = 7$을 얻었으므로 이를 $x^2-y^2$로 대입할 수 있습니다. 이렇게 하면 $3^2-7^2 = 9-49 = -40$이 됩니다.</s>
```

--------
# 🤗 Apply LoRA config
> ❗우리가 훈련에 이용할 base LLM에 LoRA를 적용해봅시다!❗

In [None]:
###########################################
# 6-1. LoRA config 정의

config = LoraConfig(
    r=lora_r,
    lora_alpha=lora_alpha,
    target_modules=lora_target_modules,
    lora_dropout=lora_dropout,
    bias="none", # 모델 가중치 말고 쓰래쉬 홀드 같은거?
    task_type="CAUSAL_LM")

In [None]:

###########################################
# 6-2. Model with LoRA

model = prepare_model_for_kbit_training(model) # prepare_model_for_int8_training
model = get_peft_model(model, config) # Applying LoRA (모델에 LoRA config 적용)

--------
# ⭐ LLM fine-tuning
> 🥰 드디어 LLM fine-tuning을 위한 준비가 모두 끝났습니다! 한번 모델을 돌려볼까요?

In [None]:

###########################################
# 7-1. 만약 이전에 돌렸던 모델을 가져온다면, 아래의 코드 실행

if resume_from_checkpoint:
    checkpoint_name = os.path.join(
        resume_from_checkpoint, "pytorch_model.bin"
    )  # All checkpoint

    if not os.path.exists(checkpoint_name):
        checkpoint_name = os.path.join(
            resume_from_checkpoint, "adapter_model.bin"
        )  # only LoRA model
        resume_from_checkpoint = (
            True
        ) # kyujin: I will use this checkpoint

    if os.path.exists(checkpoint_name):
        print(f"Restarting from {checkpoint_name}")
        adapters_weights = torch.load(checkpoint_name)
        set_peft_model_state_dict(model, adapters_weights)

    else:
        print(f"Checkpoint {checkpoint_name} not found")

Checkpoint ./sarcasm_LLM/checkpoint-001/adapter_model.bin not found


In [None]:
###########################################
# 7-2. Trainer class 정의

trainer = transformers.Trainer(
        model=model,
        train_dataset=train_data,
        eval_dataset=val_data,
        args=transformers.TrainingArguments( # 훈련에 이용될 하이퍼파라미터
            per_device_train_batch_size = micro_batch,
            gradient_accumulation_steps = gradient_accumulation_steps,
            warmup_ratio=warmup_ratio, # 0.06
            num_train_epochs=num_epochs, # 1
            learning_rate=learning_rate,
            fp16=True,
            logging_steps=1,
            optim="adamw_torch",
            eval_strategy="epoch",
            save_strategy="steps",# step마다 모델 저장하겠다
            max_grad_norm = max_grad_norm,
            save_steps = 50, # you can change! 30 -> 50
            lr_scheduler_type=lr_scheduler,
            output_dir=output_dir,
            save_total_limit=2,
            load_best_model_at_end=False,
            ddp_find_unused_parameters=False,
            group_by_length = False
        ),
        data_collator=transformers.DataCollatorForSeq2Seq(
            tokenizer, pad_to_multiple_of=8, return_tensors="pt", padding=True
        ),
    )

model.config.use_cache = False
model.print_trainable_parameters() # 훈련하는 파라미터의 % 체크

if torch.__version__ >= "2" and sys.platform != "win32":
    model = torch.compile(model)

No label_names provided for model class `PeftModelForCausalLM`. Since `PeftModel` hides base models input arguments, if label_names is not given, label_names can't be set automatically within `Trainer`. Note that empty label_names list will be used instead.


trainable params: 15,138,816 || all params: 3,227,888,640 || trainable%: 0.4690


In [None]:
###########################################
# 7-3. Training (fine-tuning)

## 훈련시간이 많이 소요됩니다! (~12h)
## 만약 중간에 colab이 끊긴다면, checkpoint를 이용해서 다시 훈련하세요!
### 만약 개인적인 GPU 자원이 있다면, 개인 서버나 컴퓨터에서 훈련시키는 것을 추천드립니다!
resume_from_checkpoint = None
torch.cuda.empty_cache()
trainer.train(resume_from_checkpoint=resume_from_checkpoint)



<IPython.core.display.Javascript object>

[34m[1mwandb[0m: No netrc file found, creating one.
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc
[34m[1mwandb[0m: Currently logged in as: [33mmyoo-oong[0m ([33mmyoo-oong-kyung-hee-university[0m) to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


  return fn(*args, **kwargs)


Epoch,Training Loss,Validation Loss
0,1.3714,1.442018


  return fn(*args, **kwargs)
  return fn(*args, **kwargs)
  return fn(*args, **kwargs)
  return fn(*args, **kwargs)
  return fn(*args, **kwargs)
  return fn(*args, **kwargs)


TrainOutput(global_step=327, training_loss=1.5761481559969235, metrics={'train_runtime': 5228.6521, 'train_samples_per_second': 2.002, 'train_steps_per_second': 0.063, 'total_flos': 3.567200740053811e+16, 'train_loss': 1.5761481559969235, 'epoch': 0.9998089050257978})

In [None]:
###########################################
# 7-4. 모델 저장

model.save_pretrained(output_dir)
model_path = os.path.join(output_dir, "pytorch_model.bin")
torch.save({}, model_path)
tokenizer.save_pretrained(output_dir)

('./custom_LLM/tokenizer_config.json',
 './custom_LLM/special_tokens_map.json',
 './custom_LLM/tokenizer.json')

-------
# 🤗 LoRA Adapter merge
> 🎉 드디어 LLM fine-tuning이 끝났습니다! 여기까지 오시느라 정말 고생하셨습니다!! 🎉  
> 🔎 이제 훈련한 LoRA layer를 기존 base LLM에 붙여서 저장해볼까요!?

In [None]:
###########################################
# 8-1. 훈련된 LoRA layer와 base LLM 병합(merge)

torch.cuda.empty_cache()

base_model = AutoModelForCausalLM.from_pretrained(
    base_LLM_model,
    return_dict = True,
    torch_dtype=torch.float16,
    device_map=device)

model = PeftModel.from_pretrained(base_model, output_dir, device)
model = model.merge_and_unload() # Merge!

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

In [None]:
###########################################
# 8-2. 여러분의 custom LLM 모델 저장!

final_save_folder = './Sarcasm_LLM_FT'

model.save_pretrained(final_save_folder)
tokenizer.save_pretrained(final_save_folder)

('./Sarcasm_LLM_FT/tokenizer_config.json',
 './Sarcasm_LLM_FT/special_tokens_map.json',
 './Sarcasm_LLM_FT/tokenizer.json')

-------
# 🤗 HuggingFace에 모델 업로드
> ✔️마지막으로, Huggingface에 자신의 모델을 직접 업로드를 해봅시다!

1. 코드에서 Huggingface login 진행합니다.
  - HuggingFace에 다시 접속하여, access token 카테고리 접속한다.
  - ⭐`Role: write`로 생성된 token을 복사 한 후, 아래의 `[...write_token...]` 부분에 붙여넣는다.
```
!huggingface-cli login --token [...write_token...]
```
  - ✅Huggingface에 접속하여, 모델을 업로드 할 repo를 생성한다.
    - ✅사전에 제공된`README.md` 파일을 이용하여 자신의 model card를 작성한다.
  - ✅아래의 코드를 이용하여 모델과 tokenizer를 업로드한다.
```
model = AutoModelForCausalLM.from_pretrained("./custom_LLM_final")
model.push_to_hub("[...repo_name...]", token=True)
tokenizer = AutoTokenizer.from_pretrained("./custom_LLM_final")
tokenizer.push_to_hub("[...repo_name...]", token=True)
```
    - `repo_name` 부분에 자신이 만든 모델 repo 이름을 붙여넣는다.
    - 만약 colab에서 모델 업로드가 안된다면, 구글 드라이브에서 직접 다운 받아서 repo에 올려주는 방법이 있다.

  
2. ✔️Huggingface repo에 업로드 된 모델 예시 이미지  
<img src = "https://drive.google.com/uc?id=1yiQv-SeN78H378oTO4UvzvEm4dG3mD0K"
height = 512>

In [None]:
###########################################
# 9-1. 허깅페이스 로그인

# WRITE token
!huggingface-cli login --token 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 # your code

The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: write).
The token `Upstage_write` has been saved to /root/.cache/huggingface/stored_tokens
Your token has been saved to /root/.cache/huggingface/token
Login successful.
The current active token is: `Upstage_write`


In [None]:
###########################################
# 9-2. 모델 업로드 (~10분)
## 먼저, 허깅페이스에 모델 repo를 만든 후 코드를 실행해야 합니다!

model = AutoModelForCausalLM.from_pretrained(final_save_folder)
model.push_to_hub('myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B', token=True)

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/4.93G [00:00<?, ?B/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/2.92G [00:00<?, ?B/s]

Upload 3 LFS files:   0%|          | 0/3 [00:00<?, ?it/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

CommitInfo(commit_url='https://huggingface.co/myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B/commit/712df476937f674908b255b86f99849d6e841e96', commit_message='Upload LlamaForCausalLM', commit_description='', oid='712df476937f674908b255b86f99849d6e841e96', pr_url=None, repo_url=RepoUrl('https://huggingface.co/myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B', endpoint='https://huggingface.co', repo_type='model', repo_id='myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B'), pr_revision=None, pr_num=None)

In [None]:
###########################################
# 9-3. Tokenizer 업로드

tokenizer = AutoTokenizer.from_pretrained(final_save_folder)
tokenizer.push_to_hub('myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B', token=True)

README.md:   0%|          | 0.00/5.17k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.2M [00:00<?, ?B/s]

CommitInfo(commit_url='https://huggingface.co/myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B/commit/a741de132ea5b266d8d720ab7bea7f500357cac5', commit_message='Upload tokenizer', commit_description='', oid='a741de132ea5b266d8d720ab7bea7f500357cac5', pr_url=None, repo_url=RepoUrl('https://huggingface.co/myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B', endpoint='https://huggingface.co', repo_type='model', repo_id='myoo-oong/Korean-Sarcasm-LLM-llama-3.2-Korean-Bllossom-3B'), pr_revision=None, pr_num=None)

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


-------
# 🤗 Huggingface LLM 리더보드 실습
> 🎉여기까지 여러분만의 custom LLM을 만들고 huggingface에 직접 올리는 실습 진행했습니다!!🎉  
> 💡자신이 만든 모델을 LLM 리더보드에 올려서 성능평가를 진행하고, 분석을 같이 해봅시다!

- [En-LLM 리더보드](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)  
- [Ko-LLM 리더보드](https://huggingface.co/spaces/upstage/open-ko-llm-leaderboard)   
