In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


1. 나눔 폰트 설치

In [None]:
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
The following NEW packages will be installed:
  fonts-nanum
0 upgraded, 1 newly installed, 0 to remove and 34 not upgraded.
Need to get 10.3 MB of archives.
After this operation, 34.1 MB of additional disk space will be used.
Get:1 http://archive.ubuntu.com/ubuntu jammy/universe amd64 fonts-nanum all 20200506-1 [10.3 MB]
Fetched 10.3 MB in 1s (7,435 kB/s)
debconf: unable to initialize frontend: Dialog
debconf: (No usable dialog-like program is installed, so the dialog based frontend cannot be used. at /usr/share/perl5/Debconf/FrontEnd/Dialog.pm line 78, <> line 1.)
debconf: falling back to frontend: Readline
debconf: unable to initialize frontend: Readline
debconf: (This frontend requires a controlling tty.)
debconf: falling back to frontend: Teletype
dpkg-preconfigure: unable to re-open stdin: 
Selecting previously unselected package fonts-nanum.
(Reading database ... 126102 files and dire

2. Colab 런타임 다시 시작
상단탭에서 [런타임] > [런타임 다시 시작] 클릭
3. matplotlib 폰트 변경
```
import matplotlib.pyplot as plt

plt.rcParams['font.family'] = 'NanumGothic'
```
출처: https://developnote.tistory.com/165 [범범범즈의 개발 노트:티스토리]

코랩에서 상대 경로를 사용하여 파일을 불러오는 방법

In [None]:
# 1. 먼저 현재 작업 디렉토리를 확인합니다:
import os
print(os.getcwd())
# 2. 필요한 경우 작업 디렉토리를 변경합니다:
os.chdir('/content/drive/MyDrive/Colab Notebooks/아이펠/DLThon/')#←('/content')  # 코랩의 기본 디렉토리로 변경
# 3. 그 다음 상대 경로를 사용하여 파일을 불러올 수 있습니다:

/content


여기까지 하고 시작

---

# preprocessing.py 의 기존 코드입니다.

In [None]:
import re

# 1. 텍스트 정제 함수들

def remove_stopwords(tokens, stopword_list):
    stopword_set = stopword_list if isinstance(stopword_list, set) else set(stopword_list)
    return [token for token in tokens if token not in stopword_set]

def clean_text(text):
    text = re.sub(r"[^\w\s가-힣]", " ", text)
    text = re.sub(r"\s+", " ", text)
    return text.strip()

def normalize_repetitions(text, repeat_limit=2):
    # 문자 반복 (예: ㅋㅋㅋㅋ → ㅋㅋ)
    text = re.sub(r'(.)\1{2,}', lambda m: m.group(1) * repeat_limit, text)

    # 음절 반복 (예: 하하하하 → 하하)
    text = re.sub(r'((..))\1{1,}', lambda m: m.group(1) * repeat_limit, text)

    return text


# 2. 텍스트 정제

def tokenize_and_clean_text(text, stopword_list=None, repeat_limit=2):
    text = normalize_repetitions(text, repeat_limit=repeat_limit)
    text = clean_text(text)
    tokens = text.split()
    if stopword_list:
        tokens = remove_stopwords(tokens, stopword_list)
    return tokens


# 3. 한줄 단위 전처리
def preprocess_conversation_lines(
    text,
    stopwords=None,
    use_silence=False,
    speaker_token="[UTTER]",
    repeat_limit=2
):
    lines = text.strip().split('\n')
    results = []

    for line in lines:
        if not line.strip():
            processed = ["[SILENCE]"] if use_silence else []
        else:
            processed = tokenize_and_clean_text(line, stopword_list=stopwords, repeat_limit=repeat_limit)
            if not processed:
                processed = ["[SILENCE]"] if use_silence else []
            else:
                processed = [speaker_token] + processed

        if processed:
            results.append(" ".join(processed).strip())

    return results


# 4. 여러줄을 한 줄로 flatten 함수
def flatten_utterances(utterance_tokens_list, sep_token=" "):
    return sep_token.join(utterance_tokens_list).strip()


# 5.  전체 전처리 파이프라인
def preprocess(
    text,
    stopwords=None,
    speaker_token="[UTTER]",
    use_silence=True,
    sep_token=" ",
    repeat_limit=2
):
    """
    전체 전처리 통합 함수
    """
    utterance_tokens = preprocess_conversation_lines(
        text,
        stopwords=stopwords,
        use_silence=use_silence,
        speaker_token=speaker_token,
        repeat_limit=repeat_limit
    )
    return flatten_utterances(utterance_tokens, sep_token=sep_token)


---
#### KoELECTRA 모델 구조와 파라미터를 확인

In [None]:
# # 필요한 라이브러리 설치
# !pip install transformers pandas scikit-learn
# !pip install torch

# 필요한 라이브러리 임포트
import torch
import pandas as pd
from transformers import ElectraModel, ElectraTokenizer, ElectraForSequenceClassification
# AdamW는 이제 torch.optim에서 가져와야 합니다
from torch.optim import AdamW
# get_linear_schedule_with_warmup은 여전히 transformers에 있습니다
from transformers import get_linear_schedule_with_warmup
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, f1_score
import numpy as np
import random
import os
from tqdm import tqdm

# 재현성을 위한 시드 설정
def set_seed(seed):
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    if torch.cuda.is_available():
        torch.cuda.manual_seed_all(seed)

set_seed(42)

# KoELECTRA 모델 및 토크나이저 로드
model_name = "monologg/koelectra-base-v3-discriminator"
tokenizer = ElectraTokenizer.from_pretrained(model_name)

# 분류를 위한 모델 로드 (클래스 개수를 5로 설정)
model = ElectraForSequenceClassification.from_pretrained(model_name, num_labels=5)

# GPU 사용 가능 여부 확인
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

# 모델 구조 확인
print("=== Model Architecture ===")
print(model)

# 모델 파라미터 이름 확인
print("\n=== Parameter Names ===")
for name, param in model.named_parameters():
    print(f"{name}: {param.shape}")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/61.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/263k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/467 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/452M [00:00<?, ?B/s]

Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


=== Model Architecture ===
ElectraForSequenceClassification(
  (electra): ElectraModel(
    (embeddings): ElectraEmbeddings(
      (word_embeddings): Embedding(35000, 768, padding_idx=0)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): ElectraEncoder(
      (layer): ModuleList(
        (0-11): 12 x ElectraLayer(
          (attention): ElectraAttention(
            (self): ElectraSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): ElectraSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
 

---

#### 1. 줄 바꿈 표시 X, 불용어 X
- KoELECTRA 모델의 인코더 부분을 고정(freeze)하고 분류기 부분만 학습
  - 전이 학습(transfer learning)의 한 종류, 사전 훈련된 언어 모델의 표현력을 유지하면서 특정 태스크에 적응시키는 효율적인 방법
- 클래스 불균형 문제
  - 분류 보고서에서 볼 수 있듯이, 모델이 대부분 '일반 대화'로 예측하고 있습니다(recall 0.99).
  - 클래스 가중치 적용: 클래스별 샘플 수에 반비례하는 가중치를 계산하여 적용
    - **성능 향상 있었음**

- 비교군으로 성능 향상으로 위해 학습률을 낮추고, Warmup 비율 설정

In [None]:
# 필요한 라이브러리 설치
!pip install transformers pandas scikit-learn
!pip install torch

import os
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, f1_score, confusion_matrix
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import ElectraTokenizer, ElectraForSequenceClassification
from transformers import get_linear_schedule_with_warmup
from torch.optim import AdamW
from tqdm import tqdm
import random
import matplotlib.pyplot as plt
import seaborn as sns

# 시드 고정
def set_seed(seed_value=42):
    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    torch.cuda.manual_seed_all(seed_value)
    torch.backends.cudnn.deterministic = True

set_seed(42)

# 설정값
MODEL_NAME = "monologg/koelectra-base-v3-discriminator"
MAX_LEN = 128
BATCH_SIZE = 32
EPOCHS = 100  # 에폭 100으로 설정
EARLY_STOPPING_PATIENCE = 10  # Early Stopping 인내심 증가
LEARNING_RATE = 5e-6  # 학습률 낮춤
TRAIN_FILE = "data/train_preprocessed_1.csv"
TEXT_COL = "text"
LABEL_COL = "class"
LABEL_DICT = {'협박 대화': 0, '갈취 대화': 1, '직장 내 괴롭힘 대화': 2, '기타 괴롭힘 대화': 3, '일반 대화': 4}
ID_TO_LABEL = {v: k for k, v in LABEL_DICT.items()}
GPU_NUM = 0
TEST_FILE = "data/test.csv"

# 1. 데이터 로드 및 전처리
print("데이터 로드 중...")
df = pd.read_csv(TRAIN_FILE)

# 라벨 매핑
df[LABEL_COL] = df[LABEL_COL].map(LABEL_DICT)

# 데이터 분할
train_df, temp_df = train_test_split(df, test_size=0.3, random_state=42, stratify=df[LABEL_COL])
val_df, test_df = train_test_split(temp_df, test_size=0.5, random_state=42, stratify=temp_df[LABEL_COL])

print(f"학습 데이터 크기: {len(train_df)}")
print(f"검증 데이터 크기: {len(val_df)}")
print(f"테스트 데이터 크기: {len(test_df)}")

# 클래스별 데이터 개수 확인
print("학습 데이터의 클래스 분포:")
print(train_df[LABEL_COL].value_counts())

# 2. Dataset 클래스 정의
class TextClassificationDataset(Dataset):
    def __init__(self, texts, labels, tokenizer, max_len):
        self.texts = texts
        self.labels = labels
        self.tokenizer = tokenizer
        self.max_len = max_len

    def __len__(self):
        return len(self.texts)

    def __getitem__(self, idx):
        text = str(self.texts[idx])
        label = self.labels[idx]

        encoding = self.tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=self.max_len,
            return_token_type_ids=True,
            padding='max_length',
            truncation=True,
            return_attention_mask=True,
            return_tensors='pt'
        )

        return {
            'text': text,
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'token_type_ids': encoding['token_type_ids'].flatten(),
            'labels': torch.tensor(label, dtype=torch.long)
        }

# 3. 데이터 로더 생성
def create_data_loader(df, tokenizer, max_len, batch_size):
    dataset = TextClassificationDataset(
        texts=df[TEXT_COL].values,
        labels=df[LABEL_COL].values,
        tokenizer=tokenizer,
        max_len=max_len
    )

    return DataLoader(
        dataset,
        batch_size=batch_size,
        num_workers=2
    )

# 4. 토크나이저 및 모델 로드
print(f"모델 '{MODEL_NAME}' 로드 중...")
tokenizer = ElectraTokenizer.from_pretrained(MODEL_NAME)
model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))

# ELECTRA 인코더 부분 freeze
for param in model.electra.parameters():
    param.requires_grad = False

# classifier 부분만 학습 가능하게 설정
for param in model.classifier.parameters():
    param.requires_grad = True

# 학습 가능한 파라미터 확인 (디버깅용)
trainable_params = 0
all_param = 0
for name, param in model.named_parameters():
    all_param += param.numel()
    if param.requires_grad:
        trainable_params += param.numel()
        print(f"✅ 학습 대상: {name}")
print(f"🔢 학습 대상 파라미터 수: {trainable_params:,} / 전체 파라미터 수: {all_param:,} ({trainable_params/all_param:.2%})")

# 5. 데이터 로더 생성
train_data_loader = create_data_loader(train_df, tokenizer, MAX_LEN, BATCH_SIZE)
val_data_loader = create_data_loader(val_df, tokenizer, MAX_LEN, BATCH_SIZE)
test_data_loader = create_data_loader(test_df, tokenizer, MAX_LEN, BATCH_SIZE)

# 6. 모델 학습 함수 (학습률 표시 추가)
def train_model(model, data_loader, optimizer, scheduler, device, current_lr):
    model.train()
    losses = []

    progress_bar = tqdm(data_loader, desc=f"학습 중 (학습률: {current_lr:.8f})")

    for batch in progress_bar:
        optimizer.zero_grad()

        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        token_type_ids = batch['token_type_ids'].to(device)
        labels = batch['labels'].to(device)

        outputs = model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            token_type_ids=token_type_ids,
            labels=labels
        )

        loss = outputs.loss
        loss.backward()

        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

        optimizer.step()
        scheduler.step()

        losses.append(loss.item())
        progress_bar.set_postfix({"loss": f"{np.mean(losses):.4f}"})

    return np.mean(losses)

# 7. 모델 평가 함수
def evaluate_model(model, data_loader, device):
    model.eval()
    losses = []
    predictions = []
    real_labels = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="평가 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)
            labels = batch['labels'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids,
                labels=labels
            )

            _, preds = torch.max(outputs.logits, dim=1)

            losses.append(outputs.loss.item())
            predictions.extend(preds.detach().cpu().numpy())
            real_labels.extend(labels.detach().cpu().numpy())

    return np.mean(losses), predictions, real_labels

# 8. 테스트 세트 예측 함수
def predict_test(model, data_loader, device):
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    return predictions

# 9. 혼동 행렬 시각화 함수
def plot_confusion_matrix(cm, classes):
    # 한글 폰트 설정
    import matplotlib.font_manager as fm

    try:
        # 방법 1: 나눔 글꼴 설치 및 사용
        !apt-get update -qq
        !apt-get install fonts-nanum -qq
        plt.rc('font', family='NanumGothic')
    except:
        try:
            # 방법 2: 한글 레이블을 영어로 변환
            classes = ['Threat', 'Extortion', 'Workplace Harassment', 'Other Harassment', 'Normal Conversation']
        except:
            pass

    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=classes, yticklabels=classes)
    plt.xlabel('예측값')
    plt.ylabel('실제값')
    plt.title('혼동 행렬')
    plt.savefig('confusion_matrix.png')
    plt.close()

# 10. 학습 메인 함수
def train():
    # GPU 사용 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")
    print(f"사용 중인 디바이스: {device}")
    model.to(device)

    # 옵티마이저 및 스케줄러 설정
    optimizer = AdamW(model.parameters(), lr=LEARNING_RATE)

    # Warmup 비율 설정 (전체 훈련 스텝의 10%)
    warmup_ratio = 0.1
    total_steps = len(train_data_loader) * EPOCHS
    warmup_steps = int(total_steps * warmup_ratio)

    scheduler = get_linear_schedule_with_warmup(
        optimizer,
        num_warmup_steps=warmup_steps,
        num_training_steps=total_steps
    )

    # 학습 시작
    best_val_f1 = 0
    patience_counter = 0  # Early Stopping을 위한 카운터

    # 에폭별 F1 점수 및 손실 기록
    train_losses = []
    val_losses = []
    val_f1_scores = []

    for epoch in range(EPOCHS):
        # 현재 학습률 가져오기
        current_lr = optimizer.param_groups[0]['lr']

        print(f"\nEpoch {epoch + 1}/{EPOCHS}")

        # 학습
        train_loss = train_model(model, train_data_loader, optimizer, scheduler, device, current_lr)
        print(f"Train Loss: {train_loss:.4f}, 현재 학습률: {current_lr:.8f}")
        train_losses.append(train_loss)

        # 검증
        val_loss, val_predictions, val_labels = evaluate_model(model, val_data_loader, device)
        val_f1 = f1_score(val_labels, val_predictions, average='macro')
        val_losses.append(val_loss)
        val_f1_scores.append(val_f1)

        print(f"Validation Loss: {val_loss:.4f}")
        print(f"Validation Macro F1: {val_f1:.4f}")

        # 최고 성능 모델 저장 및 Early Stopping 로직
        if val_f1 > best_val_f1:
            best_val_f1 = val_f1
            torch.save(model.state_dict(), "best_model.pth")
            print(f"모델 저장됨: best_model.pth (F1: {val_f1:.4f})")
            patience_counter = 0  # 성능이 향상되었으므로 카운터 초기화
        else:
            patience_counter += 1  # 성능이 향상되지 않았으므로 카운터 증가
            print(f"성능 향상 없음: {patience_counter}/{EARLY_STOPPING_PATIENCE}")

            # Early Stopping 조건 확인
            if patience_counter >= EARLY_STOPPING_PATIENCE:
                print(f"\nEarly Stopping! {EARLY_STOPPING_PATIENCE}번의 에폭 동안 성능 향상 없음.")
                break

    # 학습 곡선 시각화
    plt.figure(figsize=(12, 4))
    plt.subplot(1, 2, 1)
    plt.plot(train_losses, label='Train Loss')
    plt.plot(val_losses, label='Validation Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()
    plt.title('Loss Curves')

    plt.subplot(1, 2, 2)
    plt.plot(val_f1_scores, label='Validation F1')
    plt.xlabel('Epoch')
    plt.ylabel('F1 Score')
    plt.legend()
    plt.title('F1 Score Curve')

    plt.tight_layout()
    plt.savefig('learning_curves.png')
    plt.close()

    # 최고 성능 모델 로드
    model.load_state_dict(torch.load("best_model.pth"))

    # 테스트 세트 평가
    test_loss, test_predictions, test_labels = evaluate_model(model, test_data_loader, device)
    test_f1 = f1_score(test_labels, test_predictions, average='macro')

    print("\n테스트 결과:")
    print(f"Test Loss: {test_loss:.4f}")
    print(f"Test Macro F1: {test_f1:.4f}")

    # 분류 보고서 출력
    class_names = [ID_TO_LABEL[i] for i in range(len(LABEL_DICT))]
    print("\n분류 보고서:")
    print(classification_report(test_labels, test_predictions, target_names=class_names))

    # 혼동 행렬 시각화
    cm = confusion_matrix(test_labels, test_predictions)
    plot_confusion_matrix(cm, class_names)

    return model

# 11. 실제 테스트 데이터 예측 및 제출 파일 생성
def predict_and_save():
    # 테스트 파일 로드
    test_data = pd.read_csv(TEST_FILE)

    # Dataset 생성
    class TestDataset(Dataset):
        def __init__(self, texts, tokenizer, max_len):
            self.texts = texts
            self.tokenizer = tokenizer
            self.max_len = max_len

        def __len__(self):
            return len(self.texts)

        def __getitem__(self, idx):
            text = str(self.texts[idx])

            encoding = self.tokenizer.encode_plus(
                text,
                add_special_tokens=True,
                max_length=self.max_len,
                return_token_type_ids=True,
                padding='max_length',
                truncation=True,
                return_attention_mask=True,
                return_tensors='pt'
            )

            return {
                'text': text,
                'input_ids': encoding['input_ids'].flatten(),
                'attention_mask': encoding['attention_mask'].flatten(),
                'token_type_ids': encoding['token_type_ids'].flatten(),
            }

    # 테스트 데이터 로더 생성
    test_dataset = TestDataset(
        texts=test_data['text'].values,
        tokenizer=tokenizer,
        max_len=MAX_LEN
    )

    test_data_loader = DataLoader(
        test_dataset,
        batch_size=BATCH_SIZE,
        num_workers=2
    )

    # GPU 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")

    # 최고 성능 모델 로드
    model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))
    model.load_state_dict(torch.load("best_model.pth"))
    model.to(device)

    # 예측
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(test_data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    # 예측 결과 라벨로 변환
    label_predictions = [ID_TO_LABEL[p] for p in predictions]

    # 제출 파일 생성
    submission = pd.DataFrame({
        'idx': test_data['idx'],
        'class': label_predictions
    })

    submission.to_csv('submission.csv', index=False)
    print(f"제출 파일 생성 완료: submission.csv")

# 메인 실행
if __name__ == "__main__":
    # 모델 학습
    model = train()

    # 테스트 데이터 예측 및 제출 파일 생성
    predict_and_save()

Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch)
  Downloading nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.2.1.3 (from torch)
  Downloading nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-curand-cu12==10.3.5.147 (from torch)
  Downloading nvidia_curand_cu12-10.3.5

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/61.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/263k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/467 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/452M [00:00<?, ?B/s]

Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


✅ 학습 대상: classifier.dense.weight
✅ 학습 대상: classifier.dense.bias
✅ 학습 대상: classifier.out_proj.weight
✅ 학습 대상: classifier.out_proj.bias
🔢 학습 대상 파라미터 수: 594,437 / 전체 파라미터 수: 112,925,189 (0.53%)
사용 중인 디바이스: cuda:0

Epoch 1/100


학습 중 (학습률: 0.00000000):   3%|▎         | 3/109 [00:01<00:34,  3.06it/s, loss=1.6128]

model.safetensors:   0%|          | 0.00/452M [00:00<?, ?B/s]

학습 중 (학습률: 0.00000000): 100%|██████████| 109/109 [00:07<00:00, 15.55it/s, loss=1.6125]


Train Loss: 1.6125, 현재 학습률: 0.00000000


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.29it/s]


Validation Loss: 1.6132
Validation Macro F1: 0.1219
모델 저장됨: best_model.pth (F1: 0.1219)

Epoch 2/100


학습 중 (학습률: 0.00000050): 100%|██████████| 109/109 [00:06<00:00, 17.89it/s, loss=1.6117]


Train Loss: 1.6117, 현재 학습률: 0.00000050


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.40it/s]


Validation Loss: 1.6115
Validation Macro F1: 0.1172
성능 향상 없음: 1/10

Epoch 3/100


학습 중 (학습률: 0.00000100): 100%|██████████| 109/109 [00:06<00:00, 17.98it/s, loss=1.6092]


Train Loss: 1.6092, 현재 학습률: 0.00000100


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.37it/s]


Validation Loss: 1.6087
Validation Macro F1: 0.1096
성능 향상 없음: 2/10

Epoch 4/100


학습 중 (학습률: 0.00000150): 100%|██████████| 109/109 [00:06<00:00, 18.01it/s, loss=1.6067]


Train Loss: 1.6067, 현재 학습률: 0.00000150


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.37it/s]


Validation Loss: 1.6051
Validation Macro F1: 0.0960
성능 향상 없음: 3/10

Epoch 5/100


학습 중 (학습률: 0.00000200): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.6031]


Train Loss: 1.6031, 현재 학습률: 0.00000200


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.46it/s]


Validation Loss: 1.6007
Validation Macro F1: 0.1015
성능 향상 없음: 4/10

Epoch 6/100


학습 중 (학습률: 0.00000250): 100%|██████████| 109/109 [00:06<00:00, 18.01it/s, loss=1.6000]


Train Loss: 1.6000, 현재 학습률: 0.00000250


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.48it/s]


Validation Loss: 1.5959
Validation Macro F1: 0.0865
성능 향상 없음: 5/10

Epoch 7/100


학습 중 (학습률: 0.00000300): 100%|██████████| 109/109 [00:06<00:00, 18.07it/s, loss=1.5950]


Train Loss: 1.5950, 현재 학습률: 0.00000300


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.34it/s]


Validation Loss: 1.5903
Validation Macro F1: 0.0768
성능 향상 없음: 6/10

Epoch 8/100


학습 중 (학습률: 0.00000350): 100%|██████████| 109/109 [00:06<00:00, 18.03it/s, loss=1.5900]


Train Loss: 1.5900, 현재 학습률: 0.00000350


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.51it/s]


Validation Loss: 1.5842
Validation Macro F1: 0.0956
성능 향상 없음: 7/10

Epoch 9/100


학습 중 (학습률: 0.00000400): 100%|██████████| 109/109 [00:06<00:00, 17.99it/s, loss=1.5838]


Train Loss: 1.5838, 현재 학습률: 0.00000400


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.39it/s]


Validation Loss: 1.5773
Validation Macro F1: 0.1291
모델 저장됨: best_model.pth (F1: 0.1291)

Epoch 10/100


학습 중 (학습률: 0.00000450): 100%|██████████| 109/109 [00:06<00:00, 18.08it/s, loss=1.5794]


Train Loss: 1.5794, 현재 학습률: 0.00000450


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.42it/s]


Validation Loss: 1.5697
Validation Macro F1: 0.1611
모델 저장됨: best_model.pth (F1: 0.1611)

Epoch 11/100


학습 중 (학습률: 0.00000500): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.5735]


Train Loss: 1.5735, 현재 학습률: 0.00000500


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.48it/s]


Validation Loss: 1.5621
Validation Macro F1: 0.1939
모델 저장됨: best_model.pth (F1: 0.1939)

Epoch 12/100


학습 중 (학습률: 0.00000494): 100%|██████████| 109/109 [00:06<00:00, 17.90it/s, loss=1.5640]


Train Loss: 1.5640, 현재 학습률: 0.00000494


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.38it/s]


Validation Loss: 1.5542
Validation Macro F1: 0.2231
모델 저장됨: best_model.pth (F1: 0.2231)

Epoch 13/100


학습 중 (학습률: 0.00000489): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.5576]


Train Loss: 1.5576, 현재 학습률: 0.00000489


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.22it/s]


Validation Loss: 1.5460
Validation Macro F1: 0.2413
모델 저장됨: best_model.pth (F1: 0.2413)

Epoch 14/100


학습 중 (학습률: 0.00000483): 100%|██████████| 109/109 [00:06<00:00, 17.86it/s, loss=1.5492]


Train Loss: 1.5492, 현재 학습률: 0.00000483


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.51it/s]


Validation Loss: 1.5379
Validation Macro F1: 0.2601
모델 저장됨: best_model.pth (F1: 0.2601)

Epoch 15/100


학습 중 (학습률: 0.00000478): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.5425]


Train Loss: 1.5425, 현재 학습률: 0.00000478


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.30it/s]


Validation Loss: 1.5297
Validation Macro F1: 0.2618
모델 저장됨: best_model.pth (F1: 0.2618)

Epoch 16/100


학습 중 (학습률: 0.00000472): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.5350]


Train Loss: 1.5350, 현재 학습률: 0.00000472


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.32it/s]


Validation Loss: 1.5214
Validation Macro F1: 0.2773
모델 저장됨: best_model.pth (F1: 0.2773)

Epoch 17/100


학습 중 (학습률: 0.00000467): 100%|██████████| 109/109 [00:06<00:00, 17.91it/s, loss=1.5284]


Train Loss: 1.5284, 현재 학습률: 0.00000467


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.33it/s]


Validation Loss: 1.5130
Validation Macro F1: 0.2929
모델 저장됨: best_model.pth (F1: 0.2929)

Epoch 18/100


학습 중 (학습률: 0.00000461): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.5196]


Train Loss: 1.5196, 현재 학습률: 0.00000461


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.45it/s]


Validation Loss: 1.5044
Validation Macro F1: 0.3082
모델 저장됨: best_model.pth (F1: 0.3082)

Epoch 19/100


학습 중 (학습률: 0.00000456): 100%|██████████| 109/109 [00:06<00:00, 18.01it/s, loss=1.5120]


Train Loss: 1.5120, 현재 학습률: 0.00000456


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.55it/s]


Validation Loss: 1.4958
Validation Macro F1: 0.3255
모델 저장됨: best_model.pth (F1: 0.3255)

Epoch 20/100


학습 중 (학습률: 0.00000450): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.5062]


Train Loss: 1.5062, 현재 학습률: 0.00000450


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.18it/s]


Validation Loss: 1.4874
Validation Macro F1: 0.3373
모델 저장됨: best_model.pth (F1: 0.3373)

Epoch 21/100


학습 중 (학습률: 0.00000444): 100%|██████████| 109/109 [00:06<00:00, 18.00it/s, loss=1.4966]


Train Loss: 1.4966, 현재 학습률: 0.00000444


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.56it/s]


Validation Loss: 1.4788
Validation Macro F1: 0.3419
모델 저장됨: best_model.pth (F1: 0.3419)

Epoch 22/100


학습 중 (학습률: 0.00000439): 100%|██████████| 109/109 [00:06<00:00, 17.98it/s, loss=1.4886]


Train Loss: 1.4886, 현재 학습률: 0.00000439


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.52it/s]


Validation Loss: 1.4703
Validation Macro F1: 0.3507
모델 저장됨: best_model.pth (F1: 0.3507)

Epoch 23/100


학습 중 (학습률: 0.00000433): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.4821]


Train Loss: 1.4821, 현재 학습률: 0.00000433


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.57it/s]


Validation Loss: 1.4615
Validation Macro F1: 0.3630
모델 저장됨: best_model.pth (F1: 0.3630)

Epoch 24/100


학습 중 (학습률: 0.00000428): 100%|██████████| 109/109 [00:06<00:00, 18.04it/s, loss=1.4761]


Train Loss: 1.4761, 현재 학습률: 0.00000428


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.33it/s]


Validation Loss: 1.4532
Validation Macro F1: 0.3605
성능 향상 없음: 1/10

Epoch 25/100


학습 중 (학습률: 0.00000422): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.4665]


Train Loss: 1.4665, 현재 학습률: 0.00000422


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.54it/s]


Validation Loss: 1.4448
Validation Macro F1: 0.3696
모델 저장됨: best_model.pth (F1: 0.3696)

Epoch 26/100


학습 중 (학습률: 0.00000417): 100%|██████████| 109/109 [00:06<00:00, 17.95it/s, loss=1.4570]


Train Loss: 1.4570, 현재 학습률: 0.00000417


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.45it/s]


Validation Loss: 1.4366
Validation Macro F1: 0.3737
모델 저장됨: best_model.pth (F1: 0.3737)

Epoch 27/100


학습 중 (학습률: 0.00000411): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.4510]


Train Loss: 1.4510, 현재 학습률: 0.00000411


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.34it/s]


Validation Loss: 1.4285
Validation Macro F1: 0.3817
모델 저장됨: best_model.pth (F1: 0.3817)

Epoch 28/100


학습 중 (학습률: 0.00000406): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.4424]


Train Loss: 1.4424, 현재 학습률: 0.00000406


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.48it/s]


Validation Loss: 1.4207
Validation Macro F1: 0.3831
모델 저장됨: best_model.pth (F1: 0.3831)

Epoch 29/100


학습 중 (학습률: 0.00000400): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.4359]


Train Loss: 1.4359, 현재 학습률: 0.00000400


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.34it/s]


Validation Loss: 1.4131
Validation Macro F1: 0.3875
모델 저장됨: best_model.pth (F1: 0.3875)

Epoch 30/100


학습 중 (학습률: 0.00000394): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.4249]


Train Loss: 1.4249, 현재 학습률: 0.00000394


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.38it/s]


Validation Loss: 1.4058
Validation Macro F1: 0.3902
모델 저장됨: best_model.pth (F1: 0.3902)

Epoch 31/100


학습 중 (학습률: 0.00000389): 100%|██████████| 109/109 [00:06<00:00, 17.92it/s, loss=1.4212]


Train Loss: 1.4212, 현재 학습률: 0.00000389


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.38it/s]


Validation Loss: 1.3990
Validation Macro F1: 0.3929
모델 저장됨: best_model.pth (F1: 0.3929)

Epoch 32/100


학습 중 (학습률: 0.00000383): 100%|██████████| 109/109 [00:06<00:00, 17.90it/s, loss=1.4184]


Train Loss: 1.4184, 현재 학습률: 0.00000383


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.54it/s]


Validation Loss: 1.3921
Validation Macro F1: 0.3945
모델 저장됨: best_model.pth (F1: 0.3945)

Epoch 33/100


학습 중 (학습률: 0.00000378): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.4087]


Train Loss: 1.4087, 현재 학습률: 0.00000378


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.39it/s]


Validation Loss: 1.3855
Validation Macro F1: 0.4111
모델 저장됨: best_model.pth (F1: 0.4111)

Epoch 34/100


학습 중 (학습률: 0.00000372): 100%|██████████| 109/109 [00:06<00:00, 17.91it/s, loss=1.4036]


Train Loss: 1.4036, 현재 학습률: 0.00000372


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.44it/s]


Validation Loss: 1.3793
Validation Macro F1: 0.4103
성능 향상 없음: 1/10

Epoch 35/100


학습 중 (학습률: 0.00000367): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.3981]


Train Loss: 1.3981, 현재 학습률: 0.00000367


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.40it/s]


Validation Loss: 1.3730
Validation Macro F1: 0.4107
성능 향상 없음: 2/10

Epoch 36/100


학습 중 (학습률: 0.00000361): 100%|██████████| 109/109 [00:06<00:00, 18.01it/s, loss=1.3936]


Train Loss: 1.3936, 현재 학습률: 0.00000361


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.41it/s]


Validation Loss: 1.3673
Validation Macro F1: 0.4157
모델 저장됨: best_model.pth (F1: 0.4157)

Epoch 37/100


학습 중 (학습률: 0.00000356): 100%|██████████| 109/109 [00:06<00:00, 18.00it/s, loss=1.3849]


Train Loss: 1.3849, 현재 학습률: 0.00000356


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.48it/s]


Validation Loss: 1.3619
Validation Macro F1: 0.4206
모델 저장됨: best_model.pth (F1: 0.4206)

Epoch 38/100


학습 중 (학습률: 0.00000350): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.3821]


Train Loss: 1.3821, 현재 학습률: 0.00000350


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.30it/s]


Validation Loss: 1.3568
Validation Macro F1: 0.4288
모델 저장됨: best_model.pth (F1: 0.4288)

Epoch 39/100


학습 중 (학습률: 0.00000344): 100%|██████████| 109/109 [00:06<00:00, 17.89it/s, loss=1.3778]


Train Loss: 1.3778, 현재 학습률: 0.00000344


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.44it/s]


Validation Loss: 1.3517
Validation Macro F1: 0.4323
모델 저장됨: best_model.pth (F1: 0.4323)

Epoch 40/100


학습 중 (학습률: 0.00000339): 100%|██████████| 109/109 [00:06<00:00, 17.87it/s, loss=1.3744]


Train Loss: 1.3744, 현재 학습률: 0.00000339


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.33it/s]


Validation Loss: 1.3470
Validation Macro F1: 0.4415
모델 저장됨: best_model.pth (F1: 0.4415)

Epoch 41/100


학습 중 (학습률: 0.00000333): 100%|██████████| 109/109 [00:06<00:00, 18.00it/s, loss=1.3672]


Train Loss: 1.3672, 현재 학습률: 0.00000333


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.43it/s]


Validation Loss: 1.3425
Validation Macro F1: 0.4500
모델 저장됨: best_model.pth (F1: 0.4500)

Epoch 42/100


학습 중 (학습률: 0.00000328): 100%|██████████| 109/109 [00:06<00:00, 17.90it/s, loss=1.3608]


Train Loss: 1.3608, 현재 학습률: 0.00000328


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.46it/s]


Validation Loss: 1.3380
Validation Macro F1: 0.4492
성능 향상 없음: 1/10

Epoch 43/100


학습 중 (학습률: 0.00000322): 100%|██████████| 109/109 [00:06<00:00, 17.95it/s, loss=1.3639]


Train Loss: 1.3639, 현재 학습률: 0.00000322


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.22it/s]


Validation Loss: 1.3337
Validation Macro F1: 0.4603
모델 저장됨: best_model.pth (F1: 0.4603)

Epoch 44/100


학습 중 (학습률: 0.00000317): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.3537]


Train Loss: 1.3537, 현재 학습률: 0.00000317


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.50it/s]


Validation Loss: 1.3299
Validation Macro F1: 0.4516
성능 향상 없음: 1/10

Epoch 45/100


학습 중 (학습률: 0.00000311): 100%|██████████| 109/109 [00:06<00:00, 18.01it/s, loss=1.3483]


Train Loss: 1.3483, 현재 학습률: 0.00000311


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.44it/s]


Validation Loss: 1.3258
Validation Macro F1: 0.4598
성능 향상 없음: 2/10

Epoch 46/100


학습 중 (학습률: 0.00000306): 100%|██████████| 109/109 [00:06<00:00, 17.99it/s, loss=1.3477]


Train Loss: 1.3477, 현재 학습률: 0.00000306


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.49it/s]


Validation Loss: 1.3218
Validation Macro F1: 0.4631
모델 저장됨: best_model.pth (F1: 0.4631)

Epoch 47/100


학습 중 (학습률: 0.00000300): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.3452]


Train Loss: 1.3452, 현재 학습률: 0.00000300


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.31it/s]


Validation Loss: 1.3182
Validation Macro F1: 0.4616
성능 향상 없음: 1/10

Epoch 48/100


학습 중 (학습률: 0.00000294): 100%|██████████| 109/109 [00:06<00:00, 18.07it/s, loss=1.3420]


Train Loss: 1.3420, 현재 학습률: 0.00000294


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.40it/s]


Validation Loss: 1.3147
Validation Macro F1: 0.4633
모델 저장됨: best_model.pth (F1: 0.4633)

Epoch 49/100


학습 중 (학습률: 0.00000289): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.3339]


Train Loss: 1.3339, 현재 학습률: 0.00000289


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.46it/s]


Validation Loss: 1.3115
Validation Macro F1: 0.4693
모델 저장됨: best_model.pth (F1: 0.4693)

Epoch 50/100


학습 중 (학습률: 0.00000283): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.3317]


Train Loss: 1.3317, 현재 학습률: 0.00000283


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.31it/s]


Validation Loss: 1.3082
Validation Macro F1: 0.4678
성능 향상 없음: 1/10

Epoch 51/100


학습 중 (학습률: 0.00000278): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.3249]


Train Loss: 1.3249, 현재 학습률: 0.00000278


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.41it/s]


Validation Loss: 1.3052
Validation Macro F1: 0.4748
모델 저장됨: best_model.pth (F1: 0.4748)

Epoch 52/100


학습 중 (학습률: 0.00000272): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.3336]


Train Loss: 1.3336, 현재 학습률: 0.00000272


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.27it/s]


Validation Loss: 1.3021
Validation Macro F1: 0.4728
성능 향상 없음: 1/10

Epoch 53/100


학습 중 (학습률: 0.00000267): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.3263]


Train Loss: 1.3263, 현재 학습률: 0.00000267


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.31it/s]


Validation Loss: 1.2995
Validation Macro F1: 0.4729
성능 향상 없음: 2/10

Epoch 54/100


학습 중 (학습률: 0.00000261): 100%|██████████| 109/109 [00:06<00:00, 17.95it/s, loss=1.3170]


Train Loss: 1.3170, 현재 학습률: 0.00000261


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.22it/s]


Validation Loss: 1.2967
Validation Macro F1: 0.4736
성능 향상 없음: 3/10

Epoch 55/100


학습 중 (학습률: 0.00000256): 100%|██████████| 109/109 [00:06<00:00, 17.92it/s, loss=1.3176]


Train Loss: 1.3176, 현재 학습률: 0.00000256


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.47it/s]


Validation Loss: 1.2941
Validation Macro F1: 0.4780
모델 저장됨: best_model.pth (F1: 0.4780)

Epoch 56/100


학습 중 (학습률: 0.00000250): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.3163]


Train Loss: 1.3163, 현재 학습률: 0.00000250


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.39it/s]


Validation Loss: 1.2919
Validation Macro F1: 0.4833
모델 저장됨: best_model.pth (F1: 0.4833)

Epoch 57/100


학습 중 (학습률: 0.00000244): 100%|██████████| 109/109 [00:06<00:00, 17.92it/s, loss=1.3055]


Train Loss: 1.3055, 현재 학습률: 0.00000244


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.27it/s]


Validation Loss: 1.2891
Validation Macro F1: 0.4838
모델 저장됨: best_model.pth (F1: 0.4838)

Epoch 58/100


학습 중 (학습률: 0.00000239): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.3100]


Train Loss: 1.3100, 현재 학습률: 0.00000239


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.46it/s]


Validation Loss: 1.2869
Validation Macro F1: 0.4834
성능 향상 없음: 1/10

Epoch 59/100


학습 중 (학습률: 0.00000233): 100%|██████████| 109/109 [00:06<00:00, 18.03it/s, loss=1.3136]


Train Loss: 1.3136, 현재 학습률: 0.00000233


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.41it/s]


Validation Loss: 1.2843
Validation Macro F1: 0.4841
모델 저장됨: best_model.pth (F1: 0.4841)

Epoch 60/100


학습 중 (학습률: 0.00000228): 100%|██████████| 109/109 [00:06<00:00, 18.00it/s, loss=1.3053]


Train Loss: 1.3053, 현재 학습률: 0.00000228


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.38it/s]


Validation Loss: 1.2822
Validation Macro F1: 0.4837
성능 향상 없음: 1/10

Epoch 61/100


학습 중 (학습률: 0.00000222): 100%|██████████| 109/109 [00:06<00:00, 17.94it/s, loss=1.3006]


Train Loss: 1.3006, 현재 학습률: 0.00000222


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.45it/s]


Validation Loss: 1.2799
Validation Macro F1: 0.4894
모델 저장됨: best_model.pth (F1: 0.4894)

Epoch 62/100


학습 중 (학습률: 0.00000217): 100%|██████████| 109/109 [00:06<00:00, 17.92it/s, loss=1.3018]


Train Loss: 1.3018, 현재 학습률: 0.00000217


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.33it/s]


Validation Loss: 1.2784
Validation Macro F1: 0.4880
성능 향상 없음: 1/10

Epoch 63/100


학습 중 (학습률: 0.00000211): 100%|██████████| 109/109 [00:06<00:00, 18.01it/s, loss=1.2980]


Train Loss: 1.2980, 현재 학습률: 0.00000211


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.40it/s]


Validation Loss: 1.2764
Validation Macro F1: 0.4880
성능 향상 없음: 2/10

Epoch 64/100


학습 중 (학습률: 0.00000206): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.2988]


Train Loss: 1.2988, 현재 학습률: 0.00000206


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.40it/s]


Validation Loss: 1.2745
Validation Macro F1: 0.4895
모델 저장됨: best_model.pth (F1: 0.4895)

Epoch 65/100


학습 중 (학습률: 0.00000200): 100%|██████████| 109/109 [00:06<00:00, 17.90it/s, loss=1.2948]


Train Loss: 1.2948, 현재 학습률: 0.00000200


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.29it/s]


Validation Loss: 1.2727
Validation Macro F1: 0.4881
성능 향상 없음: 1/10

Epoch 66/100


학습 중 (학습률: 0.00000194): 100%|██████████| 109/109 [00:06<00:00, 17.94it/s, loss=1.3002]


Train Loss: 1.3002, 현재 학습률: 0.00000194


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.41it/s]


Validation Loss: 1.2714
Validation Macro F1: 0.4900
모델 저장됨: best_model.pth (F1: 0.4900)

Epoch 67/100


학습 중 (학습률: 0.00000189): 100%|██████████| 109/109 [00:06<00:00, 17.94it/s, loss=1.2896]


Train Loss: 1.2896, 현재 학습률: 0.00000189


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.42it/s]


Validation Loss: 1.2698
Validation Macro F1: 0.4927
모델 저장됨: best_model.pth (F1: 0.4927)

Epoch 68/100


학습 중 (학습률: 0.00000183): 100%|██████████| 109/109 [00:06<00:00, 17.99it/s, loss=1.2919]


Train Loss: 1.2919, 현재 학습률: 0.00000183


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.23it/s]


Validation Loss: 1.2683
Validation Macro F1: 0.4983
모델 저장됨: best_model.pth (F1: 0.4983)

Epoch 69/100


학습 중 (학습률: 0.00000178): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.2873]


Train Loss: 1.2873, 현재 학습률: 0.00000178


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.34it/s]


Validation Loss: 1.2666
Validation Macro F1: 0.4981
성능 향상 없음: 1/10

Epoch 70/100


학습 중 (학습률: 0.00000172): 100%|██████████| 109/109 [00:06<00:00, 17.98it/s, loss=1.2903]


Train Loss: 1.2903, 현재 학습률: 0.00000172


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.30it/s]


Validation Loss: 1.2653
Validation Macro F1: 0.4994
모델 저장됨: best_model.pth (F1: 0.4994)

Epoch 71/100


학습 중 (학습률: 0.00000167): 100%|██████████| 109/109 [00:06<00:00, 17.99it/s, loss=1.2883]


Train Loss: 1.2883, 현재 학습률: 0.00000167


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.35it/s]


Validation Loss: 1.2637
Validation Macro F1: 0.4980
성능 향상 없음: 1/10

Epoch 72/100


학습 중 (학습률: 0.00000161): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.2843]


Train Loss: 1.2843, 현재 학습률: 0.00000161


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.37it/s]


Validation Loss: 1.2622
Validation Macro F1: 0.5035
모델 저장됨: best_model.pth (F1: 0.5035)

Epoch 73/100


학습 중 (학습률: 0.00000156): 100%|██████████| 109/109 [00:06<00:00, 17.90it/s, loss=1.2823]


Train Loss: 1.2823, 현재 학습률: 0.00000156


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.48it/s]


Validation Loss: 1.2610
Validation Macro F1: 0.5006
성능 향상 없음: 1/10

Epoch 74/100


학습 중 (학습률: 0.00000150): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.2756]


Train Loss: 1.2756, 현재 학습률: 0.00000150


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.25it/s]


Validation Loss: 1.2597
Validation Macro F1: 0.5043
모델 저장됨: best_model.pth (F1: 0.5043)

Epoch 75/100


학습 중 (학습률: 0.00000144): 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.2766]


Train Loss: 1.2766, 현재 학습률: 0.00000144


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.48it/s]


Validation Loss: 1.2586
Validation Macro F1: 0.5006
성능 향상 없음: 1/10

Epoch 76/100


학습 중 (학습률: 0.00000139): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.2780]


Train Loss: 1.2780, 현재 학습률: 0.00000139


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.46it/s]


Validation Loss: 1.2572
Validation Macro F1: 0.5078
모델 저장됨: best_model.pth (F1: 0.5078)

Epoch 77/100


학습 중 (학습률: 0.00000133): 100%|██████████| 109/109 [00:06<00:00, 17.94it/s, loss=1.2800]


Train Loss: 1.2800, 현재 학습률: 0.00000133


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.28it/s]


Validation Loss: 1.2565
Validation Macro F1: 0.5082
모델 저장됨: best_model.pth (F1: 0.5082)

Epoch 78/100


학습 중 (학습률: 0.00000128): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.2769]


Train Loss: 1.2769, 현재 학습률: 0.00000128


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.47it/s]


Validation Loss: 1.2553
Validation Macro F1: 0.5078
성능 향상 없음: 1/10

Epoch 79/100


학습 중 (학습률: 0.00000122): 100%|██████████| 109/109 [00:06<00:00, 18.02it/s, loss=1.2766]


Train Loss: 1.2766, 현재 학습률: 0.00000122


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.36it/s]


Validation Loss: 1.2542
Validation Macro F1: 0.5083
모델 저장됨: best_model.pth (F1: 0.5083)

Epoch 80/100


학습 중 (학습률: 0.00000117): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.2780]


Train Loss: 1.2780, 현재 학습률: 0.00000117


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.31it/s]


Validation Loss: 1.2535
Validation Macro F1: 0.5071
성능 향상 없음: 1/10

Epoch 81/100


학습 중 (학습률: 0.00000111): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.2744]


Train Loss: 1.2744, 현재 학습률: 0.00000111


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.44it/s]


Validation Loss: 1.2525
Validation Macro F1: 0.5103
모델 저장됨: best_model.pth (F1: 0.5103)

Epoch 82/100


학습 중 (학습률: 0.00000106): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.2742]


Train Loss: 1.2742, 현재 학습률: 0.00000106


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.45it/s]


Validation Loss: 1.2519
Validation Macro F1: 0.5103
성능 향상 없음: 1/10

Epoch 83/100


학습 중 (학습률: 0.00000100): 100%|██████████| 109/109 [00:06<00:00, 18.00it/s, loss=1.2723]


Train Loss: 1.2723, 현재 학습률: 0.00000100


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.34it/s]


Validation Loss: 1.2511
Validation Macro F1: 0.5106
모델 저장됨: best_model.pth (F1: 0.5106)

Epoch 84/100


학습 중 (학습률: 0.00000094): 100%|██████████| 109/109 [00:06<00:00, 17.95it/s, loss=1.2736]


Train Loss: 1.2736, 현재 학습률: 0.00000094


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.43it/s]


Validation Loss: 1.2505
Validation Macro F1: 0.5105
성능 향상 없음: 1/10

Epoch 85/100


학습 중 (학습률: 0.00000089): 100%|██████████| 109/109 [00:06<00:00, 17.97it/s, loss=1.2754]


Train Loss: 1.2754, 현재 학습률: 0.00000089


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.39it/s]


Validation Loss: 1.2500
Validation Macro F1: 0.5122
모델 저장됨: best_model.pth (F1: 0.5122)

Epoch 86/100


학습 중 (학습률: 0.00000083): 100%|██████████| 109/109 [00:06<00:00, 17.98it/s, loss=1.2773]


Train Loss: 1.2773, 현재 학습률: 0.00000083


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.40it/s]


Validation Loss: 1.2494
Validation Macro F1: 0.5122
성능 향상 없음: 1/10

Epoch 87/100


학습 중 (학습률: 0.00000078): 100%|██████████| 109/109 [00:06<00:00, 18.03it/s, loss=1.2704]


Train Loss: 1.2704, 현재 학습률: 0.00000078


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.39it/s]


Validation Loss: 1.2489
Validation Macro F1: 0.5138
모델 저장됨: best_model.pth (F1: 0.5138)

Epoch 88/100


학습 중 (학습률: 0.00000072): 100%|██████████| 109/109 [00:06<00:00, 17.95it/s, loss=1.2695]


Train Loss: 1.2695, 현재 학습률: 0.00000072


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.36it/s]


Validation Loss: 1.2484
Validation Macro F1: 0.5138
성능 향상 없음: 1/10

Epoch 89/100


학습 중 (학습률: 0.00000067): 100%|██████████| 109/109 [00:06<00:00, 17.99it/s, loss=1.2718]


Train Loss: 1.2718, 현재 학습률: 0.00000067


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.96it/s]


Validation Loss: 1.2475
Validation Macro F1: 0.5125
성능 향상 없음: 2/10

Epoch 90/100


학습 중 (학습률: 0.00000061): 100%|██████████| 109/109 [00:06<00:00, 17.94it/s, loss=1.2677]


Train Loss: 1.2677, 현재 학습률: 0.00000061


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.38it/s]


Validation Loss: 1.2470
Validation Macro F1: 0.5113
성능 향상 없음: 3/10

Epoch 91/100


학습 중 (학습률: 0.00000056): 100%|██████████| 109/109 [00:06<00:00, 17.91it/s, loss=1.2687]


Train Loss: 1.2687, 현재 학습률: 0.00000056


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.43it/s]


Validation Loss: 1.2466
Validation Macro F1: 0.5113
성능 향상 없음: 4/10

Epoch 92/100


학습 중 (학습률: 0.00000050): 100%|██████████| 109/109 [00:06<00:00, 17.94it/s, loss=1.2704]


Train Loss: 1.2704, 현재 학습률: 0.00000050


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.29it/s]


Validation Loss: 1.2463
Validation Macro F1: 0.5113
성능 향상 없음: 5/10

Epoch 93/100


학습 중 (학습률: 0.00000044): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.2677]


Train Loss: 1.2677, 현재 학습률: 0.00000044


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.33it/s]


Validation Loss: 1.2460
Validation Macro F1: 0.5112
성능 향상 없음: 6/10

Epoch 94/100


학습 중 (학습률: 0.00000039): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.2688]


Train Loss: 1.2688, 현재 학습률: 0.00000039


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.31it/s]


Validation Loss: 1.2457
Validation Macro F1: 0.5113
성능 향상 없음: 7/10

Epoch 95/100


학습 중 (학습률: 0.00000033): 100%|██████████| 109/109 [00:06<00:00, 17.99it/s, loss=1.2667]


Train Loss: 1.2667, 현재 학습률: 0.00000033


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.32it/s]


Validation Loss: 1.2456
Validation Macro F1: 0.5113
성능 향상 없음: 8/10

Epoch 96/100


학습 중 (학습률: 0.00000028): 100%|██████████| 109/109 [00:06<00:00, 17.93it/s, loss=1.2720]


Train Loss: 1.2720, 현재 학습률: 0.00000028


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.42it/s]


Validation Loss: 1.2454
Validation Macro F1: 0.5113
성능 향상 없음: 9/10

Epoch 97/100


학습 중 (학습률: 0.00000022): 100%|██████████| 109/109 [00:06<00:00, 17.96it/s, loss=1.2632]


Train Loss: 1.2632, 현재 학습률: 0.00000022


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.32it/s]


Validation Loss: 1.2453
Validation Macro F1: 0.5113
성능 향상 없음: 10/10

Early Stopping! 10번의 에폭 동안 성능 향상 없음.


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.86it/s]



테스트 결과:
Test Loss: 1.2149
Test Macro F1: 0.4708

분류 보고서:
              precision    recall  f1-score   support

       협박 대화       0.50      0.26      0.34       134
       갈취 대화       0.52      0.40      0.45       146
 직장 내 괴롭힘 대화       0.42      0.34      0.38       145
   기타 괴롭힘 대화       0.40      0.47      0.43       152
       일반 대화       0.61      0.97      0.75       169

    accuracy                           0.51       746
   macro avg       0.49      0.49      0.47       746
weighted avg       0.49      0.51      0.48       746

W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
테스트 예측 중: 100%|██████████| 16/16 [00:01<00:00, 15.33it/s]


제출 파일 생성 완료: submission.csv


- 성능 향상

In [None]:
import os
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, f1_score, confusion_matrix
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import ElectraTokenizer, ElectraForSequenceClassification
from transformers import get_linear_schedule_with_warmup
from torch.optim import AdamW
from tqdm import tqdm
import random
import matplotlib.pyplot as plt
import seaborn as sns

# 시드 고정
def set_seed(seed_value=42):
    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    torch.cuda.manual_seed_all(seed_value)
    torch.backends.cudnn.deterministic = True

set_seed(42)

# 설정값
MODEL_NAME = "monologg/koelectra-base-v3-discriminator"
MAX_LEN = 128
BATCH_SIZE = 32
EPOCHS = 100  # 에폭 100으로 유지
SCHEDULER_EPOCHS = 5  # 스케줄러용 에폭 (원래 설정 유지)
EARLY_STOPPING_PATIENCE = 5  # 연속 5번의 에폭 동안 성능이 향상되지 않으면 학습 중단
LEARNING_RATE = 1.5e-5  # 8e-6에서 증가
TRAIN_FILE = "data/train_preprocessed_1.csv" # 줄 바꿈 표시 x, 불용어 X
TEXT_COL = "text"
LABEL_COL = "class"
LABEL_DICT = {'협박 대화': 0, '갈취 대화': 1, '직장 내 괴롭힘 대화': 2, '기타 괴롭힘 대화': 3, '일반 대화': 4}
ID_TO_LABEL = {v: k for k, v in LABEL_DICT.items()}
GPU_NUM = 0
TEST_FILE = "data/test.csv"

# 1. 데이터 로드 및 전처리
print("데이터 로드 중...")
df = pd.read_csv(TRAIN_FILE)

# 라벨 매핑
df[LABEL_COL] = df[LABEL_COL].map(LABEL_DICT)

# 데이터 분할
train_df, temp_df = train_test_split(df, test_size=0.3, random_state=42, stratify=df[LABEL_COL])
val_df, test_df = train_test_split(temp_df, test_size=0.5, random_state=42, stratify=temp_df[LABEL_COL])

print(f"학습 데이터 크기: {len(train_df)}")
print(f"검증 데이터 크기: {len(val_df)}")
print(f"테스트 데이터 크기: {len(test_df)}")

# 클래스별 데이터 개수 확인
print("학습 데이터의 클래스 분포:")
print(train_df[LABEL_COL].value_counts())

# 2. Dataset 클래스 정의
class TextClassificationDataset(Dataset):
    def __init__(self, texts, labels, tokenizer, max_len):
        self.texts = texts
        self.labels = labels
        self.tokenizer = tokenizer
        self.max_len = max_len

    def __len__(self):
        return len(self.texts)

    def __getitem__(self, idx):
        text = str(self.texts[idx])
        label = self.labels[idx]

        encoding = self.tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=self.max_len,
            return_token_type_ids=True,
            padding='max_length',
            truncation=True,
            return_attention_mask=True,
            return_tensors='pt'
        )

        return {
            'text': text,
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'token_type_ids': encoding['token_type_ids'].flatten(),
            'labels': torch.tensor(label, dtype=torch.long)
        }

# 3. 데이터 로더 생성
def create_data_loader(df, tokenizer, max_len, batch_size):
    dataset = TextClassificationDataset(
        texts=df[TEXT_COL].values,
        labels=df[LABEL_COL].values,
        tokenizer=tokenizer,
        max_len=max_len
    )

    return DataLoader(
        dataset,
        batch_size=batch_size,
        num_workers=2
    )

# 4. 토크나이저 및 모델 로드
print(f"모델 '{MODEL_NAME}' 로드 중...")
tokenizer = ElectraTokenizer.from_pretrained(MODEL_NAME)
model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))

# ELECTRA 인코더 부분 freeze
for param in model.electra.parameters():
    param.requires_grad = False

# classifier 부분만 학습 가능하게 설정
for param in model.classifier.parameters():
    param.requires_grad = True

# 학습 가능한 파라미터 확인 (디버깅용)
trainable_params = 0
all_param = 0
for name, param in model.named_parameters():
    all_param += param.numel()
    if param.requires_grad:
        trainable_params += param.numel()
        print(f"✅ 학습 대상: {name}")
print(f"🔢 학습 대상 파라미터 수: {trainable_params:,} / 전체 파라미터 수: {all_param:,} ({trainable_params/all_param:.2%})")

# 5. 데이터 로더 생성
train_data_loader = create_data_loader(train_df, tokenizer, MAX_LEN, BATCH_SIZE)
val_data_loader = create_data_loader(val_df, tokenizer, MAX_LEN, BATCH_SIZE)
test_data_loader = create_data_loader(test_df, tokenizer, MAX_LEN, BATCH_SIZE)

# 6. 클래스 가중치 설정 (수동 조정) - 성능이 낮은 클래스에 더 높은 가중치 부여
# 클래스 가중치 수동 조정 - F1 점수가 낮은 클래스에 더 높은 가중치 부여
class_weights = [1.8, 1.8, 1.8, 2.0, 0.7]  # 기타 괴롭힘 대화에 적당한 가중치

print("수동 설정된 클래스별 가중치:")
for i, weight in enumerate(class_weights):
    print(f"클래스 {i} ({ID_TO_LABEL[i]}): {weight:.4f}")

# 7. 모델 학습 함수 (가중치 적용한 손실 함수 사용)
def train_model(model, data_loader, optimizer, scheduler, device, class_weights_tensor):
    model.train()
    losses = []

    progress_bar = tqdm(data_loader, desc="학습 중")

    for batch in progress_bar:
        optimizer.zero_grad()

        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        token_type_ids = batch['token_type_ids'].to(device)
        labels = batch['labels'].to(device)

        outputs = model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            token_type_ids=token_type_ids,
            labels=labels
        )

        # 기본 손실 함수 대신 가중치가 적용된 손실 함수 사용
        logits = outputs.logits
        loss_fct = torch.nn.CrossEntropyLoss(weight=class_weights_tensor)
        loss = loss_fct(logits.view(-1, model.config.num_labels), labels.view(-1))

        loss.backward()

        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

        optimizer.step()
        scheduler.step()

        losses.append(loss.item())
        progress_bar.set_postfix({"loss": f"{np.mean(losses):.4f}"})

    return np.mean(losses)

# 8. 모델 평가 함수
def evaluate_model(model, data_loader, device, class_weights_tensor=None):
    model.eval()
    losses = []
    predictions = []
    real_labels = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="평가 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)
            labels = batch['labels'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            # 평가 시에도 동일한 가중치 적용
            if class_weights_tensor is not None:
                loss_fct = torch.nn.CrossEntropyLoss(weight=class_weights_tensor)
                loss = loss_fct(outputs.logits.view(-1, model.config.num_labels), labels.view(-1))
            else:
                loss_fct = torch.nn.CrossEntropyLoss()
                loss = loss_fct(outputs.logits.view(-1, model.config.num_labels), labels.view(-1))

            _, preds = torch.max(outputs.logits, dim=1)

            losses.append(loss.item())
            predictions.extend(preds.detach().cpu().numpy())
            real_labels.extend(labels.detach().cpu().numpy())

    return np.mean(losses), predictions, real_labels

# 9. 혼동 행렬 시각화 함수
def plot_confusion_matrix(cm, classes):
    try:
        # 방법 1: 나눔 글꼴 설치 및 사용
        !apt-get update -qq
        !apt-get install fonts-nanum -qq
        plt.rc('font', family='NanumGothic')
    except:
        try:
            # 방법 2: 한글 레이블을 영어로 변환
            classes = ['Threat', 'Extortion', 'Workplace Harassment', 'Other Harassment', 'Normal Conversation']
        except:
            pass

    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=classes, yticklabels=classes)
    plt.xlabel('예측값')
    plt.ylabel('실제값')
    plt.title('혼동 행렬')
    plt.savefig('confusion_matrix.png')
    plt.close()

# 10. 학습 메인 함수
def train():
    # GPU 사용 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")
    print(f"사용 중인 디바이스: {device}")
    model.to(device)

    # 클래스 가중치 텐서를 디바이스로 이동
    class_weights_tensor = torch.FloatTensor(class_weights).to(device)

    # 옵티마이저 및 스케줄러 설정
    optimizer = AdamW(model.parameters(), lr=LEARNING_RATE)

    # 전체 스텝 설정 - 여기서는 EPOCHS 전체를 사용
    total_steps = len(train_data_loader) * EPOCHS

    # 학습률 스케줄러 설정 - 더 느린 감소율 적용
    scheduler = get_linear_schedule_with_warmup(
        optimizer,
        num_warmup_steps=0,
        num_training_steps=total_steps
    )

    # 학습 시작
    best_val_f1 = 0
    patience_counter = 0  # Early Stopping을 위한 카운터

    # 에폭별 성능 기록
    train_losses = []
    val_losses = []
    val_f1_scores = []
    learning_rates = []

    for epoch in range(EPOCHS):
        # 현재 학습률 가져오기
        current_lr = optimizer.param_groups[0]['lr']
        learning_rates.append(current_lr)

        print(f"\nEpoch {epoch + 1}/{EPOCHS} (학습률: {current_lr:.2e})")

        # 학습
        train_loss = train_model(model, train_data_loader, optimizer, scheduler, device, class_weights_tensor)
        train_losses.append(train_loss)
        print(f"Train Loss: {train_loss:.4f}")

        # 검증
        val_loss, val_predictions, val_labels = evaluate_model(model, val_data_loader, device, class_weights_tensor)
        val_losses.append(val_loss)
        val_f1 = f1_score(val_labels, val_predictions, average='macro')
        val_f1_scores.append(val_f1)

        print(f"Validation Loss: {val_loss:.4f}")
        print(f"Validation Macro F1: {val_f1:.4f}")

        # 클래스별 F1 점수 출력
        class_f1 = f1_score(val_labels, val_predictions, average=None)
        for i, score in enumerate(class_f1):
            print(f"클래스 {i} ({ID_TO_LABEL[i]}) F1: {score:.4f}")

        # 최고 성능 모델 저장 및 Early Stopping 로직
        if val_f1 > best_val_f1:
            best_val_f1 = val_f1
            torch.save(model.state_dict(), "best_model.pth")
            print(f"모델 저장됨: best_model.pth (F1: {val_f1:.4f})")
            patience_counter = 0  # 성능이 향상되었으므로 카운터 초기화
        else:
            patience_counter += 1  # 성능이 향상되지 않았으므로 카운터 증가
            print(f"성능 향상 없음: {patience_counter}/{EARLY_STOPPING_PATIENCE}")

            # Early Stopping 조건 확인
            if patience_counter >= EARLY_STOPPING_PATIENCE:
                print(f"\nEarly Stopping! {EARLY_STOPPING_PATIENCE}번의 에폭 동안 성능 향상 없음.")
                break

    # 학습 과정 시각화
    plt.figure(figsize=(12, 8))

    plt.subplot(2, 2, 1)
    plt.plot(train_losses, label='Train Loss')
    plt.plot(val_losses, label='Validation Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()
    plt.title('Training and Validation Loss')

    plt.subplot(2, 2, 2)
    plt.plot(val_f1_scores, label='Validation F1')
    plt.xlabel('Epoch')
    plt.ylabel('F1 Score')
    plt.legend()
    plt.title('Validation F1 Score')

    plt.subplot(2, 2, 3)
    plt.plot(learning_rates, label='Learning Rate')
    plt.xlabel('Epoch')
    plt.ylabel('Learning Rate')
    plt.legend()
    plt.title('Learning Rate Schedule')

    plt.tight_layout()
    plt.savefig('training_history.png')
    plt.close()

    # 최고 성능 모델 로드
    model.load_state_dict(torch.load("best_model.pth"))

    # 테스트 세트 평가
    test_loss, test_predictions, test_labels = evaluate_model(model, test_data_loader, device, class_weights_tensor)
    test_f1 = f1_score(test_labels, test_predictions, average='macro')

    print("\n테스트 결과:")
    print(f"Test Loss: {test_loss:.4f}")
    print(f"Test Macro F1: {test_f1:.4f}")

    # 분류 보고서 출력
    class_names = [ID_TO_LABEL[i] for i in range(len(LABEL_DICT))]
    print("\n분류 보고서:")
    print(classification_report(test_labels, test_predictions, target_names=class_names))

    # 혼동 행렬 시각화
    cm = confusion_matrix(test_labels, test_predictions)
    plot_confusion_matrix(cm, class_names)

    return model

# 11. 실제 테스트 데이터 예측 및 제출 파일 생성
def predict_and_save():
    # 테스트 파일 로드
    test_data = pd.read_csv(TEST_FILE)

    # Dataset 생성
    class TestDataset(Dataset):
        def __init__(self, texts, tokenizer, max_len):
            self.texts = texts
            self.tokenizer = tokenizer
            self.max_len = max_len

        def __len__(self):
            return len(self.texts)

        def __getitem__(self, idx):
            text = str(self.texts[idx])

            encoding = self.tokenizer.encode_plus(
                text,
                add_special_tokens=True,
                max_length=self.max_len,
                return_token_type_ids=True,
                padding='max_length',
                truncation=True,
                return_attention_mask=True,
                return_tensors='pt'
            )

            return {
                'text': text,
                'input_ids': encoding['input_ids'].flatten(),
                'attention_mask': encoding['attention_mask'].flatten(),
                'token_type_ids': encoding['token_type_ids'].flatten(),
            }

    # 테스트 데이터 로더 생성
    test_dataset = TestDataset(
        texts=test_data['text'].values,
        tokenizer=tokenizer,
        max_len=MAX_LEN
    )

    test_data_loader = DataLoader(
        test_dataset,
        batch_size=BATCH_SIZE,
        num_workers=2
    )

    # GPU 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")

    # 최고 성능 모델 로드
    model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))
    model.load_state_dict(torch.load("best_model.pth"))
    model.to(device)

    # 예측
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(test_data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    # 예측 결과 라벨로 변환
    label_predictions = [ID_TO_LABEL[p] for p in predictions]

    # 제출 파일 생성
    submission = pd.DataFrame({
        'idx': test_data['idx'],
        'class': label_predictions
    })

    submission.to_csv('submission.csv', index=False)
    print(f"제출 파일 생성 완료: submission.csv")

# 메인 실행
if __name__ == "__main__":
    # 모델 학습
    model = train()

    # 테스트 데이터 예측 및 제출 파일 생성
    predict_and_save()

데이터 로드 중...
학습 데이터 크기: 3477
검증 데이터 크기: 745
테스트 데이터 크기: 746
학습 데이터의 클래스 분포:
class
4    786
3    707
1    681
2    679
0    624
Name: count, dtype: int64
모델 'monologg/koelectra-base-v3-discriminator' 로드 중...


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


✅ 학습 대상: classifier.dense.weight
✅ 학습 대상: classifier.dense.bias
✅ 학습 대상: classifier.out_proj.weight
✅ 학습 대상: classifier.out_proj.bias
🔢 학습 대상 파라미터 수: 594,437 / 전체 파라미터 수: 112,925,189 (0.53%)
수동 설정된 클래스별 가중치:
클래스 0 (협박 대화): 1.8000
클래스 1 (갈취 대화): 1.8000
클래스 2 (직장 내 괴롭힘 대화): 1.8000
클래스 3 (기타 괴롭힘 대화): 2.0000
클래스 4 (일반 대화): 0.7000
사용 중인 디바이스: cuda:0

Epoch 1/100 (학습률: 1.50e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.64it/s, loss=1.5838]


Train Loss: 1.5838


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.65it/s]


Validation Loss: 1.5604
Validation Macro F1: 0.0674
클래스 0 (협박 대화) F1: 0.0000
클래스 1 (갈취 대화) F1: 0.0000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.0000
클래스 3 (기타 괴롭힘 대화) F1: 0.3371
클래스 4 (일반 대화) F1: 0.0000
모델 저장됨: best_model.pth (F1: 0.0674)

Epoch 2/100 (학습률: 1.49e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.5609]


Train Loss: 1.5609


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.74it/s]


Validation Loss: 1.5492
Validation Macro F1: 0.0674
클래스 0 (협박 대화) F1: 0.0000
클래스 1 (갈취 대화) F1: 0.0000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.0000
클래스 3 (기타 괴롭힘 대화) F1: 0.3371
클래스 4 (일반 대화) F1: 0.0000
성능 향상 없음: 1/5

Epoch 3/100 (학습률: 1.47e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.74it/s, loss=1.5513]


Train Loss: 1.5513


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.43it/s]


Validation Loss: 1.5395
Validation Macro F1: 0.0678
클래스 0 (협박 대화) F1: 0.0000
클래스 1 (갈취 대화) F1: 0.0000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.0000
클래스 3 (기타 괴롭힘 대화) F1: 0.3389
클래스 4 (일반 대화) F1: 0.0000
모델 저장됨: best_model.pth (F1: 0.0678)

Epoch 4/100 (학습률: 1.45e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.83it/s, loss=1.5411]


Train Loss: 1.5411


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.59it/s]


Validation Loss: 1.5294
Validation Macro F1: 0.0737
클래스 0 (협박 대화) F1: 0.0145
클래스 1 (갈취 대화) F1: 0.0000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.0132
클래스 3 (기타 괴롭힘 대화) F1: 0.3409
클래스 4 (일반 대화) F1: 0.0000
모델 저장됨: best_model.pth (F1: 0.0737)

Epoch 5/100 (학습률: 1.44e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.5309]


Train Loss: 1.5309


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.64it/s]


Validation Loss: 1.5182
Validation Macro F1: 0.0906
클래스 0 (협박 대화) F1: 0.0286
클래스 1 (갈취 대화) F1: 0.0000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.0828
클래스 3 (기타 괴롭힘 대화) F1: 0.3414
클래스 4 (일반 대화) F1: 0.0000
모델 저장됨: best_model.pth (F1: 0.0906)

Epoch 6/100 (학습률: 1.42e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.72it/s, loss=1.5223]


Train Loss: 1.5223


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.72it/s]


Validation Loss: 1.5066
Validation Macro F1: 0.1410
클래스 0 (협박 대화) F1: 0.0556
클래스 1 (갈취 대화) F1: 0.0135
클래스 2 (직장 내 괴롭힘 대화) F1: 0.1421
클래스 3 (기타 괴롭힘 대화) F1: 0.3501
클래스 4 (일반 대화) F1: 0.1436
모델 저장됨: best_model.pth (F1: 0.1410)

Epoch 7/100 (학습률: 1.41e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.5098]


Train Loss: 1.5098


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.60it/s]


Validation Loss: 1.4937
Validation Macro F1: 0.1901
클래스 0 (협박 대화) F1: 0.0548
클래스 1 (갈취 대화) F1: 0.0000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.1846
클래스 3 (기타 괴롭힘 대화) F1: 0.3584
클래스 4 (일반 대화) F1: 0.3529
모델 저장됨: best_model.pth (F1: 0.1901)

Epoch 8/100 (학습률: 1.40e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.80it/s, loss=1.4971]


Train Loss: 1.4971


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.4797
Validation Macro F1: 0.2407
클래스 0 (협박 대화) F1: 0.0680
클래스 1 (갈취 대화) F1: 0.0267
클래스 2 (직장 내 괴롭힘 대화) F1: 0.2245
클래스 3 (기타 괴롭힘 대화) F1: 0.3709
클래스 4 (일반 대화) F1: 0.5133
모델 저장됨: best_model.pth (F1: 0.2407)

Epoch 9/100 (학습률: 1.38e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.73it/s, loss=1.4833]


Train Loss: 1.4833


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.63it/s]


Validation Loss: 1.4649
Validation Macro F1: 0.2648
클래스 0 (협박 대화) F1: 0.0805
클래스 1 (갈취 대화) F1: 0.0397
클래스 2 (직장 내 괴롭힘 대화) F1: 0.2245
클래스 3 (기타 괴롭힘 대화) F1: 0.3793
클래스 4 (일반 대화) F1: 0.6000
모델 저장됨: best_model.pth (F1: 0.2648)

Epoch 10/100 (학습률: 1.37e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.78it/s, loss=1.4721]


Train Loss: 1.4721


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.57it/s]


Validation Loss: 1.4500
Validation Macro F1: 0.3061
클래스 0 (협박 대화) F1: 0.1060
클래스 1 (갈취 대화) F1: 0.1026
클래스 2 (직장 내 괴롭힘 대화) F1: 0.2613
클래스 3 (기타 괴롭힘 대화) F1: 0.3885
클래스 4 (일반 대화) F1: 0.6719
모델 저장됨: best_model.pth (F1: 0.3061)

Epoch 11/100 (학습률: 1.35e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.79it/s, loss=1.4623]


Train Loss: 1.4623


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.4363
Validation Macro F1: 0.3468
클래스 0 (협박 대화) F1: 0.2061
클래스 1 (갈취 대화) F1: 0.1266
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3039
클래스 3 (기타 괴롭힘 대화) F1: 0.4000
클래스 4 (일반 대화) F1: 0.6977
모델 저장됨: best_model.pth (F1: 0.3468)

Epoch 12/100 (학습률: 1.34e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.73it/s, loss=1.4451]


Train Loss: 1.4451


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.69it/s]


Validation Loss: 1.4225
Validation Macro F1: 0.3443
클래스 0 (협박 대화) F1: 0.2118
클래스 1 (갈취 대화) F1: 0.0897
클래스 2 (직장 내 괴롭힘 대화) F1: 0.2952
클래스 3 (기타 괴롭힘 대화) F1: 0.3953
클래스 4 (일반 대화) F1: 0.7293
성능 향상 없음: 1/5

Epoch 13/100 (학습률: 1.32e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.84it/s, loss=1.4348]


Train Loss: 1.4348


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.56it/s]


Validation Loss: 1.4089
Validation Macro F1: 0.3675
클래스 0 (협박 대화) F1: 0.2235
클래스 1 (갈취 대화) F1: 0.1566
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3062
클래스 3 (기타 괴롭힘 대화) F1: 0.4030
클래스 4 (일반 대화) F1: 0.7481
모델 저장됨: best_model.pth (F1: 0.3675)

Epoch 14/100 (학습률: 1.31e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.84it/s, loss=1.4214]


Train Loss: 1.4214


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.70it/s]


Validation Loss: 1.3971
Validation Macro F1: 0.3802
클래스 0 (협박 대화) F1: 0.2428
클래스 1 (갈취 대화) F1: 0.1677
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3303
클래스 3 (기타 괴롭힘 대화) F1: 0.4012
클래스 4 (일반 대화) F1: 0.7591
모델 저장됨: best_model.pth (F1: 0.3802)

Epoch 15/100 (학습률: 1.29e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.74it/s, loss=1.4106]


Train Loss: 1.4106


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.69it/s]


Validation Loss: 1.3859
Validation Macro F1: 0.4102
클래스 0 (협박 대화) F1: 0.2811
클래스 1 (갈취 대화) F1: 0.2386
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3439
클래스 3 (기타 괴롭힘 대화) F1: 0.4134
클래스 4 (일반 대화) F1: 0.7742
모델 저장됨: best_model.pth (F1: 0.4102)

Epoch 16/100 (학습률: 1.27e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.78it/s, loss=1.3995]


Train Loss: 1.3995


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.3756
Validation Macro F1: 0.4327
클래스 0 (협박 대화) F1: 0.3141
클래스 1 (갈취 대화) F1: 0.2827
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3684
클래스 3 (기타 괴롭힘 대화) F1: 0.4181
클래스 4 (일반 대화) F1: 0.7801
모델 저장됨: best_model.pth (F1: 0.4327)

Epoch 17/100 (학습률: 1.26e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.83it/s, loss=1.3911]


Train Loss: 1.3911


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.61it/s]


Validation Loss: 1.3662
Validation Macro F1: 0.4312
클래스 0 (협박 대화) F1: 0.3053
클래스 1 (갈취 대화) F1: 0.2623
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3900
클래스 3 (기타 괴롭힘 대화) F1: 0.4109
클래스 4 (일반 대화) F1: 0.7875
성능 향상 없음: 1/5

Epoch 18/100 (학습률: 1.24e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.84it/s, loss=1.3781]


Train Loss: 1.3781


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.68it/s]


Validation Loss: 1.3572
Validation Macro F1: 0.4244
클래스 0 (협박 대화) F1: 0.3021
클래스 1 (갈취 대화) F1: 0.2541
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3581
클래스 3 (기타 괴롭힘 대화) F1: 0.4147
클래스 4 (일반 대화) F1: 0.7931
성능 향상 없음: 2/5

Epoch 19/100 (학습률: 1.23e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.83it/s, loss=1.3701]


Train Loss: 1.3701


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.3494
Validation Macro F1: 0.4556
클래스 0 (협박 대화) F1: 0.3547
클래스 1 (갈취 대화) F1: 0.2796
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4127
클래스 3 (기타 괴롭힘 대화) F1: 0.4216
클래스 4 (일반 대화) F1: 0.8095
모델 저장됨: best_model.pth (F1: 0.4556)

Epoch 20/100 (학습률: 1.22e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.84it/s, loss=1.3683]


Train Loss: 1.3683


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.65it/s]


Validation Loss: 1.3423
Validation Macro F1: 0.4549
클래스 0 (협박 대화) F1: 0.3529
클래스 1 (갈취 대화) F1: 0.2903
클래스 2 (직장 내 괴롭힘 대화) F1: 0.3968
클래스 3 (기타 괴롭힘 대화) F1: 0.4237
클래스 4 (일반 대화) F1: 0.8108
성능 향상 없음: 1/5

Epoch 21/100 (학습률: 1.20e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.79it/s, loss=1.3592]


Train Loss: 1.3592


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.54it/s]


Validation Loss: 1.3354
Validation Macro F1: 0.4756
클래스 0 (협박 대화) F1: 0.3714
클래스 1 (갈취 대화) F1: 0.3366
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4127
클래스 3 (기타 괴롭힘 대화) F1: 0.4373
클래스 4 (일반 대화) F1: 0.8200
모델 저장됨: best_model.pth (F1: 0.4756)

Epoch 22/100 (학습률: 1.19e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.3503]


Train Loss: 1.3503


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.64it/s]


Validation Loss: 1.3289
Validation Macro F1: 0.4808
클래스 0 (협박 대화) F1: 0.3704
클래스 1 (갈취 대화) F1: 0.3558
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4274
클래스 3 (기타 괴롭힘 대화) F1: 0.4333
클래스 4 (일반 대화) F1: 0.8173
모델 저장됨: best_model.pth (F1: 0.4808)

Epoch 23/100 (학습률: 1.17e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.3458]


Train Loss: 1.3458


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.67it/s]


Validation Loss: 1.3219
Validation Macro F1: 0.4867
클래스 0 (협박 대화) F1: 0.3850
클래스 1 (갈취 대화) F1: 0.3524
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4286
클래스 3 (기타 괴롭힘 대화) F1: 0.4440
클래스 4 (일반 대화) F1: 0.8235
모델 저장됨: best_model.pth (F1: 0.4867)

Epoch 24/100 (학습률: 1.16e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.78it/s, loss=1.3426]


Train Loss: 1.3426


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.60it/s]


Validation Loss: 1.3160
Validation Macro F1: 0.4824
클래스 0 (협박 대화) F1: 0.3850
클래스 1 (갈취 대화) F1: 0.3350
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4269
클래스 3 (기타 괴롭힘 대화) F1: 0.4457
클래스 4 (일반 대화) F1: 0.8197
성능 향상 없음: 1/5

Epoch 25/100 (학습률: 1.14e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.3345]


Train Loss: 1.3345


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.63it/s]


Validation Loss: 1.3109
Validation Macro F1: 0.4897
클래스 0 (협박 대화) F1: 0.3628
클래스 1 (갈취 대화) F1: 0.3602
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4488
클래스 3 (기타 괴롭힘 대화) F1: 0.4498
클래스 4 (일반 대화) F1: 0.8269
모델 저장됨: best_model.pth (F1: 0.4897)

Epoch 26/100 (학습률: 1.13e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.73it/s, loss=1.3232]


Train Loss: 1.3232


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.61it/s]


Validation Loss: 1.3051
Validation Macro F1: 0.4990
클래스 0 (협박 대화) F1: 0.3645
클래스 1 (갈취 대화) F1: 0.3909
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4633
클래스 3 (기타 괴롭힘 대화) F1: 0.4495
클래스 4 (일반 대화) F1: 0.8269
모델 저장됨: best_model.pth (F1: 0.4990)

Epoch 27/100 (학습률: 1.11e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.82it/s, loss=1.3181]


Train Loss: 1.3181


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.65it/s]


Validation Loss: 1.2999
Validation Macro F1: 0.5081
클래스 0 (협박 대화) F1: 0.3929
클래스 1 (갈취 대화) F1: 0.3927
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4627
클래스 3 (기타 괴롭힘 대화) F1: 0.4551
클래스 4 (일반 대화) F1: 0.8371
모델 저장됨: best_model.pth (F1: 0.5081)

Epoch 28/100 (학습률: 1.10e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.72it/s, loss=1.3143]


Train Loss: 1.3143


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.2947
Validation Macro F1: 0.5085
클래스 0 (협박 대화) F1: 0.3982
클래스 1 (갈취 대화) F1: 0.3704
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4812
클래스 3 (기타 괴롭힘 대화) F1: 0.4557
클래스 4 (일반 대화) F1: 0.8371
모델 저장됨: best_model.pth (F1: 0.5085)

Epoch 29/100 (학습률: 1.08e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.3136]


Train Loss: 1.3136


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.2900
Validation Macro F1: 0.5122
클래스 0 (협박 대화) F1: 0.3909
클래스 1 (갈취 대화) F1: 0.3911
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4851
클래스 3 (기타 괴롭힘 대화) F1: 0.4569
클래스 4 (일반 대화) F1: 0.8371
모델 저장됨: best_model.pth (F1: 0.5122)

Epoch 30/100 (학습률: 1.06e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.74it/s, loss=1.3020]


Train Loss: 1.3020


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.72it/s]


Validation Loss: 1.2860
Validation Macro F1: 0.5299
클래스 0 (협박 대화) F1: 0.4229
클래스 1 (갈취 대화) F1: 0.4211
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4833
클래스 3 (기타 괴롭힘 대화) F1: 0.4732
클래스 4 (일반 대화) F1: 0.8491
모델 저장됨: best_model.pth (F1: 0.5299)

Epoch 31/100 (학습률: 1.05e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.82it/s, loss=1.3036]


Train Loss: 1.3036


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.72it/s]


Validation Loss: 1.2818
Validation Macro F1: 0.5207
클래스 0 (협박 대화) F1: 0.4159
클래스 1 (갈취 대화) F1: 0.3853
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4924
클래스 3 (기타 괴롭힘 대화) F1: 0.4645
클래스 4 (일반 대화) F1: 0.8454
성능 향상 없음: 1/5

Epoch 32/100 (학습률: 1.03e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.74it/s, loss=1.3036]


Train Loss: 1.3036


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.56it/s]


Validation Loss: 1.2769
Validation Macro F1: 0.5265
클래스 0 (협박 대화) F1: 0.4229
클래스 1 (갈취 대화) F1: 0.3929
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4963
클래스 3 (기타 괴롭힘 대화) F1: 0.4724
클래스 4 (일반 대화) F1: 0.8481
성능 향상 없음: 2/5

Epoch 33/100 (학습률: 1.02e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.79it/s, loss=1.2957]


Train Loss: 1.2957


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.65it/s]


Validation Loss: 1.2729
Validation Macro F1: 0.5393
클래스 0 (협박 대화) F1: 0.4473
클래스 1 (갈취 대화) F1: 0.4192
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5000
클래스 3 (기타 괴롭힘 대화) F1: 0.4784
클래스 4 (일반 대화) F1: 0.8517
모델 저장됨: best_model.pth (F1: 0.5393)

Epoch 34/100 (학습률: 1.01e-05)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.2896]


Train Loss: 1.2896


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.2689
Validation Macro F1: 0.5412
클래스 0 (협박 대화) F1: 0.4519
클래스 1 (갈취 대화) F1: 0.4262
클래스 2 (직장 내 괴롭힘 대화) F1: 0.4924
클래스 3 (기타 괴롭힘 대화) F1: 0.4800
클래스 4 (일반 대화) F1: 0.8553
모델 저장됨: best_model.pth (F1: 0.5412)

Epoch 35/100 (학습률: 9.90e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.79it/s, loss=1.2877]


Train Loss: 1.2877


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.69it/s]


Validation Loss: 1.2651
Validation Macro F1: 0.5435
클래스 0 (협박 대화) F1: 0.4454
클래스 1 (갈취 대화) F1: 0.4255
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5111
클래스 3 (기타 괴롭힘 대화) F1: 0.4731
클래스 4 (일반 대화) F1: 0.8625
모델 저장됨: best_model.pth (F1: 0.5435)

Epoch 36/100 (학습률: 9.75e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.70it/s, loss=1.2834]


Train Loss: 1.2834


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.65it/s]


Validation Loss: 1.2616
Validation Macro F1: 0.5444
클래스 0 (협박 대화) F1: 0.4500
클래스 1 (갈취 대화) F1: 0.4229
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5109
클래스 3 (기타 괴롭힘 대화) F1: 0.4791
클래스 4 (일반 대화) F1: 0.8589
모델 저장됨: best_model.pth (F1: 0.5444)

Epoch 37/100 (학습률: 9.60e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.2775]


Train Loss: 1.2775


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.61it/s]


Validation Loss: 1.2576
Validation Macro F1: 0.5418
클래스 0 (협박 대화) F1: 0.4388
클래스 1 (갈취 대화) F1: 0.4279
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5091
클래스 3 (기타 괴롭힘 대화) F1: 0.4744
클래스 4 (일반 대화) F1: 0.8589
성능 향상 없음: 1/5

Epoch 38/100 (학습률: 9.45e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.73it/s, loss=1.2765]


Train Loss: 1.2765


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.74it/s]


Validation Loss: 1.2542
Validation Macro F1: 0.5493
클래스 0 (협박 대화) F1: 0.4628
클래스 1 (갈취 대화) F1: 0.4279
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5166
클래스 3 (기타 괴롭힘 대화) F1: 0.4731
클래스 4 (일반 대화) F1: 0.8660
모델 저장됨: best_model.pth (F1: 0.5493)

Epoch 39/100 (학습률: 9.30e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.73it/s, loss=1.2745]


Train Loss: 1.2745


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.68it/s]


Validation Loss: 1.2513
Validation Macro F1: 0.5487
클래스 0 (협박 대화) F1: 0.4519
클래스 1 (갈취 대화) F1: 0.4351
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5147
클래스 3 (기타 괴롭힘 대화) F1: 0.4785
클래스 4 (일반 대화) F1: 0.8634
성능 향상 없음: 1/5

Epoch 40/100 (학습률: 9.15e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.76it/s, loss=1.2683]


Train Loss: 1.2683


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.57it/s]


Validation Loss: 1.2478
Validation Macro F1: 0.5493
클래스 0 (협박 대화) F1: 0.4571
클래스 1 (갈취 대화) F1: 0.4340
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5130
클래스 3 (기타 괴롭힘 대화) F1: 0.4726
클래스 4 (일반 대화) F1: 0.8696
성능 향상 없음: 2/5

Epoch 41/100 (학습률: 9.00e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.72it/s, loss=1.2671]


Train Loss: 1.2671


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.40it/s]


Validation Loss: 1.2450
Validation Macro F1: 0.5470
클래스 0 (협박 대화) F1: 0.4545
클래스 1 (갈취 대화) F1: 0.4359
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5164
클래스 3 (기타 괴롭힘 대화) F1: 0.4615
클래스 4 (일반 대화) F1: 0.8669
성능 향상 없음: 3/5

Epoch 42/100 (학습률: 8.85e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2619]


Train Loss: 1.2619


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.66it/s]


Validation Loss: 1.2414
Validation Macro F1: 0.5495
클래스 0 (협박 대화) F1: 0.4500
클래스 1 (갈취 대화) F1: 0.4333
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5182
클래스 3 (기타 괴롭힘 대화) F1: 0.4757
클래스 4 (일반 대화) F1: 0.8704
모델 저장됨: best_model.pth (F1: 0.5495)

Epoch 43/100 (학습률: 8.70e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.2676]


Train Loss: 1.2676


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.45it/s]


Validation Loss: 1.2389
Validation Macro F1: 0.5508
클래스 0 (협박 대화) F1: 0.4527
클래스 1 (갈취 대화) F1: 0.4351
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5166
클래스 3 (기타 괴롭힘 대화) F1: 0.4757
클래스 4 (일반 대화) F1: 0.8738
모델 저장됨: best_model.pth (F1: 0.5508)

Epoch 44/100 (학습률: 8.55e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.78it/s, loss=1.2571]


Train Loss: 1.2571


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.70it/s]


Validation Loss: 1.2360
Validation Macro F1: 0.5492
클래스 0 (협박 대화) F1: 0.4564
클래스 1 (갈취 대화) F1: 0.4340
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5147
클래스 3 (기타 괴롭힘 대화) F1: 0.4723
클래스 4 (일반 대화) F1: 0.8685
성능 향상 없음: 1/5

Epoch 45/100 (학습률: 8.40e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.80it/s, loss=1.2524]


Train Loss: 1.2524


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.77it/s]


Validation Loss: 1.2318
Validation Macro F1: 0.5539
클래스 0 (협박 대화) F1: 0.4527
클래스 1 (갈취 대화) F1: 0.4310
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5236
클래스 3 (기타 괴롭힘 대화) F1: 0.4856
클래스 4 (일반 대화) F1: 0.8765
모델 저장됨: best_model.pth (F1: 0.5539)

Epoch 46/100 (학습률: 8.25e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.76it/s, loss=1.2530]


Train Loss: 1.2530


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.55it/s]


Validation Loss: 1.2286
Validation Macro F1: 0.5599
클래스 0 (협박 대화) F1: 0.4777
클래스 1 (갈취 대화) F1: 0.4333
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5305
클래스 3 (기타 괴롭힘 대화) F1: 0.4788
클래스 4 (일반 대화) F1: 0.8793
모델 저장됨: best_model.pth (F1: 0.5599)

Epoch 47/100 (학습률: 8.10e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.2497]


Train Loss: 1.2497


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.72it/s]


Validation Loss: 1.2260
Validation Macro F1: 0.5519
클래스 0 (협박 대화) F1: 0.4534
클래스 1 (갈취 대화) F1: 0.4280
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5201
클래스 3 (기타 괴롭힘 대화) F1: 0.4814
클래스 4 (일반 대화) F1: 0.8765
성능 향상 없음: 1/5

Epoch 48/100 (학습률: 7.95e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.2505]


Train Loss: 1.2505


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.69it/s]


Validation Loss: 1.2232
Validation Macro F1: 0.5599
클래스 0 (협박 대화) F1: 0.4672
클래스 1 (갈취 대화) F1: 0.4408
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5333
클래스 3 (기타 괴롭힘 대화) F1: 0.4833
클래스 4 (일반 대화) F1: 0.8746
성능 향상 없음: 2/5

Epoch 49/100 (학습률: 7.80e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.80it/s, loss=1.2466]


Train Loss: 1.2466


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.59it/s]


Validation Loss: 1.2208
Validation Macro F1: 0.5643
클래스 0 (협박 대화) F1: 0.4739
클래스 1 (갈취 대화) F1: 0.4472
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5338
클래스 3 (기타 괴롭힘 대화) F1: 0.4858
클래스 4 (일반 대화) F1: 0.8807
모델 저장됨: best_model.pth (F1: 0.5643)

Epoch 50/100 (학습률: 7.65e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2435]


Train Loss: 1.2435


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.72it/s]


Validation Loss: 1.2181
Validation Macro F1: 0.5674
클래스 0 (협박 대화) F1: 0.4861
클래스 1 (갈취 대화) F1: 0.4472
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5371
클래스 3 (기타 괴롭힘 대화) F1: 0.4845
클래스 4 (일반 대화) F1: 0.8820
모델 저장됨: best_model.pth (F1: 0.5674)

Epoch 51/100 (학습률: 7.50e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.70it/s, loss=1.2325]


Train Loss: 1.2325


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.63it/s]


Validation Loss: 1.2166
Validation Macro F1: 0.5655
클래스 0 (협박 대화) F1: 0.4819
클래스 1 (갈취 대화) F1: 0.4472
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5319
클래스 3 (기타 괴롭힘 대화) F1: 0.4883
클래스 4 (일반 대화) F1: 0.8780
성능 향상 없음: 1/5

Epoch 52/100 (학습률: 7.35e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.83it/s, loss=1.2487]


Train Loss: 1.2487


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.62it/s]


Validation Loss: 1.2138
Validation Macro F1: 0.5610
클래스 0 (협박 대화) F1: 0.4701
클래스 1 (갈취 대화) F1: 0.4516
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5217
클래스 3 (기타 괴롭힘 대화) F1: 0.4781
클래스 4 (일반 대화) F1: 0.8834
성능 향상 없음: 2/5

Epoch 53/100 (학습률: 7.20e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.84it/s, loss=1.2390]


Train Loss: 1.2390


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.64it/s]


Validation Loss: 1.2119
Validation Macro F1: 0.5664
클래스 0 (협박 대화) F1: 0.4841
클래스 1 (갈취 대화) F1: 0.4508
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5357
클래스 3 (기타 괴롭힘 대화) F1: 0.4806
클래스 4 (일반 대화) F1: 0.8807
성능 향상 없음: 3/5

Epoch 54/100 (학습률: 7.05e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.2303]


Train Loss: 1.2303


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.69it/s]


Validation Loss: 1.2089
Validation Macro F1: 0.5653
클래스 0 (협박 대화) F1: 0.4659
클래스 1 (갈취 대화) F1: 0.4435
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5442
클래스 3 (기타 괴롭힘 대화) F1: 0.4896
클래스 4 (일반 대화) F1: 0.8834
성능 향상 없음: 4/5

Epoch 55/100 (학습률: 6.90e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.2342]


Train Loss: 1.2342


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.68it/s]


Validation Loss: 1.2072
Validation Macro F1: 0.5694
클래스 0 (협박 대화) F1: 0.4882
클래스 1 (갈취 대화) F1: 0.4398
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5423
클래스 3 (기타 괴롭힘 대화) F1: 0.4935
클래스 4 (일반 대화) F1: 0.8834
모델 저장됨: best_model.pth (F1: 0.5694)

Epoch 56/100 (학습률: 6.75e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2339]


Train Loss: 1.2339


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.2054
Validation Macro F1: 0.5756
클래스 0 (협박 대화) F1: 0.4841
클래스 1 (갈취 대화) F1: 0.4498
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5474
클래스 3 (기타 괴롭힘 대화) F1: 0.5054
클래스 4 (일반 대화) F1: 0.8916
모델 저장됨: best_model.pth (F1: 0.5756)

Epoch 57/100 (학습률: 6.60e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.72it/s, loss=1.2210]


Train Loss: 1.2210


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.65it/s]


Validation Loss: 1.2026
Validation Macro F1: 0.5744
클래스 0 (협박 대화) F1: 0.4863
클래스 1 (갈취 대화) F1: 0.4427
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5461
클래스 3 (기타 괴롭힘 대화) F1: 0.5040
클래스 4 (일반 대화) F1: 0.8930
성능 향상 없음: 1/5

Epoch 58/100 (학습률: 6.45e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.72it/s, loss=1.2304]


Train Loss: 1.2304


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.56it/s]


Validation Loss: 1.2008
Validation Macro F1: 0.5673
클래스 0 (협박 대화) F1: 0.4844
클래스 1 (갈취 대화) F1: 0.4382
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5357
클래스 3 (기타 괴롭힘 대화) F1: 0.4921
클래스 4 (일반 대화) F1: 0.8862
성능 향상 없음: 2/5

Epoch 59/100 (학습률: 6.30e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.80it/s, loss=1.2323]


Train Loss: 1.2323


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.60it/s]


Validation Loss: 1.1986
Validation Macro F1: 0.5707
클래스 0 (협박 대화) F1: 0.4961
클래스 1 (갈취 대화) F1: 0.4435
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5357
클래스 3 (기타 괴롭힘 대화) F1: 0.4895
클래스 4 (일반 대화) F1: 0.8889
성능 향상 없음: 3/5

Epoch 60/100 (학습률: 6.15e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.73it/s, loss=1.2205]


Train Loss: 1.2205


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.70it/s]


Validation Loss: 1.1967
Validation Macro F1: 0.5744
클래스 0 (협박 대화) F1: 0.4903
클래스 1 (갈취 대화) F1: 0.4462
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5390
클래스 3 (기타 괴롭힘 대화) F1: 0.5000
클래스 4 (일반 대화) F1: 0.8963
성능 향상 없음: 4/5

Epoch 61/100 (학습률: 6.00e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.79it/s, loss=1.2204]


Train Loss: 1.2204


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.62it/s]


Validation Loss: 1.1946
Validation Macro F1: 0.5775
클래스 0 (협박 대화) F1: 0.4941
클래스 1 (갈취 대화) F1: 0.4435
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5442
클래스 3 (기타 괴롭힘 대화) F1: 0.5027
클래스 4 (일반 대화) F1: 0.9030
모델 저장됨: best_model.pth (F1: 0.5775)

Epoch 62/100 (학습률: 5.85e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.74it/s, loss=1.2216]


Train Loss: 1.2216


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.61it/s]


Validation Loss: 1.1931
Validation Macro F1: 0.5731
클래스 0 (협박 대화) F1: 0.4903
클래스 1 (갈취 대화) F1: 0.4480
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5309
클래스 3 (기타 괴롭힘 대화) F1: 0.5000
클래스 4 (일반 대화) F1: 0.8963
성능 향상 없음: 1/5

Epoch 63/100 (학습률: 5.70e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.67it/s, loss=1.2190]


Train Loss: 1.2190


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.73it/s]


Validation Loss: 1.1911
Validation Macro F1: 0.5763
클래스 0 (협박 대화) F1: 0.4922
클래스 1 (갈취 대화) F1: 0.4472
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5390
클래스 3 (기타 괴롭힘 대화) F1: 0.5000
클래스 4 (일반 대화) F1: 0.9030
성능 향상 없음: 2/5

Epoch 64/100 (학습률: 5.55e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.82it/s, loss=1.2196]


Train Loss: 1.2196


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.66it/s]


Validation Loss: 1.1895
Validation Macro F1: 0.5763
클래스 0 (협박 대화) F1: 0.4922
클래스 1 (갈취 대화) F1: 0.4472
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5390
클래스 3 (기타 괴롭힘 대화) F1: 0.5000
클래스 4 (일반 대화) F1: 0.9030
성능 향상 없음: 3/5

Epoch 65/100 (학습률: 5.40e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.2147]


Train Loss: 1.2147


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.51it/s]


Validation Loss: 1.1881
Validation Macro F1: 0.5766
클래스 0 (협박 대화) F1: 0.4865
클래스 1 (갈취 대화) F1: 0.4542
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5382
클래스 3 (기타 괴롭힘 대화) F1: 0.5013
클래스 4 (일반 대화) F1: 0.9030
성능 향상 없음: 4/5

Epoch 66/100 (학습률: 5.25e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.80it/s, loss=1.2224]


Train Loss: 1.2224


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.62it/s]


Validation Loss: 1.1869
Validation Macro F1: 0.5804
클래스 0 (협박 대화) F1: 0.4942
클래스 1 (갈취 대화) F1: 0.4553
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5461
클래스 3 (기타 괴롭힘 대화) F1: 0.5000
클래스 4 (일반 대화) F1: 0.9063
모델 저장됨: best_model.pth (F1: 0.5804)

Epoch 67/100 (학습률: 5.10e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.76it/s, loss=1.2141]


Train Loss: 1.2141


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.57it/s]


Validation Loss: 1.1854
Validation Macro F1: 0.5805
클래스 0 (협박 대화) F1: 0.4942
클래스 1 (갈취 대화) F1: 0.4553
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5480
클래스 3 (기타 괴롭힘 대화) F1: 0.4987
클래스 4 (일반 대화) F1: 0.9063
모델 저장됨: best_model.pth (F1: 0.5805)

Epoch 68/100 (학습률: 4.95e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2151]


Train Loss: 1.2151


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.75it/s]


Validation Loss: 1.1843
Validation Macro F1: 0.5837
클래스 0 (협박 대화) F1: 0.4981
클래스 1 (갈취 대화) F1: 0.4729
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5448
클래스 3 (기타 괴롭힘 대화) F1: 0.4959
클래스 4 (일반 대화) F1: 0.9069
모델 저장됨: best_model.pth (F1: 0.5837)

Epoch 69/100 (학습률: 4.80e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2105]


Train Loss: 1.2105


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.68it/s]


Validation Loss: 1.1820
Validation Macro F1: 0.5859
클래스 0 (협박 대화) F1: 0.4942
클래스 1 (갈취 대화) F1: 0.4664
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5544
클래스 3 (기타 괴롭힘 대화) F1: 0.5083
클래스 4 (일반 대화) F1: 0.9063
모델 저장됨: best_model.pth (F1: 0.5859)

Epoch 70/100 (학습률: 4.65e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.80it/s, loss=1.2097]


Train Loss: 1.2097


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.66it/s]


Validation Loss: 1.1808
Validation Macro F1: 0.5863
클래스 0 (협박 대화) F1: 0.4942
클래스 1 (갈취 대화) F1: 0.4743
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5500
클래스 3 (기타 괴롭힘 대화) F1: 0.5068
클래스 4 (일반 대화) F1: 0.9063
모델 저장됨: best_model.pth (F1: 0.5863)

Epoch 71/100 (학습률: 4.50e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2068]


Train Loss: 1.2068


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.63it/s]


Validation Loss: 1.1793
Validation Macro F1: 0.5863
클래스 0 (협박 대화) F1: 0.5000
클래스 1 (갈취 대화) F1: 0.4724
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5448
클래스 3 (기타 괴롭힘 대화) F1: 0.5081
클래스 4 (일반 대화) F1: 0.9063
모델 저장됨: best_model.pth (F1: 0.5863)

Epoch 72/100 (학습률: 4.35e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.69it/s, loss=1.2110]


Train Loss: 1.2110


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.66it/s]


Validation Loss: 1.1780
Validation Macro F1: 0.5839
클래스 0 (협박 대화) F1: 0.4961
클래스 1 (갈취 대화) F1: 0.4710
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5362
클래스 3 (기타 괴롭힘 대화) F1: 0.5068
클래스 4 (일반 대화) F1: 0.9091
성능 향상 없음: 1/5

Epoch 73/100 (학습률: 4.20e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.78it/s, loss=1.2096]


Train Loss: 1.2096


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.60it/s]


Validation Loss: 1.1780
Validation Macro F1: 0.5855
클래스 0 (협박 대화) F1: 0.4961
클래스 1 (갈취 대화) F1: 0.4701
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5429
클래스 3 (기타 괴롭힘 대화) F1: 0.5054
클래스 4 (일반 대화) F1: 0.9129
성능 향상 없음: 2/5

Epoch 74/100 (학습률: 4.05e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.76it/s, loss=1.2004]


Train Loss: 1.2004


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.71it/s]


Validation Loss: 1.1764
Validation Macro F1: 0.5868
클래스 0 (협박 대화) F1: 0.4981
클래스 1 (갈취 대화) F1: 0.4622
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5575
클래스 3 (기타 괴롭힘 대화) F1: 0.5069
클래스 4 (일반 대화) F1: 0.9096
모델 저장됨: best_model.pth (F1: 0.5868)

Epoch 75/100 (학습률: 3.90e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.76it/s, loss=1.2040]


Train Loss: 1.2040


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.64it/s]


Validation Loss: 1.1752
Validation Macro F1: 0.5846
클래스 0 (협박 대화) F1: 0.4942
클래스 1 (갈취 대화) F1: 0.4784
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5343
클래스 3 (기타 괴롭힘 대화) F1: 0.5123
클래스 4 (일반 대화) F1: 0.9036
성능 향상 없음: 1/5

Epoch 76/100 (학습률: 3.75e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.79it/s, loss=1.2010]


Train Loss: 1.2010


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.67it/s]


Validation Loss: 1.1738
Validation Macro F1: 0.5822
클래스 0 (협박 대화) F1: 0.4942
클래스 1 (갈취 대화) F1: 0.4729
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5309
클래스 3 (기타 괴롭힘 대화) F1: 0.5068
클래스 4 (일반 대화) F1: 0.9063
성능 향상 없음: 2/5

Epoch 77/100 (학습률: 3.60e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.78it/s, loss=1.1986]


Train Loss: 1.1986


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.69it/s]


Validation Loss: 1.1730
Validation Macro F1: 0.5863
클래스 0 (협박 대화) F1: 0.4981
클래스 1 (갈취 대화) F1: 0.4788
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5396
클래스 3 (기타 괴롭힘 대화) F1: 0.5055
클래스 4 (일반 대화) F1: 0.9096
성능 향상 없음: 3/5

Epoch 78/100 (학습률: 3.45e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.72it/s, loss=1.1993]


Train Loss: 1.1993


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.58it/s]


Validation Loss: 1.1718
Validation Macro F1: 0.5898
클래스 0 (협박 대화) F1: 0.4981
클래스 1 (갈취 대화) F1: 0.4803
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5480
클래스 3 (기타 괴롭힘 대화) F1: 0.5096
클래스 4 (일반 대화) F1: 0.9129
모델 저장됨: best_model.pth (F1: 0.5898)

Epoch 79/100 (학습률: 3.30e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.66it/s, loss=1.2063]


Train Loss: 1.2063


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.64it/s]


Validation Loss: 1.1709
Validation Macro F1: 0.5850
클래스 0 (협박 대화) F1: 0.5000
클래스 1 (갈취 대화) F1: 0.4729
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5396
클래스 3 (기타 괴롭힘 대화) F1: 0.5027
클래스 4 (일반 대화) F1: 0.9096
성능 향상 없음: 1/5

Epoch 80/100 (학습률: 3.15e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.75it/s, loss=1.2041]


Train Loss: 1.2041


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.60it/s]


Validation Loss: 1.1702
Validation Macro F1: 0.5864
클래스 0 (협박 대화) F1: 0.5000
클래스 1 (갈취 대화) F1: 0.4766
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5376
클래스 3 (기타 괴롭힘 대화) F1: 0.5054
클래스 4 (일반 대화) F1: 0.9124
성능 향상 없음: 2/5

Epoch 81/100 (학습률: 3.00e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.74it/s, loss=1.2009]


Train Loss: 1.2009


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.70it/s]


Validation Loss: 1.1696
Validation Macro F1: 0.5821
클래스 0 (협박 대화) F1: 0.4961
클래스 1 (갈취 대화) F1: 0.4729
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5290
클래스 3 (기타 괴롭힘 대화) F1: 0.5027
클래스 4 (일반 대화) F1: 0.9096
성능 향상 없음: 3/5

Epoch 82/100 (학습률: 2.85e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.81it/s, loss=1.1960]


Train Loss: 1.1960


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.58it/s]


Validation Loss: 1.1690
Validation Macro F1: 0.5821
클래스 0 (협박 대화) F1: 0.4961
클래스 1 (갈취 대화) F1: 0.4729
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5290
클래스 3 (기타 괴롭힘 대화) F1: 0.5027
클래스 4 (일반 대화) F1: 0.9096
성능 향상 없음: 4/5

Epoch 83/100 (학습률: 2.70e-06)


학습 중: 100%|██████████| 109/109 [00:06<00:00, 17.77it/s, loss=1.2018]


Train Loss: 1.2018


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.75it/s]
  plt.tight_layout()


Validation Loss: 1.1679
Validation Macro F1: 0.5865
클래스 0 (협박 대화) F1: 0.4981
클래스 1 (갈취 대화) F1: 0.4729
클래스 2 (직장 내 괴롭힘 대화) F1: 0.5409
클래스 3 (기타 괴롭힘 대화) F1: 0.5055
클래스 4 (일반 대화) F1: 0.9152
성능 향상 없음: 5/5

Early Stopping! 5번의 에폭 동안 성능 향상 없음.


  plt.savefig('training_history.png')
평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.57it/s]



테스트 결과:
Test Loss: 1.1499
Test Macro F1: 0.6095

분류 보고서:
              precision    recall  f1-score   support

       협박 대화       0.54      0.57      0.55       134
       갈취 대화       0.58      0.40      0.48       146
 직장 내 괴롭힘 대화       0.58      0.50      0.54       145
   기타 괴롭힘 대화       0.48      0.64      0.55       152
       일반 대화       0.92      0.94      0.93       169

    accuracy                           0.62       746
   macro avg       0.62      0.61      0.61       746
weighted avg       0.63      0.62      0.62       746

W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
테스트 예측 중: 100%|██████████| 16/16 [00:01<00:00, 14.85it/s]


제출 파일 생성 완료: submission.csv


#### 전체 모델 한번 학습하기
  - 현재는 ELECTRA 인코더를 고정하고 분류기만 학습하고 있는데, 이는 학습 데이터가 충분하다면 모델의 표현력을 제한할 수 있어 전체 모델을 미세 조정하는 방법을 시도 (F1 점수 높이기 위해서)
  - 비교/대조를 위해 이전 전체 모델 학습 환경에 맞춰 진행
    - 같은 결과 확인
- 클래스 불균형 해결
  - 클래스 가중치 적용: 클래스별 샘플 수에 반비례하는 가중치를 계산하여 적용
    - **성능 향상 있었지만, 아래에서 점수가 예상 이하**  
    https://www.kaggle.com/competitions/aiffel-dl-thon-dktc-online-13-a/submissions
    
    - 모델 개선 시 성능 향상 (점수 향상으로 이어지는) 있겠지만, 최종적으로 학습 데이터 (구성) 탓을 하게 됨

In [None]:
import os
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, f1_score, confusion_matrix
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import ElectraTokenizer, ElectraForSequenceClassification
from transformers import get_linear_schedule_with_warmup, get_cosine_schedule_with_warmup
from torch.optim import AdamW
from tqdm import tqdm
import random
import matplotlib.pyplot as plt
import seaborn as sns
import re
from functools import partial

# 시드 고정
def set_seed(seed_value=42):
    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    torch.cuda.manual_seed_all(seed_value)
    torch.backends.cudnn.deterministic = True

set_seed(42)

# 설정값
MODEL_NAME = "monologg/koelectra-base-v3-discriminator"
MAX_LEN = 128
BATCH_SIZE = 32
EPOCHS = 10
EARLY_STOPPING_PATIENCE = 2
LEARNING_RATE = 2e-5
TRAIN_FILE = "data/train_preprocessed_1.csv"
TEXT_COL = "text"
LABEL_COL = "class"
LABEL_DICT = {'협박 대화': 0, '갈취 대화': 1, '직장 내 괴롭힘 대화': 2, '기타 괴롭힘 대화': 3, '일반 대화': 4}
ID_TO_LABEL = {v: k for k, v in LABEL_DICT.items()}
GPU_NUM = 0
TEST_FILE = "data/test.csv"

# 1. 데이터 로드 및 전처리
print("데이터 로드 중...")
df = pd.read_csv(TRAIN_FILE)

# 라벨 매핑
df[LABEL_COL] = df[LABEL_COL].map(LABEL_DICT)

# 데이터 분할
train_df, temp_df = train_test_split(df, test_size=0.3, random_state=42, stratify=df[LABEL_COL])
val_df, test_df = train_test_split(temp_df, test_size=0.5, random_state=42, stratify=temp_df[LABEL_COL])

print(f"학습 데이터 크기: {len(train_df)}")
print(f"검증 데이터 크기: {len(val_df)}")
print(f"테스트 데이터 크기: {len(test_df)}")

# 클래스별 데이터 개수 확인
print("학습 데이터의 클래스 분포:")
print(train_df[LABEL_COL].value_counts())

# 2. Dataset 클래스 정의
class TextClassificationDataset(Dataset):
    def __init__(self, texts, labels, tokenizer, max_len):
        self.texts = texts
        self.labels = labels
        self.tokenizer = tokenizer
        self.max_len = max_len

    def __len__(self):
        return len(self.texts)

    def __getitem__(self, idx):
        text = str(self.texts[idx])
        label = self.labels[idx]

        encoding = self.tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=self.max_len,
            return_token_type_ids=True,
            padding='max_length',
            truncation=True,
            return_attention_mask=True,
            return_tensors='pt'
        )

        return {
            'text': text,
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'token_type_ids': encoding['token_type_ids'].flatten(),
            'labels': torch.tensor(label, dtype=torch.long)
        }

# 3. 데이터 로더 생성
def create_data_loader(df, tokenizer, max_len, batch_size):
    dataset = TextClassificationDataset(
        texts=df[TEXT_COL].values,
        labels=df[LABEL_COL].values,
        tokenizer=tokenizer,
        max_len=max_len
    )

    return DataLoader(
        dataset,
        batch_size=batch_size,
        num_workers=2
    )

# 4. 토크나이저 및 모델 로드
print(f"모델 '{MODEL_NAME}' 로드 중...")
tokenizer = ElectraTokenizer.from_pretrained(MODEL_NAME)
model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))

# 모든 파라미터 학습 가능하게 설정 (전체 모델 학습)
for param in model.parameters():
    param.requires_grad = True

# 학습 가능한 파라미터 확인 (디버깅용)
trainable_params = 0
all_param = 0
for name, param in model.named_parameters():
    all_param += param.numel()
    if param.requires_grad:
        trainable_params += param.numel()
        print(f"✅ 학습 대상: {name}")
print(f"🔢 학습 대상 파라미터 수: {trainable_params:,} / 전체 파라미터 수: {all_param:,} ({trainable_params/all_param:.2%})")

# 5. 데이터 로더 생성
train_data_loader = create_data_loader(train_df, tokenizer, MAX_LEN, BATCH_SIZE)
val_data_loader = create_data_loader(val_df, tokenizer, MAX_LEN, BATCH_SIZE)
test_data_loader = create_data_loader(test_df, tokenizer, MAX_LEN, BATCH_SIZE)

# 6. 클래스 가중치 설정 (더 세밀하게 조정)
# 성능이 낮은 클래스의 가중치 증가, 성능이 높은 클래스의 가중치 감소
class_weights = [2.8, 2.0, 1.5, 3.8, 0.4]  # 협박↑↑, 갈취=, 직장내괴롭힘↓, 기타괴롭힘↑↑↑↑, 일반대화↓↓

print("수동 설정된 클래스별 가중치:")
for i, weight in enumerate(class_weights):
    print(f"클래스 {i} ({ID_TO_LABEL[i]}): {weight:.4f}")

# 7. 모델 학습 함수 (가중치 적용한 손실 함수 사용)
def train_model(model, data_loader, optimizer, scheduler, device, class_weights_tensor):
    model.train()
    losses = []

    progress_bar = tqdm(data_loader, desc="학습 중")

    for batch in progress_bar:
        optimizer.zero_grad()

        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        token_type_ids = batch['token_type_ids'].to(device)
        labels = batch['labels'].to(device)

        outputs = model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            token_type_ids=token_type_ids,
            labels=labels
        )

        # 기본 손실 함수 대신 가중치가 적용된 손실 함수 사용
        logits = outputs.logits
        loss_fct = torch.nn.CrossEntropyLoss(weight=class_weights_tensor)
        loss = loss_fct(logits.view(-1, model.config.num_labels), labels.view(-1))

        loss.backward()

        # 그래디언트 클리핑 설정 (전체 모델 학습시 안정성 향상)
        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

        optimizer.step()
        scheduler.step()

        losses.append(loss.item())
        progress_bar.set_postfix({"loss": f"{np.mean(losses):.4f}"})

    return np.mean(losses)

# 8. 모델 평가 함수
def evaluate_model(model, data_loader, device, class_weights_tensor=None):
    model.eval()
    losses = []
    predictions = []
    real_labels = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="평가 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)
            labels = batch['labels'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            # 평가 시에도 동일한 가중치 적용
            if class_weights_tensor is not None:
                loss_fct = torch.nn.CrossEntropyLoss(weight=class_weights_tensor)
                loss = loss_fct(outputs.logits.view(-1, model.config.num_labels), labels.view(-1))
            else:
                loss_fct = torch.nn.CrossEntropyLoss()
                loss = loss_fct(outputs.logits.view(-1, model.config.num_labels), labels.view(-1))

            _, preds = torch.max(outputs.logits, dim=1)

            losses.append(loss.item())
            predictions.extend(preds.detach().cpu().numpy())
            real_labels.extend(labels.detach().cpu().numpy())

    return np.mean(losses), predictions, real_labels

# 9. 혼동 행렬 시각화 함수
def plot_confusion_matrix(cm, classes):
    try:
        # 방법 1: 나눔 글꼴 설치 및 사용
        !apt-get update -qq
        !apt-get install fonts-nanum -qq
        plt.rc('font', family='NanumGothic')
    except:
        try:
            # 방법 2: 한글 레이블을 영어로 변환
            classes = ['Threat', 'Extortion', 'Workplace Harassment', 'Other Harassment', 'Normal Conversation']
        except:
            pass

    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=classes, yticklabels=classes)
    plt.xlabel('예측값')
    plt.ylabel('실제값')
    plt.title('혼동 행렬')
    plt.savefig('confusion_matrix.png')
    plt.close()

# 10. 학습 메인 함수
def train():
    # GPU 사용 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")
    print(f"사용 중인 디바이스: {device}")
    model.to(device)

    # 클래스 가중치 텐서를 디바이스로 이동
    class_weights_tensor = torch.FloatTensor(class_weights).to(device)

    # 옵티마이저 설정
    optimizer = AdamW(model.parameters(), lr=LEARNING_RATE)

    # 전체 스텝 설정
    total_steps = len(train_data_loader) * EPOCHS

    # 학습률 스케줄러
    scheduler = get_linear_schedule_with_warmup(
        optimizer,
        num_warmup_steps=0,
        num_training_steps=total_steps
    )

    # 학습 시작
    best_val_f1 = 0
    patience_counter = 0  # Early Stopping을 위한 카운터

    # 에폭별 성능 기록
    train_losses = []
    val_losses = []
    val_f1_scores = []
    learning_rates = []

    for epoch in range(EPOCHS):
        # 현재 학습률 가져오기
        current_lr = optimizer.param_groups[0]['lr']
        learning_rates.append(current_lr)

        print(f"\nEpoch {epoch + 1}/{EPOCHS} (학습률: {current_lr:.2e})")

        # 학습
        train_loss = train_model(model, train_data_loader, optimizer, scheduler, device, class_weights_tensor)
        train_losses.append(train_loss)
        print(f"Train Loss: {train_loss:.4f}")

        # 검증
        val_loss, val_predictions, val_labels = evaluate_model(model, val_data_loader, device, class_weights_tensor)
        val_losses.append(val_loss)
        val_f1 = f1_score(val_labels, val_predictions, average='macro')
        val_f1_scores.append(val_f1)

        print(f"Validation Loss: {val_loss:.4f}")
        print(f"Validation Macro F1: {val_f1:.4f}")

        # 클래스별 F1 점수 출력
        class_f1 = f1_score(val_labels, val_predictions, average=None)
        for i, score in enumerate(class_f1):
            print(f"클래스 {i} ({ID_TO_LABEL[i]}) F1: {score:.4f}")

        # 최고 성능 모델 저장 및 Early Stopping 로직
        if val_f1 > best_val_f1:
            best_val_f1 = val_f1
            torch.save(model.state_dict(), "best_model.pth")
            print(f"모델 저장됨: best_model.pth (F1: {val_f1:.4f})")
            patience_counter = 0  # 성능이 향상되었으므로 카운터 초기화
        else:
            patience_counter += 1  # 성능이 향상되지 않았으므로 카운터 증가
            print(f"성능 향상 없음: {patience_counter}/{EARLY_STOPPING_PATIENCE}")

            # Early Stopping 조건 확인
            if patience_counter >= EARLY_STOPPING_PATIENCE:
                print(f"\nEarly Stopping! {EARLY_STOPPING_PATIENCE}번의 에폭 동안 성능 향상 없음.")
                break

    # 학습 과정 시각화
    plt.figure(figsize=(12, 8))

    plt.subplot(2, 2, 1)
    plt.plot(train_losses, label='Train Loss')
    plt.plot(val_losses, label='Validation Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()
    plt.title('Training and Validation Loss')

    plt.subplot(2, 2, 2)
    plt.plot(val_f1_scores, label='Validation F1')
    plt.xlabel('Epoch')
    plt.ylabel('F1 Score')
    plt.legend()
    plt.title('Validation F1 Score')

    plt.subplot(2, 2, 3)
    plt.plot(learning_rates, label='Learning Rate')
    plt.xlabel('Epoch')
    plt.ylabel('Learning Rate')
    plt.legend()
    plt.title('Learning Rate Schedule')

    plt.tight_layout()
    plt.savefig('training_history.png')
    plt.close()

    # 최고 성능 모델 로드
    model.load_state_dict(torch.load("best_model.pth"))

    # 테스트 세트 평가
    test_loss, test_predictions, test_labels = evaluate_model(model, test_data_loader, device, class_weights_tensor)
    test_f1 = f1_score(test_labels, test_predictions, average='macro')

    print("\n테스트 결과:")
    print(f"Test Loss: {test_loss:.4f}")
    print(f"Test Macro F1: {test_f1:.4f}")

    # 분류 보고서 출력
    class_names = [ID_TO_LABEL[i] for i in range(len(LABEL_DICT))]
    print("\n분류 보고서:")
    print(classification_report(test_labels, test_predictions, target_names=class_names))

    # 혼동 행렬 시각화
    cm = confusion_matrix(test_labels, test_predictions)
    plot_confusion_matrix(cm, class_names)

    return model

# 11. 실제 테스트 데이터 예측 및 제출 파일 생성
def predict_and_save():
    # 테스트 파일 로드
    test_data = pd.read_csv(TEST_FILE)

    # 전처리 함수 설정
    preprocess_fn = partial(
        preprocess,
        stopwords=None,   # 불용어 리스트 사용하지 않음
        speaker_token="",  # 발화 단위 토큰 사용하지 않음
        sep_token=" ", # 줄 구분 토큰
        use_silence=False, # 침묵 토큰 사용하지 않음
        repeat_limit=2 # 반복 문자 2개까지 허용
    )

    # 전처리 적용
    test_data['processed_text'] = test_data['text'].apply(preprocess_fn)

    # Dataset 생성
    class TestDataset(Dataset):
        def __init__(self, texts, tokenizer, max_len):
            self.texts = texts
            self.tokenizer = tokenizer
            self.max_len = max_len

        def __len__(self):
            return len(self.texts)

        def __getitem__(self, idx):
            text = str(self.texts[idx])

            encoding = self.tokenizer.encode_plus(
                text,
                add_special_tokens=True,
                max_length=self.max_len,
                return_token_type_ids=True,
                padding='max_length',
                truncation=True,
                return_attention_mask=True,
                return_tensors='pt'
            )

            return {
                'text': text,
                'input_ids': encoding['input_ids'].flatten(),
                'attention_mask': encoding['attention_mask'].flatten(),
                'token_type_ids': encoding['token_type_ids'].flatten(),
            }

    # 테스트 데이터 로더 생성 (전처리된 텍스트 사용)
    test_dataset = TestDataset(
        texts=test_data['processed_text'].values,
        tokenizer=tokenizer,
        max_len=MAX_LEN
    )

    test_data_loader = DataLoader(
        test_dataset,
        batch_size=BATCH_SIZE,
        num_workers=2
    )

    # GPU 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")

    # 최고 성능 모델 로드
    model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))
    model.load_state_dict(torch.load("best_model.pth"))
    model.to(device)

    # 예측
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(test_data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    # 예측 결과 라벨로 변환
    label_predictions = [ID_TO_LABEL[p] for p in predictions]

    # 제출 파일 생성
    submission = pd.DataFrame({
        'idx': test_data['idx'],
        'class': label_predictions
    })

    submission.to_csv('submission.csv', index=False)
    print(f"제출 파일 생성 완료: submission.csv")

# 메인 실행
if __name__ == "__main__":
    # 모델 학습
    model = train()

    # 테스트 데이터 예측 및 제출 파일 생성
    predict_and_save()

데이터 로드 중...
학습 데이터 크기: 3477
검증 데이터 크기: 745
테스트 데이터 크기: 746
학습 데이터의 클래스 분포:
class
4    786
3    707
1    681
2    679
0    624
Name: count, dtype: int64
모델 'monologg/koelectra-base-v3-discriminator' 로드 중...


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


✅ 학습 대상: electra.embeddings.word_embeddings.weight
✅ 학습 대상: electra.embeddings.position_embeddings.weight
✅ 학습 대상: electra.embeddings.token_type_embeddings.weight
✅ 학습 대상: electra.embeddings.LayerNorm.weight
✅ 학습 대상: electra.embeddings.LayerNorm.bias
✅ 학습 대상: electra.encoder.layer.0.attention.self.query.weight
✅ 학습 대상: electra.encoder.layer.0.attention.self.query.bias
✅ 학습 대상: electra.encoder.layer.0.attention.self.key.weight
✅ 학습 대상: electra.encoder.layer.0.attention.self.key.bias
✅ 학습 대상: electra.encoder.layer.0.attention.self.value.weight
✅ 학습 대상: electra.encoder.layer.0.attention.self.value.bias
✅ 학습 대상: electra.encoder.layer.0.attention.output.dense.weight
✅ 학습 대상: electra.encoder.layer.0.attention.output.dense.bias
✅ 학습 대상: electra.encoder.layer.0.attention.output.LayerNorm.weight
✅ 학습 대상: electra.encoder.layer.0.attention.output.LayerNorm.bias
✅ 학습 대상: electra.encoder.layer.0.intermediate.dense.weight
✅ 학습 대상: electra.encoder.layer.0.intermediate.dense.bias
✅ 학습 대상: electra.enco

학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.15it/s, loss=1.2272]


Train Loss: 1.2272


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.05it/s]


Validation Loss: 0.8842
Validation Macro F1: 0.7292
클래스 0 (협박 대화) F1: 0.6699
클래스 1 (갈취 대화) F1: 0.8000
클래스 2 (직장 내 괴롭힘 대화) F1: 0.6781
클래스 3 (기타 괴롭힘 대화) F1: 0.6067
클래스 4 (일반 대화) F1: 0.8911
모델 저장됨: best_model.pth (F1: 0.7292)

Epoch 2/10 (학습률: 1.80e-05)


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.15it/s, loss=0.6450]


Train Loss: 0.6450


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.66it/s]


Validation Loss: 0.5162
Validation Macro F1: 0.8693
클래스 0 (협박 대화) F1: 0.8028
클래스 1 (갈취 대화) F1: 0.8309
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9176
클래스 3 (기타 괴롭힘 대화) F1: 0.8224
클래스 4 (일반 대화) F1: 0.9726
모델 저장됨: best_model.pth (F1: 0.8693)

Epoch 3/10 (학습률: 1.60e-05)


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.15it/s, loss=0.3958]


Train Loss: 0.3958


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.09it/s]


Validation Loss: 0.4769
Validation Macro F1: 0.8685
클래스 0 (협박 대화) F1: 0.8085
클래스 1 (갈취 대화) F1: 0.8205
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9124
클래스 3 (기타 괴롭힘 대화) F1: 0.8221
클래스 4 (일반 대화) F1: 0.9791
성능 향상 없음: 1/2

Epoch 4/10 (학습률: 1.40e-05)


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.15it/s, loss=0.2624]


Train Loss: 0.2624


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.93it/s]


Validation Loss: 0.4702
Validation Macro F1: 0.8880
클래스 0 (협박 대화) F1: 0.8258
클래스 1 (갈취 대화) F1: 0.8581
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9258
클래스 3 (기타 괴롭힘 대화) F1: 0.8391
클래스 4 (일반 대화) F1: 0.9911
모델 저장됨: best_model.pth (F1: 0.8880)

Epoch 5/10 (학습률: 1.20e-05)


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.15it/s, loss=0.1899]


Train Loss: 0.1899


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.90it/s]


Validation Loss: 0.5040
Validation Macro F1: 0.8848
클래스 0 (협박 대화) F1: 0.8397
클래스 1 (갈취 대화) F1: 0.8364
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9310
클래스 3 (기타 괴롭힘 대화) F1: 0.8375
클래스 4 (일반 대화) F1: 0.9796
성능 향상 없음: 1/2

Epoch 6/10 (학습률: 1.00e-05)


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.16it/s, loss=0.1348]


Train Loss: 0.1348


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.05it/s]


Validation Loss: 0.5188
Validation Macro F1: 0.8946
클래스 0 (협박 대화) F1: 0.8346
클래스 1 (갈취 대화) F1: 0.8658
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9444
클래스 3 (기타 괴롭힘 대화) F1: 0.8371
클래스 4 (일반 대화) F1: 0.9911
모델 저장됨: best_model.pth (F1: 0.8946)

Epoch 7/10 (학습률: 8.00e-06)


학습 중: 100%|██████████| 109/109 [00:18<00:00,  6.03it/s, loss=0.1014]


Train Loss: 0.1014


평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.73it/s]


Validation Loss: 0.5638
Validation Macro F1: 0.8817
클래스 0 (협박 대화) F1: 0.8125
클래스 1 (갈취 대화) F1: 0.8428
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9301
클래스 3 (기타 괴롭힘 대화) F1: 0.8377
클래스 4 (일반 대화) F1: 0.9853
성능 향상 없음: 1/2

Epoch 8/10 (학습률: 6.00e-06)


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.15it/s, loss=0.0830]


Train Loss: 0.0830


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.04it/s]
  plt.tight_layout()


Validation Loss: 0.5778
Validation Macro F1: 0.8845
클래스 0 (협박 대화) F1: 0.8193
클래스 1 (갈취 대화) F1: 0.8407
클래스 2 (직장 내 괴롭힘 대화) F1: 0.9379
클래스 3 (기타 괴롭힘 대화) F1: 0.8276
클래스 4 (일반 대화) F1: 0.9970
성능 향상 없음: 2/2

Early Stopping! 2번의 에폭 동안 성능 향상 없음.


  plt.savefig('training_history.png')
평가 중: 100%|██████████| 24/24 [00:01<00:00, 16.86it/s]



테스트 결과:
Test Loss: 0.4856
Test Macro F1: 0.9076

분류 보고서:
              precision    recall  f1-score   support

       협박 대화       0.90      0.84      0.86       134
       갈취 대화       0.89      0.88      0.89       146
 직장 내 괴롭힘 대화       0.95      0.95      0.95       145
   기타 괴롭힘 대화       0.83      0.88      0.85       152
       일반 대화       0.98      0.99      0.98       169

    accuracy                           0.91       746
   macro avg       0.91      0.91      0.91       746
weighted avg       0.91      0.91      0.91       746

W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
테스트 예측 중: 100%|██████████| 16/16 [00:01<00:00, 15.48it/s]

제출 파일 생성 완료: submission.csv





#### 토크나이저만 koRoBERTa로 대체 - 모델과 토크나이저를 분리해서 사용하는 방식
- roberta 토크나이저 로드 중에 에러가 발생
  - klue/roberta-base 모델이 RobertaTokenizer와 호환되지 않아 발생한 문제
  - klue/roberta-base는 실제로는 BERT 기반 토크나이저를 사용
- BERT 토크나이저를 사용하도록 코드를 수정
  - KoElectra 모델과 KLUE/roberta-base의 BERT 기반 토크나이저를 함께 사용
  (KoElectra 모델은 BERT 기반 토크나이저의 출력을 입력으로 받을 수 있게 되고, 두 시스템을 함께 사용 → 토크나이저와 모델 간의 호환성 문제를 해결하는 방법)
  - **결과 : 성능 저하 발생 (호환성 문제일 듯)**

In [None]:
import os
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, f1_score, confusion_matrix
import torch
from torch.utils.data import Dataset, DataLoader
# 토크나이저와 모델 import 수정
from transformers import ElectraForSequenceClassification, BertTokenizer
from transformers import get_linear_schedule_with_warmup
from tqdm import tqdm
import random
import matplotlib.pyplot as plt
import seaborn as sns

# 시드 고정
def set_seed(seed_value=42):
    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    torch.cuda.manual_seed_all(seed_value)
    torch.backends.cudnn.deterministic = True

set_seed(42)

# 설정값
ELECTRA_MODEL_NAME = "monologg/koelectra-base-v3-discriminator"
BERT_TOKENIZER_NAME = "klue/roberta-base"  # BERT 기반 토크나이저
MAX_LEN = 128
BATCH_SIZE = 32
EPOCHS = 10
SCHEDULER_EPOCHS = 5
EARLY_STOPPING_PATIENCE = 2
LEARNING_RATE = 2e-5
TRAIN_FILE = "data/train_preprocessed_1.csv"
TEXT_COL = "text"
LABEL_COL = "class"
LABEL_DICT = {'협박 대화': 0, '갈취 대화': 1, '직장 내 괴롭힘 대화': 2, '기타 괴롭힘 대화': 3, '일반 대화': 4}
ID_TO_LABEL = {v: k for k, v in LABEL_DICT.items()}
GPU_NUM = 0
TEST_FILE = "data/test.csv"

# 1. 데이터 로드 및 전처리
print("데이터 로드 중...")
df = pd.read_csv(TRAIN_FILE)

# 라벨 매핑
df[LABEL_COL] = df[LABEL_COL].map(LABEL_DICT)

# 데이터 분할
train_df, temp_df = train_test_split(df, test_size=0.3, random_state=42, stratify=df[LABEL_COL])
val_df, test_df = train_test_split(temp_df, test_size=0.5, random_state=42, stratify=temp_df[LABEL_COL])

print(f"학습 데이터 크기: {len(train_df)}")
print(f"검증 데이터 크기: {len(val_df)}")
print(f"테스트 데이터 크기: {len(test_df)}")

# 클래스별 데이터 개수 확인
print("학습 데이터의 클래스 분포:")
print(train_df[LABEL_COL].value_counts())

# 2. Dataset 클래스 정의
class TextClassificationDataset(Dataset):
    def __init__(self, texts, labels, tokenizer, max_len):
        self.texts = texts
        self.labels = labels
        self.tokenizer = tokenizer
        self.max_len = max_len

    def __len__(self):
        return len(self.texts)

    def __getitem__(self, idx):
        text = str(self.texts[idx])
        label = self.labels[idx]

        # BERT 토크나이저는 token_type_ids를 반환함
        encoding = self.tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=self.max_len,
            padding='max_length',
            truncation=True,
            return_token_type_ids=True,
            return_attention_mask=True,
            return_tensors='pt'
        )

        return {
            'text': text,
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'token_type_ids': encoding['token_type_ids'].flatten(),
            'labels': torch.tensor(label, dtype=torch.long)
        }

# 3. 데이터 로더 생성
def create_data_loader(df, tokenizer, max_len, batch_size):
    dataset = TextClassificationDataset(
        texts=df[TEXT_COL].values,
        labels=df[LABEL_COL].values,
        tokenizer=tokenizer,
        max_len=max_len
    )

    return DataLoader(
        dataset,
        batch_size=batch_size,
        num_workers=2
    )

# 4. 토크나이저 및 모델 로드
print(f"BERT 토크나이저 '{ROBERTA_TOKENIZER_NAME}' 로드 중...")
tokenizer = BertTokenizer.from_pretrained(ROBERTA_TOKENIZER_NAME)

print(f"koElectra 모델 '{ELECTRA_MODEL_NAME}' 로드 중...")
model = ElectraForSequenceClassification.from_pretrained(ELECTRA_MODEL_NAME, num_labels=len(LABEL_DICT))

# 5. 데이터 로더 생성
train_data_loader = create_data_loader(train_df, tokenizer, MAX_LEN, BATCH_SIZE)
val_data_loader = create_data_loader(val_df, tokenizer, MAX_LEN, BATCH_SIZE)
test_data_loader = create_data_loader(test_df, tokenizer, MAX_LEN, BATCH_SIZE)

# 6. 모델 학습 함수
def train_model(model, data_loader, optimizer, scheduler, device):
    model.train()
    losses = []

    progress_bar = tqdm(data_loader, desc="학습 중")

    for batch in progress_bar:
        optimizer.zero_grad()

        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        token_type_ids = batch['token_type_ids'].to(device)
        labels = batch['labels'].to(device)

        # BERT 토크나이저는 token_type_ids를 항상 제공
        outputs = model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            token_type_ids=token_type_ids,
            labels=labels
        )

        loss = outputs.loss
        loss.backward()

        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

        optimizer.step()
        scheduler.step()

        losses.append(loss.item())
        progress_bar.set_postfix({"loss": f"{np.mean(losses):.4f}"})

    return np.mean(losses)

# 7. 모델 평가 함수
def evaluate_model(model, data_loader, device):
    model.eval()
    losses = []
    predictions = []
    real_labels = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="평가 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)
            labels = batch['labels'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids,
                labels=labels
            )

            _, preds = torch.max(outputs.logits, dim=1)

            losses.append(outputs.loss.item())
            predictions.extend(preds.detach().cpu().numpy())
            real_labels.extend(labels.detach().cpu().numpy())

    return np.mean(losses), predictions, real_labels

# 8. 테스트 세트 예측 함수
def predict_test(model, data_loader, device):
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    return predictions

# 9. 혼동 행렬 시각화 함수
def plot_confusion_matrix(cm, classes):
    # 한글 폰트 설정
    import matplotlib.font_manager as fm

    # 시스템에 설치된 폰트 경로 확인
    # 리눅스 환경이면 'NanumGothic'이나 다른 한글 폰트 사용
    # 윈도우라면 'Malgun Gothic' 등 사용
    try:
        # 방법 1: 나눔 글꼴 설치 및 사용
        !apt-get update -qq
        !apt-get install fonts-nanum -qq
        plt.rc('font', family='NanumGothic')
    except:
        try:
            # 방법 2: 한글 레이블을 영어로 변환
            classes = ['Threat', 'Extortion', 'Workplace Harassment', 'Other Harassment', 'Normal Conversation']
        except:
            pass

    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=classes, yticklabels=classes)
    plt.xlabel('예측값')
    plt.ylabel('실제값')
    plt.title('혼동 행렬')
    plt.savefig('confusion_matrix.png')
    plt.close()

# 10. 학습 메인 함수
def train():
    # GPU 사용 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")
    print(f"사용 중인 디바이스: {device}")
    model.to(device)

    # 옵티마이저 및 스케줄러 설정
    from torch.optim import AdamW
    optimizer = AdamW(model.parameters(), lr=LEARNING_RATE)
    total_steps = len(train_data_loader) * SCHEDULER_EPOCHS

    scheduler = get_linear_schedule_with_warmup(
        optimizer,
        num_warmup_steps=0,
        num_training_steps=total_steps
    )

    # 학습 시작
    best_val_f1 = 0
    patience_counter = 0  # Early Stopping을 위한 카운터

    for epoch in range(EPOCHS):
        print(f"\nEpoch {epoch + 1}/{EPOCHS}")

        # 학습
        train_loss = train_model(model, train_data_loader, optimizer, scheduler, device)
        print(f"Train Loss: {train_loss:.4f}")

        # 검증
        val_loss, val_predictions, val_labels = evaluate_model(model, val_data_loader, device)
        val_f1 = f1_score(val_labels, val_predictions, average='macro')

        print(f"Validation Loss: {val_loss:.4f}")
        print(f"Validation Macro F1: {val_f1:.4f}")

        # 최고 성능 모델 저장 및 Early Stopping 로직
        if val_f1 > best_val_f1:
            best_val_f1 = val_f1
            torch.save(model.state_dict(), "best_model.pth")
            print(f"모델 저장됨: best_model.pth (F1: {val_f1:.4f})")
            patience_counter = 0  # 성능이 향상되었으므로 카운터 초기화
        else:
            patience_counter += 1  # 성능이 향상되지 않았으므로 카운터 증가
            print(f"성능 향상 없음: {patience_counter}/{EARLY_STOPPING_PATIENCE}")

            # Early Stopping 조건 확인
            if patience_counter >= EARLY_STOPPING_PATIENCE:
                print(f"\nEarly Stopping! {EARLY_STOPPING_PATIENCE}번의 에폭 동안 성능 향상 없음.")
                break

    # 최고 성능 모델 로드
    model.load_state_dict(torch.load("best_model.pth"))

    # 테스트 세트 평가
    test_loss, test_predictions, test_labels = evaluate_model(model, test_data_loader, device)
    test_f1 = f1_score(test_labels, test_predictions, average='macro')

    print("\n테스트 결과:")
    print(f"Test Loss: {test_loss:.4f}")
    print(f"Test Macro F1: {test_f1:.4f}")

    # 분류 보고서 출력
    class_names = [ID_TO_LABEL[i] for i in range(len(LABEL_DICT))]
    print("\n분류 보고서:")
    print(classification_report(test_labels, test_predictions, target_names=class_names))

    # 혼동 행렬 시각화
    cm = confusion_matrix(test_labels, test_predictions)
    plot_confusion_matrix(cm, class_names)

    return model

# 11. 실제 테스트 데이터 예측 및 제출 파일 생성
def predict_and_save():
    # 테스트 파일 로드
    test_data = pd.read_csv(TEST_FILE)

    # 전처리 함수 불러오기 (전처리 함수 정의 필요)
    # 아래 함수는 실제 구현이 필요합니다
    def preprocess(text, stopwords=None, speaker_token="", sep_token=" ", use_silence=False, repeat_limit=2):
        # 실제 전처리 구현
        # 필요한 경우 이 부분에 전처리 로직을 구현하세요
        return text

    # 전처리 함수 설정
    from functools import partial
    preprocess_fn = partial(
        preprocess,
        stopwords=None,
        speaker_token="",
        sep_token=" ",
        use_silence=False,
        repeat_limit=2
    )

    # 전처리 적용
    test_data['processed_text'] = test_data['text'].apply(preprocess_fn)

    # Dataset 생성
    class TestDataset(Dataset):
        def __init__(self, texts, tokenizer, max_len):
            self.texts = texts
            self.tokenizer = tokenizer
            self.max_len = max_len

        def __len__(self):
            return len(self.texts)

        def __getitem__(self, idx):
            text = str(self.texts[idx])

            # BERT 토크나이저 포맷에 맞게 수정
            encoding = self.tokenizer.encode_plus(
                text,
                add_special_tokens=True,
                max_length=self.max_len,
                padding='max_length',
                truncation=True,
                return_token_type_ids=True,
                return_attention_mask=True,
                return_tensors='pt'
            )

            return {
                'text': text,
                'input_ids': encoding['input_ids'].flatten(),
                'attention_mask': encoding['attention_mask'].flatten(),
                'token_type_ids': encoding['token_type_ids'].flatten(),
            }

    # 테스트 데이터 로더 생성
    test_dataset = TestDataset(
        texts=test_data['processed_text'].values,
        tokenizer=tokenizer,
        max_len=MAX_LEN
    )

    test_data_loader = DataLoader(
        test_dataset,
        batch_size=BATCH_SIZE,
        num_workers=2
    )

    # GPU 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")

    # 최고 성능 모델 로드
    model = ElectraForSequenceClassification.from_pretrained(ELECTRA_MODEL_NAME, num_labels=len(LABEL_DICT))
    model.load_state_dict(torch.load("best_model.pth"))
    model.to(device)

    # 예측
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(test_data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)

            # token_type_ids 제거
            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    # 예측 결과 라벨로 변환
    label_predictions = [str(p) for p in predictions]

    # 제출 파일 생성
    submission = pd.DataFrame({
        'idx': test_data['idx'],
        'class': label_predictions
    })

    submission.to_csv('data/submission.csv', index=False)
    print(f"제출 파일 생성 완료: submission.csv")

# 메인 실행
if __name__ == "__main__":
    # 모델 학습
    model = train()

    # 테스트 데이터 예측 및 제출 파일 생성
    predict_and_save()

데이터 로드 중...
학습 데이터 크기: 3477
검증 데이터 크기: 745
테스트 데이터 크기: 746
학습 데이터의 클래스 분포:
class
4    786
3    707
1    681
2    679
0    624
Name: count, dtype: int64
BERT 토크나이저 'klue/roberta-base' 로드 중...


vocab.txt:   0%|          | 0.00/248k [00:00<?, ?B/s]

koElectra 모델 'monologg/koelectra-base-v3-discriminator' 로드 중...


config.json:   0%|          | 0.00/467 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/452M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/452M [00:00<?, ?B/s]

Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


사용 중인 디바이스: cuda:0

Epoch 1/10



학습 중:   0%|          | 0/109 [00:00<?, ?it/s][A
학습 중:   0%|          | 0/109 [00:02<?, ?it/s, loss=1.6042][A
학습 중:   1%|          | 1/109 [00:02<03:46,  2.09s/it, loss=1.6042][A
학습 중:   1%|          | 1/109 [00:02<03:46,  2.09s/it, loss=1.5908][A
학습 중:   2%|▏         | 2/109 [00:02<01:43,  1.04it/s, loss=1.5908][A
학습 중:   2%|▏         | 2/109 [00:02<01:43,  1.04it/s, loss=1.5905][A
학습 중:   3%|▎         | 3/109 [00:02<01:03,  1.66it/s, loss=1.5905][A
학습 중:   3%|▎         | 3/109 [00:02<01:03,  1.66it/s, loss=1.6014][A
학습 중:   4%|▎         | 4/109 [00:02<00:45,  2.33it/s, loss=1.6014][A
학습 중:   4%|▎         | 4/109 [00:02<00:45,  2.33it/s, loss=1.6081][A
학습 중:   5%|▍         | 5/109 [00:02<00:34,  3.00it/s, loss=1.6081][A
학습 중:   5%|▍         | 5/109 [00:02<00:34,  3.00it/s, loss=1.6023][A
학습 중:   6%|▌         | 6/109 [00:02<00:28,  3.63it/s, loss=1.6023][A
학습 중:   6%|▌         | 6/109 [00:03<00:28,  3.63it/s, loss=1.5976][A
학습 중:   6%|▋         | 7/109 [00:03<00:24,  4.19

Train Loss: 1.4716


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.08it/s]


Validation Loss: 1.2341
Validation Macro F1: 0.3635
모델 저장됨: best_model.pth (F1: 0.3635)

Epoch 2/10


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.16it/s, loss=1.0949]


Train Loss: 1.0949


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.23it/s]


Validation Loss: 0.9785
Validation Macro F1: 0.5787
모델 저장됨: best_model.pth (F1: 0.5787)

Epoch 3/10


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.17it/s, loss=0.8843]


Train Loss: 0.8843


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.21it/s]


Validation Loss: 0.7987
Validation Macro F1: 0.6584
모델 저장됨: best_model.pth (F1: 0.6584)

Epoch 4/10


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.18it/s, loss=0.7518]


Train Loss: 0.7518


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.42it/s]


Validation Loss: 0.7215
Validation Macro F1: 0.7016
모델 저장됨: best_model.pth (F1: 0.7016)

Epoch 5/10


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.17it/s, loss=0.6676]


Train Loss: 0.6676


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.19it/s]


Validation Loss: 0.6966
Validation Macro F1: 0.7444
모델 저장됨: best_model.pth (F1: 0.7444)

Epoch 6/10


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.17it/s, loss=0.6352]


Train Loss: 0.6352


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.23it/s]


Validation Loss: 0.6966
Validation Macro F1: 0.7444
성능 향상 없음: 1/2

Epoch 7/10


학습 중: 100%|██████████| 109/109 [00:17<00:00,  6.17it/s, loss=0.6355]


Train Loss: 0.6355


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.31it/s]


Validation Loss: 0.6966
Validation Macro F1: 0.7444
성능 향상 없음: 2/2

Early Stopping! 2번의 에폭 동안 성능 향상 없음.


평가 중: 100%|██████████| 24/24 [00:01<00:00, 17.11it/s]



테스트 결과:
Test Loss: 0.6758
Test Macro F1: 0.7623

분류 보고서:
              precision    recall  f1-score   support

       협박 대화       0.67      0.51      0.58       134
       갈취 대화       0.74      0.72      0.73       146
 직장 내 괴롭힘 대화       0.77      0.89      0.83       145
   기타 괴롭힘 대화       0.66      0.72      0.69       152
       일반 대화       0.98      0.99      0.98       169

    accuracy                           0.78       746
   macro avg       0.77      0.77      0.76       746
weighted avg       0.77      0.78      0.77       746

W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
테스트 예측 중: 100%|██████████| 16/16 [00:01<00:00, 15.60it/s]


제출 파일 생성 완료: submission.csv


#### 모델이 모든 클래스에 대해 비등하게 학습시키기 위해 한번 과적합되는 일반 대화 수를 줄여봄
- 데이터프레임 가공
  - 일반 대화만 개수 조절
- 이전 모델 개발 적용 (코드 출력 확인 요망)

In [None]:
import pandas as pd

# 데이터셋 로드
realize = pd.read_csv("data/train+normal_conversation.csv")

# 클래스별 개수 확인
print("처리 전 클래스별 개수:")
realize['class'].value_counts()

# 일반 대화 데이터의 첫 번째 인덱스 찾기
normal_conv_indices = realize[realize['class'] == '일반 대화'].index
first_normal_conv_index = normal_conv_indices[0] if len(normal_conv_indices) > 0 else None
print(f"일반 대화가 처음 시작하는 위치(인덱스): {first_normal_conv_index}")

# 유지할 일반 대화 개수 설정
keep_count = 800

# 유지할 인덱스와 제거할 인덱스 구분
keep_indices = normal_conv_indices[:keep_count]
remove_indices = normal_conv_indices[keep_count:]

# 제거할 인덱스 제외하고 새로운 데이터프레임 생성
df_filtered = realize.drop(remove_indices)

# 결과 확인
print("\n처리 후 클래스별 개수:")
print(df_filtered['class'].value_counts())

# 파일 저장
df_filtered.to_csv("data/train+normal_conversation_filtered.csv", index=False)
print(f"\n일반 대화 {keep_count}개만 유지한 데이터셋이 저장되었습니다.")

처리 전 클래스별 개수:
일반 대화가 처음 시작하는 위치(인덱스): 3846

처리 후 클래스별 개수:
class
기타 괴롭힘 대화      1011
갈취 대화           973
직장 내 괴롭힘 대화     970
협박 대화           892
일반 대화           800
Name: count, dtype: int64

일반 대화 800개만 유지한 데이터셋이 저장되었습니다.


In [None]:
import os
import re
import numpy as np
import pandas as pd
from functools import partial
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, f1_score, confusion_matrix
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import ElectraTokenizer, ElectraForSequenceClassification#, AdamW
from transformers import get_linear_schedule_with_warmup
from tqdm import tqdm
import random
import matplotlib.pyplot as plt
import seaborn as sns

# 시드 고정
def set_seed(seed_value=42):
    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    torch.cuda.manual_seed_all(seed_value)
    torch.backends.cudnn.deterministic = True

set_seed(42)

#--------------------------
# 데이터 전처리 함수들
#--------------------------

# 1. 텍스트 정제 함수들
def remove_stopwords(tokens, stopword_list):
    stopword_set = stopword_list if isinstance(stopword_list, set) else set(stopword_list)
    return [token for token in tokens if token not in stopword_set]

def clean_text(text):
    text = re.sub(r"[^\w\s가-힣]", " ", text)
    text = re.sub(r"\s+", " ", text)
    return text.strip()

def normalize_repetitions(text, repeat_limit=2):
    # 문자 반복 (예: ㅋㅋㅋㅋ → ㅋㅋ)
    text = re.sub(r'(.)\1{2,}', lambda m: m.group(1) * repeat_limit, text)

    # 음절 반복 (예: 하하하하 → 하하)
    text = re.sub(r'((..))\\1{1,}', lambda m: m.group(1) * repeat_limit, text)

    return text

# 2. 텍스트 정제
def tokenize_and_clean_text(text, stopword_list=None, repeat_limit=2):
    text = normalize_repetitions(text, repeat_limit=repeat_limit)
    text = clean_text(text)
    tokens = text.split()
    if stopword_list:
        tokens = remove_stopwords(tokens, stopword_list)
    return tokens

# 3. 한줄 단위 전처리
def preprocess_conversation_lines(
    text,
    stopwords=None,
    use_silence=False,
    speaker_token="[UTTER]",
    repeat_limit=2
):
    lines = text.strip().split('\n')
    results = []

    for line in lines:
        if not line.strip():
            processed = ["[SILENCE]"] if use_silence else []
        else:
            processed = tokenize_and_clean_text(line, stopword_list=stopwords, repeat_limit=repeat_limit)
            if not processed:
                processed = ["[SILENCE]"] if use_silence else []
            else:
                processed = [speaker_token] + processed if speaker_token else processed

        if processed:
            results.append(" ".join(processed).strip())

    return results

# 4. 여러줄을 한 줄로 flatten 함수
def flatten_utterances(utterance_tokens_list, sep_token=" "):
    return sep_token.join(utterance_tokens_list).strip()

# 5. 전체 전처리 파이프라인
def preprocess(
    text,
    stopwords=None,
    speaker_token="[UTTER]",
    use_silence=True,
    sep_token=" ",
    repeat_limit=2
):
    """
    전체 전처리 통합 함수
    """
    utterance_tokens = preprocess_conversation_lines(
        text,
        stopwords=stopwords,
        use_silence=use_silence,
        speaker_token=speaker_token,
        repeat_limit=repeat_limit
    )
    return flatten_utterances(utterance_tokens, sep_token=sep_token)

# 결측치 및 중복 제거 함수
def clean_dataframe(df, is_train=True):
    df = df.dropna(subset=['text'])
    df = df.drop_duplicates(subset=['text'])
    if is_train:
        df = df.dropna(subset=['class'])
    df = df.reset_index(drop=True)
    return df

# CSV 파일 로드 함수
def load_csv_files(file_list, is_train=True):
    df_list = []

    for file_path in file_list:
        df = pd.read_csv(file_path)

        if is_train:
            if 'conversation' in df.columns:
                df = df.rename(columns={'conversation': 'text'})
        else:
            if 'conversation' in df.columns:
                df = df.rename(columns={'conversation': 'text'})
            if 'class' not in df.columns:
                df['class'] = pd.NA  # test에는 class가 없으므로 NaN 처리

        df_list.append(df)

    return pd.concat(df_list, ignore_index=True)

# 데이터프레임 준비 함수
def prepare_dataset(file_paths, preprocess_func, is_train=True):
    df = load_csv_files(file_paths, is_train=is_train)
    df = clean_dataframe(df, is_train=is_train)
    df['text'] = df['text'].apply(preprocess_func)
    df = clean_dataframe(df, is_train=is_train)
    return df

#--------------------------
# 모델 학습 설정
#--------------------------

# 설정값
MODEL_NAME = "monologg/koelectra-base-v3-discriminator"
MAX_LEN = 128
BATCH_SIZE = 32
EPOCHS = 10  # 5에서 10으로 변경
SCHEDULER_EPOCHS = 5  # 스케줄러용 에폭 (원래 설정 유지)
EARLY_STOPPING_PATIENCE = 2  # 연속 2번의 에폭 동안 성능이 향상되지 않으면 학습 중단
LEARNING_RATE = 2e-5
TRAIN_PATH = "data/train+normal_conversation_filtered.csv"
TEXT_COL = "text"#"conversation"x : 편리성 때문에
LABEL_COL = "class"
LABEL_DICT = {'협박 대화': 0, '갈취 대화': 1, '직장 내 괴롭힘 대화': 2, '기타 괴롭힘 대화': 3, '일반 대화': 4}
ID_TO_LABEL = {v: k for k, v in LABEL_DICT.items()}
GPU_NUM = 0
TEST_FILE = "data/test.csv"

# 1. 데이터 전처리 및 로드
print("데이터 전처리 및 로드 중...")

# 불용어 리스트 정의
stopwords = '이 있 하 것 들 그 되 수 이 보 않 없 나 주 아니 등 같 우리 때 년 가 한 지 오 네 야 아 아니 그럼 내가 너'.split()

# 전처리 함수 설정 - 줄 바꿈 표시 X, 불용어 X
preprocess_fn = partial(
    preprocess,
    stopwords=None,   # 불용어 리스트 사용하지 않음
    speaker_token="",  # 발화 단위 토큰 사용하지 않음
    sep_token=" ", # 줄 구분 시 토큰
    use_silence=False, # [SILENCE] 토큰 사용하지 않음
    repeat_limit=2 # 반복 문자 2개까지 허용
)

# 데이터셋 준비
train_files = [TRAIN_PATH]

# 데이터 전처리 및 저장
print("데이터 전처리 시작...")
train_df = prepare_dataset(train_files, preprocess_fn, is_train=True)
# train_df.to_csv("dataset/train_preprocessed_1.csv", index=False)
# print(f"✅ 전처리된 데이터 저장 완료: {train_df.shape}")
print(train_df.head())

# 라벨 매핑
train_df[LABEL_COL] = train_df[LABEL_COL].map(LABEL_DICT)

# 데이터 분할
train_data, temp_data = train_test_split(train_df, test_size=0.3, random_state=42, stratify=train_df[LABEL_COL])
val_data, test_data = train_test_split(temp_data, test_size=0.5, random_state=42, stratify=temp_data[LABEL_COL])

print(f"학습 데이터 크기: {len(train_data)}")
print(f"검증 데이터 크기: {len(val_data)}")
print(f"테스트 데이터 크기: {len(test_data)}")

# 클래스별 데이터 개수 확인
print("학습 데이터의 클래스 분포:")
print(train_data[LABEL_COL].value_counts())

# 2. Dataset 클래스 정의
class TextClassificationDataset(Dataset):
    def __init__(self, texts, labels, tokenizer, max_len):
        self.texts = texts
        self.labels = labels
        self.tokenizer = tokenizer
        self.max_len = max_len

    def __len__(self):
        return len(self.texts)

    def __getitem__(self, idx):
        text = str(self.texts[idx])
        label = self.labels[idx]

        encoding = self.tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=self.max_len,
            return_token_type_ids=True,
            padding='max_length',
            truncation=True,
            return_attention_mask=True,
            return_tensors='pt'
        )

        return {
            'text': text,
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'token_type_ids': encoding['token_type_ids'].flatten(),
            'labels': torch.tensor(label, dtype=torch.long)
        }

# 3. 데이터 로더 생성
def create_data_loader(df, tokenizer, max_len, batch_size):
    dataset = TextClassificationDataset(
        texts=df[TEXT_COL].values,
        labels=df[LABEL_COL].values,
        tokenizer=tokenizer,
        max_len=max_len
    )

    return DataLoader(
        dataset,
        batch_size=batch_size,
        num_workers=2
    )

# 4. 토크나이저 및 모델 로드
print(f"모델 '{MODEL_NAME}' 로드 중...")
tokenizer = ElectraTokenizer.from_pretrained(MODEL_NAME)
model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))

# 5. 데이터 로더 생성
train_data_loader = create_data_loader(train_data, tokenizer, MAX_LEN, BATCH_SIZE)
val_data_loader = create_data_loader(val_data, tokenizer, MAX_LEN, BATCH_SIZE)
test_data_loader = create_data_loader(test_data, tokenizer, MAX_LEN, BATCH_SIZE)

# 6. 모델 학습 함수
def train_model(model, data_loader, optimizer, scheduler, device):
    model.train()
    losses = []

    progress_bar = tqdm(data_loader, desc="학습 중")

    for batch in progress_bar:
        optimizer.zero_grad()

        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        token_type_ids = batch['token_type_ids'].to(device)
        labels = batch['labels'].to(device)

        outputs = model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            token_type_ids=token_type_ids,
            labels=labels
        )

        loss = outputs.loss
        loss.backward()

        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

        optimizer.step()
        scheduler.step()

        losses.append(loss.item())
        progress_bar.set_postfix({"loss": f"{np.mean(losses):.4f}"})

    return np.mean(losses)

# 7. 모델 평가 함수
def evaluate_model(model, data_loader, device):
    model.eval()
    losses = []
    predictions = []
    real_labels = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="평가 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)
            labels = batch['labels'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids,
                labels=labels
            )

            _, preds = torch.max(outputs.logits, dim=1)

            losses.append(outputs.loss.item())
            predictions.extend(preds.detach().cpu().numpy())
            real_labels.extend(labels.detach().cpu().numpy())

    return np.mean(losses), predictions, real_labels

# 8. 테스트 세트 예측 함수
def predict_test(model, data_loader, device):
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    return predictions

# 9. 혼동 행렬 시각화 함수
def plot_confusion_matrix(cm, classes):
    # 한글 폰트 설정
    import matplotlib.font_manager as fm

    # 시스템에 설치된 폰트 경로 확인
    # 리눅스 환경이면 'NanumGothic'이나 다른 한글 폰트 사용
    # 윈도우라면 'Malgun Gothic' 등 사용
    try:
        # 방법 1: 나눔 글꼴 설치 및 사용
        !apt-get update -qq
        !apt-get install fonts-nanum -qq
        plt.rc('font', family='NanumGothic')
    except:
        try:
            # 방법 2: 한글 레이블을 영어로 변환
            classes = ['Threat', 'Extortion', 'Workplace Harassment', 'Other Harassment', 'Normal Conversation']
        except:
            pass

    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=classes, yticklabels=classes)
    plt.xlabel('예측값')
    plt.ylabel('실제값')
    plt.title('혼동 행렬')
    plt.savefig('confusion_matrix.png')
    plt.close()

# 10. 학습 메인 함수
def train():
    # GPU 사용 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")
    print(f"사용 중인 디바이스: {device}")
    model.to(device)

    # 옵티마이저 및 스케줄러 설정
    # AdamW 임포트 부분 수정
    # from transformers import AdamW - 이 부분이 오류 발생
    from torch.optim import AdamW  # 이렇게 수정
    optimizer = AdamW(model.parameters(), lr=LEARNING_RATE)  # correct_bias 파라미터 제거
    total_steps = len(train_data_loader) * SCHEDULER_EPOCHS  # 원래 에폭(5) 기준으로 설정

    scheduler = get_linear_schedule_with_warmup(
        optimizer,
        num_warmup_steps=0,
        num_training_steps=total_steps
    )

    # 학습 시작
    best_val_f1 = 0
    patience_counter = 0  # Early Stopping을 위한 카운터

    for epoch in range(EPOCHS):
        print(f"\nEpoch {epoch + 1}/{EPOCHS}")

        # 학습
        train_loss = train_model(model, train_data_loader, optimizer, scheduler, device)
        print(f"Train Loss: {train_loss:.4f}")

        # 검증
        val_loss, val_predictions, val_labels = evaluate_model(model, val_data_loader, device)
        val_f1 = f1_score(val_labels, val_predictions, average='macro')

        print(f"Validation Loss: {val_loss:.4f}")
        print(f"Validation Macro F1: {val_f1:.4f}")

        # 최고 성능 모델 저장 및 Early Stopping 로직
        if val_f1 > best_val_f1:
            best_val_f1 = val_f1
            torch.save(model.state_dict(), "best_model.pth")
            print(f"모델 저장됨: best_model.pth (F1: {val_f1:.4f})")
            patience_counter = 0  # 성능이 향상되었으므로 카운터 초기화
        else:
            patience_counter += 1  # 성능이 향상되지 않았으므로 카운터 증가
            print(f"성능 향상 없음: {patience_counter}/{EARLY_STOPPING_PATIENCE}")

            # Early Stopping 조건 확인
            if patience_counter >= EARLY_STOPPING_PATIENCE:
                print(f"\nEarly Stopping! {EARLY_STOPPING_PATIENCE}번의 에폭 동안 성능 향상 없음.")
                break

    # 최고 성능 모델 로드
    model.load_state_dict(torch.load("best_model.pth"))

    # 테스트 세트 평가
    test_loss, test_predictions, test_labels = evaluate_model(model, test_data_loader, device)
    test_f1 = f1_score(test_labels, test_predictions, average='macro')

    print("\n테스트 결과:")
    print(f"Test Loss: {test_loss:.4f}")
    print(f"Test Macro F1: {test_f1:.4f}")

    # 분류 보고서 출력
    class_names = [ID_TO_LABEL[i] for i in range(len(LABEL_DICT))]
    print("\n분류 보고서:")
    print(classification_report(test_labels, test_predictions, target_names=class_names))

    # 혼동 행렬 시각화
    cm = confusion_matrix(test_labels, test_predictions)
    plot_confusion_matrix(cm, class_names)

    return model

# 11. 실제 테스트 데이터 예측 및 제출 파일 생성
def predict_and_save():
    # 테스트 파일 로드
    test_data = pd.read_csv(TEST_FILE)

    # 텍스트 전처리 적용 - 학습 데이터와 동일한 방식으로 전처리
    # 줄 바꿈 표시 X, 불용어 X 설정
    test_data['processed_text'] = test_data['text'].apply(
        lambda x: preprocess(
            x,
            stopwords=None,
            speaker_token="",
            sep_token=" ",
            use_silence=False,
            repeat_limit=2
        )
    )

    # Dataset 생성
    class TestDataset(Dataset):
        def __init__(self, texts, tokenizer, max_len):
            self.texts = texts
            self.tokenizer = tokenizer
            self.max_len = max_len

        def __len__(self):
            return len(self.texts)

        def __getitem__(self, idx):
            text = str(self.texts[idx])

            encoding = self.tokenizer.encode_plus(
                text,
                add_special_tokens=True,
                max_length=self.max_len,
                return_token_type_ids=True,
                padding='max_length',
                truncation=True,
                return_attention_mask=True,
                return_tensors='pt'
            )

            return {
                'text': text,
                'input_ids': encoding['input_ids'].flatten(),
                'attention_mask': encoding['attention_mask'].flatten(),
                'token_type_ids': encoding['token_type_ids'].flatten(),
            }

    # 테스트 데이터 로더 생성
    test_dataset = TestDataset(
        texts=test_data['processed_text'].values,
        tokenizer=tokenizer,
        max_len=MAX_LEN
    )

    test_data_loader = DataLoader(
        test_dataset,
        batch_size=BATCH_SIZE,
        num_workers=2
    )

    # GPU 설정
    device = torch.device(f"cuda:{GPU_NUM}" if torch.cuda.is_available() else "cpu")

    # 최고 성능 모델 로드
    model = ElectraForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=len(LABEL_DICT))
    model.load_state_dict(torch.load("best_model.pth"))
    model.to(device)

    # 예측
    model.eval()
    predictions = []

    with torch.no_grad():
        for batch in tqdm(test_data_loader, desc="테스트 예측 중"):
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            token_type_ids = batch['token_type_ids'].to(device)

            outputs = model(
                input_ids=input_ids,
                attention_mask=attention_mask,
                token_type_ids=token_type_ids
            )

            _, preds = torch.max(outputs.logits, dim=1)
            predictions.extend(preds.detach().cpu().numpy())

    # 예측 결과 라벨로 변환 (숫자로 유지)
    label_predictions = [str(p) for p in predictions]

    # 제출 파일 생성
    submission = pd.DataFrame({
        'idx': test_data['idx'],
        'class': label_predictions
    })

    submission.to_csv('data/submission.csv', index=False)
    print(f"제출 파일 생성 완료: data/submission.csv")

# 메인 실행
if __name__ == "__main__":
    # 모델 학습
    model = train()

    # 테스트 데이터 예측 및 제출 파일 생성
    predict_and_save()

데이터 전처리 및 로드 중...
데이터 전처리 시작...
   idx      class                                               text
0    0      협박 대화  지금 너 스스로를 죽여달라고 애원하는 것인가 아닙니다 죄송합니다 죽을 거면 혼자 죽...
1    1      협박 대화  길동경찰서입니다 9시 40분 마트에 폭발물을 설치할거다 네 똑바로 들어 한번만 더 ...
2    2  기타 괴롭힘 대화  너 되게 귀여운거 알지 나보다 작은 남자는 첨봤어 그만해 니들 놀리는거 재미없어 지...
3    3      갈취 대화  어이 거기 예 너 말이야 너 이리 오라고 무슨 일 너 옷 좋아보인다 얘 돈 좀 있나...
4    4      갈취 대화  저기요 혹시 날이 너무 뜨겁잖아요 저희 회사에서 이 선크림 파는데 한 번 손등에 발...
학습 데이터 크기: 3251
검증 데이터 크기: 697
테스트 데이터 크기: 697
학습 데이터의 클래스 분포:
class
3    707
1    681
2    679
0    624
4    560
Name: count, dtype: int64
모델 'monologg/koelectra-base-v3-discriminator' 로드 중...


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


사용 중인 디바이스: cuda:0

Epoch 1/10


학습 중: 100%|██████████| 102/102 [00:16<00:00,  6.15it/s, loss=1.2269]


Train Loss: 1.2269


평가 중: 100%|██████████| 22/22 [00:01<00:00, 16.48it/s]


Validation Loss: 0.7408
Validation Macro F1: 0.8205
모델 저장됨: best_model.pth (F1: 0.8205)

Epoch 2/10


학습 중: 100%|██████████| 102/102 [00:16<00:00,  6.16it/s, loss=0.5827]


Train Loss: 0.5827


평가 중: 100%|██████████| 22/22 [00:01<00:00, 16.34it/s]


Validation Loss: 0.4183
Validation Macro F1: 0.8948
모델 저장됨: best_model.pth (F1: 0.8948)

Epoch 3/10


학습 중: 100%|██████████| 102/102 [00:16<00:00,  6.14it/s, loss=0.3665]


Train Loss: 0.3665


평가 중: 100%|██████████| 22/22 [00:01<00:00, 16.29it/s]


Validation Loss: 0.4343
Validation Macro F1: 0.8784
성능 향상 없음: 1/2

Epoch 4/10


학습 중: 100%|██████████| 102/102 [00:16<00:00,  6.16it/s, loss=0.2615]


Train Loss: 0.2615


평가 중: 100%|██████████| 22/22 [00:01<00:00, 16.38it/s]


Validation Loss: 0.3847
Validation Macro F1: 0.8939
성능 향상 없음: 2/2

Early Stopping! 2번의 에폭 동안 성능 향상 없음.


평가 중: 100%|██████████| 22/22 [00:01<00:00, 16.47it/s]



테스트 결과:
Test Loss: 0.4258
Test Macro F1: 0.8950

분류 보고서:
              precision    recall  f1-score   support

       협박 대화       0.86      0.81      0.84       134
       갈취 대화       0.86      0.89      0.88       146
 직장 내 괴롭힘 대화       0.93      0.96      0.95       146
   기타 괴롭힘 대화       0.83      0.81      0.82       151
       일반 대화       0.99      1.00      1.00       120

    accuracy                           0.89       697
   macro avg       0.90      0.90      0.90       697
weighted avg       0.89      0.89      0.89       697

W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
테스트 예측 중: 100%|██████████| 16/16 [00:01<00:00, 15.23it/s]

제출 파일 생성 완료: data/submission.csv





결과적으로 클래스별 균등하게 학습하는 것처럼 보이나 더 성능 떨어짐  
즉, 근본적으로 **구성한 학습 데이터셋 문제**이고, 나아가 **모델을 건드리는데 미숙한 본인 실력 문제**