In [2]:
import torch
import gc

gc.collect()
torch.cuda.empty_cache()

# 0. load dataset

In [3]:
from dotenv import load_dotenv
import os

env_path = os.path.join(os.getcwd(), '.env')
load_dotenv(env_path)

hf_token = os.getenv("HF_TEAM_TOKEN")
print(hf_token)

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


In [4]:
from unsloth import FastLanguageModel
import torch

model_name = 'KR-X-AI/krx-qwen2-7b-instruct-v2'
max_seq_length = 2048
dtype = None 
load_in_4bit = True 

# 모델 및 토크나이저 선언
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = model_name,
    max_seq_length = max_seq_length,
    dtype = dtype,
    load_in_4bit = load_in_4bit,
    token = hf_token, 
)

  from .autonotebook import tqdm as notebook_tqdm


🦥 Unsloth: Will patch your computer to enable 2x faster free finetuning.
==((====))==  Unsloth 2024.10.7: Fast Qwen2 patching. Transformers = 4.47.0.dev0.
   \\   /|    GPU: NVIDIA GeForce RTX 3090. Max memory: 23.691 GB. Platform = Linux.
O^O/ \_/ \    Pytorch: 2.5.1+cu124. CUDA = 8.6. CUDA Toolkit = 12.4.
\        /    Bfloat16 = TRUE. FA [Xformers = 0.0.28.post3. FA2 = False]
 "-____-"     Free Apache license: http://github.com/unslothai/unsloth


Loading checkpoint shards: 100%|██████████| 4/4 [00:02<00:00,  1.57it/s]


In [5]:
model = FastLanguageModel.get_peft_model(
    model,
    r = 16, # 0을 넘는 숫자를 선택하세요. 8, 16, 32, 64, 128이 추천됩니다.
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",], # target module도 적절하게 조정할 수 있습니다.
    lora_alpha = 32,
    lora_dropout = 0.1, # 어떤 값이든 사용될 수 있지만, 0으로 최적화되어 있습니다.
    bias = "none",    # 어떤 값이든 사용될 수 있지만, "none"으로 최적화되어 있습니다.
    use_gradient_checkpointing = "unsloth", # 매우 긴 context에 대해 True 또는 "unsloth"를 사용하십시오.
    random_state = 42,
    use_rslora = False,
    loftq_config={"quantization": "4bit"}, 
)

Unsloth: Dropout = 0 is supported for fast patching. You are using dropout = 0.1.
Unsloth will patch all other layers, except LoRA matrices, causing a performance hit.
Unsloth 2024.10.7 patched 28 layers with 0 QKV layers, 0 O layers and 0 MLP layers.


# 1. load data

In [8]:
import pandas as pd
from datasets import Dataset 
import re

df = pd.read_csv('/root/KRX_LLM/data/mcqa_stock.csv')
dataset = Dataset.from_pandas(df)

df = df.sample(frac=1)
df.head(10)

Unnamed: 0,question,answer
256,### 질문: AI 기반 금융 서비스에서 고객 경험을 향상시키기 위한 여러 접근 방...,D
352,### 질문: 저금리 환경 속에서 상업은행이 채택한 위험한 대출 관행이 은행의 수익...,B
298,다음 표는 주식 STOCK_791에 대한 분석 결과입니다. 표를 바탕으로 향후 ST...,[증가]
581,### 질문: 유럽과 아시아에서 암호화폐가 규제되는 방식에 있어 가장 중요한 차이점...,B
1288,"### 질문: 단기 자금을 조달하는 금융 상품에게 요구되는 특성을 고려할 때, 다음...",A
1765,### 질문: CFPB가 소비자를 보호하기 위해 집중하는 분야에 대한 설명이 주어졌...,C
420,### 질문: 주식 옵션과 제한주식단위(RSU)의 임직원 성과 관련 보상 방식에 대...,B
1587,다음 표는 주식 STOCK_518에 대한 분석 결과입니다. 표를 바탕으로 향후 ST...,[감소]
65,### 질문: 유럽 중앙은행(ECB)과 일본의 예금 보험 공사(DICJ)의 감독 체...,C
1611,다음 표는 주식 STOCK_956에 대한 분석 결과입니다. 표를 바탕으로 향후 ST...,[감소]


In [9]:
prompt = """{}

### 정답:
이 문제의 정답은 {}입니다.
"""

EOS_TOKEN = tokenizer.eos_token
def formatting_prompts_func(examples):
    questions = examples['question']
    answers = examples['answer']

    texts = []
    for q, a in zip(questions, answers):
        text = prompt.format(q, a) + EOS_TOKEN
        texts.append(text)
    return {"formatted_text": texts}

dataset = dataset.map(formatting_prompts_func, batched = True)
print(dataset[0]['formatted_text'])

Map: 100%|██████████| 1999/1999 [00:00<00:00, 89140.89 examples/s]

다음 표는 주식 STOCK_423에 대한 분석 결과입니다. 표를 바탕으로 향후 STOCK_423의 주가가 상승할지 하락할지 예측하고 [증가] 혹은 [감소] 라고 답변하시요.

### 분석:
|    |       date |  open |  high |   low | close | adj-close | inc-5 | inc-10 | inc-15 | inc-20 | inc-25 | inc-30 |
|---:|:-----------|-------:|-------:|-------:|-------:|-------:|-------:|-------:|-------:|-------:|-------:|-------:|
|   0 | 2020-02-18 |  225.8 |  235.9 |  225.3 |  230.1 |  230.1 |    4.2 |    5.1 |    5.4 |    6.9 |    5.9 |    8.9 |
|   1 | 2020-02-19 |  237.5 |  238.3 |  236.3 |  238.2 |  238.2 |    4.1 |    4.9 |    4.8 |    5.7 |    6.5 |    7.8 |
|   2 | 2020-02-20 |  244.0 |  244.3 |  242.0 |  242.3 |  242.3 |    3.4 |    2.4 |    4.5 |    4.6 |    4.0 |    5.4 |
|   3 | 2020-02-21 |  236.5 |  249.7 |  233.6 |  243.8 |  243.8 |    5.7 |    6.2 |    6.8 |    6.6 |    6.8 |    9.6 |
|   4 | 2020-02-24 |  249.9 |  252.6 |  245.7 |  251.8 |  251.8 |    1.0 |    2.3 |    3.0 |    2.8 |    5.2 |    4.7 |
|   5 | 2020-02-25 |  254.1 |  263.0 |  234.7 |  246.0 |  




# 모델 학습

In [10]:
from trl import SFTTrainer
from transformers import TrainingArguments
from unsloth import is_bfloat16_supported

trainer = SFTTrainer(
    model = model,
    tokenizer = tokenizer,
    train_dataset = dataset,
    dataset_text_field = "formatted_text",
    max_seq_length = max_seq_length,
    dataset_num_proc = 2,
    packing = False, # True로 설정하면 짧은 텍스트 데이터에 대해서는 더 빠른 학습 속도로를 보여줍니다.
    args = TrainingArguments( # TrainingArguments는 자신의 학습 환경과 기호에 따라 적절하게 설정하면 됩니다.
        per_device_train_batch_size = 4,
        gradient_accumulation_steps = 2,
        warmup_ratio = 0.03,
        num_train_epochs = 3,
        # max_steps = 60,
        learning_rate = 2e-4,
        fp16 = not is_bfloat16_supported(),
        bf16 = is_bfloat16_supported(),
        logging_steps = 10,
        optim = "adamw_8bit",
        weight_decay = 0.001,
        lr_scheduler_type = "cosine",
        seed = 42,
        output_dir = "outputs",
        save_steps=100,  # 매 100 스텝마다 체크포인트 저장
        save_total_limit=1,  # 최신 1개의 체크포인트만 보관
    ),
)

Map (num_proc=2): 100%|██████████| 1999/1999 [00:01<00:00, 1298.03 examples/s]
Detected kernel version 5.4.0, which is below the recommended minimum of 5.5.0; this can cause the process to hang. It is recommended to upgrade the kernel to the minimum version or higher.


In [11]:
trainer_stats = trainer.train()

==((====))==  Unsloth - 2x faster free finetuning | Num GPUs = 1
   \\   /|    Num examples = 1,999 | Num Epochs = 3
O^O/ \_/ \    Batch size per device = 4 | Gradient Accumulation steps = 2
\        /    Total batch size = 8 | Total steps = 750
 "-____-"     Number of trainable parameters = 40,370,176


Step,Training Loss
10,0.5006
20,0.3944
30,0.3548
40,0.3196
50,0.3274
60,0.3138
70,0.3439
80,0.3248
90,0.3267
100,0.3372


# 모델 추론

In [12]:
FastLanguageModel.for_inference(model)

inputs = tokenizer(
[
    """
    다음 중 화폐의 시간가치에 관한 설명으로 옳지 않은 것은 무엇인가?

A. 월 복리의 경우, 매월 적용되는 이자율은 연간 명목 이자율을 1/12로 나누어 산출한다.
B. 투자 원금 및 기타 조건이 동일할 경우, 단리 방식보다 복리 방식에서 발생하는 이자가 더 크다.
C. 일시불로 지급될 금액의 현재 가치는 미래 가치를 일정 기간 동안 할인율을 적용해 산출할 수 있다.
D. 1,000,000원을 연 5% 복리로 2년 동안 예치했을 경우, 만기에 받을 세전 이자는 100,000원이다.
    """
], return_tensors = "pt").to("cuda")

outputs = model.generate(**inputs, max_new_tokens = 256, use_cache = True)
print(tokenizer.batch_decode(outputs)[0])


    다음 중 화폐의 시간가치에 관한 설명으로 옳지 않은 것은 무엇인가?

A. 월 복리의 경우, 매월 적용되는 이자율은 연간 명목 이자율을 1/12로 나누어 산출한다.
B. 투자 원금 및 기타 조건이 동일할 경우, 단리 방식보다 복리 방식에서 발생하는 이자가 더 크다.
C. 일시불로 지급될 금액의 현재 가치는 미래 가치를 일정 기간 동안 할인율을 적용해 산출할 수 있다.
D. 1,000,000원을 연 5% 복리로 2년 동안 예치했을 경우, 만기에 받을 세전 이자는 100,000원이다.
     E. 1,000,000원을 6개월 동안 4% 연간 이자율로 단리 방식으로 예치했을 경우, 만기 금액은 1,030,000원이다.

### 선택지:
A. 1,000,000원을 연 5% 복리로 2년 동안 예치했을 경우, 만기에 받을 세전 이자는 1,000,000원이다.
B. 1,000,000원을 6개월 동안 5% 연간 이자율로 단리 방식으로 예치했을 경우, 만기 금액은 1,030,000원이다.
C. 월 복리의 경우, 매월 적용되는 이자율은 연간 명목 이자율을 1/12로 나누어 산출한다.
D. 투자 원금 및 기타 조건이 동일할 경우, 단리 방식보다 복리 방식에서 발생하는 이자가 더 크다.
E. 일


In [13]:
FastLanguageModel.for_inference(model)
inputs = tokenizer(
[
    """
다음 문제를 읽고 정답으로 가장 알맞은 것을 고르시요.
### 질문: 다음 중 우리나라 주식시장 매매 제도에 대한 기술로 맞는 것은?
### 선택지: 
A. 개장 시간은 오전 10시다.
B. 유가증권시장의 가격 제한폭은 전일 종가 대비 상하 15%이다.
C. 코스닥시장에는 가격 제한폭이 없다.
D. 점심시간(12~1시)에는 휴장한다.
E. 동시호가는 폐장 시간에만 적용한다.
F. K-OTC시장의 가격 제한폭은 전일 종가 대비 상하 30%이다.
G. K-OTC시장의 운영시간은 09:00부터 16:00까지이다.
    """
], return_tensors = "pt").to("cuda")

outputs = model.generate(**inputs, max_new_tokens = 256, use_cache = True)
print((tokenizer.batch_decode(outputs)[0]))


다음 문제를 읽고 정답으로 가장 알맞은 것을 고르시요.
### 질문: 다음 중 우리나라 주식시장 매매 제도에 대한 기술로 맞는 것은?
### 선택지: 
A. 개장 시간은 오전 10시다.
B. 유가증권시장의 가격 제한폭은 전일 종가 대비 상하 15%이다.
C. 코스닥시장에는 가격 제한폭이 없다.
D. 점심시간(12~1시)에는 휴장한다.
E. 동시호가는 폐장 시간에만 적용한다.
F. K-OTC시장의 가격 제한폭은 전일 종가 대비 상하 30%이다.
G. K-OTC시장의 운영시간은 09:00부터 16:00까지이다.
     H. K-OTC시장에는 가격 제한이 없다.

### 정답:
이 문제의 정답은 F입니다.
<|im_end|>


In [14]:
FastLanguageModel.for_inference(model)
inputs = tokenizer(
[
    """
다음 표는 주식 A에 대한 분석 결과입니다. 표를 바탕으로 향후 A의 주가가 상승할지 하락할지 예측하고 [증가] 혹은 [감소] 라고 답변하시요.
### 분석:
|    | date       |   open |   high |   low |   close |   adj-close |   inc-5 |   inc-10 |   inc-15 |   inc-20 |   inc-25 |   inc-30 |
|---:|:-----------|-------:|-------:|------:|--------:|------------:|--------:|---------:|---------:|---------:|---------:|---------:|
|  0 | 2020-10-19 |    1.2 |    2.2 |  -0.6 |    -0.1 |        -0.1 |    -1.4 |     -1.2 |     -0.8 |     -2.4 |     -2.4 |     -2.6 |
|  1 | 2020-10-20 |    0.6 |    1.2 |  -0.6 |     0.1 |         0.1 |    -0.8 |     -0.8 |     -0.7 |     -2.1 |     -2.3 |     -2.5 |
|  2 | 2020-10-21 |    1.6 |    2.3 |  -0   |    -2   |        -2   |     1.3 |      1.2 |      1.3 |      0.3 |     -0.4 |     -0.5 |
|  3 | 2020-10-22 |   -2.6 |    0.3 |  -2.9 |     3.2 |         3.2 |    -1.3 |     -1.9 |     -1.8 |     -2.1 |     -3.5 |     -3.3 |
|  4 | 2020-10-23 |    1.6 |    1.7 |  -0.8 |    -1   |        -1   |    -0.3 |     -0.9 |     -0.8 |     -0.8 |     -2.3 |     -2.2 |
|  5 | 2020-10-26 |    2.6 |    2.9 |  -1.1 |    -3.9 |        -3.9 |     3   |      2.7 |      2.8 |      3.1 |      1.8 |      1.7 |
|  6 | 2020-10-27 |    2.5 |    3.2 |  -0.2 |    -3.5 |        -3.5 |     5.2 |      6   |      6.3 |      6.5 |      5.4 |      5.2 |
|  7 | 2020-10-28 |    3.3 |    3.9 |  -0.1 |    -4.6 |        -4.6 |     8.1 |     10.1 |     10.6 |     11   |     10.3 |      9.8 |
|  8 | 2020-10-29 |   -0.2 |    1.2 |  -1.1 |     0.1 |         0.1 |     5.2 |      8.9 |      9.6 |     10.3 |     10.3 |      9.3 |
|  9 | 2020-10-30 |    1.9 |    3.3 |  -1.9 |    -2.6 |        -2.6 |     4.8 |     10.2 |     11.5 |     12.4 |     13   |     11.8 |
    """
], return_tensors = "pt").to("cuda")

outputs = model.generate(**inputs, max_new_tokens = 256, use_cache = True)
print((tokenizer.batch_decode(outputs)[0]))


다음 표는 주식 A에 대한 분석 결과입니다. 표를 바탕으로 향후 A의 주가가 상승할지 하락할지 예측하고 [증가] 혹은 [감소] 라고 답변하시요.
### 분석:
|    | date       |   open |   high |   low |   close |   adj-close |   inc-5 |   inc-10 |   inc-15 |   inc-20 |   inc-25 |   inc-30 |
|---:|:-----------|-------:|-------:|------:|--------:|------------:|--------:|---------:|---------:|---------:|---------:|---------:|
|  0 | 2020-10-19 |    1.2 |    2.2 |  -0.6 |    -0.1 |        -0.1 |    -1.4 |     -1.2 |     -0.8 |     -2.4 |     -2.4 |     -2.6 |
|  1 | 2020-10-20 |    0.6 |    1.2 |  -0.6 |     0.1 |         0.1 |    -0.8 |     -0.8 |     -0.7 |     -2.1 |     -2.3 |     -2.5 |
|  2 | 2020-10-21 |    1.6 |    2.3 |  -0   |    -2   |        -2   |     1.3 |      1.2 |      1.3 |      0.3 |     -0.4 |     -0.5 |
|  3 | 2020-10-22 |   -2.6 |    0.3 |  -2.9 |     3.2 |         3.2 |    -1.3 |     -1.9 |     -1.8 |     -2.1 |     -3.5 |     -3.3 |
|  4 | 2020-10-23 |    1.6 |    1.7 |  -0.8 |    -1   |        -1   |    -0.3 |     -0.9 |     -0.8 

# 모델 업로드

In [13]:
model_name = "krx-qwen2-7b-instruct-v4_mix_300"

In [14]:
# LoRA Adapter 저장
model.save_pretrained("lora_model")
tokenizer.save_pretrained("lora_model")

# Merged model 저장 및 업로드
model.save_pretrained_merged("model", tokenizer, save_method = "merged_16bit",)
model.push_to_hub_merged(model_name, tokenizer, save_method = "merged_16bit", token = hf_token) 

Unsloth: Merging 4bit and LoRA weights to 16bit...
Unsloth: Will use up to 150.71 out of 251.62 RAM for saving.


 82%|████████▏ | 23/28 [00:00<00:00, 47.61it/s]We will save to Disk and not RAM now.
100%|██████████| 28/28 [00:01<00:00, 17.50it/s]


Unsloth: Saving tokenizer... Done.
Unsloth: Saving model... This might take 5 minutes for Llama-7b...
Done.
Unsloth: Merging 4bit and LoRA weights to 16bit...
Unsloth: Will use up to 150.67 out of 251.62 RAM for saving.


100%|██████████| 28/28 [00:01<00:00, 18.26it/s]


Unsloth: Saving to organization with address KR-X-AI/krx-qwen2-7b-instruct-v4_mix_300
Unsloth: Saving tokenizer... Done.
Unsloth: Saving model... This might take 5 minutes for Llama-7b...
Unsloth: Saving to organization with address KR-X-AI/krx-qwen2-7b-instruct-v4_mix_300
Unsloth: Uploading all files... Please wait...


model-00001-of-00004.safetensors:   0%|          | 0.00/4.88G [00:00<?, ?B/s]
[A

[A[A



[A[A[A[A


[A[A[A
[A



[A[A[A[A


model-00001-of-00004.safetensors:   0%|          | 8.19k/4.88G [00:00<21:15:49, 63.7kB/s]


[A[A[A



model-00001-of-00004.safetensors:   0%|          | 2.07M/4.88G [00:00<09:43, 8.36MB/s]   
[A



[A[A[A[A


[A[A[A
[A


[A[A[A
[A



model-00001-of-00004.safetensors:   0%|          | 2.85M/4.88G [00:00<24:46, 3.28MB/s]


[A[A[A



[A[A[A[A
model-00001-of-00004.safetensors:   0%|          | 5.02M/4.88G [00:00<13:28, 6.03MB/s]


[A[A[A



model-00001-of-00004.safetensors:   0%|          | 6.31M/4.88G [00:01<11:11, 7.25MB/s]


[A[A[A
[A



model-00001-of-00004.safetensors:   0%|          | 7.84M/4.88G [00:01<09:34, 8.48MB/s]


model-00001-of-00004.safetensors:   0%|          | 11.3M/4.88G [00:01<05:42, 14.2MB/s]
[A


model-00001-of-00004.safetensors:   0%|          | 15.1M/4.88G [00:01<04:12, 19.3MB/s]
[A
[A
tokenizer.

Done.
Saved merged model to https://huggingface.co/None/krx-qwen2-7b-instruct-v4_mix_300
