In [None]:
# !pip install tiktoken

In [1]:
from openai import OpenAI
from getpass import getpass
from datetime import datetime
from collections import defaultdict
import numpy as np
import pandas as pd
import os
import time
import json
import tiktoken # openai 모델들이 사용하는 base 토큰화 + 인코딩 모듈

## Prompt 구조 설계

In [31]:
# 자체제작 프롬프트 불러오기
raw_prompt = pd.read_csv('data/ft_data/Fine_tuning_qna.csv', encoding='cp949')
raw_prompt.head()

Unnamed: 0,user,assistant
0,갈현동에서 카페 창업을 하려고해.\n보증금 5000만에 월세 200만 원 이하로 권...,갈현동에 카페 창업하기 좋은 매물을 알려드릴게요.\n매물1\n- 보증금 : 2000...
1,서울에서 보증금 3천 만 원에 월세 20만 원 이하로 온라인 쇼핑몰을 매물을 구할 ...,온라인 쇼핑몰 창업 정보를 찾으시나요? 관악구는 어떠세요?\n\n매물1\n- 보증금...
2,논현동에서 1층 매장 창업하려면 얼마정도가 필요해?,"논현동 1층 창업에 대한 정보를 알려드릴게요.\n보증금은 500만 원 ~ 6억 원,..."
3,강북구나 노원구에서 대형카페 창업을 하려고 하는데 매물정보 알려줘,"강북구, 노원구에서 카페 창업을 원하세요?\n마침 노원구 상계동 아파트 단지에 딱 ..."
4,남가좌동에서 가구점을 창업하려고 하는데 어떻게 생각해?,"확인 결과 남가좌동의 가구점에 적합한 매물은 보증금 최대 5천만 원, 월세 최대 3..."


In [None]:
def prompt_format_convert(dataframe, system_prompt):
    """
    Description:
    user, assistant 열을 가진 Q&A 형식의 csv파일을 프롬프트화 하는 코드입니다.

    Args:
    dataframe - 유저와 ai의 질문 답변을 가진 dataframe
    system_prompt - ai에게 적용시킬 system 프롬프트입니다.

    Returns:
    json 형식의 프롬프트 
    """

    openai_format_data = []

    for _, row in dataframe.iterrows():
        # 각 대화별 들어갈 시스템 프롬프트
        current_messages = [{"role": "system", "content": system_prompt}]

        # 자체 제작한 각 행의 Q&A 데이터
        user_content = row['user']
        assistant_content = row['assistant']

        # 시스템 프롬프트 밑에 각 Q&A 데이터 삽입
        current_messages.append({"role": "user", "content": user_content})
        current_messages.append({"role": "assistant", "content": assistant_content})

        # 하나의 시스템, 질문, 답변 말뭉치 삽입
        openai_format_data.append({"messages": current_messages})

    return openai_format_data

# 시스템 프롬프트 작성
system_prompt = """
You are a commercial district analysis expert specializing in Seoul, South Korea. 
Your primary task is to provide information on the monthly rent, deposit, area, and floor of properties that match the user's desired criteria. 
Please provide responses to user inquiries in Korean.
[user input] is a user question and [assident output] is an answer format. Please answer according to the answer format.


[user input]
서울에서 보증금 3천 만원, 월세 80 만원 이하로 음식점을 위한 매물을 구할 수 있을까?
고층이어도 상관없고, 10m²보다는 컸으면 좋겠어.

[assistant output]
📍 음식점 창업 매물 추천

원하는 조건에 맞는 매물을 찾는다면, 중구는 어떤가요?

───────────────────────────

🏠 매물 1
위치: 중구 필동2가
보증금: 1000 만원
월세: 80 만원
권리금: 1500 만원
면적: 23.1m²
층수: 1층
설명: 상권이잘형성되어있어서유동인구가많아유입되는손님이꾸준히있어서매출이꾸준히나오는매장.
추천 이유: 원하는 조건에 맞는 매물입니다.

🔗 매물 보러가기: [클릭](https://www.zigbang.com/home/store/items/571420)

───────────────────────────

🏠 매물 2
위치: 중구 쌍림동
보증금: 0 만원
월세: 75 만원
권리금: 6000 만원
면적: 56.2 m²
층수: 1층
설명: 역초역세권카페매물
추천 이유: 월세는 요청하신 80 만원 보다는 높지만 보증금이 없어 고려해볼만한 매물입니다.

🔗 매물 보러가기: [클릭](https://www.zigbang.com/home/store/items/515478)
"""

# 변환 함수 호출
ft_prompt = prompt_format_convert(raw_prompt, system_prompt)
ft_prompt[:5]

[{'messages': [{'role': 'system',
    'content': "\nYou are a commercial district analysis expert specializing in Seoul, South Korea. \nYour primary task is to provide information on the monthly rent, deposit, area, and floor of properties that match the user's desired criteria. \nPlease provide responses to user inquiries in Korean.\n"},
   {'role': 'user',
    'content': '갈현동에서 카페 창업을 하려고해.\n보증금 5000만에 월세 200만 원 이하로 권리금은 없었으면 좋겠고 1층에  50 m² 이상으로 찾아줘'},
   {'role': 'assistant',
    'content': '갈현동에 카페 창업하기 좋은 매물을 알려드릴게요.\n매물1\n- 보증금 : 2000만 원 \n- 월세 : 100만 원\n- 권리금 : 0원\n- 면적 : 66.1 m²\n- 층수 : 1층\n[매물 보러가기](https://www.zigbang.com/home/store/items/747317?log_screen_name=%EC%83%81%EA%B0%80%EB%A7%A4%EB%AC%BC%EC%83%81%EC%84%B8)\n\n'}]},
 {'messages': [{'role': 'system',
    'content': "\nYou are a commercial district analysis expert specializing in Seoul, South Korea. \nYour primary task is to provide information on the monthly rent, deposit, area, and floor of properties that match the 

In [72]:
# 제작한 프롬프트 파일로 저장 (OpenAI Storage에 업로드 해야 함)
with open("data/ft_data/ft_prompt.jsonl", "w", encoding="utf-8") as f :
    for i in ft_prompt :
        f.write(json.dumps(i) + "\n")

## 데이터 검증

### 1) Fine-tuning API의 규격에 맞는 데이터셋인지 검증

In [74]:
# 존재하지 않는 key값이 들어오면 0을 기본값으로 함
format_errors = defaultdict(int) 

for ex in ft_prompt: # ex는 하나의 대화(messages)로 dict형태

# 1) 대화데이터 형태 확인(dict)
    if not isinstance(ex, dict):          # isinstance(객체명, 클래스명)으로 객체의 타입을 확인하여  True or False 반환
        format_errors["data_type"] += 1   # format_errors에는 {"data_type" : 0}인 상태가 디폴트로 생성
        continue                          # ex가 dict가 아니면, not(False) -> True 반환하여 +1

# 2) 대화데이터 존재 여부 확인
    messages = ex.get('messages', None) # messages의 value값이 있는지 없는지 판단
    if not messages:
        format_errors["missing_messages_list"] +=1
        continue

# 3) 대화데이터 형식에 맞는 key값인지 확인
    for message in messages: # 채팅 API가 아닌 경우, role, content 외에 다른 key값이 있을 수 있음
        if any(key not in ("role", "content", "name", "function_call", "weight") for key in message): # any = 하나라도 True라면
            format_errors["message_unrecognized_key"] +=1      

        # message에 role과 content가 있는지 확인
        if "role" not in message or "content" not in message:
            format_errors['message_missing_key'] += 1

        #  role이 system, user, assistant 중 하나가 아니라면
        if message.get("role", None) not in ("system", "user", "assistant"):
            format_errors["unrecognized_role"] += 1

        # content에 값이 없거나 문자열이 아니라면
        content = message.get("content", None)
        if not content or not isinstance(content, str):
            format_errors["missing_content"] += 1 

    # 각 대화에 assistant의 응답이 하나도 없다면
    # message들 중 하나라도 assistant의 응답이 있으면 any문은 전체를 T로 인식함
    if not any(message.get("role", None) == "assistant" for message in messages):
        format_erros["example_missing_assistant_message"] +=1

# 발생한 에러가 있다면 해당 내용 출력
if format_errors:
    print("에러 발견:")
    for key, value in format_errors.items():
        print(f"{key}:{value}")
else:
    print("에러가 없습니다.")
                

에러가 없습니다.


### 2) 누락된 메세지 식별 및 메세지와 토큰 수 확인

In [77]:
encoding = tiktoken.get_encoding("cl100k_base") # get_encoding : 특정 토크나이저 인코딩 모델 검색
                                                # cl100k_base : OpenAI 최신 LLM에 사용되는 모델명

# 메세지 목록의 총 토큰 수 계산
def num_tokens_from_messages(messages, tokens_per_message=3, tokens_per_name=1):
    num_tokens = 0

    # tokens_per_message : "role" + "content" + "{}"를 토큰 3개로 임의 지정 (한 요소당 1로 대략 계산)
    for message in messages:
        num_tokens += tokens_per_message 

        # role과 content의 value를 tiktoken로 토큰화(encoding)하여 value의 토큰 개수 저장 
        for key, value in message.items():
            num_tokens += len(encoding.encode(value))

            # key에 "name"이 존재하면 토큰 1개 추가 (사용자가 assistant의 이름을 지정할 경우 발생)
            if key == "name": 
                num_tokens += tokens_per_name

    # num_tokens += 3 하는 이유
     # 1) 하나의 messages에 전체를 감싸는 토큰 : "{}"
     # 2) 한 message의 끝을 표시하는 특수 토큰 (모델 내부에서 동작 <SEP> 등)
     # 3) 각각의 message를 구분해주는 구분 토큰 : ','
    num_tokens += 3 

    return num_tokens

# assistant가 응답한 content의 총 토큰 수 (모델의 max_output_tokens 기준에 맞는지 판단 가능)
def num_assistant_tokens_from_messages(messages):
    num_tokens = 0
    for message in messages:
        if message["role"] == "assistant":
            num_tokens += len(encoding.encode(message["content"])) # assistant의 content 토큰 수
    return num_tokens

# message의 토큰 길이에 대한 통계 정보 출력
def print_statistics(values):
    print(f"min / max : {min(values)}, {max(values)}")
    print(f"mean / median : {np.mean(values)}, {np.median(values)}")

#### [모델별 토큰 수 ](https://platform.openai.com/docs/models)

In [81]:
max_output_tokens = 16384    # 모델 최대 출력 토큰 수(gpt-4o-mini의 경우 16384개)
n_missing_system = 0         # system이 없는 경우 대화 수
n_missing_user = 0           # user가 없는 경우의 대화 수
n_messages = []              # 각 대화의 message개수
total_tokens_lens = []       # 각 대화의 총 토큰 수
assistant_message_lens = []  # assistant가 보낸 메시지의 길이

for ex in ft_prompt:
    messages = ex["messages"]

    # system이 포함되어 있지 않으면 +1
    if not any(message["role"] == "system" for message in messages):
        n_missing_system += 1

    # user가 포함되어 있지 않으면 +1
    if not any(message["role"] == "user" for message in messages):
        n_missing_user += 1

    # 각 대화별 메세지 개수
    n_messages.append(len(messages))

    # 각 대화별 총 토큰 개수(role도 다 포함)
    total_tokens_lens.append(num_tokens_from_messages(messages))

    # assistant's output 토큰 수
    assistant_message_lens.append(num_assistant_tokens_from_messages(messages))

print("System 누락 수 : ", n_missing_system)
print("User 누락 수 : ", n_missing_user)

print()
print("대화별 메시지 수 통계 : ")
print_statistics(n_messages)

print()
print("대화별 토큰 수 통계 : ")
print_statistics(total_tokens_lens)

print()
print("대화별 assistant 출력 토큰 수 통계 : ")
print_statistics(assistant_message_lens)

# total_tokens_lens(각 대화별 토큰 수 리스트)에서 최대값(16384)을 넘는 대화 수
n_too_long = sum(i > max_output_tokens for i in total_tokens_lens)

print()
print(f"\n{n_too_long}개의 대화가 {max_output_tokens}개 토큰 제한을 초과하며 이 부분은 학습중 잘릴 수 있습니다.")

System 누락 수 :  0
User 누락 수 :  0

대화별 메시지 수 통계 : 
min / max : 3, 3
mean / median : 3.0, 3.0

대화별 토큰 수 통계 : 
min / max : 108, 656
mean / median : 320.39814814814815, 298.5

대화별 assistant 출력 토큰 수 통계 : 
min / max : 17, 527
mean / median : 189.07407407407408, 170.0


0개의 대화가 16384개 토큰 제한을 초과하며 이 부분은 학습중 잘릴 수 있습니다.


### 3) 적정 epochs 및 비용 추정
- [파인튜닝 토큰 수](https://platform.openai.com/docs/guides/fine-tuning)

In [97]:
# 모델에 맞는 대화당 최대 토큰 수 설정 (4o-mini의 Traning examples context length 기준)
MAX_TOKENS_PER_EXAMPLE = 65536

# OpenAI의 테스트에 의해 얻어진 적정 기준 (절대적인 기준은 아님!!!!!)
TARGET_EPOCHS = 3             # 초기 학습 횟수 (GPT는 보통 처음에 2~4회로 지정)
MIN_DEFAULT_EPOCHS = 1        # 최소 epochs
MAX_DEFAULT_EPOCHS = 25       # 최대 epochs
MIN_TARGET_EXAMPLES = 100     # fine-tuning 효과를 보기 위한 최소 데이터 수
MAX_TARGET_EXAMPLES = 25000   # 최대 데이터 개수 (비용 및 시간 효율을 위해 상한 설정)


# --------------- epoch 수 산정하기 ---------------
n_epochs = TARGET_EPOCHS         # 초기 학습 횟수
n_train_examples = len(ft_prompt)  # messages의 개수

# 대화 수(messages) * 초기 학습 횟수(epochs)가 최소 데이터 수에 못 미치면
if (n_train_examples * TARGET_EPOCHS) < MIN_TARGET_EXAMPLES:
    n_epochs = min(MAX_DEFAULT_EPOCHS, (MIN_TARGET_EXAMPLES//n_train_examples))  
    
# 대화 수(messages) * 초기 학습 횟수(epochs)가 최대 데이터 수를 넘기면
elif (n_train_examples * TARGET_EPOCHS) > MAX_TARGET_EXAMPLES:
    n_epochs = max(MIN_DEFAULT_EPOCHS, (MAX_TARGET_EXAMPLES//n_train_examples))
# -----------------------------------------------


# 대화별 토큰 수 (total_tokens_lens)와 MAX_TOKENS_PER_EXAMPLE 중 더 작은 토큰 수 더하기
# MAX_TOKENS_PER_EXAMPLE(65536토큰)를 초과하면 어차피 나머지는 글은 잘리기 때문에
n_billing_tokens_in_dataset = sum(min(MAX_TOKENS_PER_EXAMPLE, length) for length in total_tokens_lens)


print(f"데이터 셋에는 학습 중 요금이 청구될 {n_billing_tokens_in_dataset}개의 토큰이 있습니다.")
print(f"기본적으로 이 데이터 셋에서 {n_epochs} epochs 동안 학습합니다.")
print(f"총 {n_epochs*n_billing_tokens_in_dataset}개의 토큰에 대해 요금이 청구됩니다.")

데이터 셋에는 학습 중 요금이 청구될 34603개의 토큰이 있습니다.
기본적으로 이 데이터 셋에서 3 epochs 동안 학습합니다.
총 103809개의 토큰에 대해 요금이 청구됩니다.


## Fine-tuning

In [5]:
# MY_API_KEY = getpass.getpass("OpenAI API Key :")
MY_API_KEY = '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'

In [7]:
client = OpenAI(api_key=MY_API_KEY)

### 1) OpenAI Storage에 파일 업로드

In [104]:
fine_tune_files = client.files.create(
    file = open("data/ft_data/ft_prompt.jsonl", "rb"),  # rb를 하면 encoding이 필요 없음
    purpose = "fine-tune"
)
fine_tune_files

FileObject(id='file-JZn9jid2vktjd6bAKcVDPJ', bytes=139139, created_at=1742439796, filename='ft_prompt.jsonl', object='file', purpose='fine-tune', status='processed', status_details=None, expires_at=None)

### 작업 객체 생성 및 Fine-tuning 시작 ([모델명 참조](https://platform.openai.com/docs/guides/fine-tuning))

In [None]:
# 파인튜닝 모델과 데이터 지정
fine_tune_job = client.fine_tuning.jobs.create(
    model = "gpt-4o-mini-2024-07-18",      # docs - Fine-tuning에 있는 모델 사용
    training_file = fine_tune_files.id,    # openai storage에 있는 파일의 id값을 지정
    hyperparameters={"n_epochs": n_epochs} # 위에서 산정된 epochs 수 지정
)
fine_tune_job

FineTuningJob(id='ftjob-m9xUm0whTnuY9m4OSPPzip1b', created_at=1742439833, error=Error(code=None, message=None, param=None), fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(batch_size='auto', learning_rate_multiplier='auto', n_epochs='auto'), model='gpt-4o-mini-2024-07-18', object='fine_tuning.job', organization_id='org-NIS2YRUXpw47qQ31hSVYDspr', result_files=[], seed=1663372285, status='validating_files', trained_tokens=None, training_file='file-JZn9jid2vktjd6bAKcVDPJ', validation_file=None, estimated_finish=None, integrations=[], method=Method(dpo=None, supervised=MethodSupervised(hyperparameters=MethodSupervisedHyperparameters(batch_size='auto', learning_rate_multiplier='auto', n_epochs='auto')), type='supervised'), user_provided_suffix=None, metadata=None)

In [108]:
# 파인튜닝 작업 번호
# ftjob-Ft82dD32EH1jaOumUtXOFHEv 이런식
job_id = fine_tune_job.id 

# fine_tuned_model : 파인튜닝이 완료된 후 생성된 개인 모델 명칭 확인
# ft:gpt-4o-mini-2024-07-18:personal::B1pKdhoJ 이런식
model_id = client.fine_tuning.jobs.retrieve(job_id).fine_tuned_model

In [None]:
# 2개 모델이 요약한 내용을 비교평가하는 함수(리뷰내용, 첫 번쨰 모델 응답, 두 번째 모델 응답)
def pairwise_eval(reviews, answer_a, answer_b):
    eval_prompt = f"""[System]
    Please act as an impartial judge and evaluate the quality of the Korean summaries provided by two
    AI assistants to the set of user reviews on accommodations displayed below. You should choose the assistant that
    follows the user’s instructions and answers the user’s question better. Your evaluation
    should consider factors such as the helpfulness, relevance, accuracy, depth, creativity,
    and level of detail of their responses. Begin your evaluation by comparing the two
    responses and provide a short explanation. Avoid any position biases and ensure that the
    order in which the responses were presented does not influence your decision. Do not allow
    the length of the responses to influence your evaluation. Do not favor certain names of
    the assistants. Be as objective as possible. After providing your explanation, output your
    final verdict by strictly following this format: "[[A]]" if assistant A is better, "[[B]]"
    if assistant B is better, and "[[C]]" for a tie.
    Say Korean

    [User Reviews]
    {reviews}
    [The Start of Assistant A’s Answer]
    {answer_a}
    [The End of Assistant A’s Answer]
    [The Start of Assistant B’s Answer]
    {answer_b}
    [The End of Assistant B’s Answer]"""

    completion = client.chat.completions.create(model = 'gpt-4o',
                                                messages = [{'role':'user',
                                                             'content':eval_prompt}],
                                                temperature = 0
                                               )
    return completion
    

In [None]:
answer_a = summarize(reviews, PROMPT_BASELINE, model='gpt-3.5-turbo').choices[0].message.content

##### **status(선택)**
- running(동작중), validating_files(파일 검증), queued(대기)
- succeded(성공), fialed(실패), concelled(취소됨)


In [110]:
client.fine_tuning.jobs.retrieve(job_id).status

'validating_files'

##### **작업로그, 성능 업데이트 또는 오류 메세지 같이 미세 조정 작업 중에 발생한 이벤트추척(선택)**
- 모델, 에러 및 내용(발생시), 작업 상태, 사용된 데이터셋, 생성 및 완료 시간 등 확인 가능 (대시보드 - 파인튜닝 정보를 코드로 확인하는 것)

In [113]:
client.fine_tuning.jobs.list_events(fine_tuning_job_id = job_id,
                                    limit =5)       # 출력 개수 제한

SyncCursorPage[FineTuningJobEvent](data=[FineTuningJobEvent(id='ftevent-urV04UBwHMeytajbdGGaXJs0', created_at=1742439833, level='info', message='Validating training file: file-JZn9jid2vktjd6bAKcVDPJ', object='fine_tuning.job.event', data={}, type='message'), FineTuningJobEvent(id='ftevent-dQpIzuyA7ix03gDNOYK23uSs', created_at=1742439833, level='info', message='Created fine-tuning job: ftjob-m9xUm0whTnuY9m4OSPPzip1b', object='fine_tuning.job.event', data={}, type='message')], object='list', has_more=False)

##### **모든 파인튜닝 작업 현황 보기(선택)**

In [115]:
client.fine_tuning.jobs.list()     # limit 매개변수를 통해 출력 개수를 제한할 수 있음

SyncCursorPage[FineTuningJob](data=[FineTuningJob(id='ftjob-m9xUm0whTnuY9m4OSPPzip1b', created_at=1742439833, error=Error(code=None, message=None, param=None), fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(batch_size='auto', learning_rate_multiplier='auto', n_epochs='auto'), model='gpt-4o-mini-2024-07-18', object='fine_tuning.job', organization_id='org-NIS2YRUXpw47qQ31hSVYDspr', result_files=[], seed=1663372285, status='validating_files', trained_tokens=None, training_file='file-JZn9jid2vktjd6bAKcVDPJ', validation_file=None, estimated_finish=None, integrations=[], method=Method(dpo=None, supervised=MethodSupervised(hyperparameters=MethodSupervisedHyperparameters(batch_size='auto', learning_rate_multiplier='auto', n_epochs='auto')), type='supervised'), user_provided_suffix=None, metadata=None)], object='list', has_more=False)

In [117]:
# jobs.list에서 전체 작업 목록 id만 확인
all_job_id = [job.id for job in client.fine_tuning.jobs.list()]
all_job_id

['ftjob-m9xUm0whTnuY9m4OSPPzip1b']

##### **작업 취소 및 작업 삭제**

In [None]:
# # 작업 취소(오래걸리거나, 실수했을 때)
# client.fine_tuning.jobs.cancel(model_id)

In [None]:
## 작업 삭제
# client.models.delete(model_id)

##### **파인튜닝 후 대화하는 법**

In [15]:
model_id = 'ft:gpt-4o-mini-2024-07-18:fininsight::BD0dE9e2'
completion = client.chat.completions.create(
    model = model_id,
    messages = [{"role" : "user", "content" : "동대문구에 맛집이 없어서 내가 한 번 해볼려고 한다 어떻게 생각하냐"}]
)
print(completion.choices[0].message.content)

동대문구에 맛집이 없다는 건 좀 다른 의견이 있지만, 도움이 필요하면 언제든지 말해줘!


## Fine-tuning 결과가 좋지 않다고 판단될 경우 대응
**1) 데이터 부분**
1) 데이터 수 추가
    - 가장 효과가 확실한 방법
2) 데이터의 균형과 다양성 고려
    - 균형을 맞춰야 한다면 일반적으로 적은양의 고품질 데이터가 많은 양의 저품질 데이터보다 효과적
3) 기존 데이터의 문제점 조사
    - 원치않는 방식의 대화 데이터가 포함되어 있는지 확인(잘못된 패턴이 학습되었을 수 있음)
    - 응답에 필요한 모든 정보가 포함되어 있는지 확인
    - 여러 사람들이 함께 제작한 데이터라면 어느정도 일관성이 있는지 확인(패턴이 다 달라서 학습하기 힘들 수 있음)
      
**2) 모델 부분**
1) 완료된 모델에 추가로 fine-tuning 진행
    - 완료된 모델의 모델명으로 fine-tuning을 이어서 진행 가능
2) 하이퍼파라미터 변경
    - epochs, learning_rate를 변경 가능

**3) 평가지표**
1) mean_token_accuracy
2) loss


##### **체크포인트(중간저장) 모델 활용하기**
- Fine-tunig 완료 시 체크포인트 모델을 활용할 수 있으며 체크포인트 모델은 학습이 최종 완료된 모델과 동일한 방식으로 사용 가능
- 현재는 완료된 작업 총 `3개의 체크포인트 모델`들만 사용 가능함
- 최종 모델의 성능이 애매하거나 수치적으로 과대적합이라고 판단된다면 이전 체크포인트 모델들을 활용할 수 있음

**코드 없이 확인**

In [None]:
!curl https://api.openai.com/v1/fine_tuning/jobs/ftjob-Ft82dD32EH1jaOumUtXOFHEv/checkpoints \
  -H "Authorization: Bearer $MY_API_KEY"

**코드로 확인(더 자세함)**
- mean_token_accuracy가 높아지는지, loss가 낮아지는지 확인!

In [None]:
response = client.fine_tuning.jobs.list_events(
    fine_tuning_job_id = "ftjob-Ft82dD32EH1jaOumUtXOFHEv",
)

# loss는 낮아지고 train_mean_token_accuracy는 낮아지는지 확인
# model_dump_json : 객체를 json문자열로 변환하는 함수
print(response.model_dump_json(indent=4))

## 추가학습 및 검증 데이터 활용

##### **추가 데이터 확인**

In [None]:
with open("finetune_data/common_sense_train_add.jsonl", "r", encoding="utf-8") as f:
    dataset = [json.loads(line) for line in f]

print( "샘플 수 :", len(dataset))
dataset

##### **추가 학습 데이터 업로드**

In [None]:
fine_tune_files_add = client.files.create(
    file = open("finetune_data/common_sense_train_add.jsonl", "rb"),  # rb를 하면 encoding이 필요 없음
    purpose = "fine-tune"
)
fine_tune_files_add

##### **검증 데이터 확인**

In [None]:
with open("finetune_data/common_sense_val.jsonl", "r", encoding="utf-8") as f:
    dataset = [json.loads(line) for line in f]

print( "샘플 수 :", len(dataset))
dataset

##### **검증 데이터 업로드**

In [None]:
fine_tune_files_val = client.files.create(
    file = open("finetune_data/common_sense_val.jsonl", "rb"),  # rb를 하면 encoding이 필요 없음
    purpose = "fine-tune"
)
fine_tune_files_val

##### **추가 Fine-tuning 및 검증 진행**

In [None]:
fine_tune_job_add = client.fine_tuning.jobs.create(
    model = "ft:gpt-4o-mini-2024-07-18:personal::B1pKdhoJ", # 기존 학습된 모델
    training_file = fine_tune_files_add.id,                 # 추가 학습 데이터 아이디
    validation_file = fine_tune_files_val.id,               # 검증용 데이터 아이디
    hyperparameters = {"n_epochs" : 5,
                       "learning_rate_multiplier" : 0.8
                      }
)

# learning_rate_multiplier(학습률)
# GPT-3.5/4 계열 모델: 0.1 ~ 0.5
# 데이터가 많고 Fine-Tuning 강도를 높이고 싶다면: 0.5 ~ 1.0
# 데이터가 적거나 기존 성능을 유지하면서 미세 조정하고 싶다면: 0.05 ~ 0.2

fine_tune_job_add

##### **학습 결과 epochs별로 확인, 체크포인트 확인**

In [None]:
response = client.fine_tuning.jobs.list_events(
    fine_tuning_job_id = "ftjob-x2NOix27Qk6THUxkrQjk2I09",
)
print(response.model_dump_json(indent=4)) # 객체를 json문자열로 변환