## How to fine-tune chat models

미세 조정은 프롬프트에 맞출 수 있는 것보다 훨씬 더 많은 예제를 학습하여 모델을 개선하고, 다양한 작업에서 더 나은 결과를 얻을 수 있도록 합니다. 이 노트북은 새로운 GPT-4o 미니 미세 조정에 대한 단계별 가이드를 제공합니다. 다양한 레시피와 각각에 대한 추출된 일반 재료 목록을 제공하는 RecipeNLG 데이터 세트를 사용하여 엔터티 추출을 수행합니다 . 이는 명명된 엔터티 인식(NER) 작업에 공통적인 데이터 세트입니다.

참고: GPT-4o mini 미세 조정은 Tier 4 및 5 사용 계층 의 개발자에게 제공됩니다 . 미세 조정 대시보드를 방문하여 "생성"을 클릭하고 기본 모델 드롭다운에서 "gpt-4o-mini-2024-07-18"을 선택하여 GPT-4o mini 미세 조정을 시작할 수 있습니다.

다음 단계를 살펴보겠습니다.

- 설정: 데이터 세트를 로드하고 미세 조정할 하나의 도메인으로 필터링합니다.
- 데이터 준비: 훈련 및 검증 사례를 만들고 이를 Files엔드포인트에 업로드하여 미세 조정을 위한 데이터를 준비합니다.
- 미세 조정: 미세 조정된 모델을 만듭니다.
- 추론: 미세 조정된 모델을 사용하여 새로운 입력에 대한 추론을 수행합니다.
이 과정을 마치면 미세 조정된 gpt-4o-mini-2024-07-18모델을 훈련, 평가하고 배포할 수 있게 됩니다.

미세 조정에 대한 자세한 내용은 설명서 가이드 나 API 참조를 참조하세요 .

In [None]:
!pip install openai -q

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/362.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m362.9/362.9 kB[0m [31m13.7 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/75.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m4.5 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/77.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m4.4 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/318.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m318.9/318.9 kB[0m [31m13.9 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Chat completion API 기반 Prompt를 이용한 모델 생성

In [None]:
# Zero-shot
from openai import OpenAI

clinet = OpenAI(api_key='')

response = clinet.chat.completions.create(
    model="gpt-4o-mini-2024-07-18",
    messages=[
        {"role": "system", "content": "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."},
        {"role": "user", "content": 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '},
    ]
)

print(response.choices[0].message.content)

Generic ingredients: brown sugar, evaporated milk, vanilla, nuts, butter, shredded rice biscuits


In [None]:
# Few-shot

# Zero-shot
from openai import OpenAI

clinet = OpenAI(api_key='')

response = clinet.chat.completions.create(
    model="gpt-4o-mini-2024-07-18",
    messages=[
        {"role": "system", "content": "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."},
        {"role": "user", "content": 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\n'},
        {"role": "assistant", "content": '["brown sugar", "milk", "vanilla", "nuts", "butter", "rice biscuits"]'},
        {"role": "user", "content": 'Title: Classic Chocolate Chip Cookies\n\nIngredients: ["1 c. unsalted butter", "3/4 c. granulated sugar", "3/4 c. packed brown sugar", "1 tsp. vanilla extract", "2 large eggs", "2 1/4 c. all-purpose flour", "1/2 tsp. baking soda", "1/2 tsp. salt", "2 c. chocolate chips"]\n\nGeneric ingredients: '}
    ]
)

print(response.choices[0].message.content)

["butter", "sugar", "vanilla", "eggs", "flour", "baking soda", "salt", "chocolate chips"]


In [None]:
import json
import openai
import os
from pprint import pprint

파인 튜닝(fine-tuning)은 특정 도메인에 집중할 때 가장 효과적입니다. 모델이 학습할 수 있도록 데이터셋이 충분히 집중되어 있어야 하지만, 새로운 예시를 놓치지 않도록 어느 정도 일반성도 유지하는 것이 중요합니다. 이를 염두에 두고, 우리는 RecipesNLG 데이터셋에서 www.cookbooks.com의 문서만 포함하는 하위 집합을 추출했습니다.

In [None]:
import pandas as pd

recipe_df = pd.read_csv('/content/drive/MyDrive/KDT_2404/m9_LLM/data/cookbook_recipes_nlg_10k.csv')

recipe_df.head()

Unnamed: 0,title,ingredients,directions,link,source,NER
0,No-Bake Nut Cookies,"[""1 c. firmly packed brown sugar"", ""1/2 c. eva...","[""In a heavy 2-quart saucepan, mix brown sugar...",www.cookbooks.com/Recipe-Details.aspx?id=44874,www.cookbooks.com,"[""brown sugar"", ""milk"", ""vanilla"", ""nuts"", ""bu..."
1,Jewell Ball'S Chicken,"[""1 small jar chipped beef, cut up"", ""4 boned ...","[""Place chipped beef on bottom of baking dish....",www.cookbooks.com/Recipe-Details.aspx?id=699419,www.cookbooks.com,"[""beef"", ""chicken breasts"", ""cream of mushroom..."
2,Creamy Corn,"[""2 (16 oz.) pkg. frozen corn"", ""1 (8 oz.) pkg...","[""In a slow cooker, combine all ingredients. C...",www.cookbooks.com/Recipe-Details.aspx?id=10570,www.cookbooks.com,"[""frozen corn"", ""cream cheese"", ""butter"", ""gar..."
3,Chicken Funny,"[""1 large whole chicken"", ""2 (10 1/2 oz.) cans...","[""Boil and debone chicken."", ""Put bite size pi...",www.cookbooks.com/Recipe-Details.aspx?id=897570,www.cookbooks.com,"[""chicken"", ""chicken gravy"", ""cream of mushroo..."
4,Reeses Cups(Candy),"[""1 c. peanut butter"", ""3/4 c. graham cracker ...","[""Combine first four ingredients and press in ...",www.cookbooks.com/Recipe-Details.aspx?id=659239,www.cookbooks.com,"[""peanut butter"", ""graham cracker crumbs"", ""bu..."


## Data preparation

우리는 데이터를 준비하는 것부터 시작할 것입니다. ChatCompletion 형식으로 파인 튜닝할 때, 각 학습 예시는 메시지들의 단순한 목록으로 구성됩니다. 예를 들어, 하나의 항목은 다음과 같이 생겼을 수 있습니다:

```
[{'role': 'system',
  'content': 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'},

 {'role': 'user',
  'content': 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '},

 {'role': 'assistant',
  'content': '["brown sugar", "milk", "vanilla", "nuts", "butter", "bite size shredded rice biscuits"]'}]
```


훈련 과정에서 이 대화는 나뉘게 되며, 마지막 항목은 모델이 생성할 답변(완성)이 되고, 나머지 메시지들은 프롬프트 역할을 합니다. 따라서 학습 예제를 만들 때 이를 고려해야 합니다. 모델이 여러 차례 주고받는 대화에서 작동할 경우, 대화가 확장되더라도 성능이 떨어지지 않도록 대표적인 예시들을 제공해야 합니다.


In [None]:
training_data = []

system_message = "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."

def create_user_message(row):
  return f"""Title: {row['title']}\n\nIngredients: {row['ingredients']}\n\nGeneric ingredients: """

def prepare_example_converation(row):
  messages = []
  messages.append({"role": "system", "content": system_message})

  user_message = create_user_message(row)
  messages.append({"role":"user","content":user_message})

  messages.append({"role":"assistant", "content":row["NER"]})

  return {"messages":messages}

pprint(prepare_example_converation(recipe_df.iloc[0]))

{'messages': [{'content': 'You are a helpful recipe assistant. You are to '
                          'extract the generic ingredients from each of the '
                          'recipes provided.',
               'role': 'system'},
              {'content': 'Title: No-Bake Nut Cookies\n'
                          '\n'
                          'Ingredients: ["1 c. firmly packed brown sugar", '
                          '"1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 '
                          'c. broken nuts (pecans)", "2 Tbsp. butter or '
                          'margarine", "3 1/2 c. bite size shredded rice '
                          'biscuits"]\n'
                          '\n'
                          'Generic ingredients: ',
               'role': 'user'},
              {'content': '["brown sugar", "milk", "vanilla", "nuts", '
                          '"butter", "bite size shredded rice biscuits"]',
               'role': 'assistant'}]}


In [None]:
traning_df = recipe_df.iloc[:20]

training_data = traning_df.apply(prepare_example_converation, axis=1).tolist()

for example in training_data[:5]:
  print(example)

{'messages': [{'role': 'system', 'content': 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'}, {'role': 'user', 'content': 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '}, {'role': 'assistant', 'content': '["brown sugar", "milk", "vanilla", "nuts", "butter", "bite size shredded rice biscuits"]'}]}
{'messages': [{'role': 'system', 'content': 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'}, {'role': 'user', 'content': 'Title: Jewell Ball\'S Chicken\n\nIngredients: ["1 small jar chipped beef, cut up", "4 boned chicken breasts", "1 can cream of mushroom soup", "1 carton sour cream"]\n\nGeneric ingredients: '}, {'role': 'assistant', 'content': '["bee

훈련데이터 외에 선택적으로 검증 데이터를 제공할 수도 있습니다. 검증 데이터는 모델이 훈련세트에 과도하게 적합하지 않은지 확인하는데 사용됩니다.

In [None]:
validation_df = recipe_df.loc[20:30]
validation_data = validation_df.apply(prepare_example_converation, axis=1).tolist()

그런 다음 각 줄이 하나의 훈련 대화 사례가 되도록 .jsonl 파일로 데이터를 저장해야합니다.

In [None]:
def write_jsonl(data_list: list, filename: str) -> None:
  with open(filename, 'w') as out:
    for ddict in data_list:
      jObj = json.dumps(ddict) + '\n'
      out.write(jObj)

In [None]:
training_file_name = "tmp_recipe_finetune_training.jsonl"
write_jsonl(training_data, training_file_name)

validation_file_name = "tmp_recipe_finetune_validation.jsonl"
write_jsonl(validation_data, validation_file_name)

In [None]:
from openai import OpenAI
MODEL="gpt-3.5-turbo-0613"
# MODEL="gpt-4o-mini-2024-07-18
client = OpenAI(api_key="")
train = client.files.create(
    file=open(training_file_name, "rb"),
    purpose='fine-tune'
)

valid = clinet.files.create(
    file=open(validation_file_name, "rb"),
    purpose='fine-tune'
)

In [None]:
train

FileObject(id='file-iZ1asamOwvEPa0gi0EqONLC9', bytes=11752, created_at=1724293509, filename='tmp_recipe_finetune_training.jsonl', object='file', purpose='fine-tune', status='processed', status_details=None)

In [None]:
valid

FileObject(id='file-SdZ212Vqf8pGBaWMZud1BCaJ', bytes=6968, created_at=1724293510, filename='tmp_recipe_finetune_validation.jsonl', object='file', purpose='fine-tune', status='processed', status_details=None)

In [None]:
client.fine_tuning.jobs.create(
    training_file=train.id,
    validation_file=valid.id,
    model=MODEL,
    hyperparameters={
        "n_epochs": 3,
    }
)

FineTuningJob(id='ftjob-hoJfmcg8lW49XOQVi5NztrAG', created_at=1724293516, error=Error(code=None, message=None, param=None), fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(n_epochs=3, batch_size='auto', learning_rate_multiplier='auto'), model='gpt-3.5-turbo-0613', object='fine_tuning.job', organization_id='org-ruSNx1Go4VjRy34C11Mu9r5T', result_files=[], seed=1064471471, status='validating_files', trained_tokens=None, training_file='file-iZ1asamOwvEPa0gi0EqONLC9', validation_file='file-SdZ212Vqf8pGBaWMZud1BCaJ', estimated_finish=None, integrations=[], user_provided_suffix=None)

In [None]:
# 작업 상태 확인
response = client.fine_tuning.jobs.retrieve('ftjob-hoJfmcg8lW49XOQVi5NztrAG')

status = response.status

if status == "succeeded":
    print("작업이 완료되었습니다.")
    # 작업이 완료되면 결과를 가져와서 사용할 수 있습니다.
    # 예를 들어, 모델을 사용하여 텍스트 생성 또는 다른 작업을 수행할 수 있습니다.
else:
  print(f"작업 상태: {status}")

total_tokens = response.trained_tokens
print(f"사용된 총 토큰 수: {total_tokens}")

작업 상태: running
사용된 총 토큰 수: None


마지막 단계는 추론을 위해 미세 조정된 모델을 사용하는 것입니다. FineTuning 클래식과 유사하게 모델 매개변수를 채우는 새로운 미세 조정된 모델 이름으로 `ChatCompletions`을 호출하기만 하면 됩니다

In [None]:
test_df = recipe_df.loc[30:40]
test_row = test_df.iloc[0]
test_messages = []
test_messages.append({"role":"system","content":system_message})
user_message = create_user_message(test_row)
test_messages.append({"role":"user","content":create_user_message(test_row)})

pprint(test_messages)

[{'content': 'You are a helpful recipe assistant. You are to extract the '
             'generic ingredients from each of the recipes provided.',
  'role': 'system'},
 {'content': 'Title: Punch Bowl Fruit Salad\n'
             '\n'
             'Ingredients: ["2 large cans sliced peaches", "2 large cans fruit '
             'cocktail", "1 large can diced pineapple", "1 qt. fresh '
             'strawberries", "2 red apples", "2 yellow apples", "4 large ripe '
             'bananas", "1 lb. white grapes", "1 lb. purple grapes"]\n'
             '\n'
             'Generic ingredients: ',
  'role': 'user'}]


### Full Validation Loss의 목적:
- 과적합 방지: 훈련 데이터에 대한 손실(training loss)은 낮을 수 있지만, 검증 데이터에 대한 성능이 떨어지면 모델이 과적합되고 있는 신호입니다. Full validation loss는 이런 과적합 여부를 감지하는 데 유용합니다.
- 모델 선택: 파인튜닝 중 다양한 하이퍼파라미터 조합을 실험할 때, Full validation loss가 가장 낮은 지점에서 최적의 모델을 선택하는 기준이 될 수 있습니다.

Full validation loss는 파인튜닝 중 모델이 검증 데이터셋에 대해 얼마나 잘 예측하는지를 평가하는 중요한 지표로, 모델의 성능과 일반화 능력을 판단하는 데 도움을 줍니다.

Task1_0822. 특정 과제에 대하여 추론하는 모델을 Chat completion api를 이용해서 아래와 같이 생성하여 비교하세요.
- zero-shot
- few-shot
- fine-tuning

In [None]:
!pip install openai -q

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/362.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━[0m [32m286.7/362.9 kB[0m [31m9.6 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m362.9/362.9 kB[0m [31m5.6 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/75.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m4.8 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/77.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m5.2 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/318.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━

In [None]:
# Zero-shot
# 연차 관련 사항 미적용, 적용 전후 비교
from openai import OpenAI

client = OpenAI(api_key='')

response = client.chat.completions.create(
    model="gpt-4o-mini-2024-07-18",
    messages=[
        {"role": "system", "content": "당신은 근로자에게 필요한 정보를 제공하는 챗봇입니다."},
        {"role": "user", "content": '나는 입사한지 2년 6개월이 되었어. 그럼 나는 연차가 몇개 있는거야?'},
    ]
)

print(response.choices[0].message.content)

연차 휴가는 근무 연수에 따라 달라지며, 일반적으로 한국의 경우 첫 해는 1개월 근무 시 1일의 연차가 발생하고, 이후 매년 15일의 연차가 부여됩니다. 

따라서, 2년 6개월 근무한 경우 계산하면:

1. 첫 해 (12개월): 1일 x 12개월 = 1일
2. 두 번째 해 (12개월): 15일
3. 현재까지 추가로 발생하는 연차: (6개월 x 1.25일) = 7.5일 (대부분의 회사에서는 반올림하여 8일로 계산)
   
총합을 계산하면:
1일 + 15일 + 8일 = 24일

따라서, 현재까지 총 24일의 연차가 발생한 것으로 보입니다. 다만, 회사의 정책이나 규정에 따라 다를 수 있으므로, 인사팀에 확인하는 것이 좋습니다.


In [None]:
# Zero-shot
# 연차 관련 사항 미적용, 적용 전후 비교
from openai import OpenAI

client = OpenAI(api_key='')

response = client.chat.completions.create(
    model="gpt-4o-mini-2024-07-18",
    messages=[
        {"role": "system", "content": "당신은 근로자에게 필요한 정보를 제공하는 챗봇입니다."},
        {"role": "user", "content": '나는 입사한지 8개월이 되었어. 연차를 사용할 수 있어?'},
    ]
)

print(response.choices[0].message.content)

네, 대부분의 경우 입사한 지 8개월이 경과한 근로자는 연차휴가를 사용할 수 있습니다. 한국의 근로기준법에 따르면, 1년 근무 후 총 15일의 연차휴가가 부여되며, 1개월 근무 시 1일의 연차휴가가 발생합니다. 따라서 8개월 근무한 당신은 약 8일의 연차휴가를 사용할 수 있습니다. 정확한 내용은 회사의 내규나 인사부서에 확인하는 것이 좋습니다.


In [None]:
# Few-shot

# Zero-shot
from openai import OpenAI

clinet = OpenAI(api_key='')

response = clinet.chat.completions.create(
    model="gpt-4o-mini-2024-07-18",
    messages=[
        {"role": "system", "content": "당신은 근로자에게 필요한 정보를 제공하는 챗봇입니다."},
        {"role": "user", "content": '나는 입사한지 8개월이 되었어. 연차를 사용할 수 있어?'},
        {"role": "assistant", "content": """대부분의 경우 입사한 지 1년 미만의 근로자는 월차를 사용할 수 있습니다. 이는 매달 부여되는 유급휴가로, 보통 1개월 이상 근무한 근로자에게 주어집니다.
        1. **연차 유급휴가의 기본 조건**:\n
        - 사용자는 1년간 80% 이상 출근한 근로자에게 15일의 유급휴가를 제공해야 합니다.\n
        - 1년 미만 근무한 근로자나 80% 미만 출근한 근로자에게는 1개월 개근 시 1일의 유급휴가를 제공합니다."""},
        {"role": "user", "content": '입사한지 1년 하고도 2개월이 되었으면 연차나 월차를 사용 가능한가?'}
    ]
)

print(response.choices[0].message.content)

입사한 지 1년 2개월이 지났다면, 연차 유급휴가는 사용할 수 있습니다. 

1. **연차 유급휴가**: 1년 이상 근무한 직원은 15일의 연차 유급휴가를 받을 수 있습니다. 이후 매년 1일씩 추가됩니다.

2. **월차**: 1개월에 이상 근무한 경우에 대해 부여된 월차는 별도로 존재합니다. 따라서, 연차 뿐만 아니라 월차도 사용할 수 있습니다.

따라서, 연차와 월차 모두 사용 가능한 상태입니다. 구체적인 사용 방식은 회사의 내규에 따라 달라질 수 있으니, 인사팀에 확인해보는 것이 좋습니다.
