## How to fine-tune chat models
 이 노트북은 새로운 GPT-4o-mini 미세 조정에 대한 단계별 가이드를 제공합니다.
 다양한 레시피와 각각에 대한 추출된 일반 재료 목록을 제공하는 RecipeNLG 데이터 세트를 사용하여 엔터티 추출을 수행합니다 . 이는 개체명 인식(NER) 작업에 공통적인 데이터 세트입니다.

참고: GPT-4o mini 미세 조정은 Tier 4 및 5 사용 계층 의 개발자에게 제공됩니다 . 미세 조정 대시보드를 방문하여 "생성"을 클릭하고 기본 모델 드롭다운에서 "gpt-4o-mini-2024-07-18"을 선택하여 GPT-4o mini 미세 조정을 시작할 수 있습니다.

다음 단계를 살펴보겠습니다.

- 설정: 데이터 세트를 로드하고 미세 조정할 하나의 도메인으로 필터링합니다.
- 데이터 준비: 훈련 및 검증 사례를 만들고 이를 Files엔드포인트에 업로드하여 미세 조정을 위한 데이터를 준비합니다.
- 미세 조정: 미세 조정된 모델을 만듭니다.
- 추론: 미세 조정된 모델을 사용하여 새로운 입력에 대한 추론을 수행합니다.
이 과정을 마치면 미세 조정된 gpt-4o-mini-2024-07-18모델을 훈련, 평가하고 배포할 수 있게 됩니다.

미세 조정에 대한 자세한 내용은 설명서 가이드 나 API 참조를 참조하세요 .

In [None]:
!pip install openai -q

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/362.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m362.9/362.9 kB[0m [31m14.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m3.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m318.9/318.9 kB[0m [31m13.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
[?25h

Chat completion API Prompt로 모델 생성

In [None]:
# Zero-shot
from openai import OpenAI
client = OpenAI(api_key='')

response = client.chat.completions.create(
  model="gpt-4o-mini-2024-07-18",
  messages=[
    {"role": "system", "content": "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."},
    {"role": "user", "content": 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '},
  ]
)
print(response.choices[0].message.content)

- Brown sugar
- Evaporated milk
- Vanilla
- Nuts
- Butter or margarine
- Rice biscuits


In [None]:
# few-shot

from openai import OpenAI
client = OpenAI(api_key='')

response = client.chat.completions.create(
  model="gpt-4o-mini-2024-07-18",
  messages=[
    {"role": "system", "content": "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."},
    {"role": "user", "content": 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '},
    {"role": "assistant", "content": '["Brown sugar", "MIlk", "Vanilla", "Nuts", "Butter", "Rice biscuits"]'},
    {"role": "user", "content": 'Title: Classic Chocolate Chip Cookies\n\nIngredients: ["1 c. unsalted butter", "3/4 c. granulated sugar", "3/4 c. packed brown sugar", "1 tsp. vanilla extract", "2 large eggs", "2 1/4 c. all-purpose flour", "1/2 tsp. baking soda", "1/2 tsp. salt", "2 c. chocolate chips"]\n\nGeneric ingredients: '}

  ]
)
print(response.choices[0].message.content)

["Butter", "Granulated sugar", "Brown sugar", "Vanilla", "Eggs", "Flour", "Baking soda", "Salt", "Chocolate chips"]


In [None]:
import json
import openai
import os
import pandas as pd
from pprint import pprint

OPEN_API_KEY = os.getenv('OPEN_API_KEY', '')


파인 튜닝(fine-tuning)은 특정 도메인에 집중할 때 가장 효과적입니다. 모델이 학습할 수 있도록 데이터셋이 충분히 집중되어 있어야 하지만, 새로운 예시를 놓치지 않도록 어느 정도 일반성도 유지하는 것이 중요합니다. 이를 염두에 두고, 우리는 RecipesNLG 데이터셋에서 www.cookbooks.com의 문서만 포함하는 하위 집합을 추출했습니다.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

recipe_df = pd.read_csv('/content/drive/MyDrive/kdt_240424/M9_LLM/dataset/cookbook_recipes_nlg_10k.csv')

recipe_df.head()

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


Unnamed: 0,title,ingredients,directions,link,source,NER
0,No-Bake Nut Cookies,"[""1 c. firmly packed brown sugar"", ""1/2 c. eva...","[""In a heavy 2-quart saucepan, mix brown sugar...",www.cookbooks.com/Recipe-Details.aspx?id=44874,www.cookbooks.com,"[""brown sugar"", ""milk"", ""vanilla"", ""nuts"", ""bu..."
1,Jewell Ball'S Chicken,"[""1 small jar chipped beef, cut up"", ""4 boned ...","[""Place chipped beef on bottom of baking dish....",www.cookbooks.com/Recipe-Details.aspx?id=699419,www.cookbooks.com,"[""beef"", ""chicken breasts"", ""cream of mushroom..."
2,Creamy Corn,"[""2 (16 oz.) pkg. frozen corn"", ""1 (8 oz.) pkg...","[""In a slow cooker, combine all ingredients. C...",www.cookbooks.com/Recipe-Details.aspx?id=10570,www.cookbooks.com,"[""frozen corn"", ""cream cheese"", ""butter"", ""gar..."
3,Chicken Funny,"[""1 large whole chicken"", ""2 (10 1/2 oz.) cans...","[""Boil and debone chicken."", ""Put bite size pi...",www.cookbooks.com/Recipe-Details.aspx?id=897570,www.cookbooks.com,"[""chicken"", ""chicken gravy"", ""cream of mushroo..."
4,Reeses Cups(Candy),"[""1 c. peanut butter"", ""3/4 c. graham cracker ...","[""Combine first four ingredients and press in ...",www.cookbooks.com/Recipe-Details.aspx?id=659239,www.cookbooks.com,"[""peanut butter"", ""graham cracker crumbs"", ""bu..."


In [None]:
recipe_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 6 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   title        10000 non-null  object
 1   ingredients  10000 non-null  object
 2   directions   10000 non-null  object
 3   link         10000 non-null  object
 4   source       10000 non-null  object
 5   NER          10000 non-null  object
dtypes: object(6)
memory usage: 468.9+ KB


## Data preparation

우리는 데이터를 준비하는 것부터 시작할 것입니다. ChatCompletion 형식으로 파인 튜닝할 때, 각 학습 예시는 메시지들의 단순한 목록으로 구성됩니다. 예를 들어, 하나의 항목은 다음과 같이 생겼을 수 있습니다:

```
[{'role': 'system',
  'content': 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'},

 {'role': 'user',
  'content': 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '},

 {'role': 'assistant',
  'content': '["brown sugar", "milk", "vanilla", "nuts", "butter", "bite size shredded rice biscuits"]'}]
```


훈련 과정에서 이 대화는 나뉘게 되며, 마지막 항목은 모델이 생성할 답변(완성)이 되고, 나머지 메시지들은 프롬프트 역할을 합니다. 따라서 학습 예제를 만들 때 이를 고려해야 합니다. 모델이 여러 차례 주고받는 대화에서 작동할 경우, 대화가 확장되더라도 성능이 떨어지지 않도록 대표적인 예시들을 제공해야 합니다.


In [None]:
training_data = []

system_message = 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'

def create_user_message(row):
    return f"""Title: {row['title']}\n\nIngredients: {row['ingredients']}\n\nGeneric ingredients: """

def prepare_example_conversation(row):
    messages = []
    messages.append({'role': 'system', 'content': system_message})

    user_message = create_user_message(row)
    messages.append({'role': 'user', 'content': user_message})

    messages.append({'role': 'assistant', 'content': str(row['NER'])})

    return {'messages': messages}

pprint(prepare_example_conversation(recipe_df.iloc[0]))

{'messages': [{'content': 'You are a helpful recipe assistant. You are to '
                          'extract the generic ingredients from each of the '
                          'recipes provided.',
               'role': 'system'},
              {'content': 'Title: No-Bake Nut Cookies\n'
                          '\n'
                          'Ingredients: ["1 c. firmly packed brown sugar", '
                          '"1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 '
                          'c. broken nuts (pecans)", "2 Tbsp. butter or '
                          'margarine", "3 1/2 c. bite size shredded rice '
                          'biscuits"]\n'
                          '\n'
                          'Generic ingredients: ',
               'role': 'user'},
              {'content': '["brown sugar", "milk", "vanilla", "nuts", '
                          '"butter", "bite size shredded rice biscuits"]',
               'role': 'assistant'}]}


In [None]:
# use the first 100 rows of the dataset for training
training_df = recipe_df.loc[0:20]

# apply the prepare_example_conversation function to each row of the training_df
training_data = training_df.apply(prepare_example_conversation, axis=1).tolist()

for example in training_data[:5]:
    print(example)

{'messages': [{'role': 'system', 'content': 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'}, {'role': 'user', 'content': 'Title: No-Bake Nut Cookies\n\nIngredients: ["1 c. firmly packed brown sugar", "1/2 c. evaporated milk", "1/2 tsp. vanilla", "1/2 c. broken nuts (pecans)", "2 Tbsp. butter or margarine", "3 1/2 c. bite size shredded rice biscuits"]\n\nGeneric ingredients: '}, {'role': 'assistant', 'content': '["brown sugar", "milk", "vanilla", "nuts", "butter", "bite size shredded rice biscuits"]'}]}
{'messages': [{'role': 'system', 'content': 'You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided.'}, {'role': 'user', 'content': 'Title: Jewell Ball\'S Chicken\n\nIngredients: ["1 small jar chipped beef, cut up", "4 boned chicken breasts", "1 can cream of mushroom soup", "1 carton sour cream"]\n\nGeneric ingredients: '}, {'role': 'assistant', 'content': '["bee

훈련 데이터 외에 선택적으로 검증 데이터를 제공할 수도 있습니다. 검증 데이터는 모델이 훈련 세트에 과도하게 적합하지 않은지 확인하는 데 사용 됩니다

In [None]:
validation_df = recipe_df.loc[20:30]
validation_data = validation_df.apply(prepare_example_conversation, axis=1).tolist()


그런 다음 각 줄이 하나의 훈련 대화 사례가 되도록 .json파일로 데이터를 저장해야 합니다

- JSONL은 파일의 각 줄에 하나의 JSON 객체를 저장하는 형식입니다. 대규모 데이터를 처리할 때 유용하며 한 줄씩 데이터를 읽거나 쓸수 있기 때문에 효율적입니다

In [None]:
def write_jsonl(data_list: list, filename: str) -> None:
    with open(filename, 'w') as out:
        for ddict in data_list:
            jout = json.dumps(ddict) + '\n' # json.dumps(ddic)는 딕셔너리 ddict를 JSON 형식의 문자열로 변환
            out.write(jout)

In [None]:
training_file_name = 'tmp_recipe_finetune_training.jsonl'
write_jsonl(training_data, training_file_name)

validation_file_name = 'tmp_recipe_finetune_validation.jsonl'
write_jsonl(validation_data, validation_file_name)


In [None]:
!ls

drive  sample_data  tmp_recipe_finetune_training.jsonl	tmp_recipe_finetune_validation.jsonl


In [None]:
# print the first 5 lines of the training file
!head -n 5 tmp_recipe_finetune_training.jsonl

{"messages": [{"role": "system", "content": "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."}, {"role": "user", "content": "Title: No-Bake Nut Cookies\n\nIngredients: [\"1 c. firmly packed brown sugar\", \"1/2 c. evaporated milk\", \"1/2 tsp. vanilla\", \"1/2 c. broken nuts (pecans)\", \"2 Tbsp. butter or margarine\", \"3 1/2 c. bite size shredded rice biscuits\"]\n\nGeneric ingredients: "}, {"role": "assistant", "content": "[\"brown sugar\", \"milk\", \"vanilla\", \"nuts\", \"butter\", \"bite size shredded rice biscuits\"]"}]}
{"messages": [{"role": "system", "content": "You are a helpful recipe assistant. You are to extract the generic ingredients from each of the recipes provided."}, {"role": "user", "content": "Title: Jewell Ball'S Chicken\n\nIngredients: [\"1 small jar chipped beef, cut up\", \"4 boned chicken breasts\", \"1 can cream of mushroom soup\", \"1 carton sour cream\"]\n\nGeneric ingredients: "}, {"role":

## Fine-tuning

In [None]:
from openai import OpenAI

MODEL='gpt-4o-mini-2024-07-18'
client = OpenAI(api_key='')
train = client.files.create(
    file=open('tmp_recipe_finetune_training.jsonl', 'rb'),
    purpose='fine-tune'
)
valid = client.files.create(
    file=open('tmp_recipe_finetune_validation.jsonl', 'rb'),
    purpose='fine-tune'
)

In [None]:
train

FileObject(id='file-SbzAFouo8E9L5ulJdw8bp0Fo', bytes=12353, created_at=1724293365, filename='tmp_recipe_finetune_training.jsonl', object='file', purpose='fine-tune', status='processed', status_details=None)

In [None]:
valid

FileObject(id='file-ZmDPXpfn6hNr029PRK8EozPO', bytes=6968, created_at=1724293366, filename='tmp_recipe_finetune_validation.jsonl', object='file', purpose='fine-tune', status='processed', status_details=None)

In [None]:
client.fine_tuning.jobs.create(
    training_file=train.id,
    validation_file=valid.id,
    model=MODEL,
    hyperparameters={
        'n_epochs': 3,
    }
)

FineTuningJob(id='ftjob-cJJs7ZgXJJFK9gqlZ4NnEiqG', created_at=1724293580, error=Error(code=None, message=None, param=None), fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(n_epochs=3, batch_size='auto', learning_rate_multiplier='auto'), model='gpt-4o-mini-2024-07-18', object='fine_tuning.job', organization_id='org-gxLXvDs9v2kkMBfOqQlVpZ7h', result_files=[], seed=420488636, status='validating_files', trained_tokens=None, training_file='file-SbzAFouo8E9L5ulJdw8bp0Fo', validation_file='file-ZmDPXpfn6hNr029PRK8EozPO', estimated_finish=None, integrations=[], user_provided_suffix=None)

In [None]:
# 작업상태 확인
response = client.fine_tuning.jobs.retrieve('ftjob-cJJs7ZgXJJFK9gqlZ4NnEiqG')

# 작업 상태 확인
status = response.status

if status == 'succeeded':
    print('작업이 완료되었습니다.')
    # 작업이 완료되면 결과를 가져와서 사용할 수 있습니다
    # 예를 들어 모델을 사용하여 텍스트 생성 또는 다른 작업을 수행할 수 있습니다
else:
    print(f'작업 상태: {status}')

total_tokens = response.trained_tokens
print(f'사용된 총 토근 수: {total_tokens}')

작업 상태: running
사용된 총 토근 수: None


In [None]:
client.fine_tuning.jobs.list(limit=1)

SyncCursorPage[FineTuningJob](data=[FineTuningJob(id='ftjob-cJJs7ZgXJJFK9gqlZ4NnEiqG', created_at=1724293580, error=Error(code=None, message=None, param=None), fine_tuned_model='ft:gpt-4o-mini-2024-07-18:personal::9yrte7tz', finished_at=1724293885, hyperparameters=Hyperparameters(n_epochs=3, batch_size=1, learning_rate_multiplier=1.8), model='gpt-4o-mini-2024-07-18', object='fine_tuning.job', organization_id='org-gxLXvDs9v2kkMBfOqQlVpZ7h', result_files=['file-b84iXVWjtz8KLFqdKkaXn5gf'], seed=420488636, status='succeeded', trained_tokens=8313, training_file='file-SbzAFouo8E9L5ulJdw8bp0Fo', validation_file='file-ZmDPXpfn6hNr029PRK8EozPO', estimated_finish=None, integrations=[], user_provided_suffix=None)], object='list', has_more=False)

### Full Validation Loss의 목적:
- 과적합 방지: 훈련 데이터에 대한 손실(training loss)은 낮을 수 있지만, 검증 데이터에 대한 성능이 떨어지면 모델이 과적합되고 있는 신호입니다. Full validation loss는 이런 과적합 여부를 감지하는 데 유용합니다.
- 모델 선택: 파인튜닝 중 다양한 하이퍼파라미터 조합을 실험할 때, Full validation loss가 가장 낮은 지점에서 최적의 모델을 선택하는 기준이 될 수 있습니다.

Full validation loss는 파인튜닝 중 모델이 검증 데이터셋에 대해 얼마나 잘 예측하는지를 평가하는 중요한 지표로, 모델의 성능과 일반화 능력을 판단하는 데 도움을 줍니다.

## Inference

마지막 단계는 추론을 위해 미세 조정된 모델을 사용하는 것입니다. FineTuning 클래식과 유사하게 모델 매개변수를 채우는 새로운 미세 조정된 모델 이름으로 `ChatCompletions`을 호출하기만 하면 됩니다

In [None]:
test_df = recipe_df.loc[31:40]
test_row = test_df.iloc[0]
test_messages = []
test_messages.append({'role': 'system', 'content': system_message})
user_message = create_user_message(test_row)
test_messages.append({'role': 'user', 'content': create_user_message(test_row)})

pprint(test_messages)


[{'content': 'You are a helpful recipe assistant. You are to extract the '
             'generic ingredients from each of the recipes provided.',
  'role': 'system'},
 {'content': 'Title: Summer Chicken\n'
             '\n'
             'Ingredients: ["1 pkg. chicken cutlets", "1/2 c. oil", "1/3 c. '
             'red vinegar", "2 Tbsp. oregano", "2 Tbsp. garlic salt"]\n'
             '\n'
             'Generic ingredients: ',
  'role': 'user'}]


In [None]:
completion = client.chat.completions.create(
    model='ft:gpt-4o-mini-2024-07-18:personal::9yrte7tz',
    messages=test_messages,
    temperature=0,
    max_tokens=500
)
print(completion.choices[0].message.content)

["chicken cutlets", "oil", "red vinegar", "oregano", "garlic salt"]
