## 직렬화(Serialization)

### 직렬화(Serialization) 란?

1. **정의:**
   - 모델을 저장 가능한 형식으로 변환하는 과정

2. **목적:**
   - 모델 재사용 (재훈련 없이)
   - 모델 배포 및 공유 용이
   - 계산 리소스 절약

3. **장점:**
   - 빠른 모델 로딩
   - 버전 관리 가능
   - 다양한 환경에서 사용 가능

모델 직렬화는 AI 개발 및 배포 과정에서 중요한 단계로, 효율적인 모델 관리와 재사용을 가능하게 합니다.

`is_lc_serializable` 클래스 메서드로 실행하여 LangChain 클래스가 직렬화 가능한지 확인할 수 있습니다.

In [1]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

True

In [3]:
# LangSmith 추적을 설정합니다. https://smith.langchain.com
# !pip install langchain-teddynote
from langchain_teddynote import logging

# 프로젝트 이름을 입력합니다.
logging.langsmith("CH04-Models-03-ModelSerialization")

LangSmith 추적을 시작합니다.
[프로젝트명]
project_name='CH04-Models-03-ModelSerialization'
LANGSMITH_PROJECT: CH04-Models-03-ModelSerialization


In [None]:
import os
from langchain.prompts import PromptTemplate

# 프롬프트 템플릿을 사용하여 질문을 생성합니다.
prompt = PromptTemplate.from_template("{fruit}의 색상이 무엇입니까?")

클래스(class) 에 대하여 직렬화 가능 여부를 확인합니다.

In [None]:
from langchain_openai import ChatOpenAI

# 직렬화가 가능한지 체크합니다.
print(f"ChatOpenAI: {ChatOpenAI.is_lc_serializable()}")

ChatOpenAI: True


In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI

# 직렬화가 가능한지 체크합니다.
print(f"ChatGoogleGenerativeAI: {ChatGoogleGenerativeAI.is_lc_serializable()}")

ChatGoogleGenerativeAI: True


llm 객체에 대하여 직렬화 가능 여부를 확인합니다.

In [13]:
from common.gemini_llm_factory import GeminiLLMFactory

# 모델을 생성합니다.
llm_factory = GeminiLLMFactory()
llm = llm_factory.get_llm()
# llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)

# 직렬화가 가능한지 체크합니다.
print(f"GeminiLLMFactory: {llm.is_lc_serializable()}")

GeminiLLMFactory: True


In [8]:
# 체인을 생성합니다.
chain = prompt | llm

# 직렬화가 가능한지 체크합니다.
chain.is_lc_serializable()

True

## 체인(Chain) 직렬화(dumps, dumpd)

### 개요

체인 직렬화는 직렬화 가능한 모든 객체를 딕셔너리 또는 JSON 문자열로 변환하는 과정을 의미합니다.

### 직렬화 방법

객체의 속성 및 데이터를 키-값 쌍으로 저장하여 딕셔너리 형태로 변환합니다.

이러한 직렬화 방식은 객체를 쉽게 저장하고 전송할 수 있게 하며, 다양한 환경에서 객체를 재구성할 수 있도록 합니다.

**참고**
- `dumps`: 객체를 JSON 문자열로 직렬화
- `dumpd`: 객체를 딕셔너리로 직렬화


In [14]:
from langchain_core.load import dumpd, dumps

dumpd_chain = dumpd(chain)
dumpd_chain

{'lc': 1,
 'type': 'constructor',
 'id': ['langchain', 'schema', 'runnable', 'RunnableSequence'],
 'kwargs': {'first': {'lc': 1,
   'type': 'constructor',
   'id': ['langchain', 'prompts', 'prompt', 'PromptTemplate'],
   'kwargs': {'input_variables': ['fruit'],
    'template': '{fruit}의 색상이 무엇입니까?',
    'template_format': 'f-string'},
   'name': 'PromptTemplate'},
  'last': {'lc': 1,
   'type': 'constructor',
   'id': ['langchain_google_genai', 'chat_models', 'ChatGoogleGenerativeAI'],
   'kwargs': {'model': 'models/gemini-2.5-flash',
    'google_api_key': {'lc': 1, 'type': 'secret', 'id': ['GOOGLE_API_KEY']},
    'temperature': 0.5,
    'n': 1,
    'max_retries': 6,
    'default_metadata': []},
   'name': 'ChatGoogleGenerativeAI'}},
 'name': 'RunnableSequence'}

In [15]:
# 직렬화된 체인의 타입을 확인합니다.
type(dumpd_chain)

dict

이번에는 `dumps` 함수를 사용하여 직렬화된 체인을 확인해보겠습니다.

In [16]:
# dumps 함수를 사용하여 직렬화된 체인을 확인합니다.
dumps_chain = dumps(chain)
dumps_chain

'{"lc": 1, "type": "constructor", "id": ["langchain", "schema", "runnable", "RunnableSequence"], "kwargs": {"first": {"lc": 1, "type": "constructor", "id": ["langchain", "prompts", "prompt", "PromptTemplate"], "kwargs": {"input_variables": ["fruit"], "template": "{fruit}\\uc758 \\uc0c9\\uc0c1\\uc774 \\ubb34\\uc5c7\\uc785\\ub2c8\\uae4c?", "template_format": "f-string"}, "name": "PromptTemplate"}, "last": {"lc": 1, "type": "constructor", "id": ["langchain_google_genai", "chat_models", "ChatGoogleGenerativeAI"], "kwargs": {"model": "models/gemini-2.5-flash", "google_api_key": {"lc": 1, "type": "secret", "id": ["GOOGLE_API_KEY"]}, "temperature": 0.5, "n": 1, "max_retries": 6, "default_metadata": []}, "name": "ChatGoogleGenerativeAI"}}, "name": "RunnableSequence"}'

In [17]:
# 직렬화된 체인의 타입을 확인합니다.
type(dumps_chain)

str

## Pickle 파일

### 개요

Pickle 파일은 Python 객체를 바이너리 형태로 직렬화하는 포맷입니다.

### 특징

1. **형식:**
   - Python 객체를 바이너리 형태로 직렬화하는 포맷

2. **특징:**
   - Python 전용 (다른 언어와 호환 불가)
   - 대부분의 Python 데이터 타입 지원 (리스트, 딕셔너리, 클래스 등)
   - 객체의 상태와 구조를 그대로 보존

3. **장점:**
   - 효율적인 저장 및 전송
   - 복잡한 객체 구조 유지
   - 빠른 직렬화/역직렬화 속도

4. **단점:**
   - 보안 위험 (신뢰할 수 없는 데이터 역직렬화 시 주의 필요)
   - 사람이 읽을 수 없는 바이너리 형식

### 주요 용도

1. 객체 캐싱
2. 머신러닝 모델 저장
3. 프로그램 상태 저장 및 복원

### 사용법

- `pickle.dump()`: 객체를 파일에 저장
- `pickle.load()`: 파일에서 객체 로드


pickle 파일로 저장합니다.

In [18]:
import pickle

# fuit_chain.pkl 파일로 직렬화된 체인을 저장합니다.
with open("fruit_chain.pkl", "wb") as f:
    pickle.dump(dumpd_chain, f)

JSON 형식으로 마찬가지로 저장할 수 있습니다.

In [19]:
import json

with open("fruit_chain.json", "w") as fp:
    json.dump(dumpd_chain, fp)

## load: 저장한 모델 불러오기


먼저, 이전에 저장한 `pickle` 형식의 파일을 로드합니다.

In [20]:
import pickle

# pickle 파일을 로드합니다.
with open("fruit_chain.pkl", "rb") as f:
    loaded_chain = pickle.load(f)

로드한 json 파일을 `load` 메서드를 사용하여 로드합니다.

In [25]:
import os

os.environ["GOOGLE_API_KEY"] = "AIzaSyCE2Hyk-xLl3Mq1BMGtOSZEOCo0HjtAK6s"

In [26]:
from langchain_core.load import load

# 체인을 로드합니다.
chain_from_file = load(loaded_chain)

# 체인을 실행합니다.
print(chain_from_file.invoke({"fruit": "사과"}))

content='사과는 다양한 색상을 가질 수 있습니다. 가장 흔한 색상은 다음과 같습니다:\n\n*   **빨간색** (Red)\n*   **초록색** (Green)\n*   **노란색** (Yellow)\n\n때로는 이 색상들이 섞여 있거나 다른 미묘한 색조를 띠기도 합니다.' additional_kwargs={} response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'model_name': 'gemini-2.5-flash', 'safety_ratings': []} id='run--b9ea9c12-e72e-4bda-9bf4-c90bc1fba9fa-0' usage_metadata={'input_tokens': 9, 'output_tokens': 75, 'total_tokens': 124, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 40}}


In [27]:
from langchain_core.load import load

load_chain = load(
    loaded_chain, secrets_map={"GEMINI_API_KEY": os.environ["GEMINI_API_KEY"]}
)

# 불러온 체인이 정상 동작하는지 확인합니다.
load_chain.invoke({"fruit": "사과"})

AIMessage(content='사과는 다양한 색상을 가질 수 있습니다:\n\n*   **빨간색** (가장 흔하게 연상되는 색)\n*   **초록색**\n*   **노란색**\n\n품종에 따라 이 세 가지 색상 중 하나이거나, 여러 색상이 섞여 있을 수도 있습니다.', additional_kwargs={}, response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'model_name': 'gemini-2.5-flash', 'safety_ratings': []}, id='run--829b2baf-e7cf-4e74-a33b-be3ea98b9456-0', usage_metadata={'input_tokens': 9, 'output_tokens': 69, 'total_tokens': 118, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 40}})

In [28]:
with open("fruit_chain.json", "r") as fp:
    loaded_from_json_chain = json.load(fp)
    loads_chain = load(loaded_from_json_chain)

In [29]:
# 불러온 체인이 정상 동작하는지 확인합니다.
loads_chain.invoke({"fruit": "사과"})

AIMessage(content='사과는 다양한 색상을 가질 수 있습니다. 가장 흔하고 대표적인 색상은 다음과 같습니다:\n\n*   **빨간색 (Red):** 가장 흔하고 일반적으로 연상되는 사과의 색상입니다. (예: 후지, 홍옥, 부사 등)\n*   **초록색 (Green):** 초록색 사과도 매우 흔하며, 주로 신맛이 나는 품종이 많습니다. (예: 아오리, 그래니 스미스 등)\n*   **노란색 (Yellow):** 노란색을 띠는 사과도 있습니다. (예: 골든 딜리셔스 등)\n\n때로는 한 사과에 빨간색과 노란색, 또는 빨간색과 초록색이 섞여 있는 경우도 많습니다. 사과의 품종에 따라 색상이 달라집니다.', additional_kwargs={}, response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'model_name': 'gemini-2.5-flash', 'safety_ratings': []}, id='run--4b530ec6-3076-4295-8f6d-f46ca0a5dd7b-0', usage_metadata={'input_tokens': 9, 'output_tokens': 183, 'total_tokens': 856, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 664}})