# 직렬화(Serialization)
## 직렬화란(Serialization)?
1. 정의
   - 모델을 저장 가능한 형식으로 변환하는 과정
2. 목적
   - 모델 재사용(재훈련 없이)
   - 모델 배포 및 공유 용이
   - 계산 리소스 절약
3. 장점
   - 빠른 모델 로딩
   - 버전 관리 가능
   - 다양한 환경에서 사용 가능



`is_lc_serializable` 클래스 메서드로 실행하여 LangChain 클래스가 직렬화 가능한지 확인

In [1]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

True

In [3]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
import os

# 모델을 생성합니다.
llm = ChatOpenAI(model_name="gpt-4o-mini")

# 프롬프트를 생성합니다.
prompt = PromptTemplate.from_template("{tech} 에 대해서 200자 내외로 요약해줘")

# 체인을 생성합니다.
chain = prompt | llm

In [4]:
print(ChatOpenAI.is_lc_serializable())

True


In [6]:
chain.is_lc_serializable()

True

# 체인 직렬화
- dumpd : 객체를 JSON 문자열로 직렬화
- dumps : 객체를 딕셔너리로 직렬화

In [7]:
from langchain_core.load import dumpd, dumps

In [8]:
dumpd_chain = dumpd(chain)
dumpd_chain

{'lc': 1,
 'type': 'constructor',
 'id': ['langchain', 'schema', 'runnable', 'RunnableSequence'],
 'kwargs': {'first': {'lc': 1,
   'type': 'constructor',
   'id': ['langchain', 'prompts', 'prompt', 'PromptTemplate'],
   'kwargs': {'input_variables': ['tech'],
    'template': '{tech} 에 대해서 200자 내외로 요약해줘',
    'template_format': 'f-string'},
   'name': 'PromptTemplate'},
  'last': {'lc': 1,
   'type': 'constructor',
   'id': ['langchain', 'chat_models', 'openai', 'ChatOpenAI'],
   'kwargs': {'model_name': 'gpt-4o-mini',
    'temperature': 0.7,
    'openai_api_key': {'lc': 1, 'type': 'secret', 'id': ['OPENAI_API_KEY']},
    'max_retries': 2,
    'n': 1},
   'name': 'ChatOpenAI'}},
 'name': 'RunnableSequence'}

In [9]:
dumps_chain = dumps(chain)
dumps_chain

'{"lc": 1, "type": "constructor", "id": ["langchain", "schema", "runnable", "RunnableSequence"], "kwargs": {"first": {"lc": 1, "type": "constructor", "id": ["langchain", "prompts", "prompt", "PromptTemplate"], "kwargs": {"input_variables": ["tech"], "template": "{tech} \\uc5d0 \\ub300\\ud574\\uc11c 200\\uc790 \\ub0b4\\uc678\\ub85c \\uc694\\uc57d\\ud574\\uc918", "template_format": "f-string"}, "name": "PromptTemplate"}, "last": {"lc": 1, "type": "constructor", "id": ["langchain", "chat_models", "openai", "ChatOpenAI"], "kwargs": {"model_name": "gpt-4o-mini", "temperature": 0.7, "openai_api_key": {"lc": 1, "type": "secret", "id": ["OPENAI_API_KEY"]}, "max_retries": 2, "n": 1}, "name": "ChatOpenAI"}}, "name": "RunnableSequence"}'

## Pickle 파일

### 개요

Pickle 파일은 Python 객체를 바이너리 형태로 직렬화하는 포맷입니다.

### 특징

1. **형식:**
   - Python 객체를 바이너리 형태로 직렬화하는 포맷

2. **특징:**
   - Python 전용 (다른 언어와 호환 불가)
   - 대부분의 Python 데이터 타입 지원 (리스트, 딕셔너리, 클래스 등)
   - 객체의 상태와 구조를 그대로 보존

3. **장점:**
   - 효율적인 저장 및 전송
   - 복잡한 객체 구조 유지
   - 빠른 직렬화/역직렬화 속도

4. **단점:**
   - 보안 위험 (신뢰할 수 없는 데이터 역직렬화 시 주의 필요)
   - 사람이 읽을 수 없는 바이너리 형식

### 주요 용도

1. 객체 캐싱
2. 머신러닝 모델 저장
3. 프로그램 상태 저장 및 복원

### 사용법

- `pickle.dump()`: 객체를 파일에 저장
- `pickle.load()`: 파일에서 객체 로드


In [17]:
import pickle

with open("tech_chain.pkl","wb") as f:
    pickle.dump(dumpd_chain,f)

In [19]:
import json

with open("tech_chain.json","w") as f:
    json.dump(dumpd_chain,f)

## load: 저장한 모델 불러오기


먼저, 이전에 저장한 `pickle` 형식의 파일을 로드합니다.

In [20]:
import pickle

# pickle 파일을 로드합니다.
with open("tech_chain.pkl", "rb") as f:
    loaded_chain = pickle.load(f)

In [21]:
loaded_chain

{'lc': 1,
 'type': 'constructor',
 'id': ['langchain', 'schema', 'runnable', 'RunnableSequence'],
 'kwargs': {'first': {'lc': 1,
   'type': 'constructor',
   'id': ['langchain', 'prompts', 'prompt', 'PromptTemplate'],
   'kwargs': {'input_variables': ['tech'],
    'template': '{tech} 에 대해서 200자 내외로 요약해줘',
    'template_format': 'f-string'},
   'name': 'PromptTemplate'},
  'last': {'lc': 1,
   'type': 'constructor',
   'id': ['langchain', 'chat_models', 'openai', 'ChatOpenAI'],
   'kwargs': {'model_name': 'gpt-4o-mini',
    'temperature': 0.7,
    'openai_api_key': {'lc': 1, 'type': 'secret', 'id': ['OPENAI_API_KEY']},
    'max_retries': 2,
    'n': 1},
   'name': 'ChatOpenAI'}},
 'name': 'RunnableSequence'}

로드한 json 파일을 `load` 메서드를 사용하여 로드합니다.

In [22]:
from langchain_core.load import load

# 체인을 로드합니다.
chain_from_file = load(loaded_chain)

# 체인을 실행합니다.
print(chain_from_file.invoke({"tech": "사과"}))

  chain_from_file = load(loaded_chain)


content="사과는 대표적인 과일로, 전 세계에서 널리 재배되고 소비됩니다. 다양한 품종이 있으며, 달콤하고 상큼한 맛이 특징입니다. 비타민 C와 식이섬유가 풍부해 건강에 이롭고, 항산화 효과도 있습니다. 생으로 먹거나 주스, 잼, 디저트 등으로 활용되며, 전통적으로 '하나의 사과가 의사를 멀리한다'는 속담처럼 건강에 긍정적인 이미지가 있습니다." additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 116, 'prompt_tokens': 21, 'total_tokens': 137, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_0ba0d124f1', 'finish_reason': 'stop', 'logprobs': None} id='run-baa7245f-f6ec-492c-a592-165da6a73792-0' usage_metadata={'input_tokens': 21, 'output_tokens': 116, 'total_tokens': 137, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


In [23]:
from langchain_core.load import load, loads

load_chain = load(
    loaded_chain, secrets_map={"OPENAI_API_KEY": os.environ["OPENAI_API_KEY"]}
)

# 불러온 체인이 정상 동작하는지 확인합니다.
load_chain.invoke({"tech": "사과"})

AIMessage(content='사과는 대표적인 과일로, 다소 달콤하고 신맛이 나는 특성이 있습니다. 다양한 품종이 있으며, 주로 생식이나 주스, 잼 등으로 소비됩니다. 비타민 C와 식이섬유가 풍부해 건강에 도움이 되며, 항산화 작용도 있습니다. 또한, 사과는 다양한 요리에 활용되며, 세계 여러 나라에서 재배됩니다. "하루 한 개의 사과가 의사를 멀리한다"는 속담처럼 건강에 유익한 과일로 알려져 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 124, 'prompt_tokens': 21, 'total_tokens': 145, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_0ba0d124f1', 'finish_reason': 'stop', 'logprobs': None}, id='run-694ec6bd-eea1-43f1-8d68-7824670c2cf4-0', usage_metadata={'input_tokens': 21, 'output_tokens': 124, 'total_tokens': 145, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [25]:
with open("tech_chain.json", "r") as fp:
    loaded_from_json_chain = json.load(fp)
    loads_chain = load(loaded_from_json_chain)

In [26]:
# 불러온 체인이 정상 동작하는지 확인합니다.
loads_chain.invoke({"tech": "사과"})

AIMessage(content='사과는 대표적인 과일로, 다양한 품종이 있으며, 주로 신선하게 섭취하거나 주스, 잼 등으로 가공된다. 비타민 C와 식이섬유가 풍부해 건강에 좋고, 항산화 작용으로 면역력 강화에 도움을 준다. 사과는 단맛과 신맛을 조화롭게 지니고 있어 많은 요리에 활용되며, 상징적으로는 지혜와 유혹을 나타내기도 한다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 108, 'prompt_tokens': 21, 'total_tokens': 129, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_0ba0d124f1', 'finish_reason': 'stop', 'logprobs': None}, id='run-10eccab8-86d4-4d71-906f-40dfe5ba37a7-0', usage_metadata={'input_tokens': 21, 'output_tokens': 108, 'total_tokens': 129, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})