In [None]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

## 캐싱(Caching)

LangChain은 LLM을 위한 선택적 캐싱 레이어를 제공합니다.

이는 두 가지 이유로 유용합니다:

- 동일한 완료를 여러 번 요청하는 경우 LLM 공급자에 대한 **API 호출 횟수를 줄여 비용을 절감** 할 수 있습니다.
- LLM 제공업체에 대한 **API 호출 횟수를 줄여 애플리케이션의 속도를 높일 수** 있습니다.


모델과 프롬프트를 생성합니다


In [None]:
from langchain.chat_models import ChatOpenAI

# 모델을 생성합니다.
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

In [None]:
from langchain.prompts import PromptTemplate

prompt = PromptTemplate.from_template("{country} 에 대해서 200자 내외로 요약해줘")
prompt

In [None]:
chain = prompt | llm

In [None]:
%time response = chain.invoke({"country": "한국"})
print(response.content)

## InMemoryCache


In [None]:
from langchain.embeddings import CacheBackedEmbeddings
from langchain.storage import InMemoryByteStore

store = InMemoryByteStore()

cached_embedder = CacheBackedEmbeddings.from_bytes_store(
    underlying_embeddings, store, namespace=underlying_embeddings.model
)

In [None]:
%time response = chain.invoke({"country": "한국"})
print(response.content)

## SQLite Cache


In [None]:
from langchain.cache import SQLiteCache

set_llm_cache(SQLiteCache(database_path="mycache.db"))

In [None]:
%time response = chain.invoke({"country": "한국"})
print(response.content)