In [1]:
from dotenv import load_dotenv
import sys

sys.path.append("../common")
load_dotenv()

True

In [2]:
import os
from langsmith_tracker import set_tracking
from langchain_print import stream_response

# 인스턴스를 생성할 때 필요한 매개변수를 전달합니다.
set_tracking(project_name="04.Models")

Langsmith 추적이 활성화되었습니다. [프로젝트명: 04.Models]


### 캐싱(Caching)

Langchain 은 LLM을 위한 선택적 캐싱 레이어를 제공합니다.  

캐싱이 필요한 이유입니다. 
- 동일한 질문을 여러번 요청하는 경우 API 호출 횟수를 줄여서 비용을 절감할 수 있습니다. 
- LLM을 서빙하는 서버의 부하를 줄여(API 호출을 적게 하니까) 속도를 높일 수 있습니다.

In [3]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)

prompt = PromptTemplate.from_template("{coin}에 대해서 200자 내외로 요약해주세요.")

chain = prompt | llm

In [5]:
%%time # CPU 시간과 실제 경과 시간(Wall time)으로 나뉘어 출력
response = chain.invoke({"coin": "솔라나"})
print(response.content)

솔라나(Solana)는 고속 거래 처리와 낮은 수수료를 특징으로 하는 블록체인 플랫폼입니다. 2017년에 설계되었으며, Proof of History(PoH)라는 혁신적인 합의 알고리즘을 사용해 초당 수천 건의 거래를 처리할 수 있습니다. 이로 인해 디파이, NFT 등 다양한 애플리케이션이 활성화되고 있으며, 개발자와 사용자에게 인기를 끌고 있습니다. 솔라나는 확장성과 효율성을 중시하는 블록체인 생태계에서 중요한 역할을 하고 있습니다.
CPU times: user 21 ms, sys: 4.52 ms, total: 25.5 ms
Wall time: 2.35 s


### InMemoryCache
인메모리 캐시를 활용하여 동일한 질문에 대한 **답변** 을 저장하고 캐시에 저장된 답변을 반환합니다.  
**사용자 벌로 캐시를 다르게** 가져가고 싶다면 InMemoryCache를 사용하는 것이 유리할 수 있습니다.

In [6]:
%%time
from langchain.globals import set_llm_cache
from langchain.cache import InMemoryCache

# 인메모리 캐시 사용
set_llm_cache(InMemoryCache())

# 체인 생성
response = chain.invoke({"coin": "솔라나"})
print(response.content)

솔라나(Solana)는 고속 거래 처리와 낮은 수수료를 특징으로 하는 블록체인 플랫폼입니다. 2017년에 설계되었으며, Proof of History(PoH)라는 혁신적인 합의 알고리즘을 사용하여 초당 수천 건의 거래를 처리할 수 있습니다. 이로 인해 디파이, NFT, 게임 등 다양한 애플리케이션에서 인기를 끌고 있습니다. 솔라나는 개발자 친화적인 환경을 제공하며, 생태계가 빠르게 성장하고 있습니다.
CPU times: user 454 ms, sys: 50.1 ms, total: 504 ms
Wall time: 3.01 s


In [9]:
%%time

response = chain.invoke({"coin": "솔라나"})
print(response.content)

솔라나(Solana)는 고속 거래 처리와 낮은 수수료를 특징으로 하는 블록체인 플랫폼입니다. 2017년에 설계되었으며, Proof of History(PoH)라는 혁신적인 합의 알고리즘을 사용하여 초당 수천 건의 거래를 처리할 수 있습니다. 이로 인해 디파이, NFT, 게임 등 다양한 애플리케이션에서 인기를 끌고 있습니다. 솔라나는 개발자 친화적인 환경을 제공하며, 생태계가 빠르게 성장하고 있습니다.
CPU times: user 3.46 ms, sys: 231 μs, total: 3.7 ms
Wall time: 3.61 ms


### SQLLite Cache

In [10]:
from langchain_community.cache import SQLiteCache
from langchain_core.globals import set_llm_cache
import os

# 캐시 디렉토리 생성
if not os.path.exists("cache"):
    os.makedirs("cache")

# SQLiteCache 사용
set_llm_cache(SQLiteCache(database_path="cache/llm_cache.db"))

In [11]:
%%time

response = chain.invoke({"coin": "솔라나"})
print(response.content)

솔라나(Solana)는 고속 거래 처리와 낮은 수수료를 특징으로 하는 블록체인 플랫폼입니다. 2017년에 설계되었으며, Proof of History(PoH)라는 혁신적인 합의 알고리즘을 사용하여 초당 수천 건의 거래를 처리할 수 있습니다. 이로 인해 디파이, NFT, 게임 등 다양한 애플리케이션에서 인기를 끌고 있습니다. 솔라나는 개발자 친화적인 환경을 제공하며, 생태계가 빠르게 성장하고 있습니다.
CPU times: user 29.7 ms, sys: 4.6 ms, total: 34.3 ms
Wall time: 2.22 s


In [12]:
%%time

response = chain.invoke({"coin": "솔라나"})
print(response.content)

솔라나(Solana)는 고속 거래 처리와 낮은 수수료를 특징으로 하는 블록체인 플랫폼입니다. 2017년에 설계되었으며, Proof of History(PoH)라는 혁신적인 합의 알고리즘을 사용하여 초당 수천 건의 거래를 처리할 수 있습니다. 이로 인해 디파이, NFT, 게임 등 다양한 애플리케이션에서 인기를 끌고 있습니다. 솔라나는 개발자 친화적인 환경을 제공하며, 생태계가 빠르게 성장하고 있습니다.
CPU times: user 129 ms, sys: 77.9 ms, total: 207 ms
Wall time: 207 ms
