# 장기 메모리 (Long-term Memory)

LangChain 에이전트는 **LangGraph persistence** 기능을 사용하여 **장기 메모리(long-term memory)** 를 구현할 수 있습니다.
이 기능은 고급 주제에 속하며, 이를 사용하려면 **LangGraph의 동작 원리에 대한 이해**가 필요합니다.

LangGraph는 장기 메모리를 **JSON 문서 형식**으로 저장하며,
이를 **store(저장소)** 에 보관합니다.

각 메모리는 다음과 같이 구성됩니다:

* **namespace (네임스페이스)** → 폴더와 비슷한 개념으로, 데이터를 그룹화하는 단위입니다.
* **key (키)** → 파일 이름처럼, 해당 메모리를 구분하는 고유 식별자입니다.

보통 `namespace`에는 사용자 ID, 조직 ID 등의 정보를 포함하여
데이터를 논리적으로 분류하고 관리하기 쉽게 합니다.

이러한 구조를 통해 **계층적(hierarchical) 메모리 관리**가 가능하며,
**콘텐츠 필터(content filter)** 를 활용한 **교차-네임스페이스 검색**도 지원됩니다.


| 구분    | 단기 메모리 (short-term memory)                    | 장기 메모리 (long-term memory)          |
| ----- | --------------------------------------------- | ---------------------------------- |
| 저장 범위 | 현재 스레드(thread)나 세션 내 메시지                      | 여러 스레드, 여러 세션에 걸친 데이터              |
| 지속성   | 일시적 (대화 종료 시 사라짐)                             | 지속적 (DB나 파일에 저장)                   |
| 예시    | “방금 말한 게 뭐였지?”                                | “이전에 내가 말한 취미 기억해?”                |
| 구현 방식 | `checkpointer` (InMemorySaver, SqliteSaver 등) | `store` (InMemoryStore, DBStore 등) |
| 관리 단위 | 메시지 기록                                        | JSON 문서 (사용자 프로필, 설정, 기록 등)        |


In [1]:
from dotenv import load_dotenv

load_dotenv()

True

In [2]:
from langchain.chat_models import init_chat_model
from langchain_openai import OpenAIEmbeddings

# model = init_chat_model("gpt-5-nano", model_provider="openai")
model = init_chat_model("gemini-2.5-flash", model_provider="google_genai")
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

### Long-term 메모리 생성

In [3]:
from langgraph.store.memory import InMemoryStore

# 임베딩 함수
def embed(texts: list[str]) -> list[list[float]]:
    if isinstance(texts, str):
        texts = [texts]
    return embeddings.embed_documents(texts)

# 스토어 & 네임스페이스
store = InMemoryStore(index={"embed": embed, "dims": 1536})
namespace = ("oyj-1", "chat-1")

# 메모리 저장
memories = {
    "memory_1": {
        "rules": ["사용자는 금융 전문가 입니다.", "사용자는 영어와 파이썬만 사용합니다."],
        "my_key": "my-key-value",
    },
    "memory_2": {
        "rules": ["사용자는 투자 전략에 관심이 많습니다."],
        "my_key": "my-key-value",
    },
    "memory_3": {
        "rules": ["사용자는 한국어로만 대화합니다."],
        "my_key": "my-key-value",
    },
}
for k, v in memories.items():
    store.put(namespace, k, v)

# 유사도 검색 (필터+쿼리)
results = store.search(namespace, filter={"my_key": "my-key-value"}, query="language 선호도")
for it in results:
    print(it.key, "=>", it.value["rules"], "유사도:", round(it.score, 3))

# 특정 키 조회 예시 (필요 시)
item = store.get(namespace, "memory_1")
item

memory_3 => ['사용자는 한국어로만 대화합니다.'] 유사도: 0.276
memory_1 => ['사용자는 금융 전문가 입니다.', '사용자는 영어와 파이썬만 사용합니다.'] 유사도: 0.21
memory_2 => ['사용자는 투자 전략에 관심이 많습니다.'] 유사도: 0.169


Item(namespace=['oyj-1', 'chat-1'], key='memory_1', value={'rules': ['사용자는 금융 전문가 입니다.', '사용자는 영어와 파이썬만 사용합니다.'], 'my_key': 'my-key-value'}, created_at='2025-11-21T10:01:52.050655+00:00', updated_at='2025-11-21T10:01:52.050655+00:00')

## 도구에서 장기 메모리 읽기

In [4]:
from dataclasses import dataclass
from langchain_core.runnables import RunnableConfig
from langchain.agents import create_agent
from langchain.agents import AgentState
from langchain.tools import tool, ToolRuntime
from langgraph.store.memory import InMemoryStore

@dataclass
class Context:
    user_id: str

# InMemoryStore는 메모리를 메모리(dictionary)에 저장합니다.
# 실제 서비스 환경에서는 DB 기반 저장소를 사용하는 것이 좋습니다.
store = InMemoryStore()  

# 예시 데이터 저장
store.put(  
    ("users",),  # 사용자 데이터를 모아두는 namespace
    "user_123",  # 사용자 ID (key)
    {
        "name": "John Smith",
        "language": "English",
    }  # 사용자 정보
)

@tool
def get_user_info(runtime: ToolRuntime[Context, AgentState]) -> str:
    """사용자 정보를 조회합니다."""  
    store = runtime.store
    user_id = runtime.context.user_id
    user_info = store.get(("users",), user_id)
    return str(user_info.value) if user_info else "Unknown user"

# 에이전트 생성
agent = create_agent(
    model,
    tools=[get_user_info],
    store=store,  # 도구가 접근할 수 있도록 store를 전달
    context_schema=Context
)

# 실행 예시
agent.invoke(
    {"messages": [{"role": "user", "content": "사용자 정보를 조회해줘"}]},
    context=Context(user_id="user_123") 
)

{'messages': [HumanMessage(content='사용자 정보를 조회해줘', additional_kwargs={}, response_metadata={}, id='9d4366a6-9dd3-4013-8bf2-fa83ad94dd0c'),
  AIMessage(content='', additional_kwargs={'function_call': {'name': 'get_user_info', 'arguments': '{}'}}, response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'model_name': 'gemini-2.5-flash', 'safety_ratings': [], 'grounding_metadata': {}, 'model_provider': 'google_genai'}, id='lc_run--c8a2c5f5-a7f4-4686-bfc4-d1cd8cfcb274-0', tool_calls=[{'name': 'get_user_info', 'args': {}, 'id': '874b0c6c-a587-454d-a5f8-aa32f5959579', 'type': 'tool_call'}], usage_metadata={'input_tokens': 36, 'output_tokens': 61, 'total_tokens': 97, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 49}}),
  ToolMessage(content="{'name': 'John Smith', 'language': 'English'}", name='get_user_info', id='4de224b0-cb62-4727-b0ab-0aaa13f589f7', tool_call_id='874b0c6c-a587-454d-a5f8-aa32f5959579'),
  AIM

## 도구에 장기 메모리 쓰기

In [5]:
from dataclasses import dataclass
from typing import Any
from typing_extensions import TypedDict

from langchain.agents import create_agent
from langchain.tools import tool, ToolRuntime
from langgraph.store.memory import InMemoryStore


# InMemoryStore: 메모리에 데이터를 저장하는 임시 스토리지
# 실제 서비스 환경(Production)에서는 DB 기반 스토리지로 대체 가능
store = InMemoryStore() 

@dataclass
class Context:
    user_id: str  

# TypedDict: LLM이 이해할 수 있는 사용자 정보 구조 정의
class UserInfo(TypedDict):
    name: str  

# 에이전트가 사용자 정보를 업데이트할 수 있도록 하는 함수 (특히 대화형 애플리케이션에서 유용)
@tool
def save_user_info(user_info: UserInfo, runtime: ToolRuntime[Context, Any]) -> str:
    """사용자 정보를 스토어에 저장합니다."""
    # LangGraph 런타임에서 제공하는 store 및 context 접근
    store = runtime.store                  # 현재 실행 중인 store 객체
    user_id = runtime.context.user_id      # Context로 전달된 user_id 추출
    
    # 데이터 저장: (네임스페이스, 키, 값)
    # 여기서는 ("users",) 네임스페이스 아래 user_id별로 UserInfo 저장
    store.put(("users",), user_id, user_info) 
    
    return "사용자 정보가 성공적으로 저장되었습니다."

# 에이전트 생성
agent = create_agent(
    model,
    tools=[save_user_info],                # 에이전트가 호출할 수 있는 도구 등록
    store=store,                           # 스토어 전달
    context_schema=Context                 # Context 데이터 클래스 전달
)

agent.invoke(
    {
        "messages": [
            {"role": "user", "content": "내 이름은 길동이야."}  # 사용자 입력
        ]
    },
    context=Context(user_id="user_123")  # Context를 통해 user_id 전달 (사용자 식별)
)

# 스토어에 저장된 사용자 정보 직접 확인
result = store.get(("users",), "user_123").value
print(result)  

{'name': '길동'}


### 실제 장기 메모리 사용 예

In [9]:
model = init_chat_model("gpt-5-mini", model_provider="openai")

store = InMemoryStore()

@dataclass
class Context:
    user_id: str   # 로그인한 사용자 식별자 (JWT나 세션에서 가져옴)

class UserProfile(TypedDict):
    risk_level: str      # "aggressive" | "moderate" | "conservative"
    preferred_lang: str  # "ko" | "en"
    favorite_sector: str # 예: "semiconductor", "bio" ...

@tool
def get_user_profile(runtime: ToolRuntime[Context, Any]) -> str:
    """사용자의 금융 프로필을 조회합니다."""
    store = runtime.store
    user_id = runtime.context.user_id

    item = store.get(("user_profiles",), user_id)
    if not item:
        return "사용자 프로필이 아직 설정되지 않았습니다."

    profile: UserProfile = item.value  # TypedDict 구조
    msg = (
        f"사용자 투자 성향: {profile['risk_level']}\n"
        f"선호 언어: {profile['preferred_lang']}\n"
        f"관심 섹터: {profile['favorite_sector']}"
    )
    return msg

@tool
def save_user_profile(profile: UserProfile, runtime: ToolRuntime[Context, Any]) -> str:
    """사용자의 금융 프로필을 저장/업데이트합니다."""
    store = runtime.store
    user_id = runtime.context.user_id

    store.put(("user_profiles",), user_id, profile)
    return "사용자 프로필이 저장/업데이트되었습니다."

agent = create_agent(
    model,
    tools=[get_user_profile, save_user_profile],
    store=store,               # store 주입 → 도구에서 runtime.store 로 접근 가능
    context_schema=Context     # Context 주입 → runtime.context.user_id 로 누구인지 알 수 있음
)

def handle_chat(user_id: str, user_message: str) -> str:
    
    result = agent.invoke(
        {
            "messages": [
                {
                    "role": "user",
                    "content": user_message,
                }
            ]
        },
        # 여기에서 user_id 를 Context 로 넘김 → tools 에서 장기 메모리 키로 사용
        context=Context(user_id=user_id),
    )

    # 마지막 assistant 메시지 내용만 추출
    messages = result["messages"]
    last_ai = [m for m in messages if m.type == "ai"][-1]
    return last_ai.content


uid = "user_001"

print(handle_chat(uid, "나는 공격적인 투자 성향이고, 반도체 섹터를 좋아해. 앞으로 나를 이런 기준으로 추천해줘."))

알겠습니다—프로필(공격적 성향, 선호 섹터: 반도체, 언어: 한국어)을 저장해뒀습니다. 앞으로 추천할 때 이 기준을 기준으로 맞춰드릴게요.

간단히 어떻게 추천할지와 당장 제공 가능한 내용:
- 추천 방향: 고수익·고변동을 감수하는 공격적 포지션 중심. 대형 파운드리·디자인·장비·메모리 등 반도체 생태계 전반에서 높은 성장/레버리지 기회를 우선적으로 제안.
- 추천 상품 유형: 개별주(대형·중소형 혼합), 섹터 ETF(분산 효과), 반도체 장비·소재주, 테마형 레버리지 ETF 및 옵션 전략(원하면), IPO/소형주(리스크 큼).
- 예시 종목(교육용, 투자 권유 아님):
  - 해외 대형: Nvidia(NVDA), TSMC(TSM), ASML, Broadcom(AVGO), Applied Materials(AMAT), Lam Research(LRCX)
  - 국내 주요: 삼성전자, SK하이닉스 등
  - ETF: SOXX, SMH 등(국내는 KODEX·TIGER 계열 반도체 섹터 ETF)
- 공격적 포트폴리오 예시(참고용):
  - 대형 핵심(안정성+성장): 40–60%
  - 고성장 소형/신생주: 20–30%
  - 장비·소재(사이클 레버리지): 10–20%
  - 현금/헤지(옵션·유동성): 0–10%
- 리스크 관리(간단):
  - 포지션 사이즈 규칙(각 종목당 최대 %), 분산(업종 내 역할 분산), 손절/목표 수익 규정, 분기별 리밸런싱, 주요 이벤트(실적·공급망·거시·정책) 모니터링.

원하시면 바로 해드릴 수 있는 것:
- 1) 공격적 반도체 초점의 8–12종목 워치리스트(해외/국내 혼합)
- 2) 공격적 성향에 맞춘 추천 포트폴리오(금액 입력 시 포지션별 권장 수량/비중 제시)
- 3) 옵션/레버리지 전략(원리와 예시) 설명

원하시는 항목과 선호 시장(국내/해외), 대략의 투자금액 및 투자 기간(단기·중기·장기)을 알려주세요. (참고: 여긴 일반적 정보 제공입니다 — 최종 투자 결정 전에는 세부 리서치나 전문 투자자문을 권합니다.)


In [11]:
print(handle_chat(uid, """
내 투자 성향과 선호 섹터가 어떗지?
"""))

요약 먼저:
- 현재 프로필: 투자 성향 — 공격적(aggressive)
- 선호 섹터: 반도체
(선호 언어: 한국어)

의미와 특징
- 공격적 성향: 높은 변동성과 손실 가능성을 감수하면서 장기적·단기적으로 높은 수익을 추구하는 스타일입니다. 포트폴리오에서 주식 비중이 높고, 성장주나 레버리지 상품, 옵션 등을 활용할 가능성이 큽니다.
- 반도체 섹터 선호: 기술적 성장 동력(AI·데이터센터·자동차 전장 등)에 민감하게 반응하며, 경기 사이클·재고·설비 투자(CAPEX) 및 지정학적 리스크에 따라 큰 등락이 발생합니다.

실전 시 고려할 점 (간단한 체크리스트)
- 분산: 섹터 집중 투자는 수익을 크게 올려주지만 리스크도 큽니다. 지역·업종·자산(채권·현금·원자재 등)으로 일정 부분 분산 권장.
- 포지션 사이징: 각 종목에 너무 큰 비중을 주지 않기(예: 총자산의 5–15% 등 개인 기준 설정).
- 리스크 관리: 손절 규칙, 트레일링 스탑, 일부 이익 실현 규칙을 사전에 정하세요.
- 현금비중/비상금: 변동성 큰 전략일수록 유동성 확보가 중요합니다.
- 헤지 수단: 옵션, 인버스 ETF, 채권 등으로 극단적 하락 대비 고려.
- 리밸런싱: 정기적으로(예: 분기별) 포트폴리오 점검 및 리밸런싱.

반도체 섹터 특유의 체크 포인트
- 수요 사이클(스마트폰·서버·자동차 수요 변화), 재고·book-to-bill 지표
- 파운드리 vs 팹리스 vs 장비(ASML 등) — 사업모델과 마진 구조가 다름
- CAPEX 사이클과 설비투자 계획(공급증가 시 가격 압박 가능)
- 지정학(미·중, 공급망)과 기술 통제(수출 규제) 리스크
- 핵심 지표: 매출 성장, 마진, 주문잔고, 설비 가동률, R&D·CAPEX 비중

구체적 제안(선택사항)
- 섹터 대표 ETF(분산형): SOXX, SMH 등으로 반도체 노출 확보
- 개별주 집중 투자 시: 파운드리(TSMC), GPU/AI 관련 기업(NVIDIA 등), 장비업체(ASML) 등으로 업스트림/다운스트림 분산
- 옵션 전략: