In [1]:
from dotenv import load_dotenv
load_dotenv()

import os

os.environ["LANGSMITH_PROJECT"]

'LANGCHAIN-BASIC'

### 1. LCEL 기본 구조(Lang Chain Expression Language)

### 1) 프롬프트 템플릿

In [2]:
from langchain_core.prompts import PromptTemplate

template = '{skill}의 가장 중요한 점을 생각하고, {kind} 개발자에게 중요한 점 3가지를 알려줘'

prompt_template = PromptTemplate.from_template(template)
prompt_template

PromptTemplate(input_variables=['kind', 'skill'], input_types={}, partial_variables={}, template='{skill}의 가장 중요한 점을 생각하고, {kind} 개발자에게 중요한 점 3가지를 알려줘')

In [None]:
# prompt_template.format(skill='langchain')

### 2) 모델

In [2]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    temperature=0.1,
    model='gpt-4.1-mini',
    verbose=True
)

In [None]:
chain = prompt_template | model
chain # input_variables를 확인해서 넣어줌

PromptTemplate(input_variables=['skill'], input_types={}, partial_variables={}, template='{skill}의 가장 중요한 점 3가지')
| ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x0000026AF09CFB50>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x0000026AF0AE9590>, root_client=<openai.OpenAI object at 0x0000026AF05C8E90>, root_async_client=<openai.AsyncOpenAI object at 0x0000026AF0AE90D0>, model_name='gpt-4.1-mini', temperature=0.1, model_kwargs={}, openai_api_key=SecretStr('**********'))

In [None]:
input = {'skill': 'langchain', 'kind' : 'ai agent'}

answer = chain.invoke(input)
print(answer.content)

LangChain의 가장 중요한 점 3가지는 다음과 같습니다:

1. **언어 모델과의 통합 및 확장성**  
   LangChain은 다양한 언어 모델(예: OpenAI GPT, Hugging Face 모델 등)과 쉽게 통합할 수 있도록 설계되어 있습니다. 이를 통해 사용자는 자신이 원하는 모델을 선택하고, 필요에 따라 커스텀 파이프라인을 구축할 수 있습니다.

2. **체인(Chain) 기반의 작업 흐름 구성**  
   LangChain은 여러 개의 언어 모델 호출, 데이터 처리, 외부 API 연동 등을 체인 형태로 연결하여 복잡한 작업 흐름을 쉽게 구성할 수 있게 해줍니다. 이를 통해 단순한 질의응답부터 복잡한 멀티스텝 작업까지 유연하게 처리할 수 있습니다.

3. **데이터 연결 및 메모리 관리**  
   LangChain은 외부 데이터 소스(예: 데이터베이스, 문서, 웹페이지 등)와 연결하여 언어 모델이 더 풍부한 정보를 바탕으로 응답할 수 있도록 지원합니다. 또한, 대화형 애플리케이션에서 상태를 유지하는 메모리 기능을 제공하여 자연스러운 대화 흐름을 구현할 수 있습니다.

이 세 가지 요소가 LangChain을 활용한 언어 모델 기반 애플리케이션 개발의 핵심적인 강점입니다.


In [6]:
answer

AIMessage(content='LangChain의 가장 중요한 점 3가지는 다음과 같습니다:\n\n1. **언어 모델과의 통합 및 확장성**  \n   LangChain은 다양한 언어 모델(예: OpenAI GPT, Hugging Face 모델 등)과 쉽게 통합할 수 있도록 설계되어 있습니다. 이를 통해 사용자는 자신이 원하는 모델을 선택하고, 필요에 따라 커스텀 파이프라인을 구축할 수 있습니다.\n\n2. **체인(Chain) 기반의 작업 흐름 구성**  \n   LangChain은 여러 개의 언어 모델 호출, 데이터 처리, 외부 API 연동 등을 체인 형태로 연결하여 복잡한 작업 흐름을 쉽게 구성할 수 있게 해줍니다. 이를 통해 단순한 질의응답부터 복잡한 멀티스텝 작업까지 유연하게 처리할 수 있습니다.\n\n3. **데이터 연결 및 메모리 관리**  \n   LangChain은 외부 데이터 소스(예: 데이터베이스, 문서, 웹페이지 등)와 연결하여 언어 모델이 더 풍부한 정보를 바탕으로 응답할 수 있도록 지원합니다. 또한, 대화형 애플리케이션에서 상태를 유지하는 메모리 기능을 제공하여 자연스러운 대화 흐름을 구현할 수 있습니다.\n\n이 세 가지 요소가 LangChain을 활용한 언어 모델 기반 애플리케이션 개발의 핵심적인 강점입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 303, 'prompt_tokens': 16, 'total_tokens': 319, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'mod

### 3) 출력양식 정의

##### Stroutputparser : 단순 문자열 출력(줄바꿈, split)
##### Jsonoutputparser
##### PydanticOutputParser
##### CommaSeperate

In [14]:
from langchain_core.output_parsers import StrOutputParser

out_put_parser = StrOutputParser()

chain = prompt_template | model | out_put_parser

answer = chain.invoke({'skill': 'langchain', 'kind' : 'ai agent'})
print(answer) # answer.content를 할 필요없이 바로 응답 확인


LangChain의 가장 중요한 점은 **언어 모델(LLM)을 다양한 데이터 소스 및 도구와 효과적으로 연결하여 복잡한 작업을 자동화하고 확장 가능하게 만드는 프레임워크**라는 점입니다. 즉, 단순한 텍스트 생성에서 나아가, 외부 API 호출, 데이터베이스 쿼리, 사용자 인터랙션 등과 결합해 실질적인 AI 에이전트를 구현할 수 있도록 돕는다는 것입니다.

AI 에이전트 개발자에게 중요한 점 3가지는 다음과 같습니다:

1. **모듈화와 확장성 이해**  
   LangChain은 프롬프트 템플릿, 체인(chains), 에이전트(agents), 메모리(memory) 등 여러 컴포넌트로 구성되어 있습니다. 각 컴포넌트를 적절히 조합하고 확장할 수 있어야 복잡한 워크플로우를 유연하게 설계할 수 있습니다.

2. **외부 도구 및 데이터 소스 통합 능력**  
   AI 에이전트는 단순한 텍스트 생성기를 넘어서서, API 호출, 데이터베이스 접근, 파일 시스템 조작 등 다양한 외부 리소스와 상호작용해야 합니다. LangChain의 도구(tool) 인터페이스와 에이전트 프레임워크를 활용해 이런 통합을 효과적으로 구현하는 것이 중요합니다.

3. **프롬프트 엔지니어링과 컨텍스트 관리**  
   좋은 결과를 위해서는 적절한 프롬프트 설계가 필수적이며, LangChain의 메모리 기능을 활용해 대화나 작업의 컨텍스트를 유지하는 것이 중요합니다. 이를 통해 에이전트가 더 자연스럽고 일관성 있는 응답을 생성할 수 있습니다.

요약하면, LangChain을 잘 활용하려면 **구성요소의 이해와 조합, 외부 시스템과의 연동, 그리고 효과적인 프롬프트 및 컨텍스트 관리**가 핵심 역량입니다.


### 4) 다양한 chain 실행

In [3]:
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

# 프롬프트 템플릿 설정
template = '''
최근 {year}년 간 {skill} 분야의 기술 발전에 대해서 알려줘
'''

prompt_template = PromptTemplate.from_template(template)

# 아웃풋 파서 설정
out_put_parser = StrOutputParser()

chain = prompt_template | model | out_put_parser
chain

PromptTemplate(input_variables=['skill', 'year'], input_types={}, partial_variables={}, template='\n최근 {year}년 간 {skill} 분야의 기술 발전에 대해서 알려줘\n')
| ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x0000025009705790>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x0000025009C1A890>, root_client=<openai.OpenAI object at 0x0000025009787A50>, root_async_client=<openai.AsyncOpenAI object at 0x0000025009C1A410>, model_name='gpt-4.1-mini', temperature=0.1, model_kwargs={}, openai_api_key=SecretStr('**********'))
| StrOutputParser()

##### (1) batch 출력(잘 쓰진 않음)

In [None]:
response = chain.batch([{'skill' : 'rag', 'year' : 3}, {'skill' : 'mcp', 'year' : 3}]) # llm 서버에서 동시에 처리

['최근 3년 간 RAG (Retrieval-Augmented Generation) 분야의 기술 발전은 매우 빠르게 이루어졌으며, 특히 대규모 언어 모델과 정보 검색 기술의 결합을 통해 자연어 처리(NLP) 및 생성 모델의 성능을 크게 향상시켰습니다. 주요 발전 내용을 요약하면 다음과 같습니다.\n\n1. **RAG 모델의 등장과 발전 (2020~2021년)**\n   - 페이스북 AI(현 메타 AI)가 2020년에 발표한 RAG 모델은 사전 학습된 생성 모델과 외부 지식 베이스에서 정보를 검색하는 검색 모델을 결합한 최초의 대표적인 접근법입니다.\n   - 이 모델은 검색된 문서들을 조건으로 하여 텍스트를 생성함으로써, 단순한 생성 모델보다 더 정확하고 사실 기반의 응답을 생성할 수 있음을 보여주었습니다.\n   - 이후 다양한 변형 모델들이 등장하며, 검색 효율성 및 생성 품질을 개선하는 연구가 활발히 진행되었습니다.\n\n2. **대규모 언어 모델과의 통합**\n   - GPT-3, PaLM, LLaMA 등 대규모 언어 모델들이 등장하면서, 이들을 RAG 프레임워크에 통합하는 시도가 늘어났습니다.\n   - 특히, 대규모 언어 모델의 강력한 생성 능력과 외부 지식 검색의 결합으로, 더 정확하고 신뢰성 있는 답변 생성이 가능해졌습니다.\n   - OpenAI의 ChatGPT와 같은 시스템도 내부적으로 RAG와 유사한 접근법을 활용하여 최신 정보에 접근하는 방식을 연구 중입니다.\n\n3. **효율적인 검색 및 인덱싱 기술 발전**\n   - 벡터 검색(Vector Search) 기술이 크게 발전하여, 대규모 문서 집합에서 빠르고 정확한 관련 문서 검색이 가능해졌습니다.\n   - FAISS, Annoy, HNSW 등의 라이브러리가 널리 사용되며, 이와 함께 문서 임베딩 품질 향상을 위한 다양한 사전학습 기법도 개발되었습니다.\n   - 이로 인해 RAG 시스템의 실시간 응답 속도와 정확도가 크게 개선되었습니다.\n\n4. **멀티모달 RAG 및 도메인 특화

In [8]:
for i in response:
    print(i)

최근 3년 간 RAG (Retrieval-Augmented Generation) 분야의 기술 발전은 매우 빠르게 이루어졌으며, 특히 대규모 언어 모델과 정보 검색 기술의 결합을 통해 자연어 처리(NLP) 및 생성 모델의 성능을 크게 향상시켰습니다. 주요 발전 내용을 요약하면 다음과 같습니다.

1. **RAG 모델의 등장과 발전 (2020~2021년)**
   - 페이스북 AI(현 메타 AI)가 2020년에 발표한 RAG 모델은 사전 학습된 생성 모델과 외부 지식 베이스에서 정보를 검색하는 검색 모델을 결합한 최초의 대표적인 접근법입니다.
   - 이 모델은 검색된 문서들을 조건으로 하여 텍스트를 생성함으로써, 단순한 생성 모델보다 더 정확하고 사실 기반의 응답을 생성할 수 있음을 보여주었습니다.
   - 이후 다양한 변형 모델들이 등장하며, 검색 효율성 및 생성 품질을 개선하는 연구가 활발히 진행되었습니다.

2. **대규모 언어 모델과의 통합**
   - GPT-3, PaLM, LLaMA 등 대규모 언어 모델들이 등장하면서, 이들을 RAG 프레임워크에 통합하는 시도가 늘어났습니다.
   - 특히, 대규모 언어 모델의 강력한 생성 능력과 외부 지식 검색의 결합으로, 더 정확하고 신뢰성 있는 답변 생성이 가능해졌습니다.
   - OpenAI의 ChatGPT와 같은 시스템도 내부적으로 RAG와 유사한 접근법을 활용하여 최신 정보에 접근하는 방식을 연구 중입니다.

3. **효율적인 검색 및 인덱싱 기술 발전**
   - 벡터 검색(Vector Search) 기술이 크게 발전하여, 대규모 문서 집합에서 빠르고 정확한 관련 문서 검색이 가능해졌습니다.
   - FAISS, Annoy, HNSW 등의 라이브러리가 널리 사용되며, 이와 함께 문서 임베딩 품질 향상을 위한 다양한 사전학습 기법도 개발되었습니다.
   - 이로 인해 RAG 시스템의 실시간 응답 속도와 정확도가 크게 개선되었습니다.

4. **멀티모달 RAG 및 도메인 특화 적용**
   - 텍스트뿐만 아니

##### (2) 비동기(astream) 출력

In [10]:
# ainvoke 출력

async_answer = chain.ainvoke({'skill' : 'rag', 'year' : 3})
async_answer

  async_answer = chain.ainvoke({'skill' : 'rag', 'year' : 3})


<coroutine object RunnableSequence.ainvoke at 0x00000250371D38A0>

In [11]:
result = await async_answer
result

'최근 3년 간 RAG (Retrieval-Augmented Generation) 분야의 기술 발전은 매우 빠르게 진행되고 있으며, 주로 대규모 언어 모델과 정보 검색 기술의 결합을 통해 자연어 생성의 정확성과 신뢰성을 크게 향상시키는 데 초점이 맞춰져 있습니다. 주요 발전 내용을 정리하면 다음과 같습니다.\n\n1. **대규모 사전학습 언어모델과 검색기술의 통합 강화**  \n   - GPT, BERT, T5 등 대형 언어 모델들이 RAG 프레임워크에 통합되어, 외부 지식베이스나 문서에서 실시간으로 정보를 검색하고 이를 바탕으로 더 정확한 답변을 생성하는 방식이 일반화되었습니다.  \n   - Facebook AI Research(FAIR)에서 발표한 RAG 모델(2020년)은 최초로 검색과 생성 모델을 결합하여, 검색된 문서들을 조건으로 자연어를 생성하는 방식을 제안해 큰 주목을 받았습니다.\n\n2. **효율적인 검색 및 인덱싱 기법 발전**  \n   - Dense retrieval(밀집 임베딩 기반 검색) 기술이 크게 발전하여, 기존의 키워드 기반 검색보다 더 의미론적으로 관련된 문서를 빠르게 찾아내는 것이 가능해졌습니다.  \n   - FAISS, ANNOY, HNSW 등 효율적인 벡터 검색 라이브러리와 함께, 문서 임베딩을 실시간으로 업데이트하고 확장하는 기술들이 발전했습니다.\n\n3. **멀티모달 RAG 및 다양한 도메인 적용**  \n   - 텍스트뿐만 아니라 이미지, 음성 등 다양한 데이터 유형을 결합한 멀티모달 RAG 연구가 진행되어, 예를 들어 이미지 설명 생성, 비디오 요약 등 다양한 분야에 적용되고 있습니다.  \n   - 의료, 법률, 금융 등 전문 도메인에 특화된 RAG 시스템 개발도 활발히 이루어지고 있습니다.\n\n4. **지식 증강 및 사실 검증 강화**  \n   - 생성된 텍스트의 신뢰성을 높이기 위해, 검색된 문서 기반의 사실 검증(fact-checking) 및 출처 표기 기술이 발전했습니다.  \n   - RAG 모델