<a href="https://colab.research.google.com/github/HasunJung/llm_langchain/blob/main/06_chains.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# INSTALL

In [8]:
#최초 실행이라면
!pip install -q langchain langchain-google-genai

import os
from google.colab import userdata
os.environ['GOOGLE_API_KEY'] = userdata.get('GOOGLE_API_KEY')

from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.prompts import PromptTemplate

# ChatGoogleGenerativeAI 언어 모델을 "gemini-pro" 모델로 초기화합니다.
llm = ChatGoogleGenerativeAI(model="gemini-pro", temperature=0)

# Chain

Chains는 일련의 처리를 하나의 묶음으로 처리할 수 있는 모듈입니다.
- 여러 모듈의 조합을 쉽게 사용할 수 있다 : 랭체인으로 어플리케이션을 만들때는 하나의 모듈만으로 원하는 기능을 구현하기 어렵다.
- 특정 용도에 특화된 체인 : 언어 모델의 호출만으로는 대응하기 어려운 기능이나 복잡한 처리를 랭체인 측에서 미리 내장해 특정 용도에 특화된 Chains도 존재한다.
- 체인 자체를 정리한다 : Chains은 기능 덩어리라고 할 수 있다. 이 덩어리를 여러개 준비해 순서대로 실행하거나 필요에 따라 호출 할 수 있도록 Chains 자체를 묶을 수 있다.


다만 Chains는 암묵적으로 처리해 블랙박스가 되기 쉬우므로, 각 모듈이 어떤 처리를 하는지 제대로 이해할 필요가 있습니다.

# ConversationChain

메모리 모듈과 다른 모듈을 쉽게 조합할 수 있는 내장 모듈입니다.

ConversationChain, ConversationBufferMemory 모듈은 대화 관리 및 메모리 관리에 필요한 기능을 제공합니다.

ConversationChain 클래스의 인스턴스를 생성하여 대화 관리를 수행합니다. 이때, llm은 저수준 언어 모델을, verbose는 상세한 로깅 여부를 (여기서는 비활성화), 그리고 memory는 대화 내용을 저장할 메모리 버퍼를 각각 지정합니다.


In [10]:

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory

# ConversationChain 인스턴스를 생성합니다.
# llm: 모델을 지정합니다.
# verbose: 상세한 로깅을 비활성화합니다.
# memory: 대화 내용을 저장하는 메모리 버퍼를 지정합니다.
conversation = ConversationChain(
    llm=llm,
    verbose=True, # true로 설정시 Chains내부에서 어떤 처리가 이뤄지는지 추적 할 수 있습니다.
    memory=ConversationBufferMemory(memory_key="history"),
)


conversation.predict 함수는 주어진 입력에 대한 모델의 반응을 예측하는 데 사용됩니다.

In [11]:
conversation.invoke({"input": "양자역학에 대해 설명해줘."})



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: 양자역학에 대해 설명해줘.
AI:[0m

[1m> Finished chain.[0m


{'input': '양자역학에 대해 설명해줘.',
 'history': '',
 'response': '양자역학은 물질과 에너지의 매우 작은 규모에서의 거동을 설명하는 물리학의 한 분야입니다. 이 이론은 20세기 초에 개발되었으며, 고전 물리학으로는 설명할 수 없는 현상을 설명하는 데 성공했습니다.\n\n양자역학의 핵심 개념 중 하나는 이중성입니다. 이중성은 입자가 파동과 입자의 성질을 동시에 가질 수 있음을 의미합니다. 예를 들어, 빛은 파동으로도 입자(광자)로도 행동할 수 있습니다.\n\n또 다른 핵심 개념은 불확정성 원리입니다. 불확정성 원리는 입자의 위치와 운동량을 동시에 정확하게 알 수 없음을 의미합니다. 이는 입자가 파동과 같은 성질을 가지고 있기 때문입니다.\n\n양자역학은 레이저, 트랜지스터, 핵무기와 같은 많은 현대 기술의 기반이 되었습니다. 또한 양자 컴퓨팅과 같은 새로운 기술 분야의 개발에도 영감을 주었습니다.\n\n양자역학은 매우 복잡한 이론이지만, 물질과 에너지의 기본적인 성질을 이해하는 데 필수적입니다.'}

In [None]:
conversation.memory.load_memory_variables({})["history"]

'Human: 양자역학에 대해 설명해줘.\nAI: 양자역학은 원자와 원자보다 작은 입자의 거동을 설명하는 물리학의 한 분야입니다. 20세기 초에 개발되었으며, 고전 물리학의 법칙으로는 설명할 수 없는 관찰 결과를 설명하기 위해 고안되었습니다.\n\n양자역학의 주요 개념 중 하나는 이중성입니다. 이중성은 입자가 입자와 파동의 특성을 모두 가질 수 있음을 의미합니다. 이는 입자가 간섭하고 회절될 수 있음을 의미하며, 이는 파동이 하는 일입니다. 그러나 입자는 또한 운동량과 에너지와 같은 입자 특성도 가지고 있습니다.\n\n양자역학의 또 다른 중요한 개념은 불확정성 원리입니다. 불확정성 원리는 어떤 입자의 위치와 운동량을 동시에 정확하게 알 수 없음을 의미합니다. 즉, 입자의 위치를 더 정확하게 알면 운동량에 대한 정보가 줄어들고, 반대의 경우도 마찬가지입니다.\n\n양자역학은 현대 물리학에서 가장 성공적인 이론 중 하나입니다. 레이저, 트랜지스터, 핵무기 등의 많은 현대 기술의 기반을 형성했습니다. 또한 양자역학은 우주의 근본적인 성질을 이해하는 데에도 사용되었습니다.'

In [None]:
conversation.memory.save_context(inputs={"human": "hi"}, outputs={"ai": "안녕"})

In [None]:
conversation.memory.load_memory_variables({})["history"]

'Human: 양자역학에 대해 설명해줘.\nAI: 양자역학은 원자와 원자보다 작은 입자의 거동을 설명하는 물리학의 한 분야입니다. 20세기 초에 개발되었으며, 고전 물리학의 법칙으로는 설명할 수 없는 관찰 결과를 설명하기 위해 고안되었습니다.\n\n양자역학의 주요 개념 중 하나는 이중성입니다. 이중성은 입자가 입자와 파동의 특성을 모두 가질 수 있음을 의미합니다. 이는 입자가 간섭하고 회절될 수 있음을 의미하며, 이는 파동이 하는 일입니다. 그러나 입자는 또한 운동량과 에너지와 같은 입자 특성도 가지고 있습니다.\n\n양자역학의 또 다른 중요한 개념은 불확정성 원리입니다. 불확정성 원리는 어떤 입자의 위치와 운동량을 동시에 정확하게 알 수 없음을 의미합니다. 즉, 입자의 위치를 더 정확하게 알면 운동량에 대한 정보가 줄어들고, 반대의 경우도 마찬가지입니다.\n\n양자역학은 현대 물리학에서 가장 성공적인 이론 중 하나입니다. 레이저, 트랜지스터, 핵무기 등의 많은 현대 기술의 기반을 형성했습니다. 또한 양자역학은 우주의 근본적인 성질을 이해하는 데에도 사용되었습니다.\nHuman: hi\nAI: 안녕'

In [None]:
display(conversation.invoke({"input": "불렛포인트 형식으로 작성해줘. emoji 추가해줘."}))

{'input': '불렛포인트 형식으로 작성해줘. emoji 추가해줘.',
 'history': 'Human: 양자역학에 대해 설명해줘\nAI: 양자역학은 물질과 에너지의 가장 작은 구성 요소인 원자와 아원자 입자의 행동을 설명하는 물리학 분야입니다. 이 이론은 빛이 입자(광자)와 파동의 성질을 동시에 가질 수 있는 이중성과 같은 직관에 어긋나는 현상을 예측합니다.\n\n핵심 개념 중 일부는 다음과 같습니다.\n\n* **파동-입자 이중성:** 입자는 파동과 같은 성질을 가질 수 있습니다.\n* **불확정성 원리:** 입자의 위치와 운동량을 동시에 정확하게 알 수 없습니다.\n* **중첩:** 입자는 여러 상태에 동시에 존재할 수 있습니다.\n* **양자 얽힘:** 서로 멀리 떨어진 두 입자가 연결되어 하나의 입자에 대한 측정이 다른 입자의 상태에 즉시 영향을 미칩니다.\n\n양자역학은 레이저, 트랜지스터, MRI 기계와 같은 현대 기술의 기반이 되었습니다. 또한 우주 초기의 거동과 블랙홀의 성질을 이해하는 데에도 중요한 역할을 합니다.\nHuman: 이전의 내용을 불렛포인트로 요약해줘. emoji 추가해줘.\nAI: * **파동-입자 이중성 🌊 粒子:** 입자는 파동처럼 행동할 수 있어요.\n* **불확정성 원리 ⚖️:** 입자의 위치와 운동량을 동시에 정확히 알 수 없어요.\n* **중첩 👥:** 입자는 여러 상태에 동시에 존재할 수 있어요.\n* **양자 얽힘 🔗:** 멀리 떨어진 입자들이 서로 연결되어 있어요. 한 입자를 측정하면 다른 입자의 상태에 영향을 미쳐요.\n* **현대 기술의 기반 💡💻:** 레이저, 트랜지스터, MRI 기계 등의 기반이에요.\n* **우주와 블랙홀 이해에 기여 🌌🕳️:** 우주 초기와 블랙홀의 성질을 이해하는 데 도움이 되요.',
 'response': '* **파동-입자 이중성 🌊 粒子:** 입자는 파동처럼 행동할 수 있어요.\n* **불확정성 원리 ⚖️:** 입자의 위치와 운동량을 동시에 정확히 알 수 없어요.\n* **

위 내용을 실시간 출력하도록 처리한다면

In [None]:
from langchain_core.callbacks.base import BaseCallbackHandler
from langchain_google_genai import ChatGoogleGenerativeAI


class StreamingHandler(BaseCallbackHandler):
    def on_llm_new_token(self, token: str, **kwargs) -> None:
        print(f"{token}", end="", flush=True)


# 스트리밍을 활성화하기 위해, ChatModel 생성자에 `streaming=True`를 전달합니다.
# 추가적으로, 사용자 정의 핸들러 리스트를 전달합니다.
stream_llm = ChatGoogleGenerativeAI(
    model="gemini-pro", streaming=True, callbacks=[StreamingHandler()]
)

conversation = ConversationChain(
    llm=stream_llm,
    verbose=False,
    memory=ConversationBufferMemory(),
)



In [None]:
#conversation.predict 메소드는 주어진 입력에 대한 예측 결과를 반환합니다.
# 이 예시에서는 '양자역학에 대해 설명해줘'라는 문자열을 입력으로 사용하며, 해당 입력에 대한 예측 결과를 output 변수에 저장합니다.
#이 과정은 AI 기반 대화 시스템에서 특정 주제에 대한 설명을 요청하는 방법을 보여줍니다.
output = conversation.predict(input="양자역학에 대해 설명해줘")

In [None]:
output = conversation.predict(
    input="이전의 내용을 불렛포인트로 요약해줘. emoji 추가해줘."
)

웹문서 체인 테스트

In [None]:
!pip install -q langchainhub

from langchain import hub
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.output_parsers import JsonOutputParser
from langchain.document_loaders import WebBaseLoader
from langchain.callbacks.base import BaseCallbackHandler


# Load some data to summarize
loader = WebBaseLoader("https://www.aitimes.com/news/articleView.html?idxno=131777")
docs = loader.load()
content = docs[0].page_content


class StreamCallback(BaseCallbackHandler):
    def on_llm_new_token(self, token, **kwargs):
        print(token, end="", flush=True)


prompt = hub.pull("teddynote/chain-of-density-korean")

# Create the chain, including
chain = (
    prompt
    | ChatGoogleGenerativeAI(
        temperature=0,
        model="gemini-pro",
        streaming=True,
        callbacks=[StreamCallback()],
    )
    | JsonOutputParser()
    | (lambda x: x[-1]["Denser_Summary"])
)

# Invoke the chain
result = chain.invoke({"ARTICLE": content})
display(result)


'데이터사이언스는 빅데이터 시대 융합 학문으로서, 기존 통계적 기법과 최근의 머신러닝 및 인공지능 기술을 학문적으로 연구하는 분야입니다. 실용적인 측면에서는 데이터를 획득하고, 여기에 전문 지식을 접목해 처리하거나 모델링화 하거나 시각화하는 과정을 통해 우리 실생활에 유용한 솔루션을 만드는 것입니다.'

# 문서 전체 요약(Stuff Documents Chain)

stuff documents chain("stuff"는 "채우다" 또는 "채우기 위해"의 의미)는 문서 체인 중 가장 간단한 방식입니다. 문서 목록을 가져와서 모두 프롬프트에 삽입한 다음, 그 프롬프트를 LLM에 전달합니다.

이 체인은 문서가 작고 대부분의 호출에 몇 개만 전달되는 애플리케이션에 적합합니다.

In [3]:
!pip install -U langchain langchainhub langchain_community -q

from langchain_core.prompts import ChatPromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain


prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "You are an expert summarizer. Please summarize the following sentence.",
        ),
        (
            "user",
            "Please summarize the sentence according to the following request."
            "\nREQUEST:\n"
            "1. Summarize the main points in bullet points in Korean."
            "2. Each summarized sentence must start with an emoji that fits the meaning of the each sentence."
            "3. Use various emojis to make the summary more interesting."
            "\n\nCONTEXT: {context}\n\nSUMMARY:",
        ),
    ]
)
prompt

ChatPromptTemplate(input_variables=['context'], messages=[SystemMessagePromptTemplate(prompt=PromptTemplate(input_variables=[], template='You are an expert summarizer. Please summarize the following sentence.')), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['context'], template='Please summarize the sentence according to the following request.\nREQUEST:\n1. Summarize the main points in bullet points in Korean.2. Each summarized sentence must start with an emoji that fits the meaning of the each sentence.3. Use various emojis to make the summary more interesting.\n\nCONTEXT: {context}\n\nSUMMARY:'))])

In [4]:
from langchain import hub

prompt = hub.pull("teddynote/summary-stuff-documents-korean")
prompt

PromptTemplate(input_variables=['context'], metadata={'lc_hub_owner': 'teddynote', 'lc_hub_repo': 'summary-stuff-documents-korean', 'lc_hub_commit_hash': 'c45b97ed375ce5251c42cfd9638dfecd2eaeb5ff4904838771d2a26ac3e2a5f6'}, template='Please summarize the sentence according to the following REQUEST.\nREQUEST:\n1. Summarize the main points in bullet points in KOREAN.\n2. Each summarized sentence must start with an emoji that fits the meaning of the each sentence.\n3. Use various emojis to make the summary more interesting.\n4. Translate the summary into KOREAN if it is written in ENGLISH.\n5. DO NOT translate any technical terms.\n6. DO NOT include any unnecessary information.\n\nCONTEXT:\n{context}\n\nSUMMARY:"\n')

In [5]:
from langchain_community.document_loaders import TextLoader

loader = TextLoader("data/news.txt")
docs = loader.load()
print(f"문서의 수: {len(docs)}\n")
print("[메타데이터]\n")
print(docs[0].metadata)
print("\n========= [앞부분] 미리보기 =========\n")
print(docs[0].page_content[:500])

RuntimeError: Error loading data/news.txt

MyCallbackHandler 클래스는 BaseCallbackHandler를 상속받아, 언어 모델이 새로운 토큰을 생성할 때마다 해당 토큰을 출력하는 기능을 추가합니다.

ChatOpenAI 객체는 GPT-3.5-turbo 모델을 사용하며, 스트리밍 모드와 낮은 온도 설정을 통해 더 일관된 응답을 생성하도록 구성됩니다. 이 객체는 콜백으로 MyCallbackHandler 인스턴스를 사용합니다.

마지막으로, create_stuff_documents_chain 함수를 사용하여 문서 생성 체인을 만들고, 이 체인을 통해 주어진 문맥(docs)에 대한 응답(answer)을 생성합니다.

In [None]:
from langchain.callbacks.base import BaseCallbackHandler


class MyCallbackHandler(BaseCallbackHandler):
    def on_llm_new_token(self, token: str, **kwargs) -> None:
        print(f"{token}", end="", flush=True)


llm = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    streaming=True,
    temperature=0.01,
    callbacks=[MyCallbackHandler()],
)
chain = create_stuff_documents_chain(llm, prompt)
answer = chain.invoke({"context": docs})

# 웹문서 요약(Webpage Summarization Chain)

In [6]:
from langchain import hub
from langchain_core.output_parsers import JsonOutputParser
from langchain.document_loaders import WebBaseLoader
from langchain.callbacks.base import BaseCallbackHandler


# Load some data to summarize
loader = WebBaseLoader("https://www.aitimes.com/news/articleView.html?idxno=131777")
docs = loader.load()
content = docs[0].page_content


class StreamCallback(BaseCallbackHandler):
    def on_llm_new_token(self, token, **kwargs):
        print(token, end="", flush=True)


prompt = hub.pull("teddynote/chain-of-density-korean")

# Create the chain, including
chain = (
    prompt
    | llm
    | JsonOutputParser()
    | (lambda x: x[-1]["Denser_Summary"])
)

# Invoke the chain
result = chain.invoke({"ARTICLE": content})
print(result)

데이터사이언스는 빅데이터 시대 융합 학문으로, 기존 통계적 기법과 최근의 머신러닝 및 인공지능 기술을 학문적으로 연구하는 분야이다. 실용적인 측면에서는 데이터를 획득하고, 여기에 전문 지식을 접목해 처리하거나 모델링화 하거나 시각화하는 과정을 통해 우리 실생활에 유용한 솔루션을 만드는 것이다.


In [7]:
from langchain import hub
from langchain_core.output_parsers import JsonOutputParser
from langchain.document_loaders import WebBaseLoader
from langchain.callbacks.base import BaseCallbackHandler


# Load some data to summarize
loader = WebBaseLoader("https://lineage2m.plaync.com/guidebook/view?title=%EC%A2%85%EC%A1%B1%20%EC%86%8C%EA%B0%9C")
docs = loader.load()
content = docs[0].page_content


class StreamCallback(BaseCallbackHandler):
    def on_llm_new_token(self, token, **kwargs):
        print(token, end="", flush=True)


prompt = hub.pull("teddynote/chain-of-density-korean")

# Create the chain, including
chain = (
    prompt
    | llm
    | JsonOutputParser()
    | (lambda x: x[-1]["Denser_Summary"])
)

# Invoke the chain
result = chain.invoke({"ARTICLE": content})
print(result)

NCSOFT의 리니지2M 가이드북은 게임 정보를 제공하는 가이드북입니다.


# SimpleSequentialChain

Chains 자체를 순서대로 실행합니다.

In [13]:
from langchain.chains import LLMChain, SimpleSequentialChain

# write
write_article_chain = LLMChain(llm=llm, prompt=PromptTemplate(template="{input}에 관한 기사를 써주세요", input_variables=["input"],),)
#translate
translate_chain = LLMChain(llm=llm, prompt=PromptTemplate(template="다음 문장을 영어로 번역해 주세요. \n{input}", input_variables=["input"],),)
#sequential
sequential_chain = SimpleSequentialChain(chains=[
    write_article_chain,
    translate_chain,
])

result=sequential_chain.run("일렉트릭 기타 선택 방법")

print(result)

  warn_deprecated(


**How to Choose an Electric Guitar**

Choosing an electric guitar can be an exciting but overwhelming process. With so many different brands, models, and features available, it's important to find the guitar that's the best fit for you. This article will guide you through the key factors to consider when choosing an electric guitar.

**1. Set a Budget**

Electric guitars range widely in price. Beginner guitars can be purchased for a few hundred dollars, while high-end models can cost thousands. Setting a budget will help you narrow down your choices.

**2. Consider Your Purpose**

Think about what you'll be using the guitar for. Will you be playing a specific genre, such as rock, blues, or jazz, or will you be playing a variety of styles? Different genres require different tones and playability.

**3. Choose a Body Style**

Electric guitars come in a variety of body styles. The most common styles include:

* **Solid Body:** Made from a solid block of wood, providing sustain and a clear