# 랭체인을 통한 LLM 활용하기

In [3]:
# langchain으로 모델 불러오기
import os
from langchain_google_genai import ChatGoogleGenerativeAI

chat=ChatGoogleGenerativeAI(
    model="gemini-2.0-flash-thinking-exp-01-21", # model_name is wrong. 
    api_key=os.environ["GEMINI_API_KEY"]
)

chat.invoke("Please introduce yourself in three sentences.")

AIMessage(content='Hello, I am a large language model, trained by Google. I am designed to communicate and generate human-like text in response to a wide range of prompts and questions.  Essentially, I am here to help you with language-based tasks.', additional_kwargs={}, response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'safety_ratings': []}, id='run-100ca055-063a-4f17-bdb3-3cfd9a8cae8f-0', usage_metadata={'input_tokens': 8, 'output_tokens': 50, 'total_tokens': 58, 'input_token_details': {'cache_read': 0}})

In [4]:
# # claude로 모델 API 불러오기
# import anthropic

# anthropic.Anthropic(
#     api_key="YOUR_API_KEY").messages.create(
#         model="claude-3-7-sonnet-latest",
#         max_tokens=1024,
#         messages=[
#             {"role": "user", "content": "Hello, world"}
#         ]
#     )

In [5]:
# # openai chatgpt 모델 API 호출
# from openai import OpenAI

# client = OpenAI(api_key="YOUR_API_KEY")
# client.chat.completions.create(
#     model="gpt-4o-mini-2024-07-18",
#     messages=[
#         {"role": "user",
#         "content": "Who won the world series in 2020?"}
#     ]
# )

In [6]:
chat.invoke("한국어로 자기 소개해줘.")

AIMessage(content='안녕하세요. 저는 여러분을 돕기 위해 개발된 인공지능 모델입니다. 만나서 반갑습니다.', additional_kwargs={}, response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'safety_ratings': []}, id='run-058e9d3d-7755-4357-8309-c6c3e6c88d49-0', usage_metadata={'input_tokens': 11, 'output_tokens': 22, 'total_tokens': 33, 'input_token_details': {'cache_read': 0}})

In [None]:
# 프롬프트 연습하기
# ChatPromptTemplate 모듈 (대화 형식 만들기)
# SystemMessage로 사용자에게 유용한 챗봇이 되도록 역할 부여하고 이름을 지을 수 있도록 처리
# HumanMessage와 AIMessage로 서로 안부를 묻고 답하는 대화 히스토리를 전달하여 대화의 맥락 부여
# {user_input} 매개변수를 통ㄷ해 사용자의 입력값을 HumanMessage로 받아들여 LLM이 답할 수 있게 설정

from langchain_core.prompts import ChatPromptTemplate

prompt_template = ChatPromptTemplate.from_messages(
    [
        #SystemMessage: 유용한 챗봇이라는 역할과 이름을 부여
        ("system", "You are helpful AI bot. Your name is {name}."),
        #HumanMessage와 AIMessage: 서로 안부를 묻고 답하는 대화 히스토리 주입
        ("human", "Hello, how are you doing?"),
        ("ai", "I'm fine, thank you."),
        #HumanMessage로 사용자가 입력한 프롬프트를 전달
        ("human", "{user_input}")
    ]
)

message = prompt_template.format_messages(name="Max", user_input="What is your name?")
print(message)

[SystemMessage(content='You are helpful AI bot. Your name is Max.', additional_kwargs={}, response_metadata={}), HumanMessage(content='Hello, how are you doing?', additional_kwargs={}, response_metadata={}), AIMessage(content="I'm fine, thank you.", additional_kwargs={}, response_metadata={}), HumanMessage(content='What is your name?', additional_kwargs={}, response_metadata={})]


SystemMessage : LLM에게 지속적으로 부여되는 프롬프트. 이걸 LLM에게 전달하면 LLM은 주어진 HumanMessage에 대해 SystemMessage의 지침대로 행동한다.  
HumanMessage : LLM에게 전달하는 사용자의 메세지  
AIMessage : LLM이 출력한 메세지 

In [8]:
# 두번째 탬플릿

from langchain.prompts import HumanMessagePromptTemplate
from langchain_core.messages import SystemMessage
from langchain_google_genai import ChatGoogleGenerativeAI

chat_template = ChatPromptTemplate.from_messages(
    [
        SystemMessage(
            content=(
                "You are a helpful assistant that re-writes the user's text to sound more upbeat."
            )
        ),
        HumanMessagePromptTemplate.from_template("{text}")
    ]
)
message = chat_template.format_messages(text="I don't like eating seaweed.")
print(message)

[SystemMessage(content="You are a helpful assistant that re-writes the user's text to sound more upbeat.", additional_kwargs={}, response_metadata={}), HumanMessage(content="I don't like eating seaweed.", additional_kwargs={}, response_metadata={})]


In [9]:
# LLM의 Temperature
# 서로 다른 temperature 설정으로 답변의 차이 비교하기

import os
from langchain_google_genai import ChatGoogleGenerativeAI

api_key=os.environ["GEMINI_API_KEY"]

# temperature = 0
model_1_1 = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=0, google_api_key=api_key) 
model_1_2 = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=0, google_api_key=api_key)

# temperature = 1
model_2_1 = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=1, google_api_key=api_key)
model_2_2 = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=1, google_api_key=api_key)

model_list = [model_1_1, model_1_2, model_2_1, model_2_2]

for i in model_list:
    answer = i.invoke("왜 사이버보안이 중요한지 한 문장으로 설명해줘.")
    print("-"*100)
    print(">>>", answer.content)

----------------------------------------------------------------------------------------------------
>>> 사이버 보안은 디지털 세계를 안전하게 지키고 개인 정보 및 자산을 보호하는 데 필수적이기 때문입니다.
----------------------------------------------------------------------------------------------------
>>> 사이버 보안은 디지털 세계를 안전하게 지키고 개인 정보 및 자산을 보호하는 데 필수적이기 때문입니다.
----------------------------------------------------------------------------------------------------
>>> 사이버보안은 우리의 디지털 자산과 개인 정보를 사이버 위협으로부터 보호하여 안전하게 지켜주기 때문에 중요합니다.
----------------------------------------------------------------------------------------------------
>>> 사이버보안은 개인 정보 유출, 재산 피해, 사회 혼란 등 사이버 위협으로부터 우리를 보호하여 안전한 디지털 세상을 만드는 데 필수적이기 때문입니다.


코드 실행결과를 보면 temerature 0은 똑같은 답변을 출력하지만 값을 1로 설정한 경우 다소 다른 답변을 출력한다.   
이처럼 temparature 매개변수는 LLM의 답변 스타일을 조정한다.  
LLM은 마치 문장 완성 게임을 하는것처럼 주어진 문장과 단어를 보고 다음에 어떤 단어가 올 지 예측하는데, 무작위로 고르는게 아니라 각 단어가 나올 확률을 계산한다.  
가장 그럴듯한 단어부터 덜 그럴듯한 단어까지 순위를 매긴다.  
여기서 temperature 매개변수가 작동한다. LLM의 '대담성'을 조절하는 도구다. temparature를 낮추면 답변의 일관성을, 높이면 무작위성을 높인다.  
즉, 단어 출현 확률 분포를 조절해서 특정 단어의 출현 확률을 높이면(temperature가 낮으면) 안전한 답변을,  
다른 단어들과 출현 확률을 큰 차이가 없도록 조정하면(temperature가 높으면) 모험적인 답변을 하게 된다.   

In [10]:
# 답변 스트리밍
# 스트리밍이란? 사용자 질문에 마치 사람이 타이핑하는것처럼 한 단어씩 생성하는 과정을 보여주는다. 

from langchain_google_genai import ChatGoogleGenerativeAI

api_key=os.environ["GEMINI_API_KEY"]

chat = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=0, google_api_key=api_key)

for chunk in chat.stream("달에 관한 시를 써줘."): # chat으로 선언한 모델에 stream()함수를 실행하여 모델의 답변 청크를 연속적으로 받아온다.
    print(chunk.content, end="", flush=True)    

## 달

밤하늘 검은 도화지 위에
하얀 달이 떠오르네

차가운 듯 따스한 달빛은
세상을 부드럽게 감싸네

고요한 밤, 홀로 빛나는 달은
외로운 나의 마음을 비추네

차고 이지러지는 모습
변함없이 밤을 지키네

어둠 속에서 길을 잃을 때
은은한 빛으로 나를 위로하네

화면에 실시간으로 답변이 출력된다.

In [11]:
# 응답 캐싱하여 더 빠르게 응답받기

import time
from langchain.globals import set_llm_cache # 캐시 메모리 라이브러리 호출
from langchain_google_genai import ChatGoogleGenerativeAI

api_key=os.environ["GEMINI_API_KEY"]

chat = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=0, google_api_key=api_key)

from langchain.cache import InMemoryCache

set_llm_cache(InMemoryCache()) # 캐시 메모리 설정

# 시간 측정을 위한 코드 추가
start_time = time.time()
response = chat.invoke("양자역학을 한마디로 설명해줘.")
end_time = time.time()

print("응답:", response.content)
print(f"실행 시간: {end_time - start_time:.4f}초")

응답: 양자역학은 **아주 작은 세계(원자, 전자 등)를 다루는 물리 법칙**인데, 이 세계에서는 **에너지, 운동량 등이 불연속적인 값(양자화)을 가지고, 입자와 파동의 성질을 동시에 가지며, 미래를 정확히 예측하는 대신 확률적으로만 예측할 수 있습니다.**

**좀 더 간단히 말하면, 아주 작은 세계의 '이상하고 확률적인' 물리 법칙입니다.**
실행 시간: 6.7631초


답변 속도를 빠르게 하기 위해 이전 응답을 캐싱해줘서 이건 답변을 임시 저장소(캐시 메모리)에 저장했다가 똑같은 질문을 했을때 캐시 메모리에 저장해둔 이전의 답변을 검색하여 그대로 출력  

In [12]:
# 캐시된 응답 시간 측정

print("\n캐시 사용 후 시간 측정:")
start_time = time.time()
response = chat.invoke("양자역학을 한마디로 설명해줘.")  # 동일한 질문으로 캐시된 응답 확인
end_time = time.time()

print("응답:", response.content)
print(f"실행 시간: {end_time - start_time:.4f}초")


캐시 사용 후 시간 측정:
응답: 양자역학은 **아주 작은 세계(원자, 전자 등)를 다루는 물리 법칙**인데, 이 세계에서는 **에너지, 운동량 등이 불연속적인 값(양자화)을 가지고, 입자와 파동의 성질을 동시에 가지며, 미래를 정확히 예측하는 대신 확률적으로만 예측할 수 있습니다.**

**좀 더 간단히 말하면, 아주 작은 세계의 '이상하고 확률적인' 물리 법칙입니다.**
실행 시간: 0.0010초


## Overall practice for today
1. 모델 호출
2. ChatpromptTemplate으로 SystemMessage, HumanMessage 프롬프트 설정
3. stream() 함수를 통한 답변 스트리밍 

In [4]:
from langchain_core.prompts import ChatPromptTemplate
from langchain.prompts import HumanMessagePromptTemplate
from langchain_core.messages import SystemMessage
from langchain_google_genai import ChatGoogleGenerativeAI

import os

api_key=os.environ["GEMINI_API_KEY"]

# 모델 호출
study_chat = ChatGoogleGenerativeAI(model="gemini-2.0-flash-thinking-exp-01-21", temperature=0, google_api_key=api_key)

# ChatPromptTemplate 통해 스터디 플래너 역할 부여 및 사용자 프롬프트 매개변수화개변수화
chat_template = ChatPromptTemplate.from_messages(
    [
        SystemMessage(
            content=(
                "당신은 공부 계획을 세워주는 스터디 플래너 머신입니다."
                "사용자의 공부 주제를 입력받으면, 이를 학습하기 위한 공부 계획을 작성합니다."
            )
        ), 
        HumanMessagePromptTemplate.from_template("{text}"),
    ]
)

# 설정한 프롬프트 탬플릿에 HumanMessage 전달
message = chat_template.format_messages(text="랭체인을 활용한 RAG에 대해서 공부하고 싶어요.")

# stream 함수를 통한 답변 스트리밍
for chunk in study_chat.stream(message):
    print(chunk.content, end="", flush=True)

## 랭체인(LangChain) RAG 학습 계획 (6주)

안녕하세요! 랭체인을 활용한 RAG (Retrieval-Augmented Generation) 학습 계획을 수립해 드릴게요. 6주 동안 RAG의 기본 개념부터 랭체인을 활용한 심화 내용까지 체계적으로 학습할 수 있도록 구성했습니다.  각 주차별 목표, 학습 내용, 실습 과제, 참고 자료를 포함하고 있으며, 개인의 학습 속도에 맞춰 조절 가능합니다.

**학습 목표:**

* RAG의 기본 원리 및 작동 방식 이해
* 랭체인의 핵심 모듈 및 기능 숙지
* 랭체인을 활용하여 실제 RAG 시스템 구축 능력 함양
* 다양한 RAG 활용 사례 학습 및 응용 능력 강화

**주차별 학습 계획:**

**1주차: RAG 기초 다지기 (RAG 개념 및 필요성 이해)**

* **목표:** RAG의 기본적인 개념과 등장 배경, 그리고 왜 필요한 기술인지 이해합니다.
* **학습 내용:**
    * **RAG란 무엇인가?**: 정의, 작동 방식, 장점 및 단점 학습
    * **기존 생성 모델의 한계**:  생성 모델의 환각(Hallucination) 문제점과 RAG의 필요성 이해
    * **검색(Retrieval)과 생성(Generation)의 결합**:  각 단계별 역할 및 상호 작용 방식 학습
    * **RAG의 다양한 활용 분야**:  챗봇, 문서 요약, 질의응답 등 실제 적용 사례 탐색
* **실습 과제:**
    * RAG 관련 블로그 글 또는 논문 2-3개 읽고 핵심 내용 요약
    * RAG를 활용할 수 있는 아이디어 3가지 이상 발상하고 간단하게 설명
* **참고 자료:**
    * RAG 관련 블로그 글 (예: [검색 증강 생성(RAG)이란 무엇일까요? - AWS](https://aws.amazon.com/ko/what-is/retrieval-augmented-generation-rag/))
    * RAG 관련 유튜브 영상 (예: [RAG(Retrieval Augmented Gen

In [5]:
study_answer = study_chat.invoke(message)
print(study_answer.content)

## 랭체인(LangChain) RAG 학습 계획 (6주)

안녕하세요! 랭체인을 활용한 RAG (Retrieval-Augmented Generation) 학습 계획을 수립해 드릴게요. 6주 동안 RAG의 기본 개념부터 랭체인을 활용한 심화 내용까지 체계적으로 학습할 수 있도록 구성했습니다.  각 주차별 목표, 학습 내용, 실습 과제, 참고 자료를 포함하고 있으며, 개인의 학습 속도에 맞춰 조절 가능합니다.

**학습 목표:**

* RAG의 기본 원리 및 작동 방식 이해
* 랭체인의 핵심 모듈 및 기능 숙지
* 랭체인을 활용하여 실제 RAG 시스템 구축 능력 함양
* 다양한 RAG 활용 사례 학습 및 응용 능력 강화

**주차별 학습 계획:**

**1주차: RAG 기초 다지기 (RAG 개념 및 필요성 이해)**

* **목표:** RAG의 기본적인 개념과 등장 배경, 그리고 왜 필요한 기술인지 이해합니다.
* **학습 내용:**
    * **RAG란 무엇인가?**: 정의, 작동 방식, 장점 및 단점 학습
    * **기존 생성 모델의 한계**:  생성 모델의 환각(Hallucination) 문제점과 RAG의 필요성 이해
    * **검색(Retrieval)과 생성(Generation)의 결합**:  각 단계별 역할 및 상호 작용 방식 학습
    * **RAG의 다양한 활용 분야**:  챗봇, 문서 요약, 질의응답 등 실제 적용 사례 탐색
* **실습 과제:**
    * RAG 관련 블로그 글 또는 논문 2-3개 읽고 핵심 내용 요약
    * RAG를 활용할 수 있는 아이디어 3가지 이상 발상하고 간단하게 설명
* **참고 자료:**
    * RAG 관련 블로그 글 (예: [검색 증강 생성(RAG)이란 무엇일까요? - AWS](https://aws.amazon.com/ko/what-is/retrieval-augmented-generation-rag/))
    * RAG 관련 유튜브 영상 (예: [RAG(Retrieval Augmented Gen

In [6]:
print(study_answer)

content='## 랭체인(LangChain) RAG 학습 계획 (6주)\n\n안녕하세요! 랭체인을 활용한 RAG (Retrieval-Augmented Generation) 학습 계획을 수립해 드릴게요. 6주 동안 RAG의 기본 개념부터 랭체인을 활용한 심화 내용까지 체계적으로 학습할 수 있도록 구성했습니다.  각 주차별 목표, 학습 내용, 실습 과제, 참고 자료를 포함하고 있으며, 개인의 학습 속도에 맞춰 조절 가능합니다.\n\n**학습 목표:**\n\n* RAG의 기본 원리 및 작동 방식 이해\n* 랭체인의 핵심 모듈 및 기능 숙지\n* 랭체인을 활용하여 실제 RAG 시스템 구축 능력 함양\n* 다양한 RAG 활용 사례 학습 및 응용 능력 강화\n\n**주차별 학습 계획:**\n\n**1주차: RAG 기초 다지기 (RAG 개념 및 필요성 이해)**\n\n* **목표:** RAG의 기본적인 개념과 등장 배경, 그리고 왜 필요한 기술인지 이해합니다.\n* **학습 내용:**\n    * **RAG란 무엇인가?**: 정의, 작동 방식, 장점 및 단점 학습\n    * **기존 생성 모델의 한계**:  생성 모델의 환각(Hallucination) 문제점과 RAG의 필요성 이해\n    * **검색(Retrieval)과 생성(Generation)의 결합**:  각 단계별 역할 및 상호 작용 방식 학습\n    * **RAG의 다양한 활용 분야**:  챗봇, 문서 요약, 질의응답 등 실제 적용 사례 탐색\n* **실습 과제:**\n    * RAG 관련 블로그 글 또는 논문 2-3개 읽고 핵심 내용 요약\n    * RAG를 활용할 수 있는 아이디어 3가지 이상 발상하고 간단하게 설명\n* **참고 자료:**\n    * RAG 관련 블로그 글 (예: [검색 증강 생성(RAG)이란 무엇일까요? - AWS](https://aws.amazon.com/ko/what-is/retrieval-augmented-generation-rag/))\n    * RAG 관련 유튜브 