### LLM Chain 만들기


## 1. 환경 구성

### 1) 라이브러리 설치

In [1]:
# poetry add python-dotenv langchain langchain-openai

### 2) OpenAI 인증키 설정
https://openai.com/

In [2]:
from dotenv import load_dotenv
import os
# .env 파일을 불러와서 환경 변수로 설정
load_dotenv(dotenv_path='.env')

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
print(OPENAI_API_KEY[:5])

gsk_4


In [3]:
import langchain
print(langchain.__version__)

0.3.27


## 2. LLM Chain

### 1) Prompt + LLM


In [4]:
from langchain_openai import ChatOpenAI

# model
# llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

# chain 실행
result = llm.invoke("인공지능 모델의 학습 원리에 대하여 쉽게 설명해 주세요.")
print(type(result))

<class 'langchain_core.messages.ai.AIMessage'>


In [5]:
print(result)

content='인공지능 모델의 학습 원리는 다음과 같습니다.\n\n1.  **데이터 수집**: 인공지능 모델은 대량의 데이터를 수집합니다. 이 데이터는 모델이 학습하고 예측을 수행하는 데 사용됩니다.\n2.  **데이터 전처리**: 수집된 데이터는 전처리 과정을 거칩니다. 이 과정에서는 데이터를 정제하고, 필요한 경우 데이터를 변환하거나 보완합니다.\n3.  **모델 정의**: 인공지능 모델은 수학적 알고리즘과 통계적 기법을 사용하여 정의됩니다. 이 모델은 입력 데이터를 받아서 출력 데이터를 생성합니다.\n4.  **학습**: 모델은 수집된 데이터를 사용하여 학습합니다. 이 과정에서는 모델이 데이터를 분석하고, 패턴을 발견하며, 예측을 수행하는 데 필요한 가중치를 조정합니다.\n5.  **평가**: 학습이 완료된 후, 모델은 평가 데이터에 대해 평가됩니다. 이 과정에서는 모델의 성능을 측정하고, 모델이 얼마나 정확하게 예측을 수행하는지 확인합니다.\n6.  **최적화**: 평가 결과에 따라 모델을 최적화합니다. 이 과정에서는 모델의 가중치를 조정하여 성능을 향상시킵니다.\n\n예를 들어, 이미지 분류 모델을 학습하는 경우를 생각해 봅시다.\n\n*   **데이터 수집**: 다양한 이미지를 수집합니다. 이 이미지에는 고양이, 강아지, 자동차 등 다양한 객체가 포함됩니다.\n*   **데이터 전처리**: 이미지를 정제하고, 크기를 조정하며, 필요한 경우 이미지를 변환합니다.\n*   **모델 정의**: 이미지 분류 모델을 정의합니다. 이 모델은 이미지를 입력으로 받아서 객체를 분류합니다.\n*   **학습**: 모델은 수집된 이미지를 사용하여 학습합니다. 이 과정에서는 모델이 이미지를 분석하고, 객체를 분류하는 데 필요한 가중치를 조정합니다.\n*   **평가**: 학습이 완료된 후, 모델은 평가 데이터에 대해 평가합니다. 이 과정에서는 모델의 성능을 측정하고, 모델이 얼마나 정확하게 객체를 분류하는지 확인합니다.\n*   **최적화**: 평가 결과에 따라 모델

In [6]:
print(result.content)

인공지능 모델의 학습 원리는 다음과 같습니다.

1.  **데이터 수집**: 인공지능 모델은 대량의 데이터를 수집합니다. 이 데이터는 모델이 학습하고 예측을 수행하는 데 사용됩니다.
2.  **데이터 전처리**: 수집된 데이터는 전처리 과정을 거칩니다. 이 과정에서는 데이터를 정제하고, 필요한 경우 데이터를 변환하거나 보완합니다.
3.  **모델 정의**: 인공지능 모델은 수학적 알고리즘과 통계적 기법을 사용하여 정의됩니다. 이 모델은 입력 데이터를 받아서 출력 데이터를 생성합니다.
4.  **학습**: 모델은 수집된 데이터를 사용하여 학습합니다. 이 과정에서는 모델이 데이터를 분석하고, 패턴을 발견하며, 예측을 수행하는 데 필요한 가중치를 조정합니다.
5.  **평가**: 학습이 완료된 후, 모델은 평가 데이터에 대해 평가됩니다. 이 과정에서는 모델의 성능을 측정하고, 모델이 얼마나 정확하게 예측을 수행하는지 확인합니다.
6.  **최적화**: 평가 결과에 따라 모델을 최적화합니다. 이 과정에서는 모델의 가중치를 조정하여 성능을 향상시킵니다.

예를 들어, 이미지 분류 모델을 학습하는 경우를 생각해 봅시다.

*   **데이터 수집**: 다양한 이미지를 수집합니다. 이 이미지에는 고양이, 강아지, 자동차 등 다양한 객체가 포함됩니다.
*   **데이터 전처리**: 이미지를 정제하고, 크기를 조정하며, 필요한 경우 이미지를 변환합니다.
*   **모델 정의**: 이미지 분류 모델을 정의합니다. 이 모델은 이미지를 입력으로 받아서 객체를 분류합니다.
*   **학습**: 모델은 수집된 이미지를 사용하여 학습합니다. 이 과정에서는 모델이 이미지를 분석하고, 객체를 분류하는 데 필요한 가중치를 조정합니다.
*   **평가**: 학습이 완료된 후, 모델은 평가 데이터에 대해 평가합니다. 이 과정에서는 모델의 성능을 측정하고, 모델이 얼마나 정확하게 객체를 분류하는지 확인합니다.
*   **최적화**: 평가 결과에 따라 모델을 최적화합니다. 이 과정에서는 모델의 가중치

### 2) PromptTemplate + LLM

In [7]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

print(type(prompt))
print(prompt)

<class 'langchain_core.prompts.prompt.PromptTemplate'>
input_variables=['input'] input_types={} partial_variables={} template='You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.'


In [8]:
from langchain_openai import ChatOpenAI

# llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)
# chain 연결 (LCEL)
chain = prompt | llm
print(type(chain))

# chain 호출
result = chain.invoke({"input": "인공지능 모델의 학습 원리"})
print(type(result))
print(result)

<class 'langchain_core.runnables.base.RunnableSequence'>
<class 'langchain_core.messages.ai.AIMessage'>
content='인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. \n\n사람이 경험을 통해 학습하듯이, 인공지능 모델도 데이터를 통해 학습합니다. \n\n예를 들어, 고양이를 인식하는 모델을 개발한다고 가정해 봅시다. \n\n이를 위해 인터넷에서 고양이 사진 100만 장을 수집했다고 가정해 봅시다. \n\n이 사진들을 모델에 보여주면서, "이것은 고양이"라는 라벨을 달아주는 겁니다. \n\n그러면 모델은 이 사진들을 분석해서 고양이의 특징을 스스로 학습합니다. \n\n고양이는 털이 많고, 귀가 있고, 눈이 두 개라는 등의 특징을 스스로 발견하는 거죠. \n\n이렇게 학습한 모델은 새로운 사진을 보여주었을 때, 고양이인지 아닌지 스스로 판별할 수 있습니다.\n\n이러한 학습 과정을 수학적으로 표현하면, 최적화 문제로 귀결됩니다. \n\n즉, 모델의 성능을 나타내는 손실 함수를 정의하고, 이 손실 함수를 최소화하는 방향으로 모델의 파라미터를 업데이트하는 겁니다. \n\n이를 위해 경사 하강법이라는 최적화 알고리즘을 사용합니다. \n\n경사 하강법은 손실 함수의 기울기를 계산하고, 이 기울기의 반대 방향으로 모델의 파라미터를 업데이트하는 알고리즘입니다.\n\n모델의 학습 과정은 다음과 같습니다.\n\n1. 데이터 수집: 학습에 필요한 데이터를 수집합니다.\n2. 데이터 전처리: 수집한 데이터를 모델이 학습할 수 있도록 전처리합니다.\n3. 모델 정의: 학습할 모델을 정의합니다.\n4. 손실 함수 정의: 모델의 성능을 나타내는 손실 함수를 정의합니다.\n5. 최적화 알고리즘 선택: 모델의 파라미터를 업데이트할 최적화 알고리즘을 선택합니다.\n6. 학습: 모델을 학습합니다.\n7. 평가: 학습한 모델의 성능을 평가합니다.\n\n이렇게 학습한 모델은 새로운 데이터에 

In [9]:
print(result.content)

인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. 

사람이 경험을 통해 학습하듯이, 인공지능 모델도 데이터를 통해 학습합니다. 

예를 들어, 고양이를 인식하는 모델을 개발한다고 가정해 봅시다. 

이를 위해 인터넷에서 고양이 사진 100만 장을 수집했다고 가정해 봅시다. 

이 사진들을 모델에 보여주면서, "이것은 고양이"라는 라벨을 달아주는 겁니다. 

그러면 모델은 이 사진들을 분석해서 고양이의 특징을 스스로 학습합니다. 

고양이는 털이 많고, 귀가 있고, 눈이 두 개라는 등의 특징을 스스로 발견하는 거죠. 

이렇게 학습한 모델은 새로운 사진을 보여주었을 때, 고양이인지 아닌지 스스로 판별할 수 있습니다.

이러한 학습 과정을 수학적으로 표현하면, 최적화 문제로 귀결됩니다. 

즉, 모델의 성능을 나타내는 손실 함수를 정의하고, 이 손실 함수를 최소화하는 방향으로 모델의 파라미터를 업데이트하는 겁니다. 

이를 위해 경사 하강법이라는 최적화 알고리즘을 사용합니다. 

경사 하강법은 손실 함수의 기울기를 계산하고, 이 기울기의 반대 방향으로 모델의 파라미터를 업데이트하는 알고리즘입니다.

모델의 학습 과정은 다음과 같습니다.

1. 데이터 수집: 학습에 필요한 데이터를 수집합니다.
2. 데이터 전처리: 수집한 데이터를 모델이 학습할 수 있도록 전처리합니다.
3. 모델 정의: 학습할 모델을 정의합니다.
4. 손실 함수 정의: 모델의 성능을 나타내는 손실 함수를 정의합니다.
5. 최적화 알고리즘 선택: 모델의 파라미터를 업데이트할 최적화 알고리즘을 선택합니다.
6. 학습: 모델을 학습합니다.
7. 평가: 학습한 모델의 성능을 평가합니다.

이렇게 학습한 모델은 새로운 데이터에 대해 예측을 수행할 수 있습니다. 

예를 들어, 고양이 인식 모델은 새로운 사진을 보여주었을 때, 고양이인지 아닌지 예측할 수 있습니다.


### 3) PromptTemplate + LLM(invoke()) + StrOutputParser

In [10]:
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# 1. 컴포넌트 정의
prompt = PromptTemplate.from_template("You are an expert in AI Expert. \
                                      Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

# llm = ChatOpenAI(model="gpt-3.5-turbo")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

output_parser = StrOutputParser()

# 2. chain 생성 (LCEL)
chain = prompt | llm | output_parser
print(type(chain))

# 3. chain의 invoke 호출
result = chain.invoke({"input": "인공지능 모델의 학습 원리"})
print(type(result))
print(result)

<class 'langchain_core.runnables.base.RunnableSequence'>
<class 'str'>
인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 방식과 유사합니다. 컴퓨터가 데이터를 통해 배우고, 데이터를 기반으로 예측이나 판단을 내리는 과정을 거칩니다. 이는 크게 세 가지 단계로 설명할 수 있습니다: 데이터 수집, 모델 훈련, 그리고 예측 또는 평가입니다.

1. **데이터 수집**: 인공지능 모델이 학습하기 위해서는 많은 양의 데이터가 필요합니다. 이 데이터는 과거의 경험에서 얻어진 정보일 수 있으며, 이미지, 텍스트, 오디오 등 다양한 형태가 될 수 있습니다.

2. **모델 훈련**: 수집된 데이터를 바탕으로 모델을 훈련시킵니다. 이 과정에서는 모델이 데이터를 분석하고, 데이터 속에 있는 패턴이나 관계를 발견하려고 합니다. 예를 들어, 이미지 인식 모델을 만든다고 가정해 봅시다. 이 모델은 수많은 고양이와 강개의 사진을 통해 고양이와 강개를 구별하는 법을 배웁니다.

3. **예측 또는 평가**: 모델이 훈련된 후, 새로운 데이터를 받았을 때, 학습한 패턴을 바탕으로 예측이나 판단을 합니다. 예를 들어, 새로운 이미지가 주어졌을 때, 이 모델은 그것이 고양이인지 강개인지 구별할 수 있습니다.

이러한 학습 과정은 여러 알고리즘을 통해 이루어지며, 그중 가장 기본적인 알고리즘은 아래와 같습니다:

- **지도 학습(Supervised Learning)**: 모델이 이미 레이블이 지정된 데이터를 통해 학습하는 방식입니다. 예를 들어, 사진과 그에 따른 설명(레이블)이 주어진 경우, 모델은 사진을 보고 설명을 예측하도록 학습합니다.

- **비지도 학습(Unsupervised Learning)**: 모델이 레이블이 없는 데이터를 분석하여 패턴이나 관계를 스스로 찾는 방식입니다. 주로 데이터의 구조를 파악하거나 그룹화를 할 때 사용됩니다.

- **강화 학습(Reinforcement Learning)**: 모델이 환경과 상호작용

### 4) PromptTemplate + LLM(stream()) + StrOutputParser

In [11]:

from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# 1. 컴포넌트 정의
prompt = PromptTemplate.from_template("You are an expert in AI Expert. \
                                      Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

#llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
lm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

# chain 연결 (LCEL)
chain = prompt | llm | StrOutputParser()

# 스트리밍 출력을 위한 요청
answer = chain.stream({"input": "인공지능 모델의 학습 원리"})
# 스트리밍 출력
#print(answer)

for token in answer:
    # 스트림에서 받은 데이터의 내용을 출력합니다. 줄바꿈 없이 이어서 출력하고, 버퍼를 즉시 비웁니다.
    print(token, end="", flush=True)

인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. 

기본적으로 인공지능 모델은 데이터를 통해 학습합니다. 예를 들어, 고양이와 강아지의 사진을 분류하는 모델을 만든다고 가정해 봅시다. 

1. **데이터 수집**: 수많은 고양이와 강아지의 사진을 수집합니다.
2. **데이터 전처리**: 수집한 사진들을 컴퓨터가 처리할 수 있는 형태로 변환합니다.
3. **모델 초기화**: 모델을 초기화합니다. 이 모델은 고양이와 강아지 사진을 구분할 수 있는 신경망 구조로 되어 있습니다.
4. **학습 과정**: 
   - 모델에 고양이 사진과 강아지 사진을 하나씩 보여줍니다.
   - 모델은 사진의 특징을 추출하고, 이것이 고양이인지 강아지인지를 예측합니다.
   - 예측 결과와 실제 사진의 라벨(고양이 또는 강아지)을 비교하여 오류를 계산합니다.
   - 모델은 오류를 줄이기 위해 자동으로 내부 파라미터(가중치와 편향)를 조정합니다. 이 과정은 역전파(backpropagation) 알고리즘을 통해 이루어집니다.
5. **반복 학습**: 이 과정을 수많은 사진들에 대해 반복합니다. 모델은 매번 조금씩 더 정확해집니다.
6. **성능 평가**: 일정 횟수 학습시킨 후, 별도의 테스트 데이터를 사용하여 모델의 성능을 평가합니다.

이처럼 인공지능 모델은 주어진 데이터를 통해 지속적으로 학습하고, 그 과정에서 스스로 규칙과 패턴을 발견하여 예측 능력을 향상시킵니다. 이 학습 원리는 다양한 머신러닝과 딥러닝 알고리즘에서 기본이 되는 개념입니다.

##### 2) Multiple Chains
* Multi Chain을 활용한 영화 추천 및 줄거리 요약 ( 잘 동작하지 않는 코드)

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
prompt1 = ChatPromptTemplate.from_template("{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.")

# Step 2: 추천된 영화의 줄거리를 요약
prompt2 = ChatPromptTemplate.from_template("{movie} 추천한 영화의 제목을 먼저 알려주시고, 줄을 바꾸어서 영화의 정보(제목,감독,캐스팅,줄거리)를 알려 주세요")

# OpenAI 모델 사용
# llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    #model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    model="moonshotai/kimi-k2-instruct-0905",
    temperature=0.7
)

# 체인 1: 영화 추천 (입력: 장르 → 출력: 영화 제목)
chain1 = prompt1 | llm | StrOutputParser()

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
movie = chain1.invoke({"genre": "Drama"})  # 영화 제목 얻기

print(type(movie))
print(" ===> 추천된 영화:")  # movie 값 출력
print(movie)

<class 'str'>
 ===> 추천된 영화:
**『쇼생크 탈출(The Shawshank Redemption)』**  
1994년, 프랭크 다라본트 감독  

감옥이라는 극한의 공간에서도 희망을 빼앗기지 않는 한 남자의 20년 간 인내와 우정, 그리고 ‘자유’에 대한 이야기입니다. 사회의 부조리와 인간의 존엄성을 절묘하게 교차시키며, 마지막 10분만으로도 평생 뇌리에 남는 여운을 선사합니다.


In [13]:
# 체인 2: 줄거리 요약 (입력: 영화 제목 → 출력: 줄거리)
chain2 = (
    {"movie": chain1}  # chain1의 출력을 movie 변수로 전달
    | prompt2
    | llm
    | StrOutputParser()
)
print(chain2)

# 실행: "SF" 장르의 영화 추천 및 줄거리 요약
response = chain2.invoke({"genre": "Drama"})
print("\n🔹 영화 줄거리 요약:\n", response) 

first={
  movie: ChatPromptTemplate(input_variables=['genre'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['genre'], input_types={}, partial_variables={}, template='{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.'), additional_kwargs={})])
         | ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x000001721E04BBF0>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x000001721E017F20>, root_client=<openai.OpenAI object at 0x000001721E017770>, root_async_client=<openai.AsyncOpenAI object at 0x000001721DE82F30>, model_name='moonshotai/kimi-k2-instruct-0905', temperature=0.7, model_kwargs={}, openai_api_key=SecretStr('**********'), openai_api_base='https://api.groq.com/openai/v1')
         | StrOutputParser()
} middle=[ChatPromptTemplate(input_variables=['movie'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=PromptTempl

##### chain1과 chain2에서 영화 제목이 일관되게 전달 되도록 변경 ( 잘 동작하는 코드)

In [14]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

from pprint import pprint

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
prompt1 = ChatPromptTemplate.from_template("{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.")

# Step 2: 추천된 영화의 줄거리를 요약
prompt2 = ChatPromptTemplate.from_template("{movie} 추천한 영화의 제목을 먼저 알려주시고, 줄을 바꾸어서 영화의 정보(제목,감독,캐스팅,줄거리)를 알려 주세요.")

# OpenAI 모델 사용
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    #model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    model="moonshotai/kimi-k2-instruct-0905",
    temperature=0.7
)

# 체인 1: 영화 추천 (입력: 장르 → 출력: 영화 제목)
chain1 = prompt1 | llm | StrOutputParser()

# 체인 2: 줄거리 요약 (입력: 영화 제목 → 출력: 줄거리)
chain2 = (
    {"movie": chain1}  # chain1의 출력을 movie 변수로 전달
    | prompt2
    | llm
    | StrOutputParser()
)

# 실행: "Drama" 장르의 영화 추천 및 줄거리 요약
response = chain2.invoke({"genre": "Drama"})
print("\n🔹 영화 줄거리 요약:")
pprint(response)


🔹 영화 줄거리 요약:
('쇼생크 탈출\n'
 '\n'
 '쇼생크 탈출  \n'
 '감독: 프랭크 다라본트  \n'
 '출연: 팀 로빈스(앤디 듀프레인), 모건 프리먼(레드)\n'
 '\n'
 '1947년, 아내와 그녀의 정부를 살해했다는 누명을 쓴 은행원 앤디는 쇼생크 교도소에 무기징역으로 수감된다.  \n'
 '차분하고 지적인 그는 교도소 내에서도 희망을 잃지 않고, 동료 죄수 레드와 깊은 우정을 쌓는다.  \n'
 '20여 년에 걸쳐 교도소 관리들의 세탁·탈세를 도와주며 특별한 신뢰를 얻던 앤디는 어느 날 박사처럼 증발—그리고 마침내 진짜 ‘탈출’을 '
 '실행한다.  \n'
 '빗줄기 속에서 맞이한 자유, 그리고 레드가 약속대로 그를 찾아가며 두 사람은 태평양의 푸른 바다 앞에서 다시 만난다.')
