### LLM Chain 만들기


## 1. 환경 구성

### 1) 라이브러리 설치

In [1]:
! poetry add python-dotenv langchain langchain-openai

The following packages are already present in the pyproject.toml and will be skipped:

  - python-dotenv
  - langchain
  - langchain-openai

If you want to update it to the latest compatible version, you can use `poetry update package`.
If you prefer to upgrade it to the latest available version, you can use `poetry add package@latest`.

Nothing to add.


### 2) OpenAI 인증키 설정
https://openai.com/

In [1]:
from dotenv import load_dotenv
import os
# .env 파일을 불러와서 환경 변수로 설정
load_dotenv(dotenv_path='.env')

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
print(OPENAI_API_KEY[:5])

gsk_G


In [3]:
import langchain
print(langchain.__version__)

0.3.27


## 2. LLM Chain

### 1) Prompt + LLM


In [4]:
from langchain_openai import ChatOpenAI

# model
# llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

# chain 실행
result = llm.invoke("인공지능 모델의 학습 원리에 대하여 쉽게 설명해 주세요.")
print(type(result))

<class 'langchain_core.messages.ai.AIMessage'>


In [5]:
print(result)

content='인공지능 모델의 학습 원리는 크게 세 가지로 설명할 수 있습니다.\n\n*   **데이터 수집 및 준비** 학습을 위해서는 인공지능 모델이 학습할 수 있는 충분한 양의 데이터가 필요합니다. 데이터는 이미지, 텍스트, 오디오 등 다양한 형태가 있을 수 있습니다. 수집된 데이터는 정제되고, 라벨링되는 과정을 거쳐 모델이 학습할 수 있는 형태로 준비됩니다. 예를 들어, 고양이와 강아지의 사진을 분류하는 모델을 학습할 때는 고양이와 강아지의 사진 데이터와 각 사진에 고양이 또는 강아지라는 라벨을 준비합니다.\n*   **모델 훈련** 준비된 데이터를 바탕으로 인공지능 모델을 훈련합니다. 모델은 입력된 데이터와 예상 출력 간의 차이를 계산하고, 이 차이(오차)를 줄이기 위해 모델의 가중치를 조정하는 과정을 반복합니다. 이 과정은 최적화 알고리즘에 의해 수행되며, 모델이 데이터를 얼마나 잘 학습했는지를 나타내는 손실 함수를 최소화하는 방향으로 모델이 업데이트됩니다.\n*   **모델 평가 및 개선** 훈련된 모델의 성능을 평가하기 위해 테스트 데이터를 사용합니다. 테스트 데이터에 대한 모델의 성능을 측정하고, 필요하다면 모델의 구조를 조정하거나 학습 데이터를 추가하는 등의 방법으로 모델을 개선합니다.\n\n예를 들어, 간단한 선형 회귀 모델을 생각해 보겠습니다. 선형 회귀 모델은 직선을 이용하여 데이터 포인트들을 가장 잘 표현하려고 합니다. 이 모델은 주어진 데이터 포인트와 모델이 예측한 값 사이의 오차를 계산하고, 오차를 줄이기 위해 직선의 기울기와 절편을 조정합니다. 이 과정은 오차가 충분히 작아질 때까지 반복되며, 모델은 데이터의 패턴을 학습하게 됩니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 349, 'prompt_tokens': 24, 'total_tokens': 373, 'completion_tokens_details'

In [6]:
print(result.content)

인공지능 모델의 학습 원리는 크게 세 가지로 설명할 수 있습니다.

*   **데이터 수집 및 준비** 학습을 위해서는 인공지능 모델이 학습할 수 있는 충분한 양의 데이터가 필요합니다. 데이터는 이미지, 텍스트, 오디오 등 다양한 형태가 있을 수 있습니다. 수집된 데이터는 정제되고, 라벨링되는 과정을 거쳐 모델이 학습할 수 있는 형태로 준비됩니다. 예를 들어, 고양이와 강아지의 사진을 분류하는 모델을 학습할 때는 고양이와 강아지의 사진 데이터와 각 사진에 고양이 또는 강아지라는 라벨을 준비합니다.
*   **모델 훈련** 준비된 데이터를 바탕으로 인공지능 모델을 훈련합니다. 모델은 입력된 데이터와 예상 출력 간의 차이를 계산하고, 이 차이(오차)를 줄이기 위해 모델의 가중치를 조정하는 과정을 반복합니다. 이 과정은 최적화 알고리즘에 의해 수행되며, 모델이 데이터를 얼마나 잘 학습했는지를 나타내는 손실 함수를 최소화하는 방향으로 모델이 업데이트됩니다.
*   **모델 평가 및 개선** 훈련된 모델의 성능을 평가하기 위해 테스트 데이터를 사용합니다. 테스트 데이터에 대한 모델의 성능을 측정하고, 필요하다면 모델의 구조를 조정하거나 학습 데이터를 추가하는 등의 방법으로 모델을 개선합니다.

예를 들어, 간단한 선형 회귀 모델을 생각해 보겠습니다. 선형 회귀 모델은 직선을 이용하여 데이터 포인트들을 가장 잘 표현하려고 합니다. 이 모델은 주어진 데이터 포인트와 모델이 예측한 값 사이의 오차를 계산하고, 오차를 줄이기 위해 직선의 기울기와 절편을 조정합니다. 이 과정은 오차가 충분히 작아질 때까지 반복되며, 모델은 데이터의 패턴을 학습하게 됩니다.


### 2) PromptTemplate + LLM

In [7]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

print(type(prompt))
print(prompt)

<class 'langchain_core.prompts.prompt.PromptTemplate'>
input_variables=['input'] input_types={} partial_variables={} template='You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.'


In [8]:
from langchain_openai import ChatOpenAI

# llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)
# chain 연결 (LCEL)
chain = prompt | llm
print(type(chain))

# chain 호출
result = chain.invoke({"input": "인공지능 모델의 학습 원리"})
print(type(result))
print(result)

<class 'langchain_core.runnables.base.RunnableSequence'>
<class 'langchain_core.messages.ai.AIMessage'>
content="인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. 컴퓨터가 데이터를 통해 스스로 학습할 수 있도록 하는 것입니다. \n\n1. **데이터 수집**: 우선 인공지능이 학습할 데이터를 수집합니다. 이 데이터는 과거에 발생했던 일에 대한 정보이거나, 현실에서 관찰된 정보일 수 있습니다.\n\n2. **데이터 전처리**: 수집한 데이터를 분석에 적합한 형태로 가공하는 과정입니다. 중복된 데이터를 제거하거나, 결측치를 보완하는 등의 작업이 이에 포함됩니다.\n\n3. **모델 선택**: 인공지능 모델에는 여러 종류가 있습니다. 수집한 데이터의 특성과 해결하고자 하는 문제에 적합한 모델을 선택합니다. 예를 들어, 이미지 인식에는 합성곱 신경망(CNN), 자연어 처리에는 순환 신경망(RNN)이나 트랜스포머 등이 사용됩니다.\n\n4. **학습**: 선택한 모델에 데이터를 입력하여 모델의 파라미터를 조정하는 과정입니다. 이 과정에서 모델은 입력 데이터와 그에 따른 결과(레이블)를 통해 스스로를 수정합니다. 이 과정은 '손실 함수(loss function)'를 통해 모델의 예측 오류를 최소화하는 방향으로 진행됩니다.\n\n5. **평가**: 학습된 모델의 성능을 평가합니다. 평가 데이터 세트를 사용하여 모델의 예측 성능을 측정하고, 필요에 따라 모델의 하이퍼파라미터를 조정하거나 학습을 반복합니다.\n\n6. **예측**: 학습과 평가를 통해 완성된 모델을 사용하여 새로운 데이터에 대한 예측이나 분류 작업을 수행합니다.\n\n예를 들어, 고양이와 강아지의 사진을 구분하는 모델을 만든다고 가정해 봅시다. \n\n- 데이터를 수집합니다. (고양이, 강아지 사진들)\n- 전처리 과정을 거쳐 사진들을 분석에 적합한 형태로 가공합니다.\n- 이미지 인식에 적합한 모델(

In [None]:
print(result.content)

### 3) PromptTemplate + LLM(invoke()) + StrOutputParser

In [None]:
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# 1. 컴포넌트 정의
prompt = PromptTemplate.from_template("You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

# llm = ChatOpenAI(model="gpt-3.5-turbo")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

output_parser = StrOutputParser()

# 2. chain 생성 (LCEL)
chain = prompt | llm | output_parser
print(type(chain))

# 3. chain의 invoke 호출
result = chain.invoke({"input": "인공지능 모델의 학습 원리"})
print(type(result))
print(result)

### 4) PromptTemplate + LLM(stream()) + StrOutputParser

In [9]:

from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# 1. 컴포넌트 정의
prompt = PromptTemplate.from_template("You are an expert in AI Expert.\
                                       Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

#llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
lm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

# chain 연결 (LCEL)
chain = prompt | llm | StrOutputParser()

# 스트리밍 출력을 위한 요청
answer = chain.stream({"input": "인공지능 모델의 학습 원리"})
# 스트리밍 출력
#print(answer)

for token in answer:
    # 스트림에서 받은 데이터의 내용을 출력합니다. 줄바꿈 없이 이어서 출력하고, 버퍼를 즉시 비웁니다.
    print(token, end="", flush=True)

인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. 

1. **데이터 수집**: 우선, 인공지능 모델이 학습할 수 있는 많은 데이터를 수집합니다. 이 데이터는 문제에 대한 다양한 사례와 그에 따른 결과로 구성됩니다.

2. **데이터 전처리**: 수집된 데이터는 모델이 이해할 수 있는 형태로 변환됩니다. 예를 들어, 이미지 데이터는 픽셀 값으로 변환되고, 텍스트 데이터는 단어 벡터로 변환됩니다.

3. **모델 초기화**: 인공지능 모델은 수학적 함수로 표현되며, 이 함수는 다양한 변수(파라미터)를 가지고 있습니다. 이 변수들은 모델의 초기값으로 설정됩니다.

4. **예측**: 모델은 학습된 데이터를 바탕으로 예측을 수행합니다. 이 예측은 실제 결과와 비교하여 얼마나 정확한지 평가됩니다.

5. **오차 계산**: 모델의 예측과 실제 결과 사이의 차이(오차)를 계산합니다. 이 오차는 모델이 얼마나 잘못 예측했는지를 나타냅니다.

6. **변수 업데이트**: 오차를 줄이기 위해 모델의 변수들을 조정합니다. 이 과정은 모델이 실제 결과에 더 가까운 예측을 할 수 있도록 합니다.

7. **반복**: 4, 5, 6 단계를 여러 번 반복합니다. 반복할수록 모델은 더 많은 데이터를 학습하고, 예측의 정확도가 높아집니다.

8. **모델 평가**: 학습이 완료된 후, 모델의 성능을 평가합니다. 평가 데이터에 대한 모델의 예측 정확도를 확인하여 모델의 성능을 결정합니다.

이를 통해 인공지능 모델은 주어진 데이터를 학습하고, 새로운 데이터에 대해서도 정확한 예측을 할 수 있게 됩니다.

##### 2) Multiple Chains
* Multi Chain을 활용한 영화 추천 및 줄거리 요약

In [11]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
prompt1 = ChatPromptTemplate.from_template("{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.")

# Step 2: 추천된 영화의 줄거리를 요약
prompt2 = ChatPromptTemplate.from_template("{movie} 추천한 영화의 제목을 먼저 알려주시고, 줄을 바꾸어서 영화의 정보(제목,감독,캐스팅,줄거리)를 알려 주세요")

# OpenAI 모델 사용
# llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="moonshotai/kimi-k2-instruct-0905",  # Spring AI와 동일한 모델
    temperature=0.7
)

# 체인 1: 영화 추천 (입력: 장르 → 출력: 영화 제목)
chain1 = prompt1 | llm | StrOutputParser()

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
movie = chain1.invoke({"genre": "Drama"})  # 영화 제목 얻기

print(type(movie))
print(" ===> 추천된 영화:")  # movie 값 출력
print(movie)


<class 'str'>
 ===> 추천된 영화:
드라마 장르라면, _『아이 다니엘 블레이크』(2016)_를 꼭 권하고 싶습니다.  
켄 로치 감독이 연출한 이 작품은 영국 노동계층의 삶을 냉정하면서도 따뜻하게 그려내며, “사람은 일을 하기 위해 사는 게 아니라, 사람답게 살기 위해 일한다”는 메시지를 강렬하게 던집니다. 예산은 적지만, 박장대소와 눈물을 오가는 몇 안 되는 영화죠. 끝 크레디트가 올라가도 한동안 허전함이 가시지 않을 겁니다.


In [12]:
# 체인 2: 줄거리 요약 (입력: 영화 제목 → 출력: 줄거리)
chain2 = (
    {"movie": chain1}  # chain1의 출력을 movie 변수로 전달
    | prompt2
    | llm
    | StrOutputParser()
)
print(chain2)

# 실행: "SF" 장르의 영화 추천 및 줄거리 요약
response = chain2.invoke({"genre": "Drama"})
print("\n🔹 영화 줄거리 요약:\n", response) 

first={
  movie: ChatPromptTemplate(input_variables=['genre'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['genre'], input_types={}, partial_variables={}, template='{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.'), additional_kwargs={})])
         | ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x000001F69A3AC440>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x000001F69A3ADC10>, root_client=<openai.OpenAI object at 0x000001F69A3ADD60>, root_async_client=<openai.AsyncOpenAI object at 0x000001F69A3AC080>, model_name='moonshotai/kimi-k2-instruct-0905', temperature=0.7, model_kwargs={}, openai_api_key=SecretStr('**********'), openai_api_base='https://api.groq.com/openai/v1')
         | StrOutputParser()
} middle=[ChatPromptTemplate(input_variables=['movie'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=PromptTempl

##### chain1과 chain2에서 영화 제목이 일관되게 전달 되도록 변경

In [14]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

from pprint import pprint

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
prompt1 = ChatPromptTemplate.from_template("{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.")

# Step 2: 추천된 영화의 줄거리를 요약
prompt2 = ChatPromptTemplate.from_template("{movie} 추천한 영화의 제목을 먼저 알려주시고, 줄을 바꾸어서 영화의 정보(제목,감독,캐스팅,줄거리)를 알려 주세요.")

# OpenAI 모델 사용
llm = ChatOpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="moonshotai/kimi-k2-instruct-0905",  # Spring AI와 동일한 모델
    temperature=0.7
)

# 체인 1: 영화 추천 (입력: 장르 → 출력: 영화 제목)
chain1 = prompt1 | llm | StrOutputParser()

# 체인 2: 줄거리 요약 (입력: 영화 제목 → 출력: 줄거리)
chain2 = (
    {"movie": chain1}  # chain1의 출력을 movie 변수로 전달
    | prompt2
    | llm
    | StrOutputParser()
)

# 실행: "Drama" 장르의 영화 추천 및 줄거리 요약
response = chain2.invoke({"genre": "Drama"})
print("\n🔹 영화 줄거리 요약:")
pprint(response)


🔹 영화 줄거리 요약:
('버닝\n'
 '\n'
 '버닝  \n'
 '감독: 이창동  \n'
 '출연: 유아인, 전종서, 스티븐 연  \n'
 '줄거리:  \n'
 '빈곤한 청년 종수는 어릴 때 동네를 함께 돌아다녔던 희아를 우연히 만난 뒤, 그녀와 벤이라는 부유하고 신비로운 남자를 알게 된다. 어느 '
 '날 희아는 종수에게 “나는 언제든 사라질 수 있어”라고 말한 뒤 실종되고, 종수는 벤이 그녀를 해쳤을지도 모른다는 불안한 의심에 '
 '빠져든다.')
