### LLM Chain 만들기


## 1. 환경 구성

### 1) 라이브러리 설치

In [None]:
#%pip install -q langchain langchain-openai dotenv

### 2) OpenAI 인증키 설정
https://openai.com/

In [5]:
from dotenv import load_dotenv
import os
# .env 파일을 불러와서 환경 변수로 설정
load_dotenv(dotenv_path='../.env')

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
print(OPENAI_API_KEY[:2])

gs


In [6]:
import langchain
print(langchain.__version__)

0.3.26


## 2. LLM Chain

### 1) Prompt + LLM


In [None]:
from langchain_openai import ChatOpenAI

# model
llm = ChatOpenAI(model="gpt-3.5-turbo-0125")

# chain 실행
result = llm.invoke("인공지능 모델의 학습 원리에 대하여 쉽게 설명해 주세요.")
print(type(result))

In [None]:
print(type(result))
print(result)

In [None]:
print(result.content)

### 2) PromptTemplate + LLM

In [None]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")
prompt

In [None]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-3.5-turbo-0125")

# chain 연결 (LCEL)
chain = prompt | llm
print(type(chain))

# chain 호출
result = chain.invoke({"input": "인공지능 모델의 학습 원리"})
print(type(result))

In [None]:
print(result.content)

### 3) PromptTemplate + LLM(invoke()) + StrOutputParser

In [None]:
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# 1. 컴포넌트 정의
prompt = PromptTemplate.from_template("You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

#llm = ChatOpenAI(model="gpt-3.5-turbo")

llm = ChatOpenAI(
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7)


output_parser = StrOutputParser()

# 2. chain 생성 (LCEL)
chain = prompt | llm | output_parser
print(type(chain))

# 3. chain의 invoke 호출
result = chain.invoke({"input": "인공지능 모델의 학습 원리"})
print(type(result))

<class 'langchain_core.runnables.base.RunnableSequence'>
<class 'str'>


In [9]:
print(result)

인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. 컴퓨터에大量的 데이터를 제공하고, 데이터를 분석하여 패턴을 찾고, 패턴을 기반으로 예측이나 분류를 수행하는 것입니다.

구체적으로는 다음과 같은 과정으로 학습합니다.

1. **데이터 수집**: 인공지능 모델을 학습시키기 위해大量的 데이터를 수집합니다. 이 데이터는 문제에 따라 다르지만, 이미지, 텍스트, 오디오 등 다양한 형태일 수 있습니다.

2. **데이터 전처리**: 수집한 데이터를 분석하기 쉽게 변환하는 과정입니다. 데이터를 정제하고, 필요한 경우 데이터를 변환하거나 특징을 추출합니다.

3. **모델 정의**: 인공지능 모델을 정의합니다. 모델은 데이터로부터 패턴을 학습하고, 예측이나 분류를 수행하는 알고리즘입니다. 신경망, 결정 트리, 서포트 벡터 머신 등 다양한 모델이 있습니다.

4. **학습**: 모델에 데이터를 제공하고, 모델이 데이터를 분석하여 패턴을 학습하도록 합니다. 이 과정에서 모델은 데이터를 통해 파라미터를 조정하며, 최적의 파라미터를 찾습니다.

5. **평가**: 학습된 모델을 평가합니다. 평가 데이터에 모델을 적용하여 성능을 측정하고, 필요에 따라 모델을 조정합니다.

6. **예측 또는 분류**: 학습된 모델을 사용하여 새로운 데이터에 대한 예측이나 분류를 수행합니다.

예를 들어, 이미지 분류 모델을 학습시키는 경우를 생각해 봅시다. 고양이와 강아지의 이미지를 컴퓨터에 제공하고, 컴퓨터는 이미지의 특징을 분석하여 고양이와 강아지를 구분하는 모델을 학습합니다. 이 과정을 통해 컴퓨터는 고양이와 강아지의 패턴을 학습하고, 새로운 이미지가 주어졌을 때 이를 분류할 수 있습니다.

이러한 학습 원리는 다양한 인공지능 모델에 적용되며, 이를 통해 컴퓨터는 데이터를 분석하고, 예측이나 분류를 수행하는 능력을 갖게 됩니다.


### 4) PromptTemplate + LLM(stream()) + StrOutputParser

In [None]:

from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# 1. 컴포넌트 정의
prompt = PromptTemplate.from_template("You are an expert in AI Expert. Answer the question. <Question>: {input}에 대해 쉽게 설명해주세요.")

#llm = ChatOpenAI(model="gpt-3.5-turbo-0125")
llm = ChatOpenAI(
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)


# chain 연결 (LCEL)
chain = prompt | llm | StrOutputParser()

# 스트리밍 출력을 위한 요청
answer = chain.stream({"input": "인공지능 모델의 학습 원리"})
# 스트리밍 출력
#print(answer)

for token in answer:
    # 스트림에서 받은 데이터의 내용을 출력합니다. 줄바꿈 없이 이어서 출력하고, 버퍼를 즉시 비웁니다.
    print(token, end="", flush=True)

인공지능 모델의 학습 원리는 사람의 뇌가 학습하는 원리와 유사합니다. 

1. **데이터 수집**: 우선 인공지능 모델을 학습시키기 위해서는 수많은 데이터가 필요합니다. 

2. **데이터 입력**: 이 데이터를 모델에 입력합니다. 

3. **예측**: 모델은 입력된 데이터를 바탕으로 예측을 수행합니다. 

4. **오차 계산**: 예측 결과와 실제 결과의 차이를 계산합니다. 이를 '오차'라고 합니다. 

5. **모델 업데이트**: 이 오차를 바탕으로 모델을 업데이트합니다. 즉, 모델의 가중치를 조정하여 다음 예측에서는 더 정확한 결과를 얻을 수 있도록 합니다.

6. **반복**: 이 과정을 매우 많은 데이터에 대해 반복 수행합니다. 

이렇게 반복 학습을 통해 모델은 데이터를 분석하고 예측하는 능력을 키우게 됩니다. 

예를 들어, 고양이 사진으로 학습된 모델에게 새로운 고양이 사진을 보여주면, 모델은 이전에 보지 못한 사진이지만 고양이라는 것을 인식할 수 있습니다. 

이처럼 인공지능 모델은 주어진 데이터를 통해 스스로 학습하고, 새로운 상황에 대처하는 능력을 키우는 것입니다.

##### 2) Multiple Chains
* Multi Chain을 활용한 영화 추천 및 줄거리 요약

In [12]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
prompt1 = ChatPromptTemplate.from_template("{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.")

# Step 2: 추천된 영화의 줄거리를 요약
prompt2 = ChatPromptTemplate.from_template("{movie} 추전한 영화의 제목을 먼저 알려주시고, 줄을 바꾸어서 영화의 줄거리를 3문장으로 요약해 주세요.")

# OpenAI 모델 사용
#llm = ChatOpenAI(model="gpt-3.5-turbo-0125")

llm = ChatOpenAI(
    base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
    model="meta-llama/llama-4-scout-17b-16e-instruct",  # Spring AI와 동일한 모델
    temperature=0.7
)

# 체인 1: 영화 추천 (입력: 장르 → 출력: 영화 제목)
chain1 = prompt1 | llm | StrOutputParser()

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
movie = chain1.invoke({"genre": "Drama"})  # 영화 제목 얻기
print(" 추천된 영화:", movie)  # movie 값 출력

 추천된 영화: **'The Pursuit of Happyness'** 

*   **장르**: 드라마/전기
*   **감독**: 가브리엘 뮈지노
*   **출연**: 윌 스미스, 제이든 스미스, 티나 메이저, 줄리언 호프, 브라이언 스테파닉
*   **개봉일**: 2006년 12월 15일
*   **내용**: 크리스 가드너는 성공한 주식 중개인이다. 그러나 갑자기 직장을 잃고, 외아들 크리스토퍼와 함께 노숙자 쉼터에서 살게 된다. 크리스 가드너는 다시 직업을 얻고자 하지만, 쉽지 않다. 크리스 가드너는 크리스토퍼를 위해서라도, 다시 주식 중개인이 되고자 한다.


In [13]:
# 체인 2: 줄거리 요약 (입력: 영화 제목 → 출력: 줄거리)
chain2 = (
    {"movie": chain1}  # chain1의 출력을 movie 변수로 전달
    | prompt2
    | llm
    | StrOutputParser()
)
print(chain2)

# 실행: "SF" 장르의 영화 추천 및 줄거리 요약
response = chain2.invoke({"genre": "Drama"})
print("\n🔹 영화 줄거리 요약:\n", response) 

first={
  movie: ChatPromptTemplate(input_variables=['genre'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['genre'], input_types={}, partial_variables={}, template='{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.'), additional_kwargs={})])
         | ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x00000211FED74B60>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x00000211FE5DFE00>, root_client=<openai.OpenAI object at 0x00000211FED73860>, root_async_client=<openai.AsyncOpenAI object at 0x00000211FE396840>, model_name='meta-llama/llama-4-scout-17b-16e-instruct', temperature=0.7, model_kwargs={}, openai_api_key=SecretStr('**********'), openai_api_base='https://api.groq.com/openai/v1')
         | StrOutputParser()
} middle=[ChatPromptTemplate(input_variables=['movie'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=Pr

##### chain1과 chain2에서 영화 제목이 일관되게 전달 되도록 변경

In [14]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser
import re

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
prompt1 = ChatPromptTemplate.from_template("{genre} 장르에서 추천할 만한 영화를 한 편 알려주세요.")

# Step 2: 추천된 영화의 줄거리를 요약
prompt2 = ChatPromptTemplate.from_template("{movie} 추천한 영화의 제목을 먼저 알려주시고, 줄을 바꾸어서 영화의 줄거리를 3문장으로 요약해 주세요.")

# OpenAI 모델 사용
#llm = ChatOpenAI(model="gpt-3.5-turbo-0125")

# 체인 1: 영화 추천 (입력: 장르 → 출력: 영화 제목)
chain1 = prompt1 | llm | StrOutputParser()

# Step 1: 사용자가 입력한 장르에 따라 영화 추천
movie_response = chain1.invoke({"genre": "Drama"})  # 영화 제목 얻기
print(" 추천된 영화 (원본 응답):", movie_response)

#  영화 제목만 추출 (첫 번째 큰따옴표 안의 문자열 찾기)
match = re.search(r'"(.*?)"', movie_response)
if match:
    movie_title = match.group(1)
else:
    movie_title = movie_response.split(" ")[0]  # 대안으로 첫 번째 단어 사용

print(" 추출된 영화 제목:", movie_title)

# 체인 2: 줄거리 요약 (입력: 영화 제목 → 출력: 줄거리)
chain2 = prompt2 | llm | StrOutputParser()

# 실행: chain1의 출력(영화 제목)을 chain2에 명확히 전달
response = chain2.invoke({"movie": movie_title})
print("\n 영화 줄거리 요약:\n", response)


 추천된 영화 (원본 응답): '올드보이'(Oldboy, 2003)는 대한민국의 드라마 영화입니다. 

박찬욱 감독이 연출하고, 최민식, 유오성, 강혜정 등이 출연합니다.

납치된 지 15년 만에 풀려난 주인공 오대수(최민식 분)는 자신과 가족을 납치한 사람의 정체와 이유를 찾습니다.

그러던 중, 자신과 똑같은 방법으로 15년간 감금된 피해자를 만나면서 진실을 추적하기 시작합니다.

이 영화는 인간의 본성과 복수심에 대한 깊은 탐구를 통해, 인간의 심오한 내면세계를 표현합니다.

'올드보이'는 칸 영화제에서 감독 주연인 최민식이 '최우수 남우주연상'을 수상하는 등, 국내외에서 많은 찬사를 받았습니다.

강렬한 스토리와 연출, 배우들의 연기로 많은 사람들에게 강한 인상을 남긴 영화입니다.
 추출된 영화 제목: '올드보이'(Oldboy,

 영화 줄거리 요약:
 **올드보이**

'올드보이'는 주인공 오대수(최민식 분)가 15년간의 납치와 감금 생활을 겪은 뒤, 자신의 납치범을 찾아 복수하는 내용의 영화입니다. 오대수는 자신이 갇혀 있던 곳에서 탈출한 뒤, 자신의 납치범인 이우진(유해진 분)을 찾아나서고, 이우진은 오대수에게 자신의 비밀을 알려주며 복수를 부추깁니다. 오대수는 이우진에 대한 복수를 위해 여러사람을 죽이면서까지 찾아가는데, 이우진의 비밀은 오대수의  딸과 관련되어 있었습니다.
