### **ChatPromptTemplate**

- ChatPromptTemplate은 대화형 상황에서 여러 메시지 입력을 기반으로 단일 메시지 응답을 생성하는 데 사용. 이는 대화형 모델이나 챗봇 개발에 주로 사용. 입력은 여러 메시지를 원소로 갖는 리스트로 구성되며, 각 메시지는 역할(role)과 내용(content)으로 구성


    - SystemMessage: 시스템의 기능을 설명합니다.
    - HumanMessage: 사용자의 질문을 나타냅니다.
    - AIMessage: AI 모델의 응답을 제공합니다.
    - FunctionMessage: 특정 함수 호출의 결과를 나타냅니다.
    - ToolMessage: 도구 호출의 결과를 나타냅니다.

### **from_template**

In [1]:
from langchain_core.prompts import ChatPromptTemplate, PromptTemplate
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_template('tell me about {input}')

print(prompt.format(input = 'dog'))  # format_messages 사용가능


prompt1 = PromptTemplate.from_template('tell me about {input}')

print(prompt1.format(input = 'dog'))


# ChatPromptTemplate.from_template
# 설명: 이 메서드는 입력된 템플릿(문자열)을 내부적으로 HumanMessage 객체로 변환합니다.
# 의미: 결과적으로 대화 형식의 메시지 리스트가 만들어지고, 모델이 이를 "사람(Human)이 말한 메시지"로 명확히 인식할 수 있도록 구조화됩니다.
# 핵심: 대화 기반 모델(Chat 모델)이 이해하기 쉽게 역할(human)이 태깅된 형태로 전달됩니다.

# PromptTemplate.from_template
# 설명: 이 메서드는 템플릿을 일반 텍스트(문자열)로만 처리합니다.
# 의미: 어떤 역할이나 구조 없이 순수한 텍스트로 남아 있어서, 모델이 이를 특정 역할로 인식하지 않고 그냥 텍스트 입력으로 봅니다.
# 핵심: 주로 텍스트 완성 모델이나 역할 구분이 필요 없는 작업에 적합합니다.

Human: tell me about dog
tell me about dog


### **from_message**

In [37]:
from langchain_groq import ChatGroq

chat_prompt = ChatPromptTemplate.from_messages([
    ("system", "자연어처리의 전문가로서 LLM에 대해서 잘 설명해줄수있는 AI"),
     ('user', "{input}"),
])


messages = chat_prompt.format_messages(input = '자연어처리 4주 공부 코스 만들어줘')

print(messages)

llm = ChatGroq(model = 'gemma2-9b-it')

response = llm.invoke(messages)
response.content

[SystemMessage(content='자연어처리의 전문가로서 LLM에 대해서 잘 설명해줄수있는 AI', additional_kwargs={}, response_metadata={}), HumanMessage(content='자연어처리 4주 공부 코스 만들어줘', additional_kwargs={}, response_metadata={})]


'##  AI 자연어 처리 4주 공부 코스: LLM을 이해하기\n\n**이 코스는 LLM (Large Language Model) 에 대한 이해를 넓히고, 자연어 처리 (NLP) 분야의 기본 지식을 쌓는 것을 목표로 합니다.** \n\n**코스 구성:**\n\n**주차 1: 자연어 처리의 기초**\n\n* **NLP 개념 및 역사:** 자연어 처리란 무엇이며, 왜 중요한가? NLP의 역사와 주요 전환점\n* **텍스트 전처리:** 텍스트 데이터를 NLP 알고리즘에 적합하게 변환하는 방법\n    * 토큰화, 문장 분리, 불필요한 문자 제거, 정규화 등\n* **단어 임베딩:** 단어를 벡터로 표현하는 방법 이해 및 활용\n    * Word2Vec, GloVe, FastText 등\n* **TF-IDF:** 문서에서 단어의 중요도를 측정하는 기법\n\n**주차 2: 기본적인 자연어 처리 알고리즘**\n\n* **텍스트 분류:** 텍스트를 주어진 범주로 분류하는 방법\n    * Naive Bayes, Logistic Regression, Support Vector Machine 등\n* **문서 요약:** 긴 텍스트를 짧은 요약문으로 변환하는 방법\n    * Extractive Summarization, Abstractive Summarization\n* **감정 분석:** 텍스트에서 감정을 인식하는 방법\n    * Lexicon-based Approach, Machine Learning Approach\n* **Named Entity Recognition (NER):** 텍스트에서 사람, 장소, 기관 등을 식별하는 방법\n\n**주차 3: LLM 도입 및 이해**\n\n* **LLM 개념 및 역사:** Transformer, BERT, GPT 등 주요 LLM 모델 이해\n* **LLM 학습 방법:** 훈련 데이터, Fine-tuning, Prompt Engineering\n* **LLM 응용 사례:**\n    * 챗봇, 번역, 질문 답변, 텍스트 생성 

In [42]:
# Chain을 사용할땐 입력값은 딕셔너리 format 사용하지 않음 

from langchain_core.output_parsers import StrOutputParser
from langchain_groq import ChatGroq

chat_prompt = ChatPromptTemplate.from_messages([
    ("system", "자연어처리의 전문가로서 LLM에 대해서 잘 설명해줄수있는 AI"),
     ('user', "{input}"),
])


llm = ChatGroq(model = 'gemma2-9b-it')

parser = StrOutputParser()

chain = chat_prompt | llm | parser


response = chain.invoke({'input' : 'pytorch로 이진 분류 모델 만드는 방법과 코드를 제공해줘'})
print(response)

## LLM에 대한 설명 및 PyTorch로 이진 분류 모델 구현

### 1. LLM (Large Language Model)에 대한 설명

LLM은 방대한 텍스트 데이터를 학습하여 다양한 자연어 처리 작업을 수행할 수 있는 강력한 딥러닝 모델입니다. 

**핵심 특징:**

* **방대한 파라미터:** 수십억 또는 수조 개의 파라미터를 가지고 있어 복잡한 언어 패턴을 학습할 수 있습니다.
* **Transformer 구조:** 주로 Transformer 아키텍처를 기반으로 하여 문맥을 효과적으로 이해하고 처리할 수 있습니다.
* **다양한 작업 수행:** 텍스트 생성, 번역, 요약, 질문 답변, 분류 등 다양한 자연어 처리 작업에 활용됩니다.

**예시:** GPT-3, BERT, LaMDA

### 2. PyTorch로 이진 분류 모델 구현

이진 분류는 주어진 데이터를 두 개의 범주로 분류하는 작업입니다. PyTorch를 사용하여 이진 분류 모델을 구현하는 방법은 다음과 같습니다.

**1. 데이터 준비:**

* 데이터를 레이블(0 또는 1)이 있는 샘플로 구성합니다.
* 데이터를 학습 set, 검증 set, 테스트 set으로 분할합니다.

**2. 모델 정의:**

* PyTorch의 `torch.nn` 모듈을 사용하여 모델을 정의합니다. 간단한 예시로는 다음과 같은 모델을 사용할 수 있습니다.

```python
import torch
import torch.nn as nn

class BinaryClassifier(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(BinaryClassifier, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(hidden_si

In [36]:
# prompt 를 PromptTemplate 객체로 생성합니다.
prompt = PromptTemplate.from_template("{topic} 에 대해 쉽게 설명해주세요.")

chain = prompt | llm

input = {'topic' : '인공지능 모델의 학습 원리'}

chain.invoke(input)

AIMessage(content='인공지능 모델 학습은 사람이 공부하는 것과 비슷하지만, 좀 더 컴퓨터적인 방식이에요. \n\n**1. 데이터 탐험:** \n\n사람이 책이나 경험을 통해 지식을 습득하듯, AI 모델은 **데이터를 통해 학습**합니다. 이 데이터는 텍스트, 이미지, 소리, 숫자 등 여러 형태로 존재할 수 있으며, 모델이 이해하고 분석할 수 있도록 **정리**하는 과정이 필요해요. 예를 들어, 이미지 인식 모델은 수많은 이미지와 그 이미지에 대한 설명(레이블)을 학습합니다.\n\n**2. 패턴 찾기:**\n\n모델은 데이터 속에 숨겨진 **패턴**을 찾아내기 위해 끊임없이 노력합니다. \n\n예를 들어, 이미지 인식 모델은 고양이 사진들을 보면서 "털이 멀고, 귀가 뾰족한", "꼬리가 길고 털갈이를 하는" 등의 패턴을 학습합니다. \n\n**3. 공식 만들기:**\n\n모델은 찾아낸 패턴을 바탕으로 **예측 규칙 (모델)**을 만들어요. \n\n예를 들어, 고양이 이미지 인식 모델은 "털이 멀고, 귀가 뾰족한, 꼬리가 길고 털갈이를 하는" 특징을 가진 이미지는 고양이라고 예측할 수 있는 규칙을 만들어요.\n\n**4. 점검 및 수정:**\n\n만들어진 규칙의 정확도를 **테스트**하고, 틀린 예측을 분석하여 **규칙을 수정**하는 과정을 반복합니다. \n\n이 과정을 통해 모델은 점점 더 정확하고 완벽한 예측 능력을 갖추게 됩니다.\n\n**간단히 말해, AI 모델은 데이터를 통해 패턴을 배우고, 그 패턴을 바탕으로 예측 규칙을 만들고, 꾸준히 점검하며 수정하는 과정을 통해 학습합니다.**\n\n\n', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 483, 'prompt_tokens': 29, 'total_tokens': 512, 'completion_time': 0.878181818, 'prompt_time': 0.002153356, 'queue_ti