# Model IO
- Language Model
- Prompt
- OutputParser

  ### Langchain  Components

  <img src="https://d.pr/i/Wy5B5B+" width="500"/>

In [1]:
!pip install langchain langchain-openai langchain-huggingface langchain-community



In [2]:
from google.colab import userdata
import os
os.environ['LANGSMITH_TRACING'] = userdata.get('LANGSMITH_TRACING')
os.environ['LANGSMITH_ENDPOINT'] = userdata.get('LANGSMITH_ENDPOINT')
os.environ['LANGSMITH_API_KEY'] = userdata.get('LANGSMITH_API_KEY')
os.environ['LANGSMITH_PROJECT'] = userdata.get('LANGSMITH_PROJECT')
os.environ['OPENAI_API_KEY'] = userdata.get('OPENAI_API_KEY')

## Language Models

https://python.langchain.com/api_reference/reference.html#integrations

LangChain의 Integrations 섹션에서는 다양한 다운스트림 LLM 모델과의 연동을 지원하다.

이 섹션에서는 OpenAI, Hugging Face, GPT-4 등의 다양한 LLM 모델과 LangChain을 연결하는 방법을 다룬다.

### OpenAI

In [3]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model_name='gpt-4o')

llm.invoke('태국의 수도는 어디인가요?')

AIMessage(content='태국의 수도는 방콕입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 16, 'total_tokens': 26, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_a288987b44', 'id': 'chatcmpl-Bmvrd326L2epil2CXvdLTdPlV0ghe', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--4ecebeee-74c0-449f-9fb5-b01a3d3b5de4-0', usage_metadata={'input_tokens': 16, 'output_tokens': 10, 'total_tokens': 26, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### huggingface

In [4]:
from langchain_huggingface import HuggingFaceEndpoint, ChatHuggingFace

llm = HuggingFaceEndpoint(
    repo_id = 'microsoft/Phi-3-mini-4k-instruct',
    task='text-generation'
)

chat_model = ChatHuggingFace(
    llm = llm,
    verbose=True
)

chat_model.invoke('프랑스의 수도는 어디인가요?')

AIMessage(content='프랑스의 수도는 크리스마스에 있습니다. 크리스마스는 1294년에 바라며 다크 왕 려몰에서 언명한 나라이름의 도시인물이 있었습니다. 중세에서 혼성시대의 바라멸을 통해 프랑스에서도 정신과 다양한 섬세요. 두세기부터 파티잔치를 위해 기당 수도 구조를 변화시켰습니다. 수도는 현재 서울에 위치하며, 하림와 연체에 따르면 현지서명이 있는 시도였습니다.', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 279, 'prompt_tokens': 25, 'total_tokens': 304}, 'model_name': 'microsoft/Phi-3-mini-4k-instruct', 'system_fingerprint': '3.2.1-sha-4d28897', 'finish_reason': 'stop', 'logprobs': None}, id='run--863a1a3a-dc15-4908-8122-1af2400f9fc6-0', usage_metadata={'input_tokens': 25, 'output_tokens': 279, 'total_tokens': 304})

In [5]:
# from langchain_huggingface import HuggingFacePipeline

# pipe = HuggingFacePipeline.from_model_id(
#     model_id='microsoft/Phi-3-mini-4k-instruct',
#     task='text-generation'
# )

# pipe.invoke('What is LLM?')

### ModelLaboratory
- 여러 LLM을 동시에 비교할 수 있는 실험도구

In [6]:
from langchain.model_laboratory import ModelLaboratory

llms = [
    ChatOpenAI(model_name='gpt-3.5-turbo'),
    ChatOpenAI(model_name='gpt-4.1'),
]

lab = ModelLaboratory.from_llms(llms)
lab.compare('파이썬의 장점이 무엇인가요?')

[1mInput:[0m
파이썬의 장점이 무엇인가요?

client=<openai.resources.chat.completions.completions.Completions object at 0x7f286f4c4710> async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x7f286dd30750> root_client=<openai.OpenAI object at 0x7f286e388250> root_async_client=<openai.AsyncOpenAI object at 0x7f286f4c5610> model_kwargs={} openai_api_key=SecretStr('**********')
[36;1m[1;3m1. 쉬운 학습 곡선: 파이썬은 간결하고 읽기 쉬운 문법을 가지고 있어 학습하기 쉽습니다. 또한, 다양한 자료구조와 내장 함수를 제공하여 프로그래밍을 보다 쉽게 할 수 있습니다.

2. 다양한 라이브러리와 프레임워크: 파이썬은 다양한 라이브러리와 프레임워크를 제공하여 데이터 분석, 인공지능, 웹 개발 등 다양한 분야에서 사용되고 있습니다.

3. 크로스 플랫폼 지원: 파이썬은 Windows, macOS, Linux 등 다양한 운영 체제에서 동일하게 작동하기 때문에 여러 플랫폼에서 사용할 수 있습니다.

4. 커뮤니티 및 생태계: 파이썬은 활발한 개발자 커뮤니티와 다양한 오픈 소스 프로젝트가 존재하여 문제 해결 시 도움을 받을 수 있습니다.

5. 높은 생산성: 파이썬은 다른 언어에 비해 코드를 작성하는 시간이 짧고 빠르기 때문에 빠른 개발이 가능합니다.[0m

client=<openai.resources.chat.completions.completions.Completions object at 0x7f286dd315d0> async_client=<openai.resources.chat.completions.completions.Asyn

## Prompts

https://python.langchain.com/api_reference/core/prompts.html#langchain-core-prompts

`LangChain`의 API 문서에서 제공하는 **Prompts**에 대한 내용은 LangChain 프레임워크의 **핵심 구성 요소 중 하나**로, LLM(Large Language Model)과의 인터페이스를 설정하는 데 중요한 역할을 한다. Prompts는 LLM에 전달될 입력을 정의하고, 구조화하며, 이를 기반으로 원하는 응답을 얻기 위해 사용된다.

**주요 사용처**

1. **자동화된 입력 구성**
   - PromptTemplate을 사용하여 사용자 입력을 자동으로 구성.
   - 동일한 형식의 질문이나 대화를 대량으로 생성 가능.

2. **대화형 응답**
   - ChatPromptTemplate을 통해 대화형 AI의 문맥 유지를 지원.

3. **샘플 기반 학습**
   - Few-shot Prompt는 LLM에 구체적인 예제를 제공해 정확한 응답을 유도.

4. **결과 파싱**
   - Output Parsers를 통해 LLM의 출력을 특정 포맷으로 처리하여 후속 작업을 자동화.


**클래스 계층구조**
```
BasePromptTemplate
├─ PipelinePromptTemplate
├─ StringPromptTemplate
│  ├─ PromptTemplate
│  ├─ FewShotPromptTemplate
│  └─ FewShotPromptWithTemplates
└─ BaseChatPromptTemplate
   ├─ AutoGPTPrompt
   └─ ChatPromptTemplate
      └─ AgentScratchPadChatPromptTemplate

BaseMessagePromptTemplate
├─ MessagesPlaceholder
└─ BaseStringMessagePromptTemplate
   ├─ ChatMessagePromptTemplate
   ├─ HumanMessagePromptTemplate
   ├─ AIMessagePromptTemplate
   └─ SystemMessagePromptTemplate

```

In [7]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model_name='gpt-4o-mini')

llm.invoke("LLM이 뭐에요")

AIMessage(content='LLM은 "Large Language Model"의 약자로, 대규모 언어 모델을 의미합니다. 이러한 모델은 자연어 처리를 위해 설계된 인공지능 시스템으로, 많은 양의 텍스트 데이터를 기반으로 학습하여 언어의 구조, 의미, 패턴 등을 이해하고 생성할 수 있습니다. LLM은 질문에 답하거나, 글을 작성하고, 번역을 하거나, 대화를 나누는 등의 여러 가지 작업에 활용됩니다. 대표적인 예로는 OpenAI의 GPT 시리즈, Google\'s BERT, 그리고 Facebook의 BART 등이 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 124, 'prompt_tokens': 13, 'total_tokens': 137, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BmvyBQ7vHHaLxOHI6xEXQns11rpVu', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--eea2c9a6-b03e-4d5e-91f2-cc41d97baf9a-0', usage_metadata={'input_tokens': 13, 'output_tokens': 124, 'total_tokens': 137, 'input_token_details': {'aud

In [8]:
messages = [
    ('system', '당신은 친절한 초등학생 전용 챗봇입니다. 초딩의 눈높이에 맞게 설명해주세요'),
    ('human', '랭체인이 뭔가요?')
]
llm.invoke(messages)

AIMessage(content='랭체인(RankChain)은 요즘 사람들이 웹에서 정보를 찾는 방법을 더 똑똑하게 만들어 주는 기술이에요. 쉽게 말해서, 여러 가지 정보를 잘 연결해서 필요한 답을 빨리 찾을 수 있도록 도와주는 거예요. 마치 친구와 함께 문제를 해결하는 것처럼요!\n\n그래서 랭체인은 컴퓨터가 정보를 더 잘 이해하고, 우리가 원하는 대답을 더 빠르게 찾아주는 데 도움을 주는 거랍니다. 만약 궁금한 게 있다면, 랭체인을 통해 더 정확한 정보를 쉽게 찾을 수 있을 거예요!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 130, 'prompt_tokens': 47, 'total_tokens': 177, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BmvzrLcJoOnG95TQKat7zuVaIEaGx', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--c76c4e57-80fe-45bb-b9d2-37cf4e0891d8-0', usage_metadata={'input_tokens': 47, 'output_tokens': 130, 'total_tokens': 177, 'input_token_details': {'audio': 0, 'cache_read': 

### PromptTemplete

In [11]:
from langchain import PromptTemplate

# 어떤 상품에 대한 광고문구를 생성

prompt_template = PromptTemplate(
    template='{product}를 홍보하기 위한 신박한 광고문구를 작성해줘',
    input_variables=['product']
)
prompt = prompt_template.format(product='초소형 카메라')
prompt = prompt_template.format(product='냉털용 냉장고')

ai_message = llm.invoke(prompt)
print(ai_message.content)

"당신의 냉장고도 스타일로 가득 채우세요! 💫

🌟 냉털용 냉장고, 이제는 단순한 저장공간이 아닙니다!  
신선함을 지키며, 당신의 개성을 담아주는 멋진 동반자가 되어드립니다.  

✅ 공간 활용의 정수: 컴팩트한 디자인으로 어디에든 잘 어울리며, 세련된 인테리어를 완성해드립니다.  
✅ 모든 식품의 신선함을 지켜주는 최첨단 냉각 기술. 건강한 라이프스타일의 시작!  
✅ eco-friendly 옵션으로 지구를 생각하는 당신을 위한 선택!  

냉털용 냉장고와 함께라면, 신선함과 스타일이 한 자리에! 지금 바로 만나보세요!"


### ChatPromptTemplate

In [16]:
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate
)

system_msg_template = SystemMessagePromptTemplate.from_template("당신은 {domain}분야의 최고의 챗봇입니다.")
human_msg_template = HumanMessagePromptTemplate.from_template("{question}")
chat_template = ChatPromptTemplate.from_messages([
    system_msg_template, human_msg_template
])
prompt = chat_template.format_messages(domain='IT', question='SLM이 뭐야')
print(llm.invoke(prompt).content)

SLM은 "Service Level Management"의 약자로, 서비스 수준 관리를 의미합니다. SLM은 IT 서비스 관리(ITSM)와 관련된 개념으로, 조직이 제공하는 서비스의 품질을 정의하고 유지하기 위한 프로세스와 활동을 포함합니다. 주요 목적은 서비스 제공자와 고객 간의 기대치를 조정하고, 서비스 성과를 측정하며, 이를 지속적으로 개선하는 것입니다.

SLM의 주요 구성 요소는 다음과 같습니다:

1. **서비스 수준 목표(SLAs)**: 서비스 제공에 대한 성과 기준을 명시하는 문서로, 특정 서비스가 충족해야 하는 요구 사항과 기대치를 정의합니다.

2. **서비스 수준 보고서**: 서비스 성과를 정기적으로 검토하고 보고하여 고객과의 투명성을 유지합니다.

3. **서비스 개선 계획**: 고객의 피드백과 성과 데이터를 기반으로, 서비스 수준을 향상시키기 위한 전략과 조치를 마련합니다.

SLM은 고객 만족도를 높이고, 서비스 품질을 유지하며, 비즈니스 목표를 지원하기 위해 필수적인 요소입니다.


In [15]:
prompt = chat_template.format_messages(domain='육아', question='우리 아이가 계속 울어요')
print(llm.invoke(prompt).content)

아이가 계속 우는 것은 부모에게 힘든 상황일 수 있습니다. 아이가 우는 이유는 다양할 수 있으니 몇 가지 점을 확인해 보세요.

1. **배고픔**: 아이가 배고픈 경우가 많습니다. 마지막으로 먹은 시간이 얼마나 되었는지 확인해 보세요.
2. **기저귀**: 기저귀가 더러워져서 불편할 수 있습니다. 기저귀 상태를 체크해 보세요.
3. **피로**: 아이가 너무 피곤해할 수 있습니다. 적절한 수면 시간을 갖고 있는지 확인해 보세요.
4. **불편함**: 옷이 너무 꽉 차거나, 너무 덥거나 추운 환경에 있을 수도 있습니다.
5. **감정적 이유**: 아이가 불안하거나, 안아달라는 기분일 수도 있습니다. 달래주거나 안아주는 것이 도움이 될 수 있습니다.

이 외에도 아이의 특별한 요구나 건강 문제 등도 있을 수 있으니 상황에 따라 적절히 대응해 주세요. 필요하다면 전문가와 상담하는 것도 좋은 방법입니다.


### FewShotPromptTemplate

In [22]:
from langchain.prompts import FewShotPromptTemplate

exmaples = [
    {'q': '2 + 2 = ?', 'a': '4'},
    {'q': '3 + 5 = ?', 'a': '8'}
]

prompt_template = PromptTemplate(
    template='Q: {q}\nA: {a}',
    input_variables=['q', 'a']
)

fewshot_template = FewShotPromptTemplate(
    examples=exmaples,
    example_prompt=prompt_template,
    prefix='다음 수학문제를 풀어주세요(답변은 정답만 출력하세요):',
    suffix='Q: {question} \nA:', # 사용자 입력값
    input_variables=['question']
)

prompt = fewshot_template.format(question='12367 + 345 = ?')
print(prompt)

다음 수학문제를 풀어주세요(답변은 정답만 출력하세요):

Q: 2 + 2 = ?
A: 4

Q: 3 + 5 = ?
A: 8

Q: 12367 + 345 = ? 
A:


In [23]:
print(llm.invoke(prompt).content)

12712


## Output Parsers

https://python.langchain.com/api_reference/langchain/output_parsers.html#module-langchain.output_parsers

LangChain의 Output Parsers는 LLM이 생성한 텍스트 출력을 특정 형식으로 변환하거나 처리하는 데 사용된다. 이는 모델의 응답을 해석하고, 이를 구조화된 데이터로 바꿔 후속 작업에 활용하기 위해 설계되었다. Output Parsers는 LangChain의 응답 처리 워크플로우에서 중요한 역할을 한다.

예를 들어, LLM 응답이 "Name: John, Age: 30"와 같은 텍스트라면, 이를 {"name": "John", "age": 30}과 같은 Python 딕셔너리로 변환 가능.

**사용 목적**
- 모델의 출력을 특정 애플리케이션에 맞게 처리해야 하는 경우가 많음.
- 응답을 해석하는 일관성과 정확성을 높이기 위해 필요.
- 텍스트 기반 응답을 JSON, 리스트 또는 숫자와 같은 특정 포맷으로 변환하여 후속 작업에 활용.

**종류**
1. **BaseOutputParser**: Output Parsers의 기본 클래스, 커스텀 파서 구현 시 사용.  
2. **CommaSeparatedListOutputParser**: 콤마로 구분된 문자열을 리스트로 변환.  
3. **RegexParser**: 정규식을 사용해 특정 패턴을 추출하고 키-값 형태로 반환.  
4. **StructuredOutputParser**: 출력의 JSON 또는 구조화된 형식을 강제.  
5. **PydanticOutputParser**: Pydantic 모델을 기반으로 출력 검증 및 변환.  
6. **MarkdownOutputParser**: 마크다운 형식의 텍스트에서 데이터를 추출.  

### CommaSeparatedListOutputParser

In [24]:
from langchain.output_parsers import CommaSeparatedListOutputParser

model_output = "사과, 바나나, 오렌지, 포도"

output_parser = CommaSeparatedListOutputParser()
output = output_parser.parse(model_output)
output

['사과', '바나나', '오렌지', '포도']

In [27]:
# {야구팀} {5}개 질문
# {축구팀} {10}개 질문

prompt_template = PromptTemplate(
    template="{subject} {n}개의 팀을 보여주세요.\n{format_instruction}",
    input_variables=['subject', 'n'], # 사용자 프롬프트로 채워질 변수
    partial_variables={
        # template 생성시에 채워짐
        'format_instruction': output_parser.get_format_instructions()
    }
)
prompt = prompt_template.format(subject='대한민국 프로야구', n=5) # format 함수때문에 template은 f를 중첩으로 쓰면 안됨
prompt = prompt_template.format(subject='프리미어리그', n=5)
prompt

'프리미어리그 5개의 팀을 보여주세요.\nYour response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`'

In [29]:
ai_message = llm.invoke(prompt)
output = ai_message.content

# 출력 파서가 가공한 최종출력
output = output_parser.parse(output)
output

['맨체스터 유나이티드', '리버풀', '첼시', '맨체스터 시티', '아스날']

In [32]:
chain = prompt_template | llm | output_parser
chain.invoke(input={'subject': '프로농구', 'n':3})

['서울 삼성', '전주 KCC', '인천 전자랜드']

### JSONOutputParser

In [41]:
from langchain_core.output_parsers import JsonOutputParser

model_output = '{"title": "GPT-5를 소개합니다.", "author": "OpenAI", "pages": 250}'

json_parser = JsonOutputParser()
print(json_parser.get_format_instructions())

output = json_parser.parse(model_output) # json_str -> python object(list, dict)
print(output)
print(type(output))

Return a JSON object.
{'title': 'GPT-5를 소개합니다.', 'author': 'OpenAI', 'pages': '250'}
<class 'dict'>


In [45]:
# AI 관련 책 3권을 보여주세요. (json)
json_parser = JsonOutputParser()

prompt_template = PromptTemplate(
    template="{subject} 관련 한국어 {n}개의 책을 보여주세요.\n{format_instruction}",
    input_variables=['subject', 'n'], # 사용자 프롬프트로 채워질 변수
    partial_variables={
        # template 생성시에 채워짐
        'format_instruction': json_parser.get_format_instructions()
    }
)

llm = ChatOpenAI(model_name='gpt-4o-mini')

prompt = prompt_template.format(subject='AI', n=3) # format 함수때문에 template은 f를 중첩으로 쓰면 안됨

ai_message = llm.invoke(prompt)
output = ai_message.content

# 출력 파서가 가공한 최종출력
output = json_parser.parse(output)
print(output)

# 요리 관련 책 5권을 보여주세요. (json)
# PromptTemplate - LLM - JsonOutputParser

{'books': [{'title': '인공지능의 기초', 'author': '김성훈', 'publisher': '한빛미디어', 'year': 2020}, {'title': 'AI, 인공지능: 생각의 기초', 'author': '홍길동', 'publisher': '미래엔', 'year': 2021}, {'title': '데이터 과학과 인공지능', 'author': '이재홍', 'publisher': '길벗', 'year': 2022}]}


In [46]:
chain = prompt_template | llm | json_parser
ouput = chain.invoke(input={'subject':'AI', 'n':3})
print(output)

{'books': [{'title': '인공지능의 기초', 'author': '김성훈', 'publisher': '한빛미디어', 'year': 2020}, {'title': 'AI, 인공지능: 생각의 기초', 'author': '홍길동', 'publisher': '미래엔', 'year': 2021}, {'title': '데이터 과학과 인공지능', 'author': '이재홍', 'publisher': '길벗', 'year': 2022}]}


In [None]:
#복잡한 작업을 단순하게, 파이프라인처럼 연결해서 처리할 수 있다
from langchain.prompts import PromptTemplate
from langchain.chat_models import ChatOpenAI
from langchain.output_parsers import JsonOutputParser

prompt_template = PromptTemplate.from_template("Tell me {n} facts about {subject}.")
llm = ChatOpenAI()
json_parser = JsonOutputParser()

chain = prompt_template | llm | json_parser

output = chain.invoke({"subject": "AI", "n": 3})
print(output)