## Chapter07 모델

### 01 RAG에서 LLM의 역할과 모델의 종류

- LLM을 교체하는 주된 이유는 비용과 성능, 사용 편의성, 보안 문제
- GPT-4는 답변 수준이 높고 성능이 우수하지만 유료이므로 추론이 많아질수록 과금 부담이 커질 수 있다
  - 클라우드 기반이므로 사용자의 입력 데이터가 외부 서버로 전송되어 처리되므로 민감한 정보가 유출될 우려
- Llama 같은 무료 모델을 활용할 경우 비용 부담이 낮다
  - 오픈소스 모델은 로컬 환경에서 사용이 가능해 데이터가 외부로 전송되지않아 보안 측면에서 유리
  - 하지만 오픈 소스 모델의 성능은 상대적으로 떨어진다
- 오픈 소스 모델을 쓰려면 고성능 장비가 필요하며, 없을 경우에는 클라우드 서비스를 이용해 무료 모델을 올려서 RAG 시스템에 적용 가능
  - 사용량이 많거나 동시 접속자가 많은 경우에는 오픈소스 모델을 클라우드 인스턴스로 배포하는 것도 좋은 선택

### 02 다양한 LLM 활용 방법과 API 키 가져오기

In [1]:
from dotenv import load_dotenv
from langchain_teddynote import logging

load_dotenv()
logging.langsmith('CH04-Models')

LangSmith 추적을 시작합니다.
[프로젝트명]
CH04-Models


**OpenAI 모델**
- temperature: 생성되는 텍스트의 다양성을 제어하는 매개변수
  - 낮은 값(예: 0.2)은 더 결정적이고 일관된 출력을 생성
  - 높은 값(예: 0.8)은 더 창의적이고 다양한 출력을 생성
- max_tokens: 생성되는 텍스트의 최대 길이를 토큰 단위로 지정
- model_name: 사용할 OpenAI 모델의 이름을 지정
- **모델 스펙** 링크: https://platform.openai.com/docs/models

In [2]:
from langchain_openai import ChatOpenAI
from langchain_teddynote.messages import stream_response
# ChatOpenAI 객체를 생성합니다.
gpt = ChatOpenAI(
    temperature=0,
    model_name="gpt-4.1-mini",  # 모델명
)

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = gpt.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)


A module that was compiled using NumPy 1.x cannot be run in
NumPy 2.4.1 as it may crash. To support both 1.x and 2.x
versions of NumPy, modules must be compiled with NumPy 2.0.
Some module may need to rebuild instead e.g. with 'pybind11>=2.12'.

If you are a user of the module, the easiest solution will be to
downgrade to 'numpy<2' or try to upgrade the affected module.
We expect that some modules will need time to support NumPy 2.

Traceback (most recent call last):  File "<frozen runpy>", line 198, in _run_module_as_main
  File "<frozen runpy>", line 88, in _run_code
  File "/Users/user/Library/Caches/pypoetry/virtualenvs/langchain-kr-1B5rchLC-py3.11/lib/python3.11/site-packages/ipykernel_launcher.py", line 18, in <module>
    app.launch_new_instance()
  File "/Users/user/Library/Caches/pypoetry/virtualenvs/langchain-kr-1B5rchLC-py3.11/lib/python3.11/site-packages/traitlets/config/application.py", line 1075, in launch_instance
    app.start()
  File "/Users/user/Library/Caches/pypoe

사랑은 매우 복잡하고 다면적인 감정이자 경험입니다. 사람마다 사랑을 느끼고 표현하는 방식이 다르지만, 일반적으로 사랑은 깊은 애정, 관심, 배려, 그리고 연결감을 포함합니다. 사랑은 가족, 친구, 연인, 또는 자신에 대한 감정일 수 있으며, 상대방의 행복을 진심으로 바라고 함께 성장하고자 하는 마음에서 비롯됩니다.

철학자나 심리학자들은 사랑을 다양한 관점에서 설명해 왔는데, 예를 들어:

- **애정과 친밀감**: 서로에 대한 깊은 이해와 신뢰를 바탕으로 한 감정.
- **헌신과 책임감**: 상대방을 위해 노력하고 지지하는 마음.
- **열정과 끌림**: 강한 감정적, 신체적 끌림.

사랑은 때로 기쁨과 행복을 주지만, 때로는 어려움과 고통도 동반할 수 있습니다. 하지만 많은 사람들은 사랑을 통해 삶의 의미와 가치를 발견한다고 느낍니다.

혹시 더 구체적으로 알고 싶은 사랑의 종류나 측면이 있나요?

**Claude 모델**

- AI 안정성 및 연구에 중점을 두고 있으며, 성능이 GPT와 버금가거나 일부 벤치마크에서는 더 뛰어난 모델로 평가
- 가성비를 따지면 Haiku, 성능 중시하면 Opus
- **API 키 발급**: [https://console.anthropic.com/settings/keys](https://console.anthropic.com/settings/keys)
- **모델 리스트**: [https://docs.anthropic.com/en/docs/about-claude/models](https://docs.anthropic.com/en/docs/about-claude/models)


In [3]:
from langchain_anthropic import ChatAnthropic

# ChatAnthropic 객체를 생성합니다.
anthropic = ChatAnthropic(model_name="claude-3-5-sonnet-20241022")

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = anthropic.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)

BadRequestError: Error code: 400 - {'type': 'error', 'error': {'type': 'invalid_request_error', 'message': 'Your credit balance is too low to access the Anthropic API. Please go to Plans & Billing to upgrade or purchase credits.'}, 'request_id': 'req_011CXxkHcePL6y65EtbcHVPe'}

**Deepseek 모델**

- 효율적인 연산과 비용 절감을 목표로 설계된 대규모 언어 모델
- DeepSeek-R1은 V3를 기반으로 수학, 과학, 코딩 등 고도의 추론 능력을 강화한 모델. 고급 추론 능력에서 두각
- **API 키 발급**: https://platform.deepseek.com/api_keys
- **모델 리스트**: https://api-docs.deepseek.com/quick_start/pricing

In [4]:
from langchain_deepseek import ChatDeepSeek
deepseek = ChatDeepSeek(model="deepseek-chat")
answer = deepseek.stream("사랑이 뭔가요?")
stream_response(answer)

APIStatusError: Error code: 402 - {'error': {'message': 'Insufficient Balance', 'type': 'unknown_error', 'param': None, 'code': 'invalid_request_error'}}

**Cohere 모델**

- 한글 임베딩과 리랭커 성능이 우수한 모델
- 기업용으로 최적화된 Command R+와 오픈소스 다국어 LLM Aya

In [7]:
from langchain_cohere import ChatCohere

cohere = ChatCohere(temperature=0)
answer = cohere.stream("사랑이 뭔가요?")
stream_response(answer)

ImportError: cannot import name 'format_tool_to_openai_function' from 'langchain_core.utils.function_calling' (/Users/user/Library/Caches/pypoetry/virtualenvs/langchain-kr-1B5rchLC-py3.11/lib/python3.11/site-packages/langchain_core/utils/function_calling.py)

# Upstage

- Upstage는 인공지능(AI) 기술, 특히 대규모 언어 모델(LLM)과 문서 AI 분야에 특화된 국내 스타트업

## 주요 제품 및 기술

### Solar LLM
- **주요 특징**: Upstage의 주력 대규모 언어 모델로, 빠른 성능과 비용 효율성으로 주목
- **기술적 접근**: Depth-Up Scaling (DUS) 기술을 적용하여 성능을 극대화
- **플랫폼 통합**: Amazon SageMaker JumpStart 등 다양한 플랫폼을 통해 API로 통합 제공

### Document AI Pack
- **기능**: OCR 기술을 기반으로 한 문서 처리 솔루션으로, 복잡한 문서에서 필요한 내용을 정확히 추출하고 디지털

### AskUp Seargest
- **특징**: 개인화된 검색 및 추천 서비스를 제공하며, 기존의 ChatGPT 통합 무료 챗봇 AskUp의 업그레이드 버전

## API 키 발급
API 키 발급은 [여기](https://console.upstage.ai/api-keys)에서 가능
