# 다양한 LLM 모델 활용

In [1]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

True

In [2]:
# LangSmith 추적을 설정합니다. https://smith.langchain.com
# !pip install langchain-teddynote
from langchain_teddynote import logging
from langchain_teddynote.messages import stream_response

# 프로젝트 이름을 입력합니다.
logging.langsmith("CH04-Models")

LangSmith 추적을 시작합니다.
[프로젝트명]
CH04-Models


## OpenAI

### 개요
OpenAI는 채팅 전용 Large Language Model (LLM)을 제공합니다. 이 모델을 생성할 때 다양한 옵션을 지정할 수 있으며, 이러한 옵션들은 모델의 동작 방식에 영향을 미칩니다.

### 옵션 상세 설명

`temperature`

- 샘플링 온도를 설정하는 옵션입니다. 값은 0과 2 사이에서 선택할 수 있습니다. 높은 값(예: 0.8)은 출력을 더 무작위하게 만들고, 낮은 값(예: 0.2)은 출력을 더 집중되고 결정론적으로 만듭니다.

`max_tokens`

- 채팅 완성에서 생성할 토큰의 최대 개수를 지정합니다. 이 옵션은 모델이 한 번에 생성할 수 있는 텍스트의 길이를 제어합니다.

`model_name`

- 적용 가능한 모델을 선택하는 옵션입니다. 더 자세한 정보는 [OpenAI 모델 문서](https://platform.openai.com/docs/models)에서 확인할 수 있습니다.


**모델 스펙**

- 링크: https://platform.openai.com/docs/models/gpt-4o

| Model Name           | Description                                                                                                     | Context Length | Training Data      |
|----------------------|-----------------------------------------------------------------------------------------------------------------|----------------|--------------------|
| gpt-4o               | 새로운 GPT-4o: GPT-4 터보보다 저렴하고 빠른 최신 다중모드 플래그십 모델입니다.                                      | 128,000 tokens | Up to Oct 2023     |
| gpt-4-turbo          | 최신 GPT-4 터보 모델로, 비전 기능이 포함되어 있습니다. JSON 모드와 기능 호출을 사용할 수 있습니다.                | 128,000 tokens | Up to Dec 2023     |
| gpt-4                | 최신 GPT-4 모델입니다.                                             | 8,192 tokens   | Up to Sep 2021     |
| gpt-3.5-turbo-0125   | 최신 GPT-3.5 터보 모델로, 요청된 형식에 따라 더 정확하게 응답하며 비영어 언어 기능 호출에 관한 텍스트 인코딩 문제를 해결합니다. | 16,385 tokens  | Up to Sep 2021     |
| gpt-3.5-turbo        | 현재 gpt-3.5-turbo-0125를 가리킵니다.                                                                           | 16,385 tokens  | Up to Sep 2021     |


In [3]:
from langchain_openai import ChatOpenAI

# ChatOpenAI 객체를 생성합니다.
gpt = ChatOpenAI(
    temperature=0,
    model_name="gpt-4o",  # 모델명
)

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = gpt.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)

사랑은 매우 복잡하고 다면적인 감정으로, 사람마다 다르게 정의될 수 있습니다. 일반적으로 사랑은 깊은 애정, 헌신, 그리고 상호 존중을 포함하는 감정입니다. 사랑은 여러 형태로 나타날 수 있습니다:

1. **로맨틱한 사랑**: 연인 간의 깊은 애정과 열정을 포함하는 감정입니다.
2. **가족 사랑**: 부모와 자식, 형제자매 간의 무조건적인 사랑과 보호 본능을 포함합니다.
3. **우정**: 친구 간의 신뢰와 상호 존중을 바탕으로 한 사랑입니다.
4. **자기 사랑**: 자신을 존중하고 돌보는 감정입니다.
5. **이타적인 사랑**: 다른 사람을 돕고자 하는 무조건적인 사랑입니다.

사랑은 기쁨과 행복을 가져다줄 수 있지만, 때로는 고통과 슬픔을 동반하기도 합니다. 사랑은 인간 관계의 중요한 요소로, 우리의 삶에 깊은 영향을 미칩니다.

# Anthropic

Anthropic은 인공지능(AI) 안전성과 연구에 중점을 둔 미국의 스타트업 기업입니다. 주요 정보는 다음과 같습니다:

- **설립 연도**: 2021년
- **위치**: 미국 샌프란시스코
- **창립자**: OpenAI 출신 직원들 (Daniela Amodei와 Dario Amodei 등)
- **기업 형태**: 공익기업(Public Benefit Corporation)으로 등록

## Claude

Claude는 Anthropic의 대표적인 대규모 언어 모델(LLM) 제품군입니다. 

- **API 키 발급**: [https://console.anthropic.com/settings/keys](https://console.anthropic.com/settings/keys)
- **모델 리스트**: [https://docs.anthropic.com/en/docs/about-claude/models](https://docs.anthropic.com/en/docs/about-claude/models)


![](images/anthropic.png)

| model_name     | model                                   | Anthropic API                           | AWS Bedrock                            | GCP Vertex AI                 |
|----------------|-----------------------------------------|-----------------------------------------|----------------------------------------|-------------------------------|
| Claude 3.5 Opus   | 연말 출시 예정                           | 연말 출시 예정                           | 연말 출시 예정                           | 연말 출시 예정                 |
| Claude 3.5 Sonnet | claude-3-5-sonnet-20240620              | anthropic.claude-3-5-sonnet-20240620-v1:0 | c1aude-3-5-sonnet@20240620              | claude-3-5-sonnet@20240620     |
| Claude 3.5 Haiku  | 연말 출시 예정                           | 연말 출시 예정                           | 연말 출시 예정                           | 연말 출시 예정                 |
| Claude 3 Opus     | claude-3-opus-20240229                  | anthropic.claude-3-opus-20240229-v1:0    | c1aude-3-opus@20240229                  | claude-3-opus@20240229         |
| Claude 3 Sonnet   | claude-3-sonnet-20240229                | anthropic.claude-3-sonnet-20240229-v1:0  | c1aude-3-sonnet@20240229                | claude-3-sonnet@20240229       |
| Claude 3 Haiku    | claude-3-haiku-20240307                 | anthropic.claude-3-haiku-20240307-v1:0   | c1aude-3-haiku@20240307                 | claude-3-haiku@20240307        |

In [None]:
from langchain_anthropic import ChatAnthropic

# ChatAnthropic 객체를 생성합니다.
anthropic = ChatAnthropic(model_name="claude-3-5-sonnet-20240620")

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = anthropic.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)

# Cohere

Cohere는 기업용 인공지능 솔루션을 제공하는 선도적인 AI 기업으로, 대규모 언어 모델(LLM)을 개발하여 기업들이 AI 기술을 쉽게 도입하고 활용할 수 있도록 돕고 있습니다.

## Cohere 개요

- **설립연도**: 2020년
- **주요 투자자**: Inovia Capital, NVIDIA, Oracle, Salesforce Ventures
- **시리즈 C 펀딩**: 2억 7000만 달러 유치
- **기업 미션**: 기업용 AI 플랫폼 제공

## 주요 제품

### Command R+

Command R+는 기업용으로 최적화된 Cohere의 최신 LLM입니다. 

#### 주요 특징

- **긴 컨텍스트 윈도우**: 128k 토큰 지원
- **고급 RAG 기능**: 검색 강화 생성 기능 제공
- **다국어 지원**: 10개 주요 비즈니스 언어 지원
- **자동화 도구 사용 기능**: 복잡한 비즈니스 프로세스 자동화

### Aya

Aya는 Cohere의 비영리 연구소인 Cohere for AI에서 개발한 오픈소스 다국어 LLM입니다. 

#### 주요 특징

- **언어 지원**: 101개 언어 지원 (기존 오픈소스 모델의 두 배 이상)
- **훈련 데이터셋**: 5억 1300만 개의 데이터 포인트 포함하는 대규모 다국어 훈련 데이터셋 공개


In [None]:
from langchain_cohere import ChatCohere

# ChatCohere 객체를 생성합니다.
cohere = ChatCohere(temperature=0)

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = cohere.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)

# Upstage

Upstage는 인공지능(AI) 기술, 특히 대규모 언어 모델(LLM)과 문서 AI 분야에 특화된 국내 스타트업입니다.

## 주요 제품 및 기술

### Solar LLM
- **주요 특징**: Upstage의 주력 대규모 언어 모델로, 빠른 성능과 비용 효율성으로 주목받고 있습니다.
- **기술적 접근**: Depth-Up Scaling (DUS) 기술을 적용하여 성능을 극대화합니다.
- **플랫폼 통합**: Amazon SageMaker JumpStart 등 다양한 플랫폼을 통해 API로 통합 제공됩니다.

### Document AI Pack
- **기능**: OCR 기술을 기반으로 한 문서 처리 솔루션으로, 복잡한 문서에서 필요한 내용을 정확히 추출하고 디지털화합니다.

### AskUp Seargest
- **특징**: 개인화된 검색 및 추천 서비스를 제공하며, 기존의 ChatGPT 통합 무료 챗봇 AskUp의 업그레이드 버전입니다.

## API 키 발급
API 키 발급은 [여기](https://console.upstage.ai/api-keys)에서 가능합니다.


In [6]:
from langchain_upstage import ChatUpstage

# ChatUpstage 객체를 생성합니다.
upstage = ChatUpstage()

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = upstage.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)

AuthenticationError: Error code: 401 - {'message': 'Unauthorized'}

## Xionic

사이오닉에이아이(Sionic AI)는 대한민국의 유망한 인공지능 스타트업으로, 기업용 생성형 AI 솔루션을 개발하고 있습니다. 다음은 이 회사에 대한 주요 정보입니다:

### 주요 제품

1. **STORM Platform**: 기업이 생성형 AI를 기술적 고민 없이 바로 적용할 수 있도록 하는 플랫폼
2. **STORM Answer**: 기업에 최적화된 생성형 AI 솔루션으로 비즈니스 생산성 향상을 목표로 함
3. **Xionic**: 상업적 이용이 가능한 라이센스의 한국어 AI 모델

상업적 이용이 가능한 라이센스의 한국어 모델

- 링크: https://github.com/sionic-ai/xionic

In [None]:
from langchain_openai import ChatOpenAI

# xionic = ChatOpenAI(
#     model_name="xionic-1-72b-20240610",
#     base_url="https://sionic.chat/v1/",
#     api_key="934c4bbc-c384-4bea-af82-1450d7f8128d",
# )

# 2024. 08. 06 llama3.1 업데이트
xionic = ChatOpenAI(
    model_name="llama-3.1-xionic-ko-70b",
    base_url="http://sionic.tech:28000/v1",
    api_key="934c4bbc-c384-4bea-af82-1450d7f8128d",
)

# 스트리밍 출력을 위하여 invoke() 대신 stream()을 사용합니다.
answer = xionic.stream("사랑이 뭔가요?")

# 답변 출력
stream_response(answer)

# LogicKor

LogicKor는 한국어 언어 모델의 다분야 사고력을 평가하기 위해 만들어진 벤치마크 리더보드입니다.

## 목적

한국어 언어 모델의 다양한 분야에서의 사고력을 측정하는 벤치마크

## 평가 영역

- 한국어 추론
- 수학
- 글쓰기
- 코딩
- 이해력

## 주요 특징

1. **다양한 모델 평가**: 국내외 다양한 언어 모델들의 성능을 비교할 수 있음
2. **객관적 성능 측정**: 모델의 실제 성능을 다각도로 평가하여 객관적인 지표 제공
3. **오픈 소스**: 누구나 접근하고 결과를 확인할 수 있는 오픈 플랫폼

LogicKor 리더보드는 한국어 AI 모델의 발전을 위한 중요한 도구로 자리잡고 있으며, 지속적인 개선과 발전이 기대되고 있습니다.

- 링크: [LogicKor 리더보드](https://lk.instruct.kr/)
