# Langchain은 다양한 LLM 모델을 지원한다.

- 대규모 언어 모델(LLM) 개발 회사들은 사용자들이 자신의 애플리케이션에서 LLM 모델을 손쉽게 활용할 수 있도록 API(Application Programming Interface) 서비스를 제공하고 있다.
- 각 LLM은 API를 호출 library를 제공하고 있다. 그런데 개발자 입장에서는 같은 작업을 하는데 LLM에 따라 다른 코드를 사용해야하는 어려움이 있다.
- Langchain은  다양한 LLM의 API 호출할 수 있도록 지원한다.
    - 여러 LLM 사용을 같은 interface를 사용해 호출 할 수있게 하여 특정 모델에 종속되지 않으며,  필요에 따라 쉽게 교체할 수 있다. 
    - Langchain 지원 LLM 모델: https://python.langchain.com/docs/integrations/chat/#featured-providers

## 설치
```bash
pip install langchain langchain_core langchain-community  -qU
pip install python-dotenv -qU 
pip install ipywidgets -qU
```

In [1]:
%pip install langchain langchain_core langchain-community  -qU

Note: you may need to restart the kernel to use updated packages.


In [2]:
%pip install python-dotenv -qU 

Note: you may need to restart the kernel to use updated packages.


In [3]:
%pip install ipywidgets -qU

Note: you may need to restart the kernel to use updated packages.


# OpenAI 모델 사용
- https://platform.openai.com
  
## 결제
1. 로그인 후 Billing 페이지로 이동.
   - setting -> Billing
  
   ![openai_payment.png](figures/openai_payment.png)

2. Payment methods 탭을 선택하고 카드를 등록한다. 
   
   ![openai_payment2.png](figures/openai_payment2.png)

   - 등록이 끝나면 최초 구매를 진행한다. $5 ~ $100 사이의 금액을 선택할 수 있다.
   - 자동 충전을 설정하고 싶다면 automatic recharge 를 활성화 하고 아래 추가 설정에 입력한다. 
     - 자동 충전은 특정 금액 이하로 떨어지면 자동으로 충전한다. (**비활성화**) 
  
   ![openai_payment3.png](figures/openai_payment3.png)
   
3. 수동으로 **추가 결제하기**
   - Billing 페이지의 Overview에서 `Add to credit balance` 를 클릭한 뒤 금액을 입력하고 결제한다.

## API Key 생성
  
![openai_create_apikey.png](figures/openai_create_apikey.png)

- 1. 로그인 -> 2. Dashboard -> 3. API Keys -> 4. Create New Secreat Key

## API Key 등록
- 환경변수에 등록
  - 변수이름: OPENAI_API_KEY
  - 값: 생성된 키
- dotenv를 이용해서 load
  - Working directory에  `.env` 파일 생성하고 `OPENAI_API_KEY=생성된키` 추가한다.
  - load_dotenv() 호출 하면 .env 파일에 있는 환경변수를 로드한다.

## OpenAI LLM 모델들
-  https://platform.openai.com/docs/models
-  모델별 가격: https://openai.com/api/pricing/
-  토큰사이즈 확인: https://platform.openai.com/tokenizer
   -  1토큰: 영어 3\~4글자 정도, 한글: 대략 1\~2글자 정도
   -  모델이 업데이트 되면서 토큰 사이즈도 조금씩 커지고 있다.
-  2024/11 현재 **gpt-4o-mini** 가 성능 대비 가장 저렴하다. (100만 토큰당 $0.15)

## OpenAI 를 연동하기 위한 package 설치
```bash
pip install openai -qU
pip install langchain-openai -qU
```

In [1]:
%pip install langchain-openai -qU

Note: you may need to restart the kernel to use updated packages.


## OpenAI Library 를 이용한 API 호출

In [1]:
import openai #langchain-openai 설치시 같이 설치됨.
from dotenv import load_dotenv # API 키들을 환경 변수로 등록.

load_dotenv()  
# working directory의 `.env` 에 작성된 환경변수들을 읽어서 os 환경변수로 등록

True

In [6]:
import os
os.environ['OPENAI_API_KEY'] # 환경변수 조회
os.getenv('Path')

'C:\\Users\\Playdata\\miniconda3\\envs\\langchain;C:\\Users\\Playdata\\miniconda3\\envs\\langchain\\Library\\mingw-w64\\bin;C:\\Users\\Playdata\\miniconda3\\envs\\langchain\\Library\\usr\\bin;C:\\Users\\Playdata\\miniconda3\\envs\\langchain\\Library\\bin;C:\\Users\\Playdata\\miniconda3\\envs\\langchain\\Scripts;C:\\Users\\Playdata\\miniconda3\\envs\\langchain\\bin;C:\\Users\\Playdata\\miniconda3\\condabin;C:\\WINDOWS\\system32;C:\\WINDOWS;C:\\WINDOWS\\System32\\Wbem;C:\\WINDOWS\\System32\\WindowsPowerShell\\v1.0;C:\\WINDOWS\\System32\\OpenSSH;C:\\Program Files\\Git\\cmd;C:\\Program Files\\Bandizip;C:\\Program Files\\Graphviz\\bin;C:\\Users\\Playdata\\miniconda3;C:\\Users\\Playdata\\miniconda3\\Library\\mingw-w64\\bin;C:\\Users\\Playdata\\miniconda3\\Library\\usr\\bin;C:\\Users\\Playdata\\miniconda3\\Library\\bin;C:\\Users\\Playdata\\miniconda3\\Scripts;C:\\Users\\Playdata\\AppData\\Local\\Microsoft\\WindowsApps;C:\\Users\\Playdata\\AppData\\Local\\Programs\\Microsoft VS Code\\bin;C:\\U

In [2]:
# OpenAI Lib를 이용해서 GPT-4o-mini 모델에 질의
from openai import OpenAI

client = OpenAI() # 환경변수에 API 키가 등록안 되있으면 직접 넣어서 생성.
response = client.chat.completions.create(
    model="gpt-4o-mini", # 사용할 모델 종류 선택
    messages=[
        {"role":"user", "content":"OpenAI의 LLM 모델에 대해 설명해줘."}
    ]
)
# {"role":"채팅 주체", "content":"LLM에 전달할 내용을 text로 작성."}

In [9]:
response

ChatCompletion(id='chatcmpl-AZvLDV8iVqSKyRrwMm29Lc4Gni2PZ', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='OpenAI의 LLM(대규모 언어 모델)은 자연어 처리(NLP) 작업을 수행하기 위해 설계된 인공지능 모델입니다. 이러한 모델들은 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성하는 능력을 갖추고 있습니다. 여기에는 GPT(Generative Pre-trained Transformer) 시리즈가 포함되며, 이들 모델은 다음과 같은 특징을 가지고 있습니다.\n\n1. **Transformer 아키텍처**: LLM은 일반적으로 Transformer 아키텍처를 기반으로 하며, 이는 셀프 어텐션 메커니즘을 통해 단어 간의 관계를 효과적으로 모델링할 수 있게 해줍니다.\n\n2. **사전 학습 및 미세 조정**: LLM은 학습 과정에서 먼저 대량의 데이터로 사전 학습을 수행한 후, 특정 작업에 맞게 미세 조정됩니다. 이 단계에서 모델은 특정 도메인이나 작업에 필요한 추가 정보로 트레이닝을 받습니다.\n\n3. **다양한 응용 프로그램**: OpenAI의 LLM은 텍스트 생성, 질문 응답, 번역, 요약, 감정 분석 등 다양한 작업에 활용될 수 있습니다. 이는 매우 유연하고 범용적인 특성 덕분입니다.\n\n4. **상호작용성**: 이 모델들은 자연어로 사용자가 입력한 질문이나 명령에 대해 응답할 수 있으며, 대화형 AI 시스템에서도 널리 사용됩니다.\n\n5. **훈련 데이터의 다양성**: LLM은 다양한 출처의 텍스트 데이터를 사용하여 훈련되기 때문에, 광범위한 주제에 대한 지식을 내재하고 있습니다. 그러나 모델은 최신 정보나 전문적인 지식에 대해 제한적일 수 있습니다.\n\n6. **윤리적 고려사항**: OpenAI는 LLM의 사용에 있어 윤리적 문제를 고려하고 있으며

In [3]:
print(response.choices[0].message.content)

OpenAI의 LLM(대형 언어 모델)은 자연어 처리(NLP) 분야에서 활용되는 인공지능 모델로, 대량의 텍스트 데이터를 기반으로 학습하여 인간과 유사한 방식으로 언어를 이해하고 생성할 수 있습니다. 이러한 모델은 다음과 같은 특징을 가지고 있습니다:

1. **아키텍처**: 대부분의 OpenAI LLM은 변환기(Transformer) 아키텍처를 기반으로 합니다. 이 구조는 문맥을 이해하고 단어 간의 관계를 파악하는 데 매우 효과적입니다.

2. **사전 학습과 미세 조정**: LLM은 대량의 텍스트 데이터를 통해 사전 학습(pre-training)된 후, 특정 작업에 맞게 미세 조정(fine-tuning)될 수 있습니다. 이렇게 함으로써 다양한 응용 분야(예: 번역, 요약, 질문 응답 등)에 적합하게 조정할 수 있습니다.

3. **비지도 학습**: LLM은 비지도 방식으로 학습합니다. 즉, 레이블이 없는 데이터에서 패턴을 학습하고, 이를 통해 언어의 구조와 의미를 파악합니다.

4. **다양한 응용**: LLM은 텍스트 생성, 대화형 AI, 코드 작성, 콘텐츠 생성 등 다양한 분야에서 활용되고 있습니다. 이를 통해 보다 자연스럽고 일관된 대화형 시스템을 만들 수 있습니다.

5. **제한점**: LLM은 정보의 정확성, 편향성, 그리고 문화적 맥락에 대한 이해가 부족할 수 있습니다. 또한, 모델의 크기가 크기 때문에, 처리 시간과 자원 소모가 크다는 단점이 있습니다.

OpenAI의 최신 모델들은 성능과 능력이 지속적으로 향상되고 있으며, 이러한 발전은 연구자들과 개발자들이 보다 정교한 AI 시스템을 구축하는 데 기여하고 있습니다.


## Langchain을 이용한 OpenAI API 호출

- **ChatOpenAI**
    - chat (대화-채팅) 기반 모델 model.
    - Default 로 gpt-3.5-turbo 사용
    - llm 전달 입력과 llm 응답 출력 타입:  Message
- **OpenAI**
    - 문장 완성 모델. (text completion) model
    - Default로 gpt-3.5-turbo-instruct 사용
      - instruct 모델만 사용가능
    - llm전달 입력과 llm 응답 출력 타입: str
- Initializer 주요 파라미터
    -  **temperature**
        -  llm 모델의 출력 무작위성을 지정한다. 
        -  0 ~ 2 사이 실수를 설정하며 클 수록 무작위성이 커진다. 기본값: 0.7
        -  정확한 답변을 얻어야 하는 경우 작은 값을 창작을 해야 하는 경우 큰 값을 지정한다.
    -  **model_name**
        -  사용할 openai 모델 지정
    - **max_tokens**:
        - llm 모델이 응답할 최대 token 수.
    - **api_key**
        - OpenAI API key를 직접 입력해 생성시 사용.
        - API key가 환경변수에 설정 되있으면 생략한다. 
-  메소드
    - **`invoke(message)`** : LLM에 질의 메세지를 전달하며 LLM의 응답을 반환한다.
> - **Message**
>     - Langchain 다양한 상황과 작업 마다 다양한 값들로 구성된 입출력 데이터를 만든다. 
>     - Langchain은 그 상황들에 맞는 다양한 Message 클래스를 제공한다. 이것을 이용하면 특정 작업에 적합한 입력값을 설정할 수 있다.

In [50]:
from langchain_openai import ChatOpenAI
model_name = "gpt-4o-mini"
model = ChatOpenAI(
    model=model_name
)
res = model.invoke("안녕하세요.")

In [6]:
print(type(res))
res

<class 'langchain_core.messages.ai.AIMessage'>


AIMessage(content='안녕하세요! 어떻게 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 10, 'total_tokens': 20, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_0705bf87c0', 'finish_reason': 'stop', 'logprobs': None}, id='run-0e64ae23-d219-4c2a-9914-b0c5c5991d82-0', usage_metadata={'input_tokens': 10, 'output_tokens': 10, 'total_tokens': 20, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [7]:
print(res.content)

안녕하세요! 어떻게 도와드릴까요?


In [53]:
model = ChatOpenAI(
    model=model_name,
    temperature=0, # 무작위성을 0으로 지정.
    max_tokens=100,# 응답 토큰수에 제한.
)
prompt = """
태양계를 구성하는 행성들에 이름을 태양에서 가까운 순서대로 알려줘. 

[답변형식]
- 한국어 이름(영어 이름): 행성에 대한 간단한 설명
"""
res = model.invoke(prompt)

In [54]:
print(res.content)

- 수성, 금성, 지구, 화성, 목성, 토성, 천왕성, 해왕성


In [30]:
res2 = model.invoke(prompt)

In [31]:
print(res2.content)

- 수성(Mercury): 태양에 가장 가까운 행성으로, 대기가 거의 없어 낮과 밤의 온도 차이가 매우 큽니다.

- 금성(Venus): 지구와 비슷한 크기를 가진 행성이지만, 두꺼운 이산화탄소 대기로 인해 극심한 온실 효과가 발생합니다.

- 지구(Earth): 생명체가 존재하는 유일한 행성으로, 물이 액체 상태로 존재할 수 있는 조건을 갖추고 있습니다.

- 화성(Mars): '붉은 행성'으로 알려져 있으며, 과거에 물이 존재했을 가능성이 있는 행성입니다.

- 목성(Jupiter): 태양계에서 가장 큰 행성으로, 강력한 자기장과 많은 위성을 가지고 있습니다.

- 토성(Saturn): 아름다운 고리로 유명한 행성으로, 가스 행성 중 하나입니다.

- 천왕성(Uranus): 독특한 축으로 회전하는 행성으로, 푸른색의 대기와 많은 고리 시스템을 가지고 있습니다.

- 해왕성(Neptune): 태양계에서 가장 먼 행성으로, 강한 바람과 대규모 폭풍이 특징입니다.


In [39]:
model = ChatOpenAI(
    model=model_name,
    temperature=0.7
)

In [40]:
res = model.invoke("백합을 주제로 헤비메탈 음악의 가사를 작성해줘.")

In [None]:
print(res.content)

In [37]:
res2 = model.invoke("백합을 주제로 헤비메탈 음악의 가사를 작성해줘.")

In [38]:
print(res2.content)

물론이죠! 백합을 주제로 한 헤비메탈 음악의 가사를 작성해볼게요. 어두운 분위기와 강렬한 이미지를 담아보았습니다.

---

**제목: Lament of the Lily**

(Verse 1)  
어둠 속에서 피어난,  
하얀 인연의 백합,  
파괴된 땅 위에,  
어둠을 뚫고 솟아나네.

(Pre-Chorus)  
그대의 아름다움은,  
칠흑 같은 밤을 관통해,  
희망의 빛을 찾아,  
우린 다시 일어설 거야.

(Chorus)  
백합의 저주, 피어나는 슬픔,  
검은 심장에서 울려 퍼지는 노래,  
가시와 잎사귀, 허공을 가르는 비명,  
우린 끊임없는 전투 속에서 살아남아.

(Verse 2)  
비바람이 몰아쳐도,  
꿋꿋이 서 있는 모습,  
신의 손길은 잊혀진,  
모든 걸 삼켜버린 세상.

(Pre-Chorus)  
백합의 향기 속에,  
숨겨진 고통의 기억,  
모든 것이 멀어져도,  
그대의 이름을 부르리.

(Chorus)  
백합의 저주, 피어나는 슬픔,  
검은 심장에서 울려 퍼지는 노래,  
가시와 잎사귀, 허공을 가르는 비명,  
우린 끊임없는 전투 속에서 살아남아.

(Bridge)  
빛을 잃은 꿈들,  
그 속에서 다시 태어나,  
네가 꿈꾸던 세상은,  
여기서 끝나지 않아.

(Breakdown)  
우린 하나 되어,  
기억의 뼈를 세우고,  
죽음마저 삼켜내며,  
영혼의 집을 찾아.

(Chorus)  
백합의 저주, 피어나는 슬픔,  
검은 심장에서 울려 퍼지는 노래,  
가시와 잎사귀, 허공을 가르는 비명,  
우린 끊임없는 전투 속에서 살아남아.

(Outro)  
백합의 노래,  
끝없는 전쟁의 서사,  
어두운 밤을 지나,  
희망의 빛 속으로 나아간다.

---

이런 스타일의 가사는 헤비메탈의 강렬한 분위기를 잘 살릴 수 있을 것 같아요! 추가적인 요청이나 수정 사항이 있다면 말씀해 주세요!


## OpenAI의 API 사용 가격확인

In [19]:
from langchain.callbacks  import get_openai_callback
with get_openai_callback() as usage:
    # with 문 안에서 openai 모델에 요청을 하면 사용 비용이 usage에 저장됨.
    res1 = model.invoke("소주 제조법을 알려주세요.")
    res2 = model.invoke("막걸리 제조법을 알려주세요.")
    res3 = model.invoke("안 취하게 술마시는 법을 알려줘.")

In [20]:
usage

Tokens Used: 1594
	Prompt Tokens: 50
	Completion Tokens: 1544
Successful Requests: 3
Total Cost (USD): $0.0009338999999999999

In [21]:
usage.total_cost

0.0009338999999999999

In [22]:
usage.prompt_tokens

50

In [23]:
usage.completion_tokens

1544

In [25]:
print(res1.content)

소주는 전통적인 한국의 증류주로, 주로 쌀, 보리, 밀 등의 곡물과 물을 사용하여 제조됩니다. 기본적인 소주 제조 과정을 아래와 같이 설명드리겠습니다.

### 소주 제조법

1. **원료 준비**:
   - 주 재료로 쌀, 보리, 밀 등을 준비합니다. 이 외에도 감자나 고구마를 사용할 수도 있습니다.

2. **세척 및 불리기**:
   - 곡물을 깨끗이 세척한 후 물에 불려서 불리는 과정을 거칩니다. 이 과정은 곡물이 잘 익도록 도와줍니다.

3. **증기 찌기**:
   - 불린 곡물을 찜통에 넣고 증기로 쪄줍니다. 이 과정에서 곡물이 부풀고 익게 됩니다.

4. **발효**:
   - 찐 곡물을 식힌 후, 누룩(제빵 효모 및 발효균 혼합물)을 섞어 발효시킵니다. 이 과정에서 당분이 알코올로 변환됩니다. 일반적으로 2주에서 4주 정도 발효시킵니다.

5. **증류**:
   - 발효가 완료되면, 발효된 혼합물을 증류합니다. 이 과정에서 알코올을 분리하여 높은 도수의 소주를 얻습니다.

6. **숙성**:
   - 증류된 소주는 일정 기간 숙성됩니다. 이 과정에서 맛과 향이 더욱 깊어집니다.

7. **희석 및 병입**:
   - 숙성된 소주를 원하는 도수에 맞게 물로 희석한 후, 병에 담아 밀봉합니다.

### 주의사항
- 소주 제조는 알코올을 포함하고 있기 때문에 법적인 규제가 있을 수 있으므로, 개인이 소주를 제조하는 것은 금지된 경우가 많습니다. 반드시 관련 법규를 확인하시고, 상업적인 제조는 허가를 받아야 합니다.

이상으로 소주 제조법에 대한 간단한 설명을 마칩니다!


In [26]:
print(res2.content)

막걸리는 한국의 전통 발효주로, 쌀과 물, 누룩을 주재료로 사용하여 만듭니다. 다음은 기본적인 막걸리 제조법입니다.

### 재료
- 쌀: 1kg (찹쌀 또는 일반 쌀)
- 물: 2~3L (조절 가능)
- 누룩: 100g (막걸리용 누룩)
- 설탕: 필요에 따라 (선택 사항)

### 제조 과정

1. **쌀 씻기 및 불리기**:
   - 쌀을 깨끗이 씻은 후, 물에 4~6시간 정도 불립니다. 이 과정은 쌀이 충분히 수분을 흡수할 수 있도록 도와줍니다.

2. **쌀 찌기**:
   - 불린 쌀을 체에 밭쳐 물기를 제거한 후, 찜통에 넣고 30분에서 1시간 정도 찌어줍니다. 쌀이 고루 익도록 중간에 한 번 뒤집어 주는 것이 좋습니다.

3. **식히기**:
   - 찐 쌀을 넓은 그릇이나 쟁반에 펼쳐서 식힙니다. 온도가 약 30도 정도로 내려가도록 합니다.

4. **누룩 준비**:
   - 누룩을 잘게 부수어 준비합니다. 이때 누룩이 고루 섞일 수 있도록 잘 저어줍니다.

5. **혼합**:
   - 식힌 쌀에 누룩을 넣고 잘 섞어줍니다.

6. **발효**:
   - 혼합한 쌀과 누룩을 깨끗한 발효 용기에 담고, 물을 부어줍니다. 물의 양은 쌀과 누룩의 양에 따라 조절합니다. 일반적으로는 2~3L 정도가 적당합니다.
   - 용기의 뚜껑을 덮되, 완전히 밀폐하지 말고 약간의 공기가 통할 수 있도록 해줍니다. 이 상태에서 7일 정도 발효시킵니다. 발효 과정에서 온도는 20도에서 25도 정도가 적당합니다.

7. **여과**:
   - 발효가 끝난 후, 내용물을 체나 면포를 이용해 걸러줍니다. 이때, 액체와 고형물을 분리합니다.

8. **저장**:
   - 걸러낸 막걸리는 병에 담아 냉장 보관합니다. 추가적으로 설탕을 넣어 단맛을 조절할 수 있습니다. 

이제 막걸리가 완성되었습니다! 차갑게 해서 즐기시면 더욱 맛있습니다. 발효 시간을 조절하여 취향에 맞게 맛을 조절할 수 있으니 여러 번 시도해 보시길 추천합니다.


In [27]:
print(res3.content)

안 취하게 술을 마시려면 몇 가지 방법을 고려할 수 있습니다. 하지만 가장 중요한 것은 음주를 할 때 자신의 한계를 잘 알고, 건강을 우선시하는 것입니다. 다음은 안 취하게 술 마시는 데 도움이 될 수 있는 몇 가지 팁입니다:

1. **천천히 마시기**: 술을 천천히 마시면 체내에서 알코올이 분해되는 시간을 주게 되어 취하는 정도를 줄일 수 있습니다.

2. **음식과 함께 마시기**: 술을 마시는 동안 음식을 함께 섭취하면 알코올의 흡수를 늦출 수 있습니다. 특히 단백질과 지방이 포함된 음식이 좋습니다.

3. **물과 함께 마시기**: 술과 함께 물을 많이 마시면 탈수 현상을 예방하고, 알코올 농도를 낮출 수 있습니다. 술 한 잔에 물 한 잔을 마시는 것이 좋습니다.

4. **알콜 도수 낮은 술 선택하기**: 도수가 낮은 술을 선택하면 취하는 정도를 줄일 수 있습니다. 예를 들어, 맥주나 와인처럼 도수가 낮은 음료를 선택하는 것이 좋습니다.

5. **자신의 한계 인식하기**: 자신의 한계를 알고, 그 이상으로 음주하지 않도록 주의해야 합니다. 만약 이미 기분이 좋다고 느끼면 그만 마시는 것이 좋습니다.

6. **간헐적으로 일어나는 활동**: 술을 마시는 중간중간에 일어나서 움직이거나 대화하는 등의 활동을 통해 신체를 활성화시키면 취하는 것을 조금 더 줄일 수 있습니다.

7. **미리 계획 세우기**: 술을 마시기 전 미리 자신이 마실 양을 정하고, 그 계획에 따라 마시는 것이 좋습니다.

음주를 할 때는 항상 자신의 건강과 안전을 최우선으로 생각하고, 필요할 경우 음주를 피하는 것이 가장 좋습니다.


# Hugging Face 모델 사용

## Local 에 설치된 모델 사용
- HuggingFacePipeline 에 Model id를 전달해 Model객체를 생성한다.
- huggingface transformers 라이브러리를 이용해 model을 생성 한 뒤 HuggingFacePipeline 에 넣어 생성한다.
- 모델이 local에 없는 경우 다운로드 받는다.

## HuggingFaceEndpoint 를 이용해 API 호출
- Inference API 를 지원하고 10GB 이하 크기의 모델은 HuggingFaceEndpoint 를 이용해 호출해서 사용할 수있다. 
- local에 다운 받지 않아도 되고 GPU가 없을 경우 local 보다 빠르게 실행할 수 있다.
- Inference API 지원 여부 확인
    - HuggingFace Hub의 개별 모델 페이지에서 "Deploy - Inference API" 탭을 확인한다.
### API Key (Access Token) 생성
![huggingface_create_apikey.png](figures/huggingface_accesstoken.png)
![huggingface_create_apikey.png](figures/huggingface_accesstoken2.png)
- 1. 로그인 -> 2. Profile -> 3. Access Tokens 선택
- 생성할 때 `write` 권한을 선택한다.
- `HUGGINGFACE_API_KEY=KEY값` 을 환경변수에 등록한다.


### HuggingFace 모델을 사용하기 위한 package 설치
```bash
pip install transformers -qU
pip install langchain-huggingface -qU
pip install  huggingface_hub -qU
```

In [12]:
%pip install transformers -qU

Note: you may need to restart the kernel to use updated packages.


In [13]:
%pip install langchain-huggingface -qU

Note: you may need to restart the kernel to use updated packages.


In [14]:
%pip install  huggingface_hub -qU

Note: you may need to restart the kernel to use updated packages.


In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
import os
from huggingface_hub import login
# 파인튜닝한 모델을  huggingface-hub에 올리거나  End Point API 사용할 때 
#     발급 받은 Access token으로 로그인해야함.
huggingface_apikey = os.getenv("HUGGINGFACE_API_KEY")
# huggingface_apikey
login(huggingface_apikey)
# login()

In [9]:
############# Local 모델을 사용
from langchain_huggingface.llms import HuggingFacePipeline

model_id = "Qwen/Qwen2.5-1.5B-Instruct"
llm = HuggingFacePipeline.from_model_id(
    model_id=model_id,
    task="text-generation", 
    pipeline_kwargs={"max_new_tokens":50}  
)

tokenizer_config.json:   0%|          | 0.00/7.30k [00:00<?, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


vocab.json:   0%|          | 0.00/2.78M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/1.67M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/7.03M [00:00<?, ?B/s]

config.json:   0%|          | 0.00/660 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/3.09G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/242 [00:00<?, ?B/s]

In [10]:
res = llm.invoke("한국의 수도는 어디인가요?")

In [11]:
res

'한국의 수도는 어디인가요? 한국은 대한민국이라고 부르기도 합니다. 한국의 수도는 서울입니다. 서울은 한반도를 지나가는 동해와 서해를 잇는 도시로, 대한민국의 정치, 경제, 문'

# Anthropic의 Claude 모델 사용

- Anthropic사의 Claude 모델은 (성능 순으로) **Haiku, Sonnet, Opus** 세가지 모델이 있다.  
- [Anthropic사 사이트](https://www.anthropic.com/)
- [Claude 서비스 사이트](https://claude.ai)
- API 가격: https://www.anthropic.com/pricing#anthropic-api
- Langchain으로 Anthropic claude 모델 사용: https://python.langchain.com/docs/integrations/chat/anthropic/

## API Key 발급받기
1. https://console.anthropic.com/ 이동 후 가입한다.
2. 로그인 하면 Dashboard로 이동한다. Dashbord에서 `Get API Keys`를 클릭해 이동한다.

![anthropic_apikey1.png](figures/anthropic_apikey1.png)

3. Create key 클릭해서 API Key를 생성한다.

![anthropic_apikey2.png](figures/anthropic_apikey2.png)

4. 생성된 API Key를 복사한 뒤 저장. (다시 볼 수 없다.)
   - 환경변수에 등록
      - 변수이름: ANTHROPIC_API_KEY
      - 값: 생성된 키
5. 결제 정보 등록 및 결제 (최소 $5)
   - Settings -> Billing -> complete setup
  
![anthropic_apikey3.png](figures/anthropic_apikey3.png)
  - 설문조사 후 카드 등록한다.



## Anthropic의 Claude 모델 사용
- 모델 확인: https://docs.anthropic.com/en/docs/about-claude/models

### Claude 모델 사용을 위한 package 설치
```bash
pip install anthropic -qU
pip install -qU langchain-anthropic
```

In [12]:
%pip install anthropic -qU

Note: you may need to restart the kernel to use updated packages.


In [13]:
%pip install -qU langchain-anthropic

Note: you may need to restart the kernel to use updated packages.


### Anthropic library 이용한 API 호출

In [23]:
from dotenv import load_dotenv

In [24]:
load_dotenv()

True

In [25]:
model = "claude-3-5-haiku-latest" # "앤토로픽 api 결제할때 물어보는 것 체크한 내용.png"

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model=model,
    max_tokens=1000,
    temperature=0.0,
    system="LLM에 대한 전문가로서 설명을 부탁해. 단 모르는 것은 모른다고 해. 답변은 한국어로 해줘.",
    messages=[
        {"role": "user", "content": "Anthropic의 LLM 모델은 어떤 것이 있는지 알려주고 간단한 설명도 부탁해."}
    ]
)

In [29]:
# print(message)
# print(message.content)
print(message.content[0].text)

Anthropic의 대표적인 LLM 모델은 Claude입니다. 현재 Claude와 Claude 2가 존재하며, 주요 특징은 다음과 같습니다:

1. Claude
- 윤리적이고 안전한 대화에 중점
- 긴 문맥을 잘 이해하는 능력
- 정직성과 투명성을 강조

2. Claude 2
- Claude보다 더 발전된 성능
- 더 넓은 지식 범위
- 더 복잡한 작업 수행 능력 향상
- 코딩, 분석, 창의적 작업 등에서 뛰어난 성능

Anthropic은 AI 안전성과 윤리에 특히 중점을 두고 모델을 개발하고 있습니다.


### Langchain-antropic 사용

In [33]:
from langchain_anthropic import ChatAnthropic
from dotenv import load_dotenv
load_dotenv()

# model = "claude-3-5-haiku-latest"
model = "claude-3-5-sonnet-latest"
llm = ChatAnthropic(
    model=model,
    temperature=0.2,
    max_tokens=1024,
)
result = llm.invoke("Anthropic의 LLM 모델은 어떤 것이 있는지 알려주고 간단한 설명도 부탁해.")

In [35]:
# result
print(result.content)

Anthropic의 주요 LLM 모델은 Claude입니다. 현재 Claude 2와 Claude Instant, 두 가지 버전이 있습니다.

Claude 2:
- Anthropic의 최신 플래그십 모델
- 더 긴 컨텍스트 윈도우(약 100K 토큰)
- 더 복잡한 분석과 추론이 가능
- 코딩, 수학, 작문 등 다양한 작업 수행
- 더 정확하고 신뢰할 수 있는 응답 제공

Claude Instant:
- 경량화된 빠른 버전
- 더 짧은 응답시간
- 기본적인 대화와 간단한 작업에 적합
- 비용 효율적

두 모델 모두 윤리적 AI 원칙을 준수하도록 설계되었으며, 안전하고 유용한 방식으로 사용자를 돕는 것을 목표로 합니다.


# Ollama 모델 사용

Ollama는 로컬 환경에서 오픈소스 LLM을 쉽게 실행할 수 있도록 지원하는 플랫폼이다.

- 주요특징

  - **다양한 모델 지원**: Llama 3, Mistral, Phi 3 등 여러 오픈소스 LLM을 지원.
  - **편리한 모델 설치 및 실행**: 간단한 명령어로 모델을 다운로드하고 실행할 수 있습니다.
  - **운영체제 호환성**: macOS, Windows, Linux 등 다양한 운영체제에서 사용 가능하다.

## 설치
- https://ollama.com/download 에서 운영체제에 맞는 버전을 설치
-  Windows 버전은 특별한 설정 없이 바로 install 실행하면 된다.

## 모델 검색
- https://ollama.com/search
- 모델을 검색한 후 상세페이지로 이동하면 해당 모델을 실행할 수있는 명령어가 나온다.

![ollama_down.png](figures/ollama_down.png)


## 실행 명령어
- `ollama pull 모델명`
  - 모델을 다운로드 받는다. (다운로드만 받고 실행은 하지 않은다.)
- `ollama run 모델명`
  - 모델을 실행한다. 
  - 최초 실행시 모델을 다운로드 받는다.
  - 명령프롬프트 상에서 `프롬프트`를 입력하면 모델의 응답을 받을 수 있다.

## Python/Langchain API
- ollama api
  - https://github.com/ollama/ollama-python
- langchain-ollama
  - https://python.langchain.com/docs/integrations/chat/ollama/
- 설치
  - `pip install ollama`
  - `pip install langchain-ollama`

In [36]:
%pip install langchain-ollama

Collecting langchain-ollama
  Downloading langchain_ollama-0.2.1-py3-none-any.whl.metadata (1.9 kB)
Collecting ollama<1,>=0.3.0 (from langchain-ollama)
  Downloading ollama-0.4.2-py3-none-any.whl.metadata (4.8 kB)
Collecting httpx<0.28.0,>=0.27.0 (from ollama<1,>=0.3.0->langchain-ollama)
  Using cached httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Downloading langchain_ollama-0.2.1-py3-none-any.whl (15 kB)
Downloading ollama-0.4.2-py3-none-any.whl (13 kB)
Using cached httpx-0.27.2-py3-none-any.whl (76 kB)
Installing collected packages: httpx, ollama, langchain-ollama
  Attempting uninstall: httpx
    Found existing installation: httpx 0.28.0
    Uninstalling httpx-0.28.0:
      Successfully uninstalled httpx-0.28.0
Successfully installed httpx-0.27.2 langchain-ollama-0.2.1 ollama-0.4.2
Note: you may need to restart the kernel to use updated packages.


## Ollama library 사용

In [39]:
from ollama import chat
# 모델은 사전에 pull 되있어야 한다.
model_id = "qwen2:0.5b"
res = chat(
    model=model_id,
    messages=[
        {"role":"user", "content":"한국의 수도는 어디인가요?"}
    ]
)

In [42]:
print(type(res))
print(res)

<class 'ollama._types.ChatResponse'>
model='qwen2:0.5b' created_at='2024-12-03T02:41:09.6169197Z' done=True done_reason='stop' total_duration=747711900 load_duration=590027900 prompt_eval_count=18 prompt_eval_duration=54000000 eval_count=9 eval_duration=102000000 message=Message(role='assistant', content='한국의 수도는 서울입니다.', images=None, tool_calls=None)


In [44]:
print(res.message.content) 
print(res["message"]["content"])

한국의 수도는 서울입니다.
한국의 수도는 서울입니다.


## Langchain-ollama 사용

In [46]:
from langchain_ollama import ChatOllama

model = ChatOllama(
    model=model_id, 
)
res = model.invoke("미국의 수도는 어디인가요?")

In [47]:
res

AIMessage(content='미국의 수도는 런어드입니다.', additional_kwargs={}, response_metadata={'model': 'qwen2:0.5b', 'created_at': '2024-12-03T02:45:26.5953151Z', 'done': True, 'done_reason': 'stop', 'total_duration': 247778100, 'load_duration': 10668100, 'prompt_eval_count': 18, 'prompt_eval_duration': 76000000, 'eval_count': 13, 'eval_duration': 160000000, 'message': Message(role='assistant', content='', images=None, tool_calls=None)}, id='run-1b339c94-31e2-4e95-bd28-559b84e2cacb-0', usage_metadata={'input_tokens': 18, 'output_tokens': 13, 'total_tokens': 31})

In [48]:
res.content

'미국의 수도는 런어드입니다.'