<!-- # Langchain은 다양한 LLM(대규모 언어 모델)을 지원한다
-	대규모 언어 모델(LLM, Large Language Model)을 개발하는 회사들은 사용자가 자신의 애플리케이션에서 LLM을 손쉽게 활용할 수 있도록 API(Application Programming Interface) 서비스를 제공하고 있다.
-	하지만 각 LLM은 고유한 API 호출 라이브러리(Library)를 제공하기 때문에, 개발자는 동일한 작업을 수행하더라도 LLM에 따라 다른 코드를 작성해야 하는 번거로움이 있다.
-	Langchain은 이러한 문제를 해결하기 위해 다양한 LLM의 API를 통합적으로 지원한다.
-	여러 LLM을 동일한 인터페이스(interface)로 호출할 수 있게 하여 특정 모델에 종속되지 않도록 하고, 필요에 따라 쉽게 다른 모델로 전환할 수 있다.
-	Langchain이 지원하는 주요 LLM 목록
    - https://python.langchain.com/docs/integrations/chat/#featured-providers -->

## 설치
```bash
pip install langchain langchain-community  -qU
pip install python-dotenv -qU 
pip install ipywidgets -qU
```


In [2]:
import langchain

langchain.__version__

'0.3.25'

# OpenAI 모델 사용
- https://platform.openai.com
  
## 결제
1. 로그인 후 Billing 페이지로 이동.
   - setting -> Billing
  
   ![openai_payment.png](figures/openai_payment.png)

2. Payment methods 탭을 선택하고 카드를 등록한다. 
   
   ![openai_payment2.png](figures/openai_payment2.png)

   - 등록이 끝나면 최초 구매를 진행한다. $5 ~ $100 사이의 금액을 선택할 수 있다.
   - 자동 충전을 설정하고 싶다면 automatic recharge 를 활성화 하고 아래 추가 설정에 입력한다. 
     - 자동 충전은 특정 금액 이하로 떨어지면 자동으로 충전한다. (**비활성화**) 
  
   ![openai_payment3.png](figures/openai_payment3.png)
   
3. 수동으로 **추가 결제하기**
   - Billing 페이지의 Overview에서 `Add to credit balance` 를 클릭한 뒤 금액을 입력하고 결제한다.

## 사용량 확인
- profile/설정 -> Usage 에서 확인

## API Key 생성
  
![openai_create_apikey.png](figures/openai_create_apikey.png)

- 로그인 -> Dashboard -> API Keys -> Create New Secreat Key
> Settings -> API Keys

## API Key 등록
- 환경변수에 등록
  - 변수이름: OPENAI_API_KEY
  - 값: 생성된 키
- dotenv를 이용해서 load
  - Working directory에  `.env` 파일 생성하고 `OPENAI_API_KEY=생성된키` 추가한다.
  - load_dotenv() 호출 하면 .env 파일에 있는 값을 읽은 뒤 환경변수로 등록한다.
- **주의**
  - 생성된 API Key는 노출되면 안된다.
  - API Key가 저장된 파일(코드나 설정파일)이 github에 올라가 공개되서는 안된다.

## 사용 비용 확인
- settings -> Usage 에서 확인

## OpenAI LLM 모델들
-  OpenAI LLM 모델: https://platform.openai.com/docs/models
-  모델별 가격: https://platform.openai.com/docs/pricing
-  토큰사이즈 확인: https://platform.openai.com/tokenizer
   -  1토큰: 영어 3\~4글자 정도, 한글: 대략 1\~2글자 정도
   -  모델이 업데이트 되면서 토큰 사이즈도 조금씩 커지고 있다.

## OpenAI 를 연동하기 위한 package 설치
```bash
pip install langchain-openai -qU
```

- OpenAI 자체 라이브러리 설치
    - `pip install openai -qU`
    - langchain-openai를 설치하면 같이 설치 된다.

In [3]:
%pip install langchain-openai -qU

Note: you may need to restart the kernel to use updated packages.


## OpenAI Library 를 이용한 API 호출

In [6]:
from openai import OpenAI
from dotenv import load_dotenv

flag = load_dotenv()
print(flag)

True


In [10]:
from pyexpat.errors import messages


client = OpenAI()	# 환경 변수에 OPENAI_API_KEY 이름으로 등록되어있으면 apikey는 생략!
message = [
    {
        "role" : "user",	# 누가 말하고 있는지 (발화자 - user, assistant, system)
        "content" : "OpenAI의 LLM 모델은 무엇이 있나용 ??"	# 질의 내용 -> 프롬포트
	}
]
response = client.chat.completions.create(
    model = "gpt-4o-mini",	# 요청할 gpt 모델 종류
    messages = message
)

In [14]:
response

ChatCompletion(id='chatcmpl-Betl9MydYDzsGGAsmzk5SRTCKIlY3', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='OpenAI의 LLM(대규모 언어 모델)으로는 다음과 같은 모델들이 있습니다:\n\n1. **GPT-3**: 1750억 개의 매개변수를 가진 모델로, 다양한 자연어 처리 작업을 수행할 수 있습니다. 텍스트 생성, 번역, 질문 응답 등 여러 응용 분야에서 활용됩니다.\n\n2. **GPT-3.5**: GPT-3의 개선된 버전으로, 문맥 이해 능력과 생성 품질이 향상되었습니다. 문장 생성, 대화형 AI 등에서 더욱 효과적인 성능을 보입니다.\n\n3. **GPT-4**: GPT-4는 GPT-3.5의 후속 모델로, 더욱 향상된 이해력과 생성 능력을 제공하며, 다양한 형식의 데이터를 처리할 수 있는 기능이 강화되었습니다.\n\n이 외에도 OpenAI는 특정 용도나 응용 프로그램에 맞춘 다양한 모델을 연구하고 개발하고 있으며, 지속적으로 발전하고 있습니다. OpenAI의 모델들은 API 형태로 제공되어 다양한 어플리케이션에서 사용될 수 있습니다.', refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None))], created=1749087159, model='gpt-4o-mini-2024-07-18', object='chat.completion', service_tier='default', system_fingerprint='fp_34a54ae93c', usage=CompletionUsage(completion_tokens=231, prompt_tokens=20, total_tokens=251, completion_tokens_details=CompletionTokensD

In [16]:
print(response.choices[0].message.content)

OpenAI의 LLM(대규모 언어 모델)으로는 다음과 같은 모델들이 있습니다:

1. **GPT-3**: 1750억 개의 매개변수를 가진 모델로, 다양한 자연어 처리 작업을 수행할 수 있습니다. 텍스트 생성, 번역, 질문 응답 등 여러 응용 분야에서 활용됩니다.

2. **GPT-3.5**: GPT-3의 개선된 버전으로, 문맥 이해 능력과 생성 품질이 향상되었습니다. 문장 생성, 대화형 AI 등에서 더욱 효과적인 성능을 보입니다.

3. **GPT-4**: GPT-4는 GPT-3.5의 후속 모델로, 더욱 향상된 이해력과 생성 능력을 제공하며, 다양한 형식의 데이터를 처리할 수 있는 기능이 강화되었습니다.

이 외에도 OpenAI는 특정 용도나 응용 프로그램에 맞춘 다양한 모델을 연구하고 개발하고 있으며, 지속적으로 발전하고 있습니다. OpenAI의 모델들은 API 형태로 제공되어 다양한 어플리케이션에서 사용될 수 있습니다.


In [17]:
from IPython.display import Markdown

Markdown(response.choices[0].message.content)

OpenAI의 LLM(대규모 언어 모델)으로는 다음과 같은 모델들이 있습니다:

1. **GPT-3**: 1750억 개의 매개변수를 가진 모델로, 다양한 자연어 처리 작업을 수행할 수 있습니다. 텍스트 생성, 번역, 질문 응답 등 여러 응용 분야에서 활용됩니다.

2. **GPT-3.5**: GPT-3의 개선된 버전으로, 문맥 이해 능력과 생성 품질이 향상되었습니다. 문장 생성, 대화형 AI 등에서 더욱 효과적인 성능을 보입니다.

3. **GPT-4**: GPT-4는 GPT-3.5의 후속 모델로, 더욱 향상된 이해력과 생성 능력을 제공하며, 다양한 형식의 데이터를 처리할 수 있는 기능이 강화되었습니다.

이 외에도 OpenAI는 특정 용도나 응용 프로그램에 맞춘 다양한 모델을 연구하고 개발하고 있으며, 지속적으로 발전하고 있습니다. OpenAI의 모델들은 API 형태로 제공되어 다양한 어플리케이션에서 사용될 수 있습니다.

## Langchain을 이용한 OpenAI API 호출

- **ChatOpenAI**
    - chat (대화-채팅) 기반 모델 model.
    - Default 로 gpt-3.5-turbo 사용
    - llm 전달 입력과 llm 응답 출력 타입:  Message
> - **OpenAI**
>     - 문장 완성 모델. (text completion) model
>     - Default로 gpt-3.5-turbo-instruct 사용
>       - instruct 모델만 사용가능
>     - llm전달 입력과 llm 응답 출력 타입: str
- Initializer 주요 파라미터
    -  **temperature**
        -  llm 모델의 출력 무작위성을 지정한다. 
        -  0 ~ 2 사이 실수를 설정하며 클 수록 무작위성이 커진다. 기본값: 0.7
        -  정확한 답변을 얻어야 하는 경우 작은 값을 창작을 해야 하는 경우 큰 값을 지정한다.
    -  **model_name**
        -  사용할 openai 모델 지정
    - **max_tokens**:
        - llm 모델이 응답할 최대 token 수.
    - **api_key**
        - OpenAI API key를 직접 입력해 생성시 사용.
        - API key가 환경변수에 설정 되있으면 생략한다. 
-  메소드
    - **`invoke(message)`** : LLM에 질의 메세지를 전달하며 LLM의 응답을 반환한다.
> - **Message**
>     - Langchain 다양한 상황과 작업 마다 다양한 값들로 구성된 입출력 데이터를 만든다. 
>     - Langchain은 그 상황들에 맞는 다양한 Message 클래스를 제공한다. 이것을 이용하면 특정 작업에 적합한 입력값을 설정할 수 있다.

In [18]:
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv

load_dotenv()

True

In [19]:
model = ChatOpenAI(
    model = "gpt-4o-mini"
)

response = model.invoke("OpenAI LLM 모델 종류를 알려줘잉")

In [20]:
response

AIMessage(content='OpenAI는 다양한 대규모 언어 모델(LLM)을 개발해왔으며, 그 중 몇 가지 주요 모델은 다음과 같습니다:\n\n1. **GPT-2**: 2019년에 발표된 모델로, 대화, 텍스트 생성, 번역 등 다양한 작업을 수행할 수 있는 자연어 처리 모델입니다.\n\n2. **GPT-3**: 2020년에 출시된 모델로, 1750억 개의 매개변수를 가지고 있으며, 텍스트 생성, 질문 응답, 요약 등 다양한 작업에서 뛰어난 성능을 보여주었습니다.\n\n3. **GPT-3.5**: GPT-3의 후속 버전으로, 여러 개선된 점들이 포함되어 다양한 리소스를 활용하여 더 나은 성능을 발휘합니다.\n\n4. **GPT-4**: 2023년에 출시된 최신 모델로, 이전 버전보다 더 향상된 이해력과 생성 능력을 가지고 있습니다. 다양한 분야에서 활용될 수 있도록 다방면으로 개선되었습니다.\n\n이 외에도 OpenAI는 특정 용도에 맞춘 다양한 모델과 API를 개발해왔으며, 사용자 요구에 맞춘 다양한 기능을 제공하고 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 251, 'prompt_tokens': 18, 'total_tokens': 269, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_62a23a81ef', 'id': 'chatcmpl-BetuJuUOI9SH3m5cRywYc0FPSxQ

In [22]:
print(response.content)

OpenAI는 다양한 대규모 언어 모델(LLM)을 개발해왔으며, 그 중 몇 가지 주요 모델은 다음과 같습니다:

1. **GPT-2**: 2019년에 발표된 모델로, 대화, 텍스트 생성, 번역 등 다양한 작업을 수행할 수 있는 자연어 처리 모델입니다.

2. **GPT-3**: 2020년에 출시된 모델로, 1750억 개의 매개변수를 가지고 있으며, 텍스트 생성, 질문 응답, 요약 등 다양한 작업에서 뛰어난 성능을 보여주었습니다.

3. **GPT-3.5**: GPT-3의 후속 버전으로, 여러 개선된 점들이 포함되어 다양한 리소스를 활용하여 더 나은 성능을 발휘합니다.

4. **GPT-4**: 2023년에 출시된 최신 모델로, 이전 버전보다 더 향상된 이해력과 생성 능력을 가지고 있습니다. 다양한 분야에서 활용될 수 있도록 다방면으로 개선되었습니다.

이 외에도 OpenAI는 특정 용도에 맞춘 다양한 모델과 API를 개발해왔으며, 사용자 요구에 맞춘 다양한 기능을 제공하고 있습니다.


In [None]:
model.invoke("너 이름이 뭐니 ? 내 햄부기 정해줄 수 있겐니 ?")

AIMessage(content='저는 이름이 없지만, 여러분이 원하는 정보를 제공하기 위해 여기 있습니다! 햄스터 이름을 정하는 데 도움을 줄 수 있어요. 어떤 종류의 이름을 원하세요? 귀엽고 사랑스러운 이름, 혹은 독특하고 멋진 이름 중에 어떤 게 좋으신가요? 몇 가지 예시를 드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 77, 'prompt_tokens': 27, 'total_tokens': 104, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BetxKWVRs0EB9LlzCilvMdcVKatdU', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--db05618e-ae6f-4f41-ac19-aa43c8195771-0', usage_metadata={'input_tokens': 27, 'output_tokens': 77, 'total_tokens': 104, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [41]:
model = ChatOpenAI(
    model = "gpt-4o-mini",	# gpt-4.1-mini, gpt-4.1
    temperature = 0,		# 무작위성, 0 이상 실수 설정 (0~1), 클수록 무작위성이 커짐
    # max_token = 100			# 응답 토큰 수 제한
)

In [42]:
prompt = """
태양계를 구성하는 행성들의 이름을 태양에서 가까운 순서대로 알려줘.

<답변 형식>
목록 형식으로 답변해줘.
- 한글이름(영어이름) : 행성에 대한 간단한 설명
"""
res = model.invoke(prompt)

In [43]:
print(res.content)

- 수성(Mercury) : 태양에 가장 가까운 행성으로, 대기가 거의 없어 낮과 밤의 온도 차이가 매우 큽니다.
- 금성(Venus) : 지구와 비슷한 크기를 가진 행성이지만, 두꺼운 대기와 강한 온실 효과로 매우 높은 온도를 유지합니다.
- 지구(Earth) : 생명체가 존재하는 유일한 행성으로, 물이 액체 상태로 존재할 수 있는 조건을 갖추고 있습니다.
- 화성(Mars) : 붉은색의 표면을 가진 행성으로, 과거에 물이 존재했을 가능성이 있는 곳입니다.
- 목성(Jupiter) : 태양계에서 가장 큰 행성으로, 강력한 자기장과 많은 위성을 가지고 있습니다.
- 토성(Saturn) : 아름다운 고리로 유명한 행성으로, 가스 행성 중 하나입니다.
- 천왕성(Uranus) : 독특하게 옆으로 기울어진 자전축을 가진 행성으로, 푸른색의 대기를 가지고 있습니다.
- 해왕성(Neptune) : 태양계에서 가장 먼 행성으로, 강한 바람과 푸른색의 대기를 특징으로 합니다.


In [None]:
print(res.content)	# temperature : 1

- 수성(Mercury) : 태양에서 가장 가까운 행성으로, 대기가 거의 없어 낮과 밤의 온도 차이가 매우 큽니다.
- 금성(Venus) : 두 번째로 태양에 가까운 행성으로, 두꺼운 대기로 인해 온실효과가 심해 고온 환경을 가지고 있습니다.
- 지구(Earth) : 생명체가 존재하는 유일한 행성으로, 대기와 물이 존재하며 다양한 기후를 가지고 있습니다.
- 화성(Mars) : 붉은색 표면을 가진 '붉은 행성'으로, 과거에 물이 존재했을 가능성이 있는 행성입니다.
- 목성(Jupiter) : 태양계에서 가장 큰 행성으로, 거대한 기체 행성이며 많은 위성을 가지고 있습니다.
- 토성(Saturn) : 아름다운 고리로 유명한 행성으로, 목성처럼 기체로 이루어져 있습니다.
- 천왕성(Uranus) : 측면으로 기울어져 자전하는 특이한 행성으로, 푸른색의 메탄 대기를 가지고 있습니다.
- 해왕성(Neptune) : 태양계의 가장 바깥쪽에 위치한 행성으로, 강한 바람과 푸른색 대기를 가지고 있습니다.


In [44]:
# 채팅 형태 프롬포트 - role과 내용을 묶어서 전달.
prompt = [
    ("user", "막걸리 제조법을 알려줘")	# ("role", "대화내용")
]
res = model.invoke(prompt)

In [46]:
print(res, res.content)

content='막걸리는 한국의 전통 발효주로, 쌀과 물, 누룩을 주재료로 사용하여 만듭니다. 아래는 기본적인 막걸리 제조법입니다.\n\n### 재료\n- 쌀: 1kg (찹쌀 또는 일반 쌀)\n- 물: 1.5~2리터\n- 누룩: 100g (막걸리용 누룩)\n- 설탕: 선택 사항 (단맛을 원할 경우)\n\n### 제조 과정\n\n1. **쌀 씻기**: 쌀을 깨끗이 씻어 불순물을 제거합니다. 여러 번 물을 갈아주며 씻어주세요.\n\n2. **쌀 불리기**: 씻은 쌀을 물에 담가 4~6시간 정도 불립니다. 찹쌀을 사용할 경우, 더 부드럽고 쫄깃한 막걸리가 됩니다.\n\n3. **쌀 찌기**: 불린 쌀을 체에 받쳐 물기를 빼고, 찜통에 넣어 30~40분 정도 쪄줍니다. 쌀이 고루 익도록 중간에 한 번 저어주는 것이 좋습니다.\n\n4. **식히기**: 찐 쌀을 넓은 그릇에 옮겨 담고, 상온에서 식힙니다. 온도가 30도 정도로 식어야 합니다.\n\n5. **누룩 섞기**: 식은 쌀에 누룩을 고루 섞어줍니다. 누룩이 잘 섞이도록 손으로 부드럽게 비벼주세요.\n\n6. **발효**: 혼합한 쌀과 누룩을 깨끗한 발효 용기에 담고, 물을 추가합니다. 뚜껑을 덮되, 완전히 밀봉하지 않고 공기가 통할 수 있도록 합니다. 1~2일 동안 실온에서 발효시킵니다. 발효가 진행되면 거품이 생기고, 향이 나기 시작합니다.\n\n7. **여과**: 발효가 끝나면, 체나 면포를 이용해 막걸리를 여과합니다. 이때, 남은 찌꺼기는 버리거나 다른 요리에 활용할 수 있습니다.\n\n8. **병입 및 저장**: 여과한 막걸리를 깨끗한 병에 담고, 냉장고에 보관합니다. 이때, 설탕을 추가하여 단맛을 조절할 수 있습니다.\n\n9. **숙성**: 막걸리는 냉장고에서 며칠 숙성시키면 더욱 맛이 좋아집니다. \n\n이제 막걸리를 즐길 준비가 완료되었습니다! 막걸리는 차갑게 해서 마시는 것이 일반적이며, 다양한 안주와 함께 즐기면 좋습니다.' additional_kwargs={'refusal': None} re

In [47]:
res.response_metadata

{'token_usage': {'completion_tokens': 619,
  'prompt_tokens': 15,
  'total_tokens': 634,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4o-mini-2024-07-18',
 'system_fingerprint': 'fp_34a54ae93c',
 'id': 'chatcmpl-BeuXQnob2zaffitkt1uhVzwJAbLHH',
 'service_tier': 'default',
 'finish_reason': 'stop',
 'logprobs': None}

# Hugging Face 모델 사용

## Local 에 설치된 모델 사용
- HuggingFacePipeline 에 Model id를 전달해 Model객체를 생성한다.
- huggingface transformers 라이브러리를 이용해 model을 생성 한 뒤 HuggingFacePipeline 에 넣어 생성한다.
- 모델이 local에 없는 경우 다운로드 받는다.

### HuggingFace 모델을 사용하기 위한 package 설치
```bash
pip install langchain-huggingface -qU
```
- nvidia GPU가 있는 경우 `torch cuda`  버전을 먼저 설치하고 `langchain-huggingface`를 설치 해야 한다. 아니면 `torch cpu` 버전이 설치된다.
- `transformers`, `tokenizers`, `huggingface-hub` 등 huggingface 관련 package들이 같이 설치된다.

In [52]:
from langchain_huggingface.llms import HuggingFacePipeline

model_id = "google/gemma-3-1b-it"	
# 1b : 파라미터수(10억), it : instruction training(질문/지시시-응답 형식으로 파인튜닝한 모델)
model_hf = HuggingFacePipeline.from_model_id(
    model_id = model_id,
    task = "text-generation",
    pipeline_kwargs={"max_new_tokens" : 50}	# transformers.pipeline()의 설정을 하는 파라미터
)

Device set to use cpu


In [53]:
res = model_hf.invoke("한국의 수도는 ?")

In [55]:
res

'한국의 수도는 ?\n\n정답: 서울\n\n'

# Anthropic의 Claude 모델 사용

- Anthropic사의 Claude 모델은 (성능 순으로) **Haiku, Sonnet, Opus** 세가지 모델이 있다.  
- [Anthropic사 사이트](https://www.anthropic.com/)
- [Claude 서비스 사이트](https://claude.ai)
- API 가격: https://docs.anthropic.com/en/docs/about-claude/pricing
- Langchain으로 Anthropic claude 모델 사용: https://python.langchain.com/docs/integrations/chat/anthropic/

## API Key 발급받기
1. https://console.anthropic.com/ 이동 후 가입한다.
2. 로그인 하면 Dashboard로 이동한다. Dashbord에서 `Get API Keys`를 클릭해 이동한다.

![anthropic_apikey1.png](figures/anthropic_apikey1.png)

1. Create key 클릭해서 API Key를 생성한다.

2. 생성된 API Key를 복사한 뒤 저장. (다시 볼 수 없다.)
   - 환경변수에 등록
      - 변수이름: ANTHROPIC_API_KEY
      - 값: 생성된 키

## 결제 정보 등록 및 결제 (최소 $5)
   - Settings -> Billing 
  
![anthropic_apikey3.png](figures/anthropic_apikey3.png)
  - 설문조사 후 카드 등록한다.



## Anthropic의 Claude 모델 사용
- 모델 확인: https://docs.anthropic.com/en/docs/about-claude/models

### Claude 모델 사용을 위한 package 설치

```bash
pip install langchain-anthropic -qU
```
- `anthropic`package도 같이 설치 된다.

In [None]:
%pip install -qU langchain-anthropic

### Langchain-antropic 사용

In [None]:
from langchain_anthropic import ChatAnthropic# , Anthropic 지원하는 모델이 다른 것 같다.
from dotenv import load_dotenv
load_dotenv()
model="claude-sonnet-4-20250514"
llm = ChatAnthropic(
    model=model,
    temperature=0.2,
    max_tokens=1024,
)
result = llm.invoke("Anthropic의 LLM 모델은 어떤 것이 있는지 알려주고 간단한 설명도 부탁해.")

In [2]:
print(result.content)

Anthropic의 주요 LLM 모델은 다음과 같습니다:

1. Claude
- 가장 최신 대화형 AI 모델
- 높은 윤리성과 안전성 강조
- 정확하고 유연한 대화 능력
- 현재 Claude 3 버전 출시

2. Claude 2
- Claude의 이전 버전
- 더 넓은 컨텍스트 이해 능력
- 복잡한 작업 처리에 강점

3. Claude Instant
- 더 가벼운 버전의 모델
- 빠른 응답 속도
- 간단한 작업에 최적화

이 중 Claude 3가 현재 가장 최신이고 성능이 우수한 모델입니다.


# Ollama 모델 사용

Ollama는 로컬 환경에서 오픈소스 LLM을 쉽게 실행할 수 있도록 지원하는 플랫폼이다.

- 주요특징

  - **다양한 모델 지원**: Llama 3, Mistral, Phi 3 등 여러 오픈소스 LLM을 지원.
  - **편리한 모델 설치 및 실행**: 간단한 명령어로 모델을 다운로드하고 실행할 수 있습니다.
  - **운영체제 호환성**: macOS, Windows, Linux 등 다양한 운영체제에서 사용 가능하다.

## 설치
- https://ollama.com/download 에서 운영체제에 맞는 버전을 설치
-  Windows 버전은 특별한 설정 없이 바로 install 실행하면 된다.

## 모델 검색
- https://ollama.com/search
- 모델을 검색한 후 상세페이지로 이동하면 해당 모델을 실행할 수있는 명령어가 나온다.

![ollama_down.png](figures/ollama_down.png)


## 실행 명령어
- `ollama pull 모델명`
  - 모델을 다운로드 받는다. (다운로드만 받고 실행은 하지 않은다.)
- `ollama run 모델명`
  - 모델을 실행한다. 
  - 최초 실행시 모델을 다운로드 받는다.
  - 명령프롬프트 상에서 `프롬프트`를 입력하면 모델의 응답을 받을 수 있다.

## Python/Langchain API
- ollama api
  - https://github.com/ollama/ollama-python
- langchain-ollama
  - https://python.langchain.com/docs/integrations/chat/ollama/
- 설치
  - `pip install langchain-ollama`
  - `ollama` package도 같이 설치 된다.

GUI 환경 : open_webui 설치

## Langchain-ollama 사용

In [56]:
from langchain_ollama import ChatOllama

model = ChatOllama(
    model = "qwen3:0.6b"
)

response = model.invoke("한국의 수도를 알려줘잉~")

In [61]:
Markdown(response.content)

<think>
Okay, the user is asking for the capital of the country. I need to check which country they're referring to. Since they said "한국", which means "the Korean Republic" in Korean, I should mention South Korea. Let me confirm the capital of South Korea. It's Seoul. I should make sure there's no confusion with other countries. Also, maybe add some context to explain why it's the capital, like its significance or history. Keep it straightforward and positive.
</think>

한국의 수도는 **서울**입니다. 서울은 대한민체제의 핵심 도시로, 대한민국의 핵심 정치적, 경제적, 문화적 중심지입니다.

In [64]:
Markdown(model.invoke("What is name of Korean capital").content)

<think>
Okay, the user is asking for the name of the Korean capital. I need to confirm that the capital is Seoul. Let me think. Seoul is the capital city of South Korea, right? It's known for its urban layout and modern infrastructure. I should mention that it's the main city in the country. Also, maybe add some context about its significance, like being the economic hub. Oh, and make sure to state that it's the capital city. I think that's all.
</think>

The Korean capital is **Seoul**. It is the largest city in South Korea and serves as the political, economic, and cultural center of the nation.

# Gemini
- 모델: https://ai.google.dev/gemini-api/docs/models?hl=ko
- 가격정책: https://ai.google.dev/gemini-api/docs/pricing?hl=ko

## API Key 생성

1. https://aistudio.google.com/
    - 연결 후 로그인(구글계정)
2. Get API Key 클릭
   
    ![img](figures/gemini_api1.png)

3. `API Key 만들기` 선택
4. 프로젝트 선택 후 `기존 프로젝트에서 API 키 만들기` 선택

## 환경변수
- `GOOGLE_API_KEY` 환경변수에 생성된 API Key를 등록한다.
## 설치
- `pip install langchain_google_genai`

In [65]:
from dotenv import load_dotenv

load_dotenv()

True

In [67]:
from langchain_google_genai import ChatGoogleGenerativeAI

model = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash-preview-05-20"
)

response = model.invoke("gemini와 gemma의 차이를 알려줘")

In [71]:
Markdown(response.content)

Gemini와 Gemma는 모두 Google에서 개발한 인공지능(AI) 모델이지만, **목적, 규모, 접근 방식, 그리고 사용처에서 중요한 차이**가 있습니다.

핵심적인 차이점을 요약하자면 다음과 같습니다:

*   **Gemini (제미니):** Google의 **최첨단, 대규모, 다중 모달(텍스트, 이미지, 오디오, 비디오 등)** AI 모델입니다. Google의 핵심 AI 기술을 대표하며 주로 API를 통해 접근하거나 Bard(현재 Gemini)와 같은 Google 제품에 통합되어 사용됩니다.
*   **Gemma (젬마):** Gemini 개발에 사용된 연구 및 기술을 기반으로 만들어진 **경량(lightweight), 오픈 소스** 모델 제품군입니다. 개발자와 연구자가 로컬 환경에서 실행하고 미세 조정(fine-tuning)하기 쉽도록 설계되었습니다.

아래 표에서 두 모델의 주요 차이점을 비교해 보세요:

| 구분             | Gemini (제미니)                                     | Gemma (젬마)                                                  |
| :--------------- | :-------------------------------------------------- | :------------------------------------------------------------ |
| **목적**         | - Google의 핵심, 최첨단 AI 기술 시연 및 상업적 활용 | - AI 연구 및 개발 커뮤니티를 위한 **오픈 소스 경량 모델** 제공 |
|                  | - 광범위한 고성능 AI 애플리케이션 구축             | - 로컬 실행, 미세 조정, 효율적인 AI 개발 지원                 |
| **규모/성능**    | - **매우 크고 강력함** (Ultra, Pro, Nano 등 다양한 버전) | - **상대적으로 작고 효율적임** (2B, 7B 등 다양한 크기)        |
|                  | - 다양한 벤치마크에서 최고 수준의 성능             | - 특정 크기 대비 매우 우수한 성능을 보이지만, Gemini Ultra만큼 강력하진 않음 |
| **모달리티**     | - **다중 모달(Multimodal)**: 텍스트, 코드, 이미지, 오디오, 비디오 등 다양한 유형의 데이터 이해 및 생성 | - 주로 **텍스트 기반** (현재까지). 향후 확장 가능성 있음       |
| **접근성/라이선스** | - **폐쇄형(Proprietary)**: Google의 API(Vertex AI, Google AI Studio)를 통해 접근하거나 Google 제품에 통합되어 사용 | - **오픈 소스(Open Source)**: 모델 가중치(weights)가 공개되어 누구나 다운로드하여 상업적 용도로도 사용 및 수정 가능 (Apache 2.0 라이선스) |
| **주요 사용처**  | - Bard/Gemini 챗봇, Google Workspace, Google Cloud의 AI 서비스, 복잡한 AI 애플리케이션 개발 | - 개인 개발자, 연구자, 스타트업, 로컬 환경에서 AI 모델 실행, 특정 도메인에 특화된 AI 모델 미세 조정 |
| **특징**         | - Google의 AI 역량을 집약한 **플래그십 모델**      | - Gemini의 연구 기반 위에 구축된 **'작은 버전' 또는 '파생 모델'** |

### 두 모델의 관계

Gemma는 Gemini의 '작은 버전' 또는 '오픈 소스 파생 모델'이라고 이해할 수 있습니다. Google은 Gemini를 개발하면서 얻은 최첨단 AI 기술과 안전성 연구를 Gemma에도 적용했습니다. 즉, Gemma는 Gemini의 핵심 기술 일부를 계승하면서도, 더 많은 개발자와 연구자가 AI 기술에 접근하고 활용할 수 있도록 '오픈 소스'와 '경량화'에 초점을 맞춘 모델 제품군입니다.

**요약하자면,**

*   **Gemini**는 최첨단 성능과 다중 모달 기능을 필요로 하는 대규모 애플리케이션 및 서비스에 적합한 Google의 핵심 모델입니다.
*   **Gemma**는 개발자와 연구자가 로컬 환경에서 효율적으로 실행하고 미세 조정할 수 있는 오픈 소스 경량 모델로서, AI 생태계의 접근성을 높이는 데 기여합니다.