<!-- # Langchain은 다양한 LLM(대규모 언어 모델)을 지원한다
-	대규모 언어 모델(LLM, Large Language Model)을 개발하는 회사들은 사용자가 자신의 애플리케이션에서 LLM을 손쉽게 활용할 수 있도록 API(Application Programming Interface) 서비스를 제공하고 있다.
-	하지만 각 LLM은 고유한 API 호출 라이브러리(Library)를 제공하기 때문에, 개발자는 동일한 작업을 수행하더라도 LLM에 따라 다른 코드를 작성해야 하는 번거로움이 있다.
-	Langchain은 이러한 문제를 해결하기 위해 다양한 LLM의 API를 통합적으로 지원한다.
-	여러 LLM을 동일한 인터페이스(interface)로 호출할 수 있게 하여 특정 모델에 종속되지 않도록 하고, 필요에 따라 쉽게 다른 모델로 전환할 수 있다.
-	Langchain이 지원하는 주요 LLM 목록
    - https://python.langchain.com/docs/integrations/chat/#featured-providers -->

In [1]:
# 가상환경
# uv venv .venv --python=3.12

# 활성화
# source .venv/bin/activate

In [None]:
# !uv pip install ipykernel ipywidgets
# !uv pip install langchain_openai
# !uv pip install langchain langchain-classic langchain-community python-dotenv

[2mAudited [1m2 packages[0m [2min 43ms[0m[0m
[2mAudited [1m1 package[0m [2min 36ms[0m[0m
[2mAudited [1m4 packages[0m [2min 30ms[0m[0m


# OpenAI 모델 사용
- https://platform.openai.com
  
## 결제
1. 로그인 후 Billing 페이지로 이동.
   - **신용카드가 등록된 경우 바로 충전할 수 있다.**
   - setting -> Billing
  
   ![openai_payment.png](figures/openai_payment.png)
   - 금액 입력 후 `continue`
   - 다음 페이지에서 세금 포함 결제 금액 나오면 `Confirm`  한다.

2. 신용카드 등록
   - Payment methods 탭을 선택하고 카드를 등록한다. 
   
   ![openai_payment2.png](figures/openai_payment2.png)

   - 등록이 끝나면 최초 구매를 진행한다. $5 ~ $100 사이의 금액을 선택할 수 있다.
   - 자동 충전을 설정하고 싶다면 automatic recharge 를 활성화 하고 아래 추가 설정에 입력한다. 
     - 자동 충전은 특정 금액 이하로 떨어지면 자동으로 충전한다. (**비활성화**) 
  
   ![openai_payment3.png](figures/openai_payment3.png)
   
3. 수동으로 **추가 결제하기**
   - Billing 페이지의 Overview에서 `Add to credit balance` 를 클릭한 뒤 금액을 입력하고 결제한다.

## 사용량 확인
- profile/설정 -> Usage 에서 확인

## API Key 생성
  
![openai_create_apikey.png](figures/openai_create_apikey.png)

- 로그인 -> Dashboard -> API Keys -> Create New Secreat Key
> Settings -> API Keys

## API Key 등록
- 환경변수에 등록
  - 변수이름: OPENAI_API_KEY
  - 값: 생성된 키
- dotenv를 이용해서 load
  - Working directory에  `.env` 파일 생성하고 `OPENAI_API_KEY=생성된키` 추가한다.
  - load_dotenv() 호출 하면 .env 파일에 있는 값을 읽은 뒤 환경변수로 등록한다.
- **주의**
  - 생성된 API Key는 노출되면 안된다.
  - API Key가 저장된 파일(코드나 설정파일)이 github에 올라가 공개되서는 안된다.

## 사용 비용 확인
- settings -> Usage 에서 확인

## OpenAI LLM 모델들
-  OpenAI LLM 모델: https://platform.openai.com/docs/models
-  모델별 가격: https://platform.openai.com/docs/pricing
-  토큰사이즈 확인: https://platform.openai.com/tokenizer
   -  1토큰: 영어 3\~4글자 정도, 한글: 대략 1\~2글자 정도
   -  모델이 업데이트 되면서 토큰 사이즈도 조금씩 커지고 있다.

## OpenAI 를 연동하기 위한 package 설치
```bash
pip install langchain-openai -qU
```

- OpenAI 자체 라이브러리 설치
    - `pip install openai -qU`
    - langchain-openai를 설치하면 같이 설치 된다.

In [3]:
# API Key Load -> OS 환경 변수로 등록 (OPENAI_API_KEY)
from dotenv import load_dotenv

load_dotenv()

True

In [None]:
import os
os.getenv('OPENAI_API_KEY')

In [5]:
# !uv pip install python-dotenv

## OpenAI Library 를 이용한 API 호출

In [None]:
from openai import OpenAI

client = OpenAI() # 컴퓨터 설정 (환경변수)에 저장되어 있다면 자동으로 읽어옴. api key가 환경변수에 없으면 직접 입력. 
# response: 인공지능이 보낼 대답을 담아둘 바구니 이름. 
# chat.completions: OpenAI가 제공하는 기능 중 '채팅 형태의 완성' 기능을 쓰겠다는 경로.
# create: 실제로 질문을 생성해서 보내라는 명령어. 
response = client.chat.completions.create(
    model="gpt-5-nano", # 사용할 모델 종류의 이름
    # messages: 대화 내역을 담는 리스트 []. 인공지능이 이전 대화 맥락을 알아야 하므로 리스트 형태로 전달. 
    # {}: 누가: role, 무슨 말: content를 했는지 짝을 지어 표현. 
    # role : user = 나, 사용자  , content: 인공지능에게 전달할 실제 질문.
    messages=[
        {"role":"user", "content":"OpenAI의 LLM 모델 종류는 뭐가 있어?"}
    ]
)

In [None]:
# response라는 바구니 안에 담긴 답변 내용만 꺼내 출력.
print(response.choices[0].message.content)

요약하면, OpenAI의 LLM은 크게 다음 계열로 나뉩니다. API에서 자주 쓰는 모델들 위주로 정리해 두었습니다.

- GPT-4 시리즈
  - GPT-4: 멀티모달 가능(텍스트 입력 외에 이미지 등 입력도 처리하는 버전), 일반 대화 및 고도화된 작업에 사용.
  - GPT-4-turbo: 더 빠르고 비용 효율적인 버전.
  - GPT-4o: 멀티모달(이미지/오디오 포함) 지원 버전으로 발표된 변형도 있습니다.
- GPT-3.5 시리즈
  - GPT-3.5-turbo: 대화형 용도로 가장 많이 쓰이는 고성능 모델.
  - text-davinci-003: 이전 세대의 강력한 텍스트 엔진(지금은 보완/대체되는 경우가 많음).
- Codex(코드 전문) 계열
  - code-davinci-002
  - code-cushman-001
  - GitHub Copilot 등 코드 보조에 주로 사용되는 모델들.
- 과거/레거시 엔진(참고용)
  - GPT-3 계열의 ada, babbage, curie, davinci 등: 다양한 규모의 텍스트 생성용 엔진으로 쓰임.
  - text-curie-001, text-davinci-002 같은 텍스트 엔진도 과거에 널리 사용되었으나 현재는 주력 모델이 아닌 경우가 많습니다.
- 기타 주의점
  - DALL·E(이미지 생성), Whisper(음성 인식) 등은 LLM이지만 텍스트 기반 대화형 모델과 구분되는 멀티모달/다른 기능 모델들입니다.
  - 모델의 가용성은 지역/계정에 따라 다르며, OpenAI의 최신 문서를 통해 현재 사용 가능한 엔진을 확인하는 것이 좋습니다.

혹시 특정 사용 사례(예: 대화형 챗봇, 코드 보조, 요약/정리, 창의적 글쓰기 등)에 맞는 최적의 모델이 어떤지 원하시면 말씀해 주세요. 예에 맞춰 구체적인 추천도 드리겠습니다.


## Langchain을 이용한 OpenAI API 호출

- **ChatOpenAI**
    - chat (대화-채팅) 기반 모델 model.
    - Default 로 gpt-3.5-turbo 사용
    - llm 전달 입력과 llm 응답 출력 타입:  Message
> - **OpenAI**
>     - 문장 완성 모델. (text completion) model
>     - Default로 gpt-3.5-turbo-instruct 사용
>       - instruct 모델만 사용가능
>     - llm전달 입력과 llm 응답 출력 타입: str
- Initializer 주요 파라미터
    -  **temperature**
        -  llm 모델의 출력 무작위성을 지정. 
        -  0 ~ 2 사이 실수를 설정하며 클 수록 무작위성이 커진다. 기본값: 0.7
        -  정확한 답변을 얻어야 하는 경우 작은 값을 창작을 해야 하는 경우 큰 값을 지정한다.
    -  **model_name**
        -  사용할 openai 모델 지정
    - **max_tokens**:
        - llm 모델이 응답할 최대 token 수.
        - gpt-5 모델은 추론과정을 거칠 수있고 이 경우 토큰을 소비한다. 그래서 max_tokens를 너무 작게 잡으면 응답이 안올 수 있다.
    - **api_key**
        - OpenAI API key를 직접 입력해 생성시 사용.
        - API key가 환경변수에 설정 돼있으면 생략. 
-  메소드
    - **`invoke(message)`** : LLM에 질의 메세지를 전달하며 LLM의 응답을 반환.
> - **Message**
>     - Langchain 다양한 상황과 작업 마다 다양한 값들로 구성된 입출력 데이터를 만든다. 
>     - Langchain은 그 상황들에 맞는 다양한 Message 클래스를 제공. 이것을 이용하면 특정 작업에 적합한 입력값을 설정 가능.

In [None]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-5-nano")
# 질의 
response = model.invoke("Langchain은 어떤 Framework인지 설명해줘")

In [None]:
print(type(response))

<class 'langchain_core.messages.ai.AIMessage'>


In [None]:
print(response.content)

다음처럼 요약해볼 수 있어요.

- LangChain이란
  - 대형 언어 모델(Large Language Model, LLM)을 이용한 애플리케이션을 쉽게 구축하도록 돕는 프레임워크/라이브러리예요.
  - LLM 호출, 프롬프트 작성, 데이터 소스 연결, 외부 도구(툴) 사용, 기억(memory) 관리 등을 잘 엮어주는 “연동(glue)” 역할을 합니다.

- 왜 필요한가
  - 단순히 하나의 LLM 호출이 아니라, 여러 단계의 처리(프롬프트 템플릿 작성 → LLM 호출 → 결과 가공)나 도구 사용, 문맥 기억, 벡터 검색 등 다양한 기능을 조합해 복잡한 워크플로우를 쉽게 구축할 수 있게 해줍니다.
  - Retrieval-Augmented Generation(RAG)처럼 외부 데이터에서 정보를 조회해 답을 만드는 패턴도 쉽게 구현 가능하게 해줍니다.

- 핵심 구성 요소
  - 프롬프트(Templates): 사용자의 입력이나 맥락에 맞춘 프롬프트를 미리 정의하고 재사용합니다.
  - 체인(Chains): 여러 프롬프트+LLM 호출을 순차적으로 연결한 파이프라인. 간단한 LLMChain부터 복잡한 다단계까지 가능.
  - 에이전트(Agents)와 도구(Tools): 에이전트가 상황에 따라 필요한 도구(API 호출, 데이터 조회 등)을 선택해 실행하는 의사결정 루프를 구현합니다.
  - 기억/메모리(Memory): 대화 맥락이나 상태를 유지해 연속 대화나 맥락 기반 처리를 가능하게 합니다.
  - 벡터 저장소와 임베딩(Embeddings/Vector Stores): 문서나 지식 베이스를 벡터화해 검색하고, RAG 방식으로 정보를 가져와 답을 생성하는 데 사용합니다.
  - 데이터 로더 및 도큐먼트 인덱싱: 다양한 형식의 문서(웹 페이지, PDF 등)를 로딩하고 인덱싱하는 도구들.
  - 언어/환경: Python용과 TypeScript/JavaScript용 두 가지 주요 구현이 있습니다. 각각의 생태계에서 필요한 모듈들이 제공됩니다.

- 일반적인 사용 사례
 

In [None]:
from langchain_openai import ChatOpenAI
model = ChatOpenAI(model="gpt-5-nano", streaming=True)

res = model.stream("Langchain은 어떤 Framework인지 설명해줘.")
for token in res:
    print(token.content, end="")

In [None]:
# reasoning 설정 (gpt-5 추가)
## reasoning: 문제 전제 -> 논리를 전개 -> 결론을 도출하는 과정을 스스로 계획/구성해서 답을 도출하는 방식
# effort: 추론의 깊이 (low, medium, high), summary: 추론 과정 출력.

model = ChatOpenAI(
    model="gpt-5",
    reasoning={
        "effort": "medium", "summary":"auto"
    }
)
result = model.invoke("LLM 모델에 대한 내용을 초심자를 위해 최대한 쉽게 설명해줘.")

BadRequestError: Error code: 400 - {'error': {'message': 'Your organization must be verified to generate reasoning summaries. Please go to: https://platform.openai.com/settings/organization/general and click on Verify Organization. If you just verified, it can take up to 15 minutes for access to propagate.', 'type': 'invalid_request_error', 'param': 'reasoning.summary', 'code': 'unsupported_value'}}

In [None]:
# reasoning
# content에 추론 내용과 응답 내용을 묶어서 반환
# type: reasoning - 추론 과정, text - 최종 응답. 
result.content

In [None]:
model = ChatOpenAI(model="gpt-5-mini")

prompt = """
태양계를 구성하는 행성들에 대해서 태양에서 가까운 순서대로 알려줘.

결과는 다음 답변 형식에 맞춘다. 
[답변 형식]
- 행성 한국어 이름 (영어 이름): 간단한 한 줄 설명
"""
res = model.invoke(prompt)

In [None]:
print(res.content)

- 수성 (Mercury): 태양에서 가장 가까운 소형 암석 행성으로 얇은 대기와 많은 충돌분화구를 가짐
- 금성 (Venus): 두꺼운 이산화탄소 대기와 강렬한 온실효과로 매우 뜨거운 암석 행성
- 지구 (Earth): 액체 물과 생명이 존재하는 유일한 알려진 행성, 산소가 풍부한 대기 보유
- 화성 (Mars): 붉은 색을 띠는 암석 행성으로 과거 물의 흔적과 거대한 협곡·화산이 있음
- 목성 (Jupiter): 태양계에서 가장 큰 가스 거대행성으로 강력한 자기장과 거대한 소용돌이(대적반) 보유
- 토성 (Saturn): 뚜렷한 고리계를 가진 가스 거대행성으로 밀도가 낮음
- 천왕성 (Uranus): 얼음 성분이 많은 얼음 거대행성으로 자전축이 크게 기울어져 옆으로 도는 특징
- 해왕성 (Neptune): 강한 바람과 푸른 색을 띠는 얼음 거대행성으로 태양에서 가장 멀리 있음


# Hugging Face 모델 사용

## Local 에 설치된 모델 사용
- HuggingFacePipeline 에 Model id를 전달해 Model객체를 생성한다.
- huggingface transformers 라이브러리를 이용해 model을 생성 한 뒤 HuggingFacePipeline 에 넣어 생성한다.
- 모델이 local에 없는 경우 다운로드 받는다.

### HuggingFace 모델을 사용하기 위한 package 설치
```bash
pip install langchain-huggingface transformers -qU
```
- nvidia GPU가 있는 경우 `torch cuda`  버전을 먼저 설치하고 `langchain-huggingface`를 설치 해야 한다. 아니면 `torch cpu` 버전이 설치된다.

In [None]:
# uv pip install torch==2.8
# 수업에서는 2.8하라고 했는데 나는 안돼서 2.2 함.

In [None]:
# !uv pip install transformers

[2K[2mResolved [1m18 packages[0m [2min 79ms[0m[0m                                         [0m
[2K[2mInstalled [1m2 packages[0m [2min 164ms[0m[0m                               [0m
 [32m+[39m [1msafetensors[0m[2m==0.7.0[0m
 [32m+[39m [1mtransformers[0m[2m==4.57.3[0m


In [8]:
!uv pip install torch

[2K[2mResolved [1m9 packages[0m [2min 142ms[0m[0m                                         [0m
[2K[2mInstalled [1m4 packages[0m [2min 625ms[0m[0m                               [0m
 [32m+[39m [1mmpmath[0m[2m==1.3.0[0m
 [32m+[39m [1mnetworkx[0m[2m==3.6.1[0m
 [32m+[39m [1msympy[0m[2m==1.14.0[0m
 [32m+[39m [1mtorch[0m[2m==2.2.2[0m


In [None]:
import torch
from langchain_huggingface.llms import HuggingFacePipeline
from transformers import pipeline

model_id = "google/gemma-3-1b-it"
pipe = pipeline(task="text-generation", model=model_id)
model = HuggingFacePipeline.from_model_id(
    task="text-generation",
    model_id=model_id
)


A module that was compiled using NumPy 1.x cannot be run in
NumPy 2.3.5 as it may crash. To support both 1.x and 2.x
versions of NumPy, modules must be compiled with NumPy 2.0.
Some module may need to rebuild instead e.g. with 'pybind11>=2.12'.

If you are a user of the module, the easiest solution will be to
downgrade to 'numpy<2' or try to upgrade the affected module.
We expect that some modules will need time to support NumPy 2.

Traceback (most recent call last):  File "<frozen runpy>", line 198, in _run_module_as_main
  File "<frozen runpy>", line 88, in _run_code
  File "/Users/jiyouxg/Desktop/SKN21_mjy/10_langchain/.venv/lib/python3.12/site-packages/ipykernel_launcher.py", line 18, in <module>
    app.launch_new_instance()
  File "/Users/jiyouxg/Desktop/SKN21_mjy/10_langchain/.venv/lib/python3.12/site-packages/traitlets/config/application.py", line 1075, in launch_instance
    app.start()
  File "/Users/jiyouxg/Desktop/SKN21_mjy/10_langchain/.venv/lib/python3.12/site-packages/i

/Users/jiyouxg/Desktop/SKN21_mjy/10_langchain/.venv/bin/python: No module named uv


Device set to use cpu
Device set to use cpu


In [None]:
# !uv pip install numpy==1.26.4

[2K[2mResolved [1m1 package[0m [2min 115ms[0m[0m                                          [0m
[2K[2mInstalled [1m1 package[0m [2min 52ms[0m[0m                                 [0m
 [32m+[39m [1mnumpy[0m[2m==1.26.4[0m


In [None]:
# !uv pip show numpy

Name: numpy
Version: 1.26.4
Location: /Users/jiyouxg/Desktop/SKN21_mjy/10_langchain/.venv/lib/python3.12/site-packages
Requires:
Required-by: langchain-community, transformers


In [2]:
res = model.invoke("Huggingface를 소개해줘")

RuntimeError: Numpy is not available

In [None]:
print(res)

In [None]:
msg = [
    {
        "role":"user",
        "content":"서울에 주요 여행지 3곳을 알려줘."
    }
]
res = model.invoke(msg)

# Anthropic의 Claude 모델 사용

- Anthropic사의 Claude 모델은 (성능 순으로) **Haiku, Sonnet, Opus** 세가지 모델이 있다.  
- [Anthropic사 사이트](https://www.anthropic.com/)
- [Claude 서비스 사이트](https://claude.ai)
- API 가격: https://docs.anthropic.com/en/docs/about-claude/pricing
- Langchain으로 Anthropic claude 모델 사용: https://python.langchain.com/docs/integrations/chat/anthropic/

## API Key 발급받기
1. https://console.anthropic.com/ 이동 후 가입한다.
2. 로그인 하면 Dashboard로 이동한다. Dashbord에서 `Get API Keys`를 클릭해 이동한다.

![anthropic_apikey1.png](figures/anthropic_apikey1.png)

1. Create key 클릭해서 API Key를 생성한다.

2. 생성된 API Key를 복사한 뒤 저장. (다시 볼 수 없다.)
   - 환경변수에 등록
      - 변수이름: ANTHROPIC_API_KEY
      - 값: 생성된 키

## 결제 정보 등록 및 결제 (최소 $5)
   - Settings -> Billing 
  
![anthropic_apikey3.png](figures/anthropic_apikey3.png)
  - 설문조사 후 카드 등록한다.



## Anthropic의 Claude 모델 사용
- 모델 확인: https://docs.anthropic.com/en/docs/about-claude/models

### Claude 모델 사용을 위한 package 설치

```bash
pip install langchain-anthropic -qU
```
- `anthropic`package도 같이 설치 된다.

In [None]:
# ! uv pip install langchain-anthropic

### Langchain-antropic 사용

In [None]:
# !uv pip install langchain_anthropic

[2K[2mResolved [1m31 packages[0m [2min 343ms[0m[0m                                        [0m
[2K[37m⠙[0m [2mPreparing packages...[0m (0/3)                                                   
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/3)--------------[0m[0m     0 B/379.07 KiB          [1A
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/3)--------------[0m[0m 16.00 KiB/379.07 KiB        [1A
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/3)--------------[0m[0m 16.00 KiB/379.07 KiB        [1A
[2mlangchain-anthropic [0m [32m[2m------------------------------[0m[0m     0 B/44.65 KiB
[2K[2A[37m⠙[0m [2mPreparing packages...[0m (0/3)--------------[0m[0m 16.00 KiB/379.07 KiB        [2A
[2mlangchain-anthropic [0m [32m----------[2m--------------------[0m[0m 14.88 KiB/44.65 KiB
[2K[2A[37m⠙[0m [2mPreparing packages...[0m (0/3)--------------[0m[0m 16.00 KiB/379.07 KiB        [2A
[2mlangchain-anthropic [0m [32m----------[2m------

In [None]:
from langchain_anthropic import ChatAnthropic   # , Anthropic 지원하는 모델이 다른 것 같다.
from dotenv import load_dotenv
load_dotenv(override=True)

model="claude-sonnet-4-5"
llm = ChatAnthropic(
    model=model,
    temperature=0.2,
    max_tokens=1024,
)
result = llm.invoke("Anthropic의 LLM 모델은 어떤 것이 있는지 알려주고 간단한 설명도 부탁해.")

In [None]:
print(result.content)

# Ollama 모델 사용

Ollama는 로컬 환경에서 오픈소스 LLM을 쉽게 실행할 수 있도록 지원하는 플랫폼이다.

- 주요특징

  - **다양한 모델 지원**: Llama 3, Mistral, Phi 3 등 여러 오픈소스 LLM을 지원.
  - **편리한 모델 설치 및 실행**: 간단한 명령어로 모델을 다운로드하고 실행할 수 있습니다.
  - **운영체제 호환성**: macOS, Windows, Linux 등 다양한 운영체제에서 사용 가능하다.

## 설치
- https://ollama.com/download 에서 운영체제에 맞는 버전을 설치
-  Windows 버전은 특별한 설정 없이 바로 install 실행하면 된다.

## 모델 검색
- https://ollama.com/search
- 모델을 검색한 후 상세페이지로 이동하면 해당 모델을 실행할 수있는 명령어가 나온다.

![ollama_down.png](figures/ollama_down.png)


## 실행 명령어
- `ollama pull 모델명`
  - 모델을 다운로드 받는다. (다운로드만 받고 실행은 하지 않은다.)
- `ollama run 모델명`
  - 모델을 실행한다. 
  - 최초 실행시 모델을 다운로드 받는다.
  - 명령프롬프트 상에서 `프롬프트`를 입력하면 모델의 응답을 받을 수 있다.

## Python/Langchain API
- ollama api
  - https://github.com/ollama/ollama-python
- langchain-ollama
  - https://python.langchain.com/docs/integrations/chat/ollama/
- 설치
  - `pip install langchain-ollama`
  - `ollama` package도 같이 설치 된다.

## Langchain-ollama 사용

In [None]:
# !uv pip install langchain-ollama

[2K[2mResolved [1m27 packages[0m [2min 308ms[0m[0m                                        [0m
[2K[37m⠙[0m [2mPreparing packages...[0m (0/2)                                                   
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/2)--------------[0m[0m     0 B/14.02 KiB           [1A
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/2)----------[2m[0m[0m 14.02 KiB/14.02 KiB         [1A
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/2)----------[2m[0m[0m 14.02 KiB/14.02 KiB         [1A
[2mollama              [0m [32m------------------------------[2m[0m[0m 14.02 KiB/14.02 KiB
[2K[2A[37m⠙[0m [2mPreparing packages...[0m (0/2)--------------[0m[0m     0 B/28.52 KiB           [2A
[2mollama              [0m [32m------------------------------[2m[0m[0m 14.02 KiB/14.02 KiB
[2K[2A[37m⠙[0m [2mPreparing packages...[0m (0/2)--------------[0m[0m 14.88 KiB/28.52 KiB         [2A
[2mollama              [0m [32m------------------

In [None]:
from langchain_ollama import ChatOllama

model = ChatOllama(
    model="gemma3:1b"   # ollama run 하고 실행할 때 사용한 이름.
)
res = model.invoke("안녕하세요")

In [None]:
print(res.contect)

In [None]:
res = model.invoke("AI란 무엇인가요?")
res

AIMessage(content='AI, 즉 인공지능은 단순히 인간처럼 생각하는 기계를 만드는 것을 의미하는 것이 아니라, **컴퓨터가 인간처럼 학습, 문제 해결, 의사 결정을 내릴 수 있도록 설계된 기술**입니다. 좀 더 자세히 풀어 설명하자면 다음과 같습니다.\n\n**1. AI의 기본 개념**\n\n* **인간처럼 생각하고 행동하도록 만든 시스템:** AI는 특정 문제에 대해 스스로 학습하고 행동하는 능력을 갖도록 구축된 프로그램입니다.\n* **데이터를 기반으로 학습:** AI는 많은 데이터를 제공하여 학습합니다. 이 데이터를 통해 패턴을 파악하고, 지식을 축적합니다.\n* **문제 해결 및 의사 결정:** 학습된 지식을 기반으로, 새로운 데이터를 분석하고 결론을 내려, 문제를 해결하거나 의사 결정을 내리는 기능을 수행합니다.\n\n**2. AI의 종류와 분야**\n\nAI는 크게 다음과 같은 유형으로 분류될 수 있으며, 각 분야에서 다양한 기술을 융합하여 활용되고 있습니다.\n\n*   **강건 AI (Strong AI) / 일반 AI:** 현재까지는 꿈에 해당하는 수준으로, 인간처럼 학습하고 상식을 활용하여 실현 능력이 있는 인공지능 모델입니다.\n*   **약건 AI (Weak AI) / 좁은 AI:** 현재 가장 발전한 단계로, 특정 작업을 수행하기 위해 학습된 AI 모델입니다. 예를 들어, 이미지 인식, 음성 인식, 번역, 추천 등에 사용되는 모델들이 여기에 해당합니다.\n*   **특정 분야 AI (Narrow AI) 또는 예시 AI:** 특정 과제에 특화되어 성능이 뛰어난 AI입니다. 예를 들어, 구글 번역, 스وام스, 구글 어시스턴트 등이 있습니다.\n\n**3. AI의 주요 기술 및 응용 분야**\n\n*   **머신러닝 (Machine Learning):** 데이터를 기반으로 학습하여 패턴을 찾고 예측하는 기술입니다.\n    *   **지도 학습:** 학습 데이터를 통해 모델이 학습하도록 하는 방식\n    *   **비지도 학습:

In [None]:
print(res.content)

네, 안녕하세요! 😊 무엇을 도와드릴까요? 어떤 일이 있으신가요?

(Hello! How's it going? ☺️ Do you want to chat or need anything?)


In [None]:
prompt = """
다음 내용을 3문장으로 요약 해줘.

<요약할 내용>
AI, 즉 인공지능은 단순히 인간처럼 생각하는 기계를 만드는 것을 의미하는 것이 아니라, **컴퓨터가 인간처럼 학습, 문제 해결, 의사 결정을 내릴 수 있도록 설계된 기술**입니다. 좀 더 자세히 풀어 설명하자면 다음과 같습니다.\n\n**1. AI의 기본 개념**\n\n* **인간처럼 생각하고 행동하도록 만든 시스템:** AI는 특정 문제에 대해 스스로 학습하고 행동하는 능력을 갖도록 구축된 프로그램입니다.\n* **데이터를 기반으로 학습:** AI는 많은 데이터를 제공하여 학습합니다. 이 데이터를 통해 패턴을 파악하고, 지식을 축적합니다.\n* **문제 해결 및 의사 결정:** 학습된 지식을 기반으로, 새로운 데이터를 분석하고 결론을 내려, 문제를 해결하거나 의사 결정을 내리는 기능을 수행합니다.\n\n**2. AI의 종류와 분야**\n\nAI는 크게 다음과 같은 유형으로 분류될 수 있으며, 각 분야에서 다양한 기술을 융합하여 활용되고 있습니다.\n\n*   **강건 AI (Strong AI) / 일반 AI:** 현재까지는 꿈에 해당하는 수준으로, 인간처럼 학습하고 상식을 활용하여 실현 능력이 있는 인공지능 모델입니다.\n*   **약건 AI (Weak AI) / 좁은 AI:** 현재 가장 발전한 단계로, 특정 작업을 수행하기 위해 학습된 AI 모델입니다. 예를 들어, 이미지 인식, 음성 인식, 번역, 추천 등에 사용되는 모델들이 여기에 해당합니다.\n*   **특정 분야 AI (Narrow AI) 또는 예시 AI:** 특정 과제에 특화되어 성능이 뛰어난 AI입니다. 예를 들어, 구글 번역, 스وام스, 구글 어시스턴트 등이 있습니다.\n\n**3. AI의 주요 기술 및 응용 분야**\n\n*   **머신러닝 (Machine Learning):** 데이터를 기반으로 학습하여 패턴을 찾고 예측하는 기술입니다.\n    *   **지도 학습:** 학습 데이터를 통해 모델이 학습하도록 하는 방식\n    *   **비지도 학습:** 데이터에서 패턴을 찾아 학습하도록 하는 방식\n    *   **강화 학습:** 주어진 결과를 기반으로 시행착오를 통해 학습하도록 하는 방식 (게임, 롤플레잉 등)\n*   **딥러닝 (Deep Learning):** 인공 신경망을 이용하여 복잡한 데이터를 학습하는 기술입니다. 특히 이미지, 언어, 음성의 딥러닝 모델이 개발되어 활용되고 있습니다.\n*   **자연어 처리 (Natural Language Processing):** 인간의 언어를 컴퓨터에게 이해하고 해석하는 기술입니다. (챗봇, 기사 번역, 음성 인식 등)\n*   **컴퓨터 비전 (计算机视觉):** 이미지 및 비디오 데이터를 이해하고 해석하는 기술입니다. (자율 주행, 객체 인식, 영상 분석 등)\n*   **로보틱스 (Robotics):**  AI를 활용하여 로봇을 설계, 개발, 운용하는 기술입니다.\n\n**4. AI가 가져올 미래의 변화**\n\nAI는 우리 삶을 더욱 편리하게 만들고 효율적으로 만들 것입니다. 하지만 동시에 일자리에 영향을 미치는 등 다양한 문제점도 제기될 수 있으므로, AI 개발과 활용에 대한 지속적인 논의와 관점이 필요합니다.\n\n**더 궁금하신 점이 있다면 아래와 같이 질문해주세요.**\n\n*   특정 분야의 AI에 대해 알고 싶은 게 있을까요?\n*   AI가 현재 우리 생활과 어떻게 영향을 주고 있나요?\n*   AI의 윤리적인 문제를 해결하기 위한 노력은 무엇인가요?


"""

res = model.invoke(prompt)

# Gemini
- 모델: https://ai.google.dev/gemini-api/docs/models?hl=ko
- 가격정책: https://ai.google.dev/gemini-api/docs/pricing?hl=ko

## API Key 생성

1. https://aistudio.google.com/api-keys
    - 연결 후 로그인(구글계정)
2. `API Key 만들기` 선택
   
    ![img](figures/gemini_api1.png)

3. `키이름 지정`하고 `가져온 프로젝트 선택`에서 프로젝트 선택(없으면 만든다) 하고 키 만들기
4. 키가 생성되면 왼쪽에 복사 아이콘을 클릭하면 키가 복사된다.

## 환경변수
- `GOOGLE_API_KEY` 환경변수에 생성된 API Key를 등록한다.
## 설치
- `pip install langchain_google_genai`

In [None]:
# !uv pip install langchain_google_genai

[2K[2mResolved [1m36 packages[0m [2min 322ms[0m[0m                                        [0m
[2K[37m⠙[0m [2mPreparing packages...[0m (0/9)                                                   
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/9)--------------[0m[0m     0 B/11.28 KiB           [1A
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/9)----------[2m[0m[0m 11.28 KiB/11.28 KiB         [1A
[2K[1A[37m⠙[0m [2mPreparing packages...[0m (0/9)----------[2m[0m[0m 11.28 KiB/11.28 KiB         [1A
[2mcachetools          [0m [32m------------------------------[2m[0m[0m 11.28 KiB/11.28 KiB
[2K[2A[37m⠙[0m [2mPreparing packages...[0m (0/9)--------------[0m[0m     0 B/81.19 KiB           [2A
[2mcachetools          [0m [32m------------------------------[2m[0m[0m 11.28 KiB/11.28 KiB
[2K[2A[37m⠙[0m [2mPreparing packages...[0m (0/9)--------------[0m[0m     0 B/81.19 KiB           [2A
[2mcachetools          [0m [32m------------------

In [None]:
load_dotenv(override=True)

True

In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI

model = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash",   # 무료: 분당 60회, 하루 1000회까지 무료
)
res = model.invoke("gemini와 gemma 모델의 차이는 무엇인가요?")

In [None]:
print(res.content)

Gemini와 Gemma 모델은 모두 Google에서 개발했지만, **목적, 규모, 성능, 가용성 및 대상 사용자**에서 명확한 차이를 가지고 있습니다. 간단히 말해, **Gemini는 Google의 최고 성능 플래그십 멀티모달 모델**이고, **Gemma는 Gemini의 연구를 기반으로 만들어진 더 작고 효율적인 "오픈 모델" 패밀리**입니다.

다음 표는 두 모델의 주요 차이점을 요약합니다.

| 특징               | Gemini                                                                 | Gemma                                                                            |
| :----------------- | :--------------------------------------------------------------------- | :------------------------------------------------------------------------------- |
| **목적 및 역할**   | Google의 **플래그십 AI 모델**<br>최고 성능의 범용 AI 시스템              | **개발자 및 연구자**를 위한 효율적이고 접근성 높은 "오픈 모델"                  |
| **규모 및 복잡성** | **매우 큼 (Ultra, Pro, Nano 등 다양한 크기)**<br>복잡하고 강력한 아키텍처 | **비교적 작음 (2B, 7B 등)**<br>효율성과 성능 간의 균형에 초점                   |
| **성능 및 능력**   | **최첨단(State-of-the-art)**<br>**멀티모달** (텍스트, 이미지, 오디오, 비디오 등) <br>복잡한 추론, 코드 생성, 창의적 작업 등                                   | **해당 규모

In [None]:
from IPython.display import Markdown

Markdown(res.content)

Gemini와 Gemma 모델은 모두 Google에서 개발했지만, **목적, 규모, 성능, 가용성 및 대상 사용자**에서 명확한 차이를 가지고 있습니다. 간단히 말해, **Gemini는 Google의 최고 성능 플래그십 멀티모달 모델**이고, **Gemma는 Gemini의 연구를 기반으로 만들어진 더 작고 효율적인 "오픈 모델" 패밀리**입니다.

다음 표는 두 모델의 주요 차이점을 요약합니다.

| 특징               | Gemini                                                                 | Gemma                                                                            |
| :----------------- | :--------------------------------------------------------------------- | :------------------------------------------------------------------------------- |
| **목적 및 역할**   | Google의 **플래그십 AI 모델**<br>최고 성능의 범용 AI 시스템              | **개발자 및 연구자**를 위한 효율적이고 접근성 높은 "오픈 모델"                  |
| **규모 및 복잡성** | **매우 큼 (Ultra, Pro, Nano 등 다양한 크기)**<br>복잡하고 강력한 아키텍처 | **비교적 작음 (2B, 7B 등)**<br>효율성과 성능 간의 균형에 초점                   |
| **성능 및 능력**   | **최첨단(State-of-the-art)**<br>**멀티모달** (텍스트, 이미지, 오디오, 비디오 등) <br>복잡한 추론, 코드 생성, 창의적 작업 등                                   | **해당 규모 대비 매우 우수**<br>**주로 텍스트 중심** (파인튜닝으로 확장 가능)<br>빠른 추론, 미세조정(fine-tuning)에 적합                                                 |
| **가용성 및 접근성** | **독점적(Proprietary) 모델**<br>Google 제품(Bard, Pixel) 및 Google Cloud(Vertex AI), Google AI Studio를 통한 API 형태로 제공 | **"오픈 모델" (Open Models)**<br>모델 가중치가 공개되어 누구나 다운로드, 실행, 미세조정 가능 (특정 라이선스 하에)<br>로컬 실행, 온디바이스 AI 등에 적합 |
| **주요 사용 사례** | 고급 챗봇, 복잡한 문제 해결, 멀티모달 콘텐츠 이해 및 생성, 연구 개발 | 온디바이스 AI, 맞춤형 AI 애플리케이션 개발, 연구, 교육, 비용 효율적인 솔루션 |
| **개발 기반**      | Google DeepMind의 독자적 연구 및 기술력                                | Gemini 개발에 사용된 **동일한 연구 및 기술을 기반**으로 개발됨                  |
| **대상 사용자**    | 일반 사용자 (Bard), 기업/엔터프라이즈 개발자, 고급 AI 연구자            | AI 개발자, 연구자, 학생, 스타트업, 리소스 제약이 있는 환경                     |

**요약하자면:**

*   **Gemini**는 Google의 가장 강력하고 다재다능한 AI 모델로, 최상위 성능을 목표로 하며 주로 Google의 제품과 클라우드 서비스를 통해 제공됩니다.
*   **Gemma**는 Gemini의 선진 기술을 활용하여 더 작고 효율적으로 만들어진 모델 패밀리로, 개발자와 연구자들이 자유롭게 사용하고 미세조정할 수 있도록 "오픈 모델" 형태로 공개되었습니다. 이는 Google의 AI 전문 지식을 더 넓은 커뮤니티에 확산시키고 혁신을 촉진하려는 목적을 가집니다.