## LLM 모델
LangChain에서 LLM은 대규모 언어 모델(GPT, Claude, Gemini, Llama 등)을 일관된 인터페이스로 연결해 텍스트 생성·분석을 수행하는 핵심 엔진이다.<br>
LLM은 AI의 뇌 역할을 하며 LangChain은 이를 체인·에이전트 구조로 확장해 다양한 응용 서비스를 구현한다

In [1]:
import os
from dotenv import load_dotenv

# .env 파일의 내용 불러오기
load_dotenv("C:/env/.env")

True

### OpenAI

In [2]:
from langchain_openai import ChatOpenAI
model = ChatOpenAI(model="gpt-4o-mini")

response= model.invoke("하늘은 왜 파란가요?")
print(response.content)

하늘이 파란 이유는 지구 대기의 산란 현상 때문입니다. 태양광은 여러 색의 빛으로 이루어져 있으며, 각 색의 빛의 파장이 다릅니다. 이 중 파란색 빛은 짧은 파장을 가지고 있어서 대기 중의 공기 분자와 더 많이 산란됩니다.

태양빛이 대기에 들어오면, 파란색 빛이 다른 색의 빛보다 더 많이 산란되어 하늘이 파란색으로 보이는 것입니다. 특히, 태양이 수평선 근처에 있을 때는 더 많은 대기층을 통과해야 하기 때문에, 길고 짧은 파장의 색들이 더 많이 섞이고 산란되어 붉은색 또는 주황색의 노을이 생기게 됩니다. 반면, 정오쯤 태양이 높이 있을 때는 직진하는 빛이 많기 때문에 하늘이 더 파랗게 보이게 됩니다.


### Anthropic
https://docs.claude.com/en/docs/about-claude/models/overview?utm_source=chatgpt.com

In [3]:
# .env 파일에 ANTHROPIC_API_KEY="YOUR_API_KEY" 를 추가한다.

In [4]:
# !pip install langchain-anthropic
# notebook Kernel Restart!!

In [7]:
from langchain_anthropic import ChatAnthropic
from langchain_core.messages import HumanMessage

# 모델 초기화
llm = ChatAnthropic(
    model="claude-sonnet-4-5-20250929",   # 사용 가능한 버전: opus, sonnet, haiku 등
    temperature=0.7
)

# 메시지 구성
messages = [HumanMessage(content="하늘은 왜 파란가요?")]

# 모델 응답
response = llm.invoke(messages)

print(response.content)

# 하늘이 파란 이유

하늘이 파랗게 보이는 이유는 **레일리 산란(Rayleigh scattering)** 때문입니다.

## 원리

1. **태양빛의 구성**
   - 태양빛은 여러 색깔(파장)이 섞인 백색광입니다

2. **대기와의 상호작용**
   - 태양빛이 대기를 통과할 때 공기 분자와 부딪힙니다
   - 파장이 짧은 빛(파란색, 보라색)이 파장이 긴 빛(빨간색)보다 더 많이 산란됩니다

3. **파란색이 보이는 이유**
   - 보라색이 더 많이 산란되지만, 우리 눈은 파란색에 더 민감합니다
   - 산란된 파란 빛이 하늘 전체에서 우리 눈으로 들어옵니다

## 다른 시간대의 하늘

- **일출/일몰**: 빛이 대기를 더 길게 통과하면서 파란 빛은 다 산란되고, 빨간색/주황색 빛만 우리에게 도달합니다
- **우주에서**: 대기가 없어 산란이 일어나지 않아 하늘이 검게 보입니다


### Google Gemini
https://ai.google.dev/gemini-api/docs/models/gemini?hl=ko

In [8]:
# .env 파일에 GOOGLE_API_KEY="YOUR_API_KEY"를 추가한다.

In [9]:
# !pip install langchain_google_genai

### Ollama
Ollama는 로컬 환경에서 Llama 3, Mistral, Gemma 등 다양한 LLM을 직접 실행할 수 있게 해주는 오픈소스 플랫폼이다.
클라우드 요금 없이 빠르고 보안성 높게 AI 모델을 구동·연동할 수 있다는 점이 가장 큰 장점이다. <br>
 https://ollama.com/
 
- Llama 3: 성능 최고, 논리·코딩·대화 품질이 가장 우수하지만 모델이 커서 속도는 다소 느림. <br>
- Mistral 7B : 성능과 속도의 균형형, 중간 크기 모델로 가볍고 빠르며 추론력도 양호. <br>
- Gemma 2 / 3 : ⚡속도 가장 빠름, 작은 환경에 적합하지만 이해력·정확도는 낮음. <br>
고성능이 목표라면 Llama 3, 속도·효율을 원하면 Mistral, 저사양 환경이면 Gemma가 가장 적합하다. <br>


In [10]:
# ! pip install langchain-ollama

In [13]:
from langchain_ollama import ChatOllama

# Ollama 모델을 불러옵니다.
llm = ChatOllama(model="gemma3:4b")

response= llm.invoke("하늘은 왜 파란가요?")
print(response.content)

하늘이 파랗게 보이는 현상은 ‘레일리 산란(Rayleigh scattering)’이라는 과학적인 현상 때문에 발생합니다. 좀 더 자세히 설명해 드릴게요.

**1. 햇빛의 구성:**

* 햇빛은 사실 여러 가지 색깔의 빛이 섞여 있는 것입니다. 빨간색, 주황색, 노란색, 초록색, 파란색, 보라색 등 다양한 색깔의 빛이 모두 햇빛 안에 포함되어 있습니다.

**2. 레일리 산란:**

* 햇빛이 지구 대기에 들어오면, 대기 중의 작은 입자들(질소, 산소 분자 등)과 부딪히게 됩니다.
* 이 때 빛이 사방으로 흩어지는 현상을 ‘산란’이라고 합니다.
* 빛의 파장이 짧을수록 산란이 더 잘 일어납니다. 파장이 짧은 파란색, 보라색 빛은 빨간색, 주황색 빛보다 훨씬 더 쉽게 산란됩니다.

**3. 왜 파란색이 더 잘 보이는가?**

* 햇빛이 대기를 통과할 때, 파란색 빛이 다른 색깔의 빛보다 훨씬 더 많이 산란됩니다.
* 이렇게 산란된 파란색 빛이 우리 눈에 들어오기 때문에 하늘이 파랗게 보이는 것입니다.

**4. 보라색은 왜 보이지 않을까?**

* 보라색 빛도 파란색 빛만큼 산란이 잘 되지만, 햇빛 자체에 포함된 보라색 빛의 양이 파란색 빛보다 적고, 우리 눈이 파란색에 더 민감하게 반응하기 때문에 보라색은 하늘에서 덜 느껴지는 것입니다.


**5. 일몰/해질녘 하늘은 왜 붉은색/주황색인가?**

* 해가 지는 시간에는 햇빛이 대기를 통과하는 거리가 훨씬 길어집니다.
* 이 과정에서 파란색 빛은 대부분 산란되어 우리 눈에 도달하지 못하고, 파장이 긴 빨간색, 주황색 빛만이 우리 눈에 들어오게 됩니다.

이해가 되셨나요? 혹시 더 궁금한 점이 있다면 언제든지 질문해주세요!


In [14]:
# Ollama 앱 실행 후 "gemma3:12b" 모델 다운로드 후 실행한다
from langchain_ollama import ChatOllama

# Ollama 모델을 불러옵니다.
llm = ChatOllama(model="gemma3:12b")

response= llm.invoke("하늘은 왜 파란가요?")
print(response.content)
# 응답 오래 걸림 (CPU 사용 가능)

하늘이 파란 이유는 **레일리 산란(Rayleigh scattering)**이라는 현상 때문입니다. 좀 더 자세히 설명해 드릴게요.

**1. 햇빛은 여러 색깔의 빛으로 이루어져 있어요.**

무지개를 생각해보세요. 햇빛이 빗방울에 굴절되면서 빨주노초파남보 모든 색깔의 빛으로 분리되어 보여주죠. 햇빛은 사실 이 모든 색깔의 빛이 섞여 있는 것입니다.

**2. 빛이 공기 중의 작은 입자들과 부딪히면 흩어집니다.**

햇빛이 지구 대기를 통과할 때, 공기 중의 질소나 산소와 같은 작은 입자들과 부딪힙니다. 이때 빛은 모든 방향으로 흩어지게 되는데, 이를 '산란'이라고 합니다.

**3. 파장이 짧은 빛일수록 더 잘 흩어집니다.**

여기서 중요한 건, 빛의 파장에 따라 산란되는 정도가 다르다는 것입니다. 파장이 짧은 빛(파란색, 남색)은 파장이 긴 빛(빨간색, 주황색)보다 훨씬 더 잘 산란됩니다. 마치 작은 돌멩이가 큰 파도보다 더 쉽게 튀는 것과 비슷하다고 생각하면 됩니다.

**4. 그래서 하늘은 파랗게 보이는 겁니다.**

햇빛이 대기를 통과할 때, 파란색 빛이 다른 색깔의 빛보다 더 많이 산란되어 우리 눈에 들어오기 때문에 하늘이 파랗게 보이는 것입니다.

**추가적으로 알아두면 좋은 점:**

*   **노을은 왜 붉은색일까요?** 해가 지면 햇빛이 우리 눈에 들어오는 거리가 더 길어집니다. 이 과정에서 파란색 빛은 대부분 산란되어 사라지고, 덜 산란되는 붉은색 빛이 우리 눈에 들어오기 때문에 노을이 붉게 보이는 것입니다.
*   **달에서는 하늘이 검은색이에요.** 달에는 대기가 없기 때문에 빛이 산란되지 않아 하늘이 검게 보입니다.


### HuggingFacePipeline
HuggingFacePipeline은 LangChain에서 Hugging Face의 Transformer 모델을 직접 호출할 수 있도록 연결해주는 클래스이다.<br>
OpenAI API처럼 외부 LLM을 쓰지 않고 로컬 또는 Hugging Face Hub 모델을 바로 사용할 수 있게 해준다.

In [2]:
# !pip install transformers torch  langchain-huggingface

In [5]:
from transformers import pipeline
from langchain_huggingface import HuggingFacePipeline

# 1. Hugging Face 파이프라인 생성
pipe = pipeline(
    "text-generation",
    model="gpt2",           # 영어 전용 모델 ,  성능 낮음   
    max_new_tokens=200,
    temperature=0.7    
)

# 2. LangChain용 래퍼로 감싸기
llm = HuggingFacePipeline(pipeline=pipe)

# 3. 모델 호출
response = llm.invoke("Explain Why the sky is blue.")
print(response)

Device set to use cpu
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Explain Why the sky is blue.

"There is a small group of people who believe the sky is blue and that it is the best view of the day. People who believe that the sky is blue would like to explain the reason they are saying that. They don't want to spend their whole lives trying to find out the truth of this theory. It is clear that the sky is blue and the sky is blue."

"This is not about conspiracy theories," said the mother who was leading the rally. "This is about people who are trying to explain why the sky is blue. They want to tell people who disagree with the sky that they are wrong and that they are the ones who are wrong. They need to stop. They need to stop trying to explain why the sky is blue. They should stop calling themselves conspiracy theorists."

"I'm just trying to get it right," the mother declared. "I'm trying to get it right before I say things like 'I didn't do anything wrong


In [6]:
from langchain_huggingface import HuggingFacePipeline

# HuggingFace 모델을 다운로드
hf = HuggingFacePipeline.from_model_id(
    model_id="beomi/llama-2-ko-7b",  # 사용할 모델의 ID
    task="text-generation",          # 수행할 작업을 지정 -> 텍스트 생성
                                     
    pipeline_kwargs={"max_new_tokens": 512},
)

# 모델 크기 12.5 GB  , 100 Mbps에서 약 17분 예상, 다운로드 완료 후 재실행시는 캐시에서 읽어서 바로 실행됨
# 다운로드 경로 : C:\Users\<사용자 계정이름>\.cache\huggingface

Loading checkpoint shards:   0%|          | 0/15 [00:00<?, ?it/s]

Device set to use cpu


In [None]:
# 모델 호출 (추론)  : # CPU 환경에서 수십분 소요
prompt = "하늘은 왜 파란가요?"
response = hf.invoke(prompt)  # CPU 환경에서 수십분 소요

print("질문:", prompt)
print("모델 응답:", response)

# 일반 데스크탑 (i5, 16GB RAM) 6~8코어 --> 20 ~ 40분
# 토큰 생성 속도 초당 0.5~1 토큰n
# CUDA 지원 GPU (예: RTX 3060 이상) device_map="auto" 또는 device=0 설정으로 GPU로 전환 → 512토큰 기준 5 ~ 10초 이내 완료

In [None]:
# GPU가 있을 경우 : device_map="auto" 또는 device=0 으로 설정
# GPU 없을경우 : device=-1
from langchain_huggingface import HuggingFacePipeline

hf = HuggingFacePipeline.from_model_id(
    model_id="beomi/llama-2-ko-7b",
    task="text-generation",
    # device=0,  # GPU 사용
    device=-1,  # CPU 사용
    # model_kwargs={"device_map": "auto"},
    pipeline_kwargs={"max_new_tokens": 512},
)

# 모델 호출 (추론)
prompt = "하늘은 왜 파란가요?"
response = hf.invoke(prompt)

print("질문:", prompt)
print("모델 응답:", response)

# GPU 메모리 부족시 (14.70 GiB 필요) 
# OutOfMemoryError: CUDA out of memory. Tried to allocate 172.00 MiB. GPU 0 has a total capacity of 8.00 GiB of which 0 bytes is free. 
# Of the allocated memory 14.70 GiB is allocated by PyTorch, and 1.44 MiB is reserved by PyTorch but unallocated. 
# If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  
# See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)

In [1]:
# CUDA 확인
!nvidia-smi

NVIDIA-SMI has failed because you do not have suffient permissions. Please try running as an administrator.


In [2]:
# ! pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

In [3]:
import torch
print("CUDA available:", torch.cuda.is_available())
print("CUDA device count:", torch.cuda.device_count())
print("PyTorch build:", torch.__version__)

CUDA available: False
CUDA device count: 0
PyTorch build: 2.8.0+cpu


In [None]:
from langchain_huggingface import HuggingFacePipeline

llm = HuggingFacePipeline.from_model_id(
    model_id="EleutherAI/polyglot-ko-1.3b", # 성능 낮음
    task="text-generation",
    pipeline_kwargs={"max_new_tokens": 100, "temperature": 0.7},
)

response = llm.invoke("하늘은 왜 파란가? 그 이유는")
print(response)
# 모델 크기 약 2.1 GB  , 100 Mbps에서 약 3~5분 예상, 다운로드 완료 후 재실행시는 캐시에서 읽어서 바로 실행됨
# 다운로드 경로 : C:\Users\storm\.cache\huggingface

# Polyglot-Ko-1.3B는 “Instruction (질문-답변)” 모델이 아님
# 이 모델은 단순 언어 모델 (Language Model) 입니다
# “Q&A 구조”로 학습된 게 아니라 “문장 다음에 올 단어를 예측하는” 형태로 학습됨.

### GPT4All
GPT4All은 Nomic AI가 개발한 오픈소스 로컬 LLM(Local Large Language Model) 프레임워크이다. <br>
이 모델은 인터넷 연결 없이 실행할 수 있으며, GPU 없이도 CPU 기반으로 추론 가능하다는 점이 특징이다. <br>
https://www.nomic.ai/gpt4all

In [4]:
# ! pip install  gpt4all

In [5]:
# GTP4All Falcon 모델 : (3.9GB) , 한국어 지원 안됨
# 윈도우 메뉴의 GTP4All 프로그램을 실행해서 모델을 미리 다운로드해 놓은 다음 실행
# 모델 다운로드 경로:  C:\Users\<사용자 계정 이름>\AppData\Local\nomic.ai\GPT4All\gpt4all-falcon-newbpe-q4_0.gguf

from langchain_community.llms import GPT4All

model_path = "C:/Users/storm/AppData/Local/nomic.ai/GPT4All/gpt4all-falcon-newbpe-q4_0.gguf"

llm = GPT4All(model=model_path)
response = llm.invoke("Why is the sky blue?") # 한국어는 지원 안됨
print(response)


The sky appears blue because of a process called Rayleigh scattering. When sunlight passes through the Earth's atmosphere, it scatters in all directions, including towards the blue end of the visible spectrum. This scattering causes the blue light to be scattered more than other colors, making the sky appear blue.


In [6]:
# EEVE-Korean-Instruct-10.8B-v1.0-Q4_0.gguf 한국어 지원 모델 : 5.7GB 
# 윈도우 메뉴의 GTP4All 프로그램을 실행해서 모델을 미리 다운로드해 놓은 다음 실행
# 모델 다운로드 경로:  C:\Users\<사용자 계정 이름>\AppData\Local\nomic.ai\GPT4All\EEVE-Korean-Instruct-10.8B-v1.0-Q4_0.gguf

from langchain_community.llms import GPT4All
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.callbacks import StreamingStdOutCallbackHandler

# 프롬프트 
prompt = ChatPromptTemplate.from_template(
    """<s>A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions.</s>
<s>Human: {question}</s>
<s>Assistant:
"""
)

#  모델 초기화
# model는 GPT4All 모델 파일의 경로를 지정
model_path = "C:/Users/storm/AppData/Local/nomic.ai/GPT4All/EEVE-Korean-Instruct-10.8B-v1.0-Q4_0.gguf"

llm = GPT4All(
    model=model_path,
    # backend="gpu",  # GPU 설정
    streaming=True,   # 스트리밍 설정
    callbacks=[StreamingStdOutCallbackHandler()],  # 콜백 설정
)

# 체인 생성
chain = prompt | llm | StrOutputParser()

# 실행
response = chain.invoke({"question": "하늘은 왜 파란가요?"})   # CPU에서 동작 응답 느림
print(response)

하늘이 파란색으로 보이는 이유는 대기 중 산소와 질소가 포함된 가스 분자들이 태양광을 흡수하고 재방출하기 때문입니다. 이 과정은 빛의 산란이라고 알려져 있습니다.

태양에서 나오는 햇빛은 주로 파랑과 보라색 같은 단파장 색깔로 구성되어 있으며, 이는 공기 입자에 의해 더 잘 산란됩니다. 대기 중 가스 분자들은 태양광을 흡수하고 재방출하는데, 이 과정에서 일부 빛을 다시 지구 표면으로 되돌려 보내게 됩니다.

이 빛의 산란은 하늘에 파란색을 부여합니다. 하지만 실제로는 햇빛과 공기 입자 사이의 상호작용 때문에 다양한 색조가 나타납니다. 예를 들어, 대기 중 수증기가 태양광을 흡수하고 재방출하면 하늘이 더 푸른색으로 보일 수 있습니다.

하늘이 파란색으로 보이는 이유는 대기 중 산소와 질소가 포함된 가스 분자들이 태양광을 흡수하고 재방출하기 때문입니다. 이 과정은 빛의 산란이라고 알려져 있습니다.는 대기 중 물방울 수가 많아져 햇빛을 더 강하게 산란시켜 하늘을 더욱 선명하게 보이게 합니다.

태양에서 나오는 햇빛은 주로 파랑과 보라색 같은 단파장 색깔로 구성되어 있으며, 이는 공기 입자에 의해 더 잘 산란됩니다. 대기 중 가스 분자들은 태양광을 흡수하고 재방출하는데, 이 과정에서 일부 빛을 다시 지구 표면으로 되돌려 보내게 됩니다.

이 빛의 산란은 하늘에 파란색을 부여합니다. 하지만 실제로는 햇빛과 공기 입자 사이의 상호작용 때문에 다양한 색조가 나타납니다. 예를 들어, 대기 중 수증기가 태양광을 흡수하고 재방출하면 하늘이 더 푸른색으로 보일 수 있습니다.

또한, 지평선 근처의 구름이나 먼지 같은 다른 요소들도 빛 산란에 영향을 줄 수 있으며, 이로 인해 하늘 색깔이 달라질 수 있습니다. 예를 들어, 해질녘과 새벽에는 대기 중 물방울 수가 많아져 햇빛을 더 강하게 산란시켜 하늘을 더욱 선명하게 보이게 합니다.
