### **Google AI chat models (gemini-pro)**

Google AI의 `gemini`와 `gemini-vision` 모델 사용 방법 

`ChatGoogleGenerativeAI` 클래스를 사용


In [None]:
# !pip install -qU langchain-google-genai

In [2]:
from langchain_google_genai import ChatGoogleGenerativeAI

# ChatGoogleGenerativeAI 언어 모델을 초기화합니다.
llm = ChatGoogleGenerativeAI(model="gemini-2.0-flash-lite")

# 프롬프트를 전달하여 결과를 생성합니다.
answer = llm.stream("자연어처리에 대해서 간략히 설명해 줘")

for chunk in answer:
    print(chunk.content, end = '', flush = True)

자연어 처리(Natural Language Processing, NLP)는 컴퓨터가 인간의 언어(자연어)를 이해하고, 생성하고, 처리할 수 있도록 하는 인공지능 분야입니다. 쉽게 말해, **컴퓨터가 사람의 말을 알아듣고, 대답하고, 글을 쓸 수 있게 만드는 기술**이라고 할 수 있습니다.

**핵심 목표:**

*   **이해 (Understanding):** 텍스트나 음성 데이터를 분석하여 의미, 의도, 맥락을 파악합니다.
*   **생성 (Generation):** 컴퓨터가 자연어 텍스트나 음성을 만들어냅니다.
*   **처리 (Processing):** 언어 데이터를 다양한 방식으로 가공하고 활용합니다.

**주요 기술 및 분야:**

*   **텍스트 분석:** 단어 빈도 분석, 감성 분석, 주제 모델링 등 텍스트의 특징을 파악합니다.
*   **자연어 이해 (NLU):** 문장의 의미를 파악하고, 의도를 추론합니다. (예: 챗봇의 질문 이해)
*   **자연어 생성 (NLG):** 컴퓨터가 자연스러운 문장을 만들어냅니다. (예: 기사 자동 생성, 챗봇 답변)
*   **기계 번역:** 한 언어에서 다른 언어로 텍스트를 번역합니다.
*   **음성 인식:** 음성 데이터를 텍스트로 변환합니다.
*   **음성 합성:** 텍스트를 음성으로 변환합니다.*   **질의 응답 (QA):** 질문에 대한 답변을 찾아 제공합니다.
*   **정보 추출:** 텍스트에서 특정 정보를 찾아냅니다.

**활용 분야:**

*   **챗봇 및 가상 비서:** 고객 응대, 정보 제공, 업무 자동화 등
*   **번역 서비스:** 구글 번역, 파파고 등
*   **검색 엔진:** 검색어 이해 및 관련 정보 제공
*   **소셜 미디어 분석:** 여론 분석, 감성 분석
*   **스팸 메일 필터링:** 스팸 메일 자동 분류
*   **자동 요약:** 긴 텍스트를 요약
*   **의료 분야:** 의료 기록 분석, 질병 진단 보조 등
*   **금융 분야:** 리스크 관리, 사기 

In [None]:
from langchain_core.prompts import PromptTemplate

# ChatGoogleGenerativeAI 언어 모델을 초기화합니다.
model = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash-lite",  # 사용할 모델을 지정합니다.
)

# 프롬프트를 생성합니다.
prompt = PromptTemplate.from_template(
    "예/아니오 질문에 대답하세요. {question}는 과일입니까?"
)

# 체인을 생성합니다.
chain = prompt | model

reponse = chain.stream(question="바나나")

for chunk in reponse:
    print(chunk.content, end = '', flush = True)

## Safety Settings

Gemini 모델에는 기본 안전 설정(Satety Settings) 이 있지만, 이를 재정의할 수 있습니다.

만약 모델로부터 많은 "Safety Warnings"를 받고 있다면, 모델의 `safety_settings` 속성을 조정해 볼 수 있습니다.

Google의 [Safety Setting Types](https://ai.google.dev/api/python/google/generativeai/types/SafetySettingDict) 문서에서는 사용 가능한 카테고리와 임계값에 대한 열거형 정보를 제공합니다.

이 문서에는 콘텐츠 필터링 및 안전 설정과 관련된 다양한 카테고리와 해당 임계값이 정의되어 있어, 개발자들이 생성형 AI 모델을 활용할 때 적절한 안전 설정을 선택하고 적용하는 데 도움을 줍니다.

이를 통해 개발자들은 모델이 생성하는 콘텐츠의 안전성과 적절성을 보장하고, 사용자에게 유해하거나 부적절한 내용이 노출되는 것을 방지할 수 있습니다.

In [None]:
from langchain_google_genai import (
    ChatGoogleGenerativeAI,
    HarmBlockThreshold,
    HarmCategory,
)

llm = ChatGoogleGenerativeAI(
    # 사용할 모델을 "gemini-pro"로 지정합니다.
    model="gemini-1.5-pro-latest",
    safety_settings={
        # 위험한 콘텐츠에 대한 차단 임계값을 설정합니다.
        # 이 경우 위험한 콘텐츠를 차단하지 않도록 설정되어 있습니다. (그럼에도 기본적인 차단이 있을 수 있습니다.)
        HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE,
        HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_NONE,
        HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_NONE,
        HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_NONE,
    },
)

## Batch 단위 실행


In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(
    # 사용할 모델을 "gemini-pro"로 지정합니다.
    model="gemini-1.5-pro-latest",
)

results = llm.batch(
    [
        "대한민국의 수도는?",
        "대한민국의 주요 관광지 5곳을 나열하세요",
    ]
)

for res in results:
    # 각 결과의 내용을 출력합니다.
    print(res.content)

## Multimodal 모델

`langchain-teddynote` 에서 구현한 멀티모달 모델에 `gemini-1.5-pro` 모델을 활용하여 이미지를 텍스트로 변환 가능합니다.

In [None]:
from langchain_teddynote.models import MultiModal
from langchain_teddynote.messages import stream_response

# 객체 생성
gemini = ChatGoogleGenerativeAI(model="gemini-1.5-pro-latest")

system_prompt = (
    "당신은 시인입니다. 당신의 임무는 주어진 이미지를 가지고 시를 작성하는 것입니다."
)

user_prompt = "다음의 이미지에 대한 시를 작성해주세요."

# 멀티모달 객체 생성
multimodal_gemini = MultiModal(
    llm, system_prompt=system_prompt, user_prompt=user_prompt
)

In [None]:
# 샘플 이미지 경로(파일의 경로, URL 등)를 지정합니다.
IMAGE_URL = "images/jeju-beach.jpg"

# 이미지 파일로 부터 질의
answer = multimodal_gemini.stream(IMAGE_URL)

# 스트리밍 방식으로 각 토큰을 출력합니다. (실시간 출력)
stream_response(answer)