🕵️‍♂️ 'AI 탐정 봇' 미션은 **Gemini**나 **LiteLLM**을 사용해서도 충분히 해결할 수 있습니다. 각 기술의 특성에 맞게 코드를 어떻게 수정하면 되는지, 그리고 어떤 장단점이 있는지 상세히 알려드리겠습니다.

-----

### 🤖 Google Gemini를 사용하여 문제 해결하기

Google의 강력한 멀티모달 모델인 Gemini (특히 Gemini 1.5 Pro)를 사용하면 OpenAI와 동일한, 혹은 더 뛰어난 성능으로 미션을 수행할 수 있습니다. Google AI Python SDK를 사용하며, 코드 구조가 조금 달라집니다.

**사전 준비:**

1.  **Google AI API 키 발급:** [Google AI Studio](https://aistudio.google.com/app/apikey)에서 API 키를 발급받으세요.
2.  **라이브러리 설치:**
    ```bash
    pip install google-generativeai pillow requests
    ```
3.  **API 키 설정 (Colab 보안 비밀 추천):**
      * **이름:** `GOOGLE_API_KEY`, **값:** 발급받은 키

**코드 수정 가이드:**

#### **1단계: 이미지 분석 (Gemini Vision)**

Gemini는 이미지와 텍스트를 함께 입력받는 방식이 조금 다릅니다. 이미지 데이터를 직접 로드해야 합니다.

In [1]:
!pip install google-generativeai pillow requests

Collecting google-ai-generativelanguage==0.6.15 (from google-generativeai)
  Downloading google_ai_generativelanguage-0.6.15-py3-none-any.whl.metadata (5.7 kB)
Downloading google_ai_generativelanguage-0.6.15-py3-none-any.whl (1.3 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m14.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: google-ai-generativelanguage
  Attempting uninstall: google-ai-generativelanguage
    Found existing installation: google-ai-generativelanguage 0.6.18
    Uninstalling google-ai-generativelanguage-0.6.18:
      Successfully uninstalled google-ai-generativelanguage-0.6.18
[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
langchain-google-genai 2.1.5 requires google-ai-generativelanguage<0.7.0,>=0.6.18, but you have google-ai-generativelanguage 0.6.15 which is incompatible.[0m[

In [2]:
!pip install langchain_google_genai langchain_community

Collecting google-ai-generativelanguage<0.7.0,>=0.6.18 (from langchain_google_genai)
  Using cached google_ai_generativelanguage-0.6.18-py3-none-any.whl.metadata (9.8 kB)
Using cached google_ai_generativelanguage-0.6.18-py3-none-any.whl (1.4 MB)
Installing collected packages: google-ai-generativelanguage
  Attempting uninstall: google-ai-generativelanguage
    Found existing installation: google-ai-generativelanguage 0.6.15
    Uninstalling google-ai-generativelanguage-0.6.15:
      Successfully uninstalled google-ai-generativelanguage-0.6.15
[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
google-generativeai 0.8.5 requires google-ai-generativelanguage==0.6.15, but you have google-ai-generativelanguage 0.6.18 which is incompatible.[0m[31m
[0mSuccessfully installed google-ai-generativelanguage-0.6.18


In [3]:
!pip install faiss-cpu



In [4]:
# Gemini - 1단계 정답 코드
import os
import requests
from PIL import Image
from io import BytesIO
import google.generativeai as genai
from google.colab import userdata # Colab 사용 시

# Colab 보안 비밀에서 API 키 로드 및 설정
os.environ["GOOGLE_API_KEY"] = userdata.get('GOOGLE_API_KEY')
genai.configure(api_key=os.environ["GOOGLE_API_KEY"])

# 분석할 이미지 URL
image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Mona_Lisa%2C_by_Leonardo_da_Vinci%2C_from_C2RMF_retouched.jpg/1200px-Mona_Lisa%2C_by_Leonardo_da_Vinci%2C_from_C2RMF_retouched.jpg"

# URL에서 이미지 다운로드
response = requests.get(image_url)
img = Image.open(BytesIO(response.content))

print("--- 1단계 (Gemini): 모작 이미지 분석 시작 ---")

# 사용할 Gemini 모델 선택 (Vision 기능이 있는 모델)
model = genai.GenerativeModel('gemini-2.5-flash-preview-05-20')

# 텍스트 프롬프트와 이미지 객체를 함께 전달
prompt_parts = [
    "이 이미지에 있는 그림은 무엇인가요? 그림의 특징을 알려주세요.",
    img,
]

response = model.generate_content(prompt_parts)

print("AI 분석 결과:", response.text)
print("--- 1단계 (Gemini) 완료 ---")

--- 1단계 (Gemini): 모작 이미지 분석 시작 ---
AI 분석 결과: 이 이미지에 있는 그림은 레오나르도 다 빈치(Leonardo da Vinci)의 유명한 회화 작품인 **모나리자(Mona Lisa)**입니다.

이 그림의 주요 특징은 다음과 같습니다:

1.  **수수께끼 같은 미소 (Enigmatic Smile):** 모나리자의 가장 유명한 특징은 그녀의 수수께끼 같고 미묘한 미소입니다. 보는 각도나 시선에 따라 다르게 느껴지며, 신비롭고 살아있는 듯한 인상을 줍니다.
2.  **스푸마토 기법 (Sfumato Technique):** 레오나르도 다 빈치가 완벽하게 구사한 '스푸마토(sfumato)' 기법이 사용되었습니다. 이는 윤곽선을 부드럽게 처리하여 색상과 색조 사이의 경계를 모호하게 만드는 방식으로, 그림에 부드러운 분위기와 깊이를 더해줍니다. 특히 모나리자의 미소를 표현하는 데 결정적인 역할을 했습니다.
3.  **삼각 구도 및 자세 (Pyramidal Composition and Pose):** 인물을 안정적인 삼각형 구도(어깨와 팔이 넓게 퍼지고 머리 쪽으로 좁아지는 형태)로 배치하여 견고함과 위엄을 부여합니다. 또한, 정면이 아닌 약간 몸을 틀어 앉은 '3/4상' 자세는 인물에게 생동감과 입체감을 줍니다.
4.  **신비로운 배경 (Mysterious Background):** 인물의 뒤편에는 환상적이고 안개 낀 풍경이 펼쳐져 있습니다. 이 풍경은 인물의 감정과 연결된 듯한 신비로운 분위기를 자아내며, 배경의 양쪽이 완벽하게 일치하지 않는 것도 특징입니다.
5.  **심리적 깊이 (Psychological Depth):** 단순한 초상을 넘어 인물의 내면과 심리적 상태를 탐구하려는 시도가 돋보입니다. 이는 르네상스 시대 초상화의 새로운 지평을 열었습니다.
6.  **얇은 베일과 눈썹 부재:** 그녀의 얼굴에 얇은 베일이 씌워져 있는 것으로 보이며, 전통적인 미인상과는 달리 눈썹이 그려져 있지 않다는 점도 주목할 만합니다.

현재 모

**✔️ 주요 변경점:**

  * `openai` 대신 `google.generativeai` 라이브러리를 사용합니다.
  * `requests`와 `PIL` 라이브러리로 이미지 URL을 실제 이미지 객체로 변환합니다.
  * `generate_content` 메소드에 텍스트와 이미지 객체를 리스트로 전달합니다.

#### **2단계: 펑션 콜링 (Gemini Function Calling)**

Gemini의 펑션 콜링은 더 직관적일 수 있습니다. 파이썬 함수를 직접 `tools`로 등록할 수 있습니다.

In [5]:
# Gemini - 2단계 정답 코드
import json

# 1단계에서 정의한 get_artwork_details 함수는 그대로 사용
def get_artwork_details(artwork_title: str):
    """작품 제목을 받아 미술관 데이터베이스에서 작품 정보를 조회합니다."""
    db = {
        "모나리자": {"artist": "레오나르도 다 빈치", "year": "1503–1506", "description": "르네상스 시대의 가장 유명한 초상화 중 하나로, 신비로운 미소로 유명합니다."},
        "별이 빛나는 밤": {"artist": "빈센트 반 고흐", "year": "1889", "description": "반 고흐가 생 레미의 정신병원에서 그린 작품으로, 소용돌이치는 밤하늘이 인상적입니다."}
    }
    return db.get(artwork_title, {"error": "작품을 찾을 수 없습니다."})

print("\n--- 2단계 (Gemini): 미술관 데이터베이스 조회 시작 ---")

# 사용할 모델에 tools(함수) 정보를 전달
model = genai.GenerativeModel(
    'gemini-2.5-flash-preview-05-20',
    tools=[get_artwork_details] # 파이썬 함수를 그대로 리스트에 넣어줍니다.
)
chat = model.start_chat()
artwork_name = "모나리자"

# 함수 호출을 유도하는 프롬프트 전송
response = chat.send_message(f"'{artwork_name}'에 대한 미술관 데이터베이스 정보를 찾아줘.")
response_message = response.candidates[0].content.parts[0]

# AI가 함수 호출을 요청했는지 확인
if response_message.function_call:
    function_call = response_message.function_call
    function_name = function_call.name
    args = dict(function_call.args)

    if function_name == 'get_artwork_details':
        # 함수 실행
        function_response = get_artwork_details(artwork_title=args.get("artwork_title"))

        # 실행 결과를 다시 AI에게 전달
        response = chat.send_message(
            genai.protos.Part(
                function_response={
                    "name": function_name,
                    "response": {"result": json.dumps(function_response, ensure_ascii=False)},
                }
            )
        )
        # 함수 실행 결과를 바탕으로 AI가 최종 답변 생성
        final_answer = response.candidates[0].content.parts[0].text
        print("DB 조회 및 최종 답변:", final_answer)
else:
    print("AI가 함수를 호출하지 않았습니다.")

print("--- 2단계 (Gemini) 완료 ---")


--- 2단계 (Gemini): 미술관 데이터베이스 조회 시작 ---
DB 조회 및 최종 답변: '모나리자'는 레오나르도 다 빈치가 1503년부터 1506년 사이에 그린 작품으로, 르네상스 시대의 가장 유명한 초상화 중 하나이며 신비로운 미소로 잘 알려져 있습니다.
--- 2단계 (Gemini) 완료 ---


**✔️ 주요 변경점:**

  * `tools` 파라미터에 JSON 설명 대신 파이썬 함수 객체(`get_artwork_details`)를 직접 전달하여 더 간결합니다.
  * 응답에서 `function_call` 객체를 확인하고, 결과를 다시 `function_response` 형태로 모델에 전달하여 최종 답변을 받는 2단계 통신 과정을 거칩니다.

#### **3단계: RAG (LangChain + Gemini)**

LangChain은 여러 모델을 지원하므로, 모델과 임베딩 부분만 Gemini 용으로 교체하면 됩니다.

In [6]:
# Gemini - 3단계 정답 코드
from langchain_google_genai import ChatGoogleGenerativeAI, GoogleGenerativeAIEmbeddings
# OpenAI 대신 사용할 LangChain의 Gemini 관련 모듈을 가져옵니다.

# ... (rag_data.txt 파일 생성 및 loader, text_splitter 부분은 동일) ...
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate
from langchain.chains import create_retrieval_chain
rag_data="""...생략..."""
with open("rag_data.txt", "w", encoding="utf-8") as f: f.write(rag_data)
loader = TextLoader("rag_data.txt", encoding="utf-8")
docs = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
splits = text_splitter.split_documents(docs)
# ...

print("\n--- 3단계 (Gemini RAG): 미술사 자료 탐색 시작 ---")

# 1. 임베딩 모델을 GoogleGenerativeAIEmbeddings로 변경
embeddings = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)

# 2. LLM을 ChatGoogleGenerativeAI로 변경
llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash-preview-05-20", temperature=0)

# 프롬프트, 체인 생성 부분은 OpenAI 버전과 완전히 동일합니다.
prompt = ChatPromptTemplate.from_template("""
주어진 내용을 바탕으로 다음 질문에 답변해 주세요:

<context>
{context}
</context>

질문: {input}
답변:""")
document_chain = create_stuff_documents_chain(llm, prompt)
retriever = vectorstore.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, document_chain)

# 3. 질문하고 답변받기 (동일)
question = "반 고흐의 스타일과 르네상스 미술의 차이점은 무엇인가요?"
response = retrieval_chain.invoke({"input": question})

print("RAG 분석 질문:", question)
print("RAG 분석 답변:", response["answer"])
print("--- 3단계 (Gemini RAG) 완료 ---")


--- 3단계 (Gemini RAG): 미술사 자료 탐색 시작 ---
RAG 분석 질문: 반 고흐의 스타일과 르네상스 미술의 차이점은 무엇인가요?
RAG 분석 답변: 주어진 내용이 생략되어 있으므로, 일반적인 미술사 지식을 바탕으로 반 고흐의 스타일과 르네상스 미술의 차이점을 설명해 드리겠습니다.

반 고흐의 스타일과 르네상스 미술은 시대, 목적, 표현 방식 등 여러 면에서 극명한 차이를 보입니다.

**반 고흐의 스타일 (후기 인상주의, 19세기 후반):**

1.  **표현의 목적:** 작가의 강렬한 내면세계, 감정, 심리 상태를 표현하는 데 중점을 둡니다. 현실을 있는 그대로 재현하기보다는 주관적인 해석과 감정을 담아냅니다.
2.  **색채:** 자연색을 벗어나 감정적이고 상징적인 색채를 사용합니다. 색채는 강렬하고 대담하며, 때로는 비현실적으로 느껴질 정도로 주관적인 감정을 전달하는 도구로 활용됩니다.
3.  **붓질:** 거칠고 두꺼우며(임파스토), 역동적인 붓질이 눈에 띄게 드러납니다. 붓자국 하나하나가 작가의 에너지와 감정을 담고 있어 작품에 생동감과 질감을 부여합니다.
4.  **형태와 원근법:** 형태는 종종 왜곡되거나 단순화되며, 전통적인 원근법보다는 감정적 효과를 위한 공간 구성이 나타납니다.
5.  **주요 주제:** 일상생활, 풍경, 자화상, 서민들의 삶 등 평범하고 소박한 주제를 통해 깊은 감정과 의미를 탐구했습니다.

**르네상스 미술 (14세기 ~ 16세기, 이탈리아 중심):**

1.  **표현의 목적:** 인간 중심주의(휴머니즘)를 바탕으로 이상적인 아름다움, 조화, 균형을 추구하며 현실을 사실적이고 객관적으로 재현하는 데 중점을 둡니다. 종교적, 신화적 주제를 다루면서도 인간의 존엄성을 강조했습니다.
2.  **색채:** 자연적이고 사실적인 색채를 사용하여 대상의 입체감과 현실감을 표현합니다. 명암법(키아로스쿠로)과 부드러운 색조 변화(스푸마토)를 통해 깊이와 볼륨감을 부여합니다.
3.  **붓질:** 붓자국이 거의 보이지 

**✔️ 주요 변경점:**

  * `ChatOpenAI` -\> `ChatGoogleGenerativeAI`
  * `OpenAIEmbeddings` -\> `GoogleGenerativeAIEmbeddings`
  * LangChain의 장점 덕분에, 이 두 부분만 교체하면 나머지 RAG 파이프라인 코드는 그대로 재사용할 수 있습니다.

-----

### ⚡ LiteLLM을 사용하여 문제 해결하기

LiteLLM은 "통합 번역기"와 같습니다. 어떤 모델(OpenAI, Gemini, Anthropic 등)을 쓰든 **항상 OpenAI API와 동일한 형식으로 코드를 작성**할 수 있게 해줍니다. 모델을 바꿀 때 코드 수정을 최소화하고 싶을 때 매우 유용합니다.

**사전 준비:**

1.  **라이브러리 설치:**
    ```bash
    pip install litellm
    ```
2.  **API 키 설정 (Colab 보안 비밀 추천):**
      * 사용하려는 모든 모델의 키를 설정해야 합니다.
      * **이름:** `OPENAI_API_KEY`, **값:** OpenAI 키
      * **이름:** `GOOGLE_API_KEY`, **값:** Google 키

**코드 수정 가이드:**

LiteLLM의 핵심은 **`model` 이름 앞에 제공사 이름을 붙여주는 것**(`"gemini/gemini-1.5-pro-latest"`)과, `openai.chat.completions.create`를 `litellm.completion`으로 바꾸는 것입니다.

#### **1 & 2단계: 이미지 분석 및 펑션 콜링 (LiteLLM)**

놀랍게도, **원래 작성했던 OpenAI용 코드에서 단 두 줄만 바꾸면 됩니다.**

In [8]:
!pip install litellm

Collecting litellm
  Downloading litellm-1.72.4-py3-none-any.whl.metadata (39 kB)
Downloading litellm-1.72.4-py3-none-any.whl (8.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m8.0/8.0 MB[0m [31m58.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: litellm
Successfully installed litellm-1.72.4


In [22]:
import os
import litellm
from google.colab import userdata
import json

# Colab 보안 비밀에서 GOOGLE_API_KEY를 가져옵니다.
# 이 과정은 이전과 동일하며, 키 자체가 유효하다는 것을 알고 있습니다.
try:
    google_api_key = userdata.get('GOOGLE_API_KEY')
    if not google_api_key:
        raise ValueError("GOOGLE_API_KEY not found in Colab secrets or is empty.")
    os.environ["GOOGLE_API_KEY"] = google_api_key
    print("GOOGLE_API_KEY successfully loaded from Colab secrets.")
except Exception as e:
    print(f"Error loading API key from userdata: {e}")
    print("Please ensure GOOGLE_API_KEY is correctly set in Colab secrets and notebook access is enabled.")
    exit() # API 키 로드 실패 시, 더 이상 진행하지 않고 종료

print("\n--- 2단계 (LiteLLM): 미술관 데이터베이스 조회 시작 ---")

# tools 정의
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_artwork_details",
            "description": "미술 작품의 상세 정보를 조회합니다.",
            "parameters": {
                "type": "object",
                "properties": {
                    "artwork_name": {
                        "type": "string",
                        "description": "조회할 미술 작품의 이름",
                    }
                },
                "required": ["artwork_name"],
            },
        },
    }
]

# messages 정의
messages = [{"role": "user", "content": "'모나리자'에 대한 정보를 찾아줘."}]

# LiteLLM completion 호출 시 api_key를 명시적으로 전달합니다.
# 이렇게 하면 LiteLLM이 API 키를 정확히 사용하게 됩니다.
response = litellm.completion(
    model="gemini/gemini-2.5-flash-preview-05-20",
    messages=messages,
    tools=tools,
    tool_choice="auto",
    api_key=google_api_key,
)

# 응답 처리 로직
tool_calls = response.choices[0].message.tool_calls
if tool_calls:
    print("Function Calling이 감지되었습니다.")
    available_functions = {
        "get_artwork_details": lambda artwork_name: f"미술관 데이터베이스에서 '{artwork_name}'에 대한 정보를 찾고 있습니다.",
    }
    for tool_call in tool_calls:
        function_name = tool_call.function.name
        function_to_call = available_functions[function_name]
        function_args = json.loads(tool_call.function.arguments)

        function_response = function_to_call(
            artwork_name=function_args.get("artwork_name")
        )
        print(f"호출된 함수: {function_name}, 인자: {function_args}")
        print(f"함수 결과: {function_response}")
else:
    print("AI 답변:", response.choices[0].message.content)

print("--- 2단계 (LiteLLM) 완료 ---")

GOOGLE_API_KEY successfully loaded from Colab secrets.

--- 2단계 (LiteLLM): 미술관 데이터베이스 조회 시작 ---
Function Calling이 감지되었습니다.
호출된 함수: get_artwork_details, 인자: {'artwork_name': '모나리자'}
함수 결과: 미술관 데이터베이스에서 '모나리자'에 대한 정보를 찾고 있습니다.
--- 2단계 (LiteLLM) 완료 ---


**✔️ 주요 변경점:**

  * `client.chat.completions.create` -\> `litellm.completion`
  * `model="gpt-4o"` -\> `model="gemini/gemini-1.5-pro-latest"`
  * API 요청/응답 형식, `messages`, `tools` 구조 등 **나머지 모든 코드는 OpenAI 버전과 동일**합니다. 이것이 LiteLLM의 가장 큰 장점입니다.

#### **3단계: RAG (LiteLLM)**

LiteLLM은 LangChain과도 통합되지만, 보통 LangChain을 쓸 때는 위 `Gemini` 섹션처럼 LangChain이 제공하는 네이티브 통합 기능(`ChatGoogleGenerativeAI`)을 쓰는 것이 더 직관적입니다. LiteLLM은 여러 LLM API를 직접 호출하는 코드를 단일화할 때 가장 빛을 발합니다.

-----

### 🎯 최종 비교 및 요약

| 구분 | **Gemini (직접 사용)** | **LiteLLM 사용** |
| :--- | :--- | :--- |
| **라이브러리** | `google-generativeai` | `litellm` |
| **코드 형식** | Google SDK 고유의 형식 사용 | **OpenAI SDK 형식으로 통일** |
| **장점** | - Gemini의 모든 최신 기능 활용 가능\<br\>- Google 생태계와 완벽한 통합 | - **모델 변경 시 코드 수정 최소화**\<br\>- 여러 모델을 동일한 코드로 제어\<br\>- 테스트 및 모델 비교에 매우 유리 |
| **단점** | 모델 변경 시 코드 구조 변경 필요 | 모든 모델의 미세한 기능 차이를 100% 지원하지 못할 수 있음 |
| **추천 대상** | **Google Gemini**를 주력으로 사용하려는 경우 | **다양한 LLM 모델**을 빠르고 쉽게 교체하며 테스트/개발하려는 경우 |

결론적으로, 'AI 탐정 봇' 미션은 어떤 기술로든 훌륭하게 수행할 수 있습니다. 프로젝트의 목적과 선호하는 개발 방식에 따라 적절한 도구를 선택하시면 됩니다.

<div class="md-recitation">
  Sources
  <ol>
  <li><a href="https://github.com/nervina-labs/nft-wallet">https://github.com/nervina-labs/nft-wallet</a></li>
  <li><a href="https://www.editions-eni.fr/livre/machine-learning-et-deep-learning-des-bases-a-la-conception-avancee-d-algorithmes-exemples-en-python-et-en-javascript-9782409027604/le-deep-learning">https://www.editions-eni.fr/livre/machine-learning-et-deep-learning-des-bases-a-la-conception-avancee-d-algorithmes-exemples-en-python-et-en-javascript-9782409027604/le-deep-learning</a></li>
  <li><a href="https://githubissues.com/microsoft/LLMLingua/104">https://githubissues.com/microsoft/LLMLingua/104</a></li>
  <li><a href="https://www.53ai.com/news/qianyanjishu/1063.html">https://www.53ai.com/news/qianyanjishu/1063.html</a></li>
  <li><a href="https://github.com/NarenderSingh/cit-ai-project-api">https://github.com/NarenderSingh/cit-ai-project-api</a></li>
  <li><a href="https://github.com/luisagcenteno84/langchain">https://github.com/luisagcenteno84/langchain</a></li>
  <li><a href="https://github.com/GVS-007/hackathon_ai">https://github.com/GVS-007/hackathon_ai</a></li>
  </ol>
</div>