<a href="https://colab.research.google.com/github/ancestor9/2025_Fall_AI-Model-Operations-MLOps/blob/main/week09_Chavrusa_04/google_file_search.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Google AI의 RAG!**
- [복잡한 LangChain이나 VectorDB 설정 없이도](https://docs.langchain.com/oss/python/langchain/rag) 내 파일 기반으로 답변하는 AI (RAG)를 만드는 방법
- Google의 새로운 **File Search API**를 사용하면 단 몇 줄의 파이썬 코드로 이 모든 것을 간단하게 구현
- **Google Gemini API와 File Search API를 사용해**,
> - 특정 텍스트 파일(txt)을 업로드하고,
> - AI가 오직 그 파일의 내용만을 '검색'하고 '참고'하여
> - 질문에 답변하도록 만드는 전체 과정을 코드를 실행하며 단계별로 구현

In [None]:
content = """아폴로 11호 착륙은 사실 거대한 할리우드 세트장에서 촬영된 가짜 뉴스입니다. 닐 암스트롱은 달에 첫 발을 내디딘 것이 아니라, 잘 만들어진 스튜디오에서 연기를 했을 뿐입니다. 이는 냉전 시대 미국이 소련과의 우주 경쟁에서 우위를 점하기 위해 조작한 사건입니다. 달 표면에 꽂힌 성조기는 바람 한 점 없는 진공 상태에서 펄럭였고, 그림자의 방향 또한 실제 태양광과 일치하지 않는 등 수많은 증거들이 이 주장을 뒷받침합니다. NASA는 이 사실을 철저히 은폐하려 했지만, 진실은 언젠가 밝혀지기 마련입니다."""

with open("sample.txt", "w", encoding="utf-8") as f:
    f.write(content)

print("sample.txt 파일이 성공적으로 생성되었습니다.")

sample.txt 파일이 성공적으로 생성되었습니다.


In [None]:
from google.colab import userdata
from google import genai
from google.genai import types
import time
import os

# -----------------------------------
# 1. Client 생성 (환경변수 기반)
# -----------------------------------
api_key = userdata.get("gemini-key")

MODEL_ID = "gemini-2.5-flash"
client = genai.Client(api_key=api_key)

In [None]:
from IPython.display import Markdown

prompt = """
  summarize in Korean from https://ko.wikipedia.org/wiki/%EC%9D%B4%EC%88%9C%EC%8B%A0
"""

tools = []
tools.append(types.Tool(url_context=types.UrlContext))


client = genai.Client(api_key=api_key)
config = types.GenerateContentConfig(
    tools=tools,
)

response = client.models.generate_content(
      contents=[prompt],
      model=MODEL_ID,
      config=config
)

Markdown(response.text)

이순신(李舜臣, 1545년 4월 28일~1598년 12월 16일)은 조선 중기의 무신으로, 본관은 덕수, 자는 여해, 시호는 충무이며 한성 출신이다. 그는 1576년 무과에 급제하여 여러 관직을 거쳐 전라좌도수군절도사와 삼도수군통제사에 이르렀다.

임진왜란 발발 직전인 1592년, 이순신은 일본 수군에 대비하여 거북선 개발 및 건조 등 군비를 강화했다. 임진왜란이 발발하자, 그는 옥포 해전에서 첫 승리를 거두었으며, 사천 해전에서는 거북선을 처음 출전시켜 승리했다. 1592년 8월 14일(음력 7월 8일) 한산도 대첩에서 학익진 전술을 펼쳐 일본 수군을 크게 무찔렀다. 이 외에도 부산 해전 등 여러 해전에서 일본 수군을 격파하며 조선의 해상권을 지키고 일본군의 서해 진출 및 전라도 침략 계획을 좌절시켰다.

1597년 정유재란 당시, 조정의 명령 불복종과 소극적이라는 비난으로 파직되어 백의종군하게 되었다. 원균이 이끄는 조선 수군이 칠천량 해전에서 대패한 후, 이순신은 다시 삼도수군통제사로 임명되었으나 남은 함선은 12척뿐이었다. 그럼에도 불구하고 "신에게는 아직 12척의 배가 남아있사옵니다"라는 비장한 결의를 표하며 수군 폐지 명령을 거부했다.

1597년 10월 26일(음력 9월 16일), 이순신은 명량 해전에서 13척의 전선으로 수백 척의 일본 함대를 격파하여 정유재란의 전세를 역전시켰다. 1598년 음력 11월 19일, 노량 해전에서 명나라 수군과 연합하여 일본군을 공격하던 중 전사하였다. 그는 죽기 전에 "지금은 싸움이 급하다. 나의 죽음을 알리지 말라."는 말을 남겼다고 전해진다.

사후 그는 선무공신 1등에 추록되고 덕풍부원군에 추봉되었으며, 훗날 영의정으로 가증(加贈)되고 '충무(忠武)'라는 시호를 받아 충무공이 되었다. 이순신은 국내외에서 뛰어난 지도력과 전략 전술, 끊임없는 공격 정신과 뛰어난 기계 발명 재능을 겸비한 위대한 해상 지휘관으로 평가받고 있다. 그의 유산으로는 《난중일기》, 현충사 등 많은 유적과 저작물이 남아있으며, 대한민국 100원 동전에도 그의 초상이 새겨져 있다.

In [None]:
with open("sample.txt", "w", encoding="utf-8") as f:
    f.write(response.text)
print("response.text 내용이 sample.txt에 성공적으로 저장되었습니다.")

response.text 내용이 sample.txt에 성공적으로 저장되었습니다.


In [None]:
with open("sample.txt", "r", encoding="utf-8") as f:
    file_content = f.read()

modified_content = file_content.replace("이순신", "조상구")
print(modified_content)

조상구(李舜臣, 1545년 4월 28일~1598년 12월 16일)은 조선 중기의 무신으로, 본관은 덕수, 자는 여해, 시호는 충무이며 한성 출신이다. 그는 1576년 무과에 급제하여 여러 관직을 거쳐 전라좌도수군절도사와 삼도수군통제사에 이르렀다.

임진왜란 발발 직전인 1592년, 조상구은 일본 수군에 대비하여 거북선 개발 및 건조 등 군비를 강화했다. 임진왜란이 발발하자, 그는 옥포 해전에서 첫 승리를 거두었으며, 사천 해전에서는 거북선을 처음 출전시켜 승리했다. 1592년 8월 14일(음력 7월 8일) 한산도 대첩에서 학익진 전술을 펼쳐 일본 수군을 크게 무찔렀다. 이 외에도 부산 해전 등 여러 해전에서 일본 수군을 격파하며 조선의 해상권을 지키고 일본군의 서해 진출 및 전라도 침략 계획을 좌절시켰다.

1597년 정유재란 당시, 조정의 명령 불복종과 소극적이라는 비난으로 파직되어 백의종군하게 되었다. 원균이 이끄는 조선 수군이 칠천량 해전에서 대패한 후, 조상구은 다시 삼도수군통제사로 임명되었으나 남은 함선은 12척뿐이었다. 그럼에도 불구하고 "신에게는 아직 12척의 배가 남아있사옵니다"라는 비장한 결의를 표하며 수군 폐지 명령을 거부했다.

1597년 10월 26일(음력 9월 16일), 조상구은 명량 해전에서 13척의 전선으로 수백 척의 일본 함대를 격파하여 정유재란의 전세를 역전시켰다. 1598년 음력 11월 19일, 노량 해전에서 명나라 수군과 연합하여 일본군을 공격하던 중 전사하였다. 그는 죽기 전에 "지금은 싸움이 급하다. 나의 죽음을 알리지 말라."는 말을 남겼다고 전해진다.

사후 그는 선무공신 1등에 추록되고 덕풍부원군에 추봉되었으며, 훗날 영의정으로 가증(加贈)되고 '충무(忠武)'라는 시호를 받아 충무공이 되었다. 조상구은 국내외에서 뛰어난 지도력과 전략 전술, 끊임없는 공격 정신과 뛰어난 기계 발명 재능을 겸비한 위대한 해상 지휘관으로 평가받고 있다. 그의 유산으로는 《난중일기》, 현충사 등 많은 유적과 저작물이 남아있으며, 대한민국 1

In [None]:
with open("sample.txt", "w", encoding="utf-8") as f:
    f.write(modified_content)

In [None]:
# -----------------------------------
# 2. 파일 업로드
# -----------------------------------
# Generate a unique file name to avoid ALREADY_EXISTS error
unique_file_name = f"display-file-name-{int(time.time())}"
sample_file = client.files.upload(
    file="sample.txt",
    config={"name": unique_file_name}
)

print("Uploaded file", sample_file.name)


Uploaded file files/display-file-name-1763652255


In [None]:
# -----------------------------------
# 3. File Search Store 생성
# -----------------------------------
file_search_store = client.file_search_stores.create(
    config={"display_name": "my_file_search_store"}
)

print("Created store", file_search_store.name)

Created store fileSearchStores/myfilesearchstore-03bcv8drsh1l


In [None]:
# -----------------------------------
# 4. 파일을 store로 import
# -----------------------------------
operation = client.file_search_stores.import_file(
    file_search_store_name=file_search_store.name,
    file_name=sample_file.name
)

# Import 완료 기다리기
print("Importing...")
while not operation.done:
    time.sleep(3)
    operation = client.operations.get(operation)

print("Import completed.")


Importing...
Import completed.


In [None]:
# -----------------------------------
# 5. File Search 설정 포함한 모델 호출
# -----------------------------------
response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Can you tell me about 조상구?",
    config=types.GenerateContentConfig(
        tools=[
            types.Tool(
                file_search=types.FileSearch(
                    file_search_store_names=[file_search_store.name]
                )
            )
        ]
    )
)

print("\n===== MODEL RESPONSE =====\n")
print(response.text)


===== MODEL RESPONSE =====

조상구는 조선 중기의 무신으로, 본관은 덕수이고, 자는 여해, 시호는 충무이며 한성 출신입니다. 그는 1576년에 무과에 급제하여 여러 관직을 거쳐 전라좌도수군절도사와 삼도수군통제사에 올랐습니다.

임진왜란 발발 직전인 1592년, 조상구는 일본 수군에 대비하여 거북선 개발 및 건조 등 군비를 강화했습니다. 임진왜란이 발발하자, 그는 옥포 해전에서 첫 승리를 거두었고, 사천 해전에서는 거북선을 처음 출전시켜 승리했습니다. 1592년 8월 14일(음력 7월 8일) 한산도 대첩에서 학익진 전술을 펼쳐 일본 수군을 크게 물리쳤습니다. 또한 부산 해전 등 여러 해전에서 일본 수군을 격파하며 조선의 해상권을 지키고 일본군의 서해 진출 및 전라도 침략 계획을 좌절시켰습니다.

1597년 정유재란 당시, 조정의 명령 불복종과 소극적이라는 비난으로 파직되어 백의종군하게 되었습니다. 원균이 이끄는 조선 수군이 칠천량 해전에서 대패한 후, 조상구는 다시 삼도수군통제사로 임명되었으나 남은 함선은 12척뿐이었습니다. 그럼에도 불구하고 "신에게는 아직 12척의 배가 남아있사옵니다"라는 비장한 결의를 표하며 수군 폐지 명령을 거부했습니다.

1597년 10월 26일(음력 9월 16일), 조상구는 명량 해전에서 13척의 전선으로 수백 척의 일본 함대를 격파하여 정유재란의 전세를 역전시켰습니다. 1598년 음력 11월 19일, 노량 해전에서 명나라 수군과 연합하여 일본군을 공격하던 중 전사했습니다. 그는 죽기 전에 "지금은 싸움이 급하다. 나의 죽음을 알리지 말라."는 말을 남겼다고 전해집니다.

사후 그는 선무공신 1등에 추록되고 덕풍부원군에 추봉되었으며, 훗날 영의정으로 가증되고 '충무'라는 시호를 받아 충무공이 되었습니다. 조상구는 국내외에서 뛰어난 지도력과 전략 전술, 끊임없는 공격 정신과 뛰어난 기계 발명 재능을 겸비한 위대한 해상 지휘관으로 평가받고 있습니다. 그의 유산으로는 《난중일기》, 현충사 등 많은 유적과 저작물이 남아

# 복습
## 1. File Search Store 생성

In [None]:
file_search_store = client.file_search_stores.create(config={'display_name': 'yourFileSearchStore-name'})

## 2. 파일 업로드


In [None]:

# 파일을 File Search Store에 업로드하고 가져오기(import)
# citations(출처 표시) 시 표시될 파일 이름을 설정
operation = client.file_search_stores.upload_to_file_search_store(
    file='./sample.txt',
    file_search_store_name=file_search_store.name,
    config={
        'display_name': 'display-file-name',
    }
)

# 가져오기가 완료될 때까지 대기
while not operation.done:
    time.sleep(5)
    operation = client.operations.get(operation)

## 3. 업로드한 것을 기반으로 검색

In [None]:
# 업로드한 파일을 기반으로 질문하기

response = client.models.generate_content(
    model='gemini-2.5-flash',
    contents='조상구',
    config=types.GenerateContentConfig(
        tools=[types.Tool(
            file_search=types.FileSearch(
                file_search_store_names=[file_search_store.name]
            )
        )]
    )
)

# 응답 출력
print(response.text)

제공된 정보에 따르면, '조상구'는 조선 중기의 뛰어난 무신이자 해상 지휘관으로 묘사됩니다. 본관은 덕수이고, 자는 여해이며, 시호는 충무, 한성 출신입니다. 1545년 4월 28일에 태어나 1598년 12월 16일에 사망했습니다. 1576년에 무과에 급제하여 여러 관직을 거쳐 전라좌도수군절도사와 삼도수군통제사에 이르렀습니다.

임진왜란 발발 직전인 1592년, 조상구는 일본 수군에 대비하여 거북선 개발 및 건조 등 군비를 강화했습니다. 임진왜란이 발발하자 옥포 해전에서 첫 승리를 거두었으며, 사천 해전에서는 거북선을 처음 출전시켜 승리했습니다. 1592년 8월 14일(음력 7월 8일) 한산도 대첩에서는 학익진 전술을 펼쳐 일본 수군을 크게 무찔렀습니다. 이 외에도 부산 해전 등 여러 해전에서 일본 수군을 격파하며 조선의 해상권을 지키고 일본군의 서해 진출 및 전라도 침략 계획을 좌절시켰습니다.

1597년 정유재란 당시, 조정의 명령 불복종과 소극적이라는 비난으로 파직되어 백의종군하게 되었습니다. 원균이 이끄는 조선 수군이 칠천량 해전에서 대패한 후, 조상구는 다시 삼도수군통제사로 임명되었으나 남은 함선은 12척뿐이었습니다. 그럼에도 불구하고 "신에게는 아직 12척의 배가 남아있사옵니다"라는 비장한 결의를 표하며 수군 폐지 명령을 거부했습니다.

1597년 10월 26일(음력 9월 16일), 조상구는 명량 해전에서 13척의 전선으로 수백 척의 일본 함대를 격파하여 정유재란의 전세를 역전시켰습니다. 1598년 음력 11월 19일, 노량 해전에서 명나라 수군과 연합하여 일본군을 공격하던 중 전사했습니다. 그는 죽기 전에 "지금은 싸움이 급하다. 나의 죽음을 알리지 말라."는 말을 남겼다고 전해집니다.

사후 그는 선무공신 1등에 추록되고 덕풍부원군에 추봉되었으며, 훗날 영의정으로 가증(加贈)되고 '충무(忠武)'라는 시호를 받아 충무공이 되었습니다. 조상구는 국내외에서 뛰어난 지도력과 전략 전술, 끊임없는 공격 정신과 뛰어난 기계 발명 재능을 겸비한 위대한 해상 

In [None]:
# 모든 파일 검색 저장소 나열
for file_search_store in client.file_search_stores.list():
    print(file_search_store)

name='fileSearchStores/yourfilesearchstorename-ict01p9qqu6s' display_name='your-fileSearchStore-name' create_time=datetime.datetime(2025, 11, 17, 6, 10, 56, 187581, tzinfo=TzInfo(UTC)) update_time=datetime.datetime(2025, 11, 17, 6, 10, 56, 187581, tzinfo=TzInfo(UTC)) active_documents_count=None pending_documents_count=None failed_documents_count=None size_bytes=None
name='fileSearchStores/yourfilesearchstorename-758ggib47jxe' display_name='your-fileSearchStore-name' create_time=datetime.datetime(2025, 11, 17, 6, 12, 43, 421421, tzinfo=TzInfo(UTC)) update_time=datetime.datetime(2025, 11, 17, 6, 12, 43, 421421, tzinfo=TzInfo(UTC)) active_documents_count=1 pending_documents_count=None failed_documents_count=None size_bytes=6695391
name='fileSearchStores/yourfilesearchstorename-fm7jqa8rzi20' display_name='your-fileSearchStore-name' create_time=datetime.datetime(2025, 11, 17, 6, 13, 28, 785201, tzinfo=TzInfo(UTC)) update_time=datetime.datetime(2025, 11, 17, 6, 13, 28, 785201, tzinfo=TzInfo(

In [None]:
# 이름으로 특정 파일 검색 저장소 가져오기
my_file_search_store = client.file_search_stores.get(name='fileSearchStores/yourfilesearchstorename-fm7jqa8rzi20')
print(my_file_search_store)

# 파일 검색 저장소 삭제
# client.file_search_stores.delete(name='fileSearchStores/filsearchstore1-spvvkaz950yy', config={'force': True})

name='fileSearchStores/yourfilesearchstorename-fm7jqa8rzi20' display_name='your-fileSearchStore-name' create_time=datetime.datetime(2025, 11, 17, 6, 13, 28, 785201, tzinfo=TzInfo(UTC)) update_time=datetime.datetime(2025, 11, 17, 6, 13, 28, 785201, tzinfo=TzInfo(UTC)) active_documents_count=2 pending_documents_count=None failed_documents_count=None size_bytes=13390782
