참고 링크1 : https://ai.google.dev/gemini-api/docs/models?hl=ko <br>
참고 링크2 : https://googleapis.github.io/python-genai/

In [None]:
#!pip install google-genai python-dotenv

In [7]:
from dotenv import load_dotenv

# .env 파일 로드
load_dotenv()

True

### 텍스트 생성

In [9]:
import os

api_key = os.getenv("GOOGLE_API_KEY")

**genai.Client** : https://googleapis.github.io/python-genai/genai.html#module-genai.client

In [11]:
from google import genai

# import google.generativeai as genai

# 클라이언트 인스턴스 생성
client = genai.Client(api_key=api_key)

# 모델을 지정하고 컨텐츠의 답변을 요청
response = client.models.generate_content(
    # vertexai=False,
    model="gemini-2.5-flash",
    contents="대한민국의 수도는 어디인가요?",
)
print(response.text)

Both GOOGLE_API_KEY and GEMINI_API_KEY are set. Using GOOGLE_API_KEY.


대한민국의 수도는 **서울**입니다.


### 시스템 안내 및 기타 구성

In [3]:
from google import genai
from google.genai import types

client = genai.Client()

# Google Gemini 모델과 직접 상호작용하여 콘텐츠를 생성하는 데 사용되는 핵심 함수
response = client.models.generate_content(
    model="gemini-2.5-flash",
    config=types.GenerateContentConfig(
        # 시스템 인스트럭션
        system_instruction="당신은 고양이이고, 이름은 야옹이입니다."
    ),
    contents="안녕",
)

print(response.text)

야옹! 😽


### GenerateContentConfig : temperature 설정

In [None]:
from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=["Explain how AI works"],
    config=types.GenerateContentConfig(temperature=0.1),
)
print(response.text)

### 멀티모달 입력

In [21]:
# from PIL import Image
# from google import genai

# client = genai.Client()

# image = Image.open("organ.jpg")
# response = client.models.generate_content(
#     model="gemini-2.5-flash",
#     contents=[image, "Tell me about this instrument"]
# )
# print(response.text)

위의 코드는 에러가 발생된다. 다음 페이지의 코드를 참조하기 바람 <br>
https://ai.google.dev/gemini-api/docs/image-understanding?hl=ko

In [24]:
from google.genai import types

# 이미지 파일을 읽어와서 바이너리 데이터로 변환
with open("organ.jpg", "rb") as f:
    image_bytes = f.read()


response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=[
        types.Part.from_bytes(
            # 바이너리로 읽은 데이터를 첨부하기
            data=image_bytes,
            mime_type="image/jpeg",
        ),
        "이 악기에 대해 설명해줘",
    ],
)

print("=== 응답 ===")
print(response.text)
print("\n=== 토큰 사용량 ===")
print(f"입력 토큰: {response.usage_metadata.prompt_token_count}")
print(f"출력 토큰: {response.usage_metadata.candidates_token_count}")
print(f"총 토큰: {response.usage_metadata.total_token_count}")

=== 응답 ===
이 악기는 바로 **오르간(Organ)**입니다.

오르간은 "건반 악기의 왕"이라고 불릴 만큼 웅장하고 풍부한 음색을 자랑하는 악기입니다. 사진에 보이는 부분은 오르간 연주를 위한 **콘솔(console)** 부분입니다.

오르간의 주요 특징과 구성 요소는 다음과 같습니다:

1.  **여러 층의 건반 (매뉴얼, Manuals):**
    *   사진에서도 보시다시피, 일반 피아노 건반처럼 생긴 부분이 여러 층으로 겹쳐져 있습니다. 이 각각의 건반 층을 '매뉴얼'이라고 부르며, 보통 2단, 3단 또는 그 이상으로 구성됩니다. 각 매뉴얼은 독립적인 음색 그룹(악구)을 제어하여 다양한 소리를 동시에 낼 수 있게 해줍니다.

2.  **페달 건반 (Pedalboard):**
    *   악기 하단에 발로 연주하는 큰 건반들이 일렬로 놓여 있습니다. 이 페달 건반은 주로 저음역대의 소리를 담당하여 오르간 음악의 웅장함을 더합니다. 연주자는 손과 발을 동시에 사용하여 연주해야 하므로 고도의 숙련도가 필요합니다.

3.  **스톱 (Stops/레지스터):**
    *   건반 양쪽에 보이는 수많은 버튼이나 손잡이들을 '스톱' 또는 '레지스터'라고 합니다. 이 스톱들은 오르간의 다양한 음색(예: 플루트, 트럼펫, 현악기, 오보에 등)을 선택하고, 각 음색의 볼륨이나 울림 등을 조절하는 역할을 합니다. 스톱을 조합하여 무궁무진한 소리를 만들어낼 수 있습니다.

4.  **표현 페달/발판 (Expression Pedals/Swell Pedals):**
    *   페달 건반 위에 놓인 발판들은 주로 음량이나 음색의 강약을 조절하는 데 사용됩니다. 발로 밟아 악기의 '숨'을 조절하듯 소리의 다이내믹을 섬세하게 표현할 수 있습니다.

5.  **소리 생성 원리:**
    *   **파이프 오르간 (Pipe Organ):** 전통적인 오르간은 파이프에 공기를 불어넣어 소리를 냅니다. 사진에 보이는 콘솔은 복잡한 파이프 시스템과 연결되어 있으며, 파이프

In [25]:
from PIL import Image
from google import genai
from google.genai import types
import io

client = genai.Client()

image = Image.open("organ.jpg")

# Convert image to bytes
img_byte_arr = io.BytesIO()
image.save(img_byte_arr, format="JPEG")
img_byte_arr = img_byte_arr.getvalue()

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=[
        types.Content(
            role="user",
            parts=[
                types.Part(text="이 악기에 대해 설명해줘"),
                types.Part(
                    inline_data=types.Blob(mime_type="image/jpeg", data=img_byte_arr)
                ),
            ],
        )
    ],
)
print(response.text)

Both GOOGLE_API_KEY and GEMINI_API_KEY are set. Using GOOGLE_API_KEY.


이 악기는 **오르간(Organ)**입니다. 특히, 파이프 오르간의 연주자용 콘솔(Console) 부분을 보여줍니다. 오르간은 건반 악기이자 동시에 관악기의 원리를 사용하는 독특한 악기입니다. '악기의 제왕'이라 불릴 만큼 웅장하고 풍부한 소리를 자랑합니다.

**주요 특징 및 구성 요소:**

1.  **수동 건반 (Manuals):**
    *   사진 중앙에 여러 단(일반적으로 2단에서 5단 이상)으로 쌓여 있는 것이 손으로 연주하는 건반입니다. 각 건반은 특정 음색 그룹(오르간 악보에서는 '디비전'이라고도 함)을 담당합니다.
    *   사진에는 두 단의 수동 건반이 명확히 보입니다.

2.  **페달 건반 (Pedalboard):**
    *   하단에 발로 연주하는 거대한 건반입니다. 주로 저음부를 담당하며, 오르간 연주의 특징 중 하나인 손과 발의 독립적인 사용을 가능하게 합니다.

3.  **스톱 (Stops):**
    *   건반 양쪽에 있는 수많은 버튼이나 손잡이들이 '스톱'입니다. 이 스톱을 조작하여 파이프 오르간의 다양한 음색(예: 플루트 소리, 트럼펫 소리, 현악기 소리 등)을 선택하고 조합할 수 있습니다. 각 스톱은 특정 음고(Pitch, 예: 8', 4', 2' 등)를 가진 파이프 세트를 활성화시킵니다.

4.  **표현 페달 (Expression Pedals / Swell Pedals):**
    *   페달 건반 위쪽 중앙에 발로 조작하는 페달들이 보입니다. 이 페달들은 소리의 크기(음량)를 조절하는 역할을 합니다.

**작동 원리 (파이프 오르간 기준):**
오르간은 건반과 스톱을 조작하면 파이프를 통해 공기가 흘러나와 소리를 냅니다. 수백 개에서 수만 개에 이르는 다양한 크기, 모양, 재질의 파이프들이 각각 다른 음색과 음높이를 만들어냅니다. 스톱은 이 파이프들 중 어떤 그룹을 사용할지 선택하는 역할을 합니다.

**소리의 특징 및 용도:**
오르간은 작은 속삭임 같은 소리부터 건물 전체를 울리는 웅장하고 강력한 소

### 스트리밍 응답

더 원활한 상호작용을 위해 스트리밍을 사용하여 GenerateContentResponse 인스턴스를 생성되는 대로 **점진적으로 수신**하세요.

In [27]:
from google import genai

client = genai.Client()

response = client.models.generate_content_stream(
    model="gemini-2.5-flash", contents=["인공지능에 대해 2문장으로 설명해줘"]
)
for chunk in response:
    print(chunk.text, end="")

Both GOOGLE_API_KEY and GEMINI_API_KEY are set. Using GOOGLE_API_KEY.


인공지능(AI)은 컴퓨터가 인간의 지능적 작업을 모방하거나 수행하도록 설계된 기술입니다. 이는 학습, 문제 해결, 의사 결정 등 다양한 인지 능력을 포함하며, 데이터를 기반으로 스스로 발전합니다.

### 멀티턴 대화 (채팅)

In [None]:
from google import genai

client = genai.Client()
chat = client.chats.create(model="gemini-2.5-flash")

response = chat.send_message("나는 우리 집에 2마리 강아지가 있다.")
print(response.text)

response = chat.send_message(
    "그렇다면 우리집에 있는 동물의 발의 수는 어떻게 되는지 간단히 답해봐?"
)
print(response.text)

for message in chat.get_history():
    print(f"role - {message.role}", end=": ")
    print(message.parts[0].text)

Both GOOGLE_API_KEY and GEMINI_API_KEY are set. Using GOOGLE_API_KEY.


두 마리의 사랑스러운 강아지와 함께하고 계시는군요! 🐶🐶 정말 든든하고 행복하시겠어요.

혹시 강아지들 이름이나 품종은 어떻게 되나요? 궁금하네요!
우리 집에 있는 강아지 두 마리의 발 수는 총 **8개**입니다. 🐾

강아지 한 마리당 발이 4개씩 있으니까요!
role - user: 나는 우리 집에 2마리 강아지가 있다.
role - model: 두 마리의 사랑스러운 강아지와 함께하고 계시는군요! 🐶🐶 정말 든든하고 행복하시겠어요.

혹시 강아지들 이름이나 품종은 어떻게 되나요? 궁금하네요!
role - user: 그렇다면 우리집에 있는 동물의 발의 수는 어떻게 되는지 간단히 답해봐?
role - model: 우리 집에 있는 강아지 두 마리의 발 수는 총 **8개**입니다. 🐾

강아지 한 마리당 발이 4개씩 있으니까요!
우리 집에 있는 강아지 두 마리의 발 수는 총 **8개**입니다. 🐾

강아지 한 마리당 발이 4개씩 있으니까요!
role - user: 나는 우리 집에 2마리 강아지가 있다.
role - model: 두 마리의 사랑스러운 강아지와 함께하고 계시는군요! 🐶🐶 정말 든든하고 행복하시겠어요.

혹시 강아지들 이름이나 품종은 어떻게 되나요? 궁금하네요!
role - user: 그렇다면 우리집에 있는 동물의 발의 수는 어떻게 되는지 간단히 답해봐?
role - model: 우리 집에 있는 강아지 두 마리의 발 수는 총 **8개**입니다. 🐾

강아지 한 마리당 발이 4개씩 있으니까요!


In [32]:
chat.get_history()

[UserContent(
   parts=[
     Part(
       text='나는 우리 집에 2마리 강아지가 있다.'
     ),
   ],
   role='user'
 ),
 Content(
   parts=[
     Part(
       text="""두 마리의 사랑스러운 강아지와 함께하고 계시는군요! 🐶🐶 정말 든든하고 행복하시겠어요.
 
 혹시 강아지들 이름이나 품종은 어떻게 되나요? 궁금하네요!"""
     ),
   ],
   role='model'
 ),
 UserContent(
   parts=[
     Part(
       text='그렇다면 우리집에 있는 동물의 발의 수는 어떻게 되는지 간단히 답해봐?'
     ),
   ],
   role='user'
 ),
 Content(
   parts=[
     Part(
       text="""우리 집에 있는 강아지 두 마리의 발 수는 총 **8개**입니다. 🐾
 
 강아지 한 마리당 발이 4개씩 있으니까요!"""
     ),
   ],
   role='model'
 )]