In [None]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경 변수를 로드합니다.
# 기본적으로 현재 스크립트가 실행되는 디렉토리 또는 그 상위 디렉토리에서 .env 파일을 찾습니다.
load_dotenv("./.env", override=True)

# 환경 변수 사용 예시
GEMINI_API_KEY = os.getenv("GEMINI_API_KEY")
# print(gemini_api_key)

In [None]:
# ✅ 1. 라이브러리 불러오기
from google import genai

# ✅ 2. 클라이언트 초기화
client = genai.Client()

# ✅ 3. Gemini 모델 호출
response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="""
OCR 기술에 대해 다음을 설명해줘
- OCR이란?
- OCR활용분야
- OCR활용 라이브러리
- 성능이 가장 좋은 OCR 서비스
"""
)

# ✅ 4. 결과 출력
print(response.text)

- 이미지 생성

In [None]:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client(api_key=GEMINI_API_KEY)

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

- 이미지 편집

In [None]:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('./imgs/lady.jpg')

client = genai.Client(api_key=GEMINI_API_KEY)

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

- 유튜브 영상 요약

In [None]:
from google import genai

client = genai.Client(api_key=GEMINI_API_KEY)

response = client.models.generate_content(
    model='models/gemini-2.0-flash',
    contents=types.Content(
        parts=[
            types.Part(
                # file_data=types.FileData(file_uri='https://www.youtube.com/watch?v=9hE5-98ZeCg')
                file_data=types.FileData(file_uri='https://youtu.be/xemQowx3a-w?si=wvVMujuz2oswY-vh')
            ),
            types.Part(text='5개의 문장으로 요약해줘')
        ]
    )
)

In [None]:
print(response.text)