# ตัวอย่างการใช้งาน Gemini in Python อย่างง่าย

Notebook นี้สาธิตวิธีการใช้งาน Gemini API เพื่อ:
- สร้างข้อความจาก prompt
- วิเคราะห์ภาพ (Image Understanding)
- อ่านและสรุปไฟล์ PDF (PDF Understanding)
----

1. ติดตั้งไลบรารี `google-genai` ด้วยคำสั่ง pip
2. API Key สำหรับการใช้งาน Gemini API
3. Gemini Generate text
4. Gemini image understanging
5. Gemini pdf understanging


## 1. ติดตั้งไลบรารี `google-genai` ด้วยคำสั่ง pip

In [1]:
# Installation
!pip install google-genai

Collecting google-genai
  Downloading google_genai-1.25.0-py3-none-any.whl.metadata (41 kB)
Collecting google-auth<3.0.0,>=2.14.1 (from google-genai)
  Downloading google_auth-2.40.3-py2.py3-none-any.whl.metadata (6.2 kB)
Collecting pydantic<3.0.0,>=2.0.0 (from google-genai)
  Downloading pydantic-2.11.7-py3-none-any.whl.metadata (67 kB)
Collecting tenacity<9.0.0,>=8.2.3 (from google-genai)
  Downloading tenacity-8.5.0-py3-none-any.whl.metadata (1.2 kB)
Collecting websockets<15.1.0,>=13.0.0 (from google-genai)
  Downloading websockets-15.0.1-cp312-cp312-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.8 kB)
Collecting cachetools<6.0,>=2.0.0 (from google-auth<3.0.0,>=2.14.1->google-genai)
  Downloading cachetools-5.5.2-py3-none-any.whl.metadata (5.4 kB)
Collecting pyasn1-modules>=0.2.1 (from google-auth<3.0.0,>=2.14.1->google-genai)
  Downloading pyasn1_modules-0.4.2-py3-none-any.whl.metadata (3.5 kB)
Collecting rsa<5,>=3.1.4 (from google

## 2. API Key สำหรับการใช้งาน Gemini API

ก่อนจะเริ่มต้นใช้งาน Gemini API ผ่าน Python เราจำเป็นต้องมี **API Key** ซึ่งสามารถสร้างได้จาก Google AI Studio

วิธีการขอ API Key

1. เข้าเว็บไซต์ [Google AI Studio](https://aistudio.google.com/app/apikey)
2. **Sign in** ด้วยบัญชี Google ของคุณ
3. คลิกปุ่ม `Create API Key`
4. ตั้งชื่อ Key และเลือก Project ที่ต้องการ (หรือสร้าง Project ใหม่)
5. กด "Create" แล้ว **คัดลอก API Key** ไว้ใช้งาน

> 🔑 แนะนำให้เก็บ API Key ไว้ใน `.env` file หรือ Environment Variables เพื่อความปลอดภัย

In [None]:
import os
from dotenv import load_dotenv
from google import genai

load_dotenv("../.env")

client = genai.Client(api_key=os.getenv("GEMINI_API_KEY"))

## 3. Gemini: Generate Text

Gemini API รองรับการสร้างข้อความจาก prompt ได้อย่างชาญฉลาด  
เหมาะกับการใช้ในงาน เช่น การเขียนบทความ แนะนำสินค้า สรุปข้อมูล หรือแม้แต่แต่งเรื่อง

In [None]:
# กำหนดโมเดล Gemini ที่จะใช้ (เวอร์ชันล่าสุดและเร็ว)
MODEL_ID = "gemini-2.5-flash"

# เรียกใช้ Gemini เพื่อให้แนะนำหนังสือ AI สำหรับผู้เริ่มต้น
response = client.models.generate_content(
    model=MODEL_ID,  # ระบุโมเดลที่ใช้
    contents='แนะนำหนังสือ AI สำหรับผู้เริ่มต้น'  # ข้อความที่ใช้ถาม AI
)

# แสดงผลลัพธ์ที่ได้จากโมเดล
print(response.text)

## 4. Gemini Image Understanding

Google Gemini API รองรับการประมวลผลภาพร่วมกับข้อความ (multimodal)  
ทำให้คุณสามารถส่ง **รูปภาพ + คำถาม** เพื่อให้โมเดลวิเคราะห์และให้คำตอบได้ เช่น  
การตรวจสอบว่าสินค้าในภาพคืออะไร, วิเคราะห์ป้ายราคา, หรือเข้าใจบริบทของภาพในเชิงลึก

---
ตัวอย่างภาพ

<img src="https://storage.googleapis.com/ai-agent-jetpack/example-product.png" width="100px;"/>


In [None]:
!wget https://storage.googleapis.com/ai-agent-jetpack/example-product.png

In [None]:
import PIL.Image  # ใช้จากไลบรารี Pillow สำหรับเปิดไฟล์ภาพ

# โหลดภาพจากไฟล์ในเครื่อง
image = PIL.Image.open("example-product.png")

# เรียก Gemini API โดยใช้โมเดลที่ตั้งไว้ เช่น gemini-2.0-flash
response = client.models.generate_content(
    model=MODEL_ID,                  # ใช้โมเดล Gemini ที่กำหนดไว้ก่อนหน้า
    contents=[
        "ภาพนี้คืออะไร?",           # คำสั่ง/คำถามที่ส่งเข้าไป
        image,                       # ภาพที่ต้องการให้ AI วิเคราะห์
    ],
)

# แสดงผลลัพธ์ที่ AI ตอบกลับมา
print(response.text)

## 5. Gemini Document Understanding

Gemini รองรับการวิเคราะห์เอกสาร PDF โดยใช้โมเดลเวอร์ชัน `gemini-1.5-pro` หรือสูงกว่า  
สามารถใช้ในการสรุปเนื้อหา ค้นหาข้อมูลในเอกสาร หรือถามตอบจากไฟล์ PDF โดยตรง

---

ตัวอย่างเอกสาร PDF

<img src="https://storage.googleapis.com/ai-agent-jetpack/example-pdf.png" width="300px"></img>


In [None]:
import httpx  # ใช้สำหรับส่ง HTTP request
from google.genai import types  # ใช้สร้างข้อมูลประเภท Part (เช่น PDF, image)

# ลิงก์ไปยัง PDF เอกสาร Fund Factsheet
doc_url = "https://secdocumentstorage.blob.core.windows.net/fundfactsheet/M0370_2563.pdf"

# โหลดเอกสาร PDF จาก URL เป็น binary
doc_data = httpx.get(doc_url).content

# คำถามที่ส่งไปให้ Gemini วิเคราะห์
prompt = "สรุปเอกสารนี้ให้หน่อย"

# เรียกใช้ Gemini API โดยแนบทั้ง PDF และ prompt
response = client.models.generate_content(
  model=MODEL_ID,   # เช่น gemini-2.0-flash
  contents=[
      types.Part.from_bytes(
        data=doc_data,               # ข้อมูล binary ของ PDF
        mime_type='application/pdf' # MIME type บอกว่าเป็น PDF
      ),
      prompt                         # สั่งให้สรุปเอกสาร
  ]
)

# แสดงผลลัพธ์จาก Gemini
print(response.text)