# ตัวอย่างการใช้งาน Gemini in Python อย่างง่าย

Notebook นี้สาธิตวิธีการใช้งาน Gemini API เพื่อ:
- สร้างข้อความจาก prompt
- วิเคราะห์ภาพ (Image Understanding)
- อ่านและสรุปไฟล์ PDF (PDF Understanding)
----

1. ติดตั้งไลบรารี `google-genai` ด้วยคำสั่ง pip
2. API Key สำหรับการใช้งาน Gemini API
3. Gemini Generate text
4. Gemini image understanging
5. Gemini pdf understanging


## 1. ติดตั้งไลบรารี `google-genai` ด้วยคำสั่ง pip

In [None]:
# Installation
!pip install google-genai

## 2. API Key สำหรับการใช้งาน Gemini API

ก่อนจะเริ่มต้นใช้งาน Gemini API ผ่าน Python เราจำเป็นต้องมี **API Key** ซึ่งสามารถสร้างได้จาก Google AI Studio

วิธีการขอ API Key

1. เข้าเว็บไซต์ [Google AI Studio](https://aistudio.google.com/app/apikey)
2. **Sign in** ด้วยบัญชี Google ของคุณ
3. คลิกปุ่ม `Create API Key`
4. ตั้งชื่อ Key และเลือก Project ที่ต้องการ (หรือสร้าง Project ใหม่)
5. กด "Create" แล้ว **คัดลอก API Key** ไว้ใช้งาน

> 🔑 แนะนำให้เก็บ API Key ไว้ใน `.env` file หรือ Environment Variables เพื่อความปลอดภัย

In [None]:
import os
from dotenv import load_dotenv
from google import genai

load_dotenv("../.env")

client = genai.Client(api_key=os.getenv("GEMINI_API_KEY"))

## 3. Gemini: Generate Text

Gemini API รองรับการสร้างข้อความจาก prompt ได้อย่างชาญฉลาด  
เหมาะกับการใช้ในงาน เช่น การเขียนบทความ แนะนำสินค้า สรุปข้อมูล หรือแม้แต่แต่งเรื่อง

In [None]:
MODEL_ID="gemini-2.5-flash"
response = client.models.generate_content(
    model=MODEL_ID,
    contents='แนะนำหนังสือ AI สำหรับผู้เริ่มต้น'
)
print(response.text)

## 4. Gemini Image Understanding

Google Gemini API รองรับการประมวลผลภาพร่วมกับข้อความ (multimodal)  
ทำให้คุณสามารถส่ง **รูปภาพ + คำถาม** เพื่อให้โมเดลวิเคราะห์และให้คำตอบได้ เช่น  
การตรวจสอบว่าสินค้าในภาพคืออะไร, วิเคราะห์ป้ายราคา, หรือเข้าใจบริบทของภาพในเชิงลึก

---
ตัวอย่างภาพ

<img src="https://storage.googleapis.com/ai-agent-jetpack/example-product.png" width="100px;"/>


In [None]:
!wget https://storage.googleapis.com/ai-agent-jetpack/example-product.png

In [None]:
import PIL.Image
image = PIL.Image.open("example-product.png")
response = client.models.generate_content(
    model=MODEL_ID,
    contents=[
        "ภาพนี้คืออะไร?",image,
    ],
)
print(response.text)

## 5. Gemini Document Understanding

Gemini รองรับการวิเคราะห์เอกสาร PDF โดยใช้โมเดลเวอร์ชัน `gemini-1.5-pro` หรือสูงกว่า  
สามารถใช้ในการสรุปเนื้อหา ค้นหาข้อมูลในเอกสาร หรือถามตอบจากไฟล์ PDF โดยตรง

---

ตัวอย่างเอกสาร PDF

<img src="https://storage.googleapis.com/ai-agent-jetpack/example-pdf.png" width="300px"></img>


In [None]:
import httpx
from google.genai import types

doc_url = "https://secdocumentstorage.blob.core.windows.net/fundfactsheet/M0370_2563.pdf"  
doc_data = httpx.get(doc_url).content

prompt = "สรุปเอกสารนี้ให้หน่อย"
response = client.models.generate_content(
  model=MODEL_ID,
  contents=[
      types.Part.from_bytes(
        data=doc_data,
        mime_type='application/pdf',
      ),
      prompt])
print(response.text)