# Google AI Studio
* https://aistudio.google.com/
* https://ai.google.dev/gemini-api/docs?hl=zh-tw
* https://ai.google.dev/gemini-api/docs/get-started/tutorial?lang=python&hl=zh-tw

In [1]:
! pip install -q -U google-generativeai

In [2]:
API_KEY = "AIzaSyA54SjzjTeniIeDZ51pBoMYxyV86-iV6no"

## Load Model

In [3]:
import google.generativeai as genai

model = genai.GenerativeModel('gemini-2.0-flash')
genai.configure(api_key=API_KEY)

## 產生文字

In [4]:
prompt = "機器學習的定義"
response = model.generate_content(prompt)
print(response.text)

機器學習 (Machine Learning) 是一種人工智慧 (AI) 的子領域，它專注於**讓電腦系統能夠從資料中學習，而無需明確地進行程式設計**。換句話說，機器學習演算法可以從數據中提取模式和知識，並利用這些知識來進行預測、決策或改進自身的性能。

更精確地說，一個程式被認為可以從經驗 E 中學習，針對某任務 T 和性能度量 P，如果它在任務 T 上的性能（由 P 衡量）隨著經驗 E 的增加而改進。

**分解定義中的關鍵概念：**

*   **經驗 (Experience, E)：** 這是機器學習演算法學習的數據。它可以是標記過的數據 (labeled data, 用於監督式學習)、未標記的數據 (unlabeled data, 用於非監督式學習) 或者是與環境的互動 (用於強化學習)。
*   **任務 (Task, T)：** 這是機器學習演算法被設計來執行的特定問題。例如，預測一封電子郵件是否為垃圾郵件、識別圖像中的物體、或者玩遊戲。
*   **性能度量 (Performance Measure, P)：** 這是評估機器學習演算法在任務 T 上表現的標準。例如，準確度、精確度、召回率、F1 分數等。

**總結來說，機器學習的定義強調以下幾個方面：**

*   **從數據中學習：** 機器學習演算法依賴於數據來提取知識和模式。
*   **無需明確程式設計：** 傳統的程式設計需要手動編寫規則來解決問題，而機器學習則讓電腦自己學習規則。
*   **改進性能：** 隨著數據量的增加，機器學習演算法的性能會不斷提高。
*   **預測和決策：** 機器學習演算法可以用於預測未來事件、做出決策、以及自動化各種任務。

**更簡潔的定義：**

機器學習是利用算法讓電腦從數據中學習，並在未經明確程式設計的情況下做出預測或決策的過程。

希望這個定義能幫助你理解機器學習!



### 產生文字串流

In [5]:
import os
import google.generativeai as genai

prompt = "機器學習的定義"

response = model.generate_content(prompt, stream=True)

for chunk in response:
  print(chunk.text)
  print("_"*80)

機器
________________________________________________________________________________
學習 (Machine
________________________________________________________________________________
 Learning, ML) 是一種人工智能 (Artificial Intelligence, AI) 的子領域，它使
________________________________________________________________________________
電腦**無需明確程式化**就能從數據中學習和改進。
________________________________________________________________________________
 

更詳細地說，機器學習的定義可以概括為以下幾點：

* **從經驗中學習：** 機器學習算法
________________________________________________________________________________
不是被明確指示如何解決問題，而是通過分析大量數據（即“經驗”）來學習模式和做出預測。
* **改進性能：**
________________________________________________________________________________
 隨著數據量的增加，機器學習算法的性能會不斷提升，例如預測的準確性、分類的效率等。
* **不需要明確程式化：** 這與傳統的程式設計不同，傳統程式設計需要開發
________________________________________________________________________________
人員為每個可能的輸入編寫明確的規則。 機器學習算法則可以根據數據自行推導出這些規則。
* **建立模型：** 機器學習算法的目標是根據數據建立一個**模型**，該
________________________________________________________________

## 多模態

In [6]:
import pathlib
import google.generativeai as genai
import urllib.request

# image1 = {
#     'mime_type': 'image/jpeg',
#     'data': pathlib.Path('image1.jpg').read_bytes()
# }

image1 = {
    'mime_type': 'image/jpeg',
    'data': urllib.request.urlopen("https://img.ltn.com.tw/Upload/health/page/800/2022/01/01/phprhI3u1.jpg").read()
}
prompt = "照片中有幾根香蕉"


response = model.generate_content([prompt, image1])
print(response.text)

在照片中有兩串香蕉。


# 物件辨識


In [8]:
import pathlib
import google.generativeai as genai
import urllib.request

image1 = {
    'mime_type': 'image/jpeg',
    'data': urllib.request.urlopen("https://mentorx.tw/wp-content/gallery/corn_20170511/a_KLB_0298.jpg").read()
}
prompt = '''
列出照片中人臉的座標，請嚴格按照下面的JSON格式來輸出結果
<JSON>
[
    {"class":"人臉", "corr":[X,Y,W,H], "id":1, "age":年齡, "gender":性別},
    {"class":"人臉", "corr":[X,Y,W,H], "id":2, "age":年齡, "gender":性別},
    {"class":"人臉", "corr":[X,Y,W,H], "id":3, "age":年齡, "gender":性別},
]
</JSON>
'''


response = model.generate_content([prompt, image1])
print(response.text)

```json
[
    {"class":"人臉", "corr":[126,134,131,163], "id":1, "age":55, "gender":"男性"},
    {"class":"人臉", "corr":[327,182,104,130], "id":2, "age":25, "gender":"女性"},
    {"class":"人臉", "corr":[510,181,103,131], "id":3, "age":27, "gender":"男性"},
    {"class":"人臉", "corr":[699,195,101,131], "id":4, "age":50, "gender":"女性"}
]
```


In [9]:
import pathlib
import google.generativeai as genai
import urllib.request


image1 = {
    'mime_type': 'image/jpeg',
    'data': urllib.request.urlopen("https://img.ltn.com.tw/Upload/health/page/800/2022/01/01/phprhI3u1.jpg").read()
}
prompt = '''
列出照片中物件的座標，請嚴格按照下面的JSON格式來輸出結果。
辨識的物件限定為{香蕉、西瓜、蘋果}
<JSON>
[
    {"class":"物件名稱", "corr":[X,Y,W,H], "id":1, "color":"物件顏色"},
    {"class":"物件名稱", "corr":[X,Y,W,H], "id":2, "color":"物件顏色"},
    {"class":"物件名稱", "corr":[X,Y,W,H], "id":3, "color":"物件顏色"},
]
</JSON>
'''


response = model.generate_content([prompt, image1])
print(response.text)

```json
[
    {"class":"香蕉", "corr":[71,108,177,177], "id":1, "color":"綠色"},
    {"class":"蘋果", "corr":[242,151,43,44], "id":2, "color":"紅色"},
    {"class":"蘋果", "corr":[126,253,30,30], "id":3, "color":"紅色"},
    {"class":"香蕉", "corr":[308,251,123,132], "id":4, "color":"黃色"},
    {"class":"西瓜", "corr":[188,347,158,130], "id":5, "color":"紅色"},
    {"class":"香蕉", "corr":[71,108,177,177], "id":6, "color":"綠色"},
    {"class":"西瓜", "corr":[564,346,142,126], "id":7, "color":"黃色"},
    {"class":"蘋果", "corr":[495,65,38,37], "id":8, "color":"紅色"}
]
```


# 介面


In [19]:
!pip install gradio
!pip install -U google-generativeai gradio



In [12]:
import gradio as gr
import google.generativeai as genai

model = genai.GenerativeModel('gemini-2.0-flash')
genai.configure(api_key=API_KEY)
prompt = '''
請依照下面的書籍描述來將書籍進行分類，分類的類別只能從下面複選：
[程式語言, Data Science, 人工智慧, 分散式架構, 系統開發, 行動軟體開發, 資料庫, 資訊科學, 軟體架構, 軟體測試, 軟體工程, 資訊安全, 網站開發, 前端開發, 架站軟體, 網頁設計, Adobe 軟體應用, Office 系列, 遊戲開發設計, UI/UX, 雲端運算, 區塊鏈與金融科技, 物聯網 IoT, 商業管理類, 電子電路電機類, 嵌入式系統, 視覺影音設計, 考試認證, 數學, 微軟技術, MAC OS 蘋果電腦, 其他, 兒童專區, 製圖軟體應用, 語言學習, 國家考試, 職涯發展, Java, 理工類, 網路通訊, 量子電腦]

<書籍描述>
{書籍描述}
</書籍描述>

輸出請嚴格按照下面的JSON格式
<JSON>
[類別1, 類別2, 類別3, ]
</JSON>
'''

def book_label(book):
    prompt2 = prompt.format(書籍描述=book)
    response = model.generate_content(prompt2)
    return response.text

demo = gr.Interface(fn=book_label, inputs=[gr.Textbox(label="書籍描述", lines=10)],
    outputs=gr.Textbox(label="分類結果"))
demo.launch()
# book_label('dummy for java')

Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://fa72964ec8b19d4d1c.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [18]:
import gradio as gr
import google.generativeai as genai
from PIL import Image

model = genai.GenerativeModel('gemini-pro-vision')
genai.configure(api_key=API_KEY)

prompt = '''
列出照片中物件的座標，請嚴格按照下面的JSON格式來輸出結果。
辨識的物件限定為{香蕉、西瓜、蘋果}
<JSON>
[
    {"class":"物件名稱", "corr":[X,Y,W,H], "id":1, "color":"物件顏色"},
    {"class":"物件名稱", "corr":[X,Y,W,H], "id":2, "color":"物件顏色"},
    {"class":"物件名稱", "corr":[X,Y,W,H], "id":3, "color":"物件顏色"},
]
</JSON>
'''



def img_label(img):
    try:
        response = model.generate_content([prompt, img])
        return response.text
    except Exception as e:
        return f"發生錯誤：{str(e)}"

demo = gr.Interface(
    fn=img_label,
    inputs=gr.Image(type="pil", label="上傳圖片"),
    outputs=gr.Textbox(label="辨識結果（JSON）"),
    title="📸 圖像辨識 (Gemini)",
    description="上傳一張圖片，系統會辨識物件並輸出 JSON 格式座標與顏色"
)

demo.launch(share=True)


Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://335840d22b5684a856.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


