# Google AI Studio
* https://aistudio.google.com/
* https://ai.google.dev/gemini-api/docs?hl=zh-tw
* https://ai.google.dev/gemini-api/docs/get-started/tutorial?lang=python&hl=zh-tw

In [2]:
# ! pip install -q -U google-generativeai

In [1]:
API_KEY = "AIzaSyA54SjzjTeniIeDZ51pBoMYxyV86-iV6no"

## Load Model

In [2]:
import google.generativeai as genai

model = genai.GenerativeModel('gemini-2.0-flash')
genai.configure(api_key=API_KEY)

## 產生文字

In [4]:
prompt = "機器學習的定義"
response = model.generate_content(prompt)
print(response.text)

機器學習 (Machine Learning) 是一個廣泛的定義，但核心概念可以用以下幾種方式來表達：

**1. 從數據中學習並改進性能，而無需明確編程：**

   這是最常見且廣泛使用的定義。  它強調機器學習系統能夠從輸入數據中學習模式和關係，並根據這些學習到的模式來做出預測或決策。更重要的是，這個學習過程不需要人工編寫複雜的規則或程序，而是機器自己根據數據調整其內部參數。

**2.  使計算機能夠在沒有明確編程的情況下學習的一種技術：**

   這個定義更簡潔地概括了機器學習的目標。它強調了通過學習來避免繁瑣的人工編程，使計算機能夠自動適應新的數據和任務。

**3.  一個算法或系統，通過經驗（數據）的積累來改善其在特定任務上的表現：**

   這個定義側重於機器學習的算法和系統，以及它們如何通過數據的累積來提高在特定任務上的準確性和效率。  它強調了 **經驗 (Experience)**的重要性，也就是訓練數據。

**更詳細的解釋包括以下關鍵要素：**

*   **數據 (Data):**  機器學習的基礎。可以是結構化數據 (例如表格數據庫) 或非結構化數據 (例如文本、圖像、音頻)。
*   **算法 (Algorithm):** 用於從數據中學習模式的數學和統計模型。常見的算法包括線性回歸、支持向量機、決策樹、神經網絡等。
*   **模型 (Model):**  算法在訓練數據上學習到的知識的表示。模型可以用於預測新的數據或做出決策。
*   **任務 (Task):**  機器學習系統要完成的具體目標，例如圖像分類、自然語言處理、預測銷售額等。
*   **性能指標 (Performance Metric):**  用於評估機器學習系統在任務上的表現的標準。例如，準確度、召回率、F1 分數等。

**總之，機器學習的本質是：**

使用算法從數據中自動學習並構建模型，然後利用這些模型來做出預測、決策或解決問題，並隨著更多數據的輸入不斷改善性能。 它代表了一種從數據中提取知識，而無需人類明確編程規則的方法。



### 產生文字串流

In [17]:
import os
import google.generativeai as genai

prompt = "機器學習的定義"

response = model.generate_content(prompt, stream=True)

for chunk in response:
  print(chunk.text)
  print("_"*80)

機器
________________________________________________________________________________
學習的定義有很多种，但核心思想是：

**机器学习是
________________________________________________________________________________
计算机科学的一个分支，它允许计算机系统从数据中学习，而无需
________________________________________________________________________________
显式编程。**

更具体地说，机器学习算法可以：

* **识别模式和趋势:** 从大量数据中找出隐藏的规律和
________________________________________________________________________________
关系，帮助预测未来结果。
* **做出预测:** 基于学习到的模式，预测未来事件的发生概率。
* **进行分类:**
________________________________________________________________________________
 将数据分类到不同的类别中。
* **自动优化:** 自动调整算法参数，以提高模型的性能。

**核心概念：**

* **数据:** 机器学习模型的核心，提供信息以进行学习。

________________________________________________________________________________
* **算法:** 处理数据的数学公式，提取信息和构建模型。
* **模型:** 通过算法训练得到的结果，用于预测或分类。
* **训练:** 用已知数据训练模型，使其能够学习模式。
________________________________________________________________________________

* **预测:** 用训练好的模型，对新数据进行预测或分类。

**机器学习的应用非常广泛，包括：**

* **图像识别:** 识别照片中的物体、人

## 多模態

In [15]:
import pathlib
import google.generativeai as genai
import urllib.request

# image1 = {
#     'mime_type': 'image/jpeg',
#     'data': pathlib.Path('image1.jpg').read_bytes()
# }

# image1 = {
#     'mime_type': 'image/jpeg',
#     'data': urllib.request.urlopen("https://img.ltn.com.tw/Upload/health/page/800/2022/01/01/phprhI3u1.jpg").read()
# }
# prompt = "照片中有幾根香蕉"

image1 = {
    'mime_type': 'image/jpeg',
    'data': urllib.request.urlopen("https://mentorx.tw/wp-content/gallery/corn_20170511/a_KLB_0298.jpg").read()
}
prompt = '''
列出照片中人臉的座標，請嚴格按照下面的JSON格式來輸出結果
<JSON>
[
    {"class":"人臉", "corr":[X,Y,W,H], "id":1, "age":年齡, "gender":性別},
    {"class":"人臉", "corr":[X,Y,W,H], "id":2, "age":年齡, "gender":性別},
    {"class":"人臉", "corr":[X,Y,W,H], "id":3, "age":年齡, "gender":性別},
]
</JSON>
'''

# image1 = {
#     'mime_type': 'image/jpeg',
#     'data': urllib.request.urlopen("https://img.ltn.com.tw/Upload/health/page/800/2022/01/01/phprhI3u1.jpg").read()
# }
# prompt = '''
# 列出照片中物件的座標，請嚴格按照下面的JSON格式來輸出結果。
# 辨識的物件限定為{香蕉、西瓜、蘋果}
# <JSON>
# [
#     {"class":"物件名稱", "corr":[X,Y,W,H], "id":1, "color":"物件顏色"},
#     {"class":"物件名稱", "corr":[X,Y,W,H], "id":2, "color":"物件顏色"},
#     {"class":"物件名稱", "corr":[X,Y,W,H], "id":3, "color":"物件顏色"},
# ]
# </JSON>
# '''


response = model.generate_content([prompt, image1])
print(response.text)

```json
[
    {"class":"人臉", "corr":[137,164,146,188], "id":1, "age":55, "gender":"男性"},
    {"class":"人臉", "corr":[307,210,101,137], "id":2, "age":25, "gender":"女性"},
    {"class":"人臉", "corr":[507,203,94,127], "id":3, "age":28, "gender":"男性"},
    {"class":"人臉", "corr":[718,205,84,127], "id":4, "age":53, "gender":"女性"}
]
```


In [29]:
book = '''
內容介紹:

▍attention / self-attention 機制、Transformer、GPT...，大型語言模型 (LLM) 背後的先進技術「硬派」揭密！

▍AI 界扛霸子 NVIDIA 的深度學習 (Deep Learning) 指定教材！

近年來，在 NVIDIA (輝達) GPU、CUDA 技術的推波助瀾下，深度學習 (Deep Learning) 領域有著爆炸性的成長，例如最為人知的 ChatGPT 正是運用深度學習技術開發出來的當紅應用。

□【徹底看懂 ChatGPT 背後核心技術 - Transformer、GPT 的模型架構】

自從 ChatGPT 爆紅之後，自然語言處理 (NLP) 一直是深度學習的熱門研究話題，ChatGPT 的背後核心是 GPT 模型，而 GPT 裡面最重要最重要的技術就是最後那個「T」- 也就是大名鼎鼎、使用了 attention (注意力) 機制的 Transformer 模型，這當中所用的建模技術可說是一環扣一環，也容易讓初學者學起來暈的不得了，只要一個關鍵地方沒搞懂，後面就全花了...

為此，本書經過精心設計，是帶你看懂 Transformer、GPT...這些先進技術的最佳救星！本書設計了「環環相扣」的 NLP 章節內容，從最末章的 GPT 模型往回推，循序漸進介紹各技術的細節：

🔹看懂循環神經網路的缺點就知道為什麼需要 attention 機制以及 seq2seq 架構
🔹看懂 attention 機制就能看懂 self-attention 機制
🔹看懂 seq2seq 架構就能看懂 Transformer 的 encoder-decoder 架構
🔹看懂 self-attention、seq2seq 就能看懂 Transformer
🔹看懂 Transformer 就能看懂 GPT

你可以深刻感受到次一章的模型架構幾乎都是為了解決前一章模型的特定問題而誕生的，經此一輪學習下來，保證讓你對 attention / self-attention 機制、Transformer、GPT 技術清清楚楚！這絕對是其他書看不到的精彩內容！

【★學深度學習先進技術，跟 AI 重要推手 - NVIDIA 學最到位！】

NVIDIA 除了在硬體上為 AI 帶來助益外，為了幫助眾多初學者快速上手深度學習，任職於 NVIDIA 的本書作者 Magnus Ekman 凝聚了他多年來在 NVIDIA 所積累的 AI 知識撰寫了本書。本書同時也是 NVIDIA 的教育和培訓部門 -【深度學習機構 (Deep Learning Institute, DLI)】 指定的培訓教材 (https://www.nvidia.com/zh-tw/training/books/)。

要學深度學習，跟深度學習的重要推手 NVIDIA 學就對了！眾多紮實的內容保證讓你受益滿滿！

本書特色:

□【看懂 ChatGPT 背後核心技術 - GPT 的模型架構】
attention 機制、self-attention 機制、Transformer、GPT、encoder-decoder、seq2seq、query-key-value 機制、Multi-head、位置編碼 (positional encoding)、預訓練 (pre-train)、微調 (fine-tune)...各種建模技術輕鬆搞懂！

□【生成式 AI 語言模型 100% 從零開始打造！】
‧用 Colab + tf.Keras 實作【多國語言翻譯模型】、【Auto-Complete 文字自動完成模型】
‧從處理原始文字訓練資料 → 切割資料集 → 建構模型 → 模型調校、優化，從頭到尾示範一遍，帶你紮穩大型語言模型 (LLM) 的建模基礎

□【深度學習基礎知識學好學滿】
‧紮穩根基！不被損失函數 / 梯度下降 / 反向傳播 / 正規化 / 常規化…一拖拉庫技術名詞搞的暈頭轉向！
‧深度神經網路基礎 / CNN / RNN / LSTM...基礎概念詳解
‧多模態學習 (multimodal learning)、多任務學習 (multitask learning)、自動化模型架構搜尋...熱門主題介紹。

□詳細解說, 流暢翻譯
本書由【施威銘研究室】監修, 書中針對原書進行大量補充, 並適當添加註解, 幫助讀者更加理解內容！

作者簡介
Magnus Ekman

現為 NVIDIA 架構總監，擁有資訊工程博士學位與多項專利。他於 1990 年代後期首次接觸人工神經網路、親身體會進化計算的威力後，開始鑽研計算機架構，並與妻兒遷往矽谷居住。他曾在昇陽電腦和 Samsung Research America 從事處理器設計和研發。他目前在 NVIDIA 領導一個工程團隊，負責開發自駕車、人工智慧 (AI) 資料中心專用的高效能、低功率 CPU。

目錄大綱
Ch01 從感知器看神經網路的底層知識
1-1  最早的人工神經元 - Rosenblatt 感知器
1-2  增加感知器模型的能力
1-3  用線性代數實現神經網路模型

Ch02 梯度下降法與反向傳播
2-1  導數的基礎概念
2-2  以梯度下降法 (gradient descent) 對模型訓練問題求解
2-3  反向傳播 (back propagation)

Ch03 多層神經網路的建立與調校
3-1  動手實作：建立辨識手寫數字的多層神經網路
3-2  改善神經網路的訓練成效
3-3  實驗：調整神經網路與學習參數

Ch04 用卷積神經網路 (CNN) 進行圖片辨識
4-1  卷積神經網路 (CNN)
4-2  實作：以卷積神經網路做圖片分類
4-3  更深層的 CNN 與預訓練模型

Ch05 用循環神經網路 (RNN、LSTM...) 處理序列資料
5-1  RNN 的基本概念
5-2  RNN 範例：預測書店銷售額
5-3  LSTM (長短期記憶神經網路)
5-4  LSTM 範例：文字的 Auto-Complete 機制

Ch06 自然語言處理的重要前置工作：建立詞向量空間
6-1  詞向量空間的基本知識
6-2  做法(一)：在神經網路建模過程中「順便」生成詞向量空間
6-3  做法(二)：以 word2vec、GloVe 專用演算法生成詞向量空間

Ch07 用機器翻譯模型熟悉 seq2seq 架構
7-1  機器翻譯模型的基本知識
7-2  機器翻譯的範例實作
7-2-1  tf.Keras 函數式 API 簡介
7-2-2  建構模型前的工作
7-2-3  建構模型
7-2-4  訓練及測試模型
7-2-5  實驗結果

Ch08 認識 attention 與 self-attention 機制
8-1  熟悉 attention 機制
8-2  認識 self-attention 機制
8-2-1 self-attention 的基本概念
8-2-2 self-attention 機制的算法
8-2-3 multi-head (多頭) 的 self-attention 機制

Ch09 Transformer、GPT 及其他衍生模型架構
9-1  Transformer 架構
9-1-1 編碼器端的架構
9-1-2 解碼器端的架構
9-1-3 Transformer 內的其他設計
9-1-4 小編補充：觀摩 keras 官網上的 Transformer 範例
9-2 Transformer 架構的衍生模型：GPT、BERT
9-2-1  認識 GPT 模型
9-2-2  認識 BERT 模型
9-2-3 其他從 Transformer 衍生出的模型

附錄 A 延伸學習 (一)：多模態、多任務...等模型建構相關主題
附錄 B 延伸學習 (二)：自動化模型架構搜尋
附錄 C 延伸學習 (三)：後續學習方向建議
附錄 D 使用 Google 的 Colab 雲端開發環境
'''

prompt = '''
請依照下面的書籍描述來將書籍進行分類，分類的類別只能從下面複選：
[程式語言, Data Science, 人工智慧, 分散式架構, 系統開發, 行動軟體開發, 資料庫, 資訊科學, 軟體架構, 軟體測試, 軟體工程, 資訊安全, 網站開發, 前端開發, 架站軟體, 網頁設計, Adobe 軟體應用, Office 系列, 遊戲開發設計, UI/UX, 雲端運算, 區塊鏈與金融科技, 物聯網 IoT, 商業管理類, 電子電路電機類, 嵌入式系統, 視覺影音設計, 考試認證, 數學, 微軟技術, MAC OS 蘋果電腦, 其他, 兒童專區, 製圖軟體應用, 語言學習, 國家考試, 職涯發展, Java, 理工類, 網路通訊, 量子電腦]

<書籍描述>
{書籍描述}
</書籍描述>
'''


response = model.generate_content(prompt.format(書籍描述=book))
print(response.text)

*   人工智慧
*   Data Science
*   程式語言
*   軟體工程
*   理工類



In [31]:
import gradio as gr
import google.generativeai as genai

model = genai.GenerativeModel('gemini-2.0-flash')
genai.configure(api_key=API_KEY)
prompt = '''
請依照下面的書籍描述來將書籍進行分類，分類的類別只能從下面複選：
[程式語言, Data Science, 人工智慧, 分散式架構, 系統開發, 行動軟體開發, 資料庫, 資訊科學, 軟體架構, 軟體測試, 軟體工程, 資訊安全, 網站開發, 前端開發, 架站軟體, 網頁設計, Adobe 軟體應用, Office 系列, 遊戲開發設計, UI/UX, 雲端運算, 區塊鏈與金融科技, 物聯網 IoT, 商業管理類, 電子電路電機類, 嵌入式系統, 視覺影音設計, 考試認證, 數學, 微軟技術, MAC OS 蘋果電腦, 其他, 兒童專區, 製圖軟體應用, 語言學習, 國家考試, 職涯發展, Java, 理工類, 網路通訊, 量子電腦]

<書籍描述>
{書籍描述}
</書籍描述>

輸出請嚴格按照下面的JSON格式
<JSON>
[類別1, 類別2, 類別3, ]
</JSON>
'''


def book_label(book):
    prompt2 = prompt.format(書籍描述=book)
    response = model.generate_content(prompt2)
    return response.text

demo = gr.Interface(fn=book_label, inputs=[gr.Textbox(label="書籍描述", lines=10)], 
    outputs=gr.Textbox(label="分類結果"))
demo.launch() 
# book_label('dummy for java')

* Running on local URL:  http://127.0.0.1:7867

To create a public link, set `share=True` in `launch()`.




In [45]:
工作需求='''
工作內容
1. 規劃及執行人工智慧系列課程設計。
2. 課程教授與學員學習期間關懷。
3. 備課與人工智慧相關新技術之導入。
4. 課程教學

職務類別
講師、資料科學家、演算法工程師
工作待遇
待遇面議（經常性薪資達 4 萬元或以上）取得專屬你的薪水報告
工作性質
全職
上班地點
台北市大安區復興南路1段390號2樓 (距捷運大安站約130公尺)
管理責任
不需負擔管理責任
出差外派
無需出差外派
上班時段
日班
休假制度
依公司規定
可上班日
不限
需求人數
1人
條件要求
工作經歷
2年以上
學歷要求
專科以上
科系要求
不拘
語文條件
不拘

擅長工具
Python、scikit-learn、OpenCV、Computer Vision、LLM、Prompt
提升專業能力
工作技能
軟體程式設計、Machine Learning、深度學習、人工智慧、語言模型、演算法設計、提示工程、生成式AI
其他條件
未填寫
'''

個人履歷='''
經歷：
中原大學電子所博士

中央研究院資訊科學所博士後研究員

吉鴻電子資深工程師

冠捷科技正工程師

104人力銀行人資學院資料科學家

長庚大學工商管理系兼任實務教師

104人力銀行人資學院顧問


現職：
台灣人工智能產業協會講師

實踐大學推廣中心講師

緯育講師


專案經驗：
收鈔機韌體(偽鈔偵測)

電視韌體

交通執法系統

高承載管制違規偵測系統

手持式雷射測距儀

區間測速系統

違停偵測系統

活動地磅系統

測速照相系統

人才適任與久任度評估系統


專長：
機器學習、影像識別、大語言模型、生成式AI、數位電路與嵌入式系統、程式設計
'''

工作需求2='''
工作內容
1.工程請款
2.維修保養合約審閱
3.開立發票
4.處理廠商貨款或費用等應付款項帳務。 
5.銀行臨櫃匯款等作業。 
6.需具有1年以上會計經驗。
7.主管交辦事項 

職務類別
財務會計助理、記帳／出納／一般會計、財務分析／財務人員
工作待遇
月薪30,000~35,000元（固定或變動薪資因個人資歷或績效而異）取得專屬你的薪水報告
工作性質
全職
上班地點
台北市南港區南港路二段99-3號 (距捷運昆陽站約500公尺)
管理責任
不需負擔管理責任
出差外派
無需出差外派
上班時段
日班，08:30~18:00
休假制度
週休二日
可上班日
一個月內
需求人數
1人
條件要求
工作經歷
1年以上
學歷要求
高中、專科、大學
科系要求
財稅金融相關、一般商業學類、會計學相關
語文條件
英文 -- 聽 /略懂、說 /略懂、讀 /略懂、寫 /略懂

提升英文能力
擅長工具
Windows XP、Excel、PowerPoint、Word、天心資訊
提升專業能力
工作技能
不拘
其他條件
1.熟悉會計軟體奇德系統尤佳 
2.工作細心，重視作業細節、具良好溝通、協調能力 
3.抗壓力高，面對問題或任務時，能獨立思考 
4.具流程優化能力及經驗佳
'''


prompt = '''
你是一個人資面試官，請依據下面的個人履歷跟工作需求來分析求職者是否適合這份工作：

<個人履歷>
{個人履歷}
</個人履歷>

<工作需求>
{工作需求}
</工作需求>

請嚴格按照下面的JSON格式來進行輸出：
<JSON>
{{'是否合適':'YES'或是'NO','適任度':0~100的評分,'分析':'詳細的理由'}}
</JSON>
'''




response = model.generate_content(prompt.format(個人履歷=個人履歷, 工作需求=工作需求2))
print(response.text)

```json
{
  "是否合適": "NO",
  "適任度": 20,
  "分析": "求職者的學歷背景(電子工程博士)和經歷(研發、教學、顧問)主要集中在高科技產業和學術界，專長是機器學習、影像識別、AI等，與該職位所需的財務會計助理/記帳/出納/一般會計/財務分析人員的工作內容和條件要求明顯不符。雖然求職者可能具備一定的邏輯思維能力和解決問題能力，但缺乏必要的會計經驗和相關知識，例如：\n\n*   **經驗不符:** 職位要求1年以上會計經驗，但求職者的履歷中沒有任何與會計、財務相關的工作經驗。\n*   **技能不符:** 職位要求熟悉會計軟體（如奇德系統）和辦公軟體（Excel），但求職者的專長主要集中在程式設計和AI相關領域，雖然提及會程式設計，但可能並不擅長甚至不熟悉會計軟體與Excel。\n*   **科系不符:** 職位要求財稅金融相關、一般商業學類、會計學相關科系畢業，而求職者是電子工程相關科系。\n\n雖然求職者的學習能力可能很強，可以快速學習新的知識和技能，但從適任度和立即上手程度來看，不適合該職位。"
}
```
