<a href="https://colab.research.google.com/github/GT-Larry/machine-learning/blob/main/test/1_pipeline.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Hugging Face是專注於開發機器學習的工具、應用與模型的一家美國公司。他們最受歡迎的產品之一是開源的transformers庫，這是一個為自然語言處理(NLP)而設計的庫。

In [None]:
# 導入transformers函式庫的pipeline函式，它提供簡單的接口，將模型與其必要的處理步驟連起來。
from transformers import pipeline

# 接著我們就可以運用pipeline來使用模型了。
# 舉例，我們需要設定模型的任務是什麼，以下程式碼是將任務設為"question-answering"(問答)。
# 使用的model部分，可以進行指定。以下程式碼是將model設為"uer/roberta-base-chinese-extractive-qa"(源自Hugging Face平台)。
# qa_pipe是透過pipeline產生出的物件。
qa_pipe = pipeline(task="question-answering", model="uer/roberta-base-chinese-extractive-qa")

# 對於qa_pipe，我們提出問題並提供文本，然後模型將從文本中找尋答案來回答問題。
# 透過print(response)，可以看到answer為貓頭鷹(問題的答案)。
response = qa_pipe(question="這動物是什麼？", context="夜晚，樹上有隻貓頭鷹在啼叫")
print(response)

如果想知道pipeline可以指定哪些任務，我們可以導入SUPPORTED_TASKS。

In [None]:
# 從transformers.pipelines導入SUPPORTED_TASKS
from transformers.pipelines import SUPPORTED_TASKS

# SUPPORTED_TASKS是字典的資料，含有多個key，以及對應每個key的value。
# 每個key就是一個任務名稱
# 透過for迴圈來印出所有的key(所有任務名稱)
for k,v in SUPPORTED_TASKS.items():
  print(k)

以下是另一種使用pipeline的方式。

In [None]:
#從transformers導入AutoModelForSequenceClassification、AutoTokenizer
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

#Hugging Face 提供的自動載入器，會根據你指定的模型名稱，自動載入一個「序列分類模型」
model = AutoModelForSequenceClassification.from_pretrained('liam168/c2-roberta-base-finetuned-dianping-chinese')

#自動載入與模型對應的 tokenizer
tokenizer = AutoTokenizer.from_pretrained('liam168/c2-roberta-base-finetuned-dianping-chinese')

#形成名為pipe的物件
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer)