# Model Playground - 入門 Hugging Face🤗

[GitHub](https://github.com/tpu-dsg/hf-hands-on)

このノートブックでは、[Hugging Face🤗](https://huggingface.co/)のエコシステムを活用して、学習済みモデルを用いた画像分類を行います。

In [None]:
import requests
from urllib.parse import urlparse
import os
import sys

from transformers import AutoImageProcessor, AutoModelForImageClassification
from PIL import Image
import torch

以下で推論に使用する画像分類モデルと、推論に使用する画像を指定しましょう。

- 画像分類モデルはこちらから探してみましょう：https://huggingface.co/models?pipeline_tag=image-classification&sort=trending
- `apple/mobilevit-small`のページはこちら：https://huggingface.co/apple/mobilevit-small

In [None]:
# 推論に使用するモデル
MODEL_NAME: str = "apple/mobilevit-small"
# 推論に使用する画像のURLまたはパス
IMAGE: str = "https://images.unsplash.com/photo-1523974837767-33c0fbdd9f6a?q=80&w=1974&auto=format&fit=crop&ixlib=rb-4.0.3&ixid=M3wxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHx8fA%3D%3D"

In [None]:
parsed_url = urlparse(IMAGE)
if parsed_url.scheme in ("http", "https"):
    # URLが指定された場合
    img = Image.open(requests.get(IMAGE, stream=True).raw)
elif os.path.exists(IMAGE):
    # ファイルパスが指定された場合
    img = Image.open(IMAGE)
else:
    sys.exit("有効な画像のURLまたはパスを指定してください")

img.show()

## プロセッサーとモデルの読み込み

モデルと[Image Processor](https://huggingface.co/docs/transformers/main_classes/image_processor)を読み込みます。Image Processorはモデルが期待する形式に画像を変換する役割を担います。

In [None]:
# 画像の前処理用のプロセッサ
processor = AutoImageProcessor.from_pretrained(MODEL_NAME)
# モデルの読み込み
model = AutoModelForImageClassification.from_pretrained(MODEL_NAME)

## 推論

In [None]:
# 画像を変換
input = processor(images=img, return_tensors="pt")

# モデルの推論
with torch.no_grad():
    output = model(**input)
    logits = output.logits

# 推論結果の表示
predicted_class_idx = logits.argmax(-1).item()
print(f"Predicted class: {model.config.id2label[predicted_class_idx]}")

コードを書き換えて、他にも色々と試してみましょう！

- 他の画像分類モデルを使用してみる
- **分類タスク以外**のモデルを使用してみる
