# 顔検出と認識

このノートブックでは、顔検出と認識について学びます。

## 目次
1. [Haar Cascade](#haar-cascade)
2. [DNNベースの検出](#dnnベースの検出)

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import cv2
from skimage import filters, feature

plt.rcParams["font.family"] = "DejaVu Sans"
plt.rcParams["axes.unicode_minus"] = False
np.random.seed(42)
print("ライブラリのインポートが完了しました。")

## Haar Cascade

In [None]:
# Haar Cascadeによる顔検出
# OpenCVに含まれる事前学習済みモデルを使用

# 注意: 実際の顔画像がないため、サンプル画像を作成
# 実際の使用では、cv2.imread()で画像を読み込んでください

# サンプル画像の作成（実際の顔画像の代わり）
img = np.random.randint(0, 256, (400, 400, 3), dtype=np.uint8)

# Haar Cascade分類器の読み込み
# OpenCVに含まれる顔検出用の分類器
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')

# グレースケールに変換
gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

# 顔の検出
# パラメータを調整可能
faces = face_cascade.detectMultiScale(
    gray,
    scaleFactor=1.1,  # 画像スケールの縮小率
    minNeighbors=5,   # 検出に必要な近傍矩形の数
    minSize=(30, 30)  # 最小検出サイズ
)

# 検出された顔を描画
img_faces = img.copy()
for (x, y, w, h) in faces:
    cv2.rectangle(img_faces, (x, y), (x+w, y+h), (0, 255, 0), 2)
    cv2.putText(img_faces, 'Face', (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)

# 結果の表示
fig, axes = plt.subplots(1, 2, figsize=(12, 6))

axes[0].imshow(img)
axes[0].set_title('元の画像')
axes[0].axis('off')

axes[1].imshow(img_faces)
axes[1].set_title(f'検出された顔 ({len(faces)}個)')
axes[1].axis('off')

plt.tight_layout()
plt.show()

print(f"検出された顔の数: {len(faces)}")
print("\nHaar Cascadeのパラメータ:")
print("- scaleFactor: 画像スケールの縮小率（通常1.1-1.3）")
print("- minNeighbors: 検出に必要な近傍矩形の数（高いほど厳格）")
print("- minSize: 検出する最小サイズ")
print("- maxSize: 検出する最大サイズ（オプション）")
print("\n注意: 実際の顔画像でテストしてください。")
print("使用例: faces = face_cascade.detectMultiScale(gray, 1.1, 5)")

## DNNベースの検出

In [None]:
# DNN（Deep Neural Network）ベースの顔検出
# OpenCV DNNモジュールを使用した高精度な顔検出

# 注意: 事前学習済みモデルファイルが必要です
# 以下のモデルが利用可能:
# - OpenCV Face Detector (YUNet)
# - MTCNN
# - Dlib

print("=== DNNベースの顔検出 ===")
print("\n利用可能なモデル:")
print("1. OpenCV Face Detector (YUNet)")
print("   - 高速で高精度")
print("   - OpenCV 4.5.1以降で利用可能")
print("\n2. MTCNN (Multi-task CNN)")
print("   - 顔検出とランドマーク検出")
print("   - より高精度だが遅い")
print("\n3. Dlib HOG + Linear SVM")
print("   - バランスの取れた性能")
print("\n実装例（YUNet）:")

# YUNetモデルの使用例（モデルファイルが必要）
# detector = cv2.FaceDetectorYN.create(
#     "face_detection_yunet_2022mar.onnx",
#     "",
#     (320, 320),
#     0.9,  # score_threshold
#     0.3,  # nms_threshold
#     5000  # top_k
# )
# detector.setInputSize((img.shape[1], img.shape[0]))
# _, faces = detector.detect(img)

print("\nコード例:")
print("""
# YUNetモデルの読み込み
detector = cv2.FaceDetectorYN.create(
    "face_detection_yunet_2022mar.onnx",
    "",
    (320, 320),
    0.9, 0.3, 5000
)

# 顔検出
detector.setInputSize((img.shape[1], img.shape[0]))
_, faces = detector.detect(img)

# 結果の描画
for face in faces:
    x, y, w, h = face[0:4].astype(int)
    confidence = face[14]
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
""")

print("\n=== モデルの比較 ===")
print("Haar Cascade:")
print("  - メリット: 軽量、高速、実装が簡単")
print("  - デメリット: 精度が低い、照明条件に敏感")
print("\nDNNベース:")
print("  - メリット: 高精度、様々な条件に対応")
print("  - デメリット: 計算コストが高い、モデルファイルが必要")
print("\n推奨:")
print("  - リアルタイム処理: Haar Cascade")
print("  - 高精度が必要: DNNベース（YUNet、MTCNN）")