# üë§ Aurpegi Ezagutza - Face Detection eta Recognition

**Egilea**: Mikel Aldalur Corta  
**Data**: 2025  
**Maila**: Aurreratua  

---

## üéØ Helburua

Notebook honetan **Aurpegi Ezagutza** (Face Recognition) ikasiko dugu:
- Face Detection vs Face Recognition
- Aurpegi detekzioa (HOG, CNN)
- Face embeddings
- Aurpegi ezagutza praktika

---

## üìö Ikasiko duguna

1. ‚úÖ Face Detection oinarriak
2. ‚úÖ Face Recognition oinarriak
3. ‚úÖ Face Embeddings
4. ‚úÖ Face Verification vs Identification
5. ‚úÖ Praktika kasu errealak

## 1Ô∏è‚É£ Face Detection vs Face Recognition

### üîç Face Detection

**Face Detection**: Irudian aurpegiak aurkitzea eta lokalizatzea

- Input: Irudia
- Output: Bounding boxes aurpegien inguruan

### üéØ Face Recognition

**Face Recognition**: Aurpegia nor den identifikatzea

- Input: Aurpegiaren irudia
- Output: Nortasuna

---

### üìä Pipeline-a

```
Irudia ‚Üí Face Detection ‚Üí Face Alignment ‚Üí Face Recognition ‚Üí Identitatea
```

1. **Face Detection**: Aurpegia detektatu
2. **Face Alignment**: Aurpegia normalizatu (begiak, sudurra, ahoa lerrokatu)
3. **Face Encoding**: Aurpegia embedding bihurtu (128D bektorea)
4. **Face Recognition**: Embedding-a datu-basearekin konparatu

## 2Ô∏è‚É£ Liburutegiak Inportatu

In [None]:
# Liburutegiak
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from PIL import Image, ImageDraw
import warnings
warnings.filterwarnings('ignore')

# Estiloa
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
np.random.seed(42)

print("‚úÖ Liburutegiak kargatuta!")

## 3Ô∏è‚É£ Face Detection Teknikak

### 1. **Haar Cascades** (Klasikoa)

- Viola-Jones algoritmoa (2001)
- Haar-like features erabiltzen ditu
- Oso azkarra baina ez hain zehatza

### 2. **HOG (Histogram of Oriented Gradients)**

- Face landmarks detektatzeko
- HOG features + Linear SVM
- Ondo funtzionatzen du

### 3. **CNN-based** (Modernoa)

- MTCNN, RetinaFace, etc.
- Zehaztasun handia
- Pixka bat motela

---

### üìä Konparaketa

| Teknika | Abiadura | Zehaztasuna | Erabilera |
|---------|----------|-------------|-----------|
| **Haar Cascades** | Oso azkarra | Baxua | Legacy aplikazioak |
| **HOG** | Azkarra | Ona | Desktop aplikazioak |
| **CNN** | Motela | Oso ona | Zehaztasun kritikoa |

## 4Ô∏è‚É£ Face Detection Simulazioa

In [None]:
# Face detection simulazioa
def simulatu_face_detection():
    """
    Face detection simulazioa irudi batean
    """
    fig, ax = plt.subplots(1, 1, figsize=(10, 10))
    
    # Irudi simulatua
    img = np.random.rand(400, 600, 3) * 0.3 + 0.3
    ax.imshow(img)
    
    # Aurpegi simulatuak
    aurpegiak = [
        ((50, 50, 80, 100), 'Persona 1', 0.98),
        ((200, 100, 70, 90), 'Persona 2', 0.95),
        ((400, 150, 75, 95), 'Persona 3', 0.92),
        ((100, 250, 80, 100), 'Persona 4', 0.89)
    ]
    
    for (x, y, w, h), label, conf in aurpegiak:
        # Bounding box
        from matplotlib.patches import Rectangle
        rect = Rectangle((x, y), w, h, 
                        linewidth=2, edgecolor='lime', facecolor='none')
        ax.add_patch(rect)
        
        # Label
        ax.text(x, y-5, f'{label} ({conf:.2f})',
               bbox=dict(facecolor='lime', alpha=0.7),
               fontsize=10, color='black', fontweight='bold')
    
    ax.set_title('üë§ Face Detection Simulazioa', 
                fontsize=16, fontweight='bold', pad=20)
    ax.axis('off')
    plt.tight_layout()
    plt.show()

simulatu_face_detection()
print("‚úÖ Face detection simulazioa bistaratuta!")

## 5Ô∏è‚É£ Face Embeddings

**Face Embeddings**: Aurpegiaren bektore-errepresentazio bat (normalean 128D edo 512D)

### üîë Nola sortzen da?

1. **CNN eredua**: FaceNet, DeepFace, ArcFace
2. **Triplet Loss**: Aurpegi beraren embeddings hurbil, desberdinak urrun
3. **Output**: 128D bektorea

---

### üìê Triplet Loss

$$
L = \max(0, ||f(a) - f(p)||^2 - ||f(a) - f(n)||^2 + \alpha)
$$

- **a**: Anchor (oinarria)
- **p**: Positive (aurpegi bera)
- **n**: Negative (aurpegi desberdina)
- **Œ±**: Margin (adibidez, 0.2)

**Helburua**: $||f(a) - f(p)|| < ||f(a) - f(n)||$

In [None]:
# Face embeddings simulazioa
def simulatu_face_embeddings():
    """
    Face embeddings simulazioa 3D-an
    """
    from mpl_toolkits.mplot3d import Axes3D
    
    # Aurpegi embeddings simulatuak (3D, bistan izateko)
    # Errealitatean 128D edo 512D izango lirateke
    
    # Persona 1 aurpegiak (hurbil)
    persona1 = np.random.randn(10, 3) * 0.3 + np.array([1, 1, 1])
    
    # Persona 2 aurpegiak (hurbil)
    persona2 = np.random.randn(10, 3) * 0.3 + np.array([4, 4, 1])
    
    # Persona 3 aurpegiak (hurbil)
    persona3 = np.random.randn(10, 3) * 0.3 + np.array([2, 5, 5])
    
    # Bistaratu
    fig = plt.figure(figsize=(12, 10))
    ax = fig.add_subplot(111, projection='3d')
    
    ax.scatter(persona1[:, 0], persona1[:, 1], persona1[:, 2], 
              c='red', s=100, marker='o', label='Persona 1', alpha=0.6)
    ax.scatter(persona2[:, 0], persona2[:, 1], persona2[:, 2], 
              c='blue', s=100, marker='^', label='Persona 2', alpha=0.6)
    ax.scatter(persona3[:, 0], persona3[:, 1], persona3[:, 2], 
              c='green', s=100, marker='s', label='Persona 3', alpha=0.6)
    
    ax.set_xlabel('Embedding Dim 1', fontsize=12)
    ax.set_ylabel('Embedding Dim 2', fontsize=12)
    ax.set_zlabel('Embedding Dim 3', fontsize=12)
    ax.set_title('üß† Face Embeddings 3D Simulazioa', 
                fontsize=16, fontweight='bold', pad=20)
    ax.legend(fontsize=12)
    
    plt.tight_layout()
    plt.show()

simulatu_face_embeddings()
print("‚úÖ Face embeddings simulazioa bistaratuta!")

## 6Ô∏è‚É£ Face Verification vs Face Identification

### üîê Face Verification (1:1)

**Galdera**: Aurpegi hau eta hau pertsona bera da?

- Input: 2 aurpegi
- Output: Bai/Ez

**Metodoa**:
1. Bi aurpegien embeddings kalkulatu
2. Distantzia kalkulatu (Euclidean, Cosine)
3. Threshold-arekin konparatu

---

### üîç Face Identification (1:N)

**Galdera**: Aurpegi hau nor da datu-basean?

- Input: Aurpegi bat
- Output: Identitatea (edo "Ezezaguna")

**Metodoa**:
1. Aurpegiaren embedding kalkulatu
2. Datu-baseko embedding guztiekin konparatu
3. Hurbilena aukeratu (threshold-tik azpian bada)

In [None]:
# Face verification adibidea
def face_verification_simulazioa():
    """
    Face verification simulazioa
    """
    # Embeddings simulatuak (128D)
    embedding1 = np.random.randn(128)
    embedding2_same = embedding1 + np.random.randn(128) * 0.1  # Aurpegi bera
    embedding3_diff = np.random.randn(128)  # Aurpegi desberdina
    
    # Distantziak kalkulatu (Euclidean)
    dist_same = np.linalg.norm(embedding1 - embedding2_same)
    dist_diff = np.linalg.norm(embedding1 - embedding3_diff)
    
    # Threshold
    threshold = 0.6
    
    print("üîê Face Verification Simulazioa:")
    print("="*60)
    print(f"Embedding 1 vs Embedding 2 (aurpegi bera):")
    print(f"  Distantzia: {dist_same:.4f}")
    print(f"  Berifikazio: {'‚úÖ BAI' if dist_same < threshold else '‚ùå EZ'}")
    print()
    print(f"Embedding 1 vs Embedding 3 (aurpegi desberdina):")
    print(f"  Distantzia: {dist_diff:.4f}")
    print(f"  Berifikazio: {'‚úÖ BAI' if dist_diff < threshold else '‚ùå EZ'}")
    print("="*60)
    
    # Bistaratu
    fig, ax = plt.subplots(1, 1, figsize=(10, 6))
    
    distantziak = [dist_same, dist_diff]
    labels = ['Aurpegi bera', 'Aurpegi desberdina']
    colors = ['green' if d < threshold else 'red' for d in distantziak]
    
    bars = ax.bar(labels, distantziak, color=colors, alpha=0.7, edgecolor='black', linewidth=2)
    ax.axhline(y=threshold, color='blue', linestyle='--', linewidth=2, label=f'Threshold ({threshold})')
    
    ax.set_ylabel('Distantzia', fontsize=12)
    ax.set_title('üîê Face Verification - Distantziak', fontsize=16, fontweight='bold')
    ax.legend(fontsize=12)
    ax.grid(True, alpha=0.3, axis='y')
    
    # Balioak gehitu
    for bar, dist in zip(bars, distantziak):
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2., height,
               f'{dist:.4f}',
               ha='center', va='bottom', fontsize=12, fontweight='bold')
    
    plt.tight_layout()
    plt.show()

face_verification_simulazioa()
print("\n‚úÖ Face verification simulazioa osatuta!")

## 7Ô∏è‚É£ Face Identification Simulazioa

In [None]:
# Face identification adibidea
def face_identification_simulazioa():
    """
    Face identification simulazioa
    """
    # Datu-basea (embeddings simulatuak)
    database = {
        'Mikel': np.random.randn(128),
        'Ane': np.random.randn(128),
        'Jon': np.random.randn(128),
        'Leire': np.random.randn(128)
    }
    
    # Aurpegi berria (Mikel-en antzekoa)
    query_embedding = database['Mikel'] + np.random.randn(128) * 0.1
    
    # Distantziak kalkulatu
    distantziak = {}
    for izena, embedding in database.items():
        dist = np.linalg.norm(query_embedding - embedding)
        distantziak[izena] = dist
    
    # Hurbilena aurkitu
    hurbilena = min(distantziak, key=distantziak.get)
    dist_min = distantziak[hurbilena]
    
    # Threshold
    threshold = 0.6
    
    print("üîç Face Identification Simulazioa:")
    print("="*60)
    print("Datu-baseko distantziak:")
    for izena, dist in sorted(distantziak.items(), key=lambda x: x[1]):
        print(f"  {izena}: {dist:.4f}")
    print()
    if dist_min < threshold:
        print(f"‚úÖ Identifikatuta: {hurbilena} (distantzia: {dist_min:.4f})")
    else:
        print(f"‚ùå Ezezaguna (distantzia minimoa: {dist_min:.4f} > threshold: {threshold})")
    print("="*60)
    
    # Bistaratu
    fig, ax = plt.subplots(1, 1, figsize=(10, 6))
    
    izenak = list(distantziak.keys())
    dists = list(distantziak.values())
    colors = ['lime' if d == dist_min and d < threshold else 'lightblue' for d in dists]
    
    bars = ax.bar(izenak, dists, color=colors, alpha=0.7, edgecolor='black', linewidth=2)
    ax.axhline(y=threshold, color='red', linestyle='--', linewidth=2, label=f'Threshold ({threshold})')
    
    ax.set_ylabel('Distantzia', fontsize=12)
    ax.set_title('üîç Face Identification - Distantziak', fontsize=16, fontweight='bold')
    ax.legend(fontsize=12)
    ax.grid(True, alpha=0.3, axis='y')
    
    # Balioak gehitu
    for bar, dist in zip(bars, dists):
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2., height,
               f'{dist:.4f}',
               ha='center', va='bottom', fontsize=12, fontweight='bold')
    
    plt.tight_layout()
    plt.show()

face_identification_simulazioa()
print("\n‚úÖ Face identification simulazioa osatuta!")

## 8Ô∏è‚É£ Face Recognition Pipeline Osoa

In [None]:
# Face recognition pipeline osoa
def face_recognition_pipeline():
    """
    Face recognition pipeline osoa simulatu
    """
    print("üöÄ Face Recognition Pipeline:")
    print("="*60)
    
    # 1. Face Detection
    print("\n1Ô∏è‚É£ Face Detection...")
    print("   ‚úÖ Aurpegia detektatuta (x=100, y=150, w=80, h=100)")
    print("   ‚úÖ Confidence: 0.98")
    
    # 2. Face Alignment
    print("\n2Ô∏è‚É£ Face Alignment...")
    print("   ‚úÖ Begiak lerrokatuta")
    print("   ‚úÖ Normalizatuta (224x224)")
    
    # 3. Face Encoding
    print("\n3Ô∏è‚É£ Face Encoding...")
    print("   ‚úÖ CNN eredua aplikatuta (FaceNet)")
    embedding = np.random.randn(128)
    print(f"   ‚úÖ Embedding sortuta (128D): [{embedding[0]:.3f}, {embedding[1]:.3f}, ...]")
    
    # 4. Face Recognition
    print("\n4Ô∏è‚É£ Face Recognition...")
    print("   ‚úÖ Datu-basearekin konparatuta")
    print("   ‚úÖ Identifikatuta: Mikel (distantzia: 0.42)")
    
    print("\n" + "="*60)
    print("‚úÖ Pipeline osatuta!")

face_recognition_pipeline()

## 9Ô∏è‚É£ Aplikazio Errealak

### üè¢ Aplikazioak

1. **Segurtasuna**: Sarrera-kontrola, kamera jarraipen
2. **Mugikorrak**: Face Unlock (iPhone Face ID)
3. **Sare sozialak**: Auto-tagging (Facebook)
4. **Banku-sistema**: Autentifikazioa
5. **Tailerra**: Asistentzia kontrola

---

### ‚ö†Ô∏è Etikako Kontuak

- **Pribatutasuna**: Datuak babestea
- **Baimena**: Erabiltzaileen baimena behar da
- **Bias**: Ereduak ez dira orekatsuta (arraza, generoa, adina)
- **Transparentzia**: Erabiltzaileak jakin behar dute
- **Erabilera**: Ez erabilera diskriminatzailerako

## üîü Eredu Nagusiak

### üì¶ Liburutegiak

1. **dlib**: HOG + CNN, face landmarks
2. **OpenCV**: Haar Cascades, DNN module
3. **face_recognition**: dlib-en wrapper sinplea
4. **DeepFace**: FaceNet, VGG-Face, ArcFace, etc.
5. **InsightFace**: State-of-the-art face recognition

---

### üèÜ Ereduak

| Eredua | Tamaina | Zehaztasuna | Abiadura |
|--------|---------|-------------|----------|
| **FaceNet** | 128D | 99.63% | Motela |
| **VGG-Face** | 4096D | 98.95% | Motela |
| **ArcFace** | 512D | 99.83% | Ertaina |
| **DeepFace** | 4096D | 97.35% | Motela |
| **Dlib** | 128D | 99.38% | Azkarra |

## üìù Ondorioak

### üéØ Ikasitako Kontzeptuak

- **Face Detection**: Aurpegiak detektatu
- **Face Recognition**: Aurpegiak identifikatu
- **Face Embeddings**: 128D bektoreak
- **Verification vs Identification**: 1:1 vs 1:N
- **Pipeline**: Detection ‚Üí Alignment ‚Üí Encoding ‚Üí Recognition

### üìä Teknikak

| Teknika | Erabilera | Abantailak |
|---------|-----------|-----------|
| **Haar Cascades** | Legacy | Oso azkarra |
| **HOG** | Desktop | Ona |
| **CNN** | Produkzioa | Zehaztasun handia |
| **FaceNet** | State-of-art | Embedding onak |

### üöÄ Hurrengo Pausoak

- **Praktika**: face_recognition liburutegia erabili
- **Custom dataset**: Gure aurpegiak identifikatzeko
- **Real-time**: Webcam-etik aurpegiak identifikatu
- **DeepFake Detection**: Aurpegi faltsoak detektatu

---

**Egilea**: Mikel Aldalur Corta  
**Data**: 2025  
**Lizentzia**: MIT