Hola **Samantha**!

Soy **Patricio Requena** üëã. Es un placer ser el revisor de tu proyecto el d√≠a de hoy!

Revisar√© tu proyecto detenidamente con el objetivo de ayudarte a mejorar y perfeccionar tus habilidades. Durante mi revisi√≥n, identificar√© √°reas donde puedas hacer mejoras en tu c√≥digo, se√±alando espec√≠ficamente qu√© y c√≥mo podr√≠as ajustar para optimizar el rendimiento y la claridad de tu proyecto. Adem√°s, es importante para m√≠ destacar los aspectos que has manejado excepcionalmente bien. Reconocer tus fortalezas te ayudar√° a entender qu√© t√©cnicas y m√©todos est√°n funcionando a tu favor y c√≥mo puedes aplicarlos en futuras tareas. 

_**Recuerda que al final de este notebook encontrar√°s un comentario general de mi parte**_, empecemos!

Encontrar√°s mis comentarios dentro de cajas verdes, amarillas o rojas, ‚ö†Ô∏è **por favor, no muevas, modifiques o borres mis comentarios** ‚ö†Ô∏è:


<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class=‚ÄútocSkip‚Äù></a>
Si todo est√° perfecto.
</div>

<div class="alert alert-block alert-warning">
<b>Comentario del revisor</b> <a class=‚ÄútocSkip‚Äù></a>
Si tu c√≥digo est√° bien pero se puede mejorar o hay alg√∫n detalle que le hace falta.
</div>

<div class="alert alert-block alert-danger">
<b>Comentario del revisor</b> <a class=‚ÄútocSkip‚Äù></a>
Si de pronto hace falta algo o existe alg√∫n problema con tu c√≥digo o conclusiones.
</div>

Puedes responderme de esta forma:
<div class="alert alert-block alert-info">
<b>Respuesta del estudiante</b> <a class=‚ÄútocSkip‚Äù></a>
</div>

#  Good Seed Face recognition

La cadena de supermercados Good Seed quiere asegurarse de no vender alcohol a personas menores de edad.
El proyecto se basa en construir y evaluar un modelo para verificar la edad de las personas.

## 0. Inicializaci√≥n

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.layers import Flatten, Dense, GlobalAveragePooling2D, Dropout
from tensorflow.keras.models import Sequential
from tensorflow.keras.applications.resnet import ResNet50
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint

## 1. EDA

In [None]:
def eda(path):

    csv_path = os.path.join(path, 'labels.csv')
    df = pd.read_csv(csv_path)

    print("\n------ Informaci√≥n del dataset ------")
    print(df.info())

    print("\n------ Estad√≠sticas descriptivas ------")
    print(df.describe())

    # Histograma de edades
    plt.figure(figsize=(16, 8))
    sns.histplot(df['real_age'], bins=30, kde=True)
    plt.title('Distribuci√≥n de edades reales')
    plt.xlabel('Edad')
    plt.ylabel('Frecuencia')
    plt.show()

    # Boxplot de edades
    plt.figure(figsize=(16, 8))
    sns.boxplot(x=df['real_age'])
    plt.title('Boxplot de edades')
    plt.show()

    # Muestra aleatoria de im√°genes
    print("\n------ Muestra de im√°genes ------")
    sample = df.sample(9, random_state=42)
    plt.figure(figsize=(10, 10))

    for i, row in enumerate(sample.itertuples(), 1):
        img_path = os.path.join(path, 'final_files', row.file_name)
        img = plt.imread(img_path)
        plt.subplot(3, 3, i)
        plt.imshow(img)
        plt.title(f"Edad: {row.real_age}")
        plt.axis('off')
    plt.tight_layout()
    plt.show()

<div class="alert alert-block alert-success">
<b>Comentario del revisor (1ra Iteraci√≥n)</b> <a class="tocSkip"></a>

Excelente trabajo con el an√°lisis de tu dataset, cuando se trate de tareas de computer vision siempre es bueno mostrar unos ejemplos de las im√°genes con las que se tratar√°

## 2. Cargar datos

In [None]:
def load_data(path):

    labels = pd.read_csv(f'{path}/labels.csv')

    datagen = ImageDataGenerator(
        rescale=1./255,
        validation_split=0.25,
        horizontal_flip=True,
        vertical_flip=True
        )

    train_datagen_flow = datagen.flow_from_dataframe(
        dataframe=labels,
        directory=f'{path}/final_files/',
        x_col='file_name',
        y_col='real_age',
        target_size=(224, 224),
        batch_size=32,
        class_mode='raw',
        subset='training',
        seed=12345
        )

    val_datagen_flow = datagen.flow_from_dataframe(
        dataframe=labels,
        directory=f'{path}/final_files/',
        x_col='file_name',
        y_col='real_age',
        target_size=(224, 224),
        batch_size=32,
        class_mode='raw',
        subset='validation',
        seed=12345
        )

    return train_datagen_flow, val_datagen_flow

## 3. Crear modelo

In [None]:

def create_model(input_shape):

    backbone = ResNet50(input_shape=input_shape, weights='imagenet', include_top=False)
    # backbone.trainable = False
    for layer in backbone.layers[-20:]:
        layer.trainable = True

    # Modelo secuencial
    model = Sequential([
        backbone,
        GlobalAveragePooling2D(),
        Dense(256, activation='relu'),
        Dropout(0.5),
        Dense(1, activation='relu')
    ])

    # Compilar
    optimizer = Adam(learning_rate=0.0001)
    model.compile(optimizer=optimizer, loss='mse', metrics=['mae'])

    return model


<div class="alert alert-block alert-success">
<b>Comentario del revisor (1ra Iteraci√≥n)</b> <a class="tocSkip"></a>

Muy bien planteada la arquitectura del modelo y la funci√≥n de p√©rdida (loss) para el entrenamiento del mismo. Es importante comprender los conceptos detr√°s de lo utilizado para definir cada capa ya que de esto depender√° el tener un modelo eficiente.


## 4. Entrenar modelo

In [None]:
def train_model(model, train_data, val_data, batch_size=32, epochs=3):

    callbacks = [
        EarlyStopping(patience=3, restore_best_weights=True, monitor='val_loss'),
        ModelCheckpoint('best_model.keras', save_best_only=True)
    ]

    history = model.fit(
        train_data,
        validation_data=val_data,
        batch_size=batch_size,
        epochs=epochs,
        callbacks=callbacks,
        verbose=2
    )

    # Graficar desempe√±o
    plt.figure(figsize=(8, 5))
    plt.plot(history.history['loss'], label='train_loss')
    plt.plot(history.history['val_loss'], label='val_loss')
    plt.title('P√©rdida (MAE) durante el entrenamiento')
    plt.xlabel('√âpoca')
    plt.ylabel('MAE')
    plt.legend()
    plt.show()

    return history

## 5. Ejecutar

In [None]:
input_shape = (224, 224, 3)
path = '/datasets/faces'

eda(path)
train, test = load_data(path)
model = create_model(input_shape)
history = train_model(model, train, test)