# Examen final

Bienvenidos a su examen final.

Ustedes, al ver la revolución de la IA, han decidido crear un cajero inteligente donde, a partir del uso de modelos de machine learning, se logre clasificar correctamente qué productos se quieren comprar. La idea es que las cajas de los supermercados sean autoservicio y que se evite el paso de escaneo de los productos, sino que el algoritmo reconozca automáticamente qué producto está llevando el cliente. Para eso van a hacer uso de este [dataset](https://github.com/marcusklasson/GroceryStoreDataset).

Lo que tienen hacer es entrenar un modelo para predecir la clase del producto (las variables que dicen `[test|train]_class_one_array`) a partir de las imágenes `[test|train]_images_array`.

A continuación les dejo el código que tienen que ejecutar para obtener los datos (les toma alrededor de 2 minutos ejecutar cada celda). Recuerden que la parte de entrenamiento se hace con los datos de entrenamiento y la evaluación con los datos de test.

Dependiendo de la librería que utilicen, deberán hacer cierto preprocesamiento. Pueden usar GPU si la tienen disponible o la GPU que viene con Colab.





In [1]:
import requests
import pandas as pd
import numpy as np
from PIL import Image
from io import BytesIO

# Parámetros
base_url = 'https://raw.githubusercontent.com/marcusklasson/GroceryStoreDataset/master/dataset/'
url_archivo = base_url + 'train.txt'
max_samples = 1142
target_size = (348, 348)

df = (
    pd.read_csv(
        url_archivo,
        header=None,
        names=['file', 'class_one', 'class_two'],
        dtype={'file': str, 'class_one': int, 'class_two': int}
    )
    .dropna()
    .iloc[:max_samples]
    .reset_index(drop=True)
)

def load_resize(path):
    resp = requests.get(base_url + path)
    resp.raise_for_status()
    img = Image.open(BytesIO(resp.content))
    return np.array(img.resize(target_size))

train_images_array = np.stack([load_resize(p) for p in df['file']])
train_class_one_array = df['class_one'].values
train_class_two_array = df['class_two'].values


In [6]:
base_url = 'https://raw.githubusercontent.com/marcusklasson/GroceryStoreDataset/master/dataset/'
url_archivo = base_url + 'test.txt'
max_samples = 1117
target_size = (348, 348)

df = (
    pd.read_csv(
        url_archivo,
        header=None,
        names=['file', 'class_one', 'class_two'],
        dtype={'file': str, 'class_one': int, 'class_two': int}
    )
    .dropna()
    .iloc[:max_samples]
    .reset_index(drop=True)
)

def load_resize(path):
    resp = requests.get(base_url + path)
    resp.raise_for_status()
    img = Image.open(BytesIO(resp.content))
    return np.array(img.resize(target_size))

test_images_array = np.stack([load_resize(p) for p in df['file']])
test_class_one_array = df['class_one'].values
test_class_two_array = df['class_two'].values

## Pregunta 1 (3 pts.)

Entrena y evalúa 2 modelos de redes neuronales convolucionales:

1. El primer modelo deberá tener una arquitectura que tú plantees. Puedes usar las capas que quieras.

2. El segundo modelo deberá usar transfer learning, tomando como base Resnet50.

3. Evalúa ambos modelos mostrando claramente las métricas y la matriz de confusión. Indica claramente qué modelo es mejor

In [None]:
# Escribe tu código aquí

## Pregunta 2 (3 pts.)

Entrena un modelo de perceptrón multicapa (multilayer perceptron) para resolver el problema planteado.

Muestra claramente las métricas y la matriz de confusión. Indica qué modelo es mejor

In [None]:
# Escribe tu código aquí

## Pregunta 3 (4 pts.)

Entrena un modelo de machine learning tradicional (boosting o bagging) para resolver el problema planteado.

Muestra claramente las métricas y la matriz de confusión. Indica qué modelo es mejor. Agrega una reflexión acerca de qué modelo usarías para el caso de uso planteado y por qué. Recuerda que la explicación tiene que estar en función al caso de uso. Respuestas genéricas tendran la mínima nota automáticamente.

In [None]:
# Escribe tu código aquí