# El conjunto de datos incluye estas imágenes

`<userid> <pose> <expression> <eyes> <scale>.pgm`  
`<userid>` es la identificación del usuario de la persona en la imagen, y este campo tiene 20 valores: an2i, at33, boland, bpm, ch4f, cheyer, choon, danieln, glickman, karyadi, kawamura, kk49, megak, mitchell, night, phoebe, saavik, steffi, sz24 y tammo.  
`<pose>` es la posición de la cabeza de la persona, y este campo tiene 4 valores: straight (recto), left (izquierda), right (derecha), up (arriba).  
`<expression>` es la expresión facial de la persona, y este campo tiene 4 valores: neutral, happy (feliz), sad (triste), angry (enojado).  
`<eyes>` es el estado de los ojos de la persona, y este campo tiene 2 valores: open (abiertos), sunglasses (gafas de sol).  
`<scale>` es la escala de la imagen, y este campo tiene 3 valores: 1, 2 y 4.   
1 indica una imagen de resolución completa (128 columnas por 120 filas); 2 indica una imagen de resolución media (64 por 60); 4 indica una imagen de resolución cuarto (32 por 30).  

Si has estado observando de cerca en los directorios de imágenes, podrías notar que algunas imágenes tienen el sufijo .bad en lugar del sufijo .pgm. Resulta que 16 de las 640 imágenes tomadas tienen fallas debido a problemas con la configuración de la cámara; estas son las imágenes .bad. Algunas personas tuvieron más problemas que otras, pero todos los que fueron "faced" deberían tener al menos 28 buenas imágenes faciales (de las 32 variaciones posibles, excluyendo la escala).



 **Nombre de los integrantes:**


* **Integrante 1:** Juan José Monsalve Patiño \\
* **Integrante 2:** Pamela Escobar Palacios \\
* **Integrante 3:** José Julián Aguirre Ramírez \\
* **Integrante 4:** Santiago Mejia Carmona


<center>
    <img src="https://blogs.elespectador.com/wp-content/uploads/2017/09/logo-Universidad-Nacional.png" width="500" alt="logo" />
</center>

**Definición del problema**

En el contexto del conjunto de datos CMU Face Images Data Set del UCI Machine Learning Repository, se presenta el desafío de construir y validar un modelo de aprendizaje estadístico capaz de clasificar imágenes de sujetos según la presencia o ausencia de gafas.

El conjunto de datos consta de 640 imágenes que representan a diversos sujetos en diferentes posiciones y expresiones faciales. Cada imagen está etiquetada con información detallada, incluyendo la identificación del usuario, la posición de la cabeza, la expresión facial, el estado de los ojos (gafas o no) y la escala de la imagen.

**Objetivo**

El objetivo principal es desarrollar un modelo predictivo que pueda analizar las imágenes y predecir si el sujeto lleva gafas o no. Esto implica la clasificación binaria de las imágenes en dos categorías: "con gafas" y "sin gafas". Se espera que el modelo pueda generalizar correctamente a nuevas imágenes no vistas durante el entrenamiento.

## Instalar librerias necesarias

In [1]:
# @title
from keras.utils import *
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import cv2
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.metrics import roc_curve, auc, accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report
import os
import seaborn as sns
from skimage import feature, io
from sklearn.preprocessing import LabelEncoder
from skimage.feature import hog
import random
import itertools
from shutil import copyfile, rmtree
from pathlib import Path
from glob import glob
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.layers import Input, Lambda, Dense, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.applications.resnet50 import ResNet50, preprocess_input
from tensorflow.keras.preprocessing import image
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.losses import SparseCategoricalCrossentropy
import tensorflow_hub as hub
from tensorflow.keras.layers import GlobalAveragePooling2D, Dense
from tensorflow.keras.applications.inception_v3 import preprocess_input
from tensorflow.keras.callbacks import ModelCheckpoint
import tensorflow as tf
from tensorflow import keras
from keras.layers import *
from keras.models import *
from keras.preprocessing import image
from keras.preprocessing.image import ImageDataGenerator
from PIL import Image
from sklearn.preprocessing import MinMaxScaler
import shutil
from google.colab import drive
drive.mount('/content/drive')
from sklearn.metrics import confusion_matrix


Mounted at /content/drive


# Análisis descriptivo y exploratorio:

In [2]:
sin_gafas = '/content/drive/MyDrive/imagenes_analitica/con_gafas'
con_gafas = '/content/drive/MyDrive/imagenes_analitica/sin_gafas'
print('Se cuentan con', len(os.listdir(sin_gafas)), 'sin gafas')
print('--------------------------------------------------------------')
print('Se cuentan con', len(os.listdir(con_gafas)), 'con gafas')

Se cuentan con 0 sin gafas
--------------------------------------------------------------
Se cuentan con 0 con gafas


#Cargar y Preprocesar Imágenes


In [4]:
import os
from skimage import io, color, transform
import numpy as np
from sklearn.model_selection import train_test_split

# Directorio que contiene las carpetas con gafas y sin gafas
dataset_dir = '/content/drive/MyDrive/imagenes_analitica'

# Cargar imágenes y etiquetas
X = []
y = []

for label, category in enumerate(['con_gafas', 'sin_gafas']):
    category_dir = os.path.join(dataset_dir, category)
    for filename in os.listdir(category_dir):
        img_path = os.path.join(category_dir, filename)
        img = io.imread(img_path)
        img = transform.resize(img, (64, 64, 3)).flatten()  # Ajusta el tamaño según sea necesario
        X.append(img)
        y.append(label)

X = np.array(X)
y = np.array(y)

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
from google.colab import drive
drive.mount('/content/drive')

 # Construir y Entrenar el Modelo

In [7]:
from tensorflow.keras import layers, models

# las imágenes son en escala de grises y aplanadas (64x64x3)
model = models.Sequential([
    layers.Dense(4096, activation='relu', input_shape=(64*64*3,)),
    layers.Dropout(0.5),
    layers.Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Entrenar el modelo
model.fit(X_train, y_train, epochs=10, batch_size=32, validation_data=(X_test, y_test))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x7cbe09af1120>

# Pruebas del Modelo


In [9]:
# Hacer predicciones en el conjunto de prueba
predictions = model.predict(X_test)

# Convertir las predicciones a clases binarias (0 o 1) según un umbral (por ejemplo, 0.5)
threshold = 0.5
predicted_classes = (predictions > threshold).astype(int)

# Evaluar el rendimiento del modelo
from sklearn.metrics import accuracy_score, classification_report

accuracy = accuracy_score(y_test, predicted_classes)
report = classification_report(y_test, predicted_classes)

print(f'Accuracy: {accuracy}')
print('Classification Report:')
print(report)


Accuracy: 0.824
Classification Report:
              precision    recall  f1-score   support

           0       0.87      0.82      0.84        71
           1       0.78      0.83      0.80        54

    accuracy                           0.82       125
   macro avg       0.82      0.83      0.82       125
weighted avg       0.83      0.82      0.82       125

