
# üß† Clasificaci√≥n de Im√°genes con CNN ‚Äî CIFAR-10 (Colab)
**Autores:** Daniel Serrano y Alexander Arrosquipa  
**Universidad UNIE ‚Äî Asignatura:** Lenguaje Natural y Compiladores  
**Fecha:** Octubre 2025

> Notebook listo para ejecutar en **Google Colab**. Contiene las fases 1‚Äì3: preparaci√≥n del dataset, construcci√≥n del modelo CNN, entrenamiento, evaluaci√≥n y visualizaci√≥n de resultados, adem√°s de la **Pregunta de An√°lisis**.


In [None]:
# @title üîß Instalaci√≥n (Colab)
# Esta celda asegura que las dependencias est√©n disponibles en Colab.
# (En Colab normalmente ya hay TensorFlow, pero lo dejamos por compatibilidad)
!pip -q install tensorflow matplotlib numpy


In [None]:
# @title üì¶ Importaciones
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.optimizers import Adam

# Hacer que las figuras se vean bien en Colab
plt.rcParams['figure.figsize'] = (6,6)



## ‚öôÔ∏è Fase 1 ‚Äî Preparaci√≥n del Dataset (CIFAR-10)

- **Carga** del dataset (`tensorflow.keras.datasets.cifar10`).
- **Normalizaci√≥n** de p√≠xeles al rango \([0,1]\).
- **One-hot encoding** de etiquetas.
- **Visualizaci√≥n** de 9 im√°genes con su clase.


In [None]:
# @title üì• Carga del dataset y preprocesamiento
# Carga
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Normalizaci√≥n al rango [0, 1]
x_train = x_train.astype('float32') / 255.0
x_test  = x_test.astype('float32')  / 255.0

# One-hot encoding
y_train = to_categorical(y_train, 10)
y_test  = to_categorical(y_test, 10)

# Resumen
print("Tama√±o entrenamiento:", x_train.shape, "| Tama√±o prueba:", x_test.shape)
print("Ejemplo etiqueta one-hot:", y_train[0])


In [None]:
# @title üñºÔ∏è Visualizaci√≥n de CIFAR-10 (9 ejemplos)
class_names = ['avi√≥n', 'autom√≥vil', 'p√°jaro', 'gato', 'ciervo',
               'perro', 'rana', 'caballo', 'barco', 'cami√≥n']

fig, axes = plt.subplots(3, 3, figsize=(6,6))
for i, ax in enumerate(axes.flat):
    ax.imshow(x_train[i])
    ax.set_title(class_names[np.argmax(y_train[i])])
    ax.axis('off')
plt.tight_layout()
plt.show()



## üß† Fase 2 ‚Äî Construcci√≥n del Modelo (CNN)

Arquitectura **Sequential** con dos bloques convolucionales (Conv2D + MaxPooling) y clasificador denso:
- `Conv2D(32, 3√ó3, ReLU)` ‚Üí `MaxPooling(2√ó2)`  
- `Conv2D(64, 3√ó3, ReLU)` ‚Üí `MaxPooling(2√ó2)`  
- `Flatten` ‚Üí `Dense(64, ReLU)` ‚Üí `Dense(10, Softmax)`


In [None]:
# @title üß© Definici√≥n de la CNN
model = Sequential(name="CNN_CIFAR10_Base")
model.add(Conv2D(32, (3,3), activation='relu', input_shape=(32,32,3), name="Conv2D_1"))
model.add(MaxPooling2D(pool_size=(2,2), name="MaxPool_1"))
model.add(Conv2D(64, (3,3), activation='relu', name="Conv2D_2"))
model.add(MaxPooling2D(pool_size=(2,2), name="MaxPool_2"))
model.add(Flatten(name="Flatten"))
model.add(Dense(64, activation='relu', name="Dense_64"))
model.add(Dense(10, activation='softmax', name="Output"))

model.summary()



## üìà Fase 3 ‚Äî Entrenamiento y Evaluaci√≥n

- **Compilaci√≥n:** `optimizer=Adam`, `loss=categorical_crossentropy`, `metrics=['accuracy']`  
- **Entrenamiento:** 8 √©pocas, `batch_size=64`, `validation_split=0.1`  
- **Evaluaci√≥n:** precisi√≥n y p√©rdida en el conjunto de **test**.


In [None]:
# @title üèãÔ∏è Compilaci√≥n y entrenamiento (8 √©pocas)
model.compile(optimizer=Adam(),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

history = model.fit(
    x_train, y_train,
    epochs=8,
    batch_size=64,
    validation_split=0.1,
    verbose=1
)

print("‚úÖ Entrenamiento completado.")


In [None]:
# @title üß™ Evaluaci√≥n en test
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=1)
print(f"üìä Resultado en test ‚Üí Loss: {test_loss:.4f} | Accuracy: {test_acc:.4f}")


In [None]:
# @title üìä Gr√°ficas de precisi√≥n y p√©rdida
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)

plt.figure(figsize=(12,5))

# Precisi√≥n
plt.subplot(1,2,1)
plt.plot(epochs, acc, 'o-', label='Entrenamiento')
plt.plot(epochs, val_acc, 'o-', label='Validaci√≥n')
plt.title('Precisi√≥n')
plt.xlabel('√âpocas'); plt.ylabel('Accuracy'); plt.legend()

# P√©rdida
plt.subplot(1,2,2)
plt.plot(epochs, loss, 'o-', label='Entrenamiento')
plt.plot(epochs, val_loss, 'o-', label='Validaci√≥n')
plt.title('P√©rdida')
plt.xlabel('√âpocas'); plt.ylabel('Loss'); plt.legend()

plt.tight_layout()
plt.show()



## üí¨ Pregunta de An√°lisis

**¬øQu√© partes del modelo corresponden a (1) *Input*, (2) *Preprocessing*, (3) *Feature Extraction* y (4) *Classifier*?  
¬øC√≥mo ha automatizado la CNN el proceso de *Feature Extraction*?**

**Respuesta (resumen t√©cnico):**  
1) **Input**: los tensores de im√°genes `x_train/x_test` con forma `(32,32,3)`.  
2) **Preprocessing**: la **normalizaci√≥n** de p√≠xeles a \([0,1]\) y el **one-hot encoding** de etiquetas.  
3) **Feature Extraction**: las capas **Conv2D** y **MaxPooling2D**, que aprenden jer√°rquicamente filtros (bordes, texturas, formas) y reducen la dimensionalidad manteniendo informaci√≥n relevante.  
4) **Classifier**: `Flatten ‚Üí Dense(64, ReLU) ‚Üí Dense(10, Softmax)` que combinan las caracter√≠sticas extra√≠das y producen probabilidades por clase.  

La **CNN automatiza la extracci√≥n de caracter√≠sticas** porque los filtros de `Conv2D` **no est√°n predefinidos**: se **aprenden** mediante **retropropagaci√≥n del gradiente** para minimizar la **entrop√≠a cruzada**. As√≠, el modelo descubre representaciones discriminativas sin ingenier√≠a manual de rasgos.
