### PROCESAMIENTO DE IMAGENES: DATASET MNIST

#### Guía paso a paso sin redes neuronales

#### 1. Descarga y Carga del Dataset
##### Usaremos *"sklearn"* para cargar el dataset digits (similar a MNIST pero más simple)

#### Este código carga el dataset digits de scikit-learn, que contiene 1,797 imágenes de dígitos manuscritos (0-9). Cada imagen es una matriz de 8x8 píxeles (64 características en escala de grises). Las imágenes están almacenadas en un arreglo 3D (1797, 8, 8) y las etiquetas en un vector 1D (1797,). Este conjunto es ideal para practicar clasificación de imágenes, reducción de dimensionalidad y técnicas de machine learning básicas.

#### 2. Inspección de los datos

##### Mostrar algunos ejemplos de datos crudos

#### El código muestra las primeras 3 imágenes en formato plano (vector de 64 valores) y sus etiquetas correspondientes [0, 1, 2].

Análisis:

-Cada imagen está representada como un vector de 64 valores numéricos (8x8 píxeles aplanados)

-Los valores van de 0 a 15, representando intensidades de gris

-La primera imagen (etiqueta 0) muestra patrones típicos de un cero manuscrito

-La segunda (etiqueta 1) y tercera (etiqueta 2) muestran patrones característicos de unos y doses

#### Este formato plano es el que normalmente se usa como input para algoritmos de machine learning, mientras que la versión matricial (8x8) es útil para visualización.

#### 3. Visualización de imágenes

##### Función para mostrar múltiples imágenes

#### La función plot_digits crea una cuadrícula de 4 filas × 5 columnas (20 imágenes totales) mostrando:

-Cada dígito en escala de grises.

-Su etiqueta correspondiente arriba de cada imagen

-Sin ejes para mejor visualización

#### Propósito: Esta visualización ayuda a:

-Ver la diversidad de estilos de escritura manual

-Identificar patrones característicos de cada dígito

-Detectar posibles desafíos de clasificación (dígitos ambiguos o mal escritos)

-Validar la correspondencia entre imágenes y etiquetas

#### Es un paso esencial antes de entrenar modelos para entender la naturaleza del dataset.


#### Este código dibuja las primeras 20 imágenes del dataset en una cuadrícula, mostrando visualmente cada dígito y su etiqueta, facilitando la comprensión de cómo se ven los datos originales.

#### 4. Análisis Estadístico Básico

##### Veamos propiedades interesantes de las imágenes:
##### Calcular el promedio de pixeles por dígito


#### Este código calcula y visualiza el promedio de intensidad de píxeles para cada dígito (0-9). Para cada número, se promedian todas sus imágenes en el dataset, creando una imagen compuesta que muestra los patrones característicos.

#### Resultado: Se observa que cada dígito mantiene su forma esencial en el promedio, pero con bordes suavizados. Esto revela:

-Los patrones comunes de escritura para cada número

-Las zonas con mayor intensidad (trazos más consistentes)

-La variabilidad natural en la escritura manual

#### Estos promedios sirven como "huellas digitales" de cada número y pueden usarse como referencia para tasks de reconocimiento básico.

#### 5. Preprocesamiento Básico

##### Vamos a realizar algunas operaciones comunes sin redes neuronales

#### Convierte una imagen de números escrita a mano (en tonos de gris) en una imagen solo de blanco y negro puros, sin grises.

-Original: La imagen tiene muchos tonos de gris (claros, oscuros, medios)

-Binarizada: Usa un truco inteligente para encontrar el punto perfecto que separa lo que debería ser negro (el fondo) de lo que debería ser blanco (el número).

#### Es como pasar de un lápiz (que hace grises) a un rotulador (que hace negro o blanco puro). Así la computadora puede ver el número más claramente, sin distraerse con los tonos de gris.

#### Resultado: La imagen queda mucho más definida, lo que facilita que los algoritmos identifiquen la forma del número correctamente.

#### 6. Extracción de Características

##### Sin redes neuronales, podemos extraer características manuales

#### Es una técnica de extracción de características que analiza la dirección y intensidad de los bordes de una imagen. En lugar de usar los píxeles directamente, describe cómo se organizan los patrones visuales.

-Divide la imagen en celdas pequeñas (ej: 2x2 píxeles).

-En cada celda, calcula la dirección predominante de los bordes (gradientes).

-Crea un histograma que resume estas direcciones en toda la imagen.

-Genera una representación compacta y numérica de la forma del objeto.

#### Sirve para el reconocimiento de patrones: Identificar objetos (dígitos, rostros, etc.) aunque varíen en tamaño o estilo. Reducción de complejidad, convertir una imagen de 64 píxeles en un vector de características más manejable, funciona bien incluso con cambios de iluminación o pequeñas deformaciones.

#### 7. Transformaciones Geométricas

#### Este código modifica la imagen original del número aplicando dos cambios geométricos:
-Rotación: Inclina la imagen 15 grados
-Escalado: Agranda la imagen 1.5 veces su tamaño original

#### Usa:
-Rotar: Usa rotate() para girar la imagen manteniendo su contenido

-Escalar: Usa rescale() para ampliar la imagen sin distorsionar su forma
#### El código transforma imágenes de dígitos: rota 15° para simular inclinación y escala 1.5× para cambiar tamaño. Estas transformaciones ayudan a generar más datos para entrenamiento y mejorar robustez.

#### 8. Detección de Bordes

#### Este código encuentra los bordes (las líneas que separan las zonas claras y oscuras) del número en la imagen.

#### ¿Cómo lo hace?
-Usa un filtro especial llamado Sobel que:

-Escanea la imagen buscando cambios bruscos de color (de blanco a negro o viceversa)

-Destaca estas zonas de transición donde hay bordes

-Suaviza el resto de la imagen donde no hay cambios abruptos

#### Se obtiene una versión donde solo se ven los bordes del número, como si fuera un dibujo lineal. Como pasar de una foto a un dibujo de contorno. Es como cuando delineamos un dibujo con marcador negro para que se vea más definido, antes de colorearlo. 

#### 9. Ejercicios Prácticos

##### Se calcula el histograma de intensidades para cada dígito, promediando todas sus imágenes. Permite visualizar la distribución de brillo y contraste típico de cada número, útil en análisis y clasificación.