### Categorical Cross Entropy

Preparación de datos para redes neuronales

- Es fundamental realizar transformaciones en los datos para asegurar que las redes neuronales funcionen de manera óptima, especialmente en problemas de clasificación multicategoría.
- Se utiliza la codificación one-hot para representar variables categóricas, creando vectores que indican la presencia de cada categoría.

**Clasificación binaria y multicategoría**

- En problemas de clasificación binaria, se utiliza una capa final con un solo nodo y una función de activación sigmoide, que produce una salida entre 0 y 1, interpretada como probabilidad.
- Para la clasificación multicategoría, se extiende el uso de la función sigmoide a la función softmax, que normaliza las salidas para que sumen 1, permitiendo obtener probabilidades para cada clase.

**Función de pérdida y retropropagación**

- La función de pérdida utilizada en la clasificación multicategoría es la entropía cruzada categórica, que se basa en la función log-loss.
- La derivada de esta función tiene propiedades favorables cuando se utiliza con softmax, facilitando el proceso de retropropagación.

---

### Introduction to convolutional  neural networks (CNN)

Este material se centra en la introducción a las redes neuronales convolucionales (CNN), que son fundamentales para el reconocimiento de imágenes y se están aplicando en diversas tareas analíticas.

**Motivación detrás de las redes neuronales convolucionales**

- Las CNN están diseñadas para trabajar con datos de imagen, incorporando el conocimiento sobre la estructura de las imágenes y la forma en que el sistema visual humano procesa la información.
- A diferencia de otros modelos, las CNN consideran la relación espacial entre los píxeles, lo que es crucial para el análisis de imágenes.

**Características clave de las CNN**

- Las variables (píxeles) tienen una topología natural y una relación espacial significativa, lo que las diferencia de otros tipos de datos, como la predicción de incumplimiento de préstamos.
- Las CNN deben ser invariantes a la traducción, lo que significa que pueden identificar objetos independientemente de su tamaño y orientación.

**Aspectos a considerar al trabajar con imágenes**

- Es importante que el modelo maneje adecuadamente los cambios en la densidad de píxeles debido a la iluminación y el contraste.
- Las CNN se centran en identificar bordes y formas dentro de los datos, lo que es esencial para la clasificación de objetos.

### Image data set

Este material se centra en la comprensión de las redes neuronales convolucionales y cómo se utilizan para identificar patrones en imágenes, como los dígitos manuscritos del conjunto de datos MNIST.

**Estructura de la red neuronal**

- Las redes neuronales completamente conectadas requieren una gran cantidad de parámetros, lo que puede llevar a un alto riesgo de sobreajuste.
- Al introducir una arquitectura más eficiente, se pueden reducir los parámetros necesarios al identificar patrones específicos en las imágenes.

**Construcción de características intermedias**

- Diferentes capas de la red pueden aprender características intermedias, comenzando desde bordes hasta formas y texturas.
- Por ejemplo, para identificar un gato, se deben reconocer características como la distancia y el ángulo entre los ojos, así como la textura del pelaje.

**Identificación de patrones**

- La identificación de patrones en imágenes implica construir características a partir de elementos más simples, como bordes y formas.
- Este enfoque permite que la red neuronal reconozca objetos complejos al combinar características más simples en patrones más elaborados.

---

### Kernels

Este material se centra en la comprensión de cómo los kernels se utilizan en las redes neuronales convolucionales para capturar relaciones entre los píxeles de una imagen.

**Uso de kernels en imágenes**

- Un kernel es una cuadrícula de pesos que se superpone a una porción de la imagen, centrada en un solo píxel, y se utiliza para realizar operaciones de convolución.
- La salida del píxel central se obtiene sumando los productos de cada peso del kernel multiplicado por el valor del píxel correspondiente.

**Operación de convolución**

- Al aplicar un kernel de 3x3 a una imagen de 3x3, se obtiene un solo valor en la matriz de salida, que se calcula sumando los productos de los valores de los píxeles y los pesos del kernel.
- Este proceso se repite al deslizar el kernel a través de la imagen, generando una matriz de salida que representa las características detectadas.

**Detección de características**

- Los kernels actúan como detectores de características, permitiendo identificar bordes verticales, horizontales y esquinas en las imágenes.
- La red neuronal aprende a encontrar los kernels más útiles, lo que permite la invariancia de traducción y reduce la cantidad de parámetros necesarios para el aprendizaje.

--- 

### convolution for color images

Este material se centra en la representación de imágenes en color y el uso de convoluciones en redes neuronales, destacando cómo se manejan los colores y la importancia de los bordes en las imágenes.

**Representación de imágenes en color**

- Las imágenes en color se representan numéricamente mediante tres arreglos bidimensionales, que corresponden a los canales de color rojo, verde y azul (RGB).
- Cada uno de estos arreglos se apila uno sobre otro para formar una imagen en color completa.

**Uso de filtros en convoluciones**

- Al trabajar con imágenes en tres dimensiones, se utilizan filtros de convolución que son de tamaño 3x3x3, lo que implica 27 multiplicaciones para obtener un solo valor de salida.
- Cada uno de los 27 valores se calcula multiplicando los valores de los arreglos de color correspondientes y sumándolos.

**Problemas con los bordes de la imagen**

- Un desafío al aplicar convoluciones es que los bordes y las esquinas de la imagen pueden ser pasados por alto, lo que puede afectar la calidad del procesamiento de la imagen.
- En el siguiente video, se abordará este problema y se introducirá el concepto de padding para mejorar el tratamiento de los bordes.