# **¿Qué es una red neuronal?**
<br>

Una **red neuronal** es un **modelo computacional** inspirado en el *funcionamiento del cerebro humano*. Está compuesta por un conjunto de unidades interconectadas llamadas neuronas, que trabajan en conjunto para procesar información y realizar tareas específicas, como reconocimiento de patrones, clasificación de datos, predicción y más.<br><br>


Cada neurona en una red neuronal artificial está conectada a otras neuronas a través de conexiones ponderadas. Estas conexiones se utilizan para transmitir señales entre las neuronas, y las ponderaciones determinan la fuerza de la conexión entre ellas. Durante el proceso de entrenamiento, estas ponderaciones se ajustan gradualmente para que la red neuronal pueda aprender a realizar la tarea deseada,<br><br><br>

[video red neuronal](https://www.youtube.com/watch?v=iX_on3VxZzk)


<br><br><br><br>


# **Componentes de una red neuronal:**
<br>

Una red neuronal típica consta de tres tipos de capas:


* **Capa de entrada**: Esta capa recibe los datos de entrada y los transmite a la red neuronal para su procesamiento. Cada neurona en esta capa representa una característica o una entrada específica de los datos.

* **Capas ocultas**: Estas son capas intermedias entre la capa de entrada y la capa de salida. Cada neurona en estas capas realiza una combinación lineal y una función de activación no lineal de las entradas recibidas de la capa anterior. Estas capas son responsables de extraer y aprender características relevantes de los datos de entrada.

* **Capa de salida**: Esta capa produce los resultados finales de la red neuronal. Cada neurona en esta capa representa una clase o una salida específica, dependiendo del tipo de tarea que la red neuronal esté realizando. Por ejemplo, en un problema de clasificación, cada neurona puede representar una clase diferente, mientras que en un problema de regresión, la salida puede ser un valor continuo.<br><br>


Las redes neuronales son capaces de aprender a partir de datos mediante el proceso de entrenamiento, donde se ajustan las ponderaciones de las conexiones entre las neuronas para minimizar una función de pérdida o error. Una vez entrenada, la red neuronal puede generalizar y realizar predicciones precisas sobre datos no vistos. Debido a su capacidad para modelar relaciones complejas entre datos, las redes neuronales son utilizadas en una amplia gama de aplicaciones, como `reconocimiento de imágenes`, procesamiento de lenguaje natural, robótica, diagnóstico médico, entre otros.<br><br><br><br>



---




# **Tipos de redes neuronales:**
<br>

Existen varios otros tipos de redes neuronales que se utilizan en diferentes aplicaciones y problemas de aprendizaje automático. Aquí se citan algunos ejemplos:<br><br>

* **Redes Neuronales Recurrentes (RNN):**
Las **RNN** son diseñadas para *manejar datos secuenciales*, como series temporales, texto o audio. Tienen conexiones retroalimentadas que les permiten mantener y utilizar información sobre estados anteriores. Esto las hace adecuadas para tareas como predicción de series temporales, traducción automática y generación de texto.<br>

* **Redes Neuronales LSTM (Long Short-Term Memory):**
Las **LSTM** son un tipo especializado de **RNN** diseñado para *superar el problema del olvido a largo plazo* en las **RNN** estándar. Las **LSTM** tienen una arquitectura más compleja que les permite *recordar información relevante* durante largos períodos de tiempo, lo que las hace especialmente útiles para tareas de modelado de secuencias.<br>

* **Redes Neuronales Generativas Adversariales (GAN):**
Las **GAN** consisten en *dos redes neuronales, un generador y un discriminador*, que *compiten entre sí* en un juego de suma cero. *El generador intenta generar datos realistas*, mientras que *el discriminador intenta distinguir entre datos reales y generados*. Las **GAN** se utilizan para generar datos sintéticos realistas, como imágenes, sonido y texto.<br>

* **Redes Neuronales Siamesas:**
Las **redes siamesas** son redes neuronales con dos ramas idénticas que *comparten los mismos pesos*. Se utilizan para *comparar dos entradas y calcular su similitud o distancia*. Son útiles en aplicaciones como reconocimiento facial, verificación de firmas y emparejamiento de documentos.<br>

* **Redes Neuronales Residuales (ResNet):**
Las **redes neuronales residuales** son una clase de redes profundas que *utilizan conexiones residuales para evitar el problema de desvanecimiento del gradiente* en el entrenamiento de redes muy profundas. *Introducen conexiones que saltan capas, permitiendo que los gradientes se propaguen más fácilmente*. Son especialmente efectivas en tareas de clasificación de imágenes.<br><br><br>

Estos son solo algunos ejemplos de los tipos de redes neuronales que se utilizan en el campo del aprendizaje automático. Cada tipo de red neuronal tiene sus propias características y se adapta mejor a ciertos tipos de problemas y conjuntos de datos. Existe otro tipo de red neuronal utilizada generalmente para el reconocimiento de texto en imagenes y son las redes neuronales convalecientes. Estasw se explican a continuación: <br><br><br><br>



[VER TESIS](https://upcommons.upc.edu/bitstream/handle/2117/78924/TFG_thesis_Antea.pdf)

[VER OTRA TESIS](https://idus.us.es/bitstream/handle/11441/69565/TFG_%C3%81lvaro%20Casas%20Mart%C3%ADnez.pdf?sequence=1&isAllowed=y)



---



#**Red neuronal convolucionante (CNN)**
<br>
Una **CNN** (**Convolutional Neural Network**, *Red Neuronal Convolucional*) es un tipo específico de arquitectura de red neuronal profunda diseñada especialmente para el procesamiento de datos de tipo gráfico, como imágenes. Las **CNNs** son ampliamente utilizadas en tareas de visión por computadora, reconocimiento de patrones y análisis de imágenes debido a su capacidad para capturar características locales y jerárquicas.

La arquitectura de una **CNN** se compone principalmente de tres tipos de capas:

* **Capas de convolución:** Estas capas aplican `filtros de convolución` a la entrada para *extraer características relevante*s de la imagen. Cada filtro `identifica patrones específicos`, como bordes, texturas o formas, convolucionando sobre la imagen de entrada. Estos filtros se aprenden durante el entrenamiento de la red.
Un *filtro de convolución* es una *matriz bidimensional pequeña que se utiliza en el procesamiento de imágenes* y señales para realizar operaciones de convolución. La *convolución es un proceso matemático que se aplica a una imagen de entrada para resaltar ciertas características o extraer información relevante.*
Un *filtro de convolución* se *desliza sobre la imagen* de entrada y *realiza una operación de multiplicación y suma en cada vecindad de píxeles*. El resultado de esta operación se utiliza para generar una nueva imagen llamada "imagen convolucionada" o "mapa de características". Los *filtros de convolución* se utilizan para realizar diversas tareas de procesamiento de imágenes, como:<br><br>

1. *Detección de bordes*: Los *filtros de convolución* pueden resaltar los bordes y las transiciones de intensidad en una imagen, lo que es útil para tareas como la detección de contornos.<br>

2. *Suavizado y desenfoque*: Al aplicar ciertos *filtros de convolución*, se puede suavizar una imagen, reduciendo el ruido y los detalles finos, o crear efectos de desenfoque.<br>

3. *Realce de características*: Los *filtros de convolución* también pueden resaltar características específicas de una imagen, como líneas, texturas o patrones.<br><br>

Los *filtros de convolución* son una parte fundamental de las Convolutional Neural Networks (**CNN**), donde se utilizan como filtros aprendidos durante el proceso de entrenamiento para extraer características relevantes de las imágenes. Estos filtros aprendidos pueden capturar características complejas y abstractas en diferentes niveles de abstracción, lo que permite a las CNNs realizar tareas sofisticadas de visión por computadora, como reconocimiento de objetos, segmentación semántica y más. <br>

> Imagina que estás mirando una foto de una playa. En la capa de convolución, la red neuronal está tratando de entender qué hay en la imagen y qué características son importantes, como los bordes de las olas, la arena, el cielo, etc. Ahora, digamos que la red neuronal ha identificado estas características, pero la imagen sigue siendo bastante grande y compleja.



* **Capas de agrupación (Pooling):** Después de aplicar las capas de convolución, las capas de agrupación reducen la dimensionalidad de las características extraídas. Esto se logra mediante operaciones como el máximo o el promedio dentro de regiones locales de la salida de la capa de convolución. La reducción de dimensionalidad ayuda a hacer que la red sea más robusta y eficiente computacionalmente.<br>

> Imagina que sigues mirando una foto de una playa. Al llegar a esta capa, la imagen sigue siendo bastante grande y compleja. Aquí es donde entra en juego la capa de agrupación (**pooling**). Esta capa ayuda a simplificar la imagen al reducir su tamaño mientras mantiene la información importante.<br><br>
***¿Cómo lo hace?***<br><br>
Imagina que divides la imagen en pequeñas regiones (por ejemplo, cuadrados de 2x2 píxeles). Luego, en cada región, puedes tomar el valor máximo o promedio de todos los píxeles. Esto crea una versión simplificada de la imagen original, donde los detalles finos se pierden, pero se conservan las características más importantes.<br>
Entonces, en lugar de tener una imagen grande y detallada, ahora tienes una versión más pequeña y simplificada que conserva las características esenciales. Esto hace que el procesamiento sea más rápido y eficiente, y también ayuda a evitar que la red neuronal se sobreajuste a los detalles irrelevantes.<br><br>


* **Capas totalmente conectadas (Dense):** Después de pasar por varias capas de convolución y agrupación, la salida se aplana y se alimenta a una o más capas totalmente conectadas. Estas capas finales están típicamente diseñadas para clasificar o regresar el resultado deseado.<br>

> Imagina que tras mucho meditar al mirar la foto de la playa, se ha simplificado la imagen lo suficiente como para que la red neuronal pueda entenderla fácilmente, pero aún necesita tomar una decisión final sobre qué hay en la imagen. Aquí es donde entran en juego las capas totalmente conectadas.<br>
Para hacerlo más claro, imagina que tienes una mesa con una serie de interruptores. Cada interruptor está conectado a una función específica de la foto: uno está conectado a las olas, otro a la arena, otro al cielo, etc. Cuando enciendes los interruptores correctos, la luz verde se enciende, lo que significa que la red ha identificado correctamente lo que hay en la imagen. Si enciendes los interruptores incorrectos, la luz roja se enciende, lo que indica que la red ha cometido un error. `Las capas totalmente conectadas son como el cerebro final de la red neuronal, que toma todas las características aprendidas hasta ese punto y toma una decisión final sobre qué hay en la imagen`.

Las **CNNs** son capaces de aprender representaciones jerárquicas de las imágenes, donde las primeras capas aprenden características simples, como bordes y texturas, mientras que las capas más profundas aprenden características más complejas y abstractas, como partes de objetos y objetos completos. Esto permite a las **CNNs** realizar tareas sofisticadas de reconocimiento de objetos, detección de objetos, segmentación semántica y mucho más en imágenes y videos. <br><br><br><br>



---



# (***IMPORTANTE***: En este caso, para este proyecto se utiliza una red neuronal convaleciente `CNN` de modelo `secuencial`)

# **ACA EMPEZAMOS A LABURAR DE VERDAD**

## 1. Forzo la instalación de la actualizacion de **pip**

> *Paso obviable en Collab pero no al trabajar en Localhost*



In [None]:
!pip install --upgrade pip

## 2. Forzo la instalación de la actualizacion de **Tensorflow**, aunque viene pre-instalado en *Google collab*

> *Paso obviable en Collab pero no al trabajar en Localhost*



In [None]:
!pip install tensorflow

## 3. Importación librerias utiles:


*   **TensorFlow**: Es una biblioteca de código abierto para machine learning y desarrollo de modelos de aprendizaje profundo. Permite la creación y entrenamiento de redes neuronales y otros modelos de aprendizaje automático.

*   **Keras**:  Es una *API* de alto nivel para construir y entrenar modelos de redes neuronales en **TensorFlow**, entre otras. Proporciona una interfaz amigable y fácil de usar para definir *capas*, `modelos` y realizar operaciones de `entrenamiento` y `evaluación`. (`layers`, `models`)

`Capas (Layers):`
Las `capas` son los componentes básicos de una red neuronal. Cada capa procesa datos de entrada y genera una salida que se pasa a la siguiente capa. *Keras* proporciona una amplia gama de capas predefinidas que pueden ser apiladas y conectadas para construir modelos complejos. Algunos ejemplos de capas incluyen capas de convolución para el procesamiento de imágenes, capas recurrentes para el procesamiento de secuencias y capas densas (o totalmente conectadas) para la clasificación y regresión, ya anteriormente explicados.

`Modelos (Models):`

Los `modelos` en **Keras** son contenedores que definen la arquitectura de una red neuronal. Un modelo está compuesto por una o más capas organizadas en una estructura específica. Los modelos en Keras se pueden construir utilizando dos enfoques principales: el modelo secuencial (`Sequential`) y el modelo funcional (`Functional`). El modelo secuencial es una pila lineal de capas, mientras que el modelo funcional permite una mayor flexibilidad al permitir la creación de modelos con múltiples entradas y salidas, así como conexiones no lineales entre capas.<br><br><br>


*   **Numpy**:
Es una biblioteca fundamental para computación numérica en Python. Proporciona un conjunto de herramientas y funciones para trabajar con arreglos multidimensionales (arrays) y matrices, lo que la hace extremadamente útil para tareas de análisis de datos, manipulación de datos y cálculos científicos en general. <br>Aquí hay algunas características clave de **NumPy**:<br><br> **-** *Arreglos multidimensionales*: **NumPy** introduce un nuevo tipo de dato llamado ndarray, que representa arreglos multidimensionales de elementos del mismo tipo. Estos arreglos pueden tener una, dos o más dimensiones, lo que permite representar datos de forma eficiente en Python.<br>**-** *Funciones matemáticas y operaciones:* **NumPy** proporciona una amplia gama de funciones matemáticas y operaciones que pueden aplicarse a arreglos **NumPy**. Esto incluye funciones para álgebra lineal, transformaciones de Fourier, estadísticas, generación de números aleatorios y mucho más.<br> **-** *Indexación y segmentación avanzadas*: **NumPy** ofrece potentes capacidades de indexación y segmentación que permiten acceder y manipular partes específicas de un arreglo **NumPy** de manera eficiente.<br><br><br><br>

*   **Matplotlib** : Es una biblioteca de Python utilizada para la creación de gráficos y visualizaciones estáticas y dinámicas de datos. Proporciona una amplia variedad de herramientas para la generación de gráficos de alta calidad en diferentes estilos y formatos, lo que la hace ideal para la visualización de datos en la ciencia de datos, la ingeniería, la investigación académica y muchos otros campos. Algunas de las características principales de **Matplotlib** incluyen:<br>
> **-** *Amplia variedad de gráficos*: **Matplotlib** permite crear una amplia gama de gráficos, incluidos gráficos de líneas, gráficos de dispersión, histogramas, gráficos de barras, gráficos de pastel, gráficos de contorno, gráficos de superficie y muchos más.<br> **-** *Personalización flexible*: **Matplotlib** ofrece un alto grado de personalización, lo que permite a los usuarios ajustar prácticamente todos los aspectos de un gráfico, incluyendo colores, estilos de línea, tamaños de fuente, etiquetas de ejes y mucho más.<br> **-** *Interactividad*: Aunque **Matplotlib** es principalmente una biblioteca para la creación de gráficos estáticos, también ofrece opciones para agregar interactividad a los gráficos mediante herramientas como el zoom, el pan, la selección de regiones, etc.<br><br><br><br>

Dentro de la fauna de **Matplotlib** nos va a interesar **pyplot**. Este es un módulo específico dentro de la biblioteca Matplotlib en Python. Este módulo, conocido como matplotlib.pyplot, proporciona una interfaz similar a la de MATLAB para la creación de gráficos y visualizaciones de datos.

> Algunas características y funcionalidades de pyplot incluyen:<br> **-** *Creación rápida de gráficos*: **pyplot** permite crear gráficos de manera rápida y sencilla con solo unas pocas líneas de código.<br> **-** *Control sobre la apariencia del gráfico*: Ofrece una amplia gama de funciones para controlar la apariencia de los gráficos, como colores, estilos de línea, marcadores, etiquetas de ejes y títulos.<br> **-** *Funciones para diferentes tipos de gráficos*: **pyplot** proporciona funciones para crear diferentes tipos de gráficos, como gráficos de líneas, gráficos de dispersión, histogramas, gráficos de barras, gráficos de pastel, gráficos de contorno, entre otros.<br> **-** *Interactividad*: Aunque **pyplot** es principalmente utilizado para la creación de gráficos estáticos, también ofrece algunas capacidades básicas de interactividad, como la capacidad de acercar y alejar, guardar gráficos en diferentes formatos de archivo y explorar los datos visualizados.




<br><br><br><br>



---









In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models
import numpy as np
import matplotlib.pyplot as plt


## 4. Instanciacion de la red neuronal:
<br>
A continuación, se define un modelo de red neuronal convolucional (**CNN**) utilizando la biblioteca **Keras**

In [None]:
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')  # 10 clases para MNIST (0-9)
])

model.summary()


Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_9 (Conv2D)           (None, 26, 26, 32)        320       
                                                                 
 max_pooling2d_6 (MaxPoolin  (None, 13, 13, 32)        0         
 g2D)                                                            
                                                                 
 conv2d_10 (Conv2D)          (None, 11, 11, 64)        18496     
                                                                 
 max_pooling2d_7 (MaxPoolin  (None, 5, 5, 64)          0         
 g2D)                                                            
                                                                 
 conv2d_11 (Conv2D)          (None, 3, 3, 64)          36928     
                                                                 
 flatten_3 (Flatten)         (None, 576)              

1. **Cuando se hace:**
```
model = models.Sequential([...
```

Se está creando un nuevo modelo secuencial (Sequential) utilizando models.Sequential. El modelo secuencial es una pila lineal de capas de red neuronal, donde los datos fluyen secuencialmente de una capa a la siguiente, explicado en detalle anteriormente. <br><br>

Los elementos de la lista que recibe el models.Sequential representan las capas que se agregarán al modelo secuencial. Cada elemento de la lista es una capa de la red neuronal. En el caso de la arquitectura proporcionada, se están agregando diferentes capas de la siguiente manera:

<br><br>

2. **Primer elemento:**
```
model = models.Sequential([
  layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)), #<======
  ...
```

<br>

Esta línea agrega una capa de convolución (**Conv2D**) al modelo. Se especifica que esta capa tendrá 32 filtros (neuronas), cada uno con un tamaño de kernel de 3x3. La función de activación utilizada es la **función ReLU** (Rectified Linear Activation).

> La **función ReLU** (*Rectified Linear Unit*) es una función de activación comúnmente utilizada en redes neuronales y otros modelos de aprendizaje automático. Se define matemáticamente como:

<br><br>

<center>

![Función ReLU](https://latex.codecogs.com/svg.image?&space;f(x)=max(0,x))

</center>

<br><br>

> Lo que significa que la **función ReLU** devuelve cero si el valor de entrada es negativo, y devuelve el mismo valor de entrada si es positivo. En otras palabras, **la función ReLU** activa una neurona solo si la entrada es mayor que cero; de lo contrario, no activa la neurona.
**La función ReLU** es popular debido a su simplicidad y efectividad en muchas aplicaciones de aprendizaje profundo. Ayuda a resolver el problema de la desaparición del gradiente y puede acelerar el proceso de entrenamiento de la red neuronal al permitir que las neuronas se activen de manera más eficiente.

<br>

Con `input_shape=(28, 28, 1)` indica que la entrada del modelo es una imagen de tamaño 28x28 píxeles con un solo canal de color (escala de grises).
<br>
<br>

3. Segundo Elemento:

```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)), #<======
    ...
```
Esta línea agrega una capa de agrupación máxima (**MaxPooling2D**) al modelo. La agrupación máxima se utiliza para reducir la dimensionalidad de las características de la imagen, manteniendo las características más importantes. En este caso, se utiliza una ventana de agrupación de 2x2.
<br>
<br>

4. Tercer Elemento:

```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'), #<======
    ...
```

Otra capa de convolución con 64 filtros y un tamaño de kernel de 3x3, utilizando la función de activación **ReLU** anteriormente explicada.
<br>
<br>

5. Cuarto Elemento:

```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)), #<======
    ...
```

Otra capa de agrupación máxima con una ventana de agrupación de 2x2.
<br>
<br>

6. Quinto Elemento:
```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'), #<======
    ...
```
Otra capa de convolución con 64 filtros y un tamaño de kernel de 3x3, utilizando la función de activación **ReLU**.
<br>
<br>

7. Sexto Elemento:

```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(), #<======
    ...
```

Una capa de aplanamiento que convierte los datos de salida de las capas convolucionales y de agrupación en un solo vector, preparándolos para la entrada a las capas densamente conectadas.
<br>
<br>

8. Septimo Elemento:
```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'), #<======
    ...
```

Esta línea agrega una capa densamente conectada (**Dense**) al modelo con 64 unidades y función de activación **ReLU**. Esta capa está diseñada para aprender patrones complejos en los datos de entrada.
<br>
<br>

9. Octavo elemento:
```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')  # 10 clases para MNIST (0-9)  #<======
])
```
Esta línea agrega la capa de salida densamente conectada al modelo con 10 unidades y función de activación softmax. La capa de salida produce una distribución de probabilidad sobre las 10 clases posibles (0-9) en el conjunto de datos MNIST, que es un conjunto de datos de dígitos escritos a mano. La clase con la probabilidad más alta se considera la predicción final del modelo.
**Con el )] se cierra la lista de capas y completa la definición del modelo secuencial.**
<br>
<br>

10. Linea final:

```
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')  # 10 clases para MNIST (0-9)
])
```


model.summary() #<======

<br>



Este comando muestra un resumen del modelo, incluyendo el tipo de capa, el tamaño de la salida de cada capa y el número de parámetros entrenables en el modelo. Es útil para comprender la arquitectura general del modelo y verificar que esté configurado correctamente.

En resumen, los elementos de la lista son las diferentes capas de la red neuronal, que incluyen capas de convolución, agrupación máxima, aplanamiento y capas densamente conectadas. Estas capas juntas componen la arquitectura del modelo secuencial.
<br><br><br><br>




---




## 5. **Compilar el modelo:**
<br>
El siguiente paso es el **compilar el modelo**:
Antes de entrenar el modelo, necesitas compilarlo con una función de pérdida y un optimizador adecuados:

In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])


Cuando se hace:<br>

```
model.compile(...
```
<br>

Se procede a compilar con los siguientes parametros. Luego:<br>


```
model.compile(optimizer='adam',...
```
<br>

El optimizador es el algoritmo utilizado para ajustar los pesos de la red neuronal durante el entrenamiento con el fin de minimizar la función de pérdida. **'adam'** es un optimizador popular y eficiente que se utiliza comúnmente en muchas tareas de aprendizaje profundo. Adam adapta automáticamente las tasas de aprendizaje para cada parámetro, lo que lo hace adecuado para una amplia gama de problemas y fácil de usar.<br>
Luego:

```
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
```

<br>

**Loss Function** (*Función de Pérdida*): La función de pérdida es una medida de qué tan bien está funcionando el modelo durante el entrenamiento. 'sparse_categorical_crossentropy' es una función de pérdida comúnmente utilizada para problemas de clasificación cuando las etiquetas son enteros. En el caso de clasificación, como el reconocimiento de texto en imágenes, donde cada imagen tiene una etiqueta que corresponde a una clase, esta función de pérdida es apropiada. Ayuda a calcular la diferencia entre las predicciones del modelo y las etiquetas reales y ajustar los pesos de la red en consecuencia.<br>

```
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
```

**Metrics** (*Métricas*): Las métricas son utilizadas para evaluar el rendimiento del modelo. 'accuracy' es una métrica comúnmente utilizada que calcula la precisión del modelo, es decir, la fracción de las imágenes que son clasificadas correctamente. Durante el entrenamiento, esta métrica se mostrará para que puedas monitorear cómo está mejorando el rendimiento del modelo a lo largo del tiempo. <br><br><br><br>



---



## 6. Entrenar el modelo
<br>

A continuación se procede a montar la carpeta de Google Drive, dandole los permisos correspondientes a Google Collab tras logearnos con nuestra cuenta de Gmail, una vez corrida por primera vez la siguiente celda:

In [1]:
import os

from google.colab import drive
drive.mount('/content/drive', force_remount=True)

drive_content = os.listdir()
print(drive_content)

path = '/content/drive/MyDrive/Colab Notebooks/archive/data'

Mounted at /content/drive
['.config', 'drive', 'sample_data']


En la celda anterior se intenta consumir un conjunto de imagenes descargados desde la plataforma de [kaggle](https://www.kaggle.com/)

La estructura de archivos dentro del path es:
- data/:<br>
     Aqui el conjunto de imagenes 0.jpg, 1.jpg, 2.jpg, etc<br>
     train/<br>
     validation/<br>
- bacco-poc.ipynb <br><br><br><br>


---



In [None]:
print(path) #Se imprime el path para verificar que este sea el correcto
print(os.listdir(path+'/train')) #Se imprime el contenido del path para chequear que estamos parados en el lugar correcto
#Descomentar esta linea produce una lista de muchisimos elementos al tratarse de la carpeta que contiene al data set

from tensorflow.keras.preprocessing.image import ImageDataGenerator
batch_size =32 #32#cambiar este numero a 32 una vez que se haya cargado en la carpeta /data/train el data set de imagenes que esta en /data

# Crear un generador de datos de imágenes
datagen = ImageDataGenerator(rescale=1./255)  # Normalizar los valores de píxeles

# Configurar los generadores de datos de entrenamiento y validación
train_generator = datagen.flow_from_directory(
        path + "/train",  # Ruta al directorio de entrenamiento
        target_size=(150, 150),  # Tamaño de las imágenes
        batch_size=batch_size,
        class_mode='binary')  # Modo de clasificación

validation_generator = datagen.flow_from_directory(
        path + '/validation',  # Ruta al directorio de validación
        target_size=(150, 150),
        batch_size=batch_size,
        class_mode='binary')

steps_per_epoch = train_generator.samples // batch_size
print("ACA CHE:")
print(steps_per_epoch) # ESTO FALLA!!!!!!
validation_steps = validation_generator.samples // batch_size

/content/drive/MyDrive/Colab Notebooks/archive/data
['10008.jpg', '10005.jpg', '10004.jpg', '10003.jpg', '10007.jpg', '10013.jpg', '10010.jpg', '10009.jpg', '10014.jpg', '10006.jpg', '10001.jpg', '10002.jpg', '10000.jpg', '1000.jpg', '10.jpg', '100.jpg', '1.jpg', '0.jpg', '10019.jpg', '10039.jpg', '1001.jpg', '10044.jpg', '10042.jpg', '10037.jpg', '10016.jpg', '10032.jpg', '10033.jpg', '10031.jpg', '1003.jpg', '10030.jpg', '10034.jpg', '10035.jpg', '10026.jpg', '10036.jpg', '10012.jpg', '10011.jpg', '10038.jpg', '10023.jpg', '10024.jpg', '10022.jpg', '10029.jpg', '10028.jpg', '10018.jpg', '10017.jpg', '10015.jpg', '10027.jpg', '10041.jpg', '10043.jpg', '1004.jpg', '10040.jpg', '10049.jpg', '10045.jpg', '10046.jpg', '10047.jpg', '1002.jpg', '10020.jpg', '10021.jpg', '10025.jpg', '10077.jpg', '10051.jpg', '10087.jpg', '10058.jpg', '10055.jpg', '10053.jpg', '10054.jpg', '10052.jpg', '10074.jpg', '10075.jpg', '10073.jpg', '10071.jpg', '10076.jpg', '10072.jpg', '10070.jpg', '1007.jpg', '100


Este código utiliza la clase `ImageDataGenerator` de **TensorFlow/Keras** para cargar imágenes desde un directorio en lotes (batches) y aplicar transformaciones de datos en tiempo real durante el entrenamiento de la red neuronal. Aquí está el paso a paso de lo que hace:
<br><br>
```
from tensorflow.keras.preprocessing.image import ImageDataGenerator
```
<br><br>
**Importar bibliotecas necesarias**: Importa la clase `ImageDataGenerator` desde *tensorflow.keras.preprocessing.image.* <br><br>
```
datagen = ImageDataGenerator(rescale=1./255)
```
<br><br>
**Crear un generador de datos de imágenes**: Se crea una instancia de la clase `ImageDataGenerator` con el parámetro `rescale=1./255`. Esto normaliza los valores de píxeles de las imágenes dividiendo cada valor de píxel por 255, lo que los convierte en valores en el rango` [0, 1]`.
<br><br>
```
train_generator = datagen.flow_from_directory(
        path + "/train",  # Ruta al directorio de entrenamiento
        target_size=(150, 150),  # Tamaño de las imágenes
        batch_size=32, # Tamaño del batch
        class_mode='binary')  # Modo de clasificación

validation_generator = datagen.flow_from_directory(
        path + '/validation',  # Ruta al directorio de validación
        target_size=(150, 150), # Tamaño de las imágenes
        batch_size=32, # Tamaño del batch
        class_mode='binary')
```
<br><br>
**Configurar los generadores de datos de entrenamiento y validación**: Se crean generadores de datos utilizando el método flow_from_directory(). Este método toma la ruta al directorio que contiene las imágenes, el tamaño al que se deben redimensionar las imágenes, el tamaño de los lotes (batch size) y el modo de clasificación. El "tamaño del batch" se refiere a la cantidad de ejemplos de datos que se utilizan en una iteración de entrenamiento del modelo<br>

Esto configura dos generadores de datos: uno para el conjunto de entrenamiento y otro para el conjunto de validación. Estos generadores cargarán imágenes desde los directorios especificados, las redimensionarán al tamaño especificado (150, 150), las dividirán en lotes de tamaño 32 y las clasificarán en modo binario. El modo de clasificación 'binary' se utiliza cuando las imágenes se organizan en subdirectorios, donde cada subdirectorio representa una clase diferente, y el generador asigna etiquetas binarias a cada clase (0 o 1).<br><br><br><br>



---





## 7. Entrenar el modelo:

Entrena al modelo utilizando el método **fit**. Ajusta el número de épocas según sea necesario y proporciona tus datos de entrenamiento y validación.

In [None]:
#Estop no se
#history = model.fit(datos_entrenamiento, etiquetas_entrenamiento, epochs=num_epocas, validation_data=(datos_validacion, etiquetas_validacion))


In [None]:
history = model.fit(
    train_generator,
    steps_per_epoch=steps_per_epoch, #train_generator.batch_size
    epochs=10,
    validation_data=validation_generator,
    validation_steps=validation_steps #validation_generator.batch_size
)

ValueError: Unexpected value for `steps_per_epoch`. Received value is 0. Please check the docstring for `model.fit()` for supported values.