# Aprendizaje supervisado en redes neuronales multicapa
<!-- Autor -->
- **Autor:** Alexander Leano
- **Fecha:** 13 de Noviembre del 2024

## Introducción
En este trabajo se busca realizar un modelo de aprendizaje supervisado utilizando redes neuronales multicapas para aprender la función XOR, problema de paridad (generalización del XOR) y el mapeo logistico.


## 1. Función XOR

La regla XOR tiene dos entradas (+1 o -1) y la salida es -1 si ambas son diferentes y +1 si ambas son iguales.  Se busca utilizar el algoritmo de retropropagacion de errores para aprender el XOR en las siguientes arquitecturas.



<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio1-Arquitectura.png" width="600" title="Arquitectura 1 y 2" alt="Arquitectura 1" /></center>
<p style="text-align: center">
    <b>Figure 1: Dos arquitecturas posibles, izquierda Arquitectura o Red 1 derecha Arquitectura o Red 2.</b>
</p>

En ambos casos se incluyen las unidades de entrada adicional para simular los umbrales. Se utiliza $\text{tanh}(x)$ como función de transferencia. Se repite el proceso para 10 condiciones inciales de las conexiones.

Se comparar el tiempo medio de convergencia de ambas arquitecturas.

Los resultados obtenidos se representan en la *Figura 2* como el error cuadrático medio en función del número de iteraciones para ambas arquitecturas y 10 condiciones iniciales de las conexiones. Ademas se muestra el tiempo medio de convergencia para ambas arquitecturas.

<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio1-PartB-error.png" width="700" title="Arquitectura 1 y 2" alt="Arquitectura 1" /></center>
<p style="text-align: center">
    <b>Figura 2: Error cuadrático medio en función de numero de iteración para arquitectura 1, 2 y una comparación entre los promedios promedios.</b>
</p>

De este grafico se puede observar que la arquitectura 2 converge más rapido que la arquitectura 1 para los 10 casos iniciales de las conexiones analizados. Se puede observar tambien que la arquitectura 1 tiene minimos locales que tardan en salir de ellos. Se puede obervar que el la arquitectura 1 aun mantiene un error cuadratico medio mayor que la arquitectura 2 despues de 2000 iteraciones producto de un minimo local que aun no convergio.

Los tiempos de convergencia medios parecen ser similares, sin embargo, la arquitectura 2 muestra un mejor tiempo de convergencia para algunos casos lo que se refleja en el promedio.

## 2. Función de paridad

El problema de paridad es una generalización del XOR para N entradas. La salida es `+1` si el producto de las `N` entradas es `+1` y `-1` si el producto de las entradas es `-1`. Se busca utilizar retropropagación para aprender el problema en la siguiente arquitectura que se muestra en la **Figura 3**. 

<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio2-Arquitectura.png" width="400" title="Arquitectura XOR generalizado" alt="Arquitectura XOR generalizado" /></center>
<p style="text-align: center">
    <b>Figure 3:</b> Arquitecturas XOR generalizado. Se resuelve para un número de entradas N=5 y un numero de neuronas ocultas de N'= 1, 3, 5, 7, 9, 11.
</p>

En este caso se buscar aprender el problema para un numero de entradas `N` fijo de 5 y un numero de neuronas `N'` en la capa oculta de 1, 3, 5, 7, 9, 11 respectivamente. De esta manera se busca analizar que sucede cuando `N'` es menor, igual o mayor a `N`. 

Para cada caso con diferente numero de neuronas en la capa oculta se realizó un promedio del error entre 10 procesos de entrenamiento utilizando condiciones iniciales diferentes. Los resultados obtenidos se muestran en la **Figura 4**.

<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio2-PartB.png" width="700" title="Arquitectura XOR generalizado" alt="Arquitectura XOR generalizado" /></center>
<p style="text-align: center">
    <b>Figure 4:</b> Error cuadrático medio en función de numero de iteración para arquitectura XOR generalizado. Se resuelve para un número de entradas N=5 y un numero de neuronas ocultas de N'= 1, 3, 5, 7, 9, 11.
</p>

Se puede observar que cuando el numero de neuronas en la capa oculta es igual al numero de entradas la red aprende la tarea de forma satisfactoria. Se puede ver que para los casos donde el numero de neuronas en la capa oculta es mayor al numero de entradas la red aprende la tarea pero toma mas iteraciones. Habría esperado que para un numero menor en la capa oculta no se pudiera aprender la tarea ya que podrían no alcanzar los grados de libertad para ajustar la curva de separación, sin embargo, se puede observar que el error cuadratico medio converge a cero muy rápido.

## 3. Mapeo logístico

En esta sección se busca aprender utilizando retropropagación el mapeo logístico $x(t + 1) = 4x(t)(1 − x(t))$ en la arquitectura que se muestra en la **Figura 5**. 

Para ello se tiene en cuenta las siguientes consideraciones:
- La función de activación de las neuronas en la capa oculta es $g(x) = 1/(1 + exp(−x))$.
- Las neuronas incluyen umbrales. 
- La función de activación de la neurona de salida es lineal.
- Se busca generar una base de datos $x(t), x(t = 1)$ iterando el mapeo y presentar 5, 10 y 100 ejemplos.
- Se toma un 80% de los ejemplos presentados y se testea con el 20% de los ejemplos no presentados.

Como objetivo, se busca comparar el error de entrenamiento con el error de generalización.


<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio3-Arquitectura.png" width="200" title="Arquitectura XOR generalizado" alt="Arquitectura XOR generalizado" /></center>
<p style="text-align: center">
    <b>Figure 5:</b> Arquitectura propuesta para aprender el mapeo logistico mediante retropropagación.
</p>

<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio3-model.png" width="700" title="Arquitectura XOR generalizado" alt="Arquitectura XOR generalizado" /></center>
<p style="text-align: center">
    <b>Figure 4:</b> Arquitectura de la red propuesta utilizando TF.
</p>


<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio3-error.png" width="700" title="Logistic Regresion MSE " alt="Logistic Regresion MSE" /></center>
<p style="text-align: center">
    <b>Figure 4:</b> Error cuadrático medio en función del numero de iteraciones para 5, 10 y 100 ejemplos utilizando el 80% para entrenamiento y el 20% para testeo.
</p>

<!-- Image centered with reference and figure #-->
<center><img src="Ejercicio3.png" width="700" title="Prediccion de la regresion logistica" alt="Prediccion de la regresion logistica" /></center>
<p style="text-align: center">
    <b>Figure 4:</b> Prediccion de la regresión logistica .
</p>