**Exercise 1**

Given the following equation:
Y = 3X + 2
Generate an ANN to obtain an approximate result for the following values: X = 5, X =
3.3.


Ejercicio 2

Con el modelo generado en el Ejercicio 1 modifique el número de capas, neuronas y la
tipo de funciones de activación para comprobar si los resultados se pueden mejorar.
- ¿Qué es el sobreajuste?

  Ocurre cuando un modelo de aprendizaje automático aprende demasiado bien los detalles y ruidos del conjunto de entrenamiento, lo que lo hace funcionar muy bien en estos datos específicos, pero falla al generalizar
- ¿Cómo se puede producir?

   1. El modelo es demasiado complejo: Por ejemplo, tener muchas capas o neuronas en una red neuronal puede hacer que el modelo aprenda detalles muy específicos de los datos de entrenamiento.
   2. Falta de datos suficientes: Cuando el conjunto de datos es pequeño, el modelo tiende a aprender todos los detalles presentes en el conjunto de entrenamiento, incluyendo ruidos.
   3. Demasiadas épocas de entrenamiento: Si el modelo se entrena por demasiadas épocas, puede comenzar a memorizar los datos en lugar de aprender patrones generales.
   4. Datos ruidosos: Si los datos de entrenamiento tienen muchas características irrelevantes o ruido, el modelo puede aprender patrones erróneos.
- ¿Qué es el optimizador? Describe algunos de los optimizadores existentes.
   
   *Un optimizador *es un algoritmo que ajusta los parámetros (pesos y sesgos) del modelo para minimizar la función de pérdida durante el entrenamiento. Ayuda al modelo a aprender ajustando los parámetros en la dirección correcta para reducir el error de predicción.

   Algunos optimizadores existentes:

   a. SGD (Stochastic Gradient Descent): Actualiza los parámetros del modelo utilizando una pequeña porción del conjunto de datos (minibatch), lo que lo hace eficiente para conjuntos grandes. Sin embargo, puede ser lento en converger.

   b. Adam (Adaptive Moment Estimation): Combina las ventajas de dos métodos anteriores (RMSprop y Momentum). Adam ajusta el aprendizaje adaptativamente para cada parámetro y es uno de los más populares debido a su velocidad de convergencia.

   c. RMSprop: Utiliza una tasa de aprendizaje adaptativa que disminuye el paso cuando los gradientes son grandes, y es efectivo en problemas con datos ruidosos.

   d. Adagrad: Asigna una tasa de aprendizaje independiente a cada parámetro y ajusta la tasa de aprendizaje según la frecuencia de actualización de cada parámetro.
- ¿Qué es la función de pérdida? Describa algunas de las funciones de pérdida existentes.

   La función de pérdida mide la diferencia entre las predicciones del modelo y los valores reales. Es la métrica que el optimizador intenta minimizar. Una función de pérdida alta significa que las predicciones del modelo son incorrectas en mayor medida, mientras que una pérdida baja indica que las predicciones se acercan a los valores reales.

   1. MSE (Mean Squared Error): Calcula el promedio de los cuadrados de los errores (diferencias) entre las predicciones y los valores reales. Es común en problemas de regresión.

   2. Cross-Entropy (Entropía cruzada): Mide la distancia entre dos distribuciones de probabilidad y se usa frecuentemente en problemas de clasificación, especialmente en redes neuronales.

   3. MAE (Mean Absolute Error): Calcula el promedio de los errores absolutos entre las predicciones y los valores reales, útil en problemas donde queremos reducir el impacto de errores grandes.

   4. Hinge Loss: Usada en máquinas de soporte vectorial (SVM), maximiza el margen entre las clases en un problema de clasificación.


In [51]:
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers
import pandas as pd

Realizaremos un modelo sencillo para determinar el correcto funcionamiento de la ecuación y=3x + 2, para ello generaremos patrones numéricos según la ecuación

In [52]:
xs = np.array([3.3, 5], dtype=float)
ys = np.array([11.9, 17], dtype=float)

generaremos un modelo secuencial porque vamos a especificar cada capa del modelo de forma secuencial. Secuencialmente significa que el modelo tendrá una entrada y una salida con las que trabajar.

In [53]:
model = keras.Sequential()

In [54]:
# Modelo con 5 capas y 4 neuronas en cada una
model.add(layers.Dense(4, input_dim=1))  # Primera capa, 4 neuronas
model.add(layers.Dense(4))               # Segunda capa, 4 neuronas
model.add(layers.Dense(4))               # Tercera capa, 4 neuronas
model.add(layers.Dense(4))               # Cuarta capa, 4 neuronas
model.add(layers.Dense(1))               # Quinta capa (capa de salida), 1 neurona para salida

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [55]:
model.compile(keras.optimizers.Adam(0.1), loss="mean_squared_error", metrics=['accuracy'])

In [56]:
model.fit(xs, ys, epochs=300)

Epoch 1/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2s/step - accuracy: 0.0000e+00 - loss: 343.6684
Epoch 2/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.0000e+00 - loss: 166.0780
Epoch 3/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: 66.8685
Epoch 4/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 34ms/step - accuracy: 0.0000e+00 - loss: 0.8544
Epoch 5/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: 72.9345
Epoch 6/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.0000e+00 - loss: 20.1791
Epoch 7/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.0000e+00 - loss: 2.1370
Epoch 8/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: 26.6985
Epoch 9/300
[1m1/

<keras.src.callbacks.history.History at 0x79ba6c207100>

In [57]:
predictions = model.predict(xs)
rounded_predictions = np.round(predictions)
_, accuracy = model.evaluate(xs, ys)
print("The accuracy is {}".format(accuracy))


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 68ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 157ms/step - accuracy: 0.0000e+00 - loss: 2.9559e-11
The accuracy is 0.0


In [58]:
resultado=model.predict(np.array([10.0]))
print("Resultado Y: " + str(resultado[0][0]))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 66ms/step
Resultado Y: 32.00004


**Cambio de optimizador**


In [48]:
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers

xs = np.array([3.3, 5], dtype=float)
ys = np.array([11.9, 17], dtype=float)


model1 = keras.Sequential()
model1.add(layers.Dense(4, input_dim=1))  # Primera capa una neurona
model1.add(layers.Dense(4))               # Segunda capa
model1.add(layers.Dense(4))               # Tercera capa
model1.add(layers.Dense(1))               # Capa de salida


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [49]:
# Compilar el modelo usando el optimizador SGD
model1.compile(optimizer=keras.optimizers.SGD(learning_rate=0.01), loss="mean_squared_error", metrics=['accuracy'])
model1.fit(xs, ys, epochs=200)


Epoch 1/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 556ms/step - accuracy: 0.0000e+00 - loss: 258.5654
Epoch 2/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: 291.7756
Epoch 3/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step - accuracy: 0.0000e+00 - loss: 4514521.5000
Epoch 4/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 56ms/step - accuracy: 0.0000e+00 - loss: 353495382588231251350281191428194304.0000
Epoch 5/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 60ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 6/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 7/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 51ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 8/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 0.0000e+00 - 

<keras.src.callbacks.history.History at 0x79ba6e644550>

In [50]:
resultado=model1.predict(np.array([10.0]))
print("Resultado Y: " + str(resultado[0][0]))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 65ms/step
Resultado Y: nan


In [46]:
# Compilar el modelo usando el optimizador Adam
model.compile(optimizer=keras.optimizers.Adam(learning_rate=0.01), loss="mean_squared_error", metrics=['accuracy'])
model.fit(xs, ys, epochs=200)


Epoch 1/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - accuracy: 0.0000e+00 - loss: nan
Epoch 2/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 3/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 4/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 5/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 6/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 7/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 8/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 9/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x79ba61d04b80>

In [47]:
resultado=model.predict(np.array([10.0]))
print("Resultado Y: " + str(resultado[0][0]))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 100ms/step
Resultado Y: nan


In [39]:
# Compilar el modelo usando el optimizador RMSprop
model.compile(optimizer=keras.optimizers.RMSprop(learning_rate=0.01), loss="mean_squared_error", metrics=['accuracy'])
model.fit(xs, ys, epochs=200)


Epoch 1/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 940ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 2/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 3/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 56ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 4/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 5/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 6/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 7/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 8/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 9/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x79ba6e27e530>

In [41]:
# Compilar el modelo usando el optimizador Adagrad
model.compile(optimizer=keras.optimizers.Adagrad(learning_rate=0.01), loss="mean_squared_error", metrics=['accuracy'])
model.fit(xs, ys, epochs=200)


Epoch 1/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 840ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 2/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 3/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 4/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 5/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 6/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 7/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 8/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.0000e+00 - loss: nan
Epoch 9/200
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x79ba6e392290>