<a href="https://colab.research.google.com/github/cristiandarioortegayubro/BDS/blob/main/paper/Redes_neuronales_aplicadas_a_finanzas_01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Logo%20BDS%20Horizontal%208.png?raw=true"/>
</p>




# **<font color="DeepPink">Redes neuronales aplicadas a finanzas</font>**

## **<font color="DeepPink">Análisis de series temporales con redes neuronales</font>**

## **<font color="DeepPink">Bibliotecas</font>**

In [None]:
import yfinance as yf
import numpy as np
import pandas as pd
import plotly.express as px
from sklearn.preprocessing import MinMaxScaler
from tensorflow import keras
from tensorflow.keras import layers

Este código es una serie de importaciones de bibliotecas de Python que son utilizadas en un contexto relacionado con el análisis de series temporales y el modelado de redes neuronales con TensorFlow y Keras.

A continuación, se explica el propósito de cada importación:

1. `import yfinance as yf`: Importa la biblioteca `yfinance`, que proporciona una interfaz para acceder y descargar datos financieros y bursátiles de Yahoo Finance. Esto es útil para obtener información sobre precios de acciones y otros datos relacionados con finanzas.

2. `import numpy as np`: Importa la biblioteca NumPy con el alias `np`, que es una biblioteca fundamental para realizar cálculos numéricos y manipulación de matrices en Python. Se utiliza comúnmente en análisis de datos y modelado de aprendizaje automático.

3. `import pandas as pd`: Importa la biblioteca Pandas con el alias `pd`, que es ampliamente utilizada para la manipulación y análisis de datos en forma de estructuras de datos tabulares.

4. `import plotly.express as px`: Importa la biblioteca Plotly Express con el alias `px`, que proporciona una interfaz sencilla para crear visualizaciones interactivas y gráficos de datos.

5. `from sklearn.preprocessing import MinMaxScaler`: Importa la clase `MinMaxScaler` de la biblioteca Scikit-learn (`sklearn.preprocessing`). Esta clase se utiliza para normalizar los datos en un rango específico, como se utiliza comúnmente en el preprocesamiento de datos para el modelado de redes neuronales.

6. `from tensorflow import keras`: Importa el módulo `keras` de la biblioteca TensorFlow, que es una biblioteca de aprendizaje automático de código abierto desarrollada por Google. Keras proporciona una interfaz de alto nivel para construir y entrenar modelos de redes neuronales.

7. `from tensorflow.keras import layers`: Importa el módulo `layers` de la biblioteca Keras en TensorFlow. Este módulo contiene clases y funciones para crear diferentes tipos de capas en una red neuronal, como capas densas, convolucionales, recurrentes, etc.

En resumen, estas importaciones establecen las bases para realizar análisis de series temporales y crear modelos de redes neuronales.

## **<font color="DeepPink">Simbolo de la acción</font>**

In [None]:
symbol = "AAPL"

La línea de código `symbol = "AAPL"` simplemente está asignando el valor de la cadena de caracteres `"AAPL"` a la variable llamada `symbol`. En este caso, parece que se está utilizando la abreviatura "AAPL" para representar el símbolo de una acción específica en el mercado de valores.

Las abreviaturas de símbolos de acciones se utilizan comúnmente para identificar empresas en los mercados financieros. En este caso, "AAPL" es el símbolo de acciones utilizado en los mercados para representar a la empresa Apple Inc., una de las empresas tecnológicas más grandes y conocidas del mundo.

Esta variable `symbol` probablemente se usa en el código posterior para acceder a los datos financieros específicos de las acciones de Apple Inc. utilizando la biblioteca `yfinance`, que permite descargar información de Yahoo Finance y, por ejemplo, obtener los precios de cierre históricos de las acciones de Apple.

## **<font color="DeepPink">Periodo bajo análisis</font>**

In [None]:
start_date = "2020-01-01"
end_date = "2023-01-01"

## **<font color="DeepPink">Obtención remota de datos</font>**

In [None]:
data = yf.download(symbol, start=start_date, end=end_date).round(2)

[*********************100%%**********************]  1 of 1 completed


La línea de código `data = yf.download(symbol, start=start_date, end=end_date)` se utiliza para descargar datos históricos de precios de una acción o activo financiero específico de Yahoo Finance utilizando la biblioteca `yfinance`.

A continuación, se desglosa lo que cada parte de la línea de código hace:

- `data`: Es el nombre de la variable en la que almacenaremos los datos descargados. Puede cambiar el nombre de la variable según sus preferencias.

- `yf.download(...)`: Este es el método de la biblioteca `yfinance` que se utiliza para descargar los datos históricos. Toma varios argumentos que especifican qué datos se deben descargar.

- `symbol`: Este argumento especifica el símbolo del activo financiero del que se desea obtener los datos. Por ejemplo, si desea los datos de las acciones de Apple, el símbolo sería `"AAPL"`.

- `start`: Este argumento indica la fecha de inicio desde la cual se deben descargar los datos históricos. Debe especificarse en formato de cadena de texto, como `"2020-01-01"`.

- `end`: Este argumento indica la fecha de finalización hasta la cual se deben descargar los datos históricos. También debe especificarse en formato de cadena de texto, como `"2023-01-01"`.

En resumen, esta línea de código se utiliza para descargar datos históricos de precios de acciones o activos financieros de Yahoo Finance y almacenarlos en una variable llamada `data`. Los datos descargados se limitarán al período de tiempo especificado entre `start_date` y `end_date`. Estos datos pueden incluir información como precios de apertura, precios de cierre, volúmenes de negociación, máximos, mínimos, etc., dependiendo de lo que se haya especificado al descargar los datos.

## **<font color="DeepPink">Data</font>**

In [None]:
data

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2020-01-02,74.06,75.15,73.80,75.09,73.25,135480400
2020-01-03,74.29,75.14,74.12,74.36,72.54,146322800
2020-01-06,73.45,74.99,73.19,74.95,73.11,118387200
2020-01-07,74.96,75.22,74.37,74.60,72.77,108872000
2020-01-08,74.29,76.11,74.29,75.80,73.94,132079200
...,...,...,...,...,...,...
2022-12-23,130.92,132.42,129.64,131.86,131.30,63814900
2022-12-27,131.38,131.41,128.72,130.03,129.48,69007800
2022-12-28,129.67,131.03,125.87,126.04,125.50,85438400
2022-12-29,127.99,130.48,127.73,129.61,129.06,75703700


## **<font color="DeepPink">DataFrame con Precios de Cierre</font>**

In [None]:
df = data[['Close']]

La línea de código `df = data[['Close']]` se utiliza para crear un nuevo DataFrame de Pandas que contiene solo una columna específica de los datos descargados. En este caso, estamos interesados en la columna "Close", que corresponde a los precios de cierre de las acciones o activos financieros.

A continuación, se desglosa lo que cada parte de la línea de código hace:

- `df`: Es el nombre de la variable en la que almacenaremos el nuevo DataFrame. Puede cambiar el nombre de la variable según sus preferencias.

- `data[['Close']]`: Aquí, estamos utilizando la variable `data`, que contiene los datos históricos descargados de Yahoo Finance. Al usar la notación de corchetes dobles `[['Close']]`, estamos seleccionando una columna específica del DataFrame original y creando un nuevo DataFrame que contiene solo esa columna.

- `'Close'`: Este es el nombre de la columna que estamos seleccionando del DataFrame original. En este caso, estamos interesados en la columna de precios de cierre.

En resumen, esta línea de código se utiliza para crear un nuevo DataFrame llamado `df` que contiene únicamente la columna de precios de cierre de las acciones o activos financieros. Esto facilita el análisis y la manipulación de los datos específicos que nos interesan.

In [None]:
df

Unnamed: 0_level_0,Close
Date,Unnamed: 1_level_1
2020-01-02,75.09
2020-01-03,74.36
2020-01-06,74.95
2020-01-07,74.60
2020-01-08,75.80
...,...
2022-12-23,131.86
2022-12-27,130.03
2022-12-28,126.04
2022-12-29,129.61


## **<font color="DeepPink">Grafico lineal Precios de Cierre</font>**

In [None]:
fig = px.line(df,
              x=df.index,
              y='Close',
              template="plotly_dark",
              title=f"Precios de Cierre de {symbol}")
fig.show()

La línea de código `fig = px.line(df, x=df.index, y='Close', template="gridon", markers=True, title=f"Precios de Cierre de {symbol}")` utiliza la biblioteca Plotly Express (`px`) para crear un gráfico de línea que muestra la evolución de los precios de cierre a lo largo del tiempo. Aquí hay una explicación detallada de cada parte de la línea de código:

- `fig`: Es el nombre de la variable en la que almacenamos la figura del gráfico que estamos creando. Puede cambiar el nombre de la variable según sus preferencias.

- `px.line(...)`: Esta es la función de Plotly Express que usamos para crear el gráfico de línea.

- `df`: Es el DataFrame que contiene los datos que queremos visualizar. En este caso, estamos utilizando el DataFrame que creamos previamente y que contiene los precios de cierre.

- `x=df.index`: Este argumento especifica qué columna del DataFrame se utilizará para el eje x (horizontal) del gráfico. `df.index` se refiere al índice de fechas del DataFrame, lo que significa que estamos utilizando las fechas como valores en el eje x.

- `y='Close'`: Este argumento especifica qué columna del DataFrame se utilizará para el eje y (vertical) del gráfico. Aquí, estamos utilizando la columna de precios de cierre.

- `template="gridon"`: Esto define el estilo de la plantilla del gráfico. En este caso, estamos usando la plantilla con la cuadrícula activada.

- `markers=True`: Indica si se deben mostrar marcadores en los puntos de datos en el gráfico de línea. En este caso, estamos mostrando marcadores en los puntos de datos.

- `title=f"Precios de Cierre de {symbol}"`: Este argumento establece el título del gráfico. Estamos utilizando una cadena formateada para incluir el símbolo de la acción en el título.

- `fig.show()`: Esta línea muestra la figura del gráfico en la salida. Puede ver el gráfico en una ventana emergente en su entorno de desarrollo o en el entorno en el que está ejecutando el código.

En resumen, esta línea de código crea un gráfico de línea utilizando Plotly Express que muestra la evolución de los precios de cierre de las acciones a lo largo del tiempo. Utiliza el DataFrame que contiene los datos y personaliza varios aspectos del gráfico, como los ejes, los marcadores y el título. Luego, muestra el gráfico para su visualización.

## **<font color="DeepPink">Grafico de dispersión Precios de Cierre, con línea de tendencia</font>**

In [None]:
fig = px.scatter(df,
                 x=df.index,
                 y='Close',
                 template="plotly_dark",
                 trendline='lowess',
                 trendline_color_override="orange",
                 title=f"Precios de Cierre de {symbol}")

fig.update_traces(mode='lines')

fig.show()

## **<font color="DeepPink">Normalizado de datos</font>**

In [None]:
scaler = MinMaxScaler()
data_scaled = scaler.fit_transform(df)

Las líneas de código `scaler = MinMaxScaler()` y `data_scaled = scaler.fit_transform(df)` se utilizan para normalizar los datos de los precios de cierre de las acciones utilizando la técnica de escalado Min-Max. La normalización es un proceso común en el preprocesamiento de datos para que los valores estén en un rango específico y puedan ser procesados más eficientemente por algoritmos de aprendizaje automático.

A continuación, se explica cada parte de las líneas de código:

- `scaler = MinMaxScaler()`: Esta línea crea una instancia del objeto `MinMaxScaler` de la biblioteca `sklearn.preprocessing`. El escalador Min-Max ajusta y transforma los datos para que estén dentro de un rango específico. En este caso, los valores serán escalados a un rango entre 0 y 1.

- `data_scaled = scaler.fit_transform(df)`: Aquí, estamos utilizando el escalador Min-Max para transformar los datos en el DataFrame `df` (que contiene los precios de cierre) y almacenar los datos transformados en la variable `data_scaled`. La función `fit_transform` calcula los parámetros de escala (mínimo y máximo) a partir de los datos y luego transforma los datos según esos parámetros.

En resumen, estas líneas de código aplican la normalización Min-Max a los datos de precios de cierre de las acciones. Después de la normalización, los valores estarán en un rango entre 0 y 1, lo que puede ayudar a mejorar el rendimiento de los modelos de aprendizaje automático y facilitar la comparación y el análisis de los datos.

## **<font color="DeepPink">Conjunto de entrenamiento y conjunto de testeo</font>**

In [None]:
train_size = int(len(data_scaled) * 0.8)
train_data, test_data = data_scaled[:train_size], data_scaled[train_size:]

Estas líneas de código se utilizan para dividir los datos normalizados en conjuntos de entrenamiento y prueba. La división de los datos en estos conjuntos es una práctica común en el aprendizaje automático para evaluar la capacidad de generalización de un modelo.

A continuación, se explica cada parte de las líneas de código:

- `train_size = int(len(data_scaled) * 0.8)`: Esta línea calcula el tamaño del conjunto de entrenamiento como el 80% del tamaño total de los datos normalizados. `len(data_scaled)` devuelve la longitud total de los datos normalizados y `0.8` representa el 80% de esos datos. El resultado se convierte en un número entero utilizando `int()`.

- `train_data, test_data = data_scaled[:train_size], data_scaled[train_size:]`: Aquí, estamos utilizando el tamaño del conjunto de entrenamiento calculado para dividir los datos normalizados en dos conjuntos: `train_data` y `test_data`. La notación `[:train_size]` selecciona las primeras `train_size` filas de los datos, que serán el conjunto de entrenamiento. La notación `[train_size:]` selecciona las filas restantes a partir de `train_size`, que serán el conjunto de prueba.

En resumen, estas líneas de código dividen los datos normalizados en dos conjuntos: un conjunto de entrenamiento que representa el 80% de los datos y un conjunto de prueba que representa el 20% restante. Esta división permitirá que utilices el conjunto de entrenamiento para entrenar tu modelo de redes neuronales y el conjunto de prueba para evaluar su rendimiento en datos no vistos durante el entrenamiento.

In [None]:
def create_dataset(dataset, time_steps=1):
    X, y = [], []
    for i in range(len(dataset) - time_steps):
        X.append(dataset[i:i + time_steps])
        y.append(dataset[i + time_steps])
    return np.array(X), np.array(y)

La función `create_dataset` en el código es una función auxiliar que se utiliza para crear conjuntos de datos en el formato requerido para el entrenamiento de modelos de series temporales, como las redes neuronales. Esta función toma un conjunto de datos y lo divide en conjuntos de entrada (`X`) y salidas esperadas (`y`) para el modelado de series temporales.

A continuación, se explica cada parte de la función:

- `def create_dataset(dataset, time_steps=1):`: Esto define la función `create_dataset`, que toma dos argumentos. `dataset` es el conjunto de datos que se desea dividir, y `time_steps` es el número de pasos de tiempo que se utilizarán para predecir el siguiente valor. Por defecto, se establece en 1.

- `X, y = [], []`: Aquí se crean dos listas vacías, `X` para almacenar las secuencias de entrada y `y` para almacenar las salidas esperadas.

- `for i in range(len(dataset) - time_steps):`: Este bucle itera a través de los índices del conjunto de datos menos el número de pasos de tiempo. Esto se hace para asegurarse de que haya suficientes datos para formar una secuencia de entrada y su correspondiente salida esperada.

- `X.append(dataset[i:i + time_steps])`: En cada iteración del bucle, se agrega una secuencia de `time_steps` valores del conjunto de datos a la lista `X`. Esto crea las secuencias de entrada para el modelado de series temporales.

- `y.append(dataset[i + time_steps])`: En cada iteración, se agrega el valor en el siguiente paso de tiempo al conjunto de datos a la lista `y`. Esto crea las salidas esperadas correspondientes a las secuencias de entrada.

- `return np.array(X), np.array(y)`: Finalmente, se convierten las listas `X` y `y` en matrices NumPy y se devuelven como resultado de la función.

En resumen, la función `create_dataset` toma un conjunto de datos y crea conjuntos de entrada y salidas esperadas para el modelado de series temporales. Cada secuencia de entrada consta de `time_steps` valores del conjunto de datos, y la salida esperada corresponde al siguiente valor en el conjunto de datos. Esta función es útil para preparar los datos de entrenamiento para modelos de redes neuronales que se utilizan en el análisis de series temporales.

In [None]:
time_steps = 10
X_train, y_train = create_dataset(train_data, time_steps)
X_test, y_test = create_dataset(test_data, time_steps)

En estas líneas de código, se está utilizando la función `create_dataset` para preparar los conjuntos de entrenamiento y prueba para un modelo de series temporales. Se está creando un conjunto de secuencias de entrada (`X`) y salidas esperadas (`y`) utilizando un número específico de pasos de tiempo (`time_steps`) a partir de los datos normalizados de entrenamiento y prueba.

Aquí está la explicación de cada parte de las líneas de código:

- `time_steps = 10`: Esto define el número de pasos de tiempo en cada secuencia de entrada. En este caso, se establece en 10, lo que significa que cada secuencia de entrada contendrá 10 valores de precios de cierre consecutivos.

- `X_train, y_train = create_dataset(train_data, time_steps)`: Aquí se utiliza la función `create_dataset` para crear conjuntos de entrenamiento. Se pasa el conjunto de datos normalizados de entrenamiento `train_data` y el valor de `time_steps`. La función generará secuencias de entrada (`X_train`) y salidas esperadas (`y_train`) a partir de los datos de entrenamiento.

- `X_test, y_test = create_dataset(test_data, time_steps)`: Similarmente, esta línea utiliza la función `create_dataset` para crear conjuntos de prueba. Se pasa el conjunto de datos normalizados de prueba `test_data` y el valor de `time_steps`. La función generará secuencias de entrada (`X_test`) y salidas esperadas (`y_test`) a partir de los datos de prueba.

En resumen, estas líneas de código están utilizando la función `create_dataset` para preparar los conjuntos de entrada y salidas esperadas para el entrenamiento y prueba de un modelo de series temporales. Cada secuencia de entrada contendrá un número específico de pasos de tiempo de datos de precios de cierre consecutivos, y las salidas esperadas corresponden al siguiente valor de precio de cierre en cada secuencia. Esto es fundamental para entrenar un modelo de redes neuronales en el análisis de series temporales.

## **<font color="DeepPink">Modelo de redes neuronales</font>**

In [None]:
model = keras.Sequential()

`model = keras.Sequential()` crea una instancia de un modelo secuencial utilizando la biblioteca `Keras`, que es una interfaz de alto nivel para construir y entrenar modelos de redes neuronales en TensorFlow u otros backends de aprendizaje automático.

Un modelo secuencial en Keras es una pila lineal de capas, donde cada capa tiene exactamente un tensor de entrada y uno de salida. Esto es útil para construir modelos de redes neuronales feedforward simples y es la forma más común de crear modelos en Keras.

La variable `model` es la que utilizarás para construir y definir la arquitectura de tu red neuronal. A medida que agregas capas al modelo secuencial, estas se conectan en secuencia, pasando la salida de una capa a la siguiente.

`model = keras.Sequential()` te permite crear un modelo secuencial que puedes personalizar agregando capas y configurando sus detalles, como la función de activación, el número de unidades, la forma de entrada y otros hiperparámetros. Luego, puedes compilar el modelo y entrenarlo utilizando los datos preparados.

In [None]:
model.add(layers.LSTM(50, activation='relu', input_shape=(time_steps, 1)))
model.add(layers.Dense(1))
model.compile(optimizer='adam', loss='mse')

Estas líneas de código están siendo utilizadas para construir y compilar un modelo de redes neuronales en Keras utilizando la arquitectura LSTM (Long Short-Term Memory) para el análisis de series temporales. Vamos a desglosar cada parte:

1. `model.add(layers.LSTM(50, activation='relu', input_shape=(time_steps, 1)))`:

   - `model.add(...)`: Esta línea agrega una capa al modelo secuencial `model` que se está construyendo.
   - `layers.LSTM(50, activation='relu', input_shape=(time_steps, 1))`: Aquí estamos agregando una capa LSTM al modelo. Los parámetros son:
      - `50`: Indica que la capa LSTM tendrá 50 unidades de memoria (neuronas).
      - `activation='relu'`: Establece la función de activación de las unidades LSTM como la función ReLU.
      - `input_shape=(time_steps, 1)`: Define la forma de entrada para la capa LSTM. `time_steps` representa la longitud de las secuencias de entrada, y `1` indica que cada paso de tiempo tiene una sola característica (en este caso, los precios de cierre normalizados).

2. `model.add(layers.Dense(1))`:

   - Esta línea agrega una capa densa (fully connected) al modelo. En este caso, se agrega una capa densa con una sola unidad de salida, que se utilizará para predecir el siguiente valor en la serie temporal.

3. `model.compile(optimizer='adam', loss='mse')`:

   - `model.compile(...)`: Aquí se compila el modelo, lo que significa que se configuran detalles adicionales para el entrenamiento, como el optimizador y la función de pérdida.
   - `optimizer='adam'`: Se utiliza el optimizador Adam para ajustar los pesos de las neuronas durante el entrenamiento.
   - `loss='mse'`: La función de pérdida se establece en el error cuadrado medio (Mean Squared Error), que es una métrica comúnmente utilizada para problemas de regresión.

En resumen, estas líneas de código construyen y compilan un modelo de redes neuronales con una arquitectura LSTM seguida de una capa densa para la predicción de series temporales. El modelo se configura para minimizar el error cuadrado medio durante el entrenamiento utilizando el optimizador Adam. Después de compilar el modelo, estará listo para ser entrenado utilizando los datos de entrenamiento preparados.

## **<font color="DeepPink">Entrenando el modelo</font>**

In [None]:
model.fit(X_train, y_train, epochs=50, batch_size=16, verbose=1)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.callbacks.History at 0x7ac9f0443880>

La línea de código `model.fit(X_train, y_train, epochs=50, batch_size=16, verbose=1)` se utiliza para entrenar el modelo de redes neuronales que has construido utilizando los conjuntos de datos de entrenamiento `X_train` y `y_train`.

A continuación, se desglosa cada parte de la línea de código:

- `model.fit(...)`: Esta es la función que se utiliza para entrenar el modelo. Recibe varios argumentos para configurar el proceso de entrenamiento.

- `X_train`: Este es el conjunto de datos de entrada de entrenamiento que contiene secuencias de valores de precios de cierre.

- `y_train`: Este es el conjunto de datos de salida esperada correspondiente a las secuencias de entrada en `X_train`.

- `epochs=50`: Este argumento especifica el número de épocas (iteraciones completas a través del conjunto de datos de entrenamiento) que se utilizarán durante el entrenamiento. En este caso, se establece en 50.

- `batch_size=16`: Este argumento define el tamaño de lote utilizado durante el entrenamiento. Los datos se dividirán en lotes de 16 ejemplos cada uno, y los pesos de la red se ajustarán después de cada lote. El tamaño de lote es un hiperparámetro que influye en cómo se actualizan los pesos y puede afectar la velocidad y la calidad del entrenamiento.

- `verbose=1`: Este argumento controla la verbosidad de la salida durante el entrenamiento. `verbose=1` significa que se mostrarán mensajes detallados durante el entrenamiento, como el progreso de cada época y las métricas de pérdida y precisión.

En resumen, esta línea de código inicia el proceso de entrenamiento del modelo de redes neuronales utilizando los datos de entrada y salida esperada proporcionados. El modelo pasará por 50 épocas, ajustando los pesos en lotes de 16 ejemplos a la vez, y mostrará información detallada sobre el progreso del entrenamiento en la salida. Después de completar este proceso, el modelo habrá aprendido a hacer predicciones en función de los patrones en los datos de entrenamiento.

## **<font color="DeepPink">Evaluando el modelo</font>**

In [None]:
test_loss = model.evaluate(X_test, y_test, verbose=0)
print(f"Pérdida en el conjunto de prueba: {test_loss}")

Pérdida en el conjunto de prueba: 0.0009824545122683048


Estas líneas de código se utilizan para evaluar el rendimiento del modelo de redes neuronales entrenado en el conjunto de prueba y mostrar la pérdida resultante en el conjunto de prueba. La pérdida es una medida de qué tan bien se ajusta el modelo a los datos de prueba y es una métrica comúnmente utilizada para evaluar modelos de aprendizaje automático.

A continuación, se explica cada parte de las líneas de código:

1. `test_loss = model.evaluate(X_test, y_test, verbose=0)`:

   - `model.evaluate(...)`: Esta es la función que se utiliza para evaluar el modelo en un conjunto de datos. Recibe los datos de entrada `X_test` y las salidas esperadas `y_test` del conjunto de prueba.
   - `X_test`: El conjunto de datos de entrada de prueba.
   - `y_test`: El conjunto de datos de salida esperada correspondiente a las secuencias de entrada en `X_test`.
   - `verbose=0`: En este caso, `verbose` se establece en 0 para evitar que se muestre información detallada durante la evaluación. Esto significa que no verás mensajes en la salida mientras se evalúa el modelo.

2. `print(f"Pérdida en el conjunto de prueba: {test_loss}")`:

   - `print(...)`: Esta línea de código muestra un mensaje en la salida.
   - `f"Pérdida en el conjunto de prueba: {test_loss}"`: Aquí estamos formateando una cadena para mostrar la pérdida calculada en el conjunto de prueba. `test_loss` es el valor numérico de la pérdida calculada.

En resumen, estas líneas de código se utilizan para calcular la pérdida del modelo en el conjunto de prueba y luego mostrar esta pérdida en la salida. La pérdida en el conjunto de prueba proporciona una indicación de qué tan bien el modelo generaliza a datos no vistos durante el entrenamiento. Una pérdida más baja en el conjunto de prueba indica un mejor rendimiento del modelo en datos no vistos anteriormente.

## **<font color="DeepPink">Predicción</font>**

In [None]:
y_pred = model.predict(X_test)



La línea de código `y_pred = model.predict(X_test)` se utiliza para realizar predicciones utilizando el modelo de redes neuronales entrenado en el conjunto de datos de prueba (`X_test`). Esta operación permite generar predicciones de salida basadas en las entradas de prueba y evaluar cómo el modelo se desempeña en datos que no ha visto durante el entrenamiento.

Aquí está la explicación de esta línea de código:

- `y_pred`: Esta variable almacenará las predicciones generadas por el modelo.

- `model.predict(...)`: Esta es la función que se utiliza para realizar predicciones utilizando el modelo entrenado. Recibe los datos de entrada `X_test` del conjunto de prueba y devuelve las predicciones correspondientes.

- `X_test`: El conjunto de datos de entrada de prueba para el cual se generarán las predicciones.

Después de ejecutar esta línea de código, la variable `y_pred` contendrá las predicciones generadas por el modelo para el conjunto de datos de prueba `X_test`. Estas predicciones representan las respuestas estimadas del modelo para las entradas de prueba. Puedes usar estas predicciones para compararlas con las salidas reales `y_test` y evaluar el rendimiento del modelo en el conjunto de prueba.

## **<font color="DeepPink">Inversión de la normalización</font>**

In [None]:
y_pred_actual = scaler.inverse_transform(y_pred)
y_test_actual = scaler.inverse_transform(y_test)

Estas líneas de código se utilizan para revertir la transformación de normalización que se aplicó previamente a los datos de prueba y a las predicciones generadas por el modelo. Esto es necesario para obtener los valores reales en su escala original y poder comparar las predicciones del modelo con los valores reales.

Aquí está la explicación de cada parte de las líneas de código:

1. `y_pred_actual = scaler.inverse_transform(y_pred)`:

   - `y_pred_actual`: Esta variable almacenará las predicciones del modelo en su escala original (no normalizada).
   - `scaler.inverse_transform(...)`: Esta es una función de la instancia del escalador Min-Max (`scaler`) que se utilizó previamente para normalizar los datos. La función `inverse_transform` se utiliza para revertir la normalización y devolver los valores a su escala original.
   - `y_pred`: Las predicciones generadas por el modelo, que están en la escala normalizada.

2. `y_test_actual = scaler.inverse_transform(y_test)`:

   - `y_test_actual`: Esta variable almacenará los valores reales de salida del conjunto de prueba en su escala original.
   - `scaler.inverse_transform(...)`: Nuevamente, se aplica la función `inverse_transform` del escalador Min-Max para revertir la normalización de los valores de salida reales del conjunto de prueba.
   - `y_test`: Los valores reales del conjunto de prueba, que están en la escala normalizada.

Después de ejecutar estas líneas de código, las variables `y_pred_actual` y `y_test_actual` contendrán los valores reales correspondientes a las predicciones del modelo y a los valores de salida del conjunto de prueba, respectivamente. Esto permitirá comparar directamente las predicciones del modelo con los valores reales en su escala original y evaluar la precisión del modelo.

## **<font color="DeepPink">Graficando predicciones y valores reales</font>**

In [None]:
fig = px.scatter()

fig.add_scatter(y=y_test_actual.flatten(),
                mode='lines',
                name='Valores Reales')

fig.add_scatter(y=y_pred_actual.flatten(),
                mode='lines',
                name='Predicciones')

fig.update_layout(
    title=f'Predicciones de Precios de Cierre de {symbol}',
    xaxis_title='Días',
    yaxis_title='Precio de Cierre',
    template="plotly_dark")

fig.show()