<h1 align="center">Construcción de un modelo predictivo de la TRM asistido por ChatGPT</h1>
<div align="right">David A. Miranda, PhD<br>2023</div>

## 1. Planteamiento del problema

Implemente, con la ayuda de la inteligencia artificial [ChatGPT](https://chat.openai.com/), un modelo predictivo que permita predecir el valor de la TRM. Para entrenar el modelo, use datos obtenidas del [Banco de la República de Colombia](https://www.banrep.gov.co/es/estadisticas/trm).

## 2. Construcción del modelo

### 2.1. Instrucciones básicas para la construcción de un modelo predictivo y su entrenamiento

**Prompt ChatGPT**: Genera un Python Script que lea el archivo '../data/1.1.16.TCM_Serie historica_ultimos_doce meses.xlsx' ignorando las primeras siete filas y las cuatro últimas. Con los datos de fecha en la columna 'Fecha (dd/mm/aaaa)' crea tres nuevas columnas, primero, una columna llamada 'Día', con el día del mes; segundo, una columna llamada 'Mes', con el mes del año y tercero, una columna llamada 'Año', con el año. Toma como entradas los datos de las columnas 'Año', 'Mes', 'Día' y como salida la columna 'Tasa de cambio representativa del mercado (TRM)'; con estos datos, construye un modelo de inteligencia artificial que al introducir un valor numérico de Año, Mes y Día prediga la TRM. Usa el 60% de los datos para entrenar el modelo y 40% para validarlo.

In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

# Leer el archivo Excel
archivo = '../data/1.1.16.TCM_Serie historica_ultimos_doce meses.xlsx'
df = pd.read_excel(archivo, skiprows=7, skipfooter=4)

# Crear columnas de 'Día', 'Mes' y 'Año' a partir de la columna 'Fecha'
df['Día'] = df['Fecha (dd/mm/aaaa)'].dt.day
df['Mes'] = df['Fecha (dd/mm/aaaa)'].dt.month
df['Año'] = df['Fecha (dd/mm/aaaa)'].dt.year

# Definir las columnas de entrada y salida para el modelo
columnas_entrada = ['Año', 'Mes', 'Día']
columna_salida = 'Tasa de cambio representativa del mercado (TRM)'

# Dividir los datos en conjunto de entrenamiento y conjunto de validación
X = df[columnas_entrada]
y = df[columna_salida]
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.4, random_state=42)

# Entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

# Validar el modelo
score = modelo.score(X_val, y_val)
print(f"Puntuación del modelo: {score}")

# Ejemplo de predicción
ejemplo_entrada = [[2023, 5, 12]]  # Año, Mes, Día
prediccion = modelo.predict(ejemplo_entrada)
print(f"Predicción de TRM: {prediccion}")


Puntuación del modelo: 0.6097859205109278
Predicción de TRM: [4969.71279495]




### 2.2. Construcción de un método para predicir TRM al pasar los datos de día, mes y año

**Prompt ChatGPT**: Construye un método con el cual el modelo prediga la 'Tasa de cambio representativa del mercado (TRM)' cuando se le introduzca el Año, Mes y Día.

In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

class TRMPredictor:
    def __init__(self, data_file):
        # Leer el archivo Excel
        self.df = pd.read_excel(data_file, skiprows=7, skipfooter=4)

        # Crear columnas de 'Día', 'Mes' y 'Año' a partir de la columna 'Fecha'
        self.df['Día'] = self.df['Fecha (dd/mm/aaaa)'].dt.day
        self.df['Mes'] = self.df['Fecha (dd/mm/aaaa)'].dt.month
        self.df['Año'] = self.df['Fecha (dd/mm/aaaa)'].dt.year

        # Definir las columnas de entrada y salida para el modelo
        self.columnas_entrada = ['Año', 'Mes', 'Día']
        self.columna_salida = 'Tasa de cambio representativa del mercado (TRM)'

        # Dividir los datos en conjunto de entrenamiento y conjunto de validación
        X = self.df[self.columnas_entrada]
        y = self.df[self.columna_salida]
        self.X_train, self.X_val, self.y_train, self.y_val = train_test_split(X, y, test_size=0.4, random_state=42)

        # Entrenar el modelo de regresión lineal
        self.modelo = LinearRegression()
        self.modelo.fit(self.X_train, self.y_train)

    def predecir_TRM(self, año, mes, día):
        ejemplo_entrada = [[año, mes, día]]
        prediccion = self.modelo.predict(ejemplo_entrada)
        return prediccion[0]

In [3]:
data_file = '../data/1.1.16.TCM_Serie historica_ultimos_doce meses.xlsx'
predictor = TRMPredictor(data_file)

año = 2022
mes = 5
día = 12

prediccion_TRM = predictor.predecir_TRM(año, mes, día)
print(f"Predicción de TRM: {prediccion_TRM}")

Predicción de TRM: 4025.146479162853




### 2.3. Construcción de un método que busque en los datos de entrenamiento la TRM de un cierto día, mes y año

**Prompt ChatGPT**: Construye un método que devuelva la 'Tasa de cambio representativa del mercado (TRM)' del DataFrame de datos importados cuando se le introduzca el Año, Mes y Día.

In [4]:
import pandas as pd

class TRMDataReader:
    def __init__(self, data_file):
        # Leer el archivo Excel
        self.df = pd.read_excel(data_file, skiprows=7, skipfooter=4)

        # Crear columnas de 'Día', 'Mes' y 'Año' a partir de la columna 'Fecha'
        self.df['Día'] = self.df['Fecha (dd/mm/aaaa)'].dt.day
        self.df['Mes'] = self.df['Fecha (dd/mm/aaaa)'].dt.month
        self.df['Año'] = self.df['Fecha (dd/mm/aaaa)'].dt.year

        # Definir la columna de salida ('Tasa de cambio representativa del mercado (TRM)')
        self.columna_salida = 'Tasa de cambio representativa del mercado (TRM)'

    def obtener_TRM(self, año, mes, día):
        filtro = (self.df['Año'] == año) & (self.df['Mes'] == mes) & (self.df['Día'] == día)
        trm = self.df.loc[filtro, self.columna_salida].values
        if len(trm) > 0:
            return trm[0]
        else:
            return None

In [5]:
data_file = '../data/1.1.16.TCM_Serie historica_ultimos_doce meses.xlsx'
reader = TRMDataReader(data_file)

año = 2022
mes = 5
día = 12

trm = reader.obtener_TRM(año, mes, día)
if trm is not None:
    print(f"Tasa de cambio representativa del mercado (TRM): {trm}")
else:
    print("No se encontró la TRM para la fecha especificada.")

Tasa de cambio representativa del mercado (TRM): 4080.32


### 2.4. Mejorar el entrenamiento del modelo para reproducir mejor los datos de entrada y salida usados en el entrenamiento

**Prompot ChatGPT**: Por favor, mejora el modelo para que se aproxime más a los datos de entrada y vuelve a generar el método para obtener la 'Tasa de cambio representativa del mercado (TRM)'  cuando se le introduzca el Año, Mes y Día.

In [6]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.preprocessing import MinMaxScaler

class TRMPredictor:
    def __init__(self, data_file):
        # Leer el archivo Excel
        self.df = pd.read_excel(data_file, skiprows=7, skipfooter=4)

        # Crear columnas de 'Día', 'Mes' y 'Año' a partir de la columna 'Fecha'
        self.df['Día'] = self.df['Fecha (dd/mm/aaaa)'].dt.day
        self.df['Mes'] = self.df['Fecha (dd/mm/aaaa)'].dt.month
        self.df['Año'] = self.df['Fecha (dd/mm/aaaa)'].dt.year

        # Definir las columnas de entrada y salida para el modelo
        self.columnas_entrada = ['Año', 'Mes', 'Día']
        self.columna_salida = 'Tasa de cambio representativa del mercado (TRM)'

        # Dividir los datos en conjunto de entrenamiento y conjunto de validación
        X = self.df[self.columnas_entrada]
        y = self.df[self.columna_salida]
        self.X_train, self.X_val, self.y_train, self.y_val = train_test_split(X, y, test_size=0.6, random_state=42)

        # Normalizar los datos de entrada
        self.scaler = MinMaxScaler()
        self.X_train_scaled = self.scaler.fit_transform(self.X_train)
        self.X_val_scaled = self.scaler.transform(self.X_val)

        # Entrenar el modelo de Random Forest Regressor
        self.modelo = RandomForestRegressor(n_estimators=100, random_state=42)
        self.modelo.fit(self.X_train_scaled, self.y_train)

    def predecir_TRM(self, año, mes, día):
        ejemplo_entrada = [[año, mes, día]]
        ejemplo_entrada_scaled = self.scaler.transform(ejemplo_entrada)
        prediccion = self.modelo.predict(ejemplo_entrada_scaled)
        return prediccion[0]

In [7]:
data_file = '../data/1.1.16.TCM_Serie historica_ultimos_doce meses.xlsx'
predictor = TRMPredictor(data_file)

año = 2022
mes = 5
día = 12

prediccion_TRM = predictor.predecir_TRM(año, mes, día)
print(f"Predicción de TRM: {prediccion_TRM}")

Predicción de TRM: 4061.0842000000052




### 2.5. Generación de un modelo basado en inteligencia artificial

**Prompt ChatGPT**: Genera un modelo basado en inteligencia artificial en el que uses sklearn y construye un método para obtener la 'Tasa de cambio representativa del mercado (TRM)'  cuando se le introduzca el Año, Mes y Día.

In [8]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.preprocessing import MinMaxScaler

class TRMPredictor:
    def __init__(self, data_file):
        # Leer el archivo Excel
        self.df = pd.read_excel(data_file, skiprows=7, skipfooter=4)

        # Crear columnas de 'Día', 'Mes' y 'Año' a partir de la columna 'Fecha'
        self.df['Día'] = self.df['Fecha (dd/mm/aaaa)'].dt.day
        self.df['Mes'] = self.df['Fecha (dd/mm/aaaa)'].dt.month
        self.df['Año'] = self.df['Fecha (dd/mm/aaaa)'].dt.year

        # Definir las columnas de entrada y salida para el modelo
        self.columnas_entrada = ['Año', 'Mes', 'Día']
        self.columna_salida = 'Tasa de cambio representativa del mercado (TRM)'

        # Dividir los datos en conjunto de entrenamiento y conjunto de validación
        X = self.df[self.columnas_entrada]
        y = self.df[self.columna_salida]
        self.X_train, self.X_val, self.y_train, self.y_val = train_test_split(X, y, test_size=0.6, random_state=42)

        # Normalizar los datos de entrada
        self.scaler = MinMaxScaler()
        self.X_train_scaled = self.scaler.fit_transform(self.X_train)
        self.X_val_scaled = self.scaler.transform(self.X_val)

        # Construir el modelo de Random Forest Regressor
        self.modelo = RandomForestRegressor(n_estimators=100, random_state=42)
        self.modelo.fit(self.X_train_scaled, self.y_train)

    def predecir_TRM(self, año, mes, día):
        ejemplo_entrada = [[año, mes, día]]
        ejemplo_entrada_scaled = self.scaler.transform(ejemplo_entrada)
        prediccion = self.modelo.predict(ejemplo_entrada_scaled)
        return prediccion[0]

# Uso del TRMPredictor
data_file = '../data/1.1.16.TCM_Serie historica_ultimos_doce meses.xlsx'
predictor = TRMPredictor(data_file)

año = 2022
mes = 5
día = 12

prediccion_TRM = predictor.predecir_TRM(año, mes, día)
print(f"Predicción de TRM: {prediccion_TRM}")

Predicción de TRM: 4061.0842000000052




In [9]:
año = 2022
mes = 12
día = 31

prediccion_TRM = predictor.predecir_TRM(año, mes, día)
print(f"Predicción de TRM: {prediccion_TRM}")

Predicción de TRM: 4792.444300000004




End!