# Importando librerías y recursos externos

In [2]:
import pandas as pd
import json
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

historical_data = '/home/jovyan/work/assets/tabla_datos.json'
# Carga el archivo JSON
with open(historical_data, 'r') as file:
    data = json.load(file)

# Convierte los datos a un DataFrame
df = pd.DataFrame(data)

# Imprime el DataFrame
# print(df)

In [3]:

# Renombrar la columna 'Close    Close price adjusted for splits.' a 'Close' para simplificar
df = df.rename(columns={"Close    Close price adjusted for splits.": "Close"})

# Convertir las columnas numéricas a tipo float después de remover las comas
df['Open'] = df['Open'].str.replace(',', '').astype(float)
df['Volume'] = df['Volume'].str.replace(',', '').astype(float)
df['Close'] = df['Close'].str.replace(',', '').astype(float)

# Definir las variables independientes (features) y dependiente (target)
X = df[['Open', 'Volume']]
y = df['Close']

# Separar los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# Crear el modelo de regresión lineal
model = LinearRegression()
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio:", mse)
print("Predicciones:", y_pred)

# Opcional: Ver los coeficientes del modelo
print("Coeficientes:", model.coef_)
print("Intercepto:", model.intercept_)

Error cuadrático medio: 794.7753304104921
Predicciones: [1567.25043632 1586.15724204 1598.75168522 1608.14215578 1555.23887374
 1665.71704238 1710.96884104 1588.46793102 1681.76117638 1393.74428413
 1524.9067548  1605.19796029 1685.83388431 1752.59153498 1559.41456269
 1672.23375909 1550.51324369 1635.13454419 1527.58224103 1602.1979332
 1728.72062126 2002.57300058 1436.75024096 1473.92221545 1751.71005906
 1227.69295304 2064.50882546 1905.73706746 1753.86010218 2005.9441798
 1404.18770549 1452.65451872 1774.66553114 1759.98654522 1608.41401831
 1526.23406846 1769.79489347 2060.05195952 2056.2853742  1761.38669058
 1471.86292458 2089.92480364 1564.61363678 1761.38533635 1609.28352391
 1385.54959714 1477.74144573 2034.36084564 1662.98860241 1740.89336838
 1668.67266497]
Coeficientes: [9.94137594e-01 1.35422828e-05]
Intercepto: 7.636423709566316


# Explicación de los valores resultantes 
Carga de datos: Creamos el DataFrame df a partir del JSON.
Limpieza de datos: Eliminamos las comas en los valores numéricos de Open, Volume y Close y los convertimos a float.
Definición de variables: X contiene Open y Volume, y y es la variable Close que queremos predecir.
División de datos: Usamos train_test_split para dividir los datos en conjuntos de entrenamiento y prueba.
Entrenamiento del modelo: Entrenamos el modelo de regresión lineal con LinearRegression().
Evaluación: Calculamos el error cuadrático medio para evaluar el modelo y mostramos las predicciones.
Coeficientes: Los coeficientes e intercepto del modelo indican la relación de cada variable independiente con el Close.
