# Predicción del Precio de Cierre de la Acción de Google
Este análisis utiliza datos históricos de precios de acciones de Google (Alphabet Inc.) para construir un modelo predictivo que estime el precio de cierre del siguiente día hábil utilizando regresión lineal.

## Carga de Librerías y Datos
Se importan las bibliotecas necesarias para el análisis, visualización y modelado predictivo.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Carga de datos
df = pd.read_csv('Google_stock_data.csv')

## Revisión Inicial y Limpieza
Visualizamos los primeros registros, verificamos información básica y convertimos la columna de fecha.

In [None]:
print(df.head())
print(df.info())
print('Valores nulos por columna:', df.isnull().sum())

df['Date'] = pd.to_datetime(df['Date'])
df.sort_values('Date', inplace=True)
df.reset_index(drop=True, inplace=True)
print(df.head())

## Evolución del Precio de Cierre
Se grafica cómo ha cambiado el precio de cierre de la acción a lo largo del tiempo.

In [None]:
sns.set_theme(style='darkgrid')
plt.figure(figsize=(14, 6))
plt.plot(df['Date'], df['Close'], color='blue', linewidth=2)
plt.title('Precio de Cierre de la Acción de Google a lo largo del tiempo', fontsize=16)
plt.xlabel('Fecha')
plt.ylabel('Precio de Cierre (USD)')
plt.tight_layout()
plt.show()

## Rango Diario de Precios
Se crea una nueva variable que representa la diferencia entre el precio más alto y más bajo de cada día.

In [None]:
df['Range'] = df['High'] - df['Low']
plt.figure(figsize=(14, 4))
plt.plot(df['Date'], df['Range'], color='orange')
plt.title('Rango Diario de Precios (High - Low)', fontsize=16)
plt.xlabel('Fecha')
plt.ylabel('Rango')
plt.tight_layout()
plt.show()

## Matriz de Correlación
Exploramos la correlación entre las variables principales del mercado para entender su relación.

In [None]:
plt.figure(figsize=(8, 6))
corr = df[['Open', 'High', 'Low', 'Close', 'Volume']].corr()
sns.heatmap(corr, annot=True, cmap='coolwarm', fmt='.2f')
plt.title('Matriz de Correlación entre Variables')
plt.tight_layout()
plt.show()

## Distribución del Precio de Cierre
Visualizamos la distribución del precio de cierre para entender su comportamiento general.

In [None]:
plt.figure(figsize=(10, 4))
sns.histplot(df['Close'], bins=50, kde=True, color='green')
plt.title('Distribución del Precio de Cierre')
plt.xlabel('Precio de Cierre')
plt.ylabel('Frecuencia')
plt.tight_layout()
plt.show()

## Preparación de los Datos para el Modelo
Creamos la columna objetivo `Target`, que representa el precio de cierre del siguiente día, y eliminamos registros nulos.

In [None]:
df['Target'] = df['Close'].shift(-1)
df = df.dropna().reset_index(drop=True)
X = df[['Open', 'High', 'Low', 'Close', 'Volume']]
y = df['Target']

## Entrenamiento del Modelo
Entrenamos un modelo de regresión lineal para predecir el precio de cierre del siguiente día.

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False)
model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"MSE: {mse:.2f}")
print(f"R²: {r2:.4f}")

## Comparación de Resultados
Comparamos visualmente los valores reales con los valores predichos por el modelo.

In [None]:
plt.figure(figsize=(12, 5))
plt.plot(y_test.values, label='Valor real')
plt.plot(y_pred, label='Predicción', alpha=0.7)
plt.title('Comparación: Precio de Cierre Real vs. Predicho')
plt.xlabel('Días')
plt.ylabel('Precio (USD)')
plt.legend()
plt.tight_layout()
plt.show()