# Regresión Lineal con Python

## Conceptos de Regresión Lineal

La **regresión lineal** es un método estadístico utilizado para modelar la relación entre una variable dependiente y una o más variables independientes mediante el ajuste de una línea recta (o hiperplano en dimensiones superiores). La ecuación de una regresión lineal simple es:

$$ y = \beta_0 + \beta_1 x + \epsilon $$

donde:
- \( y \) es la variable dependiente.
- \( x \) es la variable independiente.
- \( \beta_0 \) es la intersección con el eje y.
- \( \beta_1 \) es la pendiente de la línea.
- \( \epsilon \) es el término de error.

### Bibliografía
1. "Pattern Recognition and Machine Learning" - Christopher M. Bishop, 2006. Springer.
2. "An Introduction to Statistical Learning" - Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, 2013. Springer.


In [41]:
# En este notebook, implementaremos una regresión lineal simple (una variable independiente) desde cero.
# Importación de Bibliotecas

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# Generación de Datos
# Generamos un conjunto de datos para ilustrar la regresión lineal.
# Suponemos que la relación entre la variable independiente (X) y la variable dependiente (y) es lineal con algo de ruido.
np.random.seed(0)
N = 1000
x = 2 * np.random.rand(N, 1)
y = 4 + 3 * x + np.random.randn(N, 1)

In [20]:
# Visualizamos los datos
plt.scatter(x, y, color='blue')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Datos')
plt.show()

In [42]:
# Modelo, entrenamiento y predicciones
model = LinearRegression()
model.fit(x, y)
y_pred = model.predict(x)

In [47]:
# Visualización
plt.scatter(x, y, color='blue', label='Datos reales')
plt.plot(x, y_pred, color='red', label='Predicción')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Regresión Lineal')
plt.legend()
plt.show()