# Regresión lineal múltiple

Una extensión útil de la regresión lineal es el caso en el que y es una función lineal de dos o más variables independientes. Por ejemplo, $y$ podría ser una función lineal de $x_1$ y $x_2$, como en el modelo:


\begin{equation*}
	y = a_0 + a_1 x_1 + a_2 x_2 + e.
\end{equation*}


Como en los casos anteriores, los mejores valores para los coeficientes se deter- minan al realizar la suma de los cuadrados de los residuos:


\begin{equation}
    E = \sum_{i = 1}^n e_i^2 = \sum_{i =1}^n \left( y_i - \overline{y}_i \right)^2 = \sum_{i =1}^n \left( y_i - a_0 - a_1 x_{1i} - a_2 x_{2i}\right)^2.
\end{equation}



Siguiendo el proceso, entonces ahora procedemos a determinar las derivadas parciales del método:


\begin{equation*}
	\begin{split}
		\frac{\partial E}{\partial a_0} & = -2\sum_{i =1}^n \left( y_i - a_0 - a_1 x_{1i} - a_2 x_{2i}\right) \\
		\frac{\partial E}{\partial a_1} & = -2\sum_{i =1}^n \left( y_i - a_0 - a_1 x_{1i} - a_2 x_{2i}\right) x_{1i} \\
		\frac{\partial E}{\partial a_2} & = -2\sum_{i =1}^n \left( y_i - a_0 - a_1 x_{1i} - a_2 x_{2i}\right) x_{2i} \\
	\end{split}
\end{equation*}


Entonces al reajustar las ecuaciones para los coeficientes que determinan el modelo de regresión con un polinomio de segundo orden:


\begin{equation*}
	\begin{split}
		a_0 n + a_1 \sum_{i =1}^n x_{1i} + a_2 \sum_{i =1} x_{2i} & = \sum_{i=1} y_i \\
		a_0 \sum_{i =1}^n x_{1i} + a_1 \sum_{i =1} x^2_{1i} + a_2 \sum_{i =1} x_{1i} x_{2i} & = \sum_{i=1} x_{1i} y_i \\
		a_0 \sum_{i =1} x_{2i} + a_1 \sum_{i =1}^n x_{1i} x_{2i} + a_2 \sum_{i =1} x^2_{2i} & = \sum_{i=1} x_{2i} y_i \\
	\end{split}
\end{equation*}

In [None]:
# A fin de facilitar la carga de los datos emplearemos la libreria de pandas
import pandas as pd

# Importamos numpy en caso de ocuparlo
import numpy as np

# Importamos la función señalada del determinante
from numpy.linalg import det, solve

# Libreria para graficar
import matplotlib.pyplot as plt
from matplotlib import style
import seaborn as sns

# Configuramos los warnings
import warnings
warnings.filterwarnings('ignore')

In [None]:
# Importamos la información mediante un archivo en csv
data = pd.read_csv('Ejemplo3.csv')

# Visualizamos la información
data

In [None]:
# Ahora procederemos a determinar el modelo, por lo que,
# determinamos la longitud de los datos
n = len(data)

# Número de variables dependientes
m = len(data.columns) - 1

# Imprimimos el número de datos
print('Tenemos {} datos con {} variables dependientes.'.format(n, m))

In [None]:
# Calculamos las sumas
sumx1 = data['x1'].sum()
sumx2 = data['x2'].sum()
sumx1x1 = (data['x1'] ** 2).sum()
sumx1x2 = (data['x1'] * data['x2']).sum()
sumx2x2 = (data['x2'] ** 2).sum()
sumy = data['y'].sum()
sumyx1 = (data['y'] * data['x1']).sum()
sumyx2 = (data['y'] * data['x2']).sum()

In [None]:
# Creamos una matriz con los arreglos
A = np.empty((m+1, m+1))

# Asigamos los valores
A[0,0] = n
A[0,1] = sumx1
A[1,0] = sumx1
A[0,2] = sumx2
A[2,0] = sumx2
A[1,1] = sumx1x1
A[1,2] = sumx1x2
A[2,1] = sumx1x2
A[2,2] = sumx2x2

# Creamos el vector b
b = np.empty(m+1)
b[0] = sumy
b[1] = sumyx1
b[2] = sumyx2

# Imprimimos los arreglos
print('La matriz del sistema es: \n', A)

# Imprimimos el vector columna
print('El vector columnas es: \n', b)

In [None]:
# Resolvemos el sistema
solve(A,b)

In [None]:
b