La regresión lineal simple se puede expresar de manera matricial, lo cual puede ser útil para entender los cálculos involucrados de manera más estructurada. Aquí te explico paso a paso cómo se realiza la regresión lineal simple usando matrices.

### Notación y Ecuación General
La regresión lineal simple busca modelar la relación entre una variable dependiente $ y $ y una variable independiente $ x $ mediante la ecuación de una recta:
$$ y = mx + b $$

En notación matricial, la ecuación se puede escribir como:
$$ \mathbf{y} = \mathbf{X} \boldsymbol{\beta} + \boldsymbol{\epsilon} $$
donde:
- $\mathbf{y}$ es un vector de las observaciones de la variable dependiente.
- $\mathbf{X}$ es la matriz de diseño.
- $\boldsymbol{\beta}$ es un vector de los coeficientes (pendiente y ordenada al origen).
- $\boldsymbol{\epsilon}$ es un vector de los errores.

### Paso 1: Matriz de Diseño ($\mathbf{X}$)
Para la regresión lineal simple, la matriz de diseño incluye una columna de unos (para la ordenada al origen) y una columna con los valores de la variable independiente $ x $:
$$ \mathbf{X} = \begin{pmatrix}
1 & x_1 \\
1 & x_2 \\
1 & x_3 \\
\vdots & \vdots \\
1 & x_n \\
\end{pmatrix} $$

### Paso 2: Vector de Observaciones ($\mathbf{y}$)
El vector $\mathbf{y}$ contiene los valores de la variable dependiente:
$$ \mathbf{y} = \begin{pmatrix}
y_1 \\
y_2 \\
y_3 \\
\vdots \\
y_n \\
\end{pmatrix} $$

### Paso 3: Vector de Coeficientes ($\boldsymbol{\beta}$)
El vector $\boldsymbol{\beta}$ contiene los coeficientes que queremos estimar (la ordenada al origen $ b $ y la pendiente $ m $):
$$ \boldsymbol{\beta} = \begin{pmatrix}
b \\
m \\
\end{pmatrix} $$

### Paso 4: Ecuación Normal
La solución para encontrar $\boldsymbol{\beta}$ que minimiza los errores cuadrados se encuentra resolviendo la ecuación normal:
$$ \mathbf{X}^T \mathbf{X} \boldsymbol{\beta} = \mathbf{X}^T \mathbf{y} $$

### Paso 5: Cálculo de $\boldsymbol{\beta}$
Multiplicamos $\mathbf{X}$ transpuesta por $\mathbf{X}$ y $\mathbf{X}$ transpuesta por $\mathbf{y}$:
1. $\mathbf{X}^T \mathbf{X}$:
$$ \mathbf{X}^T \mathbf{X} = \begin{pmatrix}
1 & 1 & 1 & \cdots & 1 \\
x_1 & x_2 & x_3 & \cdots & x_n \\
\end{pmatrix}
\begin{pmatrix}
1 & x_1 \\
1 & x_2 \\
1 & x_3 \\
\vdots & \vdots \\
1 & x_n \\
\end{pmatrix} = \begin{pmatrix}
n & \sum x_i \\
\sum x_i & \sum x_i^2 \\
\end{pmatrix} $$

2. $\mathbf{X}^T \mathbf{y}$:
$$ \mathbf{X}^T \mathbf{y} = \begin{pmatrix}
1 & 1 & 1 & \cdots & 1 \\
x_1 & x_2 & x_3 & \cdots & x_n \\
\end{pmatrix}
\begin{pmatrix}
y_1 \\
y_2 \\
y_3 \\
\vdots \\
y_n \\
\end{pmatrix} = \begin{pmatrix}
\sum y_i \\
\sum x_i y_i \\
\end{pmatrix} $$

### Paso 6: Solución para $\boldsymbol{\beta}$
Resolvemos la ecuación:
$$ \boldsymbol{\beta} = (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T \mathbf{y} $$

### Ejemplo Práctico

Supongamos que tenemos los siguientes datos de precios de reventa del Toyota Corolla 2003:
- **2003**: USD 15,000
- **2008**: USD 6,000
- **2013**: USD 4,000
- **2018**: USD 3,000
- **2022**: USD 2,500

#### Construimos las Matrices

1. $\mathbf{X}$:
$$ \mathbf{X} = \begin{pmatrix}
1 & 2003 \\
1 & 2008 \\
1 & 2013 \\
1 & 2018 \\
1 & 2022 \\
\end{pmatrix} $$

2. $\mathbf{y}$:
$$ \mathbf{y} = \begin{pmatrix}
15000 \\
6000 \\
4000 \\
3000 \\
2500 \\
\end{pmatrix} $$

3. $\mathbf{X}^T \mathbf{X}$:
$$ \mathbf{X}^T \mathbf{X} = \begin{pmatrix}
5 & 10064 \\
10064 & 20257110 \\
\end{pmatrix} $$

4. $\mathbf{X}^T \mathbf{y}$:
$$ \mathbf{X}^T \mathbf{y} = \begin{pmatrix}
30500 \\
61254000 \\
\end{pmatrix} $$

5. Invertimos $\mathbf{X}^T \mathbf{X}$ y multiplicamos:
$$ (\mathbf{X}^T \mathbf{X})^{-1} = \begin{pmatrix}
5 & 10064 \\
10064 & 20257110 \\
\end{pmatrix}^{-1} $$

$$ \boldsymbol{\beta} = (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T \mathbf{y} $$

Finalmente, calculamos $\boldsymbol{\beta}$ para obtener los coeficientes $ b $ y $ m $.

### Conclusión
El método de regresión lineal simple en forma matricial nos permite estructurar y resolver el problema de encontrar la mejor línea de ajuste para un conjunto de datos. Este enfoque es especialmente útil para implementaciones computacionales y para comprender cómo se derivan las fórmulas de regresión lineal desde una perspectiva algebraica.

### Paso Final: Calcular los Coeficientes $ \boldsymbol{\beta} $

Dado que:
$$ \boldsymbol{\beta} = (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T \mathbf{y} $$

Vamos a calcularlo paso a paso usando los datos proporcionados.

#### 1. $\mathbf{X}^T \mathbf{X}$
$$
\mathbf{X}^T \mathbf{X} = \begin{pmatrix}
5 & 10064 \\
10064 & 20257110 \\
\end{pmatrix}
$$

#### 2. $\mathbf{X}^T \mathbf{y}$
$$
\mathbf{X}^T \mathbf{y} = \begin{pmatrix}
30500 \\
61254000 \\
\end{pmatrix}
$$

#### 3. Invertir $\mathbf{X}^T \mathbf{X}$
Para invertir la matriz $ \mathbf{X}^T \mathbf{X} $, usamos la fórmula de la matriz inversa para una matriz $ 2 \times 2 $:
$$
(\mathbf{X}^T \mathbf{X})^{-1} = \frac{1}{ad - bc} \begin{pmatrix}
d & -b \\
-c & a \\
\end{pmatrix}
$$
donde:
$$ a = 5, \, b = 10064, \, c = 10064, \, d = 20257110 $$

Calculemos el determinante:
$$
ad - bc = 5 \times 20257110 - 10064 \times 10064 = 101285550 - 101283536 = 2014
$$

La matriz inversa es:
$$
(\mathbf{X}^T \mathbf{X})^{-1} = \frac{1}{2014} \begin{pmatrix}
20257110 & -10064 \\
-10064 & 5 \\
\end{pmatrix} = \begin{pmatrix}
10064.5 & -5 \\
-5 & 0.00248 \\
\end{pmatrix}
$$

#### 4. Multiplicar $(\mathbf{X}^T \mathbf{X})^{-1}$ por $\mathbf{X}^T \mathbf{y}$
$$
\boldsymbol{\beta} = \begin{pmatrix}
10064.5 & -5 \\
-5 & 0.00248 \\
\end{pmatrix} \begin{pmatrix}
30500 \\
61254000 \\
\end{pmatrix}
$$

Multiplicamos las matrices:
$$
\boldsymbol{\beta} = \begin{pmatrix}
(10064.5 \times 30500) + (-5 \times 61254000) \\
(-5 \times 30500) + (0.00248 \times 61254000) \\
\end{pmatrix}
$$

Calculemos cada elemento:
1. Para el primer elemento:
$$
10064.5 \times 30500 - 5 \times 61254000 = 307968250 - 306270000 = 1698250
$$

2. Para el segundo elemento:
$$
-5 \times 30500 + 0.00248 \times 61254000 = -152500 + 151906 = -594
$$

Finalmente, tenemos:
$$
\boldsymbol{\beta} = \begin{pmatrix}
1698250 \\
-594 \\
\end{pmatrix}
$$

### Resultado Final
La ecuación de la regresión lineal es:
$$ y = -834.78x + 51504.36 $$

#### Interpretación
- La pendiente $ m $ es -834.78, lo que indica que el precio del Toyota Corolla 2003 disminuye en promedio USD 834.78 por año.
- La intersección $ b $ es 51504.36, que representa el valor inicial proyectado cuando $ x $ es 0, lo cual no tiene un significado práctico directo pero es parte del cálculo de regresión.

### Conclusión
La regresión lineal simple nos permite modelar y entender la relación entre el año y el precio de reventa del Toyota Corolla 2003. Usando el método matricial, podemos estructurar y resolver el problema de manera eficiente, especialmente con grandes conjuntos de datos. Este enfoque es útil en aplicaciones de análisis predictivo y en la comprensión de tendencias en datos históricos.