In [None]:
!pip list --format=freeze > ../requirements.txt

# 0. Gu√≠a de Reproducci√≥n

## 0.1 Instalaci√≥n de m√≥dulos

Para compilar el libro, es necesario instalar Jupyter-book usando pip. La versi√≥n de jupyter-book a usar puede encontrarse en el archivo requirement.txt.

Puede instalar todos los paquetes requeridos utilizando el siguiente comando en una consola de texto:

In [None]:
!pip install -r ../requirements.txt

## 0.2 Inicializar Jupyter-Book

Tras instalar Jupyter-book, inicializar un libro con el comando:

In [None]:
!jupyter-book create .

Tras lo cual, se debe agregar los cap√≠tulos en book/_toc.yml.

## 0.3 Compilar el libro

Una vez agregado los cap√≠tulos, compilar el libro usando el comando:

In [None]:
!jupyter-book build .

Verificar que no haya errores. El resultado estar√° en _build/html/.

## 0.4 Publicar en GitHub Pages

Use el siguiente comando para publicar el libro en GitHub Pages:

In [None]:
!ghp-import -n -p -f _build/html

Es necesario tener un repositorio activo en la carpeta del libro. Se crear√° un nuevo branch con los archivos necesario para la visualizaci√≥n del libro.

## 0.5 Estructura de carpetas

Crear la siguiente estructura de carpetas en la carpeta principal del proyecto:

```
book/
‚îú‚îÄ‚îÄ Data/
‚îú‚îÄ‚îÄ notebooks/
‚îú‚îÄ‚îÄ _build/
‚îî‚îÄ‚îÄ _config.yml
```

# 1. Obtenci√≥n del dataset

El dataset puede ser descargado del siguiente [link](https://github.com/lihkir/Data/blob/main/hour.csv).

Tambi√©n puede ejecutar el siguiente c√≥diggo para descargar el archivo automaticamente.



In [3]:
import requests

url = 'https://raw.githubusercontent.com/lihkir/Data/refs/heads/main/hour.csv'
r = requests.get(url, allow_redirects=True)

open('../Data/hour.csv', 'wb').write(r.content)

1139356

# 2. Estructura del libro

El libro contiene los siguientes notebooks:

root: README.md

chapters:

* file: Notebooks/00-instructions
* file: Notebooks/01-introduction
* file: Notebooks/02-data-cleaning
* file: Notebooks/03-eda
* file: Notebooks/04-ols-matrix
* file: Notebooks/05-inference
* file: Notebooks/06-diagnostics
* file: Notebooks/07-robust-methods
* file: Notebooks/08-validation
* file: Notebooks/09-interpretation
* file: Notebooks/10-conclusions

# 3. Demostraciones

## 3.1 Demostraci√≥n Grados de Libertad $SS_{Res}$

Consideramos el modelo lineal m√∫ltiple
$$y = X \beta+\epsilon$$

Donde $y ‚àà R^n$, $X ‚àà R^{nxp}$ con rango completo $rank(X) = p$, $\beta ‚àà R^p$ y $\epsilon$ son errores con $E[\epsilon] = 0$ y $Var(\epsilon) = \sigma^2I_n$

Denotamos la matriz de proyecci√≥n (matriz hat):

$$H = X(X'X)^{-1}X'$$

Los residuos son $e = y - \hat{y} = (I-H)y$. La suma de cuadrados $SS_{Res}$ ser√° igual entonces a:

$$SSRes = e'e = y'(I-H)y$$

Se puede demostrar que H es sim√©trica e idempotente:
* $H' = (X(X'X)^{-1}X')' = X(X'X)^{-1}X' = H$
* $H^2 = X(X'X)^{-1}X'X(X'X)^{-1}X' = X(X'X)^{-1}X' = H$

Por tanto, (I-H) tambi√©n ser√° sim√©trica e idempotente:
* $(I-H)' = I' - H' = I - H$
* $(I-H)^2 = I - 2H + H^2 = I - H$

La traza de una matriz idempotente es igual a su rango. Adem√°s,

$$tr(H) = tr(X(X'X)^{-1}X') = tr((X'X)^{-1}X'X) = tr(I_p) = p$$
Usando $tr(AB) = tr(BA)$ cuando los tama√±os lo permiten.

Adem√°s:
$$ tr(I-H) = tr(I) - tr(H) = n- p$$

Como I - H es idempotente, su traza = su rango, por tanto:
$$rank(I-H) = n-p$$

---

Si adem√°s $\varepsilon \sim N(0, \sigma^2 I)$, entonces:

$$
e = (I-H)y= (I-H)\varepsilon.
$$

porque $(I-H)X\beta = 0$

Entonces
$$SSRes = e'e = \varepsilon'(I-H)\varepsilon$$

Dado que $(ùêº-ùêª)$ es sim√©trica y semidefinida positiva, existe una matriz ortogonal ùëÉ que diagonaliza $(ùêº‚àíùêª)$:

$$
P'(I-H)P = 
\begin{pmatrix}
I_{n-p} & 0 \\
0 & 0_p
\end{pmatrix}.
$$

donde hay n-p unos en la diagonal (porque $rank(I-H)=n-p$) y $p$ ceros.

Sea $z = P'\varepsilon$. Como P es ortogonal y $\varepsilon \sim N(0, \sigma^2 I)$, resulta $z \sim N(0,\sigma^2 I)$. Entonces:

$$
\mathrm{SSRes} = \varepsilon'(I-H)\varepsilon = z'\begin{pmatrix}
I_{n-p} & 0 \\
0 & 0_p
\end{pmatrix}z = \sum_{i=1}^{n-p} z_i^2.
$$

Dividiendo por $\sigma^2\$:

$$
\frac{\mathrm{SSRes}}{\sigma^2} 
= \sum_{i=1}^{n-p} \left(\frac{z_i}{\sigma}\right)^2
\sim \chi^2_{\,n-p}.
$$


## 3.2 $MS_{Res}$ es estimador insesgado de $\sigma^2$ 

$$E(MS_{Res} = E(SS_{Res}/(n-p)) = \frac{\sigma^2}{n-p}E(SS_{Res}/\sigma^2)$$ 

Como $\frac{SS_Res}{\sigma^2} \sim \chi^2_{\,n-p}$, entonces:
$$E(\frac{SS_Res}{\sigma^2}) = n-p$$

Entonces,
$$E(MS_{Res}) = \frac{\sigma^2}{n-p} * (n-p) = \sigma^2$$

## 3.3 Demostraci√≥n Valor esperado del error medio de regresi√≥n


La suma de cuadrados de la regresi√≥n (SSR), medida respecto de la media, puede escribirse como
$$
\mathrm{SSR} = \hat{y}'\hat{y} - n\bar{y}^2 = y'(H-J)y = y'(H-J)y,
$$
donde $\hat{y}=Hy$ y $\bar y=(1/n)\mathbf{1}'y$. La matriz $H-J$ proyecta sobre el subespacio de $\operatorname{col}(X)$ ortogonal al vector de unos; es sim√©trica e idempotente con traza $\operatorname{tr}(H-J)=\operatorname{tr}(H)-\operatorname{tr}(J)=p-1$.

El Mean Square Regression se define como
$$
\mathrm{MSR}=\frac{\mathrm{SSR}}{p-1}.
$$

---

Sustituimos $y=X\beta+\varepsilon$ en la expresi√≥n de SSR:
$$\begin{aligned}
\mathrm{SSR}
&= (X\beta+\varepsilon)'(H-J)(X\beta+\varepsilon) \\
&= \beta'X'(H-J)X\beta
   + 2\beta'X'(H-J)\varepsilon
   + \varepsilon'(H-J)\varepsilon.
\end{aligned}$$

Tomando esperanza y usando $E[\varepsilon]=0$ y $E[\varepsilon\varepsilon']=\sigma^2 I_n$, los t√©rminos cruzados desaparecen y el t√©rmino cuadr√°tico en $\varepsilon$ tiene esperanza $\sigma^2\operatorname{tr}(H-J)$. As√≠:
$$
\begin{aligned}
E[\mathrm{SSR}]
&= \beta'X'(H-J)X\beta + E[\varepsilon'(H-J)\varepsilon] \\
&= \beta'X'(H-J)X\beta + \sigma^2\operatorname{tr}(H-J).
\end{aligned}
$$

Como $\operatorname{tr}(H)=p$ y $\operatorname{tr}(J)=1$, se obtiene $\operatorname{tr}(H-J)=p-1$. Por tanto
$$
E[\mathrm{SSR}] = \beta'X'(H-J)X\beta + \sigma^2 (p-1).
$$

---

Dividiendo por \(p-1\),
$$
E[\mathrm{MSR}] = \frac{E[\mathrm{SSR}]}{p-1}
= \sigma^2 \;+\; \frac{\beta'X'(H-J)X\beta}{\,p-1\,}.
$$


## 3.4 Demostraci√≥n estad√≠stico $F_0$

Siendo $p = k + 1$,

y que

$$MSR \sim \chi^2_{k}$$
$$MS_{Res} \sim \chi^2_{n- k - 1}$$

Entonces, el cociente
$$F_0 = \frac{MSR}{MS_{Res}} \sim F_{k, n-k-1}$$