## Pregunta 3


El análisis factorial es un método para modelar variables observadas y su estructura de covarianza en términos de un número menor de "factores" subyacentes no observables (latentes). Los factores generalmente se consideran conceptos o ideas amplios que pueden describir un fenómeno observado. Por ejemplo, un deseo básico de alcanzar cierto nivel social podría explicar la mayoría del comportamiento de consumo. Estos factores no observados son más interesantes para el científico social que las mediciones cuantitativas observadas.

El análisis factorial es generalmente un método exploratorio/descriptivo que requiere muchos juicios subjetivos. Es una herramienta ampliamente utilizada y a menudo controvertida porque los modelos, métodos y subjetividad son tan flexibles que pueden surgir debates sobre las interpretaciones.

El método es similar a los componentes principales aunque, como señala el libro de texto, el análisis factorial es más elaborado. En un sentido, el análisis factorial es una inversión de los componentes principales. En el análisis factorial, modelamos las variables observadas como funciones lineales de los "factores". En los componentes principales, creamos nuevas variables que son combinaciones lineales de las variables observadas. En ambos, PCA y FA, se reduce la dimensión de los datos. Recordemos que en PCA, la interpretación de los componentes principales a menudo no es muy clara. Una variable particular puede, en ocasiones, contribuir significativamente a más de uno de los componentes. Idealmente, nos gustaría que cada variable contribuyera significativamente solo a un componente. Se emplea una técnica llamada rotación de factores para lograr ese objetivo. Ejemplos de campos donde se involucra el análisis factorial incluyen fisiología, salud, inteligencia, sociología y, a veces, ecología, entre otros.


##Codigo de ejemplo:

options ls=78;
title "Factor Analysis - Principal Component Method - Places Rated";

/* Ingresar los datos directamente en el programa */
data places;
  input climate housing health crime trans educate arts recreate econ id;
  datalines;
  70 150 200 300 50 100 60 80 120 1
  60 120 190 330 55 95 65 85 115 2
  75 130 210 310 60 105 70 75 130 3
  80 140 180 320 52 98 62 90 125 4
  65 110 195 340 58 102 68 78 118 5
  ;
run;

/* Realizar las transformaciones logarítmicas */
data places;
  set places;
  climate = log10(climate);
  housing = log10(housing);
  health = log10(health);
  crime = log10(crime);
  trans = log10(trans);
  educate = log10(educate);
  arts = log10(arts);
  recreate = log10(recreate);
  econ = log10(econ);
run;

/* Realizar análisis de factores usando el método de componentes principales */
proc factor data=places method=principal nfactors=3 rotate=varimax simple scree ev preplot plot residuals;
  var climate housing health crime trans educate arts recreate econ;
run;



## Pregunta 4


Ejercicio 3.1:
Muestre que las suposiciones conducen a
\begin{equation*}
\operatorname{var}(y_i) = \lambda_{i1}^2 + \lambda_{i2}^2 + \cdots + \lambda_{im}^2 + \psi_i
\end{equation*}
Ejercicio 3.2:
\begin{equation*}
\operatorname{cov}(y, f) = \Lambda
\end{equation*}
Verifique directamente que se cumple (13.13).

Ejercicio 3.3:
Demuestre que
\begin{align*}
\mathbb{E}(f^) &= \mathbb{E}(T^\prime f) = 0\
\operatorname{cov}(f^) &= \operatorname{cov}(T^\prime f) = I
\end{align*}
donde $f^* = T^\prime f$ como en (13.18), satisfaciendo los supuestos (13.6) y (13.7).

Ejercicio 3.5:
Demuestre que
\begin{equation*}
\sum_{i=1}^p \sum_{j=1}^m \hat{\lambda}{ij}^2 = \sum{j=1}^m \theta_j = \sum_{i=1}^p \hat{h}_i^2
\end{equation*}
es decir, que es igual a la suma de los primeros $m$ valores propios y también igual a la suma de todas las $p$ comunalidades, como en (13.46).

Ejercicio 3.1:
\begin{equation*}
\operatorname{var}(y_i) = \operatorname{var}(y_i - \mu_i) = \operatorname{var}\left(\sum_{j=1}^m \lambda_{ij}f_j + \epsilon_i\right) = \sum_{j=1}^m \lambda_{ij}^2 + \psi_i
\end{equation*}
Ejercicio 3.2:
\begin{align*}
\operatorname{cov}(y, f) &= \operatorname{cov}(f + \epsilon, f) &&\text{[por (13.3)]} \
&= \operatorname{cov}(f, f) &&\text{[por (13.10)]} \
&= \mathbb{E}[(f - \mathbb{E}(f))(f - \mathbb{E}(f))^\prime] &&\text{[por analogía a (3.31)]} \
&= \mathbb{E}[(f - \mathbb{E}(f))(f - \mathbb{E}(f))^\prime] \
&= \operatorname{cov}(f) = \Lambda &&\text{[por (13.7)]}
\end{align*}
Ejercicio 3.3:
\begin{align*}
\mathbb{E}(f^) &= \mathbb{E}(T^\prime f) = T^\prime \mathbb{E}(f) = T^\prime 0 = 0 \
\operatorname{cov}(f^) &= \operatorname{cov}(T^\prime f) = T^\prime \operatorname{cov}(f) T = T^\prime I T = I
\end{align*}
Ejercicio 3.5:
\begin{align*}
\sum_{i=1}^p \sum_{j=1}^m \hat{\lambda}{ij}^2 &= \sum{i=1}^p \left[\sum_{j=1}^m \hat{\lambda}{ij}^2\right] &&\text{[por (13.28)]} \
&= \sum{i=1}^p \hat{h}i^2
\end{align*}
Intercambiando el orden de las sumatorias:
\begin{align*}
\sum{i=1}^p \sum_{j=1}^m \hat{\lambda}{ij}^2 &= \sum{j=1}^m \sum_{i=1}^p \hat{\lambda}{ij}^2 \
&= \sum{j=1}^m \theta_j &&\text{[por (13.29)]}
\end{align*}
