# Modelos mixtos

Una guía divertida de modelos mixtos con sas

## Medidas repetidas

Guía adaptada de:
https://stats.idre.ucla.edu/r/seminars/repeated-measures-analysis-with-r/

### Ejemplo de datos de ejercicio y pulso

En este ejemplo se usan unos datos de personas a quienes se les midió el pulso al realizar cierto tipo de ejercicio en distintos periodos de tiempo. También se les asignó una dieta.

A continuación se leen los datos de internet y se les asigna unos formatos para que las gráficas y análisis se vean bien.

In [10]:
proc format;
value dieta
 1 = "Baja en grasas"
 2 = "Normal";
 value ejer
 1 = "Reposo"
 2 = "Caminar"
 3 = "Correr";
 value tiempo
 1 = "1 minuto"
 2 = "15 minutos"
 3 = "30 minutos";
run;

filename exer url "https://stats.idre.ucla.edu/stat/data/exer.csv";

data datos;
infile exer dlm = "," firstobs = 2;
input persona dieta ejercicio pulso tiempo;
format dieta dieta. ejercicio ejer. tiempo tiempo.;
label persona = "Individuo" dieta = "Tipo de dieta"
ejercicio = "Tipo de ejercicio" tiempo = "Intervalo de tiempo" pulso = "Pulso";
run;

proc print data = datos(obs = 12) noobs;
run;

persona,dieta,ejercicio,pulso,tiempo
1,Baja en grasas,Reposo,85,1 minuto
1,Baja en grasas,Reposo,85,15 minutos
1,Baja en grasas,Reposo,88,30 minutos
2,Baja en grasas,Reposo,90,1 minuto
2,Baja en grasas,Reposo,92,15 minutos
2,Baja en grasas,Reposo,93,30 minutos
3,Baja en grasas,Reposo,97,1 minuto
3,Baja en grasas,Reposo,97,15 minutos
3,Baja en grasas,Reposo,94,30 minutos
4,Baja en grasas,Reposo,80,1 minuto


Un análisis descriptivo podría ayudar a visualizar cómo se comportan los datos.

In [3]:
proc sgpanel data = datos;
panelby ejercicio;
vline tiempo / response = pulso group = dieta stat = mean;
title "Comportamiento del pulso por tipo de ejercicio";
run;

proc sgpanel data = datos;
panelby dieta;
vline tiempo / response = pulso group = ejercicio stat = mean;
title "Comportamiento del pulso por tipo de dieta";
run;
title;


proc sgpanel data = datos;
panelby tiempo;
vline dieta / response = pulso group = ejercicio stat = mean;
title "Comportamiento del pulso por tiempo de ejercicio";
run;
title;

Las gráficas señalan una posible interacción entre dieta y tiempo (sobre todo cuando el tipo de ejercicio es correr) y entre el tipo de ejercicio y el tiempo.

## Modelo de simetría compuesta

En este modelo, suponemos que existe una correlación constante en los tres periodos de tiempo, esto es lógico ya que como estamos midiendo la evolución de un mismo individuo, el pulso no es independiente.

El modelo propuesto para un individuo, que tomo la dieta $i$, ejercicio $j$ en el periodo $k$ es el siguiente:

$$y_{ijk} = \mu + D_i + E_j + T_k + DE_{ij}+DT_{ik}+ET_{jk}+DET_{ijk}\epsilon_{ijk}$$

donde $\epsilon_{ijk}\sim N(0,R)$ y 

$$R=\begin{bmatrix}{\sigma^2+\sigma^2_t }&{\sigma^2_t}&{\sigma^2_t}\\{\sigma^2_t}&{\sigma^2+\sigma^2_t}&{\sigma^2_t}\\{\sigma^2_t}&{\sigma^2_t}&{\sigma^2+\sigma^2_t}\end{bmatrix}$$

In [6]:
proc mixed data = datos order = data;
class persona dieta ejercicio tiempo;
model pulso =  dieta|ejercicio|tiempo;
repeated / subject = persona type = cs r rcorr;
store out = mcs;
run;


Información del modelo,Información del modelo.1
Conjunto de datos,WORK.DATOS
Variable dependiente,pulso
Estructura de covarianza,Simetría compuestas
Efecto de asunto,persona
Método de estimación,REML
Método de varianza del residual,Perfil
Método SE de efectos fijos,Basado en el modelo
Método de grados de libertad,Between-Within

Información de nivel de clase,Información de nivel de clase,Información de nivel de clase
Clase,Niveles,Valores
persona,30,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
dieta,2,Baja en grasas Normal
ejercicio,3,Reposo Caminar Correr
tiempo,3,1 minuto 15 minutos 30 minutos

Dimensiones,Dimensiones.1
Parámetros de covarianza,2
Columnas en X,48
Columnas en Z,0
Asuntos,30
Obs máx por Tema,3

Número de observaciones,Número de observaciones.1
Número de observaciones leídas,90
Número de observaciones usadas,90
Número de observaciones no usadas,0

Historia de iteración,Historia de iteración,Historia de iteración,Historia de iteración
Iteración,Evaluaciones,-2 Res Log Like,Criterio
0,1,515.93213166,
1,1,507.65678645,0.0

0
Criterio de convergencia cumplido.

Matriz R estimada para persona 1,Matriz R estimada para persona 1,Matriz R estimada para persona 1,Matriz R estimada para persona 1
Fila,Col1,Col2,Col3
1,50.6778,18.1028,18.1028
2,18.1028,50.6778,18.1028
3,18.1028,18.1028,50.6778

Matriz de correlación R estimada para persona 1,Matriz de correlación R estimada para persona 1,Matriz de correlación R estimada para persona 1,Matriz de correlación R estimada para persona 1
Fila,Col1,Col2,Col3
1,1.0,0.3572,0.3572
2,0.3572,1.0,0.3572
3,0.3572,0.3572,1.0

Estimaciones del parámetro de covarianza,Estimaciones del parámetro de covarianza,Estimaciones del parámetro de covarianza
Parm Cov,Asunto,Estimador
CS,persona,18.1028
Residual,,32.575

Estadísticos de ajuste,Estadísticos de ajuste.1
Verosimilitud -2 Res Log,507.7
AIC (Smaller is Better),511.7
AICC (Smaller is Better),511.8
BIC (Smaller is Better),514.5

Test del ratio de verosimilitud del modelo nulo,Test del ratio de verosimilitud del modelo nulo,Test del ratio de verosimilitud del modelo nulo
DF,Chi-cuadrado,Pr > ChiSq
1,8.28,0.004

Test de tipo 3 de efectos fijos,Test de tipo 3 de efectos fijos,Test de tipo 3 de efectos fijos,Test de tipo 3 de efectos fijos,Test de tipo 3 de efectos fijos
Efecto,Num DF,Den DF,F-Valor,Pr > F
dieta,1,24,14.52,0.0008
ejercicio,2,24,47.92,<.0001
dieta*ejercicio,2,24,4.69,0.0190
tiempo,2,48,31.72,<.0001
dieta*tiempo,2,48,2.96,0.0614
ejercicio*tiempo,4,48,20.9,<.0001
dieta*ejercic*tiempo,4,48,4.71,0.0028


El procedimiento `proc mixed` realiza el análisis de medidas repetidas, se especifican los datos con la opción `data = datos` y le pedimos que ordene las categorías como aparecen en los datos con la opción  `order = data`.

Con `class persona dieta ejercicio tiempo;` se definen las variables categóricas en el modelo, esto es importante porque SAS construye las matrices diseño que usará en los modelos.

En la sentencia `model` se especifica que `pulso` es la variable respuesta, después del signo igual se especifican los efectos. La barra `|` indica todas las interacción entre los efectos efectos incluyendo los efectos principales.

Para especificar que es un modelo de medidas repetidas, usamos la sentencia `repeated` seguido de una barra inclinada. Indicamos con `subject = persona` que  a quien se le mide a través del tiempo es a la persona y finalmente le indicamos que el tipo de estructura de covarianza es la de simetría compuesta (compound symmetry) `type = cs` Para ver la matriz de correlación del pulso a través del tiempo para el individuo 1 usamos `rcorr` y `r` par ver su matriz de varianza covarianza.

Podemos guarda el modelo con la sentencia `store` lo nombraremos con `out = mcs`.

In [14]:
proc plm restore = mcs;
effectplot interaction(PLOTBY=dieta);
slice dieta*ejercicio*tiempo / sliceby (dieta ejercicio) pdiff=control("Normal" "Reposo" "1 minuto");
run;


Información de almacén,Información de almacén.1
Almacén del elemento,WORK.MCS
Conjunto de datos creado de,WORK.DATOS
Creado por,PROC MIXED
Fecha de creación,27NOV19:22:29:27
Variable de respuesta,pulso
Distribución,Normal
Variables de clase,persona dieta ejercicio tiempo
Efectos del modelo,Intercept dieta ejercicio dieta*ejercicio tiempo dieta*tiempo ejercicio*tiempo dieta*ejercic*tiempo

Información de nivel de clase,Información de nivel de clase,Información de nivel de clase
Clase,Niveles,Valores
persona,30,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
dieta,2,Baja en grasas Normal
ejercicio,3,Reposo Caminar Correr
tiempo,3,1 minuto 15 minutos 30 minutos

Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados
Capa,Num DF,Den DF,F-Valor,Pr > F
dieta Baja en grasas,8,48,6.68,<.0001

Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados
Capa,Tipo de ejercicio,Intervalo de tiempo,Tipo de ejercicio.1,Intervalo de tiempo.1,Estimador,Error estándar,DF,Valor t,Pr > |t|
dieta Baja en grasas,Reposo,15 minutos,Reposo,1 minuto,1.0,3.6097,48,0.28,0.7829
dieta Baja en grasas,Reposo,30 minutos,Reposo,1 minuto,1.2,3.6097,48,0.33,0.7410
dieta Baja en grasas,Caminar,1 minuto,Reposo,1 minuto,2.0,4.5023,48,0.44,0.6589
dieta Baja en grasas,Caminar,15 minutos,Reposo,1 minuto,6.0,4.5023,48,1.33,0.1889
dieta Baja en grasas,Caminar,30 minutos,Reposo,1 minuto,6.6,4.5023,48,1.47,0.1492
dieta Baja en grasas,Correr,1 minuto,Reposo,1 minuto,5.4,4.5023,48,1.2,0.2363
dieta Baja en grasas,Correr,15 minutos,Reposo,1 minuto,21.2,4.5023,48,4.71,<.0001
dieta Baja en grasas,Correr,30 minutos,Reposo,1 minuto,22.8,4.5023,48,5.06,<.0001

Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados
Capa,Num DF,Den DF,F-Valor,Pr > F
dieta Normal,8,48,27.95,<.0001

Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados
Capa,Tipo de ejercicio,Intervalo de tiempo,Tipo de ejercicio.1,Intervalo de tiempo.1,Estimador,Error estándar,DF,Valor t,Pr > |t|
dieta Normal,Reposo,15 minutos,Reposo,1 minuto,0.4,3.6097,48,0.11,0.9122
dieta Normal,Reposo,30 minutos,Reposo,1 minuto,1.2,3.6097,48,0.33,0.7410
dieta Normal,Caminar,1 minuto,Reposo,1 minuto,3.8,4.5023,48,0.84,0.4029
dieta Normal,Caminar,15 minutos,Reposo,1 minuto,6.8,4.5023,48,1.51,0.1375
dieta Normal,Caminar,30 minutos,Reposo,1 minuto,4.8,4.5023,48,1.07,0.2917
dieta Normal,Correr,1 minuto,Reposo,1 minuto,6.4,4.5023,48,1.42,0.1616
dieta Normal,Correr,15 minutos,Reposo,1 minuto,32.6,4.5023,48,7.24,<.0001
dieta Normal,Correr,30 minutos,Reposo,1 minuto,48.8,4.5023,48,10.84,<.0001

Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados
Capa,Num DF,Den DF,F-Valor,Pr > F
ejercicio Reposo,5,48,0.2,0.9594

Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados
Capa,Tipo de dieta,Intervalo de tiempo,Tipo de dieta.1,Intervalo de tiempo.1,Estimador,Error estándar,DF,Valor t,Pr > |t|
ejercicio Reposo,Baja en grasas,1 minuto,Normal,1 minuto,-3.2,4.5023,48,-0.71,0.4807
ejercicio Reposo,Baja en grasas,15 minutos,Normal,1 minuto,-2.2,4.5023,48,-0.49,0.6273
ejercicio Reposo,Baja en grasas,30 minutos,Normal,1 minuto,-2.0,4.5023,48,-0.44,0.6589
ejercicio Reposo,Normal,15 minutos,Normal,1 minuto,0.4,3.6097,48,0.11,0.9122
ejercicio Reposo,Normal,30 minutos,Normal,1 minuto,1.2,3.6097,48,0.33,0.741

Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados
Capa,Num DF,Den DF,F-Valor,Pr > F
ejercicio Caminar,5,48,0.73,0.6011

Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados
Capa,Tipo de dieta,Intervalo de tiempo,Tipo de dieta.1,Intervalo de tiempo.1,Estimador,Error estándar,DF,Valor t,Pr > |t|
ejercicio Caminar,Baja en grasas,1 minuto,Normal,1 minuto,-5.0,4.5023,48,-1.11,0.2723
ejercicio Caminar,Baja en grasas,15 minutos,Normal,1 minuto,-1.0,4.5023,48,-0.22,0.8252
ejercicio Caminar,Baja en grasas,30 minutos,Normal,1 minuto,-0.4,4.5023,48,-0.09,0.9296
ejercicio Caminar,Normal,15 minutos,Normal,1 minuto,3.0,3.6097,48,0.83,0.41
ejercicio Caminar,Normal,30 minutos,Normal,1 minuto,1.0,3.6097,48,0.28,0.7829

Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados,Test F para dieta*ejercic*tiempo capa de medias de mínimos cuadrados
Capa,Num DF,Den DF,F-Valor,Pr > F
ejercicio Correr,5,48,38.2,<.0001

Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados,Diferencias simples de dieta*ejercic*tiempo medias de mínimos cuadrados
Capa,Tipo de dieta,Intervalo de tiempo,Tipo de dieta.1,Intervalo de tiempo.1,Estimador,Error estándar,DF,Valor t,Pr > |t|
ejercicio Correr,Baja en grasas,1 minuto,Normal,1 minuto,-4.2,4.5023,48,-0.93,0.3556
ejercicio Correr,Baja en grasas,15 minutos,Normal,1 minuto,11.6,4.5023,48,2.58,0.0131
ejercicio Correr,Baja en grasas,30 minutos,Normal,1 minuto,13.2,4.5023,48,2.93,0.0051
ejercicio Correr,Normal,15 minutos,Normal,1 minuto,26.2,3.6097,48,7.26,<.0001
ejercicio Correr,Normal,30 minutos,Normal,1 minuto,42.4,3.6097,48,11.75,<.0001
