# Análisis

+ Lo primero es revisar los paquetes que vamos a utilizar, para esto voy a utilizar dos paquetes:
    - El primero es Statsmodels que es específicamente de python
    - LMER4 que es un paquete nativo de R CRAN, sin embargo gracias a la funcionalidad de python se puede utilizar un ambiente de R en python scripting.

In [1]:
import numpy as np
import pandas as pd
import statsmodels.api as sm
import statsmodels.formula.api as smf
import plotly.express as px

Ahora vamos a cargar los datos utilizando una set de datos que pertenece al curso de Aplicación de Experimentos. El dataset consiste en mediciones de una máquina que mide niveles de triglicéridos en un periodo de 4 días en 4 máquinas. Se toman dos mediciones por máquina por día. Para este ejemplo, vamos a tomar las máquinas como efectos *fijos* mientras que el día es nuestro componente *aleatorio*

In [12]:
data = pd.read_csv('base.csv')

In [13]:
data.head()

Unnamed: 0,lote,prod
0,A,1545
1,A,1440
2,A,1440
3,A,1520
4,A,1580


In [14]:
px.scatter(data, y = "prod", x = "lote")

Podemos realizar un gráfico sencillo para observar la variabilidad intra-sujeto e inter-sujeto. 

De acuerdo a la documentación de statsmodels, el modelo Lineal Mixto es el siguiente:

$$y_{ij} = \beta_0 + \beta_1X_{ij} + \delta_{1i} X_{ij} + \epsilon_{ij}$$

In [16]:

data['lote'] = data['lote'].astype('category')

In [17]:
data.dtypes

lote    category
prod       int64
dtype: object

In [22]:
md = smf.mixedlm("prod ~ 1", data, groups = data["lote"])

In [23]:
mdf = md.fit()

print(mdf.summary())

          Mixed Linear Model Regression Results
Model:             MixedLM  Dependent Variable:  prod     
No. Observations:  30       Method:              REML     
No. Groups:        6        Scale:               2451.2239
Min. group size:   5        Log-Likelihood:      -159.8271
Max. group size:   5        Converged:           Yes      
Mean group size:   5.0                                    
----------------------------------------------------------
           Coef.   Std.Err.   z    P>|z|  [0.025   0.975] 
----------------------------------------------------------
Intercept 1527.500   19.384 78.802 0.000 1489.508 1565.492
Group Var 1764.171   31.658                               



In [24]:
maquinas = pd.read_csv("maquinas.csv")

In [41]:
md1 = smf.mixedlm("nvl ~ maquina*dia", maquinas, groups = ["dia"])

In [38]:
mdf1 = md1.fit()

print(mdf1.summary())


            Mixed Linear Model Regression Results
Model:                MixedLM   Dependent Variable:   nvl     
No. Observations:     32        Method:               REML    
No. Groups:           4         Scale:                40.8930 
Min. group size:      8         Log-Likelihood:       -89.8779
Max. group size:      8         Converged:            Yes     
Mean group size:      8.0                                     
--------------------------------------------------------------
                  Coef.  Std.Err.   z    P>|z|  [0.025  0.975]
--------------------------------------------------------------
Intercept        137.600   10.911 12.611 0.000 116.215 158.985
maquina[T.B]       7.600    7.832  0.970 0.332  -7.750  22.950
maquina[T.C]      -0.375    7.832 -0.048 0.962 -15.725  14.975
maquina[T.D]     -20.725    7.832 -2.646 0.008 -36.075  -5.375
dia                3.760    3.984  0.944 0.345  -4.049  11.569
maquina[T.B]:dia  -2.320    2.860 -0.811 0.417  -7.925   3.285
maqui