# Ejemplo 5.3.2 de Díaz y Morales (2015)
<img src="https://raw.githubusercontent.com/fhernanb/fhernanb.github.io/master/my_docs/logo_unal_color.png" alt="drawing" width="200"/>

En este ejemplo se desea estudiar el siguiente conjunto de hipótesis usando un nivel de significancia de 0.05.

$H_0: \boldsymbol{\Sigma}_1 = \boldsymbol{\Sigma}_2 = \boldsymbol{\Sigma}_3 $

$H_A$: al menos una de las matrices es diferente de las otras.

Las matrices muestrales son

\begin{equation}
\mathbf{S}_1 = 
\begin{pmatrix}
12.65  & -16.45 \\
-16.45 & 73.04
\end{pmatrix}
\end{equation}

\begin{equation}
\mathbf{S}_2 = 
\begin{pmatrix}
11.44 & -27.77 \\
-27.77 & 100.64
\end{pmatrix}
\end{equation}

\begin{equation}
\mathbf{S}_3 = 
\begin{pmatrix}
14.46 & -31.26 \\
-31.26 & 101.03
\end{pmatrix}
\end{equation}

con $n_1=26$, $n_2=23$ y $n_3=25$ sujetos por cada grupo.

In [1]:
import numpy as np
import scipy.stats

A continuación los datos del ejemplo

In [2]:
S1 = np.matrix([[12.65, -16.45],
                [-16.45, 73.04]])

S2 = np.matrix([[11.44, -27.77],
                [-27.77, 100.64]])

S3 = np.matrix([[14.46, -31.26],
                [-31.26, 101.03]])

for i in [1, 2, 3]:
    print("Esta es la matriz S" + str(i))
    print(eval("S" + str(i)))
    print("\n")

n1 = 26
n2 = 23
n3 = 25

g = 3   # número de grupos o sigmas
p = 2   # número de variables

Esta es la matriz S1
[[ 12.65 -16.45]
 [-16.45  73.04]]


Esta es la matriz S2
[[ 11.44 -27.77]
 [-27.77 100.64]]


Esta es la matriz S3
[[ 14.46 -31.26]
 [-31.26 101.03]]




## Prueba de Mardia (1979) página 140

El estadístico está dado por

$$
\varphi  = - 2 \rho \log(\lambda)
$$

Cuando $H_0$ es verdadera, $\varphi \sim \chi^2_{p(p+1)(g-1)/2}$.

<img src="ph_varias_sigma_01.png" alt="drawing" width="300"/>

<img src="ph_varias_sigma_02.png" alt="drawing" width="400"/>

In [3]:
v1 = n1 - 1
v2 = n2 - 1
v3 = n3 - 1
v = v1 + v2 + v3

rho = 1 - (2*p**2+3*p-1) * (1/v1+1/v2+1/v3-1/v) / (6*(p+1)*(g-1))
print(rho)

0.9591811898325983


In [4]:
Sp = (1/v) * (v1 * S1 + v2 * S2 + v3 * S3)
print("La matriz Sp es:")
print(Sp)

# Elementos auxiliares para calcular log_lambda
aux0 =  v * np.log(np.linalg.det(Sp))
aux1 = v1 * np.log(np.linalg.det(S1))
aux2 = v2 * np.log(np.linalg.det(S2))
aux3 = v3 * np.log(np.linalg.det(S3))

log_lambda = (aux0 - (aux1 + aux2 + aux3)) / (-2)
print("\n El valor de log_lambda es:")
print(log_lambda)

La matriz Sp es:
[[ 12.88690141 -24.96380282]
 [-24.96380282  91.05352113]]

 El valor de log_lambda es:
-3.4650131022081894


El valor del estadístico $\varphi$ es

In [5]:
phi = -2 * rho * log_lambda
print(phi)

6.647150780323187


Para calcular el valor crítico con un $\alpha=0.05$ hacemos lo siguiente

In [6]:
scipy.stats.chi2.ppf(q=1-0.05, df=p*(p+1)*(g-1)/2)  # Valor crítico

12.591587243743977

<div class="alert alert-success">
  <strong>Resultado</strong> Como el estadístico es $\varphi=6.65$, que es menor que el valor crítico $12.59$, entonces no hay evidencias suficientes para rechazar $H_0: \boldsymbol{\Sigma}_1 = \boldsymbol{\Sigma}_2 = \boldsymbol{\Sigma}_3 $.
</div>