# Vector de medias y matriz de varianzas

<img src="https://raw.githubusercontent.com/fhernanb/fhernanb.github.io/master/my_docs/logo_unal_color.png" alt="drawing" width="200"/>

In [1]:
import pandas as pd
import numpy as np

## 1. Usando un dataframe

Vamos a crear un dataframe y luego vamos a obtener el vector de medias y la matriz de varianzas

In [2]:
dt1 = {'x1': [6, 10, 8], 
       'x2': [9, 6, 3]}
dt1 = pd.DataFrame(data=dt1)
dt1

Unnamed: 0,x1,x2
0,6,9
1,10,6
2,8,3


In [3]:
dt1.shape # Para ver la dimensión del los datos

(3, 2)

El vector de medias se obtiene así:

In [4]:
x_barra = dt1.mean()                      # Para obtener el vector de medias
x_barra = np.matrix(x_barra).transpose()  # Para convertir a matriz columna
print(x_barra)                            # Para ver el contenido
print(x_barra.shape)                      # Para ver la dimensión (shape)

[[8.]
 [6.]]
(2, 1)


La matriz de varianzas se obtiene así:

In [5]:
S = dt1.cov()    # Para obtener la matriz
print(S)         # Para ver el contenido
print(S.shape)   # Para ver la dimensión (shape)

     x1   x2
x1  4.0 -3.0
x2 -3.0  9.0
(2, 2)


Ya podemos hacer operaciones con ellos. Por ejemplo, si queremos calcular $\bar{\textbf{x}}^T \textbf{S}^{-1}$ hacemos lo siguiente:

In [6]:
np.matmul(x_barra.T, S)

Unnamed: 0,x1,x2
0,14.0,30.0


## 2. Usando un arreglo numpy para los datos

Vamos a utilizar los mismos datos pero construyendo un arreglo.

In [7]:
dt2 = np.array([[6, 9], 
                [10, 6],
                [8, 3]])
dt2

array([[ 6,  9],
       [10,  6],
       [ 8,  3]])

In [8]:
dt2.shape # Para ver la dimensión del los datos

(3, 2)

El vector de medias se obtiene así:

In [9]:
x_barra = np.mean(dt2, axis=0)   # Para obtener el vector de medias
x_barra = np.matrix(x_barra).T   # Para convertir a matriz columna
print(x_barra)                   # Para ver el contenido
print(x_barra.shape)             # Para ver la dimensión (shape)

[[8.]
 [6.]]
(2, 1)


La matriz de varianzas se obtiene así:

In [10]:
S = np.cov(dt2.T) # Para obtener la matriz
print(S)          # Para ver el contenido
print(S.shape)    # Para ver la dimensión (shape)

[[ 4. -3.]
 [-3.  9.]]
(2, 2)


Ya podemos hacer operaciones con ellos. Por ejemplo, si queremos calcular $\bar{\textbf{x}}^T \textbf{S}^{-1}$ hacemos lo siguiente:

In [11]:
np.matmul(x_barra.T, S)

matrix([[14., 30.]])

<div class="alert alert-danger">
  Cuando ingrese los datos como un dataframe de pandas, puede usar los métodos mean y cov. Cuando ingrese los datos como un array de nympy, puede usar las funciones np.mean y np.cov.
</div>