### Configuração Inicial

In [None]:
import pandas as pd

### Média, Variância e Desvio-padrão

In [None]:
x = pd.Series([100,110,100,115,120])

In [None]:
x

0    100
1    110
2    100
3    115
4    120
dtype: int64

#### <p align='center'> A **média** (mean) de $x$ é dada por:</p>

$$ \bar{x} = \frac{1}{n} \sum_i{x_i} $$

In [None]:
#media = (100 + 110 + 100 + 115 + 120) / 5
media_x = x.sum() / 5
media_x

109.0

#### <p align=center>A **variância** de $x$ é dada por:</p>

$$ var = \frac{\sum_i{( x_i - \bar{x} )^2}}{n-1} $$

In [None]:
variancia_x = ((x - media_x)**2).sum()/4
variancia_x

80.0

#### <p align=center>O **desvio-padrão** (*standard deviation*) de $x$ é dado por:</p>


$$ std =\sqrt \frac{\sum_i{( x_i - \bar{x} )^2}}{n-1} = \sqrt{var} $$

In [None]:
desvio_padrao_x = variancia_x**0.5
desvio_padrao_x

8.94427190999916

### Covariância e Correlação

In [None]:
y = pd.Series([100,90,100,105,115])
y

0    100
1     90
2    100
3    105
4    115
dtype: int64

In [None]:
media_y = y.sum() / 5
media_y

102.0

In [None]:
variancia_y = ((y - media_y)**2).sum()/4
variancia_y

82.5

In [None]:
desvio_padrao_y = variancia_y**0.5
desvio_padrao_y

9.082951062292475

#### <p align=center> A **covariância** entre $x$ e $y$ é dada por:</p>

$$\sigma_{xy} = \frac{\sum_i{(x_i- \bar{x})(y_i-\bar{y})}}{n-1}$$

In [None]:
covariancia_xy = ((x - media_x)*(y - media_y)).sum() / 4
covariancia_xy

46.25

#### <p align=center>A **correlação** entre $x$ e $y$ é dada por:</p>

$$\rho_{xy} = \frac{\sigma_{xy}}{\sigma_{x}.\sigma_{y}}  $$

In [None]:
correlacao_xy = covariancia_xy / (desvio_padrao_x*desvio_padrao_y)
correlacao_xy

0.5692981457794138

### Usando funções embutidas no Pandas

In [None]:
# Criando um DataFrame com x e y
xy = pd.concat([x,y], axis=1, keys=['x','y'] )
xy

Unnamed: 0,x,y
0,100,100
1,110,90
2,100,100
3,115,105
4,120,115


In [None]:
# média
xy.mean()

x    109.0
y    102.0
dtype: float64

In [None]:
# variância
xy.var()

x    80.0
y    82.5
dtype: float64

In [None]:
# desvio-padrão
xy.std()

x    8.944272
y    9.082951
dtype: float64

In [None]:
# covariância
xy.cov()

Unnamed: 0,x,y
x,80.0,46.25
y,46.25,82.5


In [None]:
# correlação
xy.corr()

Unnamed: 0,x,y
x,1.0,0.569298
y,0.569298,1.0
