## 3 Medidas de tendência de posição central
As medidas de posição são valores que representam a tendência de concentração dos dados observados. Esse valor pode ser calculado levando em conta todos os valores do conjunto ou apenas uma parte. 

Em alguns casos, as medidas de posição central também podem ser usadas para completar dados faltantes.

As três medidas de tendência de posição central mais utilizadas são: média aritmética, moda e mediana.

### 3.1 Import

In [None]:
import pandas as pd
from scipy import stats

### 3.2 Carregando o dataset

In [None]:
meu_data_frame = pd.read_csv("../data/cereal.csv")

### 3.3 Média aritimética simples

A média aritmética simples é a soma dos valores observados dividida pelo número desses
valores.

<img src="imgs/mean.png" width=30% />

In [None]:
caloria_media = meu_data_frame["calories"].sum() / len(meu_data_frame["calories"])
print(caloria_media)

In [None]:
#use os métodos nativos
caloria_media = meu_data_frame["calories"].mean()
print(caloria_media)

### 3.4 Mediana

Para calculá-la, primeiramente temos de reorganizar os dados em ordem crescente (ou decrescente) e, em seguida, escolher o valor central. Se o número de dados for ímpar, então este valor central é único; se for
par, fazemos a média dos dois valores centrais.

In [None]:
caloria_mediana = meu_data_frame["calories"].median()
print(caloria_mediana)

### 3.5 Moda

A moda é o valor que ocorre com maior frequência em um dado conjunto de dados. Se
todos os valores aparecem um número igual de vezes (em geral, uma vez cada), dizemos
que o conunto de dados não têm moda.

In [None]:
caloria_moda = meu_data_frame["calories"].mode()
print(caloria_moda)

### 3.6 Media geométrica

As médias geométricas são bastante empregadas para observações positivas referentes a
crescimentos exponenciais (como taxas de avanço de doenças, números de habitantes de
regiões em colonização, crescimento de produtividade, e etc . . . ) [Stevenson and De Farias 1981].
A média geometrica (G) é a raiz n-ésima do produto dos n valores de um conjunto de dados
(x1;x2; : : : ;xn), conforme definido na seguinte equação:

<img src="imgs/gmean.png" width=30% />

In [None]:
caloria_media_geometrica =  stats.gmean(meu_data_frame["calories"], axis=0)
print(caloria_media_geometrica)

### 3.7 Média harmónica

Para fenômenos que dependem fortemente do menor dos dados, em geral, utiliza-se médias
harmônicas calculadas como o inverso da média dos inversos de um conjunto de
dados (x1;x2; : : : ;xn), definida conforme a equação:

<img src="imgs/hmean.png" width=30% />

In [None]:
caloria_media_geometrica =  stats.hmean(meu_data_frame["calories"], axis=0)
print(caloria_media_geometrica)