# 2. Medidas de Posição (ou Têndencia Central)
<hr></hr>

As **medidas de posição** são medidas que resumem os dados, descrevem o centro ou a posição central do conjunto de dados em estudo. As medidas de têndencia central mais comuns são: a **média**, a **mediana** e a **moda**.

## Média

A **média** é um valor que tem por objetivo resumir os nossos dados em um único ponto, ela generaliza os dados. Ela representa o valor "típico" de um conjunto de dados. A média é afetada por valores discrepantes(outliers), logo ela não é adequada em dados que possuem outliers, não será a melhor representação dos centro dos dados.

A fórmula para calcular a média é dada por:


## $\bar{X} = \frac{X_{1} + X_{2} + ... +  X_{n}}{n} = \frac{\sum \limits _{i=1} ^{n} X_{i}}{n} $


In [9]:
# Exemplo: Dado as 3 notas de uma aluno do curso de Estatística que são: 9.5, 10 e 8, calcule a sua média.

# Criando uma função que calcula a média:
def media(valores):
    soma = 0
    n = len(valores)
    
    for i in range(0,n):
        soma += valores[i]
    
    media = soma / n
    
    return media
    
notas = [9.5, 10, 8]
print(media(notas))
    

# Utilizando a biblioteca Pandas:
import pandas as pd

notas = pd.DataFrame(notas, columns=['Notas'])

media_notas = notas['Notas'].mean()
print(media_notas)


9.166666666666666
9.166666666666666


## Mediana

A **mediana** é o valor que separa um conjunto de dados ordenado em duas metades iguais.
Se o número total de valores no conjunto de dados é ímpar, a mediana é o valor do meio. Se o
número total de valores é par, a mediana é a média dos dois valores centrais. A mediana é menos
sensível a valores extremos e pode ser uma medida mais representativa do centro dos dados
quando a distribuição é assimétrica ou contém outliers (valores extremos).

A fórmula para calcular a mediana é dada por:

* Quando n é par:

## $ mediana =  \frac{X_{\frac{n}{2}} + X_{\frac{n}{2}+1}}{2} $ 


* Quando n é ímpar:

## $ mediana = X_{\frac{n+1}{2}}$

In [10]:
# Verificando se n é par ou impar:
def par(n):
    if n% 2 == 0:
        return True
    else:
        return False


# Funcao para calcular a mediana:

def mediana(valores):
    # ordenando os dados
    valores = sorted(valores)
    
    # Tamanho dos dados
    n = len(valores)
    
    if par(n):
        # primeiro indice
        indice_1 = int(n / 2)
        
        # segundo indice
        indice_2 = int((n / 2) + 1)
        
        # primeiro valor
        valor_1 = valores[indice_1 - 1]
        
        # segundo valor
        valor_2 = valores[indice_2 - 1]
        
        # calculando mediana
        mediana = (valor_1 + valor_2) / 2
    
    else:
        #obtendo o indice
        indice = int((n + 1)/2)
        
        # calculando mediana
        mediana = valores[indice - 1]
        
    return mediana

In [14]:
# Exemplo: calcule a mediana de idades que são: 10, 70, 20, 40, 50, 60, 70, 80, 10, 90

idades = [10, 70, 20, 40, 50, 60, 70, 80, 10, 90]
print(mediana(idades))

# Utilizando a biblioteca Pandas:
import pandas as pd
idades = pd.DataFrame(idades, columns=['Idades'])
print(idades['Idades'].median())

55.0
55.0


## Moda

A **moda** é o valor que mais se repete em um conjunto de dados. Quando existe apenas um valor que se repete com frequência dizemos que os dados são unimodais. Entretanto isso não significa que outros valores não se repitam frequentemente, podem haver outros e dizemos que os dados são bimodais, ou trimodais, ou multimodais.

In [17]:
# utilizando o value_counts()
valores = [1, 2, 1, 3, 4, 5, 6, 7, 7, 8]

valores = pd.DataFrame(valores, columns=['Valores'])
valores['Valores'].value_counts()[0:2]

1    2
7    2
Name: Valores, dtype: int64

In [18]:
# utilizando o pandas
valores = [1, 2, 1, 3, 4, 5, 6, 7, 7, 8]

valores = pd.DataFrame(valores, columns=['Valores'])
valores['Valores'].mode()

0    1
1    7
Name: Valores, dtype: int64

In [19]:
# Utilizando funçao

# Função: frequencia
# Parâmetro(s): uma lista de valores.
# Retorno: um dicionário em que cada key é um elemento da lista do parâmetro (não repetido),
# com a frequência de ocorrência na lista como value.
def frequencia(valores):
    # Obter os elementos de valores com a remoção de repetições.
    elementos = list(set(valores))
    
    # Dicionário para armazenar o elemento e a sua respectiva frequencia como value.
    frequencia_valores = {}
    
    # Estrutura para obter a frequencia de cada elemento da lista elementos.
    for elemento in elementos:
        frequencia = 0
        for i in valores:
            if i == elemento:
                frequencia += 1
        frequencia_valores[elemento] = frequencia
    
    return frequencia_valores

In [20]:
# função: moda
# Parâmetro(s): uma lista de valores.
# Retorno: uma lista com os valores da medida moda.
def moda(valores):
    # dicionário com a frequência de cada elemento.
    freq = frequencia(valores)
    # Elementos da lista.
    chaves = list(freq.keys())
    # Elemento que mais se repete.
    max_valor = max(freq.values())
    
    # lista para armazenar os valores de moda.
    moda = []
    
    if max_valor != 1:
        # Estrutura de repetição para obter os valores de moda.
        for chave in chaves:
            elemento = freq[chave]

            if elemento == max_valor:
                moda.append(chave)
            
    return moda

In [21]:
valores = [1, 2, 1, 3, 4, 5, 6, 7, 7, 8]

valores_moda = moda(valores)

print(f'O(s) valor(es) é/são:')

for valor in valores_moda:
    print(valor)

O(s) valor(es) é/são:
1
7


## Referências:

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística Básica. 5ª edição. São Paulo: Editora Saraiva. 2004.