---

# <center>Medidas de Dispersão</center>

---

## Introdução  🦄

<p style="font-family: 	Times New Roman; font-size: 16px;">O resumo de um conjunto de dados por uma úica medida representativa de posição central esconde toda a informação sobre a variabilidade do conjunto de observações. Para obtermos informações sobre a variabilidade dos dados, utilizamos outras medidas estatísticas chamadas de medidas de dispersão.</p>

<p style="font-family: 	Times New Roman; font-size: 16px;">As medidas de dispersão são medidas estatísticas que tentam quantificar a dispersão dos dados em relação a sua média ou mediana. As medidas de dispersão são: <i>desvio médio</i> ou <i>desvio médio absoluto</i>, <i>variância</i>, <i>desvio padrão</i> e <i>coeficiente de variação</i> ou <i>desvio padrão relativo</i>.</p>

<strong>Algumas observações em relação aos símbolos utilizados neste caderno:</strong>

- $\sigma^2$ ↦ População (Variância)

- $S^2$ ↦ Amostra (Variância)

- $\sigma$ ↦ População (Desvio Padrão)

- $S$ ↦ Amostra (Desvio Padrão)

## Desvio Médio ou Desvio Médio Absoluto 🪳

<p style="font-family: 	Times New Roman; font-size: 16px;">Em estatística, o desvio médio absoluto ou apenas desvio médio dos elementos de um conjunto de dados é a diferença absoluta entre os elementos do conjunto e o ponto do qual o desvio é medido, mais frequentemente a mediana ou algumas vezes a média.</p>

### $$dm(X) = \frac{\sum_{i=1}^n|x_i - \bar{x}|}{n}$$

In [3]:
# Pacotes utilizados
import numpy as np

In [5]:
# Conjunto de dados
grupo1 = np.array([3.0, 8.1, 9.0, 1.1, 12.8, 2.9])
grupo2 = np.array([1.0, 2.0, 3.2, 4.4, 12.3, 88.2])
grupo3 = np.array([2.2, 3.2, 4.2, 4.1, 7.7, 12.2])

In [13]:
def desvio_medio(g1, g2, g3):
    
    # Calculando o desvio médio absoluto dos três grupos
    dvg1 = np.sum(np.abs(g1 - np.mean(g1))) / len(g1)
    dvg2 = np.sum(np.abs(g2 - np.mean(g2))) / len(g2)
    dvg3 = np.sum(np.abs(g3 - np.mean(g3))) / len(g3)
    
    # Imprimindo o desvio médio absoluto dos três grupos
    print(f"Desvio Médio do Grupo 1: {dvg1:.2f}")
    print(f"Desvio Médio do Grupo 2: {dvg2:.2f}")
    print(f"Desvio Médio do Grupo 3: {dvg3:.2f}")
    
# Chamando a função desvio_medio()
desvio_medio(grupo1, grupo2, grupo3)

Desvio Médio do Grupo 1: 3.82
Desvio Médio do Grupo 2: 23.23
Desvio Médio do Grupo 3: 2.90


## Variância 🐞

<p style="font-family: 	Times New Roman; font-size: 16px;">A variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando "o quão longe" em geral os seus valores se encontram do valor esperado.</p>

### $$\sigma^2 = \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n}$$

<p style="font-family: 	Times New Roman; font-size: 16px;">Uma maneira computacionalmente mais eficiente de calcular a variância é:</p>

### $$\sigma^2 = \frac{\sum_{i=1}^nX_i^2}{n} - \bar{x}^2$$

In [15]:
# Calculando as variâncias dos três grupos criados acima
print(f"A variância do grupo 1: {grupo1.var():.2f}")
print(f"A variância do grupo 2: {grupo2.var():.2f}")
print(f"A variância do grupo 3: {grupo3.var():.2f}")

A variância do grupo 1: 17.02
A variância do grupo 2: 984.65
A variância do grupo 3: 11.58


## Desvio Padrão  🐜

<p style="font-family: 	Times New Roman; font-size: 16px;">O desvio padrão é uma medida de dispersão em torno da média de uma variável aleatória.</p>

### $$\sigma = \sqrt{\frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n}}$$

In [16]:
# Calculando o desvio padrão dos três grupos criados acima
print(f"A variância do grupo 1: {grupo1.std():.2f}")
print(f"A variância do grupo 2: {grupo2.std():.2f}")
print(f"A variância do grupo 3: {grupo3.std():.2f}")

A variância do grupo 1: 4.13
A variância do grupo 2: 31.38
A variância do grupo 3: 3.40


## Coeficiente de Variação  🪰

<p style="font-family: 	Times New Roman; font-size: 16px;">O coeficiente de variação, também conhecido como desvio padrão relativo, é uma medida padronizada de dispersão de uma distribuição de probabilidade ou de uma distribuição de frequências.</p>

### $$C_v = \frac{\sigma}{\bar{x}} * 100$$