# Medidas de Posição e Dispersão.

## **Estatística Descritiva**

A Estatística Descritiva é o ramo da estatística que se ocupa em coletar, organizar, resumir e apresentar dados de forma significativa. Seu objetivo principal é descrever as características de um conjunto de dados por meio de tabelas, gráficos e medidas numéricas, facilitando a compreensão e a análise inicial dos fenômenos estudados. Ela não tira conclusões sobre a população, mas sim organiza e sumariza as informações existentes.

## **Base dados**

In [11]:
import numpy as np
import math
import statistics
from scipy import stats

In [5]:
data = np.array([150, 151, 152, 152, 153, 154, 155, 155, 155, 155, 156, 156, 156,
                  157, 158, 158, 160, 160, 160, 160, 160, 161, 161, 161, 161, 162,
                  163, 163, 164, 164, 164, 165, 166, 167, 168, 168, 169, 170, 172,
                  173])

## **Dados Não Agrupados**

### Média, Mediana e Moda

Estas são as medidas de tendência central mais comuns, que buscam representar o valor 'típico' ou central de um conjunto de dados:

*   **Média:** É a soma de todos os valores de um conjunto de dados dividida pelo número total de valores. É a medida mais utilizada, mas é sensível a valores extremos (outliers).

$$
\bar{X} = \frac{\sum_{}x_i}{n}
$$

*   **Mediana:** É o valor central de um conjunto de dados quando os dados estão ordenados em ordem crescente ou decrescente. Se o número de dados for ímpar, é o valor do meio. Se for par, é a média dos dois valores centrais. É menos afetada por outliers que a média.
    * Quando é par
$$
\text{Mediana} = x_{\left(\frac{n+1}{2}\right)}
$$
    * Quando é impar:
    $$
      \text{Mediana} = \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}
    $$



*   **Moda:** É o valor que mais aparece em um conjunto de dados. Um conjunto de dados pode ter uma moda (unimodal), várias modas (multimodal) ou nenhuma moda.

#### Média aritmética simples

In [35]:
data.sum() / len(data)

np.float64(160.375)

In [36]:
data.mean()

np.float64(160.375)

In [37]:
statistics.mean(data)

np.int64(160)

#### Moda

In [14]:
statistics.mode(data)

np.int64(160)

In [15]:
stats.mode(data)

ModeResult(mode=np.int64(160), count=np.int64(5))

#### Mediana

In [23]:
# Odd (Impar)
odd_data = [150, 151, 152, 152, 153, 154, 155, 155, 155]
position = len(odd_data) / 2
position

4.5

In [24]:
odd_position = math.ceil(position)
odd_position

5

In [25]:
value = odd_data[odd_position - 1]
value

153

In [26]:
# Even (Par)
even_position = len(data) // 2
even_position

20

In [27]:
data[even_position - 1], data[even_position]

(np.int64(160), np.int64(160))

In [28]:
median = (data[even_position - 1] + data[even_position]) / 2
median

np.float64(160.0)

In [34]:
# Using library
print(f"numpy.median: {np.median(data)}")
print(f"statistics.median odd: {statistics.median(odd_data)}")
print(f"statistics.median even: {statistics.median(data)}")

numpy.median: 160.0
statistics.median odd: 153
statistics.median even: 160.0


### Média Aritmética Ponderada



A **Média Aritmética Ponderada** é um tipo de média que atribui diferentes pesos a cada valor em um conjunto de dados, refletindo a importância relativa de cada valor. É calculada multiplicando cada valor pelo seu peso correspondente, somando esses produtos e, em seguida, dividindo essa soma pela soma de todos os pesos.

É amplamente utilizada em situações onde nem todos os dados têm a mesma relevância, como no cálculo de notas em que diferentes avaliações têm pesos distintos ou na média de preços de produtos com diferentes volumes de venda.

$$ \bar{X}_w = \frac{\sum_{i=1}^{n} (x_i \cdot w_i)}{\sum_{i=1}^{n} w_i} $$

Onde:
*   $\bar{X}_w$ é a média aritmética ponderada.
*   $x_i$ é o i-ésimo valor do conjunto de dados.
*   $w_i$ é o peso atribuído ao i-ésésimo valor.
*   $n$ é o número total de valores.

In [47]:
# manual
score = np.array([9,8,7,3])
weight = np.array([1,2,3,4])

In [44]:
weighted_average = (score * weight).sum() / weight.sum()
weighted_average

np.float64(5.8)

In [48]:
# Numpy
np.average(score, weights=weight)

np.float64(5.8)

## **Dados Agrupados**