# Estatísticas com NumPy (mean, sum, std, etc.)

**Explicação teórica simples**

O NumPy possui diversas funções estatísticas prontas para analisar dados rapidamente — sem precisar de bibliotecas externas.
Essas funções são úteis para entender tendências, variações e médias em conjuntos numéricos.

As mais usadas são:

* `np.mean()` → média
* `np.median()` → mediana
* `np.std()` → desvio padrão (variação)
* `np.var()` → variância
* `np.min()` e `np.max()` → valores mínimo e máximo
* `np.sum()` → soma total

In [1]:
import numpy as np

# Conjunto de notas de alunos
notas = np.array([7.5, 8.2, 6.8, 9.0, 7.9, 8.5, 6.7])

print("Média:", np.mean(notas))
print("Mediana:", np.median(notas))
print("Desvio padrão:", np.std(notas))
print("Valor mínimo:", np.min(notas))
print("Valor máximo:", np.max(notas))
print("Soma total:", np.sum(notas))


Média: 7.8
Mediana: 7.9
Desvio padrão: 0.7928249671720918
Valor mínimo: 6.7
Valor máximo: 9.0
Soma total: 54.6


**Explicação rápida:**

* `mean()` → soma todos os valores e divide pela quantidade.

* `median()` → retorna o valor central da distribuição.

* `std()` → mostra quanto os dados se afastam da média (quanto mais alto, mais variáveis).

* `min()` / `max()` → localizam extremos.

* `sum()` → soma geral dos dados.

**Exemplo do mundo real**

Um analista quer entender o desempenho médio de vendas de uma loja durante a semana:

In [2]:
vendas = np.array([250, 300, 280, 310, 260, 295, 320])
print("Média de vendas:", np.mean(vendas))
print("Maior venda:", np.max(vendas))
print("Menor venda:", np.min(vendas))
print("Desvio padrão:", np.std(vendas))

Média de vendas: 287.85714285714283
Maior venda: 320
Menor venda: 250
Desvio padrão: 23.88321928185784


# Exercícios

**Fácil**

Crie um array com `[10, 20, 30, 40, 50]` e mostre:

* A média, o valor máximo e o valor mínimo.

In [4]:
arr = np.array([10, 20, 30, 40, 50])
print("Média: ", np.mean(arr))
print("Máximo: ", np.max(arr))
print("Mínimo: ", np.min(arr))

Média:  30.0
Máximo:  50
Mínimo:  10


**Intermediário**

Crie um array com as temperaturas médias da semana `[22, 25, 20, 27, 26, 23, 24]` e calcule:

* Média, mediana e desvio padrão.

In [5]:
temperaturas = np.array([22, 25, 20, 27, 26, 23, 24])
print("Temperatura média da semana: ", np.mean(temperaturas))
print("Mediana: ", np.median(temperaturas))
print("Desvio padrão: ", np.std(temperaturas))

Temperatura média da semana:  23.857142857142858
Mediana:  24.0
Desvio padrão:  2.2314999074019015


**Desafio**

Um conjunto de salários em reais:

`salarios = np.array([2500, 3200, 4000, 2700, 5000, 3800, 2900])`

1. Calcule a média, mediana e desvio padrão.
2. Descubra quanto cada salário se distancia da média (salarios - np.mean(salarios)).
3. Mostre os salários acima da média.

In [8]:
salarios = np.array([2500, 3200, 4000, 2700, 5000, 3800, 2900])

media = np.mean(salarios)
mediana = np.median(salarios)
variacao = np.std(salarios)
distancia_media = salarios - media 
filtro_acima_media = salarios > media

print(f"Media salárial: R${media:.2f}")
print(f"Mediana salárial: R${mediana:.2f}")
print(f"Desvio Padrão: R${variacao:.2f}")
print(f"\nDistancia de cada salário em relação a média:\n{distancia_media}")
print(f"\nSalários acima da média:\n{salarios[filtro_acima_media]}")

Media salárial: R$3442.86
Mediana salárial: R$3200.00
Desvio Padrão: R$815.66

Distancia de cada salário em relação a média:
[-942.85714286 -242.85714286  557.14285714 -742.85714286 1557.14285714
  357.14285714 -542.85714286]

Salários acima da média:
[4000 5000 3800]
