# Responda as perguntas:

- O que é ?
- Para que serve?
- Como fazer?

- Estatística:
	
    - Média
    - Mediana
    - Moda
    - Quartis
    - Desvio Padrão

###### Fonte: Chat GPT

## 1. Média

- O que é?
A média é uma medida de tendência central que representa a soma de um conjunto de valores dividida pelo número total de valores. É frequentemente referida como a média aritmética.

- Para que serve?
Serve para fornecer uma ideia geral do "valor central" de um conjunto de dados. É usada para resumir dados e facilitar comparações entre diferentes conjuntos de dados.

- Como fazer?
Para calcular a média de um conjunto de números, some todos os valores e divida pelo número de valores:

In [None]:
def media(valores):
    return sum(valores) / len(valores)

valores = [10, 20, 30, 40, 50]
media_valores = media(valores)
print(media_valores)

## 2. Mediana

- O que é?
A mediana é o valor que separa um conjunto de dados ordenados ao meio. Se o número de observações for ímpar, é o valor central; se for par, é a média dos dois valores centrais.

- Para que serve?
Serve para identificar o ponto médio de um conjunto de dados, especialmente útil em distribuições assimétricas, pois não é afetada por valores extremos.

- Como fazer?
Para calcular a mediana, ordene os dados e encontre o valor central:

In [None]:
def mediana(valores):
    valores.sort()
    n = len(valores)
    meio = n // 2
    if n % 2 == 0:
        return (valores[meio - 1] + valores[meio]) / 2
    else:
        return valores[meio]

valores = [10, 20, 30, 40, 50]
mediana_valores = mediana(valores)
print(mediana_valores)


## 3. Moda

- O que é?
A moda é o valor que aparece com maior frequência em um conjunto de dados. Pode haver mais de uma moda se múltiplos valores tiverem a mesma frequência máxima.

- Para que serve?
Serve para identificar os valores mais comuns em um conjunto de dados, útil para entender padrões e distribuições.

- Como fazer?
Para encontrar a moda, conte as frequências de cada valor e identifique o(s) valor(es) mais frequente(s):

In [None]:
from collections import Counter

def moda(valores):
    contagem = Counter(valores)
    max_freq = max(contagem.values())
    modas = [k for k, v in contagem.items() if v == max_freq]
    return modas

valores = [10, 20, 20, 30, 40, 50, 50]
moda_valores = moda(valores)
print(moda_valores)

## 4. Quartis

- O que é?
Quartis são valores que dividem um conjunto de dados ordenados em quatro partes iguais. Eles são:

    - Primeiro quartil (Q1): o valor que separa os 25% inferiores dos dados.
    - Segundo quartil (Q2): a mediana.
    - Terceiro quartil (Q3): o valor que separa os 25% superiores dos dados.

- Para que serve?
Servem para fornecer uma visão detalhada da distribuição dos dados, especialmente sobre a dispersão e a presença de outliers.

- Como fazer?
Para calcular os quartis, ordene os dados e determine os valores que correspondem às posições de 25%, 50% e 75%:

In [None]:
import numpy as np

def quartis(valores):
    valores.sort()
    Q1 = np.percentile(valores, 25)
    Q2 = np.percentile(valores, 50)
    Q3 = np.percentile(valores, 75)
    return Q1, Q2, Q3

valores = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
quartis_valores = quartis(valores)
print(quartis_valores)

## 5. Desvio Padrão

- O que é?
O desvio padrão é uma medida de dispersão que indica o quanto os valores de um conjunto de dados se desviam, em média, da média do conjunto de dados.

- Para que serve?
Serve para quantificar a quantidade de variação ou dispersão dos dados, ajudando a entender a consistência e a variabilidade dos dados em relação à média.

- Como fazer?
Para calcular o desvio padrão, encontre a média, calcule a diferença de cada valor em relação à média, eleve ao quadrado, some esses valores, divida pelo número de observações (para a população) ou pelo número de observações menos um (para a amostra), e tire a raiz quadrada do resultado:

In [None]:
import math

def desvio_padrao(valores):
    media_valores = sum(valores) / len(valores)
    variancia = sum((x - media_valores) ** 2 for x in valores) / len(valores)
    return math.sqrt(variancia)

valores = [10, 20, 30, 40, 50]
desvio_padrao_valores = desvio_padrao(valores)
print(desvio_padrao_valores)