# Operações Estatísticas com Pandas

Este notebook demonstra como utilizar o Pandas para realizar operações estatísticas essenciais nos dados, uma parte crucial da análise exploratória de dados em projetos de Machine Learning.

In [None]:
import pandas as pd
import numpy as np

## Criando um DataFrame de Exemplo

In [None]:
# Dados de exemplo
np.random.seed(42)  # Para reprodutibilidade
data = {
    'Idade': np.random.randint(18, 60, size=100),
    'Salário': np.random.randint(5000, 50000, size=100),
    'Nota': np.random.normal(5, 2, size=100)
}

df = pd.DataFrame(data)

## Operações Estatísticas Básicas

In [None]:
# Média
print("Média de cada coluna:\n", df.mean())

# Mediana
print("\nMediana de cada coluna:\n", df.median())

# Desvio padrão
print("\nDesvio padrão de cada coluna:\n", df.std())

## Mais Operações Estatísticas

In [None]:
# Mínimo e Máximo
print("\nMínimo de cada coluna:\n", df.min())
print("\nMáximo de cada coluna:\n", df.max())

# Quantis
print("\nQuantis:\n", df.quantile([0.25, 0.5, 0.75]))

# Contagem de valores
print("\nContagem de valores por idade:\n", df['Idade'].value_counts().head())

## Descrição Completa dos Dados

In [None]:
print("\nDescrição estatística do DataFrame:\n", df.describe())

## Correlação entre Colunas

In [None]:
print("\nCorrelação entre as colunas:\n", df.corr())

## Conclusão

Este notebook demonstrou como o Pandas pode ser utilizado para realizar uma série de operações estatísticas fundamentais em conjuntos de dados. Essas operações são essenciais para a análise exploratória de dados, ajudando a identificar padrões, tendências e possíveis anomalias nos dados.