# Análise Exploratória de Dados (EDA)

Neste notebook, realizaremos a análise exploratória dos dados relacionados ao projeto de automação logística. O objetivo é entender melhor os dados, identificar padrões, tendências e possíveis anomalias que possam impactar a automação dos processos de expedição.

In [1]:
# Importando bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configurando estilo do seaborn
sns.set(style='whitegrid')

In [2]:
# Carregando os dados
data_path = '../data/processed/dados_processados.csv'  # Atualizar com o caminho correto
df = pd.read_csv(data_path)

# Exibindo as primeiras linhas do dataframe
df.head()

In [3]:
# Resumo estatístico dos dados
df.describe()

In [4]:
# Verificando valores ausentes
missing_values = df.isnull().sum()
missing_values[missing_values > 0]

In [5]:
# Visualizando a distribuição de uma variável de interesse
plt.figure(figsize=(10, 6))
sns.histplot(df['variavel_interesse'], bins=30, kde=True)
plt.title('Distribuição da Variável de Interesse')
plt.xlabel('Variável de Interesse')
plt.ylabel('Frequência')
plt.show()

In [6]:
# Analisando correlações entre variáveis
plt.figure(figsize=(12, 8))
correlation_matrix = df.corr()
sns.heatmap(correlation_matrix, annot=True, fmt='.2f', cmap='coolwarm')
plt.title('Matriz de Correlação')
plt.show()

## Conclusão

Nesta análise exploratória, conseguimos identificar padrões e tendências nos dados que podem ser úteis para a automação dos processos de expedição. As visualizações e estatísticas descritivas nos ajudam a entender melhor o comportamento dos dados e a tomar decisões informadas para as próximas etapas do projeto.