# Introdução à Análise de Dados

Este notebook demonstra os conceitos básicos de análise de dados usando as bibliotecas do projeto.

## Objetivos
- Carregar dados
- Realizar análise exploratória
- Criar visualizações básicas
- Gerar relatórios

In [1]:
# Importar bibliotecas necessárias
import sys
import os

# Adicionar o diretório src ao path
sys.path.append(os.path.join(os.getcwd(), '..', 'src'))

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Importar nossos módulos
from data_loader import DataLoader
from data_analyzer import DataAnalyzer
from visualizer import DataVisualizer

# Configurações
plt.style.use('seaborn-v0_8')
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)

print("Bibliotecas importadas com sucesso!")

ModuleNotFoundError: No module named 'pandas'

## 1. Carregamento de Dados

In [None]:
# Inicializar o DataLoader
loader = DataLoader(data_dir='../data')

# Carregar dados de exemplo
df = loader.load_csv('../data/sample/exemplo_vendas.csv')

print("Dados carregados:")
print(f"Shape: {df.shape}")
print("\nPrimeiras 5 linhas:")
df.head()

## 2. Análise Exploratória

In [None]:
# Inicializar o DataAnalyzer
analyzer = DataAnalyzer(df)

# Informações básicas
basic_info = analyzer.basic_info()
print("=== INFORMAÇÕES BÁSICAS ===")
for key, value in basic_info.items():
    print(f"{key}: {value}")

In [None]:
# Estatísticas descritivas
print("=== ESTATÍSTICAS DESCRITIVAS ===")
desc_stats = analyzer.descriptive_statistics()
desc_stats

In [None]:
# Análise de correlação
print("=== MATRIZ DE CORRELAÇÃO ===")
corr_matrix = analyzer.correlation_analysis()
corr_matrix

In [None]:
# Detecção de outliers
print("=== DETECÇÃO DE OUTLIERS ===")
outliers = analyzer.detect_outliers()
for col, outlier_indices in outliers.items():
    print(f"{col}: {len(outlier_indices)} outliers")

## 3. Visualizações

In [None]:
# Inicializar o DataVisualizer
viz = DataVisualizer(df)

# Histograma das vendas
viz.plot_histogram('vendas', bins=20)

In [None]:
# Gráfico de dispersão: vendas vs lucro
viz.plot_scatter('vendas', 'lucro', color_col='categoria')

In [None]:
# Boxplots para detectar outliers
viz.plot_boxplot(['vendas', 'lucro'])

In [None]:
# Gráfico de pizza para categorias
viz.plot_pie_chart('categoria')

In [None]:
# Heatmap de correlação
viz.plot_heatmap()

## 4. Relatório Completo

In [None]:
# Gerar relatório completo
report = analyzer.generate_report()

print("=== RELATÓRIO COMPLETO DE ANÁLISE ===")
print(f"Dataset shape: {report['basic_info']['shape']}")
print(f"Valores nulos: {report['basic_info']['null_values']}")
print(f"Linhas duplicadas: {report['basic_info']['duplicate_rows']}")
print(f"Colunas numéricas: {report['basic_info']['numeric_columns']}")
print(f"Colunas categóricas: {report['basic_info']['categorical_columns']}")

## 5. Insights e Conclusões

Com base na análise realizada, podemos observar:

1. **Distribuição dos dados**: [Descrever padrões observados]
2. **Correlações**: [Destacar correlações importantes]
3. **Outliers**: [Comentar sobre outliers encontrados]
4. **Qualidade dos dados**: [Avaliar completude e consistência]

### Próximos Passos
- Limpeza e tratamento de dados
- Análises mais aprofundadas
- Modelagem preditiva
- Criação de dashboards interativos