# üìä Tutorial SAEV - Relat√≥rios e An√°lises Avan√ßadas

Este notebook demonstra como usar as funcionalidades avan√ßadas do Sistema de An√°lise de Avalia√ß√µes Educacionais (SAEV).

## üéØ O que voc√™ aprender√°:

1. **Como gerar relat√≥rios automatizados** - Relat√≥rios municipais em Excel
2. **Como fazer an√°lises de clustering** - Agrupamento de escolas por perfil
3. **Como usar an√°lises estat√≠sticas** - Equidade educacional e correla√ß√µes
4. **Como criar visualiza√ß√µes** - Gr√°ficos interativos dos resultados

## ‚ö†Ô∏è Requisitos:
- Banco de dados SAEV configurado (teste ou produ√ß√£o)
- Depend√™ncias instaladas: `pip install -r requirements.txt`

---

## 1Ô∏è‚É£ Importar Bibliotecas e Configurar Conex√£o

Primeiro, vamos importar todas as bibliotecas necess√°rias e configurar a conex√£o com o banco de dados.

In [None]:
# Importar bibliotecas b√°sicas
import sys
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from pathlib import Path

# Configurar o caminho para importar m√≥dulos do SAEV
sys.path.append(str(Path.cwd()))

# Importar m√≥dulos espec√≠ficos do SAEV
from src.reports.generator import SAEVReports
from src.analytics.advanced import SAEVAnalytics
from src.config import config

# Configura√ß√µes de visualiza√ß√£o
plt.style.use('default')
sns.set_palette("husl")

print("‚úÖ Bibliotecas importadas com sucesso!")
print(f"üìÅ Diret√≥rio atual: {Path.cwd()}")

In [None]:
# Verificar ambiente e configurar banco de dados
print("üîç Verificando ambientes dispon√≠veis...")

# Listar ambientes dispon√≠veis
environments = config.list_available_environments()

for env_name, info in environments.items():
    status = "‚úÖ Dispon√≠vel" if info.get('database_exists', False) else "‚ùå Indispon√≠vel"
    print(f"üóÉÔ∏è  {env_name.upper()}: {status}")
    if info.get('database_exists', False) and 'file_size_mb' in info:
        print(f"   üì¶ Tamanho: {info['file_size_mb']} MB")

# Detectar ambiente atual
current_env = config.detect_environment()
db_path = config.get_database_path(current_env)

print(f"\nüéØ Ambiente detectado: {current_env.upper()}")
print(f"üìÅ Banco de dados: {db_path}")

# Verificar se h√° dados
import sqlite3
conn = sqlite3.connect(db_path)
cursor = conn.execute("SELECT COUNT(*) FROM avaliacao")
total_records = cursor.fetchone()[0]
conn.close()

print(f"üìä Total de registros: {total_records:,}")

if total_records == 0:
    print("‚ö†Ô∏è Nenhum dado encontrado! Execute um script de carga primeiro.")
else:
    print("‚úÖ Dados encontrados! Pronto para an√°lises.")

## 2Ô∏è‚É£ Gerar Relat√≥rio Municipal

Agora vamos aprender como gerar relat√≥rios municipais automatizados. Estes relat√≥rios incluem:
- Taxa de acerto por munic√≠pio
- N√∫mero de alunos e escolas
- Classifica√ß√£o de performance
- Estat√≠sticas resumidas

In [None]:
# EXEMPLO 1: M√©todo mais simples (detec√ß√£o autom√°tica do banco)
print("üìã Gerando Relat√≥rio Municipal - M√©todo Simples")
print("="*50)

# Criar inst√¢ncia do gerador de relat√≥rios (sem especificar banco)
reports = SAEVReports()  # ‚Üê Detec√ß√£o autom√°tica!

try:
    # Gerar relat√≥rio municipal para Matem√°tica em 2023
    arquivo_relatorio = reports.generate_municipal_report(2023, "Matem√°tica")
    print(f"‚úÖ Relat√≥rio gerado com sucesso!")
    print(f"üìÅ Arquivo salvo em: {arquivo_relatorio}")
    
    # Mostrar informa√ß√µes do arquivo
    arquivo_path = Path(arquivo_relatorio)
    if arquivo_path.exists():
        tamanho_kb = arquivo_path.stat().st_size / 1024
        print(f"üì¶ Tamanho do arquivo: {tamanho_kb:.1f} KB")
    
except Exception as e:
    print(f"‚ùå Erro ao gerar relat√≥rio: {e}")
    print("üí° Verifique se h√° dados para o ano e disciplina especificados")

In [None]:
# EXEMPLO 2: M√©todo avan√ßado (especificando ambiente)
print("\nüìã Gerando Relat√≥rio Municipal - M√©todo Avan√ßado")
print("="*50)

try:
    # Especificar banco de teste explicitamente
    db_teste = config.get_database_path('teste')
    reports_teste = SAEVReports(db_teste)
    
    print(f"üóÉÔ∏è  Usando banco: {db_teste}")
    
    # Gerar m√∫ltiplos relat√≥rios
    disciplinas = ["Matem√°tica", "Portugu√™s"]
    arquivos_gerados = []
    
    for disciplina in disciplinas:
        try:
            arquivo = reports_teste.generate_municipal_report(2023, disciplina)
            arquivos_gerados.append(arquivo)
            print(f"‚úÖ {disciplina}: {Path(arquivo).name}")
        except Exception as e:
            print(f"‚ö†Ô∏è {disciplina}: Erro - {e}")
    
    print(f"\nüìÇ Total de relat√≥rios gerados: {len(arquivos_gerados)}")
    
except Exception as e:
    print(f"‚ùå Erro geral: {e}")

## 3Ô∏è‚É£ An√°lise de Clustering de Escolas

O clustering agrupa escolas com caracter√≠sticas similares de desempenho. Isso nos ajuda a:
- Identificar padr√µes de performance
- Agrupar escolas por perfil (alto/m√©dio/baixo desempenho)
- Descobrir escolas que precisam de aten√ß√£o especial

In [None]:
# EXEMPLO: Clustering de Escolas
print("üî¨ Realizando Clustering de Escolas")
print("="*40)

# Criar inst√¢ncia do analisador (detec√ß√£o autom√°tica)
analytics = SAEVAnalytics()  # ‚Üê Detec√ß√£o autom√°tica!

try:
    # Fazer clustering para Matem√°tica em 2023
    resultado_clustering = analytics.school_clustering(2023, "Matem√°tica")
    
    if 'error' not in resultado_clustering:
        print(f"‚úÖ Clustering conclu√≠do com sucesso!")
        print(f"üìä N√∫mero de grupos identificados: {resultado_clustering['n_clusters']}")
        print(f"üè´ Total de escolas analisadas: {len(resultado_clustering['data'])}")
        
        # Mostrar informa√ß√µes de cada cluster
        print("\nüìã Grupos identificados:")
        for cluster_id, nome_cluster in resultado_clustering['cluster_names'].items():
            escolas_no_cluster = len(resultado_clustering['data'][
                resultado_clustering['data']['cluster'] == cluster_id
            ])
            print(f"   üè∑Ô∏è  Grupo {cluster_id + 1}: {nome_cluster}")
            print(f"      üìä N√∫mero de escolas: {escolas_no_cluster}")
        
        # Salvar dados do clustering em uma vari√°vel para uso posterior
        dados_clustering = resultado_clustering['data']
        print(f"\nüíæ Dados salvos na vari√°vel 'dados_clustering'")
        
    else:
        print(f"‚ö†Ô∏è {resultado_clustering['error']}")
        print("üí° Isso pode acontecer se n√£o houver dados suficientes para clustering")
        
        # Vamos tentar algo mais simples
        print("\nüîÑ Tentando an√°lise de equidade como alternativa...")
        
except Exception as e:
    print(f"‚ùå Erro no clustering: {e}")
    print("üí° Verifique se h√° dados suficientes no banco")

In [None]:
# AN√ÅLISE DE EQUIDADE EDUCACIONAL
print("‚öñÔ∏è Analisando Equidade Educacional")
print("="*40)

try:
    # An√°lise de equidade para Portugu√™s em 2023
    resultado_equidade = analytics.equity_analysis(2023, "Portugu√™s")
    
    print(f"‚úÖ An√°lise de equidade conclu√≠da!")
    print(f"üèòÔ∏è Munic√≠pios analisados: {len(resultado_equidade)}")
    
    # Mostrar os 3 munic√≠pios com melhor equidade (menor varia√ß√£o)
    melhor_equidade = resultado_equidade.nsmallest(3, 'coef_variacao')
    print(f"\nüèÜ Top 3 - Munic√≠pios com MELHOR equidade:")
    for i, (_, row) in enumerate(melhor_equidade.iterrows(), 1):
        print(f"   {i}. {row['MUN_NOME']}")
        print(f"      üìä N√≠vel: {row['nivel_equidade']}")
        print(f"      üìà Coef. Varia√ß√£o: {row['coef_variacao']:.1f}%")
        print(f"      üè´ Escolas: {row['num_escolas']}")
    
    # Mostrar os 3 que mais precisam de aten√ß√£o
    pior_equidade = resultado_equidade.nlargest(3, 'coef_variacao')
    print(f"\n‚ö†Ô∏è Munic√≠pios que precisam de ATEN√á√ÉO:")
    for i, (_, row) in enumerate(pior_equidade.iterrows(), 1):
        print(f"   {i}. {row['MUN_NOME']}")
        print(f"      üìä N√≠vel: {row['nivel_equidade']}")
        print(f"      üìà Coef. Varia√ß√£o: {row['coef_variacao']:.1f}%")
    
    # Salvar dados para visualiza√ß√£o
    dados_equidade = resultado_equidade
    print(f"\nüíæ Dados salvos na vari√°vel 'dados_equidade'")
    
except Exception as e:
    print(f"‚ùå Erro na an√°lise de equidade: {e}")

## 4Ô∏è‚É£ Visualizar Resultados

Agora vamos criar gr√°ficos interativos para visualizar os resultados das nossas an√°lises.

In [None]:
# VISUALIZA√á√ïES AVAN√áADAS
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Instanciar o sistema de an√°lise
analytics = SAEVAnalytics(config_obj=config)

# 1. GR√ÅFICO DE DISPERS√ÉO - Portugu√™s vs Matem√°tica por Grupo
df_groups = analytics.clustering_analysis(n_clusters=4)
fig_scatter = px.scatter(
    df_groups,
    x='MEDIA_PORTUGUES', 
    y='MEDIA_MATEMATICA',
    color='cluster',
    size='TOTAL_ALUNOS',
    hover_data=['MUNICIPIO', 'QTD_ESCOLAS'],
    title="üìä An√°lise de Agrupamento: Portugu√™s vs Matem√°tica",
    labels={
        'MEDIA_PORTUGUES': 'M√©dia de Portugu√™s',
        'MEDIA_MATEMATICA': 'M√©dia de Matem√°tica',
        'cluster': 'Grupo'
    }
)
fig_scatter.show()

# 2. HEATMAP DE CORRELA√á√ÉO
correlation_data = analytics.correlation_analysis()
fig_heatmap = px.imshow(
    correlation_data['correlation_matrix'],
    title="üî• Mapa de Calor - Correla√ß√µes entre Indicadores",
    color_continuous_scale='RdBu',
    aspect='auto'
)
fig_heatmap.show()

# 3. RANKING DOS MUNIC√çPIOS
equity_analysis = analytics.equity_analysis()
top_10 = equity_analysis['top_municipalities'][:10]
fig_ranking = px.bar(
    x=top_10['MUNICIPIO'],
    y=top_10['MEDIA_GERAL'],
    title="üèÜ Top 10 Munic√≠pios - Melhor Desempenho",
    labels={'x': 'Munic√≠pio', 'y': 'M√©dia Geral'}
)
fig_ranking.update_xaxes(tickangle=45)
fig_ranking.show()

print("‚úÖ Visualiza√ß√µes geradas com sucesso!")

## 5Ô∏è‚É£ Compara√ß√£o de M√©tricas

Vamos comparar diferentes indicadores educacionais entre munic√≠pios.

In [None]:
# AN√ÅLISE COMPARATIVA DETALHADA

# 1. DASHBOARD MUNICIPAL INTERATIVO
print("üöÄ Iniciando o dashboard interativo...")
print("Aguarde alguns segundos para o dashboard abrir no seu navegador.\n")

# Para executar o dashboard, use o script iniciar.sh ou:
# streamlit run src/dashboard/main.py

# 2. AN√ÅLISE DE TEND√äNCIAS (se voc√™ tiver dados hist√≥ricos)
try:
    trend_data = analytics.trend_analysis(years=[2023])
    print("üìà An√°lise de tend√™ncias dispon√≠vel:")
    for metric, value in trend_data['summary_stats'].items():
        print(f"   ‚Ä¢ {metric}: {value:.2f}")
except Exception as e:
    print(f"‚ö†Ô∏è  An√°lise de tend√™ncias requer dados hist√≥ricos: {e}")

# 3. RELAT√ìRIO ESTAT√çSTICO COMPLETO
print("\nüìä ESTAT√çSTICAS GERAIS DO SISTEMA:")
print("="*50)

# Carregar dados b√°sicos
processor = SAEVDataProcessor(config_obj=config)
dados = processor.load_evaluation_data()

if not dados.empty:
    print(f"üìç Total de munic√≠pios: {dados['MUNICIPIO'].nunique()}")
    print(f"üè´ Total de escolas: {dados['QTD_ESCOLAS'].sum()}")
    print(f"üë• Total de alunos: {dados['TOTAL_ALUNOS'].sum():,}")
    print(f"üìö M√©dia geral Portugu√™s: {dados['MEDIA_PORTUGUES'].mean():.2f}")
    print(f"üî¢ M√©dia geral Matem√°tica: {dados['MEDIA_MATEMATICA'].mean():.2f}")
    
    # Estat√≠sticas de distribui√ß√£o
    print(f"\nüìä DISTRIBUI√á√ÉO DE DESEMPENHO:")
    print(f"   ‚Ä¢ Melhor munic√≠pio (Portugu√™s): {dados.loc[dados['MEDIA_PORTUGUES'].idxmax(), 'MUNICIPIO']} ({dados['MEDIA_PORTUGUES'].max():.2f})")
    print(f"   ‚Ä¢ Melhor munic√≠pio (Matem√°tica): {dados.loc[dados['MEDIA_MATEMATICA'].idxmax(), 'MUNICIPIO']} ({dados['MEDIA_MATEMATICA'].max():.2f})")
    print(f"   ‚Ä¢ Desvio padr√£o Portugu√™s: {dados['MEDIA_PORTUGUES'].std():.2f}")
    print(f"   ‚Ä¢ Desvio padr√£o Matem√°tica: {dados['MEDIA_MATEMATICA'].std():.2f}")
    
else:
    print("‚ùå N√£o foi poss√≠vel carregar os dados para an√°lise.")

print("\n" + "="*50)
print("‚úÖ Tutorial conclu√≠do com sucesso!")

## üéØ Pr√≥ximos Passos

### Como usar o sistema completo:

1. **Dashboard Interativo**: Execute `./iniciar.sh` e escolha a op√ß√£o dashboard
2. **Relat√≥rios Autom√°ticos**: Use os scripts `demo_funcionalidades.py` ou `exemplo_simples.py`
3. **An√°lises Personalizadas**: Modifique este notebook para suas necessidades espec√≠ficas

### Arquivos importantes:
- `src/config.py` - Configura√ß√£o do ambiente
- `src/reports/generator.py` - Gera√ß√£o de relat√≥rios Excel
- `src/analytics/advanced.py` - An√°lises estat√≠sticas avan√ßadas
- `src/dashboard/main.py` - Interface web Streamlit

### Dicas:
- Use o ambiente de teste para experimentar (`iniciar_teste.sh`)
- Todos os relat√≥rios s√£o salvos na pasta `reports/`
- O sistema detecta automaticamente qual banco de dados usar

---
**üöÄ Sistema SAEV pronto para uso!**