# üîÑ Camada Prata - Dados Transformados e Relacionados

Este notebook demonstra como visualizar e consultar dados da camada Prata usando Spark.

## O que √© a Camada Prata?
- Dados limpos e normalizados da camada Bronze
- Relacionamentos entre tabelas estabelecidos
- Estruturas dimensionais e de fatos criadas
- Prontos para an√°lises mais complexas

In [None]:
# ‚ö†Ô∏è IMPORTANTE: Execute primeiro o notebook CONFIGURAR_SPARK.ipynb
# Se ainda n√£o executou, execute o script de corre√ß√£o:
try:
    spark
    print("‚úÖ Spark Session j√° dispon√≠vel")
except NameError:
    print("‚ö†Ô∏è  Spark n√£o configurado. Execute CONFIGURAR_SPARK.ipynb primeiro!")
    print("Ou execute o script de corre√ß√£o:")
    exec(open('/home/jovyan/work/fix_spark_py4j.py').read())

## 1. Listar Tabelas Dispon√≠veis na Camada Prata

In [None]:
# Listar arquivos Prata dispon√≠veis
prata_paths = [
    "s3a://govbr/prata/dim_municipio/",
    "s3a://govbr/prata/dim_estado/",
    "s3a://govbr/prata/dim_orgao/",
    "s3a://govbr/prata/fact_bpc/",
    "s3a://govbr/prata/fact_populacao/"
]

print("üìÅ Tabelas dispon√≠veis na Camada Prata:\n")
for path in prata_paths:
    try:
        df = spark.read.parquet(path)
        print(f"‚úÖ {path.split('/')[-2]}")
        print(f"   Registros: {df.count():,}")
        print(f"   Colunas: {len(df.columns)}")
        print()
    except Exception as e:
        print(f"‚ö†Ô∏è  {path.split('/')[-2]} - N√£o dispon√≠vel")
        print()

## 2. Dimens√£o: Munic√≠pios

In [None]:
# Ler dimens√£o de munic√≠pios
df_dim_municipio = spark.read.parquet("s3a://govbr/prata/dim_municipio/")

print(f"üìä Total de munic√≠pios: {df_dim_municipio.count():,}")
print(f"\nüìã Estrutura:")
df_dim_municipio.printSchema()

print(f"\nüîç Exemplo de registros:")
df_dim_municipio.show(10, truncate=False)

## 3. Dimens√£o: Estados

In [None]:
# Ler dimens√£o de estados
df_dim_estado = spark.read.parquet("s3a://govbr/prata/dim_estado/")

print(f"üìä Total de estados: {df_dim_estado.count()}")
print(f"\nüîç Todos os estados:")
df_dim_estado.select("estado_id", "uf_sigla", "uf_nome", "regiao_nome").show(truncate=False)

## 4. Fato: BPC (Benef√≠cio de Presta√ß√£o Continuada)

In [None]:
# Ler fato BPC
try:
    df_fact_bpc = spark.read.parquet("s3a://govbr/prata/fact_bpc/")
    
    print(f"üìä Total de registros BPC: {df_fact_bpc.count():,}")
    print(f"\nüìã Estrutura:")
    df_fact_bpc.printSchema()
    
    print(f"\nüîç Primeiros registros:")
    df_fact_bpc.show(10, truncate=False)
    
except Exception as e:
    print(f"‚ö†Ô∏è  Dados n√£o dispon√≠veis: {e}")

## 5. An√°lises com Relacionamentos

In [None]:
# Criar views tempor√°rias
df_dim_municipio.createOrReplaceTempView("dim_municipio")
df_dim_estado.createOrReplaceTempView("dim_estado")

if 'df_fact_bpc' in locals():
    df_fact_bpc.createOrReplaceTempView("fact_bpc")
    
    # An√°lise: BPC por estado com informa√ß√µes da dimens√£o
    resultado = spark.sql("""
        SELECT 
            e.uf_sigla,
            e.uf_nome,
            e.regiao_nome,
            COUNT(DISTINCT f.municipio_id) as municipios_com_bpc,
            SUM(f.valor) as valor_total,
            SUM(f.quantidade_beneficiados) as total_beneficiados
        FROM fact_bpc f
        JOIN dim_municipio m ON f.municipio_id = m.municipio_id
        JOIN dim_estado e ON m.estado_id = e.estado_id
        GROUP BY e.uf_sigla, e.uf_nome, e.regiao_nome
        ORDER BY valor_total DESC
    """)
    
    print("üìä BPC por Estado (com relacionamentos):")
    resultado.show(truncate=False)
else:
    print("‚ö†Ô∏è  Dados de BPC n√£o dispon√≠veis para an√°lise")

## 6. An√°lise de Munic√≠pios por Regi√£o

In [None]:
# An√°lise usando SQL
resultado = spark.sql("""
    SELECT 
        e.regiao_nome,
        COUNT(DISTINCT m.municipio_id) as total_municipios,
        COUNT(DISTINCT e.estado_id) as total_estados
    FROM dim_municipio m
    JOIN dim_estado e ON m.estado_id = e.estado_id
    GROUP BY e.regiao_nome
    ORDER BY total_municipios DESC
""")

print("üìä Munic√≠pios por Regi√£o:")
resultado.show(truncate=False)

## ‚úÖ Resumo

A camada Prata cont√©m dados transformados e relacionados:
- ‚úÖ Dimens√µes: Munic√≠pios, Estados, √ìrg√£os
- ‚úÖ Fatos: BPC, Popula√ß√£o
- ‚úÖ Relacionamentos estabelecidos entre tabelas
- ‚úÖ Pronto para an√°lises mais complexas