# üìä An√°lise de Dados - Cidad√£os (Camada Bronze)

Este notebook analisa os dados de cidad√£os gerados na camada Bronze, incluindo:
- Quantidade de endere√ßos por usu√°rio
- Estruturas de formata√ß√£o de endere√ßos
- Distribui√ß√£o por estados e munic√≠pios
- Visualiza√ß√µes e estat√≠sticas diversas

## ‚öôÔ∏è Depend√™ncias

Se necess√°rio, instale as depend√™ncias:
```bash
pip install pandas numpy matplotlib seaborn minio pyarrow
```

## 1. Configura√ß√£o e Importa√ß√£o de Bibliotecas

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from minio import Minio
import io
import re
from collections import Counter
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√£o de visualiza√ß√£o
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (14, 8)
plt.rcParams['font.size'] = 10

# Configura√ß√µes MinIO
MINIO_SERVER_URL = "ch8ai-minio.l6zv5a.easypanel.host"
MINIO_ROOT_USER = "admin"
MINIO_ROOT_PASSWORD = "1q2w3e4r"
BUCKET_NAME = "govbr"

print("‚úÖ Bibliotecas importadas com sucesso!")

## 2. Conex√£o com MinIO e Carregamento dos Dados

In [None]:
# Conectar ao MinIO
minio_client = Minio(
    MINIO_SERVER_URL,
    access_key=MINIO_ROOT_USER,
    secret_key=MINIO_ROOT_PASSWORD,
    secure=True
)

print("‚úÖ Conectado ao MinIO")

In [None]:
# Listar arquivos dispon√≠veis
print("üìÅ Arquivos dispon√≠veis na camada Bronze - Cidad√£os:")
print("=" * 80)

objects = list(minio_client.list_objects(BUCKET_NAME, prefix="bronze/simulado/cidadaos/", recursive=True))

if not objects:
    print("‚ö†Ô∏è  Nenhum arquivo encontrado. Execute primeiro o script de gera√ß√£o.")
else:
    for obj in objects:
        tamanho_mb = obj.size / 1024 / 1024
        print(f"  ‚úÖ {obj.object_name} ({tamanho_mb:.2f} MB)")

In [None]:
# Carregar dados
if objects:
    # Pegar o arquivo mais recente
    arquivo_mais_recente = max(objects, key=lambda x: x.last_modified)
    print(f"\nüìÇ Carregando: {arquivo_mais_recente.object_name}")
    
    # Ler dados
    response = minio_client.get_object(BUCKET_NAME, arquivo_mais_recente.object_name)
    df = pd.read_parquet(io.BytesIO(response.read()))
    
    print(f"‚úÖ Dados carregados: {len(df):,} registros")
    print(f"\nüìä Primeiras linhas:")
    display(df.head(10))
    
    print(f"\nüìã Informa√ß√µes do DataFrame:")
    print(df.info())
else:
    print("‚ö†Ô∏è  Nenhum arquivo para carregar.")
    df = None

## 3. Estat√≠sticas Gerais

In [None]:
if df is not None:
    print("=" * 80)
    print("üìä ESTAT√çSTICAS GERAIS")
    print("=" * 80)
    
    total_registros = len(df)
    cidadaos_unicos = df['cpf'].nunique()
    
    print(f"\nüìà Totais:")
    print(f"  ‚Ä¢ Total de registros de endere√ßos: {total_registros:,}")
    print(f"  ‚Ä¢ Total de cidad√£os √∫nicos: {cidadaos_unicos:,}")
    print(f"  ‚Ä¢ M√©dia de endere√ßos por cidad√£o: {total_registros/cidadaos_unicos:.2f}")
    
    # Estat√≠sticas de endere√ßos por cidad√£o
    enderecos_por_cidadao = df.groupby('cpf').size()
    
    print(f"\nüè† Endere√ßos por Cidad√£o:")
    print(f"  ‚Ä¢ M√≠nimo: {enderecos_por_cidadao.min()}")
    print(f"  ‚Ä¢ M√°ximo: {enderecos_por_cidadao.max()}")
    print(f"  ‚Ä¢ Mediana: {enderecos_por_cidadao.median():.2f}")
    print(f"  ‚Ä¢ Desvio padr√£o: {enderecos_por_cidadao.std():.2f}")
    
    # Distribui√ß√£o
    print(f"\nüìä Distribui√ß√£o de Endere√ßos por Cidad√£o:")
    distribuicao = enderecos_por_cidadao.value_counts().sort_index()
    for num_enderecos, quantidade in distribuicao.items():
        percentual = (quantidade / cidadaos_unicos) * 100
        print(f"  ‚Ä¢ {num_enderecos} endere√ßo(s): {quantidade:,} cidad√£os ({percentual:.2f}%)")

## 4. Visualiza√ß√£o: Distribui√ß√£o de Endere√ßos por Cidad√£o

In [None]:
if df is not None:
    enderecos_por_cidadao = df.groupby('cpf').size()
    
    fig, axes = plt.subplots(1, 2, figsize=(16, 6))
    
    # Gr√°fico 1: Histograma
    axes[0].hist(enderecos_por_cidadao, bins=15, edgecolor='black', alpha=0.7, color='skyblue')
    axes[0].set_xlabel('N√∫mero de Endere√ßos por Cidad√£o', fontsize=12)
    axes[0].set_ylabel('Quantidade de Cidad√£os', fontsize=12)
    axes[0].set_title('Distribui√ß√£o de Endere√ßos por Cidad√£o', fontsize=14, fontweight='bold')
    axes[0].grid(True, alpha=0.3)
    
    # Gr√°fico 2: Gr√°fico de barras
    distribuicao = enderecos_por_cidadao.value_counts().sort_index()
    axes[1].bar(distribuicao.index, distribuicao.values, color='coral', edgecolor='black', alpha=0.7)
    axes[1].set_xlabel('N√∫mero de Endere√ßos', fontsize=12)
    axes[1].set_ylabel('Quantidade de Cidad√£os', fontsize=12)
    axes[1].set_title('Quantidade de Cidad√£os por N√∫mero de Endere√ßos', fontsize=14, fontweight='bold')
    axes[1].grid(True, alpha=0.3, axis='y')
    
    plt.tight_layout()
    plt.show()
    
    # Estat√≠sticas no gr√°fico
    print(f"\nüìä Estat√≠sticas:")
    print(f"  ‚Ä¢ M√©dia: {enderecos_por_cidadao.mean():.2f} endere√ßos por cidad√£o")
    print(f"  ‚Ä¢ Mediana: {enderecos_por_cidadao.median():.2f} endere√ßos por cidad√£o")

## 5. An√°lise de Estruturas de Endere√ßos

In [None]:
if df is not None:
    # Fun√ß√£o para identificar padr√µes de formata√ß√£o
    def identificar_padrao_endereco(endereco):
        """Identifica padr√µes de formata√ß√£o nos endere√ßos"""
        padroes = []
        
        # Verificar separadores
        if ',' in endereco:
            padroes.append('Com v√≠rgulas')
        if '-' in endereco:
            padroes.append('Com h√≠fens')
        if '/' in endereco:
            padroes.append('Com barras')
        if '|' in endereco:
            padroes.append('Com pipes')
        
        # Verificar CEP
        if 'CEP' in endereco.upper() or re.search(r'\d{5}-?\d{3}', endereco):
            padroes.append('Com CEP')
        
        # Verificar complemento
        if any(comp in endereco for comp in ['Apto', 'Apartamento', 'Casa', 'Sala', 'Loja', 'Bloco', 'Torre']):
            padroes.append('Com complemento')
        
        # Verificar mai√∫sculas/min√∫sculas
        if endereco.isupper():
            padroes.append('Tudo mai√∫sculo')
        elif endereco.islower():
            padroes.append('Tudo min√∫sculo')
        
        # Verificar abrevia√ß√µes
        if re.search(r'\b(R\.|Av\.|P√ßa\.|Tv\.|Al\.|Est\.|Rod\.)', endereco):
            padroes.append('Com abrevia√ß√µes')
        
        return ', '.join(padroes) if padroes else 'Padr√£o b√°sico'
    
    # Aplicar an√°lise
    df['padrao_formatacao'] = df['endereco'].apply(identificar_padrao_endereco)
    
    print("=" * 80)
    print("üèóÔ∏è AN√ÅLISE DE ESTRUTURAS DE ENDERE√áOS")
    print("=" * 80)
    
    # Contar padr√µes
    padroes_contagem = df['padrao_formatacao'].value_counts()
    
    print(f"\nüìä Padr√µes de Formata√ß√£o Encontrados:")
    for padrao, quantidade in padroes_contagem.head(20).items():
        percentual = (quantidade / len(df)) * 100
        print(f"  ‚Ä¢ {padrao}: {quantidade:,} ({percentual:.2f}%)")
    
    # Exemplos de cada padr√£o
    print(f"\nüìù Exemplos de Endere√ßos por Padr√£o:")
    for padrao in padroes_contagem.head(10).index:
        exemplo = df[df['padrao_formatacao'] == padrao]['endereco'].iloc[0]
        print(f"\n  {padrao}:")
        print(f"    {exemplo[:100]}..." if len(exemplo) > 100 else f"    {exemplo}")

In [None]:
if df is not None:
    # Visualiza√ß√£o dos padr√µes
    padroes_contagem = df['padrao_formatacao'].value_counts().head(15)
    
    fig, ax = plt.subplots(figsize=(14, 8))
    
    cores = plt.cm.Set3(range(len(padroes_contagem)))
    bars = ax.barh(range(len(padroes_contagem)), padroes_contagem.values, color=cores, edgecolor='black')
    
    ax.set_yticks(range(len(padroes_contagem)))
    ax.set_yticklabels(padroes_contagem.index, fontsize=9)
    ax.set_xlabel('Quantidade de Endere√ßos', fontsize=12)
    ax.set_title('Top 15 Padr√µes de Formata√ß√£o de Endere√ßos', fontsize=14, fontweight='bold')
    ax.grid(True, alpha=0.3, axis='x')
    
    # Adicionar valores nas barras
    for i, (idx, val) in enumerate(padroes_contagem.items()):
        ax.text(val + max(padroes_contagem.values) * 0.01, i, f'{val:,}', 
                va='center', fontsize=9)
    
    plt.tight_layout()
    plt.show()

## 6. An√°lise por Estados

In [None]:
if df is not None:
    # Extrair estado dos endere√ßos
    def extrair_estado(endereco):
        """Extrai o estado (UF) do endere√ßo"""
        # Padr√£o: /UF ou -UF no final
        match = re.search(r'[/-]([A-Z]{2})(?:\s|$|CEP|,)', endereco)
        if match:
            return match.group(1)
        return None
    
    df['estado'] = df['endereco'].apply(extrair_estado)
    
    print("=" * 80)
    print("üó∫Ô∏è AN√ÅLISE POR ESTADOS")
    print("=" * 80)
    
    # Estat√≠sticas por estado
    estados_contagem = df['estado'].value_counts()
    
    print(f"\nüìä Distribui√ß√£o por Estado:")
    print(f"  ‚Ä¢ Total de estados encontrados: {estados_contagem.nunique()}")
    print(f"  ‚Ä¢ Endere√ßos sem estado identificado: {df['estado'].isna().sum():,}")
    
    print(f"\nüèÜ Top 10 Estados por Quantidade de Endere√ßos:")
    for estado, quantidade in estados_contagem.head(10).items():
        percentual = (quantidade / len(df)) * 100
        print(f"  ‚Ä¢ {estado}: {quantidade:,} endere√ßos ({percentual:.2f}%)")
    
    # Cidad√£os √∫nicos por estado
    print(f"\nüë• Cidad√£os √önicos por Estado (Top 10):")
    cidadaos_por_estado = df.groupby('estado')['cpf'].nunique().sort_values(ascending=False)
    for estado, quantidade in cidadaos_por_estado.head(10).items():
        print(f"  ‚Ä¢ {estado}: {quantidade:,} cidad√£os")

In [None]:
if df is not None:
    estados_contagem = df['estado'].value_counts().head(15)
    
    fig, axes = plt.subplots(1, 2, figsize=(16, 6))
    
    # Gr√°fico 1: Barras horizontais
    cores = plt.cm.viridis(np.linspace(0, 1, len(estados_contagem)))
    axes[0].barh(estados_contagem.index, estados_contagem.values, color=cores, edgecolor='black')
    axes[0].set_xlabel('Quantidade de Endere√ßos', fontsize=12)
    axes[0].set_ylabel('Estado (UF)', fontsize=12)
    axes[0].set_title('Top 15 Estados por Quantidade de Endere√ßos', fontsize=14, fontweight='bold')
    axes[0].grid(True, alpha=0.3, axis='x')
    
    # Gr√°fico 2: Pizza
    axes[1].pie(estados_contagem.values, labels=estados_contagem.index, autopct='%1.1f%%',
                startangle=90, colors=cores)
    axes[1].set_title('Distribui√ß√£o Percentual por Estado', fontsize=14, fontweight='bold')
    
    plt.tight_layout()
    plt.show()

## 7. An√°lise por Munic√≠pios

In [None]:
if df is not None:
    # Extrair munic√≠pio dos endere√ßos
    def extrair_municipio(endereco):
        """Extrai o munic√≠pio do endere√ßo"""
        # Tentar encontrar padr√£o comum: cidade antes do estado
        # Padr√£o: cidade/UF ou cidade - UF
        match = re.search(r'([A-Z][a-z]+(?:\s+[A-Z][a-z]+)*)\s*[/-]\s*([A-Z]{2})', endereco)
        if match:
            return match.group(1).strip()
        
        # Tentar padr√£o alternativo: cidade, estado
        match = re.search(r'([A-Z][a-z]+(?:\s+[A-Z][a-z]+)*),\s*([A-Z]{2})', endereco)
        if match:
            return match.group(1).strip()
        
        return None
    
    df['municipio'] = df['endereco'].apply(extrair_municipio)
    
    print("=" * 80)
    print("üèôÔ∏è AN√ÅLISE POR MUNIC√çPIOS")
    print("=" * 80)
    
    # Estat√≠sticas por munic√≠pio
    municipios_contagem = df['municipio'].value_counts()
    
    print(f"\nüìä Distribui√ß√£o por Munic√≠pio:")
    print(f"  ‚Ä¢ Total de munic√≠pios encontrados: {municipios_contagem.nunique()}")
    print(f"  ‚Ä¢ Endere√ßos sem munic√≠pio identificado: {df['municipio'].isna().sum():,}")
    
    print(f"\nüèÜ Top 20 Munic√≠pios por Quantidade de Endere√ßos:")
    for municipio, quantidade in municipios_contagem.head(20).items():
        percentual = (quantidade / len(df)) * 100
        print(f"  ‚Ä¢ {municipio}: {quantidade:,} endere√ßos ({percentual:.2f}%)")
    
    # Cidad√£os √∫nicos por munic√≠pio
    print(f"\nüë• Cidad√£os √önicos por Munic√≠pio (Top 10):")
    cidadaos_por_municipio = df.groupby('municipio')['cpf'].nunique().sort_values(ascending=False)
    for municipio, quantidade in cidadaos_por_municipio.head(10).items():
        print(f"  ‚Ä¢ {municipio}: {quantidade:,} cidad√£os")

In [None]:
if df is not None:
    municipios_contagem = df['municipio'].value_counts().head(20)
    
    fig, ax = plt.subplots(figsize=(14, 10))
    
    cores = plt.cm.plasma(np.linspace(0, 1, len(municipios_contagem)))
    bars = ax.barh(range(len(municipios_contagem)), municipios_contagem.values, 
                   color=cores, edgecolor='black')
    
    ax.set_yticks(range(len(municipios_contagem)))
    ax.set_yticklabels(municipios_contagem.index, fontsize=10)
    ax.set_xlabel('Quantidade de Endere√ßos', fontsize=12)
    ax.set_title('Top 20 Munic√≠pios por Quantidade de Endere√ßos', fontsize=14, fontweight='bold')
    ax.grid(True, alpha=0.3, axis='x')
    
    # Adicionar valores nas barras
    for i, (idx, val) in enumerate(municipios_contagem.items()):
        ax.text(val + max(municipios_contagem.values) * 0.01, i, f'{val:,}', 
                va='center', fontsize=9)
    
    plt.tight_layout()
    plt.show()

## 8. An√°lise de Tipos de Telefone

In [None]:
if df is not None:
    print("=" * 80)
    print("üìû AN√ÅLISE DE TIPOS DE TELEFONE")
    print("=" * 80)
    
    tipos_telefone = df['tipo_telefone'].value_counts()
    
    print(f"\nüìä Distribui√ß√£o por Tipo:")
    for tipo, quantidade in tipos_telefone.items():
        percentual = (quantidade / len(df)) * 100
        print(f"  ‚Ä¢ {tipo.capitalize()}: {quantidade:,} ({percentual:.2f}%)")
    
    # Visualiza√ß√£o
    fig, ax = plt.subplots(figsize=(10, 6))
    
    cores = ['#FF6B6B', '#4ECDC4', '#45B7D1', '#FFA07A']
    ax.pie(tipos_telefone.values, labels=tipos_telefone.index.str.capitalize(), 
           autopct='%1.1f%%', startangle=90, colors=cores[:len(tipos_telefone)])
    ax.set_title('Distribui√ß√£o de Tipos de Telefone', fontsize=14, fontweight='bold')
    
    plt.tight_layout()
    plt.show()

## 9. An√°lise de Emails

In [None]:
if df is not None:
    print("=" * 80)
    print("üìß AN√ÅLISE DE EMAILS")
    print("=" * 80)
    
    # Extrair dom√≠nios
    df['dominio_email'] = df['email'].str.split('@').str[1]
    
    dominios_contagem = df['dominio_email'].value_counts()
    
    print(f"\nüìä Distribui√ß√£o por Dom√≠nio:")
    print(f"  ‚Ä¢ Total de dom√≠nios √∫nicos: {dominios_contagem.nunique()}")
    
    print(f"\nüèÜ Top 10 Dom√≠nios:")
    for dominio, quantidade in dominios_contagem.head(10).items():
        percentual = (quantidade / len(df)) * 100
        print(f"  ‚Ä¢ {dominio}: {quantidade:,} ({percentual:.2f}%)")
    
    # Visualiza√ß√£o
    fig, ax = plt.subplots(figsize=(12, 6))
    
    top_dominios = dominios_contagem.head(10)
    cores = plt.cm.Set2(range(len(top_dominios)))
    ax.barh(top_dominios.index, top_dominios.values, color=cores, edgecolor='black')
    ax.set_xlabel('Quantidade de Emails', fontsize=12)
    ax.set_ylabel('Dom√≠nio', fontsize=12)
    ax.set_title('Top 10 Dom√≠nios de Email', fontsize=14, fontweight='bold')
    ax.grid(True, alpha=0.3, axis='x')
    
    plt.tight_layout()
    plt.show()

## 10. Exemplos de Cidad√£os com M√∫ltiplos Endere√ßos

In [None]:
if df is not None:
    print("=" * 80)
    print("üë§ EXEMPLOS DE CIDAD√ÉOS COM M√öLTIPLOS ENDERE√áOS")
    print("=" * 80)
    
    # Encontrar cidad√£os com mais endere√ßos
    enderecos_por_cidadao = df.groupby('cpf').size()
    cidadaos_muitos_enderecos = enderecos_por_cidadao[enderecos_por_cidadao >= 10].index[:5]
    
    for idx, cpf in enumerate(cidadaos_muitos_enderecos, 1):
        cidadao_df = df[df['cpf'] == cpf].sort_values('numero_endereco')
        
        print(f"\n{'='*80}")
        print(f"Cidad√£o {idx}:")
        print(f"  CPF: {cpf}")
        print(f"  Nome: {cidadao_df['nome'].iloc[0]}")
        print(f"  Email: {cidadao_df['email'].iloc[0]}")
        print(f"  Telefone: {cidadao_df['telefone'].iloc[0]} ({cidadao_df['tipo_telefone'].iloc[0]})")
        print(f"  Total de Endere√ßos: {len(cidadao_df)}")
        print(f"\n  Endere√ßos:")
        
        for _, row in cidadao_df.iterrows():
            print(f"    {row['numero_endereco']}. {row['endereco']}")
            print(f"       Padr√£o: {row['padrao_formatacao']}")
            if pd.notna(row['estado']):
                print(f"       Estado: {row['estado']}")
            if pd.notna(row['municipio']):
                print(f"       Munic√≠pio: {row['municipio']}")
            print()

## 11. An√°lise de Varia√ß√µes de Formata√ß√£o

In [None]:
if df is not None:
    print("=" * 80)
    print("üé® AN√ÅLISE DETALHADA DE VARIA√á√ïES DE FORMATA√á√ÉO")
    print("=" * 80)
    
    # Contar quantos endere√ßos √∫nicos temos
    enderecos_unicos = df['endereco'].nunique()
    
    print(f"\nüìä Estat√≠sticas de Varia√ß√µes:")
    print(f"  ‚Ä¢ Total de endere√ßos √∫nicos: {enderecos_unicos:,}")
    print(f"  ‚Ä¢ Total de registros: {len(df):,}")
    print(f"  ‚Ä¢ Taxa de unicidade: {(enderecos_unicos/len(df)*100):.2f}%")
    
    # An√°lise de caracter√≠sticas espec√≠ficas
    caracteristicas = {
        'Com v√≠rgulas': df['endereco'].str.contains(',').sum(),
        'Com h√≠fens': df['endereco'].str.contains('-').sum(),
        'Com barras': df['endereco'].str.contains('/').sum(),
        'Com CEP': df['endereco'].str.contains('CEP', case=False, na=False).sum(),
        'Com complemento': df['endereco'].str.contains('Apto|Apartamento|Casa|Sala|Loja|Bloco|Torre', case=False, na=False).sum(),
        'Tudo mai√∫sculo': df['endereco'].str.isupper().sum(),
        'Tudo min√∫sculo': df['endereco'].str.islower().sum(),
        'Com abrevia√ß√µes': df['endereco'].str.contains(r'\b(R\.|Av\.|P√ßa\.|Tv\.|Al\.|Est\.|Rod\.)', regex=True, na=False).sum()
    }
    
    print(f"\nüîç Caracter√≠sticas Encontradas:")
    for caracteristica, quantidade in caracteristicas.items():
        percentual = (quantidade / len(df)) * 100
        print(f"  ‚Ä¢ {caracteristica}: {quantidade:,} ({percentual:.2f}%)")
    
    # Visualiza√ß√£o
    fig, ax = plt.subplots(figsize=(12, 8))
    
    caracteristicas_df = pd.DataFrame(list(caracteristicas.items()), columns=['Caracter√≠stica', 'Quantidade'])
    caracteristicas_df = caracteristicas_df.sort_values('Quantidade', ascending=True)
    
    cores = plt.cm.coolwarm(np.linspace(0, 1, len(caracteristicas_df)))
    ax.barh(caracteristicas_df['Caracter√≠stica'], caracteristicas_df['Quantidade'], 
            color=cores, edgecolor='black')
    ax.set_xlabel('Quantidade de Endere√ßos', fontsize=12)
    ax.set_title('Caracter√≠sticas de Formata√ß√£o nos Endere√ßos', fontsize=14, fontweight='bold')
    ax.grid(True, alpha=0.3, axis='x')
    
    plt.tight_layout()
    plt.show()

## 12. Resumo Executivo

In [None]:
if df is not None:
    print("=" * 80)
    print("üìã RESUMO EXECUTIVO")
    print("=" * 80)
    
    print(f"\nüìä DADOS GERAIS:")
    print(f"  ‚Ä¢ Total de registros: {len(df):,}")
    print(f"  ‚Ä¢ Total de cidad√£os √∫nicos: {df['cpf'].nunique():,}")
    print(f"  ‚Ä¢ M√©dia de endere√ßos por cidad√£o: {len(df)/df['cpf'].nunique():.2f}")
    
    print(f"\nüè† ENDERE√áOS:")
    enderecos_por_cidadao = df.groupby('cpf').size()
    print(f"  ‚Ä¢ M√≠nimo: {enderecos_por_cidadao.min()}")
    print(f"  ‚Ä¢ M√°ximo: {enderecos_por_cidadao.max()}")
    print(f"  ‚Ä¢ Mediana: {enderecos_por_cidadao.median():.0f}")
    
    print(f"\nüó∫Ô∏è LOCALIZA√á√ÉO:")
    print(f"  ‚Ä¢ Estados identificados: {df['estado'].nunique()}")
    print(f"  ‚Ä¢ Munic√≠pios identificados: {df['municipio'].nunique()}")
    
    print(f"\nüìû CONTATO:")
    print(f"  ‚Ä¢ Tipos de telefone: {df['tipo_telefone'].nunique()}")
    print(f"  ‚Ä¢ Dom√≠nios de email √∫nicos: {df['dominio_email'].nunique()}")
    
    print(f"\nüé® FORMATA√á√ÉO:")
    print(f"  ‚Ä¢ Padr√µes de formata√ß√£o √∫nicos: {df['padrao_formatacao'].nunique()}")
    print(f"  ‚Ä¢ Endere√ßos √∫nicos: {df['endereco'].nunique():,}")
    
    print(f"\n‚úÖ Dados prontos para an√°lise e transforma√ß√£o na camada Prata!")