In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import ipywidgets as widgets
from IPython.display import display, clear_output

plt.style.use('default')
plt.rcParams['figure.figsize'] = (12, 8)

paleta = ["#B500C5", '#FF69B4', "#FF0000", "#31FF98", '#B22222', "#602668"]
plt.rcParams['axes.prop_cycle'] = plt.cycler(color=paleta)

In [3]:
df = pd.read_csv('dados_normalizados/comparacao_idhm_idade_mae.csv')

if 'IDHM' not in df.columns:
    df['IDHM'] = df[['IDHM_Educacao', 'IDHM_Renda', 'IDHM_Longevidade']].mean(axis=1)

faixas_etarias = sorted(df['Faixa_Etaria'].unique())

print(" Dados carregados com sucesso!")
print(f"‚Ä¢ Per√≠odo: {df['Ano'].min()} - {df['Ano'].max()}")
print(f"‚Ä¢ Estados: {df['Estado'].nunique()}")
print(f"‚Ä¢ Faixas et√°rias: {len(faixas_etarias)}")

print("\nINDICADOR PRINCIPAL: IDHM GERAL")
print("   (Combina Educa√ß√£o, Renda e Longevidade)")

print("\n FAIXAS ET√ÅRIAS DISPON√çVEIS:")
for i, faixa in enumerate(faixas_etarias, 1):
    print(f"   {i:2d}. {faixa}")

 Dados carregados com sucesso!
‚Ä¢ Per√≠odo: 2000 - 2021
‚Ä¢ Estados: 27
‚Ä¢ Faixas et√°rias: 10

INDICADOR PRINCIPAL: IDHM GERAL
   (Combina Educa√ß√£o, Renda e Longevidade)

 FAIXAS ET√ÅRIAS DISPON√çVEIS:
    1. 10-14 anos
    2. 15-19 anos
    3. 20-24 anos
    4. 25-29 anos
    5. 30-34 anos
    6. 35-39 anos
    7. 40-44 anos
    8. Idade ignorada
    9. Menor de 10 anos
   10. Outras idades


In [4]:
def plot_correlacao_idhm_geral(ano=2021, faixa_etaria='15-19 anos'):
    dados_faixa = df[(df['Ano'] == ano) & (df['Faixa_Etaria'] == faixa_etaria)]
    
    if dados_faixa.empty:
        print(f" N√£o h√° dados para {faixa_etaria} no ano {ano}")
        return
    
    fig, ax = plt.subplots(figsize=(11, 7))
    
    # Calcular correla√ß√£o com IDHM Geral
    correlacao = dados_faixa['Percentual'].corr(dados_faixa['IDHM'])
    
    scatter = ax.scatter(dados_faixa['IDHM'], dados_faixa['Percentual'],
                        alpha=0.7, s=80, c=dados_faixa['Percentual'], 
                        cmap='RdPu', vmin=dados_faixa['Percentual'].min(), 
                        vmax=dados_faixa['Percentual'].max())
    
    z = np.polyfit(dados_faixa['IDHM'], dados_faixa['Percentual'], 1)
    p = np.poly1d(z)
    ax.plot(dados_faixa['IDHM'], p(dados_faixa['IDHM']), 
            color='#8B0000', linewidth=3, alpha=0.8, linestyle='--')
    
    ax.set_xlabel('IDHM Geral (0-1 escala)', fontweight='bold', fontsize=12)
    ax.set_ylabel(f'% M√£es {faixa_etaria}', fontweight='bold', fontsize=12)
    ax.set_title(f'CORRELA√á√ÉO: IDHM Geral vs M√£es {faixa_etaria} ({ano})\n'
                f'Rela√ß√£o: {correlacao:.3f}', 
                fontsize=14, fontweight='bold', pad=20)
    ax.grid(True, alpha=0.3)
    
    cbar = plt.colorbar(scatter, ax=ax)
    cbar.set_label(f'% M√£es {faixa_etaria}', rotation=270, labelpad=15, fontweight='bold')
    
    plt.tight_layout()
    plt.show()
    
    print(f"\nüîç AN√ÅLISE DETALHADA - {faixa_etaria} ({ano})")
    print("=" * 60)
    
    print(f"\n CORRELA√á√ÉO: {correlacao:.3f}")
    
    if correlacao < -0.7:
        forca = "FORTE NEGATIVA"
        interpretacao = "Quanto MAIOR o IDHM, MENOR a porcentagem de m√£es"
    elif correlacao < -0.5:
        forca = "MODERADA NEGATIVA" 
        interpretacao = "IDHM maior tende a ter menos m√£es nesta faixa"
    elif correlacao < -0.3:
        forca = "FRACA NEGATIVA"
        interpretacao = "Leve tend√™ncia de menos m√£es com IDHM maior"
    elif correlacao > 0.7:
        forca = "FORTE POSITIVA"
        interpretacao = "Quanto MAIOR o IDHM, MAIOR a porcentagem de m√£es"
    elif correlacao > 0.5:
        forca = "MODERADA POSITIVA"
        interpretacao = "IDHM maior tende a ter mais m√£es nesta faixa"
    elif correlacao > 0.3:
        forca = "FRACA POSITIVA"
        interpretacao = "Leve tend√™ncia de mais m√£es com IDHM maior"
    else:
        forca = "MUITO FRACA/INEXISTENTE"
        interpretacao = "Pouca ou nenhuma rela√ß√£o linear detectada"
    
    print(f"‚Ä¢ For√ßa da rela√ß√£o: {forca}")
    print(f"‚Ä¢ Interpreta√ß√£o: {interpretacao}")
    
    # 2. AN√ÅLISE DOS EXTREMOS
    print(f"\n ESTADOS DESTAQUE:")
    
    # Estado com maior percentual
    maior_percentual = dados_faixa.loc[dados_faixa['Percentual'].idxmax()]
    print(f"‚Ä¢ MAIOR %: {maior_percentual['Estado']} - {maior_percentual['Percentual']:.1f}% (IDHM: {maior_percentual['IDHM']:.3f})")
    
    # Estado com menor percentual  
    menor_percentual = dados_faixa.loc[dados_faixa['Percentual'].idxmin()]
    print(f"‚Ä¢ MENOR %: {menor_percentual['Estado']} - {menor_percentual['Percentual']:.1f}% (IDHM: {menor_percentual['IDHM']:.3f})")
    
    # 3. AN√ÅLISE POR FAIXA DE IDHM
    print(f"\n DISTRIBUI√á√ÉO POR FAIXAS DE IDHM:")
    
    dados_faixa['Faixa_IDHM'] = pd.cut(dados_faixa['IDHM'], 
                                     bins=[0, 0.699, 0.799, 1.0],
                                     labels=['M√©dio (‚â§0.699)', 'Alto (0.700-0.799)', 'Muito Alto (‚â•0.800)'])
    
    stats_faixas = dados_faixa.groupby('Faixa_IDHM')['Percentual'].agg(['mean', 'count'])
    
    for faixa_idhm, dados in stats_faixas.iterrows():
        if not pd.isna(faixa_idhm):
            print(f"‚Ä¢ {faixa_idhm}: {dados['mean']:.1f}% ({int(dados['count'])} estados)")
    
    # 4. AN√ÅLISE DA LINHA DE TEND√äNCIA
    print(f"\nLINHA DE TEND√äNCIA:")
    coef_angular = z[0]  # Coeficiente angular da reta
    coef_linear = z[1]   # Coeficiente linear
    
    print(f"‚Ä¢ Inclina√ß√£o: {coef_angular:.2f}% por ponto de IDHM")
    print(f"‚Ä¢ Interpreta√ß√£o: Cada 0.1 de aumento no IDHM est√° associado a {abs(coef_angular * 0.1):.2f}% {'redu√ß√£o' if coef_angular < 0 else 'aumento'} na maternidade")
    
    # 5. AN√ÅLISE DE OUTLIERS
    print(f"\nüîç PONTOS FORA DO PADR√ÉO:")
    
    Q1 = dados_faixa['Percentual'].quantile(0.25)
    Q3 = dados_faixa['Percentual'].quantile(0.75)
    IQR = Q3 - Q1
    limite_superior = Q3 + 1.5 * IQR
    limite_inferior = Q1 - 1.5 * IQR
    
    outliers = dados_faixa[(dados_faixa['Percentual'] > limite_superior) | 
                          (dados_faixa['Percentual'] < limite_inferior)]
    
    if not outliers.empty:
        for _, outlier in outliers.iterrows():
            tipo = "ACIMA" if outlier['Percentual'] > limite_superior else "ABAIXO"
            print(f"‚Ä¢ {outlier['Estado']}: {outlier['Percentual']:.1f}% ({tipo} do esperado)")
    else:
        print("‚Ä¢ Nenhum outlier significativo detectado")
    
    print(f"\nRECOMENDA√á√ïES E INSIGHTS:")
    
    if correlacao < -0.5:
        print("‚Ä¢ Desenvolvimento humano est√° associado a redu√ß√£o da maternidade precoce")
        print("‚Ä¢ Pol√≠ticas de IDHM podem ajudar a reduzir maternidade adolescente")
        print("‚Ä¢ Investir em educa√ß√£o parece ter efeito protetor")
    elif correlacao > 0.5:
        print("‚Ä¢ Desenvolvimento humano est√° associado a aumento desta maternidade")
        print("‚Ä¢ Pode indicar posterga√ß√£o saud√°vel da maternidade")
        print("‚Ä¢ Melhores condi√ß√µes permitem escolhas reprodutivas mais tardias")
    else:
        print("‚Ä¢ Rela√ß√£o complexa - outros fatores podem ser mais importantes")
        print("‚Ä¢ Necessidade de an√°lises mais espec√≠ficas por regi√£o")
        print("‚Ä¢ Considerar vari√°veis socioecon√¥micas adicionais")

print("üéõÔ∏è  CONTROLE - Correla√ß√£o IDHM Geral por ano e faixa et√°ria:")
interativo1 = widgets.interactive(plot_correlacao_idhm_geral, 
                   ano=widgets.IntSlider(value=2021, min=2000, max=2021, description='Ano:'),
                   faixa_etaria=widgets.Dropdown(
                       options=faixas_etarias, 
                       value='15-19 anos', 
                       description='Faixa Et√°ria:'))
display(interativo1)

üéõÔ∏è  CONTROLE - Correla√ß√£o IDHM Geral por ano e faixa et√°ria:


interactive(children=(IntSlider(value=2021, description='Ano:', max=2021, min=2000), Dropdown(description='Fai‚Ä¶

In [5]:
def plot_ranking_idhm_geral(ano=2021, top_n=10, faixa_etaria='15-19 anos'):
    dados_faixa = df[(df['Ano'] == ano) & (df['Faixa_Etaria'] == faixa_etaria)]
    
    if dados_faixa.empty:
        print(f"N√£o h√° dados para {faixa_etaria} no ano {ano}")
        return
    
    top_estados = dados_faixa.nlargest(top_n, 'Percentual')
    
    fig, ax = plt.subplots(figsize=(13, 8))
    
    cores = plt.cm.RdPu(np.linspace(0.3, 0.9, len(top_estados)))
    bars = ax.barh(top_estados['Estado'], top_estados['Percentual'], color=cores, alpha=0.8)
    
    ax.set_xlabel(f'% M√£es {faixa_etaria}', fontweight='bold', fontsize=12)
    ax.set_title(f'TOP {top_n} ESTADOS - Maior % de M√£es {faixa_etaria} ({ano})\n'
                f'IDHM Geral como indicador de desenvolvimento', 
                fontsize=14, fontweight='bold', pad=20)
    
    for bar in bars:
        width = bar.get_width()
        ax.text(width + 0.1, bar.get_y() + bar.get_height()/2, 
               f'{width:.1f}%', ha='left', va='center', fontweight='bold', fontsize=10)
    
    ax.grid(True, alpha=0.3, axis='x')
    plt.tight_layout()
    plt.show()

    print(f"\n AN√ÅLISE DETALHADA DO RANKING - {faixa_etaria} ({ano})")
    print("=" * 70)
    
    print(f"\n TOP {top_n} ESTADOS - AN√ÅLISE:")
    
    # Calcular estat√≠sticas do grupo
    media_top = top_estados['Percentual'].mean()
    media_idhm_top = top_estados['IDHM'].mean()
    media_geral = dados_faixa['Percentual'].mean()
    media_idhm_geral = dados_faixa['IDHM'].mean()
    
    print(f"‚Ä¢ M√©dia do Top {top_n}: {media_top:.1f}% (IDHM: {media_idhm_top:.3f})")
    print(f"‚Ä¢ M√©dia de Todos Estados: {media_geral:.1f}% (IDHM: {media_idhm_geral:.3f})")
    print(f"‚Ä¢ Diferen√ßa: +{media_top - media_geral:.1f}% | IDHM: {media_idhm_top - media_idhm_geral:+.3f}")
    
    print(f"\n DISTRIBUI√á√ÉO REGIONAL NO TOP {top_n}:")
    
    regioes = {
        'NORTE': ['Acre', 'Amap√°', 'Amazonas', 'Par√°', 'Rond√¥nia', 'Roraima', 'Tocantins'],
        'NORDESTE': ['Alagoas', 'Bahia', 'Cear√°', 'Maranh√£o', 'Para√≠ba', 'Pernambuco', 'Piau√≠', 'Rio Grande do Norte', 'Sergipe'],
        'CENTRO-OESTE': ['Distrito Federal', 'Goi√°s', 'Mato Grosso', 'Mato Grosso do Sul'],
        'SUDESTE': ['Esp√≠rito Santo', 'Minas Gerais', 'Rio de Janeiro', 'S√£o Paulo'],
        'SUL': ['Paran√°', 'Rio Grande do Sul', 'Santa Catarina']
    }
    
    contagem_regioes = {}
    for regiao, estados in regioes.items():
        estados_no_top = [estado for estado in top_estados['Estado'] if estado in estados]
        contagem_regioes[regiao] = len(estados_no_top)
        if estados_no_top:
            print(f"‚Ä¢ {regiao}: {len(estados_no_top)} estado(s) - {', '.join(estados_no_top)}")
    
    correlacao_top = top_estados['Percentual'].corr(top_estados['IDHM'])
    correlacao_geral = dados_faixa['Percentual'].corr(dados_faixa['IDHM'])
    
    print(f"\n CORRELA√á√ÉO NO TOP {top_n}:")
    print(f"‚Ä¢ Correla√ß√£o Top {top_n}: {correlacao_top:.3f}")
    print(f"‚Ä¢ Correla√ß√£o Geral: {correlacao_geral:.3f}")
    
    if abs(correlacao_top) > abs(correlacao_geral):
        print("‚Ä¢Rela√ß√£o mais forte entre IDHM e maternidade nos estados com maiores percentuais")
    else:
        print("‚Ä¢Rela√ß√£o mais fraca entre IDHM e maternidade nos estados com maiores percentuais")
    
    # 4. AN√ÅLISE DE TEND√äNCIAS TEMPORAIS
    print(f"\nEVOLU√á√ÉO DOS ESTADOS DO TOP:")
    
    # Verificar se esses estados estavam no top em anos anteriores
    anos_comparacao = [2000, 2010] if ano > 2010 else [2000]
    
    for ano_comp in anos_comparacao:
        if ano_comp < ano:
            dados_ano_anterior = df[(df['Ano'] == ano_comp) & (df['Faixa_Etaria'] == faixa_etaria)]
            if not dados_ano_anterior.empty:
                estados_no_top_anterior = []
                for estado in top_estados['Estado']:
                    if estado in dados_ano_anterior['Estado'].values:
                        percentual_anterior = dados_ano_anterior[dados_ano_anterior['Estado'] == estado]['Percentual'].values[0]
                        percentual_atual = top_estados[top_estados['Estado'] == estado]['Percentual'].values[0]
                        mudanca = percentual_atual - percentual_anterior
                        if abs(mudanca) > 1:  # Mudan√ßa significativa
                            direcao = "üìà AUMENTOU" if mudanca > 0 else "üìâ REDUZIU"
                            estados_no_top_anterior.append(f"{estado} ({direcao} {abs(mudanca):.1f}%)")
                
                if estados_no_top_anterior:
                    print(f"‚Ä¢ {ano_comp} ‚Üí {ano}: {', '.join(estados_no_top_anterior[:3])}")
    
    # 5. AN√ÅLISE DE POL√çTICAS P√öBLICAS
    print(f"\nIMPLICA√á√ïES PARA POL√çTICAS P√öBLICAS:")
    
    # Classificar o problema baseado na faixa et√°ria
    if faixa_etaria in ['10-14 anos', '15-19 anos']:
        print("‚Ä¢ESTADOS CR√çTICOS: Necessitam de interven√ß√µes urgentes")
        print("‚Ä¢ Foco em: Educa√ß√£o sexual, preven√ß√£o, prote√ß√£o √† adolesc√™ncia")
        print("‚Ä¢ Programas: Bolsa Fam√≠lia condicionado √† frequ√™ncia escolar")
        
        # Estados com maior gravidade
        if faixa_etaria == '10-14 anos':
            estados_criticos = top_estados[top_estados['Percentual'] > 1.0]
            if not estados_criticos.empty:
                print(f"‚Ä¢ üî¥ ALERTA M√ÅXIMO: {len(estados_criticos)} estado(s) com gravidez infantil >1%")
    
    elif faixa_etaria in ['25-29 anos', '30-34 anos']:
        print("‚Ä¢PADR√ÉO SAUD√ÅVEL: Maternidade em idade adulta")
        print("‚Ä¢Foco em: Planejamento familiar, apoio √† maternidade")
        print("‚Ä¢Programas: Licen√ßa-maternidade, creches, apoio √† dupla jornada")
    
    # 6. RECOMENDA√á√ïES ESPEC√çFICAS
    print(f"\nRECOMENDA√á√ïES ESPEC√çFICAS:")
    
    # Estados com baixo IDHM e alto percentual (mais preocupantes)
    estados_prioridade = top_estados[top_estados['IDHM'] < 0.700]
    if not estados_prioridade.empty:
        print("‚Ä¢ üî¥ PRIORIDADE ABSOLUTA (Baixo IDHM + Alto %):")
        for _, estado in estados_prioridade.iterrows():
            print(f"  - {estado['Estado']}: {estado['Percentual']:.1f}% (IDHM: {estado['IDHM']:.3f})")
    
    # Estados com alto IDHM e alto percentual (casos at√≠picos)
    estados_atipicos = top_estados[top_estados['IDHM'] > 0.800]
    if not estados_atipicos.empty and faixa_etaria in ['10-14 anos', '15-19 anos']:
        print("‚Ä¢CASOS AT√çPICOS (Alto IDHM + Alto %):")
        for _, estado in estados_atipicos.iterrows():
            print(f"  - {estado['Estado']}: Investigar causas espec√≠ficas")

print("üéõÔ∏è  CONTROLES - Ranking por faixa et√°ria (IDHM Geral):")
interativo2 = widgets.interactive(plot_ranking_idhm_geral,
                   ano=widgets.IntSlider(value=2021, min=2000, max=2021, description='Ano:'),
                   top_n=widgets.IntSlider(value=10, min=5, max=15, description='Top N:'),
                   faixa_etaria=widgets.Dropdown(
                       options=faixas_etarias, 
                       value='15-19 anos', 
                       description='Faixa Et√°ria:'))
display(interativo2)

üéõÔ∏è  CONTROLES - Ranking por faixa et√°ria (IDHM Geral):


interactive(children=(IntSlider(value=2021, description='Ano:', max=2021, min=2000), IntSlider(value=10, descr‚Ä¶

In [6]:
print("EVOLU√á√ÉO COMPLETA: IDHM GERAL vs MATERNIDADE")
print("=" * 65)

def plot_evolucao_idhm_geral(tipo_analise='Todos Estados', faixa_etaria='15-19 anos', estado_selecionado='Acre'):
    
    if tipo_analise == 'Todos Estados':
        dados_faixa = df[df['Faixa_Etaria'] == faixa_etaria]
        
        if dados_faixa.empty:
            print(f"N√£o h√° dados para {faixa_etaria}")
            return

        fig, (ax, ax_legenda) = plt.subplots(1, 2, figsize=(22, 10), 
                                            gridspec_kw={'width_ratios': [3, 1]})
        
        estados_unicos = sorted(dados_faixa['Estado'].unique())
        
        print(f"Plotando {len(estados_unicos)} estados para {faixa_etaria}")
        print("DICA: Passe o mouse sobre as linhas para ver o nome do estado!")
        
        regioes = {
            'NORTE': ['Acre', 'Amap√°', 'Amazonas', 'Par√°', 'Rond√¥nia', 'Roraima', 'Tocantins'],
            'NORDESTE': ['Alagoas', 'Bahia', 'Cear√°', 'Maranh√£o', 'Para√≠ba', 'Pernambuco', 'Piau√≠', 'Rio Grande do Norte', 'Sergipe'],
            'CENTRO-OESTE': ['Distrito Federal', 'Goi√°s', 'Mato Grosso', 'Mato Grosso do Sul'],
            'SUDESTE': ['Esp√≠rito Santo', 'Minas Gerais', 'Rio de Janeiro', 'S√£o Paulo'],
            'SUL': ['Paran√°', 'Rio Grande do Sul', 'Santa Catarina']
        }
        
        cores_por_regiao = {
            'NORTE': ['#FF0000', "#DF4156", "#CA3939", "#550303", "#A31780", "#E77E6C", "#F182B6CE"],
            'NORDESTE': ['#FF8C00', "#FFBB00", "#DDCA5D", "#DAB820", '#B8860B', "#4B2D07", "#AD6200", '#D2691E', "#BB8F4C"],
            'CENTRO-OESTE': ['#32CD32', '#228B22', '#006400', '#9ACD32'],
            'SUDESTE': ['#1E90FF', "#739ABE", "#6FDBDF", '#000080'],
            'SUL': ['#8A2BE2', '#4B0082', '#9400D3']
        }
        
        cores_estados = {}
        for regiao, estados in regioes.items():
            cores_regiao = cores_por_regiao[regiao]
            for i, estado in enumerate(estados):
                if i < len(cores_regiao):
                    cores_estados[estado] = cores_regiao[i]

        linhas_por_estado = {}
        
        for estado in estados_unicos:
            dados_estado = dados_faixa[dados_faixa['Estado'] == estado]
            cor = cores_estados.get(estado, '#666666')
            
            # Definir valores padr√£o para alpha e linewidth
            alpha = 0.8
            linewidth = 2.0
            
            if estado in regioes['NORTE']:
                estilo = 'o-'  
                linewidth = 2.2
                alpha = 0.9
            elif estado in regioes['NORDESTE']:
                estilo = 's-'  
                alpha = 0.8
                linewidth = 2.0
            elif estado in regioes['CENTRO-OESTE']:
                estilo = '^-'
                alpha = 0.7
                linewidth = 1.8
            elif estado in regioes['SUDESTE']:
                estilo = 'd-'
                alpha = 0.7
                linewidth = 1.8
            elif estado in regioes['SUL']:
                estilo = '*-'
                alpha = 0.7
                linewidth = 1.8
            else:
                estilo = 'x-'
                alpha = 0.6
                linewidth = 1.6
                
            linha = ax.plot(dados_estado['Ano'], dados_estado['Percentual'], 
                          estilo, color=cor, linewidth=linewidth, markersize=4, alpha=alpha,
                          label=estado, picker=True, pickradius=5)[0]  
            
            linhas_por_estado[linha] = estado
        
        ax.set_ylabel(f'% M√£es {faixa_etaria}', fontweight='bold', fontsize=12)
        ax.set_xlabel('Ano', fontweight='bold', fontsize=12)
        ax.set_title(f'TODOS OS 27 ESTADOS: % M√£es {faixa_etaria}\n'
                    'NORTE | NORDESTE | CENTRO-OESTE | SUDESTE | SUL', 
                    fontsize=16, fontweight='bold', pad=20)
        
        evolucao_media = dados_faixa.groupby('Ano')['Percentual'].mean()
        linha_media = ax.plot(evolucao_media.index, evolucao_media.values, 
               'k-', linewidth=4, alpha=1.0, label='MEDIA BRASIL')[0]
        
        ax.grid(True, alpha=0.3)
        
        
        ax_legenda.axis('off')
        ax_legenda.set_title('LEGENDA POR REGIAO\n' + '-'*20, fontweight='bold', fontsize=20, pad=28)

        y_pos = 0.95
        for regiao, estados_regiao in regioes.items():
            ax_legenda.text(0.02, y_pos, f'{regiao}', 
                          fontweight='bold', fontsize=10, 
                          color=cores_por_regiao[regiao][0],
                          transform=ax_legenda.transAxes)
            y_pos -= 0.04
            
            for estado in estados_regiao:
                if estado in estados_unicos:
                    ax_legenda.text(0.05, y_pos, f'{estado}', 
                                  fontsize=8, color=cores_estados[estado],
                                  transform=ax_legenda.transAxes)
                    y_pos -= 0.025
            
            y_pos -= 0.01 
        
        ax_legenda.text(0.02, y_pos, 'MEDIA BRASIL', 
                      fontweight='bold', fontsize=10, color='black',
                      transform=ax_legenda.transAxes)

        percentual_medio_2021 = dados_faixa[dados_faixa['Ano'] == 2021]['Percentual'].mean()
        
        print(f"\n ESTATISTICAS {faixa_etaria} (2021):")
        print(f"   ‚Ä¢ Media Brasil: {percentual_medio_2021:.1f}%")
        
        # Estat√≠sticas por regi√£o
        dados_2021 = dados_faixa[dados_faixa['Ano'] == 2021]
        for regiao, estados in regioes.items():
            estados_presentes = [e for e in estados if e in estados_unicos]
            if estados_presentes:
                media_regiao = dados_2021[dados_2021['Estado'].isin(estados_presentes)]['Percentual'].mean()
                print(f"   ‚Ä¢ {regiao}: {media_regiao:.1f}%")
        
    elif tipo_analise == 'Compara√ß√£o IDHM Geral':
        dados_faixa = df[(df['Faixa_Etaria'] == faixa_etaria) & (df['Estado'] == estado_selecionado)]
        
        if dados_faixa.empty:
            print(f"N√£o h√° dados para {estado_selecionado} - {faixa_etaria}")
            return
            
        fig, ax = plt.subplots(figsize=(14, 8))
        
        ax1 = ax
        cor1 = '#DC143C'
        ax1.set_xlabel('Ano', fontweight='bold', fontsize=12)
        ax1.set_ylabel(f'% M√£es {faixa_etaria}', color=cor1, fontweight='bold', fontsize=12)
        line1 = ax1.plot(dados_faixa['Ano'], dados_faixa['Percentual'], 
                        'o-', color=cor1, linewidth=3, markersize=6,
                        label=f'% M√£es {faixa_etaria}')
        ax1.tick_params(axis='y', labelcolor=cor1)
        
        ax2 = ax1.twinx()
        cor2 = '#FF69B4'
        ax2.set_ylabel('IDHM Geral', color=cor2, fontweight='bold', fontsize=12)
        line2 = ax2.plot(dados_faixa['Ano'], dados_faixa['IDHM'], 
                        's--', color=cor2, linewidth=2, markersize=5,
                        label='IDHM Geral')
        ax2.tick_params(axis='y', labelcolor=cor2)
        
        lines = line1 + line2
        labels = [l.get_label() for l in lines]
        ax1.legend(lines, labels, loc='upper left', fontsize=11)
        
        ax.set_title(f'{estado_selecionado}: % M√£es vs IDHM Geral ({faixa_etaria})', 
                    fontsize=14, fontweight='bold', pad=20)
        ax.grid(True, alpha=0.3)
    
    elif tipo_analise == 'Estados por Regi√£o':
        fig, ax = plt.subplots(figsize=(20, 15))
        
        dados_faixa = df[df['Faixa_Etaria'] == faixa_etaria]
        
        regioes = {
            'NORTE': ['Acre', 'Amap√°', 'Amazonas', 'Par√°', 'Rond√¥nia', 'Roraima', 'Tocantins'],
            'NORDESTE': ['Alagoas', 'Bahia', 'Cear√°', 'Maranh√£o', 'Para√≠ba', 'Pernambuco', 'Piau√≠', 'Rio Grande do Norte', 'Sergipe'],
            'CENTRO-OESTE': ['Distrito Federal', 'Goi√°s', 'Mato Grosso', 'Mato Grosso do Sul'],
            'SUDESTE': ['Esp√≠rito Santo', 'Minas Gerais', 'Rio de Janeiro', 'S√£o Paulo'],
            'SUL': ['Paran√°', 'Rio Grande do Sul', 'Santa Catarina']
        }
        
        cores_regioes = {'NORTE': '#FF0000', 'NORDESTE': '#FF8C00', 'CENTRO-OESTE': '#32CD32', 
                        'SUDESTE': '#1E90FF', 'SUL': '#8A2BE2'}
        
        for regiao, estados in regioes.items():
            dados_regiao = dados_faixa[dados_faixa['Estado'].isin(estados)]
            evolucao_media_regiao = dados_regiao.groupby('Ano')['Percentual'].mean()
            
            ax.plot(evolucao_media_regiao.index, evolucao_media_regiao.values,
                   'o-', color=cores_regioes[regiao], linewidth=3, markersize=6,
                   label=regiao, alpha=0.8)
        
        ax.set_ylabel(f'% M√£es {faixa_etaria}', fontweight='bold', fontsize=12)
        ax.set_xlabel('Ano', fontweight='bold', fontsize=16)
        ax.set_title(f'EVOLUCAO POR REGIAO: % M√£es {faixa_etaria}\n'
                    'Media de cada regiao brasileira', 
                    fontsize=18, fontweight='bold', pad=25)
        ax.legend(fontsize=11)
        ax.grid(True, alpha=0.3)
        
        # Estat√≠sticas por regi√£o
        print("COMPARACAO REGIONAL (2021):")
        dados_2021 = dados_faixa[dados_faixa['Ano'] == 2021]
        for regiao, estados in regioes.items():
            media_regiao = dados_2021[dados_2021['Estado'].isin(estados)]['Percentual'].mean()
            print(f"   ‚Ä¢ {regiao}: {media_regiao:.1f}%")
    
    plt.tight_layout()
    plt.show()
    
    print("\nEXPLICACAO:")
    if tipo_analise == 'Todos Estados':
        print("‚Ä¢ NORTE: Estados com maiores % (cores vermelhas)")
        print("‚Ä¢ NORDESTE: Estados com % elevados (cores laranjas)")
        print("‚Ä¢ CENTRO-OESTE: % intermediarios (cores verdes)")
        print("‚Ä¢ SUDESTE: % mais baixos (cores azuis)") 
        print("‚Ä¢ SUL: % mais baixos (cores roxas)")
        
    elif tipo_analise == 'Estados por Regi√£o':
        print("‚Ä¢ VIS√ÉO REGIONAL: Media de cada regiao")
        print("‚Ä¢ Norte: Sempre maiores % de maternidade precoce")
        print("‚Ä¢ Sul/Sudeste: Sempre menores %")
        
    else:
        print(f"‚Ä¢ ANALISE INDIVIDUAL: {estado_selecionado}")
        print("‚Ä¢ Tendencia ideal: % maes ‚Üì e IDHM Geral ‚Üë")

print("CONTROLES - Analise com Interatividade:")
interativo5 = widgets.interactive(plot_evolucao_idhm_geral,
    tipo_analise=widgets.RadioButtons(
        options=['Todos Estados', 'Compara√ß√£o IDHM Geral', 'Estados por Regi√£o'],
        value='Todos Estados',
        description='Tipo de Analise:',
        style={'description_width': 'initial'}
    ),
    faixa_etaria=widgets.Dropdown(
        options=faixas_etarias,
        value='15-19 anos',
        description='Faixa Etaria:',
        style={'description_width': 'initial'}
    ),
    estado_selecionado=widgets.Dropdown(
        options=sorted(df['Estado'].unique()),
        value='Acre',
        description='Estado:',
        style={'description_width': 'initial'}
    )
)
display(interativo5)

EVOLU√á√ÉO COMPLETA: IDHM GERAL vs MATERNIDADE
CONTROLES - Analise com Interatividade:


interactive(children=(RadioButtons(description='Tipo de Analise:', options=('Todos Estados', 'Compara√ß√£o IDHM ‚Ä¶

In [7]:
def analises_estatisticas_completas_todas_faixas(ano_analise=2021):
    """
    Realiza an√°lises estat√≠sticas para todas as faixas et√°rias
    e exibe os 3 gr√°ficos principais.
    """
    
    global df
    
    if 'df' not in globals():
        print("ERRO: DataFrame 'df' n√£o encontrado!")
        return
    
    if df is None or df.empty:
        print("ERRO: DataFrame est√° vazio!")
        return
    
    # Configura√ß√µes de estilo
    plt.style.use('seaborn-v0_8-whitegrid')
    
    # Filtrar dados do ano
    dados_ano = df[df['Ano'] == ano_analise]
    
    if dados_ano.empty:
        print(f"N√£o h√° dados para {ano_analise}")
        return
    
    # =========================================================================
    # C√ÅLCULO DAS ESTAT√çSTICAS
    # =========================================================================
    todas_faixas = sorted(dados_ano['Faixa_Etaria'].unique())
    
    stats_por_faixa = []
    for faixa in todas_faixas:
        dados_faixa = dados_ano[dados_ano['Faixa_Etaria'] == faixa]
        
        if not dados_faixa.empty:
            stats = {
                'Faixa_Etaria': faixa,
                'M√©dia': dados_faixa['Percentual'].mean(),
                'Desvio_Padr√£o': dados_faixa['Percentual'].std(),
                'Correla√ß√£o_IDHM': dados_faixa['Percentual'].corr(dados_faixa['IDHM']),
            }
            stats_por_faixa.append(stats)
    
    df_stats = pd.DataFrame(stats_por_faixa)
    
    # Ordenar por faixa et√°ria
    ordem_faixas = ['10-14 anos', '15-19 anos', '20-24 anos', '25-29 anos', 
                   '30-34 anos', '35-39 anos', '40-44 anos']
    df_stats['Faixa_Ordenada'] = pd.Categorical(df_stats['Faixa_Etaria'], 
                                                categories=ordem_faixas, ordered=True)
    df_stats = df_stats.sort_values('Faixa_Ordenada').drop('Faixa_Ordenada', axis=1)
    
    # Ordenar por correla√ß√£o para gr√°fico 2
    df_stats_sorted = df_stats.sort_values('Correla√ß√£o_IDHM', ascending=True)
    
    # Calcular CV
    cv_values = [(row['Desvio_Padr√£o'] / row['M√©dia']) * 100 for _, row in df_stats.iterrows()]
    df_stats['CV'] = cv_values
    
    # =========================================================================
    # 3 GR√ÅFICOS PRINCIPAIS
    # =========================================================================
    fig = plt.figure(figsize=(18, 5))
    
    # Gr√°fico 1: M√©dias
    ax1 = plt.subplot(1, 3, 1)
    cores_gradiente = plt.cm.Reds(np.linspace(0.4, 0.9, len(df_stats)))
    
    # Preparar labels curtos
    labels_curtos = [f.split()[0] for f in df_stats['Faixa_Etaria']]
    x_pos = np.arange(len(df_stats))
    
    bars = ax1.bar(x_pos, df_stats['M√©dia'], 
                   color=cores_gradiente, edgecolor='black', linewidth=1.2, 
                   width=0.7, zorder=3)
    
    ax1.set_xlabel('Faixa Et√°ria', fontweight='bold', fontsize=11, labelpad=10)
    ax1.set_ylabel('M√©dia (%)', fontweight='bold', fontsize=11, labelpad=10)
    ax1.set_title(f'M√âDIA DE MATERNIDADE\nPOR FAIXA ET√ÅRIA ({ano_analise})', 
                  fontweight='bold', fontsize=12, pad=15, color='#2c3e50')
    
    # Configurar ticks corretamente
    ax1.set_xticks(x_pos)
    ax1.set_xticklabels(labels_curtos, rotation=45, fontsize=10, ha='right')
    
    ax1.grid(True, axis='y', alpha=0.2, linestyle='--', zorder=0)
    
    # Valores nas barras
    for bar, media in zip(bars, df_stats['M√©dia']):
        height = bar.get_height()
        ax1.text(bar.get_x() + bar.get_width()/2., height + max(df_stats['M√©dia'])*0.02,
                f'{media:.1f}%', ha='center', va='bottom', 
                fontweight='bold', fontsize=9,
                bbox=dict(boxstyle="round,pad=0.2", facecolor="white", 
                         edgecolor="gray", alpha=0.8))
    
    # Gr√°fico 2: Correla√ß√£o
    ax2 = plt.subplot(1, 3, 2)
    
    # Preparar dados para gr√°fico 2
    labels_curtos2 = [f.split()[0] for f in df_stats_sorted['Faixa_Etaria']]
    y_pos = np.arange(len(df_stats_sorted))
    
    # Gradiente de cores
    norm = plt.Normalize(-1, 1)
    cores_corr = plt.cm.RdYlBu_r(norm(df_stats_sorted['Correla√ß√£o_IDHM']))
    
    bars2 = ax2.barh(y_pos, df_stats_sorted['Correla√ß√£o_IDHM'], 
                     color=cores_corr, edgecolor='black', linewidth=1, 
                     height=0.7, zorder=3)
    
    ax2.set_xlabel('Correla√ß√£o com IDHM', fontweight='bold', fontsize=11, labelpad=10)
    ax2.set_title(f'CORRELA√á√ÉO COM IDHM\nPOR FAIXA ET√ÅRIA ({ano_analise})', 
                  fontweight='bold', fontsize=12, pad=15, color='#2c3e50')
    
    ax2.axvline(x=0, color='black', linestyle='-', linewidth=1.5, alpha=0.5)
    ax2.grid(True, axis='x', alpha=0.2, linestyle='--', zorder=0)
    
    # Configurar ticks corretamente
    ax2.set_yticks(y_pos)
    ax2.set_yticklabels(labels_curtos2, fontsize=10)
    
    # Valores nas barras
    for bar, correl in zip(bars2, df_stats_sorted['Correla√ß√£o_IDHM']):
        width = bar.get_width()
        color = 'white' if abs(width) > 0.5 else 'black'
        ha_pos = 'left' if width >= 0 else 'right'
        x_pos_text = width + (0.02 if width >= 0 else -0.02)
        
        ax2.text(x_pos_text, bar.get_y() + bar.get_height()/2,
                f'{correl:.3f}', ha=ha_pos, va='center', 
                fontweight='bold', fontsize=9, color=color,
                bbox=dict(boxstyle="round,pad=0.2", facecolor="white", 
                         edgecolor="gray", alpha=0.7))
    
    # Gr√°fico 3: Variabilidade (CV)
    ax3 = plt.subplot(1, 3, 3)
    
    # Preparar cores baseadas no CV
    cores_cv = []
    for cv in cv_values:
        if cv < 15:
            cores_cv.append('#2ecc71')  # Verde
        elif cv < 30:
            cores_cv.append('#f39c12')  # Laranja
        else:
            cores_cv.append('#e74c3c')  # Vermelho
    
    bars3 = ax3.bar(x_pos, cv_values, 
                    color=cores_cv, alpha=0.8, edgecolor='black', 
                    linewidth=1.5, width=0.7)
    
    ax3.set_xlabel('Faixa Et√°ria', fontweight='bold', fontsize=11, labelpad=10)
    ax3.set_ylabel('Coeficiente de Varia√ß√£o (%)', fontweight='bold', fontsize=11, labelpad=10)
    ax3.set_title('VARIABILIDADE ENTRE ESTADOS\nPOR FAIXA ET√ÅRIA', 
                  fontweight='bold', fontsize=12, pad=15, color='#2c3e50')
    
    # Linhas de refer√™ncia
    ax3.axhline(y=15, color='gray', linestyle='--', alpha=0.5, label='CV=15%')
    ax3.axhline(y=30, color='gray', linestyle='--', alpha=0.5, label='CV=30%')
    
    # Configurar ticks corretamente
    ax3.set_xticks(x_pos)
    ax3.set_xticklabels(labels_curtos, rotation=45, fontsize=10, ha='right')
    
    ax3.grid(True, axis='y', alpha=0.2, linestyle='--')
    ax3.legend(loc='upper right', fontsize=9)
    
    # Valores nas barras
    for bar, cv in zip(bars3, cv_values):
        height = bar.get_height()
        ax3.text(bar.get_x() + bar.get_width()/2., height + max(cv_values)*0.02,
                f'{cv:.1f}%', ha='center', va='bottom', 
                fontweight='bold', fontsize=9,
                bbox=dict(boxstyle="round,pad=0.2", facecolor="white", alpha=0.8))
    
    # Layout final
    plt.suptitle(f'AN√ÅLISE COMPARATIVA - FAIXAS ET√ÅRIAS ({ano_analise})', 
                fontsize=14, fontweight='bold', y=1.05, color='#2c3e50')
    
    fig.text(0.5, 0.01, f'Fonte: Sistema de Informa√ß√µes sobre Nascidos Vivos | Ano: {ano_analise}', 
             ha='center', fontsize=9, style='italic', alpha=0.7)
    
    plt.tight_layout()
    plt.show()
    
    # =========================================================================
    # RESUMO ESTAT√çSTICO
    # =========================================================================
    print(f"\n{'='*70}")
    print(f"RESUMO ESTAT√çSTICO - ANO {ano_analise}")
    print(f"{'='*70}")
    
    print("\nTABELA RESUMO:")
    print("-" * 85)
    print(f"{'Faixa':<12} {'M√©dia (%):':<10} {'Correla√ß√£o IDHM:':<18} {'CV (%):':<10} {'Interpreta√ß√£o'}")
    print("-" * 85)
    
    for idx, row in df_stats.iterrows():
        correl = row['Correla√ß√£o_IDHM']
        cv = row['CV']
        
        # Interpreta√ß√£o da correla√ß√£o
        if correl < -0.5:
            interpretacao = "Forte rela√ß√£o negativa"
        elif correl < -0.3:
            interpretacao = "Rela√ß√£o negativa moderada"
        elif correl > 0.5:
            interpretacao = "Forte rela√ß√£o positiva"
        elif correl > 0.3:
            interpretacao = "Rela√ß√£o positiva moderada"
        else:
            interpretacao = "Rela√ß√£o fraca"
        
        faixa_curta = row['Faixa_Etaria'].split()[0]
        print(f"{faixa_curta:<12} {row['M√©dia']:<10.1f} {correl:<18.3f} {cv:<10.1f} {interpretacao}")
    
    # =========================================================================
    # CONCLUS√ïES
    # =========================================================================
    print(f"\n{'='*70}")
    print("PRINCIPAIS CONCLUS√ïES:")
    print(f"{'='*70}")
    
    if not df_stats.empty:
        # Faixa com maior m√©dia
        faixa_maior_media = df_stats.loc[df_stats['M√©dia'].idxmax()]
        print(f"\n1. FAIXA COM MAIOR PREVAL√äNCIA:")
        print(f"   ‚Ä¢ {faixa_maior_media['Faixa_Etaria']}: {faixa_maior_media['M√©dia']:.1f}%")
        
        # Faixa mais sens√≠vel
        if 'Correla√ß√£o_IDHM' in df_stats.columns:
            faixa_mais_negativa = df_stats.loc[df_stats['Correla√ß√£o_IDHM'].idxmin()]
            print(f"\n2. FAIXA MAIS SENS√çVEL AO DESENVOLVIMENTO:")
            print(f"   ‚Ä¢ {faixa_mais_negativa['Faixa_Etaria']}: r = {faixa_mais_negativa['Correla√ß√£o_IDHM']:.3f}")
        
        # Faixa mais vari√°vel
        if 'CV' in df_stats.columns:
            faixa_mais_variavel = df_stats.loc[df_stats['CV'].idxmax()]
            print(f"\n3. FAIXA COM MAIOR VARIABILIDADE REGIONAL:")
            print(f"   ‚Ä¢ {faixa_mais_variavel['Faixa_Etaria']}: CV = {faixa_mais_variavel['CV']:.1f}%")
    
    print(f"\n{'='*70}")
    print("FIM DA AN√ÅLISE")
    print(f"{'='*70}")

# =============================================================================
# WIDGET INTERATIVO
# =============================================================================
print("AN√ÅLISE INTERATIVA - FAIXAS ET√ÅRIAS")
print("=" * 70)
print("\nUse o controle abaixo para selecionar o ano de an√°lise:")

# Criar controle (slider) separadamente e ligar ao output interativo
ano_slider = widgets.IntSlider(
    value=2021,
    min=2000,
    max=2021,
    step=1,
    description='Selecione o ano:',
    style={'description_width': 'initial'},
    layout={'width': '600px'},
    continuous_update=False  # Atualiza apenas quando soltar o slider
)

interativo = widgets.interactive_output(
    analises_estatisticas_completas_todas_faixas,
    {'ano_analise': ano_slider}
)

# Exibir controle e output separadamente
display(widgets.VBox([
    widgets.Label("Controle de Ano:"),
    ano_slider
]))

print("\n" + "="*70)
print("GR√ÅFICOS SER√ÉO EXIBIDOS ABAIXO:")
print("="*70)

# Exibir o output
display(interativo)

AN√ÅLISE INTERATIVA - FAIXAS ET√ÅRIAS

Use o controle abaixo para selecionar o ano de an√°lise:


VBox(children=(Label(value='Controle de Ano:'), IntSlider(value=2021, continuous_update=False, description='Se‚Ä¶


GR√ÅFICOS SER√ÉO EXIBIDOS ABAIXO:


Output()