In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path

# Configura√ß√µes de visualiza√ß√£o
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 10
plt.rcParams['axes.titlesize'] = 14
plt.rcParams['axes.labelsize'] = 12
plt.rcParams['xtick.labelsize'] = 10
plt.rcParams['ytick.labelsize'] = 10
plt.rcParams['legend.fontsize'] = 10
plt.rcParams['figure.titlesize'] = 16

In [2]:
# Configurar seaborn
sns.set_style("whitegrid")
sns.set_palette("husl")

In [3]:
# Fun√ß√£o para carregar e processar os dados
def carregar_dados_b4a(arquivo_path):
    """
    Carrega e processa os dados da aba B4A do arquivo Excel
    """
    # Ler a aba B4A
    df = pd.read_excel(arquivo_path, sheet_name='B4A', header=None)
    
    # Identificar onde come√ßam os dados reais (ap√≥s o cabe√ßalho)
    # Geralmente os dados come√ßam ap√≥s algumas linhas de metadados
    for i, row in df.iterrows():
        if 'TOTAL' in str(row.values[0]):
            data_start = i
            break
    
    # Extrair os nomes das colunas
    col_names = [
        'Categoria',
        'Total_escolas_com_computador',
        'Ate_5_alunos',
        'De_5_1_a_10',
        'De_10_1_a_15',
        'De_15_1_a_20',
        'De_20_1_a_30',
        'De_30_1_a_40',
        'De_40_1_a_50',
        'De_50_1_a_100',
        'Mais_de_100',
        'Sem_computador',
        'Sem_informacao'
    ]
    
    # Criar novo dataframe com os dados processados
    df_clean = df.iloc[data_start:].reset_index(drop=True)
    df_clean.columns = col_names
    
    # Limpar valores n√£o num√©ricos e converter para n√∫meros
    for col in col_names[1:]:
        df_clean[col] = pd.to_numeric(df_clean[col], errors='coerce')
    
    return df_clean


In [4]:
# Fun√ß√£o principal de an√°lise
def analisar_deficit_tecnologico(arquivo_path):
    """
    Realiza an√°lise completa do d√©ficit tecnol√≥gico educacional
    """
    print("=" * 80)
    print("AN√ÅLISE DO D√âFICIT TECNOL√ìGICO EDUCACIONAL BRASILEIRO")
    print("Dados: TIC Educa√ß√£o 2023 - Aba B4A")
    print("=" * 80)
    
    # Carregar dados
    df = carregar_dados_b4a(arquivo_path)

    # 1. AN√ÅLISE GERAL
    print("\n1. VIS√ÉO GERAL DO ACESSO A COMPUTADORES NAS ESCOLAS")
    print("-" * 50)
    
    total_row = df[df['Categoria'] == 'TOTAL'].iloc[0]
    total_escolas = total_row['Sem_computador'] + total_row['Total_escolas_com_computador']
    
    print(f"Total de escolas analisadas: {total_escolas:,.0f}")
    print(f"Escolas SEM computadores: {total_row['Sem_computador']:,.0f} ({total_row['Sem_computador']/total_escolas*100:.1f}%)")
    print(f"Escolas COM computadores: {total_row['Total_escolas_com_computador']:,.0f} ({total_row['Total_escolas_com_computador']/total_escolas*100:.1f}%)")
    
    # 2. AN√ÅLISE REGIONAL
    print("\n2. DESIGUALDADE REGIONAL")
    print("-" * 50)
    
    regioes = ['Norte', 'Nordeste', 'Sudeste', 'Sul', 'Centro-Oeste']
    analise_regional = []
    
    for regiao in regioes:
        row = df[df['Categoria'] == regiao].iloc[0]
        total_regiao = row['Sem_computador'] + row['Total_escolas_com_computador']
        pct_sem = (row['Sem_computador'] / total_regiao) * 100
        analise_regional.append({
            'Regi√£o': regiao,
            'Total Escolas': total_regiao,
            'Sem Computador': row['Sem_computador'],
            '% Sem Computador': pct_sem,
            'Com Computador': row['Total_escolas_com_computador'],
            '% Com Computador': 100 - pct_sem
        })
    
    df_regional = pd.DataFrame(analise_regional)
    df_regional = df_regional.sort_values('% Sem Computador', ascending=False)
    
    print("\nRanking de Exclus√£o Digital por Regi√£o:")
    for idx, row in df_regional.iterrows():
        print(f"{row['Regi√£o']:15} - {row['% Sem Computador']:5.1f}% sem computadores ({row['Sem Computador']:,.0f} de {row['Total Escolas']:,.0f} escolas)")
    
    # 3. AN√ÅLISE URBANO VS RURAL
    print("\n3. DISPARIDADE URBANO-RURAL")
    print("-" * 50)
    
    for area in ['Urbana', 'Rural']:
        row = df[df['Categoria'] == area].iloc[0]
        total_area = row['Sem_computador'] + row['Total_escolas_com_computador']
        pct_sem = (row['Sem_computador'] / total_area) * 100
        print(f"√Årea {area:7} - {pct_sem:5.1f}% sem computadores ({row['Sem_computador']:,.0f} de {total_area:,.0f} escolas)")
    
    # 4. AN√ÅLISE POR DEPEND√äNCIA ADMINISTRATIVA
    print("\n4. SITUA√á√ÉO POR REDE DE ENSINO")
    print("-" * 50)
    
    deps = ['Municipal', 'Estadual', 'Particular']
    for dep in deps:
        row = df[df['Categoria'] == dep].iloc[0]
        total_dep = row['Sem_computador'] + row['Total_escolas_com_computador']
        pct_sem = (row['Sem_computador'] / total_dep) * 100
        print(f"Rede {dep:10} - {pct_sem:5.1f}% sem computadores ({row['Sem_computador']:,.0f} de {total_dep:,.0f} escolas)")
    
    # 5. AN√ÅLISE DA PROPOR√á√ÉO ALUNO/COMPUTADOR
    print("\n5. PROPOR√á√ÉO ALUNO/COMPUTADOR NAS ESCOLAS COM EQUIPAMENTOS")
    print("-" * 50)
    
    # Calcular distribui√ß√£o das escolas com computador por faixa de alunos/computador
    faixas_cols = ['Ate_5_alunos', 'De_5_1_a_10', 'De_10_1_a_15', 'De_15_1_a_20', 
                   'De_20_1_a_30', 'De_30_1_a_40', 'De_40_1_a_50', 'De_50_1_a_100', 'Mais_de_100']
    
    total_row = df[df['Categoria'] == 'TOTAL'].iloc[0]
    total_com_pc = total_row['Total_escolas_com_computador']
    
    print("\nDistribui√ß√£o das escolas COM computador por propor√ß√£o aluno/equipamento:")
    for col in faixas_cols:
        valor = total_row[col]
        pct = (valor / total_com_pc) * 100
        faixa_nome = col.replace('_', ' ').replace('De ', '').replace('Ate', 'At√©').replace('alunos', 'alunos/PC')
        print(f"  {faixa_nome:25} - {valor:8,.0f} escolas ({pct:5.1f}%)")
    
    # Calcular quantas escolas t√™m propor√ß√£o inadequada (>20 alunos/computador)
    inadequadas = sum([total_row[col] for col in ['De_20_1_a_30', 'De_30_1_a_40', 
                                                   'De_40_1_a_50', 'De_50_1_a_100', 'Mais_de_100']])
    pct_inadequadas = (inadequadas / total_com_pc) * 100
    
    print(f"\n‚ö†Ô∏è  {inadequadas:,.0f} escolas ({pct_inadequadas:.1f}%) t√™m mais de 20 alunos por computador")
    print("   (propor√ß√£o considerada inadequada para uso pedag√≥gico efetivo)")
    
    # 6. IMPLICA√á√ïES PARA IA GENERATIVA
    print("\n6. IMPLICA√á√ïES PARA O USO DE IA GENERATIVA")
    print("-" * 50)
    
    # Estimar popula√ß√£o estudantil afetada (considerando m√©dia de alunos por escola)
    media_alunos_escola = 300  # Estimativa conservadora
    
    escolas_sem_pc = total_row['Sem_computador']
    escolas_pc_inadequado = inadequadas
    
    alunos_sem_acesso = escolas_sem_pc * media_alunos_escola
    alunos_acesso_limitado = escolas_pc_inadequado * media_alunos_escola
    
    print(f"\nEstimativa de estudantes afetados:")
    print(f"  ‚Ä¢ Sem NENHUM acesso a computadores: ~{alunos_sem_acesso/1_000_000:.1f} milh√µes")
    print(f"  ‚Ä¢ Com acesso MUITO LIMITADO (>20 alunos/PC): ~{alunos_acesso_limitado/1_000_000:.1f} milh√µes")
    print(f"  ‚Ä¢ TOTAL com acesso inadequado para IA: ~{(alunos_sem_acesso + alunos_acesso_limitado)/1_000_000:.1f} milh√µes")
    
    print("\nüî¥ Impactos para uso de IA Generativa:")
    print("  ‚Ä¢ Impossibilidade de usar ferramentas avan√ßadas (GitHub Copilot, ChatGPT Plus, Claude)")
    print("  ‚Ä¢ Limita√ß√£o ao uso mobile b√°sico (consultas simples, n√£o projetos complexos)")
    print("  ‚Ä¢ Exclus√£o de atividades de programa√ß√£o, an√°lise de dados e automa√ß√£o")
    print("  ‚Ä¢ Perpetua√ß√£o do papel de consumidor vs. criador de tecnologia")
    
    return df, df_regional


In [None]:
# Fun√ß√£o para criar visualiza√ß√µes
def criar_visualizacoes(df, df_regional):
    """
    Cria visualiza√ß√µes dos principais insights
    """
    fig, axes = plt.subplots(2, 2, figsize=(16, 12))
    fig.suptitle('D√©ficit Tecnol√≥gico Educacional Brasileiro - TIC Educa√ß√£o 2023', fontsize=16, y=1.02)
    
    # 1. Gr√°fico de barras - Situa√ß√£o por regi√£o
    ax1 = axes[0, 0]
    df_regional_plot = df_regional.sort_values('% Sem Computador')
    colors = ['#e74c3c' if x > 60 else '#f39c12' if x > 40 else '#27ae60' 
              for x in df_regional_plot['% Sem Computador']]
    bars = ax1.barh(df_regional_plot['Regi√£o'], df_regional_plot['% Sem Computador'], color=colors)
    ax1.set_xlabel('% de Escolas SEM Computadores')
    ax1.set_title('Exclus√£o Digital por Regi√£o')
    ax1.set_xlim(0, 100)
    for bar, val in zip(bars, df_regional_plot['% Sem Computador']):
        ax1.text(val + 1, bar.get_y() + bar.get_height()/2, f'{val:.1f}%', 
                va='center', fontweight='bold')
    
    # 2. Compara√ß√£o Urbano vs Rural
    ax2 = axes[0, 1]
    areas_data = []
    for area in ['Urbana', 'Rural']:
        row = df[df['Categoria'] == area].iloc[0]
        total = row['Sem_computador'] + row['Total_escolas_com_computador']
        areas_data.append({
            '√Årea': area,
            'Com Computador': (row['Total_escolas_com_computador']/total)*100,
            'Sem Computador': (row['Sem_computador']/total)*100
        })
    
    df_areas = pd.DataFrame(areas_data)
    x = np.arange(len(df_areas))
    width = 0.35
    
    ax2.bar(x - width/2, df_areas['Com Computador'], width, label='Com Computador', color='#27ae60')
    ax2.bar(x + width/2, df_areas['Sem Computador'], width, label='Sem Computador', color='#e74c3c')
    ax2.set_ylabel('Percentual de Escolas (%)')
    ax2.set_title('Disparidade de Acesso: Urbano vs Rural')
    ax2.set_xticks(x)
    ax2.set_xticklabels(df_areas['√Årea'])
    ax2.legend()
    ax2.set_ylim(0, 100)
    
    # 3. Rede de ensino
    ax3 = axes[1, 0]
    redes_data = []
    for rede in ['Municipal', 'Estadual', 'Particular']:
        row = df[df['Categoria'] == rede].iloc[0]
        total = row['Sem_computador'] + row['Total_escolas_com_computador']
        pct_sem = (row['Sem_computador'] / total) * 100
        redes_data.append({'Rede': rede, '% Sem Computador': pct_sem})
    
    df_redes = pd.DataFrame(redes_data)
    colors_rede = ['#e74c3c', '#f39c12', '#3498db']
    ax3.bar(df_redes['Rede'], df_redes['% Sem Computador'], color=colors_rede)
    ax3.set_ylabel('% de Escolas SEM Computadores')
    ax3.set_title('Exclus√£o por Depend√™ncia Administrativa')
    ax3.set_ylim(0, 100)
    for i, val in enumerate(df_redes['% Sem Computador']):
        ax3.text(i, val + 2, f'{val:.1f}%', ha='center', fontweight='bold')
    
    # 4. Propor√ß√£o aluno/computador (escolas que t√™m computador)
    ax4 = axes[1, 1]
    total_row = df[df['Categoria'] == 'TOTAL'].iloc[0]
    
    categorias = ['Adequada\n(‚â§20 alunos/PC)', 'Inadequada\n(>20 alunos/PC)', 'Sem Computador']
    
    adequadas = sum([total_row[col] for col in ['Ate_5_alunos', 'De_5_1_a_10', 
                                                 'De_10_1_a_15', 'De_15_1_a_20']])
    inadequadas = sum([total_row[col] for col in ['De_20_1_a_30', 'De_30_1_a_40', 
                                                   'De_40_1_a_50', 'De_50_1_a_100', 'Mais_de_100']])
    sem_pc = total_row['Sem_computador']
    
    valores = [adequadas, inadequadas, sem_pc]
    colors_prop = ['#27ae60', '#f39c12', '#e74c3c']
    
    wedges, texts, autotexts = ax4.pie(valores, labels=categorias, colors=colors_prop, 
                                        autopct='%1.1f%%', startangle=90)
    ax4.set_title('Distribui√ß√£o das Escolas por Adequa√ß√£o Tecnol√≥gica')
    
    # Ajustar layout
    plt.tight_layout()
    
    return fig




In [5]:
# Fun√ß√£o para gerar relat√≥rio de insights
def gerar_relatorio_ia(df):
    """
    Gera relat√≥rio espec√≠fico sobre implica√ß√µes para IA Generativa
    """
    print("\n" + "=" * 80)
    print("RELAT√ìRIO: IMPLICA√á√ïES PARA A REVOLU√á√ÉO DA IA GENERATIVA NO BRASIL")
    print("=" * 80)
    
    print("\nüìä PRINCIPAIS FINDINGS:")
    print("-" * 50)
    
    total_row = df[df['Categoria'] == 'TOTAL'].iloc[0]
    total_escolas = total_row['Sem_computador'] + total_row['Total_escolas_com_computador']
    
    # Finding 1
    print("\n1. EXCLUS√ÉO MASSIVA:")
    print(f"   ‚Ä¢ {(total_row['Sem_computador']/total_escolas)*100:.1f}% das escolas brasileiras n√£o t√™m")
    print("     NENHUM computador dispon√≠vel para alunos")
    
    # Finding 2
    print("\n2. DESIGUALDADE REGIONAL CR√çTICA:")
    norte_row = df[df['Categoria'] == 'Norte'].iloc[0]
    nordeste_row = df[df['Categoria'] == 'Nordeste'].iloc[0]
    total_norte = norte_row['Sem_computador'] + norte_row['Total_escolas_com_computador']
    total_nordeste = nordeste_row['Sem_computador'] + nordeste_row['Total_escolas_com_computador']
    
    print(f"   ‚Ä¢ Norte: {(norte_row['Sem_computador']/total_norte)*100:.1f}% sem computadores")
    print(f"   ‚Ä¢ Nordeste: {(nordeste_row['Sem_computador']/total_nordeste)*100:.1f}% sem computadores")
    print("   ‚Ä¢ Estas regi√µes ficar√£o ainda mais para tr√°s na economia da IA")
    
    # Finding 3
    print("\n3. APARTHEID DIGITAL RURAL:")
    rural_row = df[df['Categoria'] == 'Rural'].iloc[0]
    total_rural = rural_row['Sem_computador'] + rural_row['Total_escolas_com_computador']
    print(f"   ‚Ä¢ {(rural_row['Sem_computador']/total_rural)*100:.1f}% das escolas rurais sem computadores")
    print("   ‚Ä¢ Popula√ß√£o rural ser√° exclu√≠da das oportunidades da IA")
    
    # Finding 4
    print("\n4. ELITE TECNOL√ìGICA:")
    particular_row = df[df['Categoria'] == 'Particular'].iloc[0]
    total_particular = particular_row['Sem_computador'] + particular_row['Total_escolas_com_computador']
    print(f"   ‚Ä¢ Escolas particulares: apenas {(particular_row['Sem_computador']/total_particular)*100:.1f}% sem computadores")
    print("   ‚Ä¢ Cria√ß√£o de uma elite capaz de usar IA vs. massa exclu√≠da")
    
    print("\nüö® CONSEQU√äNCIAS PARA O BRASIL NA ERA DA IA:")
    print("-" * 50)
    print("""
    1. PERPETUA√á√ÉO DO SUBDESENVOLVIMENTO TECNOL√ìGICO
       ‚Üí Enquanto pa√≠ses desenvolvidos usam IA para automatizar e inovar,
         o Brasil forma uma gera√ß√£o que mal sabe usar um computador
    
    2. PERDA DE COMPETITIVIDADE ECON√îMICA
       ‚Üí Empresas brasileiras n√£o ter√£o m√£o de obra capaz de implementar
         solu√ß√µes de IA, dependendo de consultoria estrangeira
    
    3. AMPLIA√á√ÉO DA DESIGUALDADE SOCIAL
       ‚Üí Pequena elite com acesso a computadores dominar√° empregos de IA
       ‚Üí Maioria ficar√° em subempregos amea√ßados pela automa√ß√£o
    
    4. EXCLUS√ÉO DA ECONOMIA DIGITAL GLOBAL
       ‚Üí Impossibilidade de participar do desenvolvimento de IA
       ‚Üí Brasil como mero consumidor, n√£o produtor de tecnologia
    
    5. IMPACTO GERACIONAL IRREVERS√çVEL
       ‚Üí Jovens atuais perder√£o a janela cr√≠tica de aprendizado
       ‚Üí Gap tecnol√≥gico pode levar d√©cadas para ser superado
    """)
    
    print("\nüí° RECOMENDA√á√ïES URGENTES:")
    print("-" * 50)
    print("""
    1. PROGRAMA EMERGENCIAL DE COMPUTADORES NAS ESCOLAS
       ‚Ä¢ Meta: 1 computador para cada 5 alunos em 5 anos
       ‚Ä¢ Prioridade: Norte e Nordeste + escolas rurais
    
    2. FORMA√á√ÉO MASSIVA DE PROFESSORES EM IA
       ‚Ä¢ Capacitar docentes para ensinar com e sobre IA
       ‚Ä¢ Integrar IA no curr√≠culo desde o ensino fundamental
    
    3. PARCERIAS P√öBLICO-PRIVADAS
       ‚Ä¢ Big techs brasileiras devem adotar escolas
       ‚Ä¢ Criar laborat√≥rios de IA em escolas p√∫blicas
    
    4. POL√çTICA NACIONAL DE IA NA EDUCA√á√ÉO
       ‚Ä¢ Criar diretrizes curriculares para ensino de IA
       ‚Ä¢ Estabelecer metas de alfabetiza√ß√£o em IA
    """)


In [7]:
# Script principal
if __name__ == "__main__":
    # Caminho do arquivo
    arquivo = "tic_educacao_2023_escolas_tabela_total_v1.0.xlsx"
    
    try:
        # Executar an√°lise
        df, df_regional = analisar_deficit_tecnologico(arquivo)
        
        # Gerar relat√≥rio sobre IA
        gerar_relatorio_ia(df)
        
        # Criar visualiza√ß√µes
        fig = criar_visualizacoes(df, df_regional)
        plt.savefig('deficit_tecnologico_educacional.png', dpi=300, bbox_inches='tight')
        plt.show()
        
        # Exportar dados processados
        df.to_csv('dados_processados_b4a.csv', index=False)
        df_regional.to_csv('analise_regional.csv', index=False)
        
        print("\n‚úÖ An√°lise conclu√≠da com sucesso!")
        print("üìÅ Arquivos gerados:")
        print("   ‚Ä¢ deficit_tecnologico_educacional.png")
        print("   ‚Ä¢ dados_processados_b4a.csv")
        print("   ‚Ä¢ analise_regional.csv")
        
    except FileNotFoundError:
        print(f"‚ö†Ô∏è  Arquivo '{arquivo}' n√£o encontrado!")
        print("Por favor, certifique-se de que o arquivo est√° no diret√≥rio correto.")
    except Exception as e:
        print(f"‚ùå Erro durante a an√°lise: {str(e)}")
        print("Verifique se o arquivo possui a aba 'B4A' com a estrutura esperada.")

AN√ÅLISE DO D√âFICIT TECNOL√ìGICO EDUCACIONAL BRASILEIRO
Dados: TIC Educa√ß√£o 2023 - Aba B4A

1. VIS√ÉO GERAL DO ACESSO A COMPUTADORES NAS ESCOLAS
--------------------------------------------------
Total de escolas analisadas: nan
Escolas SEM computadores: 63,459 (nan%)
Escolas COM computadores: nan (nan%)

2. DESIGUALDADE REGIONAL
--------------------------------------------------
‚ùå Erro durante a an√°lise: single positional indexer is out-of-bounds
Verifique se o arquivo possui a aba 'B4A' com a estrutura esperada.
