In [12]:
# CÉLULA 1: Conectar ao Google Drive
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [13]:
# CÉLULA 2 (Lendo CSV de 2020-2023): Carregar e Combinar Dados
import pandas as pd
import os

pasta_dados = '/content/drive/MyDrive/mini-projeto/'
print(f"Procurando arquivos CSV na pasta: {pasta_dados}")

# Focando nos 4 anos que você definiu (2020-2023)
anos_para_carregar = ['20', '21', '22', '23']

colunas_para_usar = [
    'NU_ANO', 'ID_MUNICIP', 'SG_UF_NOT', 'CS_SEXO',
    'DT_NOTIFIC', 'NU_IDADE_N', 'CLASSI_FIN', 'CRITERIO'
]
lista_dfs = []

for ano in anos_para_carregar:
    nome_arquivo = f'DENGBR{ano}.csv' # <-- Usando .csv
    caminho_completo = os.path.join(pasta_dados, nome_arquivo)
    print(f"Tentando carregar: {caminho_completo}...")

    try:
        df_ano = pd.read_csv(
            caminho_completo, sep=',', encoding='latin-1',
            usecols=colunas_para_usar, on_bad_lines='skip', low_memory=False
        )
        lista_dfs.append(df_ano)
        print(f" -> Carregado com sucesso ({len(df_ano)} linhas)")
    except FileNotFoundError:
        print(f" -> ❌ ERRO: Arquivo '{nome_arquivo}' não encontrado! Pulando este ano.")
    except Exception as e:
        print(f" -> ❌ Ocorreu um erro inesperado: {e}")

if lista_dfs:
    df_dengue_total = pd.concat(lista_dfs, ignore_index=True)
    print("\n✅ Todos os arquivos CSV disponíveis (2020-2023) foram combinados!")
else:
    print("\n❌ Nenhum arquivo de dados foi carregado.")
    df_dengue_total = pd.DataFrame(columns=colunas_para_usar)

Procurando arquivos CSV na pasta: /content/drive/MyDrive/mini-projeto/
Tentando carregar: /content/drive/MyDrive/mini-projeto/DENGBR20.csv...
 -> Carregado com sucesso (1495117 linhas)
Tentando carregar: /content/drive/MyDrive/mini-projeto/DENGBR21.csv...
 -> Carregado com sucesso (1010359 linhas)
Tentando carregar: /content/drive/MyDrive/mini-projeto/DENGBR22.csv...
 -> Carregado com sucesso (1393877 linhas)
Tentando carregar: /content/drive/MyDrive/mini-projeto/DENGBR23.csv...
 -> Carregado com sucesso (1508653 linhas)

✅ Todos os arquivos CSV disponíveis (2020-2023) foram combinados!


In [14]:
# CÉLULA 3: Limpeza dos Dados (CORRIGIDA)
print("Iniciando a limpeza e preparação dos dados...")

try:
    # Cria uma cópia do DataFrame COMBINADO para trabalhar
    df_limpo = df_dengue_total.copy() # <-- ESTA É A CORREÇÃO

    # Processa a coluna de idade 'NU_IDADE_N'
    df_limpo['NU_IDADE_N'] = pd.to_numeric(df_limpo['NU_IDADE_N'], errors='coerce')
    df_limpo.dropna(subset=['NU_IDADE_N'], inplace=True)
    df_limpo = df_limpo[df_limpo['NU_IDADE_N'] >= 4000]
    df_limpo['IDADE'] = df_limpo['NU_IDADE_N'] - 4000
    print("- Coluna 'IDADE' processada com sucesso.")

    # Converte a coluna NU_ANO para inteiro
    if 'NU_ANO' in df_limpo.columns:
         df_limpo['NU_ANO'] = df_limpo['NU_ANO'].astype(int)
         print("- Coluna 'NU_ANO' verificada/convertida.")

    print("\n✅ Processo de limpeza concluído!")
    display(df_limpo.head())

except NameError:
    print("\n❌ ERRO: A variável 'df_dengue_total' não foi criada. Execute a Célula 2 primeiro.")
except Exception as e:
    print(f"\n❌ Ocorreu um erro inesperado durante a limpeza: {e}")

Iniciando a limpeza e preparação dos dados...
- Coluna 'IDADE' processada com sucesso.
- Coluna 'NU_ANO' verificada/convertida.

✅ Processo de limpeza concluído!


Unnamed: 0,DT_NOTIFIC,NU_ANO,SG_UF_NOT,ID_MUNICIP,NU_IDADE_N,CS_SEXO,CLASSI_FIN,CRITERIO,IDADE
0,2020-01-26,2020,12,120020,4023.0,F,5.0,2.0,23.0
1,2020-01-30,2020,12,120020,4038.0,F,5.0,2.0,38.0
2,2020-02-11,2020,12,120020,4020.0,F,5.0,1.0,20.0
3,2019-12-30,2019,12,120020,4037.0,F,5.0,2.0,37.0
4,2020-02-07,2020,13,130165,4020.0,F,5.0,1.0,20.0


In [15]:
# CÉLULA 4: Análise Exploratória dos Dados

try:
    print("Iniciando a análise dos dados limpos...")

    # Pergunta 1: Quantos casos de dengue foram notificados por estado?
    print("\n--- Contagem de Casos por Estado ---")
    casos_por_estado = df_limpo['SG_UF_NOT'].value_counts()
    print(casos_por_estado)

    # Pergunta 2: Qual a distribuição de casos por sexo?
    print("\n--- Contagem de Casos por Sexo ---")
    casos_por_sexo = df_limpo['CS_SEXO'].value_counts()
    print(casos_por_sexo)

    # Pergunta 3: Quais foram os critérios de confirmação mais comuns?
    print("\n--- Contagem por Critério de Confirmação ---")
    casos_por_criterio = df_limpo['CRITERIO'].value_counts()
    print(casos_por_criterio)

    # Pergunta 4: Qual a média de idade dos pacientes notificados?
    print(f"\n--- Idade Média dos Pacientes ---")
    idade_media = df_limpo['IDADE'].mean()
    print(f"A idade média dos pacientes com dengue notificados em 2023 foi de {idade_media:.1f} anos.")

except NameError:
    print("\n❌ ERRO: A variável 'df_limpo' não foi criada. Verifique se a célula de limpeza (anterior a esta) foi executada sem erros.")
except Exception as e:
    print(f"\n❌ Ocorreu um erro inesperado durante a análise: {e}")

Iniciando a análise dos dados limpos...

--- Contagem de Casos por Estado ---
SG_UF_NOT
35    1421487
41     804206
31     687328
52     438272
42     284096
29     222940
53     202306
50     167869
23     164751
51     142251
43     128077
26     118923
33      74133
24      68701
25      65321
12      55508
27      51100
22      46387
17      46229
13      36262
11      35069
15      27205
28      17656
21      16096
32       7779
14       3744
16       2703
Name: count, dtype: int64

--- Contagem de Casos por Sexo ---
CS_SEXO
F    2897551
M    2432787
I       6046
Name: count, dtype: int64

--- Contagem por Critério de Confirmação ---
CRITERIO
2.0    2424407
1.0    2295891
3.0      46247
Name: count, dtype: int64

--- Idade Média dos Pacientes ---
A idade média dos pacientes com dengue notificados em 2023 foi de 34.9 anos.


In [16]:
# CÉLULA 5 (COM DEPURAÇÃO): Visualização dos Dados

import plotly.express as px
import ipywidgets as widgets
from ipywidgets import interact
import traceback # Para mostrar erros mais detalhados

print("--- Configurando Visualização Interativa por Ano ---")

if 'NU_ANO' in df_limpo.columns:
    anos_disponiveis = sorted(df_limpo['NU_ANO'].unique())
    opcoes_dropdown = [('Todos os Anos', 0)] + [(str(ano), ano) for ano in anos_disponiveis]

    year_selector = widgets.Dropdown(
        options=opcoes_dropdown, value=0, description='Selecione o Ano:', disabled=False,
    )

    # Função que gera o gráfico
    def plot_casos_por_estado_por_ano(ano_selecionado):
        try: # Adicionamos um try/except aqui dentro
            print(f"\n-> Tentando gerar gráfico para o ano: {ano_selecionado if ano_selecionado != 0 else 'Todos'}") # DEBUG
            if ano_selecionado == 0:
                df_filtrado_ano = df_limpo
                titulo = f'Total de Casos (2020-2023)' # Título mais curto
            else:
                df_filtrado_ano = df_limpo[df_limpo['NU_ANO'] == ano_selecionado]
                titulo = f'Casos em {ano_selecionado}'

            if df_filtrado_ano.empty:
                print(" -> Nenhum dado encontrado para este ano.")
                return

            print(" -> Calculando contagem por estado...") # DEBUG
            casos_por_estado = df_filtrado_ano['SG_UF_NOT'].value_counts().reset_index()
            casos_por_estado.columns = ['Estado_Codigo', 'Numero_de_Casos']

            print(" -> Mapeando siglas dos estados...") # DEBUG
            mapa_uf = { 11: 'RO', 12: 'AC', 13: 'AM', 14: 'RR', 15: 'PA', 16: 'AP', 17: 'TO', 21: 'MA', 22: 'PI', 23: 'CE', 24: 'RN', 25: 'PB', 26: 'PE', 27: 'AL', 28: 'SE', 29: 'BA', 31: 'MG', 32: 'ES', 33: 'RJ', 35: 'SP', 41: 'PR', 42: 'SC', 43: 'RS', 50: 'MS', 51: 'MT', 52: 'GO', 53: 'DF' }
            casos_por_estado['Sigla_Estado'] = casos_por_estado['Estado_Codigo'].map(mapa_uf)
            # Verifica se algum estado não foi mapeado (ficou NaN)
            if casos_por_estado['Sigla_Estado'].isnull().any():
                print(" -> ATENÇÃO: Alguns códigos de estado não foram mapeados para siglas!")

            print(" -> Criando a figura do gráfico...") # DEBUG
            fig = px.bar(
                casos_por_estado.sort_values('Numero_de_Casos', ascending=False),
                x='Sigla_Estado', y='Numero_de_Casos', title=titulo,
                labels={'Sigla_Estado': 'Estado', 'Numero_de_Casos': 'Notificações'},
                template='plotly_white'
            )
            print(" -> Mostrando o gráfico.") # DEBUG
            fig.show()
            print(" -> Gráfico exibido com sucesso!") # DEBUG

        except Exception as e:
            print(f"\n❌ ERRO DENTRO DA FUNÇÃO DE PLOTAGEM:")
            traceback.print_exc() # Mostra o erro detalhado

    # Conecta o widget à função
    interact(plot_casos_por_estado_por_ano, ano_selecionado=year_selector)

else:
    print("❌ ERRO: A coluna 'NU_ANO' não foi encontrada no DataFrame 'df_limpo'.")

--- Configurando Visualização Interativa por Ano ---


interactive(children=(Dropdown(description='Selecione o Ano:', options=(('Todos os Anos', 0), ('2019', np.int6…

In [17]:
# CÉLULA ANTES DO WRITEFILE: Salva os dados limpos localmente

print("Salvando DataFrame limpo para uso do Streamlit...")
try:
    caminho_local_csv = '/content/dados_limpos_para_app.csv'
    df_limpo.to_csv(caminho_local_csv, index=False, encoding='latin-1', sep=',')
    print(f"✅ Dados limpos salvos com sucesso em: {caminho_local_csv}")
except NameError:
    print("❌ ERRO: A variável 'df_limpo' não existe. Execute a célula de limpeza primeiro.")
except Exception as e:
    print(f"❌ ERRO ao salvar o arquivo local: {e}")

Salvando DataFrame limpo para uso do Streamlit...
✅ Dados limpos salvos com sucesso em: /content/dados_limpos_para_app.csv


In [19]:
# CÉLULA 6: Instala as bibliotecas e executa a aplicação

!pip install -q streamlit pyngrok

from pyngrok import ngrok
import time
import subprocess

# Coloque aqui o seu Authtoken que você já tem do site ngrok.com
AUTHTOKEN = "346zypbvE9ocMsQSJja8KsrtB4m_Q2ojQaYe6TtqBNqfRyHX"

# Configura o token e executa o dashboard
ngrok.set_auth_token(AUTHTOKEN)
ngrok.kill()
!pkill streamlit
time.sleep(5)

# Inicia o streamlit em segundo plano
process = subprocess.Popen(['streamlit', 'run', 'app.py', '--server.port=8501'])
time.sleep(10) # Damos um tempo para o servidor iniciar completamente

# Cria o link público
try:
    public_url = ngrok.connect(8501)
    print("------------------------------------------------------------------")
    print(f"🎉 SEU DASHBOARD ESTÁ PRONTO! Acesse pelo link: {public_url}")
    print("------------------------------------------------------------------")
except Exception as e:
    print(f"❌ Falha ao criar o túnel do ngrok: {e}")

------------------------------------------------------------------
🎉 SEU DASHBOARD ESTÁ PRONTO! Acesse pelo link: NgrokTunnel: "https://unpuritanical-elliptical-katalina.ngrok-free.dev" -> "http://localhost:8501"
------------------------------------------------------------------
