<a href="https://colab.research.google.com/github/jaquelinalbuquerque/projeto-epidemio/blob/main/projeto_epidemiosv2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Projeto: Semana Epidemiológica - SV2**

### **1. Extração de Dados:**

A princípio, a extração se dará por meio de conexão com o Google Drive, onde estará disponível o arquivo excel atualizado.
Posteriormente, será feita a extração diretamente do aplicativo interno SV2.

Em ETL (Extração, Transformação e Carga), a "Extração" é a primeira etapa do processo. Ela se refere ao processo de coletar dados de várias fontes diferentes, como bancos de dados, planilhas, arquivos de texto, APIs, sistemas legados e outras origens de dados. O objetivo da extração é reunir os dados brutos de suas fontes originais para que possam ser posteriormente transformados e carregados em um local de armazenamento centralizado, como um data warehouse ou um banco de dados de análise.

A extração de dados pode envolver os seguintes aspectos:

**Identificação de Fontes:** Identificar as fontes de onde os dados serão extraídos. Isso pode incluir bancos de dados operacionais, arquivos CSV, feeds de APIs, logs de servidores, entre outros.

**Conexão às Fontes:** Estabelecer as conexões necessárias com as fontes de dados para acessar os dados. Isso pode envolver a configuração de conexões de rede, autenticação, credenciais e outras configurações de segurança.

**Seleção de Dados:**  Escolher quais dados específicos serão extraídos das fontes. Isso pode envolver a definição de consultas SQL, seleção de planilhas ou especificação de critérios para a extração de dados.

**Extração dos Dados:** Efetuar a coleta dos dados brutos das fontes, convertendo-os em um formato que possa ser manipulado e processado.

**Tratamento Inicial:** Realizar algumas operações preliminares nos dados, como remoção de linhas desnecessárias, filtragem inicial e outras ações para preparar os dados para a etapa de transformação.

**Captura de Dados Incremental:** Em cenários onde os dados são atualizados regularmente, é comum implementar um mecanismo de captura incremental, que extrai apenas os novos ou modificados desde a última extração, para reduzir o tempo e os recursos necessários.

**Gerenciamento de Mudanças:** Lidar com situações em que a estrutura ou o formato dos dados nas fontes podem mudar. Isso pode exigir ajustes nas consultas ou nos processos de extração.

Uma vez que os dados foram extraídos e passaram por essa primeira etapa, eles são então encaminhados para a etapa de transformação, onde são processados, limpos e preparados para serem utilizados nas análises, relatórios ou outras atividades relevantes.








In [36]:
!pip install dash

Collecting dash
  Downloading dash-2.14.0-py3-none-any.whl (10.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m10.4/10.4 MB[0m [31m80.0 MB/s[0m eta [36m0:00:00[0m
Collecting Werkzeug<2.3.0 (from dash)
  Downloading Werkzeug-2.2.3-py3-none-any.whl (233 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m233.6/233.6 kB[0m [31m29.6 MB/s[0m eta [36m0:00:00[0m
Collecting dash-html-components==2.0.0 (from dash)
  Downloading dash_html_components-2.0.0-py3-none-any.whl (4.1 kB)
Collecting dash-core-components==2.0.0 (from dash)
  Downloading dash_core_components-2.0.0-py3-none-any.whl (3.8 kB)
Collecting dash-table==5.0.0 (from dash)
  Downloading dash_table-5.0.0-py3-none-any.whl (3.9 kB)
Collecting retrying (from dash)
  Downloading retrying-1.3.4-py3-none-any.whl (11 kB)
Collecting ansi2html (from dash)
  Downloading ansi2html-1.8.0-py3-none-any.whl (16 kB)
Installing collected packages: dash-table, dash-html-components, dash-core-components,

In [37]:
#Bibliotecas importadas
import dash
from dash import Dash, html, dcc, Input, Output
import plotly.express as px
import pandas as pd
from flask import Flask, render_template, request
import datetime

In [12]:
#Estabelecer conexão com o Google Drive. Uma janela será aberta para pedir permissão de acesso.
from google.colab import drive
drive.mount('/content/drive')



Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [13]:
#Ler arquivos do Google Drive
df_sv2 = pd.read_excel ('/content/drive/My Drive/Colab Notebooks/projeto-impacta/basesv2.xlsx')
df_unidades = pd.read_excel ('/content/drive/My Drive/Colab Notebooks/projeto-impacta/unidades.xlsx')

In [14]:
#Exibir as primeiras 10 linhas das colunas definidas

df_sv2.head(10)[["CONTRATO", "INFORMANTE", "DOENCA_AGRAVO", "DATA_NOTIFICACAO", "SEMANA", "PACIENTE"]]

Unnamed: 0,CONTRATO,INFORMANTE,DOENCA_AGRAVO,DATA_NOTIFICACAO,SEMANA,PACIENTE
0,DIADEMA,UBS PIRAPORINHA,SÍFILIS CONGÊNITA,05/01/2023,SEMANA 01,MIT FRMSQU PINHIR
1,DIADEMA,UBS PIRAPORINHA,SÍFILIS ADQUIRIDA,11/01/2023,SEMANA 02,KTI VLNTIM GNÇLLVS
2,DIADEMA,UBS PIRAPORINHA,SÍFILIS ADQUIRIDA,12/01/2023,SEMANA 02,BTRIZ MRINH DS SNTS
3,DIADEMA,UBS PIRAPORINHA,ATENDIMENTO ANTI-RÁBICO HUMANO,SEMANA NEGATIVA,SEMANA 03,JNTHN LUIZ HNRIQU D SUZ
4,DIADEMA,UBS PIRAPORINHA,ATENDIMENTO ANTI-RÁBICO HUMANO,SEMANA NEGATIVA,SEMANA 03,PMLL SNTS SILVSTR RGRI
5,DIADEMA,UBS PIRAPORINHA,ATENDIMENTO ANTI-RÁBICO HUMANO,SEMANA NEGATIVA,SEMANA 03,RSMIR D CRVLH RIBIR D SILV
6,DIADEMA,UBS PIRAPORINHA,SÍFILIS ADQUIRIDA,SEMANA NEGATIVA,SEMANA 04,JNIFFR CSR D SILV
7,DIADEMA,UBS PIRAPORINHA,ATENDIMENTO ANTI-RÁBICO HUMANO,SEMANA NEGATIVA,SEMANA 05,RICRD FLIX
8,DIADEMA,UBS PIRAPORINHA,ATENDIMENTO ANTI-RÁBICO HUMANO,SEMANA NEGATIVA,SEMANA 06,THIG RMS D LIVIR
9,DIADEMA,UBS PIRAPORINHA,ATENDIMENTO ANTI-RÁBICO HUMANO,SEMANA NEGATIVA,SEMANA 08,BTRIZ CNDID MRIC


### **2. Transformação de Dados**

Em ETL (Extração, Transformação e Carga), a transformação é a segunda etapa do processo, após a extração dos dados de suas fontes originais. A transformação envolve a aplicação de diversas operações e lógicas aos dados extraídos para convertê-los em um formato adequado para análise, armazenamento ou qualquer outro propósito necessário.

A transformação de dados pode incluir uma variedade de atividades, tais como:




**Limpeza de Dados:** Isso envolve a remoção de valores duplicados, dados ausentes (valores nulos), correção de erros tipográficos e padronização de formatos inconsistentes.

**Filtragem:** Pode ser necessário remover dados que não se encaixam nos critérios definidos, seja com base em valores específicos ou em regras de negócios.

**Conversão de Formato:** Transformar dados em formatos adequados para análise. Isso pode envolver conversões de tipos de dados, como transformar datas em formatos padronizados ou converter unidades de medida.

**Enriquecimento:** Adicionar informações ou atributos extras aos dados. Isso pode ser feito através de consulta a outras fontes de dados externas.

**Agregação:** Calcular estatísticas, somas, médias, contagens e outras operações de agregação com base nos dados.

**Derivação:** Criar novos atributos ou campos calculados a partir dos dados existentes, utilizando fórmulas matemáticas, lógicas ou de texto.

**Padronização:** Garantir que os dados sigam uma estrutura e formato consistentes, de acordo com padrões estabelecidos.

**Normalização:** Reduzir a redundância de dados ao dividir informações em tabelas separadas e estabelecer relações entre elas.

**Remoção de Ruído:** Identificar e remover outliers ou valores extremos que possam afetar a análise.

**Combinação de Dados:** Combinar dados de várias fontes para criar um conjunto de dados completo e abrangente.

**Transformações de Texto:** Tratar texto, como converter maiúsculas em minúsculas, remover espaços extras, etc.

**Validação: ** Verificar se os dados se encaixam nas regras de negócios estabelecidas ou nos padrões definidos.

**Normalização:** Garantir que os dados estejam em uma escala ou formato comum para facilitar a comparação.

**Codificação e Decodificação:** Transformar valores em códigos ou decodificar valores codificados.

**Execução da Transformação de Dados no projeto-epidemio**

1. Deletar linhas de "semana Negativa"
2. Inserir STS
3. Para as unidades notificantes diferentes da lista de unidade, mudar nome para "OUTRA"
4. Criar coluna "FONTE_ABRANGENCIA" com valores interna (abrangência igual a informante) ou externa (abrangência diferente da informante)
5. Corrigir formato de datas
6. Alterar nome semana para ano+semana
7. Coluna com a quantidade geral de registro, considerando Covid e não Covid
8. Coluna para contar os pacientes em situação de rua

In [15]:

# 1. Deletar linhas de semana negativa
df_sv2 = df_sv2[df_sv2["DATA_NOTIFICACAO"] != "SEMANA NEGATIVA"]

# para confirmar se deu certo, exibir os valores únicos da coluna com: df['DATA_NOTIFICACAO'].unique()

In [16]:
# 2. Inserir STS no df_sv2 com base no df_unidades (procv em unidades)
df_sv2 = pd.merge(df_sv2, df_unidades[['CNES', 'STS']], on='CNES', how='left')


In [17]:
# 3. Para as unidades notificantes diferentes da lista de unidade, mudar nome para "OUTRA"
df_sv2.loc[~df_sv2['UNIDADE_NOTIFICANTE'].isin(df_unidades['UNIDADE']), 'UNIDADE_NOTIFICANTE'] = 'OUTRA'

# Para testar se deu certo: df_sv2.head(20)[["CNES", "INFORMANTE", "UNIDADE_NOTIFICANTE", "PACIENTE"]]

In [18]:
# 4. Criar coluna "FONTE_ABRANGENCIA" com valores interna (abrangência igual a informante) ou externa (abrangência diferente da informante)

# Função para determinar "Interna" ou "Externa"
def define_fonte_abrangencia(linha):
    if linha['UNIDADE_NOTIFICANTE'] == linha['UNIDADE_ABRANGENCIA']:
        return 'Interna'
    else:
        return 'Externa'

# Aplica a função à coluna "FONTE_ABRANGENCIA" usando apply
df_sv2['FONTE_ABRANGENCIA'] = df_sv2.apply(define_fonte_abrangencia, axis=1)   #axis1, significa eixo 1 ou linha a linha

In [19]:
df_sv2.head()[["CNES", "INFORMANTE", "UNIDADE_ABRANGENCIA", "FONTE_ABRANGENCIA"]]

Unnamed: 0,CNES,INFORMANTE,UNIDADE_ABRANGENCIA,FONTE_ABRANGENCIA
0,2035553,UBS PIRAPORINHA,UBS PIRAPORINHA,Externa
1,2035553,UBS PIRAPORINHA,OUTRA,Externa
2,2035553,UBS PIRAPORINHA,UBS PIRAPORINHA,Interna
3,2035553,UBS PIRAPORINHA,UBS PIRAPORINHA,Interna
4,2035553,UBS PIRAPORINHA,UBS PIRAPORINHA,Interna


In [20]:
# 5. Corrigir formato de datas

#Função Corrigir data
def corrigir_formato_data(data):
    try:
        if isinstance(data, str):
            # Tenta converter texto no formato 'dd/mm/aaaa' em objeto de data
            return datetime.datetime.strptime(data, '%d/%m/%Y').strftime('%d/%m/%Y')
        elif isinstance(data, int):
            # Tenta converter número Excel em objeto de data
            data_referencia_excel = datetime.datetime(1899, 12, 30)
            return (data_referencia_excel + datetime.timedelta(days=data)).strftime('%d/%m/%Y')
        elif isinstance(data, datetime.datetime):
            # Se já for um objeto de data, mantém da mesma forma
            return data.strftime('%d/%m/%Y')
        else:
            return 'Formato de data não reconhecido'
    except Exception as e:
        return 'Erro na conversão: ' + str(e)

''' Exemplos de uso
data_texto = '23/03/2023'
data_excel = 44931
data_correta = datetime.datetime(2023, 3, 23)

print(corrigir_formato_data(data_texto))    # Saída: '23/03/2023'
print(corrigir_formato_data(data_excel))    # Saída: '23/03/2023'
print(corrigir_formato_data(data_correta))  # Saída: '23/03/2023'
'''

" Exemplos de uso\ndata_texto = '23/03/2023'\ndata_excel = 44931\ndata_correta = datetime.datetime(2023, 3, 23)\n\nprint(corrigir_formato_data(data_texto))    # Saída: '23/03/2023'\nprint(corrigir_formato_data(data_excel))    # Saída: '23/03/2023'\nprint(corrigir_formato_data(data_correta))  # Saída: '23/03/2023'\n"

In [21]:
# 5.1 Aplicar função corrigir_formato_data
df_sv2['DATA_NOTIFICACAO'] = df_sv2['DATA_NOTIFICACAO'].apply(corrigir_formato_data)
df_sv2['NASCIMENTO'] = df_sv2['NASCIMENTO'].apply(corrigir_formato_data)

''' Se necessário trabalhar com as demais colunas de datas
df_sv2['DATA_CONCLUSAO'] = df_sv2['DATA_CONCLUSAO'].apply(corrigir_formato_data)
df_sv2['DATA_EXAME1'] = df_sv2['DATA_EXAME1'].apply(corrigir_formato_data)
df_sv2['DATA_EXAME2'] = df_sv2['DATA_EXAME2'].apply(corrigir_formato_data)
df_sv2['DATA_EXAME3'] = df_sv2['DATA_EXAME3'].apply(corrigir_formato_data)
df_sv2['DATA_GRAVA'] = df_sv2['DATA_GRAVA'].apply(corrigir_formato_data)
df_sv2['DATA_ALTERA'] = df_sv2['DATA_ALTERA'].apply(corrigir_formato_data)
'''

" Se necessário trabalhar com as demais colunas de datas\ndf_sv2['DATA_CONCLUSAO'] = df_sv2['DATA_CONCLUSAO'].apply(corrigir_formato_data)\ndf_sv2['DATA_EXAME1'] = df_sv2['DATA_EXAME1'].apply(corrigir_formato_data)\ndf_sv2['DATA_EXAME2'] = df_sv2['DATA_EXAME2'].apply(corrigir_formato_data)\ndf_sv2['DATA_EXAME3'] = df_sv2['DATA_EXAME3'].apply(corrigir_formato_data)\ndf_sv2['DATA_GRAVA'] = df_sv2['DATA_GRAVA'].apply(corrigir_formato_data)\ndf_sv2['DATA_ALTERA'] = df_sv2['DATA_ALTERA'].apply(corrigir_formato_data)\n"

In [22]:
#5.2 Testar função corrigir_formato_data
df_sv2.head()[["INFORMANTE", "PACIENTE", "DATA_NOTIFICACAO", "NASCIMENTO", "DATA_CONCLUSAO",  "DATA_EXAME1", "DATA_EXAME2", "DATA_EXAME3", "DATA_EXAME4", "DATA_GRAVA", "DATA_ALTERA" ]]

Unnamed: 0,INFORMANTE,PACIENTE,DATA_NOTIFICACAO,NASCIMENTO,DATA_CONCLUSAO,DATA_EXAME1,DATA_EXAME2,DATA_EXAME3,DATA_EXAME4,DATA_GRAVA,DATA_ALTERA
0,UBS PIRAPORINHA,MIT FRMSQU PINHIR,05/01/2023,05/01/2023,,2023-01-05 00:00:00,2023-03-03,2023-05-25,,2023-02-02 09:17:11,2023-05-31 14:18:36
1,UBS PIRAPORINHA,KTI VLNTIM GNÇLLVS,11/01/2023,06/11/1992,,2023-01-12 00:00:00,NaT,NaT,,2023-01-20 12:11:06,
2,UBS PIRAPORINHA,BTRIZ MRINH DS SNTS,12/01/2023,02/05/1999,,2023-01-13 00:00:00,2023-06-16,NaT,,2023-01-20 12:14:59,2023-06-28 14:09:20
3,UBS PIRAPORINHA,JKLIN SNTS LMID,07/03/2023,05/10/1999,,2023-03-07 00:00:00,NaT,NaT,,2023-03-13 12:58:06,2023-03-14 08:38:55
4,UBS PIRAPORINHA,MRI VRNIC DS SNTS,13/03/2023,02/04/1954,28/03/2023,2023-03-17 00:00:00,NaT,NaT,,2023-03-14 08:33:50,2023-03-28 09:29:41


In [23]:
# 6. Alterar valor da coluna SEMANA para ano+semana
# Primeiro, manter apenas os dois dígitos numéricos da coluna SEMANA
df_sv2['SEMANA'] = df_sv2['SEMANA'].str.extract(r'(\d{2})')

# concatenar os dois dígitos da coluna SEMANA com a coluna ANO_NOTIFICACAO
df_sv2['SEMANA'] = df_sv2['ANO_NOTIFICACAO'].astype(str) + df_sv2['SEMANA'].astype(str).str.zfill(2)

df_sv2.head()[['INFORMANTE', 'ANO_NOTIFICACAO', 'SEMANA', 'PACIENTE']]

Unnamed: 0,INFORMANTE,ANO_NOTIFICACAO,SEMANA,PACIENTE
0,UBS PIRAPORINHA,2023,202301,MIT FRMSQU PINHIR
1,UBS PIRAPORINHA,2023,202302,KTI VLNTIM GNÇLLVS
2,UBS PIRAPORINHA,2023,202302,BTRIZ MRINH DS SNTS
3,UBS PIRAPORINHA,2023,202310,JKLIN SNTS LMID
4,UBS PIRAPORINHA,2023,202311,MRI VRNIC DS SNTS


In [24]:
# 7. Cria a coluna "QTDE-TOTAL" duplicada de "QTDE-COVID"
df_sv2['QTDE-TOTAL'] = df_sv2['QTDE-COVID']

# Preenche os valores nulos na coluna "QTDE-TOTAL" com 1
df_sv2['QTDE-TOTAL'].fillna(1, inplace=True)


df_sv2.tail()[['DOENCA_AGRAVO', 'QTDE-COVID', 'QTDE-TOTAL']]

Unnamed: 0,DOENCA_AGRAVO,QTDE-COVID,QTDE-TOTAL
42983,ATENDIMENTO ANTI-RÁBICO HUMANO,,1.0
42984,DENGUE,,1.0
42985,ACIDENTE DE TRABALHO,,1.0
42986,HEPATITES VIRAIS,,1.0
42987,DENGUE,,1.0


In [25]:
# 7.1 Filtra as primeiras 20 linhas onde a coluna "DOENÇA" seja igual a "covid"
filtro_covid = df_sv2[df_sv2['DOENCA_AGRAVO'] == 'SÍNDROME GRIPAL – COVID-19']
filtro_covid.tail()[['INFORMANTE', 'DOENCA_AGRAVO', 'QTDE-COVID', 'QTDE-TOTAL']]

Unnamed: 0,INFORMANTE,DOENCA_AGRAVO,QTDE-COVID,QTDE-TOTAL
42947,UBS VILA EMA DR FUAD KASSAB,SÍNDROME GRIPAL – COVID-19,10.0,10.0
42960,UBS VILA EMA DR FUAD KASSAB,SÍNDROME GRIPAL – COVID-19,32.0,32.0
42963,UBS VILA EMA DR FUAD KASSAB,SÍNDROME GRIPAL – COVID-19,2.0,2.0
42973,UBS VILA EMA DR FUAD KASSAB,SÍNDROME GRIPAL – COVID-19,1.0,1.0
42975,UBS VILA EMA DR FUAD KASSAB,SÍNDROME GRIPAL – COVID-19,1.0,1.0


In [26]:
# 8. Contar quantidade moradores de rua

def marcar_situacao_rua(valor):
  if isinstance(valor, str) and ('situacao de rua' in valor.lower() or 'situação de rua' in valor.lower() or 'situacão de rua' in valor.lower() or 'situaçao de rua' in valor.lower()):
    return 'SIM'
  else:
    return ''

#Aplicando a função à nova coluna:

df_sv2['SITUACAO_RUA'] = df_sv2['OBSERVACAO'].apply(marcar_situacao_rua)


In [27]:
# 8.1 Testar SITUACAO_RUA
filtro_rua = df_sv2[df_sv2['SITUACAO_RUA'] == 'SIM']
filtro_rua.tail()[['INFORMANTE', 'PACIENTE', 'SITUACAO_RUA', 'OBSERVACAO']]

Unnamed: 0,INFORMANTE,PACIENTE,SITUACAO_RUA,OBSERVACAO
29139,AMA UBS INTEGRADA V MORAES JOAO PAULO BOTELHO ...,JDR MNDS RIBIR,SIM,PACIENTE VIVE EM SITUAÇÃO DE RUA E FAZ ACOMPAN...
38833,UBS V NOVA YORK,LNRD D SILV LIVIR,SIM,EM SITUAÇÃO DE RUA
38834,UBS V NOVA YORK,SMUL STIN,SIM,EM SITUAÇÃO DE RUA
39766,AMA SAPOPEMBA,DNIL GUSMÃ D SILV,SIM,SITUAÇÃO DE RUA
41335,UBS VILA PRUDENTE,JULIN NVS RIBIR,SIM,"GESTANTE EM SITUAÇÃO DE RUA, NÃO SABE INFORMAR..."


### **3. Carregamento de Dados**

 "Load" é a terceira e última etapa do processo. Nesta etapa, os dados processados e transformados nas etapas anteriores (extração e transformação) são carregados em um destino de dados, geralmente um banco de dados ou um armazenamento de dados para que possam ser usados para análise, relatórios ou qualquer outro propósito.

A etapa de "Load" envolve:

**Definir o destino de dados:** Primeiro, você precisa determinar para onde os dados serão carregados. Isso pode ser um banco de dados relacional (como MySQL, PostgreSQL, SQL Server), um armazenamento de dados NoSQL (como MongoDB, Cassandra), um data warehouse (como Redshift, BigQuery), ou até mesmo um arquivo (como CSV ou Excel), dependendo das necessidades do seu projeto.

**Transformações finais (se necessário):** Antes de carregar os dados, podem ser necessárias transformações finais para garantir que os dados atendam aos requisitos do destino. Isso pode incluir a conversão de tipos de dados, a aplicação de regras de negócios específicas ou a agregação de dados.

**Carregar os dados:** Finalmente, os dados são inseridos no destino escolhido. Isso pode envolver a criação de novas tabelas, a atualização de tabelas existentes ou a adição de novos registros aos dados já existentes, dependendo da estratégia de carga definida.

**Validação e monitoramento:** Após o carregamento, é importante realizar verificações de integridade e qualidade dos dados para garantir que os dados estejam corretos e que nenhum erro tenha ocorrido durante o processo de ETL. Além disso, é comum configurar monitoramento contínuo para garantir que as futuras cargas de dados também ocorram sem problemas.

A etapa de "Load" é crucial para garantir que os dados estejam disponíveis e prontos para uso pelos analistas e sistemas de relatórios. Ela é uma parte fundamental do processo de ETL que ajuda as organizações a transformar dados brutos em informações valiosas e insights acionáveis.



Cálculos


1. Criar medida Total de notificações
2. Top 10 agravos
3. Total de agravos por STS
4. Perfil de pacientes por agravo
5. Linha temporal de agravos por semana
6. Diferença percentual entre duas semanas

In [28]:
# 1. Criar medida Total de notificações
total_notificacoes = df_sv2['QTDE-TOTAL'].sum()
# ou total_notificacoes = sum(df_sv2['QTDE-TOTAL'])
total_notificacoes

297066.0

In [41]:

# 2. Top 10 agravos
# Agrupa por tipo de agravo e soma a quantidade total de notificacoes
ranking_agravos = df_sv2.groupby('DOENCA_AGRAVO')['QTDE-TOTAL'].sum().reset_index()

#Ordena por quantidade em ordem decrescente
ranking_agravos = ranking_agravos.sort_values(by='QTDE-TOTAL', ascending=False)

#Cria um ranking
ranking_agravos['Rank'] = ranking_agravos['QTDE-TOTAL'].rank(ascending=False, method='min')

#Exibe o ranking
#print(ranking_agravos)





In [42]:
# Inicializa o Flask
server = Flask(__name__)

# Inicializa o aplicativo Dash
app = dash.Dash(__name__, server=server)

# cria o gráfico
fig = px.bar(df_sv2, x="SEMANA", y="QTDE-TOTAL", color="STS", barmode="group")
opcoes = list(df_sv2['STS'].unique())
opcoes.append("Todos os Territórios")

opcoes_agravo = list(df_sv2['DOENCA_AGRAVO'].unique())
opcoes_agravo.append("Todos os Agravos")

# Cria o layout, podendo usar itens de html ou itens de gráfico (dcc)
app.layout = html.Div(children=[
    html.H1(children='Semana Epidemiológica - SV2'),
    html.H2(children='Gráfico com a quantidade total de notificações por território (STS)'),
    html.Div(children='''
        Obs: não está separado por agravos.
    '''),

    dcc.Dropdown(opcoes, value='Todos os Territórios', id='lista_STS'),
    dcc.Dropdown(opcoes_agravo, value='Todos os Agravos', id='lista_agravos'),

    dcc.Graph(
        id='grafico_quantidade_agravos',
        figure=fig
    )
])

# Define a rota do Flask para o Dash
@server.route('/')
def index():
    return 'Hello, Gráfico'

@app.callback(
    Output('grafico_quantidade_agravos', 'figure'),
    [Input('lista_STS', 'value'),
    Input('lista_agravos', 'value')]
)
def update_output(sts_selecionada, agravo_selecionado):
    if sts_selecionada == "Todos os Territórios":
        fig = px.bar(df_sv2, x="SEMANA", y="QTDE-TOTAL", color="STS", barmode="group")
    elif agravo_selecionado == "Todos os Agravos":
        fig = px.bar(df_sv2, x="SEMANA", y="QTDE-TOTAL", color="STS", barmode="group")
    else:
        tabela_filtrada = df_sv2.loc[(df_sv2['STS']==sts_selecionada) & (df_sv2['DOENCA_AGRAVO']==agravo_selecionado)]
        fig = px.bar(tabela_filtrada, x="SEMANA", y="QTDE-TOTAL", color="STS", barmode="group")

    return fig


if __name__ == '__main__':
    app.run_server(debug=True)

<IPython.core.display.Javascript object>

In [43]:
fig