## Conclusão

Este estudo analisou a base de SRAG hospitalizado de 2023 a partir de quatro eixos principais:

- **Grupos de risco**
- **Gravidade clínica e trajetória intra-hospitalar**
- **Tempo e sazonalidade**
- **Geografia e inequidades**

Em seguida, foram construídos **modelos de machine learning** para previsão de óbito.

De forma geral, os achados são compatíveis com o que já se conhece em epidemiologia, mas agora **quantificados**:

- A maior parte dos casos ocorre em **adultos e idosos**, com forte concentração de óbitos em **idosos com múltiplas comorbidades**.  
- A **mortalidade global** situa-se em torno de **10–12%** entre hospitalizados, variando pouco entre regiões, mas mudando de forma importante entre **perfis clínicos**.  
- **Marcadores de gravidade** (UTI, suporte ventilatório, ventilação invasiva) explicam uma parcela relevante do risco de óbito, mas **não explicam sozinhos** a piora da letalidade no final do ano.  
- Há sinais de **diferenças territoriais e por raça/cor**, embora menos acentuadas do que em outros contextos (por exemplo, COVID na fase aguda da pandemia).  
- Os **modelos de risco** (Regressão Logística e Random Forest) apresentam **boa capacidade discriminatória** (ROC-AUC ≈ 0,90), dentro das limitações de dados e de contexto assistencial.

---

## Principais insights da análise

### 1. Quem está mais em risco?

#### Idade

- O risco de óbito **aumenta de forma monotônica** com a idade.  
- Idosos (especialmente **≥ 60 anos**, e em particular **≥ 80 anos**) concentram uma fração desproporcional dos óbitos, mesmo não sendo maioria absoluta dos casos.  

#### Comorbidades

- A presença de **pelo menos uma comorbidade** (`HAS_COMORB = 1`) já está associada a **elevação substancial do risco**.  
- O número de comorbidades (`N_COMORB`) funciona como um **gradiente de risco**: quanto maior a carga de condições crônicas, maior a probabilidade de evolução para óbito.  
- Pacientes com **múltiplas comorbidades** constituem um grupo de **altíssimo risco**, aparecendo de forma consistente tanto nas análises descritivas quanto nos modelos preditivos.

#### Sexo, raça/cor e contexto social

- Observa-se **pequena predominância de casos no sexo masculino**, com diferença modesta de letalidade, mas coerente com o padrão histórico de SRAG e infecções respiratórias.  
- Em raça/cor, **Branca** e **Preta/Parda** concentram a maior parte dos casos; há diferenças de letalidade entre grupos, mas:
  - parte do efeito se mistura com **idade, comorbidades e território**;  
  - o bloco **“Ignorado/Missing”** é numericamente relevante e introduz incerteza adicional.  

**Síntese do eixo**:  
O “núcleo duro” de risco individual é formado por **idade avançada + maior carga de comorbidades + marcadores sociais/territoriais específicos**.

---

### 2. Gravidade e trajetória dentro do hospital

#### UTI e suporte ventilatório

- Uma proporção importante de pacientes utiliza **UTI** e/ou algum tipo de **suporte ventilatório**.  
- A **ventilação invasiva** define um estrato de **gravidade extrema**, com mortalidade média próxima de **50%**, relativamente estável ao longo das estações.  
- Mesmo no grupo considerado “menos grave” (sem UTI e sem ventilação), a mortalidade permanece relevante (~**7–9%**), lembrando que se trata de pacientes já hospitalizados.

#### Severidade ao longo do ano

- Ao segmentar por estação, o **mix de gravidade** (sem suporte / não invasivo / invasivo) varia pouco.  
- A taxa de uso de UTI é semelhante entre outono/inverno e primavera/verão, com diferenças de poucos pontos percentuais.  
- A **piora da letalidade no fim do ano** não é acompanhada por um aumento proporcional na proporção de casos extremamente graves (não há “explosão” de UTI/intubação).  

**Interpretação**:  
O sistema opera em um **patamar elevado de gravidade durante todo o ano**, com sazonalidade **modesta** nesse aspecto.

#### Tempos de trajetória

Medianas globais aproximadas:

- **2–3 dias** entre início dos sintomas e internação;  
- **~3 dias** entre início dos sintomas e entrada em UTI (quando há UTI);  
- **~9–10 dias** até o desfecho (cura ou óbito).  

Diferenças entre cura e óbito:

- Pacientes que evoluem a óbito têm trajetória **ligeiramente diferente**, mas sem grandes diferenças de tempo que, isoladamente, expliquem o desfecho.

Por estação, as medianas variam pouco, sem evidência clara de períodos em que pacientes cheguem sistematicamente “mais tarde”.

**Síntese do eixo**:  
O sistema recebe **pacientes graves de forma contínua**, com fração estável em UTI e ventilação. A ventilação invasiva marca um patamar de **risco extremo**, mas a variação de letalidade ao longo do ano parece envolver outros fatores (perfil dos pacientes, mix de vírus, pressão assistencial, etc.).

---

### 3. Tempo, sazonalidade e eventos

#### Casos

- Claros **picos de casos em outono e inverno**, alinhados ao padrão esperado de doenças respiratórias.  
- Posteriormente, observa-se queda e estabilização em um patamar mais baixo.

#### Óbitos

- A curva de óbitos acompanha a de casos, com **tendência de queda mais lenta**.  

#### Letalidade (proporção de óbitos entre hospitalizados)

- Mantém-se em torno de **10–12%** durante boa parte do ano.  
- Apresenta **tendência de alta** no fim do ano (primavera/verão), **sem** aumento proporcional de uso de UTI/intubação.  

Ao se sobrepor séries com **momentos de campanha** (vacinação influenza, bivalente COVID, etc.), em alguns trechos há coincidência entre campanhas e queda/estabilização, mas:

- a série é **curta (apenas 1 ano)**;  
- múltiplos fatores atuam simultaneamente;  

Portanto, falamos de **sugestões de associação**, não de causalidade.

**Síntese do eixo**:  
A sazonalidade é clara no **volume de casos**, mas a **letalidade** parece ter um componente mais **estrutural** e outro possivelmente ligado a **mudança de perfil/mix viral** e **pressão do sistema** no fim do ano.

---

### 4. Geografia e inequidades

#### Distribuição de casos

- Maior carga de casos concentrada no **Sudeste**, seguida por **Sul** e **Nordeste**, em linha com a distribuição populacional e da rede hospitalar.  
- A maior parte dos registros vem de **municípios do interior**, embora capitais mantenham participação relevante nos casos graves.

#### Letalidade por UF e região

- Letalidade relativamente similar entre regiões (faixa de ~**10–13%**), com algumas UFs apresentando valores consistentemente maiores ou menores.  
- Diferenças intracategoria (dentro da mesma região) sugerem influência de:
  - **infraestrutura local**,  
  - **organização da rede**,  
  - **recursos disponíveis**,  
mais do que um padrão puramente “regional”.

#### Zona urbana/rural/periurbana

- Zona **urbana** concentra a maior parte dos casos e óbitos.  
- Zonas **rural** e **periurbana** têm menor volume absoluto, mas em alguns recortes exibem **letalidade discretamente maior**, sugerindo:
  - possíveis desafios de **acesso**,  
  - **tempo até o cuidado**,  
  - e **estrutura assistencial**.

#### Raça/cor x território

Ao cruzar macro-raça com região, UF e tipo de município:

- Em vários contextos, pessoas **Pretas/Pardas** apresentam letalidade **igual ou ligeiramente maior** que pessoas Brancas.  
- Em outros cenários, a diferença desaparece ou inverte, evidenciando o papel de:
  - território,  
  - rede de serviços,  
  - organização local.  
- O bloco **“Ignorado/Missing”** permanece numericamente relevante, podendo:
  - distorcer comparações,  
  - e ocultar situações de maior fragilidade de registro e acesso.

**Síntese do eixo**:  
Existem **desigualdades territoriais e por raça/cor**, porém fortemente entrelaçadas com **infraestrutura local**, **mix de casos** e **qualidade de registro**. A mensagem é menos “atribuir responsabilidade a uma única região” e mais “monitorar equidade de forma contínua e granular”.

---

### 5. Aprendizados dos modelos de risco (ML)

- Tanto a **Regressão Logística** quanto o **Random Forest** apresentam **ROC-AUC ≈ 0,89–0,90**, com boa capacidade de ordenar pacientes em **menor vs. maior risco**.  
- As curvas PR e as matrizes de confusão indicam que:
  - é possível manter **recall elevado (~0,83–0,84)** para óbito;  
  - com **precisão moderada (~0,35–0,37)** – isto é, o modelo tende a **superestimar** o grupo de alto risco (mais falsos positivos), o que é aceitável em contexto de **triagem clínica**.  
- A calibração mostra que:
  - as probabilidades brutas são **imperfeitas**, em especial na faixa intermediária;  
  - existe um **estrato de risco muito elevado**, em que a frequência real de óbito ultrapassa **60–70%**, o que é operacionalmente útil para **priorização**.

Em síntese, o modelo **confirma e quantifica** a narrativa da EDA:  
**idade, comorbidades, gravidade clínica e contexto territorial** são os principais determinantes do risco, e podem ser sintetizados em um **score operacional** sem perda significativa de transparência.

---

## Recomendações

### 1. Foco em grupos de maior risco

#### Idosos com múltiplas comorbidades

Priorizar esse grupo em:

- **Vacinação** (influenza, COVID e outras relevantes).  
- **Monitoramento precoce de sintomas**, com canais facilitados para busca de atendimento.  
- **Vias rápidas** na chegada ao serviço (triagem, acesso a oxigênio, exames, definição rápida de leito adequado).  

Protocolos específicos para “paciente SRAG + `N_COMORB` elevado” podem reduzir atrasos em decisões críticas.

#### Pacientes em ventilação invasiva / alta severidade

Pacientes em ventilação invasiva apresentam **mortalidade próxima de 50%**:

- recomenda-se revisão de **protocolos de indicação, manejo e desmame**;  
- monitoramento de **indicadores de qualidade do cuidado intensivo** (tempo até intubação, relação leito/equipe, complicações).

---

### 2. Sazonalidade e preparação de serviços

#### Planejamento por estação

Usar os padrões de pico em outono/inverno para:

- ajustar **estoques de insumos** (antivirais, sedativos, dispositivos de ventilação, EPI);  
- reforçar **escalas de plantão** em hospitais de referência;  
- intensificar **comunicação pública** sobre sinais de alerta e busca precoce de assistência.

#### Monitorar letalidade no fim do ano

A **letalidade aumenta** na primavera/verão sem aumento proporcional de uso de UTI:

- isso pode indicar **alteração de circulação viral** ou **pressão em outros pontos do sistema**.  
- recomenda-se monitorar **curvas de letalidade diária/semanal** em painel interativo, com **alertas automatizados** para desvios persistentes.

---

### 3. Redução de inequidades

#### Território (região, UF, capital/interior, zona)

Recomenda-se estruturar um **painel de inequidades** contendo:

- letalidade por **região/UF**;  
- letalidade por **zona** (urbana/rural/periurbana);  
- letalidade por **tipo de município** (capital vs. interior).

Locais com letalidade **consistentemente acima da média** devem ser priorizados para:

- diagnóstico de **infraestrutura** (leitos, UTI, ventiladores);  
- análise de **fluxos de referência/contrarreferência**;  
- reforço em **capacitação** e **protocolos assistenciais padronizados**.

#### Raça/cor

- Melhorar a **qualidade do preenchimento** de raça/cor (reduzir “Ignorado/Missing”).  
- Onde houver diferença clara de letalidade (ex.: Pretos/Pardos em determinado território), planejar:
  - **ações focalizadas de busca ativa e cuidado**,  
  - **campanhas específicas** em articulação com a Atenção Primária e lideranças comunitárias.

---

### 4. Uso dos modelos de risco na prática

#### Ferramenta de apoio, não de decisão automática

- Utilizar o modelo como **score de risco** na admissão ou primeiras 24h, classificando em faixas (baixa, intermediária, alta).  
- Associar cada faixa de risco a **ações explícitas**:
  - priorização de leito,  
  - revisão sistemática de casos de alto risco,  
  - intensificação de monitoramento.

#### Monitoramento de desempenho e viés

- Avaliar métricas do modelo por **região, raça/cor, tipo de município** para:
  - identificar onde o desempenho é inferior;  
  - ajustar limiares ou recalibrar quando necessário.  
- Evitar o uso “cego” do score em contextos onde o desempenho se mostrar claramente inadequado.

#### Integração com dashboards

Incorporar ao painel de vigilância:

- proporção de pacientes em **alto risco previsto** por hospital/região;  
- tendência temporal desse indicador;  
- combinação com **taxa de ocupação de UTI** e **disponibilidade de ventiladores**.

---

### 5. Recomendações para dados e vigilância

#### Qualidade de dados

Priorizar a completude e consistência de campos como:

- datas de **início de sintomas, internação, UTI e evolução**;  
- **comorbidades principais**;  
- **raça/cor** e **zona de residência**.

Implementar:

- **regras de consistência** (ex.: datas em ordem cronológica);  
- **alertas de preenchimento anômalo** (datas invertidas, códigos inválidos).

#### Ciclo contínuo de aprendizado

Tratar a análise como **processo recorrente**, não exercício pontual:

- repetir o estudo **anual ou periodicamente**;  
- atualizar modelos;  
- revisar padrões de sazonalidade;  
- monitorar se intervenções estão produzindo redução de letalidade e desigualdades.

---

### 6. Síntese final

A base de SRAG 2023 descreve um sistema que:

- lida com **casos graves ao longo de todo o ano**,  
- apresenta picos de volume previsíveis,  
- mas cuja **letalidade** depende de um conjunto de fatores que vão além da sazonalidade.

Os **grupos clássicos de risco** – idade avançada, múltiplas comorbidades, alta gravidade clínica – seguem como protagonistas, e os modelos de ML permitem organizar esse conjunto em um **score utilizável na prática**.

As diferenças entre **territórios** e **grupos sociais** são reais, mas exigem **monitoramento contínuo e intervenções localizadas**, e não respostas genéricas.

O principal ganho prático do projeto não é um modelo “perfeito”, e sim:

- maior **clareza sobre quem está em risco**,  
- melhor entendimento de **onde e como intervir antes**,  
- e uma ponte concreta entre **informação epidemiológica** e **decisão de gestão e cuidado**.
