# Introdução

Esse notebook estuda o avanço do novo coronavírus no estado do Ceará. As bases utilizadas aqui foram todas disponibilizadas aqui pelo IntegraSUS Analytics (https://integrasusanalytics.saude.ce.gov.br) abertamente.

O objetivo do meu estudo é observar o avanço da doença e tentar prever seu rumo.

# Informações externas para o entendimento deste notebook

A capital cearense, como era de se esperar, foi a cidade mais atingida pela pandemia do novo coronavírus no estado. O combate a pandemia em Fortaleza foi crucial para reduzir a onda de contaminção que se alastrava pelo estado. As restrições intensivas, conhecidas como lockdown, foram aplicadas na capital a partir do dia 08 de maio de 2020 e foi responsável por reduzir a onda de contágio no estado inteiro.

A data 08 de maio de 2020 será mencionada novamente quando for abordado a quantidade de novos casos positivos no estado do Ceará.

# Importações

In [47]:
################# bibliotecas previsoras ##############
from sklearn.model_selection import train_test_split
from fbprophet import Prophet

################# bibliotecas matemáticas #############
import pandas as pd
import numpy as np
from math import ceil

################# bibliotecas gráficas #################
import plotly.express as px
from plotly.offline import iplot
import plotly.graph_objects as go
import plotly.offline as py

In [48]:
# paleta de cores para os gráficos
tema_torta =px.colors.qualitative.Plotly
tema = px.colors.qualitative.G10
tema01 = ['forestgreen', 'orangered']

# Função auxiliar

In [49]:
  ## adicionar linha num gráfico
def add_trace(grafico, X, Y, mode='lines', name='', color='forestgreen', fill=None):
    return grafico.add_trace(go.Scatter(x = X,y = Y, mode=mode, name=name, line=dict(color=color), fill=fill ))

# Trabalhando a base exame

In [50]:
## carregando a base
base_exames = pd.read_csv('base_exames.csv', index_col='Unnamed: 0')

In [51]:
## criando novo dataframe para manipular os dados sem alterar o df principal
exames_novos = base_exames.copy()

## formatando a data
exames_novos['datas'] = pd.to_datetime(exames_novos['datas'], format='%Y-%m-%d').dt.strftime('%Y-%m-%d')

## agrupando
exames_novos = exames_novos.groupby('datas').sum().reset_index()

## exames acumulados
exames_acumulados = exames_novos.copy()
exames_acumulados['exames'] = exames_acumulados['exames'].cumsum()

In [52]:
## calculando a média móvel para melhor entendimento do gráfico
exames_novos['media_movel15'] = exames_novos.exames.rolling(15).mean()
exames_novos['media_movel30'] = exames_novos.exames.rolling(30).mean()

## Gráficos

In [53]:
# grafico de exames 01
g_ex_01 = go.Figure()

add_trace(g_ex_01, exames_novos.datas, exames_novos.exames, color='forestgreen', name='Exames positivos')
add_trace(g_ex_01, exames_novos.datas, exames_novos.media_movel30, color='orangered', name='Média móvel 30 dias')
add_trace(g_ex_01, exames_novos.datas, exames_novos.media_movel15, color='brown', name='Média móvel 15 dias')

g_ex_01.update_layout(title='Quantidade de exames por dia no estado do Ceará',
xaxis_title='Período',
yaxis_title='Quantidade de exames feitos')


py.iplot(g_ex_01)

In [54]:
# gráfico de exames 02

g_ex_02 = go.Figure()

add_trace(g_ex_02, exames_acumulados.datas, exames_acumulados.exames)

g_ex_02.update_layout(title='Quantidade de exames feitos acumulados no estado do Ceará',
xaxis_title='Período',
yaxis_title='Quantidade de exames feitos')


py.iplot(g_ex_02)

Analisando os gráficos, nota-se que o estado do Ceará fez um investimento crescente no que tange a exames para COVID-19. Esse investimento possibilitou um melhor rastreamento da doença, facilitando assim o combante contra ela. Tal afirmativa será confirmada ao longo desse estudo.

# Trabalhando a base confirmados

In [55]:
base_confirmados = pd.read_csv('base_confirmados.csv', index_col='Unnamed: 0')

## Preenchendo datas vazias

In [56]:
## Lidando com as datas vazias
base_confirmados['datas'] = np.where(base_confirmados['data_inicio_sintomas'].isnull() == True,
                                     base_confirmados['data_resultado_exame'], base_confirmados['data_inicio_sintomas'] )

base_confirmados['datas'] = np.where(base_confirmados['datas'].isnull() == True,
                                     base_confirmados['data_coleta_exame'], base_confirmados['datas'])

## atribuindo 1 para fazer um groupby
base_confirmados['casos_positivos'] = 1

## Separando a base em casos novos e casos acumulados

In [57]:
## criando novo dataframe para manipular os dados sem alterar o df principal
casos_novos = base_confirmados.copy()
casos_novos = casos_novos.loc[:, ['datas', 'casos_positivos']]

## formatando a data
casos_novos['datas'] = pd.to_datetime(casos_novos['datas'], format='%Y-%m-%d').dt.strftime('%Y-%m-%d')

##groupby casos_novos
casos_novos = casos_novos.groupby('datas').sum().reset_index()
casos_novos = casos_novos.loc[ casos_novos['datas'] >= '2020-03-10']

## casos acumulados
casos_acumulados = casos_novos.copy()
casos_acumulados['casos_positivos'] = casos_novos['casos_positivos'].cumsum()

## Novos casos positivos por dia e médias móveis

In [58]:
mms_positivos = casos_novos.copy()
#teste.reset_index(inplace=True)
mms_positivos['datas'] = pd.to_datetime(mms_positivos['datas'])
mms_positivos['media_movel30'] = mms_positivos.casos_positivos.rolling(30).mean()
mms_positivos['media_movel15'] = mms_positivos.casos_positivos.rolling(15).mean()

In [59]:
# gráfico de confirmados 01
g_mms_pos = go.Figure()

add_trace(g_mms_pos, mms_positivos['datas'], mms_positivos['casos_positivos'], name='Casos reais')
add_trace(g_mms_pos, mms_positivos['datas'], mms_positivos['media_movel30'], color='orangered', name='Média móvel 30 dias')
add_trace(g_mms_pos, mms_positivos['datas'], mms_positivos['media_movel15'], color='brown', name='Média móvel 15 dias')

g_mms_pos.update_layout(title='Novos casos positivos por dia e médias móveis',
xaxis_title='Período',
yaxis_title='Média de exames positivos')


py.iplot(g_mms_pos)

As médias móveis nos permitem reduzir a alta volatibilidade do dados, sendo assim, facilita a compreensão das tendências do avança da doença a longo (média móvel 30 dias) e a curto (média móvel 15 dias) prazo.

Observando o gráfico, afere-se que os casos positivos no estado começou a decair na segunda metade de maio, pouco depois do lockdown ser instaurado na capital cearense no dia 08 de maio de 2020. A quantidade de casos mantém-se em queda até a segunda metade de Setembro, quando demonstrou tendências ascendentes, porém, logo em seguida, descendeu novamente.

## Tempo de espera por resultado

In [60]:
## criando um dataframe para o tempo de espera
tempo_espera = base_confirmados.loc[:, ['data_coleta_exame', 'data_resultado_exame']]

## pegando apenas as datas pois as horas estvam causanda inconsisteências
tempo_espera['data_coleta_exame'] = pd.to_datetime(tempo_espera['data_coleta_exame']).dt.normalize()
tempo_espera['data_resultado_exame'] = pd.to_datetime(tempo_espera['data_resultado_exame']).dt.normalize()
tempo_espera['dias_espera_resultado'] =tempo_espera['data_resultado_exame'] - tempo_espera['data_coleta_exame']
tempo_espera['dias_espera_resultado'] = tempo_espera.dias_espera_resultado.dt.days

## a inconsistência das datas acabou gerando dias de espera negativos, por isso vou excluí-los
remover = tempo_espera.loc[tempo_espera.dias_espera_resultado<0]
tempo_espera = tempo_espera.drop(remover.index)

## agrupando as datas e tirando a média diária de espera
tempo_espera = tempo_espera.groupby('data_coleta_exame').mean()
tempo_espera.reset_index(inplace=True)
tempo_espera['dias_espera_resultado'] = np.ceil(tempo_espera['dias_espera_resultado'])

## removendo dados inconsistentes
tempo_espera = tempo_espera.drop(tempo_espera.loc[tempo_espera.dias_espera_resultado>100].index)

**Optei por remover os registros com mais de cem dias de espera por:**
1. Haviam apenas 2 registros desse tipo, ambos em datas bem distantes, logo, os considerei como inconsistências nos dados.
2. Sem esses 2 registros ficou muito legível as variações mais sutis dos dados no período.

### Gráfico dias de espera por resultado positivo

In [61]:
# gráfico de confirmados 01
g_espera_01 = go.Figure()

add_trace(g_espera_01, tempo_espera['data_coleta_exame'], tempo_espera['dias_espera_resultado'], name='Casos reais')

g_espera_01.update_layout(title='Tempo de espera por resultado de exame positivo',
xaxis_title='Período',
yaxis_title='Dias esperados')


py.iplot(g_espera_01)

De acordo com o gráfico "Novos casos positivos por dia e médias móveis", o primeiro semestre de 2020 foi conturbado em relação a pandemia do novo coronavírus. Isso se refletiu na quantidade de exames feitos, na quantidade de exames positivos e, consequentemente, no tempo de espera pelo resultado do exame.

De acordo com o mesmo gráfico, no segundo semestre de 2020, tivemos uma redução considerável na taxa de exames e de exames positivos, isso refletiu numa média de espera de 1 dia durante meses.

Nota-se um comportamento um tanto quanto peculiar nos meses de outubro e novembro, onde temos médias de espera chegando até 4 dias. Um estudo mais afundo será necessário para entender esse comportamento fora do padrão.

**O gráfico marca a data que o exame foi feito, os dias de espera é a quantidade de dias que paciente esperou pelo resultado a partir dessa data**

## Predições dos novos casos e casos acumulados

### Divisão das bases

In [62]:
from sklearn.model_selection import train_test_split
X = casos_novos['datas']
y= casos_novos['casos_positivos']
train_X, val_X, train_y, val_y = train_test_split(X,y, random_state=1, test_size=0.15)

### Prophet

As previsões do Prophet estavam retornando valores negativos. Com isso em mente, minha solução foi usar um algoritmo de normalização de dados que transforma os dados em uma escala de 0 a 1. Assim, as previsões ficaram mais precisas

In [63]:
df = pd.DataFrame([], columns=['ds', 'y'])
df['ds'] = train_X
df['y'] = train_y

In [64]:
# normalizando df['y']
from sklearn.preprocessing import QuantileTransformer
qt = QuantileTransformer(n_quantiles=df['y'].size, random_state=1)
df['y'] = qt.fit_transform(df['y'].values.reshape(-1, 1))

In [65]:
## model fit
prophet_model = Prophet(yearly_seasonality=True, daily_seasonality=True)
prophet_model.fit(df)

## datas futuras
future = prophet_model.make_future_dataframe(periods=15)

## forecast
forecast = prophet_model.predict(future)

## convertendo as previsões para a escala real
forecast['yhat'] = np.round(qt.inverse_transform(forecast['yhat'].values.reshape(-1, 1)))
forecast['yhat_lower'] = np.round(qt.inverse_transform(forecast['yhat_lower'].values.reshape(-1, 1)))
forecast['yhat_upper'] = np.round(qt.inverse_transform(forecast['yhat_upper'].values.reshape(-1, 1)))

## Gráficos

In [66]:
# gráfico de confirmados 01
g_conf_01 = go.Figure()

add_trace(g_conf_01, casos_novos.datas, casos_novos.casos_positivos, name='Casos reais')
add_trace(g_conf_01, future.ds,forecast['yhat'], color='orangered', name='Prophet')
#add_trace(g_conf_01, future.ds,previsoes, color='red', name='AdaBoost')

g_conf_01.update_layout(title='Novos casos positivos por dia',
xaxis_title='Período',
yaxis_title='Quantidade de exames positivos')


py.iplot(g_conf_01)

O gráfico retrata a quantidade de novos casos positivos por dia no estado do Ceará. O Prophet falhou em apontar uma previsão precisa sobre a quantidade de positivos, entretanto, acompanhou com sucesso as tendências e sazonalidades do avanço da COVID-19 em nosso estado. A previsão inicia-se em 11 de Março de 2020 e vai até 02 de Dezembro do mesmo ano. Apesar de fornecer uma previsão imprecisa acerca da quantidade diária, o Prophet nos fornece um forte indicativo tendente ao rápido aumento na quantidade de infectados.

In [67]:
# gráfico de confirmados 02
g_conf_02 = go.Figure()

add_trace(g_conf_02, casos_acumulados.datas, casos_acumulados.casos_positivos, name='Casos reais')
add_trace(g_conf_02, future.ds, forecast['yhat'].cumsum(), color='orangered', name='Prophet')

g_conf_02.update_layout(title='Casos positivos ao longo do tempo',
xaxis_title='Datas',
yaxis_title='Quantidade de exames positivos')


py.iplot(g_conf_02)

## Gráficos relacionando as bases confirmados e exames

In [68]:
## relacionando exames e confirmados novos por dia
g_ex_conf01 = go.Figure()

add_trace(g_ex_conf01, casos_novos.datas, casos_novos.casos_positivos, name='Exames positivo',color='orangered')
add_trace(g_ex_conf01, exames_novos.datas, exames_novos.exames, name='Exames feitos')


g_ex_conf01.update_layout(title='Casos positivos e quantidade de exames por dia',
xaxis_title='Período',
yaxis_title='Quantidades')

py.iplot(g_ex_conf01)

Devido às grandes ondulações no gráfico, é perceptível que o estado falhou em realizar uma coleta de dados precisa. Essa falha refletirá em inconsistências ao longo desta análise.

In [69]:
## relacionando exames e confirmados crescimento
g_ex_conf02 = go.Figure()

add_trace(g_ex_conf02, casos_acumulados.datas, casos_acumulados.casos_positivos, name='Exames positivos', color='orangered')
add_trace(g_ex_conf02, exames_acumulados.datas, exames_acumulados.exames, name='Exames feitos')


g_ex_conf02.update_layout(title='Casos positivos e exames acumulados',
xaxis_title='Períodos',
yaxis_title='Quantidades')

py.iplot(g_ex_conf02)

In [70]:
# Parâmetros
quantidades = [ exames_novos.exames.mean(), casos_novos.casos_positivos.mean()]
datas = ['Média de exames', 'Média de confirmados']

# gráfico exames e confirmados 02
g_ex_conf02 = go.Figure( [go.Bar(x=datas, y=quantidades, marker_color=tema01) ])

g_ex_conf02.update_layout(title_text = 'Médias diárias de exames feitos e casos confirmados',
                yaxis_title='Quantidade',
                xaxis_title='Médias'
                )

g_ex_conf02.show()

In [71]:
# parâmetros torta
tot_ex_conf = {'Não confirmados': (exames_novos.exames.sum() - casos_novos.casos_positivos.sum()),
               'Confirmados': casos_novos.casos_positivos.sum()}

labels = list( tot_ex_conf.keys() )
values = list( tot_ex_conf.values() )

# gráfico
pie_resultado = go.Figure(data=[go.Pie( labels=labels, values=values,hole=.3, marker=dict(colors=tema01) )])
pie_resultado.update_layout(
    title_text="Porcentagem entre exames feitos e exames positivos")
pie_resultado.show()

# Trabalhando a base etária

In [72]:
base_etaria = pd.read_csv('base_etaria.csv')

## Corrigindo inconsistência em algumas idades

Percebi algumas idades inconsistentes. Irei substituir as idades acima de 112 anos porque, segundo o GuinnessBook, essa é a idade do humano mais velho vivo e é pouco provável que os pacientes desta base têm idade igual ou superior a 112.

Fonte: https://www.guinnessworldrecords.com.br/news/2020/4/englishman-bob-weighton-confirmed-as-the-worlds-oldest-man-living-at-112-years-o-613615#:~:text=Inglês%20Bob%20Weighton%20confirmado%20como,112%20anos%20%7C%20Guinness%20World%20Records

In [73]:
base_etaria.idade_paciente.loc[base_etaria.idade_paciente>=112] = base_etaria.idade_paciente.loc[base_etaria.idade_paciente<=112].mean()



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



## Criando as faixas etárias

In [74]:
idades = [0,10,20,30,40,50,60,70,80,90,100,110]
idade_resultado = base_etaria.filter(['idade_paciente', 'resultado_final_exame'])
idade_resultado['idade_paciente'] = pd.to_numeric(idade_resultado['idade_paciente'])
idade_resultado['faixa_etaria'] = pd.cut(idade_resultado['idade_paciente'], idades)

idade_etaria = idade_resultado.groupby(['faixa_etaria','resultado_final_exame']).count().reset_index()
idade_etaria['resultado_final_exame'] = idade_etaria['resultado_final_exame'].astype('string')

etaria_positivos = idade_etaria.loc[idade_etaria['resultado_final_exame']=='Positivo'].drop(columns=['resultado_final_exame'])
faixa_etaria = list(etaria_positivos['faixa_etaria'].astype('string'))

## Gráficos

In [75]:
# parâmetros torta
valores_contados = pd.DataFrame(base_etaria.resultado_final_exame.value_counts()).T
labels = list(valores_contados.columns)
values = valores_contados.values
values = values[0]

In [76]:
# gráfico
g_etaria01 = go.Figure(data=[go.Pie( labels=labels, values=values,hole=.3, marker=dict(colors=tema) )])
g_etaria01.update_layout(
    title_text="Resultados dos exames para COVID-19",
    annotations=[dict(text='Exames', x=0.50, y=0.5, font_size=20, showarrow=False)])
g_etaria01.show()

Por se tratarem de amostras diferentes, as porcentagens de exames positivos entre o gráfico "Resultados dos exames para COVID-19" e o "Porcentagem entre exames feitos e exames positivos" são levemente divergentes, em torno de 4%.

In [77]:
# cores
colors = [tema[3],] * 11
colors[3] = tema01[1]

#gráfico
g_etaria03 = go.Figure( [go.Bar(x=faixa_etaria,
                                  y=list(etaria_positivos['idade_paciente']),
                                 marker_color=colors) ])

g_etaria03.update_layout(title_text = 'Quantidade de exames positivos por faixa etária',
                yaxis_title='Quantidade de casos positivos',
                xaxis_title='Faixa etária'
                )

g_etaria03.show()

# Trabalhando com a base sexo

## Carregamento da base

In [78]:
base_sexo = pd.read_csv('base_sexo.csv')

In [79]:
## convertendo o atributo sexo_paciente e resultado_final_exame para string
base_sexo.resultado_final_exame = base_sexo.resultado_final_exame.astype('string')

## Gráficos

In [80]:
sexo_contagem = pd.DataFrame(base_sexo.sexo_paciente.value_counts()).T

labels = list(sexo_contagem.columns)
values = sexo_contagem.values[0]

g_sexo01 = go.Figure()

# gráfico
g_sexo01 = go.Figure(data=[go.Pie( labels=labels, values=values,hole=.3, marker=dict(colors=tema01) )])
g_sexo01.update_layout(
    title_text="Distribuição de positivos pelo sexo",
    annotations=[dict(text='Sexo', x=0.50, y=0.5, font_size=20, showarrow=False)])
g_sexo01.show()

A diferença na quantidade de positivos entre homens e mulheres pode ter acontecido por vários motivos. Acredito que os dois mais prováveis sejam:
* Coincidência;
* Diferença nos hábitos entre ambos;

Isso pode indicar que as mulheres se cuidam mais que os homens, logo, fazem mais exames e por isso incidem mais nessa amostra de exames positivos.

# Trabalhando com a base obitos

## Carregamento da base

In [81]:
base_obitos = pd.read_csv('base_obitos.csv', index_col='Unnamed: 0')

In [82]:
# passando a data para datetime:
base_obitos.datas = pd.to_datetime(base_obitos.datas)

# adicionando uma nova coluna para agrupamento
base_obitos['obitos'] = 1

# agrupando as datas
base_obitos = pd.DataFrame( base_obitos.groupby('datas').sum() )
base_obitos.reset_index(inplace=True)

## Separando a base

In [83]:
X = base_obitos['datas']
y = base_obitos['obitos']
train_X, val_X, train_y, val_y = train_test_split(X, y, random_state=1, test_size = 0.15)

## Predições

In [84]:
df = pd.DataFrame(columns=['ds', 'y'])
df['ds'] = train_X
df['y'] = train_y

qt2 = QuantileTransformer(n_quantiles=df['y'].size, random_state=1)
df['y'] = qt2.fit_transform(df['y'].values.reshape(-1, 1))

prophet_model2 = Prophet(yearly_seasonality=True, daily_seasonality=True)
prophet_model2.fit(df)
#future = prophet_model2.make_future_dataframe(periods=15)
forecast = prophet_model2.predict(future)
forecast['yhat'] = qt2.inverse_transform(forecast['yhat'].values.reshape(-1, 1))

In [85]:
# gráfico de obitos 01
g_ob01 = go.Figure()

add_trace(g_ob01, base_obitos.datas, base_obitos.obitos, name='Óbitos reais')
add_trace(g_ob01, future.ds,forecast['yhat'], color='orangered', name='Prophet')

g_ob01.update_layout(title='Novos óbitos por dia',
xaxis_title='Período',
yaxis_title='Quantidade de óbitos por dia')


py.iplot(g_ob01)

O Prophet, nesse caso, saiu-se melhor que na previsão dos casos confirmados e, assim como da última vez, acompanhou bem as tendências e sazonalidades dos óbitos. Dessa forma, a previsão nos indica que o número de óbitos por dia voltou a aumentar. Mesmo que as quantidades diárias previstas não sejam 100% precisas, o gráfico nos passa uma boa ideia do que esperar a partir desses resultados crescentes. Resultados esses que fazem total sentido com a predição do número de casos positivos que, também, está aumento.

Vale ressaltar que a amostra analisda começa em 24 de Março de 2020 até 29 de Novembro do mesmo ano, porém, a predição foi feita no mesmo período da predição de casos positivos para que ficassem mais fáceis de analisar.

In [86]:
# gráfico de obitos 02
g_ob02 = go.Figure()

add_trace(g_ob02, base_obitos.datas, base_obitos.obitos.cumsum(), name='Óbitos reais')
add_trace(g_ob02, future.ds,forecast['yhat'].cumsum(), color='orangered', name='Prophet')

g_ob02.update_layout(title='Quantidade de óbitos acumulados',
xaxis_title='Período',
yaxis_title='Quantidade de óbitos acumulados')


py.iplot(g_ob02)

# Trabalhando com a base obitos idade

## Carregamento da base

In [87]:
base_obitos_idade = pd.read_csv('base_obitos_idade.csv',index_col='Unnamed: 0')

In [88]:
# atribuindo valor numérico para facilitar no agrupamento
base_obitos_idade['obito_confirmado'] = 1

# gerando a faixa etária par aobitos
base_obitos_idade['faixa_etaria'] = pd.cut(base_obitos_idade['idade_paciente'], idades)

# gerando obitos faixa etaria
obitos_etaria = base_obitos_idade.filter(['faixa_etaria', 'obito_confirmado'])
obitos_etaria = obitos_etaria.groupby('faixa_etaria').sum().reset_index()
obitos_etaria['faixa_etaria'] = obitos_etaria['faixa_etaria'].astype('string')

## Gráficos

In [89]:
# Parâmetros 
idades_obitos = list(obitos_etaria.faixa_etaria)
qtd_idades_ob = list(obitos_etaria.obito_confirmado)

# cores
colors = [tema[3],] * 11
colors[7] = tema01[1]

#gráfico
g_ob_idade01 = go.Figure( [go.Bar(x=idades_obitos,
                                  y=qtd_idades_ob,
                                 marker_color=colors)])

g_ob_idade01.update_layout(title_text = 'Quantidade de óbitos por faixa etária',
                yaxis_title='Quantidade',
                xaxis_title='Faixa etária'
                )

g_ob_idade01.show()

Apesar de que, como mostrado no gráfico "Quantidade de exames positivos por faixa etária", a faixa etária de 70 a 80 anos ser a faixa uma das menores quantidade de infectados é a faixa que mais sofre no quesito óbitos. Esse comportamento condiz com as informações que o vírus é mais mortal aos idosos.

In [90]:
labels_ob = ['Exames positivos', 'Óbitos']
values_ob = [casos_novos.casos_positivos.sum(), base_obitos['obitos'].sum()]

In [91]:
# gráfico
g_ob_idade02 = go.Figure(data=[go.Pie( labels=labels_ob, values=values_ob,hole=.3, marker=dict(colors=tema01) )])
g_ob_idade02.update_layout(
    title_text="Motalidade COVID-19",
    annotations=[dict(text='', x=0.50, y=0.5, font_size=20, showarrow=False)])
g_ob_idade02.show()

A taxa de mortalidade de 3.49% aferida no gráfico acima, indica que contivemos bem o avanço da doença e fizemos uma quantidade adequada de exames. A baixa quantidade de exames implica num alto índice de mortalidade, já que passaríamos a ter uma quantidade grande subnotificações que entrariam nas estátisticas de óbitos.

In [92]:
label_conf_ob = list(obitos_etaria['faixa_etaria'])
values_conf_ob = list(obitos_etaria['obito_confirmado'])

# gráfico
g_ob_idade03 = go.Figure(data=[go.Pie( labels=label_conf_ob, values=values_conf_ob,hole=.3, marker=dict(colors=tema) )])
g_ob_idade03.update_layout(
    title_text="Porcentagem de óbitos por faixa etária",
    annotations=[dict(text='', x=0.50, y=0.5, font_size=20, showarrow=False)])

g_ob_idade03.show()

# Conclusão

Depois do pico, o avanço da doença tem diminuído ao longodo tempo, todavia, a partir das previsões feitas nesse estudo, a quantidade de infectados está ascendendo novamente. Com base no estudo apresentado, conclui-se que uma segunda onda de infecção do novo coronavírus está por vir.

Acredito que medidas preventivas de isolamento mais rígido ajude a conter o avanço da COVID-19. Entranto, o maior obstáculo ao estado é sua própria polução, que após um longo período de lockdown, encontra-se exaurida.

### Créditos

Estudo feito por Gabriel Santiago.

Ortografia revisada por Ester Sousa.