Visualização de dados sobre o número de casos e óbitos de COVID-19 por estado e região do Brasil

In [1]:
# Importando a biblioteca pandas
import pandas as pd
# Importando a biblioteca plotly, responsável por criar gráficos interativos
import plotly.express as px

A base de dados foi obtida pelo DATASUS, com informações sobre o número de casos e óbitos por COVID-19 acumulados até a data de 04/08/2023.

In [2]:
# Fazendo a leitura da base de dados
db = pd.read_csv('covid_2023.csv', sep=";")
# Exibindo a base de dados
db

Unnamed: 0,regiao,estado,municipio,coduf,codmun,codRegiaoSaude,nomeRegiaoSaude,data,semanaEpi,populacaoTCU2019,casosAcumulado,casosNovos,obitosAcumulado,obitosNovos,Recuperadosnovos,emAcompanhamentoNovos,interior/metropolitana
0,Brasil,,,76,,,,2023-07-01,26,210147125.0,37682660,11240,704159,195,36943287.0,35214.0,
1,Brasil,,,76,,,,2023-07-02,27,210147125.0,37682660,0,704159,0,36939608.0,38893.0,
2,Brasil,,,76,,,,2023-07-03,27,210147125.0,37682660,0,704159,0,36935925.0,42576.0,
3,Brasil,,,76,,,,2023-07-04,27,210147125.0,37682660,0,704159,0,36935925.0,42576.0,
4,Brasil,,,76,,,,2023-07-05,27,210147125.0,37682660,0,704159,0,36941392.0,37109.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
196660,Centro-Oeste,DF,Brasília,53,530010.0,53001.0,DISTRITO FEDERAL,2023-07-31,31,3015268.0,910807,0,11863,0,,,1.0
196661,Centro-Oeste,DF,Brasília,53,530010.0,53001.0,DISTRITO FEDERAL,2023-08-01,31,3015268.0,910807,0,11863,0,,,1.0
196662,Centro-Oeste,DF,Brasília,53,530010.0,53001.0,DISTRITO FEDERAL,2023-08-02,31,3015268.0,910807,0,11863,0,,,1.0
196663,Centro-Oeste,DF,Brasília,53,530010.0,53001.0,DISTRITO FEDERAL,2023-08-03,31,3015268.0,910807,0,11863,0,,,1.0


In [3]:
# Selecionando apenas as colunas da base de dados que são de interesse para a criação dos gráficos
df = db.loc[:,['regiao', 'estado', 'municipio', 'data', 'casosAcumulado', 'obitosAcumulado']]
# Exibindo a base de dados
df

Unnamed: 0,regiao,estado,municipio,data,casosAcumulado,obitosAcumulado
0,Brasil,,,2023-07-01,37682660,704159
1,Brasil,,,2023-07-02,37682660,704159
2,Brasil,,,2023-07-03,37682660,704159
3,Brasil,,,2023-07-04,37682660,704159
4,Brasil,,,2023-07-05,37682660,704159
...,...,...,...,...,...,...
196660,Centro-Oeste,DF,Brasília,2023-07-31,910807,11863
196661,Centro-Oeste,DF,Brasília,2023-08-01,910807,11863
196662,Centro-Oeste,DF,Brasília,2023-08-02,910807,11863
196663,Centro-Oeste,DF,Brasília,2023-08-03,910807,11863


As primeiras linhas da base de dados possui os dados de casos e óbitos em todo o Brasil e em cada estado do país, sendo apenas essas as informações pertinentes para a visualização dos dados. As demais linhas possui as informações de acordo com cada município, dessa forma é necessário obter apenas os dados onde o município é NA.

In [4]:
# Seleciona apenas as linhas onde o município é NA
df = df.loc[db['municipio'].isnull()]
# Como os dados são acumulados, a informação que importa é apenas a do último dia de coleta, no caso 04/08/2023
df = df.loc[db['data'] == '2023-08-04']
# Removendo as colunas município e data, uma vez que ela não é mais necessária para a análise
df.drop(columns=['municipio', 'data'], inplace=True)
# Altera o nome de cada coluna do dataframe
df.columns = ['Regiões', 'Estados', 'Casos', 'Óbitos']
# Exibe o dataframe após as modificações
df


Unnamed: 0,Regiões,Estados,Casos,Óbitos
34,Brasil,,37728415,704794
69,Norte,RO,487849,7465
104,Norte,AC,163959,2063
139,Norte,AM,637204,14479
174,Norte,RR,185804,2199
209,Norte,PA,884003,19145
244,Norte,AP,186287,2169
279,Norte,TO,371565,4245
314,Nordeste,MA,496857,11077
349,Nordeste,PI,433438,8393


Verificando o dataframe acima, é possível perceber que existe a informação do total de casos e óbitos em todo o Brasil na primeira linha, essa informação não é pertinente para a nossa análise, uma vez que pretendemos visualizar os dados apenas por estado e região do país, portanto essa linha deve ser removida.

In [5]:
# Removendo a linha com a informação dos casos e óbitos no Brasil
df.drop(labels=34, axis=0, inplace=True)

Além disso, no dataframe há estados que possuem mais de uma linha com informações de casos e óbitos, sendo necessário fazer a soma desses dados. 

In [6]:
# Criando um dataframe "regiao", com a soma das informações de casos e óbitos em cada região do Brasil
regiao = df.groupby('Regiões', as_index=False).sum()
# Criando um dataframe "estado", com a soma das informações de casos e óbitos em cada estado do Brasil
estado = df.groupby('Estados', as_index=False).sum()


In [7]:
# Visualizando o dataframe com o número de casos e óbitos por região do Brasil
regiao

Unnamed: 0,Regiões,Casos,Óbitos
0,Centro-Oeste,4361442,66393
1,Nordeste,7446960,136137
2,Norte,2920912,51788
3,Sudeste,15026030,339424
4,Sul,8040135,111970


In [8]:
# Visualizando o dataframe com o número de casos e óbitos por estado do Brasil
estado

Unnamed: 0,Estados,Casos,Óbitos
0,AC,163959,2063
1,AL,340834,7300
2,AM,637204,14479
3,AP,186287,2169
4,BA,1827380,32049
5,CE,1489893,28211
6,DF,910807,11863
7,ES,1348663,15392
8,GO,1948620,28307
9,MA,496857,11077


Com isso, temos que todos os tratamentos necessários foram realizados, tornando possível criar os gráficos interativos, com a biblioteca Plotly, dos casos e óbitos por COVID-19 em cada região e estado do Brasil.

In [9]:
# Criando o gráfico interativo dos casos de COVID-19 por região do Brasil
fig_1 = px.bar(regiao, x='Regiões', y='Casos', color='Regiões', title='Número de casos de COVID-19 por região do Brasil')
fig_1.show()

In [10]:
# Criando o gráfico interativo dos óbitos de COVID-19 por região do Brasil
fig_2 = px.bar(regiao, x='Regiões', y='Óbitos', color='Regiões', title='Número de óbitos de COVID-19 por região do Brasil')
fig_2.show()

In [11]:
# Criando o gráfico interativo dos casos de COVID-19 por estado do Brasil
fig_3 = px.bar(estado, x='Estados', y='Casos', color='Estados', title='Número de casos de COVID-19 por estado do Brasil')
fig_3.show()

In [12]:
# Criando o gráfico interativo dos óbitos de COVID-19 por estado do Brasil
fig_4 = px.bar(estado, x='Estados', y='Óbitos', color='Estados', title='Número de óbitos de COVID-19 por estado do Brasil')
fig_4.show()