# Análise de dados sobre a covid 19 no Brasil

## Descrição

Análisando a base de dados para ver a progressão da covid no Brasil, assim como os esforços para combatê-la.

## 1.Importando e dados

In [174]:
#importando as bibliotecas
import pandas as pd
import plotly.express as px

In [185]:
#importando e preparando a base de dados
dados = pd.read_csv(r'C:\Users\rafae\Downloads\cases-brazil-cities-time_2022.csv')

dados = dados.dropna()
dados = dados[dados['city'] != 'TOTAL']

dados['date'] = pd.to_datetime(dados['date'], format='%Y-%m-%d')
dados.set_index('date', inplace=True)

dados.shape
dados.head()

(2042540, 11)

## 2.Tratando os dados

In [176]:
def form_num(numero):
    return f'{numero:,.3f}'

In [177]:
colunas = ['newDeaths', 'deaths', 'newCases', 'totalCases']

colunas_form = ['deaths_per_100k_inhabitants', 'totalCases_per_100k_inhabitants', 'deaths_by_totalCases']

In [186]:
#Criando uma nova base de dados diária dos estados
dados_estado = dados.drop('city', axis=1).groupby('state')[colunas].sum()
dados_estado[colunas_form] = dados.groupby('state')[colunas_form].mean()
dados_estado[colunas_form] = dados_estado[colunas_form].applymap(form_num)
dados_estado.head()

(27, 7)

In [187]:
#criando uma base de dados diaria do total
dados_diario_total = dados[colunas].groupby(pd.Grouper(freq='d')).sum()
dados_diario_total[colunas_form] = dados.groupby(pd.Grouper(freq='d'))[colunas_form].mean()
dados_diario_total[colunas_form] = dados_diario_total[colunas_form].applymap(form_num)
dados_diario_total.head()
dados_diario_total.shape

(365, 7)

In [188]:
#criando uma base de dados mensal do total
dados_mensal_total = dados[colunas].groupby(pd.Grouper(freq='m')).sum()
dados_mensal_total[colunas_form] = dados.groupby(pd.Grouper(freq='m'))[colunas_form].mean()
dados_mensal_total[colunas_form] = dados_mensal_total[colunas_form].applymap(form_num)
dados_mensal_total.head()
dados_mensal_total.shape

(12, 7)

## Visualizando os dados

In [181]:
for colun in dados_mensal_total.columns:
    fig = px.line(dados_mensal_total, x=dados_mensal_total.index, y=colun, title='Evolução da Covid 2022')
    fig.show()

In [182]:
for colun in dados_diario_total.columns:
    fig = px.line(dados_diario_total, x=dados_diario_total.index, y=colun, title='Evolução da Covid 2022')
    fig.show()

In [183]:
for colun in dados_estado.columns:
    fig = px.line(dados_estado, x=dados_estado.index, y=colun, title='Evolução da Covid 2022')
    fig.show()

## Exportando dados

In [184]:
dados_estado.to_csv('dados_estado.csv', index=True)
dados_diario_total.to_csv('dados_diario_total.csv', index=True)
dados_mensal_total.to_csv('dados_mensal_total.csv', index=True)

## Comentários

1-Podemos observar que o número de casos tende a ter um acréscimo durante períodos festivos e de férias, o que nos mostra que de fato as pessoas não estão tendo os devidos cuidados para evitar o contágio!

2-Podemos observar tambem que cidades grandes tendem a ter maior número de casos e consequentemente maior número de mortes, o que nos faz crer que são os lugares onde mais tivemos quebras de medidas de precaução contra o vírus.

3-O aumento de número de casos foi realtivamente alto no começo do ano de 2022 e volta a aumentar ao final do ano, o que nos ajuda a entender que o período entre o fim e o começo de ano é o relativamente mais perigoso no Brasil.

4-Tivemos um declínio de mortes por total de casos, mas não significa necessariamente que o número de mortes teve uma queda significativa!