# Análise dos dados de óbitos confirmados por covid no estado de Minas Gerais

### Importar as bibliotecas necessárias para a análise

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

### Importar o arquivo

In [None]:
dataFrameObitos = pd.read_csv('./Dados/ObitosConfirmados.csv', sep=',')
dataFrameObitos.head()

### Verificar os tipos de dados do dataframe

In [None]:
dataFrameObitos.dtypes

### Agora vamos converter alguns tipos de dados

In [None]:
dataFrameObitos.SEXO = dataFrameObitos.SEXO.astype('category')
dataFrameObitos.DATA_OBITO = pd.to_datetime (dataFrameObitos.DATA_OBITO)
dataFrameObitos.COMORBIDADE = dataFrameObitos.COMORBIDADE.astype('category')
dataFrameObitos.dtypes

### Verificar a quantidade de registros e quantos deles são nulos

In [None]:
print(dataFrameObitos.isna().sum())
print(' ')
print('Total de registros: ',dataFrameObitos.PACIENTE.count())

### Removendo os registros nulos do dataframe e verificando a quantidade novamente

In [None]:
dataFrameObitos = dataFrameObitos.dropna(how='any',axis=0)

In [None]:
print(dataFrameObitos.isna().sum())
print(' ')
print('Total de registros: ',dataFrameObitos.PACIENTE.count())

In [None]:
dataFrameObitos.to_csv("./Dados/ObitosConfirmadosTratado.csv")

### Aqui temos um gráfico de linha a com os dados das datas de óbitos e quantidade de mortes

In [None]:
dfGrafico = dataFrameObitos.groupby('DATA_OBITO').agg({'PACIENTE': np.size})

fig, ax = plt.subplots(figsize=(15,5))

sns.lineplot(x=dfGrafico.index, y=dfGrafico.PACIENTE, ax=ax, data=dfGrafico, linewidth=2)

ax.set_title("Óbitos X Data", fontdict={'fontsize':15})
ax.set_xlabel('Data', fontdict={'fontsize':14})
ax.set_ylabel('Óbitos', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/ObitosXDia.png")
fig.tight_layout();

### Aqui temos um gráfico de barras mostrando a quantidade de óbitos agrupada por sexo

In [None]:
dfGrafico = dataFrameObitos.groupby('SEXO')[['PACIENTE']].count()

fig, ax = plt.subplots()

plot = sns.barplot(x=dfGrafico.index, y=dfGrafico.PACIENTE, ax=ax, data=dfGrafico)

for p in plot.patches:
    plot.annotate(format(p.get_height(), '.0f'), 
                   (p.get_x() + p.get_width() / 2., p.get_height()), 
                   ha = 'center', va = 'center', 
                   xytext = (0, 9), 
                   textcoords = 'offset points')

ax.set_title("Óbitos X Sexo", fontdict={'fontsize':15})
ax.set_xlabel('Sexo', fontdict={'fontsize':14})
ax.set_ylabel('Óbitos', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/ObitosXSexo.png")
fig.tight_layout();

### Aqui temos um gráfico de barras mostrando a quantidade de óbitos agrupada por idade

In [None]:
dfGrafico = dataFrameObitos.groupby('IDADE')[['PACIENTE']].count()

fig, ax = plt.subplots(figsize=(30,5))

sns.barplot(x=dfGrafico.index, y=dfGrafico.PACIENTE, ax=ax, data=dfGrafico)

ax.set_title("Óbitos X Idade", fontdict={'fontsize':15})
ax.set_xlabel('Idade', fontdict={'fontsize':14})
ax.set_ylabel('Óbitos', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/ObitosXIdade.png")
fig.tight_layout();

### Aqui temos um gráfico de barras mostrando a quantidade de óbitos agrupada por comorbidade (possui ou não)

In [None]:
comorbidade = dataFrameObitos.groupby("COMORBIDADE")['PACIENTE'].count().reset_index()

fig, ax = plt.subplots()

plot = sns.barplot(x=comorbidade['COMORBIDADE'], y=comorbidade['PACIENTE'], ax=ax, data=comorbidade)
for p in plot.patches:
    plot.annotate(format(p.get_height(), '.0f'), 
                   (p.get_x() + p.get_width() / 2., p.get_height()), 
                   ha = 'center', va = 'center', 
                   xytext = (0, 9), 
                   textcoords = 'offset points')

ax.set_title("Óbitos X Comorbidade", fontdict={'fontsize':15})
ax.set_xlabel('Comorbidade', fontdict={'fontsize':14})
ax.set_ylabel('Óbitos', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/ObitosXComorbidade.png")
fig.tight_layout();

### Neste gráfico temos um quantitativo de mortes por município, trazendo os top 20

In [None]:
#Cria um grafico de barras separando a quantidade de mortes por municipo de residencia (TOP 20)
municipios = dataFrameObitos.groupby("MUNICIPIO_RESIDENCIA")['PACIENTE'].count().reset_index()

# Encontrar os 20 municipios com o maior numero de mortes
top_20 = municipios.sort_values(by=['PACIENTE'], ascending=False).head(20)

fig, ax = plt.subplots(figsize=(12,10))

plot = sns.barplot(top_20['PACIENTE'], top_20['MUNICIPIO_RESIDENCIA'])
for i,(value,name) in enumerate(zip(top_20['PACIENTE'],top_20['MUNICIPIO_RESIDENCIA'])):
    plot.text(value,i-0.05,f'{value:,.0f}',size=10)
    
ax.set_title("Municipio X Óbitos", fontdict={'fontsize':15})
ax.set_xlabel('Óbitos', fontdict={'fontsize':14})
ax.set_ylabel('Municipios', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

plt.savefig("./Imagens/ObitosXMunicipios.png")
plt.show()