# Análise dos dados de casos confirmados por covid no estado de Minas Gerais

### Importar as bibliotecas necessárias para a análise

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

### Importar o arquivo

In [None]:
dataFrameCasos = pd.read_csv('./Dados/CasosConfirmados.csv', sep=',')
dataFrameCasos.head()

### Verificar os tipos de dados do dataframe

In [None]:
dataFrameCasos.dtypes

### Agora vamos converter alguns tipos de dados

In [None]:
dataFrameCasos['DATA_NOTIFICACAO'] = pd.to_datetime (dataFrameCasos['DATA_NOTIFICACAO'])
#dataFrameCasos['IDADE'] = dataFrameCasos['IDADE'].astype(int)
dataFrameCasos.dtypes

### Verificar a quantidade de registros e quantos deles são nulos

In [None]:
print(dataFrameCasos.isna().sum())
print(' ')
print('Total de registros: ',dataFrameCasos.ID.count())

In [None]:
dataFrameCasos.to_csv("./Dados/CasosConfirmadosTratado.csv")

### Neste gráfico de linha temos uma relação da quantidade de casos por dia

In [None]:
dataFrameCasos.groupby('DATA_NOTIFICACAO')[['ID']].size().plot(legend=None)
plt.title('Casos por dia')
plt.xlabel('Data')
plt.ylabel('Quantidade de casos')
plt.savefig("./Imagens/CasosXDia.png")
plt.show()

### Aqui temos um gráfico de barras mostrando a quantidade de casos confirmados agrupados por idade

In [None]:
dfGrafico = dataFrameCasos.groupby('IDADE')[['CLASSIFICACAO_CASO']].count()

fig, ax = plt.subplots(figsize=(30,5))

sns.barplot(x=dfGrafico.index, y=dfGrafico.CLASSIFICACAO_CASO, ax=ax, data=dfGrafico)

ax.set_title("Casos confirmados X Idade", fontdict={'fontsize':15})
ax.set_xlabel('Idade', fontdict={'fontsize':14})
ax.set_ylabel('Casos', fontdict={'fontsize':14})
ax.tick_params(labelsize=15)
plt.xticks(rotation=75)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/CasosXIdade.png")
fig.tight_layout();

### Aqui temos um gráfico de barras mostrando a quantidade de casos agrupados por comorbidade

In [None]:
comorbidade = dataFrameCasos.groupby("COMORBIDADE")['CLASSIFICACAO_CASO'].count().reset_index()

fig, ax = plt.subplots()

plot = sns.barplot(x=comorbidade['COMORBIDADE'], y=comorbidade['CLASSIFICACAO_CASO'], ax=ax, data=comorbidade)
for p in plot.patches:
    plot.annotate(format(p.get_height(), '.0f'), 
                   (p.get_x() + p.get_width() / 2., p.get_height()), 
                   ha = 'center', va = 'center', 
                   xytext = (0, 9), 
                   textcoords = 'offset points')

ax.set_title("Casos X Comorbidade", fontdict={'fontsize':15})
ax.set_xlabel('Comorbidade', fontdict={'fontsize':14})
ax.set_ylabel('Casos', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/CasosXComorbidade.png")
fig.tight_layout();

### Neste gráfico temos um quantitativo de casos por município, trazendo os top 20

In [None]:
#Cria um grafico de barras separando a quantidade de mortes por municipo de residencia (TOP 20)
municipios = dataFrameCasos.groupby("MUNICIPIO_RESIDENCIA")['CLASSIFICACAO_CASO'].count().reset_index()

# Encontrar os 20 municipios com o maior numero de mortes
top_20 = municipios.sort_values(by=['CLASSIFICACAO_CASO'], ascending=False).head(20)

fig, ax = plt.subplots(figsize=(12,10))

plot = sns.barplot(top_20['CLASSIFICACAO_CASO'], top_20['MUNICIPIO_RESIDENCIA'])
for i,(value,name) in enumerate(zip(top_20['CLASSIFICACAO_CASO'],top_20['MUNICIPIO_RESIDENCIA'])):
    plot.text(value,i-0.05,f'{value:,.0f}',size=10)
    
ax.set_title("Municipio X Casos", fontdict={'fontsize':15})
ax.set_xlabel('Casos', fontdict={'fontsize':14})
ax.set_ylabel('Municipios', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

plt.savefig("./Imagens/CasosXMunicipios.png")
plt.show()

### Neste gráfico temos um quantitativo de casos por região do estado

In [None]:
#Cria um grafico de barras separando a quantidade de mortes por municipo de residencia (TOP 20)
regiao = dataFrameCasos.groupby("MACRO")['CLASSIFICACAO_CASO'].count().reset_index()

# Encontrar os 20 municipios com o maior numero de mortes
regiaoOrd = regiao.sort_values(by=['CLASSIFICACAO_CASO'], ascending=False)

fig, ax = plt.subplots(figsize=(12,10))

plot = sns.barplot(regiaoOrd['CLASSIFICACAO_CASO'], regiaoOrd['MACRO'])
for i,(value,name) in enumerate(zip(regiaoOrd['CLASSIFICACAO_CASO'],regiaoOrd['MACRO'])):
    plot.text(value,i-0.05,f'{value:,.0f}',size=10)
    
ax.set_title("Casos X Região", fontdict={'fontsize':15})
ax.set_xlabel('Casos', fontdict={'fontsize':14})
ax.set_ylabel('Região', fontdict={'fontsize':14})
ax.tick_params(labelsize=13)

plt.savefig("./Imagens/CasosXRegiao.png")
plt.show()

### Agora temos um gráfico de pizza mostrando a quantidade de casos agrupada por sexo

In [None]:
pie_sexo = dataFrameCasos.groupby('SEXO')[['CLASSIFICACAO_CASO']].count()

# Pie chart, where the slices will be ordered and plotted counter-clockwise:
labels = pie_sexo.index
sizes = pie_sexo['CLASSIFICACAO_CASO']

fig1, ax1 = plt.subplots()
ax1.pie(sizes, labels=labels, autopct='%1.1f%%',
        shadow=True, startangle=90)
ax1.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.

plt.savefig("./Imagens/CasosXSexo.png")
plt.show()

### Gráfico mostrando um relação da evolução das pessoas que tiveram um caso confirmado de covid

In [None]:
evolucao = dataFrameCasos.groupby("EVOLUCAO")['CLASSIFICACAO_CASO'].count().reset_index()

fig, ax = plt.subplots()

plot = sns.barplot(x=evolucao['EVOLUCAO'], y=evolucao['CLASSIFICACAO_CASO'], ax=ax, data=evolucao)
for p in plot.patches:
    plot.annotate(format(p.get_height(), '.0f'), 
                   (p.get_x() + p.get_width() / 2., p.get_height()), 
                   ha = 'center', va = 'center', 
                   xytext = (0, 9), 
                   textcoords = 'offset points')

ax.set_title("Evolução dos casos", fontdict={'fontsize':15})
ax.set_xlabel('Status', fontdict={'fontsize':13})
ax.set_ylabel('Casos', fontdict={'fontsize':13})
ax.tick_params(labelsize=10)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/EvolucaoDosCasos.png")
fig.tight_layout();

### Gráfico com uma relação de quantidade de internações por casos

In [None]:
internacao = dataFrameCasos.groupby("INTERNACAO")['CLASSIFICACAO_CASO'].count().reset_index()

fig, ax = plt.subplots()

plot = sns.barplot(x=internacao['INTERNACAO'], y=internacao['CLASSIFICACAO_CASO'], ax=ax, data=internacao)
for p in plot.patches:
    plot.annotate(format(p.get_height(), '.0f'), 
                   (p.get_x() + p.get_width() / 2., p.get_height()), 
                   ha = 'center', va = 'center', 
                   xytext = (0, 9), 
                   textcoords = 'offset points')

ax.set_title("Relação de internações", fontdict={'fontsize':15})
ax.set_xlabel('Status', fontdict={'fontsize':13})
ax.set_ylabel('Casos', fontdict={'fontsize':13})
ax.tick_params(labelsize=10)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/RelacaoInternacao.png")
fig.tight_layout();

### Gráfico com uma relacao entre internações em UTIs e número de casos confirmados

In [None]:
uti = dataFrameCasos.groupby("UTI")['CLASSIFICACAO_CASO'].count().reset_index()

fig, ax = plt.subplots()

plot = sns.barplot(x=uti['UTI'], y=uti['CLASSIFICACAO_CASO'], ax=ax, data=uti)
for p in plot.patches:
    plot.annotate(format(p.get_height(), '.0f'), 
                   (p.get_x() + p.get_width() / 2., p.get_height()), 
                   ha = 'center', va = 'center', 
                   xytext = (0, 9), 
                   textcoords = 'offset points')

ax.set_title("Relação de internações em UTI", fontdict={'fontsize':15})
ax.set_xlabel('Status', fontdict={'fontsize':13})
ax.set_ylabel('Casos', fontdict={'fontsize':13})
ax.tick_params(labelsize=10)

for axis in ['top', 'right']:
   ax.spines[axis].set_color(None)

fig.savefig("./Imagens/RelacaoUTI.png")
fig.tight_layout();