# EDA - Trabalho Prático (Pandas) 

### 1. Introdução.

#### Diariamente, o Ministério da Saúde, por meio da Secretaria de Vigilância em Saúde (SVS/MS) divulga dados consolidados sobre o COVID-19. Acesso o arquivo "`HIST_PAINEL_COVIDBR_20mai2020.xlsx`" e responda às questões a seguir.

#### Importamos os pacotes a serem usados.

In [532]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go

#### Importamos os dados a serem usados.

In [642]:
df = pd.read_excel("covid19_fevereiro.xlsx", engine='openpyxl')

#### Exercício 1.1: Faça um slice no dataframe para considerar apenas os dados do estado de Minas Gerais.

In [None]:
df_estado_mg = df.loc[df['estado']=='MG'].reset_index().drop(['index'], axis=1)

#### Exercício 1.2: Selecione também um dataframe contendo apenas os dados para a capital de MG.

In [None]:
df_municipio_bh = df_estado_mg.loc [df_estado_mg['municipio']== "Belo Horizonte"].reset_index().drop(['index'], axis=1)

### 2. Explorando o dataframe.

#### Exercício 2.1. Quantas linhas e quantas colunas o dataframe possui?

In [534]:
df.shape

(1048575, 17)

#### Exercício 2.2 Que informação o dataframe possui? Imprima o nome das colunas.

In [535]:
df.columns

Index(['regiao', 'estado', 'municipio', 'coduf', 'codmun', 'codRegiaoSaude',
       'nomeRegiaoSaude', 'data', 'semanaEpi', 'populacaoTCU2019',
       'casosAcumulado', 'casosNovos', 'obitosAcumulado', 'obitosNovos',
       'Recuperadosnovos', 'emAcompanhamentoNovos', 'interior/metropolitana'],
      dtype='object')

#### Exercício 2.3: Como o dataframe está indexado?

In [536]:
df.index

RangeIndex(start=0, stop=1048575, step=1)

#### Exercício 2.4: Qual é o tipo de dado da quarta coluna?

In [538]:
df.iloc[:,4].dtype

dtype('float64')

#### Exercício 2.5: Qual a quantidade de ocorrências de cada regiões de saúde no dataframe? 

In [564]:
x = df['regiao'].value_counts().keys()
y = df['regiao'].value_counts().values

# Use textposition='auto' for direct text
fig = go.Figure(data=[go.Bar(
            x=x, y=y,
            text=y,
            textposition='auto',
        )])


fig.update_layout(
    title="Quantidade de ocorrências por região",
    xaxis_title="Região",
    yaxis_title="Ocorrências",
    font=dict(
        family="Arial",
        size=12,
        color="black"
    )
)

fig.show()

#### Exercício 2.6: Qual é o número de casos acumulados na capital de MG, no dia 2020-03-31? 

In [633]:
list(df_municipio_bh.loc[df_municipio_bh['data']=='2020-03-31']['casosAcumulado'])[0]

163

#### Exercício 2.7: Qual é o número total de casos acumulados para todas as cidades do estado de MG, no dia 2020-03-31? 

In [634]:
df_estado_mg.loc[df_estado_mg['data']=='2020-03-31']['casosAcumulado'].sum()

550

#### Exercício 2.8: Qual é o valor médio de "semanaEpi"  durante todo o período? 

In [636]:
round(df['semanaEpi'].mean(),2)

29.69

### 3. Indexando e organizando os dados.

#### Exercício 3.1:  Selecionar  valores não duplicados para as coluna 'municipio','coduf', 'codmun', 'codRegiaoSaude' e atribuí-las a um objeto novo chamado 'covid19MGMunicipios'.

In [657]:
covid19MGMunicipios = df_estado_mg.drop_duplicates(subset=['municipio','coduf','codmun','codRegiaoSaude'])

#### Exercício 3.2:  Selecionar as primeiras 20 linhas de 'covid19MGMunicipios'

In [659]:
covid19MGMunicipios.head(20)

Unnamed: 0,regiao,estado,municipio,coduf,codmun,codRegiaoSaude,nomeRegiaoSaude,data,semanaEpi,populacaoTCU2019,casosAcumulado,casosNovos,obitosAcumulado,obitosNovos,Recuperadosnovos,emAcompanhamentoNovos,interior/metropolitana
0,Sudeste,MG,,31,,,,2020-02-25,9,21168791.0,0,0,0,0,,,
352,Sudeste,MG,,31,310000.0,,,2020-03-27,13,,0,0,0,0,,,
673,Sudeste,MG,Abadia dos Dourados,31,310010.0,31074.0,PATROCINIO / MONTE CARMELO,2020-03-27,13,6989.0,0,0,0,0,,,0.0
994,Sudeste,MG,Abaeté,31,310020.0,31024.0,SETE LAGOAS,2020-03-27,13,23237.0,0,0,0,0,,,0.0
1315,Sudeste,MG,Abre Campo,31,310030.0,31059.0,MANHUACU,2020-03-27,13,13454.0,0,0,0,0,,,0.0
1636,Sudeste,MG,Acaiaca,31,310040.0,31060.0,PONTE NOVA,2020-03-27,13,3994.0,0,0,0,0,,,0.0
1957,Sudeste,MG,Açucena,31,310050.0,31037.0,IPATINGA,2020-03-27,13,9470.0,0,0,0,0,,,0.0
2278,Sudeste,MG,Água Boa,31,310060.0,31081.0,SANTA MARIA DO SUACUI,2020-03-27,13,13735.0,0,0,0,0,,,0.0
2599,Sudeste,MG,Água Comprida,31,310070.0,31072.0,UBERABA,2020-03-27,13,1999.0,0,0,0,0,,,0.0
2920,Sudeste,MG,Aguanil,31,310080.0,31089.0,CAMPO BELO,2020-03-27,13,4486.0,0,0,0,0,,,0.0


#### Exercício 3.3:  Selecionar uma amostra aleatória de 100 linhas de 'covid19MGMunicipios'

In [661]:
covid19MGMunicipios.sample(100)

Unnamed: 0,regiao,estado,municipio,coduf,codmun,codRegiaoSaude,nomeRegiaoSaude,data,semanaEpi,populacaoTCU2019,casosAcumulado,casosNovos,obitosAcumulado,obitosNovos,Recuperadosnovos,emAcompanhamentoNovos,interior/metropolitana
8377,Sudeste,MG,Alvinópolis,31,310230.0,31060.0,PONTE NOVA,2020-03-27,13,15203.0,0,0,0,0,,,0.0
41440,Sudeste,MG,Canápolis,31,311180.0,31073.0,ITUIUTABA,2020-03-27,13,12150.0,0,0,0,0,,,0.0
56206,Sudeste,MG,Centralina,31,311580.0,31073.0,ITUIUTABA,2020-03-27,13,10350.0,0,0,0,0,,,0.0
7414,Sudeste,MG,Alto Caparaó,31,310205.0,31059.0,MANHUACU,2020-03-27,13,5847.0,0,0,0,0,,,0.0
162457,Sudeste,MG,Morro do Pilar,31,314370.0,31021.0,ITABIRA,2020-03-27,13,3182.0,0,0,0,0,,,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
28600,Sudeste,MG,Bonito de Minas,31,310825.0,31053.0,JANUARIA,2020-03-27,13,11230.0,0,0,0,0,,,0.0
19612,Sudeste,MG,Barão de Monte Alto,31,310550.0,31045.0,MURIAE,2020-03-27,13,5397.0,0,0,0,0,,,0.0
163741,Sudeste,MG,Muzambinho,31,314410.0,31002.0,GUAXUPE,2020-03-27,13,20569.0,0,0,0,0,,,0.0
169198,Sudeste,MG,Novo Cruzeiro,31,314530.0,31099.0,TEOFILO OTONI / MALACACHETA,2020-03-27,13,31331.0,0,0,0,0,,,0.0


#### Exercício 3.4: Organizar o dataframe dos municípios segundo a população, de forma decrescente.

In [662]:
covid19MGMunicipios.sort_values(['populacaoTCU2019'], ascending = False)

Unnamed: 0,regiao,estado,municipio,coduf,codmun,codRegiaoSaude,nomeRegiaoSaude,data,semanaEpi,populacaoTCU2019,casosAcumulado,casosNovos,obitosAcumulado,obitosNovos,Recuperadosnovos,emAcompanhamentoNovos,interior/metropolitana
0,Sudeste,MG,,31,,,,2020-02-25,9,21168791.0,0,0,0,0,,,
21538,Sudeste,MG,Belo Horizonte,31,310620.0,31016.0,BELO HORIZONTE/ NOVA LIMA/ CAETE,2020-03-27,13,2512070.0,0,0,0,0,,,1.0
264856,Sudeste,MG,Uberlândia,31,317020.0,31075.0,UBERLANDIA / ARAGUARI,2020-03-27,13,691305.0,0,0,0,0,,,0.0
66157,Sudeste,MG,Contagem,31,311860.0,31018.0,CONTAGEM,2020-03-27,13,663855.0,0,0,0,0,,,1.0
135172,Sudeste,MG,Juiz de Fora,31,313670.0,31097.0,JUIZ DE FORA,2020-03-27,13,568873.0,0,0,0,0,,,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
249127,Sudeste,MG,Senador José Bento,31,316580.0,31007.0,POUSO ALEGRE,2020-03-27,13,1502.0,0,0,0,0,,,0.0
102109,Sudeste,MG,Grupiara,31,312790.0,31074.0,PATROCINIO / MONTE CARMELO,2020-03-27,13,1388.0,0,0,0,0,,,0.0
55564,Sudeste,MG,Cedro do Abaeté,31,311560.0,31024.0,SETE LAGOAS,2020-03-27,13,1164.0,0,0,0,0,,,0.0
251695,Sudeste,MG,Serra da Saudade,31,316660.0,31028.0,BOM DESPACHO,2020-03-27,13,781.0,0,0,0,0,,,0.0
