# Aquisição e análise exploratória dos dados de COVID do brasil.io para o estado do Piauí
### Através  do dataset casos_covid19.csv foram capturados os nomes das 224 cidades do Piauí. No entanto, esses nomes também poderiam ser tirados do site do IBGE. Você poderá adquirir o dataset antigo para teste do script através do link no drive disponibilizado no pdf da aula. É importante que dados mais atualizados sejam capturados no site: https://brasil.io/home/. Após capturar o nome da cidade, usaremos o openstreetmap para capturar latitude e logitude, auxiliando no ponto 5 da atividade;

## Importandos as bibliotecas

In [1]:
import pandas as pd
import requests
import matplotlib.pyplot as plt 

## Aquisição dos dados

In [2]:
data = pd.read_csv('casos_covid19.csv')

In [3]:
data.head()

Unnamed: 0,date,state,city,place_type,confirmed,deaths,order_for_place,is_last,estimated_population_2019,estimated_population,city_ibge_code,confirmed_per_100k_inhabitants,death_rate
0,2021-03-22,AP,,state,92462,1233,364,True,845731.0,861773.0,16.0,10729.27557,0.0133
1,2021-03-21,AP,,state,92010,1222,363,False,845731.0,861773.0,16.0,10676.82557,0.0133
2,2021-03-20,AP,,state,91515,1222,362,False,845731.0,861773.0,16.0,10619.38585,0.0134
3,2021-03-19,AP,,state,91077,1216,361,False,845731.0,861773.0,16.0,10568.5604,0.0134
4,2021-03-18,AP,,state,90597,1206,360,False,845731.0,861773.0,16.0,10512.86128,0.0133


In [4]:
data.shape

(1048575, 13)

In [5]:
data_piaui = data[data['state'] == 'PI']

In [6]:
data_piaui.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 68989 entries, 574992 to 643980
Data columns (total 13 columns):
 #   Column                          Non-Null Count  Dtype  
---  ------                          --------------  -----  
 0   date                            68989 non-null  object 
 1   state                           68989 non-null  object 
 2   city                            68620 non-null  object 
 3   place_type                      68989 non-null  object 
 4   confirmed                       68989 non-null  int64  
 5   deaths                          68989 non-null  int64  
 6   order_for_place                 68989 non-null  int64  
 7   is_last                         68989 non-null  bool   
 8   estimated_population_2019       68989 non-null  float64
 9   estimated_population            68989 non-null  float64
 10  city_ibge_code                  68989 non-null  float64
 11  confirmed_per_100k_inhabitants  68770 non-null  float64
 12  death_rate                

In [7]:
cidades = data_piaui[data_piaui['place_type'] == 'city']

In [8]:
list_cities = cidades['city'].unique()

In [9]:
list_cities

array(['Acauã', 'Agricolândia', 'Alagoinha do Piauí', 'Alegrete do Piauí',
       'Alto Longá', 'Altos', 'Alvorada do Gurguéia', 'Amarante',
       'Angical do Piauí', 'Antônio Almeida', 'Anísio de Abreu',
       'Aroazes', 'Aroeiras do Itaim', 'Arraial', 'Assunção do Piauí',
       'Avelino Lopes', 'Baixa Grande do Ribeiro', "Barra D'Alcântara",
       'Barras', 'Barreiras do Piauí', 'Barro Duro', 'Batalha',
       'Bela Vista do Piauí', 'Belém do Piauí', 'Beneditinos',
       'Bertolínia', 'Betânia do Piauí', 'Boa Hora', 'Bocaina',
       'Bom Jesus', 'Bom Princípio do Piauí', 'Bonfim do Piauí',
       'Boqueirão do Piauí', 'Brasileira', 'Brejo do Piauí',
       'Buriti dos Lopes', 'Buriti dos Montes', 'Cabeceiras do Piauí',
       'Cajazeiras do Piauí', 'Cajueiro da Praia',
       'Caldeirão Grande do Piauí', 'Campinas do Piauí',
       'Campo Alegre do Fidalgo', 'Campo Grande do Piauí',
       'Campo Largo do Piauí', 'Campo Maior', 'Canavieira',
       'Canto do Buriti', 'Capitão G

In [10]:
len(list_cities)

224

## Capturando as latitudes e longitudes com openstreetmaps

In [11]:
#pode demorar um pouco
latitudes = []
longitudes = []
for city in list_cities:
    request = 'https://nominatim.openstreetmap.org/search?city='+city+'&state=Piaui&format=json'
    response = requests.get(request)
    response_data = response.json()[0]
    
    latitude = float(response_data["lat"])
    longitude = float(response_data["lon"])
    latitudes.append(latitude)
    longitudes.append(longitude)

In [12]:
len(latitudes)

224

In [13]:
len(longitudes)

224

### Atividade (1.5 pt): Visualização de casos de COVID-19 no Piauí (equipe 3 integrantes)

<dl>
<dt>Apresentar um jupyter notebook atendendo os seguintes itens: </dt>
    <dd>1. Filtrar os dados para selecionar apenas aqueles referentes ao estado do Piauí. Se uma cidade possui mais de 1 amostra, selecionar aquela mais recente (nota: as datas estão em ordem decrescente);</dd>
    <dd>2. Plotar um mapa com a localização e número de casos;</dd>
    <dd>3. Indicar o número de amostras, atributos e dados faltantes (se existir) do conjunto de dados;</dd>
    <dd>4. Apresentar as estatísticas descritivas dos atributos não categóricos;</dd>
    <dd>5. Apresentar os histogramas dos atributos não categóricos;</dd>
    <dd>6. Capturar as latitudes e longitudes para cada 1 dos municípios presentes na base de dados e adicionar as colunas latitude e longitude nos dados;</dd>
    <dd>7. Apresentar um gráfico da latitude x longitude, onde cada amostra será representada por um círculo e quanto maior o valor do campo estimated_population, maior o raio do círculo que representa aquela amostra. Já a cor representa a taxa de mortalidade (death_rate), quão maior esse índice, mais próximo do vermelho;</dd>
    <dd>8. Calcular a matriz de correlação;</dd>
    <dd>9. Verificar a correlação entre o atributo death_rate e os demais atributos não categóricos;</dd>
</dl>

## Referências para os gráficos

### Ponto #2

![title](./image1.png)

![title](./image2.png)

![title](./image3.png)

### Ponto #7

![title](./image4.png)