### Atividade (1.0 pt): Visualização de casos de COVID-19 no Piauí (equipe 5 integrantes)

<dl>
<dt>Apresentar um jupyter notebook atendendo os seguintes itens: </dt>
    <dd>1. Filtrar os dados para selecionar apenas aqueles referentes ao estado do Piauí. Se uma cidade possui mais de 1 amostra, selecionar aquela mais recente (nota: as datas estão em ordem decrescente);</dd>
    <dd>2. Plotar um mapa com a localização e número de casos;</dd>
    <dd>3. Indicar o número de amostras, atributos e dados faltantes (se existir) do conjunto de dados;</dd>
    <dd>4. Apresentar as estatísticas descritivas dos atributos não categóricos;</dd>
    <dd>5. Apresentar os histogramas dos atributos não categóricos;</dd>
    <dd>6. Capturar as latitudes e longitudes para cada 1 dos municípios presentes na base de dados e adicionar as colunas latitude e longitude nos dados;</dd>
    <dd>7. Apresentar um gráfico da latitude x longitude, onde cada amostra será representada por um círculo e quanto maior o valor do campo estimated_population, maior o raio do círculo que representa aquela amostra. Já a cor representa a taxa de mortalidade (death_rate), quão maior esse índice, mais próximo do vermelho;</dd>
    <dd>8. Calcular a matriz de correlação;</dd>
    <dd>9. Verificar a correlação entre o atributo death_rate e os demais atributos não categóricos;</dd>
</dl>

## Importando as bibliotecas

In [1]:
import pandas as pd
import requests
import matplotlib.pyplot as plt
import os
import csv
from urllib.parse import urlencode
from dotenv import load_dotenv as loadEnv


## Utilizando API da Brasil.IO

In [2]:
loadEnv()
BRASILIO_API_TOKEN = os.getenv('BRASILIO_API_TOKEN')

base_url = "https://api.brasil.io/v1/dataset/covid19/caso/data"

header = {
    "User-Agent": "python-urllib/brasilio-client-0.1.0",
    "Authorization": f"Token {BRASILIO_API_TOKEN}"
}

filters = {"state": "PI", "is_last": True}
if filters:
    request = base_url + "?" + urlencode(filters)

response = requests.get(request, headers=header)
responseData = response.json()['results']


## Transformando resposta da API em arquivo CSV

In [3]:
def saveOnCSV(dataset_path, dataset_name):
    file = os.path.join(dataset_path, dataset_name)

    with open(file, 'w', newline='', encoding='utf-8') as csvfile:
        fieldnames = [
            'city',
            'city_ibge_code',
            'confirmed',
            'confirmed_per_100k_inhabitants',
            'date',
            'death_rate',
            'deaths',
            'estimated_population',
            'estimated_population_2019',
            'is_last',
            'order_for_place',
            'place_type',
            'state'
        ]
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
        writer.writeheader()
        for i in responseData:
            writer.writerow(i)


In [4]:
# DATASET_PATH = 'D:\\MyProjects\\GItHub\\SI\\AT01'
DATASET_PATH = os.path.join(os.getcwd(), 'datasets')
DATASET_NAME = 'casos_atualizados.csv'

saveOnCSV(DATASET_PATH, DATASET_NAME)


## Carregando dados completos do dataset

In [5]:
# DATASET_PATH = 'D:\\MyProjects\\GItHub\\SI\\AT01'
DATASET_PATH = os.path.join(os.getcwd(), 'datasets')
DATASET_NAME = 'caso.csv'


In [6]:
def load_data(dataset_path=DATASET_PATH, dataset_name=DATASET_NAME):
    csv_path = os.path.join(dataset_path, dataset_name)
    return pd.read_csv(csv_path)


In [7]:
dataset = load_data(DATASET_PATH,DATASET_NAME)


In [8]:
dataset.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2800004 entries, 0 to 2800003
Data columns (total 13 columns):
 #   Column                          Dtype  
---  ------                          -----  
 0   date                            object 
 1   state                           object 
 2   city                            object 
 3   place_type                      object 
 4   confirmed                       int64  
 5   deaths                          int64  
 6   order_for_place                 int64  
 7   is_last                         bool   
 8   estimated_population_2019       float64
 9   estimated_population            float64
 10  city_ibge_code                  float64
 11  confirmed_per_100k_inhabitants  float64
 12  death_rate                      float64
dtypes: bool(1), float64(5), int64(3), object(4)
memory usage: 259.0+ MB


## Ponto #1
Filtrar dados pelo mais recentes e do estado do Piauí

In [9]:
dataPiaui = dataset[(dataset['is_last'] == True)&(dataset['state'] == 'PI')&(dataset['place_type'] == 'city')]


In [10]:
dataPiaui.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 224 entries, 2050053 to 2191261
Data columns (total 13 columns):
 #   Column                          Non-Null Count  Dtype  
---  ------                          --------------  -----  
 0   date                            224 non-null    object 
 1   state                           224 non-null    object 
 2   city                            224 non-null    object 
 3   place_type                      224 non-null    object 
 4   confirmed                       224 non-null    int64  
 5   deaths                          224 non-null    int64  
 6   order_for_place                 224 non-null    int64  
 7   is_last                         224 non-null    bool   
 8   estimated_population_2019       224 non-null    float64
 9   estimated_population            224 non-null    float64
 10  city_ibge_code                  224 non-null    float64
 11  confirmed_per_100k_inhabitants  224 non-null    float64
 12  death_rate                

## Ponto #2
Plotar um mapa com a localização e número de casos

## Ponto #3

## Ponto #4

## Ponto #5

## Ponto #6

## Ponto #7

## Ponto #8

## Ponto #9