## Áreas de risco da febre amarela 

Neste documento, vamos unir dados para visualizar as áreas do Brasil que possuem ou não riscos relacionados a febre amarela.

Estes dados estão disponíveis em: 
 - http://dados.gov.br/dataset/febre_amarela_acrv # Áreas com risco
 - http://dados.gov.br/dataset/febre_amarela_asrv # Áreas sem riscos

Para uma visualização legal dos dados, vamos colocar tudo em um Mapa, para fazer isto, teremos de utilizar alguns dados para a georeferência, então, vamos utilizar um conjunto que já vincula o nome de cada município com sua geolocalização.

Disponível em: https://github.com/kelvins/Municipios-Brasileiros


In [2]:
import pandas as pd

In [3]:
# Carregando os dados
area_recomendada = pd.read_csv('../../../dados/areas-febre-amarela/area-recomendada-febre-amarela.csv')
area_sem_recomendacao = pd.read_csv('../../../dados/areas-febre-amarela/area-sem-recomendacao-febre-amarela.csv')

# Arquivo com as geolocalizações dos estados do Brasil
geo_loc = pd.read_csv('../../../dados/areas-febre-amarela/geoloc.csv')

Vamos começar juntando os dados de geolocalização com os dados das áreas de necessidade de vacinação. Para isto vamos utilizar um conceito muito conhecido nos bancos de dados relacionais, o `Inner Join`, onde basicamente criaremos um novo DataFrame contendo somente as linhas que tem determinado valor igual nos dois DataFrames.

Neste caso este `Determinado valor` será o nome da cidade. 

`OBS`: Caso você ainda não tenha entendido os conceitos de `Inner Join`, veja a Figura abaixo, que demonstra basicamente cada tipo de junção possível. Um ponto importante a citar é que, aqui não estamos utilizando bancos de dados, porém o DataFrame do pandas deixa utilizarmos tais conceitos no DataFrame, o que facilita bastante a consulta aos dados.

![](https://i.stack.imgur.com/66zgg.png)

In [4]:
# Realizando Inner Join (Para áreas com recomendação de vacina)
areas_geo_recomendadas = pd.merge(geo_loc, area_recomendada, left_on='nome_municipio', right_on='no_cidade', how='inner')

In [5]:
# Realizando Inner Join (Para áreas sem recomendação de vacina)
areas_geo_sem_recomendacao = pd.merge(geo_loc, area_sem_recomendacao, 
                                      left_on='nome_municipio', 
                                      right_on='no_cidade', 
                                      how='inner')

Agora que fizemos as junções, vejamos como ficou o resultado.

In [6]:
areas_geo_recomendadas.head(3)

Unnamed: 0,codigo_ibge,nome_municipio,codigo_uf,uf,estado,capital,latitude,longitude,no_cidade
0,5200050,Abadia de Goiás,52,GO,Goiás,0,-16.7573,-49.4412,Abadia de Goiás
1,3100104,Abadia dos Dourados,31,MG,Minas Gerais,0,-18.4831,-47.3916,Abadia dos Dourados
2,5200100,Abadiânia,52,GO,Goiás,0,-16.197,-48.7057,Abadiânia


Olha que coisa bacana, juntamos as cidades que possuem os mesmos nomes (Isto nos campos `no_cidade` e `nome_municipio`). Bem agora que já temos os dados com sua localização geográfica, vamos criar o mapa, demonstrando neste cada ponto, que possui ou não recomendação de vacina contra a febre amarela.

Para criar o mapa, vamos utilizar a biblioteca Bokeh

In [26]:
import folium

brasil = folium.Map(
    location=[-16.1237611, -59.9219642], 
    zoom_start=4
)

for _, cidade in areas_geo_recomendadas[0:500].iterrows():
    folium.Marker(
        location=[cidade['latitude'], cidade['longitude']],
        icon=folium.Icon(color='red')
    ).add_to(brasil)
    
for _, cidade in areas_geo_sem_recomendacao[0:500].iterrows():
    folium.Marker(
        location=[cidade['latitude'], cidade['longitude']],
        icon=folium.Icon(color='blue')
    ).add_to(brasil)

brasil

Pronto! Agora já temos um mapa com os resultados que queriamos, porém perceba que fizemos o plot de apenas 500 cidades, isto porque, existem muitas, e o plot pode acabar ficando muito pesado :D