# Mapas con folium

In [1]:
import numpy as np  
import pandas as pd 
import folium

In [2]:
folium.__version__

'0.11.0'

# Introducción a Folium <a id="4"></a>

Folium es una poderosa biblioteca de Python que te ayuda a crear varios tipos de mapas. El hecho de que los resultados de Folium sean interactivos hace que esta biblioteca sea muy útil para la construcción de paneles.

La generación del mapa mundial es muy sencilla en **Folium**. Simplemente crea un objeto **Folium** *Map* y luego lo visualiza. Lo atractivo de los mapas **Folium** es que son interactivos, por lo que puede acercarse a cualquier región de interés a pesar del nivel de zoom inicial.

In [3]:
# crear el objeto mapa
world_map = folium.Map()

# Mostar el mapa
world_map

Todas las ubicaciones en un mapa están definidas por sus respectivos valores *Latitud* y *Longitud*. Por lo tanto, se puede crear un mapa y pasar un centro de valores de *Latitud* y *Longitud* de **[0, 0]**.

También se puede definir el nivel de zoom inicial en esa ubicación cuando se representa el mapa. **Cuanto más alto sea el nivel de zoom, más se acercará el mapa al centro**.

In [6]:
# Creamos un mapa centrado en España con zoom igual a 6 
world_map = folium.Map(location=[40.4637, -3.7492], zoom_start=3)
world_map

Creemos el mapa nuevamente con un nivel de zoom más alto

In [7]:
# Creamos un mapa centrado en España con zoom igual a 8
world_map = folium.Map(location=[40.4637, -3.7492], zoom_start=8)
world_map

### A. Stamen Toner Maps

Estos son mapas B + N (blanco y negro) de alto contraste. Son perfectos para combinar datos y explorar ríos y zonas costeras.

In [8]:
# Stamen Toner map
world_map = folium.Map(location=[40.4637, -3.7492], zoom_start=8, tiles='Stamen Toner')
world_map

### B. Stamen Terrain Maps

Estos son mapas que presentan sombreado de colinas y colores de vegetación natural. Muestran el etiquetado avanzado y la generalización de líneas de carreteras de doble calzada.

In [9]:
#Stamen Toner map 
world_map = folium.Map(location=[40.4637, -3.7492], zoom_start=8, tiles='Stamen Terrain')
world_map

### C. Mapbox Bright Maps

Este mapa esta descontinuado en folium

In [10]:
# Mapbox Bright style.
world_map = folium.Map(location=[40.4637, -3.7492], zoom_start=8, tiles='Mapbox Bright')
world_map

# Mapas con Markers (marcadores)


In [11]:
# Se descarga un csv con incidentes ocurridos en San Francisco
df_incidents = pd.read_csv('https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Police_Department_Incidents_-_Previous_Year__2016_.csv')
df_incidents.head()

Unnamed: 0,IncidntNum,Category,Descript,DayOfWeek,Date,Time,PdDistrict,Resolution,Address,X,Y,Location,PdId
0,120058272,WEAPON LAWS,POSS OF PROHIBITED WEAPON,Friday,01/29/2016 12:00:00 AM,11:00,SOUTHERN,"ARREST, BOOKED",800 Block of BRYANT ST,-122.403405,37.775421,"(37.775420706711, -122.403404791479)",12005827212120
1,120058272,WEAPON LAWS,"FIREARM, LOADED, IN VEHICLE, POSSESSION OR USE",Friday,01/29/2016 12:00:00 AM,11:00,SOUTHERN,"ARREST, BOOKED",800 Block of BRYANT ST,-122.403405,37.775421,"(37.775420706711, -122.403404791479)",12005827212168
2,141059263,WARRANTS,WARRANT ARREST,Monday,04/25/2016 12:00:00 AM,14:59,BAYVIEW,"ARREST, BOOKED",KEITH ST / SHAFTER AV,-122.388856,37.729981,"(37.7299809672996, -122.388856204292)",14105926363010
3,160013662,NON-CRIMINAL,LOST PROPERTY,Tuesday,01/05/2016 12:00:00 AM,23:50,TENDERLOIN,NONE,JONES ST / OFARRELL ST,-122.412971,37.785788,"(37.7857883766888, -122.412970537591)",16001366271000
4,160002740,NON-CRIMINAL,LOST PROPERTY,Friday,01/01/2016 12:00:00 AM,00:30,MISSION,NONE,16TH ST / MISSION ST,-122.419672,37.76505,"(37.7650501214668, -122.419671780296)",16000274071000


Cada fila consta de 13 características:
> 1. **IncidntNum**: Incident Number
> 2. **Category**: Category of crime or incident
> 3. **Descript**: Description of the crime or incident
> 4. **DayOfWeek**: The day of week on which the incident occurred
> 5. **Date**: The Date on which the incident occurred
> 6. **Time**: The time of day on which the incident occurred
> 7. **PdDistrict**: The police department district
> 8. **Resolution**: The resolution of the crime in terms whether the perpetrator was arrested or not
> 9. **Address**: The closest address to where the incident took place
> 10. **X**: The longitude value of the crime location 
> 11. **Y**: The latitude value of the crime location
> 12. **Location**: A tuple of the latitude and the longitude values
> 13. **PdId**: The police department ID

Veamos cuántas entradas hay en nuestro conjunto de datos.

In [12]:
df_incidents.shape

(150500, 13)

Para reducir el costo computacional, trabajemos con los primeros 100 incidentes en este conjunto de datos.

In [13]:
#obtener los primeros 100 crímenes del dataframe df_incidents
limit = 100
df_incidents = df_incidents.iloc[0:limit, :]

In [14]:
df_incidents.shape

(100, 13)

Ahora que redujimos un poco los datos, visualicemos dónde tuvieron lugar estos crímenes en la ciudad de San Francisco. Usaremos el estilo predeterminado e inicializaremos el nivel de zoom a 12.

In [15]:
# San Francisco latitude and longitude values
latitude = 37.77
longitude = -122.42

In [16]:
# create map and display it
sanfran_map = folium.Map(location=[latitude, longitude], zoom_start=12)

# display the map of San Francisco
sanfran_map

Ahora superpongamos las ubicaciones de los crímenes en el mapa. La forma de hacerlo en **Folium** es crear un *feature group* con sus propias características y estilo y luego agregarlo al sanfran_map.

In [17]:
# Inicializamos un feature group para los incidentes en el dataframe
incidents = folium.map.FeatureGroup()

#Recorre los 100 crímenes y agrega a cada uno al feature group de incidentes

for lat, lng, in zip(df_incidents.Y, df_incidents.X): #la columna Y y X son las coordenadas 
    incidents.add_child(
            folium.CircleMarker([lat, lng],
            radius=5, # difine el tamaño de los circulos
            color='red',
            fill=True,
            fill_color='blue',
            fill_opacity=0.6
        )
    )

# Agrega incidentes al map
sanfran_map.add_child(incidents)

# Agregar pop-up al mapa

In [19]:
# Inicializamos un feature group para los incidentes en el dataframe
incidents = folium.map.FeatureGroup()

#Recorre los 100 crímenes y agrega a cada uno al feature group de incidentes

for lat, lng, in zip(df_incidents.Y, df_incidents.X):
    incidents.add_child(
        folium.CircleMarker(
            [lat, lng],
            radius=5, # difine el tamaño de los circulos
            color='yellow',
            fill=True,
            fill_color='blue',
            fill_opacity=0.6
        )
    )

for lat, lng, label in zip(df_incidents.Y, df_incidents.X, df_incidents.Category):
    folium.Marker([lat,lng], popup=label).add_to(sanfran_map)
    
    
# Agrega incidentes al map
sanfran_map.add_child(incidents)

También es posible agrupar los marcadores en diferentes grupos. Cada grupo está representado por el número de delitos en cada vecindario. 

In [20]:
from folium import plugins

# Comenzamos de nuevo con una copia limpia del mapa de San Francisco
sanfran_map = folium.Map(location = [latitude, longitude], zoom_start = 12)

# Creamos una instancia de un objeto de clúster (mark cluster object)
#de marca para los incidentes en el marco de datos

incidents = plugins.MarkerCluster().add_to(sanfran_map)

#Recorre los 100 crímenes y agrega a cada uno al feature group de incidentes

for lat, lng, label, in zip(df_incidents.Y, df_incidents.X, df_incidents.Category):
    folium.Marker(
        location=[lat, lng],
        icon=None,
        popup=label,
    ).add_to(incidents)

# display map
sanfran_map

# Choropleth Maps

Un mapa `Choropleth` es un mapa temático en el que las áreas están sombreadas o modeladas en proporción a la medición de la variable estadística que se muestra en el mapa, como la densidad de población o el ingreso per cápita. El choropleth map proporciona una manera fácil de visualizar cómo varía una medición en un área geográfica o muestra el nivel de variabilidad dentro de una región. 

Ahora, creemos nuestro propio mapa `Choropleth` del mundo que represente la inmigración de varios países a Canadá.

In [21]:
df_can = pd.read_excel('https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Canada.xlsx',
                     sheet_name='Canada by Citizenship',
                     skiprows=range(20),
                     skipfooter=2)
df_can.head()

Unnamed: 0,Type,Coverage,OdName,AREA,AreaName,REG,RegName,DEV,DevName,1980,...,2004,2005,2006,2007,2008,2009,2010,2011,2012,2013
0,Immigrants,Foreigners,Afghanistan,935,Asia,5501,Southern Asia,902,Developing regions,16,...,2978,3436,3009,2652,2111,1746,1758,2203,2635,2004
1,Immigrants,Foreigners,Albania,908,Europe,925,Southern Europe,901,Developed regions,1,...,1450,1223,856,702,560,716,561,539,620,603
2,Immigrants,Foreigners,Algeria,903,Africa,912,Northern Africa,902,Developing regions,80,...,3616,3626,4807,3623,4005,5393,4752,4325,3774,4331
3,Immigrants,Foreigners,American Samoa,909,Oceania,957,Polynesia,902,Developing regions,0,...,0,0,1,0,0,0,0,0,0,0
4,Immigrants,Foreigners,Andorra,908,Europe,925,Southern Europe,901,Developed regions,0,...,0,0,1,1,0,0,0,0,1,1


In [22]:
df_can.shape

(195, 43)

Limpiaremos los datos y haremos algunas modificaciones al conjunto de datos original para que sea más fácil crear nuestras visualizaciones. 

In [23]:
#Limpiamos el dataframe para remover columnas inecesarias 
df_can.drop(['AREA','REG','DEV','Type','Coverage'], axis=1, inplace=True)

#Cambiamos el nombre a las columnas para que tengan más sentido

df_can.rename(columns={'OdName':'Country', 'AreaName':'Continent','RegName':'Region'}, inplace=True)

# Para tener consistencia, Cambiamos todas las etiquetas de columnas a tipo string
df_can.columns = list(map(str, df_can.columns))

# add total column
df_can['Total'] = df_can.sum(axis=1)

years = list(map(str, range(1980, 2014)))
print ('data dimensions:', df_can.shape)

data dimensions: (195, 39)


In [24]:
df_can.head()

Unnamed: 0,Country,Continent,Region,DevName,1980,1981,1982,1983,1984,1985,...,2005,2006,2007,2008,2009,2010,2011,2012,2013,Total
0,Afghanistan,Asia,Southern Asia,Developing regions,16,39,39,47,71,340,...,3436,3009,2652,2111,1746,1758,2203,2635,2004,58639
1,Albania,Europe,Southern Europe,Developed regions,1,0,0,0,0,0,...,1223,856,702,560,716,561,539,620,603,15699
2,Algeria,Africa,Northern Africa,Developing regions,80,67,71,69,63,44,...,3626,4807,3623,4005,5393,4752,4325,3774,4331,69439
3,American Samoa,Oceania,Polynesia,Developing regions,0,1,0,0,0,0,...,0,1,0,0,0,0,0,0,0,6
4,Andorra,Europe,Southern Europe,Developed regions,0,0,0,0,0,0,...,0,1,1,0,0,0,0,1,1,15


Para crear un mapa `Choropleth`, necesitamos un archivo GeoJSON que defina las áreas / límites del estado, condado o país en el que estamos interesados. En nuestro caso, dado que estamos tratando de crear un mapa mundial, quiere un GeoJSON que defina los límites de todos los países del mundo.
Vamos a llamarlo **world_countries.json**

Ahora que tenemos el archivo GeoJSON, creemos un mapa mundial, centrado alrededor de los valores **[0, 0]** *latitud* y *longitud*, con un nivel de zoom inicial de 2 y usando el estilo *Mapbox Bright*.

In [28]:
world_geo = r'world_countries.json' # geojson

# crea un mapa mundial 
world_map = folium.Map(location=[0, 0], zoom_start=2, tiles='Mapbox Bright')
world_map

Y ahora para crear un mapa `Choropleth`, utilizaremos el método *choropleth* con los siguientes parámetros principales:

1. geo_data, que es el archivo GeoJSON.
2. data, que es el dataframe que contiene los datos.
3. columns, que representan las columnas en el dataframe que se utilizarán para crear el mapa `Choropleth`.
4. key_on, que es la clave o variable en el archivo GeoJSON que contiene el nombre de la variable de interés. Para determinar eso, deberá abrir el archivo GeoJSON utilizando cualquier editor de texto y anotar el nombre de la clave o variable que contiene el nombre de los países, ya que los países son nuestra variable de interés. En este caso, **name** es la clave en el archivo GeoJSON que contiene el nombre de los países. Tenga en cuenta que esta clave es sensible a mayúsculas y minúsculas, por lo que debe pasar exactamente como existe en el archivo GeoJSON.

In [29]:
#Generar un choropleth map utilizando la inmigración total de cada país a Canadá desde 1980 hasta 2013

world_map.choropleth(
    geo_data=world_geo,
    data=df_can,
    columns=['Country', 'Total'],
    key_on='feature.properties.name',
     fill_color='Reds', 
     fill_opacity=0.7, 
     line_opacity=0.2,
     legend_name='Immigration to Canada'
)
world_map

In [30]:
world_map.save("1.html")