<a href="https://cognitiveclass.ai"><img src = "https://ibm.box.com/shared/static/9gegpsmnsoo25ikkbl4qzlvlyjbgxs5x.png" width = 400> </a>

<h1 align=center><font size = 5>Crear mapas en Python </font></h1>

## Introducción

En este laboratorio, aprenderemos a crear mapas para distintos objetivos. Para ello, nos apartaremos de Matplotlib y trabajaremos con otra biblioteca de visualización de Python denominada **Folium**. Lo bueno de **Folium** es que se desarrolló con el único fin de visualizar datos geoespaciales. Aunque hay otras bibliotecas para visualizar datos geoespaciales, como **plotly**, es posible que tengan una restricción sobre la cantidad de llamadas a la API que pueden hacerse  en un plazo definido. **Folium**, por otro lado, es una biblioteca completamente gratuita.

## Índice 

<div class="alert alert-block alert-info" style="margin-top: 20px">

1. [Explorando conjuntos de datos con *pandas*](#0)<br>
2. [Descarga y preparación de datos](#2)<br>
3. [Introducción a Folium](#4) <br>
4. [Mapa con marcadores](#6) <br>
5. [Mapas coropléticos](#8) <br>
</div>
<hr>

# Explorando conjuntos de datos con *pandas* y Matplotlib<a id="0"></a>

Kits de herramientas: Este laboratorio se basa en gran medida en [*pandas*](http://pandas.pydata.org/) y [**Numpy**](http://www.numpy.org/) para el manejo, el análisis y la visualización de datos. La primera biblioteca de diagramación que exploraremos en este laboratorio es [**Folium**](https://github.com/python-visualization/folium/).

Conjuntos de datos: 

1. Incidentes del departamento de policía de San Francisco para 2016 - Portal de datos públicos de San Francisco [Incidentes del departamento de policía](https://data.sfgov.org/Public-Safety/Police-Department-Incidents-Previous-Year-2016-/ritf-b9ki)     Incidentes derivados del sistema de denuncia de delitos del departamento de policía de San Francisco (SFPD). Actualización diaria, con datos para todo 2016. La dirección y la ubicación se hicieron anónimas. Para ello, se desplazaron a la mitad de una calle o a una intersección.    

2. Inmigración a Canadá entre 1980 a 2013 - [Corrientes migratorias internacionales desde y hacia determinados países, revisión de 2015](http://www.un.org/en/development/desa/population/migration/data/empirical2/migrationflows.shtml)     del sitio web de Naciones Unidas. El conjunto de datos contiene datos anuales sobre las corrientes migratorias internacionales según las registraron los países de destino. Los datos presentan corrientes entrantes y salientes, según el lugar de nacimiento, la ciudadanía o el lugar de residencia anterior/posterior para extranjeros y no extranjeros. En esta lección, nos enfocaremos en los datos inmigratorios de Canadá.

# Descarga y preparación de datos <a id="2"></a>

Importar módulos primarios:

In [None]:
import numpy as np  # es útil para muchos cálculos científicos en Python 
import pandas as pd # biblioteca primaria de estructura de datos

# Introducción a Folium <a id="4"></a>

Folium es una potente biblioteca de Python que nos ayuda a crear diversos tipos de mapas en Leaflet. Debido a que los resultados de Folium son interactivos, esta biblioteca es muy útil para la creación de paneles. 

De la página oficial de documentación de Folium:

> Folium aprovecha las fortalezas de manejo de datos del ecosistema de Python y las fortalezas para la creación de mapas de la biblioteca Leaflet.js. Es posible manipular los datos en Python y, a continuación, visualizarlos en un mapa de Leaflet mediante Folium.

> Gracias a Folium, es fácil visualizar los datos manipulados en Python mediante un mapa interactivo de Leaflet. Permite unir los datos a un mapa para las visualizaciones coropléticas y ejecutar visualizaciones Vincent/Vega como marcadores en el mapa.

> La biblioteca cuenta con diversos conjuntos de mosaicos de OpenStreetMap, Mapbox y Stamen, y respalda conjuntos de mosaicos personalizados con claves de la API de Mapbox o Cloudmade. Folium admite superposiciones tanto de GeoJSON como de TopoJSON, además de la unión de datos a tales superposiciones para crear mapas coropléticos con esquemas de colores de ColorBrewer. 

#### Instalemos **Folium**

**Folium** no está disponible de manera predeterminada. En primer lugar, debemos instalarlo para poder importarlo.

In [None]:
!conda install -c conda-forge folium=0.5.0 --yes
import folium

print('¡Folium instalado e importado!')

La generación del mapa mundial es directa en **Folium**. Solo es necesario crear un objeto *Map* de **Folium** y, a continuación, mostrarlo. Los mapas en **Folium** son atractivos porque son interactivos: es posible acercar cualquier región de interés independientemente del nivel de acercamiento/alejamiento inicial.

In [None]:
# definir el mapa mundial
world_map = folium.Map()

# mostrar el mapa mundial
world_map

Inténtelo. Acerque y aleje el mapa representado arriba.

Para personalizar esta definición predeterminada del mapa mundial, puede especificar el centro de su mapa y el nivel de zoom inicial. 

Todas las ubicaciones de un mapa se definen según sus valores respectivos de *latitud* y *longitud*. Así, es posible crear un mapa y ejecutar un centro con los valores de *latitud* y *longitud* de **[0, 0]**. 

Para un centro definido, puede definir además el nivel de zoom inicial en la ubicación donde se representa el mapa. **Cuanto más alto sea el nivel de zoom, más se centrará el mapa**. 

Creemos un mapa centrado en Canadá y juguemos un poco con el nivel de zoom para ver de qué manera afecta el mapa representado. 

In [None]:
# defina el mapa mundial centrado en Canadá con un nivel de zoom bajo
world_map = folium.Map(location=[56.130, -106.35], zoom_start=4)

# mostrar el mapa mundial
world_map

Creemos nuevamente el mapa con un mayor nivel de zoom.

In [None]:
# defina el mapa mundial centrado en Canadá con un nivel de zoom mayor
world_map = folium.Map(location=[56.130, -106.35], zoom_start=8)

# mostrar el mapa mundial 
world_map

Como puede apreciar, cuanto más alto sea el nivel de zoom, más se centrará el mapa.

**Pregunta:** Cree un mapa de México con un nivel de zoom de 4.

In [None]:
### escriba su respuesta aquí





Haga doble clic __aquí__ para ver la solución. 
<!-- La respuesta correcta es:
\\ # definamos las coordenadas de geolocalización de México
mexico_latitude = 23.6345 
mexico_longitude = -102.5528
-->

<!--
\\ # define el mapa del mundo centrado en Canadá con un mayor nivel de zoom
mexico_map = folium.Map(location=[mexico_latitude, mexico_longitude], zoom_start=4)
-->

<!--
\\ # muestre el mapa del mundo
mexico_map
-->

Otra característica atractiva de **Folium** es que resulta posible generar diferentes estilos de mapa.

### A. Mapas estilo Toner de Stamen 

Se trata de mapas de alto contraste en blanco y negro. Son perfectos para mashups de datos y para explorar los meandros de los ríos y las zonas costeras. 

Creemos un mapa estilo *Toner de Stamen* de Canadá con un nivel de zoom de 4.

In [None]:
# cree un mapa estilo Toner de Stamen del mundo centrado en Canadá
world_map = folium.Map(location=[56.130, -106.35], zoom_start=4, tiles='Stamen Toner')

# muestre el mapa
world_map

Puede acercar y alejar la imagen para comparar este estilo con el predeterminado.

### B. Mapas estilo Terrain de Stamen 

Estos mapas incluyen el sombreado de las montañas y los colores naturales de la vegetación. Tienen etiquetas avanzadas y generalización en líneas de autopistas.

Let's create a Stamen Terrain map of Canada with zoom level 4.

In [None]:
# cree un mapa estilo Toner de Stamen del mundo centrado en Canadá
world_map = folium.Map(location=[56.130, -106.35], zoom_start=4, tiles='Stamen Terrain')

# muestre el mapa
world_map

Puede acercar y alejar la imagen para comparar este estilo con el Toner de Stamen y el predeterminado.

### C. Mapas estilo Mapbox Bright 

Se trata de mapas bastante similares al estilo predeterminado, excepto que los límites no son visibles con un nivel de zoom bajo. Además, a diferencia del estilo predeterminado donde los nombres de los países se muestran en el idioma de cada país, el estilo *Mapbox Bright* muestra todos los nombres de los países en inglés. 

Creemos un mapa mundial con este estilo.

In [None]:
# cree un mapa mundial con el estilo Mapbox Bright.
world_map = folium.Map(tiles='Mapbox Bright')

# muestre el mapa
world_map

Acerque la imagen y observe de qué manera comienzan a mostrarse los límites y los nombres de los países en inglés.

**Pregunta:** Cree un mapa de México para visualizar el sombreado montañoso y la vegetación natural. Use un nivel de zoom de 6. 

In [None]:
### escriba su respuesta aquí 





Haga doble clic __aquí__ para ver la solución. 
<!-- La respuesta correcta es:
\\ # definamos las coordenadas de geolocalización de México.
mexico_latitude = 23.6345 
mexico_longitude = -102.5528
-->

<!--
\\ # define el mapa del mundo centrado en Canadá con un mayor nivel de zoom.
mexico_map = folium.Map(location=[mexico_latitude, mexico_longitude], zoom_start=6, tiles='Stamen Terrain')
-->

<!--
\\ # muestre el mapa del mundo
mexico_map
-->

# Mapas con marcadores <a id="6"></a>


Descarguemos e importemos los datos sobre los incidentes del departamento de policía con el método `read_csv()` de *pandas*.

Descargue el conjunto de datos e ingréselo en un DataFrame de *pandas*:

In [None]:
df_incidents = pd.read_csv('https://ibm.box.com/shared/static/nmcltjmocdi8sd5tk93uembzdec8zyaq.csv')

print('Conjunto de datos descargado e ingresado en un DataFrame de pandas')

Veamos los primeros cinco elementos de nuestro conjunto de datos.

In [None]:
df_incidents.head()

Cada fila consiste en 13 características: 

> 1. **IncidntNum (NúmIncidnt)**: Número de incidente
> 2. **Category (Categoría)**: Categoría del delito o del incidente 
> 3. **Descript (Descrip)**: Descripción del delito o del incidente 
> 4. **DayOfWeek (DíaDeLaSemana)**: El día de la semana en que ocurrió el incidente 
> 5. **Date (Fecha)**: La fecha en que ocurrió el incidente 
> 6. **Time (Hora)**: La hora del día en que ocurrió el incidente 
> 7. **PdDistrict (DistritoDp)**: El distrito del departamento de policía 
> 8. **Resolution (Resolución)**: La resolución del delito en términos del arresto o no del perpetrador
> 9. **Address (Dirección)**: La dirección más cercana al lugar donde ocurrió el incidente 
> 10. **X**: El valor de la longitud de la ubicación del delito 
> 11. **Y**: El valor de la latitud de la ubicación del delito 
> 12. **Location (Ubicación)**: El lugar donde coinciden los valores de latitud y longitud 
> 13. **PdId (IdDp)**: El id. del departamento de policía 

Veamos cuántas entradas hay en nuestro conjunto de datos.

In [None]:
df_incidents.shape

El DataFrame consiste en 150,500 delitos que tuvieron lugar en el año 2016. Para reducir los costos de los cálculos, trabajemos solo con los primeros 100 incidentes de este conjunto de datos.

In [None]:
# obtenga los primeros 100 delitos en el DataFrame df_incidents
limit = 100
df_incidents = df_incidents.iloc[0:limit, :]

Confirmemos que nuestro DataFrme consiste ahora en solo 100 delitos.

In [None]:
df_incidents.shape

Ahora que ya reducimos los datos, visualicemos dónde ocurrieron estos delitos en la ciudad de San Francisco. Utilizaremos el estilo predeterminado e inicializaremos el nivel de zoom en 12.

In [None]:
# valores de latitud y longitud para San Francisco 
latitude = 37.77
longitude = -122.42

In [None]:
# cree el mapa y muéstrelo
sanfran_map = folium.Map(location=[latitude, longitude], zoom_start=12)

# muestre el mapa de San Francisco
sanfran_map

Ahora, superpongamos las ubicaciones de los delitos en el mapa. En **Folium**, para hacerlo debemos crear un *grupo de características* con sus propias características y estilo y agregarlo a sanfran_map.

In [None]:
# instancie un grupo de características para los incidentes en el DataFrame
incidents = folium.map.FeatureGroup()

# procese los 100 delitos y agregue cada uno al grupo de características de incidentes
for lat, lng, in zip(df_incidents.Y, df_incidents.X):
    incidents.add_child(
        folium.features.CircleMarker(
            [lat, lng],
            radius=5, # defina de qué tamaño desea que sean los marcadores de círculo
            color='yellow',
            fill=True,
            fill_color='blue',
            fill_opacity=0.6
        )
    )

# agregar los incidentes al mapa
sanfran_map.add_child(incidents)

También puede agregar texto emergente para que se muestre cuando se desplace el puntero del mouse sobre un marcador. Hagamos que cada marcador muestre la categoría del delito al desplazar el puntero del mouse por arriba.

In [None]:
# instancie un grupo de características para los incidentes en el DataFrame
incidents = folium.map.FeatureGroup()

# procese los 100 delitos y agregue cada uno al grupo de características de incidentes
for lat, lng, in zip(df_incidents.Y, df_incidents.X):
    incidents.add_child(
        folium.features.CircleMarker(
            [lat, lng],
            radius=5, # defina de qué tamaño desea que sean los marcadores de círculo
            color='yellow',
            fill=True,
            fill_color='blue',
            fill_opacity=0.6
        )
    )

# agregue texto emergente a cada marcador del mapa
latitudes = list(df_incidents.Y)
longitudes = list(df_incidents.X)
labels = list(df_incidents.Category)

for lat, lng, label in zip(latitudes, longitudes, labels):
    folium.Marker([lat, lng], popup=label).add_to(sanfran_map)    
    
# agregar los incidentes al mapa
sanfran_map.add_child(incidents)

¿No es genial? Ahora puede saber qué categoría de delito ocurrió en cada marcador. 

Si le parece que el mapa está demasiado abarrotado de marcadores, hay dos soluciones posibles. La solución más sencilla es eliminar los marcadores de ubicación y agregar el texto a los marcadores circulares en sí de la siguiente manera:

In [None]:
# cree el mapa y muéstrelo
sanfran_map = folium.Map(location=[latitude, longitude], zoom_start=12)

# procese los 100 delitos y agregue cada uno de ellos al mapa
for lat, lng, label in zip(df_incidents.Y, df_incidents.X, df_incidents.Category):
    folium.features.CircleMarker(
        [lat, lng],
        radius=5, # defina de qué tamaño desea que sean los marcadores de círculo
        color='yellow',
        fill=True,
        popup=label,
        fill_color='blue',
        fill_opacity=0.6
    ).add_to(sanfran_map)

# muestre el mapa
sanfran_map

La otra solución adecuada es agrupar los marcadores. Cada grupo se representa con la cantidad de delitos en cada vecindario. Los grupos pueden considerarse porciones de San Francisco que pueden analizarse por separado. 

Para implementarlo, instanciamos un objeto *MarkerCluster* y agregamos todos los puntos de datos del DataFrame en este objeto.

In [None]:
from folium import plugins

# comencemos nuevamente con una copia limpia del mapa de San Francisco
sanfran_map = folium.Map(location = [latitude, longitude], zoom_start = 12)

# instancie un objeto de grupo de marcas para los incidentes en el DataFrame
incidents = plugins.MarkerCluster().add_to(sanfran_map)

# procese el DataFrame y agregue cada punto de datos al grupo de marcas
for lat, lng, label, in zip(df_incidents.Y, df_incidents.X, df_incidents.Category):
    folium.Marker(
        location=[lat, lng],
        icon=None,
        popup=label,
    ).add_to(incidents)

# muestre el mapa
sanfran_map

Observe que, al alejar completamente, todos los marcadores se agrupan juntos, el grupo global de 100 marcadores o delitos, que son la cantidad total de delitos en el DataFrame. Al comenzar a acercar la imagen, el *grupo global* comenzará a descomponerse en grupos más pequeños. Al acercar la imagen por completo, aparecerán los marcadores individuales.

# Mapas coropléticos <a id="8"></a>

Un mapa `coroplético` es un mapa temático en el que las áreas se sombrean o incluyen un patrón en proporción con la medida de la variable estadística que se muestra, como densidad de población o ingresos per cápita. Los mapas coropléticos ofrecen una manera fácil de visualizar la forma en que una medida varía en una misma área geográfica o muestra el nivel de variabilidad en una región. A continuación se muestra un mapa `coroplético` de EE. UU. que indica la población por milla cuadrada por estado.

<img src = "https://ibm.box.com/shared/static/2kzaknzdf6crt3n5rx6haskg3wiaklxl.png" width = 600> 

Ahora, creemos nuestro propio mapa `Choropleth` del mundo que muestre la inmigración desde distintos países hacia Canadá.

En primer lugar, descarguemos e importemos nuestro conjunto de datos primario de inmigración canadiense con el método `read_excel()` de *pandas*. Habitualmente, para poder hacerlo, debemos descargar un módulo que *pandas* necesita para leer en archivos de Excel. El módulo es **xlrd**. Para su conveniencia, ya hemos instalado este módulo. Así no deberá preocuparse por ello. De lo contrario, usted debería ejecutar la siguiente línea de código para instalar el módulo **xlrd**:
```
!conda install -c anaconda xlrd --yes
```

Descargue el conjunto de datos e ingréselo en un DataFrame de *pandas*:

In [None]:
df_can = pd.read_excel('https://ibm.box.com/shared/static/lw190pt9zpy5bd1ptyg2aw15awomz9pu.xlsx',
                     sheet_name='Canada by Citizenship',
                     skiprows=range(20),
                     skip_footer=2)

print('Datos descargados e ingresados en un DataFrame')

Veamos los primeros cinco elementos de nuestro conjunto de datos.

In [None]:
df_can.head()

Veamos cuántas entradas hay en nuestro conjunto de datos.

In [None]:
# muestre las dimensiones del DataFrame
print(df_can.shape)

Depuración de los datos. Realizaremos algunas modificaciones en el conjunto de datos original para facilitar la creación de visualizaciones. Consulte las libretas de *introducción a Matplotlib y a los gráficos de líneas* y de *diagramas de áreas, histogramas y diagramas de barras* para obtener una descripción detallada sobre este preprocesamiento.

In [None]:
# limpie el conjunto de datos para eliminar las columnas innecesarias (p. ej., REG) 
df_can.drop(['AREA','REG','DEV','Type','Coverage'], axis=1, inplace=True)

# cambiemos el nombre de las columnas para que tengan sentido
df_can.rename(columns={'OdName':'Country', 'AreaName':'Continent','RegName':'Region'}, inplace=True)

# para mayor consistencia, también hagamos que todas las etiquetas de las columnas sean del tipo cadena
df_can.columns = list(map(str, df_can.columns))

# agregue una columna total
df_can['Total'] = df_can.sum(axis=1)

# años que usaremos en esta lección - útiles para la diagramación posterior
years = list(map(str, range(1980, 2014)))
print ('data dimensions:', df_can.shape)

Veamos los primeros cinco elementos de nuestro conjunto de datos ya limpio.

In [None]:
df_can.head()

Para crear un mapa `Choropleth` necesitamos un archivo de GeoJSON que defina las áreas/ límites del estado, del país o del condado de interés. En nuestro caso, debido a que crearemos un mapa mundial, deseamos un archivo de GeoJSON que defina el límite de todos los países del mundo. Para su conveniencia, le proporcionaremos el archivo. Tenga la amabilidad de descargarlo. Nombremos el archivo **world_countries.json**.

In [None]:
# descargue el archivo de geojson de los países
!wget --quiet https://ibm.box.com/shared/static/cto2qv7nx6yq19logfcissyy4euo8lho.json -O world_countries.json
    
print('Se descargó el archivo de GeoJSON.')

Ahora que tenemos el archivo de GeoJSON, creemos un mapa del mundo centrado en los valores **[0, 0]** de *latitud* y *longitud*, con un nivel de zoom inicial de 2 y el estilo *Mapbox Bright*.

In [None]:
world_geo = r'world_countries.json' # archivo de geojson

# cree un mapa mundial sencillo
world_map = folium.Map(location=[0, 0], zoom_start=2, tiles='Mapbox Bright')

# genere un mapa coroplético con la inmigración total de cada país a Canadá entre 1980 a 2013
world_map.choropleth(
    geo_data=world_geo,
    data=df_can,
    columns=['Country', 'Total'],
    key_on='feature.properties.name',
    fill_color='YlOrRd', 
    fill_opacity=0.7, 
    line_opacity=0.2,
    legend_name='Immigration to Canada'
)

# muestre el mapa
world_map

¡Vaya! El mapa es muy interesante. Según la leyenda del mapa `coroplético`, cuanto más oscuro es el color de un país y más cercano es el color de un país al rojo, mayor es la cantidad de inmigrantes de dicho país. Podemos observar que la mayor inmigración a lo largo de 33 años (entre 1980 a 2013) fue desde China, India y Filipinas, países seguidos por Polonia, Pakistán y, un dato muy interesante, EE. UU.

Observe que la leyenda muestra un límite o umbral negativo. Corrijámoslo con una definición de nuestros umbrales y a partir del 0 en lugar de -6918.

In [None]:
world_geo = r'world_countries.json'

# cree una matriz de NumPy con un largo de 6 y con un espaciado lineal a partir del total mínimo de inmigración hasta el total máximo de inmigración
threshold_scale = np.linspace(df_can['Total'].min(),
                              df_can['Total'].max(),
                              6, dtype=int)
threshold_scale = threshold_scale.tolist() # cambie la matriz de NumPy a una lista
threshold_scale[-1] = threshold_scale[-1] + 1 # asegúrese de que el último valor de la lista sea mayor que la inmigración máxima

# permita que Folium determine la escala.
world_map = folium.Map(location=[0, 0], zoom_start=2, tiles='Mapbox Bright')
world_map.choropleth(
    geo_data=world_geo,
    data=df_can,
    columns=['Country', 'Total'],
    key_on='feature.properties.name',
    threshold_scale=threshold_scale,
    fill_color='YlOrRd', 
    fill_opacity=0.7, 
    line_opacity=0.2,
    legend_name='Inmigración a Canadá',
    reset=True
)
world_map

¡Mucho mejor! Puede jugar con los datos y quizá crear mapas `coropléticos` para años individuales, o incluso décadas, y ver cómo se comparan con todo el periodo entre 1980 a 2013.

### ¡Gracias por completar este laboratorio!

Esta libreta fue creada por [Alex Aklson](https://www.linkedin.com/in/aklson/). Espero que este laboratorio le haya resultado interesante y educativo. ¡Si tiene alguna pregunta, comuníquese conmigo!

Esta libreta es parte del curso gratuito de **Cognitive Class** denominado *Visualización de datos con Python*. Si accedió a esta libreta desde fuera del curso, puede llevar a cabo el curso en línea auto-instructivo haciendo clic [aquí](https://cocl.us/DV0101EN_Lab5).

Derechos de autor &copy; 2018 [cognitiveclass.ai](cognitiveclass.ai?utm_source=bducopyrightlink&utm_medium=dswb&utm_campaign=bdu). Esta cuaderno y su código fuente se publican bajo los términos de la [Licencia de MIT](https://bigdatauniversity.com/mit-license/).