## Folium

```python
pip install folium
```
*__QuickStart__: https://python-visualization.github.io/folium/quickstart.html*

*__Documentacion__: https://python-visualization.github.io/folium/modules.html*


**`Folium`** es una poderosa biblioteca de python que nos ayuda a crear varios tipos de mapas. El hecho de que los resultados de Folium sean interactivos hace que esta biblioteca sea muy útil para la construcción de paneles.

La generación del mapa mundial es muy sencilla en **`folium`**. Simplemente crea un objeto **`folium.map()`** y luego lo visualiza. Lo atractivo de los mapas **`folium`** es que son interactivos, por lo que puede acercarse a cualquier región de interés a pesar del nivel de zoom inicial.

In [1]:
import numpy as np  
import pandas as pd

import folium

In [2]:
# Versiones

print(f"numpy=={np.__version__}")
print(f"pandas=={pd.__version__}")
print(f"folium=={folium.__version__}")

numpy==2.2.1
pandas==2.2.3
folium==0.19.2


In [3]:
# Crear el objeto mapa
world_map = folium.Map()

# Mostar el mapa
world_map

In [4]:
type(world_map)

folium.folium.Map

Todas las ubicaciones en un mapa están definidas por sus respectivos valores **Latitud** y **Longitud**. Por lo tanto, se puede crear un mapa y pasar un centro de valores de Latitud y Longitud, por ejemplo [40.4637, -3.7492].

También se puede definir el nivel de **zoom** inicial en esa ubicación cuando se representa el mapa. **Cuanto más alto sea el nivel de zoom, más se acercará el mapa al centro.**

In [5]:
# Creamos un mapa centrado en España con zoom igual a 6 
world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 6)

world_map

In [6]:
# Creamos un mapa centrado en España con zoom igual a 8
world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 8)

world_map

## Tipos de mapas:

1. **Stamen Toner Maps**: Estos son mapas en blanco y negro de alto contraste. Son perfecto para combinar datos y explorar ríos y zonas costeras.

In [7]:
# Stamen Toner Map
# world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 8, tiles = "Stamen Toner", attr="Map tiles by Stamen Design, under CC BY 3.0. Data by OpenStreetMap, under ODbL.")

# world_map


2. **Stamen Terrain Maps**: Estos son mapas que presentan sombreado de colinas y colores de vegetación natural. Muestran el etiquetado avanzado y la generalización de líneas de carreteras de doble calzada.

In [8]:
# Stamen Terrain Map
#world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 8, tiles = "Stamen Terrain", attr="Map tiles by Stamen Design, under CC BY 3.0. Data by OpenStreetMap, under ODbL.")

#world_map


3. **Stamen Watercolor**: Mapa representado con estilo de "acuarelas".

In [9]:
# Stamen Watercolor Map
# world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 4, tiles = "Stamen Watercolor", attr="Map tiles by Stamen Design, under CC BY 3.0. Data by OpenStreetMap, under ODbL.")

# world_map

4. **CartoDB Positron**: Mapa sin información relevante a escala de grises, diseñado para que la información representada en ella sea más llamativa.

In [10]:
world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 6, tiles = "CartoDB Positron", attr="Map tiles by Stamen Design, under CC BY 3.0. Data by OpenStreetMap, under ODbL.")

world_map

5. **CartoDB Dark_Matter**: Mapa sin información relevante a escala de negros, diseñado para que la información representada en ella sea más llamativa.

In [11]:
world_map = folium.Map(location = [40.4637, -3.7492], zoom_start = 6, tiles = "CartoDB Dark_Matter", attr="Map tiles by Stamen Design, under CC BY 3.0. Data by OpenStreetMap, under ODbL.")

world_map

### "Estilos" en folium

In [12]:
# Se descarga un .csv con incidentes ocurridos en San Francisco

df_incidents = pd.read_csv("https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Police_Department_Incidents_-_Previous_Year__2016_.csv")

df_incidents.head(3)

Unnamed: 0,IncidntNum,Category,Descript,DayOfWeek,Date,Time,PdDistrict,Resolution,Address,X,Y,Location,PdId
0,120058272,WEAPON LAWS,POSS OF PROHIBITED WEAPON,Friday,01/29/2016 12:00:00 AM,11:00,SOUTHERN,"ARREST, BOOKED",800 Block of BRYANT ST,-122.403405,37.775421,"(37.775420706711, -122.403404791479)",12005827212120
1,120058272,WEAPON LAWS,"FIREARM, LOADED, IN VEHICLE, POSSESSION OR USE",Friday,01/29/2016 12:00:00 AM,11:00,SOUTHERN,"ARREST, BOOKED",800 Block of BRYANT ST,-122.403405,37.775421,"(37.775420706711, -122.403404791479)",12005827212168
2,141059263,WARRANTS,WARRANT ARREST,Monday,04/25/2016 12:00:00 AM,14:59,BAYVIEW,"ARREST, BOOKED",KEITH ST / SHAFTER AV,-122.388856,37.729981,"(37.7299809672996, -122.388856204292)",14105926363010


Cada fila consta de 13 características:

> 1. **IncidntNum**: Incident Number
> 2. **Category**: Category of crime or incident
> 3. **Descript**: Description of the crime or incident
> 4. **DayOfWeek**: The day of week on which the incident occurred
> 5. **Date**: The Date on which the incident occurred
> 6. **Time**: The time of day on which the incident occurred
> 7. **PdDistrict**: The police department district
> 8. **Resolution**: The resolution of the crime in terms whether the perpetrator was arrested or not
> 9. **Address**: The closest address to where the incident took place
> 10. **X**: The longitude value of the crime location
> 11. **Y**: The latitude value of the crime location
> 12. **Location**: A tuple of the latitude and the longitude values
> 13. **PdId**: The police department ID

In [13]:
df_incidents.shape

(150500, 13)

In [14]:
# Vamos a truncar el DataFrame a 100 filas

limit = 100

df_incidents = df_incidents.iloc[0: limit, :]

df_incidents.shape

(100, 13)

In [15]:
df_incidents

Unnamed: 0,IncidntNum,Category,Descript,DayOfWeek,Date,Time,PdDistrict,Resolution,Address,X,Y,Location,PdId
0,120058272,WEAPON LAWS,POSS OF PROHIBITED WEAPON,Friday,01/29/2016 12:00:00 AM,11:00,SOUTHERN,"ARREST, BOOKED",800 Block of BRYANT ST,-122.403405,37.775421,"(37.775420706711, -122.403404791479)",12005827212120
1,120058272,WEAPON LAWS,"FIREARM, LOADED, IN VEHICLE, POSSESSION OR USE",Friday,01/29/2016 12:00:00 AM,11:00,SOUTHERN,"ARREST, BOOKED",800 Block of BRYANT ST,-122.403405,37.775421,"(37.775420706711, -122.403404791479)",12005827212168
2,141059263,WARRANTS,WARRANT ARREST,Monday,04/25/2016 12:00:00 AM,14:59,BAYVIEW,"ARREST, BOOKED",KEITH ST / SHAFTER AV,-122.388856,37.729981,"(37.7299809672996, -122.388856204292)",14105926363010
3,160013662,NON-CRIMINAL,LOST PROPERTY,Tuesday,01/05/2016 12:00:00 AM,23:50,TENDERLOIN,NONE,JONES ST / OFARRELL ST,-122.412971,37.785788,"(37.7857883766888, -122.412970537591)",16001366271000
4,160002740,NON-CRIMINAL,LOST PROPERTY,Friday,01/01/2016 12:00:00 AM,00:30,MISSION,NONE,16TH ST / MISSION ST,-122.419672,37.765050,"(37.7650501214668, -122.419671780296)",16000274071000
...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,160014858,OTHER OFFENSES,"FRAUDULENT GAME OR TRICK, OBTAINING MONEY OR P...",Wednesday,01/06/2016 12:00:00 AM,06:00,TARAVAL,NONE,2000 Block of 29TH AV,-122.486926,37.749084,"(37.7490841729028, -122.486925960114)",16001485809024
96,160015163,NON-CRIMINAL,AIDED CASE,Wednesday,01/06/2016 12:00:00 AM,16:09,MISSION,NONE,14TH ST / FOLSOM ST,-122.415616,37.768536,"(37.7685360123583, -122.41561633832)",16001516351040
97,160015276,BURGLARY,"BURGLARY, UNLAWFUL ENTRY",Tuesday,01/05/2016 12:00:00 AM,20:00,PARK,NONE,1000 Block of COLE ST,-122.449752,37.764430,"(37.7644297714074, -122.449751652563)",16001527605073
98,160015276,LARCENY/THEFT,GRAND THEFT FROM UNLOCKED AUTO,Tuesday,01/05/2016 12:00:00 AM,20:00,PARK,NONE,1000 Block of COLE ST,-122.449752,37.764430,"(37.7644297714074, -122.449751652563)",16001527606224


In [16]:
# Latitud y Longitud de San Francisco

latitude = 37.77
longitude = -122.42

In [17]:
# Inicializa el mapa ubicado en San Francisco
sf_map = folium.Map(location = [latitude, longitude], zoom_start = 12)

# Muestra el mapa
sf_map

### folium.CircleMarker()

Ahora **superpongamos** las ubicaciones de los crímenes en el mapa. La forma de hacerlo en **`folium`** es crear un **`FeatureGroup()`** con sus propias características y estilos y luego agregarlo al mapa.

In [18]:
# Inicializamos un FeatureGroup() para los incidentes en el DataFrame
incidents = folium.map.FeatureGroup()

# Recorre los 100 crímenes y agrega a cada uno al FeatureGroup() de incidentes
# la columna Y y X son las coordenadas, latitud y longitud respectivamente

for lat, lng in zip(df_incidents["Y"], df_incidents["X"]): 
    
    incidents.add_child(folium.CircleMarker(location     = [lat, lng],
                                            radius       = 9,
                                            color        = "red",
                                            fill         = True,
                                            fill_color   = "yellow",
                                            fill_opacity = 0.6))


# Agrega incidentes al mapa
sf_map.add_child(incidents)

sf_map

### folium.Marker()

In [19]:
# Volvemos a inicializar el mapa
sf_map = folium.Map(location = [latitude, longitude], zoom_start = 12)

# Inicializamos un FeatureGroup() para los incidentes en el DataFrame
incidents = folium.map.FeatureGroup()

# Recorre los 100 crímenes y agrega a cada uno al FeatureGroup() de incidentes
# La columna Y y X son las coordenadas, latitud y longitud respectivamente
# La columna "Category" es el tipo de incidente.

for lat, lng, label in zip(df_incidents["Y"], df_incidents["X"], df_incidents["Category"]):
    
    incidents.add_child(folium.Marker(location = [lat, lng],
                                      popup    = label))
    
# Agrega incidentes al map
sf_map.add_child(incidents)

sf_map

### Nube de marcadores

**`folium.plugins.MarkerCluster()`** 

In [20]:
from folium import plugins

# Volvemos a inicializar el mapa
sf_map = folium.Map(location = [latitude, longitude], zoom_start = 12)

# Creamos una instancia de un objeto de cluster (MarkerCluster())
# de marca para los incidentes en el marco de datos

incidents = plugins.MarkerCluster()

# Recorre los 100 crímenes y agrega a cada uno al FeatureGroup() de incidentes
# La columna Y y X son las coordenadas, latitud y longitud respectivamente
# La columna "Category" es el tipo de incidente.

for lat, lng, label, in zip(df_incidents["Y"], df_incidents["X"], df_incidents["Category"]):
    
    incidents.add_child(folium.Marker(location = [lat, lng],
                                      icon     = folium.Icon(icon           = "fa-birthday-cake",
                                                             icon_color     = "white",
                                                             color          = "green",
                                                             prefix         = "fa"),
                                      popup    = label))

    
# Agrega incidentes al map
sf_map.add_child(incidents)

sf_map


# Información de Iconos: https://www.adaweb.es/iconos-font-awesome-css-content-values/

## Choropleth Maps

Un mapa **`Choropleth`** es un mapa temático en el que las áreas están sombreadas o modeladas en proporción a la medición de la variable estadística que se muestra en el mapa, como la densidad de población o el ingreso per cápita. El **`Choropleth`** map proporciona una manera fácil de visualizar cómo varía una medición en un área geográfica o muestra el nivel de variabilidad dentro de una región.

Ahora, creemos nuestro propio mapa **`Choropleth`** del mundo que represente la inmigración de varios países a Canada.

In [21]:
canada = pd.read_excel(io = "https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Canada.xlsx",
                       sheet_name = "Canada by Citizenship",
                       skiprows = range(20),
                       skipfooter = 2)

canada.head(3)

Unnamed: 0,Type,Coverage,OdName,AREA,AreaName,REG,RegName,DEV,DevName,1980,...,2004,2005,2006,2007,2008,2009,2010,2011,2012,2013
0,Immigrants,Foreigners,Afghanistan,935,Asia,5501,Southern Asia,902,Developing regions,16,...,2978,3436,3009,2652,2111,1746,1758,2203,2635,2004
1,Immigrants,Foreigners,Albania,908,Europe,925,Southern Europe,901,Developed regions,1,...,1450,1223,856,702,560,716,561,539,620,603
2,Immigrants,Foreigners,Algeria,903,Africa,912,Northern Africa,902,Developing regions,80,...,3616,3626,4807,3623,4005,5393,4752,4325,3774,4331


In [22]:
canada.shape

(195, 43)

In [23]:
canada

Unnamed: 0,Type,Coverage,OdName,AREA,AreaName,REG,RegName,DEV,DevName,1980,...,2004,2005,2006,2007,2008,2009,2010,2011,2012,2013
0,Immigrants,Foreigners,Afghanistan,935,Asia,5501,Southern Asia,902,Developing regions,16,...,2978,3436,3009,2652,2111,1746,1758,2203,2635,2004
1,Immigrants,Foreigners,Albania,908,Europe,925,Southern Europe,901,Developed regions,1,...,1450,1223,856,702,560,716,561,539,620,603
2,Immigrants,Foreigners,Algeria,903,Africa,912,Northern Africa,902,Developing regions,80,...,3616,3626,4807,3623,4005,5393,4752,4325,3774,4331
3,Immigrants,Foreigners,American Samoa,909,Oceania,957,Polynesia,902,Developing regions,0,...,0,0,1,0,0,0,0,0,0,0
4,Immigrants,Foreigners,Andorra,908,Europe,925,Southern Europe,901,Developed regions,0,...,0,0,1,1,0,0,0,0,1,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
190,Immigrants,Foreigners,Viet Nam,935,Asia,920,South-Eastern Asia,902,Developing regions,1191,...,1816,1852,3153,2574,1784,2171,1942,1723,1731,2112
191,Immigrants,Foreigners,Western Sahara,903,Africa,912,Northern Africa,902,Developing regions,0,...,0,0,1,0,0,0,0,0,0,0
192,Immigrants,Foreigners,Yemen,935,Asia,922,Western Asia,902,Developing regions,1,...,124,161,140,122,133,128,211,160,174,217
193,Immigrants,Foreigners,Zambia,903,Africa,910,Eastern Africa,902,Developing regions,11,...,56,91,77,71,64,60,102,69,46,59


In [24]:
# Limpiamos el Dataframe para remover columnas no necesarias: 
canada.drop(["AREA", "REG", "DEV", "Type", "Coverage"], axis = 1, inplace = True)

# Cambiamos el nombre a las columnas para que tengan más sentido

canada.rename(columns = {"OdName" : "Country",
                         "AreaName" : "Continent",
                         "RegName" : "Region"}, inplace = True)

# Para tener consistencia, cambiamos todas las etiquetas de columnas a tipo string
canada.columns = list(map(str, canada.columns))

# Agregamos la columna total 
canada["Total"] = canada[[str(x) for x in range(1980, 2014)]].sum(axis = 1)

years = list(map(str, range(1980, 2014)))

canada.shape

(195, 39)

In [25]:
canada.head(3)

Unnamed: 0,Country,Continent,Region,DevName,1980,1981,1982,1983,1984,1985,...,2005,2006,2007,2008,2009,2010,2011,2012,2013,Total
0,Afghanistan,Asia,Southern Asia,Developing regions,16,39,39,47,71,340,...,3436,3009,2652,2111,1746,1758,2203,2635,2004,58639
1,Albania,Europe,Southern Europe,Developed regions,1,0,0,0,0,0,...,1223,856,702,560,716,561,539,620,603,15699
2,Algeria,Africa,Northern Africa,Developing regions,80,67,71,69,63,44,...,3626,4807,3623,4005,5393,4752,4325,3774,4331,69439


Para crear un mapa **`Choropleth`**, necesitamos un archivo **`GeoJSON`** que defina las áreas / límites del estado, condado o país en el que estamos interesados. En nuestro caso, dado que estamos tratando de crear un mapa mundial, quiere un **`GeoJSON`** que defina los límites de todos los países del mundo. Vamos a llamarlo **`world_countries.json`**

Ahora que tenemos el archivo **`GeoJSON`**, creemos un mapa mundial, centrado alrededor de los valores **[0, 0]** latitud y longitud, con un nivel de zoom inicial de 2.

In [26]:
world_geo = "../Data/world_countries.json" # Archivo GeoJSON

# Crea un mapa mundial 
world_map = folium.Map(location = [0, 0], zoom_start = 2)

world_map

Y ahora para crear un mapa **`Choropleth`**, utilizaremos la función **`folium.Choropleth()`** con los siguientes parámetros principales:

1. **`geo_data`**, que es el archivo **`GeoJSON`**.


2. **`data`**, que es el **`DataFrame`** que contiene los datos.


3. **`columns`**, que representan las columnas en el **`DataFrame`** que se utilizarán para crear el mapa **`Choropleth`**.


4. **`key_on`**, que es la clave o variable en el archivo **`GeoJSON`** que contiene el nombre de la variable de interés. Para determinar eso, deberá abrir el archivo **`GeoJSON`** utilizando cualquier editor de texto y anotar el nombre de la clave o variable que contiene el nombre de los países, ya que los países son nuestra variable de interés. En este caso, name es la clave en el archivo **`GeoJSON`** que contiene el nombre de los países. Tenga en cuenta que esta clave es sensible a mayúsculas y minúsculas, por lo que debe pasar exactamente como existe en el archivo **`GeoJSON`**.

In [27]:
folium.Choropleth(geo_data = world_geo,
                  data     = canada,
                  columns  = ["Country", "Total"],
                  key_on   = "feature.properties.name").add_to(world_map)

world_map

In [28]:
world_map = folium.Map(location = [0, 0], zoom_start = 2)

folium.Choropleth(geo_data     = "../Data/world_countries.json",
                  data         = canada,
                  columns      = ["Country", "Total"],
                  key_on       = "feature.properties.name",
                  fill_color   = "Blues_r", 
                  fill_opacity = 0.7, 
                  line_opacity = 0.2,
                  legend_name  = "Immigration to Canada").add_to(world_map)

world_map

In [29]:
world_map.save("mapa_choropleth.html")

In [30]:
################################################################################################################################

In [31]:
canada["Country"].replace("Venezuela (Bolivarian Republic of)", "Venezuela", inplace = True)

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  canada["Country"].replace("Venezuela (Bolivarian Republic of)", "Venezuela", inplace = True)


In [32]:
paises_df = canada["Country"].to_list()

In [33]:
import json

with open("../Data/world_countries.json", mode = "r") as file:
    
    datos = json.load(file)

In [34]:
paises_json = [x["properties"]["name"] for x in datos["features"]]

In [35]:
coincidencias = list()
no_coincidencias = list()

for pais in paises_df:
    
    if pais in paises_json:
        
        coincidencias.append(pais)

    else:
        
        no_coincidencias.append(pais)


In [36]:
canada[canada["Country"] == "American Samoa"]

Unnamed: 0,Country,Continent,Region,DevName,1980,1981,1982,1983,1984,1985,...,2005,2006,2007,2008,2009,2010,2011,2012,2013,Total
3,American Samoa,Oceania,Polynesia,Developing regions,0,1,0,0,0,0,...,0,1,0,0,0,0,0,0,0,6


In [37]:
paises_json

['Afghanistan',
 'Angola',
 'Albania',
 'United Arab Emirates',
 'Argentina',
 'Armenia',
 'Antarctica',
 'French Southern and Antarctic Lands',
 'Australia',
 'Austria',
 'Azerbaijan',
 'Burundi',
 'Belgium',
 'Benin',
 'Burkina Faso',
 'Bangladesh',
 'Bulgaria',
 'The Bahamas',
 'Bosnia and Herzegovina',
 'Belarus',
 'Belize',
 'Bolivia',
 'Brazil',
 'Brunei',
 'Bhutan',
 'Botswana',
 'Central African Republic',
 'Canada',
 'Switzerland',
 'Chile',
 'China',
 'Ivory Coast',
 'Cameroon',
 'Democratic Republic of the Congo',
 'Republic of the Congo',
 'Colombia',
 'Costa Rica',
 'Cuba',
 'Northern Cyprus',
 'Cyprus',
 'Czech Republic',
 'Germany',
 'Djibouti',
 'Denmark',
 'Dominican Republic',
 'Algeria',
 'Ecuador',
 'Egypt',
 'Eritrea',
 'Spain',
 'Estonia',
 'Ethiopia',
 'Finland',
 'Fiji',
 'Falkland Islands',
 'France',
 'Gabon',
 'United Kingdom of Great Britain and Northern Ireland',
 'Georgia',
 'Ghana',
 'Guinea',
 'Gambia',
 'Guinea Bissau',
 'Equatorial Guinea',
 'Greece',


In [38]:
no_coincidencias

['American Samoa',
 'Andorra',
 'Antigua and Barbuda',
 'Bahamas',
 'Bahrain',
 'Barbados',
 'Bolivia (Plurinational State of)',
 'Brunei Darussalam',
 'Cabo Verde',
 'China, Hong Kong Special Administrative Region',
 'China, Macao Special Administrative Region',
 'Comoros',
 'Congo',
 "Côte d'Ivoire",
 "Democratic People's Republic of Korea",
 'Dominica',
 'Grenada',
 'Guinea-Bissau',
 'Iran (Islamic Republic of)',
 'Kiribati',
 "Lao People's Democratic Republic",
 'Liechtenstein',
 'Maldives',
 'Malta',
 'Marshall Islands',
 'Mauritius',
 'Monaco',
 'Nauru',
 'Palau',
 'Republic of Korea',
 'Republic of Moldova',
 'Russian Federation',
 'Saint Kitts and Nevis',
 'Saint Lucia',
 'Saint Vincent and the Grenadines',
 'Samoa',
 'San Marino',
 'Sao Tome and Principe',
 'Serbia',
 'Seychelles',
 'Singapore',
 'State of Palestine',
 'Syrian Arab Republic',
 'The former Yugoslav Republic of Macedonia',
 'Tonga',
 'Tuvalu',
 'Viet Nam']