# Análisis Geoespacial con Geopandas

¿Alguna vez te has preguntadoo cómo se hacen las gráficas que muestran variables de datos plasmadas en un mapa geográfico? Estas visualizaciones se utilizan comunmente para expresar datos de cambios globales en salud, población, educación, cultura, violencia, poder político, tecnoligía, entre otros. Estas visualizacioens nos ayudan a entender fácilmente cómo y por qué el mundo ha cambiado a través del tiempo. Para mí, los mapas con datos fueron lo primero del campo del análisis de datos que cautivó mi atención.

Una de las visualizaciones con mapas más útiles que podemos hacer es un mapa de calor. En un mapa de calor, se muestran territorios geográficos coloreados por alguna variable de interés. Los terriotorios pueden ser continentes, países, estados, colonias y hasta manzanas. 

Vamos a crear un mapa de calor de obesidad en adultos de 1975 a 2016.

## Datos
Descarga el shapefile de países [aquí](https://www.naturalearthdata.com/http//www.naturalearthdata.com/download/110m/cultural/ne_110m_admin_0_countries.zip)

Posteriormente, en [Our World in Data](https://ourworldindata.org/obesity) se encuentran los datos de obesisdad en todos los países del año 1975 al 2016.

## Instala geopandas

~~~~bash
pip3 install --user geopandas
~~~~

o

~~~~bash
pip install --user geopandas
~~~~

o

~~~~bash
python -m pip install --user pandas
~~~~

In [None]:
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="darkgrid")
plt.rcParams['figure.figsize'] = [10, 10]

In [None]:
shapefile = 'datos/ne_110m_admin_0_countries/ne_110m_admin_0_countries.shp'

In [None]:
gdf = gpd.read_file(shapefile)

In [None]:
gdf.shape

In [None]:
gdf.head()

Leamos únicamente unas cuantas columnas

In [None]:
gdf = gpd.read_file(shapefile)[['ADMIN', 'ADM0_A3', 'geometry']]
gdf.head()

In [None]:
gdf.rename(columns={'ADMIN':'country', 'ADM0_A3':'code'}, inplace=True)

In [None]:
gdf.head()

In [None]:
gdf[gdf.code=='MEX']

In [None]:
gdf[gdf.country=='Antarctica']

In [None]:
gdf.loc[159]

In [None]:
gdf.drop(159, inplace=True)

In [None]:
gdf[gdf.country=='Antarctica']

In [None]:
gdf.plot()

Ahora imporemos el csv de obesidad

In [None]:
obesity_data = 'datos/share-of-adults-defined-as-obese.csv'

In [None]:
df = pd.read_csv(obesity_data)

In [None]:
df.head()

In [None]:
df[df.Code=='MEX'].tail()

Limpiar columnas

In [None]:
df.columns = ['country', 'code', 'year', 'share_adults_obese']

In [None]:
df.head()

Otra forma de leer los datos y asignar el nombre de las columnas que nosotros queramos

In [None]:
#df = pd.read_csv(obesity_data, names = ['entity', 'code', 'year', 'share_adults_obese'], skiprows = 1)

In [None]:
df.info()

In [None]:
df[df.code.isna()]

In [None]:
len(df.code.isna())

In [None]:
df = df.dropna()

In [None]:
df.info()

In [None]:
df.drop(['country'], axis=1, inplace=True)

In [None]:
gdf = gdf.merge(df)

In [None]:
gdf.head()

In [None]:
gdf[gdf.year == 1990].plot(column='share_adults_obese')

In [None]:
data_1980 = gdf[gdf.year == 1980]
data_1990 = gdf[gdf.year == 1990]
data_2000 = gdf[gdf.year == 2000]
data_2010 = gdf[gdf.year == 2010]

In [None]:
fig, ax = plt.subplots(nrows=2,ncols=2, sharex=True, sharey=True)
data_1980.plot(ax=ax[0][0], column='share_adults_obese', legend=True)
data_1990.plot(ax=ax[0][1], column='share_adults_obese', legend=True)
data_2000.plot(ax=ax[1][0], column='share_adults_obese', legend=True)
data_2010.plot(ax=ax[1][1], column='share_adults_obese', legend=True)

In [None]:
data_1980.plot(column='share_adults_obese', legend=True, cmap="Greens")

In [None]:
data_1990.plot(column='share_adults_obese', legend=True, cmap="Greens")

In [None]:
data_2000.plot(column='share_adults_obese', legend=True, cmap="Greens")

In [None]:
data_2000[data_2000.code == 'MEX'].head()

In [None]:
data_1990[data_1990.code == 'MEX'].head()

In [None]:
fig, ax = plt.subplots(nrows=3, sharex=True, sharey=True)
data_1990.plot(ax=ax[0], column='share_adults_obese', legend=True)
data_2000.plot(ax=ax[1], column='share_adults_obese', legend=True)
data_2010.plot(ax=ax[2], column='share_adults_obese', legend=True)

In [None]:
df[(df.code == 'MEX') & ((df.year == 2000) | (df.year == 2010)| (df.year == 1990))]