## Parte 1:
Primero instalaremos la biblioteca folium y leemos el archivo con pandas. Tal y como se pide replicar en el archivo original, creamos una columna llamada "dpt_code" y "prov_code" (en base a data ya existente) , para luego filtrar los datos solo para mujeres. Después de ello convertimos columna month en formato de número y ordenamos nuestra df por departamento y mes. 

In [1]:
import folium
import pandas as pd
import geopandas as gpd
import matplotlib.pyplot as plt
from folium import plugins
import mplleaflet
import branca.colormap as cm
from folium.plugins import MiniMap
from branca.colormap import LinearColormap

In [2]:
sex_work = pd.read_stata('C:/Users/nando/OneDrive/Documentos/GitHub/QLAB_Summer_Python/_data/8_trab_sex_20.dta')

sex_work['dpt_code'] = sex_work.cod_ubigeo.str[:2].copy()
sex_work['prov_code'] = sex_work.cod_ubigeo.str[:4].copy()
women_work = sex_work[sex_work.sex == 'Mujer'].copy().reset_index(drop=True)
women_work['month'] = pd.to_datetime(women_work.month, format='%B').dt.strftime('%m').astype(int)
women_work.sort_values(['dpt_code', 'month'], inplace=True)

Obtenemos también el número total de mujeres empleadas por departamento y mes

In [3]:
dpt_women_work = women_work.groupby(['dpt_code', 'month'], as_index=False)[['empl']].sum().rename(columns={'empl': 'women_empl'})
dpt_women_work

Unnamed: 0,dpt_code,month,women_empl
0,01,1,2043
1,01,2,2059
2,01,3,2056
3,01,4,1811
4,01,5,1642
...,...,...,...
295,25,8,7425
296,25,9,7549
297,25,10,7751
298,25,11,7933


In [4]:
#Ordenamos con "sort"
dpt_women_work.sort_values(['dpt_code', 'month'], inplace=True)

Obtenemos la media del empleo de las mujeres por departamento

In [5]:
df2 = dpt_women_work.groupby(['dpt_code'], as_index=False)[['women_empl']].mean()
df2

Unnamed: 0,dpt_code,women_empl
0,1,1947.75
1,2,18277.0
2,3,3077.666667
3,4,57583.583333
4,5,3976.75
5,6,9634.333333
6,7,40806.416667
7,8,19503.666667
8,9,675.333333
9,10,6222.75


## Vamos a crear el shapefile, para ello ya debimos haber descargado con anterioridad los archivos shapefile

Lo primero que haremos será cargar los datos geoespaciales para los departamentos, al comienzo seguiremos el procedimiento original del código de la tarea

In [None]:
dpt_shp = gpd.read_file('C:/Users/nando/OneDrive/Documentos/GitHub/QLAB_Summer_Python/_data/INEI_LIMITE_DEPARTAMENTAL/INEI_LIMITE_DEPARTAMENTAL.shp')

Ahora realizamos el merge con el df2 que habíamos definido anteriormente

In [None]:
df3 = dpt_shp.merge(df2, left_on='CCDD', right_on='dpt_code')
# Creamos el mapa con folium
peru_map = folium.Map(location=[-9.1900, -75.0152], zoom_start=6)

Tenmos que añadir el GeoDataframe al mapa que tenemos, luego el layer control (el cual nos permite controlar qué capas están visibles en nuestro mapa interactivo)

In [None]:
folium.GeoJson(df3,
               name='geojson',
               style_function=lambda x: {'fillColor': 'red', 'color': 'black', 'weight': 2, 'dashArray': '5, 5'},
               highlight_function=lambda x: {'weight': 3, 'color': 'blue'},
               tooltip=folium.features.GeoJsonTooltip(fields=['women_empl'],
                                                      aliases=['Women Employment'],
                                                      labels=True,
                                                      sticky=True)
               ).add_to(peru_map)

folium.LayerControl().add_to(peru_map)

Ahora convertimos el gráfico de matplotlib a un objeto folium usando plugins, guardamos el mapa interactivo e imprimimos

In [None]:
fig, ax = plt.subplots(figsize=(20, 20))
df3.plot(ax=ax, column='women_empl', cmap='Reds', linestyle='--', edgecolor='black', legend=True)

folium.plugins.MiniMap().add_to(peru_map)

peru_map.save('peru_map_combined.html')
peru_map

Para la nueva parte del df3 se vuelve a crear el mapa y traspasarlo al folium

In [None]:
# Creamos el mapa con folium
peru_map1 = folium.Map(location=[-9.1900, -75.0152], zoom_start=6)

folium.GeoJson(df3,
               name='geojson',
               style_function=lambda x: {'fillColor': 'red', 'color': 'black', 'weight': 2, 'dashArray': '5, 5'},
               highlight_function=lambda x: {'weight': 3, 'color': 'blue'},
               tooltip=folium.features.GeoJsonTooltip(fields=['women_empl'],
                                                      aliases=['Women Employment'],
                                                      labels=True,
                                                      sticky=True)
               ).add_to(peru_map1)

folium.LayerControl().add_to(peru_map1)

Finalmente se replica el formato de pandas y se transforma en tipo folium 

In [None]:
fig, ax = plt.subplots(figsize=(20, 20))
df3.plot( ax = ax, column='women_empl', cmap= 'Reds', figsize=(20, 20), linestyle='--', 
edgecolor='black', legend = True, scheme = "User_Defined", 
         classification_kwds = dict( bins = [ 20000, 40000, 60000, 100000  ] ), 
        legend_kwds = dict(  loc='upper left',
                            bbox_to_anchor=(1.01, 1),
                            fontsize='x-large',
                            title= "Number of Employers", 
                            title_fontsize = 'x-large', 
                            frameon= False )
        )
folium.plugins.MiniMap().add_to(peru_map1)

peru_map.save('peru_map1_combined.html')
peru_map1

Esto viene a ser otra forma de realizar el proceso. Pues para esto se se plantea como si el proceso fuese desde el inicio

In [None]:
import folium
from folium import Choropleth, GeoJson

# Filtro los datos para CCDD diferente de "15"
filtered_df = df3[df3['CCDD'] != "15"]

# Creo el mapa centrado en la ubicación media de tus datos
centroid_lat = filtered_df.to_crs(epsg='4326').geometry.centroid.y.mean()
centroid_lon = filtered_df.to_crs(epsg='4326').geometry.centroid.x.mean()
m = folium.Map(location=[centroid_lat, centroid_lon], zoom_start=6)
#se le asigna el nombre m al folium para no poner una palabra en cada momento que se menciona de diversas ocaciones

In [None]:
# Añado la capa de coropleta
Choropleth(
    geo_data=filtered_df,
    data=filtered_df,
    columns=['geometry', 'women_empl'],
    key_on='feature.properties.women_empl',
    fill_color='Reds',
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name='Number of Employers',
    line_color='black',
    line_dash='--',
    edgecolor='black',
    name='Women Employment',
).add_to(m)

# Añado el límite de las áreas geográficas
GeoJson(
    filtered_df,
    name='geojson',
    style_function=lambda x: {
        'color': 'black',
        'weight': 2,
        'dashArray': '5, 5',
    },
).add_to(m)

folium.LayerControl().add_to(m)

# Guardar el mapa
m.save('map_filtered.html')
m

# Parte 2

In [None]:
pip install folium branca matplotlib

In [None]:
df4 = sex_work.groupby(['dpt_code', 'month', 'sex'], as_index=False)[['empl']].sum() \
        .pivot(index=['dpt_code', 'month'], columns='sex', values='empl') \
        .reset_index()

In [None]:
df4

In [None]:
df4[ 'prop_wom' ] = ( df4.Mujer * 100 / df4.Hombre )

In [None]:
df5 = dpt_shp.merge( df4, left_on = 'CCDD', right_on = 'dpt_code'  )
# Creamos el mapa con folium
peru_map = folium.Map(location=[-9.1900, -75.0152], zoom_start=6)

In [None]:
folium.GeoJson(df5,
               name='geojson',
               style_function=lambda x: {'fillColor': 'red', 'color': 'black', 'weight': 2, 'dashArray': '5, 5'},
               highlight_function=lambda x: {'weight': 3, 'color': 'blue'},
               tooltip=folium.features.GeoJsonTooltip(fields=['women_empl'],
                                                      aliases=['Women Employment'],
                                                      labels=True,
                                                      sticky=True)
               ).add_to(peru_map)

folium.LayerControl().add_to(peru_map)

In [None]:
def create_folium_map(df_month, month):
    df_json = df_month.to_json()
    # Create the Map instance
    m = folium.Map(location=[-9.1900, -75.0152], zoom_start=6)
    colormap = linear.YlOrRd_09.scale(df_month['prop_wom'].min(), df_month['prop_wom'].max())
    folium.GeoJson(
        df_json,
        name=f'Women Employment - {month}',
        style_function=lambda feature: {
            'fillColor': colormap(feature['properties']['prop_wom']),
            'color': 'black',
            'weight': 2,
            'dashArray': '5, 5'
        }
    ).add_to(m)

    colormap.add_to(m)
    html_file = f"map_{month}.html"
    m.save(html_file)
    return html_file

# Crear subgráficos de Matplotlib
fig, axis = plt.subplots(nrows=4, ncols=3, figsize=(15, 15))

idx = 0
html_files = []  # Almacena nombres de archivos HTML

for i in range(4):
    for j in range(3):
        ax = axis[i, j]

        if idx < len(df5['month'].unique()):
            month = df5['month'].unique()[idx]
            df6 = df5[df5['month'] == month]

            html_file = create_folium_map(df6, month)
            html_files.append(html_file)  # Almacena nombres de archivos HTML

            ax.set_title(month)

        idx += 1

# Imprime los enlaces HTML
for file in html_files:
    print(file)

## Parte 3

In [3]:
from textwrap import wrap

In [None]:
# Inverting colour map
cmap = plt.cm.OrRd

Se repite uno de los procesos realizados en parte 1

In [None]:
# Creamos el mapa con folium
peru_map2 = folium.Map(location=[-9.1900, -75.0152], zoom_start=6)

folium.GeoJson(df6,
               name='geojson',
               style_function=lambda x: {'fillColor': 'red', 'color': 'black', 'weight': 2, 'dashArray': '5, 5'},
               highlight_function=lambda x: {'weight': 3, 'color': 'blue'},
               tooltip=folium.features.GeoJsonTooltip(fields=['women_empl'],
                                                      aliases=['Women Employment'],
                                                      labels=True,
                                                      sticky=True)
               ).add_to(peru_map1)

folium.LayerControl().add_to(peru_map1)

Finalmente se utiliza una forma de resolver esta parte 

In [None]:
fig, ax = plt.subplots(figsize=(20, 20))
df6.plot( ax = ax, 
        column='prop_wom', 
         cmap= cmap, 
         figsize=(20, 20), 
         linestyle='--',
         edgecolor='black', 
         legend = True,  
         scheme = "User_Defined", 
         classification_kwds = dict( bins = [ 20, 30, 40, 50,  100 ] ), 
         legend_kwds=dict(  loc='upper left',
                            bbox_to_anchor=(1.01, 1),
                            fontsize='x-large',
                            title= "Women Proportion", 
                            title_fontsize = 'x-large', 
                            frameon= False )
        )
folium.plugins.MiniMap().add_to(peru_map2)

peru_map.save('peru_map2_combined.html')
peru_map2