In [1]:
import pandas as pd
import plotly.express as px

In [2]:
imss = pd.read_csv('tidy/tidy_imss.csv')
imss.head()

Unnamed: 0,rango_salarial,asegurados,no_trabajadores,año,mes,fecha,municipio,sector_economico_2,sector_economico_4,tamaño_patronal,sexo,rango_edad,rango_salarial_descripcion
0,W2,6,0,2006,1,2006-01-01,SAN LUIS RÍO COLORADO,Agricultura,Agricultura,Con un puesto de trabajo,Hombre,Mayor o igual a 55 y menor a 60 años de edad,mayor a 1 y hasta 2 veces el salario mínimo
1,W2,6,0,2006,1,2006-01-01,SAN LUIS RÍO COLORADO,Agricultura,Agricultura,Con un puesto de trabajo,Hombre,Mayor o igual a 60 y menor a 65 años de edad,mayor a 1 y hasta 2 veces el salario mínimo
2,W2,3,0,2006,1,2006-01-01,SAN LUIS RÍO COLORADO,Agricultura,Agricultura,Con un puesto de trabajo,Hombre,Mayor o igual a 70 y menor a 75 años de edad,mayor a 1 y hasta 2 veces el salario mínimo
3,W2,6,0,2006,1,2006-01-01,SAN LUIS RÍO COLORADO,Agricultura,Agricultura,Con un puesto de trabajo,Hombre,Mayor o igual a 30 y menor a 35 años de edad,mayor a 1 y hasta 2 veces el salario mínimo
4,W2,5,0,2006,1,2006-01-01,SAN LUIS RÍO COLORADO,Agricultura,Agricultura,Con un puesto de trabajo,Hombre,Mayor o igual a 35 y menor a 40 años de edad,mayor a 1 y hasta 2 veces el salario mínimo


In [4]:
# Grafica de lineas que explica la generacion de empleos para cada sector economico dependiendo el rango de edad a traves del tiempo
empleos = imss[['fecha', 'rango_edad', 'sector_economico_2', 'asegurados']].groupby(['fecha', 'rango_edad', 'sector_economico_2']).sum().reset_index()
empleos.tail()

Unnamed: 0,fecha,rango_edad,sector_economico_2,asegurados
8227,2022-12-01,Mayor o igual a 65 y menor a 70 años de edad,Ganadería,201
8228,2022-12-01,Mayor o igual a 65 y menor a 70 años de edad,Pesca,83
8229,2022-12-01,Mayor o igual a 70 y menor a 75 años de edad,Agricultura,290
8230,2022-12-01,Mayor o igual a 70 y menor a 75 años de edad,Ganadería,65
8231,2022-12-01,Mayor o igual a 70 y menor a 75 años de edad,Pesca,25


In [5]:
# Definir el mapeo de reetiquetado
mapeo = {'Mayor o igual a 15 y menor a 20 años de edad': 'Mayor o igual a 15 y menor a 25 años de edad',
         'Mayor o igual a 20 y menor a 25 años de edad': 'Mayor o igual a 15 y menor a 25 años de edad',
         'Mayor o igual a 25 y menor a 30 años de edad': 'Mayor o igual a 25 y menor a 45 años de edad',
         'Mayor o igual a 30 y menor a 35 años de edad': 'Mayor o igual a 25 y menor a 45 años de edad',
         'Mayor o igual a 35 y menor a 40 años de edad': 'Mayor o igual a 25 y menor a 45 años de edad',
         'Mayor o igual a 40 y menor a 45 años de edad': 'Mayor o igual a 25 y menor a 45 años de edad',
         'Mayor o igual a 45 y menor a 50 años de edad': 'Mayor o igual a 45 y menor a 65 años de edad',
         'Mayor o igual a 50 y menor a 55 años de edad': 'Mayor o igual a 45 y menor a 65 años de edad',
         'Mayor o igual a 55 y menor a 60 años de edad': 'Mayor o igual a 45 y menor a 65 años de edad',
         'Mayor o igual a 60 y menor a 65 años de edad': 'Mayor o igual a 45 y menor a 65 años de edad',
         'Mayor o igual a 65 y menor a 70 años de edad': 'Mayor o igual a 65 años de edad',
         'Mayor o igual a 70 y menor a 75 años de edad': 'Mayor o igual a 65 años de edad',
         '75 o más años de edad': 'Mayor o igual a 65 años de edad'}

# Reetiquetar la columna 'rango_edad'
empleos['rango_edad'] = empleos['rango_edad'].replace(mapeo)

In [6]:
empleos = empleos.groupby(['fecha', 'rango_edad', 'sector_economico_2']).sum().reset_index()
empleos.tail()

Unnamed: 0,fecha,rango_edad,sector_economico_2,asegurados
2746,2022-12-01,Mayor o igual a 45 y menor a 65 años de edad,Ganadería,4931
2747,2022-12-01,Mayor o igual a 45 y menor a 65 años de edad,Pesca,1921
2748,2022-12-01,Mayor o igual a 65 años de edad,Agricultura,1140
2749,2022-12-01,Mayor o igual a 65 años de edad,Ganadería,298
2750,2022-12-01,Mayor o igual a 65 años de edad,Pesca,121


In [7]:
# Grafica de lineas para cada sector economico dependiendo la edad a traves del tiempo
fig = px.line(empleos, x='fecha', y='asegurados', color='rango_edad', facet_col='sector_economico_2', facet_col_wrap=1, title='Asegurados por sector económico y rango de edad')
fig.update_yaxes(matches=None)
fig.show()

In [11]:
agp = pd.read_csv('tidy/tidy_agricultura_ganaderia_pesca.csv')
agp.head()

Unnamed: 0,ANO,SECTOR,CVE_DDR,CVE_MUN,ESPECIE_CULTIVO,TIPO,PRODTON,VALPROD
0,2006-01-01,Agricultura,142,1,Ajo,Hortalizas,156.0,1560.0
1,2006-01-01,Agricultura,142,1,Avena forrajera en verde,Plantas forrajeras,925.0,323.75
2,2006-01-01,Agricultura,142,1,Cebada forrajera en verde,Plantas forrajeras,4760.0,1666.0
3,2006-01-01,Agricultura,142,1,Rye grass en verde,Plantas forrajeras,3705.0,1482.0
4,2006-01-01,Agricultura,141,2,Avena forrajera en verde,Plantas forrajeras,1000.0,750.0


In [12]:
# Agrupamos valores de fecha para sumar el valor producido por sector economico
agp_anual = agp[['ANO', 'SECTOR', 'PRODTON', 'VALPROD']].groupby(['ANO', 'SECTOR']).sum().reset_index()

In [13]:
# Graficamos el valor producido por sector economico a traves del tiempo
fig = px.line(agp_anual, x='ANO', y='VALPROD', color='SECTOR', title='Valor producido por sector económico')
fig.show()

In [14]:
# Graficamos el valor producido por sector economico a traves del tiempo
fig = px.line(agp_anual, x='ANO', y='PRODTON', color='SECTOR', title='Valor producido por sector económico', facet_col='SECTOR', facet_col_wrap=1)
fig.update_yaxes(matches=None)
fig.show()

In [15]:
municipios = pd.read_csv('data/MUNICIPIO.csv')

In [16]:
municipios = municipios[municipios['CLAVE_ENTIDAD'] == '26']
municipios = municipios.drop('CLAVE_ENTIDAD', axis = 1)
municipios.head()

Unnamed: 0,CLAVE_MUNICIPIO,MUNICIPIO
1922,1,ACONCHI
1923,2,AGUA PRIETA
1924,3,ALAMOS
1925,4,ALTAR
1926,5,ARIVECHI


In [17]:
# Cambiamos las claves por los nombres de los municipios
agp_municipios = pd.merge(agp, municipios, left_on= 'CVE_MUN', right_on= 'CLAVE_MUNICIPIO', how= 'left')

In [18]:
agp_municipios.head()

Unnamed: 0,ANO,SECTOR,CVE_DDR,CVE_MUN,ESPECIE_CULTIVO,TIPO,PRODTON,VALPROD,CLAVE_MUNICIPIO,MUNICIPIO
0,2006-01-01,Agricultura,142,1,Ajo,Hortalizas,156.0,1560.0,1,ACONCHI
1,2006-01-01,Agricultura,142,1,Avena forrajera en verde,Plantas forrajeras,925.0,323.75,1,ACONCHI
2,2006-01-01,Agricultura,142,1,Cebada forrajera en verde,Plantas forrajeras,4760.0,1666.0,1,ACONCHI
3,2006-01-01,Agricultura,142,1,Rye grass en verde,Plantas forrajeras,3705.0,1482.0,1,ACONCHI
4,2006-01-01,Agricultura,141,2,Avena forrajera en verde,Plantas forrajeras,1000.0,750.0,2,AGUA PRIETA


In [19]:
agp_municipios.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 27844 entries, 0 to 27843
Data columns (total 10 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   ANO              27844 non-null  object 
 1   SECTOR           27844 non-null  object 
 2   CVE_DDR          27844 non-null  int64  
 3   CVE_MUN          27844 non-null  int64  
 4   ESPECIE_CULTIVO  27844 non-null  object 
 5   TIPO             27844 non-null  object 
 6   PRODTON          27844 non-null  float64
 7   VALPROD          27844 non-null  float64
 8   CLAVE_MUNICIPIO  27844 non-null  int64  
 9   MUNICIPIO        27844 non-null  object 
dtypes: float64(2), int64(3), object(5)
memory usage: 2.3+ MB


In [20]:
# Agrupamos por municipios para ver cuales son los de mayor produccion
agp_municipios = agp_municipios[['MUNICIPIO', 'SECTOR', 'PRODTON', 'VALPROD']].groupby(['MUNICIPIO', 'SECTOR']).sum().reset_index()

In [21]:
# Graficamos de forma ordenada los municipios con mayor produccion y su sector economico
fig = px.bar(agp_municipios, x='MUNICIPIO', y='VALPROD', color='SECTOR', title='Valor producido por sector económico', facet_col='SECTOR', facet_col_wrap=5)
fig.update_xaxes(categoryorder='total descending')

# Mostrar la figura
fig.show()

In [22]:
agp_municipios.tail()

Unnamed: 0,MUNICIPIO,SECTOR,PRODTON,VALPROD
147,VILLA HIDALGO,Ganadería,11196.679,626659.8
148,VILLA PESQUEIRA,Agricultura,146369.68,75738.52
149,VILLA PESQUEIRA,Ganadería,44947.811,897753.3
150,YÉCORA,Agricultura,57044.83,280380.4
151,YÉCORA,Ganadería,19503.561,1037908.0
