# **Mercado salarial**

In [10]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres, solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)
dfs_list = nombres_df

Lista de DataFrames creados:
['df_volumen_ms_parejas', 'df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_feb_2024_puebla', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financia

__________
# ***Volumen del mercado salarial de parejas***

## *PACHUCA*

In [17]:
# Crea los DataFrames para cada archivo con las columnas necesarias
pareja_df_salarios_pachuca = df_salarios_pachuca[['id_salarios','Volumen', 'Pareja','Categoria_Pareja']]

In [18]:
# Crea un diccionario para almacenar los DataFrames de cada categoría única
dataframes_por_categoria = {}

# Itera sobre los grupos creados por groupby()
for categoria, grupo in pareja_df_salarios_pachuca.groupby('Categoria_Pareja'):
    # Almacena el DataFrame del grupo en el diccionario
    dataframes_por_categoria[categoria] = grupo

# Itera sobre las claves del diccionario dataframes_por_categoria
for categoria in dataframes_por_categoria:
    # Imprime la categoría actual
    print("DataFrame para Categoria_Pareja '{}':".format(categoria))
    # Imprime el DataFrame correspondiente a la categoría actual
    print(dataframes_por_categoria[categoria])


DataFrame para Categoria_Pareja 'A':
     id_salarios     Volumen   Pareja Categoria_Pareja
330          331  62760000.0  50700.0                A
DataFrame para Categoria_Pareja 'A1':
     id_salarios     Volumen    Pareja Categoria_Pareja
331          332  7140000.00  57460.00               A1
332          333  7223929.11  58413.59               A1
DataFrame para Categoria_Pareja 'B':
     id_salarios    Volumen   Pareja Categoria_Pareja
329          330  5160000.0  43602.0                B
DataFrame para Categoria_Pareja 'C':
     id_salarios      Volumen    Pareja Categoria_Pareja
321          322  10512000.00  30420.00                C
322          323   8406999.99  30819.59                C
323          324  18620000.00  33800.00                C
DataFrame para Categoria_Pareja 'C1':
     id_salarios      Volumen    Pareja Categoria_Pareja
324          325  16963500.00  36335.00               C1
325          326  40704876.35  36436.04               C1
326          327  23070629.6

In [19]:
sumas_volumen_por_categoria = {}

# Itera sobre el diccionario de DataFrames
for categoria, df in dataframes_por_categoria.items():
    suma_volumen = df['Volumen'].sum() # Calcula la suma del volumen para cada DataFrame    
    sumas_volumen_por_categoria[categoria] = suma_volumen # Guarda la suma del volumen en el diccionario

# Convierte el diccionario de sumas en un DataFrame
df_sumas_volumen = pd.DataFrame.from_dict(sumas_volumen_por_categoria, orient='index', columns=['Suma_Volumen'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
df_sumas_volumen = df_sumas_volumen.reindex(nuevo_orden)
df_sumas_volumen['Suma_Volumen'] = df_sumas_volumen['Suma_Volumen'].fillna(0)

#pd.set_option('display.float_format', lambda x: '%.2f' % x) # Mostar números sin notación científica
pd.options.display.float_format = '{:,.2f}'.format # Mostrar comas como separadores de miles y dos decimales

print("DataFrame con las sumas del volumen por categoría:")
df_sumas_volumen

DataFrame con las sumas del volumen por categoría:


Unnamed: 0,Suma_Volumen
G,1917556675.26
F,4638065608.63
F1,4190311696.11
E,959079093.57
E1,458414693.48
D,198031067.0
D1,284112667.99
C,37538999.99
C1,118779396.7
B,5160000.0


In [20]:
df_volumen_ms_parejas = df_sumas_volumen[['Suma_Volumen']]
df_volumen_ms_parejas['Label'] = ['<5000 G','<5-8K F','8-12K F1','12-16K E','16-20K E1','20-25K D','25-30K D1','30-35K C','35-40K C1','40-45K B','45-50K B1','50-55K A','55-60K A1','60K S+']
df_volumen_ms_parejas

Unnamed: 0,Suma_Volumen,Label
G,1917556675.26,<5000 G
F,4638065608.63,<5-8K F
F1,4190311696.11,8-12K F1
E,959079093.57,12-16K E
E1,458414693.48,16-20K E1
D,198031067.0,20-25K D
D1,284112667.99,25-30K D1
C,37538999.99,30-35K C
C1,118779396.7,35-40K C1
B,5160000.0,40-45K B


In [23]:
pd.options.display.float_format = '{:,.2f}'.format # Mostrar comas como separadores de miles y dos decimales
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=df_volumen_ms_parejas['Label'],  # Eje x: Categoría
    y=df_volumen_ms_parejas['Suma_Volumen'],  # Eje y: Cantidad
    text=df_volumen_ms_parejas['Suma_Volumen'].apply(lambda x: '{:,.2f}'.format(x)),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Volumen del mercado salarial de parejas',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        #title='Total valor',  # Título del eje y
        tickvals=[1000000000, 2000000000, 3000000000, 4000000000, 5000000000],  # Posiciones de las líneas del eje y
        ticktext=['$1,000,000,000', '$2,000,000,000', '$3,000,000,000', '$4,000,000,000', '$5,000,000,000'],  # Etiquetas de las líneas del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_volmercadosalarial_XXparejas_pachuca', carpeta='graficas')

fig.show()


## *TULANCINGO*

In [31]:
dfs_list

['df_alfa_q_feb_2023_pachuca',
 'df_alfa_q_jul_2022_tulancingo',
 'df_alfa_q_jul_2023_pachuca',
 'df_alfa_q_jul_2023_tulancingo',
 'df_alfa_q_jun_2023_pachuca',
 'df_alfa_q_jun_2023_tulancingo',
 'df_alfa_q_mar_2023_pachuca',
 'df_alfa_q_mar_2023_tulancingo',
 'df_alfa_q_may_2022_tulancingo',
 'df_alfa_q_may_2023_tulancingo',
 'df_alfa_q_nov_2022_pachuca',
 'df_alfa_q_oct_2022_pachuca',
 'df_alfa_q_oct_2022_tulancingo',
 'df_alfa_q_oct_2023_tulancingo',
 'df_alfa_q_puebla',
 'df_alfa_q_sep_2023_pachuca',
 'df_alfa_q_sep_2023_tulancingo',
 'df_enero_2024_querertaro',
 'df_financiamientos_2019_pachuca',
 'df_financiamientos_2019_puebla',
 'df_financiamientos_2019_tulancingo',
 'df_financiamientos_2020_pachuca',
 'df_financiamientos_2020_puebla',
 'df_financiamientos_2020_tulancingo',
 'df_financiamientos_2021_pachuca',
 'df_financiamientos_2021_puebla',
 'df_financiamientos_2021_tulancingo',
 'df_financiamientos_2022_pachuca',
 'df_financiamientos_2022_puebla',
 'df_financiamientos_2022_

In [24]:
# Crea los DataFrames para cada archivo con las columnas necesarias
pareja_df_salarios_pachuca = df_salarios_pachuca[['id_salarios','Volumen', 'Pareja','Categoria_Pareja']]

In [25]:
# Crea un diccionario para almacenar los DataFrames de cada categoría única
dataframes_por_categoria = {}

# Itera sobre los grupos creados por groupby()
for categoria, grupo in pareja_df_salarios_pachuca.groupby('Categoria_Pareja'):
    # Almacena el DataFrame del grupo en el diccionario
    dataframes_por_categoria[categoria] = grupo

# Itera sobre las claves del diccionario dataframes_por_categoria
for categoria in dataframes_por_categoria:
    # Imprime la categoría actual
    print("DataFrame para Categoria_Pareja '{}':".format(categoria))
    # Imprime el DataFrame correspondiente a la categoría actual
    print(dataframes_por_categoria[categoria])


DataFrame para Categoria_Pareja 'A':
     id_salarios       Volumen    Pareja Categoria_Pareja
330          331 62,760,000.00 50,700.00                A
DataFrame para Categoria_Pareja 'A1':
     id_salarios      Volumen    Pareja Categoria_Pareja
331          332 7,140,000.00 57,460.00               A1
332          333 7,223,929.11 58,413.59               A1
DataFrame para Categoria_Pareja 'B':
     id_salarios      Volumen    Pareja Categoria_Pareja
329          330 5,160,000.00 43,602.00                B
DataFrame para Categoria_Pareja 'C':
     id_salarios       Volumen    Pareja Categoria_Pareja
321          322 10,512,000.00 30,420.00                C
322          323  8,406,999.99 30,819.59                C
323          324 18,620,000.00 33,800.00                C
DataFrame para Categoria_Pareja 'C1':
     id_salarios       Volumen    Pareja Categoria_Pareja
324          325 16,963,500.00 36,335.00               C1
325          326 40,704,876.35 36,436.04               C1
326   

In [26]:
sumas_volumen_por_categoria = {}

# Itera sobre el diccionario de DataFrames
for categoria, df in dataframes_por_categoria.items():
    suma_volumen = df['Volumen'].sum() # Calcula la suma del volumen para cada DataFrame    
    sumas_volumen_por_categoria[categoria] = suma_volumen # Guarda la suma del volumen en el diccionario

# Convierte el diccionario de sumas en un DataFrame
df_sumas_volumen = pd.DataFrame.from_dict(sumas_volumen_por_categoria, orient='index', columns=['Suma_Volumen'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
df_sumas_volumen = df_sumas_volumen.reindex(nuevo_orden)
df_sumas_volumen['Suma_Volumen'] = df_sumas_volumen['Suma_Volumen'].fillna(0)

#pd.set_option('display.float_format', lambda x: '%.2f' % x) # Mostar números sin notación científica
pd.options.display.float_format = '{:,.2f}'.format # Mostrar comas como separadores de miles y dos decimales

print("DataFrame con las sumas del volumen por categoría:")
df_sumas_volumen

DataFrame con las sumas del volumen por categoría:


Unnamed: 0,Suma_Volumen
G,1917556675.26
F,4638065608.63
F1,4190311696.11
E,959079093.57
E1,458414693.48
D,198031067.0
D1,284112667.99
C,37538999.99
C1,118779396.7
B,5160000.0


In [27]:
df_volumen_ms_parejas = df_sumas_volumen[['Suma_Volumen']]
df_volumen_ms_parejas['Label'] = ['<5000 G','<5-8K F','8-12K F1','12-16K E','16-20K E1','20-25K D','25-30K D1','30-35K C','35-40K C1','40-45K B','45-50K B1','50-55K A','55-60K A1','60K S+']
df_volumen_ms_parejas

Unnamed: 0,Suma_Volumen,Label
G,1917556675.26,<5000 G
F,4638065608.63,<5-8K F
F1,4190311696.11,8-12K F1
E,959079093.57,12-16K E
E1,458414693.48,16-20K E1
D,198031067.0,20-25K D
D1,284112667.99,25-30K D1
C,37538999.99,30-35K C
C1,118779396.7,35-40K C1
B,5160000.0,40-45K B


#### Directos

In [31]:
# Datos de ejemplo
data = {
    'Suma_Volumen': [
        282512281,4420667429,4828793682,3689430716,1892944139,1158774394,98925625,156854581,88975467,315722622,105259760,189516296,32223200,0
    ],
    'Label': [
        '<5000 G', '<5-8K F', '8-12K F1', '12-16K E', '16-20K E1', '20-25K D', '25-30K D1', '30-35K C', '35-40K C1', '40-45K B', '45-50K B1', '50-55K A', '55-60K A1', '60K S+'
    ]
    
}

# Crear el DataFrame
df_volumen_ms_parejas = pd.DataFrame(data)

In [33]:
pd.options.display.float_format = '{:,.2f}'.format # Mostrar comas como separadores de miles y dos decimales
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=df_volumen_ms_parejas['Label'],  # Eje x: Categoría
    y=df_volumen_ms_parejas['Suma_Volumen'],  # Eje y: Cantidad
    text=df_volumen_ms_parejas['Suma_Volumen'].apply(lambda x: '{:,.2f}'.format(x)),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Volumen del mercado salarial de parejas',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
       # title='Total valor',  # Título del eje y
        tickvals=[1000000000, 2000000000, 3000000000, 4000000000, 5000000000],  # Posiciones de las líneas del eje y
        ticktext=['$1,000,000,000', '$2,000,000,000', '$3,000,000,000', '$4,000,000,000', '$5,000,000,000'],  # Etiquetas de las líneas del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_volmercadosalarial_Xparejas_TULGO', carpeta='graficas')

fig.show()


## *PUEBLA*

In [32]:
# Crea los DataFrames para cada archivo con las columnas necesarias
pareja_df_salarios_puebla = df_salarios_puebla[['id_salarios','Volumen', 'Pareja','Categoria_Pareja']]

In [33]:
# Crea un diccionario para almacenar los DataFrames de cada categoría única
dataframes_por_categoria = {}

# Itera sobre los grupos creados por groupby()
for categoria, grupo in pareja_df_salarios_puebla.groupby('Categoria_Pareja'):
    # Almacena el DataFrame del grupo en el diccionario
    dataframes_por_categoria[categoria] = grupo

# Itera sobre las claves del diccionario dataframes_por_categoria
for categoria in dataframes_por_categoria:
    # Imprime la categoría actual
    print("DataFrame para Categoria_Pareja '{}':".format(categoria))
    # Imprime el DataFrame correspondiente a la categoría actual
    print(dataframes_por_categoria[categoria])


DataFrame para Categoria_Pareja 'A':
     id_salarios       Volumen    Pareja Categoria_Pareja
330          331 62,760,000.00 50,700.00                A
DataFrame para Categoria_Pareja 'A1':
     id_salarios      Volumen    Pareja Categoria_Pareja
331          332 7,140,000.00 57,460.00               A1
332          333 7,223,929.11 58,413.59               A1
DataFrame para Categoria_Pareja 'B':
     id_salarios      Volumen    Pareja Categoria_Pareja
329          330 5,160,000.00 43,602.00                B
DataFrame para Categoria_Pareja 'C':
     id_salarios       Volumen    Pareja Categoria_Pareja
321          322 10,512,000.00 30,420.00                C
322          323  8,406,999.99 30,819.59                C
323          324 18,620,000.00 33,800.00                C
DataFrame para Categoria_Pareja 'C1':
     id_salarios       Volumen    Pareja Categoria_Pareja
324          325 16,963,500.00 36,335.00               C1
325          326 40,704,876.35 36,436.04               C1
326   

In [34]:
sumas_volumen_por_categoria = {}

# Itera sobre el diccionario de DataFrames
for categoria, df in dataframes_por_categoria.items():
    suma_volumen = df['Volumen'].sum() # Calcula la suma del volumen para cada DataFrame    
    sumas_volumen_por_categoria[categoria] = suma_volumen # Guarda la suma del volumen en el diccionario

# Convierte el diccionario de sumas en un DataFrame
df_sumas_volumen = pd.DataFrame.from_dict(sumas_volumen_por_categoria, orient='index', columns=['Suma_Volumen'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
df_sumas_volumen = df_sumas_volumen.reindex(nuevo_orden)
df_sumas_volumen['Suma_Volumen'] = df_sumas_volumen['Suma_Volumen'].fillna(0)

#pd.set_option('display.float_format', lambda x: '%.2f' % x) # Mostar números sin notación científica
pd.options.display.float_format = '{:,.2f}'.format # Mostrar comas como separadores de miles y dos decimales

print("DataFrame con las sumas del volumen por categoría:")
df_sumas_volumen

DataFrame con las sumas del volumen por categoría:


Unnamed: 0,Suma_Volumen
G,1917556675.26
F,4638065608.63
F1,4190311696.11
E,959079093.57
E1,458414693.48
D,198031067.0
D1,284112667.99
C,37538999.99
C1,118779396.7
B,5160000.0


In [35]:
df_volumen_ms_parejas = df_sumas_volumen[['Suma_Volumen']]
df_volumen_ms_parejas['Label'] = ['<5000 G','<5-8K F','8-12K F1','12-16K E','16-20K E1','20-25K D','25-30K D1','30-35K C','35-40K C1','40-45K B','45-50K B1','50-55K A','55-60K A1','60K S+']
df_volumen_ms_parejas

Unnamed: 0,Suma_Volumen,Label
G,1917556675.26,<5000 G
F,4638065608.63,<5-8K F
F1,4190311696.11,8-12K F1
E,959079093.57,12-16K E
E1,458414693.48,16-20K E1
D,198031067.0,20-25K D
D1,284112667.99,25-30K D1
C,37538999.99,30-35K C
C1,118779396.7,35-40K C1
B,5160000.0,40-45K B


In [39]:
pd.options.display.float_format = '{:,.2f}'.format # Mostrar comas como separadores de miles y dos decimales
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=df_volumen_ms_parejas['Label'],  # Eje x: Categoría
    y=df_volumen_ms_parejas['Suma_Volumen'],  # Eje y: Cantidad
    text=df_volumen_ms_parejas['Suma_Volumen'].apply(lambda x: '{:,.2f}'.format(x)),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Volumen del mercado salarial de parejas',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        #title='Total valor',  # Título del eje y
        tickvals=[1000000000, 2000000000, 3000000000, 4000000000, 5000000000],  # Posiciones de las líneas del eje y
        ticktext=['$1,000,000,000', '$2,000,000,000', '$3,000,000,000', '$4,000,000,000', '$5,000,000,000'],  # Etiquetas de las líneas del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_volmercadoXXsalarial_parejas_puebla', carpeta='graficas')

fig.show()


__________
# ***Mercado salario por pareja***

## *PACHUCA*

In [40]:
registros_categoria_A = pareja_df_salarios_pachuca[pareja_df_salarios_pachuca['Categoria_Pareja'] == 'F1']
registros_categoria_A.shape

(96, 4)

In [41]:
numero_registros_por_categoria = {}
# Itera dataframes_por_categoria que contiene cada grupo de categorías por pareja
for categoria in dataframes_por_categoria:
    numero_registros = len(dataframes_por_categoria[categoria]) # Número de registros para el DataFrame correspondiente a la categoría actual
    numero_registros_por_categoria[categoria] = numero_registros # Almacena en el diccionario 

# Convertir el diccionario en un DataFrame
posiciones_salariosparejas = pd.DataFrame(list(numero_registros_por_categoria.items()), columns=['Categoria_Pareja', 'numero_registros'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
posiciones_salariosparejas = posiciones_salariosparejas.set_index('Categoria_Pareja').reindex(nuevo_orden).fillna(0).reset_index()
posiciones_salariosparejas

Unnamed: 0,Categoria_Pareja,numero_registros
0,G,56.0
1,F,88.0
2,F1,96.0
3,E,36.0
4,E1,25.0
5,D,11.0
6,D1,9.0
7,C,3.0
8,C1,5.0
9,B,1.0


In [42]:
posiciones_salariosparejas['Categoria_Pareja'] = ['<5000 G','<5-8K F','8-12K F1','12-16K E','16-20K E1','20-25K D','25-30K D1','30-35K C','35-40K C1','40-45K B','45-50K B1','50-55K A','55-60K A1','60K S+']
posiciones_salariosparejas

Unnamed: 0,Categoria_Pareja,numero_registros
0,<5000 G,56.0
1,<5-8K F,88.0
2,8-12K F1,96.0
3,12-16K E,36.0
4,16-20K E1,25.0
5,20-25K D,11.0
6,25-30K D1,9.0
7,30-35K C,3.0
8,35-40K C1,5.0
9,40-45K B,1.0


In [43]:
total_registros = posiciones_salariosparejas['numero_registros'].sum() # Calcular el total de registros en el DataFrame
# Calculamos el porcentaje que representa cada numero_registros en relación al total de registros en el df
posiciones_salariosparejas['porcentaje'] = (posiciones_salariosparejas['numero_registros'] / total_registros) * 100
posiciones_salariosparejas

Unnamed: 0,Categoria_Pareja,numero_registros,porcentaje
0,<5000 G,56.0,16.82
1,<5-8K F,88.0,26.43
2,8-12K F1,96.0,28.83
3,12-16K E,36.0,10.81
4,16-20K E1,25.0,7.51
5,20-25K D,11.0,3.3
6,25-30K D1,9.0,2.7
7,30-35K C,3.0,0.9
8,35-40K C1,5.0,1.5
9,40-45K B,1.0,0.3


In [44]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=posiciones_salariosparejas['Categoria_Pareja'],  # Eje x: Categoría
    y=posiciones_salariosparejas['porcentaje'],  # Eje y: porcentaje
    text=posiciones_salariosparejas['porcentaje'].apply(lambda x: f'{x:.2f}%'),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Mercado salario por pareja',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        title='%',  # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta): 
        os.makedirs(carpeta) # Crear la carpeta si no existe
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_mercadosalarial_xparejas_pachuca', carpeta='graficas')

fig.show()

## *PUEBLA*

In [45]:
registros_categoria_A = pareja_df_salarios_puebla[pareja_df_salarios_puebla['Categoria_Pareja'] == 'F1']
registros_categoria_A.shape

(96, 4)

In [46]:
numero_registros_por_categoria = {}
# Itera dataframes_por_categoria que contiene cada grupo de categorías por pareja
for categoria in dataframes_por_categoria:
    numero_registros = len(dataframes_por_categoria[categoria]) # Número de registros para el DataFrame correspondiente a la categoría actual
    numero_registros_por_categoria[categoria] = numero_registros # Almacena en el diccionario 

# Convertir el diccionario en un DataFrame
posiciones_salariosparejas = pd.DataFrame(list(numero_registros_por_categoria.items()), columns=['Categoria_Pareja', 'numero_registros'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
posiciones_salariosparejas = posiciones_salariosparejas.set_index('Categoria_Pareja').reindex(nuevo_orden).fillna(0).reset_index()
posiciones_salariosparejas

Unnamed: 0,Categoria_Pareja,numero_registros
0,G,56.0
1,F,88.0
2,F1,96.0
3,E,36.0
4,E1,25.0
5,D,11.0
6,D1,9.0
7,C,3.0
8,C1,5.0
9,B,1.0


In [47]:
posiciones_salariosparejas['Categoria_Pareja'] = ['<5000 G','<5-8K F','8-12K F1','12-16K E','16-20K E1','20-25K D','25-30K D1','30-35K C','35-40K C1','40-45K B','45-50K B1','50-55K A','55-60K A1','60K S+']
posiciones_salariosparejas

Unnamed: 0,Categoria_Pareja,numero_registros
0,<5000 G,56.0
1,<5-8K F,88.0
2,8-12K F1,96.0
3,12-16K E,36.0
4,16-20K E1,25.0
5,20-25K D,11.0
6,25-30K D1,9.0
7,30-35K C,3.0
8,35-40K C1,5.0
9,40-45K B,1.0


In [48]:
total_registros = posiciones_salariosparejas['numero_registros'].sum() # Calcular el total de registros en el DataFrame
# Calculamos el porcentaje que representa cada numero_registros en relación al total de registros en el df
posiciones_salariosparejas['porcentaje'] = (posiciones_salariosparejas['numero_registros'] / total_registros) * 100
posiciones_salariosparejas

Unnamed: 0,Categoria_Pareja,numero_registros,porcentaje
0,<5000 G,56.0,16.82
1,<5-8K F,88.0,26.43
2,8-12K F1,96.0,28.83
3,12-16K E,36.0,10.81
4,16-20K E1,25.0,7.51
5,20-25K D,11.0,3.3
6,25-30K D1,9.0,2.7
7,30-35K C,3.0,0.9
8,35-40K C1,5.0,1.5
9,40-45K B,1.0,0.3


In [50]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=posiciones_salariosparejas['Categoria_Pareja'],  # Eje x: Categoría
    y=posiciones_salariosparejas['porcentaje'],  # Eje y: porcentaje
    text=posiciones_salariosparejas['porcentaje'].apply(lambda x: f'{x:.2f}%'),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Mercado salario por pareja',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        #title='%',  # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta): 
        os.makedirs(carpeta) # Crear la carpeta si no existe
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_mercadoXsalarial_parejas_puebla', carpeta='graficas')

fig.show()

## TULANCINGO

In [26]:
# Datos de ejemplo
data = {
    'porcentaje': [
        9.23,14.46,24.00,18.46,11.69,8.62,2.77,2.77,1.23,2.46,0.00,1.23,0.62,0.00
    ],
    'Categoria_Pareja': [
        '<5000 G', '<5-8K F', '8-12K F1', '12-16K E', '16-20K E1', '20-25K D', '25-30K D1', '30-35K C', '35-40K C1', '40-45K B', '45-50K B1', '50-55K A', '55-60K A1', '60K S+'
    ]
    
}

# Crear el DataFrame
posiciones_salariosparejas = pd.DataFrame(data)

In [27]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=posiciones_salariosparejas['Categoria_Pareja'],  # Eje x: Categoría
    y=posiciones_salariosparejas['porcentaje'],  # Eje y: porcentaje
    text=posiciones_salariosparejas['porcentaje'].apply(lambda x: f'{x:.2f}%'),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Mercado salario por pareja',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        #title='%',  # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta): 
        os.makedirs(carpeta) # Crear la carpeta si no existe
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_mercadoXsalarial_parejas_TULGO', carpeta='graficas')

fig.show()

__________
# ***Mercado salario por persona***

## *PACHUCA*

In [18]:
# Crea los DataFrames para cada archivo con las columnas necesarias
persona_df_salarios_pachuca = df_salarios_pachuca[['id_salarios','Salario_Variable','Categoria']]

In [19]:
# Crea un diccionario para almacenar los DataFrames de cada categoría única
dataframes_por_categoria = {}

# Itera sobre los grupos creados por groupby()
for categoria, grupo in persona_df_salarios_pachuca.groupby('Categoria'):
    # Almacena el DataFrame del grupo en el diccionario
    dataframes_por_categoria[categoria] = grupo

# Itera sobre las claves del diccionario dataframes_por_categoria
for categoria in dataframes_por_categoria:
    # Imprime la categoría actual
    print("DataFrame para Categoria '{}':".format(categoria))
    # Imprime el DataFrame correspondiente a la categoría actual
    print(dataframes_por_categoria[categoria])


DataFrame para Categoria 'C':
     id_salarios  Salario_Variable Categoria
330          331         30,000.00         C
331          332         34,000.00         C
332          333         34,564.25         C
DataFrame para Categoria 'D':
     id_salarios  Salario_Variable Categoria
323          324         20,000.00         D
324          325         21,500.00         D
325          326         21,559.79         D
326          327         22,119.49         D
327          328         22,295.80         D
328          329         22,465.12         D
DataFrame para Categoria 'D1':
     id_salarios  Salario_Variable Categoria
329          330         25,800.00        D1
DataFrame para Categoria 'E':
     id_salarios  Salario_Variable Categoria
302          303         12,000.00         E
303          304         12,000.00         E
304          305         12,384.35         E
305          306         12,447.85         E
306          307         12,845.16         E
307          308        

In [20]:
numero_registros_por_categoria = {}
# Itera dataframes_por_categoria que contiene cada grupo de categorías por pareja
for categoria in dataframes_por_categoria:
    numero_registros = len(dataframes_por_categoria[categoria]) # Número de registros para el DataFrame correspondiente a la categoría actual
    numero_registros_por_categoria[categoria] = numero_registros # Almacena en el diccionario 

# Convertir el diccionario en un DataFrame
posiciones_salariospersona = pd.DataFrame(list(numero_registros_por_categoria.items()), columns=['Categoria', 'numero_registros'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
posiciones_salariospersona = posiciones_salariospersona.set_index('Categoria').reindex(nuevo_orden).fillna(0).reset_index()
posiciones_salariospersona

Unnamed: 0,Categoria,numero_registros
0,G,155.0
1,F,99.0
2,F1,48.0
3,E,14.0
4,E1,7.0
5,D,6.0
6,D1,1.0
7,C,3.0
8,C1,0.0
9,B,0.0


In [21]:
posiciones_salariospersona['Categoria'] = ['<5000 G', '<5-8K F', '8-12K F1', '12-16K E', '16-20K E1', '20-25K D', '25-30K D1', '30-35K C', '35-40K C1', '40-45K B', '45-50K B1', '50-55K A', '55-60K A1', '60K S+']
total_registros = posiciones_salariospersona['numero_registros'].sum() # Calcular el total de registros en el DataFrame
# Calculamos el porcentaje que representa cada numero_registros en relación al total de registros en el df
posiciones_salariospersona['porcentaje'] = (posiciones_salariospersona['numero_registros'] / total_registros) * 100
posiciones_salariospersona

Unnamed: 0,Categoria,numero_registros,porcentaje
0,<5000 G,155.0,46.55
1,<5-8K F,99.0,29.73
2,8-12K F1,48.0,14.41
3,12-16K E,14.0,4.2
4,16-20K E1,7.0,2.1
5,20-25K D,6.0,1.8
6,25-30K D1,1.0,0.3
7,30-35K C,3.0,0.9
8,35-40K C1,0.0,0.0
9,40-45K B,0.0,0.0


In [23]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=posiciones_salariospersona['Categoria'],  # Eje x: Categoría
    y=posiciones_salariospersona['porcentaje'],  # Eje y: porcentaje
    text=posiciones_salariospersona['porcentaje'].apply(lambda x: f'{x:.2f}%'),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    title='Mercado Salario por persona',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        title='%',  # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta): 
        os.makedirs(carpeta) # Crear la carpeta si no existe
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_mercadosalarial_xpersona_pachuca', carpeta='graficas')

fig.show()

## *PUEBLA*

In [16]:
# Crea los DataFrames para cada archivo con las columnas necesarias
persona_df_salarios_puebla = df_salarios_puebla[['id_salarios','Salario_Variable','Categoria']]

In [17]:
# Crea un diccionario para almacenar los DataFrames de cada categoría única
dataframes_por_categoria = {}

# Itera sobre los grupos creados por groupby()
for categoria, grupo in persona_df_salarios_puebla.groupby('Categoria'):
    # Almacena el DataFrame del grupo en el diccionario
    dataframes_por_categoria[categoria] = grupo

# Itera sobre las claves del diccionario dataframes_por_categoria
for categoria in dataframes_por_categoria:
    # Imprime la categoría actual
    print("DataFrame para Categoria '{}':".format(categoria))
    # Imprime el DataFrame correspondiente a la categoría actual
    print(dataframes_por_categoria[categoria])


DataFrame para Categoria 'C':
     id_salarios  Salario_Variable Categoria
330          331         30,000.00         C
331          332         34,000.00         C
332          333         34,564.25         C
DataFrame para Categoria 'D':
     id_salarios  Salario_Variable Categoria
323          324         20,000.00         D
324          325         21,500.00         D
325          326         21,559.79         D
326          327         22,119.49         D
327          328         22,295.80         D
328          329         22,465.12         D
DataFrame para Categoria 'D1':
     id_salarios  Salario_Variable Categoria
329          330         25,800.00        D1
DataFrame para Categoria 'E':
     id_salarios  Salario_Variable Categoria
302          303         12,000.00         E
303          304         12,000.00         E
304          305         12,384.35         E
305          306         12,447.85         E
306          307         12,845.16         E
307          308        

In [18]:
numero_registros_por_categoria = {}
# Itera dataframes_por_categoria que contiene cada grupo de categorías por pareja
for categoria in dataframes_por_categoria:
    numero_registros = len(dataframes_por_categoria[categoria]) # Número de registros para el DataFrame correspondiente a la categoría actual
    numero_registros_por_categoria[categoria] = numero_registros # Almacena en el diccionario 

# Convertir el diccionario en un DataFrame
posiciones_salariospersona = pd.DataFrame(list(numero_registros_por_categoria.items()), columns=['Categoria', 'numero_registros'])
# Mantener orden
nuevo_orden = ['G', 'F', 'F1', 'E', 'E1', 'D', 'D1', 'C', 'C1', 'B', 'B1', 'A', 'A1', 'S']
posiciones_salariospersona = posiciones_salariospersona.set_index('Categoria').reindex(nuevo_orden).fillna(0).reset_index()
posiciones_salariospersona

Unnamed: 0,Categoria,numero_registros
0,G,155.0
1,F,99.0
2,F1,48.0
3,E,14.0
4,E1,7.0
5,D,6.0
6,D1,1.0
7,C,3.0
8,C1,0.0
9,B,0.0


In [19]:
posiciones_salariospersona['Categoria'] = ['<5000 G', '<5-8K F', '8-12K F1', '12-16K E', '16-20K E1', '20-25K D', '25-30K D1', '30-35K C', '35-40K C1', '40-45K B', '45-50K B1', '50-55K A', '55-60K A1', '60K S+']
total_registros = posiciones_salariospersona['numero_registros'].sum() # Calcular el total de registros en el DataFrame
# Calculamos el porcentaje que representa cada numero_registros en relación al total de registros en el df
posiciones_salariospersona['porcentaje'] = (posiciones_salariospersona['numero_registros'] / total_registros) * 100
posiciones_salariospersona

Unnamed: 0,Categoria,numero_registros,porcentaje
0,<5000 G,155.0,46.55
1,<5-8K F,99.0,29.73
2,8-12K F1,48.0,14.41
3,12-16K E,14.0,4.2
4,16-20K E1,7.0,2.1
5,20-25K D,6.0,1.8
6,25-30K D1,1.0,0.3
7,30-35K C,3.0,0.9
8,35-40K C1,0.0,0.0
9,40-45K B,0.0,0.0


In [20]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=posiciones_salariospersona['Categoria'],  # Eje x: Categoría
    y=posiciones_salariospersona['porcentaje'],  # Eje y: porcentaje
    text=posiciones_salariospersona['porcentaje'].apply(lambda x: f'{x:.2f}%'),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Mercado Salario por persona',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        title='%',  # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta): 
        os.makedirs(carpeta) # Crear la carpeta si no existe
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_mercadosalarial_Xpersona_puebla', carpeta='graficas')

fig.show()

## TULANCINGO

In [23]:
# Datos de ejemplo
data = {
    'porcentaje': [
        23.32,30.03,25.56,8.63,6.07,1.28,1.92,1.28,0.32,0.64,0.32,0.0,0.0,0.64
    ],
    'Categoria': [
        '<5000 G', '<5-8K F', '8-12K F1', '12-16K E', '16-20K E1', '20-25K D', '25-30K D1', '30-35K C', '35-40K C1', '40-45K B', '45-50K B1', '50-55K A', '55-60K A1', '60K S+'
    ]
    
}

# Crear el DataFrame
posiciones_salariospersona = pd.DataFrame(data)

In [24]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=posiciones_salariospersona['Categoria'],  # Eje x: Categoría
    y=posiciones_salariospersona['porcentaje'],  # Eje y: porcentaje
    text=posiciones_salariospersona['porcentaje'].apply(lambda x: f'{x:.2f}%'),  # Texto con el formato deseado
    textposition='outside',  # Posición del texto (parte superior de las barras)
    marker_color=colores,  # Especifica los colores de las barras
))
fig.update_layout(
    #title='Mercado Salario por persona',  # Título de la gráfica
    title_x=0.5,
    yaxis=dict(
        title='%',  # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        gridwidth=1, # Ancho de las líneas que dividen los rangos del eje Y
    ),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta): 
        os.makedirs(carpeta) # Crear la carpeta si no existe
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_mercadosalarial_Xpersona_tulgo', carpeta='graficas')

fig.show()

__________
# ***Profesiones salario individual***

## *PACHUCA*

In [56]:
# Crea los DataFrames para cada archivo con las columnas necesarias
profesiones_df_salarios_pachuca = df_salarios_pachuca[['id_salarios', 'Occupation','Salario_Variable','Categoria']]
profesiones_df_salarios_pachuca

Unnamed: 0,id_salarios,Occupation,Salario_Variable,Categoria
0,1,Trabajadores de Apoyo que Realizan Actividades...,244.30,G
1,2,Trabajadores en la Cría de Caprinos y Ovinos,690.00,G
2,3,Coordinadores y Jefes de Área en Servicios Con...,817.54,G
3,4,Artesanos y Confeccionadores de Productos Text...,973.88,G
4,5,Técnicos de Laboratorios Médicos,1000.00,G
...,...,...,...,...
328,329,Oficiales del Ministerio Público y Detectives,22465.12,D
329,330,Montadores de Estructuras Metálicas,25800.00,D1
330,331,Optometristas,30000.00,C
331,332,Altas Autoridades Gubernamentales y Jurisdicci...,34000.00,C


In [57]:
# Ordenar el DataFrame por el valor del salario en orden ascendente
profesiones_df_salarios_pachuca_sorted = profesiones_df_salarios_pachuca.sort_values(by='Salario_Variable')

# Dividir el DataFrame en dos partes: bajos y altos salarios
corte = len(profesiones_df_salarios_pachuca_sorted) // 2
profesiones_bajas = profesiones_df_salarios_pachuca_sorted.iloc[:corte]
profesiones_altas = profesiones_df_salarios_pachuca_sorted.iloc[corte:]

# Imprimir la lista de ocupaciones para salarios más bajos
print("Profesiones con los salarios más bajos:")
print(profesiones_bajas['Occupation'].tolist())

# Imprimir la lista de ocupaciones para salarios más altos
print("\nProfesiones con los salarios más altos:")
print(profesiones_altas['Occupation'].tolist())

Profesiones con los salarios más bajos:
['Trabajadores de Apoyo que Realizan Actividades Agrícolas y Ganaderas', 'Trabajadores en la Cría de Caprinos y Ovinos', 'Coordinadores y Jefes de Área en Servicios Contables, Financieros, Banca y Seguros', 'Artesanos y Confeccionadores de Productos Textiles', 'Técnicos de Laboratorios Médicos', 'Parteras', 'Taladores, Trocadores, Cortadores de Árboles y Similares', 'Trabajadores en el Cultivo de Maíz Y/O Frijol', 'Cerrajeros, Afiladores y Pulidores de Herramientas', 'Trabajadores que Combinan Actividades Agrícolas con Ganaderas', 'Curanderos, Hierberos y Hueseros', 'Agrónomos', 'Administradores de Bases de Datos y Redes de Computadora', 'Bailarines y Coreógrafos', 'Escritores y Críticos Literarios', 'Productores de Carbón Vegetal', 'Trabajadores del Vidrio y Similares', 'Trabajadores de la Fuerza Armada Marítima', 'Carteros (A Pie y en Bicicleta)', 'Coordinadores y Jefes de Área en Informática', 'Supervisores, Encargados y Capataces de Trabajado

In [58]:
# Ordenar el DataFrame por el valor del salario en orden ascendente
profesiones_df_salarios_pachuca_sorted = profesiones_df_salarios_pachuca.sort_values(by='Salario_Variable')

# Dividir el DataFrame en dos partes: bajos y altos salarios
corte = len(profesiones_df_salarios_pachuca_sorted) // 2
profesiones_bajas = profesiones_df_salarios_pachuca_sorted.iloc[:corte].head(10)  # Obtener solo las 10 primeras
profesiones_altas = profesiones_df_salarios_pachuca_sorted.iloc[corte:].head(10)  # Obtener solo las 10 primeras
df_bajas = pd.DataFrame({'Profesiones Más Bajas': profesiones_bajas['Occupation']})
df_altas = pd.DataFrame({'Profesiones Más Altas': profesiones_altas['Occupation']})

# Unir los dos DataFrames en una sola tabla
tabla_comparativa = pd.concat([df_bajas.reset_index(drop=True), df_altas.reset_index(drop=True)], axis=1)
print(tabla_comparativa)

# Exportar tabla como archivo HTML
def guardar_tabla_como_html(tabla, nombre_archivo, carpeta='tablas'):
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)  # Crear la carpeta si no existe
    
    # Tabla como archivo HTML en la carpeta especificada
    tabla.to_html(f'{carpeta}/{nombre_archivo}.html', index=False)

# Exportar la tabla
guardar_tabla_como_html(tabla_comparativa, 'tabla_profsalarioindv_pachuca')

                               Profesiones Más Bajas  \
0  Trabajadores de Apoyo que Realizan Actividades...   
1       Trabajadores en la Cría de Caprinos y Ovinos   
2  Coordinadores y Jefes de Área en Servicios Con...   
3  Artesanos y Confeccionadores de Productos Text...   
4                   Técnicos de Laboratorios Médicos   
5                                           Parteras   
6  Taladores, Trocadores, Cortadores de Árboles y...   
7      Trabajadores en el Cultivo de Maíz Y/O Frijol   
8  Cerrajeros, Afiladores y Pulidores de Herramie...   
9  Trabajadores que Combinan Actividades Agrícola...   

                               Profesiones Más Altas  
0           Trabajadores de Apoyo en la Construcción  
1  Instructores y Capacitadores en Oficios y para...  
2                               Capturistas de Datos  
3  Trabajadores en la Elaboración de Productos Lá...  
4                                          Tapiceros  
5  Agentes y Representantes de Ventas y Consignat... 

## *PUEBLA*

In [27]:
# Crea los DataFrames para cada archivo con las columnas necesarias
profesiones_df_salarios_puebla = df_salarios_puebla[['id_salarios', 'Occupation','Salario_Variable','Categoria']]
profesiones_df_salarios_puebla

Unnamed: 0,id_salarios,Occupation,Salario_Variable,Categoria
0,1,Trabajadores de Apoyo que Realizan Actividades...,244.30,G
1,2,Trabajadores en la Cría de Caprinos y Ovinos,690.00,G
2,3,Coordinadores y Jefes de Área en Servicios Con...,817.54,G
3,4,Artesanos y Confeccionadores de Productos Text...,973.88,G
4,5,Técnicos de Laboratorios Médicos,1000.00,G
...,...,...,...,...
328,329,Oficiales del Ministerio Público y Detectives,22465.12,D
329,330,Montadores de Estructuras Metálicas,25800.00,D1
330,331,Optometristas,30000.00,C
331,332,Altas Autoridades Gubernamentales y Jurisdicci...,34000.00,C


In [28]:
# Ordenar el DataFrame por el valor del salario en orden ascendente
profesiones_df_salarios_puebla_sorted = profesiones_df_salarios_puebla.sort_values(by='Salario_Variable')

# Dividir el DataFrame en dos partes: bajos y altos salarios
corte = len(profesiones_df_salarios_puebla_sorted) // 2
profesiones_bajas = profesiones_df_salarios_puebla_sorted.iloc[:corte]
profesiones_altas = profesiones_df_salarios_puebla_sorted.iloc[corte:]

# Imprimir la lista de ocupaciones para salarios más bajos
print("Profesiones con los salarios más bajos:")
print(profesiones_bajas['Occupation'].tolist())

# Imprimir la lista de ocupaciones para salarios más altos
print("\nProfesiones con los salarios más altos:")
print(profesiones_altas['Occupation'].tolist())

Profesiones con los salarios más bajos:
['Trabajadores de Apoyo que Realizan Actividades Agrícolas y Ganaderas', 'Trabajadores en la Cría de Caprinos y Ovinos', 'Coordinadores y Jefes de Área en Servicios Contables, Financieros, Banca y Seguros', 'Artesanos y Confeccionadores de Productos Textiles', 'Técnicos de Laboratorios Médicos', 'Parteras', 'Taladores, Trocadores, Cortadores de Árboles y Similares', 'Trabajadores en el Cultivo de Maíz Y/O Frijol', 'Cerrajeros, Afiladores y Pulidores de Herramientas', 'Trabajadores que Combinan Actividades Agrícolas con Ganaderas', 'Curanderos, Hierberos y Hueseros', 'Agrónomos', 'Administradores de Bases de Datos y Redes de Computadora', 'Bailarines y Coreógrafos', 'Escritores y Críticos Literarios', 'Productores de Carbón Vegetal', 'Trabajadores del Vidrio y Similares', 'Trabajadores de la Fuerza Armada Marítima', 'Carteros (A Pie y en Bicicleta)', 'Coordinadores y Jefes de Área en Informática', 'Supervisores, Encargados y Capataces de Trabajado

In [29]:
# Ordenar el DataFrame por el valor del salario en orden ascendente
profesiones_df_salarios_puebla_sorted = profesiones_df_salarios_puebla.sort_values(by='Salario_Variable')

# Dividir el DataFrame en dos partes: bajos y altos salarios
corte = len(profesiones_df_salarios_puebla_sorted) // 2
profesiones_bajas = profesiones_df_salarios_puebla_sorted.iloc[:corte].head(10)  # Obtener solo las 10 primeras
profesiones_altas = profesiones_df_salarios_puebla_sorted.iloc[corte:].head(10)  # Obtener solo las 10 primeras
df_bajas = pd.DataFrame({'Profesiones Más Bajas': profesiones_bajas['Occupation']})
df_altas = pd.DataFrame({'Profesiones Más Altas': profesiones_altas['Occupation']})

# Unir los dos DataFrames en una sola tabla
tabla_comparativa = pd.concat([df_bajas.reset_index(drop=True), df_altas.reset_index(drop=True)], axis=1)
print(tabla_comparativa)

# Exportar tabla como archivo HTML
def guardar_tabla_como_html(tabla, nombre_archivo, carpeta='tablas'):
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)  # Crear la carpeta si no existe
    
    # Tabla como archivo HTML en la carpeta especificada
    tabla.to_html(f'{carpeta}/{nombre_archivo}.html', index=False)

# Exportar la tabla
guardar_tabla_como_html(tabla_comparativa, 'tabla_profsalarioindv_puebla')

                               Profesiones Más Bajas  \
0  Trabajadores de Apoyo que Realizan Actividades...   
1       Trabajadores en la Cría de Caprinos y Ovinos   
2  Coordinadores y Jefes de Área en Servicios Con...   
3  Artesanos y Confeccionadores de Productos Text...   
4                   Técnicos de Laboratorios Médicos   
5                                           Parteras   
6  Taladores, Trocadores, Cortadores de Árboles y...   
7      Trabajadores en el Cultivo de Maíz Y/O Frijol   
8  Cerrajeros, Afiladores y Pulidores de Herramie...   
9  Trabajadores que Combinan Actividades Agrícola...   

                               Profesiones Más Altas  
0           Trabajadores de Apoyo en la Construcción  
1  Instructores y Capacitadores en Oficios y para...  
2                               Capturistas de Datos  
3  Trabajadores en la Elaboración de Productos Lá...  
4                                          Tapiceros  
5  Agentes y Representantes de Ventas y Consignat... 

## *TULANCINGO*

In [None]:
# Crea los DataFrames para cada archivo con las columnas necesarias
profesiones_df_salarios_puebla = df_salarios_puebla[['id_salarios', 'Occupation','Salario_Variable','Categoria']]
profesiones_df_salarios_puebla

Unnamed: 0,id_salarios,Occupation,Salario_Variable,Categoria
0,1,Trabajadores de Apoyo que Realizan Actividades...,244.30,G
1,2,Trabajadores en la Cría de Caprinos y Ovinos,690.00,G
2,3,Coordinadores y Jefes de Área en Servicios Con...,817.54,G
3,4,Artesanos y Confeccionadores de Productos Text...,973.88,G
4,5,Técnicos de Laboratorios Médicos,1000.00,G
...,...,...,...,...
328,329,Oficiales del Ministerio Público y Detectives,22465.12,D
329,330,Montadores de Estructuras Metálicas,25800.00,D1
330,331,Optometristas,30000.00,C
331,332,Altas Autoridades Gubernamentales y Jurisdicci...,34000.00,C


In [None]:
# Ordenar el DataFrame por el valor del salario en orden ascendente
profesiones_df_salarios_puebla_sorted = profesiones_df_salarios_puebla.sort_values(by='Salario_Variable')

# Dividir el DataFrame en dos partes: bajos y altos salarios
corte = len(profesiones_df_salarios_puebla_sorted) // 2
profesiones_bajas = profesiones_df_salarios_puebla_sorted.iloc[:corte]
profesiones_altas = profesiones_df_salarios_puebla_sorted.iloc[corte:]

# Imprimir la lista de ocupaciones para salarios más bajos
print("Profesiones con los salarios más bajos:")
print(profesiones_bajas['Occupation'].tolist())

# Imprimir la lista de ocupaciones para salarios más altos
print("\nProfesiones con los salarios más altos:")
print(profesiones_altas['Occupation'].tolist())

Profesiones con los salarios más bajos:
['Trabajadores de Apoyo que Realizan Actividades Agrícolas y Ganaderas', 'Trabajadores en la Cría de Caprinos y Ovinos', 'Coordinadores y Jefes de Área en Servicios Contables, Financieros, Banca y Seguros', 'Artesanos y Confeccionadores de Productos Textiles', 'Técnicos de Laboratorios Médicos', 'Parteras', 'Taladores, Trocadores, Cortadores de Árboles y Similares', 'Trabajadores en el Cultivo de Maíz Y/O Frijol', 'Cerrajeros, Afiladores y Pulidores de Herramientas', 'Trabajadores que Combinan Actividades Agrícolas con Ganaderas', 'Curanderos, Hierberos y Hueseros', 'Agrónomos', 'Administradores de Bases de Datos y Redes de Computadora', 'Bailarines y Coreógrafos', 'Escritores y Críticos Literarios', 'Productores de Carbón Vegetal', 'Trabajadores del Vidrio y Similares', 'Trabajadores de la Fuerza Armada Marítima', 'Carteros (A Pie y en Bicicleta)', 'Coordinadores y Jefes de Área en Informática', 'Supervisores, Encargados y Capataces de Trabajado

In [None]:
# Ordenar el DataFrame por el valor del salario en orden ascendente
profesiones_df_salarios_puebla_sorted = profesiones_df_salarios_puebla.sort_values(by='Salario_Variable')

# Dividir el DataFrame en dos partes: bajos y altos salarios
corte = len(profesiones_df_salarios_puebla_sorted) // 2
profesiones_bajas = profesiones_df_salarios_puebla_sorted.iloc[:corte].head(10)  # Obtener solo las 10 primeras
profesiones_altas = profesiones_df_salarios_puebla_sorted.iloc[corte:].head(10)  # Obtener solo las 10 primeras
df_bajas = pd.DataFrame({'Profesiones Más Bajas': profesiones_bajas['Occupation']})
df_altas = pd.DataFrame({'Profesiones Más Altas': profesiones_altas['Occupation']})

# Unir los dos DataFrames en una sola tabla
tabla_comparativa = pd.concat([df_bajas.reset_index(drop=True), df_altas.reset_index(drop=True)], axis=1)
print(tabla_comparativa)

# Exportar tabla como archivo HTML
def guardar_tabla_como_html(tabla, nombre_archivo, carpeta='tablas'):
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)  # Crear la carpeta si no existe
    
    # Tabla como archivo HTML en la carpeta especificada
    tabla.to_html(f'{carpeta}/{nombre_archivo}.html', index=False)

# Exportar la tabla
guardar_tabla_como_html(tabla_comparativa, 'tabla_profsalarioindv_puebla')

                               Profesiones Más Bajas  \
0  Trabajadores de Apoyo que Realizan Actividades...   
1       Trabajadores en la Cría de Caprinos y Ovinos   
2  Coordinadores y Jefes de Área en Servicios Con...   
3  Artesanos y Confeccionadores de Productos Text...   
4                   Técnicos de Laboratorios Médicos   
5                                           Parteras   
6  Taladores, Trocadores, Cortadores de Árboles y...   
7      Trabajadores en el Cultivo de Maíz Y/O Frijol   
8  Cerrajeros, Afiladores y Pulidores de Herramie...   
9  Trabajadores que Combinan Actividades Agrícola...   

                               Profesiones Más Altas  
0           Trabajadores de Apoyo en la Construcción  
1  Instructores y Capacitadores en Oficios y para...  
2                               Capturistas de Datos  
3  Trabajadores en la Elaboración de Productos Lá...  
4                                          Tapiceros  
5  Agentes y Representantes de Ventas y Consignat... 

In [37]:
import pandas as pd
import os

# Datos de la tabla proporcionada
data = {
    'Profesiones más bajas': [
        'Artesanos y Trabajadores en la Elaboración de Productos de Papel y Cartón',
        'Trabajadores en la Cría de Porcinos',
        'Bailarines y Coreógrafos',
        'Trabajadores en la Elaboración de Sustancias y Compuestos Químicos',
        'Trabajadores de Apoyo en la Industria de la Cerámica, Vidrio y Similares',
        'Artesanos y Confeccionadores de Productos Textiles',
        'Operadores de Máquinas para el Tratamiento de Agua',
        'Escritores y Críticos Literarios',
        'Ingenieros Mecánicos',
        'Yeseros, Escayolistas y otros Recubridores de Techos y Paredes'
    ],
    'Profesiones más altas': [
        'Coordinadores y Jefes de Área en Generación y Provisión de Energía Eléctrica y Agua',
        'Instructores y Capacitadores en Oficios y para el Trabajo',
        'Supervisores de Técnicos Eléctricos, en Electrónica y de Equipos en Telecomunicaciones y Electromecánicos',
        'Jueces de Juzgado, Directores y Gerentes en Servicios Legales y Procuración de Justicia',
        'Directores y Gerentes en Servicios Funerarios y otros Servicios',
        'Directores y Gerentes en Desarrollo Social y Económico',
        'Directores y Gerentes en Comunicación y Telecomunicaciones',
        'Directores y Productores Artísticos de Cine, Teatro y Afines',
        'Coordinadores y Jefes de Área en Producción Minera, Petrolera y Gas',
        'Coordinadores y Jefes de Área en Comunicación y Telecomunicaciones'
    ]
}

# Crear el DataFrame
df = pd.DataFrame(data)

# Asegurarse de que la carpeta 'tablas' existe
if not os.path.exists('tablas'):
    os.makedirs('tablas')

# Exportar la tabla como archivo HTML
df.to_html("tablas/tabla_profsalarioindv_tulgo.html", index=False)

print("La tabla se ha exportado correctamente a tablas/tabla_profsalarioindv.html")


La tabla se ha exportado correctamente a tablas/tabla_profsalarioindv.html


In [36]:
import pandas as pd
import plotly.graph_objects as go

# Datos de la tabla proporcionada
data = {
    'Profesiones más bajas': [
        'Artesanos y Trabajadores en la Elaboración de Productos de Papel y Cartón',
        'Trabajadores en la Cría de Porcinos',
        'Bailarines y Coreógrafos',
        'Trabajadores en la Elaboración de Sustancias y Compuestos Químicos',
        'Trabajadores de Apoyo en la Industria de la Cerámica, Vidrio y Similares',
        'Artesanos y Confeccionadores de Productos Textiles',
        'Operadores de Máquinas para el Tratamiento de Agua',
        'Escritores y Críticos Literarios',
        'Ingenieros Mecánicos',
        'Yeseros, Escayolistas y otros Recubridores de Techos y Paredes'
    ],
    'Profesiones más altas': [
        'Coordinadores y Jefes de Área en Generación y Provisión de Energía Eléctrica y Agua',
        'Instructores y Capacitadores en Oficios y para el Trabajo',
        'Supervisores de Técnicos Eléctricos, en Electrónica y de Equipos en Telecomunicaciones y Electromecánicos',
        'Jueces de Juzgado, Directores y Gerentes en Servicios Legales y Procuración de Justicia',
        'Directores y Gerentes en Servicios Funerarios y otros Servicios',
        'Directores y Gerentes en Desarrollo Social y Económico',
        'Directores y Gerentes en Comunicación y Telecomunicaciones',
        'Directores y Productores Artísticos de Cine, Teatro y Afines',
        'Coordinadores y Jefes de Área en Producción Minera, Petrolera y Gas',
        'Coordinadores y Jefes de Área en Comunicación y Telecomunicaciones'
    ]
}

# Crear el DataFrame
df = pd.DataFrame(data)

# Crear una tabla con Plotly sin estilos
fig = go.Figure(data=[go.Table(
    header=dict(values=list(df.columns),
                align='left'),
    cells=dict(values=[df['Profesiones más bajas'], df['Profesiones más altas']],
               align='left'))
])

# Asegurarse de que la carpeta 'tablas' existe
if not os.path.exists('tablas'):
    os.makedirs('tablas')
# Exportar la tabla como archivo HTML
fig.write_html("tablas/tabla_profsalarioindv_tulgo.html")
