# **11. Meses de oferta (Month of Supply)**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json) # Imprimir la ruta relativa
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [3]:
dataframes = {} # Crear un diccionario para almacenar los DataFrames
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [6]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)
dfs_list = nombres_df 

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df_financiamientos_2022_

# *PACHUCA*

In [67]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in dfs_list if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


In [74]:
fin22pachuca = df_financiamientos_2022_pachuca[['año','mes']]
fin23pachuca = df_financiamientos_2023_pachuca[['año','mes']]
# Concatenar los DataFrames
fin_pachuca = pd.concat([fin22pachuca, fin23pachuca])

# Filtrar registros con año diferente de 0
fin_pachuca_filtrado = fin_pachuca[fin_pachuca['año'] != 0]

# Contar los registros por año y mes
conteo_registros_por_mes = fin_pachuca_filtrado.groupby(['año', 'mes']).size().reset_index(name='conteo')
conteo_registros_por_mes

Unnamed: 0,año,mes,conteo
0,2022,1,102
1,2022,2,95
2,2022,3,132
3,2022,4,114
4,2022,5,97
5,2022,6,112
6,2022,7,124
7,2022,8,95
8,2022,9,122
9,2022,10,112


In [69]:
conteos_por_año = fin_pachuca.groupby('año').size()

# Filtrar el conteo para cada año específico
conteo_2022 = conteos_por_año.get(2022, 0)  # Si no hay registros para el año 2022, devolverá 0
conteo_2023 = conteos_por_año.get(2023, 0)  # Si no hay registros para el año 2023, devolverá 0

print("Conteo de registros para 2022:", conteo_2022)
print("Conteo de registros para 2023:", conteo_2023)

Conteo de registros para 2022: 1388
Conteo de registros para 2023: 680


In [70]:
promedio_2022 = (conteo_2022/12).round(2)
promedio_2023 = (conteo_2023/12).round(2)
print("Promedio de créditos en 2022:", promedio_2022)
print("Promedio de créditos en 2023:", promedio_2023)

Promedio de créditos en 2022: 115.67
Promedio de créditos en 2023: 56.67


In [75]:
# Dividir los conteos por los promedios respectivos de cada año
conteo_registros_por_mes['promedio_creditos'] = conteo_registros_por_mes.apply(lambda row: round(row['conteo'] / promedio_2022, 2) if row['año'] == 2022 else round(row['conteo'] / promedio_2023, 2), axis=1)
conteo_registros_por_mes

Unnamed: 0,año,mes,conteo,promedio_creditos
0,2022,1,102,0.88
1,2022,2,95,0.82
2,2022,3,132,1.14
3,2022,4,114,0.99
4,2022,5,97,0.84
5,2022,6,112,0.97
6,2022,7,124,1.07
7,2022,8,95,0.82
8,2022,9,122,1.05
9,2022,10,112,0.97


In [76]:
# Convertir los valores de la columna mes a enteros
conteo_registros_por_mes['mes'] = conteo_registros_por_mes['mes'].astype(int)
# Mapear los números de mes a sus nombres correspondientes
meses_texto = {1: 'Enero', 2: 'Febrero', 3: 'Marzo', 4: 'Abril', 5: 'Mayo', 6: 'Junio', 7: 'Julio', 8: 'Agosto', 9: 'Septiembre', 10: 'Octubre', 11: 'Noviembre', 12: 'Diciembre'}
# Convertir el número de mes en texto
conteo_registros_por_mes['mes'] = conteo_registros_por_mes.apply(lambda row: f"{meses_texto[row['mes']]}_{int(row['año'])}", axis=1)
# Eliminar la columna 'año' ahora que ya no es necesaria
conteo_registros_por_mes = conteo_registros_por_mes.drop(columns=['año'])
conteo_registros_por_mes

Unnamed: 0,mes,conteo,promedio_creditos
0,Enero_2022,102,0.88
1,Febrero_2022,95,0.82
2,Marzo_2022,132,1.14
3,Abril_2022,114,0.99
4,Mayo_2022,97,0.84
5,Junio_2022,112,0.97
6,Julio_2022,124,1.07
7,Agosto_2022,95,0.82
8,Septiembre_2022,122,1.05
9,Octubre_2022,112,0.97


In [77]:
# Filtrar solo los registros correspondientes a 2023
conteo_2023 = conteo_registros_por_mes[conteo_registros_por_mes['mes'].str.contains('2023')]
# Seleccionar las columnas mes, conteo y promedio_creditos
conteo_2023 = conteo_2023[['mes', 'conteo', 'promedio_creditos']]
conteo_2023

Unnamed: 0,mes,conteo,promedio_creditos
12,Enero_2023,88,1.55
13,Febrero_2023,82,1.45
14,Marzo_2023,97,1.71
15,Abril_2023,20,0.35
16,Mayo_2023,145,2.56
17,Junio_2023,145,2.56
18,Julio_2023,103,1.82


In [78]:
# Obtener los datos
promedio = conteo_2023['promedio_creditos']
meses = conteo_2023['mes']

# Crear figura
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=meses,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for mes, dia in zip(meses, promedio):
    fig.add_annotation(
        x=mes,
        y=dia,
        text=str(dia),  # Texto que se mostrará (el valor del día)
        showarrow=False,  # No mostrar la flecha
        font=dict(color='black', size=12),  # Estilo del texto
        xshift=0,  # Desplazamiento horizontal del texto
        yshift=17,  # Desplazamiento vertical del texto
        textangle=0  # Ángulo del texto
    )
# Actualizar diseño
fig.update_layout(
    title='Meses de oferta',
    xaxis_title='Mes de oferta créditos',
    yaxis_title='Promedio',
    xaxis=dict(gridcolor='#dddcda', tickmode='array', tickvals=list(range(len(meses))), ticktext=meses),
    yaxis=dict(gridcolor='#dddcda', gridwidth=1),
    plot_bgcolor='rgba(0,0,0,0)'
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_MonthSupply_pachuca', carpeta='graficas')
fig.show()

# *TULANCINGO*

In [79]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in dfs_list if 'tulancingo' in df]
print(dataframes_pachuca)

['df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_tulancingo', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_tulancingo', 'df_tiempo_dias_tulancingo']


In [80]:
fin22tul = df_financiamientos_2022_tulancingo[['año','mes']]
fin23tul = df_financiamientos_2023_tulancingo[['año','mes']]
# Concatenar los DataFrames
fin_tulancingo = pd.concat([fin22tul, fin23tul])

# Filtrar registros con año diferente de 0
fin_tulacingo_filtrado = fin_tulancingo[fin_tulancingo['año'] != 0]

# Contar los registros por año y mes
conteo_registros_por_mes = fin_tulacingo_filtrado.groupby(['año', 'mes']).size().reset_index(name='conteo')
conteo_registros_por_mes

Unnamed: 0,año,mes,conteo
0,2022,1,23
1,2022,2,27
2,2022,3,28
3,2022,4,21
4,2022,5,22
5,2022,6,22
6,2022,7,30
7,2022,8,30
8,2022,9,31
9,2022,10,30


In [81]:
conteos_por_año = fin_tulancingo.groupby('año').size()

# Filtrar el conteo para cada año específico
conteo_2022 = conteos_por_año.get(2022, 0)  # Si no hay registros para el año 2022, devolverá 0
conteo_2023 = conteos_por_año.get(2023, 0)  # Si no hay registros para el año 2023, devolverá 0

print("Conteo de registros para 2022:", conteo_2022)
print("Conteo de registros para 2023:", conteo_2023)

Conteo de registros para 2022: 316
Conteo de registros para 2023: 45


In [82]:
promedio_2022 = (conteo_2022/12).round(2)
promedio_2023 = (conteo_2023/12).round(2)
print("Promedio de créditos en 2022:", promedio_2022)
print("Promedio de créditos en 2023:", promedio_2023)

Promedio de créditos en 2022: 26.33
Promedio de créditos en 2023: 3.75


In [83]:
# Dividir los conteos por los promedios respectivos de cada año
conteo_registros_por_mes['promedio_creditos'] = conteo_registros_por_mes.apply(lambda row: round(row['conteo'] / promedio_2022, 2) if row['año'] == 2022 else round(row['conteo'] / promedio_2023, 2), axis=1)
conteo_registros_por_mes

Unnamed: 0,año,mes,conteo,promedio_creditos
0,2022,1,23,0.87
1,2022,2,27,1.03
2,2022,3,28,1.06
3,2022,4,21,0.8
4,2022,5,22,0.84
5,2022,6,22,0.84
6,2022,7,30,1.14
7,2022,8,30,1.14
8,2022,9,31,1.18
9,2022,10,30,1.14


In [84]:
# Convertir los valores de la columna mes a enteros
conteo_registros_por_mes['mes'] = conteo_registros_por_mes['mes'].astype(int)
# Mapear los números de mes a sus nombres correspondientes
meses_texto = {1: 'Enero', 2: 'Febrero', 3: 'Marzo', 4: 'Abril', 5: 'Mayo', 6: 'Junio', 7: 'Julio', 8: 'Agosto', 9: 'Septiembre', 10: 'Octubre', 11: 'Noviembre', 12: 'Diciembre'}
# Convertir el número de mes en texto
conteo_registros_por_mes['mes'] = conteo_registros_por_mes.apply(lambda row: f"{meses_texto[row['mes']]}_{int(row['año'])}", axis=1)
# Eliminar la columna 'año' ahora que ya no es necesaria
conteo_registros_por_mes = conteo_registros_por_mes.drop(columns=['año'])
conteo_registros_por_mes

Unnamed: 0,mes,conteo,promedio_creditos
0,Enero_2022,23,0.87
1,Febrero_2022,27,1.03
2,Marzo_2022,28,1.06
3,Abril_2022,21,0.8
4,Mayo_2022,22,0.84
5,Junio_2022,22,0.84
6,Julio_2022,30,1.14
7,Agosto_2022,30,1.14
8,Septiembre_2022,31,1.18
9,Octubre_2022,30,1.14


In [85]:
# Filtrar solo los registros correspondientes a 2023
conteo_2023 = conteo_registros_por_mes[conteo_registros_por_mes['mes'].str.contains('2023')]
# Seleccionar las columnas mes, conteo y promedio_creditos
conteo_2023 = conteo_2023[['mes', 'conteo', 'promedio_creditos']]
conteo_2023

Unnamed: 0,mes,conteo,promedio_creditos
12,Enero_2023,4,1.07
13,Febrero_2023,6,1.6
14,Marzo_2023,8,2.13
15,Abril_2023,2,0.53
16,Mayo_2023,5,1.33
17,Junio_2023,6,1.6
18,Julio_2023,3,0.8
19,Agosto_2023,4,1.07
20,Septiembre_2023,7,1.87


In [86]:
# Obtener los datos
promedio = conteo_2023['promedio_creditos']
meses = conteo_2023['mes']

# Crear figura
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=meses,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for mes, dia in zip(meses, promedio):
    fig.add_annotation(
        x=mes,
        y=dia,
        text=str(dia),  # Texto que se mostrará (el valor del día)
        showarrow=False,  # No mostrar la flecha
        font=dict(color='black', size=12),  # Estilo del texto
        xshift=0,  # Desplazamiento horizontal del texto
        yshift=17,  # Desplazamiento vertical del texto
        textangle=0  # Ángulo del texto
    )
# Actualizar diseño
fig.update_layout(
    title='Meses de oferta',
    xaxis_title='Mes de oferta créditos',
    yaxis_title='Promedio',
    xaxis=dict(gridcolor='#dddcda', tickmode='array', tickvals=list(range(len(meses))), ticktext=meses),
    yaxis=dict(gridcolor='#dddcda', gridwidth=1),
    plot_bgcolor='rgba(0,0,0,0)'
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_MonthSupply_tulancingo', carpeta='graficas')
fig.show()

# *PUEBLA*

In [87]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in dfs_list if 'puebla' in df]
print(dataframes_pachuca)

['df_alfa_q_puebla', 'df_financiamientos_2019_puebla', 'df_financiamientos_2020_puebla', 'df_financiamientos_2021_puebla', 'df_financiamientos_2022_puebla', 'df_financiamientos_2023_puebla', 'df_grupos_edad_puebla', 'df_jul_2023_puebla', 'df_publicacion_puebla', 'df_sep_2023_puebla']


In [88]:
fin22puebla = df_financiamientos_2022_puebla[['año','mes']]
fin23puebla = df_financiamientos_2023_puebla[['año','mes']]
# Concatenar los DataFrames
fin_puebla = pd.concat([fin22puebla, fin23puebla])

# Filtrar registros con año diferente de 0
fin_puebla_filtrado = fin_puebla[fin_puebla['año'] != 0]

# Contar los registros por año y mes
conteo_registros_por_mes = fin_puebla_filtrado.groupby(['año', 'mes']).size().reset_index(name='conteo')
conteo_registros_por_mes

Unnamed: 0,año,mes,conteo
0,2022,1,236
1,2022,2,261
2,2022,3,296
3,2022,4,262
4,2022,5,258
5,2022,6,263
6,2022,7,288
7,2022,8,274
8,2022,9,224
9,2022,10,225


In [89]:
conteos_por_año = fin_puebla.groupby('año').size()

# Filtrar el conteo para cada año específico
conteo_2022 = conteos_por_año.get(2022, 0)  # Si no hay registros para el año 2022, devolverá 0
conteo_2023 = conteos_por_año.get(2023, 0)  # Si no hay registros para el año 2023, devolverá 0

print("Conteo de registros para 2022:", conteo_2022)
print("Conteo de registros para 2023:", conteo_2023)

Conteo de registros para 2022: 3104
Conteo de registros para 2023: 2057


In [90]:
promedio_2022 = (conteo_2022/12).round(2)
promedio_2023 = (conteo_2023/12).round(2)
print("Promedio de créditos en 2022:", promedio_2022)
print("Promedio de créditos en 2023:", promedio_2023)

Promedio de créditos en 2022: 258.67
Promedio de créditos en 2023: 171.42


In [91]:
# Dividir los conteos por los promedios respectivos de cada año
conteo_registros_por_mes['promedio_creditos'] = conteo_registros_por_mes.apply(lambda row: round(row['conteo'] / promedio_2022, 2) if row['año'] == 2022 else round(row['conteo'] / promedio_2023, 2), axis=1)
conteo_registros_por_mes

Unnamed: 0,año,mes,conteo,promedio_creditos
0,2022,1,236,0.91
1,2022,2,261,1.01
2,2022,3,296,1.14
3,2022,4,262,1.01
4,2022,5,258,1.0
5,2022,6,263,1.02
6,2022,7,288,1.11
7,2022,8,274,1.06
8,2022,9,224,0.87
9,2022,10,225,0.87


In [92]:
# Convertir los valores de la columna mes a enteros
conteo_registros_por_mes['mes'] = conteo_registros_por_mes['mes'].astype(int)
# Mapear los números de mes a sus nombres correspondientes
meses_texto = {1: 'Enero', 2: 'Febrero', 3: 'Marzo', 4: 'Abril', 5: 'Mayo', 6: 'Junio', 7: 'Julio', 8: 'Agosto', 9: 'Septiembre', 10: 'Octubre', 11: 'Noviembre', 12: 'Diciembre'}
# Convertir el número de mes en texto
conteo_registros_por_mes['mes'] = conteo_registros_por_mes.apply(lambda row: f"{meses_texto[row['mes']]}_{int(row['año'])}", axis=1)
# Eliminar la columna 'año' ahora que ya no es necesaria
conteo_registros_por_mes = conteo_registros_por_mes.drop(columns=['año'])
conteo_registros_por_mes

Unnamed: 0,mes,conteo,promedio_creditos
0,Enero_2022,236,0.91
1,Febrero_2022,261,1.01
2,Marzo_2022,296,1.14
3,Abril_2022,262,1.01
4,Mayo_2022,258,1.0
5,Junio_2022,263,1.02
6,Julio_2022,288,1.11
7,Agosto_2022,274,1.06
8,Septiembre_2022,224,0.87
9,Octubre_2022,225,0.87


In [93]:
# Filtrar solo los registros correspondientes a 2023
conteo_2023 = conteo_registros_por_mes[conteo_registros_por_mes['mes'].str.contains('2023')]
# Seleccionar las columnas mes, conteo y promedio_creditos
conteo_2023 = conteo_2023[['mes', 'conteo', 'promedio_creditos']]
conteo_2023

Unnamed: 0,mes,conteo,promedio_creditos
12,Enero_2023,180,1.05
13,Febrero_2023,191,1.11
14,Marzo_2023,261,1.52
15,Abril_2023,215,1.25
16,Mayo_2023,264,1.54
17,Junio_2023,270,1.58
18,Julio_2023,233,1.36
19,Agosto_2023,216,1.26
20,Septiembre_2023,227,1.32


In [94]:
# Obtener los datos
promedio = conteo_2023['promedio_creditos']
meses = conteo_2023['mes']

# Crear figura
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=meses,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for mes, dia in zip(meses, promedio):
    fig.add_annotation(
        x=mes,
        y=dia,
        text=str(dia),  # Texto que se mostrará (el valor del día)
        showarrow=False,  # No mostrar la flecha
        font=dict(color='black', size=12),  # Estilo del texto
        xshift=0,  # Desplazamiento horizontal del texto
        yshift=17,  # Desplazamiento vertical del texto
        textangle=0  # Ángulo del texto
    )
# Actualizar diseño
fig.update_layout(
    title='Meses de oferta',
    xaxis_title='Mes de oferta créditos',
    yaxis_title='Promedio',
    xaxis=dict(gridcolor='#dddcda', tickmode='array', tickvals=list(range(len(meses))), ticktext=meses),
    yaxis=dict(gridcolor='#dddcda', gridwidth=1),
    plot_bgcolor='rgba(0,0,0,0)'
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_MonthSupply_puebla', carpeta='graficas')
fig.show()