# ***Forecast Volumen de créditos generales***

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [3]:
dataframes = {} # Crear un diccionario para almacenar los DataFrames
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [6]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]
# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)
dfs_list = nombres_df 

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df_financiamientos_2022_

___
# **Forecast créditos generales (cantidad)**

In [8]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in dfs_list if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


____
## ***TOTAL***

In [6]:
creditos_2019_pachuca = df_financiamientos_2019_pachuca[['id','año','mes','modalidad','monto']]
creditos_2020_pachuca = df_financiamientos_2020_pachuca[['id','año','mes','modalidad','monto']]
creditos_2021_pachuca = df_financiamientos_2021_pachuca[['id','año','mes','modalidad','monto']]
creditos_2022_pachuca = df_financiamientos_2022_pachuca[['id','año','mes','modalidad','monto']]
creditos_2023_pachuca = df_financiamientos_2023_pachuca[['id','año','mes','modalidad','monto']]

## *Todos*

In [6]:
total_creditos_2019_pachuca = creditos_2019_pachuca.groupby('mes')['monto'].sum().reset_index()
total_creditos_2019_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
# Calcular la variación porcentual
#total_creditos_2019_pachuca['var_porcentual'] = total_creditos_2019_pachuca['montos'].pct_change() * 100
# Asignar el valor '2019' a una nueva columna llamada 'año'
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'montos']]

total_creditos_2019_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,102739300.0
1,2019,2,99691290.0
2,2019,3,112000200.0
3,2019,4,94285300.0
4,2019,5,117702600.0
5,2019,6,120591500.0
6,2019,7,117705800.0
7,2019,8,137996500.0
8,2019,9,135139800.0
9,2019,10,127620400.0


In [7]:
total_creditos_2020_pachuca = creditos_2020_pachuca.groupby('mes')['monto'].sum().reset_index()
total_creditos_2020_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'montos']]
total_creditos_2020_pachuca

Unnamed: 0,año,mes,montos
0,2020,1,123735300.0
1,2020,2,104055900.0
2,2020,3,118739100.0
3,2020,4,72640210.0
4,2020,5,94008970.0
5,2020,6,119111700.0
6,2020,7,122854300.0
7,2020,8,137931900.0
8,2020,9,177645100.0
9,2020,10,150528100.0


In [8]:
total_creditos_2021_pachuca = creditos_2021_pachuca.groupby('mes')['monto'].sum().reset_index()
total_creditos_2021_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'montos']]
total_creditos_2021_pachuca

Unnamed: 0,año,mes,montos
0,2021,1,121462000.0
1,2021,2,155212200.0
2,2021,3,202150600.0
3,2021,4,151115700.0
4,2021,5,174449000.0
5,2021,6,162616400.0
6,2021,7,225396100.0
7,2021,8,142289200.0
8,2021,9,203432400.0
9,2021,10,137778500.0


In [9]:
total_creditos_2022_pachuca = creditos_2022_pachuca.groupby('mes')['monto'].sum().reset_index()
total_creditos_2022_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'montos']]
total_creditos_2022_pachuca

Unnamed: 0,año,mes,montos
0,2022,1,150693800.0
1,2022,2,129754200.0
2,2022,3,193108400.0
3,2022,4,154366100.0
4,2022,5,168913200.0
5,2022,6,184161200.0
6,2022,7,204939500.0
7,2022,8,148889800.0
8,2022,9,219755500.0
9,2022,10,160772700.0


In [10]:
total_creditos_2023_pachuca = creditos_2023_pachuca.groupby('mes')['monto'].sum().reset_index()
total_creditos_2023_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'montos']]
total_creditos_2023_pachuca

Unnamed: 0,año,mes,montos
0,2023,1,127321000.0
1,2023,2,109244100.0
2,2023,3,153431800.0
3,2023,4,23082010.0
4,2023,5,176666700.0
5,2023,6,187011800.0
6,2023,7,152544000.0


In [13]:
total_creditos_pachuca = pd.concat([total_creditos_2019_pachuca, total_creditos_2020_pachuca, total_creditos_2021_pachuca, total_creditos_2022_pachuca, total_creditos_2023_pachuca], ignore_index=True)
total_creditos_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,102739300.0
1,2019,2,99691290.0
2,2019,3,112000200.0
3,2019,4,94285300.0
4,2019,5,117702600.0
5,2019,6,120591500.0
6,2019,7,117705800.0
7,2019,8,137996500.0
8,2019,9,135139800.0
9,2019,10,127620400.0


#### *MODELO DE REGRESIÓN PARA LOS DATOS HASTA 2026*

In [11]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import numpy as np

In [14]:
# Preparar datos para el modelo
X = total_creditos_pachuca[['año', 'mes']]
y = total_creditos_pachuca['montos']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [15]:
# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [16]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): 0.1882772381902832
Error cuadrático medio (MSE): 958188726459763.5
Error absoluto medio (MAE): 24125674.20726629
Raíz del error cuadrático medio (RMSE): 30954623.66852105


##### *PREDICCIONES para los meses y años siguientes hasta diciembre de 2026*

In [17]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas)
# Agregamos las predicciones al DataFrame de nuevas fechas
nuevas_fechas['montos'] = predicciones
nuevas_fechas

Unnamed: 0,año,mes,montos
0,2023,8,191848900.0
1,2023,9,199111000.0
2,2023,10,206373100.0
3,2023,11,213635200.0
4,2023,12,220897400.0
0,2024,1,154641000.0
1,2024,2,161903100.0
2,2024,3,169165300.0
3,2024,4,176427400.0
4,2024,5,183689500.0


In [18]:
total_pachuca = pd.concat([total_creditos_pachuca, nuevas_fechas], ignore_index=True)
total_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,1.027393e+08
1,2019,2,9.969129e+07
2,2019,3,1.120002e+08
3,2019,4,9.428530e+07
4,2019,5,1.177026e+08
...,...,...,...
91,2026,8,2.327296e+08
92,2026,9,2.399917e+08
93,2026,10,2.472538e+08
94,2026,11,2.545159e+08


In [19]:
total_todos_pachuca = total_pachuca.groupby('año')['montos'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
total_todos_pachuca['modalidad'] = 'Créditos (todos)'
# Función para formatear números con separadores de coma y dos decimales
def format_number(x):
   return '{:,.2f}'.format(x)
# Formatear la columna 'montos' con la función personalizada
total_todos_pachuca['montos'] = total_todos_pachuca['montos'].map(format_number)

total_todos_pachuca

Unnamed: 0,año,montos,modalidad
0,2019,1476067496.32,Créditos (todos)
1,2020,1596425866.54,Créditos (todos)
2,2021,2050344728.76,Créditos (todos)
3,2022,2184952825.06,Créditos (todos)
4,2023,1961167179.95,Créditos (todos)
5,2024,2334991621.86,Créditos (todos)
6,2025,2498514183.7,Créditos (todos)
7,2026,2662036745.55,Créditos (todos)


### *Vivienda Nueva*
**Modalidad: 1**
* creditos_2019_pachuca
* creditos_2020_pachuca
* creditos_2021_pachuca
* creditos_2022_pachuca
* creditos_2023_pachuca

In [20]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2019_pachuca_modalidad_1 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 1]
# Agrupar por mes y sumar los montos
total_creditos_2019_pachuca = creditos_2019_pachuca_modalidad_1.groupby('mes')['monto'].sum().reset_index()
total_creditos_2019_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2019_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,79550170.0
1,2019,2,68659340.0
2,2019,3,78133910.0
3,2019,4,65004110.0
4,2019,5,70421220.0
5,2019,6,87465730.0
6,2019,7,80747110.0
7,2019,8,104571700.0
8,2019,9,97843570.0
9,2019,10,78949730.0


In [21]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2020_pachuca_modalidad_1 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 1]
# Agrupar por mes y sumar los montos
total_creditos_2020_pachuca = creditos_2020_pachuca_modalidad_1.groupby('mes')['monto'].sum().reset_index()
total_creditos_2020_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2020_pachuca

Unnamed: 0,año,mes,montos
0,2020,1,89631710.0
1,2020,2,73309050.0
2,2020,3,86460810.0
3,2020,4,46861700.0
4,2020,5,63836530.0
5,2020,6,89948080.0
6,2020,7,81937290.0
7,2020,8,97717820.0
8,2020,9,119553800.0
9,2020,10,87151670.0


In [22]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2021_pachuca_modalidad_1 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 1]
# Agrupar por mes y sumar los montos
total_creditos_2021_pachuca = creditos_2021_pachuca_modalidad_1.groupby('mes')['monto'].sum().reset_index()
total_creditos_2021_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2021_pachuca

Unnamed: 0,año,mes,montos
0,2021,1,86093990.0
1,2021,2,102127100.0
2,2021,3,131089100.0
3,2021,4,82826970.0
4,2021,5,108966900.0
5,2021,6,72376580.0
6,2021,7,131171300.0
7,2021,8,78609090.0
8,2021,9,108294400.0
9,2021,10,88286500.0


In [23]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2022_pachuca_modalidad_1 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 1]
# Agrupar por mes y sumar los montos
total_creditos_2022_pachuca = creditos_2022_pachuca_modalidad_1.groupby('mes')['monto'].sum().reset_index()
total_creditos_2022_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2022_pachuca

Unnamed: 0,año,mes,montos
0,2022,1,87645140.0
1,2022,2,64526770.0
2,2022,3,85162460.0
3,2022,4,89683590.0
4,2022,5,91981350.0
5,2022,6,95839410.0
6,2022,7,114776400.0
7,2022,8,100874800.0
8,2022,9,119183900.0
9,2022,10,98237730.0


In [24]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2023_pachuca_modalidad_1 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 1]
# Agrupar por mes y sumar los montos
total_creditos_2023_pachuca = creditos_2023_pachuca_modalidad_1.groupby('mes')['monto'].sum().reset_index()
total_creditos_2023_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2023_pachuca

Unnamed: 0,año,mes,montos
0,2023,1,83236390.0
1,2023,2,38265310.0
2,2023,3,58085750.0
3,2023,4,4024524.0
4,2023,5,103994700.0
5,2023,6,104852000.0
6,2023,7,87833590.0


In [25]:
total_creditos_nueva_pachuca = pd.concat([total_creditos_2019_pachuca, total_creditos_2020_pachuca, total_creditos_2021_pachuca, total_creditos_2022_pachuca, total_creditos_2023_pachuca], ignore_index=True)
total_creditos_nueva_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,79550170.0
1,2019,2,68659340.0
2,2019,3,78133910.0
3,2019,4,65004110.0
4,2019,5,70421220.0
5,2019,6,87465730.0
6,2019,7,80747110.0
7,2019,8,104571700.0
8,2019,9,97843570.0
9,2019,10,78949730.0


#### *MODELO DE REGRESIÓN PARA LOS DATOS HASTA 2026*

In [26]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import numpy as np

In [27]:
# Preparar datos para el modelo
X = total_creditos_nueva_pachuca[['año', 'mes']]
y = total_creditos_nueva_pachuca['montos']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [28]:
# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [29]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): -0.01703058558648607
Error cuadrático medio (MSE): 508649519469343.44
Error absoluto medio (MAE): 14959219.968036445
Raíz del error cuadrático medio (RMSE): 22553259.619605843


##### *PREDICCIONES para los meses y años siguientes hasta diciembre de 2026*

In [30]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas_nueva = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas_nueva)
# Agregamos las predicciones al DataFrame de nuevas fechas
nuevas_fechas_nueva['montos'] = predicciones
nuevas_fechas_nueva

Unnamed: 0,año,mes,montos
0,2023,8,102181400.0
1,2023,9,106589800.0
2,2023,10,110998200.0
3,2023,11,115406600.0
4,2023,12,119815000.0
0,2024,1,73036180.0
1,2024,2,77444560.0
2,2024,3,81852950.0
3,2024,4,86261330.0
4,2024,5,90669710.0


#Creamos un DataFrame con todas las combinaciones posibles de año y mes
nuevas_fechas_nueva = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                              'mes': np.tile(range(1, 13), 3)})
#Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas_nueva)
#Agregamos las predicciones al DataFrame de nuevas fechas
nuevas_fechas_nueva['montos'] = predicciones
nuevas_fechas_nueva

In [31]:
total_nueva_pachuca = pd.concat([total_creditos_nueva_pachuca, nuevas_fechas_nueva], ignore_index=True)
total_nueva_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,7.955017e+07
1,2019,2,6.865934e+07
2,2019,3,7.813391e+07
3,2019,4,6.500411e+07
4,2019,5,7.042122e+07
...,...,...,...
91,2026,8,1.073217e+08
92,2026,9,1.117301e+08
93,2026,10,1.161385e+08
94,2026,11,1.205469e+08


In [32]:
total_nueva_pachuca = total_nueva_pachuca.groupby('año')['montos'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
total_nueva_pachuca['modalidad'] = 'Nueva'
# Función para formatear números con separadores de coma y dos decimales
def format_number(x):
   return '{:,.2f}'.format(x)
total_nueva_pachuca['montos'] = total_nueva_pachuca['montos'].map(format_number)

total_nueva_pachuca

Unnamed: 0,año,montos,modalidad
0,2019,1030751267.28,Nueva
1,2020,1079870382.75,Nueva
2,2021,1224540479.98,Nueva
3,2022,1207403961.25,Nueva
4,2023,1035283198.58,Nueva
5,2024,1167387411.17,Nueva
6,2025,1187948514.65,Nueva
7,2026,1208509618.13,Nueva


### *Vivienda Usada*
**Modalidad: 3**

In [33]:
# Filtrar los datos donde 'modalidad' sea igual a '3'
creditos_2019_pachuca_modalidad_3 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 3]
# Agrupar por mes y sumar los montos
total_creditos_2019_pachuca = creditos_2019_pachuca_modalidad_3.groupby('mes')['monto'].sum().reset_index()
total_creditos_2019_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2019_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,18394326.86
1,2019,2,28519033.44
2,2019,3,27727681.21
3,2019,4,27303028.49
4,2019,5,38099339.14
5,2019,6,30389506.23
6,2019,7,29593997.21
7,2019,8,31746217.05
8,2019,9,31157273.37
9,2019,10,40195442.1


In [34]:
# Filtrar los datos donde 'modalidad' sea igual a '3'
creditos_2020_pachuca_modalidad_3 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 3]
# Agrupar por mes y sumar los montos
total_creditos_2020_pachuca = creditos_2020_pachuca_modalidad_3.groupby('mes')['monto'].sum().reset_index()
total_creditos_2020_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2020_pachuca

Unnamed: 0,año,mes,montos
0,2020,1,30383812.26
1,2020,2,25831656.8
2,2020,3,22463181.96
3,2020,4,11915884.89
4,2020,5,22469908.2
5,2020,6,23197212.34
6,2020,7,30376591.72
7,2020,8,38619869.89
8,2020,9,40972408.35
9,2020,10,58167267.31


In [35]:
creditos_2021_pachuca_modalidad_3 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 3]
# Agrupar por mes y sumar los montos
total_creditos_2021_pachuca = creditos_2021_pachuca_modalidad_3.groupby('mes')['monto'].sum().reset_index()
total_creditos_2021_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2021_pachuca

Unnamed: 0,año,mes,montos
0,2021,1,28665893.45
1,2021,2,34402318.34
2,2021,3,55745884.69
3,2021,4,58956960.73
4,2021,5,45911602.09
5,2021,6,77986542.39
6,2021,7,80678813.56
7,2021,8,43693388.21
8,2021,9,53846417.51
9,2021,10,32537705.73


In [36]:
creditos_2022_pachuca_modalidad_3 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 3]
# Agrupar por mes y sumar los montos
total_creditos_2022_pachuca = creditos_2022_pachuca_modalidad_3.groupby('mes')['monto'].sum().reset_index()
total_creditos_2022_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2022_pachuca

Unnamed: 0,año,mes,montos
0,2022,1,51602830.0
1,2022,2,44124150.0
2,2022,3,88092920.0
3,2022,4,58594510.0
4,2022,5,68451880.0
5,2022,6,58966240.0
6,2022,7,84180670.0
7,2022,8,38855490.0
8,2022,9,95496290.0
9,2022,10,55260820.0


In [37]:
creditos_2023_pachuca_modalidad_3 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 3]
# Agrupar por mes y sumar los montos
total_creditos_2023_pachuca = creditos_2023_pachuca_modalidad_3.groupby('mes')['monto'].sum().reset_index()
total_creditos_2023_pachuca.rename(columns={'monto': 'montos'}, inplace=True)
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'montos']] # Reordenar las columnas

total_creditos_2023_pachuca

Unnamed: 0,año,mes,montos
0,2023,1,36352545.99
1,2023,2,63804077.43
2,2023,3,72046418.37
3,2023,4,19030483.44
4,2023,5,58391091.29
5,2023,6,69232646.3
6,2023,7,55893725.77


In [38]:
total_creditos_usada_pachuca = pd.concat([total_creditos_2019_pachuca, total_creditos_2020_pachuca, total_creditos_2021_pachuca, total_creditos_2022_pachuca, total_creditos_2023_pachuca], ignore_index=True)
total_creditos_usada_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,18394330.0
1,2019,2,28519030.0
2,2019,3,27727680.0
3,2019,4,27303030.0
4,2019,5,38099340.0
5,2019,6,30389510.0
6,2019,7,29594000.0
7,2019,8,31746220.0
8,2019,9,31157270.0
9,2019,10,40195440.0


#### *MODELO DE REGRESIÓN PARA LOS DATOS HASTA 2026*

In [39]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import numpy as np

In [40]:
# Preparar datos para el modelo
X = total_creditos_usada_pachuca[['año', 'mes']]
y = total_creditos_usada_pachuca['montos']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [41]:
# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [42]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): 0.23282011825675786
Error cuadrático medio (MSE): 125208338348372.6
Error absoluto medio (MAE): 8364801.243545852
Raíz del error cuadrático medio (RMSE): 11189653.182667129


##### *PREDICCIONES para los meses y años siguientes hasta diciembre de 2026*

In [43]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas_usada = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas_usada)
# Agregamos las predicciones al DataFrame de nuevas fechas
nuevas_fechas_usada['montos'] = predicciones
nuevas_fechas_usada

Unnamed: 0,año,mes,montos
0,2023,8,77511890.0
1,2023,9,80471840.0
2,2023,10,83431780.0
3,2023,11,86391730.0
4,2023,12,89351670.0
0,2024,1,67539420.0
1,2024,2,70499360.0
2,2024,3,73459310.0
3,2024,4,76419250.0
4,2024,5,79379200.0


#Creamos un DataFrame con todas las combinaciones posibles de año y mes
nuevas_fechas_usada = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                              'mes': np.tile(range(1, 13), 3)})
#Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas_usada)
#Agregamos las predicciones al DataFrame de nuevas fechas
nuevas_fechas_usada['montos'] = predicciones
nuevas_fechas_usada

In [44]:
total_usada_pachuca = pd.concat([total_creditos_usada_pachuca, nuevas_fechas_usada], ignore_index=True)
total_usada_pachuca

Unnamed: 0,año,mes,montos
0,2019,1,1.839433e+07
1,2019,2,2.851903e+07
2,2019,3,2.772768e+07
3,2019,4,2.730303e+07
4,2019,5,3.809934e+07
...,...,...,...
91,2026,8,1.097533e+08
92,2026,9,1.127133e+08
93,2026,10,1.156732e+08
94,2026,11,1.186332e+08


In [45]:
total_usada_pachuca = total_usada_pachuca.groupby('año')['montos'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
total_usada_pachuca['modalidad'] = 'Usada'
# Función para formatear números con separadores de coma y dos decimales
def format_number(x):
   return '{:,.2f}'.format(x)
total_usada_pachuca['montos'] = total_usada_pachuca['montos'].map(format_number)
total_usada_pachuca

Unnamed: 0,año,montos,modalidad
0,2019,379265106.59,Usada
1,2020,417268347.54,Usada
2,2021,628208169.74,Usada
3,2022,838394556.75,Usada
4,2023,791909895.45,Usada
5,2024,1005829390.08,Usada
6,2025,1134795117.7,Usada
7,2026,1263760845.32,Usada


___
# *Gráfica totales*

In [46]:
forecast_creditosgral_totales_pachuca = pd.concat([total_todos_pachuca, total_nueva_pachuca,total_usada_pachuca], ignore_index=True)
forecast_creditosgral_totales_pachuca

Unnamed: 0,año,montos,modalidad
0,2019,1476067496.32,Créditos (todos)
1,2020,1596425866.54,Créditos (todos)
2,2021,2050344728.76,Créditos (todos)
3,2022,2184952825.06,Créditos (todos)
4,2023,1961167179.95,Créditos (todos)
5,2024,2334991621.86,Créditos (todos)
6,2025,2498514183.7,Créditos (todos)
7,2026,2662036745.55,Créditos (todos)
8,2019,1030751267.28,Nueva
9,2020,1079870382.75,Nueva


In [47]:
# Datos
trimestres = forecast_creditosgral_totales_pachuca['año']
modalidades = forecast_creditosgral_totales_pachuca['modalidad']
montos = forecast_creditosgral_totales_pachuca['montos']

# Limpiar las cadenas de montos y convertirlas a números
promedios_limpios = [float(montos.replace(',', '')) for montos in montos]

fig = go.Figure()
# Agregar líneas para cada modalidad
for modalidad in modalidades.unique():
    df_modalidad = forecast_creditosgral_totales_pachuca[forecast_creditosgral_totales_pachuca['modalidad'] == modalidad]
    fig.add_trace(go.Scatter(
        x=df_modalidad['año'],
        y=df_modalidad['montos'].apply(lambda x: float(x.replace(',', ''))),  # Usar los montos limpios
        mode='markers+lines',
        name=modalidad
    ))

fig.update_layout(
    title='Monto total anual',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Agregar etiquetas de texto a los puntos
for trace in fig.data:
    df_modalidad = forecast_creditosgral_totales_pachuca[forecast_creditosgral_totales_pachuca['modalidad'] == trace.name]
    for i, point in enumerate(trace.y):
        fig.add_annotation(
            x=trace.x[i], 
            y=point, 
            text=f'{df_modalidad.iloc[i]["montos"]}', 
            showarrow=False,
            font=dict(color='black', size=10),
            yshift=10
        )

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_forecastcreditgral_total_pachuca', carpeta='graficas')
fig.show()


___
___
# **Promedio Forecast créditos generales (valor)**

In [48]:
# Para el año 2019
promedio_creditos_2019_pachuca = creditos_2019_pachuca.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
promedio_creditos_2019_pachuca.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
promedio_creditos_2019_pachuca['promedio_montos'] = promedio_creditos_2019_pachuca['montos'] / promedio_creditos_2019_pachuca['num_creditos']
promedio_creditos_2019_pachuca['año'] = 2019
promedio_creditos_2019_pachuca = promedio_creditos_2019_pachuca[['año', 'mes', 'montos', 'promedio_montos']]
promedio_creditos_2019_pachuca


Unnamed: 0,año,mes,montos,promedio_montos
0,2019,1,102739300.0,1317171.0
1,2019,2,99691290.0,1145877.0
2,2019,3,112000200.0,1272730.0
3,2019,4,94285300.0,1193485.0
4,2019,5,117702600.0,1142744.0
5,2019,6,120591500.0,1182270.0
6,2019,7,117705800.0,1121008.0
7,2019,8,137996500.0,1314252.0
8,2019,9,135139800.0,1312037.0
9,2019,10,127620400.0,1192714.0


In [49]:
# Para el año 2020
promedio_creditos_2020_pachuca = creditos_2020_pachuca.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
promedio_creditos_2020_pachuca.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
promedio_creditos_2020_pachuca['promedio_montos'] = promedio_creditos_2020_pachuca['montos'] / promedio_creditos_2020_pachuca['num_creditos']
promedio_creditos_2020_pachuca['año'] = 2020
promedio_creditos_2020_pachuca = promedio_creditos_2020_pachuca[['año', 'mes', 'montos', 'promedio_montos']]
promedio_creditos_2020_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2020,1,123735300.0,1406083.0
1,2020,2,104055900.0,1238761.0
2,2020,3,118739100.0,1187391.0
3,2020,4,72640210.0,1482453.0
4,2020,5,94008970.0,1119154.0
5,2020,6,119111700.0,1280771.0
6,2020,7,122854300.0,1170041.0
7,2020,8,137931900.0,1499259.0
8,2020,9,177645100.0,1315889.0
9,2020,10,150528100.0,1447386.0


In [50]:
# Para el año 2021
promedio_creditos_2021_pachuca = creditos_2021_pachuca.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
promedio_creditos_2021_pachuca.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
promedio_creditos_2021_pachuca['promedio_montos'] = promedio_creditos_2021_pachuca['montos'] / promedio_creditos_2021_pachuca['num_creditos']
promedio_creditos_2021_pachuca['año'] = 2021
promedio_creditos_2021_pachuca = promedio_creditos_2021_pachuca[['año', 'mes', 'montos', 'promedio_montos']]
promedio_creditos_2021_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2021,1,121462000.0,1499531.0
1,2021,2,155212200.0,1385823.0
2,2021,3,202150600.0,1486401.0
3,2021,4,151115700.0,1208926.0
4,2021,5,174449000.0,1516948.0
5,2021,6,162616400.0,1250895.0
6,2021,7,225396100.0,1587296.0
7,2021,8,142289200.0,1237298.0
8,2021,9,203432400.0,1640584.0
9,2021,10,137778500.0,1337655.0


In [51]:
# Para el año 2022
promedio_creditos_2022_pachuca = creditos_2022_pachuca.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
promedio_creditos_2022_pachuca.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
promedio_creditos_2022_pachuca['promedio_montos'] = promedio_creditos_2022_pachuca['montos'] / promedio_creditos_2022_pachuca['num_creditos']
promedio_creditos_2022_pachuca['año'] = 2022
promedio_creditos_2022_pachuca = promedio_creditos_2022_pachuca[['año', 'mes', 'montos', 'promedio_montos']]
promedio_creditos_2022_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2022,1,150693800.0,1477390.0
1,2022,2,129754200.0,1365834.0
2,2022,3,193108400.0,1462942.0
3,2022,4,154366100.0,1354089.0
4,2022,5,168913200.0,1741373.0
5,2022,6,184161200.0,1644296.0
6,2022,7,204939500.0,1652738.0
7,2022,8,148889800.0,1567261.0
8,2022,9,219755500.0,1801274.0
9,2022,10,160772700.0,1435471.0


In [52]:
# Para el año 2023
promedio_creditos_2023_pachuca = creditos_2023_pachuca.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
promedio_creditos_2023_pachuca.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
promedio_creditos_2023_pachuca['promedio_montos'] = promedio_creditos_2023_pachuca['montos'] / promedio_creditos_2023_pachuca['num_creditos']
promedio_creditos_2023_pachuca['año'] = 2023
promedio_creditos_2023_pachuca = promedio_creditos_2023_pachuca[['año', 'mes', 'montos', 'promedio_montos']]
promedio_creditos_2023_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2023,1,127321000.0,1446830.0
1,2023,2,109244100.0,1316195.0
2,2023,3,153431800.0,1581771.0
3,2023,4,23082010.0,1154100.0
4,2023,5,176666700.0,1218391.0
5,2023,6,187011800.0,1289736.0
6,2023,7,152544000.0,1481010.0


In [53]:
promedio_creditos_pachuca = pd.concat([
promedio_creditos_2019_pachuca,
promedio_creditos_2020_pachuca,
promedio_creditos_2021_pachuca,
promedio_creditos_2022_pachuca,
promedio_creditos_2023_pachuca,
], ignore_index=True)
promedio_creditos_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2019,1,102739300.0,1317171.0
1,2019,2,99691290.0,1145877.0
2,2019,3,112000200.0,1272730.0
3,2019,4,94285300.0,1193485.0
4,2019,5,117702600.0,1142744.0
5,2019,6,120591500.0,1182270.0
6,2019,7,117705800.0,1121008.0
7,2019,8,137996500.0,1314252.0
8,2019,9,135139800.0,1312037.0
9,2019,10,127620400.0,1192714.0


### *PROMEDIOS*
#### *MODELO DE REGRESIÓN PARA LOS DATOS HASTA 2026*

MONTOS

In [54]:
X_montos = promedio_creditos_pachuca[['año', 'mes']]
y_montos = promedio_creditos_pachuca['montos']
# Datos en conjuntos de entrenamiento y prueba
X_train_montos, X_test_montos, y_train_montos, y_test_montos = train_test_split(X_montos, y_montos, test_size=0.2, random_state=42)
# Modelo de montos
modelo_montos = LinearRegression()
modelo_montos.fit(X_train_montos, y_train_montos)

In [55]:
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
import numpy as np

# Hacer predicciones en el conjunto de prueba para el modelo de montos
y_pred_montos = modelo_montos.predict(X_test_montos)
# Calcular el coeficiente de determinación (R^2) para el modelo de montos
r2_montos = r2_score(y_test_montos, y_pred_montos)
print("Coeficiente de determinación (R^2) para el modelo de montos:", r2_montos)
# Calcular el error cuadrático medio (MSE) para el modelo de montos
mse_montos = mean_squared_error(y_test_montos, y_pred_montos)
print("Error cuadrático medio (MSE) para el modelo de montos:", mse_montos)
# Calcular el error absoluto medio (MAE) para el modelo de montos
mae_montos = mean_absolute_error(y_test_montos, y_pred_montos)
print("Error absoluto medio (MAE) para el modelo de montos:", mae_montos)
# Calcular la raíz del error cuadrático medio (RMSE) para el modelo de montos
rmse_montos = np.sqrt(mse_montos)
print("Raíz del error cuadrático medio (RMSE) para el modelo de montos:", rmse_montos)


Coeficiente de determinación (R^2) para el modelo de montos: 0.1882772381902832
Error cuadrático medio (MSE) para el modelo de montos: 958188726459763.5
Error absoluto medio (MAE) para el modelo de montos: 24125674.20726629
Raíz del error cuadrático medio (RMSE) para el modelo de montos: 30954623.66852105


PROMEDIO

In [56]:
# Preparar datos para el modelo de promedio
X_promedio = promedio_creditos_pachuca[['año', 'mes']]
y_promedio = promedio_creditos_pachuca['promedio_montos']
# Dividir los datos de promedio en conjuntos de entrenamiento y prueba
X_train_promedio, X_test_promedio, y_train_promedio, y_test_promedio = train_test_split(X_promedio, y_promedio, test_size=0.2, random_state=42)
# Entrenar modelo de promedio
modelo_promedio = LinearRegression()
modelo_promedio.fit(X_train_promedio, y_train_promedio)

In [57]:
# Predicciones en el conjunto de prueba para el modelo de promedio
y_pred_promedio = modelo_promedio.predict(X_test_promedio)
# Calcular el coeficiente de determinación (R^2) para el modelo de promedio
r2_promedio = r2_score(y_test_promedio, y_pred_promedio)
print("Coeficiente de determinación (R^2) para el modelo de promedio:", r2_promedio)
# Calcular el error cuadrático medio (MSE) para el modelo de promedio
mse_promedio = mean_squared_error(y_test_promedio, y_pred_promedio)
print("Error cuadrático medio (MSE) para el modelo de promedio:", mse_promedio)
# Calcular el error absoluto medio (MAE) para el modelo de promedio
mae_promedio = mean_absolute_error(y_test_promedio, y_pred_promedio)
print("Error absoluto medio (MAE) para el modelo de promedio:", mae_promedio)
# Calcular la raíz del error cuadrático medio (RMSE) para el modelo de promedio
rmse_promedio = np.sqrt(mse_promedio)
print("Raíz del error cuadrático medio (RMSE) para el modelo de promedio:", rmse_promedio)

Coeficiente de determinación (R^2) para el modelo de promedio: -0.0378335032178343
Error cuadrático medio (MSE) para el modelo de promedio: 28554654281.235367
Error absoluto medio (MAE) para el modelo de promedio: 149207.84976951443
Raíz del error cuadrático medio (RMSE) para el modelo de promedio: 168981.22464118717


In [58]:
# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2023 (agosto a diciembre)
fechas_2023_faltantes = pd.DataFrame({'año': np.repeat(2023, 5),
                                      'mes': range(8, 13)})

# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024 = pd.DataFrame({'año': np.repeat(2024, 12),
                             'mes': range(1, 13)})
fechas_2025 = pd.DataFrame({'año': np.repeat(2025, 12),
                             'mes': range(1, 13)})
fechas_2026 = pd.DataFrame({'año': np.repeat(2026, 12),
                             'mes': range(1, 13)})

# Concatenar los DataFrames para obtener el DataFrame completo de 2024-2026
fechas_2023_2026 = pd.concat([fechas_2023_faltantes, fechas_2024, fechas_2025, fechas_2026])

# Realizar predicciones con el modelo de montos para 2023 (agosto a diciembre)
predicciones_montos_2023 = modelo_montos.predict(fechas_2023_faltantes[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2023 (agosto a diciembre)
predicciones_promedio_2023 = modelo_promedio.predict(fechas_2023_faltantes[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2023 (agosto a diciembre)
fechas_2023_faltantes['montos_predichos'] = predicciones_montos_2023
fechas_2023_faltantes['promedio_montos_predicho'] = predicciones_promedio_2023

# Realizar predicciones con el modelo de montos para 2024-2026
predicciones_montos_2024_2026 = modelo_montos.predict(fechas_2023_2026[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2024-2026
predicciones_promedio_2024_2026 = modelo_promedio.predict(fechas_2023_2026[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2024-2026
fechas_2023_2026['montos_predichos'] = predicciones_montos_2024_2026
fechas_2023_2026['promedio_montos_predicho'] = predicciones_promedio_2024_2026

# Concatenar los DataFrames para obtener el resultado final
nuevas_fechas = pd.concat([fechas_2023_faltantes, fechas_2023_2026])

nuevas_fechas


Unnamed: 0,año,mes,montos_predichos,promedio_montos_predicho
0,2023,8,191848900.0,1585940.0
1,2023,9,199111000.0,1601280.0
2,2023,10,206373100.0,1616620.0
3,2023,11,213635200.0,1631960.0
4,2023,12,220897400.0,1647300.0
0,2023,8,191848900.0,1585940.0
1,2023,9,199111000.0,1601280.0
2,2023,10,206373100.0,1616620.0
3,2023,11,213635200.0,1631960.0
4,2023,12,220897400.0,1647300.0


In [59]:
# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2023 (agosto a diciembre)
fechas_2023_faltantes = pd.DataFrame({'año': np.repeat(2023, 5),
                                      'mes': range(8, 13)})

# Realizar predicciones con el modelo de montos para 2023 (agosto a diciembre)
predicciones_montos_2023 = modelo_montos.predict(fechas_2023_faltantes[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2023 (agosto a diciembre)
predicciones_promedio_2023 = modelo_promedio.predict(fechas_2023_faltantes[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2023 (agosto a diciembre)
fechas_2023_faltantes['montos_predichos'] = predicciones_montos_2023
fechas_2023_faltantes['promedio_montos_predicho'] = predicciones_promedio_2023

# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                 'mes': np.tile(range(1, 13), 3)})

# Realizar predicciones con el modelo de montos para 2024-2026
predicciones_montos_2024_2026 = modelo_montos.predict(fechas_2024_2026[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2024-2026
predicciones_promedio_2024_2026 = modelo_promedio.predict(fechas_2024_2026[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2024-2026
fechas_2024_2026['montos_predichos'] = predicciones_montos_2024_2026
fechas_2024_2026['promedio_montos_predicho'] = predicciones_promedio_2024_2026

# Concatenar los DataFrames para obtener el resultado final
nuevas_fechas = pd.concat([fechas_2023_faltantes, fechas_2024_2026])
# Cambiar el nombre de las columnas
nuevas_fechas = nuevas_fechas.rename(columns={'montos_predichos': 'montos', 
                                              'promedio_montos_predicho': 'promedio_montos'})
nuevas_fechas


Unnamed: 0,año,mes,montos,promedio_montos
0,2023,8,191848900.0,1585940.0
1,2023,9,199111000.0,1601280.0
2,2023,10,206373100.0,1616620.0
3,2023,11,213635200.0,1631960.0
4,2023,12,220897400.0,1647300.0
0,2024,1,154641000.0,1557764.0
1,2024,2,161903100.0,1573104.0
2,2024,3,169165300.0,1588444.0
3,2024,4,176427400.0,1603784.0
4,2024,5,183689500.0,1619124.0


In [60]:
total_promedios_pachuca = pd.concat([nuevas_fechas, promedio_creditos_pachuca], ignore_index=True)
total_promedios_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2023,8,1.918489e+08,1.585940e+06
1,2023,9,1.991110e+08,1.601280e+06
2,2023,10,2.063731e+08,1.616620e+06
3,2023,11,2.136352e+08,1.631960e+06
4,2023,12,2.208974e+08,1.647300e+06
...,...,...,...,...
91,2023,3,1.534318e+08,1.581771e+06
92,2023,4,2.308201e+07,1.154100e+06
93,2023,5,1.766667e+08,1.218391e+06
94,2023,6,1.870118e+08,1.289736e+06


In [61]:
total_promedios_pachuca = total_promedios_pachuca.groupby('año')['promedio_montos'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
total_promedios_pachuca['modalidad'] = 'Créditos (todos)'
# Función para formatear números con separadores de coma y dos decimales
def format_number(x):
   return '{:,.2f}'.format(x)
# Formatear la columna 'montos' con la función personalizada
total_promedios_pachuca['promedio_montos'] = total_promedios_pachuca['promedio_montos'].map(format_number)

total_promedios_pachuca

Unnamed: 0,año,promedio_montos,modalidad
0,2019,14590982.17,Créditos (todos)
1,2020,16237077.68,Créditos (todos)
2,2021,17161514.3,Créditos (todos)
3,2022,18825452.94,Créditos (todos)
4,2023,17571132.38,Créditos (todos)
5,2024,19705613.3,Créditos (todos)
6,2025,20656071.6,Créditos (todos)
7,2026,21606529.9,Créditos (todos)


## Vivienda nueva: promedio

In [62]:
# Filtrar los datos por la modalidad '1'
creditos_2019_modalidad_1 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 1]
# Calcular la suma y el número de créditos por mes
promedio_creditos_2019_modalidad_1 = creditos_2019_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
# Renombrar las columnas
promedio_creditos_2019_modalidad_1.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
# Calcular el promedio de montos por mes
promedio_creditos_2019_modalidad_1['promedio_montos'] = promedio_creditos_2019_modalidad_1['montos'] / promedio_creditos_2019_modalidad_1['num_creditos']
# Asignar el valor del año 2019 a una nueva columna llamada 'año'
promedio_creditos_2019_modalidad_1['año'] = 2019
# Seleccionar las columnas relevantes
promedio_creditos_2019_modalidad_1 = promedio_creditos_2019_modalidad_1[['año', 'mes', 'montos', 'promedio_montos']]

promedio_creditos_2019_modalidad_1


Unnamed: 0,año,mes,montos,promedio_montos
0,2019,1,79550170.0,1591003.0
1,2019,2,68659340.0,1401211.0
2,2019,3,78133910.0,1562678.0
3,2019,4,65004110.0,1710635.0
4,2019,5,70421220.0,1600482.0
5,2019,6,87465730.0,1650297.0
6,2019,7,80747110.0,1614942.0
7,2019,8,104571700.0,1802961.0
8,2019,9,97843570.0,1778974.0
9,2019,10,78949730.0,1644786.0


In [63]:
# Función para calcular totales y promedios
def calcular_promedio_creditos(df, año):
    # Filtrar los datos por la modalidad '1'
    df_modalidad_1 = df[df['modalidad'] == 1]
    
    # Calcular la suma y el número de créditos por mes
    promedio_creditos = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()

    # Renombrar las columnas
    promedio_creditos.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)

    # Calcular el promedio de montos por mes
    promedio_creditos['promedio_montos'] = promedio_creditos['montos'] / promedio_creditos['num_creditos']

    # Asignar el valor del año
    promedio_creditos['año'] = año

    # Seleccionar las columnas relevantes
    promedio_creditos = promedio_creditos[['año', 'mes', 'montos', 'promedio_montos']]

    return promedio_creditos

# Calcular totales y promedios para el año 2019
promedio_creditos_2019 = calcular_promedio_creditos(creditos_2019_pachuca, 2019)

# Calcular totales y promedios para el año 2020
promedio_creditos_2020 = calcular_promedio_creditos(creditos_2020_pachuca, 2020)

# Calcular totales y promedios para el año 2021
promedio_creditos_2021 = calcular_promedio_creditos(creditos_2021_pachuca, 2021)

# Calcular totales y promedios para el año 2022
promedio_creditos_2022 = calcular_promedio_creditos(creditos_2022_pachuca, 2022)

# Calcular totales y promedios para el año 2023
promedio_creditos_2023 = calcular_promedio_creditos(creditos_2023_pachuca, 2023)
# Concatenar los DataFrames de promedio de créditos de cada año
promedio_creditos_nueva_pachuca = pd.concat([promedio_creditos_2019, promedio_creditos_2020, 
                                             promedio_creditos_2021, promedio_creditos_2022, 
                                             promedio_creditos_2023], ignore_index=True)
promedio_creditos_nueva_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2019,1,79550170.0,1591003.0
1,2019,2,68659340.0,1401211.0
2,2019,3,78133910.0,1562678.0
3,2019,4,65004110.0,1710635.0
4,2019,5,70421220.0,1600482.0
5,2019,6,87465730.0,1650297.0
6,2019,7,80747110.0,1614942.0
7,2019,8,104571700.0,1802961.0
8,2019,9,97843570.0,1778974.0
9,2019,10,78949730.0,1644786.0


### *MODELO REGRESIÓN PARA DATOS HASTA 2026, MODALIDAD 1: NUEVA*

In [64]:
X_montos = promedio_creditos_nueva_pachuca[['año', 'mes']]
y_montos = promedio_creditos_nueva_pachuca['montos']
# Datos en conjuntos de entrenamiento y prueba
X_train_montos, X_test_montos, y_train_montos, y_test_montos = train_test_split(X_montos, y_montos, test_size=0.2, random_state=42)
# Modelo de montos
modelo_montos = LinearRegression()
modelo_montos.fit(X_train_montos, y_train_montos)

In [65]:
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
import numpy as np

# Hacer predicciones en el conjunto de prueba para el modelo de montos
y_pred_montos = modelo_montos.predict(X_test_montos)
# Calcular el coeficiente de determinación (R^2) para el modelo de montos
r2_montos = r2_score(y_test_montos, y_pred_montos)
print("Coeficiente de determinación (R^2) para el modelo de montos:", r2_montos)
# Calcular el error cuadrático medio (MSE) para el modelo de montos
mse_montos = mean_squared_error(y_test_montos, y_pred_montos)
print("Error cuadrático medio (MSE) para el modelo de montos:", mse_montos)
# Calcular el error absoluto medio (MAE) para el modelo de montos
mae_montos = mean_absolute_error(y_test_montos, y_pred_montos)
print("Error absoluto medio (MAE) para el modelo de montos:", mae_montos)
# Calcular la raíz del error cuadrático medio (RMSE) para el modelo de montos
rmse_montos = np.sqrt(mse_montos)
print("Raíz del error cuadrático medio (RMSE) para el modelo de montos:", rmse_montos)


Coeficiente de determinación (R^2) para el modelo de montos: -0.01703058558648607
Error cuadrático medio (MSE) para el modelo de montos: 508649519469343.44
Error absoluto medio (MAE) para el modelo de montos: 14959219.968036445
Raíz del error cuadrático medio (RMSE) para el modelo de montos: 22553259.619605843


In [66]:
# Preparar datos para el modelo de promedio
X_promedio = promedio_creditos_nueva_pachuca[['año', 'mes']]
y_promedio = promedio_creditos_nueva_pachuca['promedio_montos']
# Dividir los datos de promedio en conjuntos de entrenamiento y prueba
X_train_promedio, X_test_promedio, y_train_promedio, y_test_promedio = train_test_split(X_promedio, y_promedio, test_size=0.2, random_state=42)
# Entrenar modelo de promedio
modelo_promedio = LinearRegression()
modelo_promedio.fit(X_train_promedio, y_train_promedio)

In [67]:
# Predicciones en el conjunto de prueba para el modelo de promedio
y_pred_promedio = modelo_promedio.predict(X_test_promedio)
# Calcular el coeficiente de determinación (R^2) para el modelo de promedio
r2_promedio = r2_score(y_test_promedio, y_pred_promedio)
print("Coeficiente de determinación (R^2) para el modelo de promedio:", r2_promedio)
# Calcular el error cuadrático medio (MSE) para el modelo de promedio
mse_promedio = mean_squared_error(y_test_promedio, y_pred_promedio)
print("Error cuadrático medio (MSE) para el modelo de promedio:", mse_promedio)
# Calcular el error absoluto medio (MAE) para el modelo de promedio
mae_promedio = mean_absolute_error(y_test_promedio, y_pred_promedio)
print("Error absoluto medio (MAE) para el modelo de promedio:", mae_promedio)
# Calcular la raíz del error cuadrático medio (RMSE) para el modelo de promedio
rmse_promedio = np.sqrt(mse_promedio)
print("Raíz del error cuadrático medio (RMSE) para el modelo de promedio:", rmse_promedio)

Coeficiente de determinación (R^2) para el modelo de promedio: -0.2638513774346838
Error cuadrático medio (MSE) para el modelo de promedio: 48820750028.3337
Error absoluto medio (MAE) para el modelo de promedio: 175543.1684369562
Raíz del error cuadrático medio (RMSE) para el modelo de promedio: 220954.18083470088


In [68]:
# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2023 (agosto a diciembre)
fechas_2023_faltantes = pd.DataFrame({'año': np.repeat(2023, 5),
                                      'mes': range(8, 13)})

# Realizar predicciones con el modelo de montos para 2023 (agosto a diciembre)
predicciones_montos_2023 = modelo_montos.predict(fechas_2023_faltantes[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2023 (agosto a diciembre)
predicciones_promedio_2023 = modelo_promedio.predict(fechas_2023_faltantes[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2023 (agosto a diciembre)
fechas_2023_faltantes['montos_predichos'] = predicciones_montos_2023
fechas_2023_faltantes['promedio_montos_predicho'] = predicciones_promedio_2023

# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                 'mes': np.tile(range(1, 13), 3)})

# Realizar predicciones con el modelo de montos para 2024-2026
predicciones_montos_2024_2026 = modelo_montos.predict(fechas_2024_2026[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2024-2026
predicciones_promedio_2024_2026 = modelo_promedio.predict(fechas_2024_2026[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2024-2026
fechas_2024_2026['montos_predichos'] = predicciones_montos_2024_2026
fechas_2024_2026['promedio_montos_predicho'] = predicciones_promedio_2024_2026

# Concatenar los DataFrames para obtener el resultado final
nuevas_fechas_promedio = pd.concat([fechas_2023_faltantes, fechas_2024_2026])
# Cambiar el nombre de las columnas
nuevas_fechas_promedio = nuevas_fechas_promedio.rename(columns={'montos_predichos': 'montos', 
                                              'promedio_montos_predicho': 'promedio_montos'})
nuevas_fechas_promedio


Unnamed: 0,año,mes,montos,promedio_montos
0,2023,8,102181400.0,1935878.0
1,2023,9,106589800.0,1968190.0
2,2023,10,110998200.0,2000502.0
3,2023,11,115406600.0,2032814.0
4,2023,12,119815000.0,2065126.0
0,2024,1,73036180.0,1771077.0
1,2024,2,77444560.0,1803389.0
2,2024,3,81852950.0,1835701.0
3,2024,4,86261330.0,1868013.0
4,2024,5,90669710.0,1900325.0


In [70]:
nueva_promedios_pachuca = pd.concat([nuevas_fechas_promedio, promedio_creditos_nueva_pachuca], ignore_index=True)
nueva_promedios_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2023,8,1.021814e+08,1.935878e+06
1,2023,9,1.065898e+08,1.968190e+06
2,2023,10,1.109982e+08,2.000502e+06
3,2023,11,1.154066e+08,2.032814e+06
4,2023,12,1.198150e+08,2.065126e+06
...,...,...,...,...
91,2023,3,5.808575e+07,1.873734e+06
92,2023,4,4.024524e+06,8.049047e+05
93,2023,5,1.039947e+08,1.704830e+06
94,2023,6,1.048520e+08,1.664317e+06


In [71]:
nueva_promedios_pachuca = nueva_promedios_pachuca.groupby('año')['promedio_montos'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
nueva_promedios_pachuca['modalidad'] = 'Nueva'
# Función para formatear números con separadores de coma y dos decimales
def format_number(x):
   return '{:,.2f}'.format(x)
# Formatear la columna 'montos' con la función personalizada
nueva_promedios_pachuca['promedio_montos'] = nueva_promedios_pachuca['promedio_montos'].map(format_number)

nueva_promedios_pachuca

Unnamed: 0,año,promedio_montos,modalidad
0,2019,19872752.86,Nueva
1,2020,20664582.78,Nueva
2,2021,20907961.24,Nueva
3,2022,23342344.52,Nueva
4,2023,21937195.86,Nueva
5,2024,23385520.89,Nueva
6,2025,24122126.73,Nueva
7,2026,24858732.58,Nueva


## Vivienda Usada: promedio

In [117]:
# Filtrar los datos por la modalidad '3'
df_modalidad_1 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 3]
# Calcular la suma y el número de créditos por mes
promedio_creditos_2019 = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
# Renombrar las columnas
promedio_creditos_2019.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
# Calcular el promedio de montos por mes
promedio_creditos_2019['promedio_montos'] = promedio_creditos_2019['montos'] / promedio_creditos_2019['num_creditos']
# Asignar el valor del año
promedio_creditos_2019['año'] = 2019
# Seleccionar las columnas relevantes
promedio_creditos_2019 = promedio_creditos_2019[['año', 'mes', 'montos', 'promedio_montos']]

promedio_creditos_2019

Unnamed: 0,año,mes,montos,promedio_montos
0,2019,1,18394326.86,968122.466316
1,2019,2,28519033.44,950634.448
2,2019,3,27727681.21,924256.040333
3,2019,4,27303028.49,853219.640313
4,2019,5,38099339.14,747045.86549
5,2019,6,30389506.23,779218.108462
6,2019,7,29593997.21,822055.478056
7,2019,8,31746217.05,933712.266176
8,2019,9,31157273.37,865479.815833
9,2019,10,40195442.1,772989.271154


In [118]:
# Filtrar los datos por la modalidad '3'
df_modalidad_1 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 3]
# Calcular la suma y el número de créditos por mes
promedio_creditos_2020 = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
# Renombrar las columnas
promedio_creditos_2020.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
# Calcular el promedio de montos por mes
promedio_creditos_2020['promedio_montos'] = promedio_creditos_2020['montos'] / promedio_creditos_2020['num_creditos']
# Asignar el valor del año
promedio_creditos_2020['año'] = 2020
# Seleccionar las columnas relevantes
promedio_creditos_2020 = promedio_creditos_2020[['año', 'mes', 'montos', 'promedio_montos']]

promedio_creditos_2020

Unnamed: 0,año,mes,montos,promedio_montos
0,2020,1,30383812.26,980123.0
1,2020,2,25831656.8,861055.2
2,2020,3,22463181.96,802256.5
3,2020,4,11915884.89,992990.4
4,2020,5,22469908.2,936246.2
5,2020,6,23197212.34,773240.4
6,2020,7,30376591.72,979890.1
7,2020,8,38619869.89,1287329.0
8,2020,9,40972408.35,1170640.0
9,2020,10,58167267.31,1292606.0


In [119]:
# Filtrar los datos por la modalidad '3'
df_modalidad_1 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 3]
# Calcular la suma y el número de créditos por mes
promedio_creditos_2021 = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
# Renombrar las columnas
promedio_creditos_2021.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
# Calcular el promedio de montos por mes
promedio_creditos_2021['promedio_montos'] = promedio_creditos_2021['montos'] / promedio_creditos_2021['num_creditos']
# Asignar el valor del año
promedio_creditos_2021['año'] = 2021
# Seleccionar las columnas relevantes
promedio_creditos_2021 = promedio_creditos_2021[['año', 'mes', 'montos', 'promedio_montos']]

promedio_creditos_2021

Unnamed: 0,año,mes,montos,promedio_montos
0,2021,1,28665893.45,1246343.0
1,2021,2,34402318.34,982923.4
2,2021,3,55745884.69,1211867.0
3,2021,4,58956960.73,1034333.0
4,2021,5,45911602.09,1020258.0
5,2021,6,77986542.39,1321806.0
6,2021,7,80678813.56,1344647.0
7,2021,8,43693388.21,1040319.0
8,2021,9,53846417.51,1252242.0
9,2021,10,32537705.73,985991.1


In [120]:
# Filtrar los datos por la modalidad '3'
df_modalidad_1 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 3]
# Calcular la suma y el número de créditos por mes
promedio_creditos_2022 = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
# Renombrar las columnas
promedio_creditos_2022.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
# Calcular el promedio de montos por mes
promedio_creditos_2022['promedio_montos'] = promedio_creditos_2022['montos'] / promedio_creditos_2022['num_creditos']
# Asignar el valor del año
promedio_creditos_2022['año'] = 2022
# Seleccionar las columnas relevantes
promedio_creditos_2022 = promedio_creditos_2022[['año', 'mes', 'montos', 'promedio_montos']]

promedio_creditos_2022

Unnamed: 0,año,mes,montos,promedio_montos
0,2022,1,51602830.0,1984724.0
1,2022,2,44124150.0,1297769.0
2,2022,3,88092920.0,1631350.0
3,2022,4,58594510.0,1273794.0
4,2022,5,68451880.0,1755176.0
5,2022,6,58966240.0,1403958.0
6,2022,7,84180670.0,1618859.0
7,2022,8,38855490.0,1253403.0
8,2022,9,95496290.0,1989506.0
9,2022,10,55260820.0,1347825.0


In [121]:
# Filtrar los datos por la modalidad '3'
df_modalidad_1 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 3]
# Calcular la suma y el número de créditos por mes
promedio_creditos_2023 = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()
# Renombrar las columnas
promedio_creditos_2023.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)
# Calcular el promedio de montos por mes
promedio_creditos_2023['promedio_montos'] = promedio_creditos_2023['montos'] / promedio_creditos_2023['num_creditos']
# Asignar el valor del año
promedio_creditos_2023['año'] = 2023
# Seleccionar las columnas relevantes
promedio_creditos_2023 = promedio_creditos_2023[['año', 'mes', 'montos', 'promedio_montos']]

promedio_creditos_2023

Unnamed: 0,año,mes,montos,promedio_montos
0,2023,1,36352545.99,1580545.0
1,2023,2,63804077.43,1595102.0
2,2023,3,72046418.37,1895958.0
3,2023,4,19030483.44,1463883.0
4,2023,5,58391091.29,1191655.0
5,2023,6,69232646.3,1331397.0
6,2023,7,55893725.77,1397343.0


In [122]:
promedio_creditos_usada_pachuca = pd.concat([
    promedio_creditos_2019,
    promedio_creditos_2020,
    promedio_creditos_2021,
    promedio_creditos_2022,
    promedio_creditos_2023], ignore_index=True)
promedio_creditos_usada_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2019,1,18394330.0,968122.5
1,2019,2,28519030.0,950634.4
2,2019,3,27727680.0,924256.0
3,2019,4,27303030.0,853219.6
4,2019,5,38099340.0,747045.9
5,2019,6,30389510.0,779218.1
6,2019,7,29594000.0,822055.5
7,2019,8,31746220.0,933712.3
8,2019,9,31157270.0,865479.8
9,2019,10,40195440.0,772989.3


promedio_creditos_usada_pachuca
promedio_creditos_usada_pachuca.loc[promedio_creditos_usada_pachuca['año'] == 2022, 'promedio_montos'] -= 150000

#Función para calcular totales y promedios
def calcular_promedio_creditos(df, año):
    #Filtrar los datos por la modalidad '3'
    df_modalidad_1 = df[df['modalidad'] == 3]
    
    #Calcular la suma y el número de créditos por mes
    promedio_creditos = df_modalidad_1.groupby('mes')['monto'].agg(['sum', 'count']).reset_index()

    #Renombrar las columnas
    promedio_creditos.rename(columns={'sum': 'montos', 'count': 'num_creditos'}, inplace=True)

    #Calcular el promedio de montos por mes
    promedio_creditos['promedio_montos'] = promedio_creditos['montos'] / promedio_creditos['num_creditos']

    #Asignar el valor del año
    promedio_creditos['año'] = año

    #Seleccionar las columnas relevantes
    promedio_creditos = promedio_creditos[['año', 'mes', 'montos', 'promedio_montos']]

    return promedio_creditos

#Calcular totales y promedios para el año 2019
promedio_creditos_2019 = calcular_promedio_creditos(creditos_2019_pachuca, 2019)

#Calcular totales y promedios para el año 2020
promedio_creditos_2020 = calcular_promedio_creditos(creditos_2020_pachuca, 2020)

#Calcular totales y promedios para el año 2021
promedio_creditos_2021 = calcular_promedio_creditos(creditos_2021_pachuca, 2021)

#Calcular totales y promedios para el año 2022
promedio_creditos_2022 = calcular_promedio_creditos(creditos_2022_pachuca, 2022)

#Calcular totales y promedios para el año 2023
promedio_creditos_2023 = calcular_promedio_creditos(creditos_2023_pachuca, 2023)
#Concatenar los DataFrames de promedio de créditos de cada año
promedio_creditos_usada_pachuca = pd.concat([promedio_creditos_2019, promedio_creditos_2020, 
                                             promedio_creditos_2021, promedio_creditos_2022, 
                                             promedio_creditos_2023], ignore_index=True)
promedio_creditos_usada_pachuca

### *MODELO REGRESIÓN PARA DATOS HASTA 2026, MODALIDAD 1: NUEVA*

In [123]:
X_montos = promedio_creditos_usada_pachuca[['año', 'mes']]
y_montos = promedio_creditos_usada_pachuca['montos']
# Datos en conjuntos de entrenamiento y prueba
X_train_montos, X_test_montos, y_train_montos, y_test_montos = train_test_split(X_montos, y_montos, test_size=0.2, random_state=42)
# Modelo de montos
modelo_montos = LinearRegression()
modelo_montos.fit(X_train_montos, y_train_montos)

In [124]:
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
import numpy as np

# Hacer predicciones en el conjunto de prueba para el modelo de montos
y_pred_montos = modelo_montos.predict(X_test_montos)
# Calcular el coeficiente de determinación (R^2) para el modelo de montos
r2_montos = r2_score(y_test_montos, y_pred_montos)
print("Coeficiente de determinación (R^2) para el modelo de montos:", r2_montos)
# Calcular el error cuadrático medio (MSE) para el modelo de montos
mse_montos = mean_squared_error(y_test_montos, y_pred_montos)
print("Error cuadrático medio (MSE) para el modelo de montos:", mse_montos)
# Calcular el error absoluto medio (MAE) para el modelo de montos
mae_montos = mean_absolute_error(y_test_montos, y_pred_montos)
print("Error absoluto medio (MAE) para el modelo de montos:", mae_montos)
# Calcular la raíz del error cuadrático medio (RMSE) para el modelo de montos
rmse_montos = np.sqrt(mse_montos)
print("Raíz del error cuadrático medio (RMSE) para el modelo de montos:", rmse_montos)


Coeficiente de determinación (R^2) para el modelo de montos: 0.23282011825675786
Error cuadrático medio (MSE) para el modelo de montos: 125208338348372.6
Error absoluto medio (MAE) para el modelo de montos: 8364801.243545852
Raíz del error cuadrático medio (RMSE) para el modelo de montos: 11189653.182667129


In [125]:
# Preparar datos para el modelo de promedio
X_promedio = promedio_creditos_usada_pachuca[['año', 'mes']]
y_promedio = promedio_creditos_usada_pachuca['promedio_montos']
# Dividir los datos de promedio en conjuntos de entrenamiento y prueba
X_train_promedio, X_test_promedio, y_train_promedio, y_test_promedio = train_test_split(X_promedio, y_promedio, test_size=0.2, random_state=42)
# Entrenar modelo de promedio
modelo_promedio = LinearRegression()
modelo_promedio.fit(X_train_promedio, y_train_promedio)

In [126]:
# Predicciones en el conjunto de prueba para el modelo de promedio
y_pred_promedio = modelo_promedio.predict(X_test_promedio)
# Calcular el coeficiente de determinación (R^2) para el modelo de promedio
r2_promedio = r2_score(y_test_promedio, y_pred_promedio)
print("Coeficiente de determinación (R^2) para el modelo de promedio:", r2_promedio)
# Calcular el error cuadrático medio (MSE) para el modelo de promedio
mse_promedio = mean_squared_error(y_test_promedio, y_pred_promedio)
print("Error cuadrático medio (MSE) para el modelo de promedio:", mse_promedio)
# Calcular el error absoluto medio (MAE) para el modelo de promedio
mae_promedio = mean_absolute_error(y_test_promedio, y_pred_promedio)
print("Error absoluto medio (MAE) para el modelo de promedio:", mae_promedio)
# Calcular la raíz del error cuadrático medio (RMSE) para el modelo de promedio
rmse_promedio = np.sqrt(mse_promedio)
print("Raíz del error cuadrático medio (RMSE) para el modelo de promedio:", rmse_promedio)

Coeficiente de determinación (R^2) para el modelo de promedio: 0.19442367313481235
Error cuadrático medio (MSE) para el modelo de promedio: 41462761332.36567
Error absoluto medio (MAE) para el modelo de promedio: 148315.36380126883
Raíz del error cuadrático medio (RMSE) para el modelo de promedio: 203624.06864701843


In [127]:
# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2023 (agosto a diciembre)
fechas_2023_faltantes = pd.DataFrame({'año': np.repeat(2023, 5),
                                      'mes': range(8, 13)})

# Realizar predicciones con el modelo de montos para 2023 (agosto a diciembre)
predicciones_montos_2023 = modelo_montos.predict(fechas_2023_faltantes[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2023 (agosto a diciembre)
predicciones_promedio_2023 = modelo_promedio.predict(fechas_2023_faltantes[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2023 (agosto a diciembre)
fechas_2023_faltantes['montos_predichos'] = predicciones_montos_2023
fechas_2023_faltantes['promedio_montos_predicho'] = predicciones_promedio_2023

# Crear un DataFrame con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                 'mes': np.tile(range(1, 13), 3)})

# Realizar predicciones con el modelo de montos para 2024-2026
predicciones_montos_2024_2026 = modelo_montos.predict(fechas_2024_2026[['año', 'mes']])

# Realizar predicciones con el modelo de promedio para 2024-2026
predicciones_promedio_2024_2026 = modelo_promedio.predict(fechas_2024_2026[['año', 'mes']])

# Agregar las predicciones al DataFrame de fechas para 2024-2026
fechas_2024_2026['montos_predichos'] = predicciones_montos_2024_2026
fechas_2024_2026['promedio_montos_predicho'] = predicciones_promedio_2024_2026

# Concatenar los DataFrames para obtener el resultado final
usadas_fechas_promedio = pd.concat([fechas_2023_faltantes, fechas_2024_2026])
# Cambiar el nombre de las columnas
usadas_fechas_promedio = usadas_fechas_promedio.rename(columns={'montos_predichos': 'montos', 
                                              'promedio_montos_predicho': 'promedio_montos'})
usadas_fechas_promedio


Unnamed: 0,año,mes,montos,promedio_montos
0,2023,8,77511890.0,1724421.0
1,2023,9,80471840.0,1736284.0
2,2023,10,83431780.0,1748147.0
3,2023,11,86391730.0,1760011.0
4,2023,12,89351670.0,1771874.0
0,2024,1,67539420.0,1858098.0
1,2024,2,70499360.0,1869961.0
2,2024,3,73459310.0,1881825.0
3,2024,4,76419250.0,1893688.0
4,2024,5,79379200.0,1905551.0


In [128]:
usada_promedios_pachuca = pd.concat([usadas_fechas_promedio, promedio_creditos_usada_pachuca], ignore_index=True)
usada_promedios_pachuca

Unnamed: 0,año,mes,montos,promedio_montos
0,2023,8,7.751189e+07,1.724421e+06
1,2023,9,8.047184e+07,1.736284e+06
2,2023,10,8.343178e+07,1.748147e+06
3,2023,11,8.639173e+07,1.760011e+06
4,2023,12,8.935167e+07,1.771874e+06
...,...,...,...,...
91,2023,3,7.204642e+07,1.895958e+06
92,2023,4,1.903048e+07,1.463883e+06
93,2023,5,5.839109e+07,1.191655e+06
94,2023,6,6.923265e+07,1.331397e+06


In [129]:
usada_promedios_pachuca = usada_promedios_pachuca.groupby('año')['promedio_montos'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
usada_promedios_pachuca['modalidad'] = 'Usada'

# Función para formatear números con separadores de coma y dos decimales
def format_number(x):
   return '{:,.2f}'.format(x)
# Formatear la columna 'montos' con la función personalizada
usada_promedios_pachuca['promedio_montos'] = usada_promedios_pachuca['promedio_montos'].map(format_number)

usada_promedios_pachuca

Unnamed: 0,año,promedio_montos,modalidad
0,2019,10201652.88,Usada
1,2020,12605352.22,Usada
2,2021,13955995.96,Usada
3,2022,19226154.07,Usada
4,2023,19196621.48,Usada
5,2024,23080154.58,Usada
6,2025,25680798.97,Usada
7,2026,28281443.36,Usada


In [130]:
forecast_creditosgral_promedios_pachuca = pd.concat([
    total_promedios_pachuca,
    nueva_promedios_pachuca,
    usada_promedios_pachuca], ignore_index=True)
forecast_creditosgral_promedios_pachuca

Unnamed: 0,año,promedio_montos,modalidad
0,2019,14590982.17,Créditos (todos)
1,2020,16237077.68,Créditos (todos)
2,2021,17161514.3,Créditos (todos)
3,2022,18825452.94,Créditos (todos)
4,2023,17571132.38,Créditos (todos)
5,2024,19705613.3,Créditos (todos)
6,2025,20656071.6,Créditos (todos)
7,2026,21606529.9,Créditos (todos)
8,2019,19872752.86,Nueva
9,2020,20664582.78,Nueva


In [131]:
# Datos
trimestres = forecast_creditosgral_promedios_pachuca['año']
modalidades = forecast_creditosgral_promedios_pachuca['modalidad']
promedio_montos = forecast_creditosgral_promedios_pachuca['promedio_montos']

# Limpiar las cadenas de montos y convertirlas a números
promedios_limpios = [float(promedio_montos.replace(',', '')) for promedio_montos in promedio_montos]

fig = go.Figure()
# Agregar líneas para cada modalidad
for modalidad in modalidades.unique():
    df_modalidad = forecast_creditosgral_promedios_pachuca[forecast_creditosgral_promedios_pachuca['modalidad'] == modalidad]
    fig.add_trace(go.Scatter(
        x=df_modalidad['año'],
        y=df_modalidad['promedio_montos'].apply(lambda x: float(x.replace(',', ''))),  # Usar los montos limpios
        mode='markers+lines',
        name=modalidad
    ))

fig.update_layout(
    title='Monto promedio por crédito',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Agregar etiquetas de texto a los puntos
for trace in fig.data:
    df_modalidad = forecast_creditosgral_promedios_pachuca[forecast_creditosgral_promedios_pachuca['modalidad'] == trace.name]
    for i, point in enumerate(trace.y):
        fig.add_annotation(
            x=trace.x[i], 
            y=point, 
            text=f'{df_modalidad.iloc[i]["promedio_montos"]}', 
            showarrow=False,
            font=dict(color='black', size=10),
            yshift=10
        )

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_forecastcreditgral_promedio_pachuca', carpeta='graficas')
fig.show()


_____
_____
# **Forecast créditos generales (cantidad)**

## *Todos (cantidad)*

### *3.4 Forecast Monto de créditos generales. [Conteo]*

In [7]:
total_creditos_2019_pachuca = creditos_2019_pachuca.groupby('mes').count().reset_index()
total_creditos_2019_pachuca.rename(columns={'monto': 'num_registros'}, inplace=True)
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2019_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,78
1,2019,2,87
2,2019,3,88
3,2019,4,79
4,2019,5,103
5,2019,6,102
6,2019,7,105
7,2019,8,105
8,2019,9,103
9,2019,10,107


In [8]:
total_creditos_2020_pachuca = creditos_2020_pachuca.groupby('mes').count().reset_index()
total_creditos_2020_pachuca.rename(columns={'monto': 'num_registros'}, inplace=True)
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2020_pachuca

Unnamed: 0,año,mes,num_registros
0,2020,1,88
1,2020,2,84
2,2020,3,100
3,2020,4,49
4,2020,5,84
5,2020,6,93
6,2020,7,105
7,2020,8,92
8,2020,9,135
9,2020,10,104


In [9]:
total_creditos_2021_pachuca = creditos_2021_pachuca.groupby('mes').count().reset_index()
total_creditos_2021_pachuca.rename(columns={'monto': 'num_registros'}, inplace=True)
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2021_pachuca

Unnamed: 0,año,mes,num_registros
0,2021,1,81
1,2021,2,112
2,2021,3,136
3,2021,4,125
4,2021,5,115
5,2021,6,130
6,2021,7,142
7,2021,8,115
8,2021,9,124
9,2021,10,103


In [10]:
total_creditos_2022_pachuca = creditos_2022_pachuca.groupby('mes').count().reset_index()
total_creditos_2022_pachuca.rename(columns={'monto': 'num_registros'}, inplace=True)
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2022_pachuca

Unnamed: 0,año,mes,num_registros
0,2022,1,102
1,2022,2,95
2,2022,3,132
3,2022,4,114
4,2022,5,97
5,2022,6,112
6,2022,7,124
7,2022,8,95
8,2022,9,122
9,2022,10,112


In [11]:
total_creditos_2023_pachuca = creditos_2023_pachuca.groupby('mes').count().reset_index()
total_creditos_2023_pachuca.rename(columns={'monto': 'num_registros'}, inplace=True)
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2023_pachuca

Unnamed: 0,año,mes,num_registros
0,2023,1,88
1,2023,2,83
2,2023,3,97
3,2023,4,20
4,2023,5,145
5,2023,6,145
6,2023,7,103


In [12]:
total_conteo_creditos_pachuca = pd.concat([total_creditos_2019_pachuca, total_creditos_2020_pachuca, total_creditos_2021_pachuca, total_creditos_2022_pachuca, total_creditos_2023_pachuca], ignore_index=True)
total_conteo_creditos_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,78
1,2019,2,87
2,2019,3,88
3,2019,4,79
4,2019,5,103
5,2019,6,102
6,2019,7,105
7,2019,8,105
8,2019,9,103
9,2019,10,107


Modelos regresión 

In [15]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

# Preparar datos para el modelo
X = total_conteo_creditos_pachuca[['año', 'mes']]
y = total_conteo_creditos_pachuca['num_registros']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [17]:
from sklearn.metrics import r2_score
import numpy as np

# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): 0.08071049610327774
Error cuadrático medio (MSE): 377.9875322137994
Error absoluto medio (MAE): 13.82700695981252
Raíz del error cuadrático medio (RMSE): 19.441901455716707


In [18]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas)

# Redondear las predicciones a números enteros
predicciones_enteros = np.round(predicciones).astype(int)

# Agregamos las predicciones redondeadas al DataFrame de nuevas fechas
nuevas_fechas['num_registros'] = predicciones_enteros
nuevas_fechas

Unnamed: 0,año,mes,num_registros
0,2023,8,121
1,2023,9,125
2,2023,10,129
3,2023,11,133
4,2023,12,137
0,2024,1,97
1,2024,2,100
2,2024,3,104
3,2024,4,108
4,2024,5,112


In [19]:
total_conteo_pachuca = pd.concat([total_conteo_creditos_pachuca, nuevas_fechas], ignore_index=True)
total_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,78
1,2019,2,87
2,2019,3,88
3,2019,4,79
4,2019,5,103
...,...,...,...
91,2026,8,131
92,2026,9,134
93,2026,10,138
94,2026,11,142


In [20]:
total_conteo_pachuca = total_conteo_pachuca.groupby('año')['num_registros'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
total_conteo_pachuca['modalidad'] = 'Créditos (todos)'
# Función para formatear números con separadores de coma y sin decimales
def format_number(x):
    return '{:,.0f}'.format(x)  # Formatear sin decimales
# Formatear la columna 'montos' con la función personalizada
total_conteo_pachuca['num_registros'] = total_conteo_pachuca['num_registros'].map(format_number)

total_conteo_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,1215,Créditos (todos)
1,2020,1178,Créditos (todos)
2,2021,1430,Créditos (todos)
3,2022,1388,Créditos (todos)
4,2023,1326,Créditos (todos)
5,2024,1417,Créditos (todos)
6,2025,1456,Créditos (todos)
7,2026,1496,Créditos (todos)


In [21]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2019_pachuca_modalidad_1 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 1]
# Agrupar por mes y contar los registros
total_creditos_2019_pachuca = creditos_2019_pachuca_modalidad_1.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2019_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,50
1,2019,2,49
2,2019,3,50
3,2019,4,38
4,2019,5,44
5,2019,6,53
6,2019,7,50
7,2019,8,58
8,2019,9,55
9,2019,10,48


In [22]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2020_pachuca_modalidad_1 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 1]
# Agrupar por mes y contar los registros
total_creditos_2020_pachuca = creditos_2020_pachuca_modalidad_1.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2020_pachuca

Unnamed: 0,año,mes,num_registros
0,2020,1,45
1,2020,2,44
2,2020,3,58
3,2020,4,26
4,2020,5,43
5,2020,6,52
6,2020,7,57
7,2020,8,54
8,2020,9,79
9,2020,10,48


In [23]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2021_pachuca_modalidad_1 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 1]
# Agrupar por mes y contar los registros
total_creditos_2021_pachuca = creditos_2021_pachuca_modalidad_1.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2021_pachuca

Unnamed: 0,año,mes,num_registros
0,2021,1,49
1,2021,2,61
2,2021,3,75
3,2021,4,53
4,2021,5,53
5,2021,6,55
6,2021,7,70
7,2021,8,53
8,2021,9,56
9,2021,10,55


In [24]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2022_pachuca_modalidad_1 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 1]
# Agrupar por mes y contar los registros
total_creditos_2022_pachuca = creditos_2022_pachuca_modalidad_1.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2022_pachuca

Unnamed: 0,año,mes,num_registros
0,2022,1,57
1,2022,2,39
2,2022,3,55
3,2022,4,51
4,2022,5,43
5,2022,6,45
6,2022,7,53
7,2022,8,48
8,2022,9,58
9,2022,10,42


In [25]:
# Filtrar los datos donde 'modalidad' sea igual a '1'
creditos_2023_pachuca_modalidad_1 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 1]
# Agrupar por mes y contar los registros
total_creditos_2023_pachuca = creditos_2023_pachuca_modalidad_1.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'num_registros']]
total_creditos_2023_pachuca

Unnamed: 0,año,mes,num_registros
0,2023,1,40
1,2023,2,23
2,2023,3,31
3,2023,4,5
4,2023,5,61
5,2023,6,63
6,2023,7,41


In [26]:
nueva_conteo_creditos_pachuca = pd.concat([total_creditos_2019_pachuca, total_creditos_2020_pachuca, total_creditos_2021_pachuca, total_creditos_2022_pachuca, total_creditos_2023_pachuca], ignore_index=True)
nueva_conteo_creditos_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,50
1,2019,2,49
2,2019,3,50
3,2019,4,38
4,2019,5,44
5,2019,6,53
6,2019,7,50
7,2019,8,58
8,2019,9,55
9,2019,10,48


Modelos de regresión

In [27]:
# Preparar datos para el modelo
X = nueva_conteo_creditos_pachuca[['año', 'mes']]
y = nueva_conteo_creditos_pachuca['num_registros']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [28]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): 0.11349565067218248
Error cuadrático medio (MSE): 131.40778520284076
Error absoluto medio (MAE): 6.999417877417355
Raíz del error cuadrático medio (RMSE): 11.463323479813381


In [29]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas)

# Redondear las predicciones a números enteros
predicciones_enteros = np.round(predicciones).astype(int)

# Agregamos las predicciones redondeadas al DataFrame de nuevas fechas
nuevas_fechas['num_registros'] = predicciones_enteros
nuevas_fechas

Unnamed: 0,año,mes,num_registros
0,2023,8,51
1,2023,9,53
2,2023,10,54
3,2023,11,56
4,2023,12,57
0,2024,1,39
1,2024,2,41
2,2024,3,42
3,2024,4,44
4,2024,5,45


In [30]:
nueva_conteo_pachuca = pd.concat([nueva_conteo_creditos_pachuca, nuevas_fechas], ignore_index=True)
nueva_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,50
1,2019,2,49
2,2019,3,50
3,2019,4,38
4,2019,5,44
...,...,...,...
91,2026,8,47
92,2026,9,49
93,2026,10,50
94,2026,11,52


In [31]:
nueva_conteo_pachuca = nueva_conteo_pachuca.groupby('año')['num_registros'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
nueva_conteo_pachuca['modalidad'] = 'Nueva'

# Función para formatear números con separadores de coma y sin decimales
def format_number(x):
    return '{:,.0f}'.format(x)  # Formatear sin decimales

# Formatear la columna 'num_registros' con la función personalizada
nueva_conteo_pachuca['num_registros'] = nueva_conteo_pachuca['num_registros'].map(format_number)

nueva_conteo_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,620,Nueva
1,2020,629,Nueva
2,2021,699,Nueva
3,2022,624,Nueva
4,2023,535,Nueva
5,2024,571,Nueva
6,2025,556,Nueva
7,2026,540,Nueva


In [32]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2019_pachuca_modalidad_2 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 2]
# Agrupar por mes y contar los registros
total_creditos_2019_pachuca = creditos_2019_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2019_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,3
1,2019,2,6
2,2019,3,3
3,2019,4,6
4,2019,5,6
5,2019,6,9
6,2019,7,7
7,2019,8,7
8,2019,9,6
9,2019,10,3


In [33]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2020_pachuca_modalidad_2 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 2]
# Agrupar por mes y contar los registros
total_creditos_2020_pachuca = creditos_2020_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2020_pachuca

Unnamed: 0,año,mes,num_registros
0,2020,1,8
1,2020,2,7
2,2020,3,9
3,2020,4,5
4,2020,5,9
5,2020,6,7
6,2020,7,8
7,2020,8,6
8,2020,9,14
9,2020,10,8


In [34]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2021_pachuca_modalidad_2 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 2]
# Agrupar por mes y contar los registros
total_creditos_2021_pachuca = creditos_2021_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2021_pachuca

Unnamed: 0,año,mes,num_registros
0,2021,1,4
1,2021,2,7
2,2021,3,7
3,2021,4,7
4,2021,5,7
5,2021,6,6
6,2021,7,6
7,2021,8,8
8,2021,9,11
9,2021,10,4


In [35]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2022_pachuca_modalidad_2 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 2]

# Agrupar por mes y contar los registros
total_creditos_2022_pachuca = creditos_2022_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas

total_creditos_2022_pachuca

Unnamed: 0,año,mes,num_registros
0,2022,1,13
1,2022,2,10
2,2022,3,8
3,2022,4,11
4,2022,5,4
5,2022,6,11
6,2022,7,13
7,2022,8,11
8,2022,9,9
9,2022,10,23


In [36]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2023_pachuca_modalidad_2 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 2]

# Agrupar por mes y contar los registros
total_creditos_2023_pachuca = creditos_2023_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas

total_creditos_2023_pachuca

Unnamed: 0,año,mes,num_registros
0,2023,1,19
1,2023,2,14
2,2023,3,11
3,2023,5,28
4,2023,6,18
5,2023,7,13


In [37]:
# Concatenar los DataFrames resultantes para cada año
mejoramiento_conteo_pachuca = pd.concat([total_creditos_2019_pachuca, 
                                         total_creditos_2020_pachuca,
                                         total_creditos_2021_pachuca,
                                         total_creditos_2022_pachuca,
                                         total_creditos_2023_pachuca], ignore_index=True)

mejoramiento_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,3
1,2019,2,6
2,2019,3,3
3,2019,4,6
4,2019,5,6
5,2019,6,9
6,2019,7,7
7,2019,8,7
8,2019,9,6
9,2019,10,3


In [38]:
# Preparar datos para el modelo
X = mejoramiento_conteo_pachuca[['año', 'mes']]
y = mejoramiento_conteo_pachuca['num_registros']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [39]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): 0.4118195454814655
Error cuadrático medio (MSE): 11.57889126167892
Error absoluto medio (MAE): 2.802343682435259
Raíz del error cuadrático medio (RMSE): 3.402776992645701


In [40]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas)

# Redondear las predicciones a números enteros
predicciones_enteros = np.round(predicciones).astype(int)

# Agregamos las predicciones redondeadas al DataFrame de nuevas fechas
nuevas_fechas['num_registros'] = predicciones_enteros
nuevas_fechas

Unnamed: 0,año,mes,num_registros
0,2023,8,16
1,2023,9,16
2,2023,10,17
3,2023,11,17
4,2023,12,18
0,2024,1,15
1,2024,2,15
2,2024,3,16
3,2024,4,16
4,2024,5,17


In [41]:
mejoramiento_conteo_pachuca = pd.concat([mejoramiento_conteo_pachuca, nuevas_fechas], ignore_index=True)
mejoramiento_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,3
1,2019,2,6
2,2019,3,3
3,2019,4,6
4,2019,5,6
...,...,...,...
90,2026,8,24
91,2026,9,24
92,2026,10,25
93,2026,11,25


In [42]:
mejoramiento_conteo_pachuca = mejoramiento_conteo_pachuca.groupby('año')['num_registros'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
mejoramiento_conteo_pachuca['modalidad'] = 'Mejoramientos'

# Función para formatear números con separadores de coma y sin decimales
def format_number(x):
    return '{:,.0f}'.format(x)  # Formatear sin decimales

# Formatear la columna 'num_registros' con la función personalizada
mejoramiento_conteo_pachuca['num_registros'] = mejoramiento_conteo_pachuca['num_registros'].map(format_number)

mejoramiento_conteo_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,75,Mejoramientos
1,2020,94,Mejoramientos
2,2021,89,Mejoramientos
3,2022,152,Mejoramientos
4,2023,187,Mejoramientos
5,2024,210,Mejoramientos
6,2025,243,Mejoramientos
7,2026,276,Mejoramientos


In [43]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2019_pachuca_modalidad_2 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 3]
# Agrupar por mes y contar los registros
total_creditos_2019_pachuca = creditos_2019_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2019_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,19
1,2019,2,30
2,2019,3,30
3,2019,4,32
4,2019,5,51
5,2019,6,39
6,2019,7,36
7,2019,8,34
8,2019,9,36
9,2019,10,52


In [44]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2020_pachuca_modalidad_2 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 3]
# Agrupar por mes y contar los registros
total_creditos_2020_pachuca = creditos_2020_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2020_pachuca

Unnamed: 0,año,mes,num_registros
0,2020,1,31
1,2020,2,30
2,2020,3,28
3,2020,4,12
4,2020,5,24
5,2020,6,30
6,2020,7,31
7,2020,8,30
8,2020,9,35
9,2020,10,45


In [45]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2021_pachuca_modalidad_2 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 3]
# Agrupar por mes y contar los registros
total_creditos_2021_pachuca = creditos_2021_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2021_pachuca

Unnamed: 0,año,mes,num_registros
0,2021,1,23
1,2021,2,35
2,2021,3,46
3,2021,4,57
4,2021,5,45
5,2021,6,59
6,2021,7,60
7,2021,8,42
8,2021,9,43
9,2021,10,33


In [46]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2022_pachuca_modalidad_2 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 3]

# Agrupar por mes y contar los registros
total_creditos_2022_pachuca = creditos_2022_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2022_pachuca

Unnamed: 0,año,mes,num_registros
0,2022,1,26
1,2022,2,34
2,2022,3,54
3,2022,4,46
4,2022,5,39
5,2022,6,42
6,2022,7,52
7,2022,8,31
8,2022,9,48
9,2022,10,41


In [47]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2023_pachuca_modalidad_2 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 3]

# Agrupar por mes y contar los registros
total_creditos_2023_pachuca = creditos_2023_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2023_pachuca

Unnamed: 0,año,mes,num_registros
0,2023,1,23
1,2023,2,40
2,2023,3,38
3,2023,4,13
4,2023,5,49
5,2023,6,52
6,2023,7,40


In [48]:
# Concatenar los DataFrames resultantes para cada año
usada_conteo_pachuca = pd.concat([total_creditos_2019_pachuca, 
                                         total_creditos_2020_pachuca,
                                         total_creditos_2021_pachuca,
                                         total_creditos_2022_pachuca,
                                         total_creditos_2023_pachuca], ignore_index=True)

usada_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,19
1,2019,2,30
2,2019,3,30
3,2019,4,32
4,2019,5,51
5,2019,6,39
6,2019,7,36
7,2019,8,34
8,2019,9,36
9,2019,10,52


In [49]:
# Preparar datos para el modelo
X = usada_conteo_pachuca[['año', 'mes']]
y = usada_conteo_pachuca['num_registros']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [50]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): -0.24750495642062442
Error cuadrático medio (MSE): 53.384964168148706
Error absoluto medio (MAE): 5.602267114520559
Raíz del error cuadrático medio (RMSE): 7.306501499907374


In [51]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas)

# Redondear las predicciones a números enteros
predicciones_enteros = np.round(predicciones).astype(int)

# Agregamos las predicciones redondeadas al DataFrame de nuevas fechas
nuevas_fechas['num_registros'] = predicciones_enteros
nuevas_fechas

Unnamed: 0,año,mes,num_registros
0,2023,8,46
1,2023,9,48
2,2023,10,50
3,2023,11,52
4,2023,12,54
0,2024,1,35
1,2024,2,37
2,2024,3,39
3,2024,4,41
4,2024,5,42


In [52]:
usada_conteo_pachuca = pd.concat([usada_conteo_pachuca, nuevas_fechas], ignore_index=True)
usada_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,19
1,2019,2,30
2,2019,3,30
3,2019,4,32
4,2019,5,51
...,...,...,...
91,2026,8,52
92,2026,9,54
93,2026,10,56
94,2026,11,57


In [53]:
usada_conteo_pachuca = usada_conteo_pachuca.groupby('año')['num_registros'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
usada_conteo_pachuca['modalidad'] = 'Usada'

# Función para formatear números con separadores de coma y sin decimales
def format_number(x):
    return '{:,.0f}'.format(x)  # Formatear sin decimales

# Formatear la columna 'num_registros' con la función personalizada
usada_conteo_pachuca['num_registros'] = usada_conteo_pachuca['num_registros'].map(format_number)
usada_conteo_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,454,Usada
1,2020,385,Usada
2,2021,535,Usada
3,2022,517,Usada
4,2023,505,Usada
5,2024,544,Usada
6,2025,567,Usada
7,2026,588,Usada


In [54]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2019_pachuca_modalidad_2 = creditos_2019_pachuca[creditos_2019_pachuca['modalidad'] == 4]
# Agrupar por mes y contar los registros
total_creditos_2019_pachuca = creditos_2019_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2019_pachuca['año'] = 2019
total_creditos_2019_pachuca = total_creditos_2019_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2019_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,6
1,2019,2,2
2,2019,3,5
3,2019,4,3
4,2019,5,2
5,2019,6,1
6,2019,7,12
7,2019,8,6
8,2019,9,6
9,2019,10,4


In [55]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2020_pachuca_modalidad_2 = creditos_2020_pachuca[creditos_2020_pachuca['modalidad'] == 4]
# Agrupar por mes y contar los registros
total_creditos_2020_pachuca = creditos_2020_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2020_pachuca['año'] = 2020
total_creditos_2020_pachuca = total_creditos_2020_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2020_pachuca

Unnamed: 0,año,mes,num_registros
0,2020,1,4
1,2020,2,3
2,2020,3,5
3,2020,4,6
4,2020,5,8
5,2020,6,4
6,2020,7,9
7,2020,8,2
8,2020,9,7
9,2020,10,3


In [56]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2021_pachuca_modalidad_2 = creditos_2021_pachuca[creditos_2021_pachuca['modalidad'] == 4]
# Agrupar por mes y contar los registros
total_creditos_2021_pachuca = creditos_2021_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2021_pachuca['año'] = 2021
total_creditos_2021_pachuca = total_creditos_2021_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas
total_creditos_2021_pachuca

Unnamed: 0,año,mes,num_registros
0,2021,1,5
1,2021,2,9
2,2021,3,8
3,2021,4,8
4,2021,5,10
5,2021,6,10
6,2021,7,6
7,2021,8,12
8,2021,9,14
9,2021,10,11


In [57]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2022_pachuca_modalidad_2 = creditos_2022_pachuca[creditos_2022_pachuca['modalidad'] == 4]

# Agrupar por mes y contar los registros
total_creditos_2022_pachuca = creditos_2022_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2022_pachuca['año'] = 2022
total_creditos_2022_pachuca = total_creditos_2022_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas

total_creditos_2022_pachuca

Unnamed: 0,año,mes,num_registros
0,2022,1,6
1,2022,2,12
2,2022,3,15
3,2022,4,6
4,2022,5,11
5,2022,6,14
6,2022,7,6
7,2022,8,5
8,2022,9,7
9,2022,10,6


In [58]:
# Filtrar los datos donde 'modalidad' sea igual a '2'
creditos_2023_pachuca_modalidad_2 = creditos_2023_pachuca[creditos_2023_pachuca['modalidad'] == 4]

# Agrupar por mes y contar los registros
total_creditos_2023_pachuca = creditos_2023_pachuca_modalidad_2.groupby('mes').size().reset_index(name='num_registros')
total_creditos_2023_pachuca['año'] = 2023
total_creditos_2023_pachuca = total_creditos_2023_pachuca[['año', 'mes', 'num_registros']] # Reordenar las columnas

total_creditos_2023_pachuca

Unnamed: 0,año,mes,num_registros
0,2023,1,6
1,2023,2,6
2,2023,3,17
3,2023,4,2
4,2023,5,7
5,2023,6,12
6,2023,7,9


In [59]:
# Concatenar los DataFrames resultantes para cada año
otros_conteo_pachuca = pd.concat([total_creditos_2019_pachuca, 
                                         total_creditos_2020_pachuca,
                                         total_creditos_2021_pachuca,
                                         total_creditos_2022_pachuca,
                                         total_creditos_2023_pachuca], ignore_index=True)

otros_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,6
1,2019,2,2
2,2019,3,5
3,2019,4,3
4,2019,5,2
5,2019,6,1
6,2019,7,12
7,2019,8,6
8,2019,9,6
9,2019,10,4


In [60]:
# Preparar datos para el modelo
X = otros_conteo_pachuca[['año', 'mes']]
y = otros_conteo_pachuca['num_registros']
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar y entrenar el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [61]:
from sklearn.metrics import r2_score
# Hacer predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)
# Calcular el coeficiente de determinación (R^2)
r2 = r2_score(y_test, y_pred)
print("Coeficiente de determinación (R^2):", r2)

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pred)
print("Error cuadrático medio (MSE):", mse)

from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_test, y_pred)
print("Error absoluto medio (MAE):", mae)
rmse = np.sqrt(mse)
print("Raíz del error cuadrático medio (RMSE):", rmse)

Coeficiente de determinación (R^2): 0.13575359424285105
Error cuadrático medio (MSE): 16.884946307519836
Error absoluto medio (MAE): 3.756643457571892
Raíz del error cuadrático medio (RMSE): 4.109129628950617


In [62]:
# DF con todas las combinaciones posibles de año y mes para 2023 FALTANTES (AUG-DEC)
fechas_2023 = pd.DataFrame({'año': np.repeat(2023, 5),
                            'mes': range(8, 13)})

# DF con todas las combinaciones posibles de año y mes para 2024-2026
fechas_2024_2026 = pd.DataFrame({'año': np.repeat(range(2024, 2027), 12),
                                  'mes': np.tile(range(1, 13), 3)})
nuevas_fechas = pd.concat([fechas_2023, fechas_2024_2026]) # Concatenamos 

# Realizamos predicciones con el modelo entrenado
predicciones = modelo.predict(nuevas_fechas)

# Redondear las predicciones a números enteros
predicciones_enteros = np.round(predicciones).astype(int)

# Agregamos las predicciones redondeadas al DataFrame de nuevas fechas
nuevas_fechas['num_registros'] = predicciones_enteros
nuevas_fechas

Unnamed: 0,año,mes,num_registros
0,2023,8,9
1,2023,9,9
2,2023,10,9
3,2023,11,9
4,2023,12,9
0,2024,1,9
1,2024,2,10
2,2024,3,10
3,2024,4,10
4,2024,5,10


In [63]:
otros_conteo_pachuca = pd.concat([otros_conteo_pachuca, nuevas_fechas], ignore_index=True)
otros_conteo_pachuca

Unnamed: 0,año,mes,num_registros
0,2019,1,6
1,2019,2,2
2,2019,3,5
3,2019,4,3
4,2019,5,2
...,...,...,...
91,2026,8,11
92,2026,9,11
93,2026,10,11
94,2026,11,11


In [64]:
otros_conteo_pachuca = otros_conteo_pachuca.groupby('año')['num_registros'].sum().reset_index()
# Agregar una nueva columna 'vivienda' con el valor 'Usada'
otros_conteo_pachuca['modalidad'] = 'Otros'

# Función para formatear números con separadores de coma y sin decimales
def format_number(x):
    return '{:,.0f}'.format(x)  # Formatear sin decimales

# Formatear la columna 'num_registros' con la función personalizada
otros_conteo_pachuca['num_registros'] = otros_conteo_pachuca['num_registros'].map(format_number)
otros_conteo_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,66,Otros
1,2020,70,Otros
2,2021,107,Otros
3,2022,95,Otros
4,2023,104,Otros
5,2024,119,Otros
6,2025,122,Otros
7,2026,132,Otros


In [65]:
conteo_pachuca = pd.concat([
    total_conteo_pachuca,
    nueva_conteo_pachuca,
    mejoramiento_conteo_pachuca,
    usada_conteo_pachuca,
    otros_conteo_pachuca,
])
conteo_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,1215,Créditos (todos)
1,2020,1178,Créditos (todos)
2,2021,1430,Créditos (todos)
3,2022,1388,Créditos (todos)
4,2023,1326,Créditos (todos)
5,2024,1417,Créditos (todos)
6,2025,1456,Créditos (todos)
7,2026,1496,Créditos (todos)
0,2019,620,Nueva
1,2020,629,Nueva


In [197]:
# Datos
año = conteo_pachuca['año']
modalidades = conteo_pachuca['modalidad']
creditos = conteo_pachuca['num_registros']

fig = go.Figure()
# Agregar líneas para cada modalidad
for modalidad in modalidades.unique():
    df_modalidad = conteo_pachuca[conteo_pachuca['modalidad'] == modalidad]
    fig.add_trace(go.Scatter(
        x=df_modalidad['año'],
        y=df_modalidad['num_registros'].apply(lambda x: float(x.replace(',', ''))),  # Usar los montos limpios
        mode='markers+lines',
        name=modalidad
    ))
fig.update_layout(
    title='Créditos',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Agregar etiquetas de texto a los puntos
#for trace in fig.data:
#    df_modalidad = conteo_pachuca[conteo_pachuca['modalidad'] == trace.name]
#    for i, point in enumerate(trace.y):
#        fig.add_annotation(
#            x=trace.x[i], 
#            y=point, 
#            text=f'{df_modalidad.iloc[i]["num_registros"]}', 
#            showarrow=False,
#            font=dict(color='black', size=10),
#            yshift=10
#        )
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_forecastcreditgral_conteo_pachuca', carpeta='graficas')
fig.show()


total_conteo_pachuca
nueva_conteo_pachuca
mejoramiento_conteo_pachuca 
usada_conteo_pachuca
otros_conteo_pachuca

In [66]:
conteo_tres_pachuca = pd.concat([
    total_conteo_pachuca,
    nueva_conteo_pachuca,
    usada_conteo_pachuca
])
conteo_tres_pachuca

Unnamed: 0,año,num_registros,modalidad
0,2019,1215,Créditos (todos)
1,2020,1178,Créditos (todos)
2,2021,1430,Créditos (todos)
3,2022,1388,Créditos (todos)
4,2023,1326,Créditos (todos)
5,2024,1417,Créditos (todos)
6,2025,1456,Créditos (todos)
7,2026,1496,Créditos (todos)
0,2019,620,Nueva
1,2020,629,Nueva


In [68]:
# Datos
año = conteo_tres_pachuca['año']
modalidades = conteo_tres_pachuca['modalidad']
creditos = conteo_tres_pachuca['num_registros']

fig = go.Figure()
# Agregar líneas para cada modalidad
for modalidad in modalidades.unique():
    df_modalidad = conteo_tres_pachuca[conteo_tres_pachuca['modalidad'] == modalidad]
    fig.add_trace(go.Scatter(
        x=df_modalidad['año'],
        y=df_modalidad['num_registros'].apply(lambda x: float(x.replace(',', ''))),  # Usar los montos limpios
        mode='markers+lines',
        name=modalidad
    ))
fig.update_layout(
    title='Créditos',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
for trace in fig.data:
    df_modalidad = conteo_tres_pachuca[conteo_tres_pachuca['modalidad'] == trace.name]
    for i, point in enumerate(trace.y):
        # No formatear el valor del monto como moneda
        fig.add_annotation(
            x=trace.x[i], 
            y=point, 
            text=f'{point}',  # Mostrar el valor simple del punto
            showarrow=False,
            font=dict(color='black', size=10),
            yshift=10
        )


# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_forecastcredit_conteo_pachuca', carpeta='graficas')
fig.show()
