# ***3.1 Forecast Precio media anual 2026.***

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [3]:
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [8]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres, solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_pachuca', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_pachuca', 'df_grupos_edad_queretaro', 'df_grupos_edad_

___
# **PACHUCA**
### *Mediante datos directos*


In [25]:
datos_directos = {
    'año': [2022, 2023, 2024, 2025, 2026],
    'promedio': [2220039.00, 2039843.00, 2224331.26, 2425505.09, 2644873.55]
}
# Crear DataFrame
direct_data = pd.DataFrame(datos_directos)
direct_data

Unnamed: 0,año,promedio
0,2022,2220039.0
1,2023,2039843.0
2,2024,2224331.26
3,2025,2425505.09
4,2026,2644873.55


In [26]:
# Datos
año = direct_data['año']
promedio = direct_data['promedio']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Precio Media Anual',
    yaxis=dict(
        range=[-0, 4000000],  # Establecer el rango del eje y
        tickvals=[0, 1000000, 2000000, 3000000],  # Definir los valores de las marcas en el eje y
        ticktext=['$0', '$1,000,000', '$2,000,000', '$3,000,000', '$4,000,000'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',  # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_preciomediaanual_direct_pachuca', carpeta='graficas')
fig.show()


# *Identificamos columnas relevantes*

In [27]:
print("OCTUBRE 2022")
print(df_alfa_q_oct_2022_pachuca.columns)
print("NOVIEMBRE 2022")
print(df_alfa_q_nov_2022_pachuca.columns)
print("FEBRERO 2023")
print(df_alfa_q_feb_2023_pachuca.columns)
print("MAR 2023")
print(df_alfa_q_mar_2023_pachuca.columns)
print("JUNIO 2023")
print(df_alfa_q_jun_2023_pachuca.columns)
print("JULIO 2023")
print(df_alfa_q_jul_2023_pachuca.columns)
print("SEPTIEMBRE 2023")
print(df_alfa_q_sep_2023_pachuca.columns)

OCTUBRE 2022
Index(['id', 'q', 'categoria', 'ids', 'propiedad', 'precio', 'm2_total',
       'm2_contruido', 'precio_m2_contruido', 'precio_m2_terreno',
       'publicado_hace', 'personas_interesadas', 'status', 'tipo',
       'estacionamiento', 'recamaras', 'baño', 'medio_baño', 'baño_total',
       'cantidad_pisos', 'antiguedad', 'seguridad_privada', 'fraccionamiento',
       'colonia', 'cp', 'url'],
      dtype='object')
NOVIEMBRE 2022
Index(['id', 'categoria', 'ids', 'propiedad', 'precio', 'm2_total',
       'm2_contruido', 'precio_m2_contruido', 'precio_m2_terreno',
       'publicado_hace', 'personas_interesadas', 'promedio', 'status', 'tipo',
       'estacionamiento', 'recamaras', 'baño', 'medio_baño', 'baño_total',
       'cantidad_piso', 'antiguedad', 'seguridad', 'fraccionamiento',
       'colonia', 'cp', 'url'],
      dtype='object')
FEBRERO 2023
Index(['id', 'categoria', 'ids', 'propiedad', 'precio', 'tipo',
       'personas_interesadas', 'm2_total', 'm2_contruido',
       '

In [28]:
# Crea los DataFrames para cada archivo con las columnas necesarias
oct_2022 = df_alfa_q_oct_2022_pachuca[['categoria','propiedad','precio','m2_total','m2_contruido']]
nov_2022 = df_alfa_q_nov_2022_pachuca[['categoria','propiedad','precio','m2_total']]
feb_2023 = df_alfa_q_feb_2023_pachuca[['categoria','propiedad','precio','m2_total']]
mar_2023 = df_alfa_q_mar_2023_pachuca[['categoria','propiedad','precio','m2_total']]
jun_2023 = df_alfa_q_jun_2023_pachuca[['categoria','propiedad','precio','m2_total','m2_contruido']]
jul_2023 = df_alfa_q_jul_2023_pachuca[['categoria','propiedad','precio','m2_total','m2_contruido']]
sep_2023 = df_alfa_q_sep_2023_pachuca[['categoria','propiedad','precio','m2_total','m2_construido']] 

In [None]:
# Lista de DataFrames
df_list = [df1, df2, df3]

# Define un diccionario para mapear nombres de columnas
mapeo_columnas = {
    'm2_contruido': 'm2_construido',  # Aquí defines los mapeos para las columnas
    # Agrega más mapeos si es necesario
}

# Iterar sobre cada DataFrame en df_list y renombrar las columnas según el mapeo
for df in df_list:
    df.rename(columns=mapeo_columnas, inplace=True)


___
## Modelo predictor de precios
### **1** *Limpieza de datos*

In [None]:
df_modelo1.info()

_______
____
____
# **TULANCINGO**

* 'df_alfa_q_may_2022_tulancingo',
* 'df_alfa_q_jul_2022_tulancingo',
* 'df_alfa_q_oct_2022_tulancingo',
* 'df_alfa_q_mar_2023_tulancingo',
* 'df_alfa_q_may_2023_tulancingo',
* 'df_alfa_q_jun_2023_tulancingo',
* 'df_alfa_q_jul_2023_tulancingo',
* 'df_alfa_q_sep_2023_tulancingo'
* 'df_alfa_q_oct_2023_tulancingo',

In [4]:
precio_promedio = df_alfa_q_may_2022_tulancingo['precio'].median()
may_2022 = pd.DataFrame({'precio_promedio': [precio_promedio]})
may_2022['mes'] = 'Mayo'
may_2022['año'] = 2022
may_2022

Unnamed: 0,precio_promedio,mes,año
0,1420000.0,Mayo,2022


In [5]:
precio_promedio = df_alfa_q_jul_2022_tulancingo['precio'].median()
jul_2022 = pd.DataFrame({'precio_promedio': [precio_promedio]})
jul_2022['mes'] = 'Julio'
jul_2022['año'] = 2022
jul_2022

Unnamed: 0,precio_promedio,mes,año
0,1365000.0,Julio,2022


In [6]:
precio_promedio = df_alfa_q_oct_2022_tulancingo['precio'].median()
oct_2022 = pd.DataFrame({'precio_promedio': [precio_promedio]})
oct_2022['mes'] = 'Octubre'
oct_2022['año'] = 2022
oct_2022

Unnamed: 0,precio_promedio,mes,año
0,1350000.0,Octubre,2022


In [7]:
precio_promedio = df_alfa_q_mar_2023_tulancingo['precio'].median()
mar_2023 = pd.DataFrame({'precio_promedio': [precio_promedio]})
mar_2023['mes'] = 'Marzo'
mar_2023['año'] = 2023
mar_2023

Unnamed: 0,precio_promedio,mes,año
0,1045000.0,Marzo,2023


In [8]:
precio_promedio = df_alfa_q_may_2023_tulancingo['precio'].median()
may_2023 = pd.DataFrame({'precio_promedio': [precio_promedio]})
may_2023['mes'] = 'Mayo'
may_2023['año'] = 2023
may_2023

Unnamed: 0,precio_promedio,mes,año
0,1200000.0,Mayo,2023


In [9]:
precio_promedio = df_alfa_q_jun_2023_tulancingo['precio'].median()
jun_2023 = pd.DataFrame({'precio_promedio': [precio_promedio]})
jun_2023['mes'] = 'Junio'
jun_2023['año'] = 2023
jun_2023

Unnamed: 0,precio_promedio,mes,año
0,1500000.0,Junio,2023


In [10]:
precio_promedio = df_alfa_q_jul_2023_tulancingo['precio'].median()
jul_2023 = pd.DataFrame({'precio_promedio': [precio_promedio]})
jul_2023['mes'] = 'Julio'
jul_2023['año'] = 2023
jul_2023

Unnamed: 0,precio_promedio,mes,año
0,1149950.0,Julio,2023


In [11]:
precio_promedio = df_alfa_q_sep_2023_tulancingo['precio'].median()
sep_2023 = pd.DataFrame({'precio_promedio': [precio_promedio]})
sep_2023['mes'] = 'Septiembre'
sep_2023['año'] = 2023
sep_2023

Unnamed: 0,precio_promedio,mes,año
0,1222500.0,Septiembre,2023


In [12]:
precio_promedio = df_alfa_q_oct_2023_tulancingo['precio'].median()
oct_2023 = pd.DataFrame({'precio_promedio': [precio_promedio]})
oct_2023['mes'] = 'Octubre'
oct_2023['año'] = 2023
oct_2023

Unnamed: 0,precio_promedio,mes,año
0,1200000.0,Octubre,2023


In [25]:
tulancingo_months = pd.concat([may_2022, jul_2022, oct_2022, mar_2023, may_2023, jun_2023, jul_2023, sep_2023, oct_2023], ignore_index=True)
tulancingo_months

Unnamed: 0,precio_promedio,mes,año
0,1420000.0,Mayo,2022
1,1365000.0,Julio,2022
2,1350000.0,Octubre,2022
3,1045000.0,Marzo,2023
4,1200000.0,Mayo,2023
5,1500000.0,Junio,2023
6,1149950.0,Julio,2023
7,1222500.0,Septiembre,2023
8,1200000.0,Octubre,2023


SACAR MESES FALTANTES

In [21]:
# mediana para construir junio 2022
precio_mayo_2022 = tulancingo_months[(tulancingo_months['mes'] == 'Mayo') & (tulancingo_months['año'] == 2022)]
precio_julio_2022 = tulancingo_months[(tulancingo_months['mes'] == 'Julio') & (tulancingo_months['año'] == 2022)]
jun_22 = pd.concat([precio_mayo_2022, precio_julio_2022])
jun_22 = jun_22['precio_promedio'].median()
# mediana para construir agosto 2022
precio_oct_2022 = tulancingo_months[(tulancingo_months['mes'] == 'Octubre') & (tulancingo_months['año'] == 2022)]
precio_julio_2022 = tulancingo_months[(tulancingo_months['mes'] == 'Julio') & (tulancingo_months['año'] == 2022)]
aug_22 = pd.concat([precio_julio_2022, precio_oct_2022])
aug_22= aug_22['precio_promedio'].median()
# mediana para construir Abril 2023
precio_mar_2023 = tulancingo_months[(tulancingo_months['mes'] == 'Marzo') & (tulancingo_months['año'] == 2023)]
precio_may_2023 = tulancingo_months[(tulancingo_months['mes'] == 'Mayo') & (tulancingo_months['año'] == 2023)]
apr_23 = pd.concat([precio_mar_2023, precio_may_2023])
apr_23 = apr_23['precio_promedio'].median()
# mediana para construir Agosto 2023
precio_sep_2023 = tulancingo_months[(tulancingo_months['mes'] == 'Septiembre') & (tulancingo_months['año'] == 2023)]
precio_julio_2023 = tulancingo_months[(tulancingo_months['mes'] == 'Julio') & (tulancingo_months['año'] == 2023)]
Agosto_23 = pd.concat([precio_julio_2023, precio_sep_2023])
Agosto_23 = Agosto_23['precio_promedio'].median()
# mediana para construir Noviembre 2023
precio_sep_2023 = tulancingo_months[(tulancingo_months['mes'] == 'Septiembre') & (tulancingo_months['año'] == 2023)]
precio_oct_2023 = tulancingo_months[(tulancingo_months['mes'] == 'Octubre') & (tulancingo_months['año'] == 2023)]
Noviembre_23 = pd.concat([precio_sep_2023, precio_oct_2023])
Noviembre_23 = Noviembre_23['precio_promedio'].median()


In [39]:
# Nuevos registros
nuevos_registros = pd.DataFrame({
    'precio_promedio': [jun_22, aug_22,apr_23, Agosto_23,Noviembre_23],
    'mes': ['Junio', 'Agosto', 'Abril','Agosto','Noviembre'],
    'año': [2022,2022, 2023, 2023,2023]
})
tulancingo_months = tulancingo_months.append(nuevos_registros, ignore_index=True)
tulancingo_months

  tulancingo_months = tulancingo_months.append(nuevos_registros, ignore_index=True)


Unnamed: 0,precio_promedio,mes,año,cambio_porcentaje
0,1420000.0,Mayo,2022,
1,1365000.0,Julio,2022,-3.873239
2,1350000.0,Octubre,2022,-1.098901
3,1045000.0,Marzo,2023,-22.592593
4,1200000.0,Mayo,2023,14.832536
5,1500000.0,Junio,2023,25.0
6,1149950.0,Julio,2023,-23.336667
7,1222500.0,Septiembre,2023,6.30897
8,1200000.0,Octubre,2023,-1.840491
9,1392500.0,Junio,2022,


In [23]:
# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo['precio_promedio'].interpolate(method='quadratic')

# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna()
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes'])
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
6,Abril,2022,1382549.0
14,Agosto,2022,1027664.0
12,Julio,2022,1365000.0
10,Junio,2022,1328141.0
8,Mayo,2022,1420000.0
18,Octubre,2022,1350000.0
16,Septiembre,2022,1097381.0
7,Abril,2023,1507549.0
15,Agosto,2023,1021288.0
13,Julio,2023,1149950.0


In [72]:
# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023,2024,2025,2026]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])
# Fusionar tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')
# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo['precio_promedio'].interpolate()
# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna()
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes'])
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
15,Abril,2022,1211667.0
35,Agosto,2022,1178970.0
55,Diciembre,2022,1200000.0
30,Julio,2022,1365000.0
25,Junio,2022,1440000.0
20,Mayo,2022,1420000.0
50,Noviembre,2022,1200000.0
45,Octubre,2022,1350000.0
40,Septiembre,2022,1215245.0
16,Abril,2023,1253333.0


In [15]:
tulancingo_completo['cambio_porcentaje'] = tulancingo_completo['precio_promedio'].pct_change() * 100
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio,cambio_porcentaje
6,Abril,2022,1382549.0,
14,Agosto,2022,1027664.0,-25.668878
12,Julio,2022,1365000.0,32.825463
10,Junio,2022,1328141.0,-2.7003
8,Mayo,2022,1420000.0,6.916367
18,Octubre,2022,1350000.0,-4.929577
16,Septiembre,2022,1097381.0,-18.712555
7,Abril,2023,1507549.0,37.37708
15,Agosto,2023,1021288.0,-32.255066
13,Julio,2023,1149950.0,12.597983


In [91]:
# Calcular el cambio porcentaje promedio
cambio_porcentaje_tulancingo = tulancingo_completo['cambio_porcentaje'].mean()
# Calcular el cambio y redondear a dos decimales en formato '00.00'
cambio_tulancingo = cambio_porcentaje_tulancingo * 1.2
print("Cambio:", cambio_tulancingo)

Cambio: 1.3036769019360799


In [92]:
cambio_porcentaje_tulancingo

1.0863974182800666

In [19]:
# Calcular el cambio porcentaje promedio
cambio_porcentaje_tulancingo = tulancingo_months['cambio_porcentaje'].mean()

# Redondear a dos decimales y formatear como '00.00'
cambio_porcentaje_tulancingo = round(cambio_porcentaje_tulancingo, 2)
cambio_porcentaje_tulancingo_formatted = "{:.2f}".format(cambio_porcentaje_tulancingo)

# Calcular el cambio y redondear a dos decimales en formato '00.00'
cambio_tulancingo = cambio_porcentaje_tulancingo * 1.2
cambio_tulancingo_formatted = "{:.2f}".format(cambio_tulancingo)

# Mostrar los resultados
print("Cambio porcentaje promedio de Tulancingo:", cambio_porcentaje_tulancingo_formatted)
print("Cambio de Tulancingo:", cambio_tulancingo_formatted)

Cambio porcentaje promedio de Tulancingo: -0.20
Cambio de Tulancingo: -0.24


In [93]:
precio_media_anual_tulancingo = tulancingo_completo.groupby('año')['precio_promedio'].mean().reset_index()
precio_media_anual_tulancingo.rename(columns={'precio_promedio': 'precio'}, inplace=True)
precio_media_anual_tulancingo

Unnamed: 0,año,precio
0,2022,1281534.0
1,2023,1230786.0


In [94]:
# valor del cambio: 3.59
# Años siguientes
años_siguientes = [2024, 2025, 2026]

# Verificar si el año 2023 está presente en el DataFrame precio_media_anual_tulancingo
if 2023 in precio_media_anual_tulancingo['año'].values:
    # Obtener el precio del año anterior (2023)
    precio_anterior_2024 = precio_media_anual_tulancingo.loc[precio_media_anual_tulancingo['año'] == 2023, 'precio'].values[0]
else:
    # Asignar 0 si el año 2023 no está presente
    precio_anterior_2024 = 0

# Calcular el precio para el año 2024
precio_nuevo_2024 = (precio_anterior_2024 * cambio_tulancingo) + precio_anterior_2024

# Calcular el precio para el año 2025 basado en el precio del año 2024
precio_nuevo_2025 = (precio_nuevo_2024 * cambio_tulancingo) + precio_nuevo_2024

# Calcular el precio para el año 2026 basado en el precio del año 2025
precio_nuevo_2026 = (precio_nuevo_2025 * cambio_tulancingo) + precio_nuevo_2025

# Crear un DataFrame para los años 2024, 2025 y 2026
precios_siguientes = {'año': [2024, 2025, 2026], 'precio': [precio_nuevo_2024, precio_nuevo_2025, precio_nuevo_2026]}
precio_media_anual_siguientes = pd.DataFrame(precios_siguientes)
precio_media_anual_siguientes

Unnamed: 0,año,precio
0,2024,3579671.0
1,2025,10411270.0
2,2026,30280590.0


In [95]:
tulancingo_precio_media_anual = pd.concat([precio_media_anual_tulancingo,precio_media_anual_siguientes], ignore_index=True)
tulancingo_precio_media_anual

Unnamed: 0,año,precio
0,2022,1281534.0
1,2023,1230786.0
2,2024,3579671.0
3,2025,10411270.0
4,2026,30280590.0


In [97]:
# Datos
año = tulancingo_precio_media_anual['año']
promedio = tulancingo_precio_media_anual['precio']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Precio Media Anual',
    yaxis=dict(
        #range=[0, 10000000],  # Establecer el rango del eje y
        #tickvals=[0, 1000000,5000000, 10000000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$500,000.00', '$1,000,000.00'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',   # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_preciomediaanual_prom_tulancingo', carpeta='graficas')
fig.show()

In [56]:
import pandas as pd

# Definir la función para calcular la mediana de los meses cercanos
def calcular_mediana_mes_cercano(mes, año, df):
    # Obtener los meses circundantes disponibles en el DataFrame
    meses_disponibles = df[(df['año'] == año) & (df['mes'] != mes)]['mes']
    meses_anteriores = [m for m in meses_disponibles if meses.index(m) < meses.index(mes)]
    meses_siguientes = [m for m in meses_disponibles if meses.index(m) > meses.index(mes)]
    
    # Calcular la mediana de los meses anteriores y siguientes si están disponibles
    mediana_anterior = df[(df['año'] == año) & (df['mes'].isin(meses_anteriores))]['precio_promedio'].median()
    mediana_siguiente = df[(df['año'] == año) & (df['mes'].isin(meses_siguientes))]['precio_promedio'].median()
    
    return (mediana_anterior + mediana_siguiente) / 2

# Definir los meses y años para los que se desean calcular los valores siguientes
meses_siguientes = [('Junio', 2022), ('Agosto', 2022), ('Abril', 2023), ('Agosto', 2023), ('Noviembre', 2023)]

# Calcular los valores para los meses siguientes y almacenarlos en un DataFrame
valores_siguientes = []
for mes, año in meses_siguientes:
    mediana = calcular_mediana_mes_cercano(mes, año, tulancingo_months)
    valores_siguientes.append((mediana, mes, año))

# Crear un DataFrame con los valores calculados
df_valores_siguientes = pd.DataFrame(valores_siguientes, columns=['precio_promedio', 'mes', 'año'])
tulancingo_completo = df_valores_siguientes.dropna()
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes'])
tulancingo_completo

Unnamed: 0,precio_promedio,mes,año
1,1886514.0,Agosto,2022
0,1868453.0,Junio,2022
2,1641829.0,Abril,2023
3,1648474.0,Agosto,2023


In [57]:
tulancingo_months = pd.concat([tulancingo_months,tulancingo_completo], ignore_index=True)
tulancingo_months

Unnamed: 0,precio_promedio,mes,año
0,1968350.0,Mayo,2022
1,1496517.0,Julio,2022
2,2040594.0,Octubre,2022
3,1634948.0,Marzo,2023
4,1648710.0,Mayo,2023
5,2820898.0,Junio,2023
6,1591641.0,Julio,2023
7,1671257.0,Septiembre,2023
8,1638982.0,Octubre,2023
9,1886514.0,Agosto,2022


In [58]:
tulancingo_months['cambio_porcentaje'] = tulancingo_months['precio_promedio'].pct_change() * 100
tulancingo_months['precio_promedio'] = tulancingo_months['precio_promedio'].round(2)
tulancingo_months

Unnamed: 0,precio_promedio,mes,año,cambio_porcentaje
0,1968350.0,Mayo,2022,
1,1496516.67,Julio,2022,-23.971008
2,2040593.72,Octubre,2022,36.356231
3,1634947.58,Marzo,2023,-19.878829
4,1648709.85,Mayo,2023,0.841757
5,2820897.98,Junio,2023,71.097296
6,1591641.07,Julio,2023,-43.576794
7,1671256.9,Septiembre,2023,5.002122
8,1638981.97,Octubre,2023,-1.931177
9,1886513.53,Agosto,2022,15.102763


In [26]:
import pandas as pd

# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes en tu DataFrame
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar con tu DataFrame tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Calcular los valores faltantes como la mediana de los dos valores cercanos
for i, row in tulancingo_completo.iterrows():
    if pd.isna(row['precio_promedio']):
        # Encontrar los dos meses más cercanos
        mes_anterior = tulancingo_completo.loc[(tulancingo_completo['año'] == row['año']) & (tulancingo_completo['mes'] < row['mes'])]['mes'].max()
        mes_siguiente = tulancingo_completo.loc[(tulancingo_completo['año'] == row['año']) & (tulancingo_completo['mes'] > row['mes'])]['mes'].min()
        
        # Calcular la mediana de los dos valores cercanos si existen
        if pd.notnull(mes_anterior) and pd.notnull(mes_siguiente):
            precio_anterior = tulancingo_completo.loc[(tulancingo_completo['año'] == row['año']) & (tulancingo_completo['mes'] == mes_anterior)]['precio_promedio'].values
            precio_siguiente = tulancingo_completo.loc[(tulancingo_completo['año'] == row['año']) & (tulancingo_completo['mes'] == mes_siguiente)]['precio_promedio'].values
            mediana = (precio_anterior + precio_siguiente) / 2
            tulancingo_completo.at[i, 'precio_promedio'] = mediana

# Imprimir el DataFrame resultante
print(tulancingo_completo)


           mes   año  precio_promedio
0        Enero  2022              NaN
1        Enero  2023              NaN
2      Febrero  2022              NaN
3      Febrero  2023              NaN
4        Marzo  2022              NaN
5        Marzo  2023        1045000.0
6        Abril  2022              NaN
7        Abril  2023              NaN
8         Mayo  2022        1420000.0
9         Mayo  2023        1200000.0
10       Junio  2022              NaN
11       Junio  2023        1500000.0
12       Julio  2022        1365000.0
13       Julio  2023        1149950.0
14      Agosto  2022              NaN
15      Agosto  2023              NaN
16  Septiembre  2022              NaN
17  Septiembre  2023        1222500.0
18     Octubre  2022        1350000.0
19     Octubre  2023        1200000.0
20   Noviembre  2022        1385000.0
21   Noviembre  2023        1200000.0
22   Diciembre  2022              NaN
23   Diciembre  2023              NaN


In [27]:
# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])
# Fusionar tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')
# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo['precio_promedio'].interpolate()
# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna()
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes'])
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
6,Abril,2022,1170000.0
14,Agosto,2022,1168087.5
22,Diciembre,2022,1200000.0
12,Julio,2022,1365000.0
10,Junio,2022,1350000.0
8,Mayo,2022,1420000.0
20,Noviembre,2022,1200000.0
18,Octubre,2022,1350000.0
16,Septiembre,2022,1204362.5
7,Abril,2023,1295000.0


SACAR PORCENTAJE DE CAMBIO

In [59]:
tulancingo_completo['cambio_porcentaje'] = tulancingo_completo['precio_promedio'].pct_change() * 100
tulancingo_completo['precio_promedio'] = tulancingo_completo['precio_promedio'].round(2)
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio,cambio_porcentaje
6,Abril,2022,1170000.0,
14,Agosto,2022,1168087.5,-0.163462
22,Diciembre,2022,1200000.0,2.73203
12,Julio,2022,1365000.0,13.75
10,Junio,2022,1350000.0,-1.098901
8,Mayo,2022,1420000.0,5.185185
20,Noviembre,2022,1200000.0,-15.492958
18,Octubre,2022,1350000.0,12.5
16,Septiembre,2022,1204362.5,-10.787963
7,Abril,2023,1295000.0,7.525766


In [90]:
# Calcular el cambio porcentaje promedio
cambio_porcentaje_tulancingo = tulancingo_completo['cambio_porcentaje'].mean()

# Redondear a dos decimales y formatear como '00.00'
cambio_porcentaje_tulancingo = round(cambio_porcentaje_tulancingo, 2)
cambio_porcentaje_tulancingo_formatted = "{:.2f}".format(cambio_porcentaje_tulancingo)

# Calcular el cambio y redondear a dos decimales en formato '00.00'
cambio_tulancingo = cambio_porcentaje_tulancingo * 1.2
cambio_tulancingo_formatted = "{:.2f}".format(cambio_tulancingo)

# Mostrar los resultados
print("Cambio porcentaje promedio de Tulancingo:", cambio_porcentaje_tulancingo_formatted)
print("Cambio de Tulancingo:", cambio_tulancingo_formatted)

Cambio porcentaje promedio de Tulancingo: 1.09
Cambio de Tulancingo: 1.31


SACAR VALORES DE AÑOS

In [76]:
precio_media_anual_tulancingo = tulancingo_completo.groupby('año')['precio_promedio'].mean().reset_index()
precio_media_anual_tulancingo.rename(columns={'precio_promedio': 'precio'}, inplace=True)
precio_media_anual_tulancingo

Unnamed: 0,año,precio
0,2022,1269717.0
1,2023,1219868.0


In [77]:
# valor del cambio: 3.59
cambio_tulancingo_numerico = float(cambio_tulancingo_formatted)
# Años siguientes
años_siguientes = [2024, 2025, 2026]

# Verificar si el año 2023 está presente en el DataFrame precio_media_anual_tulancingo
if 2023 in precio_media_anual_tulancingo['año'].values:
    # Obtener el precio del año anterior (2023)
    precio_anterior_2024 = precio_media_anual_tulancingo.loc[precio_media_anual_tulancingo['año'] == 2023, 'precio'].values[0]
else:
    # Asignar 0 si el año 2023 no está presente
    precio_anterior_2024 = 0

# Calcular el precio para el año 2024
precio_nuevo_2024 = (precio_anterior_2024 * cambio_tulancingo_numerico) + precio_anterior_2024

# Calcular el precio para el año 2025 basado en el precio del año 2024
precio_nuevo_2025 = (precio_nuevo_2024 * cambio_tulancingo_numerico) + precio_nuevo_2024

# Calcular el precio para el año 2026 basado en el precio del año 2025
precio_nuevo_2026 = (precio_nuevo_2025 * cambio_tulancingo_numerico) + precio_nuevo_2025

# Crear un DataFrame para los años 2024, 2025 y 2026
precios_siguientes = {'año': [2024, 2025, 2026], 'precio': [precio_nuevo_2024, precio_nuevo_2025, precio_nuevo_2026]}
precio_media_anual_siguientes = pd.DataFrame(precios_siguientes)
precio_media_anual_siguientes

Unnamed: 0,año,precio
0,2024,2817894.0
1,2025,6509335.0
2,2026,15036560.0


In [78]:
tulancingo_precio_media_anual = pd.concat([precio_media_anual_tulancingo,precio_media_anual_siguientes], ignore_index=True)
tulancingo_precio_media_anual

Unnamed: 0,año,precio
0,2022,1269717.0
1,2023,1219868.0
2,2024,2817894.0
3,2025,6509335.0
4,2026,15036560.0


In [68]:
# Datos
año = tulancingo_predicciones['año']
promedio = tulancingo_predicciones['precio_promedio']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Precio Media Anual',
    yaxis=dict(
        range=[0, 16000000],  # Establecer el rango del eje y
        tickvals=[0, 1000000,5000000, 10000000,15000000,200000000],  # Definir los valores de las marcas en el eje y
        ticktext=['$0.00', '$500,000.00', '$1,000,000.00', '$1,500,000.00', '$2,000,000.00'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',   # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_preciomediaanual_prom_tulancingo', carpeta='graficas')
fig.show()

In [94]:
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio,cambio_porcentaje
6,Abril,2022,1170000.0,
14,Agosto,2022,1168087.5,-0.163462
22,Diciembre,2022,1200000.0,2.73203
12,Julio,2022,1365000.0,13.75
10,Junio,2022,1350000.0,-1.098901
8,Mayo,2022,1420000.0,5.185185
20,Noviembre,2022,1200000.0,-15.492958
18,Octubre,2022,1350000.0,12.5
16,Septiembre,2022,1204362.5,-10.787963
7,Abril,2023,1295000.0,7.525766


In [95]:
# Calcula el promedio del porcentaje de cambio
cambio_porcentaje_tulancingo = tulancingo_completo['cambio_porcentaje'].mean()
cambio_porcentaje_tulancingo

1.0863974182800666

In [97]:
import pandas as pd

# Agrupa por mes y calcula el promedio de los precios para 2022 y 2023
promedio_meses = tulancingo_completo.groupby('mes')['precio_promedio'].mean()

# Calcula el promedio del porcentaje de cambio
cambio_porcentaje_tulancingo = tulancingo_completo['cambio_porcentaje'].mean()

# Lista para almacenar los precios predichos
precios_predichos = []

# Itera sobre los años 2024, 2025 y 2026
for año in [2024, 2025, 2026]:
    # Itera sobre los meses disponibles en 2022 y 2023
    for mes in tulancingo_completo['mes'].unique():
        # Verifica si el mes está en el índice de los promedios calculados
        if mes in promedio_meses.index:
            # Obtiene el precio promedio del mes correspondiente en 2022 y 2023
            precio_mes_promedio = promedio_meses[mes]
            # Calcula el precio predicho para el mes y año actuales
            precio_predicho = precio_mes_promedio * (1 + cambio_porcentaje_tulancingo)
        else:
            # Si el mes no está presente en los datos de 2022 o 2023, usa el precio predicho del mes anterior
            precio_predicho = precios_predichos[-1]['precio_promedio']
        # Agrega el nuevo registro a la lista de precios predichos
        precios_predichos.append({'mes': mes, 'año': año, 'precio_promedio': precio_predicho})

# Convierte la lista de precios predichos en un DataFrame
df_precios_predichos = pd.DataFrame(precios_predichos)

# Muestra el DataFrame con los precios predichos
print(df_precios_predichos)


           mes   año  precio_promedio
0        Abril  2024     2.571485e+06
1       Agosto  2024     2.456016e+06
2    Diciembre  2024     2.503677e+06
3        Julio  2024     2.623593e+06
4        Junio  2024     2.973116e+06
5         Mayo  2024     2.733181e+06
6    Noviembre  2024     2.503677e+06
7      Octubre  2024     2.660157e+06
8   Septiembre  2024     2.531700e+06
9        Marzo  2024     2.180285e+06
10       Abril  2025     2.571485e+06
11      Agosto  2025     2.456016e+06
12   Diciembre  2025     2.503677e+06
13       Julio  2025     2.623593e+06
14       Junio  2025     2.973116e+06
15        Mayo  2025     2.733181e+06
16   Noviembre  2025     2.503677e+06
17     Octubre  2025     2.660157e+06
18  Septiembre  2025     2.531700e+06
19       Marzo  2025     2.180285e+06
20       Abril  2026     2.571485e+06
21      Agosto  2026     2.456016e+06
22   Diciembre  2026     2.503677e+06
23       Julio  2026     2.623593e+06
24       Junio  2026     2.973116e+06
25        Ma

In [98]:
# Calcula el promedio de los porcentajes de cambio por mes en tulancingo_completo
porcentaje_cambio_promedio = df_precios_predichos.groupby('mes')['cambio_porcentaje'].median()
porcentaje_cambio_promedio

KeyError: 'Column not found: cambio_porcentaje'

In [88]:
# Lista para almacenar los precios predichos
precios_predichos = []

# Itera sobre los años 2024, 2025 y 2026
for año in [2024, 2025, 2026]:
    # Itera sobre los meses de enero a diciembre
    for mes in tulancingo_completo['mes'].unique():
        # Obtiene el precio del mes anterior
        precio_anterior = tulancingo_completo[(tulancingo_completo['año'] == año - 1) & (tulancingo_completo['mes'] == mes)]['precio_promedio'].iloc[0]
        # Obtiene el porcentaje de cambio promedio de dicho mes
        porcentaje_cambio = porcentaje_cambio_promedio[mes]
        # Calcula el precio para el mes actual en el nuevo año
        precio_predicho = precio_anterior * (1 + porcentaje_cambio / 100)
        # Agrega el nuevo registro a la lista de precios predichos
        precios_predichos.append({'mes': mes, 'año': año, 'precio_promedio': precio_predicho})

# Convierte la lista de precios predichos en un DataFrame
df_precios_predichos = pd.DataFrame(precios_predichos)

# Muestra el DataFrame con los precios predichos
print(df_precios_predichos)


IndexError: single positional indexer is out-of-bounds

In [72]:
tulancingo_completo_predicciones_nuevos['cambio_porcentaje'] = tulancingo_completo_predicciones_nuevos['precio_promedio'].pct_change() * 100


In [73]:
# Iterar sobre los años 2024, 2025 y 2026
for año in [2024, 2025, 2026]:
    # Iterar sobre los meses de enero a noviembre
    for mes in tulancingo_completo_predicciones['mes'].unique()[:-1]:  # Excluir diciembre, ya que no hay un mes siguiente para 2023
        # Obtener el precio del mes anterior
        precio_anterior = tulancingo_completo_predicciones_nuevos[(tulancingo_completo_predicciones_nuevos['año'] == año - 1) & (tulancingo_completo_predicciones_nuevos['mes'] == mes)]['precio_promedio'].iloc[0]
        # Obtener el porcentaje de cambio de dicho mes
        porcentaje_cambio = tulancingo_completo_predicciones_nuevos[(tulancingo_completo_predicciones_nuevos['año'] == año) & (tulancingo_completo_predicciones_nuevos['mes'] == mes)]['cambio_porcentaje'].iloc[0]
        # Calcular el precio para el mes actual en el nuevo año
        precio_predicho = precio_anterior * (1 + porcentaje_cambio / 100)
        # Agregar el nuevo registro al DataFrame
        tulancingo_completo_predicciones_nuevos = tulancingo_completo_predicciones_nuevos.append({'mes': mes, 'año': año, 'precio_promedio': precio_predicho}, ignore_index=True)

# Ordenar el DataFrame resultante por año y mes
tulancingo_completo_predicciones_nuevos = tulancingo_completo_predicciones_nuevos.sort_values(by=['año', 'mes']).reset_index(drop=True)


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated a

In [74]:
tulancingo_completo_predicciones_nuevos

Unnamed: 0,mes,año,precio_promedio,cambio_porcentaje
0,Abril,2022,1.170000e+06,
1,Agosto,2022,1.168088e+06,-0.163462
2,Diciembre,2022,1.200000e+06,2.732030
3,Julio,2022,1.365000e+06,13.750000
4,Junio,2022,1.350000e+06,-1.098901
...,...,...,...,...
71,Noviembre,2026,9.283665e+05,
72,Octubre,2026,1.275000e+06,15.171756
73,Octubre,2026,1.468440e+06,
74,Septiembre,2026,1.168020e+06,-8.390626


In [101]:
mediana_por_año = tulancingo_precio_media_anual.groupby('año')['precio_promedio'].median().reset_index()
mediana_por_año

Unnamed: 0,año,precio_promedio
0,2022,1204362.0
1,2023,1200000.0
2,2024,2551592.0
3,2025,2551592.0
4,2026,2551592.0


In [77]:
porcentaje_cambio_promedio = tulancingo_completo.groupby('mes')['cambio_porcentaje'].mean()
porcentaje_cambio_promedio

mes
Abril          7.525766
Agosto        -4.281538
Diciembre      1.946638
Julio          4.789583
Junio         14.670776
Marzo        -30.333333
Mayo          10.008861
Noviembre     -7.746479
Octubre        6.250000
Septiembre    -4.456481
Name: cambio_porcentaje, dtype: float64

In [79]:
# Lista para almacenar los precios predichos
precios_predichos = []

# Itera sobre los años 2024, 2025 y 2026
for año in [2024, 2025, 2026]:
    # Itera sobre los meses de enero a noviembre
    for mes in tulancingo_completo_predicciones_nuevos['mes'].unique()[:-1]:  # Excluye diciembre, ya que no hay un mes siguiente para 2023
        # Obtiene el precio del mes anterior
        precio_anterior = tulancingo_completo_predicciones_nuevos[(tulancingo_completo_predicciones_nuevos['año'] == año - 1) & (tulancingo_completo_predicciones_nuevos['mes'] == mes)]['precio_promedio'].iloc[0]
        # Obtiene el porcentaje de cambio promedio de dicho mes
        porcentaje_cambio = porcentaje_cambio_promedio[mes]
        # Calcula el precio para el mes actual en el nuevo año
        precio_predicho = precio_anterior * (1 + porcentaje_cambio / 100)
        # Agrega el nuevo registro a la lista de precios predichos
        precios_predichos.append({'mes': mes, 'año': año, 'precio_promedio': precio_predicho})

# Convierte la lista de precios predichos en un DataFrame
df_precios_predichos = pd.DataFrame(precios_predichos)
df_precios_predichos

Unnamed: 0,mes,año,precio_promedio
0,Abril,2024,1392459.0
1,Agosto,2024,1135436.0
2,Diciembre,2024,1223360.0
3,Julio,2024,1205028.0
4,Junio,2024,1720062.0
5,Mayo,2024,1320106.0
6,Noviembre,2024,1107042.0
7,Octubre,2024,1275000.0
8,Septiembre,2024,1168020.0
9,Abril,2025,1497252.0


In [18]:
# Formatear los precios
pd.options.display.float_format = '{:,.2f}'.format

# valor del cambio: 3.59
cambio_tulancingo_numerico = float(cambio_tulancingo_formatted)
# Años siguientes
años_siguientes = [2024, 2025, 2026]

# Verificar si el año 2023 está presente en el DataFrame precio_media_anual_tulancingo
if 2023 in precio_media_anual_tulancingo['año'].values:
    # Obtener el precio del año anterior (2023)
    precio_anterior_2024 = precio_media_anual_tulancingo.loc[precio_media_anual_tulancingo['año'] == 2023, 'precio'].values[0]
else:
    # Asignar 0 si el año 2023 no está presente
    precio_anterior_2024 = 0

# Calcular el precio para el año 2024
precio_nuevo_2024 = (precio_anterior_2024 * cambio_tulancingo_numerico) + precio_anterior_2024

# Calcular el precio para el año 2025 basado en el precio del año 2024
precio_nuevo_2025 = (precio_nuevo_2024 * cambio_tulancingo_numerico) + precio_nuevo_2024

# Calcular el precio para el año 2026 basado en el precio del año 2025
precio_nuevo_2026 = (precio_nuevo_2025 * cambio_tulancingo_numerico) + precio_nuevo_2025

# Crear un DataFrame para los años 2024, 2025 y 2026
precios_siguientes = {'año': [2024, 2025, 2026], 'precio': [precio_nuevo_2024, precio_nuevo_2025, precio_nuevo_2026]}
precio_media_anual_siguientes = pd.DataFrame(precios_siguientes)
precio_media_anual_siguientes

Unnamed: 0,año,precio
0,2024,8419923.04
1,2025,38647446.77
2,2026,177391780.66


In [19]:
precio_media_anual_tulancingo['precio'] = precio_media_anual_tulancingo['precio'].apply(lambda x: '{:,.2f}'.format(x))
precio_media_anual_tulancingo

Unnamed: 0,año,precio
0,2022,1835153.46
1,2023,1834405.89


___

In [93]:
tulancingo_months

Unnamed: 0,precio_promedio,mes,año
0,1420000.0,Mayo,2022
1,1365000.0,Julio,2022
2,1350000.0,Octubre,2022
3,1045000.0,Marzo,2023
4,1200000.0,Mayo,2023
5,1500000.0,Junio,2023
6,1149950.0,Julio,2023
7,1222500.0,Septiembre,2023
8,1200000.0,Octubre,2023


In [102]:
# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo['precio_promedio'].interpolate(method='quadratic')

# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna()
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes'])
tulancingo_completo


Unnamed: 0,mes,año,precio_promedio
6,Abril,2022,1382549.0
14,Agosto,2022,1027664.0
12,Julio,2022,1365000.0
10,Junio,2022,1328141.0
8,Mayo,2022,1420000.0
18,Octubre,2022,1350000.0
16,Septiembre,2022,1097381.0
7,Abril,2023,1507549.0
15,Agosto,2023,1021288.0
13,Julio,2023,1149950.0


In [103]:
from sklearn.ensemble import RandomForestRegressor

# Convertir mes a número
meses_numeros = {
    'Enero': 1, 'Febrero': 2, 'Marzo': 3, 'Abril': 4, 'Mayo': 5, 'Junio': 6,
    'Julio': 7, 'Agosto': 8, 'Septiembre': 9, 'Octubre': 10, 'Noviembre': 11, 'Diciembre': 12
}

tulancingo_completo['mes_numero'] = tulancingo_completo['mes'].map(meses_numeros)

# Entrenar modelo
X_train = tulancingo_completo[['mes_numero', 'año']]
y_train = tulancingo_completo['precio_promedio']

# Entrenar modelo de Random Forest
rf_model = RandomForestRegressor(n_estimators=100, random_state=42)
rf_model.fit(X_train, y_train)

# Generar datos para predecir (2024, 2025, 2026)
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2024, 2025, 2026]
combinaciones = [(mes, año) for mes in meses for año in años]
X_predict = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Convertir mes a número
X_predict['mes_numero'] = X_predict['mes'].map(meses_numeros)

# Predecir precios promedio para los años 2024, 2025 y 2026
predicted_prices = rf_model.predict(X_predict[['mes_numero', 'año']])

# Crear DataFrame con las predicciones
predictions_df = pd.DataFrame({'mes': X_predict['mes'], 'año': X_predict['año'], 'precio_promedio': predicted_prices})
predictions_df

Unnamed: 0,mes,año,precio_promedio
0,Enero,2024,1157886.0
1,Enero,2025,1157886.0
2,Enero,2026,1157886.0
3,Febrero,2024,1157886.0
4,Febrero,2025,1157886.0
5,Febrero,2026,1157886.0
6,Marzo,2024,1157886.0
7,Marzo,2025,1157886.0
8,Marzo,2026,1157886.0
9,Abril,2024,1393534.0


In [104]:
precio_media_anual_tulancingo = tulancingo_completo.groupby('año')['precio_promedio'].mean().reset_index()
precio_media_anual_tulancingo.rename(columns={'precio_promedio': 'precio'}, inplace=True)
precio_media_anual_tulancingo

Unnamed: 0,año,precio
0,2022,1281534.0
1,2023,1230786.0


In [81]:
precio_media_anual_tulancingo_pred = tulancingo_precio_media_anual.groupby('año')['precio_promedio'].mean().reset_index()
precio_media_anual_tulancingo_pred.rename(columns={'precio_promedio': 'precio'}, inplace=True)
precio_media_anual_tulancingo_pred

Unnamed: 0,año,precio
0,2022,1269717.0
1,2023,1219868.0
2,2024,1282946.0
3,2025,1334508.0
4,2026,1334508.0


In [100]:

tulancingo_precio_media_anual = pd.concat([tulancingo_completo,df_precios_predichos], ignore_index=True)
tulancingo_precio_media_anual

Unnamed: 0,mes,año,precio_promedio,cambio_porcentaje
0,Abril,2022,1170000.0,
1,Agosto,2022,1168088.0,-0.163462
2,Diciembre,2022,1200000.0,2.73203
3,Julio,2022,1365000.0,13.75
4,Junio,2022,1350000.0,-1.098901
5,Mayo,2022,1420000.0,5.185185
6,Noviembre,2022,1200000.0,-15.492958
7,Octubre,2022,1350000.0,12.5
8,Septiembre,2022,1204362.0,-10.787963
9,Abril,2023,1295000.0,7.525766


In [83]:
# Datos
año = precio_media_anual_tulancingo_pred['año']
promedio = precio_media_anual_tulancingo_pred['precio']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Precio Media Anual',
    yaxis=dict(
        range=[0, 2000000],  # Establecer el rango del eje y
        tickvals=[0, 1000000,5000000, 2000000],  # Definir los valores de las marcas en el eje y
        ticktext=['$0.00', '$500,000.00', '$1,000,000.00', '$1,500,000.00', '$2,000,000.00'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',   # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_preciomediaanual_prom_tulancingo', carpeta='graficas')
fig.show()

In [103]:

# Datos
año = mediana_por_año['año']
promedio = mediana_por_año['precio_promedio']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Precio Media Anual',
    yaxis=dict(
        range=[0, 2000000],  # Establecer el rango del eje y
        tickvals=[0, 1000000,5000000, 2000000],  # Definir los valores de las marcas en el eje y
        ticktext=['$0.00', '$500,000.00', '$1,000,000.00', '$1,500,000.00', '$2,000,000.00'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',   # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_preciomediaanual_prom_tulancingo', carpeta='graficas')
fig.show()

modelo

In [108]:
tulancingo_months = pd.concat([may_2022, jul_2022, oct_2022, mar_2023, may_2023, jun_2023, jul_2023, sep_2023, oct_2023], ignore_index=True)
tulancingo_months

Unnamed: 0,precio_promedio,mes,año
0,1420000.0,Mayo,2022
1,1365000.0,Julio,2022
2,1350000.0,Octubre,2022
3,1045000.0,Marzo,2023
4,1200000.0,Mayo,2023
5,1500000.0,Junio,2023
6,1149950.0,Julio,2023
7,1222500.0,Septiembre,2023
8,1200000.0,Octubre,2023


interpolación de spline cúbica

In [110]:
# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)

# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo.groupby('año')['precio_promedio'].transform(lambda x: x.interpolate(method='spline', order=3))

# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna().reset_index(drop=True)
tulancingo_completo

error: (m>k) failed for hidden m: fpcurf0:m=3

lineal

In [113]:
import pandas as pd

# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for año in años for mes in meses]

# Creamos un DataFrame con todas las combinaciones posibles de meses y años
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar con los datos reales
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)

# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo.groupby('año')['precio_promedio'].transform(lambda x: x.interpolate())

# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna().reset_index(drop=True)

# Imprimir el DataFrame completo
print(tulancingo_completo)


           mes   año  precio_promedio
0        Julio  2022     1.365000e+06
1        Junio  2022     1.383333e+06
2        Marzo  2022     1.401667e+06
3         Mayo  2022     1.420000e+06
4    Noviembre  2022     1.385000e+06
5      Octubre  2022     1.350000e+06
6   Septiembre  2022     1.350000e+06
7        Julio  2023     1.149950e+06
8        Junio  2023     1.500000e+06
9        Marzo  2023     1.045000e+06
10        Mayo  2023     1.200000e+06
11   Noviembre  2023     1.200000e+06
12     Octubre  2023     1.200000e+06
13  Septiembre  2023     1.222500e+06


In [112]:
import pandas as pd

# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for año in años for mes in meses]

# Creamos un DataFrame con todas las combinaciones posibles de meses y años
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar con los datos reales
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)

# Imprimir el DataFrame completo
print(tulancingo_completo)


           mes   año  precio_promedio
0        Abril  2022              NaN
1       Agosto  2022              NaN
2    Diciembre  2022              NaN
3        Enero  2022              NaN
4      Febrero  2022              NaN
5        Julio  2022        1365000.0
6        Junio  2022              NaN
7        Marzo  2022              NaN
8         Mayo  2022        1420000.0
9    Noviembre  2022              NaN
10     Octubre  2022        1350000.0
11  Septiembre  2022              NaN
12       Abril  2023              NaN
13      Agosto  2023              NaN
14   Diciembre  2023              NaN
15       Enero  2023              NaN
16     Febrero  2023              NaN
17       Julio  2023        1149950.0
18       Junio  2023        1500000.0
19       Marzo  2023        1045000.0
20        Mayo  2023        1200000.0
21   Noviembre  2023              NaN
22     Octubre  2023        1200000.0
23  Septiembre  2023        1222500.0


In [111]:
# Importar pandas
import pandas as pd

# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Fusionar tulancingo_months para llenar los valores faltantes
tulancingo_completo = pd.merge(df_combinaciones, tulancingo_months, on=['mes', 'año'], how='left')

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)

# Calcular los valores faltantes interpolando los valores conocidos
tulancingo_completo['precio_promedio'] = tulancingo_completo.groupby('año')['precio_promedio'].transform(lambda x: x.interpolate(method='linear'))

# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna().reset_index(drop=True)

# Imprimir el DataFrame completo
print(tulancingo_completo)


           mes   año  precio_promedio
0        Julio  2022     1.365000e+06
1        Junio  2022     1.383333e+06
2        Marzo  2022     1.401667e+06
3         Mayo  2022     1.420000e+06
4    Noviembre  2022     1.385000e+06
5      Octubre  2022     1.350000e+06
6   Septiembre  2022     1.350000e+06
7        Julio  2023     1.149950e+06
8        Junio  2023     1.500000e+06
9        Marzo  2023     1.045000e+06
10        Mayo  2023     1.200000e+06
11   Noviembre  2023     1.200000e+06
12     Octubre  2023     1.200000e+06
13  Septiembre  2023     1.222500e+06


In [109]:
# Crear un DataFrame con todas las combinaciones de meses y años posibles
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
años = [2022, 2023]  # Años presentes 
combinaciones = [(mes, año) for mes in meses for año in años]

# Creamos un DataFrame con todas las combinaciones posibles de meses y años
df_combinaciones = pd.DataFrame(combinaciones, columns=['mes', 'año'])

# Inicializamos un DataFrame vacío para almacenar los datos interpolados
tulancingo_completo = pd.DataFrame()

# Iteramos sobre cada año para completar los datos
for año in años:
    # Filtrar los datos correspondientes a este año
    datos_año = tulancingo_months[tulancingo_months['año'] == año]
    # Fusionar con todas las combinaciones de meses y años para asegurarnos de tener todas las combinaciones
    datos_completos_año = pd.merge(df_combinaciones[df_combinaciones['año'] == año], datos_año, on=['mes', 'año'], how='left')
    # Calcular los valores faltantes interpolando los valores conocidos para este año
    datos_completos_año['precio_promedio'] = datos_completos_año['precio_promedio'].interpolate(method='quadratic')
    # Agregar al DataFrame completo
    tulancingo_completo = pd.concat([tulancingo_completo, datos_completos_año])

# Eliminar registros con valores NaN
tulancingo_completo = tulancingo_completo.dropna().reset_index(drop=True)

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
0,Agosto,2022,1351000.0
1,Julio,2022,1365000.0
2,Junio,2022,1388000.0
3,Mayo,2022,1420000.0
4,Octubre,2022,1350000.0
5,Septiembre,2022,1346000.0
6,Abril,2023,996609.4
7,Agosto,2023,1100905.0
8,Julio,2023,1149950.0
9,Junio,2023,1500000.0


In [None]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM

# Datos de entrenamiento
# Supongamos que tienes tus datos en forma de array numpy 'X_train' de dimensiones (número de muestras, 12) 
# donde cada fila representa los precios promedio de los 12 meses para un año.
# Y 'y_train' es un array numpy con las etiquetas correspondientes para predecir el siguiente año.

# Preparar datos para LSTM (requieren una estructura 3D)
X_train_lstm = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)

# Definir modelo LSTM
model = Sequential([
    LSTM(64, input_shape=(12, 1)),  # 12 meses como entrada
    Dense(1)  # Una neurona de salida para la predicción del precio promedio siguiente
])

# Compilar modelo
model.compile(optimizer='adam', loss='mean_squared_error')

# Entrenar modelo
model.fit(X_train_lstm, y_train, epochs=100, batch_size=32)

# Generar datos de prueba para los años 2024, 2025, 2026
# Supongamos que tienes tus datos de prueba en forma de array numpy 'X_test' de dimensiones (número de muestras, 12)
# donde cada fila representa los precios promedio de los 12 meses para un año.

# Preparar datos de prueba para LSTM (requieren una estructura 3D)
X_test_lstm = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)

# Predecir precios para los años 2024, 2025, 2026
predicted_prices = model.predict(X_test_lstm)

# Aquí tendrías las predicciones para los años 2024, 2025, 2026 en 'predicted_prices'


In [114]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM

# Suponiendo que tienes el DataFrame completo con los datos interpolados llamado 'tulancingo_completo'

# Convertir los meses a números
meses_numeros = {'Enero': 1, 'Febrero': 2, 'Marzo': 3, 'Abril': 4, 'Mayo': 5, 'Junio': 6, 'Julio': 7, 'Agosto': 8, 'Septiembre': 9, 'Octubre': 10, 'Noviembre': 11, 'Diciembre': 12}
tulancingo_completo['mes_numero'] = tulancingo_completo['mes'].map(meses_numeros)

# Preparar los datos para la LSTM
X = tulancingo_completo[['año', 'mes_numero']].values
y = tulancingo_completo['precio_promedio'].values

In [115]:

# Reestructurar los datos para la entrada de la LSTM
X_lstm = X.reshape((X.shape[0], 1, X.shape[1]))

# Definir el modelo LSTM
model = Sequential([
    LSTM(64, input_shape=(X_lstm.shape[1], X_lstm.shape[2])),
    Dense(1)
])


In [117]:
# Compilar el modelo
model.compile(optimizer='adam', loss='mean_squared_error')
# Entrenar el modelo
model.fit(X_lstm, y, epochs=100, batch_size=32)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.callbacks.History at 0x1d766b65d30>

In [120]:
# Crear una lista para almacenar los resultados de la predicción
resultados_prediccion = []

# Generar datos de prueba para los años 2024, 2025, 2026
años_prueba = [2024, 2025, 2026]
meses_prueba = np.arange(1, 13)
combinaciones_prueba = [(mes, año) for año in años_prueba for mes in meses_prueba]
X_prueba = np.array(combinaciones_prueba)
X_prueba_lstm = X_prueba.reshape((X_prueba.shape[0], 1, X_prueba.shape[1]))

# Predecir precios para los años 2024, 2025, 2026
predicted_prices = model.predict(X_prueba_lstm)

# Almacenar las predicciones en una lista
for i, precio in enumerate(predicted_prices):
    año = años_prueba[i // 12]
    mes = meses[i % 12]
    # Guardar solo el número sin formato adicional
    resultados_prediccion.append({'año': año, 'mes': mes, 'precio_promedio_predicho': precio[0]})  # Acceder al valor con [0]

# Crear un DataFrame con los resultados de la predicción
predicciones_datos = pd.DataFrame(resultados_prediccion)

# Imprimir el DataFrame con las predicciones
print(predicciones_datos)


     año         mes  precio_promedio_predicho
0   2024       Enero                 -0.555135
1   2024     Febrero                 -0.556814
2   2024       Marzo                 -0.558360
3   2024       Abril                 -0.559777
4   2024        Mayo                 -0.561067
5   2024       Junio                 -0.562234
6   2024       Julio                 -0.563283
7   2024      Agosto                 -0.564219
8   2024  Septiembre                 -0.565047
9   2024     Octubre                 -0.565773
10  2024   Noviembre                 -0.566402
11  2024   Diciembre                 -0.566940
12  2025       Enero                 -0.555149
13  2025     Febrero                 -0.556828
14  2025       Marzo                 -0.558374
15  2025       Abril                 -0.559790
16  2025        Mayo                 -0.561079
17  2025       Junio                 -0.562246
18  2025       Julio                 -0.563295
19  2025      Agosto                 -0.564231
20  2025  Sep

In [None]:


# Escalar los datos (opcional, dependiendo de la magnitud de los precios)
# from sklearn.preprocessing import MinMaxScaler
# scaler = MinMaxScaler()
# X_scaled = scaler.fit_transform(X)
# y_scaled = scaler.fit_transform(y.reshape(-1, 1))

# Reestructurar los datos para la entrada de la LSTM
X_lstm = X.reshape((X.shape[0], 1, X.shape[1]))

# Definir el modelo LSTM
model = Sequential([
    LSTM(64, input_shape=(X_lstm.shape[1], X_lstm.shape[2])),
    Dense(1)
])

# Compilar el modelo
model.compile(optimizer='adam', loss='mean_squared_error')

# Entrenar el modelo
model.fit(X_lstm, y, epochs=100, batch_size=32)

# Generar datos de prueba para los años 2024, 2025, 2026
años_prueba = [2024, 2025, 2026]
meses_prueba = np.arange(1, 13)
combinaciones_prueba = [(mes, año) for año in años_prueba for mes in meses_prueba]
X_prueba = np.array(combinaciones_prueba)
X_prueba_lstm = X_prueba.reshape((X_prueba.shape[0], 1, X_prueba.shape[1]))

# Predecir precios para los años 2024, 2025, 2026
predicted_prices = model.predict(X_prueba_lstm)

# Imprimir las predicciones
for i, precio in enumerate(predicted_prices):
    año = años_prueba[i // 12]
    mes = meses[i % 12]
    print(f"Precio promedio predicho para {mes}-{año}: {precio}")


In [121]:
predicciones_datos

Unnamed: 0,año,mes,precio_promedio_predicho
0,2024,Enero,-0.555135
1,2024,Febrero,-0.556814
2,2024,Marzo,-0.55836
3,2024,Abril,-0.559777
4,2024,Mayo,-0.561067
5,2024,Junio,-0.562234
6,2024,Julio,-0.563283
7,2024,Agosto,-0.564219
8,2024,Septiembre,-0.565047
9,2024,Octubre,-0.565773


In [125]:
# Renombrar la columna 'precio_promedio_predicho' a 'precio_promedio' en predicciones_datos
predicciones_datos = predicciones_datos.rename(columns={'precio_promedio_predicho': 'precio_promedio'})

# Concatenar predicciones_datos con tulancingo_completo
tulancingo_completo = pd.concat([tulancingo_completo, predicciones_datos], ignore_index=True)

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)
tulancingo_completo = tulancingo_completo.drop(columns=['mes_numero'])

tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
0,Julio,2022,1.365000e+06
1,Junio,2022,1.383333e+06
2,Marzo,2022,1.401667e+06
3,Mayo,2022,1.420000e+06
4,Noviembre,2022,1.385000e+06
...,...,...,...
153,Octubre,2026,-5.657957e-01
154,Septiembre,2026,-5.650703e-01
155,Septiembre,2026,-5.650703e-01
156,Septiembre,2026,-5.650703e-01


In [127]:
precio_media_anual_tulancingo = tulancingo_completo.groupby('año')['precio_promedio'].median().reset_index()
precio_media_anual_tulancingo.rename(columns={'precio_promedio': 'precio'}, inplace=True)
precio_media_anual_tulancingo

Unnamed: 0,año,precio
0,2022,1383333.0
1,2023,1200000.0
2,2024,-0.5627583
3,2025,-0.5627707
4,2026,-0.562783


In [24]:
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
6,Abril,2022,1382549.0
14,Agosto,2022,1027664.0
12,Julio,2022,1365000.0
10,Junio,2022,1328141.0
8,Mayo,2022,1420000.0
18,Octubre,2022,1350000.0
16,Septiembre,2022,1097381.0
7,Abril,2023,1507549.0
15,Agosto,2023,1021288.0
13,Julio,2023,1149950.0


In [20]:
# Paso 1: Completa los datos de los años 2022 y 2023 utilizando la interpolación
# (ya tienes este paso completado con tu código existente)

# Paso 2: Calcula el porcentaje de cambio entre cada par de meses consecutivos para los años 2022 y 2023
tulancingo_completo['porcentaje_cambio'] = tulancingo_completo.groupby('año')['precio_promedio'].pct_change()

# Paso 3: Aplica el porcentaje de cambio a los precios de los últimos meses conocidos de 2023 para predecir los precios de los siguientes años (2024, 2025, 2026)
# Obtiene los precios de los últimos meses conocidos de 2023
precios_ultimo_mes_2023 = tulancingo_completo[(tulancingo_completo['año'] == 2023) & (tulancingo_completo['mes'] == 'Diciembre')]['precio_promedio'].values

# Aplica el porcentaje de cambio a los precios del último mes conocido de 2023 para predecir los precios de los siguientes años
for año_prediccion in [2024, 2025, 2026]:
    # Calcula el porcentaje de cambio acumulado hasta el último mes conocido de 2023 para este año de predicción
    porcentaje_cambio_acumulado = tulancingo_completo[tulancingo_completo['año'] == 2023]['porcentaje_cambio'].cumsum().iloc[-1]
    # Aplica el porcentaje de cambio acumulado al precio del último mes conocido de 2023 para obtener el precio predicho para el primer mes del año de predicción
    precio_predicho = precios_ultimo_mes_2023 * (1 + porcentaje_cambio_acumulado)
    # Crea un DataFrame con el precio predicho para el primer mes del año de predicción
    df_prediccion = pd.DataFrame({'mes': 'Enero', 'año': año_prediccion, 'precio_promedio': precio_predicho}, index=[0])
    # Concatena el DataFrame de predicción con tulancingo_completo
    tulancingo_completo = pd.concat([tulancingo_completo, df_prediccion], ignore_index=True)

# Ordenar por año y mes
tulancingo_completo = tulancingo_completo.sort_values(by=['año', 'mes']).reset_index(drop=True)

# Imprimir el DataFrame completo actualizado
print(tulancingo_completo)


ValueError: Length of values (0) does not match length of index (1)

In [45]:
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio
6,Abril,2022,1170000.0
14,Agosto,2022,1168087.5
22,Diciembre,2022,1200000.0
12,Julio,2022,1365000.0
10,Junio,2022,1350000.0
8,Mayo,2022,1420000.0
20,Noviembre,2022,1200000.0
18,Octubre,2022,1350000.0
16,Septiembre,2022,1204362.5
7,Abril,2023,1295000.0


In [61]:
tulancingo_completo['cambio_porcentaje'] = tulancingo_completo['precio_promedio'].pct_change() * 100
tulancingo_completo

Unnamed: 0,mes,año,precio_promedio,cambio_porcentaje
6,Abril,2022,1170000.0,
14,Agosto,2022,1168087.5,-0.163462
22,Diciembre,2022,1200000.0,2.73203
12,Julio,2022,1365000.0,13.75
10,Junio,2022,1350000.0,-1.098901
8,Mayo,2022,1420000.0,5.185185
20,Noviembre,2022,1200000.0,-15.492958
18,Octubre,2022,1350000.0,12.5
16,Septiembre,2022,1204362.5,-10.787963
7,Abril,2023,1295000.0,7.525766


In [62]:
import itertools

# Generar las combinaciones de meses para los años 2024, 2025 y 2026
combinaciones_meses = list(itertools.product(tulancingo_completo['mes'].unique(), [2024, 2025, 2026]))

# Calcular los precios promedio predichos para los años siguientes (2024, 2025, 2026)
precios_predichos = {}
for mes, año in combinaciones_meses:
    cambio_porcentaje = tulancingo_completo[tulancingo_completo['mes'] == mes]['cambio_porcentaje'].mean()
    ultimo_precio_conocido = tulancingo_completo[(tulancingo_completo['mes'] == mes) & (tulancingo_completo['año'] == 2023)]['precio_promedio'].iloc[0]
    precio_predicho = ultimo_precio_conocido * (1 + cambio_porcentaje / 100)
    precios_predichos[(mes, año)] = precio_predicho

# Convertir los resultados en un DataFrame
df_predicciones = pd.DataFrame(list(precios_predichos.items()), columns=['mes_año', 'precio_promedio'])

# Dividir la columna mes_año en dos columnas separadas para mes y año
df_predicciones[['mes', 'año']] = pd.DataFrame(df_predicciones['mes_año'].tolist(), index=df_predicciones.index)

# Eliminar la columna mes_año ahora que ya está dividida
df_predicciones.drop(columns=['mes_año'], inplace=True)

# Ordenar el DataFrame por año y mes
df_predicciones.sort_values(by=['año', 'mes'], inplace=True)

# Reiniciar el índice del DataFrame
df_predicciones.reset_index(drop=True, inplace=True)

# Mostrar el DataFrame resultante
print(df_predicciones)


    precio_promedio         mes   año
0      1.392459e+06       Abril  2024
1      1.135436e+06      Agosto  2024
2      1.223360e+06   Diciembre  2024
3      1.205028e+06       Julio  2024
4      1.720062e+06       Junio  2024
5      7.280167e+05       Marzo  2024
6      1.320106e+06        Mayo  2024
7      1.107042e+06   Noviembre  2024
8      1.275000e+06     Octubre  2024
9      1.168020e+06  Septiembre  2024
10     1.392459e+06       Abril  2025
11     1.135436e+06      Agosto  2025
12     1.223360e+06   Diciembre  2025
13     1.205028e+06       Julio  2025
14     1.720062e+06       Junio  2025
15     7.280167e+05       Marzo  2025
16     1.320106e+06        Mayo  2025
17     1.107042e+06   Noviembre  2025
18     1.275000e+06     Octubre  2025
19     1.168020e+06  Septiembre  2025
20     1.392459e+06       Abril  2026
21     1.135436e+06      Agosto  2026
22     1.223360e+06   Diciembre  2026
23     1.205028e+06       Julio  2026
24     1.720062e+06       Junio  2026
25     7.280

In [64]:
# Concatenar tulancingo_completo con df_predicciones
tulancingo_completo_predicciones = pd.concat([tulancingo_completo, df_predicciones], ignore_index=True)

# Ordenar el DataFrame por año y mes
tulancingo_completo_predicciones.sort_values(by=['año', 'mes'], inplace=True)

# Reiniciar el índice del DataFrame
tulancingo_completo_predicciones.reset_index(drop=True, inplace=True)
tulancingo_completo_predicciones.drop(columns=['cambio_porcentaje'], inplace=True)
tulancingo_completo_predicciones

Unnamed: 0,mes,año,precio_promedio
0,Abril,2022,1170000.0
1,Agosto,2022,1168088.0
2,Diciembre,2022,1200000.0
3,Julio,2022,1365000.0
4,Junio,2022,1350000.0
5,Mayo,2022,1420000.0
6,Noviembre,2022,1200000.0
7,Octubre,2022,1350000.0
8,Septiembre,2022,1204362.0
9,Abril,2023,1295000.0


In [50]:
meses_unicos = tulancingo_completo['mes'].unique()
meses_unicos

array(['Abril', 'Agosto', 'Diciembre', 'Julio', 'Junio', 'Mayo',
       'Noviembre', 'Octubre', 'Septiembre', 'Marzo'], dtype=object)

In [51]:
import itertools
# Genera todas las combinaciones de meses para los años siguientes
combinaciones_meses = list(itertools.product(meses_unicos, [2024, 2025, 2026]))
combinaciones_meses

[('Abril', 2024),
 ('Abril', 2025),
 ('Abril', 2026),
 ('Agosto', 2024),
 ('Agosto', 2025),
 ('Agosto', 2026),
 ('Diciembre', 2024),
 ('Diciembre', 2025),
 ('Diciembre', 2026),
 ('Julio', 2024),
 ('Julio', 2025),
 ('Julio', 2026),
 ('Junio', 2024),
 ('Junio', 2025),
 ('Junio', 2026),
 ('Mayo', 2024),
 ('Mayo', 2025),
 ('Mayo', 2026),
 ('Noviembre', 2024),
 ('Noviembre', 2025),
 ('Noviembre', 2026),
 ('Octubre', 2024),
 ('Octubre', 2025),
 ('Octubre', 2026),
 ('Septiembre', 2024),
 ('Septiembre', 2025),
 ('Septiembre', 2026),
 ('Marzo', 2024),
 ('Marzo', 2025),
 ('Marzo', 2026)]

In [58]:
# Obtener los datos de los meses de 2022 y 2023
datos_2022_2023 = tulancingo_completo[(tulancingo_completo['año'] >= 2022) & (tulancingo_completo['año'] <= 2023)]

# Calcular el porcentaje de cambio acumulado hasta el último mes conocido de 2023
# Calcular el porcentaje de cambio acumulado hasta el último mes conocido de 2023
porcentaje_cambio_acumulado = tulancingo_completo.groupby('mes')['precio_promedio'].pct_change().groupby(tulancingo_completo['mes']).cumsum()
porcentaje_cambio_acumulado

6          NaN
14         NaN
22         NaN
12         NaN
10         NaN
8          NaN
20         NaN
18         NaN
16         NaN
7     0.106838
15    0.015528
23    0.000000
13   -0.157546
11    0.111111
5          NaN
9    -0.154930
21    0.000000
19   -0.111111
17    0.015060
Name: precio_promedio, dtype: float64

In [57]:
# Calcular los precios promedio predichos para los años siguientes (2024, 2025, 2026)
precios_predichos = {}
for mes, año in combinaciones_meses:
    ultimo_precio_conocido_2023 = datos_2022_2023[(datos_2022_2023['año'] == 2023) & (datos_2022_2023['mes'] == mes)]['precio_promedio'].iloc[0]
    porcentaje_cambio_acumulado_mes = porcentaje_cambio_acumulado.get(mes, 0)  # Obtener el porcentaje de cambio acumulado para el mes, o 0 si no está presente
    print(f"Mes: {mes}, Porcentaje de cambio acumulado: {porcentaje_cambio_acumulado_mes}")
    precio_predicho = ultimo_precio_conocido_2023 * (1 + porcentaje_cambio_acumulado_mes)
    precios_predichos[(mes, año)] = precio_predicho


Mes: Abril, Porcentaje de cambio acumulado: 0
Mes: Abril, Porcentaje de cambio acumulado: 0
Mes: Abril, Porcentaje de cambio acumulado: 0
Mes: Agosto, Porcentaje de cambio acumulado: 0
Mes: Agosto, Porcentaje de cambio acumulado: 0
Mes: Agosto, Porcentaje de cambio acumulado: 0
Mes: Diciembre, Porcentaje de cambio acumulado: 0
Mes: Diciembre, Porcentaje de cambio acumulado: 0
Mes: Diciembre, Porcentaje de cambio acumulado: 0
Mes: Julio, Porcentaje de cambio acumulado: 0
Mes: Julio, Porcentaje de cambio acumulado: 0
Mes: Julio, Porcentaje de cambio acumulado: 0
Mes: Junio, Porcentaje de cambio acumulado: 0
Mes: Junio, Porcentaje de cambio acumulado: 0
Mes: Junio, Porcentaje de cambio acumulado: 0
Mes: Mayo, Porcentaje de cambio acumulado: 0
Mes: Mayo, Porcentaje de cambio acumulado: 0
Mes: Mayo, Porcentaje de cambio acumulado: 0
Mes: Noviembre, Porcentaje de cambio acumulado: 0
Mes: Noviembre, Porcentaje de cambio acumulado: 0
Mes: Noviembre, Porcentaje de cambio acumulado: 0
Mes: Octub

In [None]:
# Importar pandas
import pandas as pd

# Convertir el diccionario de precios predichos a un DataFrame
df_predicciones = pd.DataFrame(list(precios_predichos.items()), columns=['mes_año', 'precio_promedio'])

# Dividir la columna mes_año en dos columnas separadas para mes y año
df_predicciones[['mes', 'año']] = pd.DataFrame(df_predicciones['mes_año'].tolist(), index=df_predicciones.index)

# Eliminar la columna mes_año ahora que ya está dividida
df_predicciones.drop(columns=['mes_año'], inplace=True)

# Ordenar el DataFrame por año y mes
df_predicciones.sort_values(by=['año', 'mes'], inplace=True)

# Reiniciar el índice del DataFrame
df_predicciones.reset_index(drop=True, inplace=True)

# Mostrar el DataFrame resultante
print(df_predicciones)


In [67]:
tulancingo_predicciones = tulancingo_completo_predicciones.groupby('año')['precio_promedio'].median().reset_index()
tulancingo_predicciones.rename(columns={'precio_promedio': 'precio_promedio'}, inplace=True)
tulancingo_predicciones

Unnamed: 0,año,precio_promedio
0,2022,1204362.0
1,2023,1200000.0
2,2024,1214194.0
3,2025,1214194.0
4,2026,1214194.0


In [36]:
# Calcula el porcentaje de cambio mensual promedio para cada mes
porcentaje_cambio_mensual_promedio = tulancingo_months.groupby('mes')['precio_promedio'].pct_change().mean()


In [37]:
# Calcula los precios promedio predichos para los años siguientes (2024, 2025, 2026) ajustando los precios según el porcentaje de cambio mensual promedio
predicciones = []
for año_prediccion in [2024, 2025, 2026]:
    precio_predicho = ultimo_precio_conocido
    for _ in range(12):  # Para cada mes en el año
        precio_predicho *= (1 + porcentaje_cambio_mensual_promedio)
    predicciones.append((año_prediccion, precio_predicho))


In [44]:

# Crea un DataFrame a partir de las predicciones
predicciones_df = pd.DataFrame(predicciones, columns=['año', 'precio_promedio'])

# Concatena los valores observados y predichos en un solo DataFrame
valores_grafica = pd.concat([precio_media_anual_tulancingo_pred, predicciones_df.set_index('año')], axis=0)

# Crea una figura de barras
fig = go.Figure()

# Agrega la serie observada
fig.add_trace(go.Bar(
    x=valores_grafica.index,
    y=valores_grafica['precio_promedio'],
    name='Observado y Predicho'
))

Unnamed: 0,porcentage,year_month
0,-13,202211
1,15,20232
2,-12,20233
3,12,20236
4,-2,20237
5,2,20239
6,-15,202312


### *DIRECTOS*

In [7]:
datos_directos_tulancingo = {
    'año': [2023,	2024,	2025,	2026,	2027],
    'conteo': [1377000.00,	1441988.04,	1510043.21,	1581310.28,	1655940.82]
}
precio_medianual_tulancingo_direct = pd.DataFrame(datos_directos_tulancingo)
precio_medianual_tulancingo_direct

Unnamed: 0,año,conteo
0,2023,1377000.0
1,2024,1441988.04
2,2025,1510043.21
3,2026,1581310.28
4,2027,1655940.82


In [11]:

# Datos
año = precio_medianual_tulancingo_direct['año']
promedio = precio_medianual_tulancingo_direct['conteo']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Precio Media Anual',
    yaxis=dict(
        range=[0, 2000000],  # Establecer el rango del eje y
        tickvals=[0,500000,1000000,1500000,2000000],  # Definir los valores de las marcas en el eje y
        ticktext=['$0.00', '$500,000.00', '$1,000,000.00', '$1,500,000.00', '$2,000,000.00'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',   # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_preciomediaanual_prom_direct_tulancingo', carpeta='graficas')
fig.show()