# **3.5 Forecast Casas y Departamentos.**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

dataframes = {} # Crear un diccionario para almacenar los DataFrames
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

    # Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]
# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)
df_list = nombres_df

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df_financiamientos_2022_

# *PACHUCA*

In [None]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in dfs_list if 'pachuca' in df]
print(dataframes_pachuca)

### DIRECTOS

### BASE

In [None]:
df_feb_2023_pachuca  = df_alfa_q_feb_2023_pachuca[['tipo']]
df_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['tipo']]
df_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['tipo']]
df_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['tipo']]
df_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['tipo']]
df_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['tipo']]
df_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['tipo']]

# *TULANCINGO*

In [None]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_tulancingo = [df for df in dfs_list if 'tulancingo' in df]
print(dataframes_tulancingo)

# *PUEBLA*

## Proyección

### DIRECTOS

In [5]:
datos_nuevos_puebla = {
    'año': [2023,2023,2024,2024,2025,2025,2026,2026],
    'tipo': ['Casa','Departamento','Casa','Departamento','Casa','Departamento','Casa','Departamento'],
    'proyeccion': [nan,Nan,0.0,24.8,-2.9,31.1,-2.9,31.1]
}
proyeccion_puebla = pd.DataFrame(datos_nuevos_puebla)
proyeccion_puebla

Unnamed: 0,año,tipo,proyeccion
0,2024,Casa,0.0
1,2024,Departamento,24.8
2,2025,Casa,-2.9
3,2025,Departamento,31.1
4,2026,Casa,-2.9
5,2026,Departamento,31.1


In [8]:
# Datos
años = proyeccion_puebla['año']
tipos = proyeccion_puebla['tipo']
proyecciones = proyeccion_puebla['proyeccion']

fig = go.Figure()
# Agregar líneas para cada tipo
for tipo in tipos.unique():
    df_tipo = proyeccion_puebla[proyeccion_puebla['tipo'] == tipo]
    # Dividir los valores de proyección por 100 para mostrarlos correctamente
    df_tipo['proyeccion'] = df_tipo['proyeccion'] / 100.0
    fig.add_trace(go.Scatter(
        x=df_tipo['año'],
        y=df_tipo['proyeccion'],
        mode='markers+lines',
        name=tipo
    ))

fig.update_layout(
    title='Proyeccion anual oferta casas/departamentos',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Modificar las etiquetas del eje x
fig.update_xaxes(
    tickvals=años,  # Establecer las posiciones de las marcas del eje x
    ticktext=años,  # Establecer las etiquetas del eje x
    title='Año'
)
# Formatear las proyecciones como porcentaje con dos decimales
fig.update_yaxes(tickformat=".2%")

# Agregar etiquetas de texto a los puntos
for trace in fig.data:
    df_tipo = proyeccion_puebla[proyeccion_puebla['tipo'] == trace.name]
    for i, point in enumerate(trace.y):
        fig.add_annotation(
            x=trace.x[i], 
            y=point, 
            text=f'{point:.2%}', 
            showarrow=False,
            font=dict(color='black', size=10),
            yshift=10
        )
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
guardar_grafico_como_html(fig, 'g_scatt_casasdepart_proyecanualofert_direct_puebla', carpeta='graficas')

fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



### BASE

In [4]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_puebla = [df for df in df_list if 'puebla' in df]
print(dataframes_puebla)

['df_alfa_q_puebla', 'df_financiamientos_2019_puebla', 'df_financiamientos_2020_puebla', 'df_financiamientos_2021_puebla', 'df_financiamientos_2022_puebla', 'df_financiamientos_2023_puebla', 'df_grupos_edad_puebla', 'df_jul_2023_puebla', 'df_publicacion_puebla', 'df_sep_2023_puebla']


In [28]:
feb_2023_puebla = df_sep_2023_puebla[['Tipo']]
jul_2023_puebla = df_jul_2023_puebla[['Tipo']]
pub_puebla = df_publicacion_puebla[['Tipo']]

In [21]:
conteo_feb_2023_puebla = feb_2023_puebla['Tipo'].value_counts().reset_index()
conteo_feb_2023_puebla.columns = ['Tipo', 'Conteo']
febrero_2023_puebla = pd.DataFrame(conteo_feb_2023_puebla)
febrero_2023_puebla['Mes'] = 'Febrero'
febrero_2023_puebla['Año'] = 2023
# Reemplazar tipos alternativos con 'Casa' o 'Departamento'
febrero_2023_puebla['Tipo'] = febrero_2023_puebla['Tipo'].replace({
    'casa' : 'Casa',
    'Casa' : 'Casa',
    'departamento' : 'Departamento'
})
# Eliminar filas que no sean 'Casa' o 'Departamento'
febrero_2023_puebla = febrero_2023_puebla[febrero_2023_puebla['Tipo'].isin(['Casa', 'Departamento'])]

# Sumar las cantidades para cada tipo
febrero_2023_puebla = febrero_2023_puebla.groupby('Tipo')['Conteo'].sum().reset_index()

# Agregar el mes y el año al DataFrame sumas_por_tipo
febrero_2023_puebla['Mes'] = 'Febrero'
febrero_2023_puebla['Año'] = 2023
febrero_2023_puebla

Unnamed: 0,Tipo,Conteo,Mes,Año
0,Casa,1328,Febrero,2023
1,Departamento,921,Febrero,2023


In [23]:
conteo_jul_2023_puebla = jul_2023_puebla['Tipo'].value_counts().reset_index()
conteo_jul_2023_puebla.columns = ['Tipo', 'Conteo']
julio_2023_puebla = pd.DataFrame(conteo_jul_2023_puebla)
julio_2023_puebla['Mes'] = 'Julio'
julio_2023_puebla['Año'] = 2023
# Reemplazar tipos alternativos con 'Casa' o 'Departamento'
julio_2023_puebla['Tipo'] = julio_2023_puebla['Tipo'].replace({
    'casa' : 'Casa',
    'Casa' : 'Casa',
    'departamento' : 'Departamento'
})
# Eliminar filas que no sean 'Casa' o 'Departamento'
julio_2023_puebla = julio_2023_puebla[julio_2023_puebla['Tipo'].isin(['Casa', 'Departamento'])]

# Sumar las cantidades para cada tipo
julio_2023_puebla = julio_2023_puebla.groupby('Tipo')['Conteo'].sum().reset_index()

# Agregar el mes y el año al DataFrame sumas_por_tipo
julio_2023_puebla['Mes'] = 'Julio'
julio_2023_puebla['Año'] = 2023
julio_2023_puebla

Unnamed: 0,Tipo,Conteo,Mes,Año
0,Casa,1404,Julio,2023
1,Departamento,746,Julio,2023


In [29]:
publicacion_tipo_puebla = pub_puebla['Tipo'].value_counts().reset_index()
publicacion_tipo_puebla.columns = ['Tipo', 'Conteo']
publicacion_tipo_puebla = pd.DataFrame(publicacion_tipo_puebla)
# Reemplazar tipos alternativos con 'Casa' o 'Departamento'
publicacion_tipo_puebla['Tipo'] = publicacion_tipo_puebla['Tipo'].replace({
    'casa' : 'Casa',
    'Casa' : 'Casa',
    'departamento' : 'Departamento'
})
# Eliminar filas que no sean 'Casa' o 'Departamento'
publicacion_tipo_puebla = publicacion_tipo_puebla[publicacion_tipo_puebla['Tipo'].isin(['Casa', 'Departamento'])]

# Sumar las cantidades para cada tipo
publicacion_tipo_puebla = publicacion_tipo_puebla.groupby('Tipo')['Conteo'].sum().reset_index()
publicacion_tipo_puebla

Unnamed: 0,Tipo,Conteo
0,Casa,2749
1,Departamento,1667


In [26]:
df_pachuca = pd.concat([febrero_2023_puebla, julio_2023_puebla], ignore_index=True)
df_pachuca

Unnamed: 0,Tipo,Conteo,Mes,Año
0,Casa,1328,Febrero,2023
1,Departamento,921,Febrero,2023
2,Casa,1404,Julio,2023
3,Departamento,746,Julio,2023


In [83]:
df_pachuca['Cambio'] = df_pachuca.groupby('Tipo')['Conteo'].pct_change() * 100
df_pachuca

Unnamed: 0,Tipo,Conteo,Mes,Año,Cambio
0,Casa,1328,Febrero,2023,
1,Departamento,921,Febrero,2023,
2,Casa,1404,Julio,2023,5.722892
3,Departamento,746,Julio,2023,-19.001086


In [85]:
# Lista de meses que queremos agregar
meses_nuevos = ['Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
df = df_pachuca
# Promedios de cambio predefinidos
promedio_cambio_casa = 5.722892
promedio_cambio_dept = -19.001086

# Itera sobre los nuevos meses y agrega los datos al DataFrame
for mes in meses_nuevos:
    # Encuentra el último mes disponible en 2023
    ultimo_mes_disponible = df[df['Año'] == 2023]['Mes'].iloc[-1]
    
    for tipo in df['Tipo'].unique():
        # Calcula los nuevos datos usando los promedios de cambio predefinidos
        if tipo == 'Casa':
            promedio_cambio_tipo = promedio_cambio_casa
        else:
            promedio_cambio_tipo = promedio_cambio_dept
        
        ultimo_conteo = df[(df['Tipo'] == tipo) & (df['Año'] == 2023) & (df['Mes'] == ultimo_mes_disponible)]['Conteo'].iloc[-1]
        nuevo_conteo = ultimo_conteo * (1 + promedio_cambio_tipo / 100)

        # Actualiza el DataFrame con los nuevos datos
        df = df.append({'Tipo': tipo, 'Conteo': nuevo_conteo, 'Mes': mes, 'Año': 2023, 'Cambio': None}, ignore_index=True)
        df.drop(columns=['Cambio'], inplace=True)
df


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated a

Unnamed: 0,Tipo,Conteo,Mes,Año
0,Casa,1328.0,Febrero,2023
1,Departamento,921.0,Febrero,2023
2,Casa,1404.0,Julio,2023
3,Departamento,746.0,Julio,2023
4,Casa,1484.349404,Agosto,2023
5,Departamento,604.251898,Agosto,2023
6,Casa,1569.297117,Septiembre,2023
7,Departamento,489.437476,Septiembre,2023
8,Casa,1659.106296,Octubre,2023
9,Departamento,396.43904,Octubre,2023


In [87]:
# Lista de meses que queremos agregar
meses_nuevos = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio', 'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']

# Promedios de cambio predefinidos
promedio_cambio_casa = 5.722892
promedio_cambio_dept = -19.001086

# Itera sobre los nuevos meses y agrega los datos al DataFrame
for año in range(2024, 2027):
    for mes in meses_nuevos:
        # Encuentra el último mes disponible en el año anterior
        ultimo_mes_disponible = df[df['Año'] == año - 1]['Mes'].iloc[-1]

        for tipo in df['Tipo'].unique():
            # Calcula los nuevos datos usando los promedios de cambio predefinidos
            if tipo == 'Casa':
                promedio_cambio_tipo = promedio_cambio_casa
            else:
                promedio_cambio_tipo = promedio_cambio_dept
            
            ultimo_conteo = df[(df['Tipo'] == tipo) & (df['Año'] == año - 1) & (df['Mes'] == ultimo_mes_disponible)]['Conteo'].iloc[-1]
            nuevo_conteo = ultimo_conteo * (1 + promedio_cambio_tipo / 100)

            # Actualiza el DataFrame con los nuevos datos
            df = df.append({'Tipo': tipo, 'Conteo': nuevo_conteo, 'Mes': mes, 'Año': año}, ignore_index=True)

print(df)


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated a

             Tipo       Conteo        Mes   Año
0            Casa  1328.000000    Febrero  2023
1    Departamento   921.000000    Febrero  2023
2            Casa  1404.000000      Julio  2023
3    Departamento   746.000000      Julio  2023
4            Casa  1484.349404     Agosto  2023
..            ...          ...        ...   ...
153  Departamento   138.220480    Octubre  2026
154          Casa  2191.388530  Noviembre  2026
155  Departamento   138.220480  Noviembre  2026
156          Casa  2191.388530  Diciembre  2026
157  Departamento   138.220480  Diciembre  2026

[158 rows x 4 columns]


In [96]:
promedio_puebla = df.groupby(['Tipo', 'Año'])['Conteo'].mean().reset_index()
promedio_puebla.columns = ['Tipo', 'Año', 'Promedio']
promedio_puebla

Unnamed: 0,Tipo,Año,Promedio
0,Casa,2023,1579.035116
1,Casa,2024,1960.565315
2,Casa,2025,2072.76635
3,Casa,2026,2191.38853
4,Departamento,2023,534.048059
5,Departamento,2024,210.675486
6,Departamento,2025,170.644856
7,Departamento,2026,138.22048


In [97]:
promedio_puebla['Cambio'] = promedio_puebla.groupby('Tipo')['Promedio'].pct_change() * 100
promedio_puebla

Unnamed: 0,Tipo,Año,Promedio,Cambio
0,Casa,2023,1579.035116,
1,Casa,2024,1960.565315,24.162236
2,Casa,2025,2072.76635,5.722892
3,Casa,2026,2191.38853,5.722892
4,Departamento,2023,534.048059,
5,Departamento,2024,210.675486,-60.551212
6,Departamento,2025,170.644856,-19.001086
7,Departamento,2026,138.22048,-19.001086


In [107]:

# Filtrar los datos para evitar valores NaN en la columna 'Cambio'
promedio_puebla_filtrado = promedio_puebla.dropna(subset=['Cambio'])

# Datos
años = promedio_puebla_filtrado['Año']
tipos = promedio_puebla_filtrado['Tipo']
proyecciones = promedio_puebla_filtrado['Cambio']  # Utilizando la columna 'Cambio' para el porcentaje de cambio

fig = go.Figure()

# Agregar puntos para cada tipo
for tipo in tipos.unique():
    df_tipo = promedio_puebla_filtrado[promedio_puebla_filtrado['Tipo'] == tipo]
    fig.add_trace(go.Scatter(
        x=df_tipo['Año'],
        y=df_tipo['Cambio'],  # Utilizando 'Cambio' como el porcentaje de cambio
        mode='markers+lines',
        name=tipo
    ))

fig.update_layout(
    title='Proyeccion anual oferta casas/departamentos',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Modificar las etiquetas del eje x
fig.update_xaxes(
    tickvals=años,  # Establecer las posiciones de las marcas del eje x
    ticktext=años,  # Establecer las etiquetas del eje x
    title='Año'
)

# Formatear el eje y como porcentaje con dos decimales
fig.update_yaxes(tickformat=".2%")

# Agregar etiquetas de texto a los puntos
for trace in fig.data:
    df_tipo = promedio_puebla_filtrado[promedio_puebla_filtrado['Tipo'] == trace.name]
    for i, point in enumerate(trace.y):
        fig.add_annotation(
            x=trace.x[i], 
            y=point, 
            text=f'{point:.2f}',  # Utilizar ".2f" para mostrar dos decimales
            showarrow=False,
            font=dict(color='black', size=10),
            yshift=10
        )
# Exportar gráfica como archivo HTML
guardar_grafico_como_html(fig, 'g_scatt_casasdepart_proyecanualofert_puebla', carpeta='graficas')
fig.show()

## Demanda

### DIRECTOS