# **PRECIO PROMEDIO POR BAÑO**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [3]:
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [4]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres, solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_pachuca', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_pachuca', 'df_grupos_edad_queretaro', 'df_grupos_edad_

___
___
# *PACHUCA*

In [4]:
baños_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['precio', 'baño_total']]
baños_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['precio', 'baño_total']]
baños_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['precio', 'baño_total']]
baños_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['precio', 'baño_total']]
baños_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['precio', 'baño_total']]
baños_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['precio', 'baño_total']]
baños_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['precio', 'baño_total']]

In [5]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([baños_df_alfa_q_oct_2022_pachuca,
                            baños_df_alfa_q_nov_2022_pachuca,
                            baños_df_alfa_q_feb_2023_pachuca,
                            baños_df_alfa_q_mar_2023_pachuca,
                            baños_df_alfa_q_jun_2023_pachuca,
                            baños_df_alfa_q_jul_2023_pachuca,
                            baños_df_alfa_q_sep_2023_pachuca])

# Ajustar los valores de 'baño_total' para que no superen 6
df_concatenado['baño_total'] = df_concatenado['baño_total'].clip(upper=6)
# Calcular el promedio de precio por el número único de baños
df_promedio_baños = df_concatenado.groupby('baño_total')['precio'].mean().reset_index()
df_promedio_baños

Unnamed: 0,baño_total,precio
0,0,991242.657143
1,1,891843.574173
2,2,980815.283318
3,3,993119.445544
4,4,996985.631128
5,5,999119.597864
6,6,999999.99


In [6]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(baños) if baños != 6 else '6+' for baños in df_promedio_baños['baño_total']]

# Obtener los precios y el número de baños
precios = df_promedio_baños['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#3d45c0','#ff4853','#ffb038','#7cc668','#67c2df','#6773df','#939fad']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    title='Precio promedio por número de baños',
    xaxis=dict(title='Número de Baños'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_PrecioPromediobaños_v_pachuca', carpeta='graficas')
fig.show()


### PRECIO PROMEDIO POR PROPIEDAD (1-4 BAÑOS)

In [7]:
df_promedio_baños

Unnamed: 0,baño_total,precio
0,0,991242.657143
1,1,891843.574173
2,2,980815.283318
3,3,993119.445544
4,4,996985.631128
5,5,999119.597864
6,6,999999.99


In [8]:
# Filtrar solo los registros con baño_total igual a 1, 2, 3 o 4
df_promedio_baños_filtrado = df_promedio_baños[df_promedio_baños['baño_total'].isin([1, 2, 3, 4])]
df_promedio_baños_filtrado

Unnamed: 0,baño_total,precio
1,1,891843.574173
2,2,980815.283318
3,3,993119.445544
4,4,996985.631128


In [9]:
import numpy as np

# Redondear los valores de baños al entero más cercano
baños_redondeados = np.round(df_promedio_baños_filtrado['baño_total']).astype(int)

# Crear la gráfica de barras con los valores redondeados
fig = go.Figure()
fig.add_trace(go.Bar(
    x=baños_redondeados,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))

# Actualizar el diseño del gráfico
fig.update_layout(
    title='Precio Promedio de la Propiedad por Número de Baños',
    xaxis=dict(title='Número de Baños', tickvals=np.arange(baños_redondeados.min(), baños_redondeados.max() + 1)),
    yaxis=dict(title='$',gridcolor='#dddcda',),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)'
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_PrecioPromediobaños_14_pachuca', carpeta='graficas')

fig.show()

___
___
# *TULANCINGO*

In [9]:
preciobaños_may_2022_tulgo = df_alfa_q_may_2022_tulancingo[['precio', 'baño_total']]
preciobaños_jul_2022_tulgo = df_alfa_q_jul_2022_tulancingo[['precio', 'baño_total']]
preciobaños_oct_2022_tulgo = df_alfa_q_oct_2022_tulancingo[['precio', 'baño_total']]
preciobaños_mar_2023_tulgo = df_alfa_q_mar_2023_tulancingo[['precio', 'baño_total']]
preciobaños_may_2023_tulgo = df_alfa_q_may_2023_tulancingo[['precio', 'baño_total']]
preciobaños_jun_2023_tulgo = df_alfa_q_jun_2023_tulancingo[['precio', 'baño_total']]
preciobaños_jul_2023_tulgo = df_alfa_q_jul_2023_tulancingo[['precio', 'baño_total']]
preciobaños_sep_2023_tulgo = df_alfa_q_sep_2023_tulancingo[['precio', 'baño_total']]
preciobaños_oct_2023_tulgo = df_alfa_q_oct_2023_tulancingo[['precio', 'baño_total']]

In [10]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciobaños_may_2022_tulgo,
                            preciobaños_jul_2022_tulgo,
                            preciobaños_oct_2022_tulgo,
                            preciobaños_mar_2023_tulgo,
                            preciobaños_may_2023_tulgo,
                            preciobaños_jun_2023_tulgo,
                            preciobaños_jul_2023_tulgo,
                            preciobaños_sep_2023_tulgo,
                            preciobaños_oct_2023_tulgo])

# Ajustar los valores de 'baño_total' para que no superen 6
df_concatenado['baño_total'] = df_concatenado['baño_total'].clip(upper=6)
# Calcular el promedio de precio por el número único de baños
df_promedio_baños = df_concatenado.groupby('baño_total')['precio'].mean().reset_index()
df_promedio_baños

Unnamed: 0,baño_total,precio
0,0,1624648.0
1,1,1022506.0
2,2,1728907.0
3,3,2459739.0
4,4,3968635.0
5,5,4714077.0
6,6,5736286.0


In [12]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(baños) if baños != 6 else '6+' for baños in df_promedio_baños['baño_total']]

# Obtener los precios y el número de baños
precios = df_promedio_baños['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#3d45c0','#ff4853','#ffb038','#7cc668','#67c2df','#6773df','#939fad']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    title='Precio promedio por número de baños',
    xaxis=dict(title='Número de Baños'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_PrecioPromediobaños_v_tulancingo', carpeta='graficas')
fig.show()


### PRECIO PROMEDIO POR PROPIEDAD (1-4 BAÑOS)

In [19]:
df_promedio_baños

Unnamed: 0,baño_total,precio
0,0,1624648.0
1,1,1022506.0
2,2,1728907.0
3,3,2459739.0
4,4,3968635.0
5,5,4714077.0
6,6,5736286.0


In [20]:
# Filtrar solo los registros con baño_total igual a 1, 2, 3 o 4
df_promedio_baños_filtrado = df_promedio_baños[df_promedio_baños['baño_total'].isin([1, 2, 3, 4])]
df_promedio_baños_filtrado

Unnamed: 0,baño_total,precio
1,1,1022506.0
2,2,1728907.0
3,3,2459739.0
4,4,3968635.0


In [26]:
import numpy as np

# Redondear los valores de baños al entero más cercano
baños_redondeados = np.round(df_promedio_baños_filtrado['baño_total']).astype(int)

# Crear la gráfica de barras con los valores redondeados
fig = go.Figure()
fig.add_trace(go.Bar(
    x=baños_redondeados,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))

# Actualizar el diseño del gráfico
fig.update_layout(
    title='Precio Promedio de la Propiedad por Número de Baños',
    xaxis=dict(title='Número de Baños', tickvals=np.arange(baños_redondeados.min(), baños_redondeados.max() + 1)),
    yaxis=dict(title='$',gridcolor='#dddcda',),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)'
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_PrecioPromediobaños_14_tulancingo', carpeta='graficas')

fig.show()