# **Precio promedio - Recámaras**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()

# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, '../../db/datos_json')

# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

# Cargar los archivos JSON y crear DataFrames
for archivo in archivos_json:
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())

# Filtrar los nombres que comienzan con "df_", contienen "alfa_q" y "pachuca"
nombres_df_filtrados = [
    nombre for nombre in nombres_variables_globales 
    # Caso de cuando no son las alfa q
    if nombre.startswith("df_") and "alfa" in nombre and "tulancingo" in nombre and "2024" in nombre

    #if nombre.startswith("df_") and "pachuca" in nombre    
    #and ("alfa_q" in nombre or "jul_2023" in nombre or "sep_2023" in nombre or "feb_2024" in nombre or "mar_2024" in nombre or "may_2024" in nombre)
]

# Imprimir la lista de DataFrames filtrados
print("Lista de DataFrames filtrados:")
nombres_df_filtrados

Lista de DataFrames filtrados:


['df_alfa_abril_2024_tulancingo',
 'df_alfa_agosto_2024_tulancingo',
 'df_alfa_febrero_2024_tulancingo',
 'df_alfa_julio_2024_tulancingo',
 'df_alfa_junio_2024_tulancingo',
 'df_alfa_marzo_2024_tulancingo',
 'df_alfa_mayo_2024_tulancingo']

In [3]:
# Iterar sobre cada DataFrame en la lista filtrada
for nombre_df in nombres_df_filtrados:
    # Obtener el DataFrame usando globals()
    df = globals()[nombre_df]
    
    df.rename(columns={'Preciol_23':'precio','Baño_total': 'baño_total','Banos_Total':'baño_total','Precio':'precio','recamaras':'Recamaras'}, inplace=True)
        # Asignar el DataFrame modificado de nuevo a la variable global
    globals()[nombre_df] = df 

# Imprimir confirmación
print("Columnas renombradas en los DataFrames filtrados.")


Columnas renombradas en los DataFrames filtrados.


In [3]:
df_alfa_marzo_2024_tulancingo.columns

Index(['id', 'Categoria', 'precio', 'propiedad', 'metros_total',
       'metros_construido', 'precio_m2_terreno', 'precio_m2_construido',
       'tiempo_de_publicacion', 'Estado', 'Tipo', 'Estacionamientos',
       'Recamaras', 'Banos', 'Medio_banos', 'baño_total', 'Seguridad',
       'Colonia', 'CP', 'url'],
      dtype='object')

In [4]:
# Crear una lista de DataFrames seleccionados con las columnas específicas
dataframes_list = []
for nombre_df in nombres_df_filtrados:
    # Seleccionar las columnas 'id' y 'categoria'
    segment_df = globals()[nombre_df][['id', 'Categoria', 'precio', 'propiedad', 'metros_total',
       'metros_construido', 'precio_m2_terreno', 'precio_m2_construido',
       'tiempo_de_publicacion', 'Estado', 'Tipo', 'Estacionamientos',
       'Recamaras', 'Banos', 'Medio_banos', 'baño_total', 'Seguridad',
       'Colonia', 'CP', 'url']]
    # Añadir el DataFrame a la lista
    dataframes_list.append(segment_df)
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat(dataframes_list)

## Eliminación de duplicados

In [5]:
# Eliminar por duplicado general, osea los registros exactamente iguales
print(df_concatenado[df_concatenado.duplicated()])

Empty DataFrame
Columns: [id, Categoria, precio, propiedad, metros_total, metros_construido, precio_m2_terreno, precio_m2_construido, tiempo_de_publicacion, Estado, Tipo, Estacionamientos, Recamaras, Banos, Medio_banos, baño_total, Seguridad, Colonia, CP, url]
Index: []


In [6]:
# Duplicado por variables, osea los registros exactamente iguales con los valores de variables
print(df_concatenado[df_concatenado.duplicated(subset=['metros_construido','Colonia', 'CP', 'precio','Estacionamientos','Recamaras','baño_total','propiedad'])])

      id Categoria    precio  \
44    45        E2    628000   
70    71        E2    578000   
6      7        E2    620000   
63    64        E2    580000   
78    79        E2    520000   
..   ...       ...       ...   
115  116        S1   4810000   
116  117             8000000   
117  118        L3  17000000   
118  119        L3  17500000   
78    79        E2    720000   

                                             propiedad  metros_total  \
44   🏡🤩La casa de tus sueños en Tulancingo de Bravo...           114   
70   🏡🤩La casa de tus sueños en Tulancingo de Bravo...           178   
6      Departamentos nuevos y económicos en Tulancingo            60   
63   Venta de Casa en Calle Hermenegildo Galeana, V...           110   
78                    CASA EN VENTA TULANCINGO HIDALGO           120   
..                                                 ...           ...   
115  CASA VENTA EN JARDINES DEL SUR, TULANCINGO DE ...           228   
116                         Casa - Tula

In [7]:
pd.set_option('display.max_colwidth', None) # Mostrar completas
print(df_concatenado[df_concatenado.duplicated(subset=['metros_construido','Colonia', 'CP', 'precio','Estacionamientos','Recamaras','baño_total'])]['propiedad'].unique())

['SE VENDE CASA EN TULANCINGO DE BRAVO'
 'EXCELENTE CASA EN VENTA DE LAS FUENTES, LA MORENA TULANCINGO HIDALGO'
 'VENTA DE CASA EN CALLE CARLOS CHAVEZ 207, COL JARDINES DEL SUR 2da Secc, CP 43660, MUNICIPIO TULANCINGO, ESTADO HIDALGO'
 '¡¡GRAN OPORTUNIDAD,  INMUEBLE  CON ADJUDICACION!!  EXCELENTE CASA EN TULANCINGO HGO¡¡'
 'Excelente Oportunidad De Inversión Tulancingo, Hidalgo'
 '🏡🤩La casa de tus sueños en Tulancingo de Bravo, Hidalgo🤩🏡'
 '🏡🤩La casa de tus sueños en Tulancingo, Hidalgo🤩🏡'
 '🏡🤩La casa de tus sueños en Tulancingo Hidalgo🤩🏡'
 'HERMOSA CASA EN LA MORENA TULANCINGO'
 'Linda casa en Tulancingo, Hidalgo'
 'CASA en Venta en Col. Vicente Guerrero, Centro de Tulancingo, Hgo.'
 'Casa en Venta, Tulancingo de Bravo, Hidalgo'
 'CASA EN VENTA! UBICADA EN CALLE HERMEREGILDO GALEANA, COLONIA VICENTE GUERRERO, TULANCINGO, HIDALGO, ENORME OPOTTUNIDAD!'
 'Hermosa casa en venta, en C. Hermenegildo Galeana, Vicente Guerrero Tulancingo de Bravo, Hgo'
 'Casa en venta, hipoteca'
 'Departament

In [8]:
# Agrupar por los registros duplicados y contar las ocurrencias
agrupados = df_concatenado[df_concatenado.duplicated(subset=['metros_construido','Colonia', 'CP', 'precio','Estacionamientos','Recamaras','propiedad'], keep=False)].groupby(['metros_construido','Colonia', 'CP', 'precio','Recamaras','propiedad']).size().reset_index(name='count')
print(agrupados)

     metros_construido                     Colonia     CP    precio  \
0                   45                 Huapalcalco  43640    600000   
1                   45         Tulancingo de Bravo  43775    680000   
2                   50                    Napateco  43640    590000   
3                   52                 Huapalcalco  43640    525000   
4                   53                    Napateco           730000   
..                 ...                         ...    ...       ...   
181                460              Felipe Ángeles  43628   8000000   
182                500  Tulancingo de Bravo Centro  43775  17000000   
183                520  Tulancingo de Bravo Centro  43775  17500000   
184                600                    El Banco          3200000   
185                600                    San Juan  43660   3200000   

     Recamaras  \
0            2   
1            2   
2            2   
3            3   
4            2   
..         ...   
181          5   
182

In [9]:
# Eliminar duplicados, conservando la primera aparición
df_sin_duplicados = df_concatenado.drop_duplicates(subset=['metros_construido','Colonia', 'CP', 'precio','Estacionamientos','Recamaras','baño_total','propiedad'], keep='first')
# conservar la última aparición
# df_sin_duplicados = df_concatenado.drop_duplicates(keep='last')
print(df_sin_duplicados)

      id Categoria   precio  \
0      1            8000000   
1      2        S1  4810000   
2      3        S1  4500000   
3      4        S1  4300000   
4      5        A3  3946465   
..   ...       ...      ...   
143  144        A3  3946465   
144  145        A3  3946465   
145  146        S1  4180000   
146  147        S1  4300000   
147  148        S1  4500000   

                                                                                   propiedad  \
0                                                                 Casa - Tulancingo de Bravo   
1                             CASA EN VENTA COL JARDINES DEL SUR TULANCINGO DE BRAVO HIDALGO   
2                       Se vende casa en Tulancingo, Fraccionamiento San Francisco Huatengo.   
3                                        Casa en Venta, Col. La Morena. Tulancingo. Pachuca.   
4              VENTA DE CASA EN PEDREGAL DE SAN FRANCISCO TULANCINGO DE BRAVO HIDALGO GDS/AS   
..                                                 

## Diidir por tipo

In [10]:
df_sin_duplicados['Tipo'].unique()

array(['Casa', 'Casa En Fraccionamiento', 'Departamento',
       'Casa En Condominio', 'Condominio Horizontal'], dtype=object)

In [11]:
casas = df_sin_duplicados[df_sin_duplicados['Tipo'].isin(['Casa', 'Casa En Fraccionamiento', 'Casa En Condominio'])]
depas = df_sin_duplicados[df_sin_duplicados['Tipo'].isin(['Departamento', 'Condominio Horizontal'])]

Ver que las cantidades coinciden por el tipo

In [12]:
casas_precio = casas['precio']
casas_precio.sort_values() 

130      371800
129      380000
0        380000
126      430000
1        430000
         ...   
0       8000000
149     8000000
140    10000000
117    17000000
118    17500000
Name: precio, Length: 696, dtype: int64

In [13]:
depas_precio = depas['precio']
depas_precio.sort_values()

0       346040
131     346040
19      400000
127     420000
128     420000
20      450000
17      487467
21      499550
1       515000
121     520000
2       520000
22      575000
100     600000
5       620000
37      620000
95      620000
102     670000
90      672537
7       672537
99      675000
8       750000
82      750000
77      802390
10      960000
64      960000
65      960000
62      980000
11      980000
12     1249000
46     1249000
44     1250000
13     1250000
14     1300000
42     1300000
37     1523793
15     1523793
32     1712133
33     1712133
24     2250000
99     2250000
97     2250000
96     2250000
100    2250000
98     2250000
101    2250003
102    2250009
22     2450000
16     2500000
68     2650000
16     2850000
17     2850000
Name: precio, dtype: int64

# Resultados

## Casas

In [14]:
casas['Recamaras'] = casas['Recamaras'].astype(int)
casas = casas[(casas['Recamaras'] >= 1) & (casas['Recamaras'] <= 8)]
casas['Recamaras'].unique()

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  casas['Recamaras'] = casas['Recamaras'].astype(int)


array([5, 4, 3, 2, 6, 1, 7])

In [15]:
# Ajustar los valores para que no superen un #
casas.loc[:, 'Recamaras'] = casas['Recamaras'].clip(lower=1,upper=8)
# Calcular el promedio de precio por el número único 
df_promedio_casas = casas.groupby('Recamaras')['precio'].mean().reset_index()
df_promedio_casas

Unnamed: 0,Recamaras,precio
0,1,1799833.0
1,2,1043849.0
2,3,1307932.0
3,4,1526766.0
4,5,5190000.0
5,6,3327714.0
6,7,8233333.0


In [16]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(recamaras) if recamaras != 16 else '16+' for recamaras in df_promedio_casas['Recamaras']]

# Obtener los precios y el número de recámaras
precios = df_promedio_casas['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    #title='Precio promedio por número de baños',
    xaxis=dict(title='Recámaras'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)',
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

fig.show()

In [17]:
recam_five = casas[casas['Recamaras']==1]
recam_five[['precio','Recamaras','Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
27,2000000,1,Casa
125,2000000,1,Casa
77,799000,1,Casa
142,2000000,1,Casa
84,2000000,1,Casa
127,2000000,1,Casa


In [18]:
registro_especifico = casas[casas['precio']==2000000]
registro_especifico[['precio','Recamaras']]

Unnamed: 0,precio,Recamaras
27,2000000,1
28,2000000,3
125,2000000,1
41,2000000,3
142,2000000,1
83,2000000,3
84,2000000,1
127,2000000,1


In [20]:
casas = pd.concat([casas[casas['Recamaras'] != 1], casas[casas['Recamaras'] == 1].drop_duplicates(subset=['precio', 'Recamaras', 'Tipo'])])
recam_five = casas[casas['Recamaras']==1]
promedios = recam_five.groupby('Recamaras')['precio'].mean().reset_index()
promedios

Unnamed: 0,Recamaras,precio
0,1,1399500.0


In [21]:
#casas = casas[~((casas['precio']==2000000) & (casas['Recamaras']==1))]
casas_copia = casas.copy()
#recam_five = casas_copia[casas_copia['Recamaras']==1]
#recam_five

In [22]:
recam_five = casas_copia[casas_copia['Recamaras']==5].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
20,500000,5,Casa
18,500000,5,Casa
26,580000,5,Casa
105,580000,5,Casa
135,4300000,5,Casa
146,4300000,5,Casa
109,4300000,5,Casa
3,4300000,5,Casa
109,4300000,5,Casa
139,8000000,5,Casa


In [24]:
casas_copia = pd.concat([casas_copia[casas_copia['Recamaras'] != 5], casas_copia[casas_copia['Recamaras'] == 5].drop_duplicates(subset=['precio', 'Recamaras', 'Tipo'])])
casas_copia[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
1,4810000,4,Casa
4,3946465,3,Casa En Fraccionamiento
5,3750000,4,Casa
6,3555000,4,Casa En Fraccionamiento
7,3400000,3,Casa
...,...,...,...
0,8000000,5,Casa
3,4300000,5,Casa
105,580000,5,Casa
20,500000,5,Casa


In [25]:
recam_five = casas_copia[casas_copia['Recamaras']==5].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
20,500000,5,Casa
105,580000,5,Casa
3,4300000,5,Casa
0,8000000,5,Casa
117,17000000,5,Casa


In [26]:
promedios = recam_five.groupby('Recamaras')['precio'].mean().reset_index()
promedios

Unnamed: 0,Recamaras,precio
0,5,6076000.0


In [36]:
casasss = casas_copia[~((casas_copia['precio']==17000000) & (casas_copia['Recamaras']==5))]
recam_five = casasss[casasss['Recamaras']==5].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
20,500000,5,Casa
105,580000,5,Casa
3,4300000,5,Casa
0,8000000,5,Casa


In [37]:
promedios = recam_five.groupby('Recamaras')['precio'].mean().reset_index()
promedios

Unnamed: 0,Recamaras,precio
0,5,3345000.0


In [38]:
recam_five = casas_copia[casas_copia['Recamaras']==6].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
26,2159000,6,Casa
55,2159000,6,Casa
113,2159000,6,Casa
85,2159000,6,Casa
128,2159000,6,Casa
0,2499000,6,Casa
140,10000000,6,Casa


In [39]:
casasss = pd.concat([casasss[casasss['Recamaras'] != 6], casasss[casasss['Recamaras'] == 6].drop_duplicates(subset=['precio', 'Recamaras', 'Tipo'])])
recam_five = casasss[casasss['Recamaras']==6].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
26,2159000,6,Casa
0,2499000,6,Casa
140,10000000,6,Casa


In [40]:
promedios = recam_five.groupby('Recamaras')['precio'].mean().reset_index()
promedios

Unnamed: 0,Recamaras,precio
0,6,4886000.0


In [41]:
recam_five = casasss[casasss['Recamaras']==7].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
116,3600000,7,Casa
105,3600000,7,Casa
118,17500000,7,Casa


In [42]:
casasss = pd.concat([casasss[casasss['Recamaras'] != 7], casasss[casasss['Recamaras'] == 7].drop_duplicates(subset=['precio', 'Recamaras', 'Tipo'])])
recam_five = casasss[casasss['Recamaras']==7].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
116,3600000,7,Casa
118,17500000,7,Casa


In [47]:
# Ajustar los valores para que no superen un #
casasss.loc[:, 'Recamaras'] = casasss['Recamaras'].clip(lower=1,upper=8)
# Calcular el promedio de precio por el número único 
df_promedio_casas = casasss.groupby('Recamaras')['precio'].mean().reset_index()
df_promedio_casas

Unnamed: 0,Recamaras,precio
0,1,799000.0
1,2,1043849.0
2,3,1307932.0
3,4,1526766.0
4,5,3345000.0
5,6,4886000.0
6,7,10550000.0


In [48]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(recamaras) if recamaras != 16 else '16+' for recamaras in df_promedio_casas['Recamaras']]

# Obtener los precios y el número de recámaras
precios = df_promedio_casas['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    #title='Precio promedio por número de baños',
    xaxis=dict(title='Recámaras'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)',
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

fig.show()

In [45]:
recam_five = casasss[casasss['Recamaras']==1].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
77,799000,1,Casa
27,2000000,1,Casa


In [46]:
casasss = casasss[~((casasss['precio']==2000000) & (casasss['Recamaras']==1))]
recam_five = casasss[casasss['Recamaras']==1].sort_values(by='precio')
recam_five[['precio', 'Recamaras', 'Tipo']]

Unnamed: 0,precio,Recamaras,Tipo
77,799000,1,Casa


In [49]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(recamaras) if recamaras != 16 else '16+' for recamaras in df_promedio_casas['Recamaras']]

# Obtener los precios y el número de recámaras
precios = df_promedio_casas['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    #title='Precio promedio por número de baños',
    xaxis=dict(title='Recámaras'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)',
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

fig.show()

In [50]:
# Función para guardar la gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='assets/graficas'):
    import os
    import plotly.io as pio

    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)

    # Configuración personalizada para la gráfica
    config = {
        'displaylogo': False,  # Ocultar el logo de Plotly
        'modeBarButtonsToRemove': [
            'toImage',       # Botón para guardar como imagen
            'select2d',      # Box select
            'lasso2d',       # Lasso select
            'resetScale2d',  # Reset Axes
        ]
    }

    # Guardar la gráfica como archivo HTML
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html', config=config)

# Ejemplo de uso
guardar_grafico_como_html(fig, 'g_bar_precio_promedio_recamaras_casa',  carpeta='assets/graficas')


## Depa

In [51]:
depas['Recamaras'] = depas['Recamaras'].astype(int)
depas = depas[(depas['Recamaras'] >= 1) & (depas['Recamaras'] <= 8)]
depas['Recamaras'].unique()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



array([2, 3, 1])

In [52]:
# Ajustar los valores para que no superen un #
depas.loc[:, 'Recamaras'] = depas['Recamaras'].clip(lower=1,upper=8)
# Calcular el promedio de precio por el número único 
df_promedio_depas = depas.groupby('Recamaras')['precio'].mean().reset_index()
df_promedio_depas

Unnamed: 0,Recamaras,precio
0,1,750000.0
1,2,1084344.0
2,3,1661206.0


In [53]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(recamaras) if recamaras != 16 else '16+' for recamaras in df_promedio_depas['Recamaras']]

# Obtener los precios y el número de recámaras
precios = df_promedio_depas['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    #title='Precio promedio por número de baños',
    xaxis=dict(title='Recámaras'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)',
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

fig.show()

In [54]:
import pandas as pd
import plotly.graph_objects as go
import locale

# Establecer configuración regional para el formato de precios
locale.setlocale(locale.LC_ALL, '')

# Definir función para formatear precios
def format_price(price):
    return locale.currency(price, grouping=True)

# Crear una lista de etiquetas para el eje x
etiquetas = [str(recamaras) if recamaras != 16 else '16+' for recamaras in df_promedio_depas['Recamaras']]

# Obtener los precios y el número de recámaras
precios = df_promedio_depas['precio']

# Crear el texto con los precios formateados
text_precios = [format_price(precio) for precio in precios]

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6','#4225CF','#2CBA4D','#2962ff', '#9500ff', '#ff0059']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=etiquetas,
    y=precios,
    text=text_precios,
    marker_color=colores,
    textposition='auto' 
))
fig.update_layout(
    #title='Precio promedio por número de baños',
    xaxis=dict(title='Recámaras'),
    yaxis=dict(title='$', gridcolor='#dddcda', ),
    bargap=0.1,
    bargroupgap=0.05,
    plot_bgcolor='rgba(0,0,0,0)',
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

fig.show()

In [55]:
# Función para guardar la gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='assets/graficas'):
    import os
    import plotly.io as pio

    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)

    # Configuración personalizada para la gráfica
    config = {
        'displaylogo': False,  # Ocultar el logo de Plotly
        'modeBarButtonsToRemove': [
            'toImage',       # Botón para guardar como imagen
            'select2d',      # Box select
            'lasso2d',       # Lasso select
            'resetScale2d',  # Reset Axes
        ]
    }

    # Guardar la gráfica como archivo HTML
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html', config=config)

# Ejemplo de uso
guardar_grafico_como_html(fig, 'g_bar_precio_promedio_recamaras_depa',  carpeta='assets/graficas')
