# **Recámaras**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica
import plotly.express as px


# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
# Imprimir la ruta relativa
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)
# Crear un diccionario para almacenar los DataFrames
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_feb_2024_puebla', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df

# **PACHUCA**

In [8]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


In [9]:
# Crea los DataFrames para cada archivo con las columnas necesarias
recamaras_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['id','categoria', 'recamaras']]

In [10]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['1', '2', '3', '4', '5', '6']
        df['recamaras'] = pd.cut(df['recamaras'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'recamaras']).size().unstack(fill_value=0)

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    recamaras_df_alfa_q_oct_2022_pachuca,
    recamaras_df_alfa_q_nov_2022_pachuca,
    recamaras_df_alfa_q_feb_2023_pachuca,
    recamaras_df_alfa_q_mar_2023_pachuca,
    recamaras_df_alfa_q_jun_2023_pachuca,
    recamaras_df_alfa_q_jul_2023_pachuca,
    recamaras_df_alfa_q_sep_2023_pachuca
]

dataframes_names = [
    'recamaras_df_alfa_q_oct_2022_pachuca',
    'recamaras_df_alfa_q_nov_2022_pachuca',
    'recamaras_df_alfa_q_feb_2023_pachuca',
    'recamaras_df_alfa_q_mar_2023_pachuca',
    'recamaras_df_alfa_q_jun_2023_pachuca',
    'recamaras_df_alfa_q_jul_2023_pachuca',
    'recamaras_df_alfa_q_sep_2023_pachuca'
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: recamaras_df_alfa_q_oct_2022_pachuca
recamaras  1    2    3    4   5   6
segmento                           
A          1    7   80   95  17   4
B          3   21  260   75  15   3
C          7   20  216   47  14   1
D          1  117  202   22   6   3
E          0   48   17    3   0   0
S          1   21  152  163  29  11
Nombre del DataFrame: recamaras_df_alfa_q_nov_2022_pachuca
recamaras  1    2    3    4   5   6
segmento                           
A          1    5   91  110  21   6
B          3   21  292   89  19   3
C          8   23  244   59  19   1
D          1  147  242   21   7   3
E          0   59   24    5   1   0
S          1   21  172  165  32  11
Nombre del DataFrame: recamaras_df_alfa_q_feb_2023_pachuca
recamaras  1   2    3   4   5  6
segmento                        
A          0  11   95  36   6  1
B          0  25  128  66  10  7
C          0  22   92  41   8  4
D          0  15   89  42   5  3
E          0   4   13  12   1  0
S          2  14



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'recamaras' con todos los DataFrame

In [11]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'recamaras']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
recamaras   1    2     3    4    5   6
segmento                              
A          11   69   637  537   85  23
B          18  121  1436  537  104  27
C          44  188  1175  289   62  22
D          42  644  1018  169   29  11
E          14  179    85   53    3   0
S          11  114   959  944  165  59


In [12]:
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['recamaras', 'segmento']).size().unstack(fill_value=0)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_dist_recamaras_pachuca', carpeta='graficas')

    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns    
    fig = go.Figure()
    colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9']
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
        yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        legend_title="Recámaras",
        barmode='group',
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento     A     B     C     D    E    S
recamaras                                 
1           11    18    44    42   14   11
2           69   121   188   644  179  114
3          637  1436  1175  1018   85  959
4          537   537   289   169   53  944
5           85   104    62    29    3  165
6           23    27    22    11    0   59


In [13]:
import os
import plotly.graph_objects as go
import plotly.io as pio

# Lista de colores
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9']

# Función para sumar tablas
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['recamaras', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pastel_dist_x_recamaras_pachuca', carpeta='graficas')
    
    return fig

# Función para graficar la tabla
def graficar_tabla(tabla):
    segmentos = tabla.index
    valores = tabla.iloc[:, 0].tolist()  # Tomamos los valores de la primera columna de la tabla

    fig1 = go.Figure(data=[go.Pie(labels=segmentos, values=valores, marker=dict(colors=colores))])

    fig1.update_layout(
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
    )

    fig1.show()
    return fig1

# Función para guardar la gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig1 = sumar_tablas(dataframes_list)


Tabla general de frecuencia:
segmento     A     B     C     D    E    S
recamaras                                 
1           11    18    44    42   14   11
2           69   121   188   644  179  114
3          637  1436  1175  1018   85  959
4          537   537   289   169   53  944
5           85   104    62    29    3  165
6           23    27    22    11    0   59


# **TULANCINGO**

In [14]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'tulancingo' in df]
print(dataframes_pachuca)

['df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_tulancingo', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_tulancingo', 'df_tiempo_dias_tulancingo']


In [20]:
recamaras_df_alfa_q_jul_2022_tulancingo = df_alfa_q_jul_2022_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_jul_2023_tulancingo = df_alfa_q_jul_2023_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_jun_2023_tulancingo = df_alfa_q_jun_2023_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_mar_2023_tulancingo = df_alfa_q_mar_2023_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_may_2022_tulancingo = df_alfa_q_may_2022_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_may_2023_tulancingo = df_alfa_q_may_2023_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_oct_2022_tulancingo = df_alfa_q_oct_2022_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_oct_2023_tulancingo = df_alfa_q_oct_2023_tulancingo[['categoria','recamaras']]
recamaras_df_alfa_q_sep_2023_tulancingo = df_alfa_q_sep_2023_tulancingo[['categoria','recamaras']]

In [21]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['1', '2', '3', '4', '5', '6']
        df['recamaras'] = pd.cut(df['recamaras'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'recamaras']).size().unstack(fill_value=0)

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes

dataframes_list = [
    recamaras_df_alfa_q_jul_2022_tulancingo ,
    recamaras_df_alfa_q_jul_2023_tulancingo ,
    recamaras_df_alfa_q_jun_2023_tulancingo ,
    recamaras_df_alfa_q_mar_2023_tulancingo ,
    recamaras_df_alfa_q_may_2022_tulancingo ,
    recamaras_df_alfa_q_may_2023_tulancingo ,
    recamaras_df_alfa_q_oct_2022_tulancingo ,
    recamaras_df_alfa_q_oct_2023_tulancingo ,
    recamaras_df_alfa_q_sep_2023_tulancingo,
]

dataframes_names = [
    'recamaras_df_alfa_q_jul_2022_tulancingo' ,
    'recamaras_df_alfa_q_jul_2023_tulancingo' ,
    'recamaras_df_alfa_q_jun_2023_tulancingo' ,
    'recamaras_df_alfa_q_mar_2023_tulancingo' ,
    'recamaras_df_alfa_q_may_2022_tulancingo' ,
    'recamaras_df_alfa_q_may_2023_tulancingo' ,
    'recamaras_df_alfa_q_oct_2022_tulancingo' ,
    'recamaras_df_alfa_q_oct_2023_tulancingo' ,
    'recamaras_df_alfa_q_sep_2023_tulancingo',
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: recamaras_df_alfa_q_jul_2022_tulancingo
recamaras  1  2   3  4  5  6
segmento                    
A          0  0   1  1  0  0
B          0  0   5  2  0  0
C          0  4  18  2  0  0
D          0  8  23  3  0  0
E          0  5   5  0  0  0
S          0  0   0  1  0  0
Nombre del DataFrame: recamaras_df_alfa_q_jul_2023_tulancingo
recamaras  1   2   3  4  5  6
segmento                     
A          0   0   3  1  0  0
B          0   0   6  1  0  0
C          0   2  14  3  0  0
D          0  14  18  7  0  0
E          1   6   7  1  0  0
S          0   0   1  4  1  0
Nombre del DataFrame: recamaras_df_alfa_q_jun_2023_tulancingo
recamaras  1   2   3  4  5  6
segmento                     
A          0   0   8  5  0  0
B          0   0   8  2  0  0
C          0   2  20  4  0  0
D          0  21  33  5  0  0
E          1  13   6  2  0  0
S          1   6  18  9  2  1
Nombre del DataFrame: recamaras_df_alfa_q_mar_2023_tulancingo
recamaras  1   2   3  4  5  6
segmento  



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'recamaras' con todos los DataFrame

In [22]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'recamaras']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
recamaras  1    2    3   4   5  6
segmento                         
A          0    3   26  25   0  4
B          0    4   59  12   0  0
C          0   20  127  29   0  0
D          0  114  231  32   1  0
E          3   76   71  11   0  0
S          1   11   28  42  11  4


In [23]:
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['recamaras', 'segmento']).size().unstack(fill_value=0)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_dist_recamaras_tulgo', carpeta='graficas')

    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns    
    fig = go.Figure()
    colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9']
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
        yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        legend_title="Recámaras",
        barmode='group',
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento    A   B    C    D   E   S
recamaras                          
1           0   0    0    0   3   1
2           3   4   20  114  76  11
3          26  59  127  231  71  28
4          25  12   29   32  11  42
5           0   0    0    1   0  11
6           4   0    0    0   0   4


In [24]:
import os
import plotly.graph_objects as go
import plotly.io as pio

# Lista de colores
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9']

# Función para sumar tablas
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['recamaras', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pastel_dist_x_recamaras_tulgo', carpeta='graficas')
    
    return fig

# Función para graficar la tabla
def graficar_tabla(tabla):
    segmentos = tabla.index
    valores = tabla.iloc[:, 0].tolist()  # Tomamos los valores de la primera columna de la tabla

    fig1 = go.Figure(data=[go.Pie(labels=segmentos, values=valores, marker=dict(colors=colores))])

    fig1.update_layout(
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
    )

    fig1.show()
    return fig1

# Función para guardar la gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig1 = sumar_tablas(dataframes_list)


Tabla general de frecuencia:
segmento    A   B    C    D   E   S
recamaras                          
1           0   0    0    0   3   1
2           3   4   20  114  76  11
3          26  59  127  231  71  28
4          25  12   29   32  11  42
5           0   0    0    1   0  11
6           4   0    0    0   0   4


# **PUEBLA**

In [25]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'puebla' in df]
print(dataframes_pachuca)

['df_alfa_q_puebla', 'df_feb_2024_puebla', 'df_financiamientos_2019_puebla', 'df_financiamientos_2020_puebla', 'df_financiamientos_2021_puebla', 'df_financiamientos_2022_puebla', 'df_financiamientos_2023_puebla', 'df_financiamientos_2024_puebla', 'df_grupos_edad_puebla', 'df_jul_2023_puebla', 'df_mar_2024_puebla', 'df_may_2024_puebla', 'df_publicacion_puebla', 'df_salarios_puebla', 'df_sep_2023_puebla']


In [26]:
df_feb_2024_puebla.columns

Index(['id', 'Q', 'Category', 'ids', 'Propiedad', 'Precio', 'Metros_total',
       'Metros_construido', 'Precio_M2_Terreno', 'Precio_M2_Construido',
       'Personas_interesadas', 'Tiempo_publicacion',
       'Promedio_Interes_Mensual', 'Estado', 'Tipo', 'Estacionamientos',
       'Recamaras', 'Banos', 'Medio_banos', 'Banos_Total', 'Cantidad_de_pisos',
       'Antiguedad', 'Seguridad', 'Fraccionamiento', 'Colonia', 'CP', 'url'],
      dtype='object')

In [27]:
recamaras_df_feb_2024_puebla = df_feb_2024_puebla[['Category','Recamaras']]
recamaras_df_jul_2023_puebla = df_jul_2023_puebla[['Category','Recamaras']]
recamaras_df_mar_2024_puebla = df_mar_2024_puebla[['Category','Recamaras']]
recamaras_df_may_2024_puebla = df_may_2024_puebla[['Category','Recamaras']]
recamaras_df_sep_2023_puebla = df_sep_2023_puebla[['Category','Recamaras']]

In [29]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['Category'].str[0]
        df.drop(columns=['Category'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['1', '2', '3', '4', '5', '6']
        df['Recamaras'] = pd.cut(df['Recamaras'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'Recamaras']).size().unstack(fill_value=0)

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes



dataframes_list = [
    recamaras_df_feb_2024_puebla ,
    recamaras_df_jul_2023_puebla ,
    recamaras_df_mar_2024_puebla ,
    recamaras_df_may_2024_puebla ,
    recamaras_df_sep_2023_puebla ,
]

dataframes_names = [
    'recamaras_df_feb_2024_puebla' ,
    'recamaras_df_jul_2023_puebla' ,
    'recamaras_df_mar_2024_puebla' ,
    'recamaras_df_may_2024_puebla' ,
    'recamaras_df_sep_2023_puebla' ,
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

Nombre del DataFrame: recamaras_df_feb_2024_puebla
Recamaras   1    2    3    4   5   6
segmento                            
A          12  126  326   64   6  14
B           6  152  363   70  15   9
C          21  206  294   63   5   3
D          23  245  296   50   8   3
E           5  212  441  295  21  10
L           0    8   80   51  14  18
S          12  112  482  213  62  38
Nombre del DataFrame: recamaras_df_jul_2023_puebla
Recamaras   1    2    3    4   5   6
segmento                            
A           8   54  205   33  12  10
B          11  100  211   36  10  11
C           7  112  183   21   4   8
D           5  169  132    8   3   0
E           1   71   34   10   1   7
L           1    5   31   28  11  14
S           6   61  264  161  24  23
Nombre del DataFrame: recamaras_df_mar_2024_puebla
Recamaras   1    2    3    4   5   6
segmento                            
A          12  105  273   60   5   8
B           9  119  316   51  14   4
C          22  193  265   47   5 



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'recamaras' con todos los DataFrame

In [30]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'Recamaras']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
Recamaras     1      2       3      4      5      6
segmento                                           
A          52.0  579.0  1335.0  272.0   42.0   56.0
B          58.0  669.0  1440.0  275.0   56.0   49.0
C          94.0  859.0  1227.0  204.0   28.0   24.0
D          83.0  997.0  1112.0  153.0   30.0    6.0
E          16.0  798.0  1280.0  805.0   62.0   44.0
L           1.0   27.0   278.0  210.0   60.0   71.0
S          49.0  445.0  1967.0  954.0  235.0  174.0


In [31]:
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['Recamaras', 'segmento']).size().unstack(fill_value=0)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_dist_recamaras_pueb', carpeta='graficas')

    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns    
    fig = go.Figure()
    colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9']
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
        yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        legend_title="Recámaras",
        barmode='group',
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento      A     B     C     D     E      L     S
Recamaras                                           
1            52    58    94    83    16    1.0    49
2           579   669   859   997   798   27.0   445
3          1335  1440  1227  1112  1280  278.0  1967
4           272   275   204   153   805  210.0   954
5            42    56    28    30    62   60.0   235
6            56    49    24     6    44   71.0   174


In [33]:
import os
import plotly.graph_objects as go
import plotly.io as pio

# Lista de colores
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9']

# Función para sumar tablas
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['Recamaras', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pastel_dist_x_recamaras_pueb', carpeta='graficas')
    
    return fig

# Función para graficar la tabla
def graficar_tabla(tabla):
    segmentos = tabla.index
    valores = tabla.iloc[:, 0].tolist()  # Tomamos los valores de la primera columna de la tabla

    fig1 = go.Figure(data=[go.Pie(labels=segmentos, values=valores, marker=dict(colors=colores))])

    fig1.update_layout(
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
    )

    fig1.show()
    return fig1

# Función para guardar la gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig1 = sumar_tablas(dataframes_list)


Tabla general de frecuencia:
segmento      A     B     C     D     E      L     S
Recamaras                                           
1            52    58    94    83    16    1.0    49
2           579   669   859   997   798   27.0   445
3          1335  1440  1227  1112  1280  278.0  1967
4           272   275   204   153   805  210.0   954
5            42    56    28    30    62   60.0   235
6            56    49    24     6    44   71.0   174


# **OTRO**

In [None]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


In [None]:
# Crea los DataFrames para cada archivo con las columnas necesarias
recamaras_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['id','categoria', 'recamaras']]
recamaras_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['id','categoria', 'recamaras']]

In [None]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['1', '2', '3', '4', '5', '6']
        df['recamaras'] = pd.cut(df['recamaras'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'recamaras']).size().unstack(fill_value=0)

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    recamaras_df_alfa_q_oct_2022_pachuca,
    recamaras_df_alfa_q_nov_2022_pachuca,
    recamaras_df_alfa_q_feb_2023_pachuca,
    recamaras_df_alfa_q_mar_2023_pachuca,
    recamaras_df_alfa_q_jun_2023_pachuca,
    recamaras_df_alfa_q_jul_2023_pachuca,
    recamaras_df_alfa_q_sep_2023_pachuca
]

dataframes_names = [
    'recamaras_df_alfa_q_oct_2022_pachuca',
    'recamaras_df_alfa_q_nov_2022_pachuca',
    'recamaras_df_alfa_q_feb_2023_pachuca',
    'recamaras_df_alfa_q_mar_2023_pachuca',
    'recamaras_df_alfa_q_jun_2023_pachuca',
    'recamaras_df_alfa_q_jul_2023_pachuca',
    'recamaras_df_alfa_q_sep_2023_pachuca'
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: recamaras_df_alfa_q_oct_2022_pachuca
recamaras  1    2    3    4   5   6
segmento                           
A          1    7   80   95  17   4
B          3   21  260   75  15   3
C          7   20  216   47  14   1
D          1  117  202   22   6   3
E          0   48   17    3   0   0
S          1   21  152  163  29  11
Nombre del DataFrame: recamaras_df_alfa_q_nov_2022_pachuca
recamaras  1    2    3    4   5   6
segmento                           
A          1    5   91  110  21   6
B          3   21  292   89  19   3
C          8   23  244   59  19   1
D          1  147  242   21   7   3
E          0   59   24    5   1   0
S          1   21  172  165  32  11
Nombre del DataFrame: recamaras_df_alfa_q_feb_2023_pachuca
recamaras  1   2    3   4   5  6
segmento                        
A          0  11   95  36   6  1
B          0  25  128  66  10  7
C          0  22   92  41   8  4
D          0  15   89  42   5  3
E          0   4   13  12   1  0
S          2  14



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'recamaras' con todos los DataFrame

In [None]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'recamaras']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
recamaras   1    2     3    4    5   6
segmento                              
A          11   69   637  537   85  23
B          18  121  1436  537  104  27
C          44  188  1175  289   62  22
D          42  644  1018  169   29  11
E          14  179    85   53    3   0
S          11  114   959  944  165  59


In [None]:
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['recamaras', 'segmento']).size().unstack(fill_value=0)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_dist_recamaras_pachuca', carpeta='graficas')

    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns    
    fig = go.Figure()
    colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9']
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
        yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        legend_title="Recámaras",
        barmode='group',
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento     A     B     C     D    E    S
recamaras                                 
1           11    18    44    42   14   11
2           69   121   188   644  179  114
3          637  1436  1175  1018   85  959
4          537   537   289   169   53  944
5           85   104    62    29    3  165
6           23    27    22    11    0   59


In [None]:
import os
import plotly.graph_objects as go
import plotly.io as pio

# Lista de colores
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9']

# Función para sumar tablas
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['recamaras', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pastel_dist_x_recamaras_pachuca', carpeta='graficas')
    
    return fig

# Función para graficar la tabla
def graficar_tabla(tabla):
    segmentos = tabla.index
    valores = tabla.iloc[:, 0].tolist()  # Tomamos los valores de la primera columna de la tabla

    fig1 = go.Figure(data=[go.Pie(labels=segmentos, values=valores, marker=dict(colors=colores))])

    fig1.update_layout(
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
    )

    fig1.show()
    return fig1

# Función para guardar la gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig1 = sumar_tablas(dataframes_list)


Tabla general de frecuencia:
segmento     A     B     C     D    E    S
recamaras                                 
1           11    18    44    42   14   11
2           69   121   188   644  179  114
3          637  1436  1175  1018   85  959
4          537   537   289   169   53  944
5           85   104    62    29    3  165
6           23    27    22    11    0   59
