# ***Estacionamientos***


In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
# Imprimir la ruta relativa
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

# Crear un diccionario para almacenar los DataFrames
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_feb_2024_puebla', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df

# **PACHUCA**

In [2]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


In [3]:
# Crea los DataFrames para cada archivo con las columnas necesarias
estacionamiento_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_sep_2023_pachuca= df_alfa_q_sep_2023_pachuca[['id','categoria', 'estacionamiento']]

In [4]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [0, 1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['0', '1', '2', '3', '4', '5', '6']
        df['estacionamiento'] = pd.cut(df['estacionamiento'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'estacionamiento']).size()

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    estacionamiento_df_alfa_q_oct_2022_pachuca,
    estacionamiento_df_alfa_q_nov_2022_pachuca,
    estacionamiento_df_alfa_q_feb_2023_pachuca,
    estacionamiento_df_alfa_q_mar_2023_pachuca,
    estacionamiento_df_alfa_q_jun_2023_pachuca,
    estacionamiento_df_alfa_q_jul_2023_pachuca,
    estacionamiento_df_alfa_q_sep_2023_pachuca
]

dataframes_names = [
    'estacionamiento_df_alfa_q_oct_2022_pachuca',
    'estacionamiento_df_alfa_q_nov_2022_pachuca',
    'estacionamiento_df_alfa_q_feb_2023_pachuca',
    'estacionamiento_df_alfa_q_mar_2023_pachuca',
    'estacionamiento_df_alfa_q_jun_2023_pachuca',
    'estacionamiento_df_alfa_q_jul_2023_pachuca',
    'estacionamiento_df_alfa_q_sep_2023_pachuca'
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: estacionamiento_df_alfa_q_oct_2022_pachuca
segmento  estacionamiento
A         0                   11
          1                   21
          2                  147
          3                   17
          4                    2
          5                    4
          6                    2
B         0                   13
          1                   76
          2                  262
          3                   18
          4                    8
          5                    0
          6                    0
C         0                   16
          1                   87
          2                  185
          3                   13
          4                    2
          5                    1
          6                    1
D         0                   26
          1                  156
          2                  167
          3                    1
          4                    0
          5                    0
          6       

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['segmento'] = df['categoria'].str[0]
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df.drop(columns=['categoria'], inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['estacionamiento'] = pd.cut(df['estacionamiento'], bins=bins, labels=labels, right=False)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[ro

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'estacionamientos' con todos los DataFrame

In [5]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'estacionamiento']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
estacionamiento    0    1     2    3    4   5   6
segmento                                         
A                 47  157  1019   88   28  16   9
B                 80  425  1577  114   45   2   8
C                104  483  1122   55    7   5   9
D                125  829   930   20    7   1   5
E                 14  205   110    4    1   0   0
S                 71  225  1288  305  240  43  85


In [6]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9','#E50CB6','#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['estacionamiento', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_Num_Estacionamientos_pachuca', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns
    
    fig = go.Figure()
    
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
         yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend_title="Estacionamientos",
        barmode='group',
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento            A     B     C    D    E     S
estacionamiento                                  
0                  47    80   104  125   14    71
1                 157   425   483  829  205   225
2                1019  1577  1122  930  110  1288
3                  88   114    55   20    4   305
4                  28    45     7    7    1   240
5                  16     2     5    1    0    43
6                   9     8     9    5    0    85


In [7]:
import os
import pandas as pd
import plotly.graph_objects as go
import plotly.io as pio

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9', '#E50CB6', '#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['estacionamiento', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pie_Num_Estacionamientos_pachuca', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    # Sumar los valores para cada estacionamiento
    suma_estacionamientos = tabla.sum(axis=1)
    
    fig = go.Figure(data=[go.Pie(
        labels=suma_estacionamientos.index,
        values=suma_estacionamientos.values,
        marker=dict(colors=colores[:len(suma_estacionamientos)]),
        #hole=.3  # Si deseas un gráfico de pastel tipo "donut"
    )])
    
    fig.update_layout(
        #title="Distribución de Estacionamientos por Segmento",
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
    )
    
    fig.show()
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento            A     B     C    D    E     S
estacionamiento                                  
0                  47    80   104  125   14    71
1                 157   425   483  829  205   225
2                1019  1577  1122  930  110  1288
3                  88   114    55   20    4   305
4                  28    45     7    7    1   240
5                  16     2     5    1    0    43
6                   9     8     9    5    0    85


# **TULANCINGO**

In [9]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'tulancingo' in df]
print(dataframes_pachuca)

['df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_tulancingo', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_tulancingo', 'df_tiempo_dias_tulancingo']


In [11]:
recamaras_df_alfa_q_jul_2022_tulancingo = df_alfa_q_jul_2022_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_jul_2023_tulancingo = df_alfa_q_jul_2023_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_jun_2023_tulancingo = df_alfa_q_jun_2023_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_mar_2023_tulancingo = df_alfa_q_mar_2023_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_may_2022_tulancingo = df_alfa_q_may_2022_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_may_2023_tulancingo = df_alfa_q_may_2023_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_oct_2022_tulancingo = df_alfa_q_oct_2022_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_oct_2023_tulancingo = df_alfa_q_oct_2023_tulancingo[['categoria','estacionamiento']]
recamaras_df_alfa_q_sep_2023_tulancingo = df_alfa_q_sep_2023_tulancingo[['categoria','estacionamiento']]

dataframes_list = [
    recamaras_df_alfa_q_jul_2022_tulancingo ,
    recamaras_df_alfa_q_jul_2023_tulancingo ,
    recamaras_df_alfa_q_jun_2023_tulancingo ,
    recamaras_df_alfa_q_mar_2023_tulancingo ,
    recamaras_df_alfa_q_may_2022_tulancingo ,
    recamaras_df_alfa_q_may_2023_tulancingo ,
    recamaras_df_alfa_q_oct_2022_tulancingo ,
    recamaras_df_alfa_q_oct_2023_tulancingo ,
    recamaras_df_alfa_q_sep_2023_tulancingo,
]

dataframes_names = [
    'recamaras_df_alfa_q_jul_2022_tulancingo' ,
    'recamaras_df_alfa_q_jul_2023_tulancingo' ,
    'recamaras_df_alfa_q_jun_2023_tulancingo' ,
    'recamaras_df_alfa_q_mar_2023_tulancingo' ,
    'recamaras_df_alfa_q_may_2022_tulancingo' ,
    'recamaras_df_alfa_q_may_2023_tulancingo' ,
    'recamaras_df_alfa_q_oct_2022_tulancingo' ,
    'recamaras_df_alfa_q_oct_2023_tulancingo' ,
    'recamaras_df_alfa_q_sep_2023_tulancingo',
]


In [12]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [0, 1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['0', '1', '2', '3', '4', '5', '6']
        df['estacionamiento'] = pd.cut(df['estacionamiento'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'estacionamiento']).size()

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: recamaras_df_alfa_q_jul_2022_tulancingo
segmento  estacionamiento
A         0                   0
          1                   1
          2                   1
          3                   0
          4                   0
          5                   0
          6                   0
B         0                   0
          1                   1
          2                   5
          3                   1
          4                   0
          5                   0
          6                   0
C         0                   0
          1                   3
          2                  19
          3                   2
          4                   0
          5                   0
          6                   0
D         0                   0
          1                  23
          2                  10
          3                   1
          4                   0
          5                   0
          6                   0
E         0     



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'estacionamientos' con todos los DataFrame

In [13]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'estacionamiento']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
estacionamiento   0    1   2   3  4  5  6
segmento                                 
A                 6   17  23  10  1  1  0
B                 3   21  39   8  4  0  0
C                10   76  79  13  0  0  0
D                 3  277  92   6  0  0  3
E                14  118  30   0  0  0  0
S                 7   13  49  15  4  4  5


In [14]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9','#E50CB6','#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['estacionamiento', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_Num_Estacionamientos_tulgo', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns
    
    fig = go.Figure()
    
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
         yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend_title="Estacionamientos",
        barmode='group',
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento          A   B   C    D    E   S
estacionamiento                          
0                 6   3  10    3   14   7
1                17  21  76  277  118  13
2                23  39  79   92   30  49
3                10   8  13    6    0  15
4                 1   4   0    0    0   4
5                 1   0   0    0    0   4
6                 0   0   0    3    0   5


In [15]:
import os
import pandas as pd
import plotly.graph_objects as go
import plotly.io as pio

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9', '#E50CB6', '#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['estacionamiento', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pie_Num_Estacionamientos_tulgo', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    # Sumar los valores para cada estacionamiento
    suma_estacionamientos = tabla.sum(axis=1)
    
    fig = go.Figure(data=[go.Pie(
        labels=suma_estacionamientos.index,
        values=suma_estacionamientos.values,
        marker=dict(colors=colores[:len(suma_estacionamientos)]),
        #hole=.3  # Si deseas un gráfico de pastel tipo "donut"
    )])
    
    fig.update_layout(
        #title="Distribución de Estacionamientos por Segmento",
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
    )
    
    fig.show()
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento          A   B   C    D    E   S
estacionamiento                          
0                 6   3  10    3   14   7
1                17  21  76  277  118  13
2                23  39  79   92   30  49
3                10   8  13    6    0  15
4                 1   4   0    0    0   4
5                 1   0   0    0    0   4
6                 0   0   0    3    0   5


# **PUEBLA**

In [33]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'puebla' in df]
print(dataframes_pachuca)

['df_alfa_q_puebla', 'df_feb_2024_puebla', 'df_financiamientos_2019_puebla', 'df_financiamientos_2020_puebla', 'df_financiamientos_2021_puebla', 'df_financiamientos_2022_puebla', 'df_financiamientos_2023_puebla', 'df_financiamientos_2024_puebla', 'df_grupos_edad_puebla', 'df_jul_2023_puebla', 'df_mar_2024_puebla', 'df_may_2024_puebla', 'df_publicacion_puebla', 'df_salarios_puebla', 'df_sep_2023_puebla']


In [34]:
df_feb_2024_puebla.columns

Index(['id', 'Q', 'Category', 'ids', 'Propiedad', 'Precio', 'Metros_total',
       'Metros_construido', 'Precio_M2_Terreno', 'Precio_M2_Construido',
       'Personas_interesadas', 'Tiempo_publicacion',
       'Promedio_Interes_Mensual', 'Estado', 'Tipo', 'Estacionamientos',
       'Recamaras', 'Banos', 'Medio_banos', 'Banos_Total', 'Cantidad_de_pisos',
       'Antiguedad', 'Seguridad', 'Fraccionamiento', 'Colonia', 'CP', 'url'],
      dtype='object')

In [44]:
recamaras_df_feb_2024_puebla = df_feb_2024_puebla[['Category','Estacionamientos']]
recamaras_df_jul_2023_puebla = df_jul_2023_puebla[['Category','Estacionamientos']]
recamaras_df_mar_2024_puebla = df_mar_2024_puebla[['Category','Estacionamientos']]
recamaras_df_may_2024_puebla = df_may_2024_puebla[['Category','Estacionamientos']]
recamaras_df_sep_2023_puebla = df_sep_2023_puebla[['Category','Estacionamientos']]


dataframes_list = [
    recamaras_df_feb_2024_puebla ,
    recamaras_df_jul_2023_puebla ,
    recamaras_df_mar_2024_puebla ,
    recamaras_df_may_2024_puebla ,
    recamaras_df_sep_2023_puebla ,
]
dataframes_names = [
    'recamaras_df_feb_2024_puebla' ,
    'recamaras_df_jul_2023_puebla' ,
    'recamaras_df_mar_2024_puebla' ,
    'recamaras_df_may_2024_puebla' ,
    'recamaras_df_sep_2023_puebla' ,
]

In [45]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['Category'].str[0]
        df.drop(columns=['Category'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [0, 1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['0', '1', '2', '3', '4', '5', '6']
        df['Estacionamientos'] = pd.cut(df['Estacionamientos'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'Estacionamientos']).size()

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)
# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: recamaras_df_feb_2024_puebla
segmento  Estacionamientos
A         0                     0
          1                   147
          2                   401
          3                     0
          4                     0
          5                     0
          6                     0
B         0                     0
          1                   165
          2                   450
          3                     0
          4                     0
          5                     0
          6                     0
C         0                     0
          1                   155
          2                   437
          3                     0
          4                     0
          5                     0
          6                     0
D         0                     0
          1                   141
          2                   484
          3                     0
          4                     0
          5                     0
    



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'estacionamientos' con todos los DataFrame

In [46]:
import pandas as pd

# Definir el orden deseado de los segmentos
segmentos_sorted = ['A', 'B', 'C', 'D', 'E', 'S', 'L']

def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'Estacionamientos']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Reordenar los segmentos según segmentos_sorted
    tabla_suma = tabla_suma.reindex(segmentos_sorted, fill_value=0)

    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)


Tabla general de frecuencia:
Estacionamientos     0       1       2      3      4     5      6
segmento                                                         
A                 48.0   768.0  1351.0  103.0   44.0  20.0   19.0
B                 35.0   869.0  1484.0  100.0   53.0   6.0    8.0
C                 45.0  1023.0  1310.0   40.0   11.0   1.0   12.0
D                 27.0  1162.0  1164.0   26.0    6.0   1.0    0.0
E                 20.0  1324.0  1608.0   21.0    7.0   0.0   29.0
S                 63.0  1302.0  1777.0  264.0  182.0  79.0  180.0
L                  9.0   241.0   284.0   27.0   25.0   6.0   58.0


In [48]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9','#E50CB6','#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['Estacionamientos', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)

    # Reordenar los segmentos según segmentos_sorted
    tabla_suma = tabla_suma.reindex(segmentos_sorted, axis=1, fill_value=0)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_Num_Estacionamientos_pueb', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns
    
    fig = go.Figure()
    
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
         yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend_title="Estacionamientos",
        barmode='group',
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento             A     B     C     D     E      L     S
Estacionamientos                                           
0                   48    35    45    27    20    9.0    63
1                  768   869  1023  1162  1324  241.0  1302
2                 1351  1484  1310  1164  1608  284.0  1777
3                  103   100    40    26    21   27.0   264
4                   44    53    11     6     7   25.0   182
5                   20     6     1     1     0    6.0    79
6                   19     8    12     0    29   58.0   180


In [31]:
import os
import pandas as pd
import plotly.graph_objects as go
import plotly.io as pio

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9', '#E50CB6', '#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['Estacionamientos', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pie_Num_Estacionamientos_Pueb', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    # Sumar los valores para cada estacionamiento
    suma_estacionamientos = tabla.sum(axis=1)
    
    fig = go.Figure(data=[go.Pie(
        labels=suma_estacionamientos.index,
        values=suma_estacionamientos.values,
        marker=dict(colors=colores[:len(suma_estacionamientos)]),
        #hole=.3  # Si deseas un gráfico de pastel tipo "donut"
    )])
    
    fig.update_layout(
        #title="Distribución de Estacionamientos por Segmento",
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
    )
    
    fig.show()
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento             A     B     C     D     E      L     S
Estacionamientos                                           
0                   48    35    45    27    20    9.0    63
1                  768   869  1023  1162  1324  241.0  1302
2                 1351  1484  1310  1164  1608  284.0  1777
3                  103   100    40    26    21   27.0   264
4                   44    53    11     6     7   25.0   182
5                   20     6     1     1     0    6.0    79
6                   19     8    12     0    29   58.0   180


# **OTRO**

In [None]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in nombres_df if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


In [None]:
# Crea los DataFrames para cada archivo con las columnas necesarias
estacionamiento_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['id','categoria', 'estacionamiento']]
estacionamiento_df_alfa_q_sep_2023_pachuca= df_alfa_q_sep_2023_pachuca[['id','categoria', 'estacionamiento']]

In [None]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [0, 1, 2, 3, 4, 5, 6, float('inf')]
        labels = ['0', '1', '2', '3', '4', '5', '6']
        df['estacionamiento'] = pd.cut(df['estacionamiento'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'estacionamiento']).size()

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    estacionamiento_df_alfa_q_oct_2022_pachuca,
    estacionamiento_df_alfa_q_nov_2022_pachuca,
    estacionamiento_df_alfa_q_feb_2023_pachuca,
    estacionamiento_df_alfa_q_mar_2023_pachuca,
    estacionamiento_df_alfa_q_jun_2023_pachuca,
    estacionamiento_df_alfa_q_jul_2023_pachuca,
    estacionamiento_df_alfa_q_sep_2023_pachuca
]

dataframes_names = [
    'estacionamiento_df_alfa_q_oct_2022_pachuca',
    'estacionamiento_df_alfa_q_nov_2022_pachuca',
    'estacionamiento_df_alfa_q_feb_2023_pachuca',
    'estacionamiento_df_alfa_q_mar_2023_pachuca',
    'estacionamiento_df_alfa_q_jun_2023_pachuca',
    'estacionamiento_df_alfa_q_jul_2023_pachuca',
    'estacionamiento_df_alfa_q_sep_2023_pachuca'
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: estacionamiento_df_alfa_q_oct_2022_pachuca
segmento  estacionamiento
A         0                   11
          1                   21
          2                  147
          3                   17
          4                    2
          5                    4
          6                    2
B         0                   13
          1                   76
          2                  262
          3                   18
          4                    8
          5                    0
          6                    0
C         0                   16
          1                   87
          2                  185
          3                   13
          4                    2
          5                    1
          6                    1
D         0                   26
          1                  156
          2                  167
          3                    1
          4                    0
          5                    0
          6       

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['segmento'] = df['categoria'].str[0]
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df.drop(columns=['categoria'], inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['estacionamiento'] = pd.cut(df['estacionamiento'], bins=bins, labels=labels, right=False)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[ro

### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'estacionamientos' con todos los DataFrame

In [None]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'estacionamiento']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
estacionamiento    0    1     2    3    4   5   6
segmento                                         
A                 47  157  1019   88   28  16   9
B                 80  425  1577  114   45   2   8
C                104  483  1122   55    7   5   9
D                125  829   930   20    7   1   5
E                 14  205   110    4    1   0   0
S                 71  225  1288  305  240  43  85


In [None]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#F79CB9','#E50CB6','#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['estacionamiento', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_Num_Estacionamientos_pachuca', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns
    
    fig = go.Figure()
    
    for i, segmento in enumerate(segmentos):
        color = colores[i % len(colores)]
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento,
            marker_color=color
        ))
    
    fig.update_layout(
        #title="M2 de Terreno",
        #xaxis_title="Rango de M2",
         yaxis=dict(
            title='Número de casas',
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
            gridwidth=1,
        ),
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
        legend_title="Estacionamientos",
        barmode='group',
        legend=dict(
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
        ),
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    #pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento            A     B     C    D    E     S
estacionamiento                                  
0                  47    80   104  125   14    71
1                 157   425   483  829  205   225
2                1019  1577  1122  930  110  1288
3                  88   114    55   20    4   305
4                  28    45     7    7    1   240
5                  16     2     5    1    0    43
6                   9     8     9    5    0    85


In [None]:
import os
import pandas as pd
import plotly.graph_objects as go
import plotly.io as pio

colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2', '#F79CB9', '#E50CB6', '#4225CF']

def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['estacionamiento', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pie_Num_Estacionamientos_pachuca', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    # Sumar los valores para cada estacionamiento
    suma_estacionamientos = tabla.sum(axis=1)
    
    fig = go.Figure(data=[go.Pie(
        labels=suma_estacionamientos.index,
        values=suma_estacionamientos.values,
        marker=dict(colors=colores[:len(suma_estacionamientos)]),
        #hole=.3  # Si deseas un gráfico de pastel tipo "donut"
    )])
    
    fig.update_layout(
        #title="Distribución de Estacionamientos por Segmento",
        margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)
    )
    
    fig.show()
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento            A     B     C    D    E     S
estacionamiento                                  
0                  47    80   104  125   14    71
1                 157   425   483  829  205   225
2                1019  1577  1122  930  110  1288
3                  88   114    55   20    4   305
4                  28    45     7    7    1   240
5                  16     2     5    1    0    43
6                   9     8     9    5    0    85
