# **PLOTLY GRÁFICAS**

# *Importacion y utilizacion de las librerias para compilar el codigo*

In [107]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df

# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica
import plotly.express as px

# *Data import*

In [108]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
# Imprimir la ruta relativa
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

### *Creación de los df por cada archivo json*

In [109]:
# Crear un diccionario para almacenar los DataFrames
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_usuarios']


________
# ***Metros Cuadrados Construidos***
# CONSULTAS
### Creación de tablas a usar

- alfa_q_oct_2022_pachuca
- alfa_q_nov_2022_pachuca
- alfa_q_feb_2023_pachuca
- alfa_q_mar_2023_pachuca
- alfa_q_jun_2023_pachuca
- alfa_q_jul_2023_pachuca

In [110]:
# Crea los DataFrames para cada archivo con las columnas necesarias
m2_contruido_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['id','categoria', 'm2_contruido']]
m2_contruido_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['id','categoria', 'm2_contruido']]
m2_contruido_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['id','categoria', 'm2_contruido']]
m2_contruido_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['id','categoria', 'm2_contruido']]
m2_contruido_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['id','categoria', 'm2_contruido']]
m2_contruido_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['id','categoria', 'm2_contruido']]

In [111]:
def procesar_dataframes(dataframes_list, dataframes_names):
    for i, df in enumerate(dataframes_list):
        # Crear una nueva columna con la primera letra de la categoría
        df['segmento'] = df['categoria'].str[0]
        df.drop(columns=['categoria'], inplace=True)

        # Clasificar 'baño_total' en rangos específicos
        bins = [0, 100, 150, 200, 250, 300, float('inf')]
        labels = ['0-100', '100-150', '150-200', '200-250', '250-300', '300+']
        df['m2_contruido'] = pd.cut(df['m2_contruido'], bins=bins, labels=labels, right=False)

        # Agrupar y contar los datos
        tabla = df.groupby(['segmento', 'm2_contruido']).size().unstack(fill_value=0)

        # Imprimir el nombre del DataFrame y la tabla resultante
        print(f"Nombre del DataFrame: {dataframes_names[i]}")
        print(tabla)

# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    m2_contruido_df_alfa_q_oct_2022_pachuca,
    m2_contruido_df_alfa_q_nov_2022_pachuca,
    m2_contruido_df_alfa_q_feb_2023_pachuca,
    m2_contruido_df_alfa_q_mar_2023_pachuca,
    m2_contruido_df_alfa_q_jun_2023_pachuca,
    m2_contruido_df_alfa_q_jul_2023_pachuca
]

dataframes_names = [
    'm2_contruido_df_alfa_q_oct_2022_pachuca',
    'm2_contruido_df_alfa_q_nov_2022_pachuca',
    'm2_contruido_df_alfa_q_feb_2023_pachuca',
    'm2_contruido_df_alfa_q_mar_2023_pachuca',
    'm2_contruido_df_alfa_q_jun_2023_pachuca',
    'm2_contruido_df_alfa_q_jul_2023_pachuca'
]

# Procesar los DataFrames de la lista
procesar_dataframes(dataframes_list, dataframes_names)

Nombre del DataFrame: m2_contruido_df_alfa_q_oct_2022_pachuca
m2_contruido  0-100  100-150  150-200  200-250  250-300  300+
segmento                                                     
A                 6       16       27       97       46    12
B                14       61      160      108       28     6
C                32      150       91       22        9     1
D               204      119       21        3        1     3
E                54        6        3        4        0     1
S                 0       16       35       39       74   213
Nombre del DataFrame: m2_contruido_df_alfa_q_nov_2022_pachuca
m2_contruido  0-100  100-150  150-200  200-250  250-300  300+
segmento                                                     
A                 5       18       30      108       58    15
B                17       70      181      124       29     6
C                35      177      107       24        9     2
D               255      132       25        4        1     4
E       



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a

Nombre del DataFrame: m2_contruido_df_alfa_q_mar_2023_pachuca
m2_contruido  0-100  100-150  150-200  200-250  250-300  300+
segmento                                                     
A                 5        9       32      139       45    15
B                21       46      171      148       28    13
C                28      136      110       21        6     3
D               190      121       26        6        7     7
E                29        9        9       12        2     8
S                 4        6        6       40      111   209
Nombre del DataFrame: m2_contruido_df_alfa_q_jun_2023_pachuca
m2_contruido  0-100  100-150  150-200  200-250  250-300  300+
segmento                                                     
A                 0       11       45      108       56    18
B                 3       62      174      151        6     0
C                37      135      106       43       12     2
D               185      160       22        0        0     7
E       



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



### Tabla general de frecuencia
 Recuento total de filas para cada combinación de valores únicos de 'segmento' y 'm2_contruido' con todos los DataFrame

In [112]:
# Crear una nueva función para sumar las tablas de todos los DataFrames
def sumar_tablas(dataframes_list):
    # Inicializar una tabla vacía para almacenar la suma
    tabla_suma = None
    
    # Iterar sobre cada DataFrame en la lista
    for df in dataframes_list:
        # Agrupar y contar los datos en el DataFrame actual
        tabla_actual = df.groupby(['segmento', 'm2_contruido']).size().unstack(fill_value=0)
        
        # Sumar la tabla actual al acumulador (tabla_suma)
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    # Imprimir la tabla resultante de la suma
    print("Tabla general de frecuencia:")
    print(tabla_suma)

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
sumar_tablas(dataframes_list)

Tabla general de frecuencia:
m2_contruido  0-100  100-150  150-200  200-250  250-300  300+
segmento                                                     
A                26       86      156      530      232    72
B                66      285      800      611      107    33
C               155      697      480      118       39     9
D               941      581      102       17       15    27
E               192       22       19       37       13    13
S                18       73      119      197      438   979


In [113]:
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['m2_contruido', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_barras_m2_construido_pachuca', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    banos = tabla.columns
    
    fig = go.Figure()
    
    for segmento in segmentos:
        fig.add_trace(go.Bar(
            x=banos,
            y=tabla.loc[segmento],
            name=segmento
        ))
    
    fig.update_layout(
        #title="Tabla general de frecuencia",
        xaxis_title="Rango de M2",
        yaxis_title="Número de casas"
    )
    
    fig.show()    
    return fig

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento        A    B    C    D    E    S
m2_contruido                              
0-100          26   66  155  941  192   18
100-150        86  285  697  581   22   73
150-200       156  800  480  102   19  119
200-250       530  611  118   17   37  197
250-300       232  107   39   15   13  438
300+           72   33    9   27   13  979


In [115]:
def sumar_tablas(dataframes_list):
    tabla_suma = None
    
    for df in dataframes_list:
        tabla_actual = df.groupby(['m2_contruido', 'segmento']).size().unstack(fill_value=0)
        
        if tabla_suma is None:
            tabla_suma = tabla_actual
        else:
            tabla_suma = tabla_suma.add(tabla_actual, fill_value=0)
    
    print("Tabla general de frecuencia:")
    print(tabla_suma)
    
    fig = graficar_tabla(tabla_suma)
    
    # Guardar la gráfica como archivo HTML
    guardar_grafico_como_html(fig, 'grafica_pastel_m2_construido_pachuca', carpeta='graficas')
    
    return fig

def graficar_tabla(tabla):
    segmentos = tabla.index
    valores = tabla.iloc[:, 0].tolist()  # Tomamos los valores de la primera columna de la tabla
    etiquetas = tabla.columns[0]  # Tomamos el nombre de la primera columna como etiqueta

    fig1 = go.Figure(data=[go.Pie(labels=segmentos, values=valores)])

    fig1.update_layout(title="M2 De Construcción")

    fig1.show()
    return fig1

def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Guardar la gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')

# Llamar a la función sumar_tablas con la lista de DataFrames como argumento
fig1 = sumar_tablas(dataframes_list)

Tabla general de frecuencia:
segmento        A    B    C    D    E    S
m2_contruido                              
0-100          26   66  155  941  192   18
100-150        86  285  697  581   22   73
150-200       156  800  480  102   19  119
200-250       530  611  118   17   37  197
250-300       232  107   39   15   13  438
300+           72   33    9   27   13  979
