# **PLOTLY GRÁFICAS**

# *Importacion y utilizacion de las librerias para compilar el codigo*

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df

# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica
import plotly.express as px

# *Data import*

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
# Imprimir la ruta relativa
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

### *Creación de los df por cada archivo json*

In [3]:
# Crear un diccionario para almacenar los DataFrames
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_tulancingo', 'df_enero_2024_querertaro', 'df_feb_2024_puebla', 'df_feb_2024_queretaro', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_queretaro', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_queretaro', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_queretaro', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df_financiamientos_2022_queretaro', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_pachuca', 'df_financiamientos_2023_puebla', 'df_financiamientos_2023_queretaro', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_pachuca', 

________
# ***Piramide Poblacional***
# CONSULTAS
### Creación de tablas a usar

- datos_grupos_edad_pachuca

In [12]:
# datos_grupos_edad_pachuca = df_grupos_edad_pachuca_2[['id', 'rango', 'total', 'Hombres', 'Mujeres']]
# datos_grupos_edad_tula = df_grupos_edad_tulancingo[['id', 'rango', 'total', 'hombres', 'mujeres']]


In [44]:
df_grupos_edad_pachuca_2.rename(columns={'Hombres': 'hombres', 'Mujeres': 'mujeres'}, inplace=True)
df_grupos_edad_tulancingo.rename(columns={'Hombres': 'hombres', 'Mujeres': 'mujeres'}, inplace=True)

datos_grupos_edad_hidalgo = pd.concat([df_grupos_edad_pachuca_2[['id', 'rango', 'total', 'hombres', 'mujeres']],
                         df_grupos_edad_tulancingo[['id', 'rango', 'total', 'hombres', 'mujeres']]])

# Merge DataFrames on 'rango'
datos_grupos_edad_hidalgo = pd.merge(df_grupos_edad_pachuca_2, df_grupos_edad_tulancingo, on='rango', suffixes=('_pachuca', '_tulancingo'))

# Si es necesario, puedes crear nuevas columnas sumando los valores de las columnas combinadas
datos_grupos_edad_hidalgo['id'] = datos_grupos_edad_hidalgo['id_pachuca'] = datos_grupos_edad_hidalgo['id_tulancingo']
datos_grupos_edad_hidalgo['total'] = datos_grupos_edad_hidalgo['total_pachuca'] + datos_grupos_edad_hidalgo['total_tulancingo']
datos_grupos_edad_hidalgo['hombres'] = datos_grupos_edad_hidalgo['hombres_pachuca'] + datos_grupos_edad_hidalgo['hombres_tulancingo']
datos_grupos_edad_hidalgo['mujeres'] = datos_grupos_edad_hidalgo['mujeres_pachuca'] + datos_grupos_edad_hidalgo['mujeres_tulancingo']



# Puedes eliminar las columnas originales si ya no son necesarias
datos_grupos_edad_hidalgo.drop(columns=['id_pachuca', 'id_tulancingo', 'total_pachuca', 'total_tulancingo', 'hombres_pachuca', 'hombres_tulancingo', 'mujeres_pachuca', 'mujeres_tulancingo'], inplace=True)
datos_grupos_edad_hidalgo

Unnamed: 0,rango,id,total,hombres,mujeres
0,0 a 4 años,1,56699,28857,27842
1,5 a 9 años,2,64462,32508,31954
2,10 a 14 años,3,68611,34608,34003
3,15 a 19 años,4,72061,36275,35786
4,20 a 24 años,5,69915,34759,35156
5,25 a 29 años,6,66973,32314,34659
6,30 a 34 años,7,65176,30249,34927
7,35 a 39 años,8,63827,29290,34537
8,40 a 44 años,9,60265,27394,32871
9,45 a 49 años,10,56099,25506,30593


In [46]:
def asignar_rango_amplio(id):
    rangos = {range(1, 5): '0-19', range(5, 8): '20-34', range(8, 11): '35-49', range(11, 14): '50-64'} 
    for rango, etiqueta in rangos.items():
        if id in rango:
            return etiqueta
    return '65+' if id > 19 else '65+'

# Asumiendo que df_grupos_edad_pachuca ya tiene la columna 'id'
datos_grupos_edad_hidalgo['rango_amplio'] = datos_grupos_edad_hidalgo['id'].apply(asignar_rango_amplio)

# Agrupar y sumar en una línea
datos_agrupados = datos_grupos_edad_hidalgo.groupby('rango_amplio').sum().reset_index()

def create_population_pyramids(df, title, male_col, female_col, age_group_col):
    age_groups = df[age_group_col].tolist()
    men_values = df[male_col].tolist()
    women_values = df[female_col].tolist()

    
    fig = go.Figure()

    fig.add_trace(go.Bar(
        y=age_groups,
        x=[-value for value in men_values],
        # text=male_data['Population'],  # Etiquetas de cantidad positiva
        name='Hombres',
        orientation='h',
        marker=dict(color='#9500ff'),
        textposition='outside',  # Posición del texto fuera de la barra
    ))

    fig.add_trace(go.Bar(
        y=age_groups,
        x=women_values,  # Coordenadas x invertidas
        # text=female_data['Population'],  # Etiquetas de cantidad positiva
        name='Mujeres',
        orientation='h',
        marker=dict(color='#ff0059'),
        textposition='outside',  # Posición del texto fuera de la barra 
    ))
    
    # Configurar el fondo de la gráfica como transparente
    # fig.update_layout({
    #     'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    #     'paper_bgcolor': 'rgba(0, 0, 0, 0)'
    # })

    # Personalización adicional del gráfico
    fig.update_layout(
        title=title,
        barmode='overlay',
        bargap=0.35,
        xaxis=dict(title='Porcentaje'),
        yaxis=dict(
            title='Rango de Edad', 
            gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        ),
        legend=dict(
            font_size=10,
            orientation='h',  # Orientación horizontal de la leyenda
            yanchor='bottom',  # Anclar al borde inferior
            y=1.02,  # Colocar la leyenda justo debajo del gráfico
            xanchor='right',
            x=1
            ),
        
        plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
        
        margin=dict(l=10, r=10, t=10, b=10)  # Ajusta los márgenes (left, right, top, bottom)
    )

    return fig

# Crear y mostrar la pirámide poblacional
create_population_pyramids(datos_agrupados, '', 'hombres', 'mujeres', 'rango_amplio')


In [48]:
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')
    # pio.write_html(fig, f'{carpeta}/{nombre_archivo}.png')
    
fig_piramide = create_population_pyramids(datos_agrupados, 'Pachuca', 'hombres', 'mujeres', 'rango_amplio')

# Guardar la figura como archivo HTML
guardar_grafico_como_html(fig_piramide, 'g_bar_piramid_poblacion_edad_gen_hidalgo')