# ***3.3 Tendencias de precios por segmento***

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [3]:
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [4]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres, solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)
dfs_list = nombres_df 

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df_financiamientos_2022_

# *PACHUCA*

In [5]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_pachuca = [df for df in dfs_list if 'pachuca' in df]
print(dataframes_pachuca)

['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_publicacion_pachuca', 'df_salarios_pachuca']


In [6]:
seg_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['id','categoria', 'precio']]
seg_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['id','categoria', 'precio']]
seg_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['id','categoria', 'precio']]
seg_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['id','categoria', 'precio']]
seg_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['id','categoria', 'precio']]
seg_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['id','categoria', 'precio']]
seg_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['id','categoria', 'precio']]

#### *Periodo 1*

In [7]:
# Lista de DataFrames
dataframes_list = [
    seg_df_alfa_q_oct_2022_pachuca,
    seg_df_alfa_q_nov_2022_pachuca,
    seg_df_alfa_q_feb_2023_pachuca
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_categoria = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el total de precios por categoría en el DataFrame actual
    for categoria, group in df.groupby('categoria'):
        total_precios_por_categoria[categoria] = total_precios_por_categoria.get(categoria, 0) + group['precio'].sum()

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_categoria = {}

# Iterar sobre la lista de DataFrames para calcular el número de observaciones por categoría
for df in dataframes_list:
    for categoria, group in df.groupby('categoria'):
        num_observaciones_por_categoria[categoria] = num_observaciones_por_categoria.get(categoria, 0) + len(group)

# Diccionario para almacenar el promedio de precios por categoría
promedio_precios_por_categoria = {}

# Calcular el promedio de precios por categoría
for categoria in total_precios_por_categoria:
    promedio_precios_por_categoria[categoria] = total_precios_por_categoria[categoria] / num_observaciones_por_categoria[categoria]

# Convertir el diccionario a un DataFrame
periodo1_promedio_precios_por_categoria_df = pd.DataFrame(list(promedio_precios_por_categoria.items()), columns=['categoria', 'promedio_precio'])
periodo1_promedio_precios_por_categoria_df

Unnamed: 0,categoria,promedio_precio
0,A1,999999.99
1,A2,999999.99
2,A3,999999.99
3,B1,999999.99
4,B2,999999.99
5,B3,999999.99
6,C1,999999.99
7,C2,999999.99
8,C3,999999.99
9,D1,999999.99


#### *Periodo 2*

In [8]:
# Lista de DataFrames
dataframes_list = [
    seg_df_alfa_q_mar_2023_pachuca,
    seg_df_alfa_q_jun_2023_pachuca,
    seg_df_alfa_q_jul_2023_pachuca,
    seg_df_alfa_q_sep_2023_pachuca
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_categoria = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el total de precios por categoría en el DataFrame actual
    for categoria, group in df.groupby('categoria'):
        total_precios_por_categoria[categoria] = total_precios_por_categoria.get(categoria, 0) + group['precio'].sum()

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_categoria = {}

# Iterar sobre la lista de DataFrames para calcular el número de observaciones por categoría
for df in dataframes_list:
    for categoria, group in df.groupby('categoria'):
        num_observaciones_por_categoria[categoria] = num_observaciones_por_categoria.get(categoria, 0) + len(group)

# Diccionario para almacenar el promedio de precios por categoría
promedio_precios_por_categoria = {}

# Calcular el promedio de precios por categoría
for categoria in total_precios_por_categoria:
    promedio_precios_por_categoria[categoria] = total_precios_por_categoria[categoria] / num_observaciones_por_categoria[categoria]

# Convertir el diccionario a un DataFrame
periodo2_promedio_precios_por_categoria_df = pd.DataFrame(list(promedio_precios_por_categoria.items()), columns=['categoria', 'promedio_precio'])
periodo2_promedio_precios_por_categoria_df

Unnamed: 0,categoria,promedio_precio
0,A1,999999.99
1,A2,999999.99
2,A3,998478.201148
3,B1,999161.210065
4,B2,997651.530455
5,B3,997931.02454
6,C1,997904.554398
7,C2,995840.698319
8,C3,995141.131872
9,D1,996199.218075


#### *Cambio porcentual*

In [9]:
# Realizando nuevamente el cálculo del porcentaje de cambio
porcentaje_cambio_corregido = ((periodo2_promedio_precios_por_categoria_df['promedio_precio'] - periodo1_promedio_precios_por_categoria_df['promedio_precio']) / periodo1_promedio_precios_por_categoria_df['promedio_precio']) * 100

# Creando un nuevo DataFrame para los resultados corregidos
cambio_porcentual_corregido_df = pd.DataFrame({
    'segmento': periodo1_promedio_precios_por_categoria_df['categoria'],
    'cambio_porcentual': porcentaje_cambio_corregido
})

cambio_porcentual_corregido_df

Unnamed: 0,segmento,cambio_porcentual
0,A1,-2.328306e-14
1,A2,-1.164153e-14
2,A3,-0.1521789
3,B1,-0.08387799
4,B2,-0.234846
5,B3,-0.2068965
6,C1,-0.2095436
7,C2,-0.4159292
8,C3,-0.4858858
9,D1,-0.3800772


In [10]:
# Extraer la letra del segmento
cambio_porcentual_corregido_df['letra_segmento'] = cambio_porcentual_corregido_df['segmento'].str[0]
# Sumar el cambio porcentual por cada letra de segmento único
suma_por_letra_segmento = cambio_porcentual_corregido_df.groupby('letra_segmento')['cambio_porcentual'].sum().reset_index()
# Redondear el resultado a dos decimales
suma_por_letra_segmento['cambio_porcentual'] = suma_por_letra_segmento['cambio_porcentual'].round(2)
suma_por_letra_segmento

Unnamed: 0,letra_segmento,cambio_porcentual
0,A,-0.15
1,B,-0.53
2,C,-1.11
3,D,0.65
4,E,-0.37
5,S,-0.36


In [11]:
colores = ['#3d45c0', '#ff4853', '#ffb038', '#7cc668', '#67c2df', '#6773df', '#939fad']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=suma_por_letra_segmento['letra_segmento'],
    y=suma_por_letra_segmento['cambio_porcentual'],
    base=0,
    marker_color=[colores[i % len(colores)] for i in range(len(suma_por_letra_segmento))],  # Usar los colores definidos
    text=suma_por_letra_segmento['cambio_porcentual'],  # Usar los porcentajes como texto
    textposition='inside',  # Mostrar el texto dentro de las barras
    texttemplate='%{text}%',  # Formato del texto
    hoverinfo='none',  # No mostrar información al pasar el cursor
))
fig.update_layout(
    title='Variación Trimestral de % (2022-2023)',
    #xaxis_title='Segmentos',
    yaxis_title='%',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_tendencia_preciosegmento_pachuca', carpeta='graficas')

fig.show()

### *POR TRIMESTRES Y LETRAS AGRUPADAS*

In [16]:
# Lista de DataFrames
dataframes_list = [
    seg_df_alfa_q_oct_2022_pachuca,
    seg_df_alfa_q_nov_2022_pachuca,
    seg_df_alfa_q_feb_2023_pachuca
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_segmento = {}

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_segmento = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Añadir una nueva columna que extraiga el segmento
    df['segmento'] = df['categoria'].str[0] # Letra
    # Calcular el total de precios por segmento en el DataFrame actual
    for segmento, group in df.groupby('segmento'):
        total_precios_por_segmento[segmento] = total_precios_por_segmento.get(segmento, 0) + group['precio'].sum()
        num_observaciones_por_segmento[segmento] = num_observaciones_por_segmento.get(segmento, 0) + len(group)

# Diccionario para almacenar el promedio de precios por segmento
promedio_precios_por_segmento = {}

# Calcular el promedio de precios por segmento
for segmento in total_precios_por_segmento:
    promedio_precios_por_segmento[segmento] = total_precios_por_segmento[segmento] / num_observaciones_por_segmento[segmento]

# Convertir el diccionario a un DataFrame
trimestre1_promedio_precios_por_segmento_df = pd.DataFrame(list(promedio_precios_por_segmento.items()), columns=['segmento', 'promedio_precio'])
trimestre1_promedio_precios_por_segmento_df



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Unnamed: 0,segmento,promedio_precio
0,A,999999.99
1,B,999999.99
2,C,999999.99
3,D,963098.484032
4,E,609743.657754
5,S,999999.99


In [17]:
# Lista de DataFrames
dataframes_list = [
    seg_df_alfa_q_mar_2023_pachuca,
    seg_df_alfa_q_jun_2023_pachuca,
    seg_df_alfa_q_jul_2023_pachuca,
    seg_df_alfa_q_sep_2023_pachuca
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_segmento = {}

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_segmento = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Añadir una nueva columna que extraiga el segmento
    df['segmento'] = df['categoria'].str[0] # Letra
    # Calcular el total de precios por segmento en el DataFrame actual
    for segmento, group in df.groupby('segmento'):
        total_precios_por_segmento[segmento] = total_precios_por_segmento.get(segmento, 0) + group['precio'].sum()
        num_observaciones_por_segmento[segmento] = num_observaciones_por_segmento.get(segmento, 0) + len(group)

# Diccionario para almacenar el promedio de precios por segmento
promedio_precios_por_segmento = {}

# Calcular el promedio de precios por segmento
for segmento in total_precios_por_segmento:
    promedio_precios_por_segmento[segmento] = total_precios_por_segmento[segmento] / num_observaciones_por_segmento[segmento]

# Convertir el diccionario a un DataFrame
trimestre2_promedio_precios_por_segmento_df = pd.DataFrame(list(promedio_precios_por_segmento.items()), columns=['segmento', 'promedio_precio'])
trimestre2_promedio_precios_por_segmento_df



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/

Unnamed: 0,segmento,promedio_precio
0,A,999469.8184
1,B,998308.394032
2,C,996087.817254
3,D,970908.364894
4,E,672593.005578
5,S,996417.082835


In [18]:
# Revisando los DataFrames
print("Trimestre 1:", trimestre1_promedio_precios_por_segmento_df)
print("Trimestre 2:", trimestre2_promedio_precios_por_segmento_df)

# Realizando nuevamente el cálculo del porcentaje de cambio
porcentaje_cambio_corregido = ((trimestre2_promedio_precios_por_segmento_df['promedio_precio'] - trimestre1_promedio_precios_por_segmento_df['promedio_precio']) / trimestre1_promedio_precios_por_segmento_df['promedio_precio']) * 100
# Creando un nuevo DataFrame para los resultados corregidos
cambio_porcentual_corregido_df_trimestres = pd.DataFrame({
    'segmento': trimestre1_promedio_precios_por_segmento_df['segmento'],
    'cambio_porcentual': porcentaje_cambio_corregido
})
cambio_porcentual_corregido_df_trimestres['cambio_porcentual'] = cambio_porcentual_corregido_df_trimestres['cambio_porcentual'].round(2)
cambio_porcentual_corregido_df_trimestres

Trimestre 1:   segmento  promedio_precio
0        A    999999.990000
1        B    999999.990000
2        C    999999.990000
3        D    963098.484032
4        E    609743.657754
5        S    999999.990000
Trimestre 2:   segmento  promedio_precio
0        A    999469.818400
1        B    998308.394032
2        C    996087.817254
3        D    970908.364894
4        E    672593.005578
5        S    996417.082835


Unnamed: 0,segmento,cambio_porcentual
0,A,-0.05
1,B,-0.17
2,C,-0.39
3,D,0.81
4,E,10.31
5,S,-0.36


In [19]:
colores = ['#3d45c0', '#ff4853', '#ffb038', '#7cc668', '#67c2df', '#6773df', '#939fad']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=cambio_porcentual_corregido_df_trimestres['segmento'],
    y=cambio_porcentual_corregido_df_trimestres['cambio_porcentual'],
    base=0,
    marker_color=[colores[i % len(colores)] for i in range(len(cambio_porcentual_corregido_df_trimestres))],  # Usar los colores definidos
    text=cambio_porcentual_corregido_df_trimestres['cambio_porcentual'],  # Usar los porcentajes como texto
    textposition='inside',  # Mostrar el texto dentro de las barras
    texttemplate='%{text}%',  # Formato del texto
    hoverinfo='none',  # No mostrar información al pasar el cursor
))
fig.update_layout(
    title='Variación Trimestral de % (2022-2023)',
    #xaxis_title='Segmentos',
    yaxis_title='%',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_tendencia_preciosegmento_trimestres_pachuca', carpeta='graficas')

fig.show()

# *TULANCINGO*

In [20]:
# Seleccionar solo los DataFrames que contienen la cadena "pachuca"
dataframes_tulancingo = [df for df in dfs_list if 'tulancingo' in df]
print(dataframes_tulancingo)

['df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_tulancingo', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_tulancingo', 'df_tiempo_dias_tulancingo']


In [21]:
seg_df_alfa_q_jul_2022_tulancingo = df_alfa_q_jul_2022_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_jul_2023_tulancingo = df_alfa_q_jul_2023_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_jun_2023_tulancingo = df_alfa_q_jun_2023_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_mar_2023_tulancingo = df_alfa_q_mar_2023_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_may_2022_tulancingo = df_alfa_q_may_2022_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_may_2023_tulancingo = df_alfa_q_may_2023_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_oct_2022_tulancingo = df_alfa_q_oct_2022_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_oct_2023_tulancingo = df_alfa_q_oct_2023_tulancingo[['id','categoria', 'precio']]
seg_df_alfa_q_sep_2023_tulancingo = df_alfa_q_sep_2023_tulancingo[['id','categoria', 'precio']]

In [38]:
# Lista de DataFrames
dataframes_list = [
    seg_df_alfa_q_oct_2022_tulancingo,
    seg_df_alfa_q_jul_2022_tulancingo,
    seg_df_alfa_q_may_2022_tulancingo
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_categoria = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el total de precios por categoría en el DataFrame actual
    for categoria, group in df.groupby('categoria'):
        total_precios_por_categoria[categoria] = total_precios_por_categoria.get(categoria, 0) + group['precio'].sum()

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_categoria = {}

# Iterar sobre la lista de DataFrames para calcular el número de observaciones por categoría
for df in dataframes_list:
    for categoria, group in df.groupby('categoria'):
        num_observaciones_por_categoria[categoria] = num_observaciones_por_categoria.get(categoria, 0) + len(group)

# Diccionario para almacenar el promedio de precios por categoría
promedio_precios_por_categoria = {}

# Calcular el promedio de precios por categoría
for categoria in total_precios_por_categoria:
    promedio_precios_por_categoria[categoria] = total_precios_por_categoria[categoria] / num_observaciones_por_categoria[categoria]

# Convertir el diccionario a un DataFrame
periodo1_promedio_precios_por_categoria_df = pd.DataFrame(list(promedio_precios_por_categoria.items()), columns=['categoria', 'promedio_precio'])
# Definir el nuevo orden de las categorías
nuevo_orden = ['A1', 'A2', 'A3', 'B1', 'B2', 'B3', 'C1', 'C2', 'C3', 'D1', 'D2', 'D3', 'E1', 'E2', 'S']
# Reindexar el DataFrame de acuerdo al nuevo orden
periodo1_promedio_precios_por_categoria_df = periodo1_promedio_precios_por_categoria_df.set_index('categoria').reindex(nuevo_orden).reset_index()
periodo1_promedio_precios_por_categoria_df

Unnamed: 0,categoria,promedio_precio
0,A1,3541667.0
1,A2,3371455.0
2,A3,3178714.0
3,B1,2814650.0
4,B2,2606571.0
5,B3,2400740.0
6,C1,2089377.0
7,C2,1843399.0
8,C3,1617143.0
9,D1,1363608.0


In [39]:
# Lista de DataFrames
dataframes_list = [
    seg_df_alfa_q_mar_2023_tulancingo,
    seg_df_alfa_q_may_2023_tulancingo,
    seg_df_alfa_q_jun_2023_tulancingo,
    seg_df_alfa_q_jul_2023_tulancingo,
    seg_df_alfa_q_sep_2023_tulancingo,
    seg_df_alfa_q_oct_2023_tulancingo
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_categoria = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el total de precios por categoría en el DataFrame actual
    for categoria, group in df.groupby('categoria'):
        total_precios_por_categoria[categoria] = total_precios_por_categoria.get(categoria, 0) + group['precio'].sum()

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_categoria = {}

# Iterar sobre la lista de DataFrames para calcular el número de observaciones por categoría
for df in dataframes_list:
    for categoria, group in df.groupby('categoria'):
        num_observaciones_por_categoria[categoria] = num_observaciones_por_categoria.get(categoria, 0) + len(group)

# Diccionario para almacenar el promedio de precios por categoría
promedio_precios_por_categoria = {}

# Calcular el promedio de precios por categoría
for categoria in total_precios_por_categoria:
    promedio_precios_por_categoria[categoria] = total_precios_por_categoria[categoria] / num_observaciones_por_categoria[categoria]

# Convertir el diccionario a un DataFrame
periodo2_promedio_precios_por_categoria_df = pd.DataFrame(list(promedio_precios_por_categoria.items()), columns=['categoria', 'promedio_precio'])
periodo2_promedio_precios_por_categoria_df

Unnamed: 0,categoria,promedio_precio
0,A1,3534818.0
1,A2,3330602.0
2,A3,3091500.0
3,B1,2858591.0
4,B2,2634000.0
5,B3,2361569.0
6,C1,2103819.0
7,C2,1843850.0
8,C3,1599541.0
9,D1,1337765.0


In [40]:
# Realizando nuevamente el cálculo del porcentaje de cambio
porcentaje_cambio_corregido = ((periodo2_promedio_precios_por_categoria_df['promedio_precio'] - periodo1_promedio_precios_por_categoria_df['promedio_precio']) / periodo1_promedio_precios_por_categoria_df['promedio_precio']) * 100
periodo1_promedio_precios_por_categoria_df = periodo1_promedio_precios_por_categoria_df.sort_values(by='categoria')

# Creando un nuevo DataFrame para los resultados corregidos
cambio_porcentual_corregido_df = pd.DataFrame({
    'segmento': periodo1_promedio_precios_por_categoria_df['categoria'],
    'cambio_porcentual': porcentaje_cambio_corregido
})

cambio_porcentual_corregido_df

Unnamed: 0,segmento,cambio_porcentual
0,A1,-0.193369
1,A2,-1.211712
2,A3,-2.743697
3,B1,1.56115
4,B2,1.052285
5,B3,-1.631627
6,C1,0.691205
7,C2,0.024483
8,C3,-1.08847
9,D1,-1.895192


In [41]:
# Extraer la letra del segmento
cambio_porcentual_corregido_df['letra_segmento'] = cambio_porcentual_corregido_df['segmento'].str[0]
# Sumar el cambio porcentual por cada letra de segmento único
suma_por_letra_segmento = cambio_porcentual_corregido_df.groupby('letra_segmento')['cambio_porcentual'].sum().reset_index()
# Redondear el resultado a dos decimales
suma_por_letra_segmento['cambio_porcentual'] = suma_por_letra_segmento['cambio_porcentual'].round(2)
suma_por_letra_segmento

Unnamed: 0,letra_segmento,cambio_porcentual
0,A,-4.15
1,B,0.98
2,C,-0.37
3,D,-4.22
4,E,-4.03
5,S,5.34


In [45]:
colores = ['#3d45c0', '#ff4853', '#ffb038', '#7cc668', '#67c2df', '#6773df', '#939fad']

fig = go.Figure()
fig.add_trace(go.Bar(
    x=suma_por_letra_segmento['letra_segmento'],
    y=suma_por_letra_segmento['cambio_porcentual'],
    base=0,
    marker_color=[colores[i % len(colores)] for i in range(len(suma_por_letra_segmento))],  # Usar los colores definidos
    text=suma_por_letra_segmento['cambio_porcentual'],  # Usar los porcentajes como texto
    textposition='outside',  # Mostrar el texto dentro de las barras
    texttemplate='%{text}%',  # Formato del texto
    hoverinfo='none',  # No mostrar información al pasar el cursor
))
fig.update_yaxes(range=[-5, 6])
fig.update_layout(
    title='Variación Trimestral de % (2022-2023)',
    #xaxis_title='Segmentos',
    yaxis_title='%',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_tendencia_preciosegmento_tulancingo', carpeta='graficas')

fig.show()