# **Tendencias de precios por segmento**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()

# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, '../../db/datos_json')

# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

# Cargar los archivos JSON y crear DataFrames
for archivo in archivos_json:
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())

# Filtrar los nombres que comienzan con "df_", contienen "alfa_q" y "pachuca"
nombres_df_filtrados = [
    nombre for nombre in nombres_variables_globales 
    if nombre.startswith("df_") and "alfa" in nombre and "queretaro" in nombre or 'df_junio_2023_queretaro' in nombre
]
# Imprimir la lista de DataFrames filtrados
print("Lista de DataFrames filtrados:")
nombres_df_filtrados

Lista de DataFrames filtrados:


['df_alfa_abril_2024_queretaro',
 'df_alfa_agosto_2024_queretaro',
 'df_alfa_marzo_2024_queretaro',
 'df_alfa_mayo_2024_queretaro',
 'df_junio_2023_queretaro']

In [2]:
# Iterar sobre cada DataFrame en la lista filtrada
for nombre_df in nombres_df_filtrados:
    # Obtener el DataFrame usando globals()
    df = globals()[nombre_df]
    
    # Verificar si la columna 'm2_contruido' existe en el DataFrame
    #if 'm2_contruido' in df.columns:
        # Renombrar la columna
    df.rename(columns={'segmento':'categoria','Categoria':'categoria','Category':'categoria','Precio':'precio'}, inplace=True)
    # Asignar el DataFrame modificado de nuevo a la variable global
    globals()[nombre_df] = df

# Imprimir confirmación
print("Columnas renombradas en los DataFrames filtrados.")


Columnas renombradas en los DataFrames filtrados.


In [3]:
# Crear una lista de DataFrames seleccionados con las columnas específicas
dataframes_list = []
dataframes_name = []

for nombre_df in nombres_df_filtrados:
    # Seleccionar las columnas 'id' y 'categoria'
    segment_df = globals()[nombre_df][['categoria', 'precio']]
    # Añadir el DataFrame a la lista
    dataframes_list.append(segment_df)
     # Componer el nombre del DataFrame en la lista dataframes_name
    dataframes_name.append(nombre_df)


## Periodo 1

In [4]:
dataframes_list = [
df_alfa_marzo_2024_queretaro,df_alfa_abril_2024_queretaro,    
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_categoria = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el total de precios por categoría en el DataFrame actual
    for categoria, group in df.groupby('categoria'):
        total_precios_por_categoria[categoria] = total_precios_por_categoria.get(categoria, 0) + group['precio'].sum()

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_categoria = {}

# Iterar sobre la lista de DataFrames para calcular el número de observaciones por categoría
for df in dataframes_list:
    for categoria, group in df.groupby('categoria'):
        num_observaciones_por_categoria[categoria] = num_observaciones_por_categoria.get(categoria, 0) + len(group)

# Diccionario para almacenar el promedio de precios por categoría
promedio_precios_por_categoria = {}

# Calcular el promedio de precios por categoría
for categoria in total_precios_por_categoria:
    promedio_precios_por_categoria[categoria] = total_precios_por_categoria[categoria] / num_observaciones_por_categoria[categoria]

# Convertir el diccionario a un DataFrame
periodo1_promedio_precios_por_categoria_df = pd.DataFrame(list(promedio_precios_por_categoria.items()), columns=['categoria', 'promedio_precio'])
# Definir el nuevo orden de las categorías
#nuevo_orden = ['A1', 'A2', 'A3', 'B1', 'B2', 'B3', 'C1', 'C2', 'C3', 'D1', 'D2', 'D3', 'E1', 'E2', 'E3', 'S1','S2','S3']
# Reindexar el DataFrame de acuerdo al nuevo orden
#periodo1_promedio_precios_por_categoria_df = periodo1_promedio_precios_por_categoria_df.set_index('categoria').reindex(nuevo_orden).reset_index()
periodo1_promedio_precios_por_categoria_df = periodo1_promedio_precios_por_categoria_df[periodo1_promedio_precios_por_categoria_df['categoria'].notna() & (periodo1_promedio_precios_por_categoria_df['categoria'] != '')]
periodo1_promedio_precios_por_categoria_df



Unnamed: 0,categoria,promedio_precio
1,A1,3370000.0
2,A2,3628778.0
3,A3,3893383.0
4,B1,2643502.0
5,B2,2883645.0
6,B3,3139581.0
7,C1,1883979.0
8,C2,2139953.0
9,C3,2383432.0
10,D1,1131466.0


## Periodo 2

In [5]:
# Lista de DataFrames
dataframes_list = [
     df_alfa_mayo_2024_queretaro,df_alfa_agosto_2024_queretaro, 
]

# Diccionario para almacenar el total de precios por categoría
total_precios_por_categoria = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el total de precios por categoría en el DataFrame actual
    for categoria, group in df.groupby('categoria'):
        total_precios_por_categoria[categoria] = total_precios_por_categoria.get(categoria, 0) + group['precio'].sum()

# Diccionario para almacenar el número de observaciones por categoría
num_observaciones_por_categoria = {}

# Iterar sobre la lista de DataFrames para calcular el número de observaciones por categoría
for df in dataframes_list:
    for categoria, group in df.groupby('categoria'):
        num_observaciones_por_categoria[categoria] = num_observaciones_por_categoria.get(categoria, 0) + len(group)

# Diccionario para almacenar el promedio de precios por categoría
promedio_precios_por_categoria = {}

# Calcular el promedio de precios por categoría
for categoria in total_precios_por_categoria:
    promedio_precios_por_categoria[categoria] = total_precios_por_categoria[categoria] / num_observaciones_por_categoria[categoria]

# Convertir el diccionario a un DataFrame
periodo2_promedio_precios_por_categoria_df = pd.DataFrame(list(promedio_precios_por_categoria.items()), columns=['categoria', 'promedio_precio'])
#nuevo_orden = ['A1', 'A2', 'A3', 'B1', 'B2', 'B3', 'C1', 'C2', 'C3', 'D1', 'D2', 'D3', 'E1', 'E2', 'E3', 'S1','S2','S3']
# Reindexar el DataFrame de acuerdo al nuevo orden
#periodo2_promedio_precios_por_categoria_df = periodo2_promedio_precios_por_categoria_df.set_index('categoria').reindex(nuevo_orden).reset_index()
periodo2_promedio_precios_por_categoria_df

Unnamed: 0,categoria,promedio_precio
0,,5279580.0
1,A1,3369603.0
2,A2,3630767.0
3,A3,3898629.0
4,B1,2640905.0
5,B2,2884522.0
6,B3,3139748.0
7,C1,1882698.0
8,C2,2139802.0
9,C3,2382822.0


## Cambio porcentual

In [6]:
# Realizando nuevamente el cálculo del porcentaje de cambio
porcentaje_cambio_corregido = ((periodo2_promedio_precios_por_categoria_df['promedio_precio'] - periodo1_promedio_precios_por_categoria_df['promedio_precio']) / periodo1_promedio_precios_por_categoria_df['promedio_precio']) * 100

# Creando un nuevo DataFrame para los resultados corregidos
cambio_porcentual_corregido_df = pd.DataFrame({
    'segmento': periodo1_promedio_precios_por_categoria_df['categoria'],
    'cambio_porcentual': porcentaje_cambio_corregido
})

cambio_porcentual_corregido_df

Unnamed: 0,segmento,cambio_porcentual
0,,
1,A1,-0.01179
2,A2,0.054814
3,A3,0.13473
4,B1,-0.09826
5,B2,0.030416
6,B3,0.005334
7,C1,-0.067989
8,C2,-0.007055
9,C3,-0.025593


In [7]:
# Extraer la letra del segmento
cambio_porcentual_corregido_df['letra_segmento'] = cambio_porcentual_corregido_df['segmento'].str[0]
# Sumar el cambio porcentual por cada letra de segmento único
suma_por_letra_segmento = cambio_porcentual_corregido_df.groupby('letra_segmento')['cambio_porcentual'].sum().reset_index()
# Redondear el resultado a dos decimales
suma_por_letra_segmento['cambio_porcentual'] = suma_por_letra_segmento['cambio_porcentual'].round(2)
suma_por_letra_segmento

Unnamed: 0,letra_segmento,cambio_porcentual
0,A,0.18
1,B,-0.06
2,C,-0.1
3,D,1.09
4,E,13.55
5,L,0.62
6,S,1.51


## Gráfica

In [9]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6']
orden_segmentos = ['E', 'D', 'C', 'B', 'A', 'S', 'L', 'ELITE']

# Convertir la columna 'letra_segmento' en una categoría con el orden deseado
suma_por_letra_segmento['letra_segmento'] = pd.Categorical(
    suma_por_letra_segmento['letra_segmento'],
    categories=orden_segmentos,
    ordered=True
)

# Ordenar el DataFrame según el orden de los segmentos
suma_por_letra_segmento = suma_por_letra_segmento.sort_values('letra_segmento')

fig = go.Figure()
fig.add_trace(go.Bar(
    x=suma_por_letra_segmento['letra_segmento'],
    y=suma_por_letra_segmento['cambio_porcentual'],
    base=0,
    marker_color=[colores[i % len(colores)] for i in range(len(suma_por_letra_segmento))],  # Usar los colores definidos
    text=suma_por_letra_segmento['cambio_porcentual'],  # Usar los porcentajes como texto
    textposition='outside',  # Mostrar el texto dentro de las barras
    texttemplate='%{text}%',  # Formato del texto
    hoverinfo='none',  # No mostrar información al pasar el cursor
))
fig.update_layout(
    #title='Variación Trimestral de % (2022-2023)',
    xaxis_title='Segmentos',
    yaxis_title='Cambio % del precio',
    yaxis=dict(gridcolor='#dddcda'),
    plot_bgcolor='rgba(0,0,0,0)',margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='assets/graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
       # Configuración para desactivar herramientas no deseadas
    config = {
        'displaylogo': False,  # Ocultar el logo de Plotly
        'modeBarButtonsToRemove': [
            'toImage',       # Botón para guardar como imagen
            'select2d',      # Box select
            'lasso2d',       # Lasso select
            'resetScale2d',  # Reset Axes
        ]
    }
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html', config=config)


# Exportar
guardar_grafico_como_html(fig, 'g_bar_precio_segmento_tendencia', carpeta='assets/graficas')
fig.show()