# ***Plusvalía estimada***

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [2]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json)
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [3]:
dataframes = {}
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [4]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres, solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_sep_2023_pachuca', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2023_pachuca', 'df_grupos_edad_pachuca', 'df_grupos_edad_queretaro', 'df_junio_2023_queretaro', 'df_publicacion_pachuca', 'df_salarios_pachuca', 'df_usuarios']


___
# *Mediante datos directos*


In [5]:
datos_directos = {
    'año': [2022, 2023, 2024, 2025, 2026],
    'promedio': [2589333.1, 3534894.07, 3984402.09, 4491070.92, 5062169.32]
}
# Crear DataFrame
direct_data = pd.DataFrame(datos_directos)
direct_data

Unnamed: 0,año,promedio
0,2022,2589333.1
1,2023,3534894.07
2,2024,3984402.09
3,2025,4491070.92
4,2026,5062169.32


In [7]:
# Datos
año = direct_data['año']
promedio = direct_data['promedio']

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))
# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"${p:,.2f}",  # Formatear el valor del promedio como moneda
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )
# Actualizar diseño
fig.update_layout(
    title='Plusvalía estimada',
    yaxis=dict(
        range=[0, 6000000],  # Establecer el rango del eje y
        tickvals=[2000000, 4000000, 6000000],  # Definir los valores de las marcas en el eje y
        ticktext=['$2,000,000', '$4,000,000', '$6,000,000'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',  # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_plusvaliaestimada_direct_pachuca', carpeta='graficas')
fig.show()


PORCENTUAL

In [8]:
datos_directos = {
    'año': [2023, 2024, 2025, 2026],
    'promedio': [36.5, 49.2, 61.9, 74.6]
}
# Crear DataFrame
direct_data_por = pd.DataFrame(datos_directos)
direct_data_por

Unnamed: 0,año,promedio
0,2023,36.5
1,2024,49.2
2,2025,61.9
3,2026,74.6


In [15]:
# Datos
año = direct_data_por['año']
promedio = direct_data_por['promedio']

# Crear figura
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=año,
    y=promedio,
    mode='markers+lines',
    marker=dict(color='blue'),
))

# Agregar anotaciones para mostrar los valores encima de los puntos
for a, p in zip(año, promedio):
    fig.add_annotation(
        x=a,
        y=p,
        text=f"{p}%",  # Formatear el valor del promedio como porcentaje
        showarrow=False,
        font=dict(color='black', size=12),
        xshift=0,
        yshift=17,
        textangle=0
    )

# Actualizar diseño
fig.update_layout(
    title='Plusvalía estimada, Porcentual',
    yaxis=dict(
        range=[0, 100],  # Establecer el rango del eje y
        tickvals=[0, 25, 50, 75, 100],  # Definir los valores de las marcas en el eje y
        ticktext=['0%', '25%', '50%', '75%', '100%'],  # Definir el texto de las marcas en el eje y
        gridcolor='#dddcda',  # Color de las líneas de la cuadrícula
        gridwidth=1  # Ancho de las líneas de la cuadrícula
    ),
    xaxis=dict(
        gridcolor='#dddcda', 
        tickmode='array',
        tickvals=año,
        ticktext=año
    ),
    plot_bgcolor='rgba(0,0,0,0)'
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_scatt_plusvaliaestimada_porcentual_direct_pachuca', carpeta='graficas')
fig.show()


____
____
## *Identificamos columnas relevantes*

In [None]:
print("OCTUBRE 2022")
print(df_alfa_q_oct_2022_pachuca.columns)
print("NOVIEMBRE 2022")
print(df_alfa_q_nov_2022_pachuca.columns)
print("FEBRERO 2023")
print(df_alfa_q_feb_2023_pachuca.columns)
print("MAR 2023")
print(df_alfa_q_mar_2023_pachuca.columns)
print("JUNIO 2023")
print(df_alfa_q_jun_2023_pachuca.columns)
print("JULIO 2023")
print(df_alfa_q_jul_2023_pachuca.columns)
print("SEPTIEMBRE 2023")
print(df_alfa_q_sep_2023_pachuca.columns)

OCTUBRE 2022
Index(['id', 'q', 'categoria', 'ids', 'propiedad', 'precio', 'm2_total',
       'm2_contruido', 'precio_m2_contruido', 'precio_m2_terreno',
       'publicado_hace', 'personas_interesadas', 'status', 'tipo',
       'estacionamiento', 'recamaras', 'baño', 'medio_baño', 'baño_total',
       'cantidad_pisos', 'antiguedad', 'seguridad_privada', 'fraccionamiento',
       'colonia', 'cp', 'url'],
      dtype='object')
NOVIEMBRE 2022
Index(['id', 'categoria', 'ids', 'propiedad', 'precio', 'm2_total',
       'm2_contruido', 'precio_m2_contruido', 'precio_m2_terreno',
       'publicado_hace', 'personas_interesadas', 'promedio', 'status', 'tipo',
       'estacionamiento', 'recamaras', 'baño', 'medio_baño', 'baño_total',
       'cantidad_piso', 'antiguedad', 'seguridad', 'fraccionamiento',
       'colonia', 'cp', 'url'],
      dtype='object')
FEBRERO 2023
Index(['id', 'categoria', 'ids', 'propiedad', 'precio', 'tipo',
       'personas_interesadas', 'm2_total', 'm2_contruido',
       '

In [None]:
# Crea los DataFrames para cada archivo con las columnas necesarias
oct_2022 = df_alfa_q_oct_2022_pachuca[['categoria','propiedad','precio','m2_total','m2_contruido']]
nov_2022 = df_alfa_q_nov_2022_pachuca[['categoria','propiedad','precio','m2_total']]
feb_2023 = df_alfa_q_feb_2023_pachuca[['categoria','propiedad','precio','m2_total']]
mar_2023 = df_alfa_q_mar_2023_pachuca[['categoria','propiedad','precio','m2_total']]
jun_2023 = df_alfa_q_jun_2023_pachuca[['categoria','propiedad','precio','m2_total','m2_contruido']]
jul_2023 = df_alfa_q_jul_2023_pachuca[['categoria','propiedad','precio','m2_total','m2_contruido']]
sep_2023 = df_alfa_q_sep_2023_pachuca[['categoria','propiedad','precio','m2_total','m2_construido']] 

In [None]:
# Lista de DataFrames
df_list = [df1, df2, df3]

# Define un diccionario para mapear nombres de columnas
mapeo_columnas = {
    'm2_contruido': 'm2_construido',  # Aquí defines los mapeos para las columnas
    # Agrega más mapeos si es necesario
}

# Iterar sobre cada DataFrame en df_list y renombrar las columnas según el mapeo
for df in df_list:
    df.rename(columns=mapeo_columnas, inplace=True)
