# **COLONIAS**

In [2]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

In [3]:
# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json) # Imprimir la ruta relativa
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

In [4]:
dataframes = {} # Crear un diccionario para almacenar los DataFrames
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

In [5]:
# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]

# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_tulancingo', 'df_financiamientos_2023_pachuca', 'df_financiamientos_2023_tulancingo', 'df_grupos_edad_pachuca', 'df_grupos_edad_queretaro', 'df_grupos_edad_

# ***Más baratas***

## **TULANCINGO**

In [17]:
preciocol_may_2022_tulgo = df_alfa_q_may_2022_tulancingo[['precio', 'colonia']]
preciocol_jul_2022_tulgo = df_alfa_q_jul_2022_tulancingo[['precio', 'colonia']]
preciocol_oct_2022_tulgo = df_alfa_q_oct_2022_tulancingo[['precio', 'colonia']]
preciocol_mar_2023_tulgo = df_alfa_q_mar_2023_tulancingo[['precio', 'colonia']]
preciocol_may_2023_tulgo = df_alfa_q_may_2023_tulancingo[['precio', 'colonia']]
preciocol_jun_2023_tulgo = df_alfa_q_jun_2023_tulancingo[['precio', 'colonia']]
preciocol_jul_2023_tulgo = df_alfa_q_jul_2023_tulancingo[['precio', 'colonia']]
preciocol_sep_2023_tulgo = df_alfa_q_sep_2023_tulancingo[['precio', 'colonia']]
preciocol_oct_2023_tulgo = df_alfa_q_oct_2023_tulancingo[['precio', 'colonia']]

In [27]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciocol_may_2022_tulgo,
                            preciocol_jul_2022_tulgo,
                            preciocol_oct_2022_tulgo,
                            preciocol_mar_2023_tulgo,
                            preciocol_may_2023_tulgo,
                            preciocol_jun_2023_tulgo,
                            preciocol_jul_2023_tulgo,
                            preciocol_sep_2023_tulgo,
                            preciocol_oct_2023_tulgo
                        ])
# Normalizar el nombre de la colonia
df_concatenado['colonia'] = df_concatenado['colonia'].str.lower().str.strip()
# Agrupar por colonia y calcular el promedio de precios
df_promedio_colonia = df_concatenado.groupby('colonia')['precio'].mean().reset_index()
# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
df_promedio_colonia['colonia'] = df_promedio_colonia['colonia'].str.title()
# Ordenar por precio promedio en orden ascendente
df_promedio_colonia = df_promedio_colonia.sort_values(by='precio')

# Seleccionar las colonias más baratas
top_colonias_baratas = df_promedio_colonia.head(5)
top_colonias_baratas

Unnamed: 0,colonia,precio
31,Guadalupe 3A Secc,597900.0
29,Francisco Villa Napateco,630000.0
9,Campo Alegre,668942.111111
42,La Esmeralda,687553.4
17,El Paraíso,700602.0


In [29]:
colores = ['#df00ff','#939fad','#6773df','#67c2df','#7cc668','#ffb038','#ff4853','#3d45c0']
col = top_colonias_baratas['colonia']
precio = top_colonias_baratas['precio']
fig = go.Figure()
fig.add_trace(go.Bar(
    y=col[::-1],  # Invertir el orden de los datos
    x=precio[::-1],  # Invertir el orden de los datos
    orientation='h', 
    marker_color='#34a853',  # Colores de las barras
    text=precio[::-1].apply(lambda x: '${:,.2f}'.format(x)),  # Invertir el orden de los datos
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
))
fig.update_layout(
    title='Colonias más baratas (Tulancingo)',  # Título de la gráfica
    xaxis=dict(
        title='$', # Título del eje x
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje X
        range=[0, 800000],  # Establecer el rango del eje y
        tickvals=[0, 200000,400000,600000, 800000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$200,000.00', '$4,000,000.00','$6,000,000.00','$8,000,000.00'],  # Definir el texto de las marcas en el eje y
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_colbaratas_t5_tulancingo', carpeta='graficas')
fig.show()

### *DIRECTOS*

In [12]:
# Datos a agregar
datos_baratas = {
    'Colonias': ['Jardines del Paraiso','Rancho Guadalupe','Campo Alegre','La Esmeralda','Francisco Villa','Huapalcalco','Rinconada La Morena','El Paraíso'],
    'Precio_promedio': [505000.00, 549000.00, 657810.47, 687553.40, 690000.00, 695714.29,700000.00,700602.00]
}

# Convertir a DataFrame
Colonias_mas_baratas = pd.DataFrame(datos_baratas)
Colonias_mas_baratas

Unnamed: 0,Colonias,Precio_promedio
0,Jardines del Paraiso,505000.0
1,Rancho Guadalupe,549000.0
2,Campo Alegre,657810.47
3,La Esmeralda,687553.4
4,Francisco Villa,690000.0
5,Huapalcalco,695714.29
6,Rinconada La Morena,700000.0
7,El Paraíso,700602.0


In [14]:
colores = ['#df00ff','#939fad','#6773df','#67c2df','#7cc668','#ffb038','#ff4853','#3d45c0']
col = Colonias_mas_baratas['Colonias']
precio = Colonias_mas_baratas['Precio_promedio']
fig = go.Figure()
fig.add_trace(go.Bar(
    y=col[::-1],  # Invertir el orden de los datos
    x=precio[::-1],  # Invertir el orden de los datos
    orientation='h', 
    marker_color='#7cc668',  # Colores de las barras
    text=precio[::-1].apply(lambda x: '${:,.2f}'.format(x)),  # Invertir el orden de los datos
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
))
fig.update_layout(
    title='Colonias más baratas (Tulancingo)',  # Título de la gráfica
    xaxis=dict(
        title='$', # Título del eje x
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje X
        range=[0, 800000],  # Establecer el rango del eje y
        tickvals=[0, 200000,400000,600000, 800000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$200,000.00', '$4,000,000.00','$6,000,000.00','$8,000,000.00'],  # Definir el texto de las marcas en el eje y
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_colbaratas_tulancingo', carpeta='graficas')
fig.show()

## **PACHUCA**

In [28]:
#preciocol_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['precio', 'colonia']]

In [29]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciocol_df_alfa_q_jul_2023_pachuca,
                            preciocol_df_alfa_q_jun_2023_pachuca,
                            preciocol_df_alfa_q_mar_2023_pachuca,
                            preciocol_df_alfa_q_nov_2022_pachuca,
                            preciocol_df_alfa_q_oct_2022_pachuca,
                            preciocol_df_alfa_q_sep_2023_pachuca,                            
                        ])
# Normalizar el nombre de la colonia
df_concatenado['colonia'] = df_concatenado['colonia'].str.lower().str.strip()


In [30]:
# Reemplazar después de la normalización
df_concatenado['colonia'] = df_concatenado['colonia'].replace('uni?n popular', 'unión popular')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('uni??n Popular', 'unión popular')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('uni??n popular', 'unión popular')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('lomas de nueva airosa.', 'lomas de nueva airosa')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('josǹ l??pez portillo', 'josé lópez portillo')

In [31]:
# Agrupar por colonia y calcular el promedio de precios
df_promedio_colonia = df_concatenado.groupby('colonia')['precio'].mean().reset_index()
# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
df_promedio_colonia['colonia'] = df_promedio_colonia['colonia'].str.title()
# Ordenar por precio promedio en orden ascendente
df_promedio_colonia = df_promedio_colonia.sort_values(by='precio')

# Seleccionar las colonias más baratas
top_colonias_baratas = df_promedio_colonia.head(5)
top_colonias_baratas

Unnamed: 0,colonia,precio
328,Unión Popular,157136.0
132,La Surtidora,380000.0
196,Pirules,450000.0
141,Lomas De Nueva Airosa,494153.5
108,José López Portillo,560000.0


In [33]:
colores = ['#df00ff','#939fad','#6773df','#67c2df','#7cc668','#ffb038','#ff4853','#3d45c0']
col = top_colonias_baratas['colonia']
precio = top_colonias_baratas['precio']
fig = go.Figure()
fig.add_trace(go.Bar(
    y=col[::-1],  # Invertir el orden de los datos
    x=precio[::-1],  # Invertir el orden de los datos
    orientation='h', 
    marker_color='#34a853',  # Colores de las barras
    text=precio[::-1].apply(lambda x: '${:,.2f}'.format(x)),  # Invertir el orden de los datos
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
))
fig.update_layout(
    title='Colonias más baratas (Pachuca)',  # Título de la gráfica
    xaxis=dict(
        title='$', # Título del eje x
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje X
        range=[0, 600000],  # Establecer el rango del eje y
        tickvals=[0, 200000,400000,600000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$200,000.00', '$4,000,000.00','$6,000,000.00','$8,000,000.00'],  # Definir el texto de las marcas en el eje y
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_colbaratas_t5_pachuca', carpeta='graficas')
fig.show()

___
___
___
# ***COLONIAS MÁS CARAS***

## **TULANCINGO**

In [23]:
preciocol_may_2022_tulgo = df_alfa_q_may_2022_tulancingo[['precio', 'colonia']]
preciocol_jul_2022_tulgo = df_alfa_q_jul_2022_tulancingo[['precio', 'colonia']]
preciocol_oct_2022_tulgo = df_alfa_q_oct_2022_tulancingo[['precio', 'colonia']]
preciocol_mar_2023_tulgo = df_alfa_q_mar_2023_tulancingo[['precio', 'colonia']]
preciocol_may_2023_tulgo = df_alfa_q_may_2023_tulancingo[['precio', 'colonia']]
preciocol_jun_2023_tulgo = df_alfa_q_jun_2023_tulancingo[['precio', 'colonia']]
preciocol_jul_2023_tulgo = df_alfa_q_jul_2023_tulancingo[['precio', 'colonia']]
preciocol_sep_2023_tulgo = df_alfa_q_sep_2023_tulancingo[['precio', 'colonia']]
preciocol_oct_2023_tulgo = df_alfa_q_oct_2023_tulancingo[['precio', 'colonia']]

In [24]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciocol_may_2022_tulgo,
                            preciocol_jul_2022_tulgo,
                            preciocol_oct_2022_tulgo,
                            preciocol_mar_2023_tulgo,
                            preciocol_may_2023_tulgo,
                            preciocol_jun_2023_tulgo,
                            preciocol_jul_2023_tulgo,
                            preciocol_sep_2023_tulgo,
                            preciocol_oct_2023_tulgo
                        ])

# Normalizar el nombre de la colonia
df_concatenado['colonia'] = df_concatenado['colonia'].str.lower().str.strip()

In [25]:
# Reemplazar "felipe Ãngeles" por "felipe angeles" después de la normalización
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe ãngeles', 'felipe ángeles')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe angeles', 'felipe ángeles')

In [26]:
# Agrupar por colonia y calcular el promedio de precios
df_promedio_colonia = df_concatenado.groupby('colonia')['precio'].mean().reset_index()
# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
df_promedio_colonia['colonia'] = df_promedio_colonia['colonia'].str.title()
# Ordenar por precio promedio en orden descendente
df_promedio_colonia = df_promedio_colonia.sort_values(by='precio', ascending=False)

# Seleccionar las colonias más caras
top_colonias_caras = df_promedio_colonia.head(5)
top_colonias_caras

Unnamed: 0,colonia,precio
22,Felipe Ángeles,7050000.0
108,Tulancingo Centro,6600000.0
52,Lindavista,6389008.0
107,Tulancingo,4600000.0
36,Jardines Del Sur 3Ra Secc,4410000.0


In [27]:
colores = ['#df00ff','#939fad','#6773df','#67c2df','#7cc668','#ffb038','#ff4853','#3d45c0']
col = top_colonias_caras['colonia']
precio = top_colonias_caras['precio']
fig = go.Figure()
fig.add_trace(go.Bar(
    y=col[::-1],  # Invertir el orden de los datos
    x=precio[::-1],  # Invertir el orden de los datos
    orientation='h', 
    marker_color='#ea4335',  # Colores de las barras
    text=precio[::-1].apply(lambda x: '${:,.2f}'.format(x)),  # Invertir el orden de los datos
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
))
fig.update_layout(
    title='Colonias más caras (Tulancingo)',  # Título de la gráfica
    xaxis=dict(
        title='$', # Título del eje x
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje X
        range=[0, 8000000],  # Establecer el rango del eje y
        tickvals=[0, 2000000,4000000,6000000, 8000000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$2,000,000.00', '$4,000,000.00','$6,000,000.00','$8,000,000.00'],  # Definir el texto de las marcas en el eje y
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_colcaras_t5_tulancingo', carpeta='graficas')
fig.show()

### *DIRECTOS*

In [6]:
# Datos a agregar
datos_caras = {
    'Colonias': ['Felipe Ángeles','Lindavista','San José Pedregal','De los Electricistas','Ampliación Sur Paraíso','Santa Ana','La Herradura'],
    'Precio_promedio': [6860000.00, 5873265.13,4093585.50,3900000.00,3300000.00,3130000.00,3002285.71]
}

# Convertir a DataFrame
Colonias_mas_caras = pd.DataFrame(datos_caras)
Colonias_mas_caras

Unnamed: 0,Colonias,Precio_promedio
0,Felipe Ángeles,6860000.0
1,Lindavista,5873265.13
2,San José Pedregal,4093585.5
3,De los Electricistas,3900000.0
4,Ampliación Sur Paraíso,3300000.0
5,Santa Ana,3130000.0
6,La Herradura,3002285.71


In [11]:
colores = ['#df00ff','#939fad','#6773df','#67c2df','#7cc668','#ffb038','#ff4853','#3d45c0']
col = Colonias_mas_caras['Colonias']
precio = Colonias_mas_caras['Precio_promedio']
fig = go.Figure()
fig.add_trace(go.Bar(
    y=col[::-1],  # Invertir el orden de los datos
    x=precio[::-1],  # Invertir el orden de los datos
    orientation='h', 
    marker_color='#ff4853',  # Colores de las barras
    text=precio[::-1].apply(lambda x: '${:,.2f}'.format(x)),  # Invertir el orden de los datos
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
))
fig.update_layout(
    title='Colonias más caras (Tulancingo)',  # Título de la gráfica
    xaxis=dict(
        title='$', # Título del eje x
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje X
        #range=[0, 800000],  # Establecer el rango del eje y
        #tickvals=[0, 200000,400000,600000, 800000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$200,000.00', '$4,000,000.00','$6,000,000.00','$8,000,000.00'],  # Definir el texto de las marcas en el eje y
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_colcaras_tulancingo', carpeta='graficas')
fig.show()

## **PACHUCA**

In [76]:
#preciocol_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['precio', 'colonia']]

In [77]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciocol_df_alfa_q_jul_2023_pachuca,
                            preciocol_df_alfa_q_jun_2023_pachuca,
                            preciocol_df_alfa_q_mar_2023_pachuca,
                            preciocol_df_alfa_q_nov_2022_pachuca,
                            preciocol_df_alfa_q_oct_2022_pachuca,
                            preciocol_df_alfa_q_sep_2023_pachuca,                            
                        ])
# Normalizar el nombre de la colonia
df_concatenado['colonia'] = df_concatenado['colonia'].str.lower().str.strip()

In [78]:
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe ãngeles', 'felipe ángeles')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe angeles', 'felipe ángeles')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('rinconada la concepci??n', 'rinconada la concepción')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('riinc?n del valle', 'rincón del valle')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('ricardo flores mag?n', 'ricardo flores magón')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('ricardo flores mag??n', 'ricardo flores magón')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('rinc?n de la plata', 'rincón de la plata')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('rinc??n del valle', 'rincón del valle')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('revoluci?n', 'revolución')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('parque urbanosan antonio el desmonte', 'parque urbano san antonio el desmonte')

#df_concatenado['colonia'] = df_concatenado['colonia'].replace('', '')

df_cleaned = df_concatenado[df_concatenado['colonia'].notna() & (df_concatenado['colonia'] != '')]	

In [80]:
# Agrupar por colonia y calcular el promedio de precios
df_promedio_colonia = df_concatenado.groupby('colonia')['precio'].mean().reset_index()

# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
df_promedio_colonia['colonia'] = df_promedio_colonia['colonia'].str.title()

# Eliminar filas donde el nombre de la colonia está vacío
df_promedio_colonia = df_promedio_colonia[df_promedio_colonia['colonia'] != '']

# Seleccionar las colonias más caras
top_colonias_caras = df_promedio_colonia.sort_values(by='precio', ascending=False).head(5)
top_colonias_caras

Unnamed: 0,colonia,precio
22,Arboledas Santa Elena,999999.99
281,Rinconada La Concepción,999999.99
344,Villas Del Sol,999999.99
231,Progreso,999999.99
174,Pachuca (Ing. Juan Guillermo Villasana),999999.99


In [82]:
colores = ['#df00ff','#939fad','#6773df','#67c2df','#7cc668','#ffb038','#ff4853','#3d45c0']
col = top_colonias_caras['colonia']
precio = top_colonias_caras['precio']
fig = go.Figure()
fig.add_trace(go.Bar(
    y=col[::-1],  # Invertir el orden de los datos
    x=precio[::-1],  # Invertir el orden de los datos
    orientation='h', 
    marker_color='#ea4335',  # Colores de las barras
    text=precio[::-1].apply(lambda x: '${:,.2f}'.format(x)),  # Invertir el orden de los datos
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
))
fig.update_layout(
    title='Colonias más caras (Pachuca)',  # Título de la gráfica
    xaxis=dict(
        title='$', # Título del eje x
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje X
        #range=[0, 8000000],  # Establecer el rango del eje y
        #tickvals=[0, 2000000,4000000,6000000, 8000000],  # Definir los valores de las marcas en el eje y
        #ticktext=['$0.00', '$2,000,000.00', '$4,000,000.00','$6,000,000.00','$8,000,000.00'],  # Definir el texto de las marcas en el eje y
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)
# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_bar_colcaras_t5_pachuca', carpeta='graficas')
fig.show()


___
___
___
# ***COLONIAS PREDOMINANTES***

## **TULANCINGO**

In [28]:
preciocol_may_2022_tulgo = df_alfa_q_may_2022_tulancingo[['precio', 'colonia']]
preciocol_jul_2022_tulgo = df_alfa_q_jul_2022_tulancingo[['precio', 'colonia']]
preciocol_oct_2022_tulgo = df_alfa_q_oct_2022_tulancingo[['precio', 'colonia']]
preciocol_mar_2023_tulgo = df_alfa_q_mar_2023_tulancingo[['precio', 'colonia']]
preciocol_may_2023_tulgo = df_alfa_q_may_2023_tulancingo[['precio', 'colonia']]
preciocol_jun_2023_tulgo = df_alfa_q_jun_2023_tulancingo[['precio', 'colonia']]
preciocol_jul_2023_tulgo = df_alfa_q_jul_2023_tulancingo[['precio', 'colonia']]
preciocol_sep_2023_tulgo = df_alfa_q_sep_2023_tulancingo[['precio', 'colonia']]
preciocol_oct_2023_tulgo = df_alfa_q_oct_2023_tulancingo[['precio', 'colonia']]

In [32]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciocol_may_2022_tulgo,
                            preciocol_jul_2022_tulgo,
                            preciocol_oct_2022_tulgo,
                            preciocol_mar_2023_tulgo,
                            preciocol_may_2023_tulgo,
                            preciocol_jun_2023_tulgo,
                            preciocol_jul_2023_tulgo,
                            preciocol_sep_2023_tulgo,
                            preciocol_oct_2023_tulgo
                        ])

# Normalizar el nombre de la colonia
df_concatenado['colonia'] = df_concatenado['colonia'].str.lower().str.strip()
# Reemplazar "felipe Ãngeles" por "felipe angeles" después de la normalización
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe ãngeles', 'felipe ángeles')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe angeles', 'felipe ángeles')

In [38]:
# Calcular la frecuencia de cada colonia
frecuencia_colonia = df_concatenado['colonia'].value_counts().reset_index()
frecuencia_colonia.columns = ['colonia', 'total']
# Eliminar la entrada 'No obtenida' si está presente
frecuencia_colonia = frecuencia_colonia[frecuencia_colonia['colonia'] != 'No obtenida']
frecuencia_colonia = frecuencia_colonia[frecuencia_colonia['colonia'] != 'no obtenida']

# Calcular el total de ocurrencias en el DataFrame original
total_ocurrencias = frecuencia_colonia['total'].sum()

# Calcular el porcentaje para cada colonia
frecuencia_colonia['porcentaje'] = (frecuencia_colonia['total'] / total_ocurrencias) * 100

# Seleccionar el top 5 de colonias que más se repiten
top_5_colonias = frecuencia_colonia.head(5)

# Calcular el precio promedio de cada colonia
precio_promedio_colonia = df_concatenado.groupby('colonia')['precio'].mean().reset_index()

# Fusionar los DataFrames de frecuencia y precio promedio por colonia
colonias_predominantes = pd.merge(top_5_colonias, precio_promedio_colonia, on='colonia', how='left')
# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
colonias_predominantes['colonia'] = colonias_predominantes['colonia'].str.title()
colonias_predominantes

Unnamed: 0,colonia,total,porcentaje,precio
0,Centro,100,11.723329,1824404.0
1,Vicente Guerrero,44,5.158265,1023850.0
2,Jaltepec,41,4.806565,1530621.0
3,Jardines Del Sur,39,4.572098,2616818.0
4,La Morena 2A. Sección,31,3.634232,4327555.0


In [41]:
fig = go.Figure()
porcentajes = colonias_predominantes['porcentaje']
colonias = colonias_predominantes['colonia']
# Agregar los datos como barras
fig.add_trace(go.Bar(
    x=colonias,  # Eje x: Modalidades
    y=porcentajes,  # Eje y: Porcentajes
     marker_color='#3d45c0',   # Especifica los colores de las barras
    text=porcentajes,  # Texto que se mostrará en las barras (porcentaje)
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
    texttemplate='%{text:.1f}%',  # Formato del texto (porcentaje con un decimal)
))

# Personalizar el diseño de la gráfica
fig.update_layout(
    title='Colonias Predominantes en Tulancingo',  # Título de la gráfica
    #xaxis=dict(title='%'),  # Título del eje x
    yaxis=dict(
        title='%', # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        #gridwidth=1,
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_colpred_t5_tulancingo', carpeta='graficas')

fig.show()

### *DIRECTOS*

In [44]:
data = {
    'Colonia': [
        'jardines del paraiso', 'rancho guadalupe', 'campo alegre', 'la esmeralda', 'francisco villa', 'huapalcalco',
        'rinconada la morena', 'el paraíso', 'la morena 3a. sección', 'carlos salinas de gortari', 'rincón colonial',
        'rincones de la hacienda', 'el cerezo', 'metilatla', 'los sabinos', 'ferrocarrilera', 'san nicolás el grande',
        'la argentina', 'insurgentes', 'ampliación javier rojo gómez', 'napateco', 'vicente guerrero', 'guadalupe',
        'ampliación rojo gómez', 'san nicolás el chico', 'ahuehuetitla', 'carrillo puerto', 'estrella',
        'jardines de napateco', 'parque urbano napateco', 'san isidro', 'lomas de progreso', 'santiago caltengo',
        'ex-hacienda de san francisco', 'el mirador', '20 de noviembre', 'polanco', 'san daniel', 'pedregal san jose',
        'tollancingo', 'santiago tulantepec de lugo guerrero', 'san josé caltengo', 'medias tierras', 'jaltepec',
        'villa sol', 'villas de tulancingo', 'nuevo tulancingo', 'san juan', 'plan de ayala', 'rancho nuevo',
        'valle sol', 'alamoxtitla', 'lomas del paraíso', 'caltengo', 'emiliano zapata', 'centro', 'aurora',
        'nueva morelos', 'lagunilla', 'la industrial', 'los mesones', 'manuel m. ponce', 'francisco i. madero',
        'el refugio', 'la cañada', 'pedregal de san francisco', 'santa clara', 'los pinos', 'san francisco huatengo',
        'zapotlán de allende', 'lomas de tulancingo', 'jardines del sur', 'la morena 3a secc', 'la escondida',
        'la herradura', 'santa ana', 'ampliación sur paraíso', 'de los electricistas', 'san josé pedregal',
        'lindavista', 'felipe ángeles'
    ],
    'Precio promedio': [
        505000.00, 549000.00, 657810.47, 687553.40, 690000.00, 695714.29, 700000.00, 700602.00, 702546.15, 714200.00,
        730000.00, 732602.78, 739000.00, 798000.00, 884400.00, 895000.00, 895000.00, 950000.00, 966333.33, 975000.00,
        993750.00, 1002306.62, 1025300.00, 1041470.59, 1047857.14, 1050000.00, 1050000.00, 1057319.00, 1083166.67,
        1083333.33, 1110000.00, 1170212.50, 1175000.00, 1300000.00, 1337500.00, 1340000.00, 1360267.00, 1390000.00,
        1390000.00, 1405714.29, 1455888.89, 1474736.84, 1477237.50, 1503387.60, 1520587.06, 1545454.55, 1564090.91,
        1580000.00, 1600400.00, 1600444.44, 1777166.67, 1794000.00, 1838150.00, 1865000.00, 1881000.00, 1945151.12,
        1992857.14, 2033333.33, 2083333.33, 2200000.00, 2213748.57, 2250000.00, 2285714.29, 2419373.33, 2450000.00,
        2476407.86, 2650000.00, 2660422.22, 2667663.64, 2690000.00, 2808000.00, 2877917.91, 2886125.38, 3000000.00,
        3002285.71, 3130000.00, 3300000.00, 3900000.00, 4093585.50, 5873265.13, 6860000.00
    ],
    'Total': [
        1, 1, 15, 5, 2, 7, 7, 4, 13, 5, 1, 9, 1, 1, 20, 1, 1, 1, 3, 2, 12, 45, 18, 17, 7, 1, 1, 5, 12, 6, 4, 16, 2, 2,
        4, 2, 1, 4, 10, 7, 9, 19, 32, 42, 85, 11, 11, 2, 10, 9, 6, 5, 12, 4, 10, 210, 7, 3, 3, 1, 7, 3, 7, 3, 1, 14, 1,
        9, 22, 1, 2, 47, 82, 2, 7, 3, 2, 1, 2, 30, 5
    ]
}

colonias_df = pd.DataFrame(data)
colonias_df

Unnamed: 0,Colonia,Precio promedio,Total
0,jardines del paraiso,505000.00,1
1,rancho guadalupe,549000.00,1
2,campo alegre,657810.47,15
3,la esmeralda,687553.40,5
4,francisco villa,690000.00,2
...,...,...,...
76,ampliación sur paraíso,3300000.00,2
77,de los electricistas,3900000.00,1
78,san josé pedregal,4093585.50,2
79,lindavista,5873265.13,30


In [46]:
# Calcular el total de ocurrencias en el DataFrame original
total_ocurrencias = colonias_df['Total'].sum()
# Calcular el porcentaje para cada colonia
colonias_df['Porcentaje'] = (colonias_df['Total'] / total_ocurrencias) * 100

# Seleccionar el top 5 de colonias que más se repiten
top_5_colonias = colonias_df.head(5)

# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
top_5_colonias['Colonia'] = top_5_colonias['Colonia'].str.title()
top_5_colonias



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Unnamed: 0,Colonia,Precio promedio,Total,Porcentaje
0,Jardines Del Paraiso,505000.0,1,0.098232
1,Rancho Guadalupe,549000.0,1,0.098232
2,Campo Alegre,657810.47,15,1.473477
3,La Esmeralda,687553.4,5,0.491159
4,Francisco Villa,690000.0,2,0.196464


## **PACHUCA**

In [89]:
#preciocol_df_alfa_q_feb_2023_pachuca = df_alfa_q_feb_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_jul_2023_pachuca = df_alfa_q_jul_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_jun_2023_pachuca = df_alfa_q_jun_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_mar_2023_pachuca = df_alfa_q_mar_2023_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_nov_2022_pachuca = df_alfa_q_nov_2022_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_oct_2022_pachuca = df_alfa_q_oct_2022_pachuca[['precio', 'colonia']]
preciocol_df_alfa_q_sep_2023_pachuca = df_alfa_q_sep_2023_pachuca[['precio', 'colonia']]

In [90]:
# Concatenar todos los DataFrames individuales en uno solo
df_concatenado = pd.concat([preciocol_df_alfa_q_jul_2023_pachuca,
                            preciocol_df_alfa_q_jun_2023_pachuca,
                            preciocol_df_alfa_q_mar_2023_pachuca,
                            preciocol_df_alfa_q_nov_2022_pachuca,
                            preciocol_df_alfa_q_oct_2022_pachuca,
                            preciocol_df_alfa_q_sep_2023_pachuca,                                                       
                        ])

# Normalizar el nombre de la colonia
df_concatenado['colonia'] = df_concatenado['colonia'].str.lower().str.strip()
# Reemplazar "felipe Ãngeles" por "felipe angeles" después de la normalización
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe ãngeles', 'felipe ángeles')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('felipe angeles', 'felipe ángeles')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('rinconada la concepci??n', 'rinconada la concepción')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('riinc?n del valle', 'rincón del valle')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('ricardo flores mag?n', 'ricardo flores magón')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('ricardo flores mag??n', 'ricardo flores magón')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('rinc?n de la plata', 'rincón de la plata')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('rinc??n del valle', 'rincón del valle')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('revoluci?n', 'revolución')
df_concatenado['colonia'] = df_concatenado['colonia'].replace('parque urbanosan antonio el desmonte', 'parque urbano san antonio el desmonte')

#df_concatenado['colonia'] = df_concatenado['colonia'].replace('', '')

#df_cleaned = df_concatenado[df_concatenado['colonia'].notna() & (df_concatenado['colonia'] != '')]	

In [91]:
# Calcular la frecuencia de cada colonia
frecuencia_colonia = df_concatenado['colonia'].value_counts().reset_index()
frecuencia_colonia.columns = ['colonia', 'total']
# Eliminar la entrada 'No obtenida' si está presente
frecuencia_colonia = frecuencia_colonia[frecuencia_colonia['colonia'] != 'No obtenida']
frecuencia_colonia = frecuencia_colonia[frecuencia_colonia['colonia'] != 'no obtenida']

# Calcular el total de ocurrencias en el DataFrame original
total_ocurrencias = frecuencia_colonia['total'].sum()

# Calcular el porcentaje para cada colonia
frecuencia_colonia['porcentaje'] = (frecuencia_colonia['total'] / total_ocurrencias) * 100

# Seleccionar el top 5 de colonias que más se repiten
top_5_colonias = frecuencia_colonia.head(5)

# Calcular el precio promedio de cada colonia
precio_promedio_colonia = df_concatenado.groupby('colonia')['precio'].mean().reset_index()

# Fusionar los DataFrames de frecuencia y precio promedio por colonia
colonias_predominantes = pd.merge(top_5_colonias, precio_promedio_colonia, on='colonia', how='left')
# Convertir la primera letra de cada palabra en la columna "colonia" a mayúscula
colonias_predominantes['colonia'] = colonias_predominantes['colonia'].str.title()
colonias_predominantes

Unnamed: 0,colonia,total,porcentaje,precio
0,Centro,885,9.855234,977658.485785
1,Zona Plateada,762,8.485523,998862.19479
2,San Antonio El Desmonte,610,6.792873,982764.336918
3,San Antonio,416,4.632517,983192.29851
4,Valle Del Sol,411,4.576837,999999.99


In [92]:
fig = go.Figure()
porcentajes = colonias_predominantes['porcentaje']
colonias = colonias_predominantes['colonia']
# Agregar los datos como barras
fig.add_trace(go.Bar(
    x=colonias,  # Eje x: Modalidades
    y=porcentajes,  # Eje y: Porcentajes
     marker_color='#3d45c0',   # Especifica los colores de las barras
    text=porcentajes,  # Texto que se mostrará en las barras (porcentaje)
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
    texttemplate='%{text:.1f}%',  # Formato del texto (porcentaje con un decimal)
))

# Personalizar el diseño de la gráfica
fig.update_layout(
    title='Colonias Predominantes en Pachuca',  # Título de la gráfica
    #xaxis=dict(title='%'),  # Título del eje x
    yaxis=dict(
        title='%', # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
        #gridwidth=1,
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_colpred_t5_pachuca', carpeta='graficas')

fig.show()