In [1]:
import pandas as pd
import numpy as np
import os
import glob
import re

In [2]:
def limpiar_y_convertir_precio(precio_str):
    tipo_cambio_usd_mxn = 18.66
    # Manejar valores nulos o no válidos
    if pd.isna(precio_str) or not isinstance(precio_str, str):
        return None

    # Detectar el tipo de moneda
    if precio_str.startswith('USD'):
        # Limpiar el string: quitar "USD " y las comas
        valor_numerico_str = precio_str.replace('USD ', '').replace(',', '')
        try:
            valor_numerico = float(valor_numerico_str)
            # Convertir a MXN
            return int(valor_numerico * tipo_cambio_usd_mxn)
        except ValueError:
            return None
    elif precio_str.startswith('MN'):
        # Limpiar el string: quitar "MN " y las comas
        valor_numerico_str = precio_str.replace('MN ', '').replace(',', '')
        try:
            return int(valor_numerico_str)
        except ValueError:
            return None
    else:
        # Si el formato no coincide, devolver un valor nulo
        return None


In [3]:
# Ruta de los directorios que contienen los archivos CSV
directorio_path = ["/Users/renataramirez/Documents/mlops-repo/data/raw/webscrapping/por_municipio_2025-08-31",
                   "/Users/renataramirez/Documents/mlops-repo/data/raw/webscrapping/por_municipio_2025-09-14",]


In [4]:

# Lista para almacenar los DataFrames individuales
lista_dfs = []


In [5]:
archivos_csv = []
# Buscar todos los archivos con la extensión .csv en el directorio
for path in directorio_path:
    archivos = glob.glob(os.path.join(path, "*.csv"))
    archivos_csv = archivos_csv + archivos


In [6]:
len(archivos_csv)

30

In [7]:
# Iterar sobre cada archivo encontrado
for archivo in archivos_csv:
    # Leer el archivo CSV en un DataFrame
    df_temp = pd.read_csv(archivo)

    # Añadir el DataFrame temporal a la lista
    lista_dfs.append(df_temp)

In [8]:
df = pd.concat(lista_dfs, ignore_index=True)
print("DataFrame final creado con éxito. Se añadieron los siguientes archivos:")

DataFrame final creado con éxito. Se añadieron los siguientes archivos:


In [9]:
df.columns

Index(['Título', 'Enlace', 'Precio', 'Dirección', 'Características',
       'Municipio de Origen'],
      dtype='object')

In [10]:
df['Municipio de Origen'].value_counts()

Municipio de Origen
Miguel Hidalgo            4679
Cuauhtémoc                3182
Benito Juárez             1812
Cuajimalpa de Morelos     1348
Álvaro Obregón            1122
Coyoacán                   346
Tlalpan                    240
Azcapotzalco               203
Gustavo A. Madero          196
Iztacalco                  107
Venustiano Carranza        105
Iztapalapa                  71
La Magdalena Contreras      69
Tláhuac                     60
Xochimilco                  60
Name: count, dtype: int64

In [11]:
print("\nPrimeras 5 filas del DataFrame final:")
df.head()


Primeras 5 filas del DataFrame final:


Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen
0,Departamento en Renta – San Jerónimo (100 m²) ...,https://www.inmuebles24.com/propiedades/clasif...,"MN 24,000","San Jerónimo Lidice\nSan Jerónimo Lídice, La M...","100 m² lote, 2 rec., 2 baños, 1 estac.",La Magdalena Contreras
1,Departamento remodelado. amueblado. frente al ...,https://www.inmuebles24.com/propiedades/clasif...,"MN 12,000","CALLEJON DEL PRADO\nBarrio San Francisco, La M...","50 m² lote, 1 rec., 1 baño, 1 estac.",La Magdalena Contreras
2,Ph en san jeronimo lidice. Departamento con ma...,https://www.inmuebles24.com/propiedades/clasif...,"MN 34,100","BLVD. ADOLFO RUIZ CORTINES, 2775\nSan Jerónimo...","232 m² lote, 3 rec., 4 baños, 2 estac.",La Magdalena Contreras
3,"Se renta casa de 80m2, más 85m2 de jardines. S...",https://www.inmuebles24.com/propiedades/clasif...,"MN 16,000","Magnolia 26\nSan Jerónimo Lídice, La Magdalena...","165 m² lote, 2 rec., 1 baño, 1 estac.",La Magdalena Contreras
4,"Exclusivo conjunto en Pedregal 2, cuenta con c...",https://www.inmuebles24.com/propiedades/clasif...,"MN 26,000","San Marcos 11\nPedregal 2, La Magdalena Contreras","180 m² lote, 3 rec., 2 baños, 2 estac.",La Magdalena Contreras


In [12]:
df.shape

(13600, 6)

In [13]:
# Remove duplicates
df = df.drop_duplicates()

In [14]:
df.shape

(9227, 6)

In [15]:
df.dtypes

Título                 object
Enlace                 object
Precio                 object
Dirección              object
Características        object
Municipio de Origen    object
dtype: object

In [16]:
# Transformar el precio a columna númerica
df['precio_mxn'] = df['Precio'].apply(limpiar_y_convertir_precio)


In [17]:
df[df['Precio'] == 'MN 3,849,092']

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn
693,Con una ubicación privilegiada y excelentes am...,https://www.inmuebles24.com/propiedades/clasif...,"MN 3,849,092","bucareli\nJuárez, Cuauhtémoc","76 m² lote, 2 rec., 2 baños, 1 estac.",Cuauhtémoc,3849092.0


In [18]:
row_to_fix = df['Precio'] == 'MN 3,849,092'

# Re-aplica la función corregida solo a esa fila, dividiendo por 100
df.loc[row_to_fix, 'precio_mxn'] = float(
    df.loc[row_to_fix, 'Precio']
    .iloc[0] # Selecciona el valor de la celda específica
    .replace('MN ', '')
    .replace(',', '')
) / 100


In [19]:
df[df['Precio'] == 'MN 3,849,092']

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn
693,Con una ubicación privilegiada y excelentes am...,https://www.inmuebles24.com/propiedades/clasif...,"MN 3,849,092","bucareli\nJuárez, Cuauhtémoc","76 m² lote, 2 rec., 2 baños, 1 estac.",Cuauhtémoc,38490.92


In [20]:
row_to_fix = df['Precio'] == 'MN 19,250,000'

# Re-aplica la función corregida solo a esa fila, dividiendo por 100
df.loc[row_to_fix, 'precio_mxn'] = float(
    df.loc[row_to_fix, 'Precio']
    .iloc[0] # Selecciona el valor de la celda específica
    .replace('MN ', '')
    .replace(',', '')
) / 1000


In [21]:
df[df['Precio'] == 'MN 19,250,000']

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn
12052,Departamento en Renta con 2 Recámaras con clos...,https://www.inmuebles24.com/propiedades/clasif...,"MN 19,250,000","Vértiz Narvarte\nNarvarte Oriente, Benito Juárez","60 m² lote, 2 rec., 1 baño, 1 estac.",Benito Juárez,19250.0


In [22]:
# Conjunto para almacenar los nombres de características únicos
caracteristicas_unicas = set()

# Expresión regular para encontrar el nombre de la característica
# Busca un número (y opcionalmente m²) seguido del nombre de la característica
patron = re.compile(r'\d+\s*(?:m²)?\s*([a-záéíóúüñ\s\w]+\b)\.?', re.IGNORECASE)

# Iterar sobre cada fila para analizar la columna 'caracteristicas'
for caracteristicas_str in df['Características']:
    if isinstance(caracteristicas_str, str):
        # Encontrar todas las coincidencias en la cadena
        matches = patron.findall(caracteristicas_str)
        
        # Añadir cada característica encontrada al conjunto
        for match in matches:
            # Limpiar el nombre (eliminar espacios y puntos finales)
            nombre_limpio = match.strip().replace('.', '')
            caracteristicas_unicas.add(nombre_limpio)

In [23]:
caracteristicas_unicas

{'a 2 rec',
 'a 80 m² lote',
 'a 95 m² lote',
 'baño',
 'baños',
 'estac',
 'lote',
 'rec',
 'un'}

In [24]:
# Con la revisión de outliers vimos que hay lcoales comerciales con precios altos que no deberíamos estar incluyendo, 
# así que creamos esta flag para identificarlos y excluirlos.
# 1. Usar .str.contains() para buscar las palabras "local comercial" (ignorando mayúsculas y minúsculas)
# 2. Usar .astype(int) para convertir True/False a 1/0
df['es_local_comercial'] = df['Título'].str.contains('local comercial', case=False, na=False).astype(int)

In [25]:
df.es_local_comercial.value_counts()

es_local_comercial
0    9222
1       5
Name: count, dtype: int64

In [26]:
df = df[df.es_local_comercial == 0]

In [27]:
# Borramos la columna porque ya no será necesaria
df = df.drop('es_local_comercial', axis = 1)

In [28]:
# Definimos la leyenda a eliminar
leyenda_a_eliminar = '*Aviso de privacidad sugerencias, quejas, aclaraciones, consultar nuestra página. El precio no incluye el mobiliario, electrodomésticos, artículos de decoración y/o arte que pudieran aparecer en las fotografías. El precio de venta no incluye gastos e impuestos de escrituración, o gastos derivados por algún tipo de credito.'

# Eliminamos la leyenda de la columna 'Título'
df['Título'] = df['Título'].str.replace(leyenda_a_eliminar, '', regex=False)

# Opcional: eliminar espacios extra que puedan quedar al final
df['Título'] = df['Título'].str.strip()

In [29]:
# Extraer "lote en m2"
# El patrón busca: (un grupo de dígitos) seguido de " m² lote"
df['lote_m2'] = df['Características'].str.extract(r'(\d+)\s*m²\s*lote', flags=re.IGNORECASE).astype('Int64')

# Extraer "recamaras"
# El patrón busca: (un grupo de dígitos) seguido de " rec." (el punto es opcional)
df['recamaras'] = df['Características'].str.extract(r'(\d+)\s*rec\.?', flags=re.IGNORECASE).astype('Int64')

# Extraer "baños"
# El patrón busca: (un grupo de dígitos) seguido de " baños"
df['baños'] = df['Características'].str.extract(r'(\d+)\s*baño\s?', flags=re.IGNORECASE).astype('Int64')

# Extraer "estacionamiento"
# El patrón busca: (un grupo de dígitos) seguido de " estac" o " estac."
df['estacionamiento'] = df['Características'].str.extract(r'(\d+)\s*estac\.?', flags=re.IGNORECASE).astype('Int64')


In [30]:
df.estacionamiento.value_counts()

estacionamiento
1     3250
2     3064
3      492
4      200
6       25
5       21
8       13
12       2
22       1
7        1
11       1
13       1
Name: count, dtype: Int64

In [31]:
# por si el estaiconamiento no viene en los detalles básicos pero si en la descripción
# 1. Usar .str.contains() para buscar la palabra "estacionamiento" (ignorando mayúsculas y minúsculas)
# 2. Usar .astype(int) para convertir True/False a 1/0
df['estacionamiento_txt'] = df['Título'].str.contains('estacionamiento', case=False, na=False).astype(int)

In [32]:
# Revisamos el cruce de las columnas de estacionamiento para ver si aporta más información juntarlas y vemos que 
# sí hay reistros donde el estacionamiento estaba vacío e inspeccionando la descripción encontramos más.
pd.crosstab(df['estacionamiento'].fillna(0), df['estacionamiento_txt'])

estacionamiento_txt,0,1
estacionamiento,Unnamed: 1_level_1,Unnamed: 2_level_1
0,1151,1000
1,587,2663
2,469,2595
3,86,406
4,29,171
5,5,16
6,2,23
7,0,1
8,2,11
11,0,1


In [33]:
# Así que complementamos la columna
df['estacionamiento'] = np.where(~df['estacionamiento'].isnull(), df['estacionamiento'], 
                                 np.where((df['estacionamiento'].isnull())&(df['estacionamiento_txt']==1),1,0))

In [34]:
df['estacionamiento'].value_counts()

estacionamiento
1.0     4250
2.0     3064
0.0     1151
3.0      492
4.0      200
6.0       25
5.0       21
8.0       13
12.0       2
22.0       1
7.0        1
11.0       1
13.0       1
Name: count, dtype: int64

In [35]:
# 1. Usar .str.contains() para buscar la palabra "renta" (ignorando mayúsculas y minúsculas)
# 2. Usar .astype(int) para convertir True/False a 1/0
df['en_renta'] = df['Título'].str.contains(' renta ', case=False, na=False).astype(int)

In [36]:
df.en_renta.value_counts()

en_renta
0    4638
1    4584
Name: count, dtype: int64

In [37]:
# 1. Usar .str.contains() para buscar la palabra "venta" (ignorando mayúsculas y minúsculas)
# 2. Usar .astype(int) para convertir True/False a 1/0
df['en_venta'] = df['Título'].str.contains(' venta ', case=False, na=False).astype(int)

In [38]:
df.en_venta.value_counts()

en_venta
0    8925
1     297
Name: count, dtype: int64

In [39]:
pd.crosstab(df.en_renta, df.en_venta)

en_venta,0,1
en_renta,Unnamed: 1_level_1,Unnamed: 2_level_1
0,4520,118
1,4405,179


In [40]:
# para filtrar los departamentos en venta tienen que tener la flag de venta y costo mayor a 1M 
# Y también hay casos en que no ponen un monto de venta pero ponen 1 MXN por poner algo
df = df[(df.en_venta==1)&(df.precio_mxn > 1)&(df.precio_mxn < 1000000)]

In [49]:
df[(df.en_venta==1)&(df.en_renta==0)].sort_values('precio_mxn',ascending=False)

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn,lote_m2,recamaras,baños,estacionamiento,estacionamiento_txt,en_renta,en_venta,es_amueblado
2101,"Departamento de Lujo en Venta y Renta, Campos Elíseos, Polanco. Vistas Insuperables al Bosque de Chapultepec. En el corazón de Polanco, sobre la prestigiada avenida Campos Elíseos, se encuentra este exclusivo departamento en el piso 26, un refugio de lujo con espectaculares vistas abiertas hacia el verde infinito del Bosque de Chapultepec. Desde el momento en que cruzas la puerta principal, el espacio transmite una sensación de elegancia atemporal. Los acabados de alta gama, la amplitud de los espacios y la luz natural que inunda cada rincón convierten este departamento en un verdadero oasis en el cielo de la ciudad. Cada detalle ha sido cuidadosamente seleccionado para ofrecer la máxima calidad: maderas finas, mármoles importados y sistemas de confort de última generación integrados de forma discreta. Los amplios ventanales no solo enmarcan vistas privilegiadas, sino que convierten al paisaje en parte esencial del diseño interior. Ubicado a solo una cuadra del encantador Parque Lincoln y rodeado de los restaurantes más reconocidos, boutiques exclusivas y centros de negocios de alto nivel, este hogar ofrece un balance perfecto entre la serenidad natural y la vibrante vida urbana de Polanco. El edificio, uno de los más distinguidos de la zona, brinda a sus residentes servicios y espacios que elevan cada aspecto del día a día, todo dentro de un ambiente de máxima seguridad, privacidad y confort. Vivir aquí es más que habitar un departamento: es acceder a un estilo de vida reservado para quienes buscan lo mejor, en la mejor ubicación de México. Déjate sorprender por la experiencia de vivir en las alturas de Campos Elíseos.",https://www.inmuebles24.com/propiedades/clasificado/veclapin-departamento-de-lujo-en-venta-y-renta-polanco-vistas-146322117.html,"USD 15,000","campos eliseos\nPolanco IV Sección, Polanco","443 m² lote, 2 rec., 2 baños, 5 estac.",Miguel Hidalgo,279900.0,443,2,2,5.0,0,0,1,0
3319,"Extraordinario departamento en venta con amplisima terraza, en piso 16, ubicado en la torre mas lujosa Y exclusiva de la ciudad de mexico en polanco con vista al campo marte Y auditorio nacional imponete Y espectacular. Torre construida por reconocido arquitecto. un departamento por piso. Terminado para estrenar diseñado Y vestibulado por uno de las mejores despachos. Maxima seguridad, vigilancia 24/7. Cuenta con area para choferes, circuito cerrado de televisión, bar, salon de belleza, gym, vale lapena",https://www.inmuebles24.com/propiedades/clasificado/alclapin-renta-exclusivo-departamento-campos-eliseos-para-59691988.html,"USD 15,000","CAMPOS ELISEOS\nPolanco, Miguel Hidalgo","460 m² lote, 3 rec., 3 baños, 5 estac.",Miguel Hidalgo,279900.0,460,3,3,5.0,0,0,1,0
635,"En venta departamento totalmente amueblado en la sección superior (pisos 48-55), The Ritz-Carlton, Mexico City incluye 64 casas privadas que serán operadas por The Ritz-Carlton, Mexico City ubicadas en el mismo edificio. Este espectacular departamento ofrece las vistas panorámicas más espectaculares del Parque Chapultepec, incluido su majestuoso Castillo, y las partes oeste y sur de la Ciudad de México. Junto con el máximo lujo en arquitectura, diseño y los legendarios servicios de la marca, es por eso que The Ritz-Carlton Residences es actualmente el líder mundial en residencias de marca que son administradas por el propio Hotel. Si bien permite que entre mucha luz en cada unidad, la fachada de vidrio doble también facilita el control ideal de la temperatura, manteniendo las residencias frescas en verano y cálidas en invierno. La envolvente exterior dispone de entradas y salidas que permiten la circulación del aire por las terrazas y en las Residencias, mientras que la interior completa el cierre hermético. Esta residencia cuenta con cocina, sala-comedor, 2 recámaras, 2 baños y medio, 2 estacionamientos con valet parking en 240 m2. Totalmente equipado, listo para habitarlo. Agenda tu cita o contáctanos a través de esta publicación. La compraventa de esta propiedad se puede realizar mediante recursos propios o crédito. Para aviso de privacidad, quejas, sugerencias o aclaraciones visita nuestro. Los gastos e impuestos de escrituración (con la Notaría de tu elección) y cargos relacionados por algún tipo de crédito no están incluidos en el precio de venta, así como el mobiliario, electrodomésticos y arte que se muestran en las fotografías. Nota importante: Toda la información y medidas provistas son aproximadas y deberán ratificarse con la documentación pertinente y no compromete contractualmente a nuestra empresa. El precio de la transacción se encuentra en dólares, por lo que la compraventa se realizará al tipo de cambio publicado por el Banco de México al momento de la (s) transacción (es).",https://www.inmuebles24.com/propiedades/clasificado/veclapin-departamento-en-venta-en-ritz-carlton-cuauhtemoc-91321293.html,"USD 15,000","Av. Paseo de la Reforma\nCuauhtémoc, Cuauhtémoc","240 m² lote, 2 rec., 2 baños, 2 estac.",Cuauhtémoc,279900.0,240,2,2,2.0,1,0,1,1
3757,"Penthouse de Lujo en Venta – Arquímedes, Polanco. 550 m² | 4 Recámaras | Roof Garden Privado | Vista Panorámica. Ubicado en una de las zonas más exclusivas de Polanco, entre Campos Elíseos y Masaryk, este penthouse de tres niveles ofrece una experiencia residencial inigualable, a solo pasos del Bosque de Chapultepec, Polanquito y las principales vías de acceso de la zona. Características Principales: Superficie: 550 m² distribuidos en 3 niveles. Vista espectacular a la ciudad desde todos los niveles. Acabados de lujo: mármol en áreas sociales, madera en recámaras y ventanales de piso a techo que inundan el espacio de luz natural. Distribución: Planta Principal: Sala y comedor con balcón. Family y antecomedor de gran tamaño. Cocina abierta con área de servicio y bodega. Medio baño de visitas. Planta Baja: 4 recámaras, todas con baño completo, vestidor y balcón. Family room privado. Tercer Nivel: Roof Garden Privado. Del tamaño completo del departamento. Área techada con barra, lavabo, refrigerador y dos baños. Terraza abierta con asador y vistas panorámicas. Alberca al aire libre con área social y comedor exterior. Amenidades del Edificio: Gimnasio equipado. Salón inglés. Sauna y vapor. Vigilancia 24/7 con empresa de seguridad profesional. 2 lugares de estacionamiento. Una propiedad única para quienes buscan lujo, privacidad y ubicación privilegiada en el corazón de Polanco.",https://www.inmuebles24.com/propiedades/clasificado/alclapin-renta-o-venta-departamento-ph-en-polanco-con-roof-60987390.html,"USD 13,500","Arquimedes\nPolanco, Miguel Hidalgo","550 m² lote, 4 rec., 4 baños, 3 estac.",Miguel Hidalgo,251910.0,550,4,4,3.0,1,0,1,0
2690,"Elegante Departamento en Venta cerca del Parque Gandhi – Vistas Incomparables y Doble Altura. Este exclusivo departamento combina amplitud, diseño y acabados de lujo en una de las zonas más privilegiadas de la ciudad, a pocos pasos del emblemático Parque Gandhi. Con una extensa área social de techos de doble altura, el espacio de bar, sala y comedor se integra con fluidez, ofreciendo un ambiente espectacular para recibir, convivir y disfrutar de la vista urbana. Distribución y características: 3 recámaras, todas con baño completo y acabados en mármol: Recámara principal con balcón, impresionantes vistas a la ciudad, pisos de madera, closets separados para él y ella, y baño con doble lavabo. Segunda recámara con área tipo sala, escritorio empotrado, amplio vestidor, baño privado y piso alfombrado. Tercera recámara con piso de madera y baño completo. Área de oficina o gimnasio, ideal para home office o actividades personales. Cocina de alta gama, equipada con electrodomésticos Smeg, Subzero y Miele, incluyendo lavavajillas, cafetera, horno y estufa, además de área de servicio independiente para el bar. Lavandería y cuarto de servicio con baño completo. 2 lugares de estacionamiento y cuarto para choferes en el estacionamiento. Seguridad 24 horas con acceso controlado. Este departamento representa una oportunidad excepcional para quienes buscan un hogar elegante, cómodo y funcional en una ubicación inmejorable, rodeada de cultura, parques y la mejor oferta de servicios de la ciudad. Agenda tu cita o contáctanos a través de esta publicación. La compraventa de esta propiedad se puede realizar mediante recursos propios o crédito. Para aviso de privacidad, quejas, sugerencias o aclaraciones visita nuestro. Los gastos e impuestos de escrituración (con la Notaría de tu elección) y cargos relacionados por algún tipo de crédito no están incluidos en el precio de venta, así como el mobiliario, electrodomésticos y arte que se muestran en las fotografías. Nota importante: Toda la información y medidas provistas son aproximadas y deberán ratificarse con la documentación pertinente y no compromete contractualmente a nuestra empresa. Agenda tu cita: Ver datos",https://www.inmuebles24.com/propiedades/clasificado/veclapin-departamento-en-venta-en-polanco-v-seccion-66546350.html,"USD 13,000","Campos Elíseos\nPolanco, Miguel Hidalgo","460 m² lote, 3 rec., 3 baños, 2 estac.",Miguel Hidalgo,242580.0,460,3,3,2.0,1,0,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
4309,"Departamento venta en acogedora privada con vigilancia. Consta de 3 recámaras, la principal con balcón, vestidor y baño completo, las otras dos comparten baño y tienen closet. Iluminada y Amplia sala -comedor con ventanas al exterior, cocina integral. Cuarto y área de servicio independiente. Lugar para dos autos en fila. Áreas verdes comunes. Estacionamiento para visitas. Conózcala!!",https://www.inmuebles24.com/propiedades/clasificado/veclapin-venta-departamento-en-desierto-de-los-leones-147349150.html,"MN 19,500","Bajada de la peñita 21\nEl Encino del Pueblo Tetelpan, Alvaro Obregón","156 m² lote, 3 rec., 2 baños, 2 estac.",Álvaro Obregón,19500.0,156,3,2,2.0,1,0,1,0
6659,"Descripción? Departamento en renta, nuevo, semiamueblado – Cuitláhuac 2939? Ubicado en Obrero Popular, Azcapotzalco, cdmx, cerca de:? Plaza Parque Jardín? Galerías Tacuba? Metro Tacuba y Metro Refinería? Walmart Toreo? Con fácil acceso a Av. Río San Joaquín, Calzada México-Tacuba y Circuito Interior? Características del departamento:? 3 recámaras con clósets? 2 baños completos con cancel y espejo (uno en la recámara principal, otro para recámaras secundarias y visitas) ? Área social con sala y comedor para 5 posiciones? Cocina equipada con estufa + horno, campana y tarja? Área de lavado con lavadero, instalación para lavadora y opción a entrega con lavadora*? 1 lugar de estacionamiento? Balcón? Ubicado en 4° piso con elevador? Áreas comunes:? Gimnasio? Patio? Patio de juegos para niños? Ludoteca? Renta: $18, 500 mxn (incluye mantenimiento) El precio de venta de la propiedad no incluye los gastos notariales ni los impuestos aplicables al comprador. Estos costos adicionales son variables.",https://www.inmuebles24.com/propiedades/clasificado/alclapin-departamento-en-obrero-popular-147345638.html,"MN 18,500","av. Cuitláhuac al 2939\nObrero Popular, Azcapotzalco","62 m² lote, 3 rec., 2 baños, 1 estac.",Azcapotzalco,18500.0,62,3,2,1.0,1,0,1,1
5608,"Departamento en venta – Av. Universidad, a 5 min del Metro Copilco. Impecable departamento en 5º piso, ubicado sobre Av. Universidad, con excelente conexión a principales vías y transporte público. • 2 habitaciones con buena iluminación. • 1 baño completo. • Estacionamiento descubierto e independiente. • Cocina y estancia acogedora. • Ambiente tranquilo y privado. • ¡Listo para habitar de inmediato!",https://www.inmuebles24.com/propiedades/clasificado/alclapin-departamento-en-renta-en-copilco-universidad-147378624.html,"MN 18,000","Av. Universidad\nCopilco Universidad, Coyoacán","100 m² lote, 2 rec., 1 baño, 1 estac.",Coyoacán,18000.0,100,2,1,1.0,1,0,1,0
12237,"Increible departamento en la colonia más bonita y mejor úbicada de la ciudad. San José Insurgentes, es una joya única en la zona, excelente iluminación, todo a un paso vive caminando deja el coche estacionado y disfruta de la vida camina vive feliz. Dos recámaras, dos baños y un estacionamiento en fila de 3 coches, segundo piso sin elevador. Llámanos y gánalo. No mascotas. San José Insurgentes es un barrio que se distingue por su carácter residencial, su ambiente tranquilo y su excelente ubicación en el sur de la Ciudad de México. Considerada una joya urbana por quienes la conocen, esta zona combina tradición, modernidad y un inconfundible sentido de comunidad. A continuación se exploran las razones más relevantes por las cuales rentar un departamento en San José Insurgentes puede ser una decisión acertada para tu estilo de vida. Ubicación estratégica. San José Insurgentes está situada entre vialidades clave como Avenida Insurgentes Sur y Río Mixcoac, lo que facilita el acceso a diferentes puntos de la ciudad. Su cercanía con importantes colonias como Del Valle, Nápoles, Ciudad Universitaria y Coyoacán permite desplazarse de manera ágil tanto en vehículo particular como en transporte público. Además, la colonia se encuentra cerca de estaciones de metro, metrobús y rutas de autobuses, lo que ofrece variadas alternativas de movilidad. Conectividad y servicios. La zona cuenta con una amplia oferta de servicios que cubren todas las necesidades cotidianas. Supermercados, bancos, farmacias, tiendas de conveniencia y centros comerciales, como Plaza Manacar, están a pocos minutos de distancia. La conectividad digital también es excelente, ya que el barrio está bien cubierto por proveedores de internet y telefonía. Oferta educativa y cultural. San José Insurgentes se caracteriza por estar cerca de prestigiosas instituciones educativas, tanto públicas como privadas, que van desde preescolar hasta universidades. Entre ellas destacan la Universidad Panamericana y escuelas de idiomas. También cuenta con espacios culturales emblemáticos como el Teatro de los Insurgentes, varias galerías de arte y librerías que enriquecen la vida intelectual y artística de la zona. Variedad gastronómica. Rentar un departamento aquí implica disfrutar de una vibrante escena culinaria. Restaurantes, cafeterías y panaderías ofrecen opciones para todos los gustos: desde cocina mexicana tradicional hasta propuestas internacionales y gourmet. Es común encontrar espacios acogedores para desayunos, comidas familiares, cenas con amistades o simplemente para disfrutar un café mientras se lee o trabaja. *En cumplimiento con las disposiciones legales, le informamos que Sinergia y kw Pedregal tiene autorización para la promoción e intermediación en la operación de venta de este inmueble. *Antes de dar cualquier apartado o información personal, asegúrese de que la propiedad esté vigente, haberla visitado y estar siendo atendido por un asesor calificado. *Los muebles que aparecen en la publicación son con fines ilustrativos y no están incluidos en el precio de venta. **Los precios son de contado, en caso de utilizar algún crédito, el precio total se determinará en función de los montos variables de conceptos de crédito y gastos notariales que deben ser consultados con el especialista de cada institución financiera y notaría pública respectivamente. *Consulta el aviso de privacidad en nuestra página web. Le informamos que los precios que mostramos y publicamos de los inmuebles que conforman nuestra cartera, ya sean en pre venta, venta o renta, no incluyen ningún tipo de impuesto, ni gastos notariales, ni derechos, ni honorarios, ni costos de tasas de interés y gastos en caso de financiamiento. Cualquiera de estos rubros, son adicionales al precio mostrado y publicado en los diferentes medios de promoción y publicidad que utilizamos. En caso de que usted requiera información al respecto de estos rubros, con gusto podemos asesorarlo. Las formas de pago para la adquisición de cada uno de los inmuebles que promovemos pueden ser mediante contado, y/o mediante la contratación de un crédito con garantía hipotecaria con la institución financiera que elija el posible comprador, siempre y cuando el sujeto y el inmueble, cumplan con los requisitos establecidos por dicha institución crediticia. Como parte de nuestro servicio, conformamos expedientes de cada uno de nuestros inmuebles con la intención de conocer su estatus legal y administrativo, para garantizar la seguridad de nuestros posibles clientes compradores. Dichos expedientes están conformados con la documentación que es proporcionada por cada uno de los propietarios. Sus datos personales pueden ser transferidos a terceros para el cumplimiento de requerimientos legales o la atención de una orden fundada y motivada de las autoridades competentes en ejercicio de sus funciones de notificación, vigilancia y fiscalización. Por ejemplo, los datos se comparten con Notarías Públicas, respecto de las operaciones traslativas de dominio.",https://www.inmuebles24.com/propiedades/clasificado/alclapin-increible-depto-en-renta-en-la-mejor-colonia-san-jose-147586277.html,"MN 17,000","José María Velasco\nSan José Insurgentes, Benito Juárez","1 m² lote, 2 rec., 2 baños, 1 estac.",Benito Juárez,17000.0,1,2,2,1.0,1,0,1,0


In [42]:
df[(df.en_venta==1)&(df.en_renta==1)]

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn,lote_m2,recamaras,baños,estacionamiento,estacionamiento_txt,en_renta,en_venta
93,Departamento en Renta Amueblado – Ideal para P...,https://www.inmuebles24.com/propiedades/clasif...,"MN 8,000","Betina 25, Lomas Estrella 2da Secc, Iztapalapa...","45 m² lote, 1 rec., 1 baño, 1 estac.",Tláhuac,8000.0,45,1,1,1.0,1,1,1
195,Venta Renta modernos departamentos Residencial...,https://www.inmuebles24.com/propiedades/clasif...,"MN 38,000","Avenida Alfonso Reyes 53\nHipódromo Condesa, C...","2000 m² lote, 2 rec., 2 baños, 2 estac.",Cuauhtémoc,38000.0,2000,2,2,2.0,1,1,1
272,En el corazón de Paseo de la Reforma se alza C...,https://www.inmuebles24.com/propiedades/clasif...,"USD 6,000","Río Ródano 510\nCuauhtémoc, Cuauhtémoc","58 m² lote, 1 rec., 1 baño, 1 estac.",Cuauhtémoc,111960.0,58,1,1,1.0,1,1,1
303,"Departamento exterior en 2o. Nivel, remodelado...",https://www.inmuebles24.com/propiedades/clasif...,"MN 27,600","Calle Bajío\nRoma Sur, Cuauhtémoc","99 m² lote, 2 rec., 2 baños, 2 estac.",Cuauhtémoc,27600.0,99,2,2,2.0,1,1,1
338,Departamento en venta o renta (sin amueblar) u...,https://www.inmuebles24.com/propiedades/clasif...,"MN 38,000","durango 210\nRoma Norte, Cuauhtémoc","133 m² lote, 2 rec., 2 baños, 1 estac.",Cuauhtémoc,38000.0,133,2,2,1.0,1,1,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
13061,Este amplio departamento de 360 m² se encuentr...,https://www.inmuebles24.com/propiedades/clasif...,"MN 65,000","loma larga\nLomas de Vista Hermosa, Cuajimalpa...","360 m² lote, 3 rec., 3 baños, 3 estac.",Cuajimalpa de Morelos,65000.0,360,3,3,3.0,1,1,1
13099,¡No dejes pasar esta oportunidad! Característi...,https://www.inmuebles24.com/propiedades/clasif...,"MN 12,400","Monte Carmelo 22, Rosa Torres, Cuajimalpa de M...","64 m² lote, 2 rec., 2 baños, 1 estac.",Cuajimalpa de Morelos,12400.0,64,2,2,1.0,1,1,1
13129,Muy amplio y funcional Penthouse en Campestre ...,https://www.inmuebles24.com/propiedades/clasif...,"MN 68,000","Calle Fresnos No.\nGranjas Palo Alto, Cuajimal...","558 m² lote, 4 rec., 3 baños, 4 estac.",Cuajimalpa de Morelos,68000.0,558,4,3,4.0,0,1,1
13251,Increíble departamento en renta en We Santa Fe...,https://www.inmuebles24.com/propiedades/clasif...,"MN 25,000","Carretera México-Toluca 2971-5392\nLa Rosita, ...","62 m² lote, 1 rec., 1 baño, 1 estac.",Cuajimalpa de Morelos,25000.0,62,1,1,1.0,1,1,1


In [43]:
# 1. Usar .str.contains() para buscar la palabra "amueblado" (ignorando mayúsculas y minúsculas)
# 2. Usar .astype(int) para convertir True/False a 1/0
df['es_amueblado'] = df['Título'].str.contains('amueblado', case=False, na=False).astype(int)

In [44]:
df.es_amueblado.value_counts()

es_amueblado
0    221
1     63
Name: count, dtype: int64

In [45]:
df.isnull().sum()

Título                 0
Enlace                 0
Precio                 0
Dirección              0
Características        0
Municipio de Origen    0
precio_mxn             0
lote_m2                3
recamaras              1
baños                  4
estacionamiento        0
estacionamiento_txt    0
en_renta               0
en_venta               0
es_amueblado           0
dtype: int64

In [46]:
df[df.en_renta == 1].precio_mxn.describe()

count       179.000000
mean      65043.597765
std       46969.912910
min        8000.000000
25%       27300.000000
50%       50000.000000
75%       94150.000000
max      242580.000000
Name: precio_mxn, dtype: float64

In [51]:
pd.set_option('display.max_colwidth', 50)

In [52]:
# Queremos identificar outliers
df.sort_values('precio_mxn', ascending=False)[:10]

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn,lote_m2,recamaras,baños,estacionamiento,estacionamiento_txt,en_renta,en_venta,es_amueblado
635,En venta departamento totalmente amueblado en ...,https://www.inmuebles24.com/propiedades/clasif...,"USD 15,000","Av. Paseo de la Reforma\nCuauhtémoc, Cuauhtémoc","240 m² lote, 2 rec., 2 baños, 2 estac.",Cuauhtémoc,279900.0,240,2,2,2.0,1,0,1,1
2101,"Departamento de Lujo en Venta y Renta, Campos ...",https://www.inmuebles24.com/propiedades/clasif...,"USD 15,000","campos eliseos\nPolanco IV Sección, Polanco","443 m² lote, 2 rec., 2 baños, 5 estac.",Miguel Hidalgo,279900.0,443,2,2,5.0,0,0,1,0
3319,Extraordinario departamento en venta con ampli...,https://www.inmuebles24.com/propiedades/clasif...,"USD 15,000","CAMPOS ELISEOS\nPolanco, Miguel Hidalgo","460 m² lote, 3 rec., 3 baños, 5 estac.",Miguel Hidalgo,279900.0,460,3,3,5.0,0,0,1,0
3757,"Penthouse de Lujo en Venta – Arquímedes, Polan...",https://www.inmuebles24.com/propiedades/clasif...,"USD 13,500","Arquimedes\nPolanco, Miguel Hidalgo","550 m² lote, 4 rec., 4 baños, 3 estac.",Miguel Hidalgo,251910.0,550,4,4,3.0,1,0,1,0
2618,Departamento de Lujo en Renta o Venta Frente a...,https://www.inmuebles24.com/propiedades/clasif...,"USD 13,000","Luis G Urbina\nPolanco, Miguel Hidalgo","325 m² lote, 2 rec., 2 baños, 4 estac.",Miguel Hidalgo,242580.0,325,2,2,4.0,1,1,1,0
2690,Elegante Departamento en Venta cerca del Parqu...,https://www.inmuebles24.com/propiedades/clasif...,"USD 13,000","Campos Elíseos\nPolanco, Miguel Hidalgo","460 m² lote, 3 rec., 3 baños, 2 estac.",Miguel Hidalgo,242580.0,460,3,3,2.0,1,0,1,0
641,"Residencia en Renta – Paseo de la Reforma, con...",https://www.inmuebles24.com/propiedades/clasif...,"USD 13,000","Paseo de la Reforma\nCuauhtémoc, Cuauhtémoc","234 m² lote, 3 rec., 3 baños, 2 estac.",Cuauhtémoc,242580.0,234,3,3,2.0,1,1,1,0
3514,Precioso departamento en renta Y venta en parq...,https://www.inmuebles24.com/propiedades/clasif...,"USD 12,000","LUIS G URBINA\nPolanco, Miguel Hidalgo","325 m² lote, 3 rec., 2 baños, 4 estac.",Miguel Hidalgo,223920.0,325,3,2,4.0,0,1,1,0
3325,Precioso Departamento en venta ó renta en tres...,https://www.inmuebles24.com/propiedades/clasif...,"USD 10,000","tres picos 19\nPolanco V Sección, Polanco","650 m² lote, 3 rec., 3 baños, 4 estac.",Miguel Hidalgo,186600.0,650,3,3,4.0,1,1,1,0
6272,Venta renta departamento bosques de santa fe c...,https://www.inmuebles24.com/propiedades/clasif...,"MN 180,000",Club de Golf Bosques de Santa Fe\nClub de Golf...,"460 m² lote, 3 rec., 3 baños, 4 estac.",Cuajimalpa de Morelos,180000.0,460,3,3,4.0,1,1,1,0


In [53]:
# Dividir la columna 'Dirección' y expandir en nuevas columnas
# Usamos r'[,\n]' como la expresión regular para buscar tanto comas como saltos de línea
df_split = df['Dirección'].str.split(r'[,\n]', expand=True)

In [54]:

# Concatenar las nuevas columnas con el DataFrame original
df = pd.concat([df, df_split], axis=1)

In [57]:
df

Unnamed: 0,Título,Enlace,Precio,Dirección,Características,Municipio de Origen,precio_mxn,lote_m2,recamaras,baños,...,en_renta,en_venta,es_amueblado,0,1,2,3,4,5,6
93,Departamento en Renta Amueblado – Ideal para P...,https://www.inmuebles24.com/propiedades/clasif...,"MN 8,000","Betina 25, Lomas Estrella 2da Secc, Iztapalapa...","45 m² lote, 1 rec., 1 baño, 1 estac.",Tláhuac,8000.0,45,1,1,...,1,1,1,Betina 25,Lomas Estrella 2da Secc,Iztapalapa,09890 Ciudad de México,Cdmx,Lomas Estrella,Iztapalapa
170,Departamento en Venta – 70 m² – Col. Doctores ...,https://www.inmuebles24.com/propiedades/clasif...,"MN 22,000","Dr. Manuel Martínez\nDoctores, Cuauhtémoc","70 m² lote, 2 rec., 2 baños, 1 estac.",Cuauhtémoc,22000.0,70,2,2,...,0,1,0,Dr. Manuel Martínez,Doctores,Cuauhtémoc,,,,
195,Venta Renta modernos departamentos Residencial...,https://www.inmuebles24.com/propiedades/clasif...,"MN 38,000","Avenida Alfonso Reyes 53\nHipódromo Condesa, C...","2000 m² lote, 2 rec., 2 baños, 2 estac.",Cuauhtémoc,38000.0,2000,2,2,...,1,1,1,Avenida Alfonso Reyes 53,Hipódromo Condesa,Cuauhtémoc,,,,
232,"Departamento en venta penthouse, condesa. Pent...",https://www.inmuebles24.com/propiedades/clasif...,"MN 60,000","TAMAULIPAS 261 BIS\nCondesa, Cuauhtémoc","157 m² lote, 2 rec., 2 baños, 2 estac.",Cuauhtémoc,60000.0,157,2,2,...,0,1,0,TAMAULIPAS 261 BIS,Condesa,Cuauhtémoc,,,,
234,La propiedad en venta se encuentra en la colon...,https://www.inmuebles24.com/propiedades/clasif...,"MN 65,000","San Luis Potosí 44\nRoma Norte, Cuauhtémoc","160 m² lote, 2 rec., 3 baños, 2 estac.",Cuauhtémoc,65000.0,160,2,3,...,0,1,0,San Luis Potosí 44,Roma Norte,Cuauhtémoc,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
13116,"En Contadero, este departamento de 100 m² ofre...",https://www.inmuebles24.com/propiedades/clasif...,"MN 27,000","Carretera mexico toluca 5860\nContadero, Cuaji...","100 m² lote, 2 rec., 2 baños, 2 estac.",Cuajimalpa de Morelos,27000.0,100,2,2,...,0,1,0,Carretera mexico toluca 5860,Contadero,Cuajimalpa de Morelos,,,,
13129,Muy amplio y funcional Penthouse en Campestre ...,https://www.inmuebles24.com/propiedades/clasif...,"MN 68,000","Calle Fresnos No.\nGranjas Palo Alto, Cuajimal...","558 m² lote, 4 rec., 3 baños, 4 estac.",Cuajimalpa de Morelos,68000.0,558,4,3,...,1,1,0,Calle Fresnos No.,Granjas Palo Alto,Cuajimalpa de Morelos,,,,
13169,"Departamento en Venta – Tres Cumbres, Av. De l...",https://www.inmuebles24.com/propiedades/clasif...,"MN 60,000","Av. De los poetas 89\nSan Mateo Tlaltenango, C...","196 m² lote, 3 rec., 1 baño, 3 estac.",Cuajimalpa de Morelos,60000.0,196,3,1,...,0,1,0,Av. De los poetas 89,San Mateo Tlaltenango,Cuajimalpa de Morelos,,,,
13251,Increíble departamento en renta en We Santa Fe...,https://www.inmuebles24.com/propiedades/clasif...,"MN 25,000","Carretera México-Toluca 2971-5392\nLa Rosita, ...","62 m² lote, 1 rec., 1 baño, 1 estac.",Cuajimalpa de Morelos,25000.0,62,1,1,...,1,1,0,Carretera México-Toluca 2971-5392,La Rosita,Cuajimalpa de Morelos,,,,
