In [1]:
import pandas as pd
import numpy as np

In [2]:
#Generamos datos 'reales' con errores intencionales
np.random.seed(45)
n_propiedades=150

ids = [f"PROP_{i:03d}" for i in range(1, n_propiedades + 1)]
barrios = np.random.choice(['Palermo', 'Recoleta', 'Belgrano', 'Centro'], n_propiedades)
precios = np.random.normal(250000, 100000, n_propiedades).round(2)
habitaciones = np.random.randint(1, 6, n_propiedades)
estados = np.random.choice(['Nuevo', 'Usado', 'A_Refaccionar', 'Detonado'], n_propiedades)

df_real=pd.DataFrame({
    'id_propiedad': ids,
    'barrio': barrios,
    'precios_usd': precios,
    'habitaciones': habitaciones,
    'estados': estados,
})

#Inyectamos los errores que se deben limpiar
df_real.loc[5, 'precios_usd'] = -50000.00  # Error 1: Precio negativo
df_real.loc[10, 'barrio'] = 'Palrrrmo'    # Error 2: Error de ortografía
df_real.loc[20, 'habitaciones'] = 0               # Error 3: Cero habitaciones

# Creamos el archivo CSV
df_real.to_csv('propiedades_raw.csv', index=False)
print("Archivo 'propiedades_raw.csv' generado correctamente.")

Archivo 'propiedades_raw.csv' generado correctamente.


# Misión 1: La Carga Profesional

In [3]:
#Leer archivo CSV
df=pd.read_csv('propiedades_raw.csv', index_col='id_propiedad')
print('---- PRIMERAS 5 FILAS---')
print(df.head())

---- PRIMERAS 5 FILAS---
                barrio  precios_usd  habitaciones   estados
id_propiedad                                               
PROP_001        Centro    311400.93             1  Detonado
PROP_002      Belgrano    264613.80             1  Detonado
PROP_003        Centro    370583.30             2     Usado
PROP_004       Palermo    230321.28             3     Usado
PROP_005       Palermo    276321.08             4  Detonado


# Misión 2: Limpieza Quirúrgica (Usando `.loc`)

In [4]:
# Cambiar precio de propiedad PROP_006 a 50000.00
df.loc['PROP_006','precios_usd'] = 50000.00

#Cambiar barrio de propiedad PROP_011 a 'Palermo'
df.loc['PROP_011','barrio'] = 'Palermo'

#Cambiar N° de habitaciones de la propiedad PROP_021 a 1
df.loc['PROP_021','habitaciones'] = 1

print("Información Actualizada")
print(df.loc['PROP_006':'PROP_021'])

# Ahora trabajamos sobre df que ya tiene 'id_propiedad' como índice,
# por lo que podemos acceder directamente a las filas por su ID.
# Esto es más práctico y legible para conjuntos de datos grandes.


Información Actualizada
                barrio  precios_usd  habitaciones        estados
id_propiedad                                                    
PROP_006        Centro     50000.00             1       Detonado
PROP_007      Recoleta    156897.32             5          Usado
PROP_008      Recoleta    335342.10             2       Detonado
PROP_009        Centro    277540.48             5          Nuevo
PROP_010       Palermo    310747.69             1       Detonado
PROP_011       Palermo    272983.75             5       Detonado
PROP_012       Palermo    162957.24             1          Nuevo
PROP_013        Centro    162783.69             4          Usado
PROP_014      Recoleta    328747.04             5       Detonado
PROP_015      Belgrano    417574.91             1  A_Refaccionar
PROP_016      Recoleta    199672.46             1          Usado
PROP_017      Recoleta    278945.86             5  A_Refaccionar
PROP_018      Belgrano    455533.37             5          Usado
P

# Misión 3: El Cliente Exigente (Boolean Masking)

In [5]:
#Encontrar casas con de menos de 200.000 USD y que sean en el barrio Belgrano o Recoleta
mask_precio=(df['precios_usd'] < 200000) & (df['barrio'].isin(['Belgrano','Recoleta']))
filtered_precios = df[mask_precio]

print("---- CASAS QUE CUMPLEN LAS CONDICIONES----")
print(filtered_precios)


---- CASAS QUE CUMPLEN LAS CONDICIONES----
                barrio  precios_usd  habitaciones        estados
id_propiedad                                                    
PROP_007      Recoleta    156897.32             5          Usado
PROP_016      Recoleta    199672.46             1          Usado
PROP_021      Belgrano    194154.79             1       Detonado
PROP_029      Recoleta    134730.76             4       Detonado
PROP_033      Belgrano    179815.47             1       Detonado
PROP_040      Belgrano    149701.05             5       Detonado
PROP_048      Belgrano    149153.66             5       Detonado
PROP_058      Belgrano    188495.94             1          Usado
PROP_059      Belgrano    136685.31             4          Usado
PROP_080      Belgrano     63774.72             3          Nuevo
PROP_095      Recoleta    170808.87             1  A_Refaccionar
PROP_108      Belgrano     85976.64             3          Nuevo
PROP_112      Recoleta    172349.71            

# Misión 4: El Reporte Rápido (Usando `.iloc`)

In [10]:
quickly=df.iloc[10 : 16, [0,1]]
print("---INFORMACIÓN FLASH----")
print(quickly)

---INFORMACIÓN FLASH----
                barrio  precios_usd
id_propiedad                       
PROP_011       Palermo    272983.75
PROP_012       Palermo    162957.24
PROP_013        Centro    162783.69
PROP_014      Recoleta    328747.04
PROP_015      Belgrano    417574.91
PROP_016      Recoleta    199672.46
