# Limpieza y Transformación de Datos de Ofertas Inmobiliarias

Este notebook documenta el proceso de limpieza y transformación de datos para el conjunto de datos de ofertas inmobiliarias.
Se abordan los siguientes pasos:
1. Identificación y tratamiento de valores faltantes.
2. Conversión de tipos de datos.
3. Eliminación de duplicados.
4. Tratamiento de outliers.
5. Transformación adicional de los datos según sea necesario.


In [None]:
```python
import pandas as pd

# Cargar el dataset
file_path = 'ofertas_inmobiliarias.csv'
df = pd.read_csv(file_path)

# Mostrar las primeras filas
df.head()
```


In [None]:
```python
# Revisión de valores faltantes y tipos de datos
missing_values = df.isnull().sum()
data_types = df.dtypes

missing_values, data_types
```


In [None]:
```python
# Reemplazar 'N/D' con NaN para un mejor manejo
df.replace('N/D', pd.NA, inplace=True)

# Llenado de valores numéricos faltantes con la mediana
numeric_columns = df.select_dtypes(include=['float64', 'int64']).columns
df[numeric_columns] = df[numeric_columns].apply(lambda col: col.fillna(col.median()))

# Llenado de valores categóricos faltantes con la moda
categorical_columns = df.select_dtypes(include=['object']).columns
df[categorical_columns] = df[categorical_columns].apply(lambda col: col.fillna(col.mode()[0]))

# Convertir la columna 'Agno Construccion' a tipo entero
df['Agno Construccion'] = pd.to_numeric(df['Agno Construccion'], errors='coerce').fillna(0).astype(int)

# Remover duplicados
df = df.drop_duplicates()

# Manejo de outliers en 'Precio' y 'mt2' (limitando al percentil 1 y 99)
df['Precio'] = df['Precio'].clip(lower=df['Precio'].quantile(0.01), upper=df['Precio'].quantile(0.99))
df['mt2'] = df['mt2'].clip(lower=df['mt2'].quantile(0.01), upper=df['mt2'].quantile(0.99))

# Mostrar datos limpiados
df.head()
```


In [None]:
```python
# Guardar datos limpiados en un CSV
cleaned_csv_path = "cleaned_ofertas_inmobiliarias.csv"
df.to_csv(cleaned_csv_path, index=False)
cleaned_csv_path
```
