# M√≥dulo 4: Interfaz de tasaci√≥n inteligente (prototipo de producci√≥n)

**Autora:** Mar√≠a Luisa Ros Bolea  
**Proyecto:** VALORALIA ‚Äî Sistema de Valoraci√≥n Automatizada con IA

---

### Mi objetivo en este cuaderno

Aqu√≠ simulo el **despliegue en producci√≥n** del sistema Valoralia. Creo una funci√≥n de tasaci√≥n que:
1. Recibe los datos de un inmueble (metros, habitaciones, municipio...)
2. Opcionalmente, recibe una imagen del interior
3. Devuelve la valoraci√≥n del modelo baseline y la del modelo h√≠brido
4. Aplica **reglas anti-alucinaci√≥n** para evitar predicciones absurdas

Tambi√©n incluyo un simulador de escenarios macro (crisis, burbuja) y genero un informe de tasaci√≥n exportable.


In [1]:
# ==============================================================================
# 1. CONFIGURACI√ìN Y CARGA DE MODELOS
# ==============================================================================
from google.colab import drive
drive.mount('/content/drive')

import pandas as pd
import numpy as np
import pickle
import os, warnings
warnings.filterwarnings('ignore')

BASE_PATH = '/content/drive/MyDrive/TFM_Mejorado'
PROC_PATH = f'{BASE_PATH}/Data/Processed'
MODEL_PATH = f'{BASE_PATH}/Models'
IMG_PATH = f'{BASE_PATH}/Data/Images'
REPORT_PATH = f'{BASE_PATH}/Reports'

# Cargar modelos
with open(f'{MODEL_PATH}/modelo_baseline_rf.pkl', 'rb') as f:
    modelo_baseline = pickle.load(f)
with open(f'{MODEL_PATH}/modelo_hibrido_rf.pkl', 'rb') as f:
    modelo_hibrido = pickle.load(f)
with open(f'{PROC_PATH}/preprocessing_artifacts.pkl', 'rb') as f:
    artifacts = pickle.load(f)

scaler = artifacts['scaler']
le_municipio = artifacts['label_encoder_municipio']
FEATURES = artifacts['features_tabular']

print("‚úÖ Modelos y artefactos cargados")
print(f"   Municipios disponibles: {list(le_municipio.classes_)}")


Mounted at /content/drive
‚úÖ Modelos y artefactos cargados
   Municipios disponibles: ['Alcorc√≥n', 'Fuenlabrada', 'Getafe', 'Legan√©s', 'M√≥stoles', 'Parla', 'Pinto']


## 2. Motor de tasaci√≥n con l√≥gica anti-alucinaci√≥n

Esta funci√≥n es el coraz√≥n del producto. Incorpora reglas de negocio que impiden que el modelo devuelva valores absurdos (por ejemplo, un piso de 30m¬≤ en Villaverde por 2 millones de euros).


In [2]:
# ==============================================================================
# 2. MOTOR DE TASACI√ìN
# ==============================================================================

# Rangos de precio por m2 realistas (para validaci√≥n anti-alucinaci√≥n)
RANGOS_PRECIO_M2 = {
    'Madrid': (2500, 12000), 'Getafe': (1800, 4500), 'Alcorc√≥n': (1800, 4200),
    'Legan√©s': (1500, 3800), 'M√≥stoles': (1500, 3500), 'Fuenlabrada': (1300, 3000),
    'Alcobendas': (2500, 6000), 'Pinto': (1500, 3500), 'Parla': (1200, 2800),
    'Torrej√≥n de Ardoz': (1500, 3500), 'Alcal√° de Henares': (1400, 3500),
    'San Sebasti√°n de los Reyes': (2000, 5000), 'Pozuelo de Alarc√≥n': (3000, 8000),
    'Las Rozas de Madrid': (2500, 6500), 'Majadahonda': (2500, 6500),
    'Rivas-Vaciamadrid': (2000, 5000), 'Coslada': (1800, 3800),
    'Tres Cantos': (2500, 5500), 'Valdemoro': (1500, 3500),
    'Collado Villalba': (1500, 3500), 'Aranjuez': (1000, 2800),
    'Arganda del Rey': (1300, 3000), 'Boadilla del Monte': (2500, 7000),
}
DEFAULT_RANGO = (1000, 8000)

def tasar_inmueble(tamano_m2, habitaciones, banos, municipio, estado,
                   planta='2', tiene_ascensor=True, tiene_terraza=False,
                   tiene_trastero=False, calefaccion='Central',
                   escenario='ESTABILIDAD', imagen_features=None):
    """
    Motor de tasaci√≥n Valoralia.
    Devuelve valoraci√≥n baseline + h√≠brida (si hay imagen) + validaci√≥n.
    """
    # Codificaci√≥n
    estado_map = {'A reformar': 0, 'Buen estado': 1, 'Obra nueva': 2}
    estado_cod = estado_map.get(estado, 1)

    def cod_planta(p):
        p = str(p).lower()
        if 'bajo' in p: return 0
        try: return min(int(''.join(filter(str.isdigit, p))), 10)
        except: return 2

    planta_cod = cod_planta(planta)

    try:
        municipio_cod = le_municipio.transform([municipio])[0]
    except:
        print(f"  ‚ö†Ô∏è Municipio '{municipio}' no reconocido, usando valor medio")
        municipio_cod = len(le_municipio.classes_) // 2

    calef_map = {c: i for i, c in enumerate(artifacts['label_encoder_calefaccion'].classes_)}
    calefaccion_cod = calef_map.get(calefaccion, 0)

    # Features
    ratio_hab_m2 = habitaciones / tamano_m2
    ratio_banos_hab = banos / max(habitaciones, 1)

    features_raw = np.array([[tamano_m2, habitaciones, banos, planta_cod,
                              int(tiene_ascensor), int(tiene_terraza), int(tiene_trastero),
                              calefaccion_cod, estado_cod, municipio_cod,
                              ratio_hab_m2, ratio_banos_hab]])

    features_scaled = scaler.transform(features_raw)

    # Predicci√≥n baseline
    precio_baseline = modelo_baseline.predict(features_scaled)[0]

    # Predicci√≥n h√≠brida (si hay features de imagen)
    precio_hibrido = None
    if imagen_features is not None:
        features_combined = np.concatenate([features_scaled.flatten(), imagen_features])
        precio_hibrido = modelo_hibrido.predict([features_combined])[0]

    # Escenario macro
    factores = {'ESTABILIDAD': 1.0, 'RECESI√ìN': 0.90, 'CRASH': 0.80, 'BURBUJA': 1.15}
    factor = factores.get(escenario, 1.0)

    precio_baseline *= factor
    if precio_hibrido:
        precio_hibrido *= factor

    # Validaci√≥n anti-alucinaci√≥n
    rango = RANGOS_PRECIO_M2.get(municipio, DEFAULT_RANGO)
    precio_m2_pred = precio_baseline / tamano_m2
    alerta = None

    if precio_m2_pred < rango[0]:
        alerta = f"‚ö†Ô∏è Precio/m¬≤ ({precio_m2_pred:,.0f}‚Ç¨) por debajo del rango esperado para {municipio} ({rango[0]:,}‚Ç¨-{rango[1]:,}‚Ç¨)"
    elif precio_m2_pred > rango[1]:
        alerta = f"‚ö†Ô∏è Precio/m¬≤ ({precio_m2_pred:,.0f}‚Ç¨) por encima del rango esperado para {municipio} ({rango[0]:,}‚Ç¨-{rango[1]:,}‚Ç¨)"

    return {
        'precio_baseline': precio_baseline,
        'precio_hibrido': precio_hibrido,
        'precio_m2': precio_m2_pred,
        'escenario': escenario,
        'factor_macro': factor,
        'alerta': alerta
    }

print("‚úÖ Motor de tasaci√≥n cargado")


‚úÖ Motor de tasaci√≥n cargado


## 3. Simulaci√≥n de tasaciones

Voy a probar el motor con varios escenarios realistas para demostrar que funciona correctamente.


In [3]:
# ==============================================================================
# 3. SIMULACI√ìN DE TASACIONES
# ==============================================================================

casos_test = [
    {"nombre": "Piso lujo Pozuelo", "tamano_m2": 150, "habitaciones": 4, "banos": 3,
     "municipio": "Pozuelo de Alarc√≥n", "estado": "Obra nueva", "tiene_ascensor": True, "tiene_terraza": True},
    {"nombre": "Piso est√°ndar Legan√©s", "tamano_m2": 85, "habitaciones": 3, "banos": 1,
     "municipio": "Legan√©s", "estado": "Buen estado", "tiene_ascensor": True, "tiene_terraza": False},
    {"nombre": "Estudio Fuenlabrada", "tamano_m2": 45, "habitaciones": 1, "banos": 1,
     "municipio": "Fuenlabrada", "estado": "A reformar", "tiene_ascensor": False, "tiene_terraza": False},
    {"nombre": "Chalet Boadilla", "tamano_m2": 250, "habitaciones": 5, "banos": 3,
     "municipio": "Boadilla del Monte", "estado": "Obra nueva", "tiene_ascensor": False, "tiene_terraza": True},
]

print("=" * 70)
print("   SIMULACI√ìN DE TASACIONES ‚Äî VALORALIA SYSTEMS")
print("=" * 70)

for caso in casos_test:
    nombre = caso.pop('nombre')
    resultado = tasar_inmueble(**caso)

    print(f"\nüè† {nombre}")
    print(f"   {caso['tamano_m2']}m¬≤ | {caso['habitaciones']} hab | {caso['municipio']} | {caso['estado']}")
    print(f"   üí∞ Valoraci√≥n IA: {resultado['precio_baseline']:,.0f} ‚Ç¨ ({resultado['precio_m2']:,.0f} ‚Ç¨/m¬≤)")
    if resultado['alerta']:
        print(f"   {resultado['alerta']}")
    else:
        print(f"   ‚úÖ Precio dentro del rango esperado")

    caso['nombre'] = nombre  # restaurar

# Simulaci√≥n con escenarios macro
print(f"\n{'='*70}")
print("   TEST DE ESCENARIOS MACRO ‚Äî Piso est√°ndar Legan√©s (85m¬≤, 3 hab)")
print("="*70)

for esc in ['ESTABILIDAD', 'RECESI√ìN', 'CRASH', 'BURBUJA']:
    r = tasar_inmueble(85, 3, 1, 'Legan√©s', 'Buen estado', escenario=esc)
    emoji = {'ESTABILIDAD': 'üü¢', 'RECESI√ìN': 'üü°', 'CRASH': 'üî¥', 'BURBUJA': 'üü†'}
    print(f"   {emoji[esc]} {esc:<15s} ‚Üí {r['precio_baseline']:>12,.0f} ‚Ç¨ (factor: x{r['factor_macro']})")


   SIMULACI√ìN DE TASACIONES ‚Äî VALORALIA SYSTEMS
  ‚ö†Ô∏è Municipio 'Pozuelo de Alarc√≥n' no reconocido, usando valor medio

üè† Piso lujo Pozuelo
   150m¬≤ | 4 hab | Pozuelo de Alarc√≥n | Obra nueva
   üí∞ Valoraci√≥n IA: 344,225 ‚Ç¨ (2,295 ‚Ç¨/m¬≤)
   ‚ö†Ô∏è Precio/m¬≤ (2,295‚Ç¨) por debajo del rango esperado para Pozuelo de Alarc√≥n (3,000‚Ç¨-8,000‚Ç¨)

üè† Piso est√°ndar Legan√©s
   85m¬≤ | 3 hab | Legan√©s | Buen estado
   üí∞ Valoraci√≥n IA: 204,145 ‚Ç¨ (2,402 ‚Ç¨/m¬≤)
   ‚úÖ Precio dentro del rango esperado

üè† Estudio Fuenlabrada
   45m¬≤ | 1 hab | Fuenlabrada | A reformar
   üí∞ Valoraci√≥n IA: 100,202 ‚Ç¨ (2,227 ‚Ç¨/m¬≤)
   ‚úÖ Precio dentro del rango esperado
  ‚ö†Ô∏è Municipio 'Boadilla del Monte' no reconocido, usando valor medio

üè† Chalet Boadilla
   250m¬≤ | 5 hab | Boadilla del Monte | Obra nueva
   üí∞ Valoraci√≥n IA: 387,668 ‚Ç¨ (1,551 ‚Ç¨/m¬≤)
   ‚ö†Ô∏è Precio/m¬≤ (1,551‚Ç¨) por debajo del rango esperado para Boadilla del Monte (2,500‚Ç¨-7,000‚Ç¨)

   TE

In [4]:
# ==============================================================================
# 4. GENERACI√ìN DE INFORME DE TASACI√ìN (CSV)
# ==============================================================================

# Generar tasaciones masivas para el dataset de test
df = pd.read_csv(f'{PROC_PATH}/datos_procesados.csv')
df_sample = df.head(50)  # Muestra para el informe

registros = []
for _, row in df_sample.iterrows():
    r = tasar_inmueble(
        tamano_m2=row['tamano_m2'], habitaciones=row['habitaciones'],
        banos=row['banos'], municipio=row['municipio'], estado=row['estado'],
        planta=row['planta'], tiene_ascensor=bool(row['tiene_ascensor']),
        tiene_terraza=bool(row['tiene_terraza']),
        tiene_trastero=bool(row['tiene_trastero']),
        calefaccion=row['calefaccion']
    )
    registros.append({
        'id_anuncio': row['id_anuncio'],
        'municipio': row['municipio'],
        'tamano_m2': row['tamano_m2'],
        'precio_real': row['precio_actual'],
        'valoracion_ia': round(r['precio_baseline']),
        'precio_m2_ia': round(r['precio_m2']),
        'error_abs': abs(row['precio_actual'] - r['precio_baseline']),
        'alerta': r['alerta'] or 'OK'
    })

df_informe = pd.DataFrame(registros)
df_informe.to_csv(f'{REPORT_PATH}/informe_tasaciones.csv', index=False)

print(f"üíæ Informe exportado: Reports/informe_tasaciones.csv ({len(df_informe)} tasaciones)")
print(f"\nüìä Estad√≠sticas del informe:")
print(f"   Error absoluto medio: {df_informe['error_abs'].mean():,.0f}‚Ç¨")
print(f"   % alertas: {(df_informe['alerta']!='OK').mean()*100:.1f}%")
print(f"\n‚úÖ M√≥dulo 4 completado ‚Äî Interfaz de tasaci√≥n operativa")


üíæ Informe exportado: Reports/informe_tasaciones.csv (50 tasaciones)

üìä Estad√≠sticas del informe:
   Error absoluto medio: 9,001‚Ç¨
   % alertas: 0.0%

‚úÖ M√≥dulo 4 completado ‚Äî Interfaz de tasaci√≥n operativa
