1. El Problema: Predicci√≥n de Precios de Casas
Vamos a simular un problema cl√°sico de regresi√≥n. Tenemos un DataFrame con 3 columnas (Caracter√≠sticas o Features):

* Metros Cuadrados (ej: 50 a 200).

* Antig√ºedad (ej: 1 a 50 a√±os).

* Distancia al centro (ej: 0.5 a 20 km).

Y queremos predecir el Precio (Target).

2. El Puente: De Pandas a PyTorch
Aqu√≠ hay una regla de oro que un Senior Engineer nunca olvida:

‚ö†Ô∏è Regla de Oro: A las redes neuronales NO les gustan los n√∫meros grandes ni los rangos dispares.

Si metes "100 metros" y "0.5 km" juntos, la red se confundir√° porque 100 es mucho m√°s grande que 0.5, aunque la distancia sea importante. Soluci√≥n: Debemos normalizar los datos (hacer que todo est√© m√°s o menos entre -1 y 1) antes de convertirlos a Tensores.

Usaremos StandardScaler de Scikit-Learn para esto.

In [1]:
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler

# 1. Simulaci√≥n de un CSV cargado en Pandas
data = {
    'metros': np.random.randint(50, 200, 1000),
    'antiguedad': np.random.randint(1, 50, 1000),
    'distancia': np.random.uniform(0.5, 20, 1000),
    'precio': np.zeros(1000) # Placeholder
}
df = pd.DataFrame(data)

# Generamos un precio l√≥gico: Precio base + (Metros * 1000) - (Antig√ºedad * 500) ...
df['precio'] = 50000 + (df['metros'] * 1000) - (df['antiguedad'] * 500) - (df['distancia'] * 1000)

# 2. Separamos Features (X) y Target (y)
X_numpy = df[['metros', 'antiguedad', 'distancia']].values
y_numpy = df['precio'].values.reshape(-1, 1) # Importante: reshape a columna

# 3. NORMALIZACI√ìN (CR√çTICO PARA REDES NEURONALES)
scaler_x = StandardScaler()
scaler_y = StandardScaler() # Escalamos tambi√©n el precio para que la Loss no sea gigante

X_scaled = scaler_x.fit_transform(X_numpy)
y_scaled = scaler_y.fit_transform(y_numpy)

print(f"Datos listos.")
print(f"Ejemplo X normalizado: {X_scaled[0]}")
print(f"Ejemplo y normalizado: {y_scaled[0]}")

Datos listos.
Ejemplo X normalizado: [ 1.64854767 -0.33145076  1.49200015]
Ejemplo y normalizado: [1.4850106]


Tu Misi√≥n:

1) Crea la clase HouseDataset:

* En el __init__, debe recibir dos argumentos: features y targets.

* Dentro del __init__, convierte esos arrays de numpy a Tensores de PyTorch tipo float32.

* Pista: torch.tensor(..., dtype=torch.float32)

Implementa __len__ y __getitem__.

2) Crea la clase HouseModel:

* Entrada: 3 neuronas (porque tenemos 3 features).

* Oculta: 2 capas ocultas de 64 neuronas cada una con ReLU.

* Salida: 1 neurona (el precio). ¬°OJO! No uses activaci√≥n en la salida final (queremos un valor lineal continuo, no una probabilidad).

Escribe el c√≥digo de estas dos clases y inst√°ncialas.

Instancia el dataset pasando X_scaled y y_scaled.

Instancia el modelo.

In [2]:
class HouseDataset(Dataset):
    def __init__(self, features, targets):
        self.features=torch.tensor(data=features, dtype=torch.float32)
        self.targets=torch.tensor(data=targets, dtype=torch.float32)
    
    def __len__(self) -> int:
        return len(self.features)
    
    def __getitem__(self, index):
        # DEVOLVEMOS TUPLA: (Datos, Precio)
        return self.features[index], self.targets[index]

class HouseModel(nn.Module):
    def __init__(self):
        super().__init__()
        #primera de 3 a 64 ocultas. Entrada -> Oculta
        self.capa1=nn.Linear(in_features=3,out_features=64)
        self.activacion=nn.ReLU()
        #oculta -> oculta. segunda transformaci√≥n (Profundidad): De 64 a 64
        self.capa2=nn.Linear(in_features=64,out_features=64)
        #capa Final (Compresi√≥n): De 64 a 1 solo precio
        self.salida=nn.Linear(in_features=64,out_features=1)
    
    def forward(self, x):
        """Debe pasar x a trav√©s de: capa1 -> activacion -> capa2 -> activacion -> salida."""
        x=self.capa1(x)
        x=self.activacion(x)
        x=self.capa2(x)
        x=self.activacion(x)
        x=self.salida(x)
        return x

modelo=HouseModel()
dataset=HouseDataset(features=X_scaled, targets=y_scaled)

Vas a escribir el script de entrenamiento completo t√∫ solo, uniendo todo lo que hemos visto.

Requisitos T√©cnicos:

* DataLoader: Inst√°ncialo con tu dataset, batch_size=32 y shuffle=True.

* Loss Function: Como es un problema de regresi√≥n (predecir valores continuos), DEBES usar nn.MSELoss() (Error Cuadr√°tico Medio).

* Optimizador: Usa torch.optim.Adam con un learning rate (lr) de 0.001. Adam suele funcionar mejor que SGD para estos datos.

* Bucle: Entrena por 20 √©pocas.

In [3]:
#Crear el DataLoader
#batch_size=32: Entregar√° paquetes de 32 datos
#shuffle=True: Barajar√° los datos en cada √©poca
loader = DataLoader(dataset=dataset, batch_size=32, shuffle=True)

#loss function
loss_function=nn.MSELoss()
#optimizador
optimizador=torch.optim.Adam(params=modelo.parameters(),lr=0.001)
#bucle
epochs=20

for epoch in range(epochs):
    loss_acum = 0
    
    for batch_x, batch_y in loader:      
        # 1. Forward
        prediccion = modelo(batch_x)
        
        # 2. Calcular Loss
        loss = loss_function(prediccion, batch_y)
        
        # 3. Limpiar gradientes previos
        optimizador.zero_grad()
        
        # 4. Backward (Calcular gradientes)
        loss.backward()
        
        # 5. Actualizar pesos
        optimizador.step()
        
        # Acumulamos el error para monitorear (opcional)
        loss_acum += loss.item()
    
    # Reporte por epoch
    promedio_loss = loss_acum / len(loader)
    print(f"√âpoca {epoch+1} | Loss Promedio: {promedio_loss:.5f}")

√âpoca 1 | Loss Promedio: 0.42114
√âpoca 2 | Loss Promedio: 0.01153
√âpoca 3 | Loss Promedio: 0.00381
√âpoca 4 | Loss Promedio: 0.00235
√âpoca 5 | Loss Promedio: 0.00204
√âpoca 6 | Loss Promedio: 0.00156
√âpoca 7 | Loss Promedio: 0.00121
√âpoca 8 | Loss Promedio: 0.00100
√âpoca 9 | Loss Promedio: 0.00079
√âpoca 10 | Loss Promedio: 0.00065
√âpoca 11 | Loss Promedio: 0.00052
√âpoca 12 | Loss Promedio: 0.00042
√âpoca 13 | Loss Promedio: 0.00036
√âpoca 14 | Loss Promedio: 0.00032
√âpoca 15 | Loss Promedio: 0.00026
√âpoca 16 | Loss Promedio: 0.00022
√âpoca 17 | Loss Promedio: 0.00020
√âpoca 18 | Loss Promedio: 0.00017
√âpoca 19 | Loss Promedio: 0.00015
√âpoca 20 | Loss Promedio: 0.00015


Llega un cliente a tu inmobiliaria.

La Casa:Metros: 120 $m^2$

Antig√ºedad: 10 a√±os

Distancia: 5.0 km

Tu Misi√≥n:Usa tu modelo entrenado para predecir el precio de esta casa.

In [4]:
# 1. Definimos los datos de la casa nueva (en el mismo orden que entrenamos)
# [metros, antiguedad, distancia]
casa_nueva = np.array([[120, 10, 5.0]]) 

# 2. Normalizamos la entrada (Usamos el MISMO scaler_x del entrenamiento)
casa_nueva_scaled = scaler_x.transform(casa_nueva)

# 3. Convertimos a Tensor (recuerda el tipo de dato y el dispositivo)
# RELLENA AQUI: casa_tensor = ...
casa_tensor = torch.tensor(casa_nueva_scaled, dtype=torch.float32)

# 4. Predicci√≥n
modelo.eval() # Modo evaluaci√≥n
with torch.no_grad(): # Apagamos gradientes
    # RELLENA AQUI: Haz el pase forward
    prediccion_scaled = modelo(casa_tensor)

# 5. Des-normalizamos el precio (De vuelta a d√≥lares)
# Usamos scaler_y.inverse_transform
# OJO: inverse_transform espera un array de numpy, no un tensor.
precio_final = scaler_y.inverse_transform(prediccion_scaled.numpy())

print(f"El precio estimado es: ${precio_final[0][0]:,.2f}")

El precio estimado es: $159,905.00


In [5]:
# 1. Creamos la etiqueta binaria basada en el precio real
# Si precio > 150000 -> 1 (VIP), si no -> 0 (Normal)
umbral = 150000
y_binario = (df['precio'].values > umbral).astype(int).reshape(-1, 1)

# 2. Convertimos a Tensor Float32
# ¬°OJO! BCELoss espera que las etiquetas sean Float, no Long/Int.
y_train_class = torch.tensor(y_binario, dtype=torch.float32)

# 3. Reusamos tus Features normalizados (X_scaled) que ya ten√≠as
X_train_tensor = torch.tensor(X_scaled, dtype=torch.float32)

# 4. Creamos el nuevo Dataset y Loader
dataset_class = HouseDataset(X_train_tensor, y_train_class)
loader_class = DataLoader(dataset_class, batch_size=32, shuffle=True)

print(f"Total de casas VIP: {y_binario.sum()} de {len(y_binario)}")

Total de casas VIP: 501 de 1000


  self.features=torch.tensor(data=features, dtype=torch.float32)
  self.targets=torch.tensor(data=targets, dtype=torch.float32)


Tu Misi√≥n:

Escribe el script de entrenamiento para Clasificaci√≥n.

* Instancia el modelo: modelo = HouseModel() (Reinst√°ncialo para borrar los pesos viejos).

* Define la Loss: Usa nn.BCEWithLogitsLoss().

* Define el Optimizador: Adam, lr=0.001.Bucle: Entrena por 20 √©pocas.

üí° Reto Extra (Opcional pero recomendado):En el print final de cada √©poca, adem√°s de la Loss, intenta calcular la Accuracy (Precisi√≥n).

Pista: La predicci√≥n cruda (logits) pasa por una sigmoide. Si el resultado $> 0.5$, es un 1. Compara eso con batch_y.

In [6]:
modelo=HouseModel()
loss_function=nn.BCEWithLogitsLoss()
optimizador=torch.optim.Adam(params=modelo.parameters(),lr=0.001)
epochs=20
for epoch in range(epochs):
    loss_acumulada=0
    correctos_acumulados = 0
    total_muestras = 0

    for batch_x, batch_y in loader_class:      
        # 1. Forward
        prediccion = modelo(batch_x)
        # 2. Calcular Loss
        loss = loss_function(prediccion, batch_y)
        # 3. Limpiar gradientes previos
        optimizador.zero_grad()
        # 4. Backward (Calcular gradientes)
        loss.backward()
        # 5. Actualizar pesos
        optimizador.step()
        # Acumulamos el error para monitorear (opcional)
        loss_acumulada += loss.item()

        #calculo accuracy
        #convertir logits a probabilidades
        probs = torch.sigmoid(prediccion)
        #Convertir a 0 o 1 (Decisi√≥n)
        preds = (probs > 0.5).float()
        #Contar aciertos (True si son iguales, False si no)
        correctos_acumulados += (preds == batch_y).sum().item()
        total_muestras += batch_y.size(0) # Sumamos 32 (tama√±o del batch)
    # Reporte por epoch
    promedio_loss = loss_acumulada / len(loader_class)
    accuracy_epoch = correctos_acumulados / total_muestras
    print(f"√âpoch {epoch+1} | Loss Promedio: {promedio_loss:.5f} | Accuracy: {accuracy_epoch*100:.2f}%")

√âpoch 1 | Loss Promedio: 0.59347 | Accuracy: 75.30%
√âpoch 2 | Loss Promedio: 0.34230 | Accuracy: 94.00%
√âpoch 3 | Loss Promedio: 0.17185 | Accuracy: 97.90%
√âpoch 4 | Loss Promedio: 0.10501 | Accuracy: 98.70%
√âpoch 5 | Loss Promedio: 0.07580 | Accuracy: 99.10%
√âpoch 6 | Loss Promedio: 0.05920 | Accuracy: 99.60%
√âpoch 7 | Loss Promedio: 0.05098 | Accuracy: 99.60%
√âpoch 8 | Loss Promedio: 0.04164 | Accuracy: 99.50%
√âpoch 9 | Loss Promedio: 0.03654 | Accuracy: 99.60%
√âpoch 10 | Loss Promedio: 0.03300 | Accuracy: 99.70%
√âpoch 11 | Loss Promedio: 0.02990 | Accuracy: 99.80%
√âpoch 12 | Loss Promedio: 0.02707 | Accuracy: 99.80%
√âpoch 13 | Loss Promedio: 0.02477 | Accuracy: 99.80%
√âpoch 14 | Loss Promedio: 0.02190 | Accuracy: 99.90%
√âpoch 15 | Loss Promedio: 0.02073 | Accuracy: 99.90%
√âpoch 16 | Loss Promedio: 0.02053 | Accuracy: 99.80%
√âpoch 17 | Loss Promedio: 0.01785 | Accuracy: 99.90%
√âpoch 18 | Loss Promedio: 0.01588 | Accuracy: 99.90%
√âpoch 19 | Loss Promedio: 0.01584 | 

In [7]:
print("As√≠ se ven tus par√°metros entrenados:")
print(modelo.state_dict().keys())
# Ver√°s algo como: 'capa1.weight', 'capa1.bias', etc.

As√≠ se ven tus par√°metros entrenados:
odict_keys(['capa1.weight', 'capa1.bias', 'capa2.weight', 'capa2.bias', 'salida.weight', 'salida.bias'])


In [8]:
torch.save(modelo.state_dict(), "modelo_casas_vip.pth")
print("¬°Modelo guardado en el disco!")

¬°Modelo guardado en el disco!


In [9]:
# --- TU C√ìDIGO CORREGIDO ---
torch.save(modelo.state_dict(), "mi_mejor_modelo.pth")

nuevo_modelo = HouseModel()
checkpoint = torch.load("mi_mejor_modelo.pth") 
nuevo_modelo.load_state_dict(checkpoint)

# Correcci√≥n aqu√≠: usamos la variable que acabas de crear
nuevo_modelo.eval() 

# --- LO QUE NO ENTEND√çAS (LA PRUEBA DE FUEGO) ---
# Usamos el tensor de la casa de prueba (120m2, 10 a√±os...)
# Asumimos que 'casa_tensor' todav√≠a existe en tu memoria del ejercicio anterior.
# Si no, recuerda: era la casa de 160.000 USD (que ES VIP).

with torch.no_grad():
    # 1. Pasamos la casa por el modelo NUEVO
    logits = nuevo_modelo(casa_tensor)
    
    # 2. Convertimos a probabilidad (0 a 1)
    probabilidad = torch.sigmoid(logits)

print(f"Probabilidad de ser VIP: {probabilidad.item():.4f}")
# Si el modelo aprendi√≥ bien, esto deber√≠a ser muy cercano a 1.0 (ej: 0.99)

Probabilidad de ser VIP: 0.9958
