
# Predicción de Precios de Viviendas con Regresión Lineal y Redes Neuronales

Este notebook implementa modelos de regresión lineal y redes neuronales para predecir precios de viviendas utilizando el dataset de California Housing. Incluye una introducción teórica, configuración del entorno, desarrollo del modelo y análisis de resultados.


In [None]:

print("📌 ¿Qué es una red neuronal artificial?")
print("Una red neuronal artificial es un modelo de aprendizaje automático inspirado en el cerebro humano. Se compone de nodos (neuronas) conectados en capas, capaces de aprender patrones complejos.")

print("\n📌 ¿Qué es una regresión lineal?")
print("La regresión lineal es una técnica estadística para predecir un valor numérico (Y) a partir de otra variable (X), bajo una relación lineal: Y = aX + b.")

print("\n📌 ¿Para qué sirve TensorFlow/Keras?")
print("TensorFlow es un framework para computación numérica. Keras es una interfaz que permite crear y entrenar redes neuronales de forma sencilla sobre TensorFlow.")

print("\n📌 ¿Por qué usar GitHub?")
print("GitHub permite versionar tu código, trabajar en equipo, documentar tu proyecto y guardar respaldos en la nube.")


## Preparación del entorno

In [None]:

!pip install -q tensorflow keras matplotlib numpy pandas scikit-learn


In [None]:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import tensorflow as tf
from tensorflow import keras


## Cargar y explorar dataset

In [None]:

data = fetch_california_housing()
X = pd.DataFrame(data.data, columns=data.feature_names)
y = pd.Series(data.target, name="MedHouseValue")

print("🔍 Primeras filas del dataset:")
display(X.head())
print("Objetivo (target):")
display(y.head())


## Regresión Lineal Simple

In [None]:

X_simple = X[['AveRooms']]
X_train, X_test, y_train, y_test = train_test_split(X_simple, y, test_size=0.2, random_state=42)

modelo_lineal = LinearRegression()
modelo_lineal.fit(X_train, y_train)
y_pred_lineal = modelo_lineal.predict(X_test)

mse_lineal = mean_squared_error(y_test, y_pred_lineal)
print(f"MSE de regresión lineal: {mse_lineal:.4f}")

plt.figure(figsize=(6, 4))
plt.scatter(X_test, y_test, color='gray', label='Datos reales', alpha=0.5)
plt.plot(X_test, y_pred_lineal, color='red', label='Predicción')
plt.xlabel('AveRooms')
plt.ylabel('Precio (MedHouseValue)')
plt.title('Regresión Lineal Simple')
plt.legend()
plt.grid(True)
plt.show()


## Red Neuronal con TensorFlow/Keras

In [None]:

X_train_full, X_test_full, y_train_full, y_test_full = train_test_split(X, y, test_size=0.2, random_state=42)

modelo_nn = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=(X.shape[1],)),
    keras.layers.Dense(32, activation='relu'),
    keras.layers.Dense(1)
])

modelo_nn.compile(optimizer='adam', loss='mse')
historial = modelo_nn.fit(X_train_full, y_train_full, epochs=10, validation_split=0.2, verbose=1)

y_pred_nn = modelo_nn.predict(X_test_full).flatten()

plt.figure(figsize=(6, 4))
plt.scatter(y_test_full, y_pred_nn, alpha=0.5, label='Predicción')
plt.plot([0, 5], [0, 5], 'r', label='Ideal')
plt.xlabel('Valor Real')
plt.ylabel('Predicción')
plt.title('Red Neuronal - Predicción vs Real')
plt.legend()
plt.grid(True)
plt.show()


## Análisis de errores y estructuras de control

In [None]:

errores = abs(y_test_full - y_pred_nn)
errores_altos = []
umbral = 1.0

for i, error in enumerate(errores):
    if error > umbral:
        errores_altos.append({'index': i, 'error': float(error)})

print(f"📊 Casos con error mayor a {umbral}: {len(errores_altos)}")
errores_altos[:5]
