In [10]:
from tensorflow.keras.datasets import boston_housing
(train_data, train_targets), (test_data, test_targets) = boston_housing.load_data()

In [5]:
train_data.shape, test_data.shape
# SOn muy pocos datos, 404 para entrenar y 102 para testeo

((404, 13), (102, 13))

In [13]:
train_data[0]
# Cada sample es un vector con 13 características...
# such as per capita crime rate, average number of rooms per dwelling, accessibility to highways, and so on.

array([  1.23247,   0.     ,   8.14   ,   0.     ,   0.538  ,   6.142  ,
        91.7    ,   3.9769 ,   4.     , 307.     ,  21.     , 396.9    ,
        18.72   ])

In [12]:
train_targets[0]  # es como el precio, en miles de dólares

15.2

In [14]:
# Problema... las componentes de train_data tienen rango muy dispares!!!
# Se suele normalizar: para cada feature we subtract the mean of the feature and divide by the standard deviation,
# so that the feature is centered around 0 and has a unit standard deviation. This is easily done in NumPy.

In [17]:
import numpy as np
def normalize(datos: np.ndarray) -> np.ndarray:
    mean = datos.mean(axis=0)  # para que haga la media de cada columna!!! de cada una de las 13 características
    std = datos.std(axis=0)  # es el vector con las desviaciones estándar de cada columna
    datos -= mean  # nos centra en la media, cada columna con su media
    datos /= std
    return datos

In [18]:
train_data = normalize(train_data)
test_data = normalize(test_data)

In [20]:
train_data[0]  # el mismo sample que mostramos antes, totalmente normalizado!!

array([-0.27224633, -0.48361547, -0.43576161, -0.25683275, -0.1652266 ,
       -0.1764426 ,  0.81306188,  0.1166983 , -0.62624905, -0.59517003,
        1.14850044,  0.44807713,  0.8252202 ])

In [22]:
from tensorflow import keras
from tensorflow.keras import layers

In [23]:
# Necesitaremos instanciar el modelo varias veces, así que crearemos con una función
def build_model():
    model = keras.Sequential([
        layers.Dense(64, activation="relu"),
        layers.Dense(64, activation="relu"),
        layers.Dense(1)
    ])
    model.compile(optimizer="rmsprop", loss="mse", metrics=["mae"])
    return model

In [24]:
# Observar que la capa de salida no tiene activación... esto es normal en los modelos de regresión
# por ejemplo, si utilizamo sigmoide estaríamos restringiendo entre 0 y 1, etc
# El error usado es mse: mean squared error, clásico en estos problemas de regresión!!
# Como métrica usaremos mae, mean absolute error (por ejemplo, si fuera 0.5 significaría un error absoluto de 500 dólares)