Una red neuronal es un modelo matemático que está inspirado en el cerebro humano y que se utiliza para resolver problemas complejos de clasificación, reconocimiento de patrones y predicción. Está compuesta por múltiples capas de unidades de procesamiento llamadas neuronas, que se interconectan entre sí y se entrenan para reconocer patrones en los datos de entrada y producir una salida deseada. Las redes neuronales se han utilizado en una variedad de aplicaciones, desde la visión por computadora hasta el procesamiento del lenguaje natural y la robótica.

In [106]:
# Carga de las librerias 
import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, LabelEncoder

# Cargar el conjunto de datos precios de las casas
url ='https://raw.githubusercontent.com/ywchiu/riii/master/data/house-prices.csv'
df = pd.read_csv(url)


In [None]:
df.info()

In [None]:
df.head(5)

In [109]:
# Eliminar las columnas "Home" , "Offers" y "Brick" ya que no aportan al modelo 
df.drop(['Home'], axis=1, inplace=True)

In [114]:
df['Neighborhood'].unique()

array([0, 1, 2])

In [115]:
df['Brick'].unique()

array([0, 1])

In [112]:
# Transformar la columna "Neighborhood" a numérica
encoder = LabelEncoder()
df['Brick'] = encoder.fit_transform(df['Brick'])

# asi tambien se puede
neighborhood_map = {'East': 0, 'North': 1, 'West': 2}
df['Neighborhood'] = df['Neighborhood'].map(neighborhood_map)


In [None]:
#df.describe()
df.head(5)

In [None]:
# Calcular la matriz de correlación
corr_matrix = df.corr()
# Imprimir la matriz de correlación
# esto determina si las variables son importantes para que el modelo haga la prediccion 
print(corr_matrix)

In [118]:
url ='https://raw.githubusercontent.com/ywchiu/riii/master/data/house-prices.csv'
df = pd.read_csv(url)
# Eliminar columnas innecesarias
df = df.drop(columns=['Home', 'Offers'])
# Transformar variable Neighborhood a numérica
df['Neighborhood'] = pd.factorize(df['Neighborhood'])[0]
df['Brick'] = pd.factorize(df['Brick'])[0]

In [None]:
#df.describe()
df.head(5)

In [None]:
df.info()

In [121]:
# Separar variables independientes y dependiente
y = df['Price']
X = df.drop(columns=['Price'])

In [None]:
X.head(5)
#y.head(5)

In [123]:
# Dividir conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
#se utiliza para establecer una semilla (seed) aleatoria para la generación de números aleatorios
#Al establecer una semilla aleatoria, se garantiza que la selección aleatoria de muestras será la misma cada vez que se ejecute el código
#con el datset de entrenamiento
# Normalizar variables de entrada
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

In [124]:
# Definir arquitectura del modelo de red neuronal
#Se crea un modelo secuencial vacío al que se le pueden agregar capas. esto seria similar a lo que vimos en la pagina de demo
model = Sequential()
#Se agrega una capa densa (Dense) a la red neuronal con 64 neuronas (nodos) y se especifica que la entrada a 
#esta capa tiene 4 dimensiones. Además, se utiliza la función de activación ReLU (Rectified Linear Unit), 
#que es una función no lineal que se utiliza para introducir no linealidad en la red neuronal.
model.add(Dense(64, input_dim=5, activation='relu'))
#Se agrega otra capa densa a la red neuronal con 32 neuronas y se utiliza la función de activación ReLU.
model.add(Dense(32, activation='relu'))
#Se agrega una última capa densa a la red neuronal con una sola neurona que produce la salida de la red. 
model.add(Dense(1, activation='linear'))
#la arquitectura definida consta de dos capas ocultas (con 64 y 32 neuronas, respectivamente) y una 
#capa de salida con una sola neurona y una función de activación lineal. La activación ReLU se utiliza 
#en las dos capas ocultas para introducir no linealidad en la red neuronal
# Compilar modelo
model.compile(loss='mean_squared_error', optimizer='adam')

In [137]:
# Entrenar modelo
#X_train: el conjunto de datos de entrenamiento de las variables independientes (features), que es una matriz de tamaño (número de ejemplos de entrenamiento, número de características).
#y_train: el conjunto de datos de entrenamiento de la variable dependiente (target), que es una matriz de tamaño (número de ejemplos de entrenamiento, 1).
#epochs: el número de épocas (iteraciones) que se utilizarán para entrenar el modelo.
#batch_size: el tamaño del lote (batch) que se utilizará para el entrenamiento. Es decir, el número de ejemplos que se utilizarán en cada paso de actualización de pesos durante el entrenamiento.
#verbose: un parámetro opcional que indica la cantidad de información que se mostrará durante el entrenamiento. 
#Un valor de 0 significa que no se mostrará ninguna información durante el entrenamiento, mientras que un valor de 1 o superior significa que se mostrará información sobre el progreso del entrenamiento.

model.fit(X_train, y_train, epochs=1000, batch_size=64, verbose=0)

# Evaluar modelo en conjunto de entrenamiento
mset = model.evaluate(X_train, y_train)
print("El error cuadrático medio en el conjunto de entrenamiento es:", round(mset, 2))

# Evaluar modelo en conjunto de prueba
mse = model.evaluate(X_test, y_test)
print("El error cuadrático medio en el conjunto de prueba es:", round(mse, 2))

El error cuadrático medio en el conjunto de entrenamiento es: 104808520.0
El error cuadrático medio en el conjunto de prueba es: 193013568.0


In [138]:
# Guardar modelo
#El formato de archivo .h5 es una extensión de archivo que se utiliza para guardar y almacenar modelos de redes neuronales en Keras
model.save('house_prices_model.h5')
print("Modelo guardado correctamente como house_prices_model.h5")

Modelo guardado correctamente como house_prices_model.h5


In [139]:
from keras.models import load_model
# Cargar el modelo entrenado
model = load_model('house_prices_model.h5')

In [140]:
# Obtener los valores de entrada del usuario
sqft = float(input("Ingresa los pies cuadrados (SqFt) de la casa: "))
bedrooms = int(input("Ingresa el número de habitaciones (Bedrooms) de la casa: "))
bathrooms = int(input("Ingresa el número de baños (Bathrooms) de la casa: "))
neighborhood = int(input("Ingresa el número de region de la zona (Neighborhood) de la casa: "))
brick = int(input("Ingresa si la casa es de ladrillo (Brick) : "))


Ingresa los pies cuadrados (SqFt) de la casa: 2850
Ingresa el número de habitaciones (Bedrooms) de la casa: 3
Ingresa el número de baños (Bathrooms) de la casa: 1
Ingresa el número de region de la zona (Neighborhood) de la casa: 3
Ingresa si la casa es de ladrillo (Brick) : 0


In [141]:
# Normalizar los valores de entrada
scaler = StandardScaler()
X = np.array([[sqft, bedrooms, bathrooms,neighborhood,brick]])
X = scaler.fit_transform(X)

In [148]:
# Realizar la predicción con el modelo
y_pred = model.predict(X)
# Imprimir la predicción
print("El precio de la casa es: ${:,.2f}".format(y_pred[0,0]))
#print("\033[1m\033[31mEl precio de la casa es: ${:,.2f} dólares\033[0m".format(y_pred[0,0]))




[1m[31mEl precio de la casa es: $107,754.84 dólares[0m
