## Clasificación

In [1]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Generar datos sintéticos
X, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=2, random_state=42)
#n_features=10: 10 características (o columnas) en los datos.
#n_informative=5: De estas 10 características, 5 son informativas (es decir, tienen impacto en la variable objetivo).
#n_redundant=2: 2 características redundantes (basadas en combinaciones de las características informativas).
#random_state=42: Establece una semilla para hacer los resultados reproducibles.

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear la red neuronal simple (perceptrón)
model = Sequential()
model.add(Dense(1, input_dim=X_train.shape[1], activation='sigmoid'))  # Capa de salida con activación sigmoide

# Compilar el modelo
model.compile(optimizer=Adam(), loss='binary_crossentropy', metrics=['accuracy'])

# Entrenar el modelo
model.fit(X_train, y_train, epochs=100, batch_size=32, verbose=1)




Epoch 1/100


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.4888 - loss: 1.2812   
Epoch 2/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.4888 - loss: 1.2379 
Epoch 3/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.4900 - loss: 1.1958 
Epoch 4/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.4900 - loss: 1.1538 
Epoch 5/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.4963 - loss: 1.1145 
Epoch 6/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5013 - loss: 1.0758 
Epoch 7/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5088 - loss: 1.0390 
Epoch 8/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5163 - loss: 1.0033 
Epoch 9/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x119107d2850>

In [2]:
# Evaluar el modelo
y_pred = (model.predict(X_test) > 0.5).astype("int32")  # Convertir las probabilidades en 0 o 1
accuracy = accuracy_score(y_test, y_pred)

print(f'Precisión del modelo: {accuracy * 100:.2f}%')

[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step 
Precisión del modelo: 84.50%


### Predicción de si un cliente comprará un producto: 
### Supongamos que tienes un conjunto de datos sobre clientes que contiene varias características (edad, ingresos, tiempo en el sitio web, etc.) y quieres predecir si un cliente hará una compra o no. Este es un problema de clasificación binaria, donde el objetivo es predecir si la respuesta es 1 (comprará) o 0 (no comprará).

In [3]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Generar datos sintéticos de clasificación binaria
# Vamos a generar datos donde 1 es "compra" y 0 es "no compra"
X, y = make_classification(n_samples=1000, n_features=5, n_informative=3, n_redundant=1, random_state=42)

# n_features=5: 5 características (por ejemplo, edad, ingresos, tiempo en el sitio, etc.)
# n_informative=3: 3 características informativas (que afectan la compra)
# n_redundant=1: 1 característica redundante (combinación de las informativas)
# random_state=42: para garantizar que los resultados sean reproducibles

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear la red neuronal simple para clasificación binaria
model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))  # Capa oculta con 64 neuronas
model.add(Dense(1, activation='sigmoid'))  # Capa de salida con activación sigmoide para clasificación binaria

# Compilar el modelo
model.compile(optimizer=Adam(), loss='binary_crossentropy', metrics=['accuracy'])

# Entrenar el modelo
model.fit(X_train, y_train, epochs=100, batch_size=32, verbose=1)

# Realizar predicciones con el modelo
y_pred_prob = model.predict(X_test)




Epoch 1/100


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.7138 - loss: 0.6261   
Epoch 2/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8313 - loss: 0.5090 
Epoch 3/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8700 - loss: 0.4259
Epoch 4/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8938 - loss: 0.3635 
Epoch 5/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.9087 - loss: 0.3150 
Epoch 6/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.9112 - loss: 0.2794 
Epoch 7/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.9162 - loss: 0.2532 
Epoch 8/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9137 - loss: 0.2340 
Epoch 9/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━

In [4]:
# Convertir las probabilidades a clases (0 o 1)
y_pred = (y_pred_prob > 0.5).astype(int)

# Calcular la exactitud (accuracy)
accuracy = accuracy_score(y_test, y_pred)

# Imprimir la precisión
print(f'Exactitud del modelo: {accuracy * 100:.2f}%')

Exactitud del modelo: 97.00%


In [5]:
# Supongamos que estas son las características del nuevo cliente
nuevo_cliente = np.array([[30, 50000, 5, 3, 120]])  # Aquí se agrega la 5ta característica

# Normalizar o escalar los datos (si es necesario, dependiendo de cómo fue entrenado el modelo)
# Aquí asumo que el modelo no requirió normalización, pero si lo hizo, debes aplicar el mismo preprocesamiento.

# Realizar la predicción con el modelo
prediccion_prob = model.predict(nuevo_cliente)  # El modelo devolverá una probabilidad

# Convertir la probabilidad a una clase (0 o 1), usando un umbral de 0.5
prediccion = (prediccion_prob > 0.5).astype(int)

# Mostrar el resultado
if prediccion == 1:
    print("El cliente comprará el producto.")
else:
    print("El cliente no comprará el producto.")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 58ms/step
El cliente comprará el producto.


## Regresión

In [6]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_regression
from sklearn.metrics import mean_squared_error

# Generar datos de regresión sintéticos
X, y = make_regression(n_samples=1000, n_features=5, noise=0.1, random_state=42)

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear el modelo de red neuronal simple (con una capa oculta)
model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))  # Capa oculta con 64 neuronas
model.add(Dense(1))  # Capa de salida (sin función de activación para regresión)

# Compilar el modelo
model.compile(optimizer=Adam(), loss='mean_squared_error')

# Entrenar el modelo
model.fit(X_train, y_train, epochs=100, batch_size=32, verbose=1)

Epoch 1/100


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 4271.3608   
Epoch 2/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 4223.9995 
Epoch 3/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 4168.8296 
Epoch 4/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 4098.4771 
Epoch 5/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 4007.1826 
Epoch 6/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 3894.2620 
Epoch 7/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 3755.6775 
Epoch 8/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 3590.4221 
Epoch 9/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 3404.8474 
Epoch 10/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[

<keras.src.callbacks.history.History at 0x11914516fd0>

In [7]:
# Hacer predicciones y evaluar el modelo
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)

print(f'Mean Squared Error (MSE): {mse:.4f}')

[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step 
Mean Squared Error (MSE): 30.9800


### Predecir el precio de una vivienda en función de algunas características, como el tamaño de la casa, el número de habitaciones, la antigüedad de la casa y la distancia al centro de la ciudad.

In [None]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_regression
from sklearn.metrics import mean_squared_error

# Datos sintéticos para la predicción de precios de viviendas
# Generamos 1000 muestras, 4 características (tamaño, habitaciones, antigüedad, distancia al centro)
# El precio se calcula arbitrariamente como una función de las características más algo de ruido

np.random.seed(42)
X = np.random.rand(1000, 4)  # 1000 viviendas, 4 características
X[:, 0] = X[:, 0] * 1000     # Tamaño (m2) entre 0 y 1000
X[:, 1] = (X[:, 1] * 5).astype(int)  # Número de habitaciones entre 0 y 5
X[:, 2] = (X[:, 2] * 50).astype(int) # Edad (años) entre 0 y 50
X[:, 3] = X[:, 3] * 10     # Distancia al centro (km) entre 0 y 10

# Precio de la casa: una función arbitraria de las características (con algo de ruido)
y = X[:, 0] * 300 + X[:, 1] * 20000 - X[:, 2] * 1000 - X[:, 3] * 5000 + np.random.randn(1000) * 20000

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear la red neuronal simple para regresión
model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))  # Capa oculta con 64 neuronas
model.add(Dense(1))  # Capa de salida sin función de activación para predicción continua

# Compilar el modelo
model.compile(optimizer=Adam(), loss='mean_squared_error')

# Entrenar el modelo
model.fit(X_train, y_train, epochs=100, batch_size=32, verbose=1)




In [None]:
# Realizar predicciones
y_pred = model.predict(X_test)

# Calcular la "precisión" con un umbral definido
threshold = 50000  # Definir un umbral de error para la precisión
correct_predictions = np.abs(y_test - y_pred.flatten()) < threshold  # Predicciones dentro del umbral
accuracy = np.mean(correct_predictions)  # Proporción de predicciones correctas

print(f'Precisión del modelo (con umbral de {threshold}): {accuracy * 100:.2f}%')

In [None]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.preprocessing import StandardScaler

# Datos sintéticos para la predicción de precios de viviendas
np.random.seed(42)
X = np.random.rand(1000, 4)  # 1000 viviendas, 4 características
X[:, 0] = X[:, 0] * 1000     # Tamaño (m2) entre 0 y 1000
X[:, 1] = (X[:, 1] * 5).astype(int)  # Número de habitaciones entre 0 y 5
X[:, 2] = (X[:, 2] * 50).astype(int) # Edad (años) entre 0 y 50
X[:, 3] = X[:, 3] * 10     # Distancia al centro (km) entre 0 y 10

# Precio de la casa: una función arbitraria de las características (con algo de ruido)
y = X[:, 0] * 300 + X[:, 1] * 20000 - X[:, 2] * 1000 - X[:, 3] * 5000 + np.random.randn(1000) * 20000

# Normalizar los datos de entrada
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Crear la red neuronal mejorada
model = Sequential()
model.add(Dense(128, input_dim=X_train.shape[1], activation='relu'))  # Capa oculta con 128 neuronas
model.add(Dropout(0.2))  # Regularización con Dropout
model.add(Dense(64, activation='relu'))  # Capa oculta adicional con 64 neuronas
model.add(Dense(1))  # Capa de salida sin función de activación para predicción continua

# Compilar el modelo con una tasa de aprendizaje ajustada
model.compile(optimizer=Adam(learning_rate=0.001), loss='mean_squared_error')

# Entrenar el modelo con más épocas
model.fit(X_train, y_train, epochs=200, batch_size=32, verbose=1)




In [None]:
# Realizar predicciones
y_pred = model.predict(X_test)

# Calcular el coeficiente de determinación R²
r2 = r2_score(y_test, y_pred)
print(f'Coeficiente de determinación R²: {r2}')

In [None]:
# Definir un umbral para la diferencia máxima entre predicción y valor real
threshold = 20000  # Umbral de 10,000 unidades en el precio

# Calcular cuántas predicciones están dentro del umbral
correct_predictions = np.abs(y_test - y_pred.flatten()) < threshold
accuracy_percentage = np.mean(correct_predictions) * 100

print(f'Porcentaje de predicciones dentro del umbral de {threshold}: {accuracy_percentage:.2f}%')