In [2]:
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split


In [3]:
# Cargar el dataset iris
iris = load_iris()
X, y = iris.data, iris.target

# Dividir el dataset en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Normalizar los datos de entrada
X_train = X_train / np.max(X_train)
X_test = X_test / np.max(X_train)


In [4]:
#Paso 3: Definir las funciones de activación y la función de pérdida
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return sigmoid(x) * (1 - sigmoid(x))

def softmax(x):
    e_x = np.exp(x - np.max(x))
    return e_x / np.sum(e_x, axis=1, keepdims=True)

def cross_entropy(y_true, y_pred):
    return -np.mean(y_true * np.log(y_pred))


In [5]:
#Inicializar los parámetros de la red neuronal
#input size representa el número de características en los datos de entrada. 
input_size = X_train.shape[1]
hidden_size = 5
output_size = len(np.unique(y_train))

#W1 es una matriz de pesos que conecta las neuronas de la capa de entrada con las neuronas de la capa oculta.
W1 = np.random.randn(input_size, hidden_size)
b1 = np.zeros(hidden_size)
#W2 es una matriz de pesos que conecta las neuronas de la capa oculta con las neuronas de la capa de salida
W2 = np.random.randn(hidden_size, output_size)
b2 = np.zeros(output_size)


In [14]:
#Entrenar la red neuronal
learning_rate = 0.1
epochs = 1000

for epoch in range(epochs):
    # Forward propagation
    z1 = np.dot(X_train, W1) + b1
    a1 = sigmoid(z1)
    z2 = np.dot(a1, W2) + b2
    a2 = softmax(z2)

    # Backpropagation
    d2 = a2 - np.eye(output_size)[y_train]
    dW2 = np.dot(a1.T, d2)
    db2 = np.sum(d2, axis=0)
    d1 = np.dot(d2, W2.T) * sigmoid_derivative(z1)
    dW1 = np.dot(X_train.T, d1)
    db1 = np.sum(d1, axis=0)

    # Actualizar los parámetros
    W2 -= learning_rate * dW2
    b2 -= learning_rate * db2
    W1 -= learning_rate * dW1
    b1 -= learning_rate * db1

    # Calcular la pérdida en cada epoch
    loss = cross_entropy(np.eye(output_size)[y_train], a2)
    if epoch % 100 == 0:
        print(f"Epoch {epoch}: Loss = {loss:.4f}")

print("Entrenamiento finalizado.")


Epoch 0: Loss = 1.3205
Epoch 100: Loss = 1.2883
Epoch 200: Loss = 0.4662
Epoch 300: Loss = 0.3638
Epoch 400: Loss = 0.3688
Epoch 500: Loss = 0.4016
Epoch 600: Loss = 0.3813
Epoch 700: Loss = 0.3756
Epoch 800: Loss = 0.3971
Epoch 900: Loss = 0.3764
Entrenamiento finalizado.


In [15]:
#Evaluar el rendimiento del modelo en el conjunto de prueba


# Forward propagation en el conjunto de prueba
z1_test = np.dot(X_test, W1) + b1
a1_test = sigmoid(z1_test)
z2_test = np.dot(a1_test, W2) + b2
a2_test = softmax(z2_test)

# Obtener las predicciones
predictions = np.argmax(a2_test, axis=1)

# Calcular la exactitud
accuracy = np.mean(predictions == y_test)
print(f"Exactitud en el conjunto de prueba: {accuracy}")



Exactitud en el conjunto de prueba: 0.36666666666666664
