In [1]:
import numpy as np
import pandas as pd

In [4]:
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Derivada de la función sigmoide
def sigmoid_derivada(x):
    return x * (1 - x)

# Lectura del conjunto de datos Iris
datos_iris = pd.read_csv('iris.csv')
datos_iris.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target
0,5.1,3.5,1.4,0.2,0
1,4.9,3.0,1.4,0.2,0
2,4.7,3.2,1.3,0.2,0
3,4.6,3.1,1.5,0.2,0
4,5.0,3.6,1.4,0.2,0


In [10]:
# Normalización de los datos
datos = datos_iris.iloc[:, :-1]
datos = (datos - datos.mean()) / datos.std()

# Agregamos una columna de unos para el sesgo
datos['sesgo'] = 1

# Convertimos los datos a matriz numpy
X = datos.values

# Etiquetas (target)
y = datos_iris['target'].values
datos.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),sesgo
0,-0.897674,1.015602,-1.335752,-1.311052,1
1,-1.1392,-0.131539,-1.335752,-1.311052,1
2,-1.380727,0.327318,-1.392399,-1.311052,1
3,-1.50149,0.097889,-1.279104,-1.311052,1
4,-1.018437,1.24503,-1.335752,-1.311052,1


In [11]:
# Definición de parámetros
tamano_entrada = X.shape[1] #número de columnas de X
tamano_salida = 3  # 3 clases en el conjunto de datos Iris
tamano_oculta1 = 6 #capa1
tamano_oculta2 = 5 #capa2
tasa_aprendizaje = 0.4
epocas = 1000

In [13]:
# Inicialización de pesos
np.random.seed(37)
pesos_entrada_oculta1 = np.random.rand(tamano_entrada, tamano_oculta1)
pesos_oculta1_oculta2 = np.random.rand(tamano_oculta1, tamano_oculta2)
pesos_oculta2_salida = np.random.rand(tamano_oculta2, tamano_salida)

#mostrar todas las filas y columnas
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

In [14]:
# Entrenamiento de la red neuronal
for epoca in range(epocas):
    # Forward pass (producto punto y activación)
    entrada_oculta1 = np.dot(X, pesos_entrada_oculta1)
    salida_oculta1 = sigmoid(entrada_oculta1)

    entrada_oculta2 = np.dot(salida_oculta1, pesos_oculta1_oculta2)
    salida_oculta2 = sigmoid(entrada_oculta2)

    entrada_salida = np.dot(salida_oculta2, pesos_oculta2_salida)
    salida_final = sigmoid(entrada_salida)

    # Calcular el error
    error = y.reshape(-1, 1) - salida_final
    #print('Error:',error)

    # Backpropagation (errores y actualización de pesos)
    delta_salida = error * sigmoid_derivada(salida_final)
    error_oculta2 = delta_salida.dot(pesos_oculta2_salida.T)
    delta_oculta2 = error_oculta2 * sigmoid_derivada(salida_oculta2)
    error_oculta1 = delta_oculta2.dot(pesos_oculta1_oculta2.T)
    delta_oculta1 = error_oculta1 * sigmoid_derivada(salida_oculta1)

    # Actualizar pesos
    pesos_oculta2_salida += salida_oculta2.T.dot(delta_salida) * tasa_aprendizaje
    pesos_oculta1_oculta2 += salida_oculta1.T.dot(delta_oculta2) * tasa_aprendizaje
    pesos_entrada_oculta1 += X.T.dot(delta_oculta1) * tasa_aprendizaje

    # Imprimir la pérdida
    if (epoca + 1) % 10 == 0:
        perdida = np.mean(np.abs(error))
        print(f'Época {epoca + 1}, Pérdida: {perdida}')

# Predicciones
predicciones = np.argmax(salida_final, axis=1)

# Imprimir las predicciones
resultados = pd.DataFrame({
    'Etiqueta Real': y,
    'Predicción': predicciones
})

print(resultados)

Época 10, Pérdida: 0.6665181363013186
Época 20, Pérdida: 0.6664855969294157
Época 30, Pérdida: 0.6664291267045401
Época 40, Pérdida: 0.6663025948352586
Época 50, Pérdida: 0.665740770342608
Época 60, Pérdida: 0.6650562430459482
Época 70, Pérdida: 0.6613658191758346
Época 80, Pérdida: 0.6665573661352631
Época 90, Pérdida: 0.6665385230174319
Época 100, Pérdida: 0.666509937768656
Época 110, Pérdida: 0.6664608182740267
Época 120, Pérdida: 0.6663550827555051
Época 130, Pérdida: 0.6659617109731896
Época 140, Pérdida: 0.6659303204326468
Época 150, Pérdida: 0.6665960939083009
Época 160, Pérdida: 0.666590706198271
Época 170, Pérdida: 0.6665843203741035
Época 180, Pérdida: 0.6665766127655279
Época 190, Pérdida: 0.6665670965702362
Época 200, Pérdida: 0.6665550009186917
Época 210, Pérdida: 0.666539021226035
Época 220, Pérdida: 0.6665167444068005
Época 230, Pérdida: 0.666483112533543
Época 240, Pérdida: 0.6664253112724514
Época 250, Pérdida: 0.6662983066780686
Época 260, Pérdida: 0.6657622516604907
