# Distinguir si un número es mayor o menor que 0.5

* una sola neuronal
* sin librerias

In [26]:
import random
import math

# --- Función de activación y su derivada ---
# La función sigmoide no es lineal, su pendiente cambia según el valor de z:
# Cuando z es muy positivo, la sigmoide está cerca de 1 y su pendiente es casi 0
# Cuando z está cerca de 0, la pendiente es máxima (~0.25)
# Cuando z es muy negativo, la pendiente es casi 0
def sigmoid(x):
    return 1 / (1 + math.exp(-x))

# sigmoid_derivative(y_predicho) devuelve la pendiente (la derivada) de la función sigmoide en el punto actual de salida.
# Al multiplicar esa pendiente por el error (la diferencia entre la salida deseada y la salida real), 
# obtenemos el tamaño y dirección adecuados para ajustar los pesos.
def sigmoid_derivative(output):
    return output * (1 - output)

# --- Inicialización ---
peso = random.uniform(-1, 1)
sesgo = random.uniform(-1, 1)
tasa_aprendizaje = 0.1

# --- Datos de entrenamiento ---
entradas = [i / 10 for i in range(0, 21)]  # 0.0 hasta 2.0
etiquetas = [1 if x > 1.0 else 0 for x in entradas]

# --- Entrenamiento ---
for epoca in range(1000):
    perdida_total = 0
    for x, y_esperado in zip(entradas, etiquetas):
        
        # Forward
        z = x * peso + sesgo # Calcula la combinación lineal de la entrada. suma ponderada
        y_predicho = sigmoid(z) # Aplica la función sigmoide para que la salida esté entre 0 y 1 (como probabilidad).

        # Error
        error = y_esperado - y_predicho # si esperabas 1 y predijo 0.8, el error es 0.2.
        # Calcula el error cuadrático medio
        perdida_total += error**2  

        # Backpropagation - Esto calcula cuánto hay que ajustar los parámetros (peso y sesgo):
        # Mide el impacto del error en el nodo, ajustado según la curva sigmoide.
        # La derivada de la función sigmoide mide cuánto cambia la salida si cambiamos la entrada z un poquito.
        # - Si la pendiente es grande (sigmoide no saturada), el delta será mayor, y los pesos se actualizarán más.
        # - Si la pendiente es pequeña (sigmoide saturada), el delta será pequeño, y los pesos casi no cambiarán 
        #   (la neurona ya está “segura” de su respuesta).
        delta = error * sigmoid_derivative(y_predicho)
        grad_peso = delta * x # Cuánto debe cambiar el peso para reducir el error.
        grad_sesgo = delta # Cuánto debe cambiar el sesgo.

        # Actualización - Ajusta los parámetros usando descenso del gradiente:
        # El peso y el sesgo se mueven en la dirección que disminuye el error.
        peso += tasa_aprendizaje * grad_peso
        sesgo += tasa_aprendizaje * grad_sesgo

    if epoca % 100 == 0:
        print(f"Época {epoca} - Pérdida total: {perdida_total:.4f}")

# --- Pruebas ---
print("\nPruebas:")
for x in [0.5, 1.0, 1.1, 1.5, 2.0]:
    salida = sigmoid(x * peso + sesgo)
    pred = round(salida)
    print(f"x = {x:.1f} → {'Mayor' if pred == 1 else 'Menor o igual'} que 1")


Época 0 - Pérdida total: 5.1570
Época 100 - Pérdida total: 1.4348
Época 200 - Pérdida total: 1.0796
Época 300 - Pérdida total: 0.9226
Época 400 - Pérdida total: 0.8277
Época 500 - Pérdida total: 0.7618
Época 600 - Pérdida total: 0.7123
Época 700 - Pérdida total: 0.6731
Época 800 - Pérdida total: 0.6410
Época 900 - Pérdida total: 0.6140

Pruebas:
x = 0.5 → Menor o igual que 1
x = 1.0 → Menor o igual que 1
x = 1.1 → Mayor que 1
x = 1.5 → Mayor que 1
x = 2.0 → Mayor que 1


In [28]:
peso, sesgo

(6.478086950061453, -6.723905117048442)