In [7]:
import matplotlib.pyplot as plt
from matplotlib import cm
from matplotlib.ticker import LinearLocator
import numpy as np

# Definir la función de pérdida
def loss_func(theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    return -np.sin(R)

# Definir el gradiente de la función de pérdida
def evaluate_gradient(loss_func, x_train, y_train, theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    grad_x = -np.cos(R) * (x / R)
    grad_y = -np.cos(R) * (y / R)
    return np.array([grad_x, grad_y])

# Gradiente descendente
def gd(theta, x_train, y_train, loss_func, epochs, eta):
    for i in range(epochs):
        gradient = evaluate_gradient(loss_func, x_train, y_train, theta)
        theta -= eta * gradient
        # theta = theta - eta * gradient
    return theta, gradient

# Parámetros iniciales
theta_init = np.array([2.0, 2.0])  # Puedes elegir cualquier punto inicial
eta = 0.1  # Tasa de aprendizaje
epochs = 10000  # Número de iteraciones

# Ejecutar gradiente descendente
theta_final, gradient_final = gd(theta_init, None, None, loss_func, epochs, eta)
print(f"El punto mínimo aproximado es: {theta_final}")

El punto mínimo aproximado es: [1.11072073 1.11072073]


In [4]:
# Definir la función de pérdida
def loss_func(theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    return -np.sin(R)

# Definir el gradiente de la función de pérdida
def evaluate_gradient(loss_func, x, y, theta):
    R = np.sqrt(x**2 + y**2)
    grad_x = -np.cos(R) * (x / R)
    grad_y = -np.cos(R) * (y / R)
    return np.array([grad_x, grad_y])

# Gradiente descendente estocástico
def sgd(theta, data_train, loss_func, epochs, eta):
    for i in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos en cada época
        for example in data_train:
            x, y = example
            gradient = evaluate_gradient(loss_func, x, y, theta)
            theta = theta - eta * gradient  # Actualizar los parámetros con el gradiente
    return theta, gradient

# Generar datos de entrenamiento (pueden ser puntos aleatorios en el plano)
n_points = 100
x_train = np.random.uniform(-6.5, 6.5, n_points)
y_train = np.random.uniform(-6.5, 6.5, n_points)
data_train = list(zip(x_train, y_train))  # Crear pares de datos (x, y)

# Parámetros iniciales
theta_init = np.array([2.0, 2.0])  # Punto inicial
eta = 0.01  # Tasa de aprendizaje inicial
epochs = 10000  # Número de épocas

# Ejecutar el SGD
theta_final, gradient_final = sgd(theta_init, data_train, loss_func, epochs, eta)
print(f"El punto mínimo aproximado es: {theta_final}")

El punto mínimo aproximado es: [818.02419645 574.35032942]


In [5]:
# Definir la función de pérdida
def loss_func(theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    return -np.sin(R)

# Definir el gradiente de la función de pérdida
def evaluate_gradient(loss_func, x, y, theta):
    R = np.sqrt(x**2 + y**2)
    grad_x = -np.cos(R) * (x / R)
    grad_y = -np.cos(R) * (y / R)
    return np.array([grad_x, grad_y])

# RMSprop
def rmsprop(theta, data_train, loss_func, epochs, eta=0.001, decay=0.9, epsilon=1e-8):
    E_g2 = np.zeros_like(theta)  # Inicializar E[g^2] en cero
    for epoch in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos
        for example in data_train:
            x, y = example
            gradient = evaluate_gradient(loss_func, x, y, theta)
            
            # Actualizar el promedio del cuadrado del gradiente
            E_g2 = decay * E_g2 + (1 - decay) * gradient**2
            
            # Actualizar los parámetros usando RMSprop
            theta -= eta / (np.sqrt(E_g2) + epsilon) * gradient
            
    return theta

# Generar datos de entrenamiento (pueden ser puntos aleatorios en el plano)
n_points = 100
x_train = np.random.uniform(-6.5, 6.5, n_points)
y_train = np.random.uniform(-6.5, 6.5, n_points)
data_train = list(zip(x_train, y_train))  # Crear pares de datos (x, y)

# Parámetros iniciales
theta_init = np.array([2.0, 2.0])  # Punto inicial
epochs = 10000  # Número de épocas

# Ejecutar RMSprop
theta_final = rmsprop(theta_init, data_train, loss_func, epochs)
print(f"El punto mínimo aproximado es: {theta_final}")

El punto mínimo aproximado es: [ 134.35457131 -198.87527003]


In [6]:
# Definir la función de pérdida
def loss_func(theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    return -np.sin(R)

# Definir el gradiente de la función de pérdida
def evaluate_gradient(loss_func, x, y, theta):
    R = np.sqrt(x**2 + y**2)
    grad_x = -np.cos(R) * (x / R)
    grad_y = -np.cos(R) * (y / R)
    return np.array([grad_x, grad_y])

# Algoritmo Adam
def adam(theta, data_train, loss_func, epochs, alpha=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8):
    m = np.zeros_like(theta)  # Inicializar el momento de primer orden
    v = np.zeros_like(theta)  # Inicializar el momento de segundo orden
    t = 0  # Inicializar el contador de iteraciones

    for epoch in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos
        for example in data_train:
            x, y = example
            t += 1  # Incrementar el contador
            gradient = evaluate_gradient(loss_func, x, y, theta)

            # Actualizar los momentos de primer y segundo orden
            m = beta1 * m + (1 - beta1) * gradient
            v = beta2 * v + (1 - beta2) * (gradient**2)

            # Corrección de sesgo para momentos de primer y segundo orden
            m_hat = m / (1 - beta1**t)
            v_hat = v / (1 - beta2**t)

            # Actualización de los parámetros
            theta -= alpha * m_hat / (np.sqrt(v_hat) + epsilon)

    return theta

# Generar datos de entrenamiento (pueden ser puntos aleatorios en el plano)
n_points = 100
x_train = np.random.uniform(-6.5, 6.5, n_points)
y_train = np.random.uniform(-6.5, 6.5, n_points)
data_train = list(zip(x_train, y_train))  # Crear pares de datos (x, y)

# Parámetros iniciales
theta_init = np.array([2.0, 2.0])  # Punto inicial
epochs = 10000  # Número de épocas

# Ejecutar Adam
theta_final = adam(theta_init, data_train, loss_func, epochs)
print(f"El punto mínimo aproximado es: {theta_final}")

El punto mínimo aproximado es: [104.72907941  10.62512374]


In [5]:
import matplotlib.pyplot as plt
from matplotlib import cm
from matplotlib.ticker import LinearLocator
import numpy as np

# Definir la función de pérdida
def loss_func(theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    return -np.sin(R)

# Definir el gradiente de la función de pérdida
def evaluate_gradient(loss_func, theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    grad_x = -np.cos(R) * (x / R)
    grad_y = -np.cos(R) * (y / R)
    return np.array([grad_x, grad_y])

# Gradiente descendente
def gd(theta, loss_func, epochs, eta):
    for i in range(epochs):
        gradient = evaluate_gradient(loss_func, theta)
        theta -= eta * gradient
    return theta, gradient

# Gradiente descendente estocástico
def sgd(theta, data_train, loss_func, epochs, eta):
    for i in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos en cada época
        for example in data_train:
            x, y = example
            gradient = evaluate_gradient(loss_func, np.array([x, y]))
            theta -= eta * gradient  # Actualizar los parámetros con el gradiente
    return theta, gradient

# RMSprop
def rmsprop(theta, data_train, loss_func, epochs, eta=0.001, decay=0.9, epsilon=1e-8):
    E_g2 = np.zeros_like(theta)  # Inicializar E[g^2] en cero
    for epoch in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos
        for example in data_train:
            x, y = example
            gradient = evaluate_gradient(loss_func, np.array([x, y]))
            # Actualizar el promedio del cuadrado del gradiente
            E_g2 = decay * E_g2 + (1 - decay) * gradient**2
            # Actualizar los parámetros usando RMSprop
            theta -= eta / (np.sqrt(E_g2) + epsilon) * gradient
    return theta

# Algoritmo Adam
def adam(theta, data_train, loss_func, epochs, alpha=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8):
    m = np.zeros_like(theta)  # Inicializar el momento de primer orden
    v = np.zeros_like(theta)  # Inicializar el momento de segundo orden
    t = 0  # Inicializar el contador de iteraciones
    for epoch in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos
        for example in data_train:
            x, y = example
            t += 1  # Incrementar el contador
            gradient = evaluate_gradient(loss_func, np.array([x, y]))
            # Actualizar los momentos de primer y segundo orden
            m = beta1 * m + (1 - beta1) * gradient
            v = beta2 * v + (1 - beta2) * (gradient**2)
            # Corrección de sesgo para momentos de primer y segundo orden
            m_hat = m / (1 - beta1**t)
            v_hat = v / (1 - beta2**t)
            # Actualización de los parámetros
            theta -= alpha * m_hat / (np.sqrt(v_hat) + epsilon)
    return theta

# Distancia desde el origen
def calcular_distancia(theta):
    return np.sqrt(theta[0]**2 + theta[1]**2)

# Generar datos de entrenamiento 
n_points = 100
x_train = np.random.uniform(-6.5, 6.5, n_points)
y_train = np.random.uniform(-6.5, 6.5, n_points)
data_train = list(zip(x_train, y_train))  # Crear pares de datos (x, y)

# Parámetros iniciales
theta_init = np.array([2.0, 2.0])
epochs = 10000  

# Ejecución de metodos

# Gradient Descent
theta_gd, _ = gd(theta_init.copy(), loss_func, epochs, 0.1)
dist_gd = calcular_distancia(theta_gd)

# Stochastic Gradient Descent
theta_sgd, _ = sgd(theta_init.copy(), data_train, loss_func, epochs, 0.01)
dist_sgd = calcular_distancia(theta_sgd)

# RMSProp
theta_rmsprop = rmsprop(theta_init.copy(), data_train, loss_func, epochs)
dist_rmsprop = calcular_distancia(theta_rmsprop)

# Adam
theta_adam = adam(theta_init.copy(), data_train, loss_func, epochs)
dist_adam = calcular_distancia(theta_adam)

# Crear la tabla de resultados
resultados = {
    "Método": ["Gradient Descent", "SGD", "RMSProp", "Adam"],
    "Distancia al origen": [dist_gd, dist_sgd, dist_rmsprop, dist_adam]
}

df_resultados = pd.DataFrame(resultados)

# Determinar el mejor método (menor distancia)
mejor_metodo = df_resultados.loc[df_resultados['Distancia al origen'].idxmin()]

# Mostrar resultados
print(df_resultados)
print(f"El mejor método es: {mejor_metodo['Método']} con una distancia de {mejor_metodo['Distancia al origen']:.4f}")

             Método  Distancia al origen
0  Gradient Descent             1.570796
1               SGD           673.212525
2           RMSProp           129.494524
3              Adam           132.366176
El mejor método es: Gradient Descent con una distancia de 1.5708


In [None]:
# Definir la función de pérdida
def loss_func(theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    return -np.sin(R)

# Definir el gradiente de la función de pérdida
def evaluate_gradient(loss_func, theta):
    x, y = theta
    R = np.sqrt(x**2 + y**2)
    grad_x = -np.cos(R) * (x / R)
    grad_y = -np.cos(R) * (y / R)
    return np.array([grad_x, grad_y])

# Gradiente descendente
def gd(theta, loss_func, epochs, eta):
    for i in range(epochs):
        gradient = evaluate_gradient(loss_func, theta)
        theta -= eta * gradient
    return theta, gradient

# Gradiente descendente estocástico
def sgd(theta, data_train, loss_func, epochs, eta):
    for i in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos en cada época
        for example in data_train:
            x, y = example
            gradient = evaluate_gradient(loss_func, np.array([x, y]))
            theta -= eta * gradient  # Actualizar los parámetros con el gradiente
    return theta, gradient

# RMSprop
def rmsprop(theta, data_train, loss_func, epochs, eta=0.001, decay=0.9, epsilon=1e-8):
    E_g2 = np.zeros_like(theta)  # Inicializar E[g^2] en cero
    for epoch in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos
        for example in data_train:
            x, y = example
            gradient = evaluate_gradient(loss_func, np.array([x, y]))
            # Actualizar el promedio del cuadrado del gradiente
            E_g2 = decay * E_g2 + (1 - decay) * gradient**2
            # Actualizar los parámetros usando RMSprop
            theta -= eta / (np.sqrt(E_g2) + epsilon) * gradient
    return theta

# Algoritmo Adam
def adam(theta, data_train, loss_func, epochs, alpha=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8):
    m = np.zeros_like(theta)  # Inicializar el momento de primer orden
    v = np.zeros_like(theta)  # Inicializar el momento de segundo orden
    t = 0  # Inicializar el contador de iteraciones
    for epoch in range(epochs):
        np.random.shuffle(data_train)  # Barajar los datos
        for example in data_train:
            x, y = example
            t += 1  # Incrementar el contador
            gradient = evaluate_gradient(loss_func, np.array([x, y]))
            # Actualizar los momentos de primer y segundo orden
            m = beta1 * m + (1 - beta1) * gradient
            v = beta2 * v + (1 - beta2) * (gradient**2)
            # Corrección de sesgo para momentos de primer y segundo orden
            m_hat = m / (1 - beta1**t)
            v_hat = v / (1 - beta2**t)
            # Actualización de los parámetros
            theta -= alpha * m_hat / (np.sqrt(v_hat) + epsilon)
    return theta

# Distancia desde el origen
def calcular_distancia(theta):
    return np.sqrt(theta[0]**2 + theta[1]**2)

# Generar datos de entrenamiento 
n_points = 100
x_train = np.random.uniform(-6.5, 6.5, n_points)
y_train = np.random.uniform(-6.5, 6.5, n_points)
data_train = list(zip(x_train, y_train))  # Crear pares de datos (x, y)

# Parámetros iniciales
theta_init = np.array([2.0, 2.0])
epochs = 100

n_simulaciones = 50  # Número de simulaciones
resultados_simulaciones = []

for _ in range(n_simulaciones):
    # Ejecutar cada método
    theta_gd, _ = gd(theta_init.copy(), loss_func, epochs, 0.1)
    dist_gd = calcular_distancia(theta_gd)

    theta_sgd, _ = sgd(theta_init.copy(), data_train, loss_func, epochs, 0.01)
    dist_sgd = calcular_distancia(theta_sgd)

    theta_rmsprop = rmsprop(theta_init.copy(), data_train, loss_func, epochs)
    dist_rmsprop = calcular_distancia(theta_rmsprop)

    theta_adam = adam(theta_init.copy(), data_train, loss_func, epochs)
    dist_adam = calcular_distancia(theta_adam)

    # Guardar resultados en cada simulación
    distancias = [dist_gd, dist_sgd, dist_rmsprop, dist_adam]
    mejor_metodo_idx = np.argmin(distancias)
    resultados_simulaciones.append(mejor_metodo_idx)

df_frecuencias = pd.DataFrame(resultados_simulaciones, columns=["Mejor Método"])

df_frecuencias["Mejor Método"] = df_frecuencias["Mejor Método"].map({
    0: "Gradient Descent",
    1: "SGD",
    2: "RMSProp",
    3: "Adam"
})

# Tabla de frecuencias absolutas y relativas
tabla_frecuencias = df_frecuencias["Mejor Método"].value_counts().reset_index()
tabla_frecuencias.columns = ["Método", "Frecuencia Absoluta"]
tabla_frecuencias["Frecuencia Relativa"] = tabla_frecuencias["Frecuencia Absoluta"] / n_simulaciones

print(tabla_frecuencias)