In [1]:
%load_ext autoreload
%autoreload 2

import warnings
warnings.filterwarnings('ignore')

# Função 3

In [2]:
from sympy import symbols

variaveis = list(symbols('x_1 x_2'))

print("Variáveis da função 3:")
display(variaveis)

Variáveis da função 3:


[x_1, x_2]

In [3]:
x_1, x_2 = variaveis

f_x = (x_1**2 + x_2 - 11)**2 + (x_1 + x_2**2 - 7)**2

print("Função 3:")
display(f_x)

Função 3:


(x_1 + x_2**2 - 7)**2 + (x_1**2 + x_2 - 11)**2

In [4]:
from algoritmos import calcula_gradiente

grad_f_x = calcula_gradiente(f_x, variaveis)

print("Vetor gradiente da função 3:")
display(grad_f_x)

Vetor gradiente da função 3:


[4*x_1*(x_1**2 + x_2 - 11) + 2*x_1 + 2*x_2**2 - 14,
 2*x_1**2 + 4*x_2*(x_1 + x_2**2 - 7) + 2*x_2 - 22]

In [5]:
from algoritmos import calcula_hessiana

hess_f_x = calcula_hessiana(f_x, variaveis)

print("Matriz Hessiana da função 3:")
display(hess_f_x)

Matriz Hessiana da função 3:


Matrix([
[12*x_1**2 + 4*x_2 - 42,          4*x_1 + 4*x_2],
[         4*x_1 + 4*x_2, 4*x_1 + 12*x_2**2 - 26]])

In [6]:
# TODO: Estudo da função: pontos críticos, convexidade, existência de ponto(s) ótimo(s), além de plotar sua função, etc.

## Estudo da função

A função 3 é a função de Himmelblau. Ela é utilizada para testar algoritmos de otimização, pois possui vários mínimos locais. A função é dada por:

$$f(x, y) = (x^2 + y - 11)^2 + (x + y^2 - 7)^2$$

A função tem quatro mínimos locais:

$$f(3, 2) = 0$$
$$f(-2.805118, 3.131312) = 0$$
$$f(-3.779310, -3.283186) = 0$$
$$f(3.584428, -1.848126) = 0$$


In [7]:
import numpy as np
import plotly.graph_objects as go

x = np.linspace(-6, 6, 200)
y = np.linspace(-6, 6, 200)
X, Y = np.meshgrid(x, y)
Z = (X**2 + Y - 11)**2 + (X + Y**2 - 7)**2

fig = go.Figure()

fig.add_trace(go.Surface(
    z=Z,
    x=X,
    y=Y,
    colorscale=[
        [0.0, 'blue'],
        [0.003, 'cyan'],
        [0.05, 'yellow'],
        [0.07, 'orange'],
        [1.0, 'red']
    ],
    colorbar=dict(title="Valores")
))

fig.update_layout(
    title="Função 3",
    scene=dict(
        xaxis_title='X-axis',
        yaxis_title='Y-axis',
        zaxis_title='Z-axis'
    ),
    width=800,
    height=800
)

fig.show()


In [8]:
fig = go.Figure()

fig.add_trace(go.Contour(
    z=Z,
    x=x,
    y=y,
    colorscale=[
        [0.0, 'blue'],
        [0.003, 'cyan'],
        [0.05, 'yellow'],
        [0.07, 'orange'],
        [1.0, 'red']
    ],
    colorbar=dict(title="Valores"),
    contours=dict(
        start=0,
        end=np.max(Z),
        size=10
    )
))

fig.update_layout(
    title="Curvas de Nível da Função 3",
    xaxis_title='X-axis',
    yaxis_title='Y-axis',
    width=800,
    height=800
)

fig.show()

In [9]:
from algoritmos import metodo_do_gradiente, metodo_de_newton, metodo_de_quase_newton
import pandas as pd
import numpy as np

df = pd.DataFrame(columns=['Método', 'Gamma', 'Eta', 'Iterações', 'Iterações Armijo', 'Ponto otimo'])

ponto = np.array([4, 3])

results = []

for gamma in [0.1, 0.25, 0.5, 0.9]:
    for eta in [0.1, 0.25, 0.5, 0.9]:
        ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_do_gradiente(f_x, grad_f_x, variaveis, ponto, gamma, eta)

        results.append({
            'Método': 'Gradiente',
            'Gamma': gamma,
            'Eta': eta,
            'Iterações': n_iteracoes,
            'Iterações Armijo': n_iteracoes_armijo,
            'Ponto otimo': ponto_otimo,
        })

        ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_de_newton(f_x, grad_f_x, hess_f_x, variaveis, ponto, gamma, eta)

        results.append({
            'Método': 'Newton',
            'Gamma': gamma,
            'Eta': eta,
            'Iterações': n_iteracoes,
            'Iterações Armijo': n_iteracoes_armijo,
            'Ponto otimo': ponto_otimo,
        })

        ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_de_quase_newton(f_x, len(variaveis), grad_f_x, variaveis, ponto, gamma, eta, metodo='bfgs')

        results.append({
            'Método': 'Quase Newton (BFGS)',
            'Gamma': gamma,
            'Eta': eta,
            'Iterações': n_iteracoes,
            'Iterações Armijo': n_iteracoes_armijo,
            'Ponto otimo': ponto_otimo,
        })

        ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_de_quase_newton(f_x, len(variaveis), grad_f_x, variaveis, ponto, gamma, eta, metodo='dfp')

        results.append({
            'Método': 'Quase Newton (DFP)',
            'Gamma': gamma,
            'Eta': eta,
            'Iterações': n_iteracoes,
            'Iterações Armijo': n_iteracoes_armijo,
            'Ponto otimo': ponto_otimo,
        })

df = pd.concat([df, pd.DataFrame(results)], ignore_index=True)

Método do Gradiente:   5%|▌         | 54/1000 [00:00<00:06, 141.07it/s]
Método de Newton:   0%|          | 5/1000 [00:00<00:03, 251.48it/s]
Método de Quase Newton (bfgs):   1%|          | 8/1000 [00:00<00:04, 237.42it/s]
Método de Quase Newton (dfp): 100%|██████████| 1000/1000 [00:03<00:00, 286.80it/s]
Método do Gradiente:   5%|▌         | 54/1000 [00:00<00:06, 141.95it/s]
Método de Newton:   0%|          | 5/1000 [00:00<00:03, 253.48it/s]
Método de Quase Newton (bfgs):   1%|          | 8/1000 [00:00<00:04, 236.37it/s]
Método de Quase Newton (dfp):  45%|████▍     | 449/1000 [00:01<00:02, 266.88it/s]
Método do Gradiente:   6%|▌         | 61/1000 [00:00<00:06, 135.32it/s]
Método de Newton:   0%|          | 5/1000 [00:00<00:03, 251.20it/s]
Método de Quase Newton (bfgs):   1%|          | 12/1000 [00:00<00:04, 233.96it/s]
Método de Quase Newton (dfp):  74%|███████▍  | 740/1000 [00:02<00:01, 254.01it/s]
Método do Gradiente:  61%|██████▏   | 613/1000 [00:05<00:03, 111.11it/s]
Método de Newton

In [10]:
df.to_csv('resultados_funcao_3.csv', index=False)

In [11]:
df = pd.read_csv('resultados_funcao_3.csv')

df_gradiente = df[df['Método'] == 'Gradiente'].sort_values(by='Iterações', ascending=True).head(1)
df_newton = df[df['Método'] == 'Newton'].sort_values(by='Iterações', ascending=True).head(1)
df_quase_newton_bfgs = df[df['Método'] == 'Quase Newton (BFGS)'].sort_values(by='Iterações', ascending=True).head(1)
df_quase_newton_dfp = df[df['Método'] == 'Quase Newton (DFP)'].sort_values(by='Iterações', ascending=True).head(1)

df_top3 = pd.concat([df_gradiente, df_newton, df_quase_newton_bfgs, df_quase_newton_dfp])
df_top3.to_csv('resultados_funcao_3_top3.csv', index=False)

## Melhores hiperparâmetros

In [12]:
df_top3

Unnamed: 0,Método,Gamma,Eta,Iterações,Iterações Armijo,Ponto otimo
36,Gradiente,0.5,0.25,19,130,[3. 2.00000001]
1,Newton,0.1,0.1,5,5,[3. 2.]
2,Quase Newton (BFGS),0.1,0.1,8,12,[2.99999999 2. ]
55,Quase Newton (DFP),0.9,0.25,26,189,[3. 2.]


In [13]:
import numpy as np
import pandas as pd

colunas = ['Algoritmo', 'Ponto inicial', '# de iteracoes', '# de cham. de armijo', 'Ponto otimo', 'Valor otimo', 'Erro de aproximação', 'Tempo de exec (s)']
df_base = pd.DataFrame(columns=colunas)

pontos = [
  np.array([3.1, 1.95]),
  np.array([-2.78, 3.15]),
  np.array([-3.75, -3.25]),
  np.array([3.55, -1.82]),
  np.array([4, 3]),
  np.array([5, -5]),
  np.array([1, 2]),
  np.array([3, 1]),
  np.array([9, 1]),
  np.array([22, 11]),
  np.array([5.5, 10]),
]

print("Pontos a serem testados:")
display(pontos)

Pontos a serem testados:


[array([3.1 , 1.95]),
 array([-2.78,  3.15]),
 array([-3.75, -3.25]),
 array([ 3.55, -1.82]),
 array([4, 3]),
 array([ 5, -5]),
 array([1, 2]),
 array([3, 1]),
 array([9, 1]),
 array([22, 11]),
 array([ 5.5, 10. ])]

### Gradiente

In [14]:
from algoritmos import metodo_do_gradiente
from utils import substitui_variaveis_funcao, substitui_variaveis_gradiente
import time

df_gradiente = df_base.copy()

for ponto in pontos:
    tic = time.time()
    ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_do_gradiente(f_x, grad_f_x, variaveis, ponto, gamma=0.5, eta=0.25)
    tac = time.time()
    valor_otimo = substitui_variaveis_funcao(f_x, variaveis, ponto_otimo)
    erro_aproximacao = np.linalg.norm(substitui_variaveis_gradiente(grad_f_x, variaveis, ponto_otimo))
    df_gradiente = pd.concat([df_gradiente, pd.DataFrame([['gradiente', ponto, n_iteracoes, n_iteracoes_armijo, ponto_otimo, valor_otimo, erro_aproximacao, tac - tic]], columns=colunas)])

df_gradiente

Método do Gradiente:   2%|▏         | 20/1000 [00:00<00:14, 65.62it/s]
Método do Gradiente:   1%|          | 11/1000 [00:00<00:15, 63.23it/s]
Método do Gradiente:   1%|          | 10/1000 [00:00<00:16, 60.08it/s]
Método do Gradiente:   3%|▎         | 27/1000 [00:00<00:15, 63.16it/s]
Método do Gradiente:   2%|▏         | 19/1000 [00:00<00:14, 65.77it/s]
Método do Gradiente:   3%|▎         | 31/1000 [00:00<00:15, 63.21it/s]
Método do Gradiente:   2%|▏         | 23/1000 [00:00<00:14, 67.79it/s]
Método do Gradiente:   2%|▏         | 24/1000 [00:00<00:14, 69.09it/s]
Método do Gradiente:   2%|▎         | 25/1000 [00:00<00:16, 57.53it/s]
Método do Gradiente:   2%|▏         | 24/1000 [00:00<00:15, 63.73it/s]
Método do Gradiente:   2%|▏         | 22/1000 [00:00<00:18, 52.36it/s]


Unnamed: 0,Algoritmo,Ponto inicial,# de iteracoes,# de cham. de armijo,Ponto otimo,Valor otimo,Erro de aproximação,Tempo de exec (s)
0,gradiente,"[3.1, 1.95]",20,135,"[3.0000000099124478, 1.9999999912962914]",3.1978210642471003e-15,5.6791e-07,0.306121
0,gradiente,"[-2.78, 3.15]",11,77,"[-2.805118087569019, 3.1313125108820907]",2.20201041509781e-15,5.95604e-07,0.175209
0,gradiente,"[-3.75, -3.25]",10,75,"[-3.7793102558172786, -3.2831859995235844]",2.7718459325733102e-15,6.598754e-07,0.167715
0,gradiente,"[3.55, -1.82]",27,192,"[3.5844283341170793, -1.8481265178957504]",2.8371806804942604e-15,6.288718e-07,0.42866
0,gradiente,"[4, 3]",19,130,"[3.0000000033316625, 2.000000011242811]",3.3086578301370902e-15,6.509366e-07,0.290132
0,gradiente,"[5, -5]",31,221,"[3.584428331900417, -1.8481265148806534]",5.1567908950606805e-15,8.523928e-07,0.491637
0,gradiente,"[1, 2]",23,154,"[3.0000000156771622, 1.9999999741877288]",1.23269999012397e-14,8.56003e-07,0.340663
0,gradiente,"[3, 1]",24,161,"[3.0000000044088084, 1.999999978879007]",6.440460411457631e-15,6.372359e-07,0.348693
0,gradiente,"[9, 1]",25,170,"[2.99999999989359, 1.9999999851568175]",3.77744932771447e-15,5.91361e-07,0.435537
0,gradiente,"[22, 11]",24,168,"[2.999999989794349, 2.0000000177843127]",5.60052689165113e-15,5.657464e-07,0.37858


### Newton

In [15]:
from algoritmos import metodo_de_newton
df_newton = df_base.copy()

for ponto in pontos:
    tic = time.time()
    ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_de_newton(f_x, grad_f_x, hess_f_x, variaveis, ponto, gamma=0.1, eta=0.1)
    tac = time.time()
    valor_otimo = substitui_variaveis_funcao(f_x, variaveis, ponto_otimo)
    erro_aproximacao = np.linalg.norm(substitui_variaveis_gradiente(grad_f_x, variaveis, ponto_otimo))
    df_newton = pd.concat([df_newton, pd.DataFrame([['newton', ponto, n_iteracoes, n_iteracoes_armijo, ponto_otimo, valor_otimo, erro_aproximacao, tac - tic]], columns=colunas)])

display(df_newton)

Método de Newton:   0%|          | 3/1000 [00:00<00:05, 187.39it/s]
Método de Newton:   0%|          | 3/1000 [00:00<00:05, 178.42it/s]
Método de Newton:   0%|          | 3/1000 [00:00<00:05, 186.79it/s]
Método de Newton:   0%|          | 3/1000 [00:00<00:05, 181.98it/s]
Método de Newton:   0%|          | 5/1000 [00:00<00:04, 237.03it/s]
Método de Newton:   1%|          | 7/1000 [00:00<00:04, 241.67it/s]
Método de Newton: 100%|██████████| 1000/1000 [00:03<00:00, 259.85it/s]
Método de Newton:   1%|          | 10/1000 [00:00<00:04, 231.40it/s]
Método de Newton:   1%|          | 7/1000 [00:00<00:04, 207.87it/s]
Método de Newton:   1%|          | 9/1000 [00:00<00:04, 230.11it/s]
Método de Newton:   1%|          | 8/1000 [00:00<00:04, 212.43it/s]


Unnamed: 0,Algoritmo,Ponto inicial,# de iteracoes,# de cham. de armijo,Ponto otimo,Valor otimo,Erro de aproximação,Tempo de exec (s)
0,newton,"[3.1, 1.95]",3,3,"[3.000000000067341, 1.9999999999809384]",1.48291343352411e-19,4.654728e-09,0.01712
0,newton,"[-2.78, 3.15]",3,3,"[-2.805118086952746, 3.1313125182505734]",6.32350718816689e-29,9.34461e-14,0.017908
0,newton,"[-3.75, -3.25]",3,3,"[-3.7793102533777527, -3.283185991286182]",6.84894554545366e-27,9.952626e-13,0.017173
0,newton,"[3.55, -1.82]",3,3,"[3.5844283403305206, -1.848126526964662]",9.71662652666075e-25,7.483389e-12,0.017595
0,newton,"[4, 3]",5,5,"[2.9999999999980784, 2.0000000000088414]",1.12568665687103e-21,2.644513e-10,0.022333
0,newton,"[5, -5]",7,7,"[3.584428340330501, -1.8481265269645064]",1.53206963443139e-25,2.962516e-12,0.029977
0,newton,"[1, 2]",1000,17941,"[0.7690103098123604, 2.3591685265398334]",65.2363617534944,34.37275,3.849592
0,newton,"[3, 1]",10,11,"[2.9999999999990274, 2.000000000004409]",2.79694071013221e-22,1.314551e-10,0.044972
0,newton,"[9, 1]",7,7,"[3.584428340330525, -1.8481265269646685]",1.02584193655595e-24,7.715108e-12,0.035472
0,newton,"[22, 11]",9,9,"[3.000000006502036, 1.9999999971181803]",1.33065859051745e-15,4.247259e-07,0.040632


### Quase-Newton

In [16]:
from algoritmos import metodo_de_quase_newton

df_quase_newton = df_base.copy()

for metodo in [
    ('bfgs', { 'gamma': 0.1, 'eta': 0.1 }),
    ('dfp', { 'gamma': 0.9, 'eta': 0.25 })
]:
    for ponto in pontos:
        tic = time.time()
        ponto_otimo, n_iteracoes, n_iteracoes_armijo = metodo_de_quase_newton(f_x, len(variaveis), grad_f_x, variaveis, ponto, gamma=metodo[1]['gamma'], eta=metodo[1]['eta'], metodo=metodo[0])
        tac = time.time()
        valor_otimo = substitui_variaveis_funcao(f_x, variaveis, ponto_otimo)
        erro_aproximacao = np.linalg.norm(substitui_variaveis_gradiente(grad_f_x, variaveis, ponto_otimo))
        df_quase_newton = pd.concat([df_quase_newton, pd.DataFrame([[f'quase-newtown ({metodo[0]})', ponto, n_iteracoes, n_iteracoes_armijo, ponto_otimo, valor_otimo, erro_aproximacao, tac - tic]], columns=colunas)])

display(df_quase_newton)

Método de Quase Newton (bfgs):   1%|          | 6/1000 [00:00<00:05, 175.31it/s]
Método de Quase Newton (bfgs):   0%|          | 5/1000 [00:00<00:05, 179.84it/s]
Método de Quase Newton (bfgs):   0%|          | 5/1000 [00:00<00:05, 191.65it/s]
Método de Quase Newton (bfgs):   0%|          | 5/1000 [00:00<00:05, 186.31it/s]
Método de Quase Newton (bfgs):   1%|          | 8/1000 [00:00<00:04, 228.47it/s]
Método de Quase Newton (bfgs): 100%|██████████| 1000/1000 [00:03<00:00, 283.37it/s]
Método de Quase Newton (bfgs):   1%|          | 10/1000 [00:00<00:04, 214.52it/s]
Método de Quase Newton (bfgs):   1%|          | 10/1000 [00:00<00:04, 235.96it/s]
Método de Quase Newton (bfgs):   1%|          | 11/1000 [00:00<00:10, 97.61it/s]
Método de Quase Newton (bfgs):   2%|▏         | 22/1000 [00:00<00:03, 252.35it/s]
Método de Quase Newton (bfgs):   2%|▏         | 16/1000 [00:00<00:04, 229.18it/s]
Método de Quase Newton (dfp):   7%|▋         | 73/1000 [00:00<00:09, 101.97it/s]
Método de Quase Newto

Unnamed: 0,Algoritmo,Ponto inicial,# de iteracoes,# de cham. de armijo,Ponto otimo,Valor otimo,Erro de aproximação,Tempo de exec (s)
0,quase-newtown (bfgs),"[3.1, 1.95]",6,10,"[3.000000000001234, 2.0000000000032907]",3.21695859194437e-22,2.081999e-10,0.035882
0,quase-newtown (bfgs),"[-2.78, 3.15]",5,9,"[-2.8051180903967516, 3.1313125216008433]",8.21581092677958e-16,3.439868e-07,0.028843
0,quase-newtown (bfgs),"[-3.75, -3.25]",5,9,"[-3.779310252685666, -3.283185992300646]",9.30823783741761e-17,1.542817e-07,0.02718
0,quase-newtown (bfgs),"[3.55, -1.82]",5,9,"[3.5844283428702375, -1.8481265257879411]",3.7899305322814e-16,2.792093e-07,0.027703
0,quase-newtown (bfgs),"[4, 3]",8,12,"[2.9999999930021395, 2.000000000203774]",1.78407811459043e-15,5.307093e-07,0.035972
0,quase-newtown (bfgs),"[5, -5]",1000,17917,"[3.3930484402702112, -0.30965576323356653]",12.3688350360029,6.387817,3.529853
0,quase-newtown (bfgs),"[1, 2]",10,15,"[2.999999999976977, 1.9999999815918337]",5.76912575923728e-15,7.273933e-07,0.047878
0,quase-newtown (bfgs),"[3, 1]",10,13,"[3.0000000016814767, 1.9999999985399786]",9.175090187455221e-17,9.656549e-08,0.043714
0,quase-newtown (bfgs),"[9, 1]",11,16,"[3.584428338302486, -1.8481265258818969]",2.17414831983092e-16,2.057456e-07,0.114429
0,quase-newtown (bfgs),"[22, 11]",22,29,"[2.999999999790633, 2.0000000005553336]",4.53923007729687e-18,1.533476e-08,0.08846


## Tabela geral

In [17]:
df_all = pd.concat([df_gradiente, df_newton, df_quase_newton])
df_all

Unnamed: 0,Algoritmo,Ponto inicial,# de iteracoes,# de cham. de armijo,Ponto otimo,Valor otimo,Erro de aproximação,Tempo de exec (s)
0,gradiente,"[3.1, 1.95]",20,135,"[3.0000000099124478, 1.9999999912962914]",3.1978210642471003e-15,5.6791e-07,0.306121
0,gradiente,"[-2.78, 3.15]",11,77,"[-2.805118087569019, 3.1313125108820907]",2.20201041509781e-15,5.95604e-07,0.175209
0,gradiente,"[-3.75, -3.25]",10,75,"[-3.7793102558172786, -3.2831859995235844]",2.7718459325733102e-15,6.598754e-07,0.167715
0,gradiente,"[3.55, -1.82]",27,192,"[3.5844283341170793, -1.8481265178957504]",2.8371806804942604e-15,6.288718e-07,0.42866
0,gradiente,"[4, 3]",19,130,"[3.0000000033316625, 2.000000011242811]",3.3086578301370902e-15,6.509366e-07,0.290132
0,gradiente,"[5, -5]",31,221,"[3.584428331900417, -1.8481265148806534]",5.1567908950606805e-15,8.523928e-07,0.491637
0,gradiente,"[1, 2]",23,154,"[3.0000000156771622, 1.9999999741877288]",1.23269999012397e-14,8.56003e-07,0.340663
0,gradiente,"[3, 1]",24,161,"[3.0000000044088084, 1.999999978879007]",6.440460411457631e-15,6.372359e-07,0.348693
0,gradiente,"[9, 1]",25,170,"[2.99999999989359, 1.9999999851568175]",3.77744932771447e-15,5.91361e-07,0.435537
0,gradiente,"[22, 11]",24,168,"[2.999999989794349, 2.0000000177843127]",5.60052689165113e-15,5.657464e-07,0.37858
