<a href="https://colab.research.google.com/github/felipedram/xf-models-analysis/blob/master/trabalho_final.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

[Funções para teste](http://delta.cs.cinvestav.mx/~ccoello/EMOO/testfuncs/)<br>
[Documentação basin-hopping](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.basinhopping.html#scipy.optimize.basinhopping)<br>
[Documentação minimize](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.minimize.html)<br>
[Basin-Hopping Paper](https://arxiv.org/pdf/cond-mat/9803344.pdf)<br>
[Stochastic Gradient Descent Towards Data Science](https://towardsdatascience.com/gradient-descent-in-python-a0d07285742f)<br>
[Stochastic Gradient Descent](https://www.pyimagesearch.com/2016/10/17/stochastic-gradient-descent-sgd-with-python/)
[StatQuest Gradient Descent](https://www.youtube.com/watch?v=sDv4f4s2SB8)<br>
[StatQuest Stochastic Gradient Descent](https://www.youtube.com/watch?v=vMh0zPT0tLI)

Em \cite{Ekel2002} foram introduzidos os modelos $\langle X,R \rangle$ e $\langle X,F \rangle$ como uma forma de lidar com as incertezas inerentes ao processo de tomada de decisão multicritério, utilizando a teoria de conjuntos fuzzy. O primeiro é aplicado a problemas multicritério e, o segundo, a problemas multiobjetivo. Para análise dos modelos, os autores utilizaram a abordagem Bellman-Zadeh, técnicas de relação de preferência *fuzzy* e introduziram o conceito de solução harmoniosa. Nas seções a seguir, vamos explorar o modelo $\langle X,F \rangle$, falando sobre as motivações que levaram a sua proposição, discutindo suas características e exemplificando sua aplicação.

## Introdução

### Otimização multiobjetivo

De maneira bastante rasa, estamos diante de um problema de otimização matemática quando temos uma função $f(X)$ e queremos encontrar o $X$ que *maximiza* ou *minimiza* seu resultado. À essa função, chamamos de Função Objetivo (FO) e, matematicamente, escrevemos

$$
\begin{equation}
    f(X) \rightarrow extr,
\end{equation}
$$
onde extr significa extremo, indicando que queremos levar essa função a um dos extremos (máximo ou mínimo).

Normalmente, esse tipo de problema possui restrições de tal maneira que não pode ser aceito qualquer valor de $X$. Assim, aos valores aceitáveis para $X$, dá-se o nome de conjunto das soluções permissíveis, ou região das soluções factíveis, ou espaço de busca, ou $L$, simplesmente. Dentre os possíveis valores de $X$ ($X \in L$), àquele que leva $f(X)$ ao extemo, chamamos de $X^*$ (alguns autores também chamam de $X^0$).

Agora imagine um problema em que, ao invés de uma, temos algumas (2, 3, 4, ...) FOs. Ou seja, temos um conjunto (ou vetor) $F(X) = \{f_0(X), f_1(X), f_2(X), ...\}$ e queremos encontrar $X^*$. Ou seja, um único $X$ que maximiza (ou minimiza) todas as FOs ao mesmo tempo e que, assim como no primeiro problema, está sujeito a uma série de regras/restrições. Este é um problema de *otimização multiobjetivo* que escrevemos como

$$
\begin{equation}
    F(X) \rightarrow extr \text{.}
\end{equation}
$$

Certamente, encontrar esse $X^*$ não é tarefa fácil, principalmento porque, normalmente, as FOs são conflitantes. Então, que se discutir questões como normalização, princípios de otimalidade e prioridades dos critérios. A solução dessas questões passa por técnicas de escalarização, imposição restrições, método da função utilidade, programação de metas e utilização do princípio da garantia do resultado. Os autores de XX, indicaram como muito importante uma especial atenção para a utiliação do princípio da garantia do resultado, assim como uma lacuna na definição de "solução ótima". Para tratar dessas questões, os autores propuseram a aplicação da abordagem Bellman-Zadeh. Nas seções a seguir vamos implementar e discutir algumas aplicações da abordagem proposta em XX, bem como alguns prós e pontos de atenção para utilização do método.

### Modelo $\langle X,F \rangle$ e a Abordagem de Bellman-Zadeh

Em problemas de otimização multiobjetivo, ou problemas do tipo (2), não existe uma única solução que otimize a todos os objetivos simultaneamente. Nesses casos, falamos em soluções ótimas de Pareto, quando não é mais possível melhorar o valor de uma FO sem degradar o valor das demais, sem acréscimo de novas informações. Essas soluções também são conhecidas como soluções não-dominadas, ótimas de Pareto, Pareto eficientes ou não-inferiores. Todas as soluções da *fronteira de Pareto*, que aqui chamaremos de $\Omega$, são consideradas igualmente boas. Agora, imagine que você é um profissional contratado para resolver um problema de otimização multiobjetivo. O que seu cliente diria se, como resultado de meses de trabalho, você entregasse a ele um conjunto infinito (ou finito incontável) de soluções?

Foi pensando em tratar essa questão, sem descartar a necessidade de se observar todas as outras citadas anteriormente (normalização, otimalidade, etc.), que Ekel propôs o modelo $\langle X,F \rangle$ e a utilização da abordagem Bellman-Zadeh para sua análise. A ideia central da proposta é associar, para cada FO, um número *fuzzy* $\{ X, \mu_{A}(X) \}$. Esse número *fuzzy* funciona como uma "nota" para cada $X \in L$ e indica o grau de pertinência desse $X$ à melhor solução possível para aquela FO --- ou o grau de pertinência de $X$ ao $extr$ daquela FO.

Como função de pertinência, ou seja, para o cálculo dessa nota, Ekel propôs

$$
	\begin{equation}
		\mu_{A_{p}}(X)=\Bigg[\frac{f_p(X)-\underset{X \in L}\min{f_p(X)}}{\underset{X \in L}\max{f_p(X)}-\underset{X \in L}\min{f_p(X)}}\Bigg]
	\end{equation}
$$
para FO a serem maximizadas e
$$
	\begin{equation}
		\mu_{A_{p}}(X)=\Bigg[\frac{\underset{X \in L}\max{f_p(X)}-f_p(X)}{\underset{X \in L}\max{f_p(X)}-\underset{X \in L}\min{f_p(X)}}\Bigg]
	\end{equation}
$$
para FO a serem minimizadas. Ekel também definiu que, dado um vetor $F$ de FOs, seus respectivos $\mu_A$ formam um vetor $\mu_D$.

Dito isso, imagine que temos um problema com 4 FOs. Utilizando a notação de (2), temos: $F(X) = \{f_0(X), f_1(X), f_2(X), f_3(X)\}$ --- vamos começar a contar em zero para nos adequarmos à linguagem Python. Se um ponto $X_i$ qualquer atende às FOs em um nível $\mu_D(X_i) = \{0.3, 0.5, 0.7, 0.4\}$ e outro ponto $X_j$ atende às FOs em um nível $\mu_D(X_j) = \{0.4, 0.5, 0.7, 0.6\}$, podemos dizer que o ponto $X_j$ é uma solução melhor pois o menor nível de pertinência de $X_j$ é maior que o menor nível de pertinência de $X_i$, ou $\min(\mu_D(X_j)) > \min(\mu_D(X_i))$. Olhando dessa forma, fica claro que um problema de otimização multiobjetivo foi transformado em um problema $\max \min$ pois o $X^*$ que buscamos agora é aquele que ofereça um $\mu_D$ cujo menor nível de pertinência é o maior possível. Também podemos dizer que essa forma de representar o problema nos permite resolver um problema multiobjetivo através de algoritmo monoobjetivo pois o algoritmo terá que trabalhar apenas com a função $\max \mu_D$. Isso ficará mais claro durante a iplementação computacional.

#### Implementação computacional

Agora que introduzimos o modelo $\langle X,F \rangle$ e como analisá-lo, vamos fazer uma implementação computacional com dois exemplos. E começaremos por definir uma FO genérica:

In [35]:
import numpy as np

In [37]:
class f(object):
    """
    Função Objetivo genérica
    
    Classe que representa uma FO genérica, para implementação do modelo <X,F>
    """

    def __init__(self, solver, goal, f_max=None, x_max=None, f_min=None, x_min=None):
        self.__solver = solver  # Equação da função
        if goal == "max" or goal == "min":  # Objetivo a ser maximizado ou minimizado
            self.__goal = goal
        else:
            raise Exception("goal deve ser 'max' ou 'min'.")
        self.__f_max = f_max  # Valoes a serem calculados para mu
        self.__x_max = x_max
        self.__f_min = f_min
        self.__x_min = x_min

    @property
    def goal(self):
        return self.__goal

    @property
    def f_max(self):
        return self.__f_max

    @f_max.setter
    def f_max(self, f_max):
        self.__f_max = f_max

    @property
    def x_max(self):
        return self.__x_max

    @x_max.setter
    def x_max(self, x_max):
        self.__x_max = x_max

    @property
    def f_min(self):
        return self.__f_min

    @f_max.setter
    def f_min(self, f_min):
        self.__f_min = f_min

    @property
    def x_min(self):
        return self.__x_min

    @x_min.setter
    def x_min(self, x_min):
        self.__x_min = x_min

    def solve(self, x, inv=False):  # Retorna valor da fução para um dado ponto X
        x = np.array(x)
        return self.__solver(x) * -1 if inv else self.__solver(x)

    def mu(self, x):  # Cálculo de mu, conforme definição
        x = np.array(x)
        if self.__goal == "max":
            return (self.solve(x) - self.__f_min) / (self.__f_max - self.__f_min)
        elif self.__goal == "min":
            return (self.__f_max - self.solve(x)) / (self.__f_max - self.__f_min)

**Nota** sobre o método solve: Por que pode ser necessário inverter o valor de $f(X)$?<br>
Quando temos em mãos um algoritmo para minimização mas estamos diante de um objetivo a ser maximizado (ou vice-versa), a seguinte transformação pode ser útil:
$$
    \begin{equation}
        z = \underset{X \in L}{\min} f(X) = -\underset{X \in L}{\max} -f(X)
    \end{equation}
$$

Para um primeiro exemplo, vamos definir também uma FO linear, que é uma FO genérica cuja equação é um produto escalar dos coeficientes pelas variáveis.

In [3]:
class f_linear(f):
    def __init__(self, coefs, goal):
        self.__coefs = np.array(coefs)
        f.__init__(self, lambda x: np.dot(self.__coefs, x), goal)

    @property
    def coefs(self):
        return self.__coefs

Vamos agora tratar de um exemplo: um problema de alocação de recursos com 4 FOs lineares

$$
    \begin{align}
        f_{0}(X)&= 0,06x_0+0,53x_1+0,18x_2+0,18x_3+0,06x_4 \, \rightarrow \, \max \\
        f_{1}(X)&= 25x_0+70x_1+60x_2+95x_3+45x_4 \, \rightarrow \, \max \\
        f_{2}(X)&= 0x_0+32,5x_1+300x_2+120x_3+0x_4 \, \rightarrow \, \min \\
        f_{3}(X)&= 0,1x_0+0,1x_1+0,11x_2+0,35x_3+0,33x_4 \, \rightarrow \, \min
    \end{align}
$$

sujeitas às seguintes restrições

$$
\begin{align}
	0 \leq x_1 & \leq 850 \\
%
	0 \leq x_2 & \leq 220 \\
%
	0 \leq x_3 & \leq 1300 \\
%
	0 \leq x_4 & \leq 1615 \\
%
	0 \leq x_5 & \leq 700 \\
%
	x_1+x_2+x_3+x_4+x_5 & = 3\text{mil}
\end{align}
$$

Criando as funções

In [4]:
f0 = f_linear([0.06, 0.53, 0.18, 0.18, 0.06], "max")
f1 = f_linear([25, 70, 60, 95, 45], "max")
f2 = f_linear([0, 32.5, 300, 120, 0], "min")
f3 = f_linear([0.1, 0.1, 0.11, 0.35, 0.33], "min")

F = [f0, f1, f2, f3]

E as restrições (já conforme o melhor formato para utilização nos algoritmos de otimização disponíveis)

In [5]:
A_eq = np.array([[1, 1, 1, 1, 1]])
b_eq = np.array([3000])
x0_bounds = (0, 850)
x1_bounds = (0, 220)
x2_bounds = (0, 1300)
x3_bounds = (0, 1615)
x4_bounds = (0, 700)

bounds = [x0_bounds, x1_bounds, x2_bounds, x3_bounds, x4_bounds]

In [7]:
from scipy.optimize import linprog
import warnings

for f_ in F:
    res = linprog(f_.coefs * -1, A_eq=A_eq, b_eq=b_eq, bounds=bounds, method='simplex')
    if res.success:
        f_.f_max = -1 * res.fun
        f_.x_max = res.x
    else:
        warnings.warn("Otimização mal sucedida.")

In [34]:
teste = linprog(f1.coefs * -1, A_eq=A_eq, b_eq=b_eq, bounds=bounds, method='simplex')
print(teste)
muD_max([f1], teste.fun*-1)

     con: array([0.])
     fun: -617.0
 message: 'Optimization terminated successfully.'
     nit: 10
   slack: array([], dtype=float64)
  status: 0
 success: True
       x: array([   0.,  220., 1165., 1615.,    0.])


-1.2052471482889735

In [8]:
for f_ in F:
    res = linprog(f_.coefs, A_eq=A_eq, b_eq=b_eq, bounds=bounds, method='simplex')
    if res.success:
        f_.f_min = res.fun
        f_.x_min = res.x
    else:
        warnings.warn("Otimização mal sucedida.")

In [9]:
def muD_min(x):
    x = np.array(x)
    return np.max([f_.mu(x)*-1 for f_ in F])

In [10]:
def basinhopping_bounds(**kwargs):
    x = kwargs["x_new"]
    resp = True
    if np.dot(x, A_eq[0]) != b_eq[0]:
        resp = False
    if x[0] < x0_bounds[0] or x[0] > x0_bounds[1]:
        resp = False
    if x[1] < x1_bounds[0] or x[1] > x1_bounds[1]:
        resp = False
    if x[2] < x2_bounds[0] or x[2] > x2_bounds[1]:
        resp = False
    if x[3] < x3_bounds[0] or x[3] > x3_bounds[1]:
        resp = False
    if x[4] < x4_bounds[0] or x[4] > x4_bounds[1]:
        resp = False
    return resp



cobyla_constraints = [
    {"type": "ineq", "fun": lambda x: x[0]},
    {"type": "ineq", "fun": lambda x: x0_bounds[1] - x[0]},
    {"type": "ineq", "fun": lambda x: x[1]},
    {"type": "ineq", "fun": lambda x: x1_bounds[1] - x[1]},
    {"type": "ineq", "fun": lambda x: x[2]},
    {"type": "ineq", "fun": lambda x: x2_bounds[1] - x[2]},
    {"type": "ineq", "fun": lambda x: x[3]},
    {"type": "ineq", "fun": lambda x: x3_bounds[1] - x[3]},
    {"type": "ineq", "fun": lambda x: x[4]},
    {"type": "ineq", "fun": lambda x: x4_bounds[1] - x[4]},
    {"type": "eq", "fun": lambda x: np.dot(x, A_eq[0]) - b_eq[0]},
]

In [11]:
minimizer_kwargs = {"method": "SLSQP", "constraints": cobyla_constraints}
res1 = opt.basinhopping(
    muD_min,
    f1.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)
res2 = opt.basinhopping(
    muD_min,
    f2.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)
res3 = opt.basinhopping(
    muD_min,
    f3.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)
res4 = opt.basinhopping(
    muD_min,
    f4.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)

In [12]:
print(res1.fun*-1)
print(res2.fun*-1)
print(res3.fun*-1)
print(res4.fun*-1)


0.08500610982317854
0.08423738579101561
0.4984950723433928
0.0023872004855269423


In [13]:
minimizer_kwargs = {"method": "SLSQP", "constraints": cobyla_constraints}
res1 = opt.basinhopping(
    muD_min,
    f1.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)
res2 = opt.basinhopping(
    muD_min,
    f2.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)
res3 = opt.basinhopping(
    muD_min,
    f3.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)
res4 = opt.basinhopping(
    muD_min,
    f4.x_max,
    minimizer_kwargs=minimizer_kwargs,
    accept_test=basinhopping_bounds,
    disp=False,
)

In [14]:
print(res1.fun*-1)
print(res2.fun*-1)
print(res3.fun*-1)
print(res4.fun*-1)

0.08465519106836998
0.08595675218205957
0.001894084639702505
0.35346003581079855


In [15]:
pip install --upgrade pyswarm

Requirement already up-to-date: pyswarm in /Users/feliperamalho/anaconda3/lib/python3.6/site-packages (0.6)
Note: you may need to restart the kernel to use updated packages.


In [16]:
lb = [b[0] for b in bounds]
ub = [b[1] for b in bounds]
cons = [lambda x: np.dot(A_eq, x)-b_eq[0]+0.5, lambda x: np.dot(A_eq, x)-b_eq[0]-0.5]

In [17]:
from pyswarm import pso

xpt, fopt = pso(muD_min, lb, ub, ieqcons=cons)


Stopping search: Swarm best objective change less than 1e-08


In [18]:
print(xpt)
print(fopt*-1)

[ 743.45892574  219.99999983  754.33445721 1037.82238497  333.49547888]
0.5293350161124273


In [23]:
def muD_max(F, x):
    x = np.array(x)
    return np.min([f_.mu(x) for f_ in F])


def possivel_subtrair(posicao, limite, passo):
    return True if posicao - passo >= limite[0] else False


def possivel_adicionar(posicao, limite, passo):
    return True if posicao + passo <= limite[1] else False


def caminha(posicao_origem, passo, subtrair_de, adicionar_em):
    posicao_destino = np.array(posicao_origem)
    posicao_destino[subtrair_de] -= passo
    posicao_destino[adicionar_em] += passo
    return posicao_destino


def passo_e_melhor(F, posicao_origem, posicao_destino):
    return True if muD_max(F, posicao_origem) > muD_max(F, posicao_destino) else False

In [24]:
pos = [ 850.,  220., 1300.,  630.,    0.]
print(muD_max(F, pos))
print(muD_max(F, caminha(pos, 10, 1, 2)))
passo_e_melhor(F, pos, caminha(pos, 10, 1, 2))

0.26356925749023014
0.2573744391373571


True

In [28]:
def heuristica_relogio(F, posicao_inicial, limites, passo=0.5):
    posicao_atual = np.array(posicao_inicial)
    num_vars = len(posicao_atual)
    i = 0
    while i < num_vars:
        j = 0
        while j < num_vars:
            if i != j:
                if possivel_subtrair(posicao_atual[i], limites[i], passo):
                    if possivel_adicionar(posicao_atual[j], limites[j], passo):
                        if passo_e_melhor(F, posicao_atual, caminha(posicao_atual, passo, i, j)):
                            #import pdb; pdb.set_trace()
                            posicao_atual = caminha(posicao_atual, passo, i, j)
                            print("posicao atualizada: {}".format(posicao_atual))
                        else:
                            j += 1
                    else:
                        j += 1
                else:
                    i += 1
                    break
            else:
                j += 1
    return posicao_atual

In [30]:
print(f1.x_max)
print(muD_max(F, f1.x_max))
X = heuristica_relogio(F, f1.x_max, bounds, 10)
print(X)
print(muD_max(F, X))

[   0.  220. 1165. 1615.    0.]
0.08363004776378637
posicao atualizada: [   0.  210. 1175. 1615.    0.]
posicao atualizada: [   0.  200. 1185. 1615.    0.]
posicao atualizada: [   0.  190. 1195. 1615.    0.]
posicao atualizada: [   0.  180. 1205. 1615.    0.]
posicao atualizada: [   0.  170. 1215. 1615.    0.]
posicao atualizada: [   0.  160. 1225. 1615.    0.]
posicao atualizada: [   0.  150. 1235. 1615.    0.]
posicao atualizada: [   0.  140. 1245. 1615.    0.]
posicao atualizada: [   0.  130. 1255. 1615.    0.]
posicao atualizada: [   0.  120. 1265. 1615.    0.]
posicao atualizada: [   0.  110. 1275. 1615.    0.]
posicao atualizada: [   0.  100. 1285. 1615.    0.]
posicao atualizada: [   0.   90. 1295. 1615.    0.]


KeyboardInterrupt: 

In [48]:
class heuristica_relogio(object):
    """Heurística do relógio
    
    Utilizada para problemas do tipo max min com condição de balanço."""

    def __init__(self, F, posicao_inicial, limites, funcao_custo, passo=0.5):
        self.__F = F
        self.__posicao_atual = posicao_inicial
        self.__limites = limites
        self.__funcao_custo = funcao_custo
        self.__passo = passo
        self.__num_vars = len(posicao_inicial)

    def __possivel_subtrair(self, posicao, limite):
        return True if posicao - self.__passo >= limite[0] else False

    def __possivel_adicionar(self, posicao, limite):
        return True if posicao + self.__passo <= limite[1] else False

    def __passo_e_melhor(self, posicao_origem, posicao_destino):
        if self.__funcao_custo(posicao_origem) > self.__funcao_custo(posicao_destino):
            return True
        else:
            return False

    def __caminha(self, posicao_origem, subtrair_de, adicionar_em):
        posicao_destino = posicao_origem[:]
        posicao_destino[subtrair_de] -= self.__passo
        posicao_destino[adicionar_em] += self.__passo
        return posicao_destino

    def __call__(self):
        i = 0
        print(i)
        while i < self.__num_vars:
            j = i + 1
            while j < self.__num_vars:
                if self.__possivel_subtrair(self.__posicao_atual[i], self.__limites[i]):
                    if self.__possivel_adicionar(
                        self.__posicao_atual[j], self.__limites[j]
                    ):
                        if self.__passo_e_melhor(
                            self.__posicao_atual, self.__caminha(posicao_atual, i, j)
                        ):
                            self.__posicao_atual = self.__caminha(posicao_atual, i, j)
                        else:
                            j = j + 1
                    else:
                        j = j + 1
                else:
                    i = i + 1
                    break
        return self.__posicao_atual  # , self.__funcao_custo(self.__posicao_atual)

    # def __call__(self):
    # return self.otimizar

In [49]:
otimizar = heuristica_relogio(F, f1.x_max, bounds, muD_max)

In [50]:
otimizar

<__main__.heuristica_relogio at 0x1021414160>

In [51]:
otimizar.

__main__.heuristica_relogio