<img src="https://pages.cnpem.br/workshopbioimagens/wp-content/uploads/sites/166/2023/06/logo-ilum-2048x382.png" alt="Descrição da imagem" style="width: 1000px; height: auto; ">

<div style=" padding: 12px; font-size: 35px; text-align: center;">
<strong> A liga ternária leve mais cara do mundo ⛓️: </strong> 
<div style=" padding: 10px; font-size: 34px; text-align: center;">
<strong>Encontrando com algoritmo genético</strong> 

<div style=" padding: 10px; font-size: 17px; text-align: center;">
<strong>Autores:</strong> Ana Luz Pereira Mendes & Maria Emily Nayla Gomes da Silva 
<div style=" padding: 10px; font-size: 17px; text-align: center;">
<strong>Professor:</strong> Daniel R. Cassar

# ⛓️**Liga Ternária**

<div style="background-color: lightblue; font-size: 18px; padding: 10px;">
<div style="text-align: justify"><strong>Objetivo:</strong> Encontre uma liga de três elementos que tenha o maior custo e o menor peso atômico. A liga ternária deve ser da forma x A.y B.z C sendo que x + y + z = 100 g, x ≥ 5 g, y ≥ 5 g, z ≥ 5 g e “A”, “B” e “C” são elementos químicos diferentes. Utilize o preço dado no exercício anterior e peso atômico dados abaixo [3]. Considere que qualquer composto com 3 elementos químicos é chamado de liga. </div>

## 📝 **Introdução**  
Inspirado em evolução natural, algorítimos genéticos surgem como uma ferramenta para problemas de otimização. Seu mecanismo é baseado em gerar populações com várias soluções para o seu problema e evoluir-la ao longo de gerações. Cada indivíduo é visto como um "cromossomo" em que durante uma geração passa por diversos componates: 
- Seleção: escolhe os indivíduos mais aptos para se reproduzirem com base em uma função de avaliação;
- Cruzamento:  combina partes dos pais para gerar novos indivíduos (filhos).
- Mutação: introduz pequenas alterações aleatórias nos indivíduos para manter a diversidade genética da população. 
<div style="text-align: justify">
A atividade da liga ternária, analisando o objetivo, foi atacada, nesse notebook, como um problema de maximização. Onde vamos gerar candidados no formato <code>[Elemento1, Elemento2, Elemento3, Peso1, Peso2, Peso3]</code> , representando os três elementos distintos e suas respectivas quantidades em gramas. Com isso, a função objetivo será valorizar elementos mais pesados e penalizar candidatos com custo mais altos. Assim, abordaremos as diversas funções para a seleção, cruzamento e mutação entendendo essa estrutura escolhida para o candidado.
</div>



## 🔗**Código**

<div style="text-align: justify">
Para a atividade da liga ternária, foram importadas funções de um script de <code>python</code> desenvolvido para adaptar funções utilizadas em problemas de maximização, assim como foram criadas funções específicas para o problema das ligas ternárias — considerando que queremos maximizar a diferença entre o valor da liga e o peso molecular. Essa abordagem é possível, pois buscamos encontrar a liga de maior valor e menor peso atômico; assim, quanto maior o valor da liga e menor o peso atômico, maior será a diferença. Além dessas funções, importou-se a biblioteca <code>random</code> para lidar com as ações probabilísticas do código.
</div>

In [1]:
import random

from funcoes_liga import populacao_ligas as cria_populacao
from funcoes_liga import funcao_objetivo_pop_liga as funcao_objetivo
from funcoes_liga import selecao_torneio_max as funcao_selecao
from funcoes_liga import cruzamento_ordenado_liga as funcao_cruzamento
from funcoes_liga import mutacao_peso_liga as funcao_mutacao1
from funcoes_liga import mutacao_gene_liga as funcao_mutacao2

<div style="text-align: justify">
Para resolver o problema das ligas ternárias, foram necessários os dicionários a seguir — <code>preco</code> e <code>peso_atomico</code> —, os quais apresentam, respectivamente, o preço em dólares por quilograma de cada elemento e o peso atômico de cada elemento possível.
</div>



In [2]:
# preço em dólares por quilograma
preco = {
"H": 1.39,
"He": 24,
"Li": 85.6,
"Be": 857,
"B": 3.68,
"C": 0.122,
"N": 0.14,
"O": 0.154,
"F": 2.16,
"Ne": 240,
"Na": 3.43,
"Mg": 2.32,
"Al": 1.79,
"Si": 1.7,
"P": 2.69,
"S": 0.0926,
"Cl": 0.082,
"Ar": 0.931,
"K": 13.6,
"Ca": 2.35,
"Sc": 3460,
"Ti": 11.7,
"V": 385,
"Cr": 9.4,
"Mn": 1.82,
"Fe": 0.424,
"Co": 32.8,
"Ni": 13.9,
"Cu": 6,
"Zn": 2.55,
"Ga": 148,
"Ge": 1010,
"As": 1.31,
"Se": 21.4,
"Br": 4.39,
"Kr": 290,
"Rb": 15500,
"Sr": 6.68,
"Y": 31,
"Nb": 85.6,
"Mo": 40.1,
"Tc": 100000,
"Ru": 10600,
"Rh": 147000,
"Pd": 49500,
"Ag": 521,
"Cd": 2.73,
"In": 167,
"Sn": 18.7,
"Sb": 5.79,
"Te": 63.5,
"I": 35,
"Xe": 1800,
"Cs": 61800,
"Ba": 0.275,
"La": 4.92,
"Ce": 4.71,
"Pr": 103,
"Nd": 57.5,
"Pm": 460000,
"Sm": 13.9,
"Eu": 31.4,
"Gd": 28.6,
"Tb": 658,
"Dy": 307,
"Ho": 57.1,
"Er": 26.4,
"Tm": 3000,
"Yb": 17.1,
"Lu": 643,
"Hf": 900,
"Ta": 312,
"W": 35.3,
"Re": 4150,
"Os": 12000,
"Ir": 56200,
"Pt": 27800,
"Hg": 30.2,
"Tl": 4200,
"Pb":2,
"Bi": 6.36,
"Po": 49200000000000,
"Ac": 29000000000000,
"Th": 287,
"Pa": 280000,
"U": 101,
"Np": 660000,
"Pu": 6490000,
"Am": 750000,
"Cm": 160000000000,
"Bk": 185000000000,
"Cf": 185000000000,
}

In [3]:
# peso atômico em gramas por mol
peso_atomico = {
"H": 1.008,
"He": 4.002602,
"Li": 6.94,
"Be": 9.0121831,
"B": 10.81,
"C": 12.011,
"N": 14.007,
"O": 15.999,
"F": 18.998403163,
"Ne": 20.1797,
"Na": 22.98976928,
"Mg": 24.305,
"Al": 26.9815385,
"Si": 28.085,
"P": 30.973761998,
"S": 32.06,
"Cl": 35.45,
"Ar": 39.948,
"K": 39.0983,
"Ca": 40.078,
"Sc": 44.955908,
"Ti": 47.867,
"V": 50.9415,
"Cr": 51.9961,
"Mn": 54.938044,
"Fe": 55.845,
"Co": 58.933194,
"Ni": 58.6934,
"Cu": 63.546,
"Zn": 65.38,
"Ga": 69.723,
"Ge": 72.63,
"As": 74.921595,
"Se": 78.971,
"Br": 79.904,
"Kr": 83.798,
"Rb": 85.4678,
"Sr": 87.62,
"Y": 88.90584,
"Nb": 92.90637,
"Mo": 95.95,
"Tc": 97.90721,
"Ru": 101.07,
"Rh": 102.9055,
"Pd": 106.42,
"Ag": 107.8682,
"Cd": 112.414,
"In": 114.818,
"Sn": 118.71,
"Sb": 121.76,
"Te": 127.6,
"I": 126.90447,
"Xe": 131.293,
"Cs": 132.90545196,
"Ba": 137.327,
"La": 138.90547,
"Ce": 140.116,
"Pr": 140.90766,
"Nd": 144.242,
"Pm": 144.91276,
"Sm": 150.36,
"Eu": 151.964,
"Gd": 157.25,
"Tb": 158.92535,
"Dy": 162.5,
"Ho": 164.93033,
"Er": 167.259,
"Tm": 168.93422,
"Yb": 173.045,
"Lu": 174.9668,
"Hf": 178.49,
"Ta": 180.94788,
"W": 183.84,
"Re": 186.207,
"Os": 190.23,
"Ir": 192.217,
"Pt": 195.084,
"Hg": 200.592,
"Tl": 204.38,
"Pb": 207.2,
"Bi": 208.9804,
"Po": 209.0,
"Ac": 227.0,
"Th": 232.0377,
"Pa": 231.03588,
"U": 238.02891,
"Np": 237.0,
"Pu": 244.0,
"Am": 243.0,
"Cm": 247.0,
"Bk": 247.0,
"Cf": 251.0,
}

<div style="text-align: justify;">
Para resolver o problema das ligas ternárias, foi necessário definir importantes hiperparâmetros. A partir dessas definições a seguir e dos dados anteriores, criou-se a população da primeira geração.
</div>


<div style="text-align: center;">

<table border="1" cellpadding="5" cellspacing="0" style="margin: 0 auto; border-collapse: collapse;">
  <thead>
    <tr>
      <th>Variável</th>
      <th>Valor</th>
      <th>Descrição</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td><code>ELEMENTOS_POSSIVEIS</code></td>
      <td><code>list(peso_atomico.keys())</code></td>
      <td>Lista dos elementos possíveis considerados no problema</td>
    </tr>
    <tr>
      <td><code>TAMANHO_POPULACAO</code></td>
      <td><code>100</code></td>
      <td>Número de indivíduos na população</td>
    </tr>
    <tr>
      <td><code>PESO_MAX</code></td>
      <td><code>100</code></td>
      <td>Peso total para a liga</td>
    </tr>
    <tr>
      <td><code>CHANCE_DE_CRUZAMENTO</code></td>
      <td><code>0.5</code></td>
      <td>Probabilidade de cruzamento entre indivíduos</td>
    </tr>
    <tr>
      <td><code>CHANCE_DE_MUTACAO</code></td>
      <td><code>1</code></td>
      <td>Probabilidade de mutação em um indivíduo</td>
    </tr>
    <tr>
      <td><code>TAMANHO_TORNEIO</code></td>
      <td><code>3</code></td>
      <td>Número de indivíduos selecionados no torneio para competição</td>
    </tr>
    <tr>
      <td><code>GERACAO</code></td>
      <td><code>200</code></td>
      <td>Número total de gerações na evolução</td>
    </tr>
  </tbody>
</table>

</div>


In [4]:
ELEMENTOS_POSSIVEIS = list(peso_atomico.keys())
TAMANHO_POPULACAO = 100
PESO_MAX = 100

CHANCE_DE_CRUZAMENTO = 0.5
CHANCE_DE_MUTACAO = 1
TAMANHO_TORNEIO = 3
GERACAO = 200

In [5]:
populacao = cria_populacao(TAMANHO_POPULACAO, ELEMENTOS_POSSIVEIS, PESO_MAX)

<div style="text-align: justify;">
A seguir, é possível ver o código do algoritmo genético adaptado para o problema de ligas metálicas. Respectivamente, ele encontra o fitness de cada indivíduo da primeira população, seleciona a população, realiza um cruzamento ordenado e, então, duas mutações: uma que altera a massa dos elementos da liga e outra que altera o elemento. Observe as mudanças:

- Criação do candidato: Foi criado duas funções de gene, uma que cria uma lista dos elementos, outra que cria uma lista com o peso de forma que a soma dos pesos seja o peso máximo definido.

- Função Objetivo: Para computar o fitness dos indivíduos, definiu-se que seria calculada a diferença entre o valor da liga e seu peso molecular, pois desejamos o maior valor possível e o menor peso atômico. Assim, quanto maior a diferença, melhor o desempenho do indivíduo — atendendo ao objetivo de maximizar o valor e minimizar o peso molecular.


- Seleção: Aqui usaremos a seleção por torneio por máximização.

- Cruzamento: Nessa parte optamos por cruzar apenas a primeira parte do canditado, ou seja, os elementos. Isso porque, com a restrição do peso máximo essa troca poderia gerar muitos indivíduos inválidos.

- Mutação da Massa: Para fazer essa mutação, sorteamos um peso para  mante-lo fixo, depois sortemaos um proximo peso entre 5 a máximio sem o peso escolhido como fixo. Depois, com dois valores de peso definidos encontramos o terceiro.

- Mutação do Elemento: Para realizar essa mutação, sorteia-se um dos três elementos da liga para ser alterado. Em seguida, escolhe-se aleatoriamente um novo elemento possível — exceto aqueles que já estão presentes no indivíduo — garantindo, assim, a criação de um indivíduo válido.
 
</div>


In [6]:
maior_fitness_geral = - float("inf")
melhor_candidato = []
geracao = 0

for i in range(GERACAO):
    # Seleção
    fitness = funcao_objetivo(populacao, peso_atomico, preco)        
    selecionados = funcao_selecao(populacao, fitness, TAMANHO_TORNEIO)
    
    # Cruzamento
    proxima_geracao = []
    for pai, mae in zip(selecionados[::2], selecionados[1::2]):
        individuo1, individuo2 = funcao_cruzamento(pai, mae, CHANCE_DE_CRUZAMENTO)
        proxima_geracao.append(individuo1)
        proxima_geracao.append(individuo2)
    
    # Mutação
    funcao_mutacao1(proxima_geracao, PESO_MAX, CHANCE_DE_MUTACAO)
    funcao_mutacao2(proxima_geracao, CHANCE_DE_MUTACAO, ELEMENTOS_POSSIVEIS)
    
    # Encerramento
    populacao = proxima_geracao
    geracao += 1
    
    fitness = funcao_objetivo(populacao, peso_atomico, preco)
    maior_fitness_observado = max(fitness)
    
    if maior_fitness_observado > maior_fitness_geral:
        maior_fitness_geral = maior_fitness_observado
        indice = fitness.index(maior_fitness_observado)
        candidato = populacao[indice]
        print(f"Geração: {i}\nLiga: {candidato}\nFitness: {maior_fitness_observado}")

        peso_molecular = 0
        valor_liga = 0

        for elemento, massa in zip(candidato, candidato[3:]):
            peso_elemento = peso_atomico[elemento]
            peso_molecular += peso_elemento*massa
            valor_liga += preco[elemento]*massa

        peso_molecular /= 100
        valor_liga /= 1000
        print(f"A liga apresenta o peso molecular de {peso_molecular} e custa {valor_liga} dólores.\n\n")
        

Geração: 0
Liga: ['Po', 'Be', 'Ir', 51, 22, 27]
Fitness: 2509200001375.7827
A liga apresenta o peso molecular de 160.471270282 e custa 2509200001536.254 dólores.


Geração: 1
Liga: ['Po', 'Np', 'Co', 82, 13, 5]
Fitness: 4034400008375.0273
A liga apresenta o peso molecular de 205.13665970000002 e custa 4034400008580.164 dólores.


Geração: 6
Liga: ['H', 'Ac', 'Po', 9, 17, 74]
Fitness: 4133799999806.672
A liga apresenta o peso molecular de 193.34072 e custa 4133800000000.0127 dólores.


Geração: 12
Liga: ['Sn', 'Po', 'B', 8, 87, 5]
Fitness: 4280399999808.301
A liga apresenta o peso molecular de 191.8673 e custa 4280400000000.168 dólores.


Geração: 41
Liga: ['Ho', 'Po', 'Ac', 6, 79, 15]
Fitness: 4321799999791.2866
A liga apresenta o peso molecular de 209.0558198 e custa 4321800000000.3423 dólores.


Geração: 44
Liga: ['Sb', 'Yb', 'Po', 5, 5, 90]
Fitness: 4427999999797.274
A liga apresenta o peso molecular de 202.84025000000003 e custa 4428000000000.114 dólores.


Geração: 49
Liga: ['Hf',

<div style="text-align: justify;">
O melhor indivíduo muda a cada vez que o código é executado, assim como quando se alteram os hiperparâmetros. Afinal, o algoritmo genético não é um algoritmo de busca exaustiva, mas sim um código probabilístico que utiliza conceitos biológicos como inspiração para a construção de um código eficiente, embora não ideal. Desse modo, a seguir encontramos o melhor candidato entre os diversos testados neste notebook.
</div>


In [7]:
print(f"Geração: {i}\nLiga: {candidato}\nFitness: {maior_fitness_observado}")
print(f"A liga apresenta o peso molecular de {peso_molecular} e custa {valor_liga} dólores.")

Geração: 199
Liga: ['Ac', 'Xe', 'Po', 8, 6, 86]
Fitness: 4329599999812.937
A liga apresenta o peso molecular de 205.77758000000003 e custa 4463200000010.8 dólores.


## 😁 **Conclusão**

<div style="text-align: justify;">
Portanto, neste notebook foi possível implementar um código de algoritmo genético que resolve o problema das ligas ternárias — em que se deseja aumentar o valor da liga e diminuir o peso molecular. Ou seja, buscava-se a maior diferença entre o valor da liga e seu peso molecular. Esse problema foi tratado como um de maximização. Para isso, adaptou-se a função objetivo para retornar a diferença entre o valor da liga e seu peso atômico, e o cruzamento utilizado foi o ordenado, garantindo que sempre houvesse três elementos distintos na liga. 
Além disso, optou-se por usar dois tipos de mutações: a <code>mutacao_peso_liga</code> — que altera a massa de dois elementos de modo que a massa total da liga não se altere — e a <code>mutacao_gene_liga</code> — que substitui um elemento da liga por outro que ainda não fazia parte da composição.
</div>
<div></div>
<div style="text-align: justify;">
Um desafio do projeto foi identificar como seria calculado o fitness, já que a ordem de grandeza entre as massas, assim como entre os valores por quilograma dos elementos, varia drasticamente. Contudo, consideramos que obtivemos um excelente resultado, visto que o código convergiu para ligas compostas por elementos de altíssimo valor associado e massas que, embora não sejam as menores, também não estão muito distantes da massa de outros elementos.
</div>
