# Algoritmos Genéticos

### Battle Royale: Qual o melhor material?

**Alunas:** Geovana Bettero, Natália Alcantara e Samira Oliveira

Este notebook usa de estratégias de algoritmos genéticos para identificar materiais bidimensionais (2D). Para esses materiais buscamos características de maior band gap e menor calor de formação, para aferir tais características utilizamos dois modelos de previsão de floresta aleatória.
Discorreremos sobre as ferramentas e estratégias de programação utilizadas ao longo do notebook.

---

Importando as bibliotecas e as funções que estão no script funcoes_ag.py :

In [1]:
from funcoes_ag import individuo_bgcf, populacao_bgcf, objetivo_pop_bgcf, mutacao_bgcf
from funcoes_ag import cruzamento_ponto_duplo as cruzamento
from funcoes_ag import selecao_roleta_max as selecao

Definindo variáveis globais que serão utilizadas ao longo do código:

In [2]:
ELEMENTOS = ['H', 'Li', 'Be', 'B', 'C', 'N', 'O', 'F', 'Na', 'Mg', 'Al', 'Si','P', 'S', 'Cl', 'K', 'Ca', 'Sc', 'Ti', 'V', 'Cr', 'Mn', 'Fe', 'Co', 'Ni', 'Cu', 'Zn', 'Ga', 'Ge', 'As', 'Se', 'Br', 'Rb', 'Sr', 'Y', 'Zr', 'Nb', 'Mo', 'Ru', 'Rh', 'Pd', 'Ag', 'Cd', 'In', 'Sn', 'Sb', 'Te', 'I', 'Cs', 'Ba', 'Hf', 'Ta', 'W', 'Re', 'Os', 'Ir', 'Pt', 'Au', 'Hg', 'Tl', 'Pb', 'Bi']
NUM_ELEMENTOS = len(ELEMENTOS)
TAMANHO_POPULACAO = 10
NUM_GERACOES = 5
CHANCE_DE_CRUZAMENTO = 0.5
CHANCE_DE_MUTACAO = 0.05
TAMANHO_HALL_DA_FAMA = 1

Criando a estrutura geral do algoritmo genético. Nele, as funções do script funcoes_ag.py são chamadas ao longo das gerações.

In [3]:
# Criando a população inicial
populacao = populacao_bgcf(TAMANHO_POPULACAO, NUM_ELEMENTOS)

hall_da_fama = []

# Iteração que traduz a passagem das gerações
for n in range(NUM_GERACOES):
    
    # Seleção
    # Calculamos a aptidão dos indivíduos (função objetivo_pop_bgcf) e os selecionamos para a próxima geração (função selecao) 
    fitness = objetivo_pop_bgcf(populacao)       
    selecionados = selecao(populacao, fitness)
    
    # Cruzamento
    # Atuação na variabilidade genética da população por cruzamento (função cruzamento)
    proxima_geracao = []
    for pai, mae in zip(selecionados[::2], selecionados[1::2]):
        individuo1, individuo2 = cruzamento(pai, mae, CHANCE_DE_CRUZAMENTO)
        proxima_geracao.append(individuo1)
        proxima_geracao.append(individuo2)
    
    # Mutação
    # Atuação na variabilidade genética da população por mutação (função mutacao_bgcf)
    mutacao_bgcf(proxima_geracao, CHANCE_DE_MUTACAO)
    
    # Atualização do hall da fama
    # Atualiza o hall da fama conforme os valores calculados pela função objetivo (função objetivo_pop_bgcf)
    fitness = objetivo_pop_bgcf(proxima_geracao)
    maior_fitness = max(fitness)
    indice = fitness.index(maior_fitness)
    hall_da_fama.append(proxima_geracao[indice])    
    
    # Encerramento
    populacao = proxima_geracao

Mostrando ao leitor o indivíduo que apresentou o melhor fitness:

In [4]:
fitness = objetivo_pop_bgcf(hall_da_fama)
maior_fitness = max(fitness)
indice = fitness.index(maior_fitness)
melhor_individuo_observado = hall_da_fama[indice]

print(melhor_individuo_observado)

[0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 7, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 7, 0, 0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]


Mostrando ao leitor o indivíduo que apresentou o melhor fitness em seu formato de fórmula química:

In [5]:
material = ""
for valor, elemento in zip(melhor_individuo_observado, ELEMENTOS):
    if valor > 0:
        material += f"{elemento}{valor}"

print(material)

C8Ca7Y7Pd8I2Ta2


#### Aspectos interessantes 
Parte do cálculo do fitness é realizado por um modelo de árvore aleatória que prevê o quão bom o material 2D é bom para as características desejadas: band gap e calor de formação. Um rápido adendo: o band gap é mais valorizado em relação ao calor de formação, ação tomada a partir de entrevista com especialista.
A mutação é feita com base na eletronegatividade dos elementos químicos, trazendo conceitos da física para melhorar a convergência. Outra ação tomada a partir de entrevista com especialista.

#### Conclusão
O algoritmo genético forneceu como resultado um material 2D que satisfaz os critérios de maximização e minimização estabelecidos de forma satisfatória.

# Referências:

1. Banco de dados C2DB: https://cmr.fysik.dtu.dk/c2db/c2db.html#brief-description
2. CASSAR, D. R. Floresta Aleatória (2023)
3. CASSAR, D. R. Notebook algoritmo genético. (2024)
4. CASSAR, D. R. Notebook caixas não-binárias. (2024)
5. FQ.pt. (2024). Eletronegatividade. Disponível em: https://www.fq.pt/ligacao-quimica/eletronegatividade.
6. ChatGPT para ajuda na resolução de bugs.