# <font color='red' size='6'>Inteligência Artificial</font>

## Atividade Prática: Algoritmos Genéticos

Grupo (Máx. 4 alunos) - Integrantes
<table width="300" border="2">
    <tr>
        <td><b>Nome do Aluno</b> </td>
        <td><b>RA</b></td>
     </tr>  
   <tr>
       <td>Aline Yumi Higa </td>
       <td>10402138</td>
   </tr>
   <tr>
       <td>Gustavo Garabetti Munhoz</td>
       <td>10409258</td>
   </tr>
   <tr>
       <td>Karine Yoo Lim Choi</td>
       <td>10403237</td>
   </tr>
   <tr>
       <td>Paula Aguiar Oliveira</td>
       <td>10403270</td>
   </tr>
</table>


## Definindo o Problema da Atividade

Esta atividade consiste em construir a solução de dois exercícios utilizando algoritmos genéticos. Sendo eles:<br>
1) <b>Otimização de uma Sequência de DNA</b>, considerando os nucleotídeos adenina (A), citosina (C), guanina (G) e timina (T). <br>
2) <b>Otimização de uma Sequência de Notas Musicais</b>. Música: "Parabéns para Você".

<p><b>Exercício 1: Otimização de uma Sequência de DNA</b>
<p><b>Contexto:</b>
A otimização de sequências de DNA é um problema comum em bioinformática e biologia sintética. Algoritmos genéticos podem ser usados para explorar o espaço de possíveis sequências e encontrar a sequência desejada.
    
<p><b>Objetivo: </b>evoluir uma população de sequências de DNA até que uma delas corresponda a uma sequência pré-definida. Implemente um algoritmo genético que evolua uma população de sequências de DNA até encontrar a sequência que corresponda exatamente à sequência alvo "ATGCCGTATGCCGTA". Os nucleotídeos possíveis são: ['A', 'T', 'C', 'G']. O significado de cada sigla é: adenina (A), citosina (C), guanina (G) e timina (T),

<p><b>Descrição do Problema:</b>

<p><b>1. Parâmetros do Algoritmo:</b></p>

<b>Tamanho da população:</b> 50 indivíduos.<br>

<b>Taxa de crossover:</b> 80%.<br>

<b>Taxa de mutação:</b> 5%.<br>

<b>Número máximo de gerações:</b> 1000.<br>

<b>Comprimento da sequência:</b> 15. <br>

<p><b>Entrada:</b></p>
<b>Sequência alvo:</b> "ATGCCGTATGCCGTA".<br>
<b>Nucleotídeos possíveis:</b> ['A', 'T', 'C', 'G'].<br><br>

<p><b>Saída Esperada:</b></p>
A sequência de DNA evolvida que corresponde exatamente à sequência alvo.
O número de gerações necessárias para encontrar a solução.<br><br>

<p><b>2. Representação do Indivíduo:</b></p>

Cada indivíduo na população é representado por uma sequência de DNA, que é uma cadeia de nucleotídeos (A, T, C, G). Por exemplo, uma sequência pode ser "ATGCCGTATGCCGTA".<br>

<p><b>3. Função de Avaliação (Fitness):</b></p>

A função de fitness deve avaliar quão próxima uma sequência de DNA está da sequência alvo. A pontuação de fitness pode ser calculada como o número de nucleotídeos corretos na posição correta. Por exemplo:<br>

<b>Sequência alvo:</b> "ATGCCGTATGCCGTA"<br>

<b>Sequência candidata:</b> "ATGCCGTCTGCCGTA"<br>

<b>Fitness:</b> 14 (pois 14 nucleotídeos estão corretos).<br>

<p><b>4. Operadores Genéticos:</b></p>

<p><b>Seleção:</b> Utilize um método de seleção (como roleta ou torneio) para escolher os indivíduos mais aptos para reprodução.

<p><b>Crossover:</b> Implemente um operador de crossover para combinar duas sequências de DNA e gerar descendentes.

<p><b>Mutação:</b> Aplique mutação para introduzir diversidade na população. A mutação pode alterar aleatoriamente um nucleotídeo em uma sequência.

<p><b>5. Critério de Parada:</b></p>

O algoritmo deve parar quando encontrar uma sequência de DNA com fitness máximo (ou seja, quando a sequência candidata for idêntica à sequência alvo).

In [24]:
import random
from functools import reduce

TAM_POPULACAO = 50
TAXA_CROSSOVER = 0.8
TAXA_MUTACAO = 0.05
MAX_GERACOES = 1000
COMP_SEQ = 15
NUCLEOTIDEOS = ['A', 'T', 'C', 'G']
TARGET = "ATGCCGTATGCCGTA"

def gerar_individuo():
    return reduce(lambda x, y: x + y, [random.choice(NUCLEOTIDEOS) for _ in range(COMP_SEQ)])

def calc_fitness(individuo):
    return sum(1 for i in range(COMP_SEQ) if individuo[i] == TARGET[i])

def selecionar_pais(populacao):
    pais = []
    for _ in range(TAM_POPULACAO):
        competidores = random.sample(populacao, 3)
        melhor = max(competidores, key=calc_fitness)
        pais.append(melhor)
    return pais

def crossover(pai1, pai2):
    if random.random() < TAXA_CROSSOVER:
        ponto_corte = random.randint(1, COMP_SEQ - 1)
        filho1 = pai1[:ponto_corte] + pai2[ponto_corte:]
        filho2 = pai2[:ponto_corte] + pai2[ponto_corte:]
        return filho1, filho2
    else:
        return pai1, pai2

def mutar(individuo):
    new_ind = ''
    for i in range(COMP_SEQ):
        new_ind += random.choice(NUCLEOTIDEOS) if random.random() < TAXA_MUTACAO else individuo[i]
    return new_ind

def algoritmo_genetico():
    populacao = [gerar_individuo() for _ in range(TAM_POPULACAO)]

    for geracao in range(MAX_GERACOES):

        fitness_populacao = [calc_fitness(individuo) for individuo in populacao]
        melhor_fitness = max(fitness_populacao)
        melhor_individuo = populacao[fitness_populacao.index(melhor_fitness)]

        print(f"Geracao {geracao}: Melhor individuo = {melhor_individuo}, Fitness = {melhor_fitness}")

        if melhor_fitness == COMP_SEQ:
            print(f"Solução encontrada na geração {geracao}: {melhor_individuo}")
            return melhor_individuo

        pais = selecionar_pais(populacao)

        nova_populacao = []
        for i in range(0, TAM_POPULACAO, 2):
            pai1, pai2 = pais[i], pais[i+1]
            filho1, filho2 = crossover(pai1, pai2)
            nova_populacao.append(mutar(filho1))
            nova_populacao.append(mutar(filho2))

        populacao = nova_populacao

    print("Solução não encontrada dentro do número máximo de gerações.")
    return None

if __name__ == "__main__":
    solucao = algoritmo_genetico()
    if solucao:
        print("Sequência evoluida:", solucao)

Geracao 0: Melhor individuo = CAGGCCTACGTCATT, Fitness = 7
Geracao 1: Melhor individuo = CGGGCGCAGGCCCGA, Fitness = 8
Geracao 2: Melhor individuo = ACACCCCTCGCCGTC, Fitness = 8
Geracao 3: Melhor individuo = ACACCCCACGCCGTC, Fitness = 9
Geracao 4: Melhor individuo = ATGCCATACGCAGTC, Fitness = 11
Geracao 5: Melhor individuo = ATGCCGTAAGCAGTC, Fitness = 12
Geracao 6: Melhor individuo = ATGCCATACGCCGTC, Fitness = 12
Geracao 7: Melhor individuo = ATGCCGTACGCAGTC, Fitness = 12
Geracao 8: Melhor individuo = ATGCCATAAGCCGTC, Fitness = 12
Geracao 9: Melhor individuo = ATGCCATACGCCGTC, Fitness = 12
Geracao 10: Melhor individuo = ATGCCATACGCCGTC, Fitness = 12
Geracao 11: Melhor individuo = ATGCCATATGCCGTC, Fitness = 13
Geracao 12: Melhor individuo = ATGCCATATGCCGTC, Fitness = 13
Geracao 13: Melhor individuo = ATGCCATATGCCGTA, Fitness = 14
Geracao 14: Melhor individuo = ATGCCATATGCCGTA, Fitness = 14
Geracao 15: Melhor individuo = ATGCCATATGCCGTA, Fitness = 14
Geracao 16: Melhor individuo = ATGCCGT

<p><b>Exercício 2: Otimização de uma Sequência de Notas Musicais. Música: "Parabéns para Você"</b>

<p><b>Contexto:</b></p>
A otimização de sequências de notas musicais é um problema interessante na área de computação musical. Algoritmos genéticos podem ser usados para explorar o espaço de possíveis sequências e encontrar a sequência desejada.<br><br>
    
<p><b>Objetivo:</b> evoluir uma população de sequências de notas até que uma delas corresponda a uma sequência pré-definida.  Implemente um algoritmo genético que evolua uma população de sequências de notas musicais até encontrar a sequência que corresponda exatamente à sequência alvo da música "Parabéns para Você".<br>

<b>Onde:</b>

Primeira Frase (<b>"Parabéns pra você"</b>):<br>

Sol, Sol, Lá, Sol, Dó, Si: Representa a melodia da primeira linha da música.<br>

Segunda Frase (<b>"Nesta data querida"</b>):<br>

Sol, Sol, Lá, Sol, Ré, Dó: Representa a melodia da segunda linha.<br>

Terceira Frase (<b>"Muitas felicidades"</b>):<br>

Sol, Sol, Sol, Mi, Dó, Si, Lá: Representa a melodia da terceira linha.<br>

Quarta Frase (<b>"Muitos anos de vida"</b>):<br>

Fá, Fá, Mi, Dó, Ré, Dó: Representa a melodia da quarta linha.<br>

<p><b>Descrição do Problema:</b></p>

<p><b>1. Parâmetros do Algoritmo:</b></p>

<b>Tamanho da população: </b>200 indivíduos.<br>

<b>Taxa de crossover:</b> 95%.<br>

<b>Taxa de mutação:</b> 10%.<br>

<b>Número máximo de gerações:</b> 1000.<br>

<b>Comprimento da sequência:</b> 25.<br>

<b>Entrada:</b><br>
<b>Sequência alvo:</b> ["Sol", "Sol", "Lá", "Sol", "Dó", "Si", "Sol", "Sol", "Lá", "Sol", "Ré", "Dó", "Sol", "Sol", "Sol", "Mi", "Dó", "Si", "Lá", "Fá", "Fá", "Mi", "Dó", "Ré", "Dó"].<br>

<b>Notas possíveis:</b> ["Dó", "Ré", "Mi", "Fá", "Sol", "Lá", "Si"].<br>

<b>Saída Esperada:</b><br>
A sequência de notas evolvida que corresponde exatamente à sequência alvo.<br>

O número de gerações necessárias para encontrar a solução.<br>

<p><b>2. Representação do Indivíduo:</b></p>

Cada indivíduo na população é representado por uma sequência de notas musicais, que é uma cadeia de notas (por exemplo, ["Sol", "Sol", "Lá", "Sol", "Dó", "Si"]). <br>

<p><b>3. Função de Avaliação (Fitness):</b></p>

A função de fitness deve avaliar quão próxima uma sequência de notas está da sequência alvo. A pontuação de fitness pode ser calculada como o número de notas corretas na posição correta. Por exemplo:<br>

<b>Sequência alvo:</b> ["Sol", "Sol", "Lá", "Sol", "Dó", "Si"]<br>

<b>Sequência candidata:</b> ["Sol", "Sol", "Lá", "Sol", "Ré", "Si"]<br>

<b>Fitness:</b> 4 (pois 4 notas estão corretas).<br>

<p><b>4. Operadores Genéticos:</b></p>

<p><b>Seleção:</b> Utilize um método de seleção (como roleta ou torneio) para escolher os indivíduos mais aptos para reprodução. Sugestão: selecione aleatóriamente 5 indivíduos por meio do torneio.<br>

<p><b>Crossover:</b> Implemente um operador de crossover para combinar duas sequências de notas e gerar descendentes. <br>

<p><b>Mutação:</b> Aplique mutação para introduzir diversidade na população. A mutação pode alterar aleatoriamente uma nota em uma sequência.<br>

<p><b>5. Critério de Parada:</b></p>

O algoritmo deve parar quando encontrar uma sequência de notas com fitness máximo (ou seja, quando a sequência candidata for idêntica à sequência alvo).

In [50]:
import random

TAM_POPULACAO = 200
TAXA_CROSSOVER = 0.95
TAXA_MUTACAO = 0.1
MAX_GERACOES = 1000
COMP_SEQ = 25
NOTAS = ['Dó', 'Ré', 'Mi', 'Fá', 'Sol', 'Lá', 'Si']
TARGET = ['Sol', 'Sol', 'Lá', 'Sol', 'Dó', 'Si', 'Sol', 'Sol', 'Lá', 'Sol', 'Ré', 'Dó', 'Sol', 'Sol', 'Sol', 'Mi', 'Dó', 'Si', 'Lá', 'Fá', 'Fá', 'Mi', 'Dó', 'Ré', 'Dó']

def gerar_individuo():
    return [random.choice(NUCLEOTIDEOS) for _ in range(COMP_SEQ)]

def calc_fitness(individuo):
    return sum(1 for i in range(COMP_SEQ) if individuo[i] == TARGET[i])

def selecionar_pais(populacao):
    pais = []
    for _ in range(TAM_POPULACAO):
        competidores = random.sample(populacao, 3)
        melhor = max(competidores, key=calc_fitness)
        pais.append(melhor)
    return pais

def crossover(pai1, pai2):
    if random.random() < TAXA_CROSSOVER:
        ponto_corte = random.randint(1, COMP_SEQ - 1)
        filho1 = pai1[:ponto_corte] + pai2[ponto_corte:]
        filho2 = pai2[:ponto_corte] + pai2[ponto_corte:]
        return filho1, filho2
    else:
        return pai1, pai2

def mutar(individuo):
    for i in range(COMP_SEQ):
        if random.random() < TAXA_MUTACAO:
            individuo[i] = random.choice(NOTAS)
    return individuo

def algoritmo_genetico():
    populacao = [gerar_individuo() for _ in range(TAM_POPULACAO)]

    for geracao in range(MAX_GERACOES):

        fitness_populacao = [calc_fitness(individuo) for individuo in populacao]
        melhor_fitness = max(fitness_populacao)
        melhor_individuo = populacao[fitness_populacao.index(melhor_fitness)]

        print(f"Geracao {geracao}: Melhor individuo = {melhor_individuo}, Fitness = {melhor_fitness}")

        if melhor_fitness == COMP_SEQ:
            print(f"Solução encontrada na geração {geracao}: {melhor_individuo}")
            return melhor_individuo

        pais = selecionar_pais(populacao)

        nova_populacao = []
        for i in range(0, TAM_POPULACAO, 2):
            pai1, pai2 = pais[i], pais[i+1]
            filho1, filho2 = crossover(pai1, pai2)
            nova_populacao.append(mutar(filho1))
            nova_populacao.append(mutar(filho2))

        populacao = nova_populacao

    print("Solução não encontrada dentro do número máximo de gerações.")
    return None

if __name__ == "__main__":
    solucao = algoritmo_genetico()
    if solucao:
        print("Sequência evoluida:", solucao)

Geracao 0: Melhor individuo = ['C', 'A', 'T', 'C', 'C', 'G', 'A', 'C', 'C', 'T', 'G', 'C', 'G', 'A', 'T', 'C', 'T', 'G', 'A', 'A', 'A', 'T', 'G', 'A', 'T'], Fitness = 0
Geracao 1: Melhor individuo = ['C', 'Mi', 'T', 'T', 'T', 'C', 'A', 'C', 'C', 'Sol', 'Ré', 'C', 'C', 'T', 'A', 'G', 'T', 'G', 'G', 'T', 'T', 'A', 'Dó', 'G', 'G'], Fitness = 3
Geracao 2: Melhor individuo = ['A', 'T', 'C', 'T', 'C', 'Fá', 'C', 'Sol', 'G', 'Mi', 'T', 'Dó', 'G', 'T', 'G', 'A', 'T', 'T', 'Lá', 'G', 'A', 'Mi', 'T', 'T', 'Mi'], Fitness = 4
Geracao 3: Melhor individuo = ['Fá', 'Mi', 'T', 'T', 'T', 'C', 'A', 'C', 'C', 'Sol', 'Ré', 'C', 'Sol', 'C', 'Sol', 'Mi', 'G', 'C', 'Fá', 'C', 'G', 'T', 'Si', 'T', 'A'], Fitness = 5
Geracao 4: Melhor individuo = ['T', 'Sol', 'Dó', 'A', 'Sol', 'T', 'G', 'T', 'Lá', 'C', 'C', 'Dó', 'Dó', 'T', 'Dó', 'Dó', 'G', 'Si', 'Fá', 'Fá', 'G', 'Mi', 'C', 'T', 'T'], Fitness = 6
Geracao 5: Melhor individuo = ['A', 'Fá', 'G', 'A', 'Dó', 'Si', 'T', 'Si', 'G', 'Sol', 'Ré', 'Dó', 'Sol', 'Mi', 'C',