# Aula 5: Aplicações em Engenharia de Software (Estudos de Caso)

**Professor** PhD Jackson Antonio do Prado Lima

**Contato:** `[jacksonpradolima at @gmail.com]` - Por favor, use o prefixo `[SBSE-CursoBR]` no assunto

---

**Agenda:**
- Como o SBSE é utilizado na melhoria de processos de desenvolvimento de software (Estudos de Caso)
- Como é utilizado:
  - Search-Based Testing
    - Geração e Priorização de Casos de Teste
  - Search-Based Software Maintenance    
    - Refatoração de código    

---

A aplicação de SBSE em testes de software é um dos campos mais explorados atualmente na área de engenharia de software. Isso se deve ao fato de que a testagem é uma etapa crucial do processo de desenvolvimento de software, e métodos tradicionais de testes, como testes manuais ou baseados em especificações, podem ser limitados em termos de eficácia e eficiência.

Com o uso de técnicas de SBSE, é possível gerar automaticamente casos de teste eficazes e eficientes, melhorando a qualidade do software e reduzindo o tempo e custo envolvidos no processo de testagem.

Entre as principais técnicas de SBSE aplicadas em testes de software, destacam-se a geração e priorização de casos de teste.

Além disso, outras aplicações de SBSE em testes de software incluem a identificação automática de defeitos no código-fonte, refatoração de código (***code smells***), e a geração de casos de teste para testes de segurança.

A SBSE tem potencial para melhorar significativamente a eficácia e eficiência dos testes de software, reduzindo o tempo e o custo envolvidos no processo e melhorando a qualidade do software produzido.

# Geração de casos de teste 

## O que é

A geração de casos de teste consiste na criação de dados de entrada para um software, com o objetivo de exercitar as funcionalidades do sistema, maximizando a cobertura de código e revelando defeitos no software de maneira eficiente e automática. Desse modo, a qualidade do software é verificada semm a necessidade de criação manual de dados pelos testadores ou desenvolvedores.

## Necessidade

A geração manual de dados de teste é um processo que pode ser demorado, trabalhoso e propenso a erros. Os testadores e desenvolvedores precisam criar dados de entrada para os casos de teste com o objetivo de cobrir o máximo possível de cenários, ramos e caminhos do código-fonte. No entanto, criar um conjunto de dados de teste eficiente e eficaz manualmente pode ser uma tarefa desafiadora, especialmente em sistemas de software complexos e de grande porte.

A seguir estão algumas das razões pelas quais a geração automática de dados de teste é necessária:

1. **Economia de tempo e recursos**: A geração manual de dados de teste é um processo demorado que exige esforço e habilidades consideráveis por parte dos testadores e desenvolvedores. A geração automática de dados de teste pode reduzir significativamente o tempo e os recursos necessários para criar conjuntos de dados de teste, permitindo que os testadores e desenvolvedores se concentrem em outras atividades essenciais de teste e desenvolvimento.

2. **Melhoria na cobertura de código**: A geração manual de dados de teste pode levar a conjuntos de dados de teste subótimos, com cobertura de código insuficiente. A geração automática de dados de teste, usando técnicas de otimização baseadas em busca, pode maximizar a cobertura de código, garantindo que mais caminhos, ramos e condições sejam testados no software.

3. **Detecção aprimorada de defeitos**: A geração automática de dados de teste pode revelar defeitos que talvez não fossem descobertos com a geração manual de dados de teste. As técnicas de geração automática de dados de teste podem identificar casos de teste que exploram cenários e condições incomuns ou de borda, aumentando a probabilidade de detectar defeitos no software.

4. **Redução do viés humano**: A geração manual de dados de teste pode ser influenciada pelo viés humano, levando a conjuntos de dados de teste que não exploram adequadamente todas as possibilidades e cenários. A geração automática de dados de teste pode criar conjuntos de dados de teste mais diversificados e imparciais, aumentando a eficácia dos testes.

5. **Adaptabilidade a mudanças no software**: À medida que o software evolui, os dados de teste também precisam ser atualizados e adaptados às novas funcionalidades e requisitos. A geração automática de dados de teste pode facilitar esse processo, permitindo a rápida adaptação e atualização dos conjuntos de dados de teste conforme as mudanças no software ocorrem.


## Cobertura de código

A cobertura de código é uma métrica importante no processo de teste de software que indica a porcentagem do código-fonte do programa que é executada durante os testes. O objetivo da cobertura de código é garantir que todos os aspectos do software sejam testados, incluindo caminhos, ramos e condições. Uma cobertura de código mais alta geralmente leva a uma melhor detecção de defeitos e a uma maior qualidade do software.

A geração automática de dados de teste tem como objetivo maximizar a cobertura de código. Normalmente, usa-se análise estática e dinâmica para identificar os caminhos e ramos do código-fonte que não foram cobertos pelos testes existentes. Isso permite que novos dados de teste sejam gerados para cobrir essas áreas não cobertas do código.

## Função objetivo

As métricas comuns incluem:
- cobertura de código
- taxa de detecção de defeitos
- tempo de execução do teste 
- complexidade dos dados de teste





## Ferramentas e bibliotecas para Geração Automática de Dados de Teste

Existem várias ferramentas e bibliotecas disponíveis que podem ser utilizadas para facilitar a geração automática de dados de teste. Elas ajudam a simplificar o processo e a implementar algoritmos de busca eficientes e eficazes. Algumas das ferramentas e bibliotecas mais populares incluem:

- **EvoSuite**: O EvoSuite é uma ferramenta de código aberto escrita em Java para a geração automática de casos de teste para programas Java. Ele utiliza algoritmos de busca, como algoritmos genéticos e algoritmos baseados em busca local, para gerar casos de teste que maximizam a cobertura de código e a detecção de defeitos.

- **pytest-quickcheck**: O pytest-quickcheck é um plugin Python para a biblioteca pytest que permite a geração automática de dados de teste baseada em propriedades. Ele utiliza o conceito de testes baseados em propriedades, onde os dados de teste são gerados automaticamente para satisfazer as propriedades especificadas pelo desenvolvedor.

- **DEAP (Distributed Evolutionary Algorithms in Python)**: O DEAP é uma biblioteca Python de código aberto que fornece uma estrutura para a implementação de algoritmos evolutivos, incluindo algoritmos genéticos. Ele pode ser usado para implementar algoritmos de busca personalizados para a geração automática de dados de teste.

- **jMetalPy**: O jMetalPy é uma biblioteca Python que oferece uma estrutura para o desenvolvimento de algoritmos de otimização multiobjetivo, incluindo algoritmos genéticos e algoritmos de enxame de partículas. A jMetalPy pode ser usada para implementar algoritmos de busca que otimizem múltiplos critérios de adequação ao mesmo tempo, como a cobertura de código e a taxa de detecção de defeitos.

- **KLEE**: O KLEE é uma ferramenta de execução simbólica para programas C e C++ que gera automaticamente casos de teste para alcançar alta cobertura de código. A execução simbólica é uma técnica que explora todas as possíveis execuções de um programa, substituindo as entradas por valores simbólicos e gerando restrições para as condições de controle. O KLEE utiliza solucionadores de restrições para encontrar entradas concretas que satisfaçam as restrições e maximizem a cobertura de código.

## Código


As técnicas de SBSE utilizadas para esse fim envolvem a busca por soluções ótimas ou próximas da ótima, considerando restrições e objetivos específicos.

## Exemplo 1

In [None]:
import random

# Define the function to be tested
def add(a, b):
    return a + b

# Define the fitness function to evaluate the quality of test cases
def fitness_function(test_case):
    a, b, expected_output = test_case
    output = add(a, b)
    return 1 if output == expected_output else 0

# Define a function to generate a random test case
def generate_test_case():
    a = random.randint(1, 10)
    b = random.randint(1, 10)
    expected_output = add(a, b)
    return (a, b, expected_output)

# Define a function to generate an initial population of test cases
def generate_initial_population(size):
    population = []
    for i in range(size):
        population.append(generate_test_case())
    return population

# Define the selection operator to select test cases based on their fitness values
def selection(population):
    return random.choice(population)

# Define the crossover operator to generate new test cases from two parent test cases
def crossover(parent1, parent2):
    a1, b1, _ = parent1
    a2, b2, _ = parent2
    child1 = (a1, b2, add(a1, b2))
    child2 = (a2, b1, add(a2, b1))
    return [child1, child2]

# Define the mutation operator to make small changes to a test case
def mutation(test_case):
    a, b, expected_output = test_case
    if random.random() < 0.5:
        a = random.randint(1, 10)
    else:
        b = random.randint(1, 10)
    expected_output = add(a, b)
    return (a, b, expected_output)

# Define the main genetic algorithm function to generate high-quality test cases
def genetic_algorithm():
    population_size = 10
    population = generate_initial_population(population_size)
    best_test_case = None
    best_fitness = 0
    num_generations = 100
    
    # Iterate over a fixed number of generations
    for i in range(num_generations):
        new_population = []
        # Generate a new population of test cases from the existing population
        for j in range(population_size):
            parent1 = selection(population)
            parent2 = selection(population)
            children = crossover(parent1, parent2)
            child1 = mutation(children[0])
            child2 = mutation(children[1])
            new_population.append(child1)
            new_population.append(child2)
        population = new_population
        # Evaluate the fitness of each test case and select the best test case
        for test_case in population:
            fitness = fitness_function(test_case)
            if fitness > best_fitness:
                best_fitness = fitness
                best_test_case = test_case
                print(f"New best test case: {test_case}")
    return best_test_case

# Call the genetic algorithm function to generate the best test case
best_test_case = genetic_algorithm()
print(f"Best test case: {best_test_case}")


New best test case: (1, 6, 7)
Best test case: (1, 6, 7)


This code example demonstrates how a Genetic Algorithm can be used to automatically generate test cases for a simple Python function. The algorithm uses the selection, crossover, and mutation operators to generate new test cases from existing test cases. The fitness_function evaluates the quality of each test case based on the function output and selects the best test case. The example demonstrates how SBST can be used to automate test case generation activities, which can help reduce the time and cost of software testing while improving

## Exemplo 2

Neste exemplo, utilizaremos um Algoritmo Genético simples para resolver o problema de gerar dados de teste que maximizem a cobertura de ramos de uma função fictícia. A função tem três ramos condicionais e recebe três parâmetros inteiros.

In [3]:
import random

# Função fictícia com três ramos condicionais
def funcao_ficticia(a, b, c):
    if a > 10:
        pass  # Ramo 1
    if b < 5:
        pass  # Ramo 2
    if c == 7:
        pass  # Ramo 3

# Função de adequação (fitness) que calcula a cobertura de ramos
def fitness(individuo):
    a, b, c = individuo
    cobertura = 0
    if a > 10:
        cobertura += 1
    if b < 5:
        cobertura += 1
    if c == 7:
        cobertura += 1
    return cobertura

# Parâmetros do Algoritmo Genético
TAMANHO_POPULACAO = 100
TAXA_CRUZAMENTO = 0.8
TAXA_MUTACAO = 0.1
NUMERO_GERACOES = 50

# Inicialização da população
populacao = [[random.randint(0, 20) for _ in range(3)] for _ in range(TAMANHO_POPULACAO)]

for geracao in range(NUMERO_GERACOES):
    # Avaliação da população
    fitness_populacao = [fitness(individuo) for individuo in populacao]

    # Seleção dos pais
    pais = random.choices(populacao, weights=fitness_populacao, k=TAMANHO_POPULACAO)

    # Cruzamento (Crossover)
    descendentes = []
    for i in range(0, TAMANHO_POPULACAO, 2):
        pai1, pai2 = pais[i], pais[i+1]
        if random.random() < TAXA_CRUZAMENTO:
            ponto_corte = random.randint(1, 2)
            descendente1 = pai1[:ponto_corte] + pai2[ponto_corte:]
            descendente2 = pai2[:ponto_corte] + pai1[ponto_corte:]
        else:
            descendente1, descendente2 = pai1, pai2
        descendentes.extend([descendente1, descendente2])

    # Mutação
    for descendente in descendentes:
        for i in range(3):
            if random.random() < TAXA_MUTACAO:
                descendente[i] = random.randint(0, 20)

    # Substituição da população
    populacao = descendentes

# Encontrando o melhor indivíduo
melhor_individuo = max(populacao, key=fitness)
print("Melhor indivíduo:", melhor_individuo, "Fitness:", fitness(melhor_individuo))


Melhor indivíduo: [13, 3, 7] Fitness: 3


Este exemplo utiliza um Algoritmo Genético para gerar dados de teste que maximizem a cobertura de ramos da função fictícia. A função de adequação (fitness) simplesmente conta quantos ramos são cobertos pelos dados de teste. Os operadores de cruzamento e mutação são aplicados para gerar novos conjuntos de dados de teste, e a população é atualizada a cada geração. O exemplo termina exibindo o melhor conjunto de dados de teste

In [6]:
!pip3 install deap numpy

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [2]:
import random
from deap import base, creator, tools

# Função fictícia com três ramos condicionais
def funcao_ficticia(a, b, c):
    if a > 10:
        pass  # Ramo 1
    if b < 5:
        pass  # Ramo 2
    if c == 7:
        pass  # Ramo 3

# Função de adequação (fitness) que calcula a cobertura de ramos
def fitness(individuo):
    a, b, c = individuo
    cobertura = 0
    if a > 10:
        cobertura += 1
    if b < 5:
        cobertura += 1
    if c == 7:
        cobertura += 1
    return cobertura,

# Parâmetros do Algoritmo Genético
TAMANHO_POPULACAO = 100
TAXA_CRUZAMENTO = 0.8
TAXA_MUTACAO = 0.1
NUMERO_GERACOES = 50

creator.create("FitnessMax", base.Fitness, weights=(1.0,))
creator.create("Individuo", list, fitness=creator.FitnessMax)

toolbox = base.Toolbox()
toolbox.register("attr_int", random.randint, 0, 20)
toolbox.register("individuo", tools.initRepeat, creator.Individuo, toolbox.attr_int, n=3)
toolbox.register("populacao", tools.initRepeat, list, toolbox.individuo)

toolbox.register("evaluate", fitness)
toolbox.register("mate", tools.cxOnePoint)
toolbox.register("mutate", tools.mutUniformInt, low=0, up=20, indpb=0.1)
toolbox.register("select", tools.selTournament, tournsize=3)

populacao = toolbox.populacao(n=TAMANHO_POPULACAO)

for geracao in range(NUMERO_GERACOES):
    # Avaliação da população
    fitness_populacao = list(map(toolbox.evaluate, populacao))
    for ind, fit in zip(populacao, fitness_populacao):
        ind.fitness.values = fit

    # Seleção dos pais
    pais = toolbox.select(populacao, len(populacao))

    # Cruzamento (Crossover)
    pais = list(toolbox.map(toolbox.clone, pais))
    for pai1, pai2 in zip(pais[::2], pais[1::2]):
        if random.random() < TAXA_CRUZAMENTO:
            toolbox.mate(pai1, pai2)
            del pai1.fitness.values
            del pai2.fitness.values

    # Mutação
    for mutant in pais:
        if random.random() < TAXA_MUTACAO:
            toolbox.mutate(mutant)
            del mutant.fitness.values

    # Substituição da população
    populacao[:] = pais

# Encontrando o melhor indivíduo
melhor_individuo = tools.selBest(populacao, 1)[0]
print("Melhor indivíduo:", melhor_individuo, "Fitness:", melhor_individuo.fitness.values[0])


Melhor indivíduo: [13, 4, 7] Fitness: 3.0


In [8]:
import random
import numpy as np
from deap import base, creator, tools, algorithms

# Função fictícia com três ramos condicionais
def funcao_ficticia(a, b, c):
    if a > 10:
        pass  # Ramo 1
    if b < 5:
        pass  # Ramo 2
    if c == 7:
        pass  # Ramo 3

# Função de adequação (fitness) que calcula a cobertura de ramos
def fitness(individuo):
    a, b, c = individuo
    cobertura = 0
    if a > 10:
        cobertura += 1
    if b < 5:
        cobertura += 1
    if c == 7:
        cobertura += 1
    return cobertura,

# Parâmetros do Algoritmo Genético
TAMANHO_POPULACAO = 100
TAXA_CRUZAMENTO = 0.8
TAXA_MUTACAO = 0.1
NUMERO_GERACOES = 50

creator.create("FitnessMax", base.Fitness, weights=(1.0,))
creator.create("Individuo", list, fitness=creator.FitnessMax)

toolbox = base.Toolbox()
toolbox.register("attr_int", random.randint, 0, 20)
toolbox.register("individuo", tools.initRepeat, creator.Individuo, toolbox.attr_int, n=3)
toolbox.register("populacao", tools.initRepeat, list, toolbox.individuo)

toolbox.register("evaluate", fitness)
toolbox.register("mate", tools.cxOnePoint)
toolbox.register("mutate", tools.mutUniformInt, low=0, up=20, indpb=0.1)
toolbox.register("select", tools.selNSGA2)

populacao = toolbox.populacao(n=TAMANHO_POPULACAO)

stats = tools.Statistics(lambda ind: ind.fitness.values)
stats.register("avg", np.mean)
stats.register("min", min)
stats.register("max", max)

logbook = tools.Logbook()

populacao, logbook = algorithms.eaSimple(
    populacao,
    toolbox,
    cxpb=TAXA_CRUZAMENTO,
    mutpb=TAXA_MUTACAO,
    ngen=NUMERO_GERACOES,
    stats=stats,
    verbose=True,
)

# Encontrando o melhor indivíduo
melhor_individuo = tools.selBest(populacao, 1)[0]
print("Melhor indivíduo:", melhor_individuo, "Fitness:", melhor_individuo.fitness.values[0])


gen	nevals	avg 	min   	max   
0  	100   	0.78	(0.0,)	(2.0,)
1  	82    	0.79	(0.0,)	(2.0,)
2  	88    	0.79	(0.0,)	(2.0,)
3  	90    	0.79	(0.0,)	(2.0,)
4  	84    	0.76	(0.0,)	(2.0,)
5  	82    	0.77	(0.0,)	(3.0,)
6  	80    	0.8 	(0.0,)	(3.0,)
7  	86    	0.8 	(0.0,)	(3.0,)
8  	83    	0.8 	(0.0,)	(3.0,)
9  	92    	0.81	(0.0,)	(3.0,)
10 	87    	0.82	(0.0,)	(3.0,)
11 	86    	0.83	(0.0,)	(3.0,)
12 	81    	0.82	(0.0,)	(3.0,)
13 	75    	0.82	(0.0,)	(3.0,)
14 	87    	0.82	(0.0,)	(3.0,)
15 	81    	0.81	(0.0,)	(3.0,)
16 	86    	0.81	(0.0,)	(3.0,)
17 	90    	0.79	(0.0,)	(3.0,)
18 	74    	0.8 	(0.0,)	(3.0,)
19 	83    	0.8 	(0.0,)	(3.0,)
20 	71    	0.81	(0.0,)	(3.0,)
21 	82    	0.81	(0.0,)	(3.0,)
22 	83    	0.82	(0.0,)	(3.0,)
23 	87    	0.8 	(0.0,)	(3.0,)
24 	81    	0.81	(0.0,)	(3.0,)
25 	80    	0.81	(0.0,)	(3.0,)
26 	89    	0.8 	(0.0,)	(3.0,)
27 	80    	0.8 	(0.0,)	(3.0,)
28 	78    	0.8 	(0.0,)	(3.0,)
29 	74    	0.8 	(0.0,)	(3.0,)
30 	90    	0.79	(0.0,)	(3.0,)
31 	80    	0.78	(0.0,)	(3.0,)
32 	79    

# Melhores práticas e ferramentas para aplicar o SBSE na indústria

Ao aplicar técnicas de SBSE em ambientes industriais, existem várias práticas recomendadas e ferramentas que podem ser usadas para melhorar a eficácia e a eficiência do processo de SBSE.

- Definir objetivos claros e critérios de sucesso: Antes de iniciar o processo SBSE, é importante definir objetivos claros e critérios de sucesso para o problema em questão. Isso ajudará a garantir que o processo SBSE esteja focado na solução do problema certo e que os resultados possam ser avaliados e comparados com os padrões de referência estabelecidos.

- Use representações apropriadas do problema: A escolha da representação do problema é crucial para a eficácia e eficiência do processo SBSE. É importante usar representações que sejam adequadas para o problema em questão e que possam ser manipuladas de forma eficiente pelos algoritmos de otimização.

- Use algoritmos e metaheurísticas de otimização apropriados: A escolha do algoritmo de otimização ou metaheurística também é crucial para a eficácia e eficiência do processo SBSE. É importante usar algoritmos e metaheurísticas que sejam adequados para o problema em questão e que possam explorar o espaço de busca de forma eficiente.

- Use métricas de desempenho e análises estatísticas apropriadas: Para avaliar os resultados do processo SBSE, é importante usar métricas de desempenho e análises estatísticas apropriadas. Isso ajudará a garantir que os resultados sejam confiáveis e que o processo SBSE esteja fazendo um progresso significativo em direção aos objetivos.

- Use ferramentas e bibliotecas apropriadas: Existem várias ferramentas e bibliotecas de código aberto que podem ser usadas para implementar técnicas de SBSE em configurações da indústria. Alguns exemplos dessas ferramentas incluem EvoSuite, DEAP, Optunity e PyGMO. Essas ferramentas fornecem componentes e funções pré-construídos que podem ser usados para implementar técnicas de SBSE, o que pode ajudar a reduzir o tempo de desenvolvimento e o esforço necessário. 

- Monitore e adapte o processo: É importante monitorar o progresso do processo SBSE e adaptá-lo conforme necessário. Isso pode envolver ajustar os parâmetros dos algoritmos de otimização ou metaheurísticas, ajustar a representação do problema ou ajustar as métricas de desempenho e análise estatística.

- Comunicar os resultados: É importante comunicar os resultados do processo SBSE às partes interessadas relevantes. Isso pode envolver o fornecimento de relatórios detalhados, visualizações ou painéis interativos que fornecem informações sobre os resultados e o progresso do processo SBSE.

- Melhorar continuamente o processo: SBSE é um processo contínuo e é importante melhorar continuamente o processo com base nos resultados e feedback. Isso pode envolver a incorporação de novas técnicas, ferramentas ou práticas recomendadas ao processo, ou fazer ajustes no processo para melhorar sua eficácia e eficiência.

## Exemplos

- Defina objetivos claros e critérios de sucesso: por exemplo, uma empresa deseja otimizar o desempenho de seu sistema de software. Os objetivos do processo SBSE seriam melhorar o desempenho do sistema de software e o critério de sucesso seria um certo aumento de desempenho, como reduzir o tempo de resposta em 30%.

- Use representações de problemas apropriadas: por exemplo, representando o sistema de software como um gráfico, onde os nós representam componentes e as arestas representam as interações entre os componentes. Essa representação é adequada para o problema em questão, pois permite a otimização das interações entre os componentes, o que pode melhorar o desempenho do sistema de software.

- Use algoritmos de otimização apropriados e metaheurísticas: Por exemplo, usando um algoritmo genético para otimizar o desempenho do sistema de software. Algoritmos genéticos são adequados para este problema, pois podem explorar de forma eficiente o grande espaço de busca de possíveis interações entre os componentes.

- Use métricas de desempenho e análises estatísticas apropriadas: por exemplo, usando o tempo de resposta como métrica de desempenho e usando técnicas estatísticas como ANOVA para comparar os resultados do processo SBSE com os resultados de um grupo de controle.

- Use ferramentas e bibliotecas apropriadas: Por exemplo, usando a biblioteca DEAP em Python para implementar o algoritmo genético. O DEAP fornece componentes e funções pré-construídos para a implementação de algoritmos genéticos, que podem ajudar a reduzir o tempo de desenvolvimento e o esforço necessário.

- Monitorar e adaptar o processo: por exemplo, monitorar o progresso do processo SBSE rastreando o tempo de resposta do sistema de software ao longo do tempo. Caso o tempo de resposta não esteja diminuindo conforme o esperado, pode ser necessário adaptar o processo ajustando os parâmetros do algoritmo genético ou ajustando a representação do problema.

- Comunique os resultados: por exemplo, fornecendo um painel que mostra o tempo de resposta do sistema de software ao longo do tempo e o impacto do processo SBSE no tempo de resposta. Isso pode ajudar as partes interessadas a entender o progresso do processo SBSE e os resultados alcançados.

- Melhore continuamente o processo: por exemplo, incorporando feedback das partes interessadas no processo SBSE e experimentando diferentes algoritmos de otimização e metaheurísticas para encontrar a melhor abordagem para o problema em questão.

É importante observar que esses exemplos são gerais e casos específicos podem ter necessidades diferentes, mas a ideia geral é adaptar o processo ao contexto específico.

# Priorização de Casos de Teste

A priorização de casos de teste baseada em busca é uma técnica de engenharia de software que utiliza algoritmos de busca para ordenar os casos de teste de acordo com critérios específicos, visando maximizar a eficácia do processo de teste. Essa abordagem é particularmente útil em situações em que o tempo e os recursos para a execução de testes são limitados, permitindo que os testadores se concentrem nos casos de teste mais relevantes e informativos.



## Ferramentas para Priorização de Casos de Teste

- **TestPrioritizer**: É uma ferramenta de código aberto que usa algoritmos genéticos para priorizar casos de teste com base em critérios como cobertura de código, complexidade do caso de teste e frequência de falhas. Ele suporta várias linguagens de programação, incluindo Java, C ++ e C #.

- **OptimizeTest**: É uma ferramenta de priorização de casos de teste baseada em algoritmos genéticos que considera tanto a cobertura de código quanto a importância do requisito do sistema. Ele é projetado para trabalhar com projetos de software em C ++.

- **Tarantula**: É uma técnica de priorização de casos de teste que usa a fórmula de Tarantula para calcular a pontuação de cada caso de teste com base na frequência com que o caso de teste falha nos testes de sucesso e falha. Ele foi originalmente desenvolvido para projetos em Java, mas pode ser usado com outras linguagens de programação.

- **DeSTInE**: É uma ferramenta de priorização de casos de teste baseada em algoritmos genéticos que considera a cobertura de código, a complexidade do caso de teste e a frequência com que o caso de teste falha nos testes de sucesso e falha. Ele suporta vários idiomas, incluindo Java, C ++ e C #.

- **AETG**: É uma ferramenta de priorização de casos de teste baseada em um algoritmo determinístico que usa técnicas de planejamento experimental para selecionar uma subconjunto de casos de teste que maximize a cobertura de parâmetros de entrada. Ele é usado principalmente para testar software com entradas configuráveis, como sistemas de controle de processos ou sistemas de gerenciamento de banco de dados.

In [None]:
import numpy as np
import random
from operator import attrgetter

# Dados do exemplo
"""
matriz que representa a relação entre os casos de teste e os 
requisitos do software que eles cobrem. 
Cada linha da matriz corresponde a um caso de teste e 
cada coluna corresponde a um requisito. 
Se um caso de teste cobre um determinado requisito,
o valor na posição correspondente na matriz será 1; caso contrário, será 0.

Por exemplo, o primeiro caso de teste (primeira linha) 
cobre os requisitos 1, 3 e 5, enquanto o segundo caso de teste (segunda linha)
cobre os requisitos 2 e 4.
"""
cobertura = np.array([
    [1, 0, 1, 0, 1],
    [0, 1, 0, 1, 0],
    [1, 1, 0, 0, 1],
    [0, 0, 1, 1, 0],
    [1, 0, 0, 1, 1]
])
importancia_requisitos = np.array([3, 2, 4, 1, 5])

# Configurações do GA
num_geracoes = 100
tam_populacao = 50
taxa_cruzamento = 0.8
taxa_mutacao = 0.1

# Função para calcular o fitness de um indivíduo
def calcular_fitness(individuo):
    cobertura_total = cobertura[individuo].sum(axis=0)
    importancia_total = (cobertura_total > 0).dot(importancia_requisitos)
    return importancia_total

# Função para gerar a população inicial
def gerar_populacao_inicial():
    populacao = []
    for _ in range(tam_populacao):
        # Permutação que indica a ordem em que os casos de teste devem 
        # ser executados para maximizar a cobertura de código e a importância dos requisitos.
        individuo = np.random.permutation(len(cobertura))
        populacao.append(individuo)    
    return populacao

# Função para selecionar pais usando seleção por torneio
def selecao_torneio(populacao, k=2):
    pais = []
    for _ in range(2):
        competidores = random.sample(populacao, k)
        vencedor = max(competidores, key=calcular_fitness)
        pais.append(vencedor)
    return pais

# Função para aplicar o cruzamento ordenado (OX - Ordered Crossover)
def crossover(pais):
    if random.random() < taxa_cruzamento:
        tamanho = len(pais[0])
        corte1, corte2 = sorted(random.sample(range(tamanho), 2))
        filho = [-1] * tamanho
        filho[corte1:corte2] = pais[0][corte1:corte2]
        
        pos_filho = corte2
        for gene in pais[1]:
            if gene not in filho:
                while filho[pos_filho % tamanho] != -1:
                    pos_filho += 1
                filho[pos_filho % tamanho] = gene
                pos_filho += 1
                
    else:
        filho = pais[0].copy()
    
    return filho

# Função para aplicar mutação por troca
def mutacao(individuo):
    if random.random() < taxa_mutacao:
        pos1, pos2 = random.sample(range(len(individuo)), 2)
        individuo[pos1], individuo[pos2] = individuo[pos2], individuo[pos1]

# Execução do GA
populacao = gerar_populacao_inicial()

for geracao in range(num_geracoes):
    nova_populacao = []
    
    for _ in range(tam_populacao):
        pais = selecao_torneio(populacao)
        filho = crossover(pais)
        mutacao(filho)
        nova_populacao.append(filho)
    populacao = nova_populacao
       
melhor_individuo = max(populacao, key=calcular_fitness)
print("Melhor solução encontrada:", melhor_individuo)
print("Fitness:", calcular_fitness(melhor_individuo))

Melhor solução encontrada: [4, 0, 1, 2, 3]
Fitness: 15


Este exemplo demonstra uma implementação básica de um algoritmo genético para resolver o problema de priorização de casos de teste. Note que o algoritmo pode ser aprimorado e adaptado para abordar cenários mais complexos e realistas, como a consideração de restrições de tempo, recursos e dependências entre casos de teste. Além disso, é importante ajustar os parâmetros do algoritmo, como o tamanho da população, o número de gerações e as taxas de cruzamento e mutação, para obter os melhores resultados para o seu problema específico.




In [9]:
import numpy as np
import random
from deap import base, creator, tools, algorithms

# Dados do exemplo
cobertura = np.array([
    [1, 0, 1, 0, 1],
    [0, 1, 0, 1, 0],
    [1, 1, 0, 0, 1],
    [0, 0, 1, 1, 0],
    [1, 0, 0, 1, 1]
])
importancia_requisitos = np.array([3, 2, 4, 1, 5])

# Adicionando tempo de execução fictício para cada caso de teste
tempos_execucao = np.array([5.0, 3.0, 7.0, 2.0, 4.0])

# Configurações do GA
num_geracoes = 100
tam_populacao = 50
taxa_cruzamento = 0.8
taxa_mutacao = 0.1

# Função para calcular o fitness de um indivíduo
def calcular_fitness(individuo):
    cobertura_total = cobertura[individuo].sum(axis=0)
    importancia_total = (cobertura_total > 0).dot(importancia_requisitos)
    
    tempo_execucao_total = tempos_execucao[individuo].sum()
    
    return importancia_total, -tempo_execucao_total

creator.create("FitnessMulti", base.Fitness, weights=(1.0, -1.0))
creator.create("Individuo", list, fitness=creator.FitnessMulti)

toolbox = base.Toolbox()

toolbox.register("indices", np.random.permutation, len(cobertura))
toolbox.register("individuo", tools.initIterate, creator.Individuo, toolbox.indices)
toolbox.register("populacao", tools.initRepeat, list, toolbox.individuo)

toolbox.register("evaluate", calcular_fitness)
toolbox.register("mate", tools.cxOrdered)
toolbox.register("mutate", tools.mutShuffleIndexes, indpb=0.05)
toolbox.register("select", tools.selNSGA2) # 

populacao = toolbox.populacao(n=tam_populacao)

# Estatísticas
stats = tools.Statistics(lambda ind: ind.fitness.values)
stats.register("min", np.min, axis=0)
stats.register("max", np.max, axis=0)
stats.register("avg", np.mean, axis=0)

populacao, logbook = algorithms.eaSimple(
    populacao,
    toolbox,
    cxpb=taxa_cruzamento,
    mutpb=taxa_mutacao,
    ngen=num_geracoes,
    stats=stats,
    verbose=True
)

melhor_individuo = tools.selBest(populacao, 1)[0]
print("Melhor solução encontrada:", melhor_individuo)
print("Fitness:", calcular_fitness(melhor_individuo))


gen	nevals	min        	max        	avg        
0  	50    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
1  	44    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
2  	37    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
3  	36    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
4  	42    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
5  	45    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
6  	41    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
7  	38    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
8  	45    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
9  	39    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
10 	45    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
11 	43    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
12 	42    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
13 	46    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
14 	40    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
15 	44    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
16 	44    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
17 	42    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
18 	35    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
19 	42    	[ 15. -21.]	[ 15. -21.]	[ 15. -21.]
20 	44    	[ 

Neste exemplo, adicionamos uma lista `tempos_execucao` que contém os tempos de execução fictícios de cada caso de teste. Em seguida, modificamos a função `calcular_fitness` para calcular o tempo de execução total e retornar uma tupla com dois elementos: importância total e tempo (negativo, para minimizar) 

Além disso, o código foi adaptado para utilizar o algoritmo NSGA-II da biblioteca DEAP. A função de seleção foi substituída por `tools.selNSGA2`, que implementa o algoritmo NSGA-II. Bem como utilizamos a função `algorithms.eaSimple` para realizar a evolução da população. Essa função simplifica o processo de evolução, gerenciando as iterações e a aplicação das operações genéticas (cruzamento, mutação e seleção) ao longo das gerações.

## Sugestão de Leitura

- A. Bajaj and O. P. Sangwan, [A Systematic Literature Review of Test Case Prioritization Using Genetic Algorithms](https://ieeexplore.ieee.org/abstract/document/8819910) in IEEE Access, vol. 7, pp. 126355-126375, 2019, doi: 10.1109/ACCESS.2019.2938260. 
  - Artigo aberto
- Michael, C. C., McGraw, G., & Schatz, M. A. (2001). Generating software test data by evolution. IEEE Transactions on software engineering, 27(12), 1085-1110.
- Yoo, S., & Harman, M. (2012). Regression testing minimization, selection and prioritization: a survey. Software testing, verification and reliability, 22(2), 67-120.

# Search-Based Refactoring

"Search-based Software Refactoring" (Refatoração de Software Baseada em Busca) é uma técnica que usa algoritmos de busca para automatizar o processo de refatoração de software. A refatoração de software é o processo de melhorar a estrutura interna do código-fonte sem alterar seu comportamento externo. O objetivo é tornar o código mais legível, fácil de entender, fácil de manter e mais eficiente em termos de desempenho.



## Code Smells

A refatoração de software é um processo importante na manutenção e evolução de um software. Para ajudar os desenvolvedores a identificar oportunidades de refatoração, foram criados os "code smells" (maus cheiros de código), que são indicações de que o código-fonte precisa ser refatorado. Esses "code smells" incluem, por exemplo, código duplicado, métodos muito grandes, classes muito complexas, entre outros.

Existem várias técnicas de refatoração que podem ser aplicadas para corrigir os "code smells". Algumas das técnicas mais comuns incluem a extração de métodos, a extração de classes, a renomeação de variáveis, a eliminação de código duplicado, entre outras.

A tabela a seguir compara diferentes tipos de "code smells" que podem ser encontrados em projetos de software. Cada "code smell" é descrito em termos de sua definição geral e pode ser usado como uma indicação de que o código-fonte precisa ser refatorado para melhorar sua qualidade e facilidade de manutenção. Cada "code smell" pode ser detectado usando técnicas de análise de código-fonte ou inspeção manual de código. Ao identificar esses "code smells", os desenvolvedores podem tomar medidas para corrigi-los usando técnicas de refatoração de software adequadas.

| Code Smell |	Descrição |
|---|---|
|Duplicação de código |	Código idêntico ou semelhante em vários lugares no software|
|Métodos longos |	Métodos com muitas linhas de código ou muitas responsabilidades|
|Classes grandes |	Classes com muitas linhas de código ou muitas responsabilidades|
|Métodos com muitos parâmetros |	Métodos com muitos argumentos|
|Complexidade condicional	| Estruturas de controle de fluxo complexas (if, switch, etc.)|
|Código inalcançável	| Código que nunca é executado ou acessado|
|Comentários excessivos	| Comentários que não são úteis para entender o código|
|Nomes inadequados	| Nomes de variáveis, métodos ou classes que não são descritivos|
|Má organização do código	| Código que não segue padrões de organização ou convenções|
|Classes não coesas	| Classes com responsabilidades não relacionadas ou conflitantes |



## Técnicas de Refactoring

As técnicas de refatoração são usadas para melhorar a qualidade do código-fonte, tornando-o mais legível, mais fácil de manter e mais eficiente em termos de desempenho. A refatoração é o processo de modificar o código-fonte sem alterar seu comportamento externo. Algumas das técnicas de refatoração mais comuns incluem:

- **Extração de método**: Consiste em extrair uma seção de código de um método e transformá-la em um novo método para melhorar a legibilidade e a organização do código.

- **Extração de classe**: Consiste em criar uma nova classe para mover métodos e dados relacionados a uma nova classe para melhorar a organização do código e reduzir a complexidade.

- **Renomeação de variáveis e métodos**: Consiste em renomear variáveis e métodos para tornar seu nome mais significativo e descritivo.

- **Eliminação de código duplicado**: Consiste em remover códigos que são iguais ou muito semelhantes em diferentes partes do código.

- **Simplificação de estruturas de controle de fluxo**: Consiste em simplificar estruturas de controle de fluxo complexas, como loops aninhados, para melhorar a legibilidade do código.

- **Reorganização de parâmetros**: Consiste em reorganizar os parâmetros de um método para torná-lo mais fácil de entender e utilizar.

Essas técnicas de refatoração podem ser aplicadas manualmente ou com o auxílio de ferramentas de refatoração, como o Eclipse e o Visual Studio. A aplicação de técnicas de refatoração pode ajudar a melhorar a qualidade do código-fonte, reduzindo a complexidade e tornando-o mais fácil de manter e evoluir ao longo do tempo.



## Otimização em Refactoring

A técnica de "Search-based Software Refactoring" pode ser usada para automatizar a identificação de oportunidades de refatoração e a seleção das melhores técnicas de refatoração para corrigir os "code smells". Ela pode usar técnicas de busca como algoritmos genéticos, busca local e otimização multiobjetivo para encontrar soluções de refatoração que atendam a critérios específicos, como melhorar a qualidade do código, reduzir a complexidade ou melhorar a performance.

A otimização multiobjetivo é uma técnica de busca que permite otimizar vários objetivos simultaneamente. Na refatoração de software, isso pode ser útil para encontrar soluções que atendam a vários critérios de qualidade, como legibilidade do código, eficiência, manutenibilidade e simplicidade.

Existem várias ferramentas de refatoração de software baseadas em busca disponíveis atualmente, como o ReFacTo, o JCharon e o Opt4J. Essas ferramentas usam diferentes técnicas de busca e critérios de avaliação para identificar e implementar soluções de refatoração em projetos de software. Alguns exemplos de soluções de refatoração implementadas por essas ferramentas incluem a eliminação de código duplicado, a extração de classes e a renomeação de variáveis.

Em resumo, a técnica de "Search-based Software Refactoring" pode ser uma abordagem eficaz para automatizar o processo de refatoração de software, identificando oportunidades de refatoração e selecionando as melhores técnicas de refatoração para corrigir os "code smells". Além disso, a otimização multiobjetivo e as ferramentas de refatoração baseadas em busca podem ser úteis para otimizar vários objetivos simultaneamente e implementar soluções de refatoração em projetos de software de forma mais eficiente.

## Código 





### Exemplo 1

Suponha que temos uma função que calcula o fatorial de um número e queremos refatorá-la para melhorar a legibilidade e reduzir o tamanho do código. Aqui está a função original:


In [14]:
def factorial(n):
    if n == 0:
        return 1
    else:
        return n * factorial(n-1)


Para refatorar essa função, podemos usar um algoritmo genético para otimizar o código. Podemos definir o tamanho do código e a legibilidade como nossos objetivos de otimização, e usar as operações de mutação e crossover para gerar novos indivíduos.

In [19]:
import random
import numpy as np
from deap import algorithms, base, creator, tools

# Definição dos objetivos
creator.create("FitnessMulti", base.Fitness, weights=(-1.0, -1.0))

# Definição da estrutura do indivíduo
creator.create("Individual", list, fitness=creator.FitnessMulti)

# Definição das operações genéticas
toolbox = base.Toolbox()

# Operação de mutação
def mutShuffle(individual):
    idx1 = random.randint(0, len(individual) - 1)
    idx2 = random.randint(0, len(individual) - 1)
    individual[idx1], individual[idx2] = individual[idx2], individual[idx1]
    return individual,

toolbox.register("mutate", mutShuffle)

# Operação de seleção
toolbox.register("select", tools.selNSGA2)

# Operação de crossover
toolbox.register("mate", tools.cxUniform, indpb=0.5)

# Definição da função de avaliação dos objetivos
def evaluate(individual):
    # Transforma o indivíduo em código-fonte
    code = ''.join(individual).replace('i', 'if n == 0: return 1\n    else: return n * factorial(n-1)').replace('r', 'return')
    # Executa o código e captura exceções
    try:
        exec(code)
        result = factorial(5)
    except Exception as e:
        result = 1000000
    # Ajuste do tamanho do código
    code_size = len(individual)
    # Avaliação da legibilidade do código
    readability = len([c for c in individual if c in ['i', 'r']]) / len(individual)
    # Retorna uma tupla com os objetivos
    return code_size, readability

toolbox.register("evaluate", evaluate)

# Definição da população inicial
def generateIndividual():
    return [random.choice(['i', 'r']) for i in range(100)]

toolbox.register("individual", tools.initIterate, creator.Individual, generateIndividual)
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

# Definição dos parâmetros do algoritmo
pop = toolbox.population(n=100)
hof = tools.HallOfFame(1)
stats = tools.Statistics(lambda ind: ind.fitness.values)
stats.register("avg", np.mean, axis=0)
stats.register("std", np.std, axis=0)
stats.register("min", np.min, axis=0)
stats.register("max", np.max, axis=0)

# Roda o algoritmo de otimização multiobjetivo
algorithms.eaMuPlusLambda(pop, toolbox, mu=100, lambda_=100, cxpb=0.5, mutpb=0.2, ngen=50, stats=stats, halloffame=hof)

# Imprime a melhor solução encontrada
print(hof[0])




gen	nevals	avg        	std    	min        	max        
0  	100   	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
1  	64    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
2  	77    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
3  	67    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
4  	67    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
5  	68    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
6  	70    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
7  	73    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
8  	70    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
9  	72    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
10 	78    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
11 	71    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
12 	66    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
13 	67    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
14 	68    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
15 	75    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
16 	76    	[100.   1.]	[0. 0.]	[100.   1.]	[100.   1.]
17 	64    

Este código usa a biblioteca DEAP para implementar um algoritmo genético que refatora uma função Python. O algoritmo é executado por 50 gerações e usa uma população de 100 indivíduos. As operações genéticas definidas incluem mutação e crossover, e os objetivos de otimização são o tamanho do código e a legibilidade do código. A função evaluate avalia cada indivíduo em relação

### Exemplo 2

Suponha que temos um código com dois objetivos conflitantes: reduzir o tamanho do código e melhorar a legibilidade do código. Queremos encontrar uma solução que otimize ambos os objetivos simultaneamente.


In [13]:
import random
import numpy as np
from deap import algorithms, base, creator, tools

# Definição dos objetivos
creator.create("FitnessMulti", base.Fitness, weights=(-1.0, -1.0))

# Definição da estrutura do indivíduo
creator.create("Individual", list, fitness=creator.FitnessMulti)

# Definição das operações genéticas
toolbox = base.Toolbox()

# Operação de mutação
def mutShuffle(individual):
    idx1 = random.randint(0, len(individual) - 1)
    idx2 = random.randint(0, len(individual) - 1)
    individual[idx1], individual[idx2] = individual[idx2], individual[idx1]
    return individual,

toolbox.register("mutate", mutShuffle)

# Operação de seleção
toolbox.register("select", tools.selNSGA2)

# Operação de crossover
toolbox.register("mate", tools.cxUniform, indpb=0.5)

# Definição da função de avaliação dos objetivos
def evaluate(individual):
    # Ajuste do tamanho do código
    code_size = len(''.join(individual))
    # Avaliação da legibilidade do código
    readability = len([c for c in individual if c in ['(', ')', '{', '}', ':', '\n']])
    # Retorna uma tupla com os objetivos
    return code_size, readability

toolbox.register("evaluate", evaluate)

# Definição da população inicial
def generateIndividual():
    return [random.choice(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', ' ', '\n', '(', ')', '{', '}', ':']) for i in range(100)]

toolbox.register("individual", tools.initIterate, creator.Individual, generateIndividual)
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

# Definição dos parâmetros do algoritmo
pop = toolbox.population(n=100)
hof = tools.HallOfFame(1)
stats = tools.Statistics(lambda ind: ind.fitness.values)
stats.register("avg", np.mean, axis=0)
stats.register("std", np.std, axis=0)
stats.register("min", np.min, axis=0)
stats.register("max", np.max, axis=0)

# Roda o algoritmo de otimização multiobjetivo
algorithms.eaMuPlusLambda(pop, toolbox, mu=50, lambda_=50, cxpb=0.5, mutpb=0.2, ngen=100, stats=stats, halloffame=hof)

# Exibe a melhor solução encontrada
print("Melhor solução: ", hof[0])




gen	nevals	avg            	std                    	min        	max        
0  	100   	[100.    18.42]	[0.         4.41628803]	[100.   7.]	[100.  30.]
1  	28    	[100.    13.92]	[0.         1.85299757]	[100.   7.]	[100.  16.]
2  	36    	[100.    12.54]	[0.         1.60262285]	[100.   7.]	[100.  14.]
3  	35    	[100.   11.2]  	[0.         1.67332005]	[100.   7.]	[100.  13.]
4  	38    	[100.     9.52]	[0.         1.15308282]	[100.   7.]	[100.  12.]
5  	31    	[100.     8.18]	[0.         1.01370607]	[100.   6.]	[100.  10.]
6  	36    	[100.     7.26]	[0.         0.68731361]	[100.   6.]	[100.   8.]
7  	44    	[100.     6.38]	[0.         0.77175126]	[100.   3.]	[100.   7.]
8  	35    	[100.     5.62]	[0.         0.91411159]	[100.   3.]	[100.   7.]
9  	33    	[100.     4.94]	[0.         1.08461975]	[100.   3.]	[100.   6.]
10 	41    	[100.     3.96]	[0.         0.91564185]	[100.   2.]	[100.   5.]
11 	36    	[100.     3.22]	[0.   0.46]            	[100.   2.]	[100.   4.]
12 	40    	[100.     2.82

Neste exemplo, usamos o algoritmo NSGA-II para otimizar simultaneamente o tamanho do código e a legibilidade do código.

- O indivíduo é uma lista de caracteres que representa o código-fonte após a aplicação de uma técnica de refatoração. Cada posição na lista corresponde a um caractere no código-fonte, incluindo letras, espaços, quebras de linha, parênteses, chaves e dois-pontos. O comprimento da lista representa o tamanho total do código-fonte refatorado.
- A função de avaliação avalia o tamanho do código e a legibilidade do código e retorna uma tupla com os objetivos. 
- As operações genéticas definidas incluem a mutação e o crossover.
- A população inicial é gerada aleatoriamente e o algoritmo de otimização é executado por um determinado número de gerações. No final, a melhor solução é exibida.
 

Durante o processo de otimização multiobjetivo, cada indivíduo é avaliado em relação a dois objetivos conflitantes: reduzir o tamanho do código e melhorar a legibilidade do código. A função de avaliação avalia cada indivíduo em relação a esses dois objetivos, retornando uma tupla com os valores de cada objetivo.

Cada indivíduo é submetido a operações genéticas, como mutação e crossover, que visam gerar novos indivíduos com características semelhantes ou melhores que os indivíduos pais. O algoritmo de otimização busca encontrar a melhor combinação de indivíduos que otimize simultaneamente ambos os objetivos de refatoração.



## Ferramentas de Refactoring

- Suporte à refatoração do Eclipse IDE
- **Ref-Finder**: Ref-Finder identifica refatorações entre duas versões de programas Java. É um plugin do Eclipse capaz de mostrar quais refatorações foram utilizadas dentre as 96 refatorações do catálogo de Fowler.
- **Code-Imp**: uma ferramenta automatizada de refatoração baseada em pesquisa, que suporta um conjunto de refatorações, métricas e algoritmos de pesquisa. A ferramenta funciona aplicando refatorações a uma representação AST de programas Java. Um conjunto de 14 refatorações é utilizado no nível de métodos, campos e classes. O usuário deve escolher as métricas a serem utilizadas na função fitness e a técnica de busca a ser executada. As técnicas de busca disponíveis são Hill Climbing,
Recozimento Simulado e Algoritmo Genético. Para compor a função fitness, estão disponíveis 28 métricas e o usuário pode fazer qualquer combinação delas. Eles podem ser combinados usando uma soma ponderada ou otimização de Pareto, o primeiro define um peso para cada métrica e o segundo considera uma melhoria se pelo menos um valor da métrica for aumentado sem diminuir os outros


## Sugestão de Leitura

- Fowler, M. (2018). Refactoring: improving the design of existing code. Addison-Wesley Professional.
- Ouni, A., Kessentini, M., Sahraoui, H., & Hamdi, M. S. (2012). Search-based refactoring: Towards semantics preservation. In 2012 28th IEEE International Conference on Software Maintenance (ICSM) (pp. 347-356). IEEE.
- **Mariani, Thainá, and Silvia Regina Vergilio. "A systematic review on search-based refactoring." Information and Software Technology 83 (2017): 14-34.**