Busca aleatória
===============



## Introdução



Uma forma simples de se encontrar uma solução para um `problema de otimização` é realizando uma `busca aleatória`. A busca aleatória, como o próprio nome sugere, é um algoritmo onde um certo `espaço de busca` é definido de onde sorteamos `candidatos` de soluções para o problema.

Diferentemente de outros algoritmos de otimização, a busca aleatória não requer que a `função objetivo` seja diferenciável nem contínua.

Um algoritmo de busca aleatória segue os seguintes passos:

1.  Um espaço de busca é definido

2.  Um candidato $x$ dentro do espaço de busca é sorteado aleatoriamente

3.  Calculamos o resultado da função objetivo para o candidato $x$

4.  Se o critério de parada for atingido, encerrar o algoritmo e retornar ao usuário o candidato que teve melhor resultado durante a busca. Do contrário, retorne ao passo 2



## Reflexões



Você diria que o algoritmo de busca aleatória é determinístico ou probabilístico?

Em quais problemas de otimização você acredita que este algoritmo seja uma boa escolha?

Em quais problemas de otimização você acredita que este algoritmo seja uma má escolha?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo de busca aleatória. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.

Como todo problema computacional, um dos desafios é &ldquo;traduzir&rdquo; o problema dado em estruturas computacionais.



## Importações



In [1]:
import random

## Códigos e discussão



In [2]:
# preciso de uma lista para representar meu indivíduo
# quantidade de elementos na lista é o número de genes
# cada gene pode ser 0 ou 1, vou gerar esses números aleatoriamente

def gene_cb():
    """Gera um gene válido para o problema das caixas binárias.
    
    Return:
      Um valor zero ou um.
    """
    lista = [0,1]
    gene = random.choice(lista)
    return gene
    

def individuo_cb(n):
    """Gera um indivíduo para o problema das caixas binárias.
    
    Args:
      n: número de genes do indivíduo.
    
    Return:
      Uma lista com n genes. Cada gene é um valor zero ou um.
    """
    individuo = []
    for i in range(n):
        gene = gene_cb()
        individuo.append(gene)
    return individuo
    

def funcao_objetivo_cb(individuo):
    """Computa a função objetivo no problema das caixas binárias.
    
    Args:
      individuo: lista contendo os genes das caixas binárias.
    
    Return:
      Um valor representando a soma dos genes do indivíduo.
    """
    return sum(individuo)

In [3]:
# constantes

NUM_CANDIDATOS = 8
NUM_GENES = 4

In [4]:
for n in range(NUM_CANDIDATOS):
    candidato = individuo_cb(NUM_GENES)
    fobj = funcao_objetivo_cb(candidato)
    print(candidato, fobj)

[1, 0, 1, 1] 3
[1, 0, 1, 0] 2
[0, 0, 0, 1] 1
[1, 1, 1, 1] 4
[1, 0, 0, 0] 1
[1, 0, 0, 1] 2
[0, 1, 1, 1] 3
[0, 1, 1, 0] 2


## Conclusão

Resolvemos o problema das caixas binárias com 4 caixas. Utilizamos a busca aleatória e, para isso, foi preciso importarmos a biblioteca "random" para que, dentro da função que gera um gene válido, a escolha do gene pudesse ser aleatória, além de que criamos funções para gerar uma lista que representa o indíviduo, sendo cada elemento um gene (0 ou 1) e outra para somar todos os genes, que era a definição da nossa função objetivo. Observamos através de várias rodadas que este é um algoritmo probabilístico, pois o resultado obtido em diversas rodadas foi diferente, cada pessoa da turma obteve um resultado diferente nas diversas rodadas qeu testaram.

Acredito que esse algoritmo é uma boa escolha quando se tem um número muito grande de "genes" (caixas) e muitas opções de valores para eles, porque essa ideia de colocar um número de parada e fazer escolha aleatória para os genes aparenta ser vantajoso para ser menos custoso, já que há chances de rodas menos vezes e chegar em um bom resultado, uma função objetivo mais próxima da ideal. 

Porém, para números não tão grandes de genes, pode ser que tenha mais chances, pelo número de parada e por poder repetir visto aleatoriedade, de rodar mais do que o necessário se comparado a métodos determinísticos, que poderiam resultar, rodando menos vezes, no que seria o ideal de se encontrar para a função objetivo. 

## Playground

