Busca em grade
==============



## Introdução



Uma forma de se encontrar uma solução para um problema de otimização é realizando uma `busca em grade`. Uma busca em grade nada mais é do que testar exaustivamente todas as combinações possíveis entre um ou mais conjunto de parâmetros.

Vamos supor que você queira testar dois parâmetros em um problema de otimização, $p$ e $q$. Os valores possíveis para $p$ e $q$ estão exibidos abaixo:

$p = \{0, 1, 2\}$

$q = \{a, b, c\}$

Em uma busca em grade, nós iremos testar todas as combinações entre $p$ e $q$, sendo elas: $(0, a)$, $(0, b)$, $(0,c)$, $(1, a)$, $(1, b)$, $(1,c)$, $(2, a)$, $(2, b)$ e $(2,c)$.

Um algoritmo de busca em grade segue os seguintes passos:

1.  Definir quais são os parâmetros e quais são os valores possíveis para cada parâmetro

2.  Computar e armazenar o resultado da função objetivo para todas as combinações possíveis dos parâmetros definidos no passo 1

3.  Retornar ao usuário a combinação de parâmetros que teve o melhor resultado durante a busca.



## Reflexões



Você diria que o algoritmo de busca em grade é determinístico ou probabilístico?

Será que a busca em grade é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que você espera da performance do algoritmo de busca em grade? Como a performance varia com o número de parâmetros e o número de itens nos conjuntos de valores de cada parâmetro?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo de busca em grade. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
from funcoes import funçãoObjetivo_cb
import itertools

## Códigos e discussão



In [2]:
# Constantes:

NUM_GENES = 4

In [3]:
# Script:

valoresPossíveis = [0, 1]
dicionário = {}

for indivíduo in itertools.product(valoresPossíveis, repeat = 4):
    candidato = indivíduo
    fobj = funçãoObjetivo_cb(candidato)
    nomeDoCandidato = ''.join(str(candidato[i]) for i in range(len(candidato)))
    dicionário[nomeDoCandidato] = fobj

resultado = max(dicionário.items())

print('Os candidatos e suas métricas obtidas foram:')
print(dicionário)
print()
print('O melhor candidato e sua métrica foi:')
print(resultado)

Os candidatos e suas métricas obtidas foram:
{'0000': 0, '0001': 1, '0010': 1, '0011': 2, '0100': 1, '0101': 2, '0110': 2, '0111': 3, '1000': 1, '1001': 2, '1010': 2, '1011': 3, '1100': 2, '1101': 3, '1110': 3, '1111': 4}

O melhor candidato e sua métrica foi:
('1111', 4)


## Conclusão

O problema das caixas binárias foi resolvido neste notebook a partir da implementação de um `algoritmo de busca em grade`.

O algoritmo foi implementado com uso da biblioteca `itertools`, e pode ser caracterizado como determinístico, nesse caso - afinal todos os indivíduos possíveis foram analisados.

A busca em grade é interessante por ser capaz de encontrar mínimos ou máximos *globais* da função objetivo. Como mencionado acima, todas as possibilidades são consideradas; isso, naturalmente, garante que o resultado sempre será global.

Sendo assim, essa busca é muito boa para problemas de otimização com um número não muito absurdo de possibilidades de candidatos, pois todas elas serão levadas em conta antes de se concluir um resultado definitivo. O problema das caixas binárias acima é um bom exemplo, afinal todos os 16 indivíduos possíveis foram comparados - o que garante uma solução garantida e global.

Por outro lado, a performance de um algoritmo como esse não é tão rápida e simples como o algoritmo de busca aleatória, realizando muito mais operações (incluindo o cálculo de $2^n$ indivíduos, para $n$ igual ao número de genes, ou "caixas" para esse problema).

## Playground

