Algoritmos gulosos
==================

**Autor:** Daniel R. Cassar



## Introdução



Em diversos problemas que precisamos resolver, nós temos o interesse de **maximizar** ou **minimizar** um certo resultado. Vamos ver alguns exemplos.



### Exemplos de situações onde queremos maximizar algo



1.  Maximizar o tempo de bateria do celular: podemos alterar o brilho, fechar aplicativos que estão ativos, ligar o modo avião, etc.

2.  Maximizando a eficiência do estudo: podemos escolher fontes mais didáticas, realizar pausas estratégicas para reter o conhecimento, priorizar disciplinas com relação a afinidade, debater o assunto com algum colega, etc.

3.  Maximizando a velocidade da internet: escolhemos onde colocar o roteador de internet considerando os cômodos da casa a fim de ter uma boa velocidade nos lugares que mais ficamos.



### Exemplos de situações onde queremos minimizar algo



1.  Minimizar o tempo ou o percurso: escolhemos o menor caminho ou o caminho mais rápido quando vamos nos locomover de um local a outro.

2.  Minimizando o tempo de fila: no supermercado, buscamos escolher uma fila que tenha menos pessoas ou pessoas com menos itens na frente.

3.  Minimizando gasto energético: desligamos as luzes e certos aparelhos (ventiladores, por exemplo) quando saímos de um cômodo para economizar energia e reduzir o valor pago ao final do mês.



### Definição



Problemas onde queremos maximizar ou minimizar um ou mais objetivos são chamados de **problemas de otimização**.

Existem diversas estratégias para resolver problemas de otimização. A escolha da estratégia a ser utilizada depende do problema. Existem diversos **algoritmos de otimização**, porém nem todo algoritmo de otimização pode ser utilizado em todo problema de otimização.



## Algoritmos gulosos



Existe uma estratégia para resolver problemas de otimização chamada de *greedy algorithms* que, por incrível que pareça, não são chamados de *algoritmos gananciosos* (como a tradução sugeriria), mas sim são chamados de **algoritmos gulosos**&#x2026;

A estratégia de um algoritmo guloso é muito simples: a cada passo do problema, opte pela &ldquo;melhor escolha&rdquo; dentre as existentes (o conceito de &ldquo;melhor escolha&rdquo; ficará mais claro ao longo do texto). Após a escolha ter sido realizada, não olhe para trás, siga em frente e realize outra &ldquo;melhor escolha&rdquo; caso necessário. Repita esse processo até não existirem mais escolhas para serem feitas. Relativamente simples, não é? Vamos alguns exemplos.



## O problema dos cursos (maximização)



### Contextualização



Suponha que chegaram as férias e você quer fazer alguns cursos para complementar seus estudos. Seu objetivo é fazer o **máximo** de cursos possível! Chamamos este tipo de problema de **problema de maximização**.

Os cursos oferecidos nestas férias (e seus respectivos horários) são:

-   Curso de cálculo quântico 5: das 11:00 às 12:30
-   Curso de peteca medieval: das 9:00 às 10:30
-   Curso de poesia de elevador: das 10:00 às 11:30
-   Curso de biologia da antimatéria: das 8:00 às 9:30
-   Curso de paleontologia para tabeliões: das 12:00 às 13:30

Oh não! Não é possível fazer todos os cursos por conta de conflito de horários! Como escolher os cursos de forma a *fazer o máximo de cursos possível*? Uma solução para este problema é usar um algoritmo guloso!



### Formalização



**Problema**: escolher a maior quantidade de cursos disponíveis sem que haja conflito de horário.

**Entrada**: a relação de cursos disponíveis com seus respectivos horários.

**Saída**: uma lista de cursos que podem ser cursados sem que haja conflito de horário.



### Algoritmo



1.  Escolha o curso que termina mais cedo;

2.  Escolha o curso que termina mais cedo e que comece depois do horário de encerramento do curso que acabou de escolher;

3.  Repita o passo 2 até que não existam mais cursos disponíveis

Observe que este algoritmo faz uma escolha baseada em uma consideração simples (neste caso, esta seria &ldquo;a melhor escolha&rdquo; na visão do algoritmo) e após a escolha ter sido feita, ele não retorna para reconsiderar a escolha feita, apenas segue em frente.

No final das contas, após rodar este algoritmo você irá fazer os seguintes cursos nestas férias:

-   Curso de biologia da antimatéria: das 8:00 às 9:30
-   Curso de poesia de elevador: das 10:00 às 11:30
-   Curso de paleontologia para tabeliões: das 12:00 às 13:30



### Discussão



Um fato curioso sobre este algoritmo que acabamos de usar neste problema é que ele sempre encontra a **melhor resposta** para esse problema (lembrando que o objetivo é de *fazer o máximo de cursos possível*).

**Cuidado**: nem sempre um algoritmo guloso encontra a melhor resposta, mas neste caso isso é verdade. Pode checar, não existe nenhuma resposta melhor que essa neste caso se seu objetivo é maximizar a *quantidade* de cursos.

Em certos problemas, podemos ter **empate** na posição de melhor resposta (por exemplo, duas respostas com cursos diferentes mas com a mesma quantidade de cursos). Neste caso, o algoritmo estudado irá encontrar apenas uma das melhores respostas.



## O problema do troco (minimização)



### Contextualização



Suponha um caixa de supermercado que tenha um estoque infinito de moedas. Sempre que for dar um troco em dinheiro, o caixa deve entregar a **menor** quantidade de moedas possível para o cliente. Chamamos este tipo de problema de `problema de minimização`.



### Formalização



**Problema**: encontrar a menor quantidade de moedas para dar como troco em uma transação financeira.

**Entrada**: um número real menor ou igual a 1 com no máximo dois dígitos representando o troco a ser retornado.

**Saída**: uma lista representando a menor quantidade de moedas válidas em território brasileiro que, quando somadas, são iguais ao número de entrada.



### Algoritmo



Podemos resolver esse problema com um algoritmo guloso? Certamente! Para isso devemos sempre escolher a moeda de maior valor em cada momento de escolha (esta é a &ldquo;melhor escolha&rdquo; segundo o algoritmo). Suponha que o troco deve ser de 41 centavos:

1.  Para 41 centavos, a maior moeda disponível é a de 25 centavos. $41-25=16$
2.  Para 16 centavos, a maior moeda disponível é a de 10 centavos. $16-10=6$
3.  Para 6 centavos, a maior moeda disponível é a de 5 centavos. $6-5=1$
4.  Para 1 centavo, a maior moeda disponível é a de 1 centavo. $1-1=0$
5.  Fim, o troco total foi pago.

No final, entregamos ao cliente apenas 4 moedas: uma de 25 centavos, uma de 10 centavos, uma de 5 centavos e uma de 1 centavo. Novamente, este algoritmo guloso fornece a **melhor resposta** para esse problema (desde que você esteja trabalhando com moedas válidas dentro do território brasileiro, isto é: 1, 5, 10, 25 e 50 centavos e a moeda de 1 real)!



## O problema de encontrar a menor distância em grafos ponderados (minimização)



Na aula de grafos nós nos deparamos com o problema de encontrar a menor distância em um grafo ponderado (seja ele direcional ou não). O algoritmo que nós vimos foi o de Dijkstra (lembrando que ele funciona apenas para grafos com pesos maiores ou iguais a zero).

No algoritmo de Dijkstra, a escolha de cada passo a ser dado era sempre pelo vértice não-visitado com a menor distância conhecida. Observe que a &ldquo;melhor escolha&rdquo; é realizada e, uma vez realizada, não retornamos para revê-la. Logo, o algoritmo de Dijkstra é um algoritmo guloso. Não apenas isso, mas ele é capaz de encontrar a **melhor resposta** neste tipo de problema (deste que a restrição dos pesos do grafo serem maiores ou iguais a zero seja respeitada).



## O problema da mochila (maximização com restrição)



### Contextualização



Suponha que você tem uma mochila com capacidade de carregar no máximo 2 quilogramas. Se você colocar uma grama a mais além da capacidade máxima, sua mochila rasga e tudo que você colocou nela quebra de forma catastrófica ao se chocar com o chão (indesejável).

Suponha que você quer encher a sua mochila e para isso pode escolher qualquer combinação de itens da lista abaixo. Seu interesse é **maximizar** o preço de venda dos itens que colocou na sua mochila sem que ela rasgue.

-   Mapa para chegar ao tesouro *Dois Pedaços*. **Peso**: 200 g. **Valor**: 9.
-   Varinha mágica do Haroldo Poteiro. **Peso**: 550 g. **Valor**: 7.
-   Elixir da energia infinita (dura 30 minutos). **Peso**: 1200 g. **Valor**: 10.
-   Mini pinscher capaz de ler mentes. **Peso**: 1700 g. **Valor**: 12.
-   Mensagem na garrafa (o que será que está escrito?). **Peso**: 200 g. **Valor**: 2.
-   Computador IBM 5100 com o monitor quebrado. **Peso**: 3200 g. **Valor**: 500.

Neste caso temos um **problema de maximização com restrição**.

Este é um problema famoso, então é bom saber que o nome dele em inglês é *knapsack problem*.



### Formalização



**Problema**: encontrar um conjunto de itens que atende a restrição de peso da mochila e que tenham o maior valor quando somado.

**Entrada**: relação dos itens disponíveis, cada um com um com seu peso e valor.

**Saída**: uma lista com os itens que serão colocados na mochila.



### Algoritmo



Um algoritmo para resolver o problema apresentado é o seguinte:

1.  Teste todas as soluções possíveis;

2.  Retorne ao usuário a melhor solução encontrada no passo 1.

Esse algoritmo tem complexidade $\mathrm{O}(2^n)$, onde $n$ é o número de itens disponíveis.



### Algoritmo com menor complexidade, é possível?



Podemos fazer melhor que o algoritmo acima? Vamos explorar o uso de um algoritmo guloso para resolver este problema:

1.  Pegue o item mais caro disponível que ainda caiba dentro da capacidade da sua mochila;

2.  Repita o passo 1 até que não seja mais possível pegar um novo item.

Ou seja, a cada escolha possível, o algoritmo guloso tenta **otimizar localmente** a resposta (esta é a &ldquo;melhor escolha&rdquo; no contexto deste algoritmo). Ele faz isso pegando sempre o item mais caro possível, sem ligar para outras combinações. Veja que o algoritmo guloso jamais retorna para checar outras soluções&#x2026; ele só &ldquo;segue em frente&rdquo;!

Seguindo esse algoritmo, você deveria pegar primeiro o mini pinscher pois é o item mais caro que ainda cabe na mochila. Com isso, sobrariam ainda 300 gramas dentro da restrição da mochila. O item mais caro que pesa menos que 300 gramas é o mapa do tesouro; colocamos este item na mochila. Como não tem nenhum item com 100 gramas ou menos essa é a resposta final obtida pelo algoritmo guloso. Com estes dois itens a mochila tem um valor total de 21 unidades de dinheiro e um peso total de 1900 gramas, dentro do limite de 2 quilogramas que a mochila aguenta.

A pergunta agora é: a resposta do algoritmo guloso é a **melhor resposta** para este problema?

&#x2026;

Não é! Seria melhor ter pego o elixir, o mapa do tesouro e a varinha, totalizando uma mochila com o valor de 26 unidades de dinheiro e um peso total de 1950 gramas. Esta é a melhor resposta deste problema específico, porém ela não foi encontrada pelo algoritmo guloso.

Às vezes, algoritmos gulosos **não nos entregam a melhor resposta**. A vantagem deles é que eles *entregam* uma solução e entregam ela *rápido* (a complexidade do algoritmo guloso neste caso é $O(n \log(n))$ devido a necessidade de ordenar os itens para encontrar o de maior valor). Não apenas isso, a solução encontrada costuma ser uma solução razoavelmente boa dentro das restrições do problema.

No exemplo dado nós tínhamos apenas 6 itens, neste caso é relativamente fácil checar *todas* as combinações possíveis e encontrar a **melhor resposta**. Checar todas as respostas de um problema tem um nome, chama-se **busca exaustiva**.

Imagine resolver esse problema com uma lista de 50 itens com diferentes pesos e valores! Nesse caso, teríamos que checar $2^{50}$ combinações diferentes para encontrar a tão elusiva **melhor resposta** (se cada combinação demorasse 1 segundo para testarmos, levaríamos um pouco mais que 35 mil milênios para terminar a conta). Não temos como encontrar a **melhor resposta** para esse problema de maneira eficiente&#x2026; Não apenas isso, mas para esse problema em particular, se você encontrar uma resposta qualquer não tem como você dizer que ela é a **melhor resposta** sem checar *todas* as outras&#x2026;

Diversos problemas de otimização são assim: encontrar a **melhor resposta** é uma tarefa que pode ser proibitivamente demorada! Nestes casos, não temos outra saída a não ser usar algoritmos que encontram uma resposta razoavelmente boa. Um algoritmo que entrega uma resposta razoavelmente boa é um **algoritmo de aproximação**. O termo técnico para uma *resposta razoavelmente boa* é uma **solução aproximada**.



## O problema do caixeiro viajante (minimização com restrição)



### Contextualização



Suponha que você terminou seu curso na Ilum e usou seu conhecimento científico para desenvolver um novo produto revolucionário. Você abriu uma *startup* e agora irá fabricar seu novo produto. Agora só falta o mundo conhecer sua invenção e, claro, comprar seu produto para que você tenha sucesso profissional e financeiro!

Só tem um probleminha! Seu investimento inicial foi muito grande e agora você não tem muito dinheiro sobrando para viajar pelo Brasil vendendo seu produto&#x2026; seu objetivo é viajar para $n$ cidades de maneira otimizada (percorrendo a menor quantidade de quilômetros), visitando todas elas apenas uma vez e apresentando seu produto em cada uma delas. Ao final das visitas, você retorna para sua cidade de partida. Como planejar a sua rota otimizada?

Essa é a ideia do problema clássico do caixeiro viajante! Trata-se de um **problema de minimização com restrição**. O enunciado relativamente simples pode nos enganar num primeiro momento, mas veja que com apenas $n=5$ cidades nós temos que checar $5!=120$ rotas possíveis para encontrar a **melhor resposta**! Se quiser visitar $n=10$ cidades terá que checar mais de três milhões e meio de rotas!

Este é um problema famoso, então é bom saber que o nome dele em inglês é *traveling salesman problem* ou simplesmente TSP.



### Formalização



**Problema**: dado um conjunto de cidades e uma cidade inicial (ponto de partida), encontrar o caminho de menor distância que visita todas as cidades e retorna para a cidade inicial.

**Entrada**: a coordenada $x$ e $y$ de um conjunto de cidades e uma cidade inicial.

**Saída**: a ordem de visitação das cidades de entrada que minimizam a distância do percurso realizado.



### Algoritmo



Um algoritmo para resolver o problema apresentado é o seguinte:

1.  Teste todas as rotas possíveis;

2.  Retorne ao usuário a rota de menor distância encontrada no passo 1.

Esse algoritmo tem complexidade $\mathrm{O}(n!)$, onde $n$ é o número de cidades que serão visitadas.



### Solução aproximada com algoritmo guloso



Uma forma de encontrar uma **solução aproximada** para esse problema é usando um algoritmo guloso. O algoritmo é relativamente simples:

1.  Da cidade em que você está (que será o ponto de partida ao início do algoritmo), cheque a distância para todas as cidades ainda não visitadas e viaje até a cidade ainda não visitada mais próxima;

2.  Repita o passo 1 até que todas as cidades sejam visitadas;

3.  Retorne à cidade inicial.

O problema do caixeiro viajante é outro tipo de problema onde checar todas as soluções fica computacionalmente proibitivo muito rapidamente com o aumento de $n$, uma vez que o número de rotas aumenta com o fatorial de $n$. Esse é um dos problemas ainda abertos em ciência da computação: existe um algoritmo eficiente que encontra a **melhor resposta** para esse problema? Diversos cientistas da computação acreditam que a resposta é não&#x2026;



## Problemas NP



### Problemas da classe P e problemas da classe NP



O problema da mochila e o problema do caixeiro viajante são problemas que não são possíveis de serem resolvidos em tempo polinomial (os algoritmos gulosos não *resolvem* estes problemas, apenas encontram soluções aproximadas). O que significa um problema ser resolvido em tempo polinomial? Significa que o tempo gasto para resolvermos o algoritmo aumenta de forma polinomial com relação ao aumento da informação de entrada (lembre-se da complexidade de algoritmos e da notação do $O$ grande).

O tempo de execução do algoritmo de encontrar o valor máximo em uma lista aumenta linearmente com o tamanho da lista (vimos isso na aula sobre complexidade). Logo esse é um algoritmo que pode ser resolvido em tempo polinomial (tempo linear é um caso específico de tempo polinomial).

O tempo de execução do algoritmo de encontrar índices duplicados em uma lista aumenta com o quadrado do tamanho da lista. Logo esse algoritmo também pode ser resolvido em tempo polinomial.

Para encontrar a **melhor resposta** do problema da mochila, nós precisamos checar $2^k$ possibilidades, onde $k$ é o número de itens disponíveis. Logo, checar todas as possibilidades deste problema é um algoritmo de complexidade exponencial. Esse problema (ainda) *não* pode ser resolvido em tempo polinomial!

Para encontrar a **melhor resposta** do problema do caixeiro viajante, nós precisamos checar $n!$ possibilidades, onde $n$ é o número de cidades a serem visitadas. Logo, checar todas as possibilidades deste problema é um algoritmo de complexidade fatorial. Esse problema (ainda) *não* pode ser resolvido em tempo polinomial!

Problemas que *não podem* ser resolvidos com algoritmos que operam em tempo polinomial são conhecidos como **problemas da classe NP**. Da mesma forma, problemas que *podem* ser resolvidos com algoritmos que operam em tempo polinomial são conhecidos como **problemas da classe P**. Existe uma pergunta em aberto na matemática, conhecida como $P\overset{?}{=}NP$, que é um dos Problemas do Milênio mais famosos ainda não solucionados [1].

Existem três tipos de problemas NP que são particularmente importantes e serão apresentados abaixo.



### Problemas da classe NP



Um problema está na **classe NP** se, dada uma solução candidata, é possível verificar se ela é válida por meio de um algoritmo que roda em tempo polinomial ou melhor.

**Exemplo**: problema de fatoração de inteiros (encontrar os fatores primos de um número inteiro).



### Problemas da classe NP-completo



Problemas **NP-completos** são os problemas mais difíceis da classe NP.

O que significa serem os problemas mais difíceis da classe NP? Significa que todo problema em NP pode ser reduzido ou transformado em um problema NP-completo utilizando um algoritmo de complexidade polinomial. [2]

Um fato interessante é que se encontrarmos um algoritmo eficiente (tempo polinomial) para resolver qualquer problema NP-completo, todos os problemas da classe NP também poderão ser resolvidos eficientemente. [2]

**Exemplo**: a versão de decisão do problema da mochila onde apenas queremos checar se existe uma combinação de itens que resulta em um dado peso específico (desconsiderados os valores dos itens).



### Problemas da classe NP-difícil



Um problema está na **classe NP-difícil** se, dada uma solução candidata, é necessário verificar *todas* as soluções possíveis para checar se ela é de fato a solução do problema.

Em outras palavras, mesmo que uma solução interesante seja obtida, o algoritmo que prova que ela é a solução do problema tem complexidade pior que polinomial.

**Exemplos**: os problemas da mochila e do caixeiro viajante apresentados neste notebook são problemas da classe NP-difícil.



## XKCD relevante



![img](https://imgs.xkcd.com/comics/np_complete.png)

`Imagem: NP-Complete (XKCD) disponível em https://xkcd.com/287`



## Referências



1.  Artigo da Wikipédia sobre o Problema P versus NP [https://pt.wikipedia.org/wiki/P_versus_NP](https://pt.wikipedia.org/wiki/P_versus_NP)

2.  Artigo da Wikipédia sobre problemas da classe NP-completo [https://en.wikipedia.org/wiki/NP-completeness](https://en.wikipedia.org/wiki/NP-completeness)

3.  Artigo da Wikipédia sobre problemas NP [https://en.wikipedia.org/wiki/NP_(complexity)](https://en.wikipedia.org/wiki/NP_(complexity))

