Estrutura de Dados - Recursão
==========================================

Capítulo 2 do livro texto sugerido:
Introduction to Algorithms, Fourth Edition
By Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest and Clifford Stein
https://mitpress.mit.edu/9780262046305/introduction-to-algorithms/

Conteúdo
========

Muitos algoritmos complexos podem ser resolvidos através da sua subdivisão em partes menores, posteriormente reunidas na solução final.

Esta divisão do problema pode ser feita até se encontrar um problema mínimo com solução trivial.

A este processo se dá o nome de recursão, e a estratégia é conhecida como dividir para conquistar.

Um algoritmo que pode ser implementado com recursão é o de ordenação Merge-sort.

Assim como todo o algoritmo recursivo, precisamos estabelecer o caso comum e a condição de parada das recursões.

Para o merge sort existem duas condições de parada, sendo ambas triviais:
- Caso a lista tenha até um elemento, ela já está ordenada
- Caso a lista tenha dois elementos, ordênam-se os dois elementos

In [104]:
def mergeSortCondicaoParada(lista):
    # Se só tem um elemento, já está ordenada
    if len(lista) <= 1:
        return lista
    # Se tem dois elementos, comparação é trivial
    if len(lista) == 2:
        if lista[0] > lista[1]:
            return [lista[1], lista[0]]
        else:
            return lista
    # Retorna None caso não seja ainda não tenha
    # atingido uma condição de parada
    return None

print(mergeSortCondicaoParada([]))
print(mergeSortCondicaoParada([1]))
print(mergeSortCondicaoParada([2,1]))
print(mergeSortCondicaoParada([3,2,1])) # não atende a condição de parada len(lista) > 2

[]
[1]
[1, 2]
None


Agora que temos a condição de parada, precisamos tratar o caso comum, onde a lista terá mais de dois elementos e precisará ser dividida em duas partes, as quais serão ordenadas separadamente e depois juntas

In [105]:
def mergeSort(lista):
    listaAtendeCondicaoParada = mergeSortCondicaoParada(lista)
    # Retorna lista já ordenada caso já atenda o critério de parada
    if listaAtendeCondicaoParada is not None:
        return listaAtendeCondicaoParada

    # Quebra a lista em duas metades e chama o mergeSort novamente
    metade = len(lista)//2
    metadeEsquerdaOrdenada = mergeSort(lista[:metade])
    metadeDireitaOrdenada = mergeSort(lista[metade:])

    # Junta metades ordenadas
    listaFinal = []
    while True:
        # Se apenas a metade esquerda tiver elementos,
        # copia todos os elementos para a lista final
        if metadeEsquerdaOrdenada and not metadeDireitaOrdenada:
            listaFinal.extend(metadeEsquerdaOrdenada)
            break
        # Se apenas a metade direita tiver elementos,
        # copia todos os elementos para a lista final
        elif not metadeEsquerdaOrdenada and metadeDireitaOrdenada:
            listaFinal.extend(metadeDireitaOrdenada)
            break
        else:
            # Caso ambas metades contenham elementos,
            # copia o menor primeiro elemento entre as duas listas ordenadas
            if metadeEsquerdaOrdenada[0] < metadeDireitaOrdenada[0]:
                listaFinal.append(metadeEsquerdaOrdenada[0])
                metadeEsquerdaOrdenada.pop(0)
            else:
                listaFinal.append(metadeDireitaOrdenada[0])
                metadeDireitaOrdenada.pop(0)
    return listaFinal

print("Resultado ordenado:", mergeSort([]))
print("Resultado ordenado:", mergeSort([1]))
print("Resultado ordenado:", mergeSort([2,1]))
print("Resultado ordenado:", mergeSort([3,2,1]))
print("Resultado ordenado:", mergeSort([4,3,2,1]))
print("Resultado ordenado:", mergeSort([5,4,3,2,1]))

Resultado ordenado: []
Resultado ordenado: [1]
Resultado ordenado: [1, 2]
Resultado ordenado: [1, 2, 3]
Resultado ordenado: [1, 2, 3, 4]
Resultado ordenado: [1, 2, 3, 4, 5]


Podemos observar a árvore de execução recursiva decorrente das chamadas do mergeSort.

Aqui utilizaremos a ferramenta PyInstrument para fazer a impressão desta árvore.

Perceba que o mergeSort chama a si mesmo duas vezes para processar cada uma das suas metades.



In [106]:
from pyinstrument import Profiler
p = Profiler(interval=0.00001)
p.start()
resultado = mergeSort([500-i for i in range(500)])
p.stop()
print(p.output_text(color=True, show_all=True, timeline=True))


  _     ._   __/__   _ _  _  _ _/_   Recorded: 17:43:57  Samples:  13286
 /_//_/// /_\ / //_// / //_'/ //     Duration: 0.455     CPU time: 0.456
/   _/                      v4.4.0

Program: /mnt/dev/tools/source/ed_2022_2/venv/lib/python3.10/site-packages/ipykernel_launcher.py -f /home/gabriel/.local/share/jupyter/runtime/kernel-5c176e18-6ee9-4e1b-aad9-114ff1f808e2.json

[31m0.454[0m ZMQInteractiveShell.run_ast_nodes[0m  [2mIPython/core/interactiveshell.py:3274[0m
`- [31m0.450[0m [48;5;24m[38;5;15m<module>[0m  [2m../../../tmp/ipykernel_17303/1193443913.py:1[0m
   `- [31m0.450[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipykernel_17303/3417733175.py:1[0m
      |- [33m0.229[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipykernel_17303/3417733175.py:1[0m
      |  |- [33m0.121[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipykernel_17303/3417733175.py:1[0m
      |  |  |- [32m0.073[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/i

Provavelmente irá perceber que a condição de parada não foi impressa, apesar de ter sido executada.

Isto é resultado da medição por amostragem feita pelo PyInstrument.

Se mudarmos o intervalo de amostragem, podemos aumentar a probabilidade de uma amostra aparecer.

In [107]:
from pyinstrument import Profiler
p = Profiler(interval=0.0001)
p.start()
resultado = mergeSort([100-i for i in range(100)])
p.stop()
print(p.output_text(color=True, show_all=True, timeline=True))


  _     ._   __/__   _ _  _  _ _/_   Recorded: 17:43:58  Samples:  7
 /_//_/// /_\ / //_// / //_'/ //     Duration: 0.001     CPU time: 0.001
/   _/                      v4.4.0

Program: /mnt/dev/tools/source/ed_2022_2/venv/lib/python3.10/site-packages/ipykernel_launcher.py -f /home/gabriel/.local/share/jupyter/runtime/kernel-5c176e18-6ee9-4e1b-aad9-114ff1f808e2.json

[31m0.001[0m ZMQInteractiveShell.run_ast_nodes[0m  [2mIPython/core/interactiveshell.py:3274[0m
|- [31m0.001[0m [48;5;24m[38;5;15m<module>[0m  [2m../../../tmp/ipykernel_17303/3508207992.py:1[0m
|  `- [31m0.001[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipykernel_17303/3417733175.py:1[0m
|     `- [31m0.001[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipykernel_17303/3417733175.py:1[0m
|        |- [31m0.001[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipykernel_17303/3417733175.py:1[0m
|        |  |- [32m0.000[0m [48;5;24m[38;5;15mmergeSort[0m  [2m../../../tmp/ipyke

A mesma estratégia recursiva pode ser utilizada para resolver os mais diversos problemas.

Outro exemplo já mostrado na introdução foi a procura pela rota mais curta entre dois vértices de um grafo.

Criemos primeiro um grafo com rotas aéreas entre algumas cidades

In [108]:
class Vertice():
    def __init__(self, nome):
        self.nome = nome
        self.verticesConectados = []

    def adicionarVerticeConectado(self, novoVertice, distancia):
        self.verticesConectados.append((novoVertice, distancia))
        novoVertice.verticesConectados.append((self, distancia))

    def apagarConexao(self, vertice):
        for (verticeConectado, distancia) in self.verticesConectados:
            if verticeConectado == vertice:
                self.verticesConectados.remove((verticeConectado, distancia))
                verticeConectado.verticesConectados.remove((self, distancia))
                break

    def apagarConexoes(self):
        for (verticeConectado, distancia) in self.verticesConectados:
            for verticeTuple in verticeConectado.verticesConectados:
                if verticeTuple[0] == self:
                    verticeConectado.verticesConectados.remove(verticeTuple)
        del self

# Belém (Val-de-cans) e Brasília (Juscelino Kubitscheck)
bel = Vertice("BEL")
bsb = Vertice("BSB")
bel.adicionarVerticeConectado(bsb, 1600)

# Belo Horizonte (Confins)
cnf = Vertice("CNF")
bel.adicionarVerticeConectado(cnf, 2100)
bsb.adicionarVerticeConectado(cnf, 618)

# São Paulo (Guarulhos)
gru = Vertice("GRU")
bel.adicionarVerticeConectado(gru, 2472)
bsb.adicionarVerticeConectado(gru, 876)

# Rio de Janeiro (Galeão)
gig = Vertice("GIG")
gig.adicionarVerticeConectado(gru, 360)
gig.adicionarVerticeConectado(bsb, 936)
gig.adicionarVerticeConectado(cnf, 340)

Em seguida, montamos a estratégia recursiva para encontrar a menor rota

In [109]:
def buscaRotaMaisCurta (verticePartida, verticeDestino, distanciaVisitada=0, verticesVisitados=None):
    # Esta é uma função recursiva
    if verticesVisitados is None:
        verticesVisitados = [verticePartida]

    # A condição de parada é quando o vértice de destino já está na rota,
    # o que significa que chegamos ao destino usando a rota descrita pelos
    # vértices visitados
    if verticeDestino in verticesVisitados:
        return distanciaVisitada, verticesVisitados

    distanciaRotaMaisCurta = 99999999999999 # distância absurda
    rotaMaisCurta = None

    # Para cada vértice conectado ao ponto de partida, explore os vértices conectados
    for (verticeEscala, distancia) in verticePartida.verticesConectados:
        # Não faça duas escalas numa mesma cidade
        if verticeEscala in verticesVisitados:
            continue
        # Busca a menor rota entre o vértice de escala e o destino
        distanciaNovaRota, NovaRota = buscaRotaMaisCurta(verticeEscala,
                                                         verticeDestino,
                                                         distanciaVisitada+distancia,
                                                         [*verticesVisitados, verticeEscala])
        # Pegue sempre a rota mais curta
        if distanciaNovaRota < distanciaRotaMaisCurta:
            distanciaRotaMaisCurta = distanciaNovaRota
            rotaMaisCurta = NovaRota

    # Retorne as rotas parciais mais curtas
    return distanciaRotaMaisCurta, rotaMaisCurta

distancia, rota = buscaRotaMaisCurta(bel, gru)
print("Rota mais curta entre Belém e Guarulhos:%d km passando por %s" % (distancia, list(map(lambda x: x.nome, rota))))

Rota mais curta entre Belém e Guarulhos:2472 km passando por ['BEL', 'GRU']


Agora removamos a conexão direta entre Guarulhos e Belém e procuremos a rota alternativa mais curta

In [110]:
gru.apagarConexao(bel)
distancia, rota = buscaRotaMaisCurta(bel, gru)
print("Rota mais curta entre Belém e Guarulhos:%d km passando por %s" % (distancia, list(map(lambda x: x.nome, rota))))

Rota mais curta entre Belém e Guarulhos:2476 km passando por ['BEL', 'BSB', 'GRU']


Agora removamos a conexão direta entre Brasília e Belém e procuremos a rota alternativa mais curta

In [111]:
bsb.apagarConexao(bel)
from pyinstrument import Profiler
p = Profiler(interval=0.00001)
p.start()
distancia, rota = buscaRotaMaisCurta(bel, gru)
p.stop()
print("Rota mais curta entre Belém e Guarulhos:%d km passando por %s" % (distancia, list(map(lambda x: x.nome, rota))))
print(p.output_text(color=True, show_all=True, timeline=True))

Rota mais curta entre Belém e Guarulhos:2800 km passando por ['BEL', 'CNF', 'GIG', 'GRU']

  _     ._   __/__   _ _  _  _ _/_   Recorded: 17:43:58  Samples:  103
 /_//_/// /_\ / //_// / //_'/ //     Duration: 0.003     CPU time: 0.003
/   _/                      v4.4.0

Program: /mnt/dev/tools/source/ed_2022_2/venv/lib/python3.10/site-packages/ipykernel_launcher.py -f /home/gabriel/.local/share/jupyter/runtime/kernel-5c176e18-6ee9-4e1b-aad9-114ff1f808e2.json

[31m0.003[0m ZMQInteractiveShell.run_ast_nodes[0m  [2mIPython/core/interactiveshell.py:3274[0m
|- [92m[2m0.000[0m [self][0m  [2mNone[0m
|- [92m[2m0.000[0m helper[0m  [2mcontextlib.py:279[0m
|  `- [92m[2m0.000[0m _GeneratorContextManager.__init__[0m  [2mcontextlib.py:102[0m
|- [92m[2m0.000[0m _GeneratorContextManager.__enter__[0m  [2mcontextlib.py:130[0m
|  `- [92m[2m0.000[0m [self][0m  [2mNone[0m
|- [92m[2m0.000[0m XCachingCompiler.__call__[0m  [2mcodeop.py:117[0m
|  |- [92m[2m0.000[0m [

Agora removamos a conexão direta entre Confins e Belém (removendo todos as rotas possíveis)

In [112]:
cnf.apagarConexao(bel)
distancia, rota = buscaRotaMaisCurta(bel, gru)
print("Rota mais curta entre Belém e Guarulhos:%d km passando por %s" % (distancia, rota))

Rota mais curta entre Belém e Guarulhos:99999999999999 km passando por None


Como a rota inexiste (None), a distância máxima da rota é o valor de distância máxima utilizada para comparação dentro do algoritmo.