# Trabalho 2 - Estruturas Discretas

**PUC-Rio, INF1631, Data de entrega: 03/07/2017**

- **Alunos/Matrículas:**
    - **Rafael Rubim Cabral - 1511068**
    - **Gabriela Bevilacqua Gutierrez - 1511241**
    - **Gabriel de Andrade Busquim - 1510549**

### Funções auxiliares de questões:

In [9]:
# OPERAÇÕES EM GRAFOS ORIENTADOS

import sys

def LevantarErro(msg):
    print("\nERRO FATAL: " + str(msg) + "\n")
    sys.exit(0)

# Recebe o path do arquivo e retorna o grafo no formato de um dicionário,
# o número de arestas e o número de vértices dele.
def CriarGrafo(numVerts):
    grafo = {}
    for j in range(1, numVerts + 1):
        grafo[j] = []
    return grafo

# Recebe um grafo e cria um vértice com a primeira enumeração disponível a partir do 1
# ou também aceita opcionalmente um identificicador de vértice específico, desde
# que não haja conflito com vértice já existente.
def CriarVertice(grafo, identificador = None):
    if (identificador == None):
        identificador = 1
        while (identificador in grafo):
            identificador += 1
    else:
        if (identificador in grafo):
            LevantarErro("Vértice já existe")
    grafo[identificador] = []

# Recebe um grafo e um vértice e deleta o vértice do grafo
def DeletarVertice(grafo, vert):
    debug = grafo.pop(vert, None)
    if (debug == None):
        LevantarErro("Vértice não existe")

# Cria aresta (vert1, vert2) no grafo (peso é opcional)
def CriarAresta(grafo, vert1, vert2, peso = 0):
    grafo[vert1].append((vert2, peso))

# Testa se a aresta (vert1, vert2) existe e retorna 1 caso
# ela exista e 0 caso contrário
def TemAresta(grafo, vert1, vert2):
    if (vert1 > len(grafo) or vert2 > len(grafo)):
        LevantarErro("Vértice não existe")
    for i in range(len(grafo[vert1])):
        vert, peso = grafo[vert1][i]
        if (vert == vert2):
            return 1
    return 0

# Retorna o peso da aresta (vert1, vert2)
def PesoAresta(grafo, vert1, vert2):
    if (vert1 > len(grafo) or vert2 > len(grafo)):
        LevantarErro("Vértice não existe")
    for i in range(len(grafo[vert1])):
        vert, peso = grafo[vert1][i]
        if (vert == vert2):
            return peso
    LevantarErro("Aresta não existe")

# Exclui a aresta (vert1, vert2)
def DeletarAresta(grafo, vert1, vert2):
    if (vert1 > len(grafo) or vert2 > len(grafo)):
        LevantarErro("Vértice não existe")
    for i in range(len(grafo[vert1])):
        vert, peso = grafo[vert1][i]
        if (vert == vert2):
            grafo[vert1].pop(i)
            break
    LevantarErro("Aresta não existe")

In [10]:
# FUNÇÕES AUXILIARES

# Função para inserir elemento "elem" em lista "lista" de forma a manter ordem crescente
# (opção de passar uma função "filtro" para alterar critérios de ordenação)
def InsertionSort(lista, elem, filtro = lambda x: x):
    n = len(lista)
    if (n == 0 or filtro(elem) < filtro(lista[0])):
        lista.insert(0, elem)
        return
    for i in range(n - 1):
        if (filtro(elem) >= filtro(lista[i]) and filtro(elem) < filtro(lista[i+1])):
            lista.insert(i+1, elem)
            return
    lista.insert(n, elem)

# Função que retorna índice do maior elemento da lista "lista". Retorna -1 em lista vazia
# (opção de passar uma função "filtro" para alterar critérios de comparação)
def ObterInxMaximo(lista, filtro = lambda x: x):
    inxMax = -1
    maxVal = -1
    for inx, val in enumerate(lista):
        valFiltrado = filtro(val)
        if (inxMax == -1 or valFiltrado > maxVal):
            maxVal = valFiltrado
            inxMax = inx
    return inxMax

# Função que recebe lista de elementos e calcula todas as suas combinações k a k,
# retornando uma lista de combinações (cada combinação é uma lista de elementos
# ordenada em ordem crescente)
# (opção de passar uma função "filtro" para alterar critérios de ordenação. Se
# os elementos de lstElems não forem ordenáveis, a função filtro é obrigatória)
def ObterCombinacoes(lstElems, k, filtro = lambda x: x):
    if (k == 0):
        return [[]]
    combinacoesMenores = ObterCombinacoes(lstElems, k-1)
    totalCombinacoes = []
    for i in lstElems:
        for combinacao in combinacoesMenores:
            if (i not in combinacao):
                novaCombinacao = combinacao[:]
                InsertionSort(novaCombinacao, i, filtro)
                if (novaCombinacao not in totalCombinacoes):
                    totalCombinacoes.append(novaCombinacao)
    return totalCombinacoes

## Questão 1:

**1. Seja um grafo conexo $G = (V,E)$, não-orientado, e $w_{e}$, para $e ∈ E$ os pesos associados às arestas de $G$. Seja o problema de encontrar a árvore geradora de peso máximo de $G$ que contém o vértice $1 ∈ V$ e o teorema abaixo.
Teorema 1 ($K$): Sabe-se encontrar a árvore de peso máximo de $G = (V,E)$ que contém o vértice 1 e possui $K$ vértices.**

### Prova do teorema por indução:

&emsp;Primeiro, imaginou-se a resolução do teorema com um algoritmo parecido com Kruskal, guloso, que parte do vértice 1 e a cada aumento do parâmetro indutivo para $k+1$ (número de vértices), é escolhida uma nova aresta que adicione um novo vértice à arvore já encontrada com $k$ vértices, de maneira a formar uma nova árvore (sem permitir loops). Essa era a ideia discutida em sala de aula, onde chegou-se à conclusão de que é impossível que tal algoritmo funcione sem que o grafo fosse completo e seu desenho obedecesse à desigualdade triangular.<br />
&emsp;Porém, encontramos um contraexemplo para a afirmação acima: encontramos um grafo de 4 vértices completo, que além de obedecer a desigualdade triangular, ainda pode ser desenhado geometricamente de maneira válida (com ângulos e medidas válidas), no qual o algoritmo mencionado não funciona. Segue uma imagem do contraexemplo achado:

![](contraexemplo.png)

&emsp;A imagem acima não é 100% rigorosa quanto às medidas visualmente desenhadas, mas testamos tais medidas numa calculadora de lados/ângulos de triângulos e ela pode ser desenhada de maneira geometricamente certa. Se utilizássemos o algoritmo guloso teríamos o seguinte resultado para $k = 3$ vértices:

- $k = 1$ vértice: Árvore: {1} (Peso total 0)
- $k = 2$ vértices: Árvore: {1 - 4} (Peso total 11)
- $k = 3$ vértices: Árvore: {1 - 4 - 2} (Peso total 11 + 17 = 28)

&emsp;Porém, nesse exemplo, há duas soluções de árvores de peso maior com 3 vértices:

- Árvore: {1 - 2 - 3} (Peso total 10 + 19 = 29)
- Árvore: {1 - 3 - 2} (Peso total 10 + 19 = 29)

&emsp;Portanto, escolhemos implementar um algoritmo diferente, muito menos eficiente, cuja prova seguirá a seguir:

&emsp;A indução é em número de vértices da árvore. Para fazer a prova, precisaremos também de um reforço de hipótese: não apenas sabemos a árvore de maior peso que possui $k$ vértices e contém o vértice 1, mas dado um conjunto $C$ qualquer de $k$ vértices, incluindo o vértice 1, sabemos a árvore de maior peso que contém exatamente os vértices desse conjunto, se existir. Para qualquer número específico $k$, a árvore de maior peso é aquela que possui o maior peso entre todas as árvores de maior peso para todos os conjuntos $C$ de tamanho $k$ que puderem ser considerados.

- Teorema 1 ($k$, $C$): Dado o grafo $G = (V,E)$ e dado o conjunto $C \subset V$ de vértices, tal que $|C| = k$ ($C$ possui $k$ vértices) e tal que o vértice $1 \in C$, sabe-se determinar a árvore de $k$ vértices de peso máximo que contém exatamente todos os vértices de $C$, se existir.

##### Teorema do caso base

&emsp;No caso base $k = 1$, há um único conjunto $C$ possível: $C = \{1\}$. Trivialmente, monta-se uma árvore de 1 vértice que contém somente o vértice 1.

##### Teorema do passo indutivo

- Hipótese indutiva: ($k>1$) para cada conjunto de $k$ vértices que inclui o vértice 1, conhece-se a árvore de maior peso que contém exatamente os $k$ vértices desse conjunto, se existir.

&emsp;Deve-se provar que o mesmo vale para um conjunto qualquer $C$ de $k+1$ vértices que contém o vértice 1. Para isso, vamos levar em conta os fatos seguintes:<br />
&emsp;Suponha que exista uma árvore que contém exatamente os vértices de $C$. A propósito de clareza, daqui pra frente, vamos dizer que essa é uma árvore que representa $C$. Essa árvore possui no mínimo duas folhas. Se retirarmos um vértice diferente do 1 que é folha da árvore do conjunto $C$, teremos um conjunto $C_{2}$ que certamente possui uma árvore que o representa (se retirarmos uma folha de uma árvore de mais de um vértice o que resta ainda compõe uma árvore). Suponha agora que não exista nenhuma árvore que representa $C$. Se retirarmos um vértice qualquer diferente do 1, há duas opções: o conjunto $C_{2}$ restante pode ou não possuir árvore que o representa. Em caso positivo, o vértice retirado não pode possuir aresta no grafo que o ligue a nenhum vértice restante de $C_{2}$, pois se possuísse, poderíamos adicioná-lo à árvore como folha, através dessa aresta. Através das duas suposições anteriores, pode-se tirar a seguinte equivalência sobre o conjunto $C$: se e somente se $C$ possuir árvore que o representa, haverá pelo menos um vértice $v$ folha diferente de 1 que pode ser retirado de $C$ de forma que o conjunto restante $C_{2}$ tenha árvore que o representa e $v$ está ligado por aresta a pelo menos um vértice de $C_{2}$. Portanto:

- Fato(1): Se e somente se não houver um vértice $v$ diferente de 1 que possua ligação com outro vértice de $C$ e que possa ser retirado de forma que o conjunto resultante $C_{2}$ possua árvore representante, então $C$ não possui árvore que o representa.

&emsp;Se C possui pelo menos uma árvore que o representa, então há uma árvore de maior peso $A$ que representa C. De forma similar à prova anterior, haverá ao menos um vértice $v$ folha diferente de 1 dessa árvore de maior peso que pode ser retirado de $C$ de maneira que $v$ possui aresta que o liga ao restante $C_{2}$ e $C_{2}$ possui ao menos uma árvore que o representa. Podemos montar a árvore $A_{2}$, retirando o vértice $v$ a partir da árvore $A$, que representa $C_{2}$. Nesse caso específico, a árvore $A_{2}$ também deve ser a árvore de maior peso que representa $C_{2}$. Isso pode ser provado por contradição: suponha que há uma árvore $B_{2}$ de peso ainda maior que $A_{2}$ que represnta $C_{2}$. Monte a árvore $B$ adicionando o vértice $v$ como folha à arvore $B_{2}$ através da mesma aresta que foi "cortada" para retirá-lo de $A$ (podemos fazê-lo porque o que muda de árvore $A_{2}$ pra árvore $B_{2}$ são as arestas, não os vértices). O peso total da árvore $A$ era $pesoA_{2}+pesoAresta$. O peso total da árvore $B$, que é uma outra árvore que representa $C$, é $pesoB_{2}+pesoAresta$. Mas como $pesoB_{2}$ é maior que $pesoA_{2}$ por suposição, o peso total de $B$ é maior que o peso total de $A$! Isso é um absurdo, pois $A$ é a árvore de maior peso que representa $C$. Por contradição, então, provou-se que ao retirar $v$, folha da árvore de maior peso de $A$, a árvore restante $A_{2}$ é a árvore de maior peso de $C_{2}$.

- Fato(2): Se $C$ possui árvore que o representa, a árvore $A$ de maior peso que o representa possuirá um vértice $v$ folha diferente de 1 que ao ser retirado de $A$ formará a árvore $A_{2}$ de maior peso de $C_{2} = C - {v}$.

&emsp;Com tudo que foi discutido anteriormente, já temos os argumentos necessários pra provar o passo indutivo. Pelo fato 1, concluímos que sabemos testar se um conjunto qualquer $C$ de $k+1$ vértices, incluindo o vértice 1, possui árvore que o representa. Para tanto, basta retirar cada vértice $v$ diferente de 1 de $C$ que possua ligação com algum outro vértice do conjunto e ver, por hipótese indutiva, se $C-{v}$ (aridade $k$) possui árvore de maior peso. Se isso falhar para todos os vértices que se tentou retirar, então $C$ não possui árvore que contém exatamente seus elementos. Se esse teste não falhar para pelo menos um vértice, ainda é conveniente que o teste seja repetido para todos os vértices que possam ser testados dessa maneira. Digamos que temos um conjunto $S$ de vértices para os quais o teste funcionou. Quando se retira cada um deles de $C$ (digamos que retiramos $v$), sabe-se encontrar a árvore de maior peso do conjunto restante $C_{2}$, por hipótese indutiva (chamaremos a árvore de $A_{2}$). Cada um deles tem no mínimo uma aresta que o liga com outro vértice de $C$ (que não ele mesmo). Para cada vértice $v$ em $S$ e a árvore $A_{2}$, pode-se acrescentar $v$ como folha a $A_{2}$ de várias maneiras (cada maneira ligando $v$ a um vértice de $A_{2}$ através de uma das arestas que liga $v$ a $C_{2}$), formando uma árvore $X$ que representa $C$. Pelo fato 2, a árvore $A$ de maior peso estará entre as árvores $X$ montadas. Para encontrá-la, basta ver qual das árvores $X$ possui o maior peso.<br />
&emsp;Assim, provou-se que para qualquer conjunto $C$ de $k+1$ vértices, sabe-se encontrar a árvore de maior peso que contém exatamente os vértices de $C$, se existir.

### Surgimento / Explicação do algoritmo:

&emsp;Como a prova por indução sugere uma implementação recursiva, essa foi a nossa ideia na implementação do algoritmo. Precisamos inicialmente de uma função cápsula "ArvorePesoMax" que recebe o grafo e a quantidade $k$ vértices da árvore desejada e retorna a árvore e o peso total de suas arestas.<br />
&emsp;Como o reforço da hipótese exigiu que para isso, realizássemos o cálculo não somente da árvore de maior peso, mas da árvore de maior peso para todas as combinações diferentes de $k$ vértices $C$, a função cápsula usa uma função auxiliar que cria todas as combinações possíveis de todos os $n$ vértices do grafo inicial recebido, $k$ a $k$. Como a ideia é em todas as combinações incluir o vértice 1, decidiu-se fazer o contrário: não incluirmos o vértice 1 entre os vértices das combinações e assumirmos que ele está implícito em cada conjunto.<br />
&emsp;A árvore de peso máximo para cada $C$ pode assim ser computada recursivamente, se existir, e a árvore de maior peso entre todas é escolhida e retornada junto com seu peso. O único caso de não existir essa árvore para $k$ vértices é se nenhuma das combinações $C$ tiver retornado uma árvore existente.<br />
&emsp;A implementação recursiva faz como é descrito na prova: recebe uma combinação $C$ e procura todos os vértices $v$ que possuem ligações com outros vértices do conjunto (ou com o vértice 1, que não está explícito no conjunto $C$ recebido pela função). Na prática, apenas a aresta $a$ de maior peso entre $v$ e outro vértice de $C$ é importante, por isso ela é guardada. Depois, retira cada um ($v$) e faz uma chamada recursiva passando a nova combinação $C_{2} = C - v$, testando através do retorno dessa chamada recursiva, se há uma árvore que representa $C_{2}$. Se houver, a árvore é guardada. Após repeti-lo para todos os vértices $v$ em $C$ que possuem ligações com outros vértices, pegamos as árvores retornadas e mantemos a que, junto com o vértice $v$ que foi retirado, através da aresta $a$, possuirá o maior peso. A função recursiva retornará então essa árvore inserindo nela o vértice $v$ como folha, através da aresta $a$, junto com o peso total dessa nova árvore. Se nenhuma árvore foi retornada, isso significa que o conjunto $C$ não possui árvore que o representa, então uma árvore inexistente é retornada. No caso base, com $C$ sendo o conjunto vazio (o que significa possuir apenas o vértice 1, implicitamente), uma árvore somente com o vértice 1 é retornada.

### Descrição informal do algoritmo:

&emsp;A função recursiva recebe uma combinação $C$ de vértices (uma lista de índices de vértices) e cria dois dicionários: "vizinhos" e "candidatos".<br />
&emsp;O algoritmo percorre os vértices da combinação $C$, procurando por arestas que os liguem a outros vértices de $C$. Os vértices de $C$ que possuem ligações com outros serão guardados como chaves do dicionário "vizinhos", com o valor de uma lista dos respectivos vértices com os quais ele está ligado.<br />
&emsp;Para cada vértice $v$ que tem no mínimo um vizinho, a função chama-se recursivamente para calcular uma árvore para o conjunto $C_{2} = C - v$. No caso dessa árvore existir ela é guardada em "A2", calcula-se entre todos os vizinhos de $v$ aquele com o qual $v$ possui aresta de maior peso, pois ela será importante. O peso total da árvore retornada por recursão é somado ao peso dessa aresta de maior peso e guardado em "pesoTotal" e o índice do vizinho com o qual $v$ possui essa aresta na lista do dicionário "vizinhos" é guardado em "inxMax".<br />
&emsp;No dicionário "candidatos", cria-se uma chave para o vizinho $v$ que chamou uma recursão que retornou uma árvore e  guarda-se em seu valor uma tupla com 3 entradas: (pesoTotal, inxMax, A2).<br />
&emsp;No final, se nenhum vértice $v$ retornou uma árvore que represente $C_{2} = C - v$, nenhuma árvore que represente o conjunto $C$ existe. Nesse caso a função retorna (None, -1).<br />
&emsp;No caso de no mínimo uma árvore ter sido retornada, todas as tuplas do dicionário "candidatos" são percorridas e mantém-se a que possui maior "pesoTotal". Depois de ser escolhida, usa-se a árvore A2 dessa tupla e adiciona-se a ela, como folha o vértice $v$, através da aresta que ele possui com seu vizinho no índice "inxMax" na lista do dicionário "vizinhos". Essa árvore então é retornada, juntamente com "pesoMax".

In [11]:
# LEITURA DO FORMATO DE GRAFO ESPECÍFICO DA QUESTÃO

def GerarGrafo(nome):
    #Abre o arquivo
    with open(nome, 'r') as file:
        #Pega o número de vertices
        line = file.readline()
        vertices = int (line)
        #Cria um dicionário
        grafo = CriarGrafo(vertices)
        i = 1
        data = file.readlines()
        for line in data: 
            words = line.split()
            for j in range (1, vertices + 1):
                #Liga os vertices no formato vert1[(vert2, peso)]
                if(i != j and -1 != float(words[j - 1])):
                    CriarAresta(grafo, i, j, float(words[j - 1]))
            i = i + 1
    return grafo, vertices

In [4]:
# IMPLEMENTAÇÃO DO ALGORITMO

def ArvorePesoMax(grafo, k):
    # Lista para gerar combinações de vértices
    lstVertices = []
    for vertice in grafo:
        if (vertice != 1):
            lstVertices.append(vertice)
    todasCombinacoesK = ObterCombinacoes(lstVertices, k-1)
    lstResultados = []
    # Para cada combinação de vértices, chama-se a função recursiva ArvorePesoMaxC
    # para encontrar a melhor árvore. Árvores existente são salvas na lista lstResultados
    for C in todasCombinacoesK:
        arvore, peso = ArvorePesoMaxC(grafo, C)
        if (arvore != None):
            lstResultados.append((arvore, peso))
    # Se lstResultados está vazia, não há árvore de $k$ vértices no grafo (pode significar um bug)
    if (lstResultados == []):
        return None, -1
    # Encontrar melhor árvore dentre todas as combinações e retorná-la
    inxMax = ObterInxMaximo(lstResultados, lambda x: x[1])
    return lstResultados[inxMax]
    
def ArvorePesoMaxC(grafo, C):
    # Caso base: C é vazio (1 implícito) -> retornar árvore apenas com vértice 1
    if (C == []):
        return CriarGrafo(1), 0
    vizinhos = {}
    candidatos = {}
    # Para cada v, gerar C2 = C-v e procurar uma aresta de v com algum vértice de C2
    # (ou com o vértice 1, implícito em C e C2)
    for v in C:
        C2 = C[:]
        C2.remove(v)
        # busca de aresta com o vértice 1
        if (1 == TemAresta(grafo, v, 1)):
            # Se v possui vizinhos, inseri-los como uma lista chaveados por v
            if (v not in vizinhos):
                vizinhos[v] = []
            vizinhos[v].append(1)
        # busca de aresta com algum vértice de C2
        for v2 in C2:
            if (1 == TemAresta(grafo, v, v2)):
                # Se v possui vizinhos, inseri-los como uma lista chaveados por v
                if (v not in vizinhos):
                    vizinhos[v] = []
                vizinhos[v].append(v2)
        # Se v possui algum vizinho, chamar recursiva e tentar obter árvore que representa C2
        if (v in vizinhos):
            A2, pesoA2 = ArvorePesoMaxC(grafo, C2)
            # Se não há árvore que represnta C2, não fazer nada
            if (A2 == None):
                continue
            # Encontrar vizinho com o qual v tem a a aresta de maior peso
            inxMax = ObterInxMaximo(vizinhos[v], lambda x: PesoAresta(grafo, v, x))
            maiorPeso = PesoAresta(grafo, v, vizinhos[v][inxMax])
            # Salvar o peso que a árvore retornada terá após a inclusão de v como folha
            pesoTotal = pesoA2 + maiorPeso
            # Salvar tupla do dicionário de candidatos
            candidatos[v] = (pesoTotal, inxMax, A2)
    # Se não há candidatos a árvore que represente C, retornar None
    if (len(candidatos) == 0):
        return None, -1
    melhorCandidato = -1
    maiorPeso = -1
    # Encontrar candidato de maior peso (certo vértice v específico)
    for v in candidatos:
        if (melhorCandidato == -1):
            melhorCandidato = v
            maiorPeso = candidatos[v][0]
        if (candidatos[v][0] > maiorPeso):
            melhorCandidato = v
            maiorPeso = candidatos[v][0]
    # Assertiva
    if (melhorCandidato == -1):
        LevantarErro("Inconsistência")
    # Obter vizinho com o qual v tem aresta que entrará como folha na árvore de C2
    inxVizinho = candidatos[melhorCandidato][1]
    vizinho = vizinhos[melhorCandidato][inxVizinho]
    # Obter árvore que representa C2
    arvoreC = candidatos[melhorCandidato][2]
    peso = PesoAresta(grafo, melhorCandidato, vizinho)
    # Adicionar vértice v como folha da árvore, junto com a aresta decidida
    CriarVertice(arvoreC, melhorCandidato)
    CriarAresta(arvoreC, melhorCandidato, vizinho, peso)
    CriarAresta(arvoreC, vizinho, melhorCandidato, peso)
    # Retornar árvore que representa C
    return arvoreC, candidatos[melhorCandidato][0]

In [12]:
print("Ulysses16\n")

print("\nk = 1\n")
grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 1)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 2\n")
grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 2)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 3\n")
grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 3)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 4\n")
grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 4)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 5\n")
grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 5)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 6\n")
grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 6)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))

Ulysses16


k = 1

Peso da árvore: 0, Árvore:
{1: []}

k = 2

Peso da árvore: 26.0, Árvore:
{1: [(11, 26.0)], 11: [(1, 26.0)]}

k = 3

Peso da árvore: 58.0, Árvore:
{1: [(11, 26.0)], 2: [(11, 32.0)], 11: [(1, 26.0), (2, 32.0)]}

k = 4

Peso da árvore: 89.0, Árvore:
{3: [(11, 31.0)], 1: [(11, 26.0)], 2: [(11, 32.0)], 11: [(1, 26.0), (3, 31.0), (2, 32.0)]}

k = 5

Peso da árvore: 117.0, Árvore:
{3: [(11, 31.0)], 1: [(11, 26.0)], 2: [(11, 32.0)], 11: [(1, 26.0), (4, 28.0), (3, 31.0), (2, 32.0)], 4: [(11, 28.0)]}

k = 6

Peso da árvore: 143.0, Árvore:
{1: [(11, 26.0)], 2: [(11, 32.0)], 3: [(11, 31.0)], 4: [(11, 28.0)], 8: [(11, 26.0)], 11: [(1, 26.0), (4, 28.0), (3, 31.0), (2, 32.0), (8, 26.0)]}


In [13]:
print("Ulysses22\n")
print("\nk = 1\n")
grafo, verts = GerarGrafo("ulysses22.txt")
arvore, peso = ArvorePesoMax(grafo, 1)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 2\n")
grafo, verts = GerarGrafo("ulysses22.txt")
arvore, peso = ArvorePesoMax(grafo, 2)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 3\n")
grafo, verts = GerarGrafo("ulysses22.txt")
arvore, peso = ArvorePesoMax(grafo, 3)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 4\n")
grafo, verts = GerarGrafo("ulysses22.txt")
arvore, peso = ArvorePesoMax(grafo, 4)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 5\n")
grafo, verts = GerarGrafo("ulysses22.txt")
arvore, peso = ArvorePesoMax(grafo, 5)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))

Ulysses22


k = 1

Peso da árvore: 0, Árvore:
{1: []}

k = 2

Peso da árvore: 26.0, Árvore:
{1: [(11, 26.0)], 11: [(1, 26.0)]}

k = 3

Peso da árvore: 58.0, Árvore:
{1: [(11, 26.0)], 2: [(11, 32.0)], 11: [(1, 26.0), (2, 32.0)]}

k = 4

Peso da árvore: 89.0, Árvore:
{3: [(11, 31.0)], 1: [(11, 26.0)], 2: [(11, 32.0)], 11: [(1, 26.0), (3, 31.0), (2, 32.0)]}

k = 5

Peso da árvore: 119.0, Árvore:
{3: [(11, 31.0)], 1: [(11, 26.0)], 2: [(11, 32.0)], 11: [(1, 26.0), (3, 31.0), (2, 32.0), (17, 30.0)], 17: [(11, 30.0)]}


In [14]:
print("Bays29\n")
print("\nk = 1\n")
grafo, verts = GerarGrafo("bays29.txt")
arvore, peso = ArvorePesoMax(grafo, 1)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 2\n")
grafo, verts = GerarGrafo("bays29.txt")
arvore, peso = ArvorePesoMax(grafo, 2)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 3\n")
grafo, verts = GerarGrafo("bays29.txt")
arvore, peso = ArvorePesoMax(grafo, 3)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 4\n")
grafo, verts = GerarGrafo("bays29.txt")
arvore, peso = ArvorePesoMax(grafo, 4)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))
print("\nk = 5\n")
grafo, verts = GerarGrafo("bays29.txt")
arvore, peso = ArvorePesoMax(grafo, 5)
print("Peso da árvore: " + str(peso) + ", Árvore:\n" + str(arvore))

Bays29


k = 1

Peso da árvore: 0, Árvore:
{1: []}

k = 2

Peso da árvore: 1488.0, Árvore:
{1: [(17, 1488.0)], 17: [(1, 1488.0)]}

k = 3

Peso da árvore: 3439.0, Árvore:
{1: [(17, 1488.0)], 12: [(17, 1951.0)], 17: [(1, 1488.0), (12, 1951.0)]}

k = 4

Peso da árvore: 5368.0, Árvore:
{23: [(3, 1991.0)], 1: [(7, 1217.0)], 3: [(7, 2160.0), (23, 1991.0)], 7: [(1, 1217.0), (3, 2160.0)]}

k = 5

Peso da árvore: 7375.0, Árvore:
{3: [(23, 1991.0), (7, 2160.0)], 1: [(17, 1488.0)], 23: [(17, 1736.0), (3, 1991.0)], 7: [(3, 2160.0)], 17: [(1, 1488.0), (23, 1736.0)]}


## Testes de execução

### Ulysses16

In [15]:
import CPUtimer

timer = CPUtimer.CPUTimer()

print("Ulysses16\n")

#Para k = 1
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses16.txt")
    arvore, peso = ArvorePesoMax(grafo, 1)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 1\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 2
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses16.txt")
    arvore, peso = ArvorePesoMax(grafo, 2)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1

timer.stop()
print("\nk = 2\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 3
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses16.txt")
    arvore, peso = ArvorePesoMax(grafo, 3)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 3\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 4
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses16.txt")
    arvore, peso = ArvorePesoMax(grafo, 4)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 4\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 5
timer.reset()
timer.start()

grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 5)
    
timer.stop()
print("\nk = 5\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")

#Para k = 6
timer.reset()
timer.start()

grafo, verts = GerarGrafo("ulysses16.txt")
arvore, peso = ArvorePesoMax(grafo, 6)
    
timer.stop()
print("\nk = 6\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")


Ulysses16


k = 1

Tempo Total: 5.00125295821 s
Número de Execuções: 
9948

k = 2

Tempo Total: 5.00107492287 s
Número de Execuções: 
6952

k = 3

Tempo Total: 5.00108952888 s
Número de Execuções: 
850

k = 4

Tempo Total: 5.10671224792 s
Número de Execuções: 
56

k = 5

Tempo Total: 1.17694106873 s

k = 6

Tempo Total: 12.1688746075 s


### Ulysses22

In [16]:
import CPUtimer

timer = CPUtimer.CPUTimer()

print("Ulysses22\n")

#Para k = 1
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses22.txt")
    arvore, peso = ArvorePesoMax(grafo, 1)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 1\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 2
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses22.txt")
    arvore, peso = ArvorePesoMax(grafo, 2)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 2\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 3
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses22.txt")
    arvore, peso = ArvorePesoMax(grafo, 3)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 3\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 4
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("ulysses22.txt")
    arvore, peso = ArvorePesoMax(grafo, 4)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 4\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 5
timer.reset()
timer.start()

grafo, verts = GerarGrafo("ulysses22.txt")
arvore, peso = ArvorePesoMax(grafo, 5)
    
timer.stop()
print("\nk = 5\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")


Ulysses22


k = 1

Tempo Total: 5.00037580851 s
Número de Execuções: 
6265

k = 2

Tempo Total: 5.00057239742 s
Número de Execuções: 
4540

k = 3

Tempo Total: 5.00931784044 s
Número de Execuções: 
394

k = 4

Tempo Total: 5.0174675954 s
Número de Execuções: 
15

k = 5

Tempo Total: 7.39115270971 s


### Bays29

In [18]:
import CPUtimer

timer = CPUtimer.CPUTimer()

print("Bays29\n")

#Para k = 1
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("bays29.txt")
    arvore, peso = ArvorePesoMax(grafo, 1)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 1\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 2
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("bays29.txt")
    arvore, peso = ArvorePesoMax(grafo, 2)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 2\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 3
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("bays29.txt")
    arvore, peso = ArvorePesoMax(grafo, 3)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 3\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 4
numExecucoes = 0
timer.reset()
timer.start()
tempo = timer.get_time()

while(tempo < 5):  
    grafo, verts = GerarGrafo("bays29.txt")
    arvore, peso = ArvorePesoMax(grafo, 4)
    tempo = timer.get_time()
    timer.lap()
    numExecucoes += 1
    
timer.stop()
print("\nk = 4\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")
print("Número de Execuções: ")
print(numExecucoes)

#Para k = 5
timer.reset()
timer.start()

grafo, verts = GerarGrafo("bays29.txt")
arvore, peso = ArvorePesoMax(grafo, 5)
    
timer.stop()
print("\nk = 5\n")
print("Tempo Total: " + str( timer.get_time() ) +" s")


Bays29


k = 1

Tempo Total: 5.00025777622 s
Número de Execuções: 
3786

k = 2

Tempo Total: 5.00129282865 s
Número de Execuções: 
2959

k = 3

Tempo Total: 5.02007535908 s
Número de Execuções: 
197

k = 4

Tempo Total: 5.01278262122 s
Número de Execuções: 
4

k = 5

Tempo Total: 60.8139542595 s


## Questão 2:

**2. *Walk of a King*<br />
&emsp;Considere um tabuleiro de xadrez e um rei que está inicialmente na posição (1,1) (as posições do tabuleiro são representadas por $(i,j)$ onde $1 ≤ i ≤ 8$ e $1 ≤ j ≤ 8$). Para cada posição do tabuleiro estão associados um prêmio $p_{ij}$ e um consumo $q_{ij}$ (o prêmio pode ser em USD(!!) e o consumo em litros de gasolina, por exemplo). Os prêmios e os consumos assumem somente valores positivos. O rei tem inicialmente $Q$ unidades para consumir e pode passar quantas vezes quiser em cada posição do tabuleiro e a cada vez receber o prêmio e, naturalmente, consumir os seus recursos. Ao ﬁnal (do passeio) o rei tem que estar de volta na posição (1,1).**

### Prova do teorema por indução:

&emsp;Com a gasolina inicial $Q$, precisa-se de um teorema que dirá que se sabe encontrar um caminho para percorrer que inicie na casa do tabuleiro (1, 1) e termine na casa (1, 1) que tenha produto final de prêmios maximizado e que gaste no máximo a gasolina $Q$. Para isso, $k$ será o parâmetro indutivo, que é a quantidade exata de gasolina restante no tanque do rei após percorrer o caminho. No caso base $k = Q$ e passo indutivo para $k - 1$, prova-se que é possível encontrar um caminho (se existir) que maximize os prêmios para cada $k$. No final, o caminho de maior produto total de $k = Q$ até $k = 0$ será o melhor caminho (pois não obrigatoriamente deve-se usar toda a gasolina do tanque), se existir. Como reforço de hipótese para alcançar esse objetivo, será provado que se sabe encontrar o caminho que não necessariamente termine na casa (1, 1), mas em qualquer casa do tabuleiro. Apesar de desnecessário, também se generalizará a casa inicial e o tamanho do tabuleiro, o que quase não muda a prova por indução. Note que não assumiremos custos nulos ou negativos nas casas, pois se fosse o caso, haveriam caminhos que poderiam ser percorridos infinitamente.

- Teorema 2 $(k, c)$:&emsp;Seja um tabuleiro de dimensões M x N com consumos/prêmios definidos. Para um tanque de gasolina inicial $Q$ e casa inicial $I$, sabe-se encontrar o caminho de maior produto de prêmios total que inicia na casa $I$ e termina na casa $c$, terminando com exatamente $k$ litros de gasolina no tanque final.

##### Teorema do caso base

&emsp;Como não assumimos custos nulos ou negativos, qualquer movimentação a partir da casa inicial resultará num tanque final menor que $Q$ inicial. Portanto, no caso base $k = Q$, há apenas um caminho possível: não se movimentar de qualquer jeito, começando e terminando na casa inicial $I$. Então, sabe-se que para cada possível casa final $c$, o caminho será: inexistente, caso $c \neq I$, ou não fazer nenhum movimento, caso $c = I$.<br />
&emsp;Representaremos daqui por diante os caminhos como uma sequência de casas, inclusive a inicial e a final, pelas quais se passa. Portanto, para $c \neq I$, teríamos caminhos vazios [] e para $c = I$, um caminho somente com a casa inicial $I$ (Ex. para $I$ = 1,1: [(1, 1)]).

##### Teorema do passo indutivo

- Hipótese indutiva (indução forte): Para todo par de casa $c$ e tanque final $n$, $n = Q..k$, sabe-se encontrar o melhor caminho que chega na casa $c$ com tanque final $n$, se existir.

&emsp;Precisamos provar que o mesmo vale para chegar em todas as casas, com tanque final $k-1$. Vamos provar isso para uma casa qualquer $c$. Para existir um caminho que chegue nessa casa, deve-se ter passado logo anteriormente por uma casa adjacente a $c$ (seguindo os critérios de movimentação do rei no xadrez). Uma casa pode ter até 8 casas adjcentes a ela, portanto podem haver até no máximo 8 casas pelas quais um caminho que termina em $c$ deve ter passado como penúltima casa. Há duas opções: um caminho que termine em $c$ com tanque $k-1$ pode existir (nesse caso sempre há um melhor caminho) ou não. Suponha que o melhor caminho que termina em $c$ existe e passa pela penúltima casa $c_{2}$. Ao andar de $c_{2}$ para $c$, o rei deve consumir o custo de $c$, que chamaremos surpreendentemente de $custoC$. Como o caminho termina com tanque $k-1$, então na penúltima casa ainda deveria haver exatamente $k-1+custoC$ no tanque. Supomos que o caminho existe, portanto $k-1+custoC$ deve ser menor ou igual a $Q$ (pois não se pode ter mais gasolina que a inicial). Como $custoC$ é positivo inteiro, ainda, tem-se que $k-1+custoC$ é maior ou igual a $k$. Assim, por hipótese indutiva, como $k-1+custoC$ está entre $Q..k$ conhece-se o melhor caminho até $c_{2}$ a partir da casa inicial $I$ que termina com a gasolina $k-1+custoC$. Como se supôs que se sabe o melhor caminho para chegar em $c$ com penúltima casa $c_{2}$, então se ignorarmos o passo final desse caminho e considerarmos apenas o subcaminho de $I$ até $c_{2}$, então esse subcaminho deve ser o melhor que se conhece, como dito anteriormente. Como já discutido antes, há até no máximo 8 opções de penúltima casa $c_{2}$ pela qual um caminho que termina em $c$ passará. Portanto, pode-se testar a existência de um caminho assim escolhendo cada casa adjacente a $c$ e vendo por hipótese indutiva se há um caminho até ela de tanque final $k-1+custoC$, pois se existir, precisaríamos apenas de mais um passo de $c2$ até $c$ e teríamos um caminho que termina em $c$ com tanque $k-1$. Se $k-1+custoC$ for maior que $Q$, temos certeza que nenhum caminho existe, pois seria impossível ter mais de $Q$ gasolina no tanque antes de entrar em $c$. Se não houver possibilidade de caminhos, sabe-se determinar que um caminho até $c$ de tanque final $k-1$ não existe. Caso exista uma possibilidade de caminho, sabe-se que o produto total desse caminho é o produto total do caminho que termina no penúltimo vértice (adjacente a $c$) mais o $prêmioC$. Portanto sabe-se determinar que o melhor caminho que termina em $c$ é aquele que passa por uma casa adjacente $c2$ dentre um conjunto finito de casas adjacentes, tal que o produto total do caminho até $c2$ com tanque $k-1+custoC$ é maior do que qualquer outra casa adjacente de $c$.

![](rei-gasolina.png)

### Surgimento / Explicação do algoritmo:

&emsp;Apesar da prova por indução sugerir um algoritmo recursivo, acreditamos que a recursão nesse caso não seja ideal, pois a recursão nem sempre é uma boa opção em situações de muitas chamadas recursivas, devido à limitação da linguagem Python de lidar com níveis muito baixos de recursão.<br />
&emsp;Abordando o problema de um ponto um pouco diferente: afinal o que se deseja ao final é calcular o melhor caminho da casa (1, 1) do tabuleiro à própria casa (1, 1). Porém, como mostrado pelo reforço de hipótese adotado, a cada passo dos cálculos não basta calcular possíveis caminhos para a casa (1, 1), mas deve-se fazer cálculos para todas as casas $c$ possíveis. Apenas no final que se observa os melhores caminhos que terminam em (1, 1). Já que muitos cálculos serão feitos, evitaremos salvar o caminho calculado para cada casa e tanque final, mas apenas guardar o resultado do caminho, que indica o produto total de prêmios do caminho que termina em cada casa/tanque final. O caminho desejado em si pode ser obtido no final para que se evite que, a cada passo, vários caminhos sejam computados desnecessariamente.<br />
&emsp;Ao implementar um algoritmo, portanto, podemos fazer uma rotina que parta do caso base e de fato calcule os melhores resultados para todos as casas. Após ela rodar, outra rotina pode encontrar, de todos os resultados calculados pela primeira, o melhor resultado para a casa final desejada (1, 1). Outra rotina, por último, a partir do melhor resultado, pode obter o caminho que o rei deve fazer para obter tal resultado. Vamos explicar como se implementará cada rotina:<br />
&emsp;Para implementar a primeira rotina descrita acima, a ideia é partir do fato de que muitos caminhos que terminem especificamente numa casa $c$ com tanque final $k$ podem ser inviáveis e guardar apenas os caminhos possíveis, pois é através do único caminho possível do caso base (terminar na casa inicial sem se mover, com o tanque final igual ao inicial $Q$) que se chegam aos outros caminhos. Em suma, um caminho só existe se um pedaço menor dele (ou um subcaminho) também existe. Para cada resultado de caminho já calculado que termina com a gasolina $k$ na casa $c$ com produto total de prêmios $produto_{1}$, dar mais um passo a partir da casa final para uma casa adjacente $c_{2}$ representa um novo resultado de caminho que termina com a gasolina $k-custoC_{2}$ e tem produto total $produto_{2} = produto_{1} + prêmioC_{2}$. Fazer isso para todas as casas adjacentes a $c$ resultará em vários outros resultados de caminhos (desde que $k-custoC_{2}$ seja maior que 0), para os quais pode-se repetir o processo. Vamos chamar o ato de obter novos resultados de caminhos a partir de um resultado de caminho $X$ de "abrir um resultado de caminho $X$".<br />
&emsp;Com essa técnica, todos os possíveis caminhos serão cobertos. Para garantir que os resultados são os melhores, porém, sempre que se obtiver dois resultados de caminhos que terminem na mesma casa com o mesmo tanque final, deve-se manter apenas o que garante o melhor produto. Cada resultado de caminho que se abre, também, precisa ter seu resultado já otimizado. Para garantir isso, suponha que esse resultado termine com tanque $k$. Deve-se abri-lo apenas depois que todos os resultados que terminem com tanque maior que $k$ já tenham sido abertos. Fazer isso funcionará porque, se não há nenhum resultado a abrir que termine com tanque maior que $k$, então nenhuma outra possibilidade de resultado que termina com tanque $k$ surgirá (cada novo resultado que surge tem tanque menor que o tanque do que foi aberto), o que garante que o resultado de tanque $k$ que temos é o melhor resultado.<br />
&emsp;A primeira rotina funcionará como descrito acima. Cada resultado aberto deve ser guardado em uma estrutura de dados, para que ao final possa-se executar a segunda rotina, que busca em todos os resultados de tanque final diferentes, mas que terminam na mesma casa final desejada (1, 1), o resultado que garante o maior produto de prêmios.<br />
&emsp;Para a última rotina funcionar após o melhor resultado ter sido encontrado, deve ser possível obter o caminho que chega nesse resultado. Para isso, a estrutura de dados de cada resultado pode guardar, além do produto total para certa casa/tanque final, a penúltima casa $c$ pela qual seu caminho passou anteriormente e quanto de tanque $k$ havia quando se passou por ela. Basta procurar o melhor resultado específico para a casa $c$ com tanque final $k$ e ele indicará qual é a penúltima casa pela qual esse resultado passou. Fazendo isso do resultado final e repetindo até o resultado inicial (casa $I$, tanque $Q$), constroi-se o caminho percorrido para chegar em certo resultado de trás para frente.<br />
&emsp;Com tudo isso, obtém-se o caminho desejado da casa inicial à final, que é o que a terceira rotina retorna.

### Descrição informal do algoritmo:

&emsp;As 3 rotinas são implementadas com 2 funções: a primeira calcula os melhores resultados (CalcularMelhoresProdutos), a segunda encontra o melhor resultado e calcula o caminho a ser feito para chegar nele (ObterCaminho). Uma terceira função (GerarMelhorCaminho) pode ser usada como cápsula para chamar as rotinas e retornar o caminho final, recebendo apenas o tabuleiro, tanque inicial e as casas inicial/final do caminho.<br />
&emsp;O tabuleiro é representado por um grafo orientado, em que cada nó é uma casa e cada aresta que entra em um nó tem um peso, que é uma lista com duas informações: custo e prêmio relativos ao nó. Cada nó está ligado a até 8 nós que representam as casas adjacentes do tabuleiro de xadrez, incluindo as diagonais (seguindo a movimentação do rei no xadrez)<br />
&emsp;O algoritmo representa cada resultado como uma tupla de dimensão 5 contendo: (casa final do caminho, tanque final do caminho, produto final do caminho, penúltima casa do caminho, tanque na penúltima casa do caminho).<br />
&emsp;Um resultado inicial é montado trivialmente do caminho do caso base: (casa inicial, tanque inicial, 0, inexistente, inexistente). O resultado inicial é inserido na fila descrita a seguir.<br />
&emsp;Já que os resultados serão abertos um por um, o algoritmo usará uma "fila" de resultados a serem abertos, porém cada novo resultado a ser aberto não é inserido necessariamente no final da fila, pois os resultados com maior tanque devem ser abertos primeiro, como descrito na explicação do algoritmo. Os resultados são inseridos de maneira a manter a fila sempre em ordem descrescente de tanques, de maneira que o próximo resultado a ser aberto (o primeiro da fila), é sempre o que possui maior tanque final.<br />
&emsp;Enquanto a fila não estiver vazia, o primeiro resultado da fila ($c$, $k$, $p$, $c_{-1}$,$k_{-1}$) é retirado e aberto. Para cada casa $c_{2}$ adjacente à casa final do resultado aberto ($c$), há uma nova possibilidade de resultado ($c_{2}$, $k-custoC_{2}$, $p+premioC_{2}$, $c$, $k$), desde que $k-custoC_{2}$ não seja menor que 0. Uma busca será feita na fila para ver se já alguma tupla nela cuja casa/tanque final equivalem a $c_{2}$, $k-custoC_{2}$. Se não existir, então o novo resultado é inserido na fila de maneira a mantê-la ordenada em ordem descrescente de tanque final. Se já existe, então o novo resultado substitui o que já existe no caso de $p+premioC_{2}$ ser maior do que o produto do resultado que já existe.<br />
&emsp;Como cada resultado aberto é retirado da fila (mas precisa ficar guardado em memória) e cada resultado aberto já é o melhor resultado para aquela casa/tanque final, o resultado aberto é salvo em uma lista de um dicionário de "melhores resultados", chaveado por índices de casas. O primeiro campo da tupla de resultados não é salvo, já que já é representado pela chave do dicionário.<br />
&emsp;Quando a fila de resultados a abrir estiver vazia, os melhores resultados já foram calculados. No dicionário de melhores resultados, basta fazer uma busca na lista da chave correspondente à casa final do caminho que se busca, até encontrar o melhor resultado, para todas as opções de tanque final.<br />
&emsp;Com esse melhor resultado encontrado, o algoritmo pega os dois últimos campos da tupla do resultado e busca no dicionário de melhores, no índice correspondente à penúltima casa (quarto item da tupla), o resultado que possui o tanque final correspondente ao tanque na penúltima casa (quinto item da tupla). Com o novo resultado encontrado, repete-se isso até encontrar todas as casas pelas quais o caminho buscado passa, para chegar da casa inicial à casa final. A cada passo, a casa atual é adicionada no início de uma lista que representa esse caminho, montando então essa lista de trás para frente!<br />
&emsp;Essa lista é a lista final do caminho buscado, que é retornada pela função cápsula!

### Algoritmo:

In [19]:
# LER TABULEIRO / ADAPTAR IMPLEMENTAÇÃO DE GRAFO PARA PROBLEMA 2 (Grafo 2D)

NUM_LINS = 8
NUM_COLS = 8

def indiceTupla(x, y):
    return x * NUM_COLS + y + 1

def tuplaIndice(inx):
    inx -= 1
    return (int(inx / NUM_COLS), inx % NUM_COLS)

def grafo2D(grafo, x, y):
    return grafo[indiceTupla(x, y)]

# recebe o path do arquivo e retorna o grafo que representa o tabuleiro e o tanque 
def LerTabuleiro(nome):
    with open(nome, 'r') as f:
        primeira_linha = f.readline()
        tanque = int(primeira_linha)
        # matriz de custos/prêmios
        matriz = [[[0, 0] for j in range(NUM_COLS)] for i in range(NUM_LINS)]
        for k in range(2):
            for i in range(NUM_LINS):
                linha = f.readline()
                words = linha.split()
                for j in range(NUM_COLS):
                    matriz[i][j][k] = int(words[j])
        # Criar grafo de NUM_LINS * NUM_COLS vértices (grafo2D NUM_LINS x NUM_COLS)
        grafo = CriarGrafo(NUM_LINS * NUM_COLS)
        # Criar arestas horizontais
        for j in range(1, NUM_COLS):
            for i in range(NUM_LINS):
                # Arestas que vão para direita, de (i,j-1) -> (i,j) (entrando em i,j)
                CriarAresta(grafo, indiceTupla(i, j-1), indiceTupla(i, j), matriz[i][j] )
                # Arestas que vão para esquerda, de (i,j) -> (i,j-1) (entrando em i,j-1)
                CriarAresta(grafo, indiceTupla(i, j), indiceTupla(i, j-1), matriz[i][j-1] )
        # Criar arestas verticais
        for i in range(1, NUM_LINS):
            for j in range(NUM_COLS):
                # Arestas que vão para baixo, de (i-1,j) -> (i,j) (entrando em i,j)
                CriarAresta(grafo, indiceTupla(i-1, j), indiceTupla(i, j), matriz[i][j] )
                # Arestas que vão para cima, de (i,j) -> (i-1,j) (entrando em i-1,j)
                CriarAresta(grafo, indiceTupla(i, j), indiceTupla(i-1, j), matriz[i-1][j] )
        # Criar arestas diagonais (em formato de rampa)
        for i in range(1, NUM_LINS):
            for j in range(1, NUM_COLS):
                # Arestas que vão para cima/direita, de (i,j-1) -> (i-1,j) (entrando em i-1,j)
                CriarAresta(grafo, indiceTupla(i, j-1), indiceTupla(i-1, j), matriz[i-1][j] )
                # Arestas que vão para baixo/esquerda, de (i-1,j) -> (i,j-1) (entrando em i,j-1)
                CriarAresta(grafo, indiceTupla(i-1, j), indiceTupla(i, j-1), matriz[i][j-1] )
        # Criar arestas diagonais (em formato de declive)
        for i in range(1, NUM_LINS):
            for j in range(1, NUM_COLS):
                # Arestas que vão para baixo/direita, de (i-1,j-1) -> (i,j) (entrando em i,j)
                CriarAresta(grafo, indiceTupla(i-1, j-1), indiceTupla(i, j), matriz[i][j] )
                # Arestas que vão para cima/esquerda, de (i,j) -> (i-1,j-1) (entrando em i-1,j-1)
                CriarAresta(grafo, indiceTupla(i, j), indiceTupla(i-1, j-1), matriz[i-1][j-1] )
        return grafo, tanque

In [20]:
# IMPLEMENTAÇÃO DO ALGORITMO

# Recebe o grafo do tabuleiro, o tanque inicial e as tuplas casaInicial/casaFinal,
# retornando a lista do caminho a ser tomado que dá o melhor produto da casa inicial
# à casa final
def GerarMelhorCaminho(grafo, tanqueInicial, casaInicial, casaFinal):
    melhores = {}
    for i in grafo:
        melhores[i] = []
    filaNosTanques = []
    inxInicial = indiceTupla(casaInicial[0], casaInicial[1])
    # Primeiro resultado de caminho existente é o nó inicial com o tanque inicial, de
    # produto 0 e sem penúltimo nó
    filaNosTanques.append((inxInicial, tanqueInicial, 0, -1, -1))
    # Preencher dicionário "melhores" com melhores resultados a partir da fila
    # com resultado inicial
    CalcularMelhoresProdutos(grafo, filaNosTanques, melhores)
    # Assertiva
    if (filaNosTanques != []):
        LevantarErro("Ainda há resultados para calcular")
    # 
    return ObterCaminho(melhores, tanqueInicial, casaFinal)

# Dada a fila "filaNosTanques" de resultados a serem abertos, abre
# cada nó e preenche o dicionário "melhores" com os melhores resultados em cada
# casa, para cada tanque final
def CalcularMelhoresProdutos(grafo, filaNosTanques, melhores):
    # Enquanto houverem resultados a abrir, abri-los
    while(len(filaNosTanques) != 0):
        # Abrir resultado e salvá-lo no dicionário
        noAberto, tanque, prod, origem, tanqueOrigem = filaNosTanques.pop(0)
        melhores[noAberto].append((tanque, prod, origem, tanqueOrigem))
        # Cada casa final do resultado aberto tem algumas casas adjacentes que podem
        # representar novos resultados (novos caminhos):
        for no, peso in grafo[noAberto]:
            # Custo e prêmio da casa adjacente
            custo = peso[0]
            premio = peso[1]
            # Se o custo é maior que o tanque atual, o caminho é inviável
            if (tanque - custo < 0):
                continue
            # Ver se resultado já está na lista de resultados a abrir
            inxTupla = -1
            for inx, val in enumerate(filaNosTanques):
                if val[:2] == (no, tanque-custo):
                    inxTupla = inx
                    break
            # Se resultado não está na lista, adicioná-lo, mantendo a lista ordenada
            # (maiores tanques primeiro)
            if (inxTupla == -1):                
                InsertionSort(filaNosTanques, (no, tanque-custo, prod+premio, noAberto, tanque), lambda tupla: -tupla[1])
            # Se resultado já está na lista, substituí-lo caso o produto deste caminho
            # seja maior
            else:
                if (filaNosTanques[inxTupla][2] < prod+premio):
                    filaNosTanques[inxTupla] = (no, tanque-custo, prod+premio, noAberto, tanque)

# Recebe dicionário "melhores" de melhores resultados para cada casa, para cada tanque
# final e retorna: Uma lista de tuplas com o melhor caminho da casa inicial até a final
# e o que restou no tanque
def ObterCaminho(melhores, tanqueInicial, casaFinal):
    inxFinal = indiceTupla(casaFinal[0], casaFinal[1])
    # Obter índice de resultado de maior produto na casa final
    inxMelhorResultado = ObterInxMaximo(melhores[inxFinal], lambda tupla: tupla[1])
    # Se não há índice, não há nenhum resultado que chegue na casa final. Logo não há caminho!
    if (inxMelhorResultado == -1):
        return [], tanqueInicial
    
    # Vetor com as tuplas do caminho
    caminho = [tuplaIndice(inxFinal)]
    
    # Queremos obter a partir de qual casa chegamos na casa final
    casaAtual = melhores[inxFinal][inxMelhorResultado][2]
    # Queremos saber qual tanque possuíamos quando estávamos nessa casa
    tanqueAtual = melhores[inxFinal][inxMelhorResultado][3]
    # Loop para inserir todas as casas pelas quais se passou na lista "caminho", até a casa
    # inicial (quando casaAtual == -1)
    while(casaAtual != -1):
        # casaAtual é a casa que será inserida na lista.
        caminho.insert(0, tuplaIndice(casaAtual))
        # Obter casa anterior à casa atual (penúltima) e salvá-la como nova casa atual
        achou = False
        for tupla in melhores[casaAtual]:
            if (tupla[0] == tanqueAtual):
                casaAtual = tupla[2]
                # Atualizar também o tanque que se possía quando se passou pela penúltima casa
                tanqueAtual = tupla[3]
                achou = True
                break
        # Assertiva
        if (achou == False):
            LevantarErro("Não se passou por nenhum resultado na casa atual com o tanque salvo em tanqueAtual")
    return caminho, melhores[inxFinal][inxMelhorResultado][0], melhores[inxFinal][inxMelhorResultado][1]

### Comentários de desenvolvimento:

- O tabuleiro é lido de um arquivo .txt conforme apresentado pelo enunciado e salvo em formato de grafo conforme a descrição do algoritmo. Esse formato simplifica a obtenção de casas adjacentes a uma casa durante a execução do algoritmo.

- A função final do algoritmo é GerarMelhorCaminho e recebe as casas inicial e final do caminho desejado. Como o especificado do enunciado é que o rei comece e termine na casa (1, 1), é ela que tem que ser passada como casa inicial e final. Porém, a implementação do algoritmo assume que as tuplas espaciais que representam o tabuleiro começam do índice 0, portanto, deve-se passar à função (0, 0) ao invés de (1, 1). Nessas tuplas espaciais, o primeiro número representa a linha e o último, a coluna do tabuleiro. A posição (0, 0) representa o topo superior esquerdo do tabuleiro.

### Testes de execução:

In [21]:
print("Primeira Instancia\n")

grafo, tanque = LerTabuleiro("walk.txt")
print("\nTanque inicial: " + str(tanque) + "\n")
caminho, tanqueFinal, produtoFinal = GerarMelhorCaminho(grafo, tanque, (0, 0), (0, 0))
print("Tanque final: " + str(tanqueFinal) + ", Produto final: " + str(produtoFinal) + ", Caminho percorrido:\n" + str(caminho))

print("\n")
print("Segunda Instancia\n")

grafo, tanque = LerTabuleiro("walk2.txt")
print("\nTanque inicial: " + str(tanque) + "\n")
caminho, tanqueFinal, produtoFinal = GerarMelhorCaminho(grafo, tanque, (0, 0), (0, 0))
print("Tanque final: " + str(tanqueFinal) + ", Produto final: " + str(produtoFinal) + ", Caminho percorrido:\n" + str(caminho))

print("\n")
print("Terceira Instancia\n")

grafo, tanque = LerTabuleiro("walk3.txt")
print("\nTanque inicial: " + str(tanque) + "\n")
caminho, tanqueFinal, produtoFinal = GerarMelhorCaminho(grafo, tanque, (0, 0), (0, 0))
print("Tanque final: " + str(tanqueFinal) + ", Produto final: " + str(produtoFinal) + ", Caminho percorrido:\n" + str(caminho))

print("\n")
print("Quarta Instancia\n")

grafo, tanque = LerTabuleiro("walk4.txt")
print("\nTanque inicial: " + str(tanque) + "\n")
caminho, tanqueFinal, produtoFinal = GerarMelhorCaminho(grafo, tanque, (0, 0), (0, 0))
print("Tanque final: " + str(tanqueFinal) + ", Produto final: " + str(produtoFinal) + ", Caminho percorrido:\n" + str(caminho))

print("\n")
print("Quinta Instancia\n")

grafo, tanque = LerTabuleiro("walk5.txt")
print("\nTanque inicial: " + str(tanque) + "\n")
caminho, tanqueFinal, produtoFinal = GerarMelhorCaminho(grafo, tanque, (0, 0), (0, 0))
print("Tanque final: " + str(tanqueFinal) + ", Produto final: " + str(produtoFinal) + ", Caminho percorrido:\n" + str(caminho))

Primeira Instancia


Tanque inicial: 8

Tanque final: 0, Produto final: 16, Caminho percorrido:
[(0, 0), (0, 1), (0, 0), (0, 1), (0, 0), (0, 1), (0, 0), (0, 1), (0, 0)]


Segunda Instancia


Tanque inicial: 8

Tanque final: 0, Produto final: 16, Caminho percorrido:
[(0, 0), (0, 1), (0, 0), (0, 1), (0, 0), (0, 1), (0, 0), (0, 1), (0, 0)]


Terceira Instancia


Tanque inicial: 8

Tanque final: 0, Produto final: 16, Caminho percorrido:
[(0, 0), (0, 1), (0, 0), (0, 1), (0, 0), (0, 1), (0, 0), (0, 1), (0, 0)]


Quarta Instancia


Tanque inicial: 22

Tanque final: 0, Produto final: 284, Caminho percorrido:
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 4), (6, 4), (7, 4), (6, 4), (7, 4), (6, 4), (7, 4), (6, 4), (7, 4), (6, 4), (7, 4), (6, 4), (5, 4), (4, 4), (3, 3), (2, 2), (1, 1), (0, 0)]


Quinta Instancia


Tanque inicial: 18

Tanque final: 0, Produto final: 57, Caminho percorrido:
[(0, 0), (1, 0), (2, 0), (3, 1), (2, 0), (3, 1), (2, 0), (3, 1), (2, 0), (3, 1), (2, 0), (3, 1), (2, 0), (3, 1

<h3>Testes de Execução:</h3>
<br /> Em todos os casos, o tempo total foi de 5 segundos.
<br />
<p> Arquivo "walk.txt"
<br />Número de execuções:115,113,116,119->Media:115.75
<br />Tempo em média de cada execução:5/115.75=43 milissegundos
<br />
<p> Arquivo "walk2.txt"
<br />Número de execuções:115,116,117,119->Media:116.75
<br />Tempo em média de cada execução:5/116.75=43 milissegundos
<br />
<p> Arquivo "walk3.txt"
<br />Número de execuções:120,100,120,123->Media:115.75
<br />Tempo em média de cada execução:5/115.75=43 milissegundos
<br />
<p> Arquivo "walk4.txt"
<br />Número de execuções:18,19,19,19->Media:18.75
<br />Tempo em média de cada execução:5/18.75=0.27 segundo
<br />
<p> Arquivo "walk5.txt"
<br />Número de execuções:21,24,23,23->Media:22.75
<br />Tempo em média de cada execução:5/2.75=0.22 segundo

## Questão 3:
**3. Busca de um string em textos<br />
&emsp;Considere um text deﬁnido pelo vetor de caracteres $T[1..n]$. Deseja-se determinar todas as ocorrências do string $s[1..m]$ em $T$. Desenvolva algoritmos com este objetivo que atendam as seguintes condições:**

**$(a)$ Encontra as ocorrências de string s exatamente como especificado.<br />
$(b)$ Permite alternativas entre elementos de s. Por exemplo, maiúsculas e minúsculas são equivalentes.<br />
$(c)$ Encontra as ocorrências de s que deixam de verificar até um dos seus elementos.<br />**

### Prova do teorema por indução (a):

&emsp;Para determinar as ocorrências de uma string $s[1..m]$ em uma string $T[1..n]$, devemos provar que é possivel determinar em que intervalos de $T$ conseguimos encontrar substrings $T[a..b]$, tal que os caracteres dessa substring se igualem aos caracteres da string $s$ de forma sequencial. Isto é, onde o primeiro caracter de $s$ é igual ao primeiro caracter da substring $T[a..b]$ ( $s[0] = T[a]$ ), o segundo caracter de $s$ é igual ao segundo caracter da substring $T[a..b]$ ( $s[1] = T[a + 1]$ ), e assim por diante até que o último caracter da string $s$ corresponda ao último caracter da substring $T[a..b]$ ( $s[m] = T[b]$ ).

&emsp;É importante observar que, para tais substrings, adotamos por definição que $a >= 1$, $a <= b$ e $b <= k$, ou seja, para toda substring $T[a..b]$ esta deve estar contida na string $T[1..k]$. 

&emsp;Dessa forma, devemos comparar cada caracter da string $T$ com o primeiro caracter da string $s$ para verificar, a partir de quais caracteres em $T$, podemos ter uma substring $T[a..b]$, tal que esta seja igual a $s$. Portanto, determinamos então todos os caracteres em $T$ que são candidatos para iniciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$. Dessa maneira, é possivel determinar todos os caracteres candidatos para inciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$, todas as ocorrências de $s$ em $T[1..k]$ e, consequentemente, a quantidade de vezes que a string $s$ aparece em $T[1..k]$.

&emsp;Enunciamos para isso um novo teorema:

&emsp;Teorema 3a $(k)$: Sabe-se determinar todos os caracteres em $T$ que são candidatos para iniciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$, e sabe-se determinar também todas as ocorrências da string $s$ em $T$, sendo $T$ uma string $T[1..k]$ e $s$ uma string $s[1..m]$.

##### Teorema do caso base

&emsp;Sendo $T$ e $s$ strings de 1 caracter é possivel determinar se existe uma ocorrência de $s$ em $T$, que seria $T[1] = s[1]$, ou se não existe nenhuma ocorrência de $s$ em $T$ e então $T[1] != s[1]$.

##### Teorema do passo indutivo

&emsp;Pelo teorema, sabemos determinar para $k-1$ caracteres todos os caracteres em $T$ que são candidatos para inciar uma substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$, e também a quantidade de ocorrências de $s$ em $T$ para esses $k-1$ caracteres. Sendo assim, conseguimos determinar todos os caracteres candidatos em $T[1..k-1]$ e todas as ocorrências de $s$ em $T[1..k-1]$.

&emsp;Ao adicionarmos o novo caracter $T[k]$ à string $T[1..k-1]$, primeiramente, verificamos se esse novo caracter é um candidato para inciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$. Ou seja, verificamos se o novo caracter $T[k]$ é igual ao primeiro caracter $s[0]$ na string $s$. Em caso positivo, o novo caracter é adicionado à lista de candidatos e em caso negativo ele não é incluído na lista de candidatos.

&emsp;Em seguida, verificamos, para todos os candidatos até então existentes, se o novo caracter $T[k]$ segue a sequência da string $s$ para aquela substring $T[a..b]$ candidata. Ou seja, se o novo caracter $T[k]$ é igual ao próximo caracter $s[k - a]$ da sequencia $s$, onde $a$ é o início da substring $T[a..b]$, candidata a ser uma ocorrência de $s$, $k$ é o caracter atual, e a expressão $k - a$ tem como resultado o caracter em $s$ ao qual $k$ deve corresponder para que aquela substring $T[a..b]$ seja mantida como candidata.

&emsp;Dessa forma, é possível selecionar os caracteres candidatos $T[a]$ a serem mantidos, que em iterações futuras poderão corresponder ao início de uma substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$. E os caracteres candidatos $T[a]$ que devem ser descartados. Pois, a partir da verificação acima descrita, o novo caracter $T[k]$ pode "quebrar" a sequência $s$ que a substring $T[a..b]$ candidata estava seguindo. Então o caracter $T[a]$ candidato deve ser descartado pois algum dos caracteres subsequentes a ele não corresponde ao caracter em $s$.

&emsp;Caso em $T[k]$ tenha-se conseguido finalizar uma substring candidata $T[a..b]$, tal que $T[a..b]$ seja igual a $s$, então retiramos o caracter incial $T[a]$ da lista de candidatos, adicionamos a nova ocorrência de $s$ para a substring $T[a..b]$ em $T$, e aumentamos a quantidade total de ocorrências de $s$ em $T$, para $T[1..k]$.

### Algoritmo da letra (a)

### Surgimento/Explicação do algoritmo

Como a prova mostra, guardaremos os candidatos a serem iguais a string procuradas. À cada vez que lemos um novo caracter da string T, atualizaremos os candidatos já encontrados, verificando se algum deles ainda pode ser considerado como tal (caso contrário, será removido da lista). Caso ele ainda seja um candidato, testa-se se ele já pode ser considerado como uma ocorrência. Em caso afirmativo, guarda-se em que posição da string T ele está. 

### Descrição do algoritmo

A função encontraOcorrencias cria duas listas, uma que guarda em que posições da string T estão as ocorrências de s (caso existam) e outra que guarda os possíveis candidatos de T a serem iguais a s. Caso s seja vazia, simplismente retorna-se uma lista vazia. A função então chamará, para cada caracter de T, a funcão ocorrenciaString.
A função ocorrenciaString  verifica se o caracter atual é igual ao primeiro caracter de s, isto é, se este é um candidato a uma ocorrência. Após fazer essa verificação, atualizaremos a lista de candidatos, de acordo como foi explicado acima.  Ao final, retorna-se a lista de ocorrências e seu tamanho, isto é, quantas vezes a string s apareceu em T.   

In [29]:
#Atualiza para um novo caracter T[k] todos os candidatos e as ocorrências de (s) em (T)
def ocorrenciaString(string, strProc, k, ocorrencias, candidatos):
    #Verifica para T[k] se ele é um novo candidato para inciar uma string T[a..b], tal que T[a..b] seja igual a (s)
    if (string[k] == strProc[0]):
        candidatos.append(k)
    #Para todos os caracteres candidatos verifica se eles devem ser mantidos ou descartados
    for inx in candidatos:
        pos = k - inx
        #Se o novo caracter T[k] corresponde ao próximo caracter da sequencia (s) para uma substring T[a..b] iniciando em T[a]
        if (string[k] == strProc[pos]):
            #Se a substring T[a..b] corresponde até o último caracter à string (s), o candidato é finalizado e a nova ocorrência
            #é registrada
            if (pos == len(strProc) - 1):
                iniFim=[inx,inx+len(strProc)-1]
                ocorrencias.append(iniFim)
                candidatos.remove(inx)
        else:
            candidatos.remove(inx)

#Encontra as ocorrências da string procurada (s) na string (T)
#Retorna as ocorrências em (T) no formato [a..b] e a quantidade de ocorrências de (s) em (T)
def encontraOcorrencias(string, strProc):
    ocorrencias = []
    candidatos = []
    if(len(strProc)==0):
        return []
    n = len(string)
    for k in range(n):
        ocorrenciaString(string, strProc, k, ocorrencias, candidatos)
    return ocorrencias,len(ocorrencias)

### Prova do teorema por indução (b):

&emsp;Para determinar as ocorrências de uma string $s[1..m]$ em uma string $T[1..n]$ permitindo alternativas entre elementos de $s$. Devemos provar que é possivel determinar em que intervalos de $T$ conseguimos encontrar substrings $T[a..b]$, tal que os caracteres dessa substring sejam equivalentes aos caracteres da string $s$ de forma sequencial. Isto é, onde o primeiro caracter de $s$ é equivalente ao primeiro caracter da substring $T[a..b]$ ( $s[0] = T[a]$ ), o segundo caracter de $s$ é equivalente ao segundo caracter da substring $T[a..b]$ ( $s[1] = T[a + 1]$ ), e assim por diante até que o último caracter da string $s$ seja equivalente ao último caracter da substring $T[a..b]$ ( $s[m] = T[b]$ ). Existem vários critérios de equivalência, o utilizado para essa questão foi o de equivalência entre caracteres maiúsculos e minúsculos, por exemplo $g$ equivale a $G$ então indenpendente de estarmos buscando o caracter $g$ da string $s$ na string $T$, ao encontrarmos $g$ ou $G$ na string $T$, a substring $T[a..b]$ continua valendo como candidata. Ela não é descartada apesar dos caracteres não serem iguais, pois os caracteres continuam sendo equivalentes.

&emsp;É importante observar que, para tais substrings, adotamos por definição que $a >= 1$, $a <= b$ e $b <= k$, ou seja, para toda substring $T[a..b]$ esta deve estar contida na string $T[1..k]$. 

&emsp;Dessa forma, devemos comparar cada caracter da string $T$ com o primeiro caracter da string $s$ para verificar, a partir de quais caracteres em $T$, podemos ter uma substring $T[a..b]$, tal que esta seja equivalente a $s$. Portanto, determinamos então todos os caracteres em $T$ que são candidatos para iniciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$. Dessa maneira, é possivel determinar todos os caracteres candidatos para inciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$, todas as ocorrências de $s$ em $T[1..k]$ e, consequentemente, a quantidade de vezes que a string $s$ aparece em $T[1..k]$.

&emsp;Enunciamos para isso um novo teorema:

&emsp;Teorema 3b $(k)$: Sabe-se determinar todos os caracteres em $T$ que são candidatos para iniciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$, e sabe-se determinar também todas as ocorrências da string $s$ em $T$, sendo $T$ uma string $T[1..k]$ e $s$ uma string $s[1..m]$.

##### Teorema do caso base

&emsp;Sendo $T$ e $s$ strings de 1 caracter é possivel determinar se existe uma ocorrência de $s$ em $T$, tal que $T[1]$ seja equivalente a $s[1]$, ou se não existe nenhuma ocorrência de $s$ em $T$ e então $T[1]$ não é igual nem equivalente a $s[1]$.

##### Teorema do passo indutivo

&emsp;Pelo teorema, sabemos determinar para $k-1$ caracteres todos os caracteres em $T$ que são candidatos para inciar uma substring $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$, e também a quantidade de ocorrências de $s$ em $T$ para esses $k-1$ caracteres. Sendo assim, conseguimos determinar todos os caracteres candidatos em $T[1..k-1]$ e todas as ocorrências de $s$ em $T[1..k-1]$.

&emsp;Ao adicionarmos o novo caracter $T[k]$ à string $T[1..k-1]$, primeiramente, verificamos se esse novo caracter é um candidato para inciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$. Ou seja, verificamos se o novo caracter $T[k]$ é equivalente ao primeiro caracter $s[0]$ na string $s$. Em caso positivo, o novo caracter é adicionado à lista de candidatos e em caso negativo ele não é incluído na lista de candidatos.

&emsp;Em seguida, verificamos, para todos os candidatos até então existentes, se o novo caracter $T[k]$ segue a sequência da string $s$ para aquela substring $T[a..b]$ candidata. Ou seja, se o novo caracter $T[k]$ é equivalente ao próximo caracter $s[k - a]$ da sequencia $s$, onde $a$ é o início da substring $T[a..b]$, candidata a ser uma ocorrência de $s$, $k$ é o caracter atual, e a expressão $k - a$ tem como resultado o caracter em $s$ ao qual $k$ deve corresponder para que aquela substring $T[a..b]$ seja mantida como candidata.

&emsp;Dessa forma, é possível selecionar os caracteres candidatos $T[a]$ a serem mantidos, que em iterações futuras poderão corresponder ao início de uma substring $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$. E os caracteres candidatos $T[a]$ que devem ser descartados. Pois, a partir da verificação acima descrita, o novo caracter $T[k]$ pode "quebrar" a sequência $s$ que a substring $T[a..b]$ candidata estava seguindo. Então o caracter $T[a]$ candidato deve ser descartado pois algum dos caracteres subsequentes a ele não corresponde ao caracter em $s$, ou seja, não é igual nem equivalente.

&emsp;Caso em $T[k]$ tenha-se conseguido finalizar uma substring candidata $T[a..b]$, tal que $T[a..b]$ seja equivalente a $s$, então retiramos o caracter incial $T[a]$ da lista de candidatos, adicionamos a nova ocorrência de $s$ para a substring $T[a..b]$ em $T$, e aumentamos a quantidade total de ocorrências de $s$ em $T$, para $T[1..k]$.

### Algoritmo da letra (b)

### Surgimento/Explicação do algoritmo

O algoritmo funciona de modo muito semelhante ao anterior. Ele difere apenas por tratar caracteres minúsculos equivalentes aos maiúsculos.

### Descrição do Algoritmo

A função ocorrenciaStringMaiuscula usa a função upper() para permitir alternativas entre elementos de s. Mais uma vez, retorna-se a lista de ocorrências e quantas vezes a string s apareceu em T.   

In [31]:
#Atualiza para um novo caracter T[k] todos os candidatos e as ocorrências de (s) em (T)
def ocorrenciaStringMaiuscula(string, strProc, k, ocorrencias, candidatos):
    #Verifica para T[k] se ele é um novo candidato para inciar uma string T[a..b], tal que T[a..b] seja equivalente a (s)
    if (string[k].upper() == strProc[0].upper()):
        candidatos.append(k)
    #Para todos os caracteres candidatos verifica se eles devem ser mantidos ou descartados
    for inx in candidatos:
        pos = k - inx
        #Se o novo caracter T[k] é equivalente ao próximo caracter da sequencia (s) para uma substring T[a..b] iniciando em T[a]
        if (string[k].upper() == strProc[pos].upper()):
            #Se a substring T[a..b] é equivalente até o último caracter à string (s), o candidato é finalizado e a nova
            #ocorrência é registrada
            if (pos == len(strProc) - 1):
                iniFim=[inx,inx+len(strProc)-1]
                ocorrencias.append(iniFim)
                candidatos.remove(inx)
        else:
            candidatos.remove(inx)

#Encontra as ocorrências da string procurada (s) na string (T) permitindo equivalência entre maiúsculas e minúsculas
#Retorna as ocorrências em (T) no formato [a..b] e a quantidade de ocorrências de (s) em (T)
def encontraOcorrenciasMaiuscula(string, strProc):
    ocorrencias = []
    candidatos = []
    if(len(strProc)==0):
        return []
    n = len(string)
    for k in range(n):
        ocorrenciaStringMaiuscula(string, strProc, k, ocorrencias, candidatos)
    return ocorrencias,len(ocorrencias)

### Algoritmo da letra (c)

### Prova do teorema por indução (c):

&emsp;Para determinar as ocorrências de uma string $s[1..m]$ em uma string $T[1..n]$ com um número máximo tolerável de erros, devemos provar que é possivel determinar em que intervalos de $T$ conseguimos encontrar substrings $T[a..b]$, tal que os caracteres dessa substring se igualem aos caracteres da string $s$ de forma sequencial com um número máximo tolerável de erros. Isto é, onde o primeiro caracter de $s$ é igual ao primeiro caracter da substring $T[a..b]$ ( $s[0] = T[a]$ ), o segundo caracter de $s$ é igual ao segundo caracter da substring $T[a..b]$ ( $s[1] = T[a + 1]$ ), e assim por diante até que o último caracter da string $s$ corresponda ao último caracter da substring $T[a..b]$ ( $s[m] = T[b]$ ). No caso dos caracteres não serem iguais, os erros devem ser contados mas não devem ultrapassar o número máximo tolerável de erros.

&emsp;É importante observar que, para tais substrings, adotamos por definição que $a >= 1$, $a <= b$ e $b <= k$, ou seja, para toda substring $T[a..b]$ esta deve estar contida na string $T[1..k]$. 

&emsp;Dessa forma, devemos comparar cada caracter da string $T$ com o primeiro caracter da string $s$ para verificar, a partir de quais caracteres em $T$, podemos ter uma substring $T[a..b]$, tal que esta seja igual a $s$ com um número máximo tolerável de erros. Portanto, determinamos então todos os caracteres em $T$ que são candidatos para iniciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$ com um número máximo tolerável de erros. Dessa maneira, é possivel determinar todos os caracteres candidatos para inciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$ com um número máximo tolerável de erros, todas as ocorrências de $s$ em $T[1..k]$ e, consequentemente, a quantidade de vezes que a string $s$ aparece em $T[1..k]$.

&emsp;Enunciamos para isso um novo teorema:

&emsp;Teorema 3c $(k)$: Sabe-se determinar todos os caracteres em $T$ que são candidatos para iniciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$ com um número máximo tolerável de erros, e sabe-se determinar também todas as ocorrências da string $s$ em $T$, sendo $T$ uma string $T[1..k]$ e $s$ uma string $s[1..m]$.

##### Teorema do caso base

&emsp;Sendo $T$ e $s$ strings de 1 caracter e um número máximo tolerável de erros igual 1, então, trivialmente, existe uma ocorrência de $s$ em $T$, que possui no máximo 1 erro. 

##### Teorema do passo indutivo

&emsp;Pelo teorema, sabemos determinar para $k-1$ caracteres todos os caracteres em $T$ que são candidatos para inciar uma substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$ com um número máximo tolerável de erros, e também a quantidade de ocorrências de $s$ em $T$ para esses $k-1$ caracteres. Sendo assim, conseguimos determinar todos os caracteres candidatos em $T[1..k-1]$ e todas as ocorrências de $s$ em $T[1..k-1]$ com um número máximo tolerável de erros.

&emsp;Ao adicionarmos o novo caracter $T[k]$ à string $T[1..k-1]$, primeiramente, adicionamos esse novo caracter como um candidato para inciar uma nova substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$ com um número máximo tolerável de erros. 

&emsp;Em seguida, verificamos, para todos os candidatos até então existentes, se o novo caracter $T[k]$ segue a sequência da string $s$ para aquela substring $T[a..b]$ candidata. Ou seja, se o novo caracter $T[k]$ é igual ao próximo caracter $s[k - a]$ da sequencia $s$, onde $a$ é o início da substring $T[a..b]$, candidata a ser uma ocorrência de $s$, $k$ é o caracter atual, e a expressão $k - a$ tem como resultado o caracter em $s$ ao qual $k$ deve corresponder para que aquela substring $T[a..b]$ seja mantida como candidata.

&emsp;Dessa forma, é possível selecionar os caracteres candidatos $T[a]$ a serem mantidos, que em iterações futuras poderão corresponder ao início de uma substring $T[a..b]$, tal que $T[a..b]$ seja igual a $s$, desde que a substring $T[a..b]$ atenda ao número máximo tolerável de erros. E os caracteres candidatos $T[a]$ que devem ser descartados. Pois, a partir da verificação acima descrita, o novo caracter $T[k]$ pode não corresponder ao caracter que deveria em $s$ e assim aumentar o número de erros naquela substring $T[a..b]$ de modo que esse número de erros ultrapasse o limite tolerável, sendo necessário descartar entao o caracter $T[a]$ como candidato a iniciar uma substring $T[a..b]$ que seja igual a $s$ atendendo ao número máximo tolerável de erros.

&emsp;Caso em $T[k]$ tenha-se conseguido finalizar uma substring candidata $T[a..b]$, tal que $T[a..b]$ seja igual a $s$ com um número máximo tolerável de erros, então retiramos o caracter incial $T[a]$ da lista de candidatos, adicionamos a nova ocorrência de $s$ para a substring $T[a..b]$ em $T$, e aumentamos a quantidade total de ocorrências de $s$ em $T$, para $T[1..k]$.

### Surgimento/Explicação do algoritmo

Novamente, guardaremos os candidatos e as ocorrências da string s. Entretanto, dessa vez também guardaremos a quantidade de erros que cada candidato possui em relação a string s. Como cada novo caracter lido de T pode ser considerado como um candidato, fizemos isso para conseguirmos diferenciá-los. Portanto, para cada caracter lido, examinaremos todos os candidatos, da seguinte forma:
- Cada candidato só deixará de possuir essa característica caso ultrapasse o limite de erros permitido. Caso contrário, ele permanecerá como candidato e terá seu contador de erros aumentado.
- Assim como nos casos anteriores, verificaremos se os candidatos já podem ser considerados como ocorrências, armazenando sua posição em T em caso afirmativo. 

### Descrição do algoritmo

Na função ocorrenciaStringParecida adicionamos uma nova lista, que guarda os candidatos que serão removidos cada vez que a função é chamada. Também foi adicionada uma variável global TOL, que representa quantos elementos de s as ocorrências contabilizadas deixam de verificar. Assim como antes, a função encontraOcorrenciasParecida retornará quantas vezes a string s apareceu em T e em que posição de T cada ocorrência está.      

In [33]:
global TOL
TOL = 1

#Atualiza para um novo caracter T[k] todos os candidatos e as ocorrências de (s) em (T)
def ocorrenciaStringParecida(string, strProc, k, ocorrencias, candidatos):
    global TOL
    #Adiciona todo novo caracter T[k] como candidato para inciar uma string T[a..b], tal que T[a..b] seja igual a (s) com um
    #número máximo tolerável de erros (caracteres desiguais)
    #O número de erros é inicializado como 0
    candidatos.append([k, 0])
    remover = []
    #Para todos os caracteres candidatos verifica se eles devem ser mantidos ou descartados
    for dupla in candidatos:
        inx = dupla[0]
        pos = k - inx
        #Se o novo caracter T[k] é diferente do próximo caracter da sequencia (s) para uma substring T[a..b] iniciando em T[a]
        #e o número de erros é maior que o tolerável retira o candidato
        if (dupla[1] >= TOL and string[k] != strProc[pos]):
            remover.append([inx, dupla[1]])
            continue
        #Se o novo caracter T[k] é diferente do próximo caracter da sequencia (s) para uma substring T[a..b] iniciando em T[a]
        #e o número de erros ainda está dentro tolerável mantém o candidato e aumenta o número de erros
        elif (string[k] != strProc[pos]):
            dupla[1] += 1
        #Se a substring T[a..b] é corresponde à string (s) com um número tolerável de erros, o candidato é finalizado e a nova
        #ocorrência é registrada
        if (pos == len(strProc) - 1):
            iniFim=[inx,inx+len(strProc)-1]
            ocorrencias.append(iniFim)
            remover.append([inx, dupla[1]])
    for dupla in remover:
        candidatos.remove(dupla)

#Encontra as ocorrências da string procurada (s) na string (T) permitindo um número máximo tolerável de erros (caracteres
#desiguais)
#Retorna as ocorrências em (T) no formato [a..b] e a quantidade de ocorrências de (s) em (T)
def encontraOcorrenciasParecida(string, strProc):
    ocorrencias = []
    candidatos = []
    n = len(string)
    for k in range(n):
        ocorrenciaStringParecida(string, strProc, k, ocorrencias, candidatos)
    return ocorrencias,len(ocorrencias)

### Testes

In [25]:
with open("teste_string.txt") as f:
    arq = f.readlines()
arq = [x.strip() for x in arq] 
string1=arq[2]
string2=arq[8]
string3=arq[14]
subseq1=[arq[4],arq[5],arq[6]]
subseq2=[arq[10],arq[11],arq[12]]
subseq3=[arq[16],arq[17],arq[18]]


### (a)

In [30]:
print("Primeira string:\n")
print(string1)

print("\n")

lst,numOcor = encontraOcorrencias(string1, subseq1[0])
print("A palavra "+ str(subseq1[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrencias(string1, subseq1[1])
print("A palavra "+ str(subseq1[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrencias(string1, subseq1[2])
print("A palavra "+ str(subseq1[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

print("Segunda string:\n")
print(string2)

print("\n")

lst,numOcor = encontraOcorrencias(string2, subseq2[0])
print("A palavra "+ str(subseq2[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrencias(string2, subseq2[1])
print("A palavra "+ str(subseq2[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrencias(string2, subseq2[2])
print("A palavra "+ str(subseq2[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

print("Terceira string:\n")
print(string3)

print("\n")

lst,numOcor = encontraOcorrencias(string3, subseq3[0])
print("A palavra "+ str(subseq3[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrencias(string3, subseq3[1])
print("A palavra "+ str(subseq3[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrencias(string3, subseq3[2])
print("A palavra "+ str(subseq3[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")


Primeira string:

That one comment by my supervisor had a very large flow-on effect. One unintended outcome was that I ended up making Benders' decomposition a focus of my PhD thesis and subsequently applied it to other projects I have been involved in. The work completed as part of my thesis involved the application of Benders' decomposition in conjunction with column generation. I don't state this because it is particularly novel or ground-breaking, but because this integration of solution approaches greatly affects the resulting implementation. In another project while working as a postdoc at UNSW I developed a model that was just too large to fit into the variable structures provided by MATLAB. So I decided the best solution to that problem was to apply Benders' decomposition, hence reducing the number of variables in each individual subproblem. I felt that in this case it was absolutely necessary to use some decomposition technique, but I am not too sure whether that should have b

### (b)

In [32]:
print("Primeira string:\n")
print(string1)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string1, subseq1[0])
print("A palavra "+ str(subseq1[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string1, subseq1[1])
print("A palavra "+ str(subseq1[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string1, subseq1[2])
print("A palavra "+ str(subseq1[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

print("Segunda string:\n")
print(string2)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string2, subseq2[0])
print("A palavra "+ str(subseq2[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string2, subseq2[1])
print("A palavra "+ str(subseq2[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string2, subseq2[2])
print("A palavra "+ str(subseq2[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

print("Terceira string:\n")
print(string3)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string3, subseq3[0])
print("A palavra "+ str(subseq3[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string3, subseq3[1])
print("A palavra "+ str(subseq3[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasMaiuscula(string3, subseq3[2])
print("A palavra "+ str(subseq3[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")


Primeira string:

That one comment by my supervisor had a very large flow-on effect. One unintended outcome was that I ended up making Benders' decomposition a focus of my PhD thesis and subsequently applied it to other projects I have been involved in. The work completed as part of my thesis involved the application of Benders' decomposition in conjunction with column generation. I don't state this because it is particularly novel or ground-breaking, but because this integration of solution approaches greatly affects the resulting implementation. In another project while working as a postdoc at UNSW I developed a model that was just too large to fit into the variable structures provided by MATLAB. So I decided the best solution to that problem was to apply Benders' decomposition, hence reducing the number of variables in each individual subproblem. I felt that in this case it was absolutely necessary to use some decomposition technique, but I am not too sure whether that should have b

### (c)

In [34]:
print("Primeira string:\n")
print(string1)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string1, subseq1[0])
print("A palavra "+ str(subseq1[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string1, subseq1[1])
print("A palavra "+ str(subseq1[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string1, subseq1[2])
print("A palavra "+ str(subseq1[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

print("Segunda string:\n")
print(string2)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string2, subseq2[0])
print("A palavra "+ str(subseq2[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string2, subseq2[1])
print("A palavra "+ str(subseq2[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string2, subseq2[2])
print("A palavra "+ str(subseq2[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

print("Terceira string:\n")
print(string3)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string3, subseq3[0])
print("A palavra "+ str(subseq3[0]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string3, subseq3[1])
print("A palavra "+ str(subseq3[1]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")

lst,numOcor = encontraOcorrenciasParecida(string3, subseq3[2])
print("A palavra "+ str(subseq3[2]) + " possui " + str(numOcor)+ " ocorrência(s) nesta string com no máximo um erro. Caso existam, elas estão nas seguintes posições:\n")
print(lst)

print("\n")


Primeira string:

That one comment by my supervisor had a very large flow-on effect. One unintended outcome was that I ended up making Benders' decomposition a focus of my PhD thesis and subsequently applied it to other projects I have been involved in. The work completed as part of my thesis involved the application of Benders' decomposition in conjunction with column generation. I don't state this because it is particularly novel or ground-breaking, but because this integration of solution approaches greatly affects the resulting implementation. In another project while working as a postdoc at UNSW I developed a model that was just too large to fit into the variable structures provided by MATLAB. So I decided the best solution to that problem was to apply Benders' decomposition, hence reducing the number of variables in each individual subproblem. I felt that in this case it was absolutely necessary to use some decomposition technique, but I am not too sure whether that should have b

### Testes de Execução:
<br /> Em todos os casos, o tempo total foi de 5 segundos.

### Algoritmo (a)

##### Primeira String T
<br />Para a primeira string s buscada:
<br />Número de execuções:7070,7430->Media:7235
<br />Tempo em média de cada execução:5/7235= 0.7 milissegundo
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:7668,7603->Media:7635.5
<br />Tempo em média de cada execução:5/7635.5= 0.6 milissegundo
<br />
<br />Para a terceira string s buscada:
<br />Número de execuções:6587,7353->Media:6970
<br />Tempo em média de cada execução:5/6970= 0.7 milissegundo
<br />
##### Segunda String T
<br />Para a primeira string s buscada:
<br />Número de execuções:8422,9773->Media:9097.5
<br />Tempo em média de cada execução:5/9097.5= 0.5 milissegundo
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:9979,8678->Media:9328.5
<br />Tempo em média de cada execução:5/9328.5= 0.5 milissegundo
<br />
<br />Para a terceira string s buscada:
<br />Número de execuções:8768,8660->Media:8714
<br />Tempo em média de cada execução:5/8714= 0.6 milissegundo
<br />
##### Terceira String T
<br />Para a primeira string s buscada:
<br />Número de execuções:12883,14449->Media:13666
<br />Tempo em média de cada execução:5/13666= 0.4 milissegundo
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:14045,13270->Media:13657.5
<br />Tempo em média de cada execução:5/13657.5= 0.4 milissegundo
<br />
<br />Para a terceira string s buscada:
<br />Número de execuções:12456,12540->Media:12498
<br />Tempo em média de cada execução:5/12498= 0.4 milissegundo

### Algoritmo (b)
<br /> Como o algoritmo apenas promove a equivalência entre letras minúsculas e maiúsculas, registrou-se somente o tempo de execução para busca pela primeira e segunda strings s na primeira string T, já que estas abordam tal equivalência.
##### Primeira String T
<br />Para a primeira string s buscada:
<br />Número de execuções:2640,3463->Media:3051.5
<br />Tempo em média de cada execução:5/3051.5= 1.6 milissegundos
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:3660,3556->Media:3608
<br />Tempo em média de cada execução:5/3608= 1.3 milissegundos

### Algoritmo (c)

##### Primeira String T
<br />Para a primeira string s buscada:
<br />Número de execuções:1039,1303->Media:1171
<br />Tempo em média de cada execução:5/1171= 4.2 milissegundos
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:1126,1259->Media:1192.5
<br />Tempo em média de cada execução:5/1192.5=4.2 milissegundos
<br />
<br />Para a terceira string s buscada:
<br />Número de execuções:1249,1333->Media:1291
<br />Tempo em média de cada execução:5/1291= 3.9 milissegundos
<br />
##### Segunda String T
<br />Para a primeira string s buscada:
<br />Número de execuções:2005,2290->Media:2147.5
<br />Tempo em média de cada execução:5/2147.5= 2.3 milissegundos
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:2056,2214->Media:2135
<br />Tempo em média de cada execução:5/2135= 2.3 milissegundos
<br />
<br />Para a terceira string s buscada:
<br />Número de execuções:1878,2244->Media:2061
<br />Tempo em média de cada execução:5/2061= 2.4 milissegundos
<br />
##### Terceira String T
<br />Para a primeira string s buscada:
<br />Número de execuções:3002,3393->Media:3197.5
<br />Tempo em média de cada execução:5/3197.5= 1.5 milissegundo
<br />
<br />Para a segunda string s buscada:
<br />Número de execuções:2352,2789->Media:2660.5
<br />Tempo em média de cada execução:5/2660.5= 1.9 milissegundo
<br />
<br />Para a terceira string s buscada:
<br />Número de execuções:2890,2857->Media:2873.5
<br />Tempo em média de cada execução:5/2873.5= 1.7 milissegundo