<a href="https://colab.research.google.com/github/hernandemonteiro/Praticas-Livro-Entendendo-Algoritmos/blob/main/livro_entendendo_algoritmos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **BigO Notation**
É a função que calcula o tempo de execução de um algoritmo baseado no espaço, ela sempre retornara o pior dos casos para aquele algoritmo (etapas necessárias, no pior dos casos), esse tempo de execução não é medido em 's' ou 'ms', ele é medido sobre a quantidade de etapas que sera necessária para resolver o algoritmo.


---


### **Existem 7 niveis de complexidade:**


---


<table>
<thead>
<tr>
  <th>Operações</th>
  <th>Nome</th>
  <th>Complexidade</th>
</tr>
</thead>
<tbody>
  <tr>
    <td>O(n!)</td>
    <td>Fatorial</td>
    <td>Quando cresce o array, as operações crescem fatorialmente, pior de todos os BigOs</td>
  </tr>
   <tr>
    <td>O(2^n)</td>
    <td>Exponencial</td>
    <td>O tempo de execução do algoritmo aumenta exponencialmente com o tamanho da entrada.</td>
  </tr>
   <tr>
    <td>O(n²)</td>
    <td>Quadrático</td>
    <td>O tempo de execução do algoritmo é proporcional ao quadrado do tamanho da entrada.</td>
  </tr>
   <tr>
    <td>O(n log n)</td>
    <td>Proporcional</td>
    <td>Cresce em conformidade com a quantidade de dados na estrutura.</td>
  </tr>
   <tr>
    <td>O(n)</td>
    <td>Linear</td>
    <td>No pior caso teriamos de percorrer toda a estrutura de dados para encontrar o valor.</td>
  </tr>
   <tr>
    <td>O(log n)</td>
    <td>Logaritimica</td>
    <td>Quanto maior for o tamanho da estrutura menos tempo ele leva em consideração aos outros tempos de execução.</td>
  </tr>
   <tr>
    <td>O(1)</td>
    <td>Constante</td>
    <td>Independentemente do tamanho da entrada, o tempo de execução do algoritmo permanece constante.</td>
  </tr>
</tbody>
</table>


## **Exemplos de Algoritmos**
Abaixo temos alguns algoritmos utilizando python como linguagem, esses algoritmos
tem em sua descrição seu tempo de execução.


---

### **Busca (Search)**
Algoritmos de busca são algoritmos utilizados para encontrar uma informação dentro de um conjunto de dados (Array, Lista, ...)

#### **Linear Search**
<div align="center">
<h4>
<b>Tempo de Execução: $$O(n)$$</b>
</h4>

O algoritmo de busca linear tem por base o acesso linear a informação pedida, ou seja, ele anda cada posição do array até encontrar o valor, então caso o item pedido seja o ultimo, temos que percorrer todo o conjunto de dados para encontrar a posição esperada, por isso seu tempo de execução é refletido no tamnho de seu conjunto O(n), sendo n o tamanho do conjunto.
<br/>

> Funciona bem apenas quando não temos a opção de ordenar a lista, então precisamos percorrer cada posição da lista.
</div>

In [None]:
import random

# criando array e bagunçando ordem para uso aleatorio
array = list(range(1, 240))
random.shuffle(array)

def linearSearch(array, item):
  step = 1
  for number in array:
    if number == item:
      print(f"Step ({step}) => {number}")
      break
    step+=1

# Exemplos
linearSearch(array, 1)
linearSearch(array, 50)
linearSearch(array, 230)

Step (55) => 1
Step (216) => 50
Step (132) => 230


#### **Binary Search**

<div align="center">
<h4><b>Tempo de Execução: $$O(\log n)$$ </b></h4>
<br/>
Algoritmo de busca binaria tem por base a divisão e acesso ao valor central de um array ordenado, assim comparando a grandeza ou igualdade para excluir uma parte não correspondente do array.
<br/>
Chamamos de Busca Binária por ser sempre uma divisão ao meio do array.
<br/>

> Funciona apenas quando a lista é ordenada, em nosso caso de forma crescente.
</div>

In [None]:
# conjunto de dados
array = list(range(1, 240001))

In [None]:
# algoritmo
def myBynarySearch(array, item):
  step = 1
  if not array[0] <= item <= array[-1]:
    print("Error out of range!")
    return

  while True:
    index = len(array) // 2
    currentNumber = array[index]

    if(currentNumber == item):
      print(f"Steps: {step}")
      print(currentNumber)
      break
    if item < currentNumber:
      array = array[0:index]
    else:
      array = array[index:len(array)]

    step += 1

# chamada do algoritmo com conjunto de dado
myBynarySearch(array, 1)

Steps: 18
1


### **Ordenação (Sorting)**
Algoritmos de ordenação são algoritmos utilizados para organizar de forma crescente ou decrescente uma estrutura de Dados.
<br/>
Hoje em dia a maioria das linguagens tem seus métodos internos de ordenação, então o estudo sobre é considerado uma boa prática, mas não tão usual no dia a dia.

#### **Selection Sort**
<div align="center">

![Selection Sort](https://i.stack.imgur.com/5ai2E.jpg)

<h4><b>Tempo de Execução: $$O(n²)$$</b></h4>
O algoritmo trabalha diretamente no array original, trocando os elementos de posição conforme necessário para ordená-los.

----
##### **O selection sort funciona da seguinte maneira:**
---

<div align="left">

1. Para cada posição no array, encontre o menor elemento na parte não ordenada do array (começando da posição atual até o final).
2. Troque o menor elemento encontrado com o elemento na posição atual.
3. Avance para a próxima posição no array e repita o processo até que todo o array esteja ordenado.
</div>
</div>


In [None]:
def searchValue(arrayReceived, asc=True):
  value = arrayReceived[0]
  value_index = 0
  for i in range(1, len(arrayReceived)):
    condition = arrayReceived[i] < value if asc == True else arrayReceived[i] > value
    if(condition):
      value = arrayReceived[i]
      value_index = i
  return value_index

In [None]:
def selectionSort(arrayReceived, asc=True):
  newArray = []
  for i in range(len(arrayReceived)):
    index = searchValue(arrayReceived, asc)
    newArray.append(arrayReceived.pop(index))
  return newArray

In [None]:
array = [0, 3, 7, 4, 6, 2, 5, 8, 10, 1, 9]
selectionSort(array, asc=False)

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

#### **Recursão**
Vamos falar um pouco sobre recursão, aqui vão rodar alguns exemplos de código que podem ser utils em caso de precisarmos repetir sua chamada, ou seja, uma função que tem capacidade de chamar a si mesma novamente. dessa maneira aprenderemos recursão e logo voltaremos a falar sobre algoritmos de ordenação.



> "Os loops podem melhorar o desempenho do seu programa. a recursão melhora o desempenho do seu programador. Escolha o que for mais importante para sua situação."
- Leigh CaldWell




In [None]:
# exemplo (fatorial), com loop

def fatorial(number: int):
  result = number
  next = number;
  while next > 1:
    next-=1
    result = result * next
  return result

In [None]:
fatorial(5)

120

In [None]:
# fatorial recursivo

def fat(x: int):
  if x == 1:
    return 1
  else:
    return x * fat(x-1)

In [None]:
fat(5)

120

In [None]:
# função regressiva (recursiva) que chama a si mesma
def regressiva(number: int):
  print(number)
  if number > 1:
    regressiva(number -1)

In [None]:
regressiva(5)

5
4
3
2
1


#### **Quick Sort**
<div align="center">

![Quick Sort Image](https://media.geeksforgeeks.org/wp-content/uploads/20231219164812/Quick-Sort-Algorithm.png)

</div>

Algoritmo de ordenação, com o lema: dividir para conquistar.
<br/>

Mais rápido que o Merge Sort, a relevância da constante de medida do BigO é uma das causas desse feito.

In [None]:
# exemplo de DC ( dividir para conquistar )
# aqui vemos uma ideia básica sobre
# o métodod usado no algoritmo que estamos acompanhando
# lição 4.1
numberList = [2, 4, 5, 2]

def sum(array: list[int]):
  if not array:
    return 0
  else:
    return array[0] + sum(array[1:])

sum(numberList)

13

In [None]:
# contar os numeros da lista com função recursiva (DC)
# lição 4.2
numberList = [2, 4, 4]

def countItems(array: list[int]):
  if not array:
    return 0
  else:
    return 1 + countItems(array[1:])

countItems(numberList)

3

In [None]:
# encontrar o valor mais alto da lista de forma recursiva (DC)
# lição 4.3
numberList = [2, 4, 12, 133, 4, 5, 25]

def majorInArray(array: list[int]):
  if len(array) == 1:
    return array[0]
  nextCall = majorInArray(array[1:])
  return array[0] if array[0] >  nextCall else nextCall

majorInArray(numberList)

133

In [None]:
# Agora vamos ao QuickSort
# escolhemos um numero como pivo
# depois criamos dois arrays, um com os valores menores
# e outro com os maiores que o pivo
# após retornamos a soma de menores + pivo + maiores
# e chamamos a recursividade para fazer isso até que
# o caso-base seja retornado, ou seja, um array de
# 1 posição, mesmo nesse caso o pior caso seria O(n)

numberList = [32, 2, 74, 4, 12, 133, 1, 5, 25]

def qsort(array: list[int]):
  if len(array) < 2:
    return array
  else:
    pivot: int = array[0]
    minor = [i for i in array[1:] if i <= pivot]
    major = [i for i in array[1:] if i >= pivot]
    return qsort(minor) + [pivot] + qsort(major)

qsort(numberList)

[1, 2, 4, 5, 12, 25, 32, 74, 133]

In [None]:
# para diminuirmos o pior caso de tempo de execução para
# O(n log n), podemos escolher o pivo aleatoriamente,
# assim, os casos que apresentarem um ordenação podem
# ser ordenados mais facilmente

import random

numberList = [32, 2, 74, 54, 4, 6, 12, 133, 1, 5, 25]

def qsort2(array: list[int]):
    if len(array) < 2:
        return array
    else:
        pivot_index = random.randint(0, len(array) - 1)
        pivot = array[pivot_index]
        minor = [i for i in array[:pivot_index] + array[pivot_index + 1:] if i <= pivot]
        major = [i for i in array[:pivot_index] + array[pivot_index + 1:] if i >= pivot]
        return qsort2(minor) + [pivot] + qsort2(major)

qsort2(numberList)


[1, 2, 4, 5, 6, 12, 25, 32, 54, 74, 133]

### **Tabelas Hash**
<div align="center">

![Hash Table image](https://upload.wikimedia.org/wikipedia/commons/thumb/3/34/HASHTB32.svg/294px-HASHTB32.svg.png)

</div>
Hash Tables ou Tabelas Hash, é uma estrutura de dados básica muito útil, ela mapeia chaves para valores, utilizando uma função de hash para calcular um índice (endereço) onde um valor pode ser encontrado.
<br/>

Elas funcionam com uma função hash, que retorna um valor para cada posição, mapeando assim as chaves para indices.
<br/>

São ótimas quando você deseja mapear algum item em relação a outro, por você precisar pesquisar algo.
<br/><br/>
Podem ser utilizadas para cachear informações importantes para a aplicação.

In [None]:
# dentro das linguagens temos implementações
# de hash tables como o Dictionary em python
# ou os objects (JSON) em JS/TS

caderno = dict()
# ou caderno = {}
caderno["maçã"] = 0.67
caderno["leite"] = 1.49
caderno["abacate"] = 1.49

print(f"caderno: {caderno}")

# ficando mais facil acessar as posições
# por cada item ser um index, isso fica mais facil

print("Leite:", caderno["leite"])

# que também pode ser escrito em python assim:

caderno2 = {
    "maçã": 0.67,
    "leite": 1.49,
    "abacate": 1.49,
}

print(f"caderno2: {caderno2}")

caderno: {'maçã': 0.67, 'leite': 1.49, 'abacate': 1.49}
Leite: 1.49
caderno2: {'maçã': 0.67, 'leite': 1.49, 'abacate': 1.49}


In [None]:
print(caderno.get("uva"))
print(caderno.get("maçã"))

None
0.67


In [None]:
# exemplo para verificar se pessoas já votaram
# em uma eleição

voted = {}

def verify_elector(name: str):
  if voted.get(name):
    print("Mande embora!")
  else:
    voted[name] = True
    print("Deixe votar")

# primeira vez que chega ao local para votar e apresenta nome
verify_elector("Hernande")
print("\n Votou! \n")
# segunda vez chegando ao local que já votou
verify_elector("Hernande")

Deixe votar

 Votou! 

Mande embora!


##### **Colisões e Desempenho**
Colisão é quando duas chaves são indicadas para o mesmo espaço em memória, para isso é importante o uso da função hash, ela mapeia cada dado para um único espaço.
<br/>
Para uma tabela hash ter um tempo de execução constante O(1), é importante que ela tenha um baixo fator de carga e uma boa função hash, senão pode causar colisões e podemos também gerar o pior caso de tempo de execução O(n) o que seria um tempo linear.
<br/>
A maior parte das linguagens já possui sua hash table implementada, então você não vai precisar implementar uma do zero, mas conhecer sobre é sempre bom.

In [None]:
# tool para remover acentos
!pip install unidecode

Collecting unidecode
  Downloading Unidecode-1.3.8-py3-none-any.whl (235 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m235.5/235.5 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: unidecode
Successfully installed unidecode-1.3.8


In [None]:
from unidecode import unidecode

text = "Maus"
# exercicios função hash
#  a - retorne 1 para qualquer entrada
def returnOne(input: str):
  print(f"Return One: {input}")
  return 1

print(returnOne(text))

#  b - use o comprimento da string como indice
def returnLength(input: str):
  print(f"Return Length: {input}")
  return len(input)

print(returnLength(text))

#  c - use o primeiro caractere como indice
def returnFirstLetter(input: str):
  print(f"First Letter: {input}")
  return input[0]

print(returnFirstLetter(text)
)
#  d - mapeie cada letra para um numero primo
def prime_mapping(letter):
  prime_numbers = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107]
  letter = unidecode(letter)
  if letter.isalpha():
    base = ord('A') if letter.isupper() else ord('a')
    offset = ord(letter) - base
    return prime_numbers[offset]
  elif letter == ' ':
    return 0
  else:
    return 0

def returnPrimeNumberHash(input: str):
  print(f"Prime Number Hash: {input}")
  hash = 10
  primeNumbers = [prime_mapping(letter) for letter in input]
  return sum(primeNumbers) % hash

print(returnPrimeNumberHash(text)
)

Return One: Maus
1
Return Length: Maus
4
First Letter: Maus
M
Prime Number Hash: Maus
3


### **Pesquisa em Largura**

<div align="center">

![BDS](https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcScjjt6ZvfpVa2JZL6Sqk5TTAZPwFxBeqVnCz9860q2zQ&s)

</div>

Pesquisa em Largura ou Breadth First Search (BFS) é um algoritmo para pesquisa em Grafos (Graph), uma estrutura de dados que veremos agora também.
<br/>
Essa pesquisa permite encontrar o menor caminho entre dois objetos.
<br/>
Com isso abrimos um leque de possibilidades:

- Escrever um algoritmo de Machine Learning que encontre o menor numero de jogadas para uma vitória em partida de damas.

- Criar um corretor ortográfico ( o qual calcula o menor número de edições para transformar a palavra digitada incorretamente em uma palavra real )

- Encontrar o médico conveniado mais perto de você.


#### **Grafo**

Um grafo é um conjunto de conexões composto por vértices (nó) e arestas (link, arco), essas vértices se relacionam entre si por meio das arestas.
<br/>
Todos os nós conectados diretamente por uma aresta também são conhecidos como vizinhos.
<br/><br/>
Exemplo:
<br/>

![Imagem de vértice e aresta](https://resumos.leic.pt/static/f6fdb904523248a98dfe256850c5ac92/0aaa2/0018-grafo.png)

In [None]:
# exemplo de grafo em código, mapeando amigos próximos (vizinhos).
# como mapear você -> bov, você -> claire, você -> alice?

grafo = {}

grafo["voce"] = ["alice", "bob", "claire"]

print(grafo)

# e para um grafo maior? adicionando amigo dos amigos

grafo["bob"] = ["anuj", "peggy"]
grafo["alice"] = ["peggy"]
grafo["claire"] = ["thom", "jonny"]
grafo["anuj"] = []
grafo["peggy"] = []
grafo["thom"] = []
grafo["jonny"] = []


# para os casos de anuj, peggy, thom e jonny, eles tem
# grafos apontados para eles, mas não apontam para ninguém, ou seja,
# não tem vizinhos, esses são chamados de digrafos ou grafo direcionado,
# em grafos não direcionados, ambos os vizinhos apontam um para o outro,
# um exemplo nesse caso seria que o "thom" seria vizinho de "claire"
print(grafo)

{'voce': ['alice', 'bob', 'claire']}
{'voce': ['alice', 'bob', 'claire'], 'bob': ['anuj', 'peggy'], 'alice': ['peggy'], 'claire': ['thom', 'jonny'], 'anuj': [], 'peggy': [], 'thom': [], 'jonny': []}


In [None]:
# Implementando o algoritmo de BFS
from collections import deque

# digamos que o vendedor de manga termine com a letra "m"
def person_is_seller(name):
  return name[-1] == "m"

def bfsAlgo(grafo):
  search_stack = deque()
  search_stack += grafo["voce"]
  verified = []
  while search_stack:
    person = search_stack.popleft()
    if person not in verified:
      if person_is_seller(person):
        print(person + " é um vendedor de manga!")
        return True
      else:
        search_stack += grafo[person]
        verified.append(person)
  return False

In [None]:
bfsAlgo(grafo)

thom é um vendedor de manga!


True

### **Algoritmo de Dijkstra**

Algoritmo que ajuda determinar o caminho mais curto levando em conta seu tempo.
<br/>
Esse algoritmo só funciona quando não temos um ciclo, grafo não direcionado ou grafos com pesos negativos, para esse outro caso podemos utilizar o algoritmo Bellman-Ford, o qual permite essas entradas, mas é mais lento.

In [None]:
def ache_nodo_custo_mais_baixo(custos, processados):
  custo_mais_baixo = float("inf")
  nodo_custo_mais_baixo = None
  for nodo in custos:
    custo = custos[nodo]
    if custo<custo_mais_baixo and nodo not in processados:
      custo_mais_baixo = custo
      nodo_custo_mais_baixo = nodo
  return nodo_custo_mais_baixo

In [None]:
def caminho_do_grafo(initKey: str, endKey: str, fathers: dict):
  atual = endKey
  custo_total = 0
  caminho = []
  caminho.append(endKey)

  while atual != initKey:
    pai = fathers[atual]
    atual = pai
    caminho.append(pai)
  caminho[:] = reversed(caminho)
  for i in caminho:
    print(i)

  print("\nCusto Total:", custos["fim"])

In [None]:
def dijkstra_algo(custos):
  processados = []
  nodo = ache_nodo_custo_mais_baixo(custos, processados)
  while nodo is not None:
    custo = custos[nodo]
    vizinhos = grafo[nodo]
    for n in vizinhos.keys():
      novo_custo = custo + vizinhos[n]
      if custos[n] > novo_custo:
        custos[n] = novo_custo
        pais[n] = nodo
    processados.append(nodo)
    nodo = ache_nodo_custo_mais_baixo(custos, processados)
  caminho_do_grafo("inicio", "fim", pais)

In [None]:
grafo = {}

grafo["inicio"] = {}
grafo["inicio"]["a"] = 6
grafo["inicio"]["b"] = 2
grafo["a"] = {}
grafo["a"]["fim"] = 1
grafo["b"] = {}
grafo["b"]["a"] = 3
grafo["b"]["fim"] = 5
grafo["fim"] = {}

infinito = float("inf")

custos = {}
custos["a"] = 6
custos["b"] = 2
custos["fim"] = infinito

pais = {}

pais["a"] = "inicio"
pais["b"] = "inicio"
pais["fim"] = None

dijkstra_algo(custos)

inicio
b
a
fim

Custo Total: 6


In [None]:
grafo = {}

grafo["inicio"] = {}
grafo["inicio"]["a"] = 5
grafo["inicio"]["b"] = 2
grafo["a"] = {}
grafo["a"]["d"] = 2
grafo["a"]["c"] = 4
grafo["b"] = {}
grafo["b"]["a"] = 8
grafo["b"]["d"] = 7
grafo["c"] = {}
grafo["c"]["d"] = 6
grafo["c"]["fim"] = 3
grafo["d"] = {}
grafo["d"]["fim"] = 1
grafo["fim"] = {}

infinito = float("inf")
custos = {}
custos["a"] = 5
custos["b"] = 2
custos["c"] = infinito
custos["d"] = infinito
custos["fim"] = infinito


pais = {}
pais["a"] = "inicio"
pais["b"] = "inicio"
pais["c"] = None
pais["d"] = None
pais["fim"] = None

dijkstra_algo(custos)

inicio
a
d
fim

Custo Total: 8


In [None]:
# Representações de grafos, podemos usar hash tables,
# mas também outras formas de representar.
# Exemplo: matriz de adjacência

# Criando uma lista 2D que representa uma adjacency matrix (graph)
adjacency_matrix = [
    [0, 1, 1, 0, 0],
    [1, 0, 1, 1, 0],
    [1, 1, 0, 1, 1],
    [0, 1, 1, 0, 1],
    [0, 0, 1, 1, 0]
]

# Print the adjacency matrix
for row in adjacency_matrix:
    print(row)

[0, 1, 1, 0, 0]
[1, 0, 1, 1, 0]
[1, 1, 0, 1, 1]
[0, 1, 1, 0, 1]
[0, 0, 1, 1, 0]


In [None]:
# Exemplo: lista de adjacência

# Criando um dicionário que representa uma lista de adjacência (graph)
lista_adjacencia = {
    0: [1, 2],
    1: [0, 2, 3, 4],
    2: [0, 1, 3, 4],
    3: [1, 2, 4],
    4: [1, 2, 3]
}

# Imprimindo a lista de adjacência
for key, value in lista_adjacencia.items():
    print(f"Node {key}: {value}")

### **Algoritmo Guloso (greedy algorithm)**

Um algoritmo guloso, ou greedy algorithm, é um tipo de algoritmo que busca a solução ótima de um problema em etapas locais, com a esperança de que cada passo leve a uma solução global ótima. Em geral, um algoritmo guloso faz uma série de escolhas que parecem ser as melhores no momento, sem considerar as consequências futuras.
<br/>
<br/>
Algoritmos gulosos são frequentemente usados em problemas de otimização, como o problema da mochila (knapsack problem), onde você precisa preencher uma mochila com itens de valores e pesos diferentes de forma a maximizar o valor total sem exceder o peso máximo da mochila.
<br/>
<br/>
Pontos a observar:
* Não garante a solução ótima: Embora os algoritmos gulosos sejam intuitivos e fáceis de implementar, eles não garantem sempre a solução ótima. Às vezes, podem produzir soluções subótimas.
* Não necessidade de backtracking: Uma vez feita uma escolha em um algoritmo guloso, ela é final e não será revisada posteriormente. Ou seja, não há necessidade de desfazer ou reverter escolhas anteriores.
* Eficiência: Em muitos casos, os algoritmos gulosos são eficientes e têm boa performance. Eles são especialmente úteis quando se deseja encontrar uma solução aproximada para um problema de otimização em um tempo razoável.

In [None]:
# algoritmo de aproximação (exemplo de algoritmo guloso)

estados_abranger = set(["mt", "wa", "or", "id", "nv", "ut", "ca", "az"])
print("Estados:", estados_abranger)

estacoes = {}

estacoes["kum"] = set(["id", "nv", "ut"])
estacoes["kdois"] = set(["wa", "id", "mt"])
estacoes["ktres"] = set(["or", "nv", "ca"])
estacoes["kquatro"] = set(["nv", "ut"])
estacoes["kcinco"] = set(["ca", "az"])

estacoes_finais = set()

while estados_abranger:
  melhor_estacao = None
  estados_cobertos = set()

  for estacao, estados in estacoes.items():
    cobertos = estados_abranger & estados
    if len(cobertos) > len(estados_cobertos):
      melhor_estacao = estacao
      estados_cobertos = cobertos

    estados_abranger -= estados_cobertos
    estacoes_finais.add(melhor_estacao)

print(estacoes_finais)

Estados: {'wa', 'nv', 'mt', 'ca', 'az', 'ut', 'or', 'id'}
{'ktres', 'kum', 'kdois', None, 'kcinco'}


#### **Problemas NP-completos**
Problemas NP-completos são um conjunto especial de problemas na teoria da complexidade computacional. A classe de problemas NP-completos é composta por problemas que, intuitivamente, são tão difíceis que, se houvesse um algoritmo eficiente para resolver qualquer um deles, então todos os problemas em NP poderiam ser resolvidos de forma eficiente.
<br/>
Um exemplo é o problema do caixeiro viajante.
<br/>
Em resumo problemas NP-Completo não tem uma solução rápida.
<br/>
No caso de encontrar um NP-Completo o melhor a se fazer é usar um algoritmo de aproximação.

### **Programação Dinâmica**
É uma técnica para resolução de problemas complexos que se baseia na divisão de um problema em subproblemas, os quais são resolvidos separadamente.
<br/>
Todas as soluções de programação dinâmica envolve uma tabela.

In [None]:
# Maior substring comum
def common_substring (palavra_a, palavra_b):
  celula = [[0 for _ in range(len(palavra_b) + 1)] for _ in range(len(palavra_a) + 1)]

  for i in range(1, len(palavra_a) + 1):
      for j in range(1, len(palavra_b) + 1):
          if palavra_a[i - 1] == palavra_b[j - 1]:
              celula[i][j] = celula[i - 1][j - 1] + 1
          else:
              celula[i][j] = 0

  print("Comprimento maior substring comum:", max(max(row) for row in celula))
  return celula

In [None]:
common_substring("hish", "fish")

Comprimento maior substring comum: 3


[[0, 0, 0, 0, 0],
 [0, 0, 0, 0, 1],
 [0, 0, 1, 0, 0],
 [0, 0, 0, 2, 0],
 [0, 0, 0, 0, 3]]

In [None]:
common_substring("hish", "vista")

Comprimento maior substring comum: 2


[[0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0],
 [0, 0, 1, 0, 0, 0],
 [0, 0, 0, 2, 0, 0],
 [0, 0, 0, 0, 0, 0]]

In [None]:
def common_subsequence(palavra_a, palavra_b):
    celula = [[0 for _ in range(len(palavra_b) + 1)] for _ in range(len(palavra_a) + 1)]

    for i in range(1, len(palavra_a) + 1):
        for j in range(1, len(palavra_b) + 1):
            if palavra_a[i - 1] == palavra_b[j - 1]:
                celula[i][j] = celula[i - 1][j - 1] + 1
            else:
                celula[i][j] = max(celula[i - 1][j], celula[i][j - 1])

    max_subsequence_length = celula[-1][-1]
    print("Comprimento da maior subsequência comum:", max_subsequence_length)

    return celula

In [None]:
# nesse caso a maior substring falharia, sendo necessario outro algoritmo
celula1 = common_substring("fosh", "fish")
print(celula1)
# aqui está a solução a aplicação da susequência comum
celula2 = common_subsequence("fosh", "fish")
print(celula2)

# a maior subsequência é utilizada para análise de similaridade
# nas leitura de fitas de DNA, isso pode dizer o quão semelhante
# são dois animais ou duas doenças

Comprimento maior substring comum: 2
[[0, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 2]]
Comprimento da maior subsequência comum: 3
[[0, 0, 0, 0, 0], [0, 1, 1, 1, 1], [0, 1, 1, 1, 1], [0, 1, 1, 2, 2], [0, 1, 1, 2, 3]]


In [None]:
common_substring("blue", "clue")

Comprimento maior substring comum: 3


[[0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 1, 0, 0],
 [0, 0, 0, 2, 0],
 [0, 0, 0, 0, 3]]

### **k-nearest neighbors (k-vizinhos mais próximos)**

Esse é um algoritmo de classificação amplamente usado em machine learning, ele ajuda classificar conjuntos de dados em categorias e suas semelhanças através da regressão. esse algoritmo consegue classificar itens por aproximação, calculando seus vizinhos mais próximos.

In [None]:
import pandas as pd
from math import sqrt
usuarios_pd = pd.DataFrame({
     "Priyanka": [3, 4, 4, 1, 4],
    "Justin": [4, 3, 5, 1, 5],
    "Morpheus": [2, 5, 1, 3, 1]
}, index=["comédia", "ação", "drama", "terror", "romance"])

usuarios = {
    "Priyanka": [3, 4, 4, 1, 4],
    "Justin": [4, 3, 5, 1, 5],
    "Morpheus": [2, 5, 1, 3, 1]
}


def distancia_usuarios(user_one, user_two):
  sum = 0
  for i in range(0, len(user_one)):
    number = (user_one[i] - user_two[i]) ** 2
    sum += number
  return sqrt(sum)

# print("Justin <> Priyanka", distancia_usuarios(usuarios["Justin"], usuarios["Priyanka"]))
# print("Priyanka <> Morpheus", distancia_usuarios(usuarios["Priyanka"], usuarios["Morpheus"]))
sqrt((3 - 2) ** 2 + (4 - 5) ** 2 + (4 - 1) ** 2 + (1 - 3) ** 2 + (4 - 1) ** 2)

4.898979485566356

In [None]:
usuarios_pd

Unnamed: 0,Priyanka,Justin,Morpheus
comédia,3,4,2
ação,4,3,5
drama,4,5,1
terror,1,1,3
romance,4,5,1


In [None]:
# fazendo o mesmo calculo de distância usando numpy
import numpy as np
np.linalg.norm(usuarios_pd["Morpheus"] - usuarios_pd["Priyanka"])

4.898979485566356