#Search Algorithm

##Tree

###Construção da Árvore

In [1]:
class Nodo():
    def __init__(self, value=None, leftNodo=None, rightNodo=None):
        self.value = value
        self.leftNodo = leftNodo
        self.rightNodo = rightNodo

class Tree():
    def __init__(self, nodo=None):
        self.tree = nodo

In [2]:
def construct_tree(height, value=1):
    if height == 0:
        return None
    else:
        left_subtree = construct_tree(height - 1, value * 2)
        right_subtree = construct_tree(height - 1, value * 2 + 1)
        return Nodo(value, left_subtree, right_subtree)

def print_tree(node, level=0):
    if node is not None:
        print_tree(node.rightNodo, level + 1)
        print("   " * level + str(node.value))
        print_tree(node.leftNodo, level + 1)

In [3]:
tree = Tree(construct_tree(5))
print_tree(tree.tree)

            31
         15
            30
      7
            29
         14
            28
   3
            27
         13
            26
      6
            25
         12
            24
1
            23
         11
            22
      5
            21
         10
            20
   2
            19
         9
            18
      4
            17
         8
            16


###Busca em Profundidade

In [4]:
def search_tree(nodo=None, value=None, height=None, left=0, right=0):
    if nodo is not None:
      if value == nodo.value:
          print(f'Encontrado o valor {value}\nAltura: {height}')
          if left == 1:
            print("Nodo a esquerda")
          else:
            print("Nodo a direita")
          return 0
      else:
        height += 1
        search_tree(nodo.leftNodo, value, height, 1, 0)
        search_tree(nodo.rightNodo, value, height, 0, 1)

In [5]:
search_tree(nodo=tree.tree, value=31, height=1, left=0, right=0)

Encontrado o valor 31
Altura: 5
Nodo a direita


###Busca em Largura

In [6]:
def search_tree_bfs(nodo=None, value=None, height=0):
    if nodo is not None:
      listNodo = [(nodo, height)]
      while listNodo:
        nodoVerify, current_height = listNodo.pop(0)
        if nodoVerify.value == value:
          print("Valor encontrado")
          print(f'Encontrado o valor {nodoVerify.value}\nAltura no qual foi encontrado o valor: {current_height}')
          return None

        if nodoVerify.leftNodo:
          listNodo.append((nodoVerify.leftNodo, current_height + 1))
        if nodoVerify.rightNodo:
          listNodo.append((nodoVerify.rightNodo, current_height + 1))

      print("Valor nao encontrado")
      print(f'Altura da árvore percorrida: {current_height}')
      return None

In [7]:
search_tree_bfs(tree.tree, 5, 1)

Valor encontrado
Encontrado o valor 5
Altura no qual foi encontrado o valor: 3


###Busca Heuristica

In [8]:
def search_tree_greedy(nodo=None, value=None, height=0, maxValue = 0):
        valueLeft = 0
        valueRight = 0
        if nodo.value == value:
          print("Valor encontrado")
          print(f'Encontrado o valor {value}\nAltura no qual foi encontrado o valor: {height}')
          print(f'Valor mais alto encontrado durante o percurso: {maxValue}')
          return None
        if nodo.rightNodo:
          valueLeft = abs(nodo.leftNodo.value - value) / max(abs(nodo.leftNodo.value), abs(value))
        if nodo.leftNodo:
          valueRight = abs(nodo.rightNodo.value - value) / max(abs(nodo.rightNodo.value), abs(value))


        if valueRight > valueLeft and nodo.rightNodo:
          if nodo.rightNodo.value > maxValue:
            maxValue = nodo.rightNodo.value
          search_tree_greedy(nodo.rightNodo, value, height + 1, maxValue)
        elif valueRight < valueLeft and nodo.leftNodo:
          if nodo.leftNodo.value > maxValue:
            maxValue = nodo.leftNodo.value
          search_tree_greedy(nodo.leftNodo, value, height + 1, maxValue)
        else:
          print("Valor nao encontrado")
          print(f'Altura da árvore percorrida: {height}')
          print(f'Valor mais alto encontrado durante o percurso: {maxValue}')
          return None

In [9]:
search_tree_greedy(tree.tree, 31, 1) #1, 3, 7, 15, 31

Valor nao encontrado
Altura da árvore percorrida: 5
Valor mais alto encontrado durante o percurso: 16


##(Depth-First Search - DFS)

A busca em profundidade (Depth-First Search - DFS) é um algoritmo de busca usado em grafos e estruturas de dados em árvore. Ela começa na raiz (ou em um nó inicial arbitrário) e explora tão profundamente quanto possível ao longo de cada ramificação antes de fazer o backtracking (retornar) para explorar outras ramificações

In [10]:
vectorAdjacentes = []

def dfs(grafo, no_atual, visitados, condicaoDeParada):
  if no_atual not in visitados:
    visitados.append(no_atual)
    for i in grafo[no_atual]:
      if i == condicaoDeParada:
        vectorAdjacentes.append(no_atual)
      dfs(grafo, i, visitados, condicaoDeParada)


  print(visitados)



In [11]:
grafo = [ [1],           # Vizinhos do vértice 0.
          [2, 3],        # Vizinhos do vértice 1.
          [1, 4],        # Vizinhos do vértice 2.
          [0, 2],        # Vizinhos do vértice 3.
          [1]            # Vizinhos do vértice 4.
        ]
visitados = []
no_atual = 0
dfs(grafo, no_atual, visitados, 2)
print(vectorAdjacentes)

[0, 1, 2]
[0, 1, 2, 4]
[0, 1, 2, 4]
[0, 1, 2, 4]
[0, 1, 2, 4, 3]
[0, 1, 2, 4, 3]
[0, 1, 2, 4, 3]
[0, 1, 2, 4, 3]
[0, 1, 2, 4, 3]
[1, 3]


##(Breadth-First Search - BFS)

A busca em largura (Breadth-First Search - BFS) é um algoritmo de busca utilizado em estruturas de dados em grafo e árvore. Diferentemente da busca em profundidade (DFS), que explora o máximo possível em profundidade antes de retroceder, a busca em largura explora todos os nós vizinhos de um nó antes de avançar para os vizinhos dos vizinhos. Isso significa que a BFS é usada para explorar todos os nós de um nível antes de passar para o próximo nível, o que a torna útil para encontrar o caminho mais curto entre dois nós em um grafo não ponderado.

In [12]:
def bfs(grafo, no_inicio):
  visitado = []
  fila = []
  fila.append(no_inicio)
  visitado.append(no_inicio)

  while len(fila) != 0:
    no_inicio = fila.pop(0)
    for vizinho in grafo[no_inicio]:
      if vizinho not in visitado:
        visitado.append(vizinho)
        fila.append(vizinho)
  print(fila)
  print(visitado)

In [13]:
grafo = [ [1],           # Vizinhos do vértice 0.
          [2, 3],        # Vizinhos do vértice 1.
          [1, 4],        # Vizinhos do vértice 2.
          [0, 2],        # Vizinhos do vértice 3.
          [0]            # Vizinhos do vértice 4.
        ]
bfs(grafo, 4)

[]
[4, 0, 1, 2, 3]


##(Uniform-Cost Search - UCS)

O algoritmo de busca de custo uniforme (Uniform-Cost Search ou UCS) é um algoritmo de busca não informada que é usado para encontrar o caminho mais curto entre dois pontos em um grafo ponderado. O UCS é uma variação da busca em largura (BFS) e é especialmente útil quando todos os custos das arestas no grafo não são negativos. Ele garante encontrar o caminho mais curto, mesmo em grafos com custos diferentes nas arestas.

In [14]:
G = {}
prioridade = []

def inicializar_G(grafo, no_inicial):
    for no in range(len(grafo)):
        if no == no_inicial:
            G[no] = 0  # O nó inicial tem G(n) igual a 0
        else:
            G[no] = float('inf')  # Inicializa todos os outros nós com infinito

# Procedimento para atualizar G(n) de um nó vizinho
def atualizar_G(no_atual, no_vizinho, custo_aresta):
    if G[no_atual] + custo_aresta < G[no_vizinho]:
        G[no_vizinho] = G[no_atual] + custo_aresta

def retirar_menor_custo():
    prioridade.sort(key=lambda x: x[1]) # Ordena a fila pelo valor G(n)
    no_atual, menor_custo = prioridade.pop(0)  # Retira o nó com menor custo
    return no_atual

def adicionar_no_fila_prioridade(no):
    prioridade.append((no, G[no]))

def ucs(grafo, no_inicial, no_destino):
    inicializar_G(grafo, no_inicial)
    adicionar_no_fila_prioridade(no_inicial)

    while len(prioridade) != 0:
        no_atual = retirar_menor_custo()

        if no_atual == no_destino:
          new_G = {chave: valor for chave, valor in G.items() if chave <= no_destino}

          # Imprima o novo dicionário
          print(new_G)

          return

        for vizinho in range(len(grafo[no_atual])):
          custo_aresta = grafo[no_atual][vizinho]

          # Verifica se há uma aresta válida (custo maior que 0)
          if custo_aresta > 0:
              # Calcula o novo custo G(n) do vizinho
              novo_custo = G[no_atual] + custo_aresta

              # Verifica se o novo custo é menor do que o custo atual do vizinho
              if novo_custo < G[vizinho]:
                  # Atualiza o custo G(n) do vizinho
                  G[vizinho] = novo_custo

                  # Adiciona o vizinho à fila de prioridade
                  adicionar_no_fila_prioridade(vizinho)


    print("Caminho não encontrado")

# Exemplo de uso



In [15]:
grafo = [
    [0, 5, 3, 10],
    [5, 0, 1, 2],
    [3, 1, 0, 0],
    [10, 2, 0, 0]
]
no_inicial = 0
no_destino = 3
ucs(grafo, no_inicial, no_destino)

{0: 0, 1: 4, 2: 3, 3: 6}


##Graph

###Construção do Grafo

In [16]:
import random

In [17]:
class NodoGraph:
    def __init__(self, number_nodo=None, value=None):
        self.number_nodo = number_nodo
        self.value = value
        self.adjacency = []

    def add_adjacency(self, other_nodo):
        self.adjacency.append(other_nodo)


In [18]:
def build_graph(num_nodos, probabilidade_conexao):

    nodos = [NodoGraph(number_nodo=i) for i in range(num_nodos)]
    for nodo in nodos:
      nodo.value = random.randint(1, 10)
    for i in range(num_nodos):
        for j in range(i+1, num_nodos):
            if random.random() < probabilidade_conexao:
                nodos[i].add_adjacency(nodos[j])
                nodos[j].add_adjacency(nodos[i])

    return nodos



In [19]:


# Exemplo de uso
num_nodos = 5
probabilidade_conexao = 0.6
grafo = build_graph(num_nodos, probabilidade_conexao)

# Exibir as adjacências para cada nodo
for nodo in grafo:
    print(f"Nodo {nodo.number_nodo} é adjacente a:")
    print(f"Valor {nodo.value}")
    print('Adjacente:' , end= " ")
    for adjacente in nodo.adjacency:
        print(adjacente.number_nodo, end=" ")
    print()
    print()


Nodo 0 é adjacente a:
Valor 10
Adjacente: 3 4 

Nodo 1 é adjacente a:
Valor 3
Adjacente: 4 

Nodo 2 é adjacente a:
Valor 2
Adjacente: 

Nodo 3 é adjacente a:
Valor 8
Adjacente: 0 

Nodo 4 é adjacente a:
Valor 6
Adjacente: 0 1 



##Busca Gulosa

In [20]:
class Cidade:
  def __init__(self, nome, distanciaObjetivo):
    self.nome = nome
    self.visitado = False
    self.distanciaObjetivo = distanciaObjetivo
    self.adjacentes = []

  def addCidadeAdjacente(self, cidade):
      self.adjacentes.append(cidade)

class Adjacente:
  def __init__(self, cidade):
    self.cidade = cidade

class Mapa:
  portoUniao = Cidade('Porto Uniao', 203)
  pauloFrontin = Cidade('Paulo Frontin', 172)
  canoinhas = Cidade('Canoinhas', 141)
  irati = Cidade('Irati', 139)
  palmeira = Cidade('Palmeira', 59)
  campoLargo = Cidade('Campo Largo', 27)
  curitiba = Cidade('Curitiba', 0)
  balsaNova = Cidade('Balsa Nova', 41)
  araucaria = Cidade('Araucaria', 23)
  saoJose = Cidade('Sao Jose dos Pinhais', 13)
  contenda = Cidade('Contenda', 39)
  mafra = Cidade('Mafra', 94)
  tijucas = Cidade('Tijucas do Sul', 56)
  lapa = Cidade('Lapa', 74)
  saoMateus = Cidade('Sao Mateus do Sul', 123)
  tresBarras = Cidade('Tres Barras', 131)

  portoUniao.addCidadeAdjacente(Adjacente(pauloFrontin))
  portoUniao.addCidadeAdjacente(Adjacente(canoinhas))
  portoUniao.addCidadeAdjacente(Adjacente(saoMateus))

  pauloFrontin.addCidadeAdjacente(Adjacente(portoUniao))
  pauloFrontin.addCidadeAdjacente(Adjacente(irati))

  canoinhas.addCidadeAdjacente(Adjacente(portoUniao))
  canoinhas.addCidadeAdjacente(Adjacente(tresBarras))
  canoinhas.addCidadeAdjacente(Adjacente(mafra))

  irati.addCidadeAdjacente(Adjacente(pauloFrontin))
  irati.addCidadeAdjacente(Adjacente(saoMateus))
  irati.addCidadeAdjacente(Adjacente(palmeira))

  palmeira.addCidadeAdjacente(Adjacente(irati))
  palmeira.addCidadeAdjacente(Adjacente(campoLargo))
  palmeira.addCidadeAdjacente(Adjacente(saoMateus))

  campoLargo.addCidadeAdjacente(Adjacente(palmeira))
  campoLargo.addCidadeAdjacente(Adjacente(curitiba))
  campoLargo.addCidadeAdjacente(Adjacente(balsaNova))

  curitiba.addCidadeAdjacente(Adjacente(campoLargo))
  curitiba.addCidadeAdjacente(Adjacente(balsaNova))
  curitiba.addCidadeAdjacente(Adjacente(araucaria))
  curitiba.addCidadeAdjacente(Adjacente(saoJose))

  balsaNova.addCidadeAdjacente(Adjacente(campoLargo))
  balsaNova.addCidadeAdjacente(Adjacente(curitiba))
  balsaNova.addCidadeAdjacente(Adjacente(contenda))

  araucaria.addCidadeAdjacente(Adjacente(curitiba))
  araucaria.addCidadeAdjacente(Adjacente(contenda))

  saoJose.addCidadeAdjacente(Adjacente(curitiba))
  saoJose.addCidadeAdjacente(Adjacente(tijucas))

  contenda.addCidadeAdjacente(Adjacente(araucaria))
  contenda.addCidadeAdjacente(Adjacente(balsaNova))
  contenda.addCidadeAdjacente(Adjacente(lapa))

  mafra.addCidadeAdjacente(Adjacente(tijucas))
  mafra.addCidadeAdjacente(Adjacente(canoinhas))
  mafra.addCidadeAdjacente(Adjacente(lapa))

  tijucas.addCidadeAdjacente(Adjacente(mafra))
  tijucas.addCidadeAdjacente(Adjacente(saoJose))

  lapa.addCidadeAdjacente(Adjacente(contenda))
  lapa.addCidadeAdjacente(Adjacente(saoMateus))
  lapa.addCidadeAdjacente(Adjacente(mafra))

  saoMateus.addCidadeAdjacente(Adjacente(tresBarras))
  saoMateus.addCidadeAdjacente(Adjacente(portoUniao))
  saoMateus.addCidadeAdjacente(Adjacente(lapa))
  saoMateus.addCidadeAdjacente(Adjacente(irati))
  saoMateus.addCidadeAdjacente(Adjacente(palmeira))

  tresBarras.addCidadeAdjacente(Adjacente(canoinhas))
  tresBarras.addCidadeAdjacente(Adjacente(saoMateus))


class VetorOrdenado:
    def __init__(self, tamanho):
        self.numeroElementos = 0
        self.cidades = [None] * tamanho

    def inserir(self, cidade):
        if self.numeroElementos == 0:
            self.cidades[0] = cidade
            self.numeroElementos = 1
            return

        posicao = 0
        i = 0

        while i < self.numeroElementos:
            if cidade.distanciaObjetivo > self.cidades[posicao].distanciaObjetivo:
                posicao += 1
            i += 1

        for k in range(self.numeroElementos, posicao, -1):
            self.cidades[k] = self.cidades[k - 1]

        self.cidades[posicao] = cidade
        self.numeroElementos += 1

    def getPrimeiro(self):
        return self.cidades[0]

    def getCidade(self, index):
        return self.cidades[index]

    def mostrar(self):
        for i in range(0, self.numeroElementos):
            print('{} - {}'.format(self.cidades[i].nome, self.cidades[i].distanciaObjetivo))


In [21]:
class Gulosa:

    def __init__(self, objetivo):
        self.objetivo = objetivo
        self.achou = False
        self.custo = 0

    def buscar(self, atual):
        print('\nAtual: {}'.format(atual.nome))

        self.custo += atual.distanciaObjetivo
        atual.visitado = True

        if atual == self.objetivo:
            self.achou = True
            print('\nCusto Total: {}'.format(self.custo))
        else:
            self.fronteira = VetorOrdenado(len(atual.adjacentes))

            for a in atual.adjacentes:
                if a.cidade.visitado is False:
                    a.cidade.visitado = True
                    self.fronteira.inserir(a.cidade)

            self.fronteira.mostrar()

            if self.fronteira.getPrimeiro() is not None:
                Gulosa.buscar(self, self.fronteira.getPrimeiro())


In [22]:
mapa = Mapa()

In [23]:
gulosa = Gulosa(mapa.curitiba)

In [24]:
gulosa.buscar(mapa.portoUniao)


Atual: Porto Uniao
Sao Mateus do Sul - 123
Canoinhas - 141
Paulo Frontin - 172

Atual: Sao Mateus do Sul
Palmeira - 59
Lapa - 74
Tres Barras - 131
Irati - 139

Atual: Palmeira
Campo Largo - 27

Atual: Campo Largo
Curitiba - 0
Balsa Nova - 41

Atual: Curitiba

Custo Total: 412


##A*

In [25]:
class Cidade:
  def __init__(self, nome, distanciaObjetivo):
    self.nome = nome
    self.visitado = False
    self.distanciaObjetivo = distanciaObjetivo
    self.adjacentes = []

  def addCidadeAdjacente(self, cidade):
      self.adjacentes.append(cidade)

class Adjacente:
  def __init__(self, cidade):
    self.cidade = cidade

class Mapa:
  portoUniao = Cidade('Porto Uniao', 203)
  pauloFrontin = Cidade('Paulo Frontin', 172)
  canoinhas = Cidade('Canoinhas', 141)
  irati = Cidade('Irati', 139)
  palmeira = Cidade('Palmeira', 59)
  campoLargo = Cidade('Campo Largo', 27)
  curitiba = Cidade('Curitiba', 0)
  balsaNova = Cidade('Balsa Nova', 41)
  araucaria = Cidade('Araucaria', 23)
  saoJose = Cidade('Sao Jose dos Pinhais', 13)
  contenda = Cidade('Contenda', 39)
  mafra = Cidade('Mafra', 94)
  tijucas = Cidade('Tijucas do Sul', 56)
  lapa = Cidade('Lapa', 74)
  saoMateus = Cidade('Sao Mateus do Sul', 123)
  tresBarras = Cidade('Tres Barras', 131)

  portoUniao.addCidadeAdjacente(Adjacente(pauloFrontin))
  portoUniao.addCidadeAdjacente(Adjacente(canoinhas))
  portoUniao.addCidadeAdjacente(Adjacente(saoMateus))

  pauloFrontin.addCidadeAdjacente(Adjacente(portoUniao))
  pauloFrontin.addCidadeAdjacente(Adjacente(irati))

  canoinhas.addCidadeAdjacente(Adjacente(portoUniao))
  canoinhas.addCidadeAdjacente(Adjacente(tresBarras))
  canoinhas.addCidadeAdjacente(Adjacente(mafra))

  irati.addCidadeAdjacente(Adjacente(pauloFrontin))
  irati.addCidadeAdjacente(Adjacente(saoMateus))
  irati.addCidadeAdjacente(Adjacente(palmeira))

  palmeira.addCidadeAdjacente(Adjacente(irati))
  palmeira.addCidadeAdjacente(Adjacente(campoLargo))
  palmeira.addCidadeAdjacente(Adjacente(saoMateus))

  campoLargo.addCidadeAdjacente(Adjacente(palmeira))
  campoLargo.addCidadeAdjacente(Adjacente(curitiba))
  campoLargo.addCidadeAdjacente(Adjacente(balsaNova))

  curitiba.addCidadeAdjacente(Adjacente(campoLargo))
  curitiba.addCidadeAdjacente(Adjacente(balsaNova))
  curitiba.addCidadeAdjacente(Adjacente(araucaria))
  curitiba.addCidadeAdjacente(Adjacente(saoJose))

  balsaNova.addCidadeAdjacente(Adjacente(campoLargo))
  balsaNova.addCidadeAdjacente(Adjacente(curitiba))
  balsaNova.addCidadeAdjacente(Adjacente(contenda))

  araucaria.addCidadeAdjacente(Adjacente(curitiba))
  araucaria.addCidadeAdjacente(Adjacente(contenda))

  saoJose.addCidadeAdjacente(Adjacente(curitiba))
  saoJose.addCidadeAdjacente(Adjacente(tijucas))

  contenda.addCidadeAdjacente(Adjacente(araucaria))
  contenda.addCidadeAdjacente(Adjacente(balsaNova))
  contenda.addCidadeAdjacente(Adjacente(lapa))

  mafra.addCidadeAdjacente(Adjacente(tijucas))
  mafra.addCidadeAdjacente(Adjacente(canoinhas))
  mafra.addCidadeAdjacente(Adjacente(lapa))

  tijucas.addCidadeAdjacente(Adjacente(mafra))
  tijucas.addCidadeAdjacente(Adjacente(saoJose))

  lapa.addCidadeAdjacente(Adjacente(contenda))
  lapa.addCidadeAdjacente(Adjacente(saoMateus))
  lapa.addCidadeAdjacente(Adjacente(mafra))

  saoMateus.addCidadeAdjacente(Adjacente(tresBarras))
  saoMateus.addCidadeAdjacente(Adjacente(portoUniao))
  saoMateus.addCidadeAdjacente(Adjacente(lapa))
  saoMateus.addCidadeAdjacente(Adjacente(irati))
  saoMateus.addCidadeAdjacente(Adjacente(palmeira))

  tresBarras.addCidadeAdjacente(Adjacente(canoinhas))
  tresBarras.addCidadeAdjacente(Adjacente(saoMateus))


class VetorOrdenado:
    def __init__(self, tamanho):
        self.numeroElementos = 0
        self.cidades = [None] * tamanho

    def inserir(self, cidade):
        if self.numeroElementos == 0:
            self.cidades[0] = cidade
            self.numeroElementos = 1
            return

        posicao = 0
        i = 0

        while i < self.numeroElementos:
            if cidade.distanciaObjetivo > self.cidades[posicao].distanciaObjetivo:
                posicao += 1
            i += 1

        for k in range(self.numeroElementos, posicao, -1):
            self.cidades[k] = self.cidades[k - 1]

        self.cidades[posicao] = cidade
        self.numeroElementos += 1

    def getPrimeiro(self):
        return self.cidades[0]

    def getCidade(self, index):
        return self.cidades[index]

    def mostrar(self):
        for i in range(0, self.numeroElementos):
            print('{} - {}'.format(self.cidades[i].nome, self.cidades[i].distanciaObjetivo))


In [26]:
class aStar:

    def __init__(self, objetivo):
        self.objetivo = objetivo
        self.achou = False
        self.custo = 0

    def buscar(self, atual):
        print('\nAtual: {}'.format(atual.nome))

        self.custo += atual.distanciaObjetivo
        atual.visitado = True

        if atual == self.objetivo:
            self.achou = True
            print('\nCusto Total: {}'.format(self.custo))
        else:
            self.fronteira = VetorOrdenado(len(atual.adjacentes))

            for a in atual.adjacentes:
                if a.cidade.visitado is False:
                    a.cidade.visitado = True
                    self.fronteira.inserir(a.cidade)

            self.fronteira.mostrar()

            index = None
            aux_custo = self.custo
            min_custo = 0
            for i in range(0, self.fronteira.numeroElementos):

                    aux_custo += self.fronteira.getCidade(i).distanciaObjetivo

                    if i == 0:

                      min_custo = aux_custo

                      index = i

                    else:
                      if aux_custo < min_custo:

                        min_custo = aux_custo

                        index = i


            if self.fronteira.getCidade(index) is not None:
                cidade = self.fronteira.getCidade(index)
                aStar.buscar(cidade)


In [27]:
mapa_astar = Mapa()

In [28]:
aStar = aStar(mapa_astar.curitiba)

In [29]:
aStar.buscar(mapa_astar.portoUniao)


Atual: Porto Uniao
Sao Mateus do Sul - 123
Canoinhas - 141
Paulo Frontin - 172

Atual: Sao Mateus do Sul
Palmeira - 59
Lapa - 74
Tres Barras - 131
Irati - 139

Atual: Palmeira
Campo Largo - 27

Atual: Campo Largo
Curitiba - 0
Balsa Nova - 41

Atual: Curitiba

Custo Total: 412


#Classificadores H2IA - UFPEL

##Precepton originating from the library


In [30]:
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_digits

# Carregar a base de dados
conjunto_de_dados = load_digits(n_class=10)

nomes_rotulo = conjunto_de_dados['target_names']

rotulos = conjunto_de_dados['target']

nomes_feature = conjunto_de_dados['feature_names']

features = conjunto_de_dados['data']


target_names:

Significado: É um atributo que contém os nomes ou rótulos das classes ou categorias que o modelo está tentando prever. Em problemas de classificação, onde você tenta atribuir uma categoria a cada amostra de dados, target_names fornece os nomes ou rótulos correspondentes às classes.

target:

Significado: É um atributo que contém os rótulos reais ou verdadeiros associados às amostras de dados em um conjunto de dados supervisionado. Em um problema de classificação, target contém as classes reais que você deseja prever.

data:

Significado: É um atributo que contém os dados ou características das amostras do conjunto de dados. Cada linha em data corresponde a uma amostra e cada coluna a uma característica. É a partir dessas características que um modelo de aprendizado de máquina faz previsões.

feature_names:

Significado: É um atributo que contém os nomes ou rótulos das características ou atributos em data. Cada característica em data é rotulada com um nome em feature_names, o que facilita a interpretação dos dados.

In [31]:
from sklearn.model_selection import train_test_split

# Dividir o conjunto de dados
treino, teste, rotulos_treino, rotulos_teste = train_test_split(features, rotulos, test_size=0.20)


from sklearn.model_selection import train_test_split: Esta linha importa a função train_test_split da biblioteca Scikit-Learn, que é usada para realizar a divisão dos dados.

treino, teste, rotulos_treino, rotulos_teste = train_test_split(features, rotulos, test_size=0.20): Esta linha executa a divisão dos dados nos seguintes
componentes:

features: Representa os dados ou características que você deseja dividir em conjuntos de treinamento e teste.
rotulos: Representa os rótulos (classes ou alvos) associados às amostras de dados.
test_size=0.20: Define a proporção dos dados a serem alocados para o conjunto de teste. Neste caso, 20% dos dados serão usados como conjunto de teste, enquanto os 80% restantes serão usados como conjunto de treinamento.
A função train_test_split retorna quatro conjuntos de dados:

treino: Contém as amostras de treinamento (80% dos dados neste caso).
teste: Contém as amostras de teste (20% dos dados neste caso).
rotulos_treino: Contém os rótulos correspondentes às amostras de treinamento.
rotulos_teste: Contém os rótulos correspondentes às amostras de teste.
Essa divisão é comum em problemas de aprendizado de máquina supervisionado, onde o conjunto de treinamento é usado para treinar o modelo e o conjunto de teste é usado para avaliar o desempenho do modelo em dados não vistos durante o treinamento. O uso de conjuntos de treinamento e teste ajuda a verificar como o modelo generaliza para dados não vistos e a evitar o sobreajuste (overfitting).

In [32]:
from sklearn.linear_model import Perceptron

# Inicializar nosso classificador
p = Perceptron()


# Treinar nosso classificador


modelo = p.fit(treino, rotulos_treino)

modelo.get_params()

{'alpha': 0.0001,
 'class_weight': None,
 'early_stopping': False,
 'eta0': 1.0,
 'fit_intercept': True,
 'l1_ratio': 0.15,
 'max_iter': 1000,
 'n_iter_no_change': 5,
 'n_jobs': None,
 'penalty': None,
 'random_state': 0,
 'shuffle': True,
 'tol': 0.001,
 'validation_fraction': 0.1,
 'verbose': 0,
 'warm_start': False}

alpha: É um hiperparâmetro que controla a força da regularização (penalização) aplicada ao modelo. Valores maiores de alpha aumentam a penalização.

class_weight: Define o peso das classes no modelo. Quando definido como None, todas as classes têm o mesmo peso. Pode ser usado para tratar desequilíbrios de classe.

early_stopping: Se definido como True, permite que o treinamento pare antecipadamente quando a métrica de validação não melhora. É comum em algoritmos iterativos para economizar tempo de treinamento.

eta0: Taxa de aprendizado inicial para o SGD (gradiente descendente estocástico).

fit_intercept: Indica se um termo de intercepção (bias) deve ser ajustado no modelo.

l1_ratio: Parâmetro que controla a mistura de regularização L1 e L2. Um valor de 0 corresponde à regularização L2, um valor de 1 corresponde à regularização L1 e valores no meio representam uma combinação.

max_iter: Número máximo de iterações ou épocas durante o treinamento.

n_iter_no_change: Número de iterações sem melhoria na métrica de validação após o qual o treinamento é interrompido (quando early_stopping é definido como True).

n_jobs: Número de trabalhadores (núcleos da CPU) a serem usados durante o treinamento. Quando definido como None, o número padrão de núcleos é usado.

penalty: Tipo de penalização a ser aplicado ao modelo. Pode ser 'l1', 'l2' ou None.

random_state: Semente para a geração de números aleatórios, o que torna os resultados reproduzíveis.

shuffle: Se definido como True, os dados de treinamento são embaralhados aleatoriamente antes de cada iteração.

tol: Tolerância para parar o treinamento quando a mudança nos parâmetros do modelo for menor que esse valor.

validation_fraction: A fração dos dados de treinamento a serem usados como conjunto de validação quando early_stopping é definido como True.

verbose: Controle do nível de informações de depuração durante o treinamento. Um valor maior indica mais informações verbais.

warm_start: Se definido como True, o modelo é treinado com os pesos iniciais dos resultados anteriores.

Esses parâmetros são usados para ajustar o comportamento do modelo durante o treinamento e podem afetar significativamente o desempenho e o comportamento do modelo. Os valores específicos fornecidos para esses parâmetros determinarão como o modelo é treinado e como ele se comporta durante o processo de ajuste. A seleção adequada de hiperparâmetros é uma parte importante do desenvolvimento de modelos de aprendizado de máquina.

In [33]:
# Fazer previsões
previsoes = modelo.predict(teste)
print(previsoes)

[9 0 2 3 1 1 3 6 4 9 1 7 0 5 1 2 8 7 4 7 3 4 8 3 8 9 1 6 8 4 6 5 0 9 2 1 1
 1 7 6 6 1 7 6 6 0 6 4 8 8 1 3 8 8 8 1 0 9 6 1 5 5 2 0 7 2 6 1 6 6 2 7 8 8
 1 8 1 0 6 8 6 5 5 7 0 7 8 3 2 6 0 5 4 4 0 0 9 3 8 6 2 1 5 1 8 2 1 2 0 6 3
 8 7 5 7 9 6 6 4 3 3 7 8 8 4 3 1 7 1 6 9 4 4 7 8 0 3 2 7 9 2 2 9 2 3 4 4 8
 4 3 9 0 5 9 5 6 8 7 3 6 4 0 9 5 3 5 7 6 7 6 0 6 5 6 7 7 3 2 8 1 8 9 4 9 1
 8 5 5 9 6 9 9 7 1 8 6 7 6 6 2 9 8 7 5 3 7 1 8 1 8 1 8 0 0 6 4 9 7 2 8 7 7
 5 9 3 9 4 0 1 9 1 6 1 4 9 4 5 6 6 3 4 4 1 5 8 3 2 1 0 5 7 3 0 0 3 6 4 9 0
 3 0 4 0 1 6 8 7 3 7 3 7 5 6 4 6 9 6 7 1 9 2 5 7 6 5 5 6 3 7 4 6 3 6 5 5 7
 8 1 3 7 0 0 5 2 1 5 1 0 4 7 9 3 4 6 5 1 5 9 6 8 3 8 9 4 8 8 2 6 4 4 1 5 2
 7 5 0 5 4 2 8 9 8 0 7 7 8 0 2 8 1 9 4 0 3 9 9 1 9 5 4]


Geralmente, após treinar um modelo de aprendizado de máquina, é importante fazer previsões em dados de teste ou dados não vistos para avaliar o desempenho do modelo e verificar como ele generaliza para novos dados. As previsões podem ser usadas para várias tarefas, como classificação, regressão ou qualquer outra tarefa para a qual o modelo foi treinado.

In [34]:
from sklearn.model_selection import cross_val_score

scores = cross_val_score(modelo, features, rotulos, cv=5, scoring='accuracy')
scores

array([0.88055556, 0.83888889, 0.90807799, 0.94986072, 0.8718663 ])

scores = cross_val_score(modelo, features, rotulos, cv=5, scoring='accuracy'): O código executa a validação cruzada usando os seguintes parâmetros:

modelo: É o modelo de aprendizado de máquina que você deseja avaliar.
features: São as características (dados) usadas para treinar e avaliar o modelo.
rotulos: São os rótulos (classes) correspondentes às amostras.
cv=5: Indica que a validação cruzada será realizada em 5 dobras (ou divisões). Isso significa que os dados serão divididos em 5 partes iguais e o modelo será treinado e testado 5 vezes, usando diferentes combinações de treinamento e teste.
scoring='accuracy': Define a métrica de avaliação a ser usada, que é a acurácia neste caso. Isso significa que o desempenho do modelo será avaliado com base na proporção de previsões corretas.

Ao imprimir a variável scores, você terá uma lista de pontuações de acurácia para cada dobra da validação cruzada. Isso permite avaliar o desempenho do modelo de forma mais abrangente, levando em consideração diferentes divisões dos dados. Geralmente, você pode calcular a média dessas pontuações para obter uma estimativa geral do desempenho do modelo.

In [35]:
from sklearn.metrics import accuracy_score

# Avaliar o modelo
print(accuracy_score(rotulos_teste, previsoes))

0.9472222222222222


A função accuracy_score calcula a acurácia comparando as previsões com os rótulos verdadeiros e retorna um valor que representa a porcentagem de previsões corretas. Esse valor é impresso no console usando print, o que permite avaliar o desempenho do modelo em termos de acurácia. Quanto maior a acurácia, melhor o modelo está em fazer previsões corretas.