### **Algoritmos de Busqueda**

Un algoritmo de búsqueda es un conjunto de pasos o reglas que se utilizan para encontrar un elemento específico dentro de un conjunto de datos o estructura. <br>
Los algoritmos de búsqueda son ampliamente utilizados en informática y programación para buscar información en una variedad de contextos, como listas, arreglos, bases de datos, árboles, grafos y más.

In [1]:
import random
nums = [x for x in range(1,71)]
dataset = random.choices(nums, k=30)
print(dataset)

[14, 45, 46, 34, 8, 23, 54, 31, 47, 1, 47, 5, 21, 43, 14, 49, 69, 53, 49, 45, 37, 46, 48, 23, 64, 65, 60, 26, 21, 59]


#### **Busqueda Linear**
---

El algoritmo de búsqueda lineal, a veces llamado búsqueda secuencial, es uno de los métodos de búsqueda más simples y directos. El objetivo de este algoritmo es encontrar un elemento específico en una colección de datos, como una lista o un arreglo, recorriendo la colección elemento por elemento hasta que se encuentre el elemento buscado o se confirme que no existe en la colección.

Procedimento:

1. Comenzar desde el primer elemento de la colección.
2. Comparar el elemento actual con el elemento objetivo que se busca.
3. Si el elemento actual es igual al elemento objetivo, se ha encontrado una coincidencia y el algoritmo termina.
4. Si el elemento actual no coincide con el elemento objetivo, se pasa al siguiente elemento en la colección.
5. Este proceso se repite hasta que se encuentre una coincidencia o se recorran todos los elementos de la colección sin éxito.

Complejidad

- En el mejor de los casos 0(1).
- En el peor de los casos 0(n).

In [2]:
num2find = 27
for i in range(0,len(dataset)):
    if (dataset[i]==num2find):
        print("Numer Found!")
        print(f"Position: {i} | Number Found: {dataset[i]}")
        break

#### **Búsqueda Binaria**
----


La búsqueda binaria, también conocida como búsqueda dicotómica, es un algoritmo de búsqueda eficiente utilizado para encontrar un elemento específico en una colección de datos ordenada, como un arreglo o una lista. El algoritmo aprovecha la propiedad de ordenamiento de los datos para realizar búsquedas de manera más rápida que la búsqueda lineal en el peor de los casos.

Procedimiento:

1. **Ordena los datos:** El primer paso crítico es asegurarse de que la colección de datos esté ordenada en orden ascendente (de menor a mayor) o descendente (de mayor a menor). La búsqueda binaria solo funciona en datos ordenados.
2. **Inicialización:** Establece dos índices, uno que representa el inicio del rango de búsqueda (llamado "inicio") y otro que representa el final del rango de búsqueda (llamado "fin").Inicialmente, el "inicio" se establece en 0 y el "fin" en el último índice de la colección.
3. **Bucle de búsqueda:** En un bucle, sigue estos pasos hasta que el "inicio" sea mayor que el "fin" (lo que significa que has reducido el rango de búsqueda a un solo elemento o ninguno):<br>
**a)** Calcula el índice medio del rango de búsqueda:** (inicio + fin) / 2.<br>
**b)** Compara el elemento en el índice medio con el elemento objetivo que estás buscando.<br>
**c)** Si el elemento en el índice medio es igual al elemento objetivo, has encontrado una coincidencia y el algoritmo termina.<br>
**d)** Si el elemento en el índice medio es menor que el elemento objetivo, actualiza el valor de "inicio" para que sea el índice medio + 1. Esto significa que ahora buscarás en la mitad derecha del rango de búsqueda.<br>
**e)** Si el elemento en el índice medio es mayor que el elemento objetivo, actualiza el valor de "fin" para que sea el índice medio - 1. Esto significa que ahora buscarás en la mitad izquierda del rango de búsqueda.

Resultado: Una vez que el bucle termine, si no se encontró ninguna coincidencia, significa que el elemento objetivo no está en la colección.



In [3]:
dataset_sorted = list(set(dataset))
num2find = 34
print(dataset_sorted)

[1, 5, 8, 14, 21, 23, 26, 31, 34, 37, 43, 45, 46, 47, 48, 49, 53, 54, 59, 60, 64, 65, 69]


In [4]:
start = 0
end = len(dataset_sorted)
middle = (start + end)//2

def binary_search(dataset_sorted, start, end, num2find):
    middle = (start + end)//2
    if start > end:
        return "The number does not exist"
    
    if (dataset_sorted[middle]) == num2find:
        print(f"Value found! | Position: {middle}")
        return f"Position: {middle}"
    elif (dataset_sorted[middle]) < num2find:
        start = middle + 1
        print("Medium value is lower than num2find")
        return binary_search(dataset_sorted, start, end, num2find)
    elif (dataset_sorted[middle] > num2find):
        end = middle - 1
        print("Medium value is greater than num2find")
        return binary_search(dataset_sorted, start, end, num2find)

binary_search(dataset_sorted, start, end, num2find)

Medium value is greater than num2find
Medium value is lower than num2find
Value found! | Position: 8


'Position: 8'

#### **Búsqueda Hash (basica)**
----

Un algoritmo de búsqueda con tablas de hash, también conocido como búsqueda hash, es una técnica eficiente para recuperar información de una estructura de datos conocida como tabla hash o diccionario hash. Este tipo de estructura de datos utiliza una función de hash para mapear una clave (key) a un valor (value). En lugar de buscar elementos uno por uno en una lista o matriz, la búsqueda se acelera mediante el uso de esta función de hash.



Algunos conceptos claves:


- **Función de Hash:** Es una función que toma una clave como entrada y devuelve un valor numérico (hash code o índice) que se utilizará para acceder a la ubicación de almacenamiento del valor asociado con esa clave. La función de hash debe ser determinista, lo que significa que siempre debe producir el mismo valor hash para la misma clave.

- **Tabla Hash:** Es una estructura de datos que consta de un arreglo (array) de "contenedores" o "buckets". Cada bucket puede contener uno o más pares clave-valor. La función de hash se utiliza para determinar en qué bucket debe almacenarse o buscarse un par clave-valor.

- **Inserción:** Para insertar un nuevo par clave-valor en una tabla hash, se aplica la función de hash a la clave para calcular la ubicación del bucket. Si hay colisiones (es decir, varios elementos tienen el mismo valor hash), se pueden resolver de diversas formas, como el uso de listas vinculadas en el mismo bucket.

- **Búsqueda:** Para buscar un valor a partir de una clave en una tabla hash, se aplica la función de hash a la clave para encontrar el bucket correspondiente y, luego, se busca en ese bucket para encontrar el valor.

- **Colisiones:** Las colisiones ocurren cuando dos o más claves generan el mismo valor hash y deben ser almacenadas en el mismo bucket. Las colisiones se manejan de diferentes maneras, como listas vinculadas, árboles, o incluso funciones de hash más avanzadas.

- **Rendimiento:** La búsqueda en una tabla hash suele ser muy rápida, con una complejidad promedio de tiempo de O(1) para la búsqueda, inserción y eliminación, si la función de hash es efectiva y las colisiones se manejan adecuadamente.

Es importante elegir o diseñar una función de hash eficiente para minimizar las colisiones y garantizar un rendimiento óptimo. Además, la capacidad de la tabla hash (el número de buckets) debe ajustarse adecuadamente para evitar colisiones excesivas o desperdicio de memoria

In [5]:
def hashing(word):
    value = 0
    for i, c in enumerate(word):
        i=i+1
        value += (i * ord(c))
    return value

In [6]:
class HashTable:
    def __init__(self, size=10):
        self.data = [None] * size
        self.size = size
        
    def __setitem__(self, key, value):
        index = hashing(key) % self.size
        self.data[index] = value
        
    def __getitem__(self, key):
        return self.data[
            hashing(key) % self.size
        ]
        
    def __repr__(self):
        return f"Hash Table\n{self.data}"

In [7]:
hashtable = HashTable(5)
hashtable['listen'] = 'ok'
hashtable['magic'] = 'there is'
hashtable['master'] = 'Joe'

#### **Búsqueda Deep First Search (DFS)**
----

El algoritmo de búsqueda en profundidad (DFS) también se aplica comúnmente a árboles binarios. La diferencia principal es que en un árbol binario, cada nodo tiene, como máximo, dos hijos: uno izquierdo y uno derecho. La aplicación de DFS en un árbol binario sigue los mismos principios generales que se describen en la respuesta anterior, pero con algunas modificaciones para adaptarse a la estructura del árbol binario. Aquí tienes una explicación de cómo funciona el algoritmo DFS en un árbol binario.

Funcionamiento del algoritmo:

1. Comienza en el nodo raíz del árbol binario.
2. Procesa el nodo actual (por ejemplo, imprime su valor).
3. Si el nodo actual tiene un hijo izquierdo, llama recursivamente a la función DFS en el hijo izquierdo.
4. Si el nodo actual tiene un hijo derecho, llama recursivamente a la función DFS en el hijo derecho.
5. La recursión se encargará de explorar todo el árbol, y cuando alcances un nodo sin hijos izquierdos o derechos, la recursión retrocederá automáticamente al nodo padre y continuará explorando otros nodos.


Repite los pasos 2-4 hasta que hayas explorado todos los nodos del árbol.

In [8]:
class Node:
    def __init__(self, value):
        self.value = value
        self.visited = False
        self.left = None
        self.right = None
        
    def __repr__(self):
        return f" {self.left is not None} <= \"{self.value}\" => {self.right is not None}"

In [9]:

class BinaryTree:

  # Funciones privadas del arbol
  def __init__(self, root_value=None):
    self.root = Node(root_value)

  # Inserting
  def __add_recursive(self, node, value):
    # The new value is lower that the current value in node?
    if value < node.value:
      if node.left is None: # Yes but, The next left node is free to use?
        node.left = Node(value) # Yes it is!, let's create new node and save it
      else:
          self.__add_recursive(node.left, value) # Not is it, keep searching
    else:
      # The new value is higher that the current value in node.
        if node.right is None: # The next right node is free to use?
          node.right = Node(value)
        else:
          self.__add_recursive(node.right, value) # Not is filled, keep searching
  
  def __restart__(self, node):
    node.visited=False
    if node.left is not None:
      return self.__restart__(node.left)
    elif node.right is not None:
      return self.__restart__(node.right)
      
    
  def __dfs__(self, node, value):
    if node.value == value:
      print("Found!")
      self.__restart__(self.root)
      return node.value
    else:
      if node.left is not None:
        if node.left.visited == False:
          return self.__dfs__(node.left, value)
        
      elif node.right is not None:
        if node.right.visited == False:
          return self.__dfs__(node.right, value)
        
      if (node.left is None) & (node.right is None):
        node.visited = True
        print("Not found!")
        
        self.__restart__(self.root)
        return False
    
  
  
  # Funciones publicas
  def insert(self, value):
    self.__add_recursive(self.root, value)
    return 'Inserted'
  
  def search(self, value):
    return self.__dfs__(self.root, value)

In [10]:
arbol = BinaryTree("America")
arbol.insert("Bruno")
arbol.insert("Carla")
arbol.insert("Daniel")
arbol.insert("Carol")

'Inserted'

In [11]:
print(arbol.root)
print(arbol.root.right)
print(arbol.root.right.right)
print(arbol.root.right.right.right)
print(arbol.root.right.right.right.left)

 False <= "America" => True
 False <= "Bruno" => True
 False <= "Carla" => True
 True <= "Daniel" => False
 False <= "Carol" => False


In [12]:
#NOTE:
#+ El algoritmo puede mejorar quitando la recursividad en los visitados y meter lso nodos visitados en una pila
arbol.search("Carla")

Found!


'Carla'

#### **Búsqueda Breadth First Search (BFS)**
----

La búsqueda en anchura (BFS, por sus siglas en inglés, Breadth-First Search) es un algoritmo que se utiliza para recorrer o buscar elementos en un árbol o un grafo. Cuando se aplica a un árbol binario, el algoritmo visita todos los nodos de nivel 0 (la raíz), luego todos los nodos de nivel 1, luego todos los nodos de nivel 2, y así sucesivamente. El proceso de búsqueda comienza en la raíz y se mueve horizontalmente (explorando todos los nodos del mismo nivel) antes de pasar al siguiente nivel. Aquí tienes una explicación paso a paso de cómo funciona la búsqueda en anchura en un árbol binario:

1. Comienza por visitar el nodo raíz del árbol. Este nodo se considera el nivel 0.
2. Luego, visita todos los nodos del nivel 0 antes de pasar al nivel 1.
3. Para visitar un nodo, se agregan sus hijos (si los tiene) a una cola.
4. Una vez que hayas visitado todos los nodos del nivel actual, tomas el siguiente nodo de la cola y repites el proceso. Esto garantiza que los nodos de un nivel se visiten antes de pasar al siguiente nivel.
5. Continúa recorriendo y visitando nodos en orden de nivel hasta que hayas visitado todos los nodos del árbol.



In [13]:
class Node:
    def __init__(self, value):
        self.value = value
        self.visited = False
        self.left = None
        self.right = None
        
    def __repr__(self):
        return f" {self.left is not None} <= \"{self.value}\" => {self.right is not None}"

In [14]:

class BinaryTree:
  def __init__(self, root_value=None):
    self.root = Node(root_value)
    self.queue_of_slots = [self.root]
    
  def __add_by_levels(self, value):
    curret_node = self.queue_of_slots[0]
    if curret_node.left is None:
      curret_node.left = Node(value)
      self.queue_of_slots.append(curret_node.left)
    elif curret_node.right is None:
      curret_node.right = Node(value)
      self.queue_of_slots.append(curret_node.right)
    
    if (curret_node.left is not None) & (curret_node.right is not None): 
      self.queue_of_slots.pop(0)
    
  def __bfs(self, value):
    while(len(self.queue_of_slots) > 0):
      current_node = self.queue_of_slots.pop(0)
      if current_node.value == value:
        print("Value Found!")
        print(type(current_node))
        return current_node
      else:
        print("Siguiendo la busqueda")
        if current_node.left is not None:
          self.queue_of_slots.append(current_node.left)
        if current_node.right is not None:
          self.queue_of_slots.append(current_node.right)
    
    print("No encontrado!")
    return None
    
  def insert(self, value):
    self.__add_by_levels(value)
    return 'added'
  

  def search(self, value):
    self.queue_of_slots = [self.root]
    self.__bfs(value)


In [15]:
tree = BinaryTree("Raiz")
tree.insert("A1")
tree.insert("A2")
tree.insert("B1")
tree.insert("B2")
tree.insert("B3")
tree.insert("B4")
print(tree.queue_of_slots)

[ False <= "B1" => False,  False <= "B2" => False,  False <= "B3" => False,  False <= "B4" => False]


In [16]:
print("\t\t\t\t\t",tree.root)
print("\t\t",tree.root.left,"\t\t\t\t\t\t",tree.root.right)
print(tree.root.left.left, "\t", tree.root.left.right, "\t\t", tree.root.right.left,  "\t", tree.root.right.right)

					  True <= "Raiz" => True
		  True <= "A1" => True 						  True <= "A2" => True
 False <= "B1" => False 	  False <= "B2" => False 		  False <= "B3" => False 	  False <= "B4" => False


In [19]:
tree.search("A2")

Siguiendo la busqueda
Siguiendo la busqueda
Value Found!
<class '__main__.Node'>
