<h1>Algortimos de búsqueda con Python</h1>




Para saber la diferencia de computo se agrega la siguiente funcion decoración para obtener los tiempos de computo : 

In [1]:
import time
def timing_decorator(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = func(*args, **kwargs)
        end_time = time.time()
        elapsed_time = end_time - start_time
        print(f"Function '{func.__name__}' took {elapsed_time:.6f} seconds to execute.")
        return result
    return wrapper

<h2>Búsqueda secuencial</h2>

<p>La búsqueda secuencial es un algoritmo simple que busca un elemento en una lista, uniendo uno por uno los elementos de la lista hasta que encuentra el elemento que está buscando o hasta que llega al final de la lista.</p>

<ul>
  <li>Inicializar el índice actual a 0.</li>
  <li>Comparar el elemento en la posición actual de la lista con el valor que se está buscando.</li>
  <li>Si los elementos son iguales, el algoritmo ha encontrado el elemento que está buscando y finaliza.</li>
  <li>Si los elementos no son iguales, aumentar el índice actual en 1 y repetir el paso 2.</li>
  <li>Si el índice actual alcanza el final de la lista, el algoritmo no ha encontrado el elemento que está buscando y finaliza.</li>
</ul>

<p>Aquí hay un ejemplo de cómo implementar el algoritmo de búsqueda secuencial en Python:</p>

In [7]:
@timing_decorator
def sequential_search(lst, target):
    for i, element in enumerate(lst):
        if element == target:
            return i  # Returns the index where the element was found
    return -1  # Returns -1 if the element is not found in the list

La función sequential_search tiene una complejidad O(n), ya que depende totalmente del numero de elementos en el array lst. Y este sería un ejemplo de como utilizarlo:

In [8]:
numbers = [10, 4, 6, 8, 2, 1, 7]
target = 6
found_index = sequential_search(numbers, target)

if found_index != -1:
    print(f"The number {target} was found at index {found_index}.")
else:
    print(f"The number {target} was not found in the list.")

Function 'sequential_search' took 0.000005 seconds to execute.
The number 6 was found at index 2.


<h2> Búsqueda Dicotómica o Binaria </h2>
es un algoritmo de búsqueda más eficiente que la búsqueda secuencial para listas ordenadas. En lugar de recorrer la lista uno por uno, la búsqueda binaria divide repetidamente la lista a la mitad y compara el elemento buscado con el elemento en el medio. Si el elemento buscado es igual al elemento en el medio, se ha encontrado. Si es menor, se busca en la mitad inferior de la lista; si es mayor, se busca en la mitad superior. Este proceso continúa hasta que se encuentre el elemento o se determine que no está presente. 


In [9]:
@timing_decorator
def binary_search(sorted_list, target):
    left, right = 0, len(sorted_list) - 1

    while left <= right:
        mid = (left + right) // 2
        if sorted_list[mid] == target: 
            return mid # Returns the index where the target was found
        elif sorted_list[mid] < target:
            left = mid + 1
        else: right = mid - 1
    return -1

La búsqueda binaria tiene una complejidad de tiempo de O(log n), lo que la hace muy eficiente para listas grandes. Aqui un ejemplo de como funciona: 

In [10]:
# Usage example
sorted_numbers = [1, 2, 4, 6, 7, 8, 10]
target = 6

found_index = binary_search(sorted_numbers, target)

if found_index != -1:
    print(f"The number {target} was found at index {found_index}.")
else:
    print(f"The number {target} was not found in the list.")

Function 'binary_search' took 0.000007 seconds to execute.
The number 6 was found at index 3.


Es probable que en pequeñas listas la diferencia de computo sea pequeño, inclusive los metodos con O(n) sean más rápidos, por ello es interesante tener en cuenta la siguiente grafica de la notación <strong>Big  O </strong>
<div>
<img src="https://www.campusmvp.es/recursos/image.axd?picture=/big-o-complejidad-algoritmica.png" />
</div>

<h2>Búsqueda Hash</h2>
Es un enfoque eficiente para recuperar valores de colección de datos basada en una clave única asociada a cada valor. Utiliza una función hash para convertir la clave en una ubicación especifica en la estructura de datos llamada tabla hash. 
Las tablas <strong>Hash</strong> normalmente es un arreglo de <strong>buckets</strong> o cubos donde los valores se almacenan. La busqueda en una tabla hash es muy rápida en promedio. 

In [2]:
class HashTable:
    def __init__(self, size):
        self.size = size #size of the hash table 
        self.table = [None] * size #create a list of size self.size with initial values None
    
    def _hash_function(self, key):
        return hash(key) % self.size # Hash function to calculate the index hash table
    
    def insert(self, key, value):
        index = self._hash_function(key) #Calculate the index using the _hash_function
        if self.table[index] is None:
            self.table[index] = [(key, value)] #if none in the index selected, create a list and add the key-value pair
        else:
            for i, (existing_key, _) in enumerate(self.table[index]): 
                if existing_key == key:
                    self.table[index][i] = (key, value) #if the key already exists, update the value
                    return
                self.table[index].append((key, value)) #If there is not a colision, add the pair key-value
    @timing_decorator
    def get(self, key):
        index = self._hash_function(key)
        if self.table[index] is not None:
            for existing_key, value in self.table[index]:
                if existing_key == key:
                    return value #If the key its found, return value asociated
        return None
    


La busqueda de hash es muy rápida en promedio, ya que el acceso a los elementos se hace en un tiempo constante $O(1)$ en condiciones ideales. $\\$
Acontinuación un ejemplo: 


In [3]:
# Crear una instancia de la tabla hash con tamaño 10
hash_table = HashTable(size=10)

# Insertar pares clave-valor en la tabla hash
hash_table.insert("name", "John")
hash_table.insert("age", 30)

# Obtener valores utilizando claves
name = hash_table.get("name")
age = hash_table.get("age")
gender = hash_table.get("gender")

# Imprimir los valores obtenidos
print("Name:", name)
print("Age:", age)
print("Gender:", gender)

Function 'get' took 0.000006 seconds to execute.
Function 'get' took 0.000018 seconds to execute.
Function 'get' took 0.000013 seconds to execute.
Name: John
Age: 30
Gender: None


### Desventajas de la Búsqueda Hash

Aunque la búsqueda hash tiene muchas ventajas, también presenta algunas desventajas que deben tenerse en cuenta:

1. **Colisiones:** Una de las principales desventajas de la búsqueda hash es la posibilidad de colisiones. Las colisiones ocurren cuando dos claves diferentes se asignan a la misma ubicación en la tabla hash debido a la función de hash. Esto puede llevar a la pérdida de datos si no se manejan adecuadamente. Para evitar colisiones, se deben usar técnicas como encadenamiento (almacenar múltiples valores en un mismo índice usando una lista) o resolución por sondas (buscar el siguiente índice disponible).

2. **Funciones de Hash Ineficientes:** Si la función de hash utilizada no distribuye uniformemente los valores en la tabla, puede aumentar la probabilidad de colisiones. Elegir o diseñar una función de hash eficiente es crucial para el rendimiento de la búsqueda hash.

3. **Uso de Memoria:** Las tablas hash pueden consumir una cantidad significativa de memoria. Si la tabla se vuelve demasiado grande en relación con la cantidad de datos almacenados, puede haber un desperdicio de memoria.

4. **No es Ordenado:** A diferencia de otros métodos de búsqueda, como la búsqueda binaria en una lista ordenada, la búsqueda hash no proporciona una forma de acceder a elementos en un orden específico. Los elementos se almacenan en ubicaciones basadas en la función de hash, lo que no garantiza un orden.

5. **Tiempo de Inserción:** A veces, la inserción de nuevos elementos puede ser costosa debido a las colisiones y la necesidad de manejarlas correctamente. Esto puede ralentizar el proceso de inserción en comparación con otras estructuras de datos.

6. **No es Ideal para Rangos:** Si necesitas buscar elementos dentro de un rango específico, la búsqueda hash no es la mejor opción, ya que no proporciona un orden natural para los elementos.

En general, la búsqueda hash es una técnica poderosa y eficiente cuando se utiliza correctamente, pero es importante considerar estas desventajas y seleccionarla con base en los requisitos y características específicas del problema que estás resolviendo.


<h2>Búsqueda en Árboles o Tree Search</h2>

Es una estructura de búsqueda en árboles jerárquicos, los árboles son una estructura de datos que constan de nodos conectados por enlaces llamados ramas o aristas. En estos se empieza desde un nodo raíz, y se desciende con reglas específicas según la estructura del árbol. 
Ejemplo :

In [6]:
class TreeNode:
    def __init__(self, key, value):
        self.key = key
        self.value = value
        self.left = None
        self.right = None

class BinarySearchTree:
    def __init__(self):
        self.root = None
    
    def insert(self, key, value):
        self.root = self._insert_recursive(self.root, key, value)
    
    def _insert_recursive(self, node, key, value):
        # If the node is None, create a new node and return it
        if node is None:
            return TreeNode(key, value)
        
        # If the key is less than the current node's key, insert on the left subtree
        if key < node.key:
            node.left = self._insert_recursive(node.left, key, value)
        # If the key is greater than the current node's key, insert on the right subtree
        elif key > node.key:
            node.right = self._insert_recursive(node.right, key, value)
        
        return node
    
    @timing_decorator
    def search(self, key):
        return self._search_recursive(self.root, key)
    
    def _search_recursive(self, node, key):
        # If the node is None or the key matches the current node's key, return the node
        if node is None or node.key == key:
            return node
        
        # If the key is less than the current node's key, search in the left subtree
        if key < node.key:
            return self._search_recursive(node.left, key)
        # If the key is greater than the current node's key, search in the right subtree
        else:
            return self._search_recursive(node.right, key)


En este ejemplo, hemos implementado una clase TreeNode para representar los nodos en el árbol binario de búsqueda, y una clase BinarySearchTree para manejar el árbol en sí. La función insert se encarga de agregar nodos al árbol de manera recursiva. La función search realiza una búsqueda en el árbol recursivamente, comparando las claves de los nodos. Si la clave se encuentra, se devuelve el nodo; de lo contrario, se devuelve None.

Recuerda que hay otros tipos de árboles, como los árboles AVL, que optimizan la altura y el rendimiento de las operaciones de búsqueda. La elección del tipo de árbol depende de tus necesidades específicas y los requisitos de rendimiento.

In [7]:
bst = BinarySearchTree()
bst.insert(5, "apple")
bst.insert(3, "banana")
bst.insert(7, "cherry")

result = bst.search(3)
if result:
    print(f"Key: {result.key}, Value: {result.value}")
else:
    print("Key not found.")

Function 'search' took 0.000004 seconds to execute.
Key: 3, Value: banana
