<a href="https://colab.research.google.com/github/jugernaut/ManejoDatos/blob/desarrollo/AlgoritmosBusqueda/01_BusquedaSecuencial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>Búsqueda Secuencial</i></h1>
  </font>
  <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesor: M.en.C. Miguel Angel Pérez León</i></h5>
  <h5 align="center"><i>Ayudante: Jesús Iván Coss Calderón</i></h5>
  <h5 align="center"><i>Ayudante: Jonathan Ramirez Montes</i></h5>
  <h5 align="center"><i>Materia: Manejo de Datos</i></h5>
  </font>

# Introducción

El algoritmo de búsqueda secuencial (o lineal) es uno de los algoritmos de búsqueda más sencillos de comprender y fáciles de implementar.

La forma de trabajar de este algoritmo es iterar sobre la estructura de datos (lista, vector, colección, etc.) elemento por elemento hasta encontrar el dato buscado.

Vale la pena recalcar que este algoritmo no pide prerequisito alguno y funciona en cualquier caso, sin importar la longitud o el orden en el que se encuentren los elementos de la colección.

# Descripción

De manera formal podemos describir el funcionamiento del algoritmo de la siguiente manera:

1.   El algoritmo toma como entrada una colección de datos y un elemento ó dato a buscar.
2.   Se itera (recorre) toda la colección, elemento por elemento y se compara cada elemento con el elemento que se busca.
3.   Una vez localizado el elemento a buscar se devuelve el valor *True*, el índice de la colección donde se localizo el dato ó el elemento en si.
4.   En caso de no encontrarse el elemento a buscar, se devuelve *False* o *None*.
5.   Fin del algoritmo.

# Análisis

El análisis de la complejidad de este algoritmo es de lo más sencillo y para no perder la costumbre, tratemos de identificar el peor caso para poder comenzar con el análisis de la complejidad de este algoritmo.

Para una colección de datos de longitud 0 ó 1, este algoritmo **realiza una sola operación**, ya que a lo más se tiene un elemento con el cuál comparar el dato a buscar

En una colección de longitud 2 (y suponiedo que el dato a buscar se encuentra en la ultima localidad de la colección), este algoritmo **realiza 2 comparaciones**, una por cada elemento de la colección.

Si se tiene una colección de longitud 3 (y considerando el peor caso), este algoritmo **realiza 3 comparaciones**.

| Longit de la colección $(n)$ | Número de copmaraciones | 
| :-:           |           :-:              | 
| 1       | $T(1)=1$ | 
| 2       | $T(2)=2$ |
| 3       | $T(3)=3$ |
| ..      | ........ |
| $n$       | $T(n)=?$ |

## ¿Qué sucede con colecciones de tamaño $n$?

Supongamos que se tiene una colección $A$ de datos de longitud $n$ y se busca el dato $x$ (donde $x$ no está restringido a ser un valor numérico).

$$
A=\underset{n-elementos}{\underbrace{\left[a\right]_{0}\left[b\right]_{1}\cdots\left[x\right]_{n-1}}}
$$

Es importante notar que hay diferencia entre el contenido de cada elemento y el índice que caracteriza a cada elemento, el algoritmo indica que se tiene que recorrer toda la colección (elemento por elemento) hasta localizar el dato $x$.

De tal manera que el peor caso para este algoritmo sería cuando el dato a buscar se encuentra en la última posición de la colección (como se muestra en la imagen), ya que en ese caso el algoritmo tiene que realizar **$n$ comparaciones**, una por cada dato de la colección.

Por lo tanto para una colección de datos de longitud $n$ este algoritmo realiza $n$ última, en otras palabras.

$$
T(n) \in O(n)
$$

## Demostración

En este caso (y algunos otros) **no hace falta una demostración formal matemática** para mostrar que este algoritmo pertenece al orden lineal, basta con identificar el peor caso y justificar el número de comparaciones que este algoritmo realiza para colecciones de longitud arbitraria.

# Búsqueda Secuencial (valores numéricos)

En este ejemplo vamos a ver la versión de la búsqueda secuencial utilizando valores numéricos y más adelante mostramos el caso general con objetos.


In [None]:
''' 
Algoritmo que implementa la búsqueda secuencial
coleccion: coleccion de datos
dato:      dato a buscar en la coleccion
'''
def b_secuencial(coleccion, valor):
  for i in range(len(coleccion)):
    if coleccion[i] == valor:
      return i
  return False

# pruebas del algoritmo
# coleccion de datos
col = [0, -1, 19, 5, 25, 55]
# dato a buscar
valor = 55
#valor = 105
print(b_secuencial(col, valor))

5


En la implementación de la celda superior se busca un valor numérico y en caso de encontrar el valor se devuelve el indice (no el valor) del dato buscado.

En otro caso se devuelve `False`, lo que indica que el valor no se encontraba en la colección.

# Paradigma Orientado a Objetos (POO)

Hasta este momento hemos desarrollado algoritmos empleando el paradigma funcional, lo que quiere decir que todos nuestros algoritmos han sido definidos en forma de funciones (`def funcion()`).

Sin embargo existen diferentes [paradigmas](https://www.4rsoluciones.com/blog/que-son-los-paradigmas-de-programacion-2/) de programación, por mencionar algunos:

*   Funcional.
*   Procedimental.
*   Lógico.
*   Orientado a objetos.

En los problemas reales, los algoritmos no solo se aplican a valores numéricos (como se ha visto hasta el momento), de hecho en la gran mayoría de casos todo algoritmo tiene que resolver un problema que involucra **objetos** de manera general.

Por lo tanto la finalidad de esta sección es mostrar como utilizar el paradigma orientado a objetos para adaptar los algoritmos vistos previamente (y los que veremos en el restos del curso) con la finalidad de que funcionen con cualquier clase de objeto, no únicamente valores numéricos.


## Definición de clases

Las clases dentro del POO sirven para agrupar un conjunto de atributos y comportamientos que poseerán los elementos pertenecientes a esta clase.

Por ejemplo supongamos que necesitamos aplicar los algoritmos del curso sobre los alumnos de la Facultad de Ciencias, por lo tanto necesitamos definir una clase que nos permita **abstraer las características que nos interese modelar** y sobretodo que nos permita generar **objetos de tipo alumno**.

Por lo tanto vamos a generar la clase `AlumnoFC` que contendrá como atributos de cada alumno:

*   Nombre.
*   Número de cuenta.
*   Calificaciones.

Y como comportamientos (métodos) vamos tener:

*   Constructor de alumnos: este método nos permite crear objetos de tipo alumno
*   Operadores de comparación entre alumnos ($\leq, \ge$, =): estos métodos nos permiten establecer un orden entre los alumnos y sobretodo nos permitirá compararlos.
*   Promedio: devuelve el promedio del alumno.

A continuación se muestra la definición de la clase `AlumnoFC`.




In [None]:
# Clase para generar objetos de tipo alumno
class AlumnoFC(object):

  # Constructor de alumnos
  def __init__(self, nombre, numero_cuenta, calif):
    self.nombre = nombre
    self.numero_cuenta = numero_cuenta
    self.calificaciones = calif

  # Sobrecarga de los operadores de comparación
  # Determina si un alumno es igual a otro
  def iguales(self, otro):
    if self.numero_cuenta == otro.numero_cuenta:
      return True
    else:
      return False

  # Indica si un alumnos es mayor o igual a otro
  def mayor_que(self, otro):
    if self.numero_cuenta >= otro.numero_cuenta:
      return True
    else:
      return False

  # Indica si un alumnos es menor o igual a otro
  def menor_que(self, otro):
    if self.numero_cuenta <= otro.numero_cuenta:
      return True
    else:
      return False
  
  def promedio(self):
    promedio = sum(self.calificaciones)/len(self.calificaciones)
    return promedio

# Pruebas de la clase AlumnosFC
Mike = AlumnoFC('Miguel Angel Perez Leon', 30134563, [10, 10, 10, 9, 10])
Aitor = AlumnoFC('Peter', 20134563, [8, 10, 9, 9, 10])

# Pruebas del metodo promedio
print(Mike.promedio())
print(Aitor.promedio())

# Prueba de comparacion DESCOMENTAR PARA VER ERROR
#print(Mike <= Aitor)

# Prueba del metodo iguales
print(Mike.iguales(Aitor))
print(Mike.iguales(Mike))

9.8
9.2


TypeError: ignored

## Sobrecarga de Operadores (*Overload*)

En la primera definición de la clase `AlumnoFC` podemos ver una versión temprana de la implementación de las características que nos interesa modelos de los alumnos de la Facultad de Ciencias, sin embargo tiene un problema.

El problema radica en la definición de los métodos de comparación (`iguales, mayor_que, menor_que`) ya que en caso de que quisiéramos usar nuestros algoritmos de ordenamiento o de búsqueda con objetos de la clase `AlumnoFC` tendríamos que cambiar todo signo $==,\geq,\leq$ por su respectivo método de la clase `AlumnoFC`.

Sin embargo la POO y en particular *Python 3.x* nos proporciona un mecanismo conocido como **Sobrecarga de Operadores**, lo que significa que mediante código, redefiniendo los operadores de comparación podemos ahorrarnos el trabajo de cambiar los operadores de comparación y utilizar de manera natural los algoritmos de ordenamiento y de búsqueda vistos hasta el momento.

Los 3 métodos principales que se tienen que sobrecargar (*overload*) son:

*   `iguales`: se substituye por `__eq__` y corresponde al operador de comparación $==$.
*   `mayor_que`: se substituye por `__ge__` y corresponde al operador de comparación $\geq$.
*   `menor_que`: se substituye por `__le__` y corresponde al operador de comparación $\leq$.

Existen más operadores que puede ser sobrecargados pero **para nuestros algoritmos, basta con estos**.

In [None]:
# Clase para generar objetos de tipo alumno
class AlumnoFC(object):

  # Constructor de alumnos
  def __init__(self, nombre, numero_cuenta, calif):
    self.nombre = nombre
    self.numero_cuenta = numero_cuenta
    self.calificaciones = calif

  # Sobrecarga de los operadores de comparación
  # Determina si un alumno es igual a otro
  def __eq__(self, otro):
    if self.numero_cuenta == otro.numero_cuenta:
      return True
    else:
      return False

  # Indica si un alumnos es mayor o igual a otro
  def __ge__(self, otro):
    if self.numero_cuenta >= otro.numero_cuenta:
      return True
    else:
      return False

  # Indica si un alumnos es menor o igual a otro
  def __le__(self, otro):
    if self.numero_cuenta <= otro.numero_cuenta:
      return True
    else:
      return False
  
  def promedio(self):
    promedio = sum(self.calificaciones)/len(self.calificaciones)
    return promedio

# Pruebas con la clase AlumnosFC
Mike = AlumnoFC('Miguel Angel Perez Leon', 30134563, [10, 10, 10, 9, 10])
Aitor = AlumnoFC('Aitor', 20134563, [8, 10, 9, 9, 10])
Pete = AlumnoFC('Peter', 110134563, [9, 8, 8, 9, 10])

# Prueba de operadores
print(Mike == Mike)
print(Mike <= Aitor)
print(Pete >= Mike)

# Coleccion de alumnos 
alumnos = [Mike, Aitor, Pete]
# Alumno a buscar
dato = AlumnoFC('Peter', 110134563, [9, 8, 8, 9, 10])

print(b_secuencial(alumnos, dato))



True
False
True
2


¡Perfecto!, ya podemos utilizar la `b_secuencial` que definimos previamente para valores numéricos, pero ahora la estamos usando con objetos de la clase `AumnosFC` y lo mejor es que no tuvimos que realizar cambios sobre el algoritmo de búsqueda secuencial visto previamente, ahora podemos buscar alumnos.

Queda como tarea moral (conveniente hacerlo antes del examen) ¿qué se debe hacer para poder emplear los algoritmos de ordenamiento para ordenar objetos de tipo `AumnosFC`.

# Referencias

* Thomas H. Cormen: Introduction to Algorithms.
* Referencias Libro Web: Introduccion a Python.
* Referencias Daniel T. Joyce: Object-Oriented Data Structures.
* Referencias John C. Mitchell: Concepts in programing Languages.