# Algoritmos de Busqueda

## Problema 1

_ Disena un algoritmo que dada una cadena S encuentre y regrese la primera instancia del caracter que no se repite. Si dicho caracter no existe regresar #. Tu algoritmo debe de recorrer una sola vez la cadena S y utilizar O(1) en memoria. La cadena S contiene solo letras minusculas del alfabeto ingles. _

### Solucion: 

Primero creamos dos diccionarios, uno para decirnos la posicion donde se encontro por primera vez cada caracter y el segundo para decirnos la frecuencia en la que aparecio cada caracter. Los diccionarios todos tendran el el numero de llaves de la alfabeto siempre, por lo tanto su tamano no depende del tamano de la cadena y por lo tanto ocupan O(1) memoria.

In [1]:
def frequency_dict():
    keys = list('abcdefghijklmnopqrstuvwxyz') 
    dict = {}
    for char in keys:
        dict[char] = 0
    return dict

def first_appearance_dict():
    keys = list('abcdefghijklmnopqrstuvwxyz') 
    dict = {}
    for char in keys:
        dict[char] = 'not found yet'
    return dict

Definamos la siguiente funcion para ejecutar el algoritmo como tal. Recorrera solo una vez la cadena, registrando la posicion de la primera aparicion de cada caracter y la frecuencia con la que aparecio en la cadena

In [2]:
def first_non_repeating_char(string):

    # Gets the frenquency and first appereance of the charactrers in the string
    frequency = frequency_dict()
    first_appearance = first_appearance_dict()
    # Loops over the string
    for position in range(len(string)):
        # Gets the character 
        char = string[position]
        # Updates the frequency
        frequency[char] = frequency[char] + 1
        # Records the position if it's the first time it appears
        if first_appearance[char] == 'not found yet':
            first_appearance[char] = position

    # Finally gets the first non reapiting character
    character = '#'
    position = float('inf')
    # Loops over the alphabet
    alphabet = list(frequency.keys())
    for char in alphabet:
        if frequency[char] == 1:
            if first_appearance[char] < position:
                character = char
                position = first_appearance[char]
    
    return character  

### Ejemplos

In [3]:
first_non_repeating_char('geeksforgeeks')

'f'

In [4]:
first_non_repeating_char('hello')

'h'

In [5]:
first_non_repeating_char('aaaaabbbbbbcddddddeeeeefggghijkkkk')

'c'

## Problema 2

_ Dado un arreglo ordenado entontrar la posicion de un elemento dado x en tiempo O(log(n)) _

### Solucion

Para resolver este problema usaremos el algoritmo de busqueda binaria que se implementa a continuacion, el algoritmo hace uso del apradigma divide y venceras. 

The function takes the following arguments:

* low is the lowest index of the array
* high is the highest index of the array
* value the element to be found

In [6]:
def binary_search(array, low, high, value):
    # calculates the mid point
    mid = int((high - low)/2) + low
    # This step checks if high < low wich means that the value is not in the array
    if high < low:
        return 'the value is not in the array'
    # Checks if the mid point is the value we are looking for
    elif value == array[mid]:
        return mid
    # If de value es higher than the mid value then we look for it in the right part of the array
    elif value > array[mid]:
        return binary_search(array, mid + 1, high, value)
    # If de value es lower than the mid value then we look for it in the left part of the array
    elif value < array[mid]:
        left_part = array[:mid]
        return binary_search(array, low, mid - 1, value)

### Ejemplos

In [7]:
numbers = [-4,-2,0,2,4,6,8,10]
low = 0
high = len(numbers) - 1

In [8]:
binary_search(numbers, low, high, -4)

0

In [9]:
binary_search(numbers, low, high, -3)

'the value is not in the array'

In [10]:
binary_search(numbers, low, high, -2)

1

In [11]:
binary_search(numbers, low, high, 6)

5

## Problema 3

__ Encuentre algun pico en el arreglo (peak finding) __

### Solucion:

Usaremos una estrategia devide y venceras.


In [12]:
def peak_finder(array, low, high):
    # Finds the mid point
    mid = int((high - low)/2) + low
    # We're left only with an element of the array returns that element
    if low == high:
        return low
    # Looks for the peak in the left part of the array
    elif array[mid - 1] > array[mid]:
        return peak_finder(array, low, mid - 1)
    # Looks for the peakn in the right part of the array
    elif array[mid] < array[mid + 1]:
         return peak_finder(array, mid + 1, high)
    else:
        return mid


## Problema 4

_ Dado un arreglo decir si existe un par de elementos en el arreglo cuya suma sea un numero dado k _

### Solucion:

Supongamos que podemos calcular el maximo y el minimo del arreglo en tiempo O(n), con esto crearemos un diccionario que ocuparemos para saber si algun elemento ha sido visto.


In [13]:
def all_num_dic(array, sum_num):
    min_el = min(array)
    max_el = sum_num - min_el
    dic = {num : False for num in range(min_el, max_el + 1)}
    return dic

Ahora recorreremos el arreglo y buscaremos si el complemento de cada numero ya ha sido visto

In [14]:
def are_there_two_nums(array, sum_num):

    seen = all_num_dic(array, sum_num)

    for num in array:
        complement = sum_num - num
        if seen[complement]:
            return True
        else:
            seen[num] = True
        
    return False

### Ejemplos

In [15]:
are_there_two_nums([1,2,3,4,5], 100)

False

In [16]:
are_there_two_nums([1,2,3,4,5], 4)

True

## Problema 5

_ Implemente el algoritmo Merge Sort _

### Solucion

Definamos primero la funcion de Merge

In [17]:
def merge(left_array, right_array):
    # New list
    sorted_list = []
    # indexes
    i_l = 0 # left array
    i_r = 0 # right array
    # Lengths
    n_l = len(left_array)
    n_r = len(right_array)
    # Merges the arrays
    while i_l < n_l and i_r < n_r:
        # Adds the smallest element
        if left_array[i_l] <= right_array[i_r]:
            sorted_list.append(left_array[i_l])
            i_l = i_l + 1
        else:
            sorted_list.append(right_array[i_r])
            i_r = i_r + 1
    # Appends the remaining of the arrays
    sorted_list = list(sorted_list + left_array[i_l:])
    sorted_list = list(sorted_list + right_array[i_r:])
    return sorted_list

Veamos que funciona

In [18]:
merge([7] ,[3, 5])

[3, 5, 7]

Ahora creemos el algoritmos de merge sort

In [19]:
def merge_sort(array):
    # Checks for the base case
    if len(array) <= 1:
        return array
    # Divides the instance
    else:
        mid_point = int(len(array)/2)
        left_part = merge_sort(array[:mid_point])
        right_part = merge_sort(array[mid_point:])
        sorted_array = merge(left_part, right_part)
        return sorted_array

### Ejemplo 

In [20]:
merge_sort([4,23,6,4,2,5,7,5,3,3,2,1])

[1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 7, 23]

In [21]:
merge_sort([1,2,3,4,5,6,7,8,9])

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [22]:
merge_sort([9,8,7,6,5,4,3,2,1])

[1, 2, 3, 4, 5, 6, 7, 8, 9]

## Problema 6

_ Implemente el algoritmo de busqueda en graficas conocido como breadth-fisrt search, los nodos y los verices se daran de la siguiente forma: _

* Nodos: \[1,2,3,4,5,6,7\]
* Vertices: \[(2,3),(4,5),...\]

### Solucion:

Primero creemos una funcion que dado un nodo nos devuelva una lista de sus hijos



In [23]:
def get_sons(vertex, edges):
    sons = []
    for edge in edges:
        if vertex in edge:
            if vertex == edge[0]:
                sons.append(edge[1])
            else:
                sons.append(edge[0])
    return sons


In [24]:
vertices = [1,2,3,4,5,6,7]
edges = [(1,2),(2,3),(2,4),(5,6),(6,7)]
get_sons(7, edges)

[6]

La sioguiente clase nos ayudara a manejar de mejor forma todo lo que tenga que ver con los vertices

In [25]:
class create_vertex:

    def __init__(self, vertex_index, edges):
        self.index = vertex_index
        self.adjacency = get_sons(vertex_index, edges)
        self.color = 'w'
        self.distance = float('inf')
        self.parent = None

Ejemplo

In [26]:
v = create_vertex(2,edges)
v.index, v.adjacency, v.color, v.distance, v.parent

(2, [1, 3, 4], 'w', inf, None)

Ahora crearemos una diccionario que contenga un objeto veritce por cada entrada, este sera el formato de la entrada del algoritmo

In [27]:
V = {vertex_index : create_vertex(vertex_index, edges) for vertex_index in vertices}
V

{1: <__main__.create_vertex at 0x7fb0dec24280>,
 2: <__main__.create_vertex at 0x7fb0dec24d90>,
 3: <__main__.create_vertex at 0x7fb0dec243d0>,
 4: <__main__.create_vertex at 0x7fb0dec24a90>,
 5: <__main__.create_vertex at 0x7fb0dec24d60>,
 6: <__main__.create_vertex at 0x7fb0dec248e0>,
 7: <__main__.create_vertex at 0x7fb0dec24310>}

Finalmente programamos el algoritmo como tal

In [28]:
def BFS(vertices, source_vertex):
    # Prepraramos al vertice inicial para ser preprocesado
    vertices[source_vertex].color = 'g'
    vertices[source_vertex].distance = 0
    # Queue
    queue = [source_vertex]
    # Loops over the graph
    while len(queue) != 0:
        # La lista de adyacencia de u sera explorada en esta iteracion
        u = queue.pop(0)
        # Iteramos sobre los hijos de u, los pintamos de gris, definimos su distancia y los agregamos a la cola
        for v in vertices[u].adjacency:
            # Procesa solo los vertices que no han sido vistos aun
            if vertices[v].color == 'w':
                vertices[v].color = 'g'
                vertices[v].distance = vertices[u].distance + 1
                queue.append(v)
        # Cuando terminemos de visitar por primera vez los hijos de u lo pintamos de negro
        vertices[u].color = 'b'

    return vertices 

Probemos el algoritmo

In [29]:
vert = [1,2,3,4,5,6,7]
edges = [(1,2),(2,3),(2,4),(5,6),(6,7)]
V = {vertex_index : create_vertex(vertex_index, edges) for vertex_index in vert}
results = BFS(V, 5)

Veamos los resultados

In [30]:
for vertex in results.keys():
    print('vertex: ' + str(vertex))
    print('distance from the source: ' + str(results[vertex].distance))
    print('----------------------------------')

vertex: 1
distance from the source: inf
----------------------------------
vertex: 2
distance from the source: inf
----------------------------------
vertex: 3
distance from the source: inf
----------------------------------
vertex: 4
distance from the source: inf
----------------------------------
vertex: 5
distance from the source: 0
----------------------------------
vertex: 6
distance from the source: 1
----------------------------------
vertex: 7
distance from the source: 2
----------------------------------


## Problema 7

_ Implemente el algoritmo de busqueda en graficas conocido como depth-fisrt search, los nodos y los verices se daran de la siguiente forma: _

* Nodos: \[1,2,3,4,5,6,7\]
* Vertices: \[(2,3),(4,5),...\]

### Solucion:

Necesitaremos crear una clase para los vertices de la grafica, de forma muy similar a los del problema anterior


In [31]:
class create_vertex_DSF:

    def __init__(self, vertex_index, edges):
        self.index = vertex_index
        self.adjacency = get_sons(vertex_index, edges)
        self.color = 'w'
        # Tiempo en el cual fue encontrado
        self.d = float('inf')
        # Tiempo en el cual se terminaron de procesar todos sus hijos
        self.f = float('inf')

Debemos crear un discionario parecido al del problema anterior pero acorde con este nuevo tipo de vertice

In [32]:
vert = [1,2,3,4,5,6,7]
edges = [(1,2),(2,3),(2,4),(5,6),(6,7)]
V = {vertex_index : create_vertex_DSF(vertex_index, edges) for vertex_index in vert}
V[1].index, V[1].adjacency, V[1].color, V[1].d, V[1].f

(1, [2], 'w', inf, inf)

Para ejecutar el algoritmo necesitamos las dos siguientes rutinas

In [38]:
def DFS_visit(vertices, u, time): # u es el nodo que estamos por procesar
    time = time + 1
    vertices[u].d = time
    vertices[u].color = 'g'
    # Exploramos todos su hijos
    for v in vertices[u].adjacency:
        # Solo visitamos los vertices que no han sido vistos
        if vertices[v].color == 'w':
            vertices, time = DFS_visit(vertices, v, time)
    # terminamos de procesar el vertice u
    vertices[u].color = 'b'
    time = time + 1
    vertices[u].f = time 

    return vertices, time

In [39]:
def DFS(vertices):
    time = 0
    all_vertices = list(vertices.keys())
    for each_v in all_vertices:
        # Procesa los vertices que no han sido vistos
        if vertices[each_v].color == 'w':
            vertices, time = DFS_visit(vertices, each_v, time)
    
    return vertices

Probemos el algoritmo

In [40]:
vert = [1,2,3,4,5,6]
edges = [(1,2),(2,3),(1,4),(5,6)]
V = {vertex_index : create_vertex_DSF(vertex_index, edges) for vertex_index in vert}
V[1].index, V[1].adjacency, V[1].color, V[1].d, V[1].f

(1, [2, 4], 'w', inf, inf)

In [41]:
results = DFS(V)

In [42]:
for vertex in results.keys():
    print('vertex: ' + str(vertex))
    print('encontrado en: ' + str(results[vertex].d))
    print('finalizado en: ' + str(results[vertex].f))
    print('----------------------------------')

vertex: 1
encontrado en: 1
finalizado en: 8
----------------------------------
vertex: 2
encontrado en: 2
finalizado en: 5
----------------------------------
vertex: 3
encontrado en: 3
finalizado en: 4
----------------------------------
vertex: 4
encontrado en: 6
finalizado en: 7
----------------------------------
vertex: 5
encontrado en: 9
finalizado en: 12
----------------------------------
vertex: 6
encontrado en: 10
finalizado en: 11
----------------------------------
