# Searching Algorithms

## İçerik:
* [Sequential (Linear) Search with Unordered List](#1)
* [Sequential (Linear) Search with Ordered List](#2)
* [Binary Search](#3)
* [Jump Search](#5)
* [Hashing ve Hash Table](#44)
* [Searching Algorithms İş Mülakatları Soru-Cevap](#55)
* [Searching Algorithms Python Challenge/Problem](#66)
* [Neler Öğrendik](#99)

<a id="1"></a>
## Sequential (Linear) Search with Unordered List
* Sequential Search sıralı arama demektir.
* Unordered list ise bir listenin içerisinde ki değerlerin *sırasız* bir şekilde bulunduğu listelerdir.
    * [5, 7, 2, 3, 15, 8, 100, 12]
* Sequential Search de aranan sayı listenin içinde baştan başlayarak sırayla aranır.
* Mesela 8 sayısını yukarıda tanımlı listenin içerisinde aramak istiyoruz. Aramaya baştan başlanır ve sırasıyla bulana kadar devam edilir. Eğer aranan sayı bulunamaz ise arama listenin sonuna kadar devam eder.
* ![Time](unordered_list_analizi.jpg)
* En iyi durumda aranan değer bulunur ise complexity of algoritma O(1)
* Diğer durumlarda ise complexity of algoritma O(n)

In [1]:
def sequentialSearchUnorderedList(liste,value):
    """
    sequantial search for unordered list
    """
    index = 0
    found = False
    
    while index < len(liste) and not found:
        
        if liste[index] == value:
            found = True
        else:
            index += 1
    return (found,index)

In [2]:
liste = [5, 7, 2, 3, 15, 8, 100, 12]
found , index = sequentialSearchUnorderedList(liste, 15)
print(found)
print(index)

True
4


<a id="2"></a>
## Sequential (Linear) Search with Ordered List
* Sequential Search sıralı arama demektir.
* Ordered list ise bir listenin içerisinde ki değerlerin *sıralı* bir şekilde bulunduğu listelerdir.
    * [2, 3, 5, 7, 8, 12, 15, 100]
* Mesela 8 sayısını yukarıda tanımlı listenin içerisinde aramak istiyoruz. Aramaya baştan başlanır ve sırasıyla bulana kadar devam edilir. Eğer aranan sayı bulunamaz ise liste ordered olduğu için aranan sayıdan daha büyük bir sayı ile karşılaşıldığında arama sona erer.
* Başka bir örnek vermek gerekirse. Yukarıda ki liste içerisinde 6 sayısını arıyoruz. Baştan başlayıp aramaya devam ederken 7 sayısı ile karşılaştığımızda arama sona erer.
* ![Time](ordered_list_analizi.jpg)
* En iyi durumda complexity of algoritma O(1)
* En kötü durumda ise complexity of algoritma O(n)

In [3]:
def sequentialSearchOrderedList(liste,value):
    """
    sequential search for ordered list
    """
    
    index = 0
    found = False
    stop = False
    while index < len(liste) and not found and not stop:
        if liste[index] == value:
            found = True
        else:
            if value < liste[index]:
                stop = True
            else:
                index += 1
    return (found,index)

In [4]:
liste = [2, 3, 5, 7, 8, 12, 15, 100]
found,index = sequentialSearchOrderedList(liste,11)
print(found)
print(index)

False
5


<a id="3"></a>
## Binary Search
* Sequential search aksine binary search sıralı arama yapmaz.
* Binary search ordered yani sıralı listelerde çok avantajlıdır.
* Binary search aramaya ortadan başlar. Eğer aradığı değer ortadaki değerden büyük ise bir sonraki arama adımını listenin upper half kısmında yapar. Bu process böyle tekrar eder.
* ![Time](binarys.jpg)
* Binary search divide and conquer(böl ve fethet) mantığı ile çalışır.
* Binary search complexity of algorithm logarithmic big O yani O(log n). n bir listedeki eleman sayısı

In [1]:
def binarySearch(liste,value):
    """
    binary search for sorted array
    """
    first_index = 0
    last_index = len(liste) - 1
    
    found = False
    
    while first_index <= last_index and not found:
        
        middle_index = int((first_index + last_index) / 2)
        
        if liste[middle_index] == value:
            found = True
        else:
            # lower half
            if value < liste[middle_index]:
                last_index = middle_index - 1
                print("lower half")
            # upper half
            else:
                first_index = middle_index + 1
                print("upper half")
    return found

In [2]:
liste = [3,6,11,12,18,21,34]
binarySearch(liste,18)

upper half
lower half


True

In [4]:
liste = [3,6,11,12,18,21,34]
binarySearch(liste,2)

lower half
lower half
lower half


False

<a id="5"></a>
## Jump Search
* Jump Search de binary search gibi sorted listelerde arama yapmak için kullanılır.
* Jump search sequential search de olduğu gibi tek tek arama yapmak yerine belli bir step size ile zıplayarak arama yapar.
* Örneğin elimizde sıralı bir liste olsun [0, 1, 2, 3, 4, 5, 6, 7, 8] 
    * Search etmek istediğimiz sayı 5 olsun 
    * arama 3 index atlayarak yapılsın.
    * Step1: index 0'dan index 3'e bir atlama gerçekleşti ama bulunamadı
    * step2: index 3'dan index 6'ya bir atlama gerçekleşti ama bulunamadı
    * step3: aranan değerin index 6 da bulunan değerden küçük olduğu görüldü ve bu nedenle index 4 e atlandı.
    * step4: index 4 den itibaren aranan değeri bulana kadar linear search yapıldı.
    * ![Time](jump.jpg)
* Jump Search'ün time complexity'si Linear Search(O(n)) ve Binary Search(O(Log n)) arasındadır.

In [1]:
import math
def jumpSearch(liste,value):
    """
    jump search for sorted array
    """
    n = len(liste)
    step = math.sqrt(n) # karekök alma
    
    prev = 0
    
    while liste[int(min(step,n)-1)] < value:
        prev = step
        step += math.sqrt(n)
        
        if prev >= n:
            return -1
    while liste[int(prev)] < value:
        prev += 1
        
        if prev == min(step,n):
            return -1
        
    if liste[int(prev) == value]:
        return int(prev)
    
    return -1

In [2]:
liste = [0,1,2,3,4,5,6,7,8,18,21,44]
jumpSearch(liste,45)

-1

<a id="44"></a>
## Hashing ve Hash Table
* Diğer searching algoritmalarından farklı olarak complexity of algorithm O(1) olan bir data strucure elde edebiliriz. Bu konsept hashing diye adlandırılır.
* Hash table değerlerin daha sonra kolay bulunabilmesini sağlayan bir data  structure yapısıdır.
* Hash table üzerindeki her bir pozisyon slots olarak adlandırılır.
* Bunu boş bir liste olarak düşünebilirsiniz.
* 10 tane boş slotu olan bir hash table![Time](hash_e.jpg)
* Hash function: slotlar ve bu slotlarda ki itemler arasında bağlantı(mapping) kurmaya yarayan fonksiyondur.
* Hash fonksiyonu item değerini alır ve bu item'ın hangi slotta olduğu return eder.
* Hash function remainder method: item'ı hangi slot'a koyacağımızı remainder yöntemi ile bulmak
* Mesela bir hast table'ımız var. n = 8 yani empty hash table size. 
* Bir listemiz var [ 44, 36, 83, 27,67,41 ]
* h(item) = item%n => hash value
* collusion: birden fazla linked listing bir slot'a bağlanması.
* ![Time](hashf.jpg)
* searching O(n) n = belli bir slotta linked list eleman sayısı. 
* Zaten amacımızda hash function kullanarak hash table üzerinde ki her bir slot için 1 tane value atamak. Böylece searching içi constant time complexity'ye sahip oluruz. O(1).

<a id="55"></a>
## Searching Algorithms İş Mülakatları Soru-Cevap
* Algoritma Ne Demektir?
    * Algoritma, girdi olarak bir değer ya da değer kümesi alan ve çıktı olarak bir değer ya da değer kümesi üreten iyi tanımlanmış bir hesaplama prosedürüdür. Bir algoritma, girişi çıktıya dönüştüren bir hesaplama adımları dizisidir. (Source: Introduction to Algorithms 3rd Edition by CLRS)
* Binary search'ü açıklayın?
    * İlk önce arrayin ortasındaki değere bakarız. 
    * Aradığımız değer bu ortadaki değerden büyükse upper half'ın ortasındaki değere bakarız ve lower half'ı iptal ederiz. 
    * Daha sonra aradığımız değer lower half'ın ortasında ki değerden büyükse bu seferde upper half in upper half'ına bakarız. 
    * Arama bu süreçleri tekrar ederek sürer gider.
* Binary Search time complexity (Big O ) nedir?
    * Binary search recursion ile çözülebiliyor. Recursion ile implement edildiği zaman O(Logn)'dir.
* Binary Search ile Linked list de arama yapılır mı?
    * Hayır. Binary search de arama ortadan başladığı için linked listte bir anda(yani O(1) sürede) ortaya gidemez.
* Hash Algorithm nerelerde kullanılır bir örnek verin?
    * Şifre doğrulama
* Algoritmada best case ve worst case senaryoların tanımı nedir?
    * Best case: en hızlı mesela binary search de aranan değerin arrayin ortasında olması
    * Worst case: en yavaş

<a id="66"></a>
## Searching Algorithms Python Challenge/Problem
1. Binary Search with recursion

### 1) Binary Search with recursion

In [2]:
def rec_binary_search(arr,ele):
    """
    binary search with recursion
    """
    
    # base case
    if len(arr) == 0:
        return False
    
    # recursive case
    else:
        mid = int (len(arr)/2)
        
        # if match found
        if arr[mid] == ele:
            return True
        else:
            #lower
            if ele < arr[mid]:
                return rec_binary_search(arr[:mid],ele)
                
            #upper
            else:
                return rec_binary_search(arr[mid+1:],ele)
                

In [3]:
liste = [3,6,11,12,18,21,34]
rec_binary_search(liste,18)

True

In [4]:
rec_binary_search(liste,28)

False

<a id="99"></a>
## Neler Öğrendik
* Sequential (Linear) Search with Unordered List
* Sequential (Linear) Search with Ordered List
* Binary Search
* Jump Search
* Hashing ve Hash Table
* Searching Algorithms İş Mülakatları Soru-Cevap
* Searching Algorithms Python Challenge/Problem