In [1]:
stock_prices = []
with open("stock_prices.csv") as file:
    for line in file:
        tokens = line.split(",")
        day = tokens[0]
        price = float(tokens[1])
        stock_prices.append([day, price])

In [2]:
stock_prices

[['march 6', 310.0],
 ['march 7', 340.0],
 ['march 8', 380.0],
 ['march 9', 302.0],
 ['march 10', 297.0],
 ['march 11', 323.0]]

In [3]:
for entry in stock_prices:
    if entry[0] == "march 9":
        print(entry[1])

302.0


**Вышенаписанный способ - неэффективен. Сложность по времени - O(n)**

Словарь позводяет делать это со сложностью O(1)

In [4]:
stock_prices = {}
with open("stock_prices.csv") as file:
    for line in file:
        tokens = line.split(",")
        day = tokens[0]
        price = float(tokens[1])
        stock_prices[day] = price

In [5]:
stock_prices

{'march 6': 310.0,
 'march 7': 340.0,
 'march 8': 380.0,
 'march 9': 302.0,
 'march 10': 297.0,
 'march 11': 323.0}

In [6]:
stock_prices["march 9"]

302.0

Словарь - имлементация Hash Table/Map. Посмотрим его внутреннее устройство

![](Screenshot_1.png)

Сначала она аллоцирует массив в RAM -> Потом берёт сначала "march 6" -> Каким-то образом он замаппит(привяжет) к определённому элементу массива. И чтобы получить индекс этого элемента, используется Hash Function(Конвертирует строковый ключ в индекс в массиве). 

![](Screenshot_2.png)

Таким же образом можно применить Hash Function ко всем остальным ключам.

**Пример Hash функции**

![](Screenshot_3.png)

Здесь используется ASCII код. Все ASCII идексы символов строки складываются. После берётся остаток от деления суммы на длину выделенного массива. В данном случае - это 609 % 10 = 9

**Complexities**

Lookup by key - O(1) on average

Insertion/Deletion - O(1) on average

In [10]:
def get_hash(key):
    h = 0
    for char in key:
        h += ord(char)
    return h % 100

In [12]:
get_hash("march 6")

9

In [64]:
class HashTable:
    # k - length of the key
    def __init__(self):  # O(n) -> O(1) when array length is short and static
        self.MAX = 10
        self.arr = [[] for i in range(self.MAX)]

    def __setitem__(self, key, value):  # O(k) -> O(1) when key is short
        hash = self.get_hash(key)

        # Chaining
        found = False
        for idx, element in enumerate(self.arr[hash]):
            if len(element) == 2 and element[0] == key:
                self.arr[hash][idx] = (key, value)
                found = True
                break
        if not found:
            self.arr[hash].append((key, value))

    def __delitem__(self, key):  # O(k) -> O(1) when key is short
        self.arr[self.get_hash(key)] = None

    def __getitem__(self, key):  # O(k) -> O(1) when key is short
        return self.arr[self.get_hash(key)]

    def get_hash(self, key):  # O(k)
        hash = 0
        for char in key:
            hash += ord(char)
        return hash % self.MAX

In [71]:
hash_table = HashTable()
hash_table['march 6'] = 310
hash_table['march 6'] = 120
hash_table['march 6'] = 154
hash_table['march 17'] = 120
hash_table['march 2'] = 120
hash_table['march 4'] = 193

In [72]:
print(hash_table['march 6'])
print(hash_table['march 2'])
print(hash_table['march 4'])

[('march 6', 154), ('march 17', 120)]
[('march 2', 120)]
[('march 4', 193)]


In [73]:
hash_table.arr[:10]

[[],
 [],
 [],
 [],
 [],
 [('march 2', 120)],
 [],
 [('march 4', 193)],
 [],
 [('march 6', 154), ('march 17', 120)]]

In [74]:
del hash_table['march 6']
hash_table.arr[:10]

[[], [], [], [], [], [('march 2', 120)], [], [('march 4', 193)], [], None]

**Обработка Коллизий**

## Chaining

Всякий элемент хэш-таблицы (её массива) есть ссылка на отдельный связный список, в который добавляются новые элементы при коллизии.

![](Screenshot_4.png)

В таком случае поиск элемента:

O(1) on avg, O(n) in worst case

## Linear Probing

Элементы всё также хранят значения, но в случае коллизии, будет пробироваться следующий индекс до тех пор, пока не найдётся пустой. Если достигнут конец массива, пробирование продолжается с его начального элемента.

![](Screenshot_4.png)


In [56]:
collisions = HashTable()
collisions["march 6"] = 120
collisions["march 17"] = 986

In [57]:
print(collisions.get_hash("march 6"))
print(collisions.get_hash("march 17"))

9
9


In [59]:
collisions["march 6"]

986

In [None]:
# Collision Handling In Hash Table - Data Structures & Algorithms Tutorials In Python -> 10:16 
# Modifying __delitem__, __getitem__ methods