# Hash Function
雜湊函式：將大量的資料壓縮變小成雜湊值，並固定格式，具唯一性不易發生衝突，也同時具有保護資料的特性，在此練習中我們透過 MD5 將資料加密，並將十六進位轉為十進位的純數字。

# Hash Table
雜湊表：將資料先透過雜湊函式取得數字，並除以欲分出的堆數（幾個櫃子），取餘數為第幾類（第幾個櫃子），若兩筆資料的餘數相同則發生碰撞，較後進入 Hash Table 的資料以 linked list 或 BST 的型態接在上一筆資料後面，在此練習中我們使用 linked list 的型態串接資料。

```由於 Hash Table 較難單用文字說明，因此學習歷程內並沒有詳細說明，而是以手寫的方式放在流程圖內，配合畫圖說明詳細邏輯構想與步驟。
```

# 學習歷程
## 原本的構想：不小心將 array 語法套用至 linked list 
由於這份作業相較於上一次的 BST 來講輕鬆許多，在複習完老師的上課影片，並參考老師及其他網站寫法後，就開始著手自己寫，卻沒有運用 linked list 的思維——節點指向節點的方式寫，反而用較熟悉的 array 的 a[0] 去指定位置，導致卡關許久，後來又去複習了一次 linked list 以及自己寫的 BST。
   * [Hash Table 參考網站](https://www.nosuchfield.com/2016/07/29/the-python-implementationp-of-HashTable/)
   * [MD5 程式網站](https://kite.com/python/examples/2084/crypto-generate-a-new-md5-hash)
   * [老師 ppt](https://docs.google.com/presentation/d/e/2PACX-1vT1HO9Nl475k2bR0l1x8_Tr4V5Wzx0BEqp9bpmHckvj8kTeJehhYVlOJUDVPhLQm6kjGCJ_sLMSBUw5/pub?start=false&loop=false&delayms=3000&slide=id.p)
   * [linked list 複習網站](https://emn178.pixnet.net/blog/post/93557502)

In [None]:
from Crypto.Hash import MD5


class ListNode:
    def __init__(self, val):
        self.val = val
        self.next = None
        """
        :type val: int
        :type next: ListNode
        :rtype: None        
        """
class MyHashSet:
    def __init__(self, capacity=5):
        self.capacity = capacity
        self.data = [None] * capacity
        self.head = None
        """
        :type capacity: int
        :rtype: None
        """
    def add(self, key):
        """
        :type key: int
        :rtype: None
        """
        h = MD5.new()
        h.update(key.encode("utf-8"))
        key_code = int(h.hexdigest(),16)
        index = key_code % 5
        if self.data[index][0] == None:
            self.data[index][0] = key_code
        else:
            last = self.data[index][0]
            while last.next != None:
                last = last.next
            last.next = key_code
            
        
    def remove(self, key):
        """
        :type key: int
        :rtype: None
        """
        if self.contains(key) != True:
            pass
        else:
            h = MD5.new()
            h.update(key.encode("utf-8"))
            key_code = int(h.hexdigest(),16)
            index = key_code % 5
            i = 0
            while self.data[index][i].val != key_code:
                pre = self.data[index][i]
                self.data[index][i] = self.data[index].next
                i += 1
            pre.next = self.data[index].next
                
        
    def contains(self, key):
        """
        :type key: int
        :rtype: bool(True or False)
        """
        h = MD5.new()
        h.update(key.encode("utf-8"))
        key_code = int(h.hexdigest(),16)
        index = key_code % 5
        if self.data[index][0] == None:
            return False
        else:
            head = self.data[index][0]
            while head != key:
                head = head.next
            if head != None:
                return True
            else:
                return False

## 後來更正：改為 linked list 寫法
複習完 linked list 的觀念後，將原本的程式碼用指向的方式重寫了一次，並沒有出現 error，但輸入測資後發現可以加入資料，卻又找不到資料，發現問題可能出在 contains 函式。

In [None]:
from Crypto.Hash import MD5


class ListNode:
    def __init__(self, val):
        self.val = val
        self.next = None
        """
        :type val: int
        :type next: ListNode
        :rtype: None        
        """
class MyHashSet:
    def __init__(self, capacity=5):
        self.capacity = capacity
        self.data = [None] * capacity
        """
        :type capacity: int
        :rtype: None
        """
    def add(self, key):
        """
        :type key: int
        :rtype: None
        """
        h = MD5.new()
        h.update(key.encode("utf-8"))
        key_code = int(h.hexdigest(),16)
        index = key_code % 5
        new_node = ListNode(key)
        if self.data[index] == None:
            self.data[index] = new_node
        else:
            last = self.data[index]
            while last.next != None:
                last = last.next
            last.next = new_node
            
        
    def remove(self, key):
        """
        :type key: int
        :rtype: None
        """
        if self.contains(key) != True:
            pass
        else:
            h = MD5.new()
            h.update(key.encode("utf-8"))
            key_code = int(h.hexdigest(),16)
            index = key_code % 5
            while self.data[index].val != key_code:
                pre = self.data[index]
                self.data[index] = self.data[index].next
            pre.next = self.data[index].next
                
        
    def contains(self, key):
        """
        :type key: int
        :rtype: bool(True or False)
        """
        h = MD5.new()
        h.update(key.encode("utf-8"))
        key_code = int(h.hexdigest(),16)
        index = key_code % 5
        if self.data[index] == None:
            return False
        else:
            head = self.data[index]
            while head != key:
                head = head.next
            if head != None:
                return True
            else:
                return False

## 最後的程式碼：依自己的想法全部重寫
因為測資無法順利測試，也找不到哪裡出錯，又覺得與參考網站的寫法太像，用自己的想法全部重新寫了一遍，雖然中途又出現了幾次 error，但有 error 還是比較好 debug，一個測資測試成功後，再陸陸續續加上其他測資，就像上次的 BST 一樣，時間最多還是花在測試測資，這一次光 remove 就想出了 6 種不同可能的測資，最後就慢慢摸索出來最終的版本了！這樣一路下來，真的感覺到自己進步很多！

In [None]:
from Crypto.Hash import MD5


class ListNode:
    def __init__(self, val):
        self.val = val
        self.next = None
        """
        :type val: int
        :type next: ListNode
        :rtype: None        
        """
        
class MyHashSet:
    def __init__(self, capacity=5):
        self.capacity = capacity
        self.data = [None] * capacity
        """
        :type capacity: int
        :rtype: None
        """
        
    def add(self, key):
        """
        :type key: int
        :rtype: None
        """
        h = MD5.new()
        h.update(key.encode("utf-8"))
        key_code = int(h.hexdigest(),16)
        index = key_code % self.capacity
        new_node = ListNode(key_code)
        
        if self.contains(key) == True:
            return
        else:
            if self.data[index] == None:
                self.data[index] = new_node
            else:
                last = self.data[index]
                
                while last.next != None:
                    last = last.next
                    
                last.next = new_node
        
    def remove(self, key):
        """
        :type key: int
        :rtype: None
        """
        if self.contains(key) != True:
            return
        else:
            h = MD5.new()
            h.update(key.encode("utf-8"))
            key_code = int(h.hexdigest(),16)
            index = key_code % self.capacity
            temp = self.data[index]
            
            if temp.val == key_code:
                if temp.next:
                    self.data[index] = temp.next
                else:
                    self.data[index] = None
            else:
                while temp:
                    if temp.val != key_code:
                        pre = temp
                        temp = temp.next
                    else:
                        break
                        
                if temp.next:
                    pre.next = temp.next
                else:
                    pre.next = None
            

    def contains(self, key):
        """
        :type key: int
        :rtype: bool(True or False)
        """
        h = MD5.new()
        h.update(key.encode("utf-8"))
        key_code = int(h.hexdigest(),16)
        index = key_code % self.capacity
        temp = self.data[index]
        
        while temp:
            if temp.val != key_code:
                temp = temp.next
            else:
                return True
            
        return False
                

# 流程圖

![](https://i.imgur.com/fi2sOJ3.jpg)

![](https://i.imgur.com/c0NFurF.jpg)

![](https://i.imgur.com/pyeCmg8.jpg)

# 參考資料

https://www.nosuchfield.com/2016/07/29/the-python-implementationp-of-HashTable/

https://kite.com/python/examples/2084/crypto-generate-a-new-md5-hash

https://docs.google.com/presentation/d/e/2PACX-1vT1HO9Nl475k2bR0l1x8_Tr4V5Wzx0BEqp9bpmHckvj8kTeJehhYVlOJUDVPhLQm6kjGCJ_sLMSBUw5/pub?start=false&loop=false&delayms=3000&slide=id.p

https://emn178.pixnet.net/blog/post/93557502