Hash: 是一個將對象映射為固定長度的整數值的過程。這個過程使用了hash函數，通常用來快速比較和查找對象。

Hashable: Hash 對象的值在其生命周期內必須保持不變，這樣它可以作為字典的鍵或集合中的元素。

在 Python 中，不可變的對象通常是 hashable 的，因為它們的值不會變化。
integer、float、string、tuple(當元組中的所有元素也是 hashable 時)

In [2]:
a = 100
b = 'This is a string'
c = 1.0
d = True
e = None

print(hash(a), hash(b), hash(c), hash(d), hash(e))
# 100, 亂碼, 1.0, 1, 亂碼
# 故常用 hash 的會是 str  

100 -6865713742499119920 1 1 8794083829423


同一 run 中 hash 同樣東西會得到同樣的值

但不同 run 中 hash 的值會不一樣

這是為了避免 reverse engineering (資安問題)

並且，即使只有差一點點， hash 出來的值都會差很多，這是為了避免 collision
(即不同的 input 產生同個 output)

In [3]:
print(hash("Hi"))  # 會跟下面一樣 
print(hash("Hi!"))  # 值會差很多
print(hash("Hi!!"))  # 值差很多
def do():
    print("do something here")
do()

for i in range(10):
    pass

print(hash("Hi"))  # 一樣
print(hash("Hi"))  # 一樣

-8863767901706960610
3668063738057149799
-3822401342925972907
do something here
-8863767901706960610
-8863767901706960610


__hash__() 是用來返回對象的hash值的特殊方法。如果想讓自定義的 class 變成 hashable (就可以當dictionary key 或 set 的 element)，最終， hash() 會 return 一個整數，這個整數就是對象的 hash 值。

__eq__() 用來定義對象之間的相等比較行為。

如果想要讓一個對象可以被 hash (即使是字典的鍵或集合的元素)，那麼這個對象必須同時實現 __hash__()：用於計算哈希值。__eq__()：用於比較相等性。

為什麼需要兩者一起實現？因為 Python 要確保在字典或集合中，如果兩個對象被認為是相等的（通過 __eq__()），那麼它們的 hash 值也必須相同（由 __hash__() 提供）。這樣可以保證對象的唯一性。

In [2]:
# 單純的情況下，不寫__hash__，class 還是可以當作 dictionary 的 key 來使用。
# 但在有寫__eq__的情況下，寫__hash__其必要性。
# 至於__hash__的撰寫方式，在 Python 的 documentation也有說明，通常是將屬性放入 tuple 內部，用內建的hash()去運算數值。

class Robot():
    def __init__(self, name, age, address):
        self.name = name
        self.age = age 
        self.address = address

    # define a private method __key()
    def __key(self):
        return (self.name, self.age, self.address) # 將屬性放入 tuple 內部

    # implement hash function
    def __hash__(self):
        return hash(self.__key()) # 用內建的hash()去運算數值
    
    def __eq__(self, other): # 定義 "==" 比較的特殊方法
        if isinstance(other, Robot): #  other 是否為 Robot 的 instance
            return self.__key() == other.__key()
        return NotImplemented # 特殊的返回值, 如果某個操作符或方法不支持兩個對象之間的操作，返回 NotImplemented 可以告訴 Python 該操作未實現
    
robot1 = Robot("Benny", 25, "Taiwan")
robot2 = Robot("Benny", 25, "Taiwan")
print(robot1 == robot2)




True
