### 可哈希類型與Set的關係

#### 什麼是可哈希(Hashable)物件？

物件被認為是可哈希的，如果滿足以下條件：

1. **不變的哈希值**：物件必須擁有在其生命週期內不會改變的哈希值。這通常是透過實現 `__hash__()` 方法來完成。

2. **可比較性**：物件必須能夠與其他物件進行比較，這是透過實現 `__eq__()` 方法來完成。

3. **相等性與哈希值**：如果兩個物件相互比較為相等（即 `obj1 == obj2` 為 `True`），它們必須擁有相同的哈希值。這確保了可哈希物件可以在依賴哈希的集合物件中可靠地使用，例如Set和字典。

#### 為什麼哈希性對Set很重要

Python 中的Set是唯一元素的集合，並且是使用**哈希表(Hash Table)**實現的。以下是哈希性如何應用於Set：

- **唯一性**：當你將一個物件添加到Set中時，Python 會檢查具有相同哈希值的物件是否已經存在於Set中。如果存在，則不會添加新物件，確保Set中的所有元素都是唯一的。

- **效率**：使用哈希表使得Set中的成員測試、添加和刪除操作在平均情況下具有常數時間複雜度（O(1)）。這種效率在很大程度上依賴於存儲物件的可哈希性。

#### 可哈希與不可哈希類型

- **可哈希類型**：大多數 Python 的**不可變(immutable)**內建類型都是可哈希的。例子包括：
  - **字串**：`str`
  - **元組**：`tuple`（只要所有元素都是可哈希的）
  - **不可變Set**：`frozenset`

- **不可哈希類型**：可變類型不是可哈希的，例如：
  - **清單**：`list`
  - **字典**：`dict`

#### 使用者定義的類別

- 使用者定義的類別預設是可哈希的，這意味著這些類別的實例將擁有來自其在記憶體中位置（使用 `id()`）的唯一哈希值。
- 然而，若希望類別的實例在Set中有意義地使用（即基於內容而非位置），則應實現 `__hash__()` 和 `__eq__()` 方法。

### 使用可哈希類型的Set範例 

```python
class HashablePoint:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __hash__(self):
        return hash((self.x, self.y))

    def __eq__(self, other):
        return isinstance(other, HashablePoint) and self.x == other.x and self.y == other.y

    def __repr__(self):
        return f"HashablePoint({self.x}, {self.y})"


class IdentityPoint:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __repr__(self):
        return f"IdentityPoint({self.x}, {self.y})"


# 創建一個 Set 來存儲唯一的可哈希點
hashable_points_set = set()

# 添加可哈希點
hashable_points_set.add(HashablePoint(1, 2))
hashable_points_set.add(HashablePoint(1, 2))  # 重複項，不會被添加
hashable_points_set.add(HashablePoint(3, 4))

# 顯示可哈希點的 Set
print(hashable_points_set)  # 輸出: {HashablePoint(1, 2), HashablePoint(3, 4)}

# 創建一個 Set 來存儲身份點
identity_points_set = set()

# 添加身份點
identity_points_set.add(IdentityPoint(1, 2))
identity_points_set.add(IdentityPoint(1, 2))  # 重複項，會被添加
identity_points_set.add(IdentityPoint(3, 4))

# 顯示身份點的 Set
print(identity_points_set)  # 輸出: {IdentityPoint(1, 2), IdentityPoint(3, 4), IdentityPoint(1, 2)} 
```

### 主要要點

IdentityPoint 類別：這個類別不覆寫 __hash__ 和 __eq__ 方法，因此每個實例的哈希值基於其在記憶體中的位置（id()）。即使兩個 IdentityPoint(1, 2) 物件的坐標相同，它們仍然會被視為不同的實例，因此都會被添加到集合中。

### 什麼是哈希？

**哈希**是一種將輸入數據轉換為固定大小數值的過程，這個數值稱為**哈希值**或**哈希碼**。哈希函數（hash function）是一種數學算法，它接受任意大小的輸入數據，並將其轉換為固定長度的位元組序列。這種轉換具有以下特點：

1. **固定長度**：無論輸入數據的大小，哈希值的長度是固定的。

2. **快速計算**：哈希函數能夠快速計算出哈希值，這使得它在數據處理中非常高效。

3. **唯一性**：理想的哈希函數應該為不同的輸入產生不同的哈希值，但在實際應用中，可能會存在哈希碰撞（即不同的輸入產生相同的哈希值）。優秀的哈希函數能夠將這種情況降到最低。

4. **不可逆**：哈希函數是單向的，這意味著從哈希值無法輕易推導回原始輸入數據。

### 哈希函數的工作原理

**哈希函數**是一種數學算法，將輸入（或「訊息」）轉換為固定大小的字節串。輸出，通常稱為**哈希值**或**摘要**，通常以十六進制數字表示。

1. **輸入**：哈希函數接受任意大小的輸入。這可以是字串、文件或任何其他數據類型。

2. **處理**：算法通過一系列數學運算處理輸入。這些運算可能包括：
   - 位元運算（AND、OR、NOT 等）
   - 模運算
   - 位元移動
   - 混合函數以產生均勻的輸出分佈

3. **輸出**：哈希函數會產生固定大小的輸出，無論輸入的大小。常見的輸出大小包括 128 位（MD5）、160 位（SHA-1）和 256 位（SHA-256）。

### 優良哈希函數的特性

一個好的哈希函數理應具備以下特性：

1. **確定性**：相同的輸入總是會生成相同的輸出。

2. **快速計算**：對於任何輸入，哈希值的計算應該很快。

3. **預影響抗性**：給定一個哈希值，應該在計算上難以找到產生該哈希值的原始輸入。

4. **小變化產生大變化**：對輸入的微小變化（即使是改變一位）應該產生顯著不同的哈希輸出，這被稱為**雪崩效應**。

5. **碰撞抗性**：應該難以找到兩個不同的輸入產生相同的哈希值（碰撞）。

6. **均勻分佈**：哈希值應均勻分佈，以避免聚集，確保哈希函數能有效利用可用的哈希空間。

### 常見的哈希函數

1. **MD5（訊息摘要算法 5）**：
   - 產生 128 位的哈希值。
   - 廣泛使用，但由於存在碰撞攻擊的漏洞，被視為不安全。

2. **SHA-1（安全哈希算法 1）**：
   - 產生 160 位的哈希值。
   - 比 MD5 更安全，但仍然對某些攻擊存在脆弱性。

3. **SHA-256**：
   - 屬於 SHA-2 系列，產生 256 位的哈希值。
   - 更安全，廣泛用於需要強安全性的應用，如 SSL/TLS 證書和加密貨幣。

4. **SHA-3**：
   - 最新的安全哈希算法成員，引入了新的構造方法，旨在抵禦各種攻擊。

### 哈希函數的應用

1. **數據完整性**：哈希函數用於驗證數據的完整性。通過比較傳輸前後的哈希值，可以檢測數據的任何變更。

2. **密碼存儲**：系統不存儲明文密碼，而是存儲密碼的哈希。在用戶登錄時，輸入的密碼會被哈希並與存儲的哈希進行比較。

3. **數位簽名**：哈希函數在數位簽名中用於確保消息未被篡改。

4. **加密應用**：哈希函數在各種加密協議中至關重要，包括 SSL/TLS，用於互聯網上的安全通信。

5. **數據結構**：哈希函數是實現哈希表的基礎，這使得數據檢索變得高效。

### 總結

哈希函數在計算機科學和網絡安全中至關重要，提供了一種確保數據完整性、安全性和高效數據處理的方法。理解它們的工作原理及其特性對於從事算法、數據結構或安全協議的相關工作是非常重要的。