### 練習：英文單字出現次數

- 選擇一首英文歌曲，計算單字及出現次數
  - 忽略大小寫差異，全部轉換為小寫
  - 去除標點符號
  - 轉換為list
  - 以dict 儲存
    - 英文單字為key，出現次數為value
  - 排序後列印出出現次數最多的5個字



### Python 解決方案（拆分後去除非字母字元）

```python 

# 假設的歌曲歌詞
lyrics = """
I will survive, oh as long as I know how to love, I know I'll stay alive.
I've got all my life to live, and I will survive. I will survive.
"""

# 1. 將歌詞轉換為小寫
lyrics_lower = lyrics.lower()

# 2. 將歌詞轉換為清單，按空格拆分
words_list = lyrics_lower.split()

# 3. 使用字典計算單詞出現次數
word_count = {}

# 4. 遍歷每個單詞，去除非字母字元
for word in words_list:
    # 使用生成器去除非字母字元
    cleaned_word = ''.join(char for char in word if char.isalpha())
    
    if cleaned_word:  # 確保清理後的單詞不為空
        if cleaned_word in word_count:
            word_count[cleaned_word] += 1  # 如果單詞已存在，計數加一
        else:
            word_count[cleaned_word] = 1  # 如果單詞不存在，初始化為1

# 5. 將字典按照出現次數排序，並獲取出現次數最多的5個字
top_5_words = sorted(word_count.items(), key=lambda item: item[1], reverse=True)[:5]

# 6. 列印結果
print("出現次數最多的5個單詞:")
for word, count in top_5_words:
    print(f"{word}: {count}")
```

### 解釋代碼

1. **將歌詞轉換為小寫**：
   - 使用 `lower()` 方法將所有字母轉換為小寫。

2. **拆分文本為單詞**：
   - 使用 `split()` 方法按空格拆分字串，將其轉換為單詞清單 `words_list`。

3. **計算單詞出現次數**：
   - 使用一個空字典 `word_count` 來儲存每個單詞及其出現次數。

4. **遍歷每個單詞並去除非字母字元**：
   - 使用生成器表達式，遍歷每個單詞中的字元，僅保留字母字元（`char.isalpha()`）。這樣可以有效地去除非字母字元。
   - 確保 `cleaned_word` 不為空，以避免將空字串計入計數。

5. **排序字典**：
   - 使用 `sorted()` 函數對字典進行排序，並根據出現次數獲取最多的5個單詞。

6. **輸出結果**：
   - 最後，打印出出現次數最多的5個單詞及其計數。
 

### Python 解決方案（去除非字母字元後再拆分）

```python
import string
from collections import Counter

# 假設的歌曲歌詞
lyrics = """
I will survive, oh as long as I know how to love, I know I'll stay alive.
I've got all my life to live, and I will survive. I will survive.
"""

# 1. 將歌詞轉換為小寫
lyrics_lower = lyrics.lower()

# 2. 去除標點符號
lyrics_cleaned = lyrics_lower.translate(str.maketrans("", "", string.punctuation))

# 3. 將歌詞轉換為清單
words_list = lyrics_cleaned.split()

# 4. 使用字典儲存單詞及其出現次數
word_count = Counter(words_list)

# 5. 排序並列印出現次數最多的5個字
top_5_words = word_count.most_common(5)

print("出現次數最多的5個單詞:")
for word, count in top_5_words:
    print(f"{word}: {count}")
```

### 解釋代碼
1. **導入必要的模組**：
   - `string` 用於處理標點符號。
   - `Counter` 是 collections 模組中的一個類別，用於計算可哈希物件的出現次數。

2. **定義歌詞**：
   - 將歌曲的歌詞儲存在 `lyrics` 變數中。

3. **轉換為小寫**：
   - 使用 `lower()` 方法將所有字母轉換為小寫。

4. **去除標點符號**：
   - 使用 `translate()` 方法去除所有標點符號。

5. **轉換為清單**：
   - 使用 `split()` 方法將清理後的字串轉換為單詞清單。

6. **計算單詞出現次數**：
   - 使用 `Counter` 物件來計算每個單詞的出現次數，並將其儲存在字典中。

7. **排序並列印結果**：
   - 使用 `most_common(5)` 方法獲取出現次數最多的五個單詞，並打印出來。
 

In [None]:

import string
from collections import Counter

# 假設的歌曲歌詞
lyrics = """
I will survive, oh as long as I know how to love, I know I'll stay alive.
I've got all my life to live, and I will survive. I will survive.
"""

# 1. 將歌詞轉換為小寫
lyrics_lower = lyrics.lower()

# 2. 去除標點符號
lyrics_cleaned = lyrics_lower.translate(str.maketrans("", "", string.punctuation))

# 3. 將歌詞轉換為清單
words_list = lyrics_cleaned.split()

# 4. 使用字典儲存單詞及其出現次數
word_count = Counter(words_list)

# 5. 排序並列印出現次數最多的5個字
top_5_words = word_count.most_common(5)

print("出現次數最多的5個單詞:")
for word, count in top_5_words:
    print(f"{word}: {count}")

在 Python 中，`translate()` 方法用於轉換字串中的字元，通常用於刪除或替換特定的字元。這個方法需要一個轉換表，該轉換表告訴 Python 需要替換或刪除哪些字元。

### 使用 `str.maketrans()`

在使用 `translate()` 方法之前，通常會使用 `str.maketrans()` 方法來創建一個字元映射表。這個映射表可以用來定義哪些字元需要被替換或刪除。

### 例子

以下是一個簡單的示例，展示如何使用 `translate()` 方法來**刪除字串中的標點符號**：

```python
import string

# 定義一個包含標點符號的字串
text = "Hello, world! This is a test string. Let's see how it works."

# 創建一個轉換表，刪除所有標點符號
translation_table = str.maketrans("", "", string.punctuation)

# 使用 translate() 方法進行轉換
cleaned_text = text.translate(translation_table)

# 輸出結果
print("原始字串:", text)
print("清理後的字串:", cleaned_text)
```

### 解釋

1. **導入 `string` 模組**：
   - `string` 模組提供了一些常用的字串常量，例如標點符號集。

2. **定義字串**：
   - 我們定義了一個包含標點符號的字串 `text`。

3. **創建轉換表**：
   - 使用 `str.maketrans("", "", string.punctuation)` 創建一個轉換表，這裡的**第一個和第二個空字串表示不需要替換字元**，而第三個參數 `string.punctuation` 用來指定哪些字元需要被刪除。

4. **使用 `translate()` 方法**：
   - 使用 `text.translate(translation_table)` 方法將字串中的標點符號刪除。

5. **輸出結果**：
   - 最後，打印原始字串和清理後的字串。

### 執行結果

當您運行這段代碼時，您將會看到：

```
原始字串: Hello, world! This is a test string. Let's see how it works.
清理後的字串: Hello world This is a test string Lets see how it works
```
 

### static str.maketrans(x[, y[, z]])

- 此靜態方法返回一個可用於 `str.translate()` 的轉換表。

  - 如果只有一個參數，則必須是一個字典，將 Unicode 符號（整數）或字元（長度為 1 的字串）映射到 Unicode 符號、字串（任意長度）或 None。字元鍵將被轉換為符號。
  - 如果有兩個參數，它們必須是等長的字串，並且在結果字典中，x 中的每個字元將映射到 y 中相同位置的字元。
  - 如果有第三個參數，它必須是一個字串，其中的字元將在結果中映射為 None。

### string.punctuation

- ASCII 字串，包含在 C 語言環境中被視為標點符號的字元：``!"#$%&'()*+,-./:;<=>?@[\\]^_`{|}~``。

## `Counter` 類別

`Counter` 是 Python 的 `collections` 模組中的一個子類別，用於計算可哈希物件的出現次數。它是字典的子類別，但專注於計數元素的頻率，並提供了許多方便的方法來操作計數數據。

### 基本用法

### 1. 匯入 `Counter`

首先，您需要從 `collections` 模組中匯入 `Counter` 類別：

```python
from collections import Counter
```

### 2. 創建 `Counter` 物件

您可以用以下幾種方式創建 `Counter` 物件：

- **從可迭代物件創建**：

```python
# 從清單創建 Counter
my_list = ['apple', 'banana', 'apple', 'orange']
counter = Counter(my_list)
print(counter)  # 輸出: Counter({'apple': 2, 'banana': 1, 'orange': 1})
```

- **從字典創建**：

```python
# 從字典創建 Counter
my_dict = {'apple': 2, 'banana': 1, 'orange': 1}
counter = Counter(my_dict)
print(counter)  # 輸出: Counter({'apple': 2, 'banana': 1, 'orange': 1})
```

- **從字串創建**：

```python
# 從字串創建 Counter
my_string = "hello"
counter = Counter(my_string)
print(counter)  # 輸出: Counter({'l': 2, 'h': 1, 'e': 1, 'o': 1})
```

### 3. 常用方法

- **獲取元素出現的次數**：

```python
# 獲取特定元素的計數
print(counter['apple'])  # 輸出: 2
```

- **添加計數**：

```python
# 使用 update() 方法添加計數
counter.update(['apple', 'banana', 'banana'])
print(counter)  # 輸出: Counter({'apple': 3, 'banana': 3, 'orange': 1})
```

- **減少計數**：

```python
# 使用 subtract() 方法減少計數
counter.subtract(['apple', 'banana'])
print(counter)  # 輸出: Counter({'apple': 2, 'banana': 2, 'orange': 1})
```

- **獲取最常見的元素**：

```python
# 使用 most_common() 獲取最常見的元素
most_common = counter.most_common(2)
print(most_common)  # 輸出: [('apple', 2), ('banana', 2)]
```

### 4. 轉換為字典

如果需要，您可以將 `Counter` 物件轉換為字典：

```python
counter_dict = dict(counter)
print(counter_dict)  # 輸出: {'apple': 2, 'banana': 2, 'orange': 1}
```
 