# 筆記本 4：處理地點清單
在此範例中，我們將從 CSV 檔案中提取出唯一的地點名稱，並將它們儲存到另一個檔案。過程中也會去除重複的地點。

## 操作步驟 
- 載入一個包含地點資訊的 CSV 檔案。
- 清理並去除重複的地點名稱。
- 將處理後的唯一地點名稱列表存入新的 CSV 檔案。


In [None]:
# 匯入必要的 Python 套件
import csv
import pandas as pd


### 步驟 1：載入 CSV 檔案
我們先把檔案讀入，並檢查資料專欄。
假設原始檔案路徑為 `locations.csv`，其中地點資訊位於第三欄。

In [None]:
# 定義輸入 CSV 檔案路徑
input_csv = 'event_log.txt'

# 使用 pandas 讀取 CSV 文件
data = pd.read_csv(input_csv)
data.head()  # 顯示 CSV 檔案的前幾行以檢查其內容

### 步驟 2：提取唯一地點名稱
我們將從 CSV 檔案中第三欄（地點）提取並處理包含地點的欄位，去除重複地點並轉存成新檔案。

In [None]:
# 定義提取和保存唯一地點名稱的函數
def extract_unique_places(input_csv, output_csv):
    unique_places = set()  # 使用集合儲存地點，避免重複

    # 讀取輸入的CSV檔案
    with open(input_csv, 'r', encoding='utf-8') as infile:
        csv_reader = csv.reader(infile)
        next(csv_reader)  # 略過表頭列
        for row in csv_reader:
            place_field = row[2]  # 取得第三欄的'地點'欄位
            # 使用分號分割地點，並去除多餘的空格
            places = [place.strip() for place in place_field.split(';')]
            # 將地點加入集合中，避免重複
            unique_places.update(places)

    # 將獨特的地點名稱寫入輸出的CSV檔案
    with open(output_csv, 'w', encoding='utf-8', newline='') as outfile:
        csv_writer = csv.writer(outfile)
        csv_writer.writerow(['地名'])  # 寫入表頭
        for place in sorted(unique_places):  # 排序地點名稱以保持輸出的一致性
            csv_writer.writerow([place])

    print(f"轉換完成，請檢查輸出檔案：{output_csv}")

### 步驟 3：儲存結果
我們將去除重複的地點名稱後的列表存入一個新的 CSV 檔案。

In [None]:
# 定義輸出 CSV 檔案路徑
output_csv = 'unique_places.csv'

# 調用函數來提取唯一地點並存入到輸出檔案
extract_unique_places(input_csv, output_csv)

### 結論
在這個範例中，我們成功提取了唯一的地點名稱並存入了新的 CSV 檔案。這個步驟可以有效地幫助我們在日後進行不同資料的地點對應或分析。

接下來，你可以繼續處理這些地點名稱資料用於其他進階的分析或操作。