# **第6章 使用openpyxl提升Excel處理效率**

## 6.1 openpyxl 簡介

### 安裝openpyxl

In [None]:
pip install openpyxl

## 6.2 基本操作

In [None]:
import openpyxl
from openpyxl.styles import Font, Alignment, PatternFill
from openpyxl.utils import get_column_letter
import random
from datetime import datetime, timedelta

# 創建一個新的工作簿 (Workbook)，並設置一個新工作表 (Worksheet)
wb = openpyxl.Workbook()
ws = wb.active

# 設定工作表標題為“銀行交易記錄”
ws.title = "銀行交易記錄"

# 設置表頭
# 我們用 headers 列表存儲每一列的標題名稱
headers = ["交易日期", "客戶姓名", "賬號", "交易類型", "交易金額", "餘額"]
for col, header in enumerate(headers, start=1):
    # cell 初始化單元格並賦值
    cell = ws.cell(row=1, column=col, value=header)
    # 設置字體為粗體
    cell.font = Font(bold=True)
    # 設置表頭內容居中
    cell.alignment = Alignment(horizontal='center')
    # 填充單元格顏色
    cell.fill = PatternFill(start_color="DDDDDD", end_color="DDDDDD", fill_type="solid")

# 生成模擬數據
# 使用固定的客戶名列表
customers = ["張三", "李四", "王五", "趙六", "錢七"]
# 交易類型列表
transaction_types = ["存款", "取款", "轉賬"]

# 設置隨機種子以便結果可重複
random.seed(42)
# 設定開始日期
start_date = datetime(2023, 1, 1)
for i in range(2, 102):  # 生成100條記錄
    # 隨機生成交易日期
    ws.cell(row=i, column=1, value=start_date + timedelta(days=random.randint(0, 364)))
    # 隨機選擇客戶姓名
    ws.cell(row=i, column=2, value=random.choice(customers))
    # 隨機生成賬號
    ws.cell(row=i, column=3, value=f"62220000{random.randint(10000000, 99999999)}")
    # 隨機選擇交易類型
    ws.cell(row=i, column=4, value=random.choice(transaction_types))
    # 隨機生成交易金額
    amount = random.randint(100, 10000) / 100
    ws.cell(row=i, column=5, value=amount)
    # 生成餘額計算公式，需累加指定列至當前行
    ws.cell(row=i, column=6, value=f"=SUM(E2:E{i})")

# 調整每列的寬度以適應內容
for col in range(1, 7):
    ws.column_dimensions[get_column_letter(col)].width = 15

# 保存文件
wb.save("銀行交易記錄.xlsx")
# 打印提示信息
print("Excel 文件已生成：銀行交易記錄.xlsx")

### 6.2.1 打開和保存 Excel 文件

#### 打開現有的 Excel 文件

In [None]:
import openpyxl

# 打開現有的 Excel 文件
# 這段代碼使用 openpyxl 模組的 load_workbook 函數來打開名為 '銀行交易記錄.xlsx' 的 Excel 文件。
# 這一操作會返回一個 Workbook 的對象存儲在變量 wb 中。打開已有文件是為了對其進行操作，如讀取或修改內容。
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')

# 獲取活動工作表（默認的第一個工作表）
# 通過訪問 Workbook 對象的 active 屬性來獲取當前活動的工作表（通常是第一個工作表）。
# 這可以讓我們直接對該工作表進行操作，如果需要對特定的工作表進行操作也可以通過名稱或索引來獲取。
ws = wb.active

# 讀取單元格的值
# 使用工作表對象 ws 的方式訪問指定單元格（例如 'A1'）並獲取其值。
# 這段代碼直接輸出單元格 A1 的值，通常用來檢查單元格內容。
print(ws['A1'].value)  # 輸出：交易日期

# 關閉文件（可選，但建議執行）
# 使用 close 方法關閉已打開的 Excel 文件。在處理完文件後，建議進行此操作，這樣有助於釋放系統資源。
wb.close()

#### 創建新的 Excel 文件

In [None]:
import openpyxl

# 創建一個新的工作簿，這會建立一個新的 Excel 文件
wb = openpyxl.Workbook()

# 獲取活動工作表，這通常是新建工作簿時的默認第一個工作表
ws = wb.active

# 在工作表中的單元格 A1 寫入數據，這裡是一段文字
ws['A1'] = '這是一個新的 Excel 文件'

# 將工作簿保存為一個名為 "新文件.xlsx" 的 Excel 文件
wb.save('新文件.xlsx')

#### 保存 Excel 文件

In [None]:
wb.save('更新後的文件.xlsx')

### 6.2.2 工作表操作

#### 獲取所有工作表

In [None]:
import openpyxl

# 打開現有的 Excel 文件 '銀行交易記錄.xlsx'
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')

# 獲取活動工作表（默認的第一個工作表）
ws = wb.active

# 獲取所有工作表的名稱
# 使用 wb.sheetnames 方法可以獲取到工作簿中所有工作表的名稱列表。
# 這些名稱可以用來識別各個工作表。
sheet_names = wb.sheetnames
print("所有工作表：", sheet_names)

# 遍歷所有工作表
# wb 物件可以被迭代，從而可以遍歷文件中的所有工作表。
for sheet in wb:
    # 打印每個工作表的標題
    # 每個 sheet 物件有一個 title 屬性，該屬性返回工作表的名稱。
    print(sheet.title)

#### 選擇特定工作表

In [None]:
import openpyxl

# 打開現有的 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')

# 通過工作表名稱選擇特定的工作表 (Worksheet)
# 此行代碼選擇名為 '銀行交易記錄' 的工作表
ws = wb['銀行交易記錄']

# 或者通過索引選擇工作表
# worksheets 屬性返回工作簿的所有工作表列表
# 此行代碼選擇列表中的第一個工作表 (索引從 0 開始)
ws = wb.worksheets[0]

#### 創建新工作表

In [None]:
import openpyxl

# 打開現有的 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')

# 通過名稱選擇工作表
ws = wb['銀行交易記錄']

# 或者通過索引選擇工作表
ws = wb.worksheets[0]

# 創建一個新的工作表
# 此行代碼使用 create_sheet 函數創建一個名為 '新工作表' 的工作表，並將其添加到工作簿 wb 中。
new_sheet = wb.create_sheet("新工作表")

# 創建工作表並指定位置（索引從0開始）
# 此行代碼在工作簿的第一個位置創建一個名為 '另一個工作表' 的新工作表，索引位置為 0 即首位。
another_sheet = wb.create_sheet("另一個工作表", 0)

# 遍歷所有工作表
for sheet in wb:
    print(sheet.title)

#### 刪除工作表

In [None]:
import openpyxl

# 打開現有的 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')

# 通過名稱選擇工作表
ws = wb['銀行交易記錄']

# 或者通過索引選擇工作表
ws = wb.worksheets[0]

# 創建一個新的工作表
new_sheet = wb.create_sheet("新工作表")

# 創建工作表並指定位置（索引從0開始）
another_sheet = wb.create_sheet("另一個工作表", 0)

# 刪除工作表
del wb["另一個工作表"]

# 遍歷所有工作表
for sheet in wb:
    print(sheet.title)

#### 重命名工作表

In [None]:
import openpyxl

# 打開現有的 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')

# 通過名稱選擇工作表
ws = wb['銀行交易記錄']

# 或者通過索引選擇工作表
ws = wb.worksheets[0]

# 重命名工作表
ws.title = "新名稱"

# 遍歷所有工作表
for sheet in wb:
    print(sheet.title)

### 6.2.3 單元格操作

#### 讀取單元格值

In [None]:
import openpyxl

# 創建一個新的工作簿
wb = openpyxl.Workbook()

# 獲取活動工作表
ws = wb.active

# 寫入數據
ws['A1'] = '這是一個新的 Excel 文件'

# 使用單元格坐標來取得單元格的值
# 這裡使用'A1'來定位工作表中的A1單元格，並獲取該單元格中的值
value1 = ws['A1'].value

# 使用行和列索引來取得單元格的值
# 這裡使用行和列的索引（第一行，第一列）來定位單元格，獲取該單元格中的值
# ws.cell(row=1, column=1)表示取得A1單元格，這種方式在需要動態定位單元格時很有用
value2 = ws.cell(row=1, column=1).value

# 打印A1單元格的值，通過單元格坐標來取得
print(f"A1 單元格的值：{value1}")

# 打印第1行第1列的值，通過行和列索引來取得
print(f"第1行第1列的值：{value2}")

#### 寫入單元格值

In [None]:
import openpyxl

# 創建一個新的工作簿
wb = openpyxl.Workbook()

# 獲取活動工作表
ws = wb.active

# 寫入數據
ws['A1'] = '這是一個新的 Excel 文件'

# 使用單元格坐標寫入數據到 B2
# 在單元格 'B2' 中寫入字符串 "新的值"
ws['B2'] = "新的值"

# 使用行和列索引寫入數據到 B2
# 使用 .cell() 方法可以通過行列索引來指定單元格，並寫入 "另一個新值" 到第2行第2列（即 B2 單元格）
ws.cell(row=2, column=2, value="另一個新值")

# 使用單元格坐標
value1 = ws['B2'].value

# 使用行和列索引
value2 = ws.cell(row=2, column=2).value

print(f"B2 單元格的值：{value1}")
print(f"第2行第2列的值：{value2}")

#### 獲取單元格樣式

In [None]:
from openpyxl.styles import Font # 從openpyxl庫中導入樣式中的字體模塊

# 創建一個新的工作簿
wb = openpyxl.Workbook()

# 獲取活動工作表
ws = wb.active

# 寫入數據
ws['A1'] = '這是一個新的 Excel 文件'

# 獲取寫入數據的A1單元格對象
cell = ws['A1']  # 通過工作表ws的索引方式獲取A1單元格的對象

# 獲取A1單元格的字體樣式
font = cell.font  # 通過單元格對象cell的font屬性獲取該單元格的字體樣式

# 打印A1單元格字體的名稱和大小
print(f"字體：{font.name}, 大小：{font.size}")  # 使用f字符串格式化輸出字體的名稱和大小

#### 設置單元格樣式

In [None]:
import openpyxl
from openpyxl.styles import Font, Alignment, PatternFill

# 創建一個新的工作簿
wb = openpyxl.Workbook()

# 獲取活動工作表
ws = wb.active

# 寫入數據
ws['A1'] = '這是一個新的 Excel 文件'

# 設置字體格式，這裡我們選擇了Arial字體，字體大小為12，設為粗體，且字體顏色為紅色
# Font物件可控制字體相關屬性，例如字體名稱、大小、加粗、斜體和顏色等
cell = ws['A1']
cell.font = Font(name='Arial', size=12, bold=True, color="FF0000")

# 設置單元格對齊方式，將水平對齊和垂直對齊設為居中
# Alignment物件可以設定文字在單元格中的對齊方式，包括水平(horizontal)和垂直(vertical)對齊
cell.alignment = Alignment(horizontal='center', vertical='center')

# 設置單元格背景顏色，這裡我們設置為黃色背景
# PatternFill物件用於設定單元格的背景填充樣式和顏色，起始顏色(start_color)和結束顏色(end_color)均設為黃色
cell.fill = PatternFill(start_color="FFFF00", end_color="FFFF00", fill_type="solid")

## 6.3 數據處理

### 6.3.1 讀取數據

#### 讀取整列或整行數據

In [None]:
import openpyxl

# 打開 Excel 文件 '銀行交易記錄.xlsx' 並選擇當前活動的工作表
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')
ws = wb.active

# 讀取第一行（表頭）並打印出這一行的所有單元格值
# 這通常用來檢查表格的欄位名稱，以便後續處理特定列時更為方便
header_row = ws[1]
print("表頭：", [cell.value for cell in header_row])

# 讀取第一列（交易日期）並打印出前5個非表頭的單元格值
# 這裡僅打印前5個日期，以供我們快速檢查日期的格式和數據的準確性
date_column = ws['A']
print("前5個交易日期：", [cell.value for cell in date_column[1:6]])

# 讀取第三列（賬號）並打印出前5個非表頭的單元格值
# 通過這種方式，我們可以快速查看賬號數據，確保數據沒有錯誤或遺漏
account_column = ws['C']
print("前5個賬號：", [cell.value for cell in account_column[1:6]])

# 關閉工作簿以釋放資源
wb.close()

#### 讀取特定範圍的數據

In [None]:
import openpyxl

# 打開 Excel 文件 '銀行交易記錄.xlsx' 並選擇當前活動的工作表
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')
ws = wb.active

# 讀取特定範圍的數據，此例中讀取的是A2到E6範圍內的數據，即前5行的交易信息
# data_range是一個由行組成的序列，每行又是由單元格組成的序列
data_range = ws['A2:E6']

# 遍歷data_range中的每一行
for row in data_range:
    # 將每一行的所有單元格的值提取出來，並以列表形式顯示
    print([cell.value for cell in row])

# 關閉工作簿以釋放資源
wb.close()

#### 遍歷工作表中的所有數據

In [None]:
import openpyxl

# 打開 Excel 文件 '銀行交易記錄.xlsx' 並選擇當前活動的工作表
wb = openpyxl.load_workbook('銀行交易記錄.xlsx')
ws = wb.active

# 遍歷工作表中的每一行，從第二行開始（通常第一行是標題行）
# min_row=2 表示從第二行開始，values_only=True 表示只返回單元格的值，不是單元格對象
for row in ws.iter_rows(min_row=2, values_only=True):
    # print(row) 用於輸出當前行的所有值，這裡的 row 是一個元組，包含該行中所有單元格的值
    print(row)

# 關閉工作簿以釋放資源
wb.close()

### 6.3.2 寫入數據

#### 寫入列表數據

In [None]:
# 創建新的工作表，工作表名稱為"新交易記錄"
# 使用此函數的原因是在現有工作簿中新增一個用來存儲交易記錄的工作表
ws_new = wb.create_sheet("新交易記錄")

# 定義表頭列表，包含交易日期、客戶姓名、賬號、交易類型和交易金額
headers = ["交易日期", "客戶姓名", "賬號", "交易類型", "交易金額"]
# 寫入表頭到新創建的工作表中
# append函數在工作表下一行添加一個新的行，此處用來添加表頭
ws_new.append(headers)

# 定義一個包含新的交易記錄的列表，每一條記錄包含交易日期、客戶姓名、賬號、交易類型和交易金額
new_transactions = [
    (datetime(2023, 12, 1), "黃八", "622200002345678", "存款", 1000.00),
    (datetime(2023, 12, 2), "吳九", "622200008765432", "取款", 500.50),
    (datetime(2023, 12, 3), "周十", "622200004567890", "轉賬", 750.25)
]

# 使用一個循環遍歷每一條新的交易記錄並將其寫入到工作表中
# 每次循環append函數都將一條新的記錄添加到工作表下一行，此處用來添加實際的交易數據
for transaction in new_transactions:
    ws_new.append(transaction)

# 將更新後的工作簿保存到一個新的Excel文件中，文件名為'銀行交易記錄_更新.xlsx'
# save函數用來將工作簿對象保存到一個Excel文件中，確保所有更改被永久保存
wb.save('銀行交易記錄_更新.xlsx')

print("新數據已添加到'新交易記錄'工作表中")

#### 寫入字典數據

In [None]:
import openpyxl

# 打開 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 新增一個工作表，用於存放字典數據
ws_dict = wb.create_sheet("字典數據")

# 定義表頭，這是用來標示每列數據的名稱
headers = ["交易日期", "客戶姓名", "賬號", "交易類型", "交易金額"]
ws_dict.append(headers)  # 將表頭添加到工作表的第一行

# 準備字典數據，包括三筆不同的銀行交易記錄
dict_data = [
    {"交易日期": datetime(2023, 12, 4), "客戶姓名": "劉一", "賬號": "622200001122334", "交易類型": "存款", "交易金額": 2000.00},
    {"交易日期": datetime(2023, 12, 5), "客戶姓名": "陳二", "賬號": "622200005566778", "交易類型": "取款", "交易金額": 1500.50},
    {"交易日期": datetime(2023, 12, 6), "客戶姓名": "張三", "賬號": "622200009988776", "交易類型": "轉賬", "交易金額": 3000.75}
]

# 將字典數據逐行寫入工作表
for item in dict_data:
    # 依據表頭順序從字典中取值，並生成一行數據
    row = [item[header] for header in headers]  # 也可以使用 ws_dict.append(list(item.values()))，但要確保字典鍵的順序與表頭一致
    ws_dict.append(row)  # 將當前行數據添加到工作表中

# 保存修改後的 Excel 文件
wb.save('銀行交易記錄_更新.xlsx')

print("字典數據已添加到'字典數據'工作表中")

#### 批量寫入數據

In [None]:
import openpyxl
from datetime import datetime, timedelta
import random

# 打開 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')
# 在工作簿中創建一個新的工作表並命名為"批量數據"
ws_bulk = wb.create_sheet("批量數據")

# 寫入表頭，表明數據的每一列代表的意義
headers = ["交易日期", "客戶姓名", "賬號", "交易類型", "交易金額"]
# 將表頭添加到工作表的第一行
ws_bulk.append(headers)

# 定義生成模擬數據所需的基本信息
customers = ["張三", "李四", "王五", "趙六", "錢七", "孫八", "周九", "吳十"]
transaction_types = ["存款", "取款", "轉賬"]
# 設定模擬數據的開始日期
start_date = datetime(2023, 1, 1)

# 開始逐行生成和寫入數據
for i in range(10000):  # 生成10000條記錄
    # 隨機生成一個日期，從開始日期起最多加上364天
    date = start_date + timedelta(days=random.randint(0, 364))
    # 從客戶列表中隨機選擇一個客戶
    customer = random.choice(customers)
    # 生成一個隨機的賬戶號碼
    account = f"62220000{random.randint(10000000, 99999999)}"
    # 從交易類型列表中隨機選擇一種交易類型
    trans_type = random.choice(transaction_types)
    # 生成一個隨機的交易金額，範圍在1到10000元之間，小數點後兩位
    amount = random.randint(100, 1000000) / 100
    # 將這一行數據添加到工作表中
    ws_bulk.append([date, customer, account, trans_type, amount])

# 保存修改後的工作簿到磁碟中
wb.save('銀行交易記錄_更新.xlsx')

print("已批量添加10000條記錄到'批量數據'工作表中")

### 6.3.3 數據計算

#### 使用公式

In [None]:
import openpyxl

# 打開 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 在工作簿中創建一個名為'計算'的新工作表
ws_calc = wb.create_sheet("計算")

# 定義要添加到'計算'工作表中的數據，包括商品名稱、單價、數量和總價
# 使用Excel公式來計算每件商品的總價（單價 * 數量）
data = [
    ["商品", "單價", "數量", "總價"],
    ["蘋果", 5, 10, "=B2*C2"],  # 蘋果的總價公式，B2表示單價，C2表示數量
    ["香蕉", 3, 15, "=B3*C3"],  # 香蕉的總價公式，B3表示單價，C3表示數量
    ["橙子", 4, 8, "=B4*C4"]    # 橙子的總價公式，B4表示單價，C4表示數量
]

# 將數據逐行添加到'計算'工作表中
for row in data:
    ws_calc.append(row)

# 在工作表的第五行第一列添加總計標籤
ws_calc['A5'] = "總計"

# 使用Excel的SUM函數計算從D2到D4的總和，並將結果放入第五行第四列
ws_calc['D5'] = "=SUM(D2:D4)"

# 保存已更新的工作簿至同一文件名
wb.save('銀行交易記錄_更新.xlsx')

print("計算示例已添加到'計算'工作表中")

#### 計算總和、平均值等

In [None]:
import openpyxl
from statistics import mean, median

# 打開 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 載入名稱為 '銀行交易記錄' 的工作表
ws = wb['銀行交易記錄']

# 獲取所有交易金額，排除空白和非數字單元格
amounts = [cell.value for cell in ws['E'][1:] if isinstance(cell.value, (int, float))]

# 計算統計數據
total = sum(amounts)  # 計算總交易額
average = mean(amounts)  # 計算平均交易額
median_value = median(amounts)  # 計算中位數交易額
max_amount = max(amounts)  # 獲取最大交易額
min_amount = min(amounts)  # 獲取最小交易額

# 創建新的工作表來存儲統計結果
ws_stats = wb.create_sheet("統計結果")

# 準備統計數據以插入新的工作表
stats_data = [
    ["統計項目", "數值"],  # 標題行
    ["總交易額", total],  # 插入總交易額
    ["平均交易額", average],  # 插入平均交易額
    ["中位數交易額", median_value],  # 插入中位數交易額
    ["最大交易額", max_amount],  # 插入最大交易額
    ["最小交易額", min_amount]  # 插入最小交易額
]

# 將準備好的數據逐行添加到新的工作表
for row in stats_data:
    ws_stats.append(row)

# 設置金額格式為 '#,##0.00'，以便更友好地顯示數字
for row in ws_stats['B2:B6']:
    for cell in row:
        cell.number_format = '#,##0.00'

# 儲存工作簿並覆蓋原有的文件 '銀行交易記錄_更新.xlsx'
wb.save('銀行交易記錄_更新.xlsx')
print("統計結果已添加到'統計結果'工作表中")

#### 條件計算

In [None]:
import openpyxl
from datetime import datetime

# 打開 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 選取工作簿中的 '銀行交易記錄' 工作表
ws = wb['銀行交易記錄']

# 初始化一個用於計算每月存款總額的字典
monthly_deposits = {}

# 遍歷工作表的每一行，從第二行開始，以獲取每一行的值（不包括標題行）
for row in ws.iter_rows(min_row=2, values_only=True):
    # 解析行數據，假設數據順序為：日期、交易類型、交易金額等
    date, _, _, trans_type, amount = row[:5]

    # 判斷日期是否為datetime類型並且交易類型是否為 '存款'
    if isinstance(date, datetime) and trans_type == '存款':
        # 使用年份和月份作為鍵來計算每月存款總額
        month_key = date.strftime("%Y-%m")
        # 如果當月的存款總額已存在，則累加；否則初始化為交易金額
        monthly_deposits[month_key] = monthly_deposits.get(month_key, 0) + amount

# 創建新的工作表，用於存儲月度存款統計
ws_monthly = wb.create_sheet("月度存款統計")

# 添加表頭
ws_monthly.append(["月份", "存款總額"])

# 將每月的存款總額寫入新的工作表
for month, total in sorted(monthly_deposits.items()):
    ws_monthly.append([month, total])

# 設置金額格式為標準貨幣格式
for cell in ws_monthly['B']:
    cell.number_format = '#,##0.00'

# 保存修改後的工作簿
wb.save('銀行交易記錄_更新.xlsx')

print("月度存款統計已添加到'月度存款統計'工作表中")

## 6.4 格式化和樣式

### 6.4.1 單元格格式

#### 設置字體（大小、顏色、粗體等）

In [None]:
import openpyxl
from openpyxl.styles import Font, Color

# 打開 Excel 文件
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 新增一個名為"格式示例"的工作表
ws = wb.create_sheet("格式示例")

# 設置不同的字體樣式
# 在單元格A1中設置大號粗體紅色字體
ws['A1'] = "大號粗體紅色字體"
ws['A1'].font = Font(name='Arial', size=16, bold=True, color="FF0000")
# 使用Font類設置字體樣式，name參數設置字體名稱，size參數設置字體大小，bold參數設置是否加粗，color參數設置字體顏色，這裡使用的是紅色 (FF0000)

# 在單元格A2中設置斜體藍色字體
ws['A2'] = "斜體藍色字體"
ws['A2'].font = Font(name='Calibri', size=12, italic=True, color="0000FF")
# 使用Font類設置字體樣式，name參數設置字體名稱，size參數設置字體大小，italic參數設置是否使用斜體，color參數設置字體顏色，這裡使用的是藍色 (0000FF)

# 在單元格A3中設置帶下劃線的字體
ws['A3'] = "帶下劃線的字體"
ws['A3'].font = Font(name='Times New Roman', size=14, underline='single')
# 使用Font類設置字體樣式，name參數設置字體名稱，size參數設置字體大小，underline參數設置是否帶下劃線，這裡使用的是單一下劃線

# 保存修改後的工作簿
wb.save('銀行交易記錄_更新.xlsx')

print("字體格式示例已添加到'格式示例'工作表中")

#### 設置對齊方式

In [None]:
from openpyxl.styles import Alignment

# 設置單元格B1的文字水平居中和垂直居中
# 首先將單元格B1的值設定為"居中對齊"，然後使用Alignment類來設置文字的對齊方式
# horizontal='center'表示水平居中，vertical='center'表示垂直居中
ws['B1'] = "居中對齊"
ws['B1'].alignment = Alignment(horizontal='center', vertical='center')

# 設置單元格B2的文字右對齊
# 將單元格B2的值設定為"右對齊"，然後通過設置Alignment類的horizontal參數為'right'來實現右對齊
ws['B2'] = "右對齊"
ws['B2'].alignment = Alignment(horizontal='right')

# 設置單元格B3的文字自動換行
# 將單元格B3的值設定為"這是一段很長的文字，將會自動換行顯示"，然後設置wrap_text=True來使其自動換行
# 這樣當文字內容超出單元格寬度時，會自動在單元格內換行顯示
ws['B3'] = "這是一段很長的文字，將會自動換行顯示"
ws['B3'].alignment = Alignment(wrap_text=True)

# 將以上設置保存到名為'銀行交易記錄_更新.xlsx'的Excel文件中
wb.save('銀行交易記錄_更新.xlsx')

print("對齊方式示例已更新")

#### 設置邊框

In [None]:
from openpyxl.styles import Border, Side

# 定義細邊框樣式，Side物件指定了每個邊的樣式為細線
# Border物件將這些邊的樣式統一應用到一個單元格上
thin_border = Border(left=Side(style='thin'),
                     right=Side(style='thin'),
                     top=Side(style='thin'),
                     bottom=Side(style='thin'))

# 在單元格C1中插入文字
ws['C1'] = "帶邊框的單元格"
# 給單元格C1應用細邊框樣式
ws['C1'].border = thin_border

# 定義粗邊框樣式，類似於上面的細邊框樣式，但使用的是粗線
thick_border = Border(left=Side(style='thick'),
                      right=Side(style='thick'),
                      top=Side(style='thick'),
                      bottom=Side(style='thick'))

# 遍歷C3到E5範圍內的所有單元格，並應用粗邊框樣式
for row in ws['C3:E5']:
    for cell in row:
        cell.border = thick_border

# 在單元格C3中插入文字，表示這是粗邊框範圍的開始
ws['C3'] = "粗邊框範圍"


wb.save('銀行交易記錄_更新.xlsx')

print("邊框示例已更新")

#### 設置填充顏色

In [None]:
# 匯入openpyxl庫中的PatternFill和GradientFill模組，用於設置單元格填充樣式
from openpyxl.styles import PatternFill, GradientFill

# 設置單元格D1的單色填充
# 此註釋詳細解釋：首先將單元格D1的值設置為"黃色背景"，然後使用PatternFill設置D1單元格的背景為黃色。
# PatternFill函數參數說明：
# start_color和end_color都設為"FFFF00"（黃色的十六進制表示），這表示填充顏色從開始到結束都是黃色。
# fill_type設為"solid"，表示填充類型為單色填充。
ws['D1'] = "黃色背景"
ws['D1'].fill = PatternFill(start_color="FFFF00", end_color="FFFF00", fill_type="solid")

# 設置單元格D2的漸變填充
# 此註釋詳細解釋：首先將單元格D2的值設置為"漸變背景"，然後使用GradientFill設置D2單元格的背景為漸變色。
# GradientFill函數參數說明：
# stop參數為一個元組，包含了兩個顏色的十六進制表示，表示從黃色（"FFFF00"）漸變到紅色（"FF0000"）。
ws['D2'] = "漸變背景"
ws['D2'].fill = GradientFill(stop=("FFFF00", "FF0000"))

wb.save('銀行交易記錄_更新.xlsx')

print("填充顏色示例已更新")

### 6.4.2 條件格式化

#### 設置簡單的條件格式

In [None]:
from openpyxl.formatting.rule import CellIsRule
from openpyxl.styles import PatternFill

# 創建新的工作表名為"條件格式化"，用於展示條件格式化示例
ws_cond = wb.create_sheet("條件格式化")

# 添加一些示例數據到新工作表中
# 在A列的1到10行中插入數值（100, 200, ..., 1000）
for i in range(1, 11):
    ws_cond.cell(row=i, column=1, value=i * 100)

# 設置條件格式：將大於 500 的單元格填充為紅色
# 使用 PatternFill 來創建紅色填充
# start_color 和 end_color 都設置為紅色的十六進位值 'FFFF0000'
red_fill = PatternFill(start_color='FFFF0000', end_color='FFFF0000', fill_type='solid')

# 使用 CellIsRule 來定義條件格式規則
# operator 設置為 'greaterThan' 表示大於某個值
# formula 設置為 ['500']，定義了條件值
# fill 設置為 red_fill，當條件滿足時，會應用此填充樣式
ws_cond.conditional_formatting.add('A1:A10',
                                   CellIsRule(operator='greaterThan',
                                              formula=['500'],
                                              fill=red_fill))

wb.save('銀行交易記錄_更新.xlsx')

print("簡單條件格式化示例已添加到'條件格式化'工作表中")

#### 使用色階

In [None]:
from openpyxl.formatting.rule import ColorScaleRule

# 添加色階條件格式，這部分訂立了一個色階規則，顏色隨著單元格數據變化
# 1. 'start_type'設置為'min'，表示色階從數據範圍的最小值開始
# 2. 'start_color'設置為'00FF00' (綠色)，代表最小值的顏色
# 3. 'mid_type'設置為'percentile'，表示中間點為數據的百分位數
# 4. 'mid_value'設置為50，表示中位數並對應著設定顏色
# 5. 'mid_color'設置為'FFFF00' (黃色)，代表中間值的顏色
# 6. 'end_type'設置為'max'，表示色階到數據範圍的最大值
# 7. 'end_color'設置為'FF0000' (紅色)，代表最大值的顏色
# 該規則旨在根據數據值漸變顏色，直觀顯示數據的分布與趨勢

color_scale_rule = ColorScaleRule(start_type='min', start_color='00FF00',
                                  mid_type='percentile', mid_value=50, mid_color='FFFF00',
                                  end_type='max', end_color='FF0000')

# 將條件格式應用於工作表（ws_cond）的範圍A1到A10
ws_cond.conditional_formatting.add('A1:A10', color_scale_rule)

wb.save('銀行交易記錄_更新.xlsx')

print("色階條件格式化已添加")

#### 使用數據條

In [None]:
from openpyxl.formatting.rule import DataBarRule

# 添加數據條條件格式：
# DataBarRule 是 openpyxl 中的一個功能，允許我們為特定範圍內的單元格添加數據條。
# 這些數據條能夠直觀地展示數據的大小。
data_bar_rule = DataBarRule(
    start_type='min',  # 數據條開始值的類型。設置為 'min' 代表從該範圍中的最小值開始。
    end_type='max',    # 數據條結束值的類型。設置為 'max' 代表到該範圍中的最大值為止。
    color="FF638EC6",  # 數據條的顏色，這裏使用了藍色 (十六進制表示)。
    showValue=True,    # 是否在數據條上顯示數據值。設置為 True 代表顯示。
    minLength=None,    # 最短的數據條長度（默認為 None 表示自動）。
    maxLength=None     # 最長的數據條長度（默認為 None 表示自動）。
)

# 將設置好的數據條條件格式應用到工作表中特定範圍：
# conditional_formatting.add 用於將規則應用到特定的單元格範圍。
ws_cond.conditional_formatting.add('B1:B10', data_bar_rule)

# 添加一些數據到 B 列：
# 這些數據將被用來展示數據條格式化的效果。
for i in range(1, 11):
    ws_cond.cell(row=i, column=2, value=i * 10)  # 將數值依次填入 B 列的 1 到 10 行

wb.save('銀行交易記錄_更新.xlsx')

print("數據條條件格式化已添加")

#### 使用圖標集

In [None]:
from openpyxl.formatting.rule import IconSetRule

# 添加圖標集條件格式
# IconSetRule 用來為 Excel 儲存格指定一組圖標，以視覺化表示數據的分佈情況。
# '3Arrows' 是一組有三個箭頭的圖標，表示數據的高、中、低三個範圍。
# 'percent' 表示數據會按百分比進行分類，數值 [0, 33, 67] 指的是分界點的百分比。
icon_rule = IconSetRule('3Arrows', 'percent', [0, 33, 67])

# 將條件格式規則應用於工作表 ws_cond 的 C1 至 C10 儲存格範圍內。
# 這個操作使得 C 列中的數據會自動顯示對應的圖標，幫助用戶快速識別數據的範疇。
ws_cond.conditional_formatting.add('C1:C10', icon_rule)

# 添加一些數據到C列
# 使用 for 循環來逐一為 C 列的每一個儲存格添加數據。
# 這裡設定了 1 到 10 的數據，每個數據乘以 10，結果分別為 10, 20, 30, ..., 100。
for i in range(1, 11):
    ws_cond.cell(row=i, column=3, value=i * 10)

wb.save('銀行交易記錄_更新.xlsx')

print("圖標集條件格式化已添加")

### 6.4.3 數字格式

#### 設置日期格式

In [None]:
from datetime import datetime, timedelta

# 創建一個新的工作表，命名為“數字格式”
ws_format = wb.create_sheet("數字格式")

# 在單元格A1中設置當前日期，並格式化為 年-月-日
# datetime.now() 函數返回當前的日期和時間
ws_format['A1'] = datetime.now()
# number_format 設置單元格的顯示格式為 'YYYY-MM-DD'
ws_format['A1'].number_format = 'YYYY-MM-DD'

# 在單元格A2中設置當前日期，並格式化為 日/月/年
# datetime.now() 函數返回當前的日期和時間
ws_format['A2'] = datetime.now()
# number_format 設置單元格的顯示格式為 'DD/MM/YYYY'
ws_format['A2'].number_format = 'DD/MM/YYYY'

# 在單元格A3中設置當前日期，並格式化為 'YYYY年MM月DD日'
# datetime.now() 函數返回當前的日期和時間
ws_format['A3'] = datetime.now()
# number_format 設置單元格的顯示格式為 'YYYY年MM月DD日'
ws_format['A3'].number_format = 'YYYY年MM月DD日'

wb.save('銀行交易記錄_更新.xlsx')

print("日期格式示例已添加")

#### 設置貨幣格式

In [None]:
# 設置單元格中的貨幣格式以便於讀取
# 將1234.56設置為格式為'#,##0.00'的貨幣，這種格式會顯示為'1,234.56'
ws_format['B1'] = 1234.56
ws_format['B1'].number_format = '#,##0.00'

# 將1234.56設置為格式為'¥#,##0.00'的貨幣，這種格式會顯示為'¥1,234.56'
ws_format['B2'] = 1234.56
ws_format['B2'].number_format = '¥#,##0.00'

# 將1234.56設置為格式為'$#,##0.00'的貨幣，這種格式會顯示為'$1,234.56'
ws_format['B3'] = 1234.56
ws_format['B3'].number_format = '$#,##0.00'

wb.save('銀行交易記錄_更新.xlsx')

print("貨幣格式示例已添加")

#### 設置百分比格式

In [None]:
# 將值0.1234寫入工作表的單元格C1，並將其數字格式設定為百分比格式，保留兩位小數（例如：12.34%）
ws_format['C1'] = 0.1234
ws_format['C1'].number_format = '0.00%'

# 將值0.5678寫入工作表的單元格C2，並將其數字格式設定為百分比格式，不保留小數（例如：57%）
ws_format['C2'] = 0.5678
ws_format['C2'].number_format = '0%'

wb.save('銀行交易記錄_更新.xlsx')

print("百分比格式示例已添加")

#### 自定義數字格式

In [None]:
# 將數值1234567.89設置為'D1'儲存格的內容
ws_format['D1'] = 1234567.89
# 為'D1'儲存格設置自定義的數字格式。如果數值大於1000000顯示“很大”，否則以藍色顯示，保留兩位小數。
ws_format['D1'].number_format = '[>1000000]很大;[色藍]0.00'

# 將數值123.45設置為'D2'儲存格的內容
ws_format['D2'] = 123.45
# 為'D2'儲存格設置自定義的數字格式，數值以藍色顯示，並保留兩位小數。
ws_format['D2'].number_format = '[色藍]0.00'

wb.save('銀行交易記錄_更新.xlsx')

print("自定義數字格式示例已添加")

## 6.5 圖表和圖形

### 6.5.1 創建圖表

#### 創建柱狀圖

In [None]:
import openpyxl
from openpyxl.chart import BarChart, Reference  # 從openpyxl.chart模組中匯入BarChart和Reference來創建和操作圖表

# 加載現有的Excel工作簿
wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 打開名為'月度存款統計'的工作表
ws_monthly = wb['月度存款統計']

# 創建一個柱狀圖
chart = BarChart()
chart.title = "月度存款統計"  # 設置圖表標題為"月度存款統計"
chart.y_axis.title = '存款總額'  # 設置Y軸標題為"存款總額"，這表示圖表中縱向數據的含義
chart.x_axis.title = '月份'  # 設置X軸標題為"月份"，這表示橫向數據的含義

# 選擇數據範圍
# Reference用來選取圖表的數據範圍。在此例中，數據為工作表'月度存款統計'中的第二欄，從第一行到最後一行
data = Reference(ws_monthly, min_col=2, min_row=1, max_row=ws_monthly.max_row, max_col=2)

# 選擇X軸的分類標籤範圍，即月份名稱所在的第一欄，從第二行到最後一行
cats = Reference(ws_monthly, min_col=1, min_row=2, max_row=ws_monthly.max_row)

# 將數據添加到圖表中
chart.add_data(data, titles_from_data=True)  # 將data數據添加到chart，並啟用titles_from_data以表示數據範圍的首行是標題
chart.set_categories(cats)  # 設置圖表的X軸分類標籤為cats範圍

# 將創建的圖表添加到工作表中，圖表將放置在D2單元格始處
ws_monthly.add_chart(chart, "D2")

wb.save('銀行交易記錄_更新.xlsx')
print("柱狀圖已添加到'月度存款統計'工作表中")

#### 創建折線圖

In [None]:
from openpyxl.chart import LineChart

# 創建一個新的工作表，用於展示交易趨勢
ws_trend = wb.create_sheet("交易趨勢")

# 準備數據，這裡添加了表頭
ws_trend.append(["序號", "交易金額"])
# 從已有的工作表 '銀行交易記錄' 中提取數據，並寫入到 '交易趨勢' 工作表
# 這裡取的是 column 5 的數據，即交易金額，並給每行數據加上序號
for i, row in enumerate(wb['銀行交易記錄'].iter_rows(min_row=2, max_col=5, values_only=True), 1):
    ws_trend.append([i, row[4]])

# 創建折線圖對象
line_chart = LineChart()
line_chart.title = "交易金額趨勢"  # 設置圖表標題
line_chart.y_axis.title = '交易金額'  # 設置 y 軸標題
line_chart.x_axis.title = '交易序號'  # 設置 x 軸標題

# 定義數據範圍；這裡的數據範圍是交易金額 (B 列) 的數據
data = Reference(ws_trend, min_col=2, min_row=1, max_row=101)  # 假設我們只取前100條數據
# 定義類別範圍；這裡的類別範圍是序號 (A 列) 的數據
cats = Reference(ws_trend, min_col=1, min_row=2, max_row=101)

# 將數據添加到圖表中，titles_from_data=True 表示柱狀圖的名稱從數據的第一行獲取
line_chart.add_data(data, titles_from_data=True)
line_chart.set_categories(cats)  # 設置類別範圍, 這裡是交易序號

# 將圖表添加到 '交易趨勢' 工作表中，位置在單元格 D2
ws_trend.add_chart(line_chart, "D2")

wb.save('銀行交易記錄_更新.xlsx')
print("折線圖已添加到'交易趨勢'工作表中")

#### 創建餅圖

In [None]:
from openpyxl.chart import PieChart

# 創建一個新的工作表，名為 "交易類型分佈"
ws_pie = wb.create_sheet("交易類型分佈")

# 初始化一個字典來存儲交易類型及其數量
transaction_types = {}

# 迭代 "銀行交易記錄" 工作表的每一行（除了標題行），提取交易類型並計數
for row in wb['銀行交易記錄'].iter_rows(min_row=2, max_col=5, values_only=True):
    # 第四列代表交易類型
    t_type = row[3]
    # 更新交易類型的計數
    transaction_types[t_type] = transaction_types.get(t_type, 0) + 1

# 在 "交易類型分佈" 工作表中添加表頭
ws_pie.append(["交易類型", "數量"])
# 將交易類型及其對應的數量逐行添加到工作表
for t_type, count in transaction_types.items():
    ws_pie.append([t_type, count])

# 創建餅圖
pie = PieChart()
# 設置餅圖的標題
pie.title = "交易類型分佈"

# 參考數據範圍，數據範圍是從第二列第一行到交易類型數量加1的行
data = Reference(ws_pie, min_col=2, min_row=1, max_row=len(transaction_types) + 1)
# 參考標簽範圍，標簽範圍是從第一列第二行到交易類型數量加1的行
labels = Reference(ws_pie, min_col=1, min_row=2, max_row=len(transaction_types) + 1)

# 把數據添加到圖表，並設定標題來自數據
pie.add_data(data, titles_from_data=True)
# 設置餅圖的類別標簽
pie.set_categories(labels)

# 將餅圖添加到 "交易類型分佈" 的工作表中的 D2 位置
ws_pie.add_chart(pie, "D2")

wb.save('銀行交易記錄_更新.xlsx')
print("餅圖已添加到'交易類型分佈'工作表中")

### 6.5.2 插入圖片

#### 插入本地圖片

In [None]:
# 生成需要使用的圖片，可以跳過這部份代碼
from PIL import Image, ImageDraw, ImageFont

# 設置圖片的尺寸和顏色
width, height = 200, 100
background_color = (255, 255, 255)
text_color = (0, 0, 0)

# 創建圖片對象
image = Image.new('RGB', (width, height), background_color)
draw = ImageDraw.Draw(image)

# 添加一些文字
text = "Sample"
font_size = 20

# 使用默認字體，如果可用，可以指定字體路徑
try:
    font = ImageFont.truetype("arial.ttf", font_size)
except IOError:
    font = ImageFont.load_default()

text_width, text_height = draw.textsize(text, font=font)
text_x = (width - text_width) / 2
text_y = (height - text_height) / 2

draw.text((text_x, text_y), text, fill=text_color, font=font)

# 保存圖片到文件
image.save('example_image.png')

In [None]:
from openpyxl.drawing.image import Image

# 創建一個新的工作表，用於插入圖片。我們將這個工作表命名為“圖片示例”
ws_image = wb.create_sheet("圖片示例")

# 插入本地圖片文件。第一步是加載圖片。請確保您提供的圖片文件名和路徑是正確的。
# 這裡我們將加載名為 'example_image.png' 的圖片
img = Image('example_image.png')  # 請確保圖片文件存在

# 將圖片添加到工作表中的特定位置。我們將圖片插入到'A1'位置，即工作表的第一行第一列
ws_image.add_image(img, 'A1')

wb.save('銀行交易記錄_更新.xlsx')

print("圖片已插入到'圖片示例'工作表中")

#### 調整圖片大小和位置

In [None]:
# 重新調整並設定圖片的尺寸
img.width = 300  # 將圖片的寬度設置為300像素
img.height = 200  # 將圖片的高度設置為200像素

# 確認再次將圖片添加到工作表中的指定位置
ws_image.add_image(img, 'B5')  # 將圖片添加到工作表ws_image中的B5單元格位置

wb.save('銀行交易記錄_更新.xlsx')
print("圖片大小和位置已調整")

## 6.6 數據驗證和保護

### 6.6.1 數據驗證

#### 設置下拉列表

In [None]:
import openpyxl
from openpyxl.worksheet.datavalidation import DataValidation

wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 在工作簿中創建一個新的工作表，用於數據驗證
ws_validation = wb.create_sheet("數據驗證")

# 創建一個包含交易類型的下拉列表
transaction_types = ["存款", "取款", "轉賬"]
# 使用DataValidation類來設定下拉列表，type設為"list"並指定選項來源
dv = DataValidation(type="list", formula1=f'"{",".join(transaction_types)}"', allow_blank=True)

# 設置當輸入無效數據時顯示的錯誤訊息
dv.error = '您的輸入不正確'  # 錯誤訊息內容
dv.errorTitle = '無效的交易類型'  # 錯誤訊息標題
dv.showErrorMessage = True  # 啟用錯誤訊息顯示
dv.errorStyle = 'stop'  # 錯誤類型設為"停止"，防止輸入無效數據

# 設置輸入提示，當選擇此單元格時會顯示提示訊息
dv.prompt = '請選擇交易類型'  # 輸入提示內容
dv.promptTitle = '交易類型'  # 輸入提示標題

# 將數據驗證規則應用到工作表的特定範圍
ws_validation.add_data_validation(dv)
dv.add('A1:A10')  # 將數據驗證應用到A1到A10範圍

# 為示例添加一些基本的數據
ws_validation['A1'] = "交易類型"  # 第一行作為標題
for i in range(2, 11):
    ws_validation.cell(row=i, column=1).value = "請選擇"  # 將每個單元格預設為"請選擇"

wb.save('銀行交易記錄_更新.xlsx')
print("下拉列表驗證已添加到'數據驗證'工作表中")

#### 設置數字範圍驗證

In [None]:
# 創建數字範圍驗證
# 此部分代碼負責創建和配置一個針對特定單元格範圍的數値驗證，確保用戶輸入的數值在100到10000之間。
number_validation = DataValidation(type="whole", operator="between", formula1=100, formula2=10000)
# 設定當用戶輸入無效數據時顯示的錯誤信息和標題
number_validation.error = "請輸入100到10000之間的整數"  # 錯誤提示信息
number_validation.errorTitle = "數值超出範圍"  # 錯誤標題

# 設定在輸入無效數據時顯示錯誤信息並強制停止輸入
number_validation.showErrorMessage = True  # 切勿隱藏錯誤提示信息
number_validation.errorStyle = 'stop'  # 停止用戶輸入無效數據

# 將配置好的數値驗證添加到工作表中，並將其應用到指定的單元格範圍
ws_validation.add_data_validation(number_validation)
number_validation.add('B1:B10')

# 設定字段名稱及初始提示
ws_validation['B1'] = "交易金額"  # 指定B1單元格作為標題
for i in range(2, 11):
    ws_validation.cell(row=i, column=2).value = "請輸入金額"  # 為B2到B10單元格添加初始提示值

wb.save('銀行交易記錄_更新.xlsx')
print("數字範圍驗證已添加")

#### 自定義錯誤提示

In [None]:
# 修改下拉列表的錯誤提示，以便通知使用者必須選擇有效的交易類型
# 這裡我們給定一個錯誤信息，提示使用者從預設的下拉列表中選擇合法選項
dv.error = "請從下拉列表中選擇有效的交易類型"  # dv.error 設定出錯後的具體錯誤提示信息
dv.errorTitle = "無效選擇"  # dv.errorTitle 設定出錯後的錯誤提示標題

# 修改數字範圍驗證的錯誤提示，以確保交易金額處於允許範圍內
# 筆者設定了交易金額必須在100元到10000元之間，任何不在此範圍內的數字都會顯示錯誤提示
number_validation.error = "交易金額必須在100元到10000元之間"  # number_validation.error 設定錯誤信息，提示金額必須在設定範圍內
number_validation.errorTitle = "金額無效"  # number_validation.errorTitle 設定錯誤提示標題

wb.save('銀行交易記錄_更新.xlsx')
print("自定義錯誤提示已更新")

### 6.6.2 工作表保護

#### 鎖定單元格

In [None]:
from openpyxl.styles import Protection

# 建立一個新的工作表，用於設置工作表保護
ws_protection = wb.create_sheet("工作表保護")

# 鎖定A1:C1單元格（通常是表頭，用於防止用戶修改這些關鍵信息）
for col in ['A', 'B', 'C']:
    ws_protection[f'{col}1'].protection = Protection(locked=True)

# 解鎖其他單元格，以便用戶可以對交易記錄進行編輯
for row in ws_protection['A2:C10']:
    for cell in row:
        cell.protection = Protection(locked=False)

# 在工作表中添加一些示例數據，用於模擬銀行交易記錄
ws_protection['A1'] = "交易類型"  # 表頭：交易類型
ws_protection['B1'] = "交易金額"  # 表頭：交易金額
ws_protection['C1'] = "交易日期"  # 表頭：交易日期

# 添加交易記錄的示例數據，填入2到10行
for i in range(2, 11):
    ws_protection.cell(row=i, column=1).value = i-1  # 示例數據：每行的交易類型

wb.save('銀行交易記錄_更新.xlsx')
print("單元格鎖定設置已完成")

#### 設置工作表密碼保護

In [None]:
# 設置工作表保護
# 使用 set_password() 方法設置工作表的保護密碼，以防止未經授權的人員修改工作表數據。
ws_protection.protection.set_password('password123')

# 啟用工作表保護
# 將 sheet 屬性設置為 True，這將保護整個工作表，使其無法在沒有密碼的情況下被更改。
ws_protection.protection.sheet = True

wb.save('銀行交易記錄_更新.xlsx')
print("工作表保護已啟用")

## 6.7 高級技巧

### 6.7.1 合併和拆分單元格

#### 合併單元格

In [None]:
import openpyxl

wb = openpyxl.load_workbook('銀行交易記錄_更新.xlsx')

# 建立一個新的工作表用於展示高級技巧
ws_advanced = wb.create_sheet("高級技巧")

# 合併A1:C1單元格作為標題，主要目的是在表格頂部展示一個居中的標題
ws_advanced.merge_cells('A1:C1')
ws_advanced['A1'] = '銀行交易記錄摘要'

# 設置標題樣式使標題更突出，居中且加粗
from openpyxl.styles import Alignment, Font
ws_advanced['A1'].alignment = Alignment(horizontal='center', vertical='center')  # 設置文字居中對齊
ws_advanced['A1'].font = Font(size=14, bold=True)  # 設置文字大小和加粗

# 添加一些示例數據，包括日期、交易類型和金額幾列，用於測試或演示
data = [
    ['日期', '交易類型', '金額'],
    ['2023-01-01', '存款', 1000],
    ['2023-01-02', '取款', 500],
    ['2023-01-03', '轉賬', 300]
]

# 迭代示例數據並將其添加到工作表中，便於後續操作和展示
for row in data:
    ws_advanced.append(row)

wb.save('銀行交易記錄_更新.xlsx')
print("單元格合併示例已添加到'高級技巧'工作表中")

#### 拆分單元格

In [None]:
# 拆分已合併的單元格範圍 'A1:C1'。當你需要對之前合併的單元格進行操作時，例如填入不同的數據，必須先將其拆分。
ws_advanced.unmerge_cells('A1:C1')

wb.save('銀行交易記錄_更新.xlsx')
print("單元格已拆分")

### 6.7.2 凍結窗格

#### 凍結首行或首列

In [None]:
# 'freeze_panes' 是一個屬性，用於在工作表中凍結到指定的單元格，此處凍結的是A2行
# 凍結窗格的功能在處理大型數據集時特別實用，可以使第一行標題或第一列等持續可見，方便數據的查看與分析。
ws_advanced.freeze_panes = 'A2'

wb.save('銀行交易記錄_更新.xlsx')
print("首行已凍結")

#### 凍結多行或多列

In [None]:
# 凍結前兩行和A列
ws_advanced.freeze_panes = 'B3'

wb.save('銀行交易記錄_更新.xlsx')
print("前兩行和A列已凍結")

### 6.7.3 自動篩選

#### 設置自動篩選

In [None]:
# 設置範圍'A1:C5'的自動篩選
# auto_filter方法允許在工作表的指定範圍內啟用自動篩選功能。
# 這個功能可以幫助用戶快速篩選和排序大型數據集中的信息。
# 在這裡，我們將自動篩選應用於A1到C5的儲存格範圍。
ws_advanced.auto_filter.ref = 'A1:C5'

wb.save('銀行交易記錄_更新.xlsx')
print("自動篩選已添加")

#### 應用篩選條件

In [None]:
# 模擬篩選：只顯示存款交易
# 這段程式碼篩選了工作表 `ws_advanced` 中的交易記錄，只保留類型為 "存款" 的交易。
# 使用 `iter_rows` 方法從第2行開始遍歷（假設第1行是表頭），並且只返回行值（values_only=True）。
# 如果該行的第2列（交易類型）為 '存款'，則將其添加到 `filtered_data` 列表中。
filtered_data = [row for row in ws_advanced.iter_rows(min_row=2, values_only=True) if row[1] == '存款']

# 創建新的工作表來顯示篩選結果
# 這段程式碼創建了一個新的工作表，命名為 "篩選結果"，用來顯示篩選後的存款交易記錄。
ws_filtered = wb.create_sheet("篩選結果")

# 添加表頭
# 在篩選結果的工作表中添加表頭，即 "日期"、"交易類型" 和 "金額"。
ws_filtered.append(['日期', '交易類型', '金額'])

# 將篩選後的交易資料寫入新的工作表
# 這段程式碼迭代 `filtered_data` 列表，將每一行數據添加到新創建的工作表中。
for row in filtered_data:
    ws_filtered.append(row)

wb.save('銀行交易記錄_更新.xlsx')
print("篩選結果已添加到新的工作表")

### 6.7.4 樞紐分析表

#### 創建簡單的數據透視表

In [None]:
import pandas as pd
from openpyxl.utils.dataframe import dataframe_to_rows

# 將工作表數據讀取到 pandas DataFrame
# 此步驟將工作表 ws_advanced 內容讀入到 pandas DataFrame 中，
# 使得後續的資料處理變得更加容易和高效。
df = pd.DataFrame(ws_advanced.values)

# 設置 DataFrame 的列名並移除原始標題行
# 這一步驟通過將 DataFrame 的第一行設為列名來整理數據，
# 然後刪除第一行原始數據以便於進一步處理。
df.columns = df.iloc[1]  # 將第二行設為列名
df = df[2:]  # 刪除原來的標題行

# 創建數據透視表：按交易類型匯總金額
# 使用 pivot_table 方法按照“交易類型”匯總“金額”。
# 這樣可以快速地看到每種類型交易的總金額，有助於分析和決策。
pivot = df.pivot_table(values='金額', index='交易類型', aggfunc='sum')

# 將數據透視表結果寫入新的工作表
# 建立一個名為“數據透視表”的新工作表，然後將透視表的數據逐行寫入這個工作表中。
# 這樣方便在 Excel 中查看和進一步處理數據透視表的結果。
ws_pivot = wb.create_sheet("數據透視表")
for r in dataframe_to_rows(pivot, index=True, header=True):
    ws_pivot.append(r)

wb.save('銀行交易記錄_更新.xlsx')
print("數據透視表已創建")

### 6.7.5 巨集

#### 模擬簡單的巨集功能

In [None]:
def apply_formatting(worksheet):
    """
    模擬一個為整個工作表應用格式的巨集
    這個函數將會應用特定的字體、對齊方式和邊框到工作表的所有單元格。

    參數：
    worksheet (openpyxl.worksheet.worksheet.Worksheet) -- 需要被格式化的工作表
    """
    from openpyxl.styles import Font, Alignment, Border, Side

    # 定義字體樣式，這裡使用 Arial 字體，字體大小設為 11
    font = Font(name='Arial', size=11)

    # 定義對齊方式，水平與垂直方向都設置為居中
    alignment = Alignment(horizontal='center', vertical='center')

    # 定義邊框樣式，四邊都設置為細線
    border = Border(left=Side(style='thin'),
                    right=Side(style='thin'),
                    top=Side(style='thin'),
                    bottom=Side(style='thin'))

    # 遍歷工作表的每一個單元格，並應用上述定義的字體、對齊方式和邊框樣式
    for row in worksheet.iter_rows():
        for cell in row:
            cell.font = font
            cell.alignment = alignment
            cell.border = border

# 對當前的工作表應用格式化的"巨集"
apply_formatting(ws_advanced)

wb.save('銀行交易記錄_更新.xlsx')
print("格式化'巨集'已應用到'高級技巧'工作表")

## 6.8 實際應用案例

### 6.8.1 自動生成報表

In [None]:
import openpyxl
from openpyxl.styles import Font, PatternFill
from openpyxl.utils import get_column_letter
from datetime import datetime, timedelta
import random

def generate_monthly_report(year, month):
    # 創建一個新的工作簿和默認的工作表
    wb = openpyxl.Workbook()
    ws = wb.active
    ws.title = f"{year}年{month}月交易報表"

    # 設置表頭，並配置格式
    headers = ["日期", "交易類型", "交易筆數", "交易總額", "平均交易金額"]
    for col, header in enumerate(headers, start=1):
        cell = ws.cell(row=1, column=col, value=header)
        cell.font = Font(bold=True)  # 將表頭設為粗體
        cell.fill = PatternFill(start_color="DDDDDD", end_color="DDDDDD", fill_type="solid")  # 設置背景顏色

    # 模擬生成每一天，三種交易類型的數據
    transaction_types = ["存款", "取款", "轉賬"]
    start_date = datetime(year, month, 1)
    # 根據月份計算下個月的第一天來確定結束日期
    end_date = datetime(year, month + 1, 1) if month < 12 else datetime(year + 1, 1, 1)
    current_date = start_date

    row = 2
    while current_date < end_date:
        for t_type in transaction_types:
            # 隨機生成交易筆數和總額
            count = random.randint(50, 200)
            total = random.randint(10000, 100000)
            average = total / count  # 計算平均交易金額

            # 將生成的數據填入表格
            ws.cell(row=row, column=1, value=current_date.strftime("%Y-%m-%d"))
            ws.cell(row=row, column=2, value=t_type)
            ws.cell(row=row, column=3, value=count)
            ws.cell(row=row, column=4, value=total)
            ws.cell(row=row, column=5, value=average)

            row += 1
        current_date += timedelta(days=1)  # 日期遞增一天

    # 設置所有列的寬度，確保顯示完整內容
    for col in range(1, 6):
        ws.column_dimensions[get_column_letter(col)].width = 15

    # 添加總計行
    ws.cell(row=row, column=1, value="總計")
    # 使用Excel公式計算總計和平均
    ws.cell(row=row, column=3, value=f"=SUM(C2:C{row-1})")
    ws.cell(row=row, column=4, value=f"=SUM(D2:D{row-1})")
    ws.cell(row=row, column=5, value=f"=AVERAGE(E2:E{row-1})")

    for col in range(1, 6):
        ws.cell(row=row, column=col).font = Font(bold=True)  # 將總計行設為粗體

    # 設置數字格式，包括千分位分隔符和兩位小數
    for row in ws['C2:E' + str(ws.max_row)]:
        for cell in row:
            if isinstance(cell.value, (int, float)):
                cell.number_format = '#,##0.00'

    # 保存生成的Excel文件
    filename = f"銀行交易月報_{year}年{month}月.xlsx"
    wb.save(filename)
    print(f"月度報表已生成：{filename}")

# 生成2023年12月的報表
generate_monthly_report(2023, 12)

### 6.8.2 批量處理多個 Excel 文件

In [None]:
import openpyxl
import os
from datetime import datetime, timedelta
import random

def create_dummy_daily_reports(folder_path, num_days=30):
    """
    創建虛擬的每日報表生成函數, 可以生成過去指定天數的每日報表Excel文件.

    參數:
    folder_path (str): 要儲存報表的目錄路徑.
    num_days (int): 需要生成多少天的報表, 默認為30天.
    """
    # 如果指定的資料夾不存在，則創建該資料夾
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)

    # 根據指定的天數生成報表
    for i in range(num_days):
        # 計算當前報表的日期，並將其格式化為'YYYYMMDD'
        date = (datetime.now() - timedelta(days=i)).strftime('%Y%m%d')
        # 設定報表文件的檔名格式
        filename = f"日報{date}.xlsx"
        # 建立報表文件的完整路徑
        file_path = os.path.join(folder_path, filename)

        # 創建一個Excel工作簿並激活第一個工作表
        wb = openpyxl.Workbook()
        ws = wb.active

        # 填充報表內容:
        # 1. 日期（格式為'YYYY-MM-DD'）
        # 2. 任意生成的交易總筆數（範圍為50到200之間的隨機數）
        # 3. 任意生成的交易總金額（範圍為1000到10000之間的隨機浮點數，保留兩位小數）
        date_value = (datetime.now() - timedelta(days=i)).strftime('%Y-%m-%d')
        total_count = random.randint(50, 200)
        total_amount = round(random.uniform(1000, 10000), 2)

        # 儲存在工作表的指定儲存格中
        ws['A1'] = date_value
        ws['B1'] = total_count
        ws['C1'] = total_amount

        # 保存工作簿到對應的文件路徑
        wb.save(file_path)
        # 關閉工作簿釋放資源
        wb.close()
        # 打印生成報表的信息
        print(f"已生成：{filename}")

# 執行函數，創建過去30天的日報
create_dummy_daily_reports("daily_reports")

In [None]:
import openpyxl
import os
from datetime import datetime

def process_daily_reports(folder_path, output_file):
    # 建立一個新的 Excel 工作簿並獲取活動工作表
    wb_output = openpyxl.Workbook()
    ws_output = wb_output.active
    ws_output.title = "月度匯總"  # 設置表單的標題為"月度匯總"

    # 設置表頭
    headers = ["日期", "總交易筆數", "總交易金額"]
    ws_output.append(headers)  # 將表頭添加到工作表第一行

    # 遍歷目標文件夾中的所有 Excel 文件
    for filename in sorted(os.listdir(folder_path)):
        # 只處理以 "日報" 開頭且以 ".xlsx" 結尾的文件
        if filename.endswith('.xlsx') and filename.startswith('日報'):
            file_path = os.path.join(folder_path, filename)  # 獲取文件的完整路徑
            wb = openpyxl.load_workbook(file_path, data_only=True)  # 加載 Excel 文件並讀取其內容
            ws = wb.active  # 獲取活動工作表

            # 假設每個日報文件的 A1 單元格包含日期，B1 單元格包含總交易筆數，C1 單元格包含總交易金額
            date = ws['A1'].value  # 讀取日期
            total_count = ws['B1'].value  # 讀取總交易筆數
            total_amount = ws['C1'].value  # 讀取總交易金額

            # 將讀取到的數據添加到輸出工作表中
            ws_output.append([date, total_count, total_amount])

            wb.close()  # 關閉當前讀取的日報工作簿

    # 添加總計行，計算列 B 和列 C 中的數據總和
    last_row = ws_output.max_row  # 獲取有效數據的最後一行
    ws_output.cell(row=last_row + 1, column=1, value="總計")  # 設置總計行標題
    ws_output.cell(row=last_row + 1, column=2, value=f"=SUM(B2:B{last_row})")  # 計算總交易筆數之和
    ws_output.cell(row=last_row + 1, column=3, value=f"=SUM(C2:C{last_row})")  # 計算總交易金額之和

    # 儲存匯總結果到指定的輸出文件
    wb_output.save(output_file)
    print(f"月度匯總報表已生成：{output_file}")  # 在控制台輸出完成訊息

# 使用範例，將日報文件夾中的數據匯總成一個名為 "月度匯總報表.xlsx" 的文件
process_daily_reports("daily_reports", "月度匯總報表.xlsx")

### 6.8.3 數據清理和轉換

In [None]:
import openpyxl
from datetime import datetime

def create_sample_data(output_file):
    # 創建一個新的工作簿
    wb = openpyxl.Workbook()
    ws = wb.active
    ws.title = "原始交易數據"

    # 設置表頭
    headers = ["交易日期", "客戶姓名", "賬號", "交易類型", "交易金額"]
    ws.append(headers)

    # 添加樣本數據
    sample_data = [
        ["2023/01/01", "張三", "1234 5678 9012 3456", "存款", "1000.50"],
        ["2023/02/15", "李四", "2345-6789-0123-4567", "取款", "500"],
        ["03/20/2023", "王五 ", " !!!!3456****7890****1234", "轉賬", "3000.75"],
        ["2023/04/10", "趙六", "12345678901234", "借錢", "2000.00"],
        ["2023/05/05", "   孫七", "1234567890123456", "存款", "not_a_number"],
        ["2023-06-15", "周八", "1234567890123456", "轉賬", "1500"],
        ["", "吳九", "1234 5678 9012 3456", "存款", "700"],
        ["2023/08/08", "鄭十", "", "轉賬", "1200"],
        ["2023/09/09", "錢十一", "123456789012345x", "取款", "900"],
        ["Invalid Date", " 孔十二", "1234567890123456", "存款", "100"]
    ]

    # 將樣本數據逐行加入工作表中
    for row in sample_data:
        ws.append(row)

    # 將工作簿保存到指定的文件中
    wb.save(output_file)
    print(f"樣本數據已保存到：{output_file}")

create_sample_data("原始交易數據.xlsx")

In [None]:
import openpyxl
from datetime import datetime

def clean_transaction_data(input_file, output_file):
    # 加載輸入文件的工作簿和活頁
    wb = openpyxl.load_workbook(input_file)
    ws = wb.active

    # 創建新的工作簿和活頁用於保存清理後的數據
    wb_output = openpyxl.Workbook()
    ws_output = wb_output.active
    ws_output.title = "清理後的數據"

    # 設置表頭
    headers = ["交易日期", "客戶姓名", "賬號", "交易類型", "交易金額"]
    ws_output.append(headers)

    # 遍歷每一行，從第二行開始（跳過表頭）
    for row in ws.iter_rows(min_row=2, values_only=True):
        date, name, account, trans_type, amount = row

        # 清理日期格式
        if isinstance(date, str):
            try:
                date = datetime.strptime(date, "%Y/%m/%d").date()
            except ValueError:
                date = None

        # 將日期格式統一為 date 類型，避免字符串格式錯誤影響數據處理

        # 清理客戶姓名（去除多餘的空格）
        name = name.strip() if name else ""

        # 移除客戶姓名中的多餘空格，以保持數據一致性

        # 標準化賬號格式（假設應該是16位數字）
        account = ''.join(filter(str.isdigit, str(account)))
        if len(account) != 16:
            account = None

        # 將賬號轉化為僅包含數字的字符串，若長度不為16位則視為無效賬號

        # 標準化交易類型
        valid_types = ["存款", "取款", "轉賬"]
        trans_type = trans_type if trans_type in valid_types else "其他"

        # 只允許有效的交易類型，其他類型標示為"其他"，以方便後續分析

        # 確保金額是數字
        try:
            amount = float(amount)
        except (ValueError, TypeError):
            amount = 0

        # 確保交易金額是數字格式，若非數字則設為0，避免數據錯誤

        # 只有當所有字段都有效時才添加行
        if all([date, name, account, trans_type, amount]):
            ws_output.append([date, name, account, trans_type, amount])
            # 只存儲所有字段都有效的交易數據，以確保數據質量

    # 保存清理後的數據到輸出文件中
    wb_output.save(output_file)
    print(f"數據清理完成，結果保存在：{output_file}")

clean_transaction_data("原始交易數據.xlsx", "清理後的交易數據.xlsx")

## 6.9 性能優化技巧

### 使用生成器處理大型文件

In [None]:
import openpyxl

def generate_large_excel(filename, num_rows):
    # 建立一個新的工作簿
    # 使用 openpyxl.Workbook() 函式來建立一個新的 Excel 工作簿對象
    wb = openpyxl.Workbook()
    # 獲取當前活躍的工作表，通常是新工作簿中的第一個工作表
    ws = wb.active

    # 添加標題行
    # 使用 ws.append() 方法來添加標題行，標題行可以幫助我們清楚每一列所代表的意義
    ws.append(["Column1", "Column2", "Column3", "Column4"])

    # 添加大量數據行
    # 透過一個 for 迴圈來生成大量數據行，範圍是從 1 到 num_rows 加1，這樣能確保總共生成 num_rows 行數據
    for i in range(1, num_rows + 1):
        # 每行數據透過字串格式化來生成四個數據
        row_data = [f"Data{i}_1", f"Data{i}_2", f"Data{i}_3", f"Data{i}_4"]
        # 使用 ws.append() 方法將這行數據添加到工作表中
        ws.append(row_data)

    # 儲存到文件
    # 使用 wb.save() 方法將工作簿儲存為指定的文件名
    wb.save(filename)

# 生成一個包含10000行數據的Excel文件
# 調用 generate_large_excel() 函式，傳入文件名 "large_file.xlsx" 和需要生成的行數 10000，來生成目標 Excel 文件
generate_large_excel("large_file.xlsx", 10000)

In [None]:
import openpyxl

def process_large_file(filename):
    """
    處理大型 Excel 文件。

    此函式負責打開指定的 Excel 文件，並逐行處理其中的數據。整個過程將以只讀模式進行，
    以提高對大文件處理的效率，並避免大量的內存佔用。

    參數：
    filename: Excel 文件的名稱或路徑
    """
    # 用並列 `load_workbook` 方法以只讀模式打開 Excel 文件，
    # 這樣大文件可以更有效地被加載，避免大量內存佔用
    wb = openpyxl.load_workbook(filename, read_only=True)
    # 獲取當前活躍的工作表，通常是文件中的第一個工作表
    ws = wb.active

    # 使用 `iter_rows` 方法按行迭代整個工作表，並設置 `values_only=True` 以僅返回單元格的值而非單元格對象
    for row in ws.iter_rows(values_only=True):
        # 處理每一行的數據，這裡調用 `process_row` 函式將每行數據傳入進一步處理
        process_row(row)

def process_row(row):
    """
    處理單行數據。

    此函式將每行數據作為參數，並在此處進行具體業務邏輯的處理，比如數據過濾、計算或存儲等。

    參數：
    row: Excel 行數據，每個元素對應一個單元格的值
    """
    # 在這裡可以執行每行數據的具體處理邏輯，
    # 此例中僅僅是將行數據打印出來以示範
    print(row)

# 使用範例
# 調用 `process_large_file` 函式並傳入目標文件名來處理數據
process_large_file("large_file.xlsx")

### 批量讀寫數據

In [None]:
import openpyxl

def batch_write(filename, data):
    """
    批量寫入數據到Excel文件中。

    這個函數建立一個新的Excel工作簿，並在其中創建一個工作表（以只寫模式）。然後，它將提供的數據逐行寫入到這個工作表中。

    參數：
    filename (str): 要保存的Excel文件名。
    data (list): 包含要寫入Excel文件的數據的列表。每一個子列表代表一行數據。

    當有大量數據需要高效地寫入到Excel文件中時，可以使用這個函數。這個函數特別適合處理大規模數據的情況，因為它使用了openpyxl的只寫模式（write_only），這樣可以減少記憶體的使用。

    示例：
    data = [
        ["Name", "Age", "City"],
        ["Alice", 30, "New York"],
        ["Bob", 25, "London"],
        # ... 更多數據 ...
    ]
    batch_write("batch_output.xlsx", data)
    """
    wb = openpyxl.Workbook(write_only=True)
    ws = wb.create_sheet()

    # 批量寫入數據
    for row in data:
        ws.append(row)

    wb.save(filename)

### 減少樣式對象的使用

In [None]:
import openpyxl
from openpyxl.styles import Font, Alignment

def optimize_styles(filename):
    """
    優化Excel樣式應用的函數。這個函數創建一個新的Excel工作簿，並設置特定單元格的樣式。
    文件名作為參數傳入，用於保存生成的Excel文件。

    參數：
    filename: 要保存的Excel文件的名稱。
    """
    # 創建一個新的工作簿
    wb = openpyxl.Workbook()
    # 獲取活動工作表（預設為第一個工作表）
    ws = wb.active

    # 創建一個一次性的樣式對象（這樣避免每次迭代都創建新的樣式對象，提高性能）
    bold_font = Font(bold=True)  # 剛體字樣式
    centered_alignment = Alignment(horizontal='center')  # 水平居中對齊樣式

    # 在工作表中填充數據並設置樣式
    for row in range(1, 1001):
        for col in range(1, 11):
            # 獲取當前單元格對象
            cell = ws.cell(row=row, column=col)
            # 設置單元格的值
            cell.value = f"Row {row}, Col {col}"

            # 如果是第一行，設置粗體字體
            if row == 1:
                cell.font = bold_font
            # 如果是第一列，設置水平居中對齊
            if col == 1:
                cell.alignment = centered_alignment

    # 保存工作簿到指定文件名
    wb.save(filename)

# 使用示例：將設置了樣式的工作表保存為“optimized_styles.xlsx”
optimize_styles("optimized_styles.xlsx")

### 使用`cell()`方法代替索引訪問

In [None]:
import openpyxl

def fast_cell_access(filename):
    """
    這個函式用來快速地往一個新的Excel工作簿中填入數據。

    函式接收一個檔案名稱作為參數，並創建一個新的Excel工作簿和工作表。
    然後，它使用 Openpyxl 的 cell() 方法在表格的每個單元格中填入數據。

    參數：
    - filename: 儲存新Excel文件的檔案名稱

    使用時機：
    - 當你需要快速地建立和填充大量Excel數據，例如數據模擬或臨時報告。
    """
    wb = openpyxl.Workbook()  # 創建一個新的Excel工作簿
    ws = wb.active  # 獲取當前活動的工作表

    # 使用cell()方法來填充單元格
    # 這裡的雙重迴圈遍歷從第1行到第1000行，以及第1列到第10列的所有單元格
    for row in range(1, 1001):
        for col in range(1, 11):
            ws.cell(row=row, column=col, value=f"Row {row}, Col {col}")  # 填入對應的行列位置和數據

    wb.save(filename)  # 將建立好的工作簿儲存到指定的檔案名稱中

# 使用示例
fast_cell_access("fast_access.xlsx")

### 使用DataFrame進行數據處理

In [None]:
import pandas as pd

# 創建數據
# 這裡我們設置了一個名為 data 的字典，包含了四個不同的鍵（'Category', 'Product', 'Quantity', 'Price'）。
# 每一個鍵對應一個列表，其中包含了不同商品的分類、名字、數量和價格。
data = {
    'Category': ['Electronics', 'Electronics', 'Furniture', 'Furniture', 'Groceries', 'Groceries', 'Clothing', 'Clothing'],
    'Product': ['Laptop', 'Smartphone', 'Chair', 'Table', 'Apple', 'Banana', 'T-shirt', 'Jeans'],
    'Quantity': [2, 5, 10, 3, 20, 30, 15, 7],
    'Price': [800, 600, 50, 200, 1, 0.5, 10, 40]
}

# 創建 DataFrame
# 使用 pandas 的 DataFrame 類將我們之前創建的字典 'data' 轉換為數據框，用於更便捷地進行數據分析和處理。
df = pd.DataFrame(data)

# 將數據寫入 Excel 文件
# 使用 pandas 的 to_excel 函數將我們的 DataFrame 'df' 寫入一個名為 'sales_data.xlsx' 的 Excel 文件中。
# index=False 參數表示在寫入文件時不包括 DataFrame 的索引。
df.to_excel('sales_data.xlsx', index=False)

In [None]:
import openpyxl
import pandas as pd

def process_with_pandas(input_file, output_file):
    # 讀取 Excel 文件至 DataFrame
    # 使用 Pandas 讀取 input_file 中的 Excel 文件，將數據載入到 DataFrame 中以便進行後續處理
    df = pd.read_excel(input_file)

    # 在 DataFrame 中進行數據處理
    # 這裡計算每一行的 Total 欄位，Total 為 Quantity（數量）和 Price（單價）的乘積
    df['Total'] = df['Quantity'] * df['Price']

    # 根據 Category（分類）進行分組，並匯總每個分類的 Quantity 和 Total
    # 此步驟用於生成每個分類的報表數據，agg 函數是一個聚合函數，用於計算每個分類的數據總和
    df_summary = df.groupby('Category').agg({
        'Quantity': 'sum',
        'Total': 'sum'
    }).reset_index()

    # 使用 Pandas 的 ExcelWriter 來創建一個新的 Excel 文件並寫入處理後的數據
    # 這裡使用了 openpyxl 來作為引擎
    with pd.ExcelWriter(output_file, engine='openpyxl') as writer:
        # 將原始處理後的詳細數據寫入到第一個工作表中
        df.to_excel(writer, sheet_name='Detailed Data', index=False)
        # 將分類匯總數據寫入到第二個工作表中
        df_summary.to_excel(writer, sheet_name='Summary', index=False)

# 使用示例
process_with_pandas("sales_data.xlsx", "processed_sales_data.xlsx")

### 使用內存優化的數據結構

In [None]:
import openpyxl  # 用於處理 Excel 文件
import numpy as np  # 用於數據分析和處理的數學庫

def large_data_processing(filename):
    """
    大數據處理函數，將生成的隨機數據存儲到 Excel 文件中。

    filename: 輸出 Excel 文件的名稱
    """
    # 生成一個大小為10000行, 100列的隨機數據矩陣，數據範圍在0到1之間
    data = np.random.rand(10000, 100)

    # 創建一個只能寫入的工作簿以節省內存
    wb = openpyxl.Workbook(write_only=True)
    # 在工作簿中建立一個新的工作表
    ws = wb.create_sheet()

    # 將 NumPy 隨機數據矩陣逐行寫入到 Excel 工作表中
    for row in data:
        ws.append(row.tolist())

    # 將工作簿保存為指定名稱的 Excel 文件
    wb.save(filename)

# 使用示例：將生成的大數據矩陣存儲到名為 "large_data_output.xlsx" 的 Excel 文件中
large_data_processing("large_data_output.xlsx")

## 6.10 常見問題和解決方案

### 處理不同 Excel 版本的兼容性問題

In [None]:
import openpyxl

def load_compatible(filename):
    """
    使用 openpyxl 加載 Excel 文件並返回工作簿對象。
    filename: Excel 文件的名稱或路徑。
    如果成功加載，返回 openpyxl.workbook.workbook.Workbook 對象；如果失敗，返回 None。

    這個函數的目的是確保在加載來自不同來源或版本的 Excel 文件時能夠處理潛在的不兼容性問題。
    使用 data_only=True 是為了在加載工作表時只讀取此時單元格中顯示的值，而不是公式。
    """
    try:
        wb = openpyxl.load_workbook(filename, data_only=True)
        print("文件成功加載")
        return wb
    except Exception as e:
        print(f"加載文件時出錯：{e}")
        return None

# 使用示例
# 嘗試加載名為"可能不兼容的文件.xlsx"的 Excel 文件。
wb = load_compatible("可能不兼容的文件.xlsx")

### 解決內存溢出錯誤

使用生成器和read\_only模式

In [None]:
import openpyxl

def process_large_file(filename):
    """
    處理大型Excel文件。
    參數:
    filename: Excel文件的名稱和路徑。
    該函數加載指定的Excel文件並迭代每一行數據進行處理。
    """
    wb = openpyxl.load_workbook(filename, read_only=True)
    ws = wb.active

    # 逐行讀取數據，並對每一行數據進行處理
    for row in ws.iter_rows(values_only=True):
        # 針對每一行的數據進行處理
        process_row(row)

def process_row(row):
    print(row)

# 使用示例
process_large_file("large_file.xlsx")

分塊處理數據

In [None]:
import openpyxl

def chunk_processor(filename, chunk_size=1000):
    """
    這個函數用於逐塊處理大型 Excel 文件的數據。通過指定塊大小來減少記憶體使用量，避免一次性讀取大量資料。
    參數:
    filename: Excel 文件的名稱。
    chunk_size: 每次處理的數據塊大小，預設為 1000 行。
    """
    wb = openpyxl.load_workbook(filename, read_only=True)
    ws = wb.active

    chunk = []
    for row in ws.iter_rows(values_only=True):
        chunk.append(row)
        if len(chunk) == chunk_size:
            process_chunk(chunk)
            chunk = []

    # 處理剩餘的數據
    if chunk:
        process_chunk(chunk)

def process_chunk(chunk):
    """
    這個函數用於處理每一塊的數據。可以根據需要在內部撰寫具體的數據處理邏輯。
    參數:
    chunk: 將被處理的數據塊，包含多行數據。
    當 `chunk_processor` 讀取到指定數量的行後，會自動調用 `process_chunk` 進行處理。
    """
    # 在這裡處理一組數據
    print(f"處理了 {len(chunk)} 行數據")

# 使用示例
chunk_processor("large_file.xlsx")

### 處理公式計算錯誤

In [None]:
import openpyxl

def create_example_excel(filename):
    # 創建一個新的工作簿（Workbook）
    wb = openpyxl.Workbook()

    # 獲取默認的活動工作表（Worksheet）並將其命名為"Sheet1"
    ws = wb.active
    ws.title = "Sheet1"

    # 定義一個要填入工作表的數據列表。該列表中的每個元素是一個元組，
    # 每個元組包含3個值：前兩個是數字，第三個是Excel公式
    data = [
        (1, 2, "=A1+B1"),  # 第三個元素"=A1+B1"是對應行的Excel公式，計算前兩項的和
        (3, 4, "=A2+B2"),  # 這些公式將會在Excel文件中自動更新
        (5, 6, "=A3+B3"),
        (10, 20, "=A4+B4"),
    ]

    # 遍歷data列表，將每個元組（行）添加到工作表中
    for row in data:
        ws.append(row)

    # 保存包含數據和公式的工作簿到指定的文件中
    wb.save(filename)

# 使用函數創建一個名為'file_with_formulas.xlsx'的Excel文件
create_example_excel("file_with_formulas.xlsx")

使用`data_only=True`來加載計算後的值而不是公式

In [None]:
import openpyxl

def load_calculated_values(filename):
    # 使用openpyxl庫的load_workbook方法打開給定文件名的Excel工作簿
    # data_only=True參數確保加載後的工作簿中，單元格顯示的是公式計算後的值而不是公式本身
    wb = openpyxl.load_workbook(filename, data_only=True)

    # 獲取當前活動的工作表（通常是第一個工作表）
    ws = wb.active

    # 遍歷工作表中的每一行數據，並且僅獲取其中的值（不包含單元格的其他屬性）
    # iter_rows(values_only=True)返回的行是一個元組，每個元組包含該行中的所有單元格的值
    for row in ws.iter_rows(values_only=True):
        # 輸出每一行中的值
        print(row)

# 使用示例
# 調用load_calculated_values函數，輸入Excel文件的名稱
load_calculated_values("file_with_formulas.xlsx")

如果需要處理公式，考慮使用Python重新實現複雜的計算邏輯

In [None]:
import openpyxl

def recalculate_custom(filename):
    """
    此函數重新計算並更新指定 Excel 文件的特定單元格數值結果。
    參數:
    filename: 待處理的 Excel 文件名。
    """

    # 使用 openpyxl 加載給定的 Excel 文件
    wb = openpyxl.load_workbook(filename)
    # 獲取活動工作表
    ws = wb.active

    # 遍歷工作表的所有行 (從第二行開始) 和前三列
    for row in ws.iter_rows(min_row=2, max_col=3):
        # 假設 C 列的值是 A 列和 B 列值的和
        a_value = row[0].value  # A 列的值
        b_value = row[1].value  # B 列的值
        # 檢查 A 列和 B 列的值是否為數字類型 (整數或浮點數)
        if isinstance(a_value, (int, float)) and isinstance(b_value, (int, float)):
            # 將 C 列的值設置為 A 列和 B 列值的和
            row[2].value = a_value + b_value

    # 保存修改後的工作簿，文件名加上 "recalculated_" 前綴
    wb.save("recalculated_" + filename)

# 使用示例：處理名為 "file_with_formulas.xlsx" 的 Excel 文件
recalculate_custom("file_with_formulas.xlsx")

### 處理格式和樣式問題

盡可能使用簡單的樣式設置

In [None]:
from openpyxl.styles import Font, Alignment, Border, Side

def apply_simple_style(ws, cell_range):
    """
    套用簡單的樣式到範圍內的儲存格。
    參數：
    ws：Excel工作表對象。
    cell_range：字串，表示儲存格範圍（例如'A1:D10'）。
    """
    # 設定字體樣式：Arial字型，大小11，加粗
    font = Font(name='Arial', size=11, bold=True)

    # 設定對齊方式：水平居中，垂直居中
    alignment = Alignment(horizontal='center', vertical='center')

    # 設定邊框樣式：四邊都使用細邊框
    border = Border(left=Side(style='thin'),
                    right=Side(style='thin'),
                    top=Side(style='thin'),
                    bottom=Side(style='thin'))

    # 遍歷指定範圍內的所有儲存格，並應用上述樣式
    for row in ws[cell_range]:
        for cell in row:
            cell.font = font
            cell.alignment = alignment
            cell.border = border

# 使用示例
import openpyxl

# 創建一個新的Excel工作簿
wb = openpyxl.Workbook()
# 獲取當前活躍的工作表
ws = wb.active
# 將樣式套用到A1到D10範圍的儲存格
apply_simple_style(ws, 'A1:D10')
# 將工作簿儲存為styled_file.xlsx
wb.save('styled_file.xlsx')

對於複雜的樣式，考慮創建一個模板Excel文件，然後只更新其中的數據

In [None]:
import openpyxl
from openpyxl.styles import Font, Alignment, Border, Side

def create_formatted_template(filename):
    # 創建新的工作簿和默認工作表
    wb = openpyxl.Workbook()
    ws = wb.active

    # 設置標題數據
    headers = ["項目名稱", "日期", "進度百分比", "狀態"]
    ws.append(headers)  # 在第一行插入標題數據

    # 定義樣式，增強可讀性
    font = Font(name='Arial', size=11, bold=True)  # 設定標題字體樣式：Arial字體，11號字，加粗
    alignment = Alignment(horizontal='center', vertical='center')  # 設定對齊樣式：水平居中，垂直居中
    border = Border(left=Side(style='thin'),
                    right=Side(style='thin'),
                    top=Side(style='thin'),
                    bottom=Side(style='thin'))  # 設定邊框樣式：四周皆為細線

    # 應用樣式到標題
    for col_num, header in enumerate(headers, start=1):
        cell = ws.cell(row=1, column=col_num)
        cell.font = font  # 設定字體樣式
        cell.alignment = alignment  # 設定對齊樣式
        cell.border = border  # 設定邊框樣式

    # 預先應用樣式到第二行以後，確保未來數據更新時的格式一致
    for row in range(2, 21):  # 假設數據最多20行
        for col in range(1, len(headers) + 1):
            cell = ws.cell(row=row, column=col)
            cell.alignment = alignment  # 設定對齊樣式
            cell.border = border  # 設定邊框樣式

    # 保存模板文件
    wb.save(filename)  # 保存工作簿為指定文件名

# 使用示例
create_formatted_template("formatted_template.xlsx")

In [None]:
import openpyxl

def update_template(template_file, data, output_file):
    # 加載現有的模板文件
    wb = openpyxl.load_workbook(template_file)
    ws = wb.active

    # 根據提供的數據更新工作表，但保留格式
    for row, row_data in enumerate(data, start=2):  # 從第2行開始插入數據（第1行是標題）
        for col, value in enumerate(row_data, start=1):  # 從第1列開始插入數據
            ws.cell(row=row, column=col, value=value)  # 插入數據到對應的單元格

    # 保存更新後的工作簿到指定文件
    wb.save(output_file)

# 使用範例數據進行更新
data = [
    ["項目A", "2023-10-01", 55, "完成"],
    ["項目B", "2023-10-02", 80, "進行中"],
    ["項目C", "2023-10-03", 45, "未開始"],
    ["項目D", "2023-10-04", 70, "完成"],
    ["項目E", "2023-10-05", 60, "未開始"]
]

update_template("formatted_template.xlsx", data, "updated_report.xlsx")

### 處理日期和時間問題

使用 Python 的`datetime`模塊來標準化日期和時間處理

In [None]:
import openpyxl

# 創建一個新的Excel工作簿和默認工作表
wb = openpyxl.Workbook()
ws = wb.active

# 在A1單元格插入標題"日期"
# ws['A1'] = '日期' 將在單元格A1中輸入文字 '日期'
ws['A1'] = '日期'

# 插入示例數據到工作表中
# dates變量存儲了一些日期字符串示例
dates = [
    '2022-01-01',        # 標準的日期格式(YYYY-MM-DD)
    '1/15/2023',         # 月/日/年 格式
    'February 20, 2022', # 英文月份全稱
    '2023-03-10',        # 再次使用標準的日期格式
    '4/25/2021',         # 月/日/年 格式
    'June 5, 2023',      # 英文月份全稱
]

# 使用枚舉類型的for循環，從第二行開始逐行插入日期
# enumerate(dates, start=2) 用來獲取包含index和日期的元組，其中index從2開始
for idx, date_str in enumerate(dates, start=2):
    # 在指定的單元格(row, column)插入日期字符串
    # ws.cell(row=idx, column=1).value = date_str 將日期插入到對應行的第一列
    ws.cell(row=idx, column=1).value = date_str

# wb.save('dates_file.xlsx') 將當前工作簿保存為文件
wb.save('dates_file.xlsx')

In [None]:
import openpyxl
from datetime import datetime, date

def standardize_dates(filename):
    """
    將Excel文件中的日期標準化為YYYY-MM-DD格式。

    參數:
        filename: 需要標準化日期的Excel文件名稱。
    """

    # 加載現有的Excel文件
    wb = openpyxl.load_workbook(filename)

    # 選擇活躍的工作表
    ws = wb.active

    # 遍歷工作表中的每一行，從第二行開始，僅處理第一列的數據
    # ws.iter_rows(min_row=2, max_col=1)生成從第二行到最後一行的第一列所有行
    for row in ws.iter_rows(min_row=2, max_col=1):
        cell = row[0]  # 獲取這一行的第一個單元格

        try:
            # 嘗試按照'%Y-%m-%d'格式解析日期字符串
            # 如果解析失敗將會引發ValueError
            parsed_date = datetime.strptime(cell.value, '%Y-%m-%d')
        except ValueError:
            try:
                # 如果第一種格式解析失敗，嘗試第二種格式'%m/%d/%Y'
                parsed_date = datetime.strptime(cell.value, '%m/%d/%Y')
            except ValueError:
                try:
                    # 如果第二種格式解析失敗，嘗試第三種格式'%B %d, %Y'
                    parsed_date = datetime.strptime(cell.value, '%B %d, %Y')
                except ValueError:
                    # 如果所提供的日期格式不在預期的範圍內，拋出異常
                    raise ValueError(f"無法解析日期格式: {cell.value}")

        # 將解析後的日期轉換為標準格式'YYYY-MM-DD'
        # parsed_date.strftime('%Y-%m-%d') 將 datetime 對象格式化為字符串
        cell.value = parsed_date.strftime('%Y-%m-%d')

    # 保存文件，並在文件名之前加上'標準化_'前綴
    # wb.save 保存修改後的工作簿
    wb.save("standardized_" + filename)

# 使用示例
# 調用standardize_dates函數，並將'dates_file.xlsx'作為參數傳入
standardize_dates("dates_file.xlsx")

在寫入日期時，確保使用正確的數據類型

In [None]:
import openpyxl
from datetime import datetime

def write_dates(filename):
    # 創建一個新的 Workbook（工作簿）
    wb = openpyxl.Workbook()

    # 選擇當前工作簿的活動工作表（worksheet）
    ws = wb.active

    # 寫入當前日期和時間到單元格 A1
    # 使用 datetime.now() 函數取得當前日期和時間
    ws['A1'] = datetime.now()

    # 設定單元格 A1 的日期格式
    # 這樣顯示的日期將是 'YYYY-MM-DD' 格式
    ws['A1'].number_format = 'YYYY-MM-DD'

    # 將工作簿保存至指定的文件名
    wb.save(filename)

# 使用示例：調用 write_dates 函數並傳入生成的文件名
write_dates("dates_output.xlsx")

### 處理編碼問題

In [None]:
# 生成演示用的數據，可以跳過這部份代碼
import openpyxl

def generate_non_ascii_file(filename):
    wb = openpyxl.Workbook()
    ws = wb.active

    # 添加一些非ASCII字符的數據
    data = [
        [u"中文", u"テスト", u"Тест", u"اختبار"],
        [u"汉字", u"日本語", u"Русский", u"عربي"],
        [u"謝謝", u"ありがとう", u"Спасибо", u"شكرا"],
    ]

    for row in data:
        ws.append(row)

    wb.save(filename)

# 創建包含非ASCII字符的Excel文件
generate_non_ascii_file("non_ascii_file.xlsx")

確保使用正確的字符編碼

In [None]:
import openpyxl
import sys

def handle_encoding(filename):
    # 設置默認編碼為 UTF-8
    if hasattr(sys, 'setdefaultencoding'):
        sys.setdefaultencoding('utf-8')

    # 打開 Excel 工作簿
    wb = openpyxl.load_workbook(filename)

    # 取得當前活頁簿
    ws = wb.active

    # 迭代每一行並以只讀模式讀取值
    # values_only=True 意味著只讀取儲存格的值而非整個 Cell 物件
    for row in ws.iter_rows(values_only=True):
        print(row)

    # 保存處理過的工作簿，並在名稱前添加 "encoded_" 前綴
    wb.save("encoded_" + filename)

# 處理包含非 ASCII 字符的文件
# 函數的目的是將擁有非 ASCII 字符的 Excel 檔案以 UTF-8 編碼進行處理，並輸出每個列的值
handle_encoding("non_ascii_file.xlsx")

在處理文本時使用 Unicode

In [None]:
import openpyxl

def write_unicode(filename):
    """
    創建一個新的 Excel 文件並寫入幾種不同語言的 Unicode 字符串。
    參數:
        filename: 儲存的 Excel 檔案名。包含副檔名 .xlsx。
    """
    # 創建一個新的工作簿對象
    wb = openpyxl.Workbook()

    # 獲取當前活動的工作表
    ws = wb.active

    # 向工作表中寫入不同語言的 Unicode 字符串
    ws['A1'] = u"這是中文"     # 在單元格 A1 中寫入中文字符串
    ws['A2'] = u"これは日本語です"  # 在單元格 A2 中寫入日文字符串
    ws['A3'] = u"Это русский"    # 在單元格 A3 中寫入俄文字符串
    ws['A4'] = u"هذا عربي"      # 在單元格 A4 中寫入阿拉伯文字符串

    # 將工作簿保存到指定的文件名
    wb.save(filename)

# 使用 write_unicode 函數創建包含 Unicode 字符的新文件
write_unicode("unicode_file.xlsx")