# ライブラリのインストールとインポート
コマンドプロンプトを起動してpipでopenpyxlライブラリをインストールします。

In [None]:
# pip install openpyxl
!pip install --no-deps openpyxl-3.0.10-py2.py3-none-any.whl
!pip install --no-deps et_xmlfile-1.1.0-py3-none-any.whl

Successfully installed openpyxl-*.*.* と表示されればインストールは成功です。

インストールが完了したら openpyxl をインポートします。

In [None]:
import openpyxl as op
from openpyxl import Workbook

# openpyxlの使い方
openpyxl は、Excelファイル（xlsx/xlsm/xltx/xltm）の読み書きを行うためのライブラリです。

操作を行うためには、openpyxlのメソッドでワークブックを開き、どのシート、どのセルに操作を行うのかを指定する必要があります。

エクセルマクロの記述とよく似ている為、マクロを利用した事がある方はイメージが湧くと思います。

# サンプルファイル
Excelファイルは以下のsample.xlsxを使用します。ファイルはpythonスクリプトファイルと同じフォルダに保存されているものとします。

# ワークブックを操作する
ワークブックの新規作成、既存ブックの読み込み、保存操作が可能です。

## ワークブックを新規作成
ブックを新規で作成するには wrokbook() メソッドを使用します。引数は不要です。

In [None]:
wb = Workbook()

## ワークブックを読み込む
既存のExcelファイルを読み込むには openpyxl.load_workbook() でExcelファイルのパスを指定します。

In [None]:
wb = op.load_workbook('sample.xlsx')
print(wb.sheetnames)
#['2020', '2021']

## ワークブックを保存する
ブックを保存するには save() メソッドを使用して、引数はファイルのパスを指定します。
上書き保存する場合は、読み込んだファイルと同名を指定します。

In [None]:
#上書き保存
wb.save('sample.xlsx')

#別名で保存
wb.save('sample_test.xlsx')

## ワークブックを閉じる
ブックを閉じるには close() メソッドを使用します。

In [None]:
wb.close()

# ワークシート操作
## ワークシートの取得
ワークブックオブジェクトから[シート名]でワークシートオブジェクトを取得できます。

インデックス番号を指定して取得することもできます。インデックスは左端が0になります。

In [None]:
#シート名を指定して取得
ws = wb['2020']

#先頭のシートを取得（先頭のインデックス番号は0）
ws = wb.worksheets[0]

アクティブシートを選択するには active プロパティで選択できます。

In [None]:
ws = wb.active

## ワークシート名を取得する
読み込んだワークブックのシート名を取得するには sheetnames プロパティを使用します。
結果はリストになります。

In [None]:
print(wb.sheetnames)
# ['2020', '2021']

## ワークシートを追加する
ワークシートを追加するには create_sheet() メソッドで、引数に追加するシート名と追加位置を指定します。

 ワークシートオブジェクト.create_sheet(title=追加するシート名, index=追加位置のインデックス番号)
最後尾にシートを追加する場合は位置の指定は不要です。

In [None]:
ws_2022 = wb.create_sheet(title='2022')
print(wb.sheetnames)
# ['2020', '2021', '2022']

位置を指定して追加する（第二引数で位置＝インデックスを指定）

In [None]:
ws_new = wb.create_sheet(title='Sheet_New', index=1)
print(wb.sheetnames)
# ['2020', 'Sheet_New', '2021', '2022']

インデックスは先頭が０となり、最後尾に追加する場合は引数の省略可。

## ワークシートをコピーする
ワークシートをコピーするには copy_worksheet() メソッドを使用します。引数でコピー元のワークシートを指定します。

コピーしたシート名は「元のシート名 Copy」となる。コピー先の位置の指定はできません。

 ワークシートオブジェクト.copy_worksheet(コピー元のワークシート)

In [None]:
ws_copy = wb.copy_worksheet(wb['2022'])
print(wb.sheetnames)
# ['2920', 'Sheet_New', '2021', '2022', '2022 Copy']

## ワークシートを削除する
ワークシートを削除するには remove() を使用します。引数にはコピー元のワークシートオブジェクトを指定します。複数のシートを一度に削除することはできません。

 ワークシートオブジェクト.remove(ワークシートオブジェクト)

In [None]:
wb.remove(ws_new)
print(wb.sheetnames)
# ['2020', '2021', '2022', '2022 Copy']

シート名を指定して削除したい場合は del を使用します。

 del ワークシートオブジェクト[削除するシート名]

In [None]:
del wb['2022 Copy']
print(wb.sheetnames)
# ['2020', '2021', '2022']

## 複数のワークシートを削除する
複数シートを削除するには、ブック内のシートをfor 文で一つずつ取り出して、削除したいシートのリストと照合し、マッチした場合は削除します。

In [None]:
wb.create_sheet(title='Del_Sheet1')
wb.create_sheet(title='Del_Sheet2')
print(wb.sheetnames)

del_sheets = ['Del_Sheet1', 'Del_Sheet2']
for sheetName in wb.sheetnames:
    if sheetName in del_sheets:
        del wb[sheetName]
print(wb.sheetnames)
#['2020', '2021', '2022', 'Del_Sheet1', 'Del_Sheet2']
#['2020', '2021', '2022']

## ワークシート名を変更する
ワークシート名を変更するには、ワークシートオブジェクトの title プロパティを指定します。

 ワークシートオブジェクト.title = 変更後のワークシート名

In [None]:
ws_2022.title = '2022rename'
print(wb.sheetnames)
# ['2020', '2021', '2022rename']

## ワークシートのインデックス番号を取得する
ワークシートのインデックス番号は index() メソッドで、ワークシートを引数に指定して取得します。

In [None]:
num = wb.index(ws_2022)
print(num)

num = wb.index(wb['2020'])
print(num)

# 2
# 0

# セル操作
## セル値の取得
ワークシートオブジェクトから［’A1’］のようなセル指定文字列でセルオブジェクトを取得し、属性 value でセル値を取得できます。

 ワークシートオブジェクト[セル番地]

In [None]:
ws = wb['2020']
cell = ws['B2']
print(cell.value)
#7.1

cell() メソッドで行番号(row)、列番号(column)を指定して取得することも可能です。
行番号はExcelの行番号の数字をそのまま使い、列番号はA＝1, B＝2・・・と数値に読み換えて指定します。

 ワークシートオブジェクト.cell(row = 行番号, column = 列番号)
row=, column= は省略も可能です。

In [None]:
cell = ws.cell(row=3, column=2)
print(cell.value)

cell = ws.cell(7, 4)
print(cell.value)

#8.3
#10.7

## セル値の書き込み・削除
セルに値を書き込むには、セルオブジェクトの属性 value に値を設定します。
入力した値を実際のファイルに反映させるには、ワークブックを保存する必要があります。

 ワークシートオブジェクト[セル番地].value = 値
 ワークシートオブジェクト.cell(row = 行番号, column = 列番号).value = 値
 ワークシートオブジェクト.cell(row = 行番号, column = 列番号, value = 値)

In [None]:
ws['B14'].value = 10.0
print(ws['B14'].value)

ws.cell(row=15, column=3).value = 11.0
print(ws['C15'].value)

ws.cell(row=16, column=4, value=12.0)
print(ws['D16'].value)

# 10.0
# 11.0
# 12.0

In [None]:
wb.save('sample_test.xlsx')

値に 'None' を設定することで、セル値を削除する事が出来ます。

In [None]:
ws['B14'].value = None
print(ws['B14'].value)

ws.cell(row=15, column=3).value = None
print(ws['C15'].value)

ws.cell(row=16, column=4).value = None
print(ws['D16'].value)

# None
# None
# None

In [None]:
wb.save('sample_test.xlsx')

## 数式を書き込む
数式を書き込むには、数式の文字列を指定して書き込みます。

 セルオブジェクト.value = 数式の文字列

In [None]:
c_form = ws['B14']
c_form.value = '=AVERAGE(B2:B13)'
print(c_form.value)
# =AVERAGE(B2:B13)

ワークブックを保存して開くと式が入力されて計算されている事が確認できます。

In [None]:
wb.save('sample_test.xlsx')

保存したファイルをopenpyxlで開き直して数式を入力したセルの値を取得しても、計算結果の数値を取得することはできません。これはopenpyxlが文字列をそのまま取得するようになっているためです。

In [None]:
wb_test = op.load_workbook('sample_test.xlsx')
ws_test = wb_test['2020']
c = ws_test['B14']
print(c.value)
# =AVERAGE(B2:B13)

計算結果を取得するには、一度手動でワークブックをエクセルアプリで開いて上書き保存する必要があります。その上で、openpyxlでブックを開く際に引数に data_only=True を指定することで取得できるようになります。（openpyxlに再計算させる手段は無いようです）

In [None]:
# エクセルアプリで開いて上書き保存した後に実行
wb_data = op.load_workbook('sample_test.xlsx', data_only=True)
ws_data = wb_data['2020']
c_data = ws_data['B14']
print(c_data.value)
# 16.53333333333333

## セルのアドレスを確認する
セルのアドレス（C1R1形式）は、セルオブジェクトの coordinate プロパティで取得できます。

 セルブジェクト.coordinate

In [None]:
c = ws.cell(row=4, column=1)
print(c.coordinate)
# A4

行列番号、列名はセルオブジェクトの row, column, column_letter で取得できます。

 行番号
 セルオブジェクト.row
 列番号
 セルオブジェクト.column
 列名
 セルオブジェクト.column_letter

In [None]:
# 行番号
print(c.row)

# 列番号
print(c.column)

# 列名
print(c.column_letter)

# 4
# 1
# A

# 繰り返し処理
## １シートずつ繰り返す
ワークブックオブジェクトをfor文で処理すると１シートずつ取得することができます。

In [None]:
wb = op.load_workbook('sample.xlsx')
for ws in wb:
    print(ws.title) #シート名を出力
#2020
#2021

## １行ずつ繰り返す
sample.xlsxのsheet1 A1：D13のデータを１行ずつ読み込みます。
ワークシートオブジェクトの rows プロパティでシートの行を取得し、for文でループ処理することで１行ずつ読み込めます。

以下の例では読み込んだデータを１行ずつリストに追加しています。

In [None]:
ws = wb['2020']
for row in ws.rows:
    data = []
    for cell in row:
        data.append(cell.value)
    print(data)

#['年月日', '平均気温(℃)', '最高気温(℃)', '最低気温(℃)']
#[datetime.datetime(2020, 1, 1, 0, 0), 7.1, 18.6, 0.6]
#[datetime.datetime(2020, 2, 1, 0, 0), 10, 18.2, -2.1]
#・・・・・
#[datetime.datetime(2020, 12, 1, 0, 0), 7.7, 17.2, -0.6]

読み込む範囲を指定する場合には iter_rows() メソッドを利用します。
次の例ではヘッダーを飛ばして２行目から読み込みます。

In [None]:
#2行目からセルの値を取得
for row in ws.iter_rows(min_row=2):
    data = []
    for cell in row:
        data.append(cell.value)
    print(data)

#[datetime.datetime(2020, 1, 1, 0, 0), 7.1, 18.6, 0.6]
#[datetime.datetime(2020, 2, 1, 0, 0), 8.3, 18.2, -2.1]
# ・・・・・
#[datetime.datetime(2020, 12, 1, 0, 0), 7.7, 17.2, -0.6]

以下の例では２行目から１０行目、２列目から３列目までを読み込みます。

In [None]:
#２行目から１０行目、２列目から３列目までセルの値を取得
for row in ws.iter_rows(min_row=2, max_row=10, min_col=2, max_col=3):
    data = []
    for cell in row:
        data.append(cell.value)
    print(data)

#[7.1, 18.6]
#[8.3, 18.2]
# ・・・・・
#[24.2, 35.1]

## 全ワークシートのデータを取得する
シートの繰り返し処理と１行ずつの繰り返し処理を入れ子にします。

In [None]:
for ws in wb:
    print(ws.title)
    for row in ws.rows:
        data = []
        for cell in row:
            data.append(cell.value)
        print(data)

#2020
#[datetime.datetime(2020, 1, 1, 0, 0), 7.1, 18.6, 0.6]
#[datetime.datetime(2020, 2, 1, 0, 0), 8.3, 18.2, -2.1]
# ・・・・・
#[datetime.datetime(2020, 12, 1, 0, 0), 7.7, 17.2, -0.6]
#2021
#[datetime.datetime(2021, 1, 1, 0, 0), 5.4, 18.7, -2.4]
#[datetime.datetime(2021, 2, 1, 0, 0), 8.5, 21.9, -0.5]
# ・・・・・
#[datetime.datetime(2021, 12, 1, 0, 0), 8.1, 20.3, -2.2]

openpyxlを使ってExcelファイルを処理する方法を解説しました。