# Excel文書を読み込む

In [1]:
import openpyxl
wb = openpyxl.load_workbook(r".\pydata\example.xlsx")
type(wb)

openpyxl.workbook.workbook.Workbook

Excelなどの.xlsxファイルは openpyxl モジュールを使うことで扱うことができる

openpyxlモジュールには load_workbook 関数があり、ファイル名を渡すことで workbookオブジェクトを作ることができる

In [2]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['Sheet1', 'Sheet2', 'Sheet3']

In [3]:
sheet = wb.get_sheet_by_name("Sheet3")
sheet

  """Entry point for launching an IPython kernel.


<Worksheet "Sheet3">

In [4]:
type(sheet)

openpyxl.worksheet.worksheet.Worksheet

In [5]:
sheet.title

'Sheet3'

In [6]:
another_sheet = wb.active
another_sheet

<Worksheet "Sheet1">

workbookオブジェクトの get_sheet_names メソッドを呼び出すと、ワークブックに含まれるシートの名前をリストで取得できる

workbookオブジェクトの get_sheet_by_name メソッドにシート名の文字列を渡すことで worksheetオブジェクトを作ることができる

worksheetオブジェクトの title アトリビュートを呼び出すことでシートの名前を取得できる

また、workbookオブジェクトの active アトリビュートを呼び出すことでアクティブシート(現在表示中のシートまたはExcelを閉じる前の表示していたシート)の Worksheetオブジェクトを作成できる

In [7]:
sheet = wb.get_sheet_by_name("Sheet1")
sheet["A1"]

  """Entry point for launching an IPython kernel.


<Cell 'Sheet1'.A1>

In [8]:
type(sheet["A1"])

openpyxl.cell.cell.Cell

In [9]:
sheet["A1"].value

'4/5/2015 1:34:02 PM'

In [10]:
c = sheet["B1"]
c.value

'Apples'

In [11]:
c.row

1

In [12]:
c.column

2

In [13]:
c.coordinate

'B1'

In [14]:
f"行 {c.row},列 {c.column} は {c.value}"

'行 1,列 2 は Apples'

In [15]:
f"セル {c.coordinate} は {c.value}"

'セル B1 は Apples'

Worksheetオブジェクトに行と列の名前を文字列で指定することで Cellオブジェクトを作成することができる

Cellオブジェクトには value アトリビュートがあり、セルの内容が入っている

Cellオブジェクトには row column coordinate という位置情報(それぞれ行、列、位置)を持つアトリビュートがある

In [16]:
sheet.cell(1, 2)

<Cell 'Sheet1'.B1>

In [17]:
sheet.cell(row=1, column=2).value

'Apples'

In [18]:
for i in range(1, 8, 2):
    print(i, sheet.cell(row=i, column=2).value)

1 Apples
3 pears
5 Apples
7 Strawberries


Worksheetオブジェクトには cell メソッドがあり第一引数に行、第二引数に列を渡すことで簡単にCellオブジェクトを作ることができる

for文を使うことで一連のCellオブジェクトを取得できる(上ではi行目の2列目の値を表示)

In [19]:
sheet.max_row

7

In [20]:
sheet.max_column

3

Worksheetオブジェクトの max_row や max_column アトリビュートを使うことでシートのサイズを知ることができる

In [21]:
from openpyxl.utils import get_column_letter, column_index_from_string

In [22]:
get_column_letter(1)

'A'

In [23]:
get_column_letter(2)

'B'

In [24]:
get_column_letter(27)

'AA'

In [25]:
get_column_letter(900)

'AHP'

In [26]:
get_column_letter(sheet.max_column)

'C'

In [27]:
column_index_from_string("AA")

27

列(column)の番号と文字を相互互換するには、openpyxl.utils モジュールの get_column_letter と column_index_from_string メソッドを使う

get_column_letter メソッドは列の番号をアルファベットの文字に変換する

column_index_from_string メソッドはアルファベットの文字を列の番号に変換する

In [28]:
import openpyxl
wb = openpyxl.load_workbook(r".\pydata\example.xlsx")
sheet = wb.get_sheet_by_name("Sheet1")
tuple(sheet["A1": "C3"])

  This is separate from the ipykernel package so we can avoid doing imports until


((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>),
 (<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>),
 (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>))

In [29]:
for row_of_cell_objects in sheet["A1": "C3"]:
    for cell_obj in row_of_cell_objects:
        print(cell_obj.coordinate, cell_obj.value)
    print("--- END OF ROW ---")

A1 4/5/2015 1:34:02 PM
B1 Apples
C1 73
--- END OF ROW ---
A2 4/5/2015 3:41:23 AM
B2 Cherries
C2 85
--- END OF ROW ---
A3 4/6/2015 12:46:51 PM
B3 pears
C3 14
--- END OF ROW ---


Worksheetオブジェクトをスライスで指定することで矩形領域のCellオブジェクトをタプルの中のタプルにまとめることができる(セルごとのタプルを行ごとにまとめたタプル)



In [30]:
import openpyxl
wb = openpyxl.load_workbook(r".\pydata\example.xlsx")
sheet = wb.get_sheet_by_name("Sheet1")
tuple(sheet.columns)[1]

  This is separate from the ipykernel package so we can avoid doing imports until


(<Cell 'Sheet1'.B1>,
 <Cell 'Sheet1'.B2>,
 <Cell 'Sheet1'.B3>,
 <Cell 'Sheet1'.B4>,
 <Cell 'Sheet1'.B5>,
 <Cell 'Sheet1'.B6>,
 <Cell 'Sheet1'.B7>)

In [31]:
for cell_obj in tuple(sheet.columns)[1]:
    print(cell_obj.value)

Apples
Cherries
pears
Oranges
Apples
Bananas
Strawberries


In [32]:
tuple(sheet.columns)

((<Cell 'Sheet1'.A1>,
  <Cell 'Sheet1'.A2>,
  <Cell 'Sheet1'.A3>,
  <Cell 'Sheet1'.A4>,
  <Cell 'Sheet1'.A5>,
  <Cell 'Sheet1'.A6>,
  <Cell 'Sheet1'.A7>),
 (<Cell 'Sheet1'.B1>,
  <Cell 'Sheet1'.B2>,
  <Cell 'Sheet1'.B3>,
  <Cell 'Sheet1'.B4>,
  <Cell 'Sheet1'.B5>,
  <Cell 'Sheet1'.B6>,
  <Cell 'Sheet1'.B7>),
 (<Cell 'Sheet1'.C1>,
  <Cell 'Sheet1'.C2>,
  <Cell 'Sheet1'.C3>,
  <Cell 'Sheet1'.C4>,
  <Cell 'Sheet1'.C5>,
  <Cell 'Sheet1'.C6>,
  <Cell 'Sheet1'.C7>))

In [33]:
tuple(sheet.rows)

((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>),
 (<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>),
 (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>),
 (<Cell 'Sheet1'.A4>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.C4>),
 (<Cell 'Sheet1'.A5>, <Cell 'Sheet1'.B5>, <Cell 'Sheet1'.C5>),
 (<Cell 'Sheet1'.A6>, <Cell 'Sheet1'.B6>, <Cell 'Sheet1'.C6>),
 (<Cell 'Sheet1'.A7>, <Cell 'Sheet1'.B7>, <Cell 'Sheet1'.C7>))

Worksheetオブジェクトには rows アトリビュートと columns アトリビュートがあり、rowsアトリビュートは行ごとにCellオブジェクトをまとめ、columns アトリビュートは列ごとにCellオブジェクトをまとめて格納している(そのままだとジェネレーターオブジェクトなのでタプルやリストにする必要がある)

決まった列や行を取り出したいなら[ ]でインデックス値を指定すれば特定の行や列を取り出すこともできる

# Excel文書を書き出す

In [34]:
import openpyxl
wb = openpyxl.Workbook()
wb.get_sheet_names()

  This is separate from the ipykernel package so we can avoid doing imports until


['Sheet']

In [35]:
sheet = wb.active
sheet.title

'Sheet'

In [36]:
sheet.title = "Spam Bacon Eggs Sheet"

In [37]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['Spam Bacon Eggs Sheet']

openpyxl.Workbook 関数を使うと新規に空のWorkbookオブジェクトを生成する

生成後はSheetという名前のシートが一枚あるだけだが、そのWorkSheetオブジェクトの title アトリビュートに名前の文字列を与えることで変更できる

In [38]:
wb = openpyxl.load_workbook(r".\pydata\example.xlsx")
sheet = wb.active
sheet.title = "Spam Spam Spam"

In [39]:
wb.save(r".\pydata\example_copy.xlsx")

変更した内容はWorkbookオブジェクトの save メソッドを呼び出すことでスプレッドシートを保存できる

この時に元のファイルとは違う名前を渡すことで変更前のファイルを残しながら変更後のファイルを保存することができる

In [40]:
wb = openpyxl.Workbook()
wb.get_sheet_names()

  


['Sheet']

In [41]:
wb.create_sheet()

<Worksheet "Sheet1">

In [42]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['Sheet', 'Sheet1']

In [43]:
wb.create_sheet(index=0, title="First Sheet")

<Worksheet "First Sheet">

In [44]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['First Sheet', 'Sheet', 'Sheet1']

In [45]:
wb.create_sheet(index=2, title="Middle Sheet")

<Worksheet "Middle Sheet">

In [46]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['First Sheet', 'Sheet', 'Middle Sheet', 'Sheet1']

Workbookオブジェクトの create_sheet メソッドを使うことで新しいシートを追加することができる

引数を渡さないと「Sheet*」という名前のシートを末尾に追加する

引数に index を指定して値を渡すことでシートを追加する場所、title を指定して文字列を渡すことで名前を設定できる

In [47]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['First Sheet', 'Sheet', 'Middle Sheet', 'Sheet1']

In [48]:
wb.remove_sheet(wb.get_sheet_by_name("Middle Sheet"))

  """Entry point for launching an IPython kernel.
  """Entry point for launching an IPython kernel.


In [49]:
wb.remove_sheet(wb.get_sheet_by_name("Sheet1"))

  """Entry point for launching an IPython kernel.
  """Entry point for launching an IPython kernel.


In [50]:
wb.get_sheet_names()

  """Entry point for launching an IPython kernel.


['First Sheet', 'Sheet']

Workbookオブジェクトの remove_sheet メゾットに、削除したいWorksheetオブジェクトを渡すことでそのシートを削除することができる

In [51]:
wb = openpyxl.Workbook()
sheet = wb.get_sheet_by_name("Sheet")
sheet["A1"] = "Hello World!"
sheet["A1"].value

  


'Hello World!'

セルに値を書き込むにはCellオブジェクトに値を代入することでできる

# セルのフォントスタイルを設定する

In [53]:
import openpyxl
from openpyxl.styles import Font

In [54]:
wb = openpyxl.Workbook()
sheet = wb.get_sheet_by_name("Sheet")
italic24_font = Font(size=24, italic=True)
sheet["A1"].font = italic24_font
sheet["A1"] = "Hello World!"
wb.save(r".\pydata\styled.xlsx")

  


セルのフォントスタイルを変更するには openpyxl.styles モジュールから Font 関数をインポートする必要がある

まず Font 関数を使ってFontオブジェクトを作成する必要がある(上では、sizeを24でitalicを設定している)

次にCellオブジェクトのfontアトリビュートに生成したFontオブジェクトを代入することで設定できる

In [55]:
wb = openpyxl.Workbook()
sheet = wb.get_sheet_by_name("Sheet")
font_obj1 = Font(name="Times New Roman", bold=True)
sheet["A1"].font = font_obj1
sheet["A1"] = "Bold Times New Roman"
font_obj2 = Font(size=24, italic=True)
sheet["B3"].font = font_obj2
sheet["B3"] = "24 pt Italic"
wb.save(r".\pydata\styles.xlsx")

  


font関数に渡せるキーワード引数と説明

|キーワード引数|渡すデータ型|説明|
|:-|:-|:-|
|name|文字列型|"Calibri"や"Times New Roma"などのフォント名(デフォルトはClibri)|
|suze|整数型|ポイント数(デフォルトは11)|
|bold|ブール型|太字ならTrue|
|italic|ブール型|イタリックならTrue|

# 計算

In [56]:
import openpyxl
wb = openpyxl.Workbook()
sheet = wb.active
sheet["A2"] = 200
sheet["B2"] = 300
sheet["C2"] = 400
sheet["D2"] = "=SUM(A2:C2)"
wb.save(r".\pydata\writeFormula.xlsx")

Excel内の書式を使って計算するには、その書式を文字列としてセルに直接入力することでできる

上ではD2には900の数字が表示されることになる

In [57]:
wb_formulas = openpyxl.load_workbook(r".\pydata\writeFormula.xlsx")
sheet = wb_formulas.active
sheet["D2"].value

'=SUM(A2:C2)'

In [58]:
wb_data_only = openpyxl.load_workbook(r".\pydata\writeFormula.xlsx", data_only=True)
sheet = wb_data_only.active
sheet["D2"].value

計算の書式ではなく計算結果を返したい場合は、Workbookオブジェクトを生成するときにキーワード引数の data_only をTrueにすることで計算結果を表示することができるようになる

※いったんExcelを開いて上書き保存をしてからでないと表示できない

# 行と列を調整する

In [59]:
import openpyxl
wb = openpyxl.Workbook()
sheet = wb.active
sheet["A1"] = "Tall row"
sheet["B2"] = "Wide column"
sheet.row_dimensions[1].height = 70
sheet.column_dimensions["B"].width = 20
wb.save(r".\pydata\dimension.xlsx")

Worksheetオブジェクトの row_dimensions と column_dimensions はそれぞれ RowDimension と ColumnDimension オブジェクトが辞書のように複数格納されている

上ではrow_dimensionsの中から1を指定してRowDimensionオブジェクトを取り出し、heightアトリビュートを変更することで行の高さを変更できる
デフォルトの高さは12.75ポイント(1ポイント=1/72インチ)で0～409まで指定できる

column_dimensionsの中からBを指定してColumnDimensionオブジェクトを取り出し、widthアトリビュートを変更することで列の幅を変更できる
デフォルトは8.43文字(1文字=11ポイント)で0～255まで指定できる

高さか幅を0にすることで、その行か列を非表示にできる

In [60]:
wb = openpyxl.Workbook()
sheet = wb.active
sheet.merge_cells("A1:D3")
sheet["A1"] = "Twelve cells merged together."
sheet.merge_cells("C5:D5")
sheet["C5"] = "Two merged cells."
wb.save(r".\pydata\merged.xlsx")

Worksheetオブジェクトに merged_cell メソッドを使うことで矩形領域のセルを結合することができる

渡す引数は結合したい範囲の左上のセル名と右下のセル名をコロンでつないだ一つの文字列として渡すことでできる

文字を入力するときは左上のセル名に入れることで入力できる

In [61]:
wb = openpyxl.load_workbook(r".\pydata\merged.xlsx")
sheet = wb.active
sheet.unmerge_cells("A1:D3")
sheet.unmerge_cells("C5:D5")
wb.save(r".\pydata\unmerged.xlsx")

セルの結合を解除するには、Worksheetオブジェクトの unmerge_cells メソッドを使うことで解除できる

渡す引数は結合するときと同じ

In [62]:
wb = openpyxl.load_workbook(r".\pydata\produceSales.xlsx")
sheet = wb.active
sheet.freeze_panes = "A2"
wb.save(r".\pydata\freezeExample.xlsx")

ウィンドウ枠の固定をすることで画面をスクロールしても常に行や列の見出しを画面に表示し見やすくすることができる

固定するはWorksheetオブジェクトの freeze_panes アトリビュートにセルの座標を指定することができる

ただし指定したセルが固定されるわけではなく、指定したセル以前のセルがすべて固定される

ウィンドウ枠の固定の例

|freeze_panesの設定|固定される行と列|
|:-|:-|
|sheet.freeze_panes = "A2"|行1|
|sheet.freeze_panes = "B1"|列A|
|sheet.freeze_panes = "C1"|列A～列B|
|sheet.freeze_panes = "C2"|行1と列A～列B|
|sheet.freeze_panes = "A1"|固定解除|
|sheet.freeze_panes = None|固定解除|

# グラフ

In [63]:
import openpyxl
wb = openpyxl.Workbook()
sheet = wb.active
for i in range(1,11): # 適当な数字を入力
    sheet["A"+str(i+1)] = i

In [64]:
ref_obj = openpyxl.chart.Reference(sheet,min_col=1, min_row=2,max_col=1, max_row=11)
series_obj = openpyxl.chart.Series(ref_obj, title="First series")
chart_obj = openpyxl.chart.BarChart()
chart_obj.append(series_obj)
chart_obj.x = 100
chart_obj.y = 50
chart_obj.w = 300
chart_obj.h = 200
sheet.add_chart(chart_obj)
wb.save(r".\pydata\sampleChart.xlsx")

グラフを描くにはReferenceオブジェクト(領域)とSeriesオブジェクト(図の内部詳細)とChartオブジェクト(図の形と大きさ・サイズ)を生成する必要がある

Referenceオブジェクトは openpyxl.chart の Reference メソッドに、格納しているデータのあるWorksheetオブジェクトと矩形領域の示すための min_col(一番左の列),min_row(一番上の行),max_col(一番右の列),max_row(一番下の行) に整数を渡すことでできる(列はアルファベットではなく整数でAが1)

Seriesオブジェクトは open.chart の Series メソッドに、生成したReferenceオブジェクトを渡すことでできる。キーワード引数の title に文字列を渡すことでタイトルをつけることもできる

Chartオブジェクトは openpyxl.chart に作りたいグラフのメソッドを渡すことでできる(上ではBarChart 棒グラフを渡している)

そしてChartオブジェクトに append メソッドを使って Series オブジェクトを追加

Chartオブジェクトの x と y アトリビュートを変更してグラフを乗せる座標(単位はピクセル)を決めて

Chartオブジェクトの w と h アトリビュートを変更してグラフのサイズ(単位はピクセル)を決める

最後にWorksheetオブジェクトの add_chart メソッドに生成したChartオブジェクトを渡すことでグラフを乗せることができる

グラフの種類と呼ぶメソッド

|グラフの種類|呼ぶメソッド名|
|:-|:-|
|棒グラフ|openpyxl.chart.BarChart()|
|折れ線グラフ|openpyxl.chart.LineChart()|
|散布図|openpyxl.chart.ScattetChart()|
|円グラフ|openpyxl.chart.PieChart()|