# 必要なライブラリのインポート

今回のレクチャーでも、前回同様に`openpyxl`をインポートしていきましょう。

In [1]:
import openpyxl

また、今回使うためのExcelシートを先に作成しておきましょう。

In [2]:
wb = openpyxl.Workbook()
wb.active
wb.save('test.xlsx')

このtest.xlsxを使って、今回もPython×Excel超入門を始めていきたいと思います。

# STEP3 : セルの取り扱い

Excel操作を分解すると、以下のようになります。

- ファイルの操作
- シートの操作
- セルの操作

前回までのレクチャーで、ファイルの操作とシートの操作をおこなってきたので、今回はセルの操作をおこなっていきたいと思います。

Excelの醍醐味とも言える部分。頑張っていきましょう！

## セルを指定する

セルを操作するには、先にExcelシートを選ぶ必要があります。シート一覧を確認してみましょう。

In [None]:
# シート一覧を確認する
print(wb.sheetnames)

シート名一覧を確認すると、`Sheet`の一枚になっているかと思います。

普通にExcelファイルを新規作成すると`Sheet1`ですが、PythonでExcelシートを作成する場合、必ず`Sheet`という名前になっていましたね。

<br>

ここまで確認できたら、実際に編集していくシートを選択していきましょう。

In [None]:
# 編集するシートを選択
ws = wb['Sheet']

以下のように書くと、選択したシートも確認できます。

In [None]:
# シートのタイトルを取得する
ws.title

### 1つのセルを指定する

Excelシートの操作と同様に、セルを編集するためには、「**セルを選択すること**」から始める必要があります。

なのでまずは、Excelシート内に入っている1つのシートを選択してみましょう。

Excelシートに含まれているシートを選択する方法は、複数あります。

In [None]:
# (1, 1)のセルを取得する
cell1 = ws['A1']
cell1

In [None]:
# 番号指定
cell2 = ws.cell(row=1, column=1)
cell2

In [None]:
# row, columnsは省略可能
cell3 = ws.cell(1, 1)
cell3

上記のとおりです。

このようにセルを選択してあげると、後からセルの値を参照したり、セルの値を変更したりできます。

<br>

実際に、すべての結果が一致しているのか確認してみましょう。

In [None]:
# すべてのセルが一致しているか確認する
cell1 == cell2 == cell3

こちらのように、すべて結果が一致していますね。

1つのセルを指定する方法は、全部で3つということになります。


```
1.  セルのアドレスを指定する : ws['A1']
2.  セルの番号を指定する : ws.cell(row=1, column=1)
3.  セルの番号を指定する : ws.cell(1, 1)
```

以上です。

2と3に関しては、実質的に同じ方法になります。

ただ省略すると分かりづらい部分が出てきますので、慣れるまではrowとcolumnを書いてあげることをおすすめします。

### 複数のセルを指定する

1つのセルだけでなく、複数のセルを指定する方法も見ていきましょう。


In [None]:
# A1〜B3を選択
range1 = ws['A1:B3']

# 以下のように書いてもOK!
range2 = ws['A1':'B3']

# 同じ結果になっているか確認
print(range1 == range2)

複数のセルを選択するには、上記のように書きます。

1つのクオーテーションにまとめてしまっても良いですし、別々で書いても大丈夫です。

<br>

Pythonからプログラミングを始めた方であれば、range2で書いた方が分かりやすいかもしれないですね。

<br>

それでは、実際に選択したセルを見てみます。

In [None]:
# 中身を確認
range1

こちらのように、A1〜B3を選択できていますね。

そして、中身をよく見てみると、`()`で格納されています。

要するに、これは"タプルの形になっている"ということです。

<br>

なので、以下のように書いてあげると、行を選択できるようになりますね。



In [None]:
# インデックス指定で、1行目を取得する
range1[0]

また、タプルになっているということは、for文を使って取り出せますので、以下のように取得したセルを確認できます。

In [None]:
# for文を使って、取得したセルを確認する
for row in range1:
    for cell in row:
        print(cell)

上記のとおりです。

少しコードを書き加えて、もう少し見やすい形で出力してあげましょう。

In [None]:
# リストを使うことで分かりやすい形にする
for row in range1:
    format_l = []
    for cell in row:
        format_l.append(cell.coordinate)
    print(format_l)

こうすると、Excelのセルと同じ形式でみることができますね。

### 演習A

先ほど作成した、選択したシートを見やすくするコードを関数化しておきましょう。

*※関数化する目的は、いつでも分かりやすい形で閲覧できるようにするためです。*

In [None]:
# 関数を使って、いつでも分かりやすい形で閲覧できるようにする
def show_formated_cell(range_):
    for row in range_:
        format_l = []
        for cell in row:
            format_l.append(cell.coordinate)
        print(format_l)

In [None]:
show_formated_cell(range1)

<hr>
上記までがsection5です！参考のため、コードを残しておきます！
<hr>

## Section6

### 制限付きで複数のセルを指定する

Excelを使っていると、ヘッダーやインデックスを飛ばして、表の中身だけ読み込みたいときがあります。

例えば、映画館の来場者数と売り上げを管理するExcelファイルがあったとしましょう。

*※以下のコードは実行するだけで大丈夫です。Pandasについては、他の動画で解説していきます。*

In [3]:
import pandas as pd

pd.DataFrame({
    '来客者数': [200, 300, 400, 200, 400], 
    '売上(万円)': [32, 34, 50, 22, 30]
})

Unnamed: 0,来客者数,売上(万円)
0,200,32
1,300,34
2,400,50
3,200,22
4,400,30


この場合だと、一番左の列や、"来客者数"とか"売上"といった文字を取り除いて、数値の部分だけ読み込みたいってことになりますね。

このように、Pythonを使って数値データだけを取得する方法を学習していきます。

<br>

まずは今までどおり、使用するワークシートを選択することから始めます。(ワークシートを選択しないと、セルの編集ができないからですね...！)

In [4]:
# シート一覧を確認する
print(wb.sheetnames)

# 編集するシートを選択
ws = wb['Sheet']

['Sheet']


次に、今までどおりに複数のセルを選択するコードを書いてみましょう。

今回は、先ほど例に挙げた映画館の売り上げシートに倣って、A1〜C6までを選択するようにしたいと思います。

In [9]:
# range1にA1〜C6のセルを指定して格納する
range1 = ws['A1':'C6']

前回の演習で作成した関数の中に、この`range1`を入れてあげたいと思います。

In [11]:
# 関数を使って、いつでも分かりやすい形で閲覧できるようにする
def show_formated_cell(range_):
    for row in range_:
        format_l = []
        for cell in row:
            format_l.append(cell.coordinate)
        print(format_l)

In [12]:
show_formated_cell(range1)

['A1', 'B1', 'C1']
['A2', 'B2', 'C2']
['A3', 'B3', 'C3']
['A4', 'B4', 'C4']
['A5', 'B5', 'C5']
['A6', 'B6', 'C6']


関数を作成しておくと、同じコードを書かなくて良いのでラクですね。

<br>

このとき、ヘッダー部分(=1行目)をスキップして読み込むには、以下のように書いてあげます。

In [15]:
# ヘッダー(1行目)を飛ばして読み込みする
for row in ws.iter_rows(min_row=2):
    format_l = []
    for cell in row:
        format_l.append(cell.coordinate)
    print(format_l)

['A2', 'B2', 'C2']
['A3', 'B3', 'C3']
['A4', 'B4', 'C4']
['A5', 'B5', 'C5']
['A6', 'B6', 'C6']


上記のように書くと、ヘッダー部分(=1行目)を削除して情報を取得できるようになります。

これは`min_row=2`で2行目から選択するように指定しているからです。

<br>

さらに、行のスキップだけでなく、列のスキップも可能です。

In [17]:
# ヘッダー(1行目)とインデックス(1列目)を飛ばして読み込む場合
for row in ws.iter_rows(min_row=2, min_col=2):
    format_l = []
    for cell in row:
        format_l.append(cell.coordinate)
    print(format_l)

['B2', 'C2']
['B3', 'C3']
['B4', 'C4']
['B5', 'C5']
['B6', 'C6']


上記のように書いてあげると、映画館の表から数値の部分だけ取り出せるようになりますね。

In [20]:
pd.DataFrame({
    '来客者数': [200, 300, 400, 200, 400], 
    '売上(万円)': [32, 34, 50, 22, 30]
})

Unnamed: 0,来客者数,売上(万円)
0,200,32
1,300,34
2,400,50
3,200,22
4,400,30


### 演習B

自分で指定した(行, 列)番号から読み込みできるような関数を作成しましょう。

*※前の演習で取り組んだ内容と、ほぼ同じ実装です。でも、こちらの関数の方が柔軟性が高くなり、使いやすくなるので重要な内容になります。*

In [21]:
# 関数を使って、いつでも分かりやすい形で閲覧できるようにする
def show_formated_cell(ws, min_row=1, min_col=1):
    for row in ws.iter_rows(min_row=min_row, min_col=min_col):
        format_l = []
        for cell in row:
            format_l.append(cell.coordinate)
        print(format_l)

In [25]:
# 何も指定しなければ、普通に読み込める
# show_formated_cell(ws)

# (2, 2にすれば、ヘッダーとインデックスを飛ばして読み込みできる)
show_formated_cell(ws, 2, 2)

['B2', 'C2']
['B3', 'C3']
['B4', 'C4']
['B5', 'C5']
['B6', 'C6']


### 行単位でセルを指定する

行単位でセルを指定するには、以下のように書いてあげます。

In [26]:
# 1行目を取得する(0ではなく、1からスタート)
row1 = ws[1]

少し紛らわしいですが、行を選択するには0からではなく1からスタートです。

実際に中身を見てみましょう。

In [27]:
row1

(<Cell 'Sheet'.A1>, <Cell 'Sheet'.B1>, <Cell 'Sheet'.C1>)

すると、上記のようになります。

よく見ると、こちらのタプルの形になっていますので、以下のように書いてあげるとA1だけ取得できるようになります。

In [28]:
row1[0]

<Cell 'Sheet'.A1>

上記のとおりです。

行単位でデータを追加したいときには、こちらを使うのが良いですね。

## セルの場所を確認する

セルに付属しているメソッドを使うことで、いま選択しているセルを確認できます。

まずは、セルを準備してあげましょう。

In [29]:
# (1, 1)要素を格納
cell1 = ws.cell(row=1, column=1)
cell1

<Cell 'Sheet'.A1>

このセルに対して、以下のようなメソッドを使ってあげると、目的に応じたセルの場所を確認できます。

In [30]:
# アドレスを確認する
print('coordinate: ', cell1.coordinate)

# 行番号を確認する
print('row number: ', cell1.row)

# 列番号を確認する
print('column number: ', cell1.column)

# 列のアルファベット部分を取得する
print('alphabet: ', cell1.column_letter)

coordinate:  A1
row number:  1
column number:  1
alphabet:  A


上記のように、セルの確認方法は多種多様です。

目的に応じて使い分けましょう。

<br>

ここまでで、セルの指定方法は以上になります。

次回は、Excel自動操作の醍醐味とも言える以下のことを紹介していきます。

- セルに数値を書き込む
- Excelの数式をPythonで扱う
- セルの書式設定をPythonで変更する
- 文字を書いた場合には、フォントの書式を変更する

ここまでできるようになると、あとは今までの組み合わせで簡単にExcelを操作できるようになります。

最後まで頑張っていきましょう！