# 初期設定

## ライブラリ

* openpyxl
    * エクセルの読み書きができる
    * 既存のExcelファイルの書式を保ったまま編集・追記したい場合に便利
* pandas.read_excel()
    * pandasでエクセルをpandas.DataFrameとして読み込む
* xlrd/xlwt
    * エクセルの読み/書きができる
    * xlrdはpandas.read_excel()の内部で使われている

## インストール

pandas.read_excel()はpandasがインストールされていれば使えるので略

```
pip install openpyxl xlrd xlwt
```

# openpyxl

+ pandasは使ってない

### 基本

In [13]:
import openpyxl as excel

# 新規のワークブック作成
wb = excel.Workbook()

# アクティブなワークシートを得る
ws = wb.active

# A1セルに値を代入
ws["A1"] = "こんにちは"

# 2行2列目に値を代入
ws.cell(column=2, row=2, value="さようなら")

# ファイルを保存
wb.save("excel/hello.xlsx")

### エクセルファイルの読み込み

* load_workbook
    * data_only : 数式ではなく値のみ取り出す

In [1]:
import openpyxl as excel

# エクセルの読み込み
wb = excel.load_workbook("excel/hello.xlsx", data_only=True)

# シートを選択
ws = wb["Sheet"]

# 値の参照
print(ws["A1"].value)

# 任意の範囲を選択
list_data = ws["A1:C3"]
print(list_data)
print(list_data[1][1])
print(list_data[1][1].value)

こんにちは
((<Cell 'Sheet'.A1>, <Cell 'Sheet'.B1>, <Cell 'Sheet'.C1>), (<Cell 'Sheet'.A2>, <Cell 'Sheet'.B2>, <Cell 'Sheet'.C2>), (<Cell 'Sheet'.A3>, <Cell 'Sheet'.B3>, <Cell 'Sheet'.C3>))
<Cell 'Sheet'.B2>
さようなら


# pandasで利用

## エクセルファイルの読み込み

* sheet_name
    * None : 全シートを読み込む
    * (シート名) : (シート名)を読み込む

In [29]:
import pandas as pd
df = pd.read_excel("excel/read_excel.xlsx", sheet_name=None)
print(df)
print("--------------------------")
print(df["number"])

OrderedDict([('number',       1    2     3
0   4.0  5.0  6.00
1   7.0  8.0  9.00
2   NaN  NaN   NaN
3   1.2 -5.0  3.14
4   3.0  NaN   NaN
5  12.0  NaN   NaN), ('charactor',      a    b    c
0    d    e    f
1    g    h    i
2  NaN  NaN  NaN
3    !    ~    #
4    $    %    &), ('日本語',     おはよう
0  こんにちは
1  さようなら)])
--------------------------
      1    2     3
0   4.0  5.0  6.00
1   7.0  8.0  9.00
2   NaN  NaN   NaN
3   1.2 -5.0  3.14
4   3.0  NaN   NaN
5  12.0  NaN   NaN


In [30]:
import pandas as pd
df = pd.read_excel("excel/read_excel.xlsx", sheet_name=["number", "charactor"])
df

OrderedDict([('number',       1    2     3
              0   4.0  5.0  6.00
              1   7.0  8.0  9.00
              2   NaN  NaN   NaN
              3   1.2 -5.0  3.14
              4   3.0  NaN   NaN
              5  12.0  NaN   NaN), ('charactor',      a    b    c
              0    d    e    f
              1    g    h    i
              2  NaN  NaN  NaN
              3    !    ~    #
              4    $    %    &)])

## エクセルファイルへ書き込み

* この見た目のようにindexやcolumnは太字でエクセルに記載される
* <b>上書きした場合、他のシートの情報も含めて全て削除される</b>

In [26]:
import pandas as pd
df = pd.read_excel("excel/read_excel.xlsx", sheet_name="日本語")
df.to_excel("excel/write_excel_test.xlsx")
df

Unnamed: 0,おはよう
0,こんにちは
1,さようなら


## エクセルファイルへの書き込み(追加)

* openpyxlを利用する

In [31]:
import pandas as pd
import openpyxl as opx

# 書き込み対象ファイルのExcelWriterオブジェクトを取得
excel_writer = pd.ExcelWriter("excel/write_excel_test.xlsx", engine="openpyxl")

# 読み込み対象ファイルのシートの読み込み、ExcelWriterオブジェクト.bookに渡す
#excel_writer.book = opx.load_workbook("excel/write_excel_test.xlsx")
excel_writer.book = opx.load_workbook("excel/read_excel.xlsx")

# データフレームを追加シートに書き込む
df_add = pd.DataFrame([('apple',160),('orange',30),('kiwi',80)], columns=['name', 'price'])
df_add.to_excel(excel_writer, sheet_name="果物")
excel_writer.close()