# Lecture 9 Excelの自動化

## 複数ファイルの操作

In [None]:
# 圧縮ファイルをColab内に展開
import requests
from io import BytesIO
from zipfile import ZipFile

r = requests.get('https://github.com/shibats/tdl_python_basic/raw/main/Lecture09/ch02.zip')
zip_buffer = BytesIO(r.content)

with ZipFile(zip_buffer) as myzip:
    myzip.extractall()

In [None]:
# ライブラリをインポート
import openpyxl

In [None]:
# シートをオブジェクトとして読み込む
wb = openpyxl.load_workbook("ch02/company_data1.xlsx")
ws = wb.worksheets[0]

In [None]:
# pandasに読み込んで表示
import pandas as pd
df = pd.DataFrame(ws.values)
df  # 表示

In [None]:
# セル全体を二重のループで取り出し表示
for y, cy in enumerate(ws):
    for x, cx in enumerate(cy):
        print(x, y, cx.value)

In [None]:
# シートを追加する
ws2 = wb.create_sheet(title="Sheet2")
# ロウとカラムを増やす
ws2.insert_rows(1, ws.max_row)
ws2.insert_cols(1, ws.max_column)
# 行と列を入れ替える
for y, cy in enumerate(ws):
    for x, cx in enumerate(cy):
        ws2[x+1][y].value = cx.value


In [None]:
# 新しいファイルに保存
# wb.save("ch02/company_data_new.xlsx")

In [None]:
df2 = pd.DataFrame(ws2.values)
df2  # 表示

※ スライドに戻ります

In [None]:
# フォルダの中身を表示
%ls ch02

In [None]:
# ファイルを操作するライブラリをインポート
import pathlib
# オブジェクトを生成

path = pathlib.Path("ch02")
# フォルダ内のファイルをループで取得
for f in path.iterdir():
    print(f)

In [None]:
def swap_colrow(filename):
    # ファイル名を指定して
    # Excelシートの列と行を入れ替える
    wb = openpyxl.load_workbook(filename)
    ws = wb.worksheets[0]
    ws2 = wb.create_sheet(title="Sheet2")
    # カラムを増やす
    ws2.insert_rows(1, ws.max_row)
    ws2.insert_cols(1, ws.max_column)
    # 行と列を入れ替える
    for y, cy in enumerate(ws):
        for x, cx in enumerate(cy):
            ws2[x+1][y].value = cx.value
    # 新規ファイルに保存する
    newfn = filename.replace(".xlsx", "_new.xlsx")
    wb.save(newfn)

In [None]:
# 関数を呼び出してみる
swap_colrow("ch02/company_data4.xlsx")

In [None]:
import pandas as pd
wb = openpyxl.load_workbook("ch02/company_data4_new.xlsx")
ws = wb.worksheets[0]
df = pd.DataFrame(ws.values)
df  # 表示

In [None]:
ws = wb.worksheets[1]
df = pd.DataFrame(ws.values)
df  # 表示

In [None]:
%ls ch02

In [None]:
# ループで一気に処理
path = pathlib.Path("ch02")
# フォルダ内のファイルをループで取得
for f in path.iterdir():
    if ".xlsx" in str(f):
        swap_colrow(str(f))