In [None]:
import pathlib
import pandas as pd

datadir = pathlib.Path.cwd().parent / "data"

pd_reservation = pd.read_parquet(datadir / "reservation.parquet")
pd_hotel_sales = pd.read_parquet(datadir / "hotel_sales.parquet")

# 9章 整形
## 9-1 縦持ちデータから横持ちデータへの変換
### Q: 横持ち変換


#### Awesome

In [None]:
pd.pivot_table(pd_reservation, index="hotel_id",
               columns="people_num", aggfunc="size")

#### Awesome

In [None]:
(
    pd_reservation
    .groupby(["hotel_id", "people_num"]).size()
    .unstack()
)

## 9-2 横持ちから縦持ちへの変換
### Q: 縦持ち変換


#### Awesome

In [None]:
pd_hotel_sales.melt(id_vars="month", var_name="hotel_type", value_name="sales")

## 9-3 スパースマトリックスへの変換
### Q: 顧客×宿泊人数ごとの予約数のスパースマトリックス作成
#### Awesome

In [None]:
from scipy.sparse import csr_matrix

# （1） 顧客・宿泊人数ごとの予約数を集計した縦持ちデータを作成
cnt_data = pd_reservation.groupby(["customer_id", "people_num"]).size()

# （2） スパースマトリックスの行／列にする列をカテゴリ型に変換
customer_id = pd.Categorical(cnt_data.index.get_level_values("customer_id"))
people_num_id = pd.Categorical(cnt_data.index.get_level_values("people_num"))

# （3） スパースマトリックス変換
csr_matrix((cnt_data, (customer_id.codes, people_num_id.codes)))