In [13]:
import pandas as pd

In [14]:
# Đọc dữ liệu đã merge
df = pd.read_csv('complete_coffee_shop_data.csv')
# Chuyển order_time sang datetime
df['order_time'] = pd.to_datetime(df['order_time'])
df['order_hour'] = df['order_time'].dt.hour
df['order_date'] = df['order_time'].dt.date

Pivot doanh thu theo giờ x loại sản phẩm

In [15]:
pivot_revenue = pd.pivot_table(
    df,
    values='revenue',
    index='order_hour',
    columns='product_name',
    aggfunc='sum',
    fill_value=0
)
print(pivot_revenue)
print(f"\nKích thước: {pivot_revenue.shape}")

product_name  Bac  Xiu  Ca Phe Den  Ca Phe Sua  Matcha Latte  Sinh To Xoai  \
order_hour                                                                   
0.0                0.0         0.0         0.0           0.0           0.0   
1.0                0.0         0.0         0.0      140000.0           0.0   
2.0           140000.0         0.0         0.0           0.0           0.0   
3.0                0.0     45000.0         0.0           0.0           0.0   
4.0                0.0    135000.0     35000.0      105000.0           0.0   
5.0            35000.0         0.0    105000.0           0.0          60.0   
6.0            70000.0     90000.0    105000.0       35000.0          90.0   
7.0           105000.0         0.0         0.0           0.0           0.0   
8.0                0.0         0.0    105000.0           0.0           0.0   
9.0                0.0     90000.0         0.0           0.0           0.0   
10.0               0.0         0.0    140000.0      105000.0    

Pivot lợi nhuận theo ngày x món

In [16]:
pivot_profit = pd.pivot_table(
    df,
    values='profit',
    index='order_date',
    columns='product_name',
    aggfunc='sum',
    fill_value=0
)
print(pivot_profit)
print(f"\nKích thước: {pivot_profit.shape}")

product_name  Bac  Xiu  Ca Phe Den  Ca Phe Sua  Matcha Latte  Sinh To Xoai  \
order_date                                                                   
2024-01-01    629784.0    481000.0    500000.0      312000.0     -179640.0   

product_name   Tra Dao  
order_date              
2024-01-01    864000.0  

Kích thước: (1, 6)


Thực hiện stack/unstack trên bảng pivot

In [17]:
# Unstack
unstacked = pivot_revenue.unstack().reset_index()
unstacked.columns = ['product_name', 'hour', 'revenue']
print(unstacked.head(10))
# Stack
restacked = unstacked.set_index(['hour', 'product_name'])['revenue'].unstack()
print(restacked)

  product_name  hour   revenue
0     Bac  Xiu   0.0       0.0
1     Bac  Xiu   1.0       0.0
2     Bac  Xiu   2.0  140000.0
3     Bac  Xiu   3.0       0.0
4     Bac  Xiu   4.0       0.0
5     Bac  Xiu   5.0   35000.0
6     Bac  Xiu   6.0   70000.0
7     Bac  Xiu   7.0  105000.0
8     Bac  Xiu   8.0       0.0
9     Bac  Xiu   9.0       0.0
product_name  Bac  Xiu  Ca Phe Den  Ca Phe Sua  Matcha Latte  Sinh To Xoai  \
hour                                                                         
0.0                0.0         0.0         0.0           0.0           0.0   
1.0                0.0         0.0         0.0      140000.0           0.0   
2.0           140000.0         0.0         0.0           0.0           0.0   
3.0                0.0     45000.0         0.0           0.0           0.0   
4.0                0.0    135000.0     35000.0      105000.0           0.0   
5.0            35000.0         0.0    105000.0           0.0          60.0   
6.0            70000.0     90000.0 

Nhận xét món/khung giờ mang lại doanh thu cao nhất

In [18]:
# Tổng doanh thu theo giờ
hour_total = pivot_revenue.sum(axis=1)
top_hour = hour_total.idxmax()
top_hour_revenue = hour_total.max()
print(f"Giờ có doanh thu cao nhất: {top_hour}:00")
print(f"Doanh thu: {top_hour_revenue:,.0f}")
# Tổng doanh thu theo món
product_total = pivot_revenue.sum()
top_product = product_total.idxmax()
top_product_revenue = product_total.max()
print(f"\nMón có doanh thu cao nhất: {top_product}")
print(f"Doanh thu: {top_product_revenue:,.0f}")
# Combo giờ-món có doanh thu cao nhất
max_revenue = pivot_revenue.max().max()
max_location = pivot_revenue.stack().idxmax()
print(f"\nCombo giờ-món có doanh thu cao nhất:")
print(f"Giờ: {max_location[0]}:00")
print(f"Món: {max_location[1]}")
print(f"Doanh thu: {max_revenue:,.0f}")

Giờ có doanh thu cao nhất: 6.0:00
Doanh thu: 435,090

Món có doanh thu cao nhất: Tra Dao
Doanh thu: 1,080,000

Combo giờ-món có doanh thu cao nhất:
Giờ: 1.0:00
Món: Matcha Latte
Doanh thu: 140,000
