In [8]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LinearRegression

# --- BƯỚC 1: Đọc và chuẩn bị dữ liệu ---

# Tải file dữ liệu CSV của bạn
df = pd.read_excel(r"/workspaces/Group6-Project-Python4DS-DSEB-66B/notebooks/week2/week2/Weekly_pivot_with_quarter_season.xlsx")

# --- BƯỚC 2: Tính toán các cột mới ---

# Công đoạn 1: Tạo cột Doanh thu Tổng
# Liệt kê các cột doanh thu sản phẩm
product_columns = ['Product_0979', 'Product_0993', 'Product_1157', 'Product_1159', 'Product_1938']
# Tính tổng doanh thu
df['Total_Revenue'] = df[product_columns].sum(axis=1)
# Cửa sổ cho MA
window_3 = 3  # Cửa sổ 3 tuần
window_5 = 5  # Cửa sổ 5 tuần

# Chuẩn bị biến X cho Hồi quy (chỉ cần làm 1 lần)
# Cần 2 dấu ngoặc vuông để tạo DataFrame 2D
X_lr = df[['Week_number']]

print("Bắt đầu tính toán MA và LR cho 5 sản phẩm...")

# Lặp qua từng cột sản phẩm
for product in product_columns:
    print(f"Đang xử lý: {product}")
    
    # Lấy dữ liệu y (biến phụ thuộc) cho sản phẩm hiện tại
    y = df[product]
    
    # Tính toán Trung bình trượt (MA)
    # .rolling().mean() sẽ tự động xử lý các giá trị NaN ở đầu
    df[f'{product}_MA_3'] = y.rolling(window=window_3).mean()
    df[f'{product}_MA_5'] = y.rolling(window=window_5).mean()
    
    # Tạo cột dự đoán từ mô hình LR
    df[f'{product}_LR'] = model_lr.predict(X_lr)

print("--- Hoàn tất tính toán ---")

# --- BƯỚC 3: Kiểm tra và Lưu kết quả ---

# In ra 7 dòng đầu tiên của sản phẩm đầu tiên để xem kết quả
print("\n--- Dữ liệu mẫu cho Product_0979 (7 dòng đầu) ---")
cols_to_show = ['Week_number', product_columns[0], f'{product_columns[0]}_MA_3', f'{product_columns[0]}_MA_5', f'{product_columns[0]}_LR']
print(df[cols_to_show].head(7))

# Lưu DataFrame mới (chứa tất cả các cột mới) ra file CSV
output_csv_file = 'weekly_product_analysis_ma_lr.csv'
df.to_csv(output_csv_file, index=False)
print(f"\nĐã lưu dữ liệu phân tích chi tiết vào file: {output_csv_file}")

# --- BƯỚC 4: Trực quan hóa (5 biểu đồ riêng biệt) ---

print("\n--- Bắt đầu tạo 5 biểu đồ sản phẩm ---")

# Lặp qua từng sản phẩm để vẽ biểu đồ
for product in product_columns:
    # Tạo khung hình (figure) MỚI cho mỗi biểu đồ
    plt.figure(figsize=(15, 8)) 

    # 1. Vẽ doanh thu thực tế
    plt.plot(df['Week_number'], df[product], label=f'Doanh thu {product}', color='deepskyblue', alpha=0.7, marker='o', markersize=4, linestyle='-')

    # 2. Vẽ MA 3 tuần
    plt.plot(df['Week_number'], df[f'{product}_MA_3'], label='Trung bình trượt 3 tuần (MA-3)', color='lightcoral', linestyle='--', linewidth=2.5)

    # 3. Vẽ MA 5 tuần
    plt.plot(df['Week_number'], df[f'{product}_MA_5'], label='Trung bình trượt 5 tuần (MA-5)', color='crimson', linestyle=':', linewidth=2.5)

    # --- Tùy chỉnh biểu đồ cho đẹp ---
    plt.title(f'Phân tích Doanh thu: {product}', fontsize=16)
    plt.xlabel('Tuần (Week_number)', fontsize=12)
    plt.ylabel('Doanh thu (Revenue)', fontsize=12)
    plt.legend(fontsize=11) # Hiển thị chú thích
    plt.grid(True, linestyle='--', alpha=0.6) # Bật lưới (grid) mờ
    plt.tight_layout() # Tự động căn chỉnh

    # Lưu biểu đồ ra file ảnh
    output_plot_file = f'revenue_analysis_{product}.png'
    plt.savefig(output_plot_file)
    print(f"Đã lưu biểu đồ cho {product} vào file: {output_plot_file}")

    plt.close()

print("\n--- oh yeah ---")

Bắt đầu tính toán MA và LR cho 5 sản phẩm...
Đang xử lý: Product_0979
Đang xử lý: Product_0993
Đang xử lý: Product_1157
Đang xử lý: Product_1159
Đang xử lý: Product_1938
--- Hoàn tất tính toán ---

--- Dữ liệu mẫu cho Product_0979 (7 dòng đầu) ---
   Week_number  Product_0979  Product_0979_MA_3  Product_0979_MA_5  \
0            1          4700                NaN                NaN   
1            2         11800                NaN                NaN   
2            3         16400       10966.666667                NaN   
3            4          5200       11133.333333                NaN   
4            5          8000        9866.666667             9220.0   
5            6          7000        6733.333333             9680.0   
6            7         16500       10500.000000            10620.0   

   Product_0979_LR  
0         8.214804  
1         8.264450  
2         8.314095  
3         8.363741  
4         8.413387  
5         8.463033  
6         8.512678  

Đã lưu dữ liệu phân tí