In [5]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import calendar
import ipywidgets as widgets
from ipywidgets import interact

# --- Set global Matplotlib parameters ---
plt.rcParams["font.family"] = "serif"
plt.rcParams["text.usetex"] = True
plt.rcParams["text.latex.preamble"] = r"\usepackage{amsmath}"
plt.rcParams["figure.dpi"] = 1200
plt.rcParams["font.size"] = 20
plt.rcParams["axes.labelsize"] = 20
plt.rcParams["axes.titlesize"] = 20
plt.rcParams["legend.fontsize"] = 20
plt.rcParams["xtick.direction"] = "in"
plt.rcParams["ytick.direction"] = "in"
plt.rcParams["xtick.major.size"] = 5.0
plt.rcParams["xtick.minor.size"] = 3.0
plt.rcParams["ytick.major.size"] = 5.0
plt.rcParams["ytick.minor.size"] = 3.0
plt.rcParams["axes.linewidth"] = 1.5
plt.rcParams["legend.handlelength"] = 2.0

In [10]:
# --- Load training data (Years 1 and 2) ---
train_df = pd.read_excel('./datasets/training.xlsx', sheet_name='Data')
train_df.to_csv('./datasets/training.csv', index=False)

**Hourly GHI Variation**

In [None]:
# Xác định function vẽ đồ thị tương tác
def plot_hourly_variation(month, site, year):
    # ============================================================================
# Hình ảnh tương tác: Biến động GHI hàng giờ theo tháng, năm và địa điểm
#
# Mô tả:
# Phần này cung cấp hình ảnh tương tác về biến động Độ rọi toàn cầu theo chiều ngang 
# giữa các tháng, năm và địa điểm giám sát
# khác nhau bằng ipywidgets và matplotlib.
#
# Tính năng:
# - Mỗi đường màu biểu thị hồ sơ GHI hàng giờ của một ngày.
# - Đường màu đen ("Tâm") hiển thị GHI trung bình tại mỗi giờ trong tháng.
# - Menu thả xuống cho phép lựa chọn động tháng, năm và địa điểm.
# ============================================================================

    # Filter the DataFrame for the specified year and month
    filtered_df = train_df[(train_df["Year"] == year) & (train_df["Month"] == month)]
    
    plt.figure(figsize=(10, 6))
    
    # Plot each day's hourly variation
    for day in sorted(filtered_df["Day"].unique()):
        subset = filtered_df[filtered_df["Day"] == day]
        plt.plot(subset["Hour"], subset[site],
                 alpha=0.5, linestyle="-", marker="o", lw=1.0)
    
    # Compute and plot the centroid: average GHI for each hour across all days
    centroid = filtered_df.groupby("Hour")[site].mean()
    plt.plot(centroid.index, centroid, color='black', lw=2.5, marker='D', linestyle='-', label="Centroid")
    
    plt.xlabel("Hour of the Day")
    plt.ylabel("GHI (Global Horizontal Irradiance)")
    plt.title(f"Hourly GHI Variation for {calendar.month_name[month]} (Year {year}) - {site}")
    plt.legend(loc="upper left")
    plt.show()

# Tạo tiện ích để chọn tháng (sử dụng tên tháng để rõ ràng hơn)
month_widget = widgets.Dropdown(
    options={calendar.month_name[m]: m for m in sorted(train_df["Month"].unique()) if m != 0},
    value=4,
    description="Month:",
)

# Tạo tiện ích để chọn trang web (giả sử các cột trang web chứa "GHI")
site_columns = [col for col in train_df.columns if "GHI" in col]
site_widget = widgets.Dropdown(
    options=site_columns,
    value=site_columns[0],
    description="Site:",
)

# Tạo tiện ích để chọn năm
year_widget = widgets.Dropdown(
    options=sorted(train_df["Year"].unique()),
    value=1,
    description="Year:",
)

# Sử dụng tiện ích tương tác
interact(plot_hourly_variation, month=month_widget, site=site_widget, year=year_widget);

**Hourly Temperature Variation**

- phiên bản tương tác để quan sát biến thiên nhiệt độ (Temperature) theo giờ cho từng tháng, năm, và trạm đo (site).

In [None]:
# Define the interactive plotting function
def plot_hourly_variation(month, site, year):
    # ==============================================================================
    # Hình ảnh tương tác: Biến động nhiệt độ hàng giờ theo tháng, năm và địa điểm
    #
    # Mô tả:
    # Bảng điều khiển tương tác này cho phép người dùng khám phá biến động hàng giờ
    # của nhiệt độ địa điểm (°C) qua các tháng và năm khác nhau bằng ipywidgets.
    #
    # Tính năng:
    # - Mỗi đường màu thể hiện mô hình nhiệt độ của một ngày trong tháng đã chọn.
    # - Đường màu đen ("Tâm") biểu thị nhiệt độ trung bình hàng giờ.
    # - Menu thả xuống cho phép lọc động theo tháng, năm và địa điểm.
    # #
    # Phụ thuộc:
    # Yêu cầu: matplotlib, ipywidgets, calendar, pandas
    # ==============================================================================================
    # Filter the DataFrame for the specified year and month
    filtered_df = train_df[(train_df["Year"] == year) & (train_df["Month"] == month)]
    
    plt.figure(figsize=(10, 6))
    
    # Plot each day's hourly variation
    for day in sorted(filtered_df["Day"].unique()):
        subset = filtered_df[filtered_df["Day"] == day]
        plt.plot(subset["Hour"], subset[site],
                 alpha=0.5, linestyle="-", marker="o", lw=1.0)
    
    # Compute and plot the centroid: average GHI for each hour across all days
    centroid = filtered_df.groupby("Hour")[site].mean()
    plt.plot(centroid.index, centroid, color='black', lw=2.5, marker='D', linestyle='-', label="Centroid")
    
    plt.xlabel("Hour of the Day")
    plt.ylabel("Temperature")
    plt.title(f"Hourly Temperature Variation for {calendar.month_name[month]} (Year {year}) - {site}")
    plt.legend(loc="upper left")
    plt.show()

# Create widget for month selection (using month names for clarity)
month_widget = widgets.Dropdown(
    options={calendar.month_name[m]: m for m in sorted(train_df["Month"].unique()) if m != 0},
    value=4,
    description="Month:",
)

# Create widget for site selection (assumes site columns contain "GHI")
site_columns = [col for col in train_df.columns if "Temp" in col]
site_widget = widgets.Dropdown(
    options=site_columns,
    value=site_columns[0],
    description="Site:",
)

# Create widget for year selection
year_widget = widgets.Dropdown(
    options=sorted(train_df["Year"].unique()),
    value=1,
    description="Year:",
)

# Use the interactive widget
interact(plot_hourly_variation, month=month_widget, site=site_widget, year=year_widget);

- Phiên bản tương tác chuyên nghiệp để quan sát biến thiên tải điện (Electricity Load) theo giờ, tháng và năm

In [None]:
def plot_hourly_load_variation(month, year):
    # ==============================================================================
    # Hình ảnh tương tác: Biến động phụ tải điện theo giờ theo tháng và năm
    #
    # Mô tả:
    # Biểu đồ tương tác này trực quan hóa biến động phụ tải điện theo giờ
    # cho từng tháng và năm trong tập dữ liệu bằng ipywidgets.
    #
    # Tính năng:
    # - Mỗi dòng thể hiện biểu đồ phụ tải theo giờ của một ngày trong tháng đã chọn.
    # - Đường màu đen ("Tâm") hiển thị phụ tải trung bình theo giờ của tất cả các ngày.
    # - Menu thả xuống cho phép lựa chọn tương tác theo Tháng và Năm.
    # #
    # Phụ thuộc:
    # Yêu cầu: matplotlib, ipywidgets, calendar, pandas
    # ==============================================================================================
    # Filter the DataFrame for the selected year and month
    filtered_df = train_df[(train_df["Year"] == year) & (train_df["Month"] == month)]
    
    plt.figure(figsize=(10, 6))
    
    # Plot each day's hourly electricity load variation
    for day in sorted(filtered_df["Day"].unique()):
        subset = filtered_df[filtered_df["Day"] == day]
        plt.plot(subset["Hour"], subset["Load"],
                 alpha=0.5, linestyle="-", marker="o", lw=1.0)
    
    # Compute and plot the centroid: average load for each hour across all days in the month
    centroid = filtered_df.groupby("Hour")["Load"].mean()
    plt.plot(centroid.index, centroid, color='black', lw=2.5, marker='D',
             linestyle='-', label="Centroid")
    
    plt.xlabel("Hour of the Day")
    plt.ylabel("Electricity Load")
    plt.title(f"Hourly Electricity Load Variation for {calendar.month_name[month]} (Year {year})")
    plt.legend(loc="upper left")
    plt.show()

# Create widget for month selection (displaying month names for clarity)
month_widget = widgets.Dropdown(
    options={calendar.month_name[m]: m for m in sorted(train_df["Month"].unique()) if m != 0},
    value=4,
    description="Month:",
)

# Create widget for year selection
year_widget = widgets.Dropdown(
    options=sorted(train_df["Year"].unique()),
    value=1,
    description="Year:",
)

# Use the interactive widget to update the plot
interact(plot_hourly_load_variation, month=month_widget, year=year_widget);