In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

class Visualizer:
    '''
        Lớp trực quan hóa dữ liệu
    '''
    def __init__(self, df: pd.DataFrame):
        self.df = df

    def plot_histogram(self, column: str):
        '''
        Vẽ biểu đồ histogram cho một cột số
        '''
        if column in self.df.columns:
            plt.figure(figsize=(8, 5))
            sns.histplot(self.df[column], kde=True, bins=30, color='skyblue')
            plt.title(f'Biểu đồ phân phối: {column}')
            plt.xlabel(column)
            plt.ylabel('Tần suất')
            plt.grid(True)
            plt.tight_layout()
            plt.show()
        else:
            print(f"Cột '{column}' không tồn tại trong dữ liệu.")

    def plot_time_series(self, x: str, y: str):
        '''
        Vẽ biểu đồ dạng chuỗi thời gian (line plot)
        '''
        if x in self.df.columns and y in self.df.columns:
            plt.figure(figsize=(10, 5))
            sns.lineplot(data=self.df, x=x, y=y, marker='o')
            plt.title(f'Trend: {y} theo {x}')
            plt.xlabel(x)
            plt.ylabel(y)
            plt.grid(True)
            plt.tight_layout()
            plt.show()
        else:
            print(f"Thiếu cột '{x}' hoặc '{y}'.")

    def plot_correlation_matrix(self):
        '''
        Vẽ ma trận tương quan giữa các biến số
        '''
        plt.figure(figsize=(10, 8))
        corr = self.df.corr(numeric_only=True)
        sns.heatmap(corr, annot=True, cmap='coolwarm', fmt=".2f", square=True)
        plt.title('Ma trận tương quan')
        plt.tight_layout()
        plt.show()
