In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Tên các file CSV chứa dữ liệu GDP
file_paths = [
    'Russia_GDP_10yrs.csv',
    'India_GDP_10yrs.csv',
    'China_GDP_10yrs.csv',
    'Euro_GDP_10yrs.csv',
    'VN_GDP_10yrs.csv',
    'USA_GDP_10yrs.csv',
    'ASEAN5_GDP_10yrs.csv'
]

# Dictionary để lưu trữ dữ liệu GDP của từng quốc gia/khu vực
gdp_data = {}

# Đọc dữ liệu từ từng file CSV và tiền xử lý
for file_path in file_paths:
    try:
        df = pd.read_csv(file_path)
        country_name = df.iloc[0, 0] # Lấy tên quốc gia hoặc khu vực từ cột đầu tiên, dòng đầu tiên
        if file_path == 'Euro_GDP_10yrs.csv' or file_path == 'ASEAN5_GDP_10yrs.csv':
            country_name = df.iloc[0, 0] # For 'Country Group Name' files
        else:
            country_name = df.iloc[0, 0] # For 'Country' files

        # Lấy dữ liệu GDP từ cột 2015 đến 2024 và chuyển đổi sang số
        gdp_values = df.iloc[0, 5:15].values.tolist()
        gdp_values_numeric = []
        for val in gdp_values:
            if isinstance(val, str):
                val_cleaned = val.replace(",", "")
            else:
                val_cleaned = str(val)
            try:
                gdp_values_numeric.append(float(val_cleaned))
            except ValueError:
                gdp_values_numeric.append(None) # Handle cases where conversion fails

        gdp_data[country_name] = pd.Series(gdp_values_numeric, index=range(2015, 2025))

    except FileNotFoundError:
        print(f"Không tìm thấy file: {file_path}")
        continue
    except Exception as e:
        print(f"Lỗi khi xử lý file {file_path}: {e}")
        continue

# Tạo DataFrame từ dữ liệu GDP
gdp_df = pd.DataFrame(gdp_data)

# Tính ma trận tương quan
correlation_matrix = gdp_df.corr()

# Trực quan hóa ma trận tương quan bằng Heatmap
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f")
plt.title('Ma trận tương quan GDP giữa VN và các quốc gia/khu vực')
plt.xlabel('Quốc gia/Khu vực')
plt.ylabel('Quốc gia/Khu vực')
plt.show()