In [5]:
import numpy as np
#1.HÀM ĐỌC FILE CSV
def doc_du_lieu(duong_dan):
    du_lieu = np.genfromtxt(duong_dan, delimiter=",", dtype=str, skip_header=1)
    thang = du_lieu[:, 0]                 # cột tháng (chuỗi)
    gia = du_lieu[:, 1].astype(float)     # cột giá (float)
    return thang, gia

#2.HÀM XỬ LÝ CHO TỪNG THÀNH PHỐ
def xu_ly_thanh_pho(ten, thang, gia):

    print(f"\n===== {ten.upper()} =====")

    #diff giá theo tháng
    bien_dong = np.diff(gia)

    #Mask tăng mạnh / giảm mạnh
    mask_tang = bien_dong > 0
    mask_giam = bien_dong < 0

    thang_tang = thang[1:][mask_tang]
    thang_giam = thang[1:][mask_giam]

    print("Tháng tăng mạnh:", thang_tang)
    print("Tháng giảm mạnh:", thang_giam)

    #fancy indexing – top 3 tăng / giảm
    top3_tang_idx = np.argsort(bien_dong)[-3:]
    top3_giam_idx = np.argsort(bien_dong)[:3]

    print("Top 3 tháng tăng mạnh nhất:", thang[1:][top3_tang_idx])
    print("Top 3 tháng giảm mạnh nhất:", thang[1:][top3_giam_idx])

    # Danh sách tháng bất thường
    bat_thuong = np.concatenate([
        np.column_stack((thang_tang, ["TĂNG MẠNH"] * len(thang_tang))),
        np.column_stack((thang_giam, ["GIẢM MẠNH"] * len(thang_giam)))
    ])

    # Danh sách tháng đặc biệt (tăng/giảm > 20% giá trung bình)
    gia_tb = np.mean(gia)
    nguong = gia_tb * 0.2

    mask_db = np.abs(bien_dong) > nguong
    thang_db = thang[1:][mask_db]
    loai_db = np.where(bien_dong[mask_db] > 0, "TĂNG > 20%", "GIẢM > 20%")

    dac_biet = np.column_stack((thang_db, loai_db))

    print("Tháng đặc biệt:", dac_biet)

    return bat_thuong, dac_biet

#3.CHẠY TOÀN BỘ CHƯƠNG TRÌNH
duA = "city_A.csv"
duB = "city_B.csv"

# đọc dữ liệu
thangA, giaA = doc_du_lieu(duA)
thangB, giaB = doc_du_lieu(duB)

# xử lý
bat_A, dacbiet_A = xu_ly_thanh_pho("CITY A", thangA, giaA)
bat_B, dacbiet_B = xu_ly_thanh_pho("CITY B", thangB, giaB)

#4.XUẤT FILE CSV
np.savetxt("thang_bat_thuong_cityA.csv", bat_A, fmt="%s", delimiter=",", encoding="utf-8")
np.savetxt("thang_bat_thuong_cityB.csv", bat_B, fmt="%s", delimiter=",", encoding="utf-8")

np.savetxt("thang_dac_biet_cityA.csv", dacbiet_A, fmt="%s", delimiter=",", encoding="utf-8")
np.savetxt("thang_dac_biet_cityB.csv", dacbiet_B, fmt="%s", delimiter=",", encoding="utf-8")

print("\nĐÃ XUẤT FILE:")
print("- thang_bat_thuong_cityA.csv")
print("- thang_bat_thuong_cityB.csv")
print("- thang_dac_biet_cityA.csv")
print("- thang_dac_biet_cityB.csv")


===== CITY A =====
Tháng tăng mạnh: ['2025-02' '2025-04' '2025-08' '2025-09' '2025-12']
Tháng giảm mạnh: ['2025-03' '2025-05' '2025-07' '2025-10' '2025-11']
Top 3 tháng tăng mạnh nhất: ['2025-09' '2025-04' '2025-12']
Top 3 tháng giảm mạnh nhất: ['2025-05' '2025-11' '2025-10']
Tháng đặc biệt: [['2025-02' 'TĂNG > 20%']
 ['2025-04' 'TĂNG > 20%']
 ['2025-05' 'GIẢM > 20%']
 ['2025-08' 'TĂNG > 20%']
 ['2025-09' 'TĂNG > 20%']
 ['2025-10' 'GIẢM > 20%']
 ['2025-11' 'GIẢM > 20%']
 ['2025-12' 'TĂNG > 20%']]

===== CITY B =====
Tháng tăng mạnh: ['2025-02' '2025-03' '2025-07' '2025-08' '2025-10' '2025-11']
Tháng giảm mạnh: ['2025-04' '2025-05' '2025-06' '2025-09' '2025-12']
Top 3 tháng tăng mạnh nhất: ['2025-07' '2025-03' '2025-08']
Top 3 tháng giảm mạnh nhất: ['2025-09' '2025-04' '2025-06']
Tháng đặc biệt: [['2025-03' 'TĂNG > 20%']
 ['2025-04' 'GIẢM > 20%']
 ['2025-06' 'GIẢM > 20%']
 ['2025-07' 'TĂNG > 20%']
 ['2025-08' 'TĂNG > 20%']
 ['2025-09' 'GIẢM > 20%']
 ['2025-12' 'GIẢM > 20%']]

ĐÃ XUẤT F