In [6]:
import numpy as np


data_a = np.genfromtxt("city_a.csv", delimiter=",",
                       dtype=[("month", "U7"), ("avg_price", "f8")],
                       skip_header=1, autostrip=True, encoding="utf-8")

data_b = np.genfromtxt("city_b.csv", delimiter=",",
                       dtype=[("month", "U7"), ("avg_price", "f8")],
                       skip_header=1, autostrip=True, encoding="utf-8")

print("Dữ liệu City A:\n", data_a)
print("\nDữ liệu City B:\n", data_b)


month_a = data_a["month"]
price_a = data_a["avg_price"]

month_b = data_b["month"]
price_b = data_b["avg_price"]

print("\nCity A dtype:", data_a.dtype)
print("City A shape:", data_a.shape)
print("3 dòng đầu A:\n", data_a[:3])
print("3 dòng cuối A:\n", data_a[-3:])

print("\nCity B dtype:", data_b.dtype)
print("City B shape:", data_b.shape)
print("3 dòng đầu B:\n", data_b[:3])
print("3 dòng cuối B:\n", data_b[-3:])


month_a_dt = month_a.astype("datetime64[M]")
month_b_dt = month_b.astype("datetime64[M]")


Q1 = price_a[0:3]
Q2 = price_a[3:6]
Q3 = price_a[6:9]
Q4 = price_a[9:12]

print("\nQ1:", Q1)
print("Q2:", Q2)
print("Q3:", Q3)
print("Q4:", Q4)

ratio_a = price_a[1:] / price_a[:-1]
ratio_b = price_b[1:] / price_b[:-1]

inc_a = month_a[1:][ratio_a > 1.10]
dec_a = month_a[1:][ratio_a < 0.90]

inc_b = month_b[1:][ratio_b > 1.10]
dec_b = month_b[1:][ratio_b < 0.90]

print("\nCity A tăng >110%:", inc_a)
print("City A giảm <90%:", dec_a)

print("\nCity B tăng >110%:", inc_b)
print("City B giảm <90%:", dec_b)


delta_a = np.diff(price_a)
delta_b = np.diff(price_b)

strong_a = month_a[1:][np.abs(delta_a) >= 150]
strong_b = month_b[1:][np.abs(delta_b) >= 150]

print("\nBiến động mạnh City A (≥150):", strong_a)
print("Biến động mạnh City B (≥150):", strong_b)

top_inc_idx = np.argsort(delta_a)[-3:]
top_dec_idx = np.argsort(delta_a)[:3]

top_inc_months = month_a[1:][top_inc_idx]
top_dec_months = month_a[1:][top_dec_idx]

print("\nTop 3 tháng tăng mạnh nhất A:", top_inc_months)
print("Top 3 tháng giảm mạnh nhất A:", top_dec_months)


diff = price_a - price_b
X = 200

A_higher = month_a[diff >= X]
A_lower  = month_a[diff <= -X]

print("\nA > B ≥ 200:", A_higher)
print("A < B ≥ 200:", A_lower)


print("\n--- Thống kê City A ---")
print("mean:", np.mean(price_a))
print("std:", np.std(price_a))
print("min:", np.min(price_a))
print("max:", np.max(price_a))
print("Tháng giá cao nhất:", month_a[np.argmax(price_a)])
print("Tháng giá thấp nhất:", month_a[np.argmin(price_a)])

print("\n--- Thống kê City B ---")
print("mean:", np.mean(price_b))
print("std:", np.std(price_b))
print("min:", np.min(price_b))
print("max:", np.max(price_b))
print("Tháng giá cao nhất:", month_b[np.argmax(price_b)])
print("Tháng giá thấp nhất:", month_b[np.argmin(price_b)])


label = np.zeros(12, dtype=int)

label[1:][ratio_a > 1.10] = 1
label[1:][ratio_a < 0.90] = 2

label[np.abs(diff) >= 200] = 3


output = np.column_stack([month_a, price_a, price_b, diff, label])

np.savetxt("ket_qua_case_4.csv", 
           output,
           delimiter=",",
           fmt="%s",
           header="month,price_a,price_b,diff,label",
           comments='')

print("\n✔ Đã xuất file: ket_qua_case_4.csv")


Dữ liệu City A:
 [('2025-01', 1875.) ('2025-02', 2451.) ('2025-03', 2232.)
 ('2025-04', 3699.) ('2025-05', 1656.) ('2025-06', 1656.)
 ('2025-07', 1558.) ('2025-08', 2366.) ('2025-09', 3327.)
 ('2025-10', 2208.) ('2025-11',  955.) ('2025-12', 2470.)]

Dữ liệu City B:
 [('2025-01', 1583.) ('2025-02', 1704.) ('2025-03', 3309.)
 ('2025-04', 1832.) ('2025-05', 1691.) ('2025-06',  862.)
 ('2025-07', 1539.) ('2025-08', 3355.) ('2025-09', 1766.)
 ('2025-10', 1856.) ('2025-11', 2185.) ('2025-12', 1600.)]

City A dtype: [('month', '<U7'), ('avg_price', '<f8')]
City A shape: (12,)
3 dòng đầu A:
 [('2025-01', 1875.) ('2025-02', 2451.) ('2025-03', 2232.)]
3 dòng cuối A:
 [('2025-10', 2208.) ('2025-11',  955.) ('2025-12', 2470.)]

City B dtype: [('month', '<U7'), ('avg_price', '<f8')]
City B shape: (12,)
3 dòng đầu B:
 [('2025-01', 1583.) ('2025-02', 1704.) ('2025-03', 3309.)]
3 dòng cuối B:
 [('2025-10', 1856.) ('2025-11', 2185.) ('2025-12', 1600.)]

Q1: [1875. 2451. 2232.]
Q2: [3699. 1656. 1656.]


In [7]:


with open("ket_qua_case_4.csv", "w", encoding="utf-8") as f:

    f.write("=== SLICING THEO QUÝ ===\n")
    f.write(f"Q1,{Q1[0]},{Q1[1]},{Q1[2]}\n")
    f.write(f"Q2,{Q2[0]},{Q2[1]},{Q2[2]}\n")
    f.write(f"Q3,{Q3[0]},{Q3[1]},{Q3[2]}\n")
    f.write(f"Q4,{Q4[0]},{Q4[1]},{Q4[2]}\n\n")

    f.write("=== TĂNG / GIẢM BẤT THƯỜNG ===\n")
    f.write(f"CityA_tang_gt_110%,{','.join(inc_a)}\n")
    f.write(f"CityA_giam_lt_90%,{','.join(dec_a)}\n")
    f.write(f"CityB_tang_gt_110%,{','.join(inc_b)}\n")
    f.write(f"CityB_giam_lt_90%,{','.join(dec_b)}\n\n")

    f.write("=== BIẾN ĐỘNG MẠNH (|Δ| ≥ 150) ===\n")
    f.write(f"CityA,{','.join(str(x) for x in strong_a)}\n")
    f.write(f"CityB,{','.join(str(x) for x in strong_b)}\n\n")

    f.write("=== TOP 3 TĂNG / GIẢM CITY A ===\n")
    f.write(f"Top_tang,{','.join(top_inc_months)}\n")
    f.write(f"Top_giam,{','.join(top_dec_months)}\n\n")

    f.write("=== SO SÁNH 2 THÀNH PHỐ (diff>=200) ===\n")
    f.write(f"A_cao_hon_B>=200,{','.join(A_higher)}\n")
    f.write(f"A_thap_hon_B>=200,{','.join(A_lower)}\n\n")

    f.write("=== THỐNG KÊ CITY A ===\n")
    f.write(f"mean,{np.mean(price_a)}\n")
    f.write(f"std,{np.std(price_a)}\n")
    f.write(f"min,{np.min(price_a)}\n")
    f.write(f"max,{np.max(price_a)}\n")
    f.write(f"argmax,{month_a[np.argmax(price_a)]}\n")
    f.write(f"argmin,{month_a[np.argmin(price_a)]}\n\n")

    f.write("=== THỐNG KÊ CITY B ===\n")
    f.write(f"mean,{np.mean(price_b)}\n")
    f.write(f"std,{np.std(price_b)}\n")
    f.write(f"min,{np.min(price_b)}\n")
    f.write(f"max,{np.max(price_b)}\n")
    f.write(f"argmax,{month_b[np.argmax(price_b)]}\n")
    f.write(f"argmin,{month_b[np.argmin(price_b)]}\n\n")

    f.write("=== BẢNG DỮ LIỆU CHÍNH ===\n")
    f.write("month,price_a,price_b,diff,label\n")
    for m, pa, pb, d, lb in zip(month_a, price_a, price_b, diff, label):
        f.write(f"{m},{pa},{pb},{d},{lb}\n")
