In [6]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import confusion_matrix, precision_score, recall_score

# ===========================
# 1. Tạo dữ liệu + xuất CSV
# ===========================

rows = [
    ["Điều khiển", 3, "Nhỏ", "Nhựa PP", "Cao"],
    ["Xếp hình", 5, "Vừa", "Cao su", "Thấp"],
    ["Xếp hình", 7, "To", "Nhựa PP", "Thấp"],
    ["Điều khiển", 5, "Nhỏ", "Cao su", "Thấp"],
    ["Búp bê", 3, "Vừa", "Nhựa PP", "Thấp"],
    ["Điều khiển", 5, "Vừa", "Nhựa PP", "Cao"],
    ["Búp bê", 5, "To", "Nhựa PP", "Cao"],
    ["Điều khiển", 7, "Vừa", "Cao su", "Thấp"],
    ["Xếp hình", 7, "To", "Cao su", "Cao"],
    ["Xếp hình", 3, "To", "Nhựa PP", "Thấp"],
    ["Búp bê", 3, "Nhỏ", "Cao su", "Thấp"],
    ["Xếp hình", 3, "Nhỏ", "Nhựa PP", "Cao"],
    ["Điều khiển", 5, "To", "Cao su", "Thấp"],
    ["Búp bê", 5, "Vừa", "Nhựa PP", "Cao"],
    ["Búp bê", 7, "To", "Nhựa PP", "Cao"],
]

df = pd.DataFrame(rows, columns=["Loai", "So_mau", "Kich_thuoc", "Chat_lieu", "Doanh_so"])
df.to_csv("dochoi.csv", index=False, encoding="utf-8-sig")

# ===========================
# 2. Encode dữ liệu
# ===========================
encoders = {}
for col in ["Loai", "Kich_thuoc", "Chat_lieu", "Doanh_so"]:
    le = LabelEncoder()
    df[col] = le.fit_transform(df[col])
    encoders[col] = le

X = df[["Loai", "So_mau", "Kich_thuoc", "Chat_lieu"]]
y = df["Doanh_so"]

# ===========================
# 3. Tách dữ liệu
# ===========================
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=0, stratify=y
)

# ===========================
# 4. Train CART (Gini)
# ===========================
cart = DecisionTreeClassifier(criterion="gini", random_state=0)
cart.fit(X_train, y_train)

y_pred = cart.predict(X_test)

# ===========================
# 5. Precision – Recall – F-measure
# ===========================

pos_label = encoders["Doanh_so"].transform(["Cao"])[0]

precision = precision_score(y_test, y_pred, pos_label=pos_label, zero_division=0)
recall    = recall_score(y_test, y_pred, pos_label=pos_label, zero_division=0)

f_measure = 2 * precision * recall / (precision + recall) if (precision + recall) > 0 else 0

# ===========================
# 6. In kết quả
# ===========================

print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred))
print("Precision:", precision)
print("Recall:", recall)
print("F-measure:", f_measure)

print("Nguyễn Đình Vương - 6351071081\n")


Confusion Matrix:
 [[0 2]
 [1 2]]
Precision: 0.0
Recall: 0.0
F-measure: 0
Nguyễn Đình Vương - 6351071081



In [7]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import (
    confusion_matrix,
    precision_score,
    recall_score,
    f1_score,
)

# ===========================
# 1. Tạo dữ liệu từ bảng
# ===========================

rows = [
    # giảm      người      chuyện     yêu       vừa       đi       Cảm xúc
    ["0.5",     "11..20",  ">20",    "11..20", ">20",    "0.5",   "tốt"],
    ["11..20",  "6..10",   "6..10",  "0.5",    "11..20", "11..20","tốt"],
    ["6..10",   "0.5",     "6..10",  "11..20", "0.5",    "6..10", "xấu"],
    [">20",     "0.5",     "11..20", "6..10",  "0.5",    ">20",   "bình thường"],
    ["0.5",     ">20",     "11..20", "0.5",    "6..10",  "0.5",   "xấu"],
    ["0.5",     "6..10",   "0.5",    "0.5",    "11..20", "11..20","xấu"],
    ["0.5",     "6..10",   "11..20", "0.5",    "6..10",  "0.5",   "tốt"],
    ["11..20",  ">20",     "0.5",    "11..20", "0.5",    "11..20","bình thường"],
    ["0.5",     "0.5",     "6..10",  "6..10",  "6..10",  ">20",   "tốt"],
    ["11..20",  "0.5",     "11..20", "11..20", "0.5",    "11..20","tốt"],
    [">20",     "6..10",   "0.5",    "0.5",    "0.5",    "6..10", "xấu"],
    ["0.5",     "0.5",     "11..20", "0.5",    "11..20", ">20",   "bình thường"],
    ["6..10",   "11..20",  "6..10",  ">20",    "0.5",    "6..10", "bình thường"],
    ["11..20",  "6..10",   ">20",    "11..20", "0.5",    "0.5",   "xấu"],
]

df = pd.DataFrame(
    rows,
    columns=["giam", "nguoi", "chuyen", "yeu", "vua", "di", "Cam_xuc"],
)

# lưu ra csv (nếu cần nộp file)
df.to_csv("camxuc.csv", index=False, encoding="utf-8-sig")

# ===========================
# 2. Mã hoá các thuộc tính
# ===========================

encoders = {}
for col in ["giam", "nguoi", "chuyen", "yeu", "vua", "di", "Cam_xuc"]:
    le = LabelEncoder()
    df[col] = le.fit_transform(df[col])
    encoders[col] = le

X = df[["giam", "nguoi", "chuyen", "yeu", "vua", "di"]]
y = df["Cam_xuc"]

# ===========================
# 3. Chia train / test
# ===========================

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=0, stratify=y
)

# ===========================
# 4. Train CART (Gini)
# ===========================

cart = DecisionTreeClassifier(criterion="gini", random_state=0)
cart.fit(X_train, y_train)

y_pred = cart.predict(X_test)

# ===========================
# 5. Tính Precision, Recall, F-measure
# ===========================

# Confusion matrix (đa lớp)
cm = confusion_matrix(y_test, y_pred)
print("Confusion Matrix:\n", cm)

# Precision, Recall, F1 từng lớp
prec_each = precision_score(y_test, y_pred, average=None, zero_division=0)
recall_each = recall_score(y_test, y_pred, average=None, zero_division=0)
f1_each = f1_score(y_test, y_pred, average=None, zero_division=0)

print("Precision từng lớp:", prec_each)
print("Recall từng lớp:", recall_each)
print("F-measure (F1) từng lớp:", f1_each)

# F-measure macro (trung bình các lớp)
f1_macro = f1_score(y_test, y_pred, average="macro", zero_division=0)
print("F-measure macro (trung bình các lớp):", f1_macro)

# Nếu muốn F-measure riêng cho lớp 'tốt':
if "tốt" in encoders["Cam_xuc"].classes_:
    pos_label = encoders["Cam_xuc"].transform(["tốt"])[0]
    prec_t = precision_score(y_test, y_pred, labels=[pos_label],
                             average="macro", zero_division=0)
    rec_t = recall_score(y_test, y_pred, labels=[pos_label],
                         average="macro", zero_division=0)
    f1_t = f1_score(y_test, y_pred, labels=[pos_label],
                    average="macro", zero_division=0)
    print("Precision (lớp 'tốt'):", prec_t)
    print("Recall (lớp 'tốt'):", rec_t)
    print("F-measure (lớp 'tốt'):", f1_t)

print("Nguyễn Đình Vương - 6351071081\n")


Confusion Matrix:
 [[1 0 0]
 [2 0 0]
 [1 1 0]]
Precision từng lớp: [0.25 0.   0.  ]
Recall từng lớp: [1. 0. 0.]
F-measure (F1) từng lớp: [0.4 0.  0. ]
F-measure macro (trung bình các lớp): 0.13333333333333333
Precision (lớp 'tốt'): 0.0
Recall (lớp 'tốt'): 0.0
F-measure (lớp 'tốt'): 0.0
Nguyễn Đình Vương - 6351071081

