<a href="https://colab.research.google.com/github/dongnguyennhathuy260206-lab/Huy_Dong/blob/main/Untitled2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Train đồ ăn
import os
import cv2
import numpy as np
from keras.utils import to_categorical
from keras.models import Sequential
from keras.layers import Dense, Dropout, BatchNormalization
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt

#xử lý thư mục, file của data
def load_data(data_dir, img_size=(60, 60), test_size=0.2):
    X, y = [], []
    class_names = sorted([d for d in os.listdir(data_dir) if os.path.isdir(os.path.join(data_dir, d))])
    class_map = {cls_name: idx for idx, cls_name in enumerate(class_names)}

    for cls in class_names:
        cls_path = os.path.join(data_dir, cls)
        for file in os.listdir(cls_path):
            if file.lower().endswith((".jpg", ".png", ".jpeg", ".bmp", ".HEIC")):
                img_path = os.path.join(cls_path, file)
                try:
                    img = cv2.imdecode(np.fromfile(img_path, dtype=np.uint8), cv2.IMREAD_GRAYSCALE)
                except Exception as e:
                    print(f"Error decoding image {img_path}: {e}")
                    continue

                    # Tiền xử lý ảnh
                img = cv2.resize(img, img_size)
                img = cv2.equalizeHist(img)  # Cân bằng histogram để cải thiện độ tương phản
                img = cv2.GaussianBlur(img, (3, 3), 0)  # Làm mờ để giảm nhiễu
                img = img.astype("float32") / 255.0
                X.append(img)
                y.append(class_map[cls])

    X = np.array(X)
    y = np.array(y)

    X = X.reshape((X.shape[0], img_size[0] * img_size[1]))

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=test_size, random_state=42, stratify=y)
    return (X_train, y_train), (X_test, y_test), class_names


def create_model(input_shape, num_classes):
    model = Sequential()

    # Mạng neural sâu hơn với các kỹ thuật chống overfitting
    model.add(Dense(1024, activation='relu', input_shape=input_shape))
    model.add(BatchNormalization())
    model.add(Dropout(0.5))

    model.add(Dense(512, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.4))

    model.add(Dense(256, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.3))

    model.add(Dense(128, activation='relu'))
    model.add(Dropout(0.2))

    model.add(Dense(num_classes, activation='softmax'))

    # Sử dụng optimizer tốt hơn
    model.compile(optimizer='adam',
                  loss='categorical_crossentropy',
                  metrics=['accuracy'])

    return model


def augment_data(X_train, y_train):
    # Tạo dữ liệu augmentation
    datagen = ImageDataGenerator(
        rotation_range=20,  # Xoay ảnh ngẫu nhiên ±20 độ
        width_shift_range=0.2,  # Dịch chuyển ngang ngẫu nhiên 20%
        height_shift_range=0.2,  # Dịch chuyển dọc ngẫu nhiên 20%
        shear_range=0.2,  # Biến dạng cắt ngẫu nhiên 20%
        zoom_range=0.2,  # Zoom ngẫu nhiên ±20%
        horizontal_flip=True,  # Lật ngang ngẫu nhiên
        fill_mode='nearest'  # Điền pixel gần nhất khi biến đổi
    )

    # Reshape dữ liệu để phù hợp với ImageDataGenerator
    X_train_reshaped = X_train.reshape(-1, 60, 60, 1)

    # Tạo dữ liệu augmentation
    aug_iter = datagen.flow(X_train_reshaped, y_train, batch_size=32)

    # Tạo batch dữ liệu augmentation
    X_augmented = []
    y_augmented = []

    for i in range(len(X_train) // 32):  # Tạo thêm dữ liệu gấp đôi
        X_batch, y_batch = next(aug_iter)
        X_augmented.append(X_batch.reshape(-1, 60 * 60))
        y_augmented.append(y_batch)

    # Kết hợp dữ liệu gốc và dữ liệu augmentation
    X_combined = np.vstack([X_train] + X_augmented)
    y_combined = np.vstack([y_train] + y_augmented)

    return X_combined, y_combined


def plot_training_history(history):
    # Vẽ đồ thị accuracy và loss
    plt.figure(figsize=(12, 4))
    plt.subplot(1, 2, 1)
    plt.plot(history.history['accuracy'], label='Training Accuracy')
    plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
    plt.title('Model Accuracy')
    plt.xlabel('Epoch')
    plt.ylabel('Accuracy')
    plt.legend()

    plt.subplot(1, 2, 2)
    plt.plot(history.history['loss'], label='Training Loss')
    plt.plot(history.history['val_loss'], label='Validation Loss')
    plt.title('Model Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()

    plt.tight_layout()
    plt.savefig('training_history.png')
    plt.show()


# Main training code
try:
    data_dir = "train"
    if not os.path.exists(data_dir):
        raise FileNotFoundError(f"Thư mục {data_dir} không tồn tại!")

    # Tải dữ liệu
    (X_train, y_train), (X_test, y_test), class_names = load_data(data_dir)

    # Chuyển đổi nhãn sang dạng categorical
    y_train_categorical = to_categorical(y_train, num_classes=len(class_names))
    y_test_categorical = to_categorical(y_test, num_classes=len(class_names))

    print(f"Số người nhận dạng: {len(class_names)}")
    print(f"Tên người nhận dạng: {class_names}")
    print(f"Kích thước dữ liệu huấn luyện: {X_train.shape}")
    print(f"Kích thước dữ liệu kiểm tra: {X_test.shape}")

    # Tạo và huấn luyện mô hình
    model = create_model((60 * 60,), len(class_names))
    model.summary()

    # Augmentation dữ liệu
    X_train_aug, y_train_aug = augment_data(X_train, y_train_categorical)
    print(f"Kích thước dữ liệu sau augmentation: {X_train_aug.shape}")

    # Huấn luyện mô hình
    history = model.fit(
        X_train_aug, y_train_aug,
        epochs=50,
        batch_size=32,
        validation_data=(X_test, y_test_categorical),
        verbose=1,
        callbacks=[
            # Dừng sớm nếu validation loss không cải thiện sau 10 epochs
            tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True),
            # Giảm learning rate nếu validation loss không cải thiện
            tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=5)
        ]
    )

    #Vẽ đồ thị quá trình huấn luyện
    plot_training_history(history)

    # Đánh giá mô hình
    test_loss, test_accuracy = model.evaluate(X_test, y_test_categorical, verbose=0)
    print(f"Độ chính xác trên tập test: {test_accuracy:.4f}")

    #Dự đoán
    y_pred = model.predict(X_test)
    y_pred_classes = np.argmax(y_pred, axis=1)
    y_true = np.argmax(y_test_categorical, axis=1)

    model.save("flower_detect_mnist_style.keras")    #Lưu mô hình

    #Kiểm tra độ chính xác trên từng lớp (đồ ăn cần nhận diện)
    class_accuracy = {}
    for i, cls_name in enumerate(class_names):
        class_mask = (y_true == i)
        if np.sum(class_mask) > 0:
            class_acc = np.mean(y_pred_classes[class_mask] == y_true[class_mask])
            class_accuracy[cls_name] = class_acc
            print(f"Độ chính xác khi huấn luyện data của {cls_name}: {class_acc:.4f}")

except Exception as e: #khi train không thành công thì in ra lỗi
    print(f"Lỗi: {e}")
    import traceback
    traceback.print_exc()

Lỗi: Thư mục train không tồn tại!


Traceback (most recent call last):
  File "/tmp/ipython-input-294854403.py", line 138, in <cell line: 0>
    raise FileNotFoundError(f"Thư mục {data_dir} không tồn tại!")
FileNotFoundError: Thư mục train không tồn tại!


In [None]:
# Giao diện đồ ăn
import cv2
import numpy as np
from keras.models import load_model
import tkinter as tk
from tkinter import ttk, filedialog, messagebox
from PIL import Image, ImageTk
import os

model = load_model("food_detect.keras")
class_names = ["pizza", "burger", "sushi", "noodles", "fried_chicken"]
flower_info = {
    "pizza": [
        "Pizza là món ăn nổi tiếng có nguồn gốc từ Ý.",
        "Được làm từ bột mì, phô mai, sốt cà chua và nhiều loại topping khác nhau.",
        "Pizza ngày nay phổ biến toàn cầu với nhiều biến thể, từ pizza hải sản, pizza phô mai đến pizza chay.",
        "Đây là món ăn thường gắn liền với sự sum họp gia đình, bạn bè."
    ],
    "burger": [
        "Burger (bánh mì kẹp thịt) có nguồn gốc từ Đức và Mỹ.",
        "Nguyên liệu chính thường gồm: bánh mì, thịt bò nướng, rau xà lách, cà chua, phô mai và sốt.",
        "Burger là món ăn nhanh phổ biến nhất thế giới, đặc biệt trong các chuỗi fast food."
        "Ngoài thịt bò, burger còn có nhiều biến thể với thịt gà, cá, hoặc chay."
    ],
    "sushi": [
        "Sushi là món ăn truyền thống của Nhật Bản.",
        "Nguyên liệu chính là cơm trộn giấm kết hợp với hải sản tươi sống, rau củ hoặc trứng.",
        "Sushi không chỉ là món ăn mà còn là nghệ thuật trình bày tinh tế của ẩm thực Nhật.",
        "Các loại sushi phổ biến: Nigiri, Maki, Sashimi, Temaki."
    ],
    "noodles": [
        "Noodles (mì) là món ăn phổ biến khắp châu Á.",
        "Có nhiều loại mì: mì tươi, mì khô, mì gói, với đa dạng cách chế biến như xào, nấu, trộn.",
        "Mì thường ăn kèm với thịt, hải sản, rau củ và nhiều loại gia vị khác nhau."
        "Ở Việt Nam, mì gói là món ăn nhanh quen thuộc, tiện lợi và phổ biến."
    ],
    "fried_chicken": [
        "Fried Chicken (gà rán) là món ăn nổi tiếng toàn cầu, đặc biệt gắn liền với ẩm thực Mỹ.",
        "Thịt gà được tẩm bột, chiên giòn, vàng ruộm và có hương vị hấp dẫn.",
        "Gà rán thường ăn kèm với khoai tây chiên, salad và nước ngọt.",
        "Các thương hiệu gà rán nổi tiếng: KFC, Popeyes, Lotteria."
    ]
}

class FlowerRecognitionUI:
    def __init__(self, root):
        self.root = root
        self.root.title("Ứng dụng Nhận Diện Món Ăn")
        self.root.geometry("1200x800")
        self.root.configure(bg="#f0f0f0")

        # Biến lưu trữ
        self.image_path = None
        self.cap = None
        self.webcam_running = False
        self.current_frame = None
        self.photo = None
        self.original_image = None
        self.webcam_image = None
        self.create_widgets()
        self.start_webcam()

    def create_widgets(self):
        # Configure style
        style = ttk.Style()
        style.configure('TFrame', background='#f0f0f0')
        style.configure('TLabel', background='#f0f0f0', font=('Arial', 10))
        style.configure('Title.TLabel', background='#f0f0f0', font=('Arial', 20, 'bold'), foreground='#2c3e50')
        style.configure('Result.TLabel', background='#f0f0f0', font=('Arial', 18, 'bold'), foreground='#27ae60')
        style.configure('TButton', font=('Arial', 12), padding=8)
        style.configure('TLabelFrame', font=('Arial', 12, 'bold'), background='#f0f0f0')

        # Main container
        main_frame = ttk.Frame(self.root, padding="20")
        main_frame.grid(row=0, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Title
        title_label = ttk.Label(main_frame, text="HỆ THỐNG NHẬN DIỆN MÓN ĂN",
                                style='Title.TLabel')
        title_label.grid(row=0, column=0, columnspan=2, pady=(0, 20))

        # Left frame for controls and info
        left_frame = ttk.Frame(main_frame)
        left_frame.grid(row=1, column=0, sticky=(tk.W, tk.E, tk.N, tk.S), padx=(0, 20))

        # Right frame for image/webcam
        right_frame = ttk.Frame(main_frame)
        right_frame.grid(row=1, column=1, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Selection frame
        select_frame = ttk.Frame(left_frame)
        select_frame.grid(row=0, column=0, pady=(0, 20), sticky=(tk.W, tk.E))

        # Select button
        self.select_btn = ttk.Button(select_frame, text="📁 CHỌN ẢNH VÀ NHẬN DIỆN",
                                     command=self.select_and_recognize, width=25)
        self.select_btn.grid(row=0, column=0, padx=(0, 10))

        # Webcam button
        self.webcam_btn = ttk.Button(select_frame, text="📷 BẬT/TẮT WEBCAM",
                                     command=self.toggle_webcam, width=20)
        self.webcam_btn.grid(row=0, column=1)

        # Path label
        self.path_label = ttk.Label(select_frame, text="Chưa chọn ảnh nào",
                                    foreground="#7f8c8d", font=('Arial', 11))
        self.path_label.grid(row=1, column=0, columnspan=2, pady=(10, 0), sticky=tk.W)

        # Result frame
        result_frame = ttk.LabelFrame(left_frame, text="KẾT QUẢ NHẬN DIỆN", padding="15")
        result_frame.grid(row=1, column=0, pady=(0, 20), sticky=(tk.W, tk.E))

        # Result display - centered and larger
        self.result_var = tk.StringVar(value="🔄 Chưa có kết quả")
        result_display = tk.Label(result_frame, textvariable=self.result_var,
                                  font=('Arial', 18, 'bold'), foreground="#2c3e50",
                                  background='#ecf0f1', justify=tk.CENTER,
                                  wraplength=400, padx=20, pady=20,
                                  relief=tk.RIDGE, borderwidth=2)
        result_display.grid(row=0, column=0, pady=10)

        # Information frame
        info_frame = ttk.LabelFrame(left_frame, text="THÔNG TIN CHI TIẾT", padding="15")
        info_frame.grid(row=2, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Text box for information
        self.info_text = tk.Text(info_frame, width=60, height=15, font=('Arial', 11),
                                 wrap=tk.WORD, state=tk.DISABLED, bg='#ffffff',
                                 relief=tk.FLAT, borderwidth=1, padx=15, pady=15)
        self.info_text.grid(row=0, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Scrollbars for text box
        v_scrollbar = ttk.Scrollbar(info_frame, orient=tk.VERTICAL, command=self.info_text.yview)
        v_scrollbar.grid(row=0, column=1, sticky=(tk.N, tk.S))

        h_scrollbar = ttk.Scrollbar(info_frame, orient=tk.HORIZONTAL, command=self.info_text.xview)
        h_scrollbar.grid(row=1, column=0, sticky=(tk.W, tk.E))

        self.info_text.configure(yscrollcommand=v_scrollbar.set, xscrollcommand=h_scrollbar.set)

        # Image/Webcam display frame
        display_frame = ttk.LabelFrame(right_frame, text="XEM TRƯỚC ẢNH/WEBCAM", padding="10")
        display_frame.grid(row=0, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Image label for displaying selected image or webcam - FIXED SIZE
        self.image_label = tk.Label(display_frame, bg="#2c3e50", width=50, height=30,
                                    relief=tk.SUNKEN, text="Webcam đang khởi động...")
        self.image_label.grid(row=0, column=0, pady=10, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Configure grid to expand the label
        display_frame.columnconfigure(0, weight=1)
        display_frame.rowconfigure(0, weight=1)

        # Capture button
        self.capture_btn = ttk.Button(display_frame, text="📸 CHỤP ẢNH VÀ NHẬN DIỆN",
                                      command=self.capture_and_recognize, width=30)
        self.capture_btn.grid(row=1, column=0, pady=10)

        # Configure grid weights for resizing
        self.root.columnconfigure(0, weight=1)
        self.root.rowconfigure(0, weight=1)

        main_frame.columnconfigure(0, weight=1)
        main_frame.columnconfigure(1, weight=1)
        main_frame.rowconfigure(1, weight=1)

        left_frame.columnconfigure(0, weight=1)
        left_frame.rowconfigure(2, weight=1)

        right_frame.columnconfigure(0, weight=1)
        right_frame.rowconfigure(0, weight=1)

        info_frame.columnconfigure(0, weight=1)
        info_frame.rowconfigure(0, weight=1)

    def start_webcam(self):
        """Khởi động webcam"""
        try:
            self.cap = cv2.VideoCapture(0)
            if not self.cap.isOpened():
                messagebox.showerror("Lỗi", "Không thể truy cập webcam!")
                return

            self.webcam_running = True
            self.update_webcam()

        except Exception as e:
            messagebox.showerror("Lỗi", f"Không thể khởi động webcam: {str(e)}")

    def stop_webcam(self):
        self.webcam_running = False
        if self.cap:
            self.cap.release()
        self.cap = None

    def toggle_webcam(self):
        if self.webcam_running:
            self.stop_webcam()
            self.webcam_btn.configure(text="📷 BẬT WEBCAM")
            self.image_label.configure(image='', text="Webcam đã tắt", bg="#2c3e50", fg="white")
        else:
            self.start_webcam()
            self.webcam_btn.configure(text="📷 TẮT WEBCAM")

    def update_webcam(self):
        if self.webcam_running and self.cap and self.cap.isOpened():
            ret, frame = self.cap.read()
            if ret:
                self.webcam_image = frame.copy()
                frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
                h, w = frame.shape[:2]
                label_width = self.image_label.winfo_width()
                label_height = self.image_label.winfo_height()
                if label_width <= 1:
                    label_width = 400
                    label_height = 300

                ratio = min(label_width / w, label_height / h)
                new_w, new_h = int(w * ratio), int(h * ratio)
                if new_w < 100:
                    new_w = 100
                if new_h < 100:
                    new_h = 100

                frame_resized = cv2.resize(frame_rgb, (new_w, new_h))
                self.photo = ImageTk.PhotoImage(image=Image.fromarray(frame_resized))
                self.image_label.configure(image=self.photo, text="")
            if self.webcam_running:
                self.root.after(10, self.update_webcam)
        else:
            self.image_label.configure(image='', text="Không có tín hiệu webcam", bg="#2c3e50", fg="white")

    def display_image(self, image):
        if image is None:
            return
        if len(image.shape) == 3:
            img_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        else:
            img_rgb = cv2.cvtColor(image, cv2.COLOR_GRAY2RGB)
        img_pil = Image.fromarray(img_rgb)
        label_width = self.image_label.winfo_width()
        label_height = self.image_label.winfo_height()
        if label_width <= 1:
            label_width = 400
            label_height = 300

        w, h = img_pil.size
        ratio = min(label_width / w, label_height / h)
        new_w, new_h = int(w * ratio), int(h * ratio)

        if new_w < 100:
            new_w = 100
        if new_h < 100:
            new_h = 100

        img_resized = img_pil.resize((new_w, new_h), Image.Resampling.LANCZOS)
        photo = ImageTk.PhotoImage(img_resized)
        self.image_label.config(image=photo)
        self.image_label.image = photo

    def capture_and_recognize(self):
        if self.webcam_image is not None:
            self.original_image = self.webcam_image.copy()
            self.display_image(self.original_image)
            self.path_label.configure(text=f"Đã chụp ảnh từ webcam")
            self.recognize_flower(self.webcam_image, source="webcam")
        else:
            messagebox.showwarning("Cảnh báo", "Không có frame nào từ webcam!")

    def select_and_recognize(self):
        file_path = filedialog.askopenfilename(
            title="Chọn ảnh loài hoa",
            filetypes=[("Image files", "*.jpg *.jpeg *.png *.bmp")]
        )
        if file_path:
            self.image_path = file_path
            self.original_image = cv2.imread(file_path)
            if self.original_image is None:
                self.original_image = cv2.imdecode(np.fromfile(file_path, dtype=np.uint8), cv2.IMREAD_COLOR)
            if self.original_image is None:
                messagebox.showerror("Lỗi", "Không thể đọc ảnh!")
                return
            self.display_image(self.original_image)
            try:
                self.path_label.configure(text=f"Đã chọn: {os.path.basename(file_path)}")
                self.recognize_flower(self.original_image, source="file")
            except Exception as e:
                messagebox.showerror("Lỗi", f"Không thể đọc ảnh: {str(e)}")

    def recognize_flower(self, image, source="file"):
        if image is None:
            messagebox.showwarning("Cảnh báo", "Không có ảnh để nhận diện!")
            return

        try:
            img_processed = image.copy()
            if len(img_processed.shape) == 3:
                img_processed = cv2.cvtColor(img_processed, cv2.COLOR_BGR2GRAY)
            img_processed = cv2.resize(img_processed, (60, 60))
            img_processed = cv2.equalizeHist(img_processed)
            img_processed = cv2.GaussianBlur(img_processed, (3, 3), 0)
            img_processed = img_processed.astype("float32") / 255.0
            img_processed = img_processed.reshape(1, 60 * 60)

            predictions = model.predict(img_processed, verbose=0)
            class_idx = np.argmax(predictions)
            predicted_name = class_names[class_idx]
            confidence = predictions[0][class_idx] * 100

            self.result_var.set(
                f"✅ NHẬN DIỆN THÀNH CÔNG!\n\nKết quả: {predicted_name}\nĐộ chính xác: {confidence:.2f}%")

            self.show_flower_info(predicted_name)

        except Exception as e:
            messagebox.showerror("Thông báo", f"Up ảnh thành công")

    def show_flower_info(self, flower_name):
        info = flower_info.get(flower_name, [])

        self.info_text.configure(state=tk.NORMAL)
        self.info_text.delete(1.0, tk.END)

        # Display flower information with formatting
        self.info_text.insert(tk.END, f"THÔNG TIN CHI TIẾT - {flower_name.upper()}\n\n", "title")
        self.info_text.tag_configure("title", font=('Arial', 14, 'bold'), foreground='#2980b9')

        for line in info:
            self.info_text.insert(tk.END, f"• {line}\n\n")

        self.info_text.configure(state=tk.DISABLED)

    def __del__(self):
        if self.cap:
            self.cap.release()


if __name__ == "__main__":
    root = tk.Tk()
    app = FlowerRecognitionUI(root)
    root.protocol("WM_DELETE_WINDOW", lambda: (app.stop_webcam(), root.destroy()))
    root.mainloop()

ValueError: File not found: filepath=food_detect.keras. Please ensure the file is an accessible `.keras` zip file.

In [None]:
# Train chỉ tay
import os
import cv2
import numpy as np
from keras.utils import to_categorical
from keras.models import Sequential
from keras.layers import Dense, Dropout, BatchNormalization
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt

#xử lý thư mục, file của data
def load_data(data_dir, img_size=(60, 60), test_size=0.2):
    X, y = [], []
    class_names = sorted([d for d in os.listdir(data_dir) if os.path.isdir(os.path.join(data_dir, d))])
    class_map = {cls_name: idx for idx, cls_name in enumerate(class_names)}

    for cls in class_names:
        cls_path = os.path.join(data_dir, cls)
        for file in os.listdir(cls_path):
            if file.lower().endswith((".jpg", ".png", ".jpeg", ".bmp", ".HEIC")):
                img_path = os.path.join(cls_path, file)
                try:
                    img = cv2.imdecode(np.fromfile(img_path, dtype=np.uint8), cv2.IMREAD_GRAYSCALE)
                except Exception as e:
                    print(f"Error decoding image {img_path}: {e}")
                    continue

                    # Tiền xử lý ảnh
                img = cv2.resize(img, img_size)
                img = cv2.equalizeHist(img)  # Cân bằng histogram để cải thiện độ tương phản
                img = cv2.GaussianBlur(img, (3, 3), 0)  # Làm mờ để giảm nhiễu
                img = img.astype("float32") / 255.0
                X.append(img)
                y.append(class_map[cls])

    X = np.array(X)
    y = np.array(y)

    X = X.reshape((X.shape[0], img_size[0] * img_size[1]))

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=test_size, random_state=42, stratify=y)
    return (X_train, y_train), (X_test, y_test), class_names


def create_model(input_shape, num_classes):
    model = Sequential()

    # Mạng neural sâu hơn với các kỹ thuật chống overfitting
    model.add(Dense(1024, activation='relu', input_shape=input_shape))
    model.add(BatchNormalization())
    model.add(Dropout(0.5))

    model.add(Dense(512, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.4))

    model.add(Dense(256, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.3))

    model.add(Dense(128, activation='relu'))
    model.add(Dropout(0.2))

    model.add(Dense(num_classes, activation='softmax'))

    # Sử dụng optimizer tốt hơn
    model.compile(optimizer='adam',
                  loss='categorical_crossentropy',
                  metrics=['accuracy'])

    return model


def augment_data(X_train, y_train):
    # Tạo dữ liệu augmentation
    datagen = ImageDataGenerator(
        rotation_range=20,  # Xoay ảnh ngẫu nhiên ±20 độ
        width_shift_range=0.2,  # Dịch chuyển ngang ngẫu nhiên 20%
        height_shift_range=0.2,  # Dịch chuyển dọc ngẫu nhiên 20%
        shear_range=0.2,  # Biến dạng cắt ngẫu nhiên 20%
        zoom_range=0.2,  # Zoom ngẫu nhiên ±20%
        horizontal_flip=True,  # Lật ngang ngẫu nhiên
        fill_mode='nearest'  # Điền pixel gần nhất khi biến đổi
    )

    # Reshape dữ liệu để phù hợp với ImageDataGenerator
    X_train_reshaped = X_train.reshape(-1, 60, 60, 1)

    # Tạo dữ liệu augmentation
    aug_iter = datagen.flow(X_train_reshaped, y_train, batch_size=32)

    # Tạo batch dữ liệu augmentation
    X_augmented = []
    y_augmented = []

    for i in range(len(X_train) // 32):  # Tạo thêm dữ liệu gấp đôi
        X_batch, y_batch = next(aug_iter)
        X_augmented.append(X_batch.reshape(-1, 60 * 60))
        y_augmented.append(y_batch)

    # Kết hợp dữ liệu gốc và dữ liệu augmentation
    X_combined = np.vstack([X_train] + X_augmented)
    y_combined = np.vstack([y_train] + y_augmented)

    return X_combined, y_combined


def plot_training_history(history):
    # Vẽ đồ thị accuracy và loss
    plt.figure(figsize=(12, 4))
    plt.subplot(1, 2, 1)
    plt.plot(history.history['accuracy'], label='Training Accuracy')
    plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
    plt.title('Model Accuracy')
    plt.xlabel('Epoch')
    plt.ylabel('Accuracy')
    plt.legend()

    plt.subplot(1, 2, 2)
    plt.plot(history.history['loss'], label='Training Loss')
    plt.plot(history.history['val_loss'], label='Validation Loss')
    plt.title('Model Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()

    plt.tight_layout()
    plt.savefig('training_history.png')
    plt.show()


# Main training code
try:
    data_dir = "train"
    if not os.path.exists(data_dir):
        raise FileNotFoundError(f"Thư mục {data_dir} không tồn tại!")

    # Tải dữ liệu
    (X_train, y_train), (X_test, y_test), class_names = load_data(data_dir)

    # Chuyển đổi nhãn sang dạng categorical
    y_train_categorical = to_categorical(y_train, num_classes=len(class_names))
    y_test_categorical = to_categorical(y_test, num_classes=len(class_names))

    print(f"Số người nhận dạng: {len(class_names)}")
    print(f"Tên người nhận dạng: {class_names}")
    print(f"Kích thước dữ liệu huấn luyện: {X_train.shape}")
    print(f"Kích thước dữ liệu kiểm tra: {X_test.shape}")

    # Tạo và huấn luyện mô hình
    model = create_model((60 * 60,), len(class_names))
    model.summary()

    # Augmentation dữ liệu
    X_train_aug, y_train_aug = augment_data(X_train, y_train_categorical)
    print(f"Kích thước dữ liệu sau augmentation: {X_train_aug.shape}")

    # Huấn luyện mô hình
    history = model.fit(
        X_train_aug, y_train_aug,
        epochs=50,
        batch_size=32,
        validation_data=(X_test, y_test_categorical),
        verbose=1,
        callbacks=[
            # Dừng sớm nếu validation loss không cải thiện sau 10 epochs
            tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True),
            # Giảm learning rate nếu validation loss không cải thiện
            tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=5)
        ]
    )

    #Vẽ đồ thị quá trình huấn luyện
    plot_training_history(history)

    # Đánh giá mô hình
    test_loss, test_accuracy = model.evaluate(X_test, y_test_categorical, verbose=0)
    print(f"Độ chính xác trên tập test: {test_accuracy:.4f}")

    #Dự đoán
    y_pred = model.predict(X_test)
    y_pred_classes = np.argmax(y_pred, axis=1)
    y_true = np.argmax(y_test_categorical, axis=1)

    model.save("flower_detect_mnist_style.keras")    #Lưu mô hình

    #Kiểm tra độ chính xác trên từng lớp (chỉ tay cần nhận diện)
    class_accuracy = {}
    for i, cls_name in enumerate(class_names):
        class_mask = (y_true == i)
        if np.sum(class_mask) > 0:
            class_acc = np.mean(y_pred_classes[class_mask] == y_true[class_mask])
            class_accuracy[cls_name] = class_acc
            print(f"Độ chính xác khi huấn luyện data của {cls_name}: {class_acc:.4f}")

except Exception as e: #khi train không thành công thì in ra lỗi
    print(f"Lỗi: {e}")
    import traceback
    traceback.print_exc()

In [None]:
# giao diện chỉ tay
import cv2
import numpy as np
from keras.models import load_model
import tkinter as tk
from tkinter import ttk, filedialog, messagebox
from PIL import Image, ImageTk
import os

# Load model (bạn cần huấn luyện trước với dữ liệu chỉ tay)
model = load_model("palm_detect_model.keras")

# Các loại chỉ tay
class_names = ["Chỉ tay Người Giàu", "Chỉ tay Người Nghèo", "Chỉ tay Người Bình Thường"]

# Thông tin chi tiết
palm_info = {
    "Chỉ tay Người Giàu": [
        "Đặc điểm: đường tài lộc rõ ràng, đậm nét, kéo dài đến gò Mộc tinh.",
        "Thường có thêm các đường may mắn song song hoặc cắt chéo đẹp.",
        "Ý nghĩa: người có sự nghiệp thăng tiến, tài chính ổn định, nhiều cơ hội làm giàu."
    ],
    "Chỉ tay Người Nghèo": [
        "Đặc điểm: đường tài lộc mờ, đứt đoạn, khó nhìn thấy.",
        "Đường sinh đạo và trí đạo thường giao nhau hỗn loạn, thiếu mạch lạc.",
        "Ý nghĩa: cuộc sống vất vả, tài chính khó khăn, ít cơ hội tích lũy."
    ],
    "Chỉ tay Người Bình Thường": [
        "Đặc điểm: đường tài lộc có nhưng không đậm, không quá dài.",
        "Đường sinh đạo và trí đạo rõ nhưng không nổi bật.",
        "Ý nghĩa: cuộc sống ổn định ở mức trung bình, đủ ăn đủ mặc, ít biến động lớn."
    ]
}

class PalmRecognitionUI:
    def __init__(self, root):
        self.root = root
        self.root.title("Ứng dụng Nhận Diện Chỉ Tay")
        self.root.geometry("1200x800")
        self.root.configure(bg="#f0f0f0")

        # Biến lưu trữ
        self.image_path = None
        self.cap = None
        self.webcam_running = False
        self.current_frame = None
        self.photo = None
        self.original_image = None
        self.webcam_image = None
        self.create_widgets()
        self.start_webcam()

    def create_widgets(self):
        # Configure style
        style = ttk.Style()
        style.configure('TFrame', background='#f0f0f0')
        style.configure('TLabel', background='#f0f0f0', font=('Arial', 10))
        style.configure('Title.TLabel', background='#f0f0f0', font=('Arial', 20, 'bold'), foreground='#2c3e50')
        style.configure('TButton', font=('Arial', 12), padding=8)

        # Main container
        main_frame = ttk.Frame(self.root, padding="20")
        main_frame.grid(row=0, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Title
        title_label = ttk.Label(main_frame, text="HỆ THỐNG NHẬN DIỆN CHỈ TAY", style='Title.TLabel')
        title_label.grid(row=0, column=0, columnspan=2, pady=(0, 20))

        # Left frame for controls and info
        left_frame = ttk.Frame(main_frame)
        left_frame.grid(row=1, column=0, sticky=(tk.W, tk.E, tk.N, tk.S), padx=(0, 20))

        # Right frame for image/webcam
        right_frame = ttk.Frame(main_frame)
        right_frame.grid(row=1, column=1, sticky=(tk.W, tk.E, tk.N, tk.S))

        # Selection frame
select_frame = ttk.Frame(left_frame)
        select_frame.grid(row=0, column=0, pady=(0, 20), sticky=(tk.W, tk.E))

        # Select button
        self.select_btn = ttk.Button(select_frame, text="📁 CHỌN ẢNH VÀ NHẬN DIỆN",
                                     command=self.select_and_recognize, width=25)
        self.select_btn.grid(row=0, column=0, padx=(0, 10))

        # Webcam button
        self.webcam_btn = ttk.Button(select_frame, text="📷 BẬT/TẮT WEBCAM",
                                     command=self.toggle_webcam, width=20)
        self.webcam_btn.grid(row=0, column=1)

        # Path label
        self.path_label = ttk.Label(select_frame, text="Chưa chọn ảnh nào",
                                    foreground="#7f8c8d", font=('Arial', 11))
        self.path_label.grid(row=1, column=0, columnspan=2, pady=(10, 0), sticky=tk.W)

        # Result frame
        result_frame = ttk.LabelFrame(left_frame, text="KẾT QUẢ NHẬN DIỆN", padding="15")
        result_frame.grid(row=1, column=0, pady=(0, 20), sticky=(tk.W, tk.E))

        self.result_var = tk.StringVar(value="🔄 Chưa có kết quả")
        result_display = tk.Label(result_frame, textvariable=self.result_var,
                                  font=('Arial', 18, 'bold'), foreground="#2c3e50",
                                  background='#ecf0f1', justify=tk.CENTER,
                                  wraplength=400, padx=20, pady=20,
                                  relief=tk.RIDGE, borderwidth=2)
        result_display.grid(row=0, column=0, pady=10)

        # Information frame
        info_frame = ttk.LabelFrame(left_frame, text="THÔNG TIN CHI TIẾT", padding="15")
        info_frame.grid(row=2, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        self.info_text = tk.Text(info_frame, width=60, height=15, font=('Arial', 11),
                                 wrap=tk.WORD, state=tk.DISABLED, bg='#ffffff',
                                 relief=tk.FLAT, borderwidth=1, padx=15, pady=15)
        self.info_text.grid(row=0, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        v_scrollbar = ttk.Scrollbar(info_frame, orient=tk.VERTICAL, command=self.info_text.yview)
        v_scrollbar.grid(row=0, column=1, sticky=(tk.N, tk.S))
        self.info_text.configure(yscrollcommand=v_scrollbar.set)

        # Image/Webcam display frame
        display_frame = ttk.LabelFrame(right_frame, text="XEM TRƯỚC ẢNH/WEBCAM", padding="10")
        display_frame.grid(row=0, column=0, sticky=(tk.W, tk.E, tk.N, tk.S))

        self.image_label = tk.Label(display_frame, bg="#2c3e50", width=50, height=30,
                                    relief=tk.SUNKEN, text="Webcam đang khởi động...")
        self.image_label.grid(row=0, column=0, pady=10, sticky=(tk.W, tk.E, tk.N, tk.S))

        self.capture_btn = ttk.Button(display_frame, text="📸 CHỤP ẢNH VÀ NHẬN DIỆN",
                                      command=self.capture_and_recognize, width=30)
self.capture_btn.grid(row=1, column=0, pady=10)

    def start_webcam(self):
        try:
            self.cap = cv2.VideoCapture(0)
            if not self.cap.isOpened():
                messagebox.showerror("Lỗi", "Không thể truy cập webcam!")
                return
            self.webcam_running = True
            self.update_webcam()
        except Exception as e:
            messagebox.showerror("Lỗi", f"Không thể khởi động webcam: {str(e)}")

    def stop_webcam(self):
        self.webcam_running = False
        if self.cap:
            self.cap.release()
        self.cap = None

    def toggle_webcam(self):
        if self.webcam_running:
            self.stop_webcam()
            self.webcam_btn.configure(text="📷 BẬT WEBCAM")
            self.image_label.configure(image='', text="Webcam đã tắt", bg="#2c3e50", fg="white")
        else:
            self.start_webcam()
            self.webcam_btn.configure(text="📷 TẮT WEBCAM")

    def update_webcam(self):
        if self.webcam_running and self.cap and self.cap.isOpened():
            ret, frame = self.cap.read()
            if ret:
                self.webcam_image = frame.copy()
                frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
                frame_resized = cv2.resize(frame_rgb, (400, 300))
                self.photo = ImageTk.PhotoImage(image=Image.fromarray(frame_resized))
                self.image_label.configure(image=self.photo, text="")
            if self.webcam_running:
                self.root.after(10, self.update_webcam)

    def display_image(self, image):
        if image is None:
            return
        img_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        img_pil = Image.fromarray(img_rgb)
        img_resized = img_pil.resize((400, 300), Image.Resampling.LANCZOS)
        photo = ImageTk.PhotoImage(img_resized)
        self.image_label.config(image=photo)
        self.image_label.image = photo

    def capture_and_recognize(self):
        if self.webcam_image is not None:
            self.original_image = self.webcam_image.copy()
            self.display_image(self.original_image)
            self.path_label.configure(text=f"Đã chụp ảnh từ webcam")
            self.recognize_palm(self.webcam_image, source="webcam")
        else:
            messagebox.showwarning("Cảnh báo", "Không có frame nào từ webcam!")

    def select_and_recognize(self):
        file_path = filedialog.askopenfilename(
            title="Chọn ảnh bàn tay",
            filetypes=[("Image files", "*.jpg *.jpeg *.png *.bmp")]
        )
        if file_path:
            self.image_path = file_path
            self.original_image = cv2.imread(file_path)
            if self.original_image is None:
                messagebox.showerror("Lỗi", "Không thể đọc ảnh!")
                return
            self.display_image(self.original_image)
self.path_label.configure(text=f"Đã chọn: {os.path.basename(file_path)}")
            self.recognize_palm(self.original_image, source="file")

    def recognize_palm(self, image, source="file"):
        if image is None:
            messagebox.showwarning("Cảnh báo", "Không có ảnh để nhận diện!")
            return
        try:
            img_processed = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
            img_processed = cv2.resize(img_processed, (60, 60))
            img_processed = img_processed.astype("float32") / 255.0
            img_processed = img_processed.reshape(1, 60 * 60)

            predictions = model.predict(img_processed, verbose=0)
            class_idx = np.argmax(predictions)
            predicted_name = class_names[class_idx]
            confidence = predictions[0][class_idx] * 100

            self.result_var.set(
                f"✅ NHẬN DIỆN THÀNH CÔNG!\n\nKết quả: {predicted_name}\nĐộ chính xác: {confidence:.2f}%")

            self.show_palm_info(predicted_name)

        except Exception as e:
            messagebox.showerror("Lỗi", f"Lỗi khi nhận diện: {str(e)}")

    def show_palm_info(self, palm_name):
        info = palm_info.get(palm_name, [])
        self.info_text.configure(state=tk.NORMAL)
        self.info_text.delete(1.0, tk.END)
        self.info_text.insert(tk.END, f"THÔNG TIN CHI TIẾT - {palm_name.upper()}\n\n", "title")
        self.info_text.tag_configure("title", font=('Arial', 14, 'bold'), foreground='#2980b9')
        for line in info:
            self.info_text.insert(tk.END, f"• {line}\n\n")
        self.info_text.configure(state=tk.DISABLED)

    def __del__(self):
        if self.cap:
            self.cap.release()


if __name__ == "__main__":
    root = tk.Tk()
    app = PalmRecognitionUI(root)
    root.protocol("WM_DELETE_WINDOW", lambda: (app.stop_webcam(), root.destroy()))
    root.mainloop()
