In [None]:
from Features_Ex import Feature_Extractor_Factory
from Models import ModelFactory
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris




# A.Hướng dẫn sử dụng DataLoader



## **1. DataLoader - Load dữ liệu**
### **1.1. Mô tả chung**
DataLoader giúp load ảnh từ thư mục và trích xuất đặc trưng để phục vụ cho việc huấn luyện mô hình.

### **1.2. Cách sử dụng**
```python
from dataloader import DataLoader

# Định nghĩa đường dẫn chứa ảnh (mỗi thư mục là một class)
dataset_path = "path/to/dataset"

# Khởi tạo DataLoader với các phương pháp trích xuất đặc trưng
dataloader = DataLoader(dataset_path, feature_extractors=[extractor1, extractor2])  
# Thay extractor1, extractor2 bằng các phương pháp trích xuất như color_histogram, hu_moments,...

# Load dữ liệu và chia tập train-test
(X_train, X_test, y_train, y_test), label_encoder = dataloader.load_data(test_size=0.2, random_state=42)
```

### **1.3. Các tham số**
| Tham số          | Mô tả |
|------------------|------|
| `dataset_path`   | Đường dẫn đến thư mục chứa ảnh, mỗi thư mục con là một class. |
| `feature_extractors` | Danh sách các phương pháp trích xuất đặc trưng. |
| `test_size`      | Tỷ lệ tập test, mặc định là `0.2` (20%). |
| `random_state`   | Giá trị seed để đảm bảo tái lập kết quả. |

### **1.4. Output**
- `X_train, X_test`: Dữ liệu đặc trưng đã trích xuất.
- `y_train, y_test`: Nhãn tương ứng.
- `label_encoder`: Bộ mã hóa nhãn giúp chuyển đổi giữa tên class và số nguyên.



## **2. Ghi chú**
- DataLoader tự động đọc ảnh từ thư mục, trích xuất đặc trưng và chuyển đổi nhãn thành số.
- Các đặc trưng có thể kết hợp nhiều phương pháp trích xuất khác nhau.
```


__________________________________________________________________________________________________________________________________________________

# B. Hướng dẫn sử dụng Feature Extractor và Model Factory

## 1. Feature Extraction
### 1.1. Mô tả chung
Feature Extractor giúp trích xuất đặc trưng từ hình ảnh bằng các phương pháp khác nhau. Các phương pháp hiện có:
- **color_histogram**: Trích xuất histogram màu từ ảnh.
- **contour_features**: Trích xuất các đặc trưng liên quan đến contour.
- **hu_moments**: Trích xuất các Hu moments từ ảnh.
- **zernike_moments**: Trích xuất Zernike moments.

### 1.2. Cách sử dụng
```python
from feature_extractor import FeatureExtractor
import cv2

# Đọc ảnh
image = cv2.imread("image.jpg")

# Trích xuất đặc trưng màu
color_hist = FeatureExtractor.extract_feature("color_histogram", image, bins=(8, 8, 8))

# Trích xuất contour features
contour_feat, segmented_image = FeatureExtractor.extract_feature("contour_features", image)

# Trích xuất Hu moments
hu_moments = FeatureExtractor.extract_feature("hu_moments", image)

# Trích xuất Zernike moments (nếu đã cài đặt)
zernike_moments = FeatureExtractor.extract_feature("zernike_moments", image, radius=21)
```

### 1.3. Các tham số có thể điều chỉnh
| Phương pháp             | Tham số             | Mô tả |
|-------------------------|---------------------|------|
| color_histogram        | bins=(8,8,8)       | Số lượng bins cho từng kênh màu. |
| contour_features       | None               | Không có tham số tùy chỉnh. |
| hu_moments            | None               | Không có tham số tùy chỉnh. |
| zernike_moments       | radius=21          | Bán kính cho Zernike moments. |

---
## 2. Model Training
### 2.1. Mô tả chung
Model Factory giúp tạo và huấn luyện các mô hình học máy khác nhau:
- **random_forest** (RF)
- **xgboost** (XGB)
- **lightgbm** (LGBM)

### 2.2. Cách sử dụng
```python
from model_factory import ModelFactory
from sklearn.model_selection import train_test_split
import numpy as np

# Giả sử X là dữ liệu đặc trưng và y là nhãn
X = np.random.rand(100, 20)  # 100 mẫu, 20 đặc trưng
y = np.random.randint(0, 2, 100)  # Nhãn 0 hoặc 1

# Chia tập dữ liệu
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Khởi tạo và train model
model = ModelFactory.create_model("xgboost", n_estimators=100, max_depth=5)
model.fit(X_train, y_train)

# Dự đoán
predictions = model.predict(X_test)
```

### 2.3. Các tham số có thể điều chỉnh
| Mô hình           | Tham số            | Mô tả |
|-------------------|--------------------|------|
| random_forest    | n_estimators=100   | Số lượng cây trong rừng. |
| random_forest    | max_depth=5        | Độ sâu tối đa của cây. |
| xgboost          | n_estimators=100   | Số lượng cây boosting. |
| xgboost          | max_depth=5        | Độ sâu tối đa của cây. |
| lightgbm         | num_leaves=31      | Số lượng lá tối đa. |
| lightgbm         | learning_rate=0.1  | Tốc độ học. |

---
## 3. Tổng kết
- **Feature Extractor** giúp trích xuất đặc trưng từ hình ảnh.
- **Model Factory** giúp tạo và huấn luyện mô hình học máy.
- Có thể điều chỉnh các tham số để phù hợp với từng bài toán cụ thể.
- Code có thể được sử dụng trực tiếp trong Jupyter Notebook hoặc script Python.



In [7]:
from load_data import DataLoader
import Models
import Features_Ex

def main():
    # Load data
    
    # Split data
    data_path=r"C:\Users\DO TUAN MINH\Desktop\ben\Learn\AIL303m\mushroom_nobg_4th - NoOutliers"
    dataloader = DataLoader(data_path,feature_extractors=["color_histogram"])

    (X_train, X_test, y_train, y_test), label_encoder= dataloader.load_data()
    # Create feature extractor
    # feature_extractor = Features_Ex.Feature_Extractor_Factory().create_feature_extractor("hog")
    # # Extract features
    # X_train = feature_extractor.extract_features(X_train)
    # X_test = feature_extractor.extract_features(X_test)

    # Create model
    model = Models.ModelFactory().create_model("svm")
    # Train model
    model.train(X_train, y_train)
    # Test model
    y_pred = model.test(X_test)
    # Evaluate model
    accuracy = model.evaluate(y_test, y_pred)
    print("Accuracy: ", accuracy)

main()

TypeError: 'str' object is not callable