# Template Matching

**Template Matching** là một kỹ thuật trong thị giác máy tính được sử dụng để xác định vị trí của một mẫu nhỏ hoặc khuôn mẫu trong một bức ảnh lớn hơn. Phương pháp này dựa trên so sánh mẫu này với các vùng khác nhau trong ảnh để tìm ra khu vực trùng khớp nhất.

### Nguyên tắc hoạt động

Template Matching hoạt động bằng cách trượt mẫu (template) qua ảnh đích từ trái sang phải và từ trên xuống dưới. Tại mỗi vị trí, nó tính toán một số chỉ số độ tương đồng giữa mẫu và vùng ảnh dưới mẫu. Chỉ số này có thể được tính toán bằng nhiều cách, trong đó phổ biến nhất là sử dụng hàm tương quan chéo, sai số tuyệt đối trung bình, hoặc tổng bình phương sai khác.

### Các bước thực hiện

1. **Chọn Template**: Đầu tiên, cần phải có một mẫu (template), thường là một phần nhỏ của ảnh mà chúng ta muốn tìm kiếm trong ảnh lớn hơn.
   
2. **Trượt Mẫu qua Ảnh**: Mẫu sẽ được trượt qua từng vị trí trong ảnh. Tại mỗi vị trí, một khu vực của ảnh sẽ được so sánh với mẫu.
   
3. **Tính Toán Độ Tương Đồng**: Độ tương đồng giữa mẫu và khu vực đang xét được tính toán. Phương pháp tính toán phụ thuộc vào lựa chọn thuật toán (ví dụ: tương quan chéo).
   
4. **Xác Định Vị Trí Tốt Nhất**: Vị trí mà tại đó mẫu có độ tương đồng cao nhất với khu vực trong ảnh sẽ được xác định là vị trí phát hiện mẫu.

### Ứng dụng

Template Matching thường được sử dụng trong các ứng dụng như kiểm tra chất lượng sản phẩm trong công nghiệp, theo dõi đối tượng trong video, và nhận dạng ký tự trong các hình ảnh.

### Hạn chế

Mặc dù hữu ích, Template Matching có một số hạn chế. Nó không hiệu quả với những ảnh có sự thay đổi về góc nhìn, kích thước hoặc khi ảnh bị biến dạng. Ngoài ra, phương pháp này cũng yêu cầu khá nhiều thời gian tính toán khi ảnh có kích thước lớn.

### Kết luận

Template Matching là một công cụ đơn giản nhưng mạnh mẽ trong thị giác máy tính để phát hiện vị trí của một đối tượng trong ảnh. Tuy nhiên, để đạt hiệu quả cao,

 cần lựa chọn và điều chỉnh kỹ lưỡng các tham số của phương pháp phù hợp với từng ứng dụng cụ thể.

Để thực hiện phát hiện đối tượng trong ảnh sử dụng phương pháp Template Matching bằng Python, bạn có thể sử dụng thư viện OpenCV, một thư viện mã nguồn mở phổ biến cho xử lý hình ảnh và thị giác máy tính. Dưới đây là các bước và code minh họa để thực hiện điều này:

### Các Bước Thực Hiện

1. **Nhập Thư Viện và Đọc Ảnh**: Nhập thư viện OpenCV và đọc ảnh nguồn cùng với ảnh mẫu (template).

2. **Áp Dụng Template Matching**: Sử dụng hàm `cv2.matchTemplate()` để so sánh template với ảnh nguồn.

3. **Xác Định Vị Trí Phát Hiện**: Sử dụng hàm `cv2.minMaxLoc()` để tìm vị trí của độ tương đồng cao nhất, nơi phát hiện template.

4. **Vẽ Hình Chữ Nhật Xung Quanh Đối Tượng Đã Phát Hiện**: Dùng hàm `cv2.rectangle()` để vẽ hình chữ nhật xung quanh khu vực đã tìm thấy trong ảnh nguồn.

### Code Minh Họa

```python
import cv2
import numpy as np

# Đọc ảnh nguồn và ảnh mẫu (template)
img = cv2.imread('source_image.jpg')
template = cv2.imread('template_image.jpg')
h, w = template.shape[:2]

# Áp dụng Template Matching
res = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)

# Tìm vị trí của độ tương đồng cao nhất
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)

# Tính toán vị trí góc trên cùng bên trái của khu vực tìm thấy
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)

# Vẽ hình chữ nhật xung quanh đối tượng phát hiện
cv2.rectangle(img, top_left, bottom_right, (0, 255, 0), 2)

# Hiển thị ảnh
cv2.imshow('Detected Object', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
```

### Giải Thích Các Hàm và Lệnh

- `cv2.imread()`: Đọc ảnh từ file. Trả về một mảng numpy chứa dữ liệu pixel của ảnh.

- `cv2.matchTemplate(image, templ, method)`: Hàm này trượt mẫu `templ` qua `image`, sử dụng phương pháp `method` để tính độ tương đồng. `cv2.TM_CCOEFF_NORMED` là một trong những phương pháp, cho phép chuẩn hóa kết quả tương quan, giúp dễ dàng xác định vị trí tốt nhất.

- `cv2.minMaxLoc()`: Tìm giá trị và vị trí của giá trị nhỏ nhất và lớn nhất trong một mảng. Trong trường hợp này, chúng ta tìm vị trí của giá trị lớn nhất (max_loc) để xác định nơi template khớp nhất với ảnh.

- `cv2.rectangle()`: Vẽ một hình chữ nhật. Các tham số bao gồm ảnh nguồn, điểm góc trên bên trái, điểm góc dưới bên phải, màu sắc (ở đây là màu xanh lá cây với mã RGB), và độ dày của đường viền.

- `cv2.imshow()`: Hiển thị một cửa sổ chứa ảnh. Cửa s

ổ sẽ tự đóng khi bạn nhấn bất kỳ phím nào.

Phương pháp Template Matching là một cách tiếp cận cơ bản nhưng hiệu quả trong nhiều trường hợp sử dụng cụ thể, tuy nhiên nó có thể không phù hợp với mọi tình huống, đặc biệt là khi ảnh có sự thay đổi lớn về kích thước hoặc góc nhìn.

In [2]:
import cv2
import numpy as np

# Đọc ảnh nguồn và ảnh mẫu (template)
img = cv2.imread('sammy.jpg')
template = cv2.imread('sammy_face.jpg')
h, w = template.shape[:2]

# Áp dụng Template Matching
res = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)

# Tìm vị trí của độ tương đồng cao nhất
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)

# Tính toán vị trí góc trên cùng bên trái của khu vực tìm thấy
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)

# Vẽ hình chữ nhật xung quanh đối tượng phát hiện
cv2.rectangle(img, top_left, bottom_right, (0, 255, 0), 2)

# Hiển thị ảnh
cv2.imshow('Detected Object', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

# PHÁT HIỆN ĐỐI TƯỢNG VỚI HAAR CASCADES

## 2.1  Tìm hiểu và trình bày những hiểu biết về thuật toán Haar Cascades thông qua bài báo: Viola, Paul & Jones, Michael. (2001). Rapid Object Detection using a Boosted Cascade  of  Simple  Features.  IEEE  Conf  Comput  Vis  Pattern  Recognit.  1.  I-511. 10.1109/CVPR.2001.990517. 

Thuật toán Haar Cascades, được phát triển bởi Paul Viola và Michael Jones trong bài báo "Rapid Object Detection using a Boosted Cascade of Simple Features", là một trong những kỹ thuật đột phá trong lĩnh vực phát hiện đối tượng, đặc biệt là phát hiện khuôn mặt trong ảnh và video. Dưới đây là tổng quan và các điểm chính từ bài báo này:

### Khái niệm cơ bản

Haar Cascades là một phương pháp dựa trên học máy để phát hiện các đối tượng trong ảnh. Nó sử dụng các đặc trưng Haar, được lấy cảm hứng từ các sóng Haar, để xác định các đặc điểm đơn giản của khuôn mặt như cạnh, đường chéo, v.v. Thuật toán này sử dụng cấu trúc "cascade", nghĩa là các bộ phân loại đơn giản (weak classifiers) được xếp chồng lên nhau trong một chuỗi, với mỗi bộ phân loại tập trung vào một đặc điểm cụ thể của đối tượng.

### Lý thuyết và Phương pháp

1. **Đặc trưng Haar**: Các đặc trưng Haar là sự khác biệt về giá trị pixel giữa các khu vực nhất định trong ảnh. Ví dụ, một đặc trưng có thể là sự khác biệt giữa tổng giá trị pixel của hai khu vực đứng cạnh nhau.

2. **Hình chóp ảnh (Image Pyramid)**: Để phát hiện đối tượng ở các kích thước khác nhau, thuật toán sử dụng hình chóp ảnh, nơi mỗi tầng của hình chóp là bản thu nhỏ của ảnh gốc.

3. **Bộ phân loại AdaBoost**: Để chọn ra những đặc trưng Haar tốt nhất và huấn luyện các bộ phân loại, thuật toán sử dụng AdaBoost. Phương pháp này chọn các đặc trưng Haar hiệu quả nhất và tạo thành một "strong classifier" bằng cách kết hợp nhiều "weak classifiers".

4. **Cascades**: Để giảm thiểu thời gian xử lý, các bộ phân loại được sắp xếp theo dạng cascade. Các bộ phân loại đầu tiên trong chuỗi (các weak classifiers đơn giản) loại bỏ nhanh chóng các khu vực không chứa đối tượng, và chỉ các khu vực tiềm năng mới được chuyển qua các bộ phân loại phức tạp hơn.

### Ứng dụng và Hiệu quả

Phương pháp Haar Cascades nổi tiếng với khả năng phát hiện khuôn mặt và các đối tượng khác một cách nhanh chóng và hiệu quả. Nó được sử dụng rộng rãi trong các ứng dụng thực tế như camera giám sát, phân tích video và nhiều hệ thống an ninh khác nhau. Mặc dù có hiệu quả, thuật toán này có thể không hoạt động tốt trong các điều kiện ánh sáng yếu hoặc khi đối tượng có tư thế, biểu cảm, hoặc góc nhìn thay đổi đáng kể.

### Kết luận

Bài báo của Viola và Jones đã đánh dấu một bước ngoặt trong lĩnh vực nhận d

ạng đối tượng, với phương pháp Haar Cascades mang lại một giải pháp hiệu quả về mặt tốc độ và độ chính xác. Cách tiếp cận này tiếp tục được nghiên cứu và cải tiến trong nhiều năm sau đó, làm cơ sở cho các nghiên cứu tiếp theo trong phát hiện đối tượng và nhận dạng khuôn mặt.

Để phát hiện đối tượng trong Python sử dụng thuật toán Haar Cascades của OpenCV, bạn cần thực hiện các bước sau đây. Đoạn code mẫu sẽ minh họa cách phát hiện khuôn mặt, nhưng bạn có thể thay đổi cascade để phát hiện các loại đối tượng khác như mắt, xe hơi, v.v.

### Các Bước Thực Hiện

1. **Cài đặt và Nhập Thư Viện**: Đảm bảo rằng bạn đã cài đặt thư viện OpenCV. Nếu chưa, bạn có thể cài đặt nó thông qua pip: `pip install opencv-python-headless`.

2. **Tải và Đọc Cascade**: Tải file Haar Cascade cho đối tượng cần phát hiện. OpenCV cung cấp một số file XML sẵn có cho khuôn mặt, mắt, v.v.

3. **Đọc Ảnh hoặc Video**: Đọc ảnh hoặc video mà bạn muốn phát hiện đối tượng.

4. **Áp dụng Haar Cascades**: Sử dụng cascade đã tải để phát hiện đối tượng trong ảnh hoặc video.

5. **Hiển thị Kết Quả**: Vẽ hình chữ nhật xung quanh các đối tượng đã phát hiện và hiển thị kết quả.

### Code Minh Họa

Đoạn code sau đây minh họa cách phát hiện khuôn mặt trong một ảnh:

```python
import cv2

# Đường dẫn đến file Haar Cascade
face_cascade_path = 'haarcascade_frontalface_default.xml'

# Khởi tạo bộ phân loại Haar Cascade
face_cascade = cv2.CascadeClassifier(face_cascade_path)

# Đọc ảnh từ đĩa
img = cv2.imread('path_to_image.jpg')

# Chuyển đổi ảnh sang màu xám
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Phát hiện khuôn mặt trong ảnh
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

# Vẽ hình chữ nhật xung quanh mỗi khuôn mặt
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)

# Hiển thị kết quả
cv2.imshow('Face Detection', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
```

### Giải Thích Code

- `cv2.CascadeClassifier()`: Tải file XML của Haar Cascade, nơi chứa dữ liệu để phát hiện đối tượng.

- `cv2.imread()`: Đọc ảnh từ đường dẫn cung cấp.

- `cv2.cvtColor()`: Chuyển đổi ảnh từ màu BGR (mặc định của OpenCV) sang màu xám vì Haar Cascades yêu cầu đầu vào là ảnh màu xám.

- `face_cascade.detectMultiScale()`: Phương thức này phát hiện đối tượng. `scaleFactor` là thông số chỉ ra mức độ giảm kích thước của hình ảnh, `minNeighbors` là số lượng đối tượng lân cận cần có để xác định đối tượng là hiện diện, và `minSize` là kích thước tối thiểu của đối tượng được phát hiện.

- `cv2.rectangle()`: Vẽ hình chữ nhật xung quanh đối tượng đã phát hiện.

- `cv2.imshow()`: Hiển thị ảnh kết quả.

### Lưu ý

Để chạy đoạn code này, bạn cần có file XML của Haar Cascade (`haarcascade_frontalface_default.xml`) và một ảnh (`path_to_image.jpg`). File

 XML có thể được tải xuống từ kho lưu trữ của OpenCV hoặc từ một nguồn khác trực tuyến.

In [4]:
import cv2

# Đường dẫn đến file Haar Cascade
face_cascade_path = 'haarcascade_frontalface_default.xml'

# Khởi tạo bộ phân loại Haar Cascade
face_cascade = cv2.CascadeClassifier(face_cascade_path)

# Đọc ảnh từ đĩa
img = cv2.imread('Nadia_Murad.jpg')

# Chuyển đổi ảnh sang màu xám
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Phát hiện khuôn mặt trong ảnh
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

# Vẽ hình chữ nhật xung quanh mỗi khuôn mặt
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)

# Hiển thị kết quả
cv2.imshow('Face Detection', img)
cv2.waitKey(0)
cv2.destroyAllWindows()


In [5]:
import cv2

# Đường dẫn đến file Haar Cascade
face_cascade_path = 'haarcascade_frontalface_default.xml'

# Khởi tạo bộ phân loại Haar Cascade
face_cascade = cv2.CascadeClassifier(face_cascade_path)

# Đọc ảnh từ đĩa
img = cv2.imread('solvay_conference.jpg')

# Chuyển đổi ảnh sang màu xám
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Phát hiện khuôn mặt trong ảnh
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

# Vẽ hình chữ nhật xung quanh mỗi khuôn mặt
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)

# Hiển thị kết quả
cv2.imshow('Face Detection', img)
cv2.waitKey(0)
cv2.destroyAllWindows()


In [6]:
import cv2

# Đường dẫn đến file Haar Cascade
face_cascade_path = 'haarcascade_frontalface_default.xml'

# Khởi tạo bộ phân loại Haar Cascade
face_cascade = cv2.CascadeClassifier(face_cascade_path)

# Đọc ảnh từ đĩa
img = cv2.imread('Denis_Mukwege.jpg')

# Chuyển đổi ảnh sang màu xám
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Phát hiện khuôn mặt trong ảnh
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

# Vẽ hình chữ nhật xung quanh mỗi khuôn mặt
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)

# Hiển thị kết quả
cv2.imshow('Face Detection', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
