## Cut image from video

In [2]:
import cv2
import os

def extract_frames(video_path, output_folder):
    # Tạo một đối tượng VideoCapture
    cap = cv2.VideoCapture(video_path)

    # Kiểm tra xem video có được mở thành công không
    if not cap.isOpened():
        print("Không thể mở video.")
        return

    # Tạo thư mục lưu trữ frame nếu nó chưa tồn tại
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # Đếm số frame
    frame_count = 0

    # Tần suất frame cắt (1s cắt 25 frame)
    frames_per_second = 20

    # Lấy tổng số frame
    total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    print("Lấy tổng số frame: ",total_frames)
    # Tổng số giây của video
    total_seconds = total_frames / cap.get(cv2.CAP_PROP_FPS)
    print("Tổng số giây của video: ",total_seconds)

    # Tính toán số frame cắt ra cho mỗi giây
    frames_to_cut = frames_per_second * total_seconds
    print("Tính toán số frame cắt ra cho mỗi giây: ",frames_to_cut)
    # Đọc từng frame từ video và lưu vào thư mục
    while True:
        # Đọc một frame
        ret, frame = cap.read()

        # Kiểm tra nếu không còn frame nào hoặc có lỗi xảy ra
        if not ret:
            break

        # Kiểm tra nếu đến điểm cắt frame
        if frame_count % int(total_frames // frames_to_cut) == 0:
            # Ghi frame vào thư mục
            frame_path = os.path.join(output_folder, f"frame1_{frame_count:04d}.jpg")
            cv2.imwrite(frame_path, frame)

        # Tăng biến đếm frame
        frame_count += 1

    # Giải phóng các tài nguyên
    cap.release()
    cv2.destroyAllWindows()


# Sử dụng hàm extract_frames
video_path = '/run/user/1000/gvfs/mtp:host=OPPO_CPH1911_MVTCZSGEEA4H85F6/Bộ nhớ trong dùng chung/DCIM/Camera/VID20240406000829.mp4'
output_folder = 'add'
extract_frames(video_path, output_folder)


Không thể mở video.


In [None]:
import os
import shutil

# Đường dẫn đến folder nguồn
source_folder = "/media/rambo/HDD/University/DATN/Drowsiness Detection/Data/Data/tets"

# Đường dẫn đến folder đích
destination_folder = "version2/Drowsiness"

# Lặp qua tất cả các tệp trong folder nguồn
for filename in os.listdir(source_folder):
    # Kiểm tra nếu tệp có phần mở rộng là .jpeg
    if filename.endswith(".jpg"):
        # Tạo đường dẫn đầy đủ tới tệp nguồn và tệp đích
        source_path = os.path.join(source_folder, filename)
        destination_path = os.path.join(destination_folder, filename)

        # Di chuyển tệp từ folder nguồn sang folder đích
        shutil.move(source_path, destination_path)
        print(f"Đã chuyển: {filename}")



In [20]:
video_path1 = '/media/rambo/HDD/University/DATN/Drowsiness Detection/Data/NITYMED/MALE.mp4'
extract_frames(video_path1, output_folder)

Lấy tổng số frame:  6713
Tổng số giây của video:  268.52
Tính toán số frame cắt ra cho mỗi giây:  6713.0


In [23]:
video_path2 = '/media/rambo/HDD/University/DATN/Drowsiness Detection/Data/NITYMED/notdrowsiness.mp4'
output_folder2 = '/media/rambo/HDD/University/DATN/Drowsiness Detection/Data/NITYMED/NotDrowsiness'
extract_frames(video_path2, output_folder2)

Lấy tổng số frame:  12511
Tổng số giây của video:  500.44
Tính toán số frame cắt ra cho mỗi giây:  12511.0


## Count Image

In [10]:
import glob
import os

def count_jpg_images(folder_path):
    # Sử dụng glob để tìm tất cả các file JPG trong thư mục
    jpg_files = glob.glob(os.path.join(folder_path, '*.jpg'))
    
    # Đếm số lượng file JPG
    count = len(jpg_files)
    
    return count

# Đường dẫn đến thư mục chứa ảnh
notdrowsiness_folder = 'version2/NotDrowsiness'
drowsiness_folder = 'version2/Drowsiness'

# Gọi hàm để đếm số lượng ảnh JPG trong thư mục
notdrowsiness_count = count_jpg_images(notdrowsiness_folder)
drowsiness_count = count_jpg_images(drowsiness_folder)
# In kết quả
print(f"Số lượng ảnh Drowsiness: {drowsiness_count}")
print(f"Số lượng ảnh not Drowsiness: {notdrowsiness_count}")

Số lượng ảnh Drowsiness: 0
Số lượng ảnh not Drowsiness: 10362


## chuyen anh dang folder khac

In [None]:
import os
import shutil

def move_images(source_folder, dest_folder, num_images):
    # Đảm bảo rằng thư mục đích tồn tại hoặc tạo mới nếu chưa tồn tại
    if not os.path.exists(dest_folder):
        os.makedirs(dest_folder)

    # Lấy danh sách tệp tin ảnh từ thư mục nguồn
    image_files = [f for f in os.listdir(source_folder) if f.endswith(('.jpg', '.jpeg', '.png'))]

    # Chỉ di chuyển số lượng hình ảnh mong muốn
    num_images = min(num_images, len(image_files))

    # Di chuyển từng ảnh đến thư mục đích
    for image in image_files[:num_images]:
        source_path = os.path.join(source_folder, image)
        dest_path = os.path.join(dest_folder, image)
        shutil.move(source_path, dest_path)
        print(f"Đã chuyển {image} đến {dest_folder}")

def main():
    source_folder = "add"
    dest_folder = "data/train/Drowsiness"
    num_images = 600

    move_images(source_folder, dest_folder, num_images)

if __name__ == "__main__":
    main()


## Rename Image

In [22]:
import os

# Đường dẫn đến thư mục
folder_path = "add"

# Lặp qua tất cả các tệp trong thư mục và sắp xếp theo thứ tự tăng dần
file_list = sorted(os.listdir(folder_path))
for idx, filename in enumerate(file_list, start=1):
    if filename.endswith(".jpg"):
        # Đổi tên tệp
        new_filename = f"new_name_{idx}.jpg"
        os.rename(os.path.join(folder_path, filename), os.path.join(folder_path, new_filename))
        print(f"Đã đổi tên: {filename} thành {new_filename}")


Đã đổi tên: frame_0005_new.jpg thành new_name_1.jpg
Đã đổi tên: frame_0006_new.jpg thành new_name_2.jpg
Đã đổi tên: frame_0007_new.jpg thành new_name_3.jpg
Đã đổi tên: frame_0008_new.jpg thành new_name_4.jpg
Đã đổi tên: frame_0009_new.jpg thành new_name_5.jpg
Đã đổi tên: frame_0010_new.jpg thành new_name_6.jpg
Đã đổi tên: frame_0011_new.jpg thành new_name_7.jpg
Đã đổi tên: frame_0012_new.jpg thành new_name_8.jpg
Đã đổi tên: frame_0013_new.jpg thành new_name_9.jpg
Đã đổi tên: frame_0014_new.jpg thành new_name_10.jpg
Đã đổi tên: frame_0015_new.jpg thành new_name_11.jpg
Đã đổi tên: frame_0016_new.jpg thành new_name_12.jpg
Đã đổi tên: frame_0017_new.jpg thành new_name_13.jpg
Đã đổi tên: frame_0018_new.jpg thành new_name_14.jpg
Đã đổi tên: frame_0019_new.jpg thành new_name_15.jpg
Đã đổi tên: frame_0020_new.jpg thành new_name_16.jpg
Đã đổi tên: frame_0021_new.jpg thành new_name_17.jpg
Đã đổi tên: frame_0207_new.jpg thành new_name_18.jpg
Đã đổi tên: frame_0208_new.jpg thành new_name_19.jpg
Đã

## Landmark image

In [1]:
import cv2
import mediapipe as mp

# # Khởi tạo đối tượng Mediapipe
# mp_face_mesh = mp.solutions.face_mesh

# # Đọc ảnh
# image = cv2.imread('frame1_0.jpg')

# # Khởi tạo bộ xử lý nhận diện landmark khuôn mặt
# with mp_face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1, min_detection_confidence=0.5) as face_mesh:
#     # Chuyển đổi ảnh sang định dạng RGB
#     image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
#     # Nhận diện landmark trên khuôn mặt
#     results = face_mesh.process(image_rgb)

#     # Vẽ landmark lên ảnh
#     if results.multi_face_landmarks:
#         for face_landmarks in results.multi_face_landmarks:
#             for landmark in face_landmarks.landmark:
#                 cx, cy = int(landmark.x * image.shape[1]), int(landmark.y * image.shape[0])
#                 cv2.circle(image, (cx, cy), 1, (0, 255, 0), -1)

#     # Hiển thị ảnh kết quả
#     cv2.imshow('Image with Face Landmarks', image)
#     cv2.waitKey(0)
#     cv2.destroyAllWindows()


In [None]:
import cv2
import mediapipe as mp
import time

def get_landmarks(image_path):
    start1 = time.time()
    # Left eyes indices 
    Points =[ 46, 111, 276, 448]

    # Tạo đối tượng của lớp Mediapipe EyeLandmark
    mp_eye_landmarks = mp.solutions.face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1)

    # Đọc ảnh
    image = cv2.imread(image_path)

    # Chuyển đổi ảnh sang không gian màu RGB
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

    # Nhận diện landmarks của khuôn mặt trên ảnh
    results = mp_eye_landmarks.process(image_rgb)

    # Kiểm tra xem có landmarks nào được nhận diện không
    if results.multi_face_landmarks:
        # Lấy danh sách các landmarks của khuôn mặt đầu tiên trong ảnh
        face_landmarks = results.multi_face_landmarks[0]

        # Tạo danh sách tọa độ của các điểm LEFT_EYE
        points_landmarks = []

        for index in Points:
            landmark = face_landmarks.landmark[index]
            landmark_x = int(landmark.x * image.shape[1])
            landmark_y = int(landmark.y * image.shape[0])
            points_landmarks.append((landmark_x, landmark_y))

            # print(f"Landmark {index}: ({landmark_x}, {landmark_y})")

        # Vẽ một hình tròn đỏ tại mỗi điểm LEFT_EYE trên ảnh
        for landmark in points_landmarks:
            cv2.circle(image, landmark, 1, (0, 0, 255), -1)    

    # image = cv2.imread("frame1_0.jpg")
    # start_px = min(points_landmarks[0][0],points_landmarks[1][0])
    # start_py = min(points_landmarks[0][1],points_landmarks[2][1])
    # end_px = max(points_landmarks[2][0],points_landmarks[3][0])
    # end_py = max(points_landmarks[1][1],points_landmarks[3][1])
    # cropped_image = image[start_py:end_py, start_px:end_px]
    # cv2.imwrite("test.jpg", cropped_image)

    # Hiển thị ảnh kết quả
    end1 = time.time() - start1
    print("Time: ",end1)
    cv2.imshow("Landmarks", image)
    cv2.imwrite("test.jpg",image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    return points_landmarks


img_path = r"/media/rambo/HDD/University/DATN/Drowsiness Detection/Code/23032024/Drowsiness.jpg"
A = get_landmarks(img_path)


In [17]:
# Points =[ 63, 117, 293, 346]
A

[(906, 727), (900, 838), (1415, 646), (1395, 753)]

In [None]:
import cv2
import mediapipe as mp

# Khởi tạo Face Mesh detection
mp_face_mesh = mp.solutions.face_mesh
mp_drawing = mp.solutions.drawing_utils

# Khởi tạo webcam
cap = cv2.VideoCapture(0)

# Kích thước của vùng cắt
cut_size = (224, 224)

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break
    # frame = cv2.imread('frame_0000.jpg')
    # Chuyển đổi ảnh sang không gian màu RGB (Mediapipe yêu cầu đầu vào là RGB)
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

    # Nhận diện landmark trên khuôn mặt
    with mp_face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1) as face_mesh:
        results = face_mesh.process(frame_rgb)
        if results.multi_face_landmarks:
            # Tính toán tọa độ của các điểm cần cắt cho vùng 1
            points_to_cut1 = [464, 443, 265, 450]
            landmarks = results.multi_face_landmarks[0].landmark
            min_x1 = min(landmarks[i].x * frame.shape[1] for i in points_to_cut1)
            min_y1 = min(landmarks[i].y * frame.shape[0] for i in points_to_cut1)
            max_x1 = max(landmarks[i].x * frame.shape[1] for i in points_to_cut1)
            max_y1 = max(landmarks[i].y * frame.shape[0] for i in points_to_cut1)

            # Tính toán tọa độ của các điểm cần cắt cho vùng 2
            points_to_cut2 = [124, 223, 244, 230]
            min_x2 = min(landmarks[i].x * frame.shape[1] for i in points_to_cut2)
            min_y2 = min(landmarks[i].y * frame.shape[0] for i in points_to_cut2)
            max_x2 = max(landmarks[i].x * frame.shape[1] for i in points_to_cut2)
            max_y2 = max(landmarks[i].y * frame.shape[0] for i in points_to_cut2)

            # Cắt vùng mắt từ ảnh và resize về kích thước 224x224
            cut_region1 = frame[int(min_y1):int(max_y1), int(min_x1):int(max_x1)]
            resized_cut_region1 = cv2.resize(cut_region1, cut_size)

            cut_region2 = frame[int(min_y2):int(max_y2), int(min_x2):int(max_x2)]
            resized_cut_region2 = cv2.resize(cut_region2, cut_size)

            # Hiển thị vùng cắt đã resize
            # cv2.imshow("Resized Cut Region 1", resized_cut_region1)
            # cv2.imshow("Resized Cut Region 2", resized_cut_region2)

            # Ghép lại các vùng cắt đã resize
            merged_image = cv2.hconcat([resized_cut_region2, resized_cut_region1])

            # Hiển thị ảnh đã ghép
            cv2.imshow("Merged Image", merged_image)

    # Hiển thị frame gốc
    cv2.imshow("Frame", frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()


In [None]:
import cv2
import mediapipe as mp
# one image
# Chuyển đổi ảnh sang không gian màu RGB (Mediapipe yêu cầu đầu vào là RGB)
frame = cv2.imread('frame_0000.jpg')
frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
# Khởi tạo Face Mesh detection
mp_face_mesh = mp.solutions.face_mesh
mp_drawing = mp.solutions.drawing_utils
cut_size = (224, 224)


# Nhận diện landmark trên khuôn mặt
with mp_face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1) as face_mesh:
    results = face_mesh.process(frame_rgb)
    if results.multi_face_landmarks:
        # Tính toán tọa độ của các điểm cần cắt cho vùng 1
        points_to_cut1 = [464, 443, 265, 450]
        landmarks = results.multi_face_landmarks[0].landmark
        min_x1 = min(landmarks[i].x * frame.shape[1] for i in points_to_cut1)
        min_y1 = min(landmarks[i].y * frame.shape[0] for i in points_to_cut1)
        max_x1 = max(landmarks[i].x * frame.shape[1] for i in points_to_cut1)
        max_y1 = max(landmarks[i].y * frame.shape[0] for i in points_to_cut1)

        # Tính toán tọa độ của các điểm cần cắt cho vùng 2
        points_to_cut2 = [124, 223, 244, 230]
        min_x2 = min(landmarks[i].x * frame.shape[1] for i in points_to_cut2)
        min_y2 = min(landmarks[i].y * frame.shape[0] for i in points_to_cut2)
        max_x2 = max(landmarks[i].x * frame.shape[1] for i in points_to_cut2)
        max_y2 = max(landmarks[i].y * frame.shape[0] for i in points_to_cut2)

        # Cắt vùng mắt từ ảnh và resize về kích thước 224x224
        cut_region1 = frame[int(min_y1):int(max_y1), int(min_x1):int(max_x1)]
        resized_cut_region1 = cv2.resize(cut_region1, cut_size)

        cut_region2 = frame[int(min_y2):int(max_y2), int(min_x2):int(max_x2)]
        resized_cut_region2 = cv2.resize(cut_region2, cut_size)

        # Hiển thị vùng cắt đã resize
        cv2.imshow("Resized Cut Region 1", resized_cut_region1)
        # cv2.imshow("Resized Cut Region 2", resized_cut_region2)

        # Ghép lại các vùng cắt đã resize
        # merged_image = cv2.hconcat([resized_cut_region2, resized_cut_region1])

        # # Hiển thị ảnh đã ghép
        # cv2.imshow("Merged Image", merged_image)

## Extract eye version 1

In [None]:
import cv2
import mediapipe as mp
import os
import time

# def get_landmarks(image_path):
#     # start1 = time.time()
#     # Left eyes indices 
#     Points =[ 63, 117, 293, 346]

#     # Tạo đối tượng của lớp Mediapipe EyeLandmark
#     mp_eye_landmarks = mp.solutions.face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1)

#     # Đọc ảnh
#     image = cv2.imread(image_path)

#     # Chuyển đổi ảnh sang không gian màu RGB
#     image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

#     # Nhận diện landmarks của khuôn mặt trên ảnh
#     results = mp_eye_landmarks.process(image_rgb)

#     # Kiểm tra xem có landmarks nào được nhận diện không
#     if results.multi_face_landmarks:
#         # Lấy danh sách các landmarks của khuôn mặt đầu tiên trong ảnh
#         face_landmarks = results.multi_face_landmarks[0]

#         # Tạo danh sách tọa độ của các điểm LEFT_EYE
#         points_landmarks = []

#         for index in Points:
#             landmark = face_landmarks.landmark[index]
#             landmark_x = int(landmark.x * image.shape[1])
#             landmark_y = int(landmark.y * image.shape[0])
#             points_landmarks.append((landmark_x, landmark_y))

#         # Vẽ một hình tròn đỏ tại mỗi điểm LEFT_EYE trên ảnh
#         # for landmark in points_landmarks:
#         #     cv2.circle(image, landmark, 1, (0, 0, 255), -1)  

#     start_px = min(points_landmarks[0][0],points_landmarks[1][0])
#     start_py = min(points_landmarks[0][1],points_landmarks[2][1])
#     end_px = max(points_landmarks[2][0],points_landmarks[3][0])
#     end_py = max(points_landmarks[1][1],points_landmarks[3][1])
#     cropped_image = image[start_py:end_py, start_px:end_px]  

#     # Tạo tên file lưu sau khi sửa đổi (cùng tên với file gốc)
#     img_name = os.path.basename(image_path)
#     output_path = os.path.join("NotDrowsiness", img_name)

#     # Lưu ảnh sau khi sửa đổi
#     cv2.imwrite(output_path, cropped_image)

#     # Hiển thị ảnh kết quả
#     # end1 = time.time() - start1
#     # print("Time: ", end1)
#     # cv2.imshow("Landmarks", image)
#     # cv2.waitKey(0)
#     # cv2.destroyAllWindows()



In [4]:
import cv2
import mediapipe as mp
import os
import time

# def get_landmarks(image_path):
#     # start1 = time.time()
#     # Left eyes indices 
#     Points =[ 63, 117, 293, 346]

#     # Tạo đối tượng của lớp Mediapipe EyeLandmark
#     mp_eye_landmarks = mp.solutions.face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1)

#     # Đọc ảnh
#     image = cv2.imread(image_path)

#     # Chuyển đổi ảnh sang không gian màu RGB
#     image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

#     # Nhận diện landmarks của khuôn mặt trên ảnh
#     results = mp_eye_landmarks.process(image_rgb)

#     # Kiểm tra xem có landmarks nào được nhận diện không
#     if results.multi_face_landmarks:
#         # Lấy danh sách các landmarks của khuôn mặt đầu tiên trong ảnh
#         face_landmarks = results.multi_face_landmarks[0]

#         # Tạo danh sách tọa độ của các điểm LEFT_EYE
#         points_landmarks = []

#         for index in Points:
#             landmark = face_landmarks.landmark[index]
#             landmark_x = int(landmark.x * image.shape[1])
#             landmark_y = int(landmark.y * image.shape[0])
#             points_landmarks.append((landmark_x, landmark_y))

#         # Vẽ một hình tròn đỏ tại mỗi điểm LEFT_EYE trên ảnh
#         # for landmark in points_landmarks:
#         #     cv2.circle(image, landmark, 1, (0, 0, 255), -1)  

#     start_px = min(points_landmarks[0][0],points_landmarks[1][0])
#     start_py = min(points_landmarks[0][1],points_landmarks[2][1])
#     end_px = max(points_landmarks[2][0],points_landmarks[3][0])
#     end_py = max(points_landmarks[1][1],points_landmarks[3][1])
#     cropped_image = image[start_py:end_py, start_px:end_px]  

#     # Tạo tên file lưu sau khi sửa đổi (cùng tên với file gốc)
#     img_name = os.path.basename(image_path)
#     output_path = os.path.join("NotDrowsiness", img_name)

#     # Lưu ảnh sau khi sửa đổi
#     cv2.imwrite(output_path, cropped_image)

#     # Hiển thị ảnh kết quả
#     # end1 = time.time() - start1
#     # print("Time: ", end1)
#     # cv2.imshow("Landmarks", image)
#     # cv2.waitKey(0)
#     # cv2.destroyAllWindows()

# Thư mục chứa ảnh
folder_path = "/media/rambo/HDD/University/DATN/Drowsiness Detection/Data/NITYMED/NotDrowsiness"
Points =[ 63, 117, 293, 346]
mp_eye_landmarks = mp.solutions.face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1)

# Duyệt qua tất cả các file trong thư mục và xử lý chúng
for filename in os.listdir(folder_path):
    if filename.endswith(".jpg") :
        image_path = os.path.join(folder_path, filename)
        points_landmarks = []
        # Đọc ảnh
        image = cv2.imread(image_path)

        # Chuyển đổi ảnh sang không gian màu RGB
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

        # Nhận diện landmarks của khuôn mặt trên ảnh
        results = mp_eye_landmarks.process(image_rgb)

        # Kiểm tra xem có landmarks nào được nhận diện không
        if results.multi_face_landmarks:
            # Lấy danh sách các landmarks của khuôn mặt đầu tiên trong ảnh
            face_landmarks = results.multi_face_landmarks[0]

            # Tạo danh sách tọa độ của các điểm LEFT_EYE
            

            for index in Points:
                landmark = face_landmarks.landmark[index]
                landmark_x = int(landmark.x * image.shape[1])
                landmark_y = int(landmark.y * image.shape[0])
                points_landmarks.append((landmark_x, landmark_y))

            # Vẽ một hình tròn đỏ tại mỗi điểm LEFT_EYE trên ảnh
            # for landmark in points_landmarks:
            #     cv2.circle(image, landmark, 1, (0, 0, 255), -1)  

            start_px = min(points_landmarks[0][0],points_landmarks[1][0])
            start_py = min(points_landmarks[0][1],points_landmarks[2][1])
            end_px = max(points_landmarks[2][0],points_landmarks[3][0])
            end_py = max(points_landmarks[1][1],points_landmarks[3][1])
            cropped_image = image[start_py:end_py, start_px:end_px]  

            # Tạo tên file lưu sau khi sửa đổi (cùng tên với file gốc)
            img_name = os.path.basename(image_path)
            output_path = os.path.join("NotDrowsiness", img_name)

            # Lưu ảnh sau khi sửa đổi
            cv2.imwrite(output_path, cropped_image)
        else:
            print(img_name)


I0000 00:00:1712173873.682231   10486 gl_context_egl.cc:85] Successfully initialized EGL. Major : 1 Minor: 5
I0000 00:00:1712173873.683394   13168 gl_context.cc:357] GL version: 3.2 (OpenGL ES 3.2 Mesa 23.0.4-0ubuntu1~23.04.1), renderer: Mesa Intel(R) UHD Graphics 620 (KBL GT2)


frame_2585.jpg


## extract eye version 2

In [27]:
import os
import cv2
import mediapipe as mp

# Thư mục chứa ảnh
folder_path = "add"
points_to_cut1 = [464, 443, 265, 450]
points_to_cut2 = [124, 223, 244, 230]
cut_size = (224, 224)

# Khởi tạo Face Mesh detection
mp_face_mesh = mp.solutions.face_mesh
mp_drawing = mp.solutions.drawing_utils

# Duyệt qua tất cả các file trong thư mục và xử lý chúng
for filename in os.listdir(folder_path):
    if filename.endswith(".jpg") :
        image_path = os.path.join(folder_path, filename)
        points_landmarks = []
        # Đọc ảnh
        frame = cv2.imread(image_path)

        # Chuyển đổi ảnh sang không gian màu RGB
        frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

        # Nhận diện landmark trên khuôn mặt
        with mp_face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1) as face_mesh:
            results = face_mesh.process(frame_rgb)
            if results.multi_face_landmarks:
                # Tính toán tọa độ của các điểm cần cắt cho vùng 1
               
                landmarks = results.multi_face_landmarks[0].landmark
                min_x1 = min(landmarks[i].x * frame.shape[1] for i in points_to_cut1)
                min_y1 = min(landmarks[i].y * frame.shape[0] for i in points_to_cut1)
                max_x1 = max(landmarks[i].x * frame.shape[1] for i in points_to_cut1)
                max_y1 = max(landmarks[i].y * frame.shape[0] for i in points_to_cut1)

                # Tính toán tọa độ của các điểm cần cắt cho vùng 2
               
                min_x2 = min(landmarks[i].x * frame.shape[1] for i in points_to_cut2)
                min_y2 = min(landmarks[i].y * frame.shape[0] for i in points_to_cut2)
                max_x2 = max(landmarks[i].x * frame.shape[1] for i in points_to_cut2)
                max_y2 = max(landmarks[i].y * frame.shape[0] for i in points_to_cut2)

                # Cắt vùng mắt từ ảnh và resize về kích thước 224x224
                cut_region1 = frame[int(min_y1):int(max_y1), int(min_x1):int(max_x1)]
                resized_cut_region1 = cv2.resize(cut_region1, cut_size)

                cut_region2 = frame[int(min_y2):int(max_y2), int(min_x2):int(max_x2)]
                resized_cut_region2 = cv2.resize(cut_region2, cut_size)

                # Hiển thị vùng cắt đã resize
                # cv2.imshow("Resized Cut Region 1", resized_cut_region1)
                # cv2.imshow("Resized Cut Region 2", resized_cut_region2)
                # cv2.waitKey(0)

                # Ghép lại các vùng cắt đã resize
                merged_image = cv2.hconcat([resized_cut_region2, resized_cut_region1])

                # Tạo tên file lưu sau khi sửa đổi (cùng tên với file gốc)
                img_name = os.path.basename(image_path)
                output_path = os.path.join("add", img_name)

                # Lưu ảnh sau khi sửa đổi
                cv2.imwrite(output_path, merged_image)
            else:
                print(img_name)


I0000 00:00:1712341389.193131  676802 gl_context_egl.cc:85] Successfully initialized EGL. Major : 1 Minor: 5
I0000 00:00:1712341389.195527  707631 gl_context.cc:357] GL version: 3.2 (OpenGL ES 3.2 Mesa 23.0.4-0ubuntu1~23.04.1), renderer: Mesa Intel(R) UHD Graphics 620 (KBL GT2)
I0000 00:00:1712341389.282631  676802 gl_context_egl.cc:85] Successfully initialized EGL. Major : 1 Minor: 5
I0000 00:00:1712341389.284414  707642 gl_context.cc:357] GL version: 3.2 (OpenGL ES 3.2 Mesa 23.0.4-0ubuntu1~23.04.1), renderer: Mesa Intel(R) UHD Graphics 620 (KBL GT2)
I0000 00:00:1712341389.338702  676802 gl_context_egl.cc:85] Successfully initialized EGL. Major : 1 Minor: 5
I0000 00:00:1712341389.339620  707653 gl_context.cc:357] GL version: 3.2 (OpenGL ES 3.2 Mesa 23.0.4-0ubuntu1~23.04.1), renderer: Mesa Intel(R) UHD Graphics 620 (KBL GT2)
I0000 00:00:1712341389.396897  676802 gl_context_egl.cc:85] Successfully initialized EGL. Major : 1 Minor: 5
I0000 00:00:1712341389.397938  707664 gl_context.cc:35

## Display ALL landmark using mediapipe

In [None]:
import cv2
import mediapipe as mp

# Khởi tạo Face Mesh detection
mp_face_mesh = mp.solutions.face_mesh
mp_drawing = mp.solutions.drawing_utils

# Đọc ảnh đầu vào
image_path = "frame_0000.jpg"
image = cv2.imread(image_path)

# Chuyển đổi ảnh sang không gian màu RGB (MediaPipe yêu cầu đầu vào là RGB)
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

# Nhận diện landmark trên khuôn mặt
with mp_face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1) as face_mesh:
    results = face_mesh.process(image_rgb)
    if results.multi_face_landmarks:
        # Vẽ landmark lên ảnh
        # for face_landmarks in results.multi_face_landmarks:
        #     mp_drawing.draw_landmarks(
        #         image=image,
        #         landmark_list=face_landmarks,
        #         connections=mp_face_mesh.FACEMESH_TESSELATION,
        #         landmark_drawing_spec=None,
        #         connection_drawing_spec=mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=1, circle_radius=1),
        #     )

        # Hiển thị các điểm points_to_cut2
        points_to_cut2 = [464, 443, 265, 450]
        for idx in points_to_cut2:
            landmark = face_landmarks.landmark[idx]
            landmark_x = int(landmark.x * image.shape[1])
            landmark_y = int(landmark.y * image.shape[0])
            cv2.circle(image, (landmark_x, landmark_y), 3, (255, 0, 0), -1)

# Hiển thị ảnh với các điểm landmark
cv2.imshow("Face Landmarks", image)
cv2.waitKey(0)
cv2.destroyAllWindows()


## Lua chon diem pixel

In [None]:
# import cv2

# # Hàm xử lý sự kiện click chuột
# def mouse_click(event, x, y, flags, param):
#     if event == cv2.EVENT_LBUTTONDOWN:
#         print(f"Coord (x, y): ({x}, {y})")

# # Đọc ảnh từ đường dẫn
# image = cv2.imread("frame1_0.jpg")

# # Kiểm tra xem ảnh có tồn tại không
# if image is None:
#     print("Không thể đọc ảnh. Hãy chắc chắn đường dẫn đến ảnh là chính xác.")
#     exit()

# # Tạo cửa sổ hiển thị ảnh
# cv2.namedWindow("Image")

# # Gán hàm xử lý sự kiện chuột cho cửa sổ hiển thị ảnh
# cv2.setMouseCallback("Image", mouse_click)

# # Hiển thị ảnh và đợi sự kiện từ người dùng
# while True:
#     cv2.imshow("Image", image)
#     key = cv2.waitKey(1) & 0xFF
#     # Nhấn 'q' để thoát
#     if key == ord('q'):
#         break

# # Giải phóng bộ nhớ và đóng cửa sổ
# cv2.destroyAllWindows()
