In [4]:
import pandas as pd
import os
import shutil
from tqdm import tqdm
import re


In [6]:
def normalize_folder_name(name):
    # Bỏ số ở đầu và dấu gạch ngang
    name = re.sub(r'^\d+[-_\s]*', '', name)
    # Bỏ dấu gạch ngang và khoảng trắng thừa
    name = re.sub(r'[-_]+', ' ', name)
    # Chuyển về chữ thường và cắt khoảng trắng đầu/cuối
    name = name.lower().strip()
    return name

# Thư mục chứa các folder cần đổi tên
source_dir = 'D:/IE104.P11.CNVN/truyen'

# Lấy danh sách các folder
items = os.listdir(source_dir)
folders = [item for item in items if os.path.isdir(os.path.join(source_dir, item))]

print("Danh sách thay đổi tên folder:")
for folder in tqdm(folders, desc="Đang đổi tên thư mục"):
    old_path = os.path.join(source_dir, folder)
    new_name = normalize_folder_name(folder)
    new_path = os.path.join(source_dir, new_name)
    
    try:
        if old_path != new_path:
            print(f"- {folder} -> {new_name}")
            os.rename(old_path, new_path)
    except Exception as e:
        print(f"Lỗi khi đổi tên {folder}: {str(e)}")

print("Hoàn tất đổi tên!")

Danh sách thay đổi tên folder:


Đang đổi tên thư mục: 100%|██████████| 341/341 [00:00<00:00, 13215.72it/s]

- 1-seirei-tsukai-no-blade-dance -> seirei tsukai no blade dance
Lỗi khi đổi tên 1-seirei-tsukai-no-blade-dance: [WinError 183] Cannot create a file when that file already exists: 'D:/IE104.P11.CNVN/truyen\\1-seirei-tsukai-no-blade-dance' -> 'D:/IE104.P11.CNVN/truyen\\seirei tsukai no blade dance'
- 10-utsuro-no-hako-to-zero-no-maria -> utsuro no hako to zero no maria
Lỗi khi đổi tên 10-utsuro-no-hako-to-zero-no-maria: [WinError 183] Cannot create a file when that file already exists: 'D:/IE104.P11.CNVN/truyen\\10-utsuro-no-hako-to-zero-no-maria' -> 'D:/IE104.P11.CNVN/truyen\\utsuro no hako to zero no maria'
- 100-accel-world -> accel world
Lỗi khi đổi tên 100-accel-world: [WinError 183] Cannot create a file when that file already exists: 'D:/IE104.P11.CNVN/truyen\\100-accel-world' -> 'D:/IE104.P11.CNVN/truyen\\accel world'
- 101-psycho-love-comedy -> psycho love comedy
Lỗi khi đổi tên 101-psycho-love-comedy: [WinError 183] Cannot create a file when that file already exists: 'D:/IE104.




In [3]:
try:
    # Đọc file CSV
    df = pd.read_csv('D:/IE104.P11.CNVN/web_wibu_react/src/data_and_source/Novel_Data/hako_data.csv')

    # Lấy danh sách các tựa đề từ CSV và chuyển về chữ thường
    novel_titles = [title.lower().strip() for title in df['Tựa đề'].tolist()]

    # Thư mục nguồn chứa các folder truyện
    source_dir = 'D:/IE104.P11.CNVN/truyen'

    # Thư mục đích để lưu các folder đã lọc
    destination_dir = 'D:/IE104.P11.CNVN/truyen_filtered'

    # Tạo thư mục đích nếu chưa tồn tại
    if not os.path.exists(destination_dir):
        os.makedirs(destination_dir)

    # Lấy danh sách các folder cần chuyển (so sánh tên đã chuyển về chữ thường)
    folders_to_move = [
        folder for folder in os.listdir(source_dir) 
        if folder.lower().strip() in novel_titles
    ]

    print(f"Tìm thấy {len(folders_to_move)} thư mục cần di chuyển:")
    for folder in folders_to_move[:5]:  # In 5 thư mục đầu tiên để kiểm tra
        print(f"- {folder}")

    confirm = input("Bạn có muốn tiếp tục di chuyển không? (y/n): ")
    if confirm.lower() != 'y':
        print("Đã hủy thao tác.")
        exit()

    # Tạo thanh tiến trình
    for folder in tqdm(folders_to_move, desc="Đang di chuyển thư mục"):
        source_path = os.path.join(source_dir, folder)
        dest_path = os.path.join(destination_dir, folder)
        
        try:
            if os.path.exists(source_path):
                if os.path.exists(dest_path):
                    print(f"Thư mục {folder} đã tồn tại ở đích, đang xóa...")
                    shutil.rmtree(dest_path)
                
                shutil.move(source_path, dest_path)
                print(f"Đã di chuyển thành công: {folder}")
            else:
                print(f"Không tìm thấy thư mục nguồn: {folder}")
        
        except Exception as e:
            print(f"Lỗi khi di chuyển {folder}: {str(e)}")

    print(f'Hoàn tất! Đã di chuyển {len(folders_to_move)} thư mục.')

except Exception as e:
    print(f"Có lỗi xảy ra: {str(e)}")

Đang di chuyển thư mục: 0it [00:00, ?it/s]

Hoàn tất! Đã di chuyển 0 thư mục.



