# Init project folder structure

In [2]:
import os

# Định nghĩa cấu trúc thư mục
project_structure = {
    "data": ["raw", "processed", "external"],
    "src": ["data", "models", "features", "training", "evaluation", "utils", "visualization"],
    "notebooks": [],
    "experiments": [],
    "results": [],
    "configs": [],
    "logs": [],
    "tests": []
}

# Các file Python mặc định cần tạo
default_python_files = {
    "src/data": ["data_loader.py", "process.py"],
    "src/models": ["model_architecture.py", "model_utils.py"],
    # "src/features": ["feature_engineering.py", "feature_selection.py"], 
    # Hiện tại gộp bước này trong module 1 của model
    "src/training": ["train_model.py", "hyperparameter_tuning.py"],
    "src/evaluation": ["evaluate.py", "metrics.py"],
    "src/utils": ["utils.py", "helpers.py", "logger.py"],
    "src/visualization": ["visualize.py", "plot_metrics.py"],
    "tests": ["test_data_loader.py", "test_model.py", "test_utils.py"]
}

# Hàm tạo thư mục nếu chưa tồn tại
def create_dir(path):
    if not os.path.exists(path):
        os.makedirs(path)
        print(f"Created directory: {path}")
    else:
        print(f"Directory already exists: {path}")

# Hàm tạo file nếu chưa tồn tại
def create_file(file_path, content=""):
    if not os.path.exists(file_path):
        with open(file_path, "w") as f:
            f.write(content)
        print(f"Created file: {file_path}")
    else:
        print(f"File already exists: {file_path}")

# Hàm tạo cấu trúc dự án
def create_project_structure(base_path):
    # Tạo các thư mục chính
    for main_dir, sub_dirs in project_structure.items():
        main_dir_path = os.path.join(base_path, main_dir)
        create_dir(main_dir_path)
        
        # Tạo các thư mục con
        for sub_dir in sub_dirs:
            sub_dir_path = os.path.join(main_dir_path, sub_dir)
            create_dir(sub_dir_path)
    
    # Tạo các file mặc định
    create_default_files(base_path)

# Tạo các file mặc định
def create_default_files(base_path):
    # File README.md
    readme_path = os.path.join(base_path, "README.md")
    create_file(readme_path, "# Project Title\n\nDescribe your project here.\n")
    
    # File requirements.txt
    requirements_path = os.path.join(base_path, "requirements.txt")
    create_file(requirements_path, "# List your dependencies here\n")
    
    # # File environment.yml
    # environment_path = os.path.join(base_path, "environment.yml")
    # environment_content = (
    #     "name: your_project_env\n"
    #     "channels:\n"
    #     "  - defaults\n"
    #     "dependencies:\n"
    #     "  - python=3.9\n"
    #     "  - pip\n"
    #     "  - pip:\n"
    #     "    - your-package\n"
    # )
    # create_file(environment_path, environment_content)

    # Tạo các file Python mặc định trong các thư mục
    for folder, filenames in default_python_files.items():
        for filename in filenames:
            file_path = os.path.join(base_path, folder, filename)
            create_file(file_path, f"# {filename} content\n")

# Đường dẫn cơ sở cho dự án
base_project_path = "."

# Khởi tạo cấu trúc dự án
create_project_structure(base_project_path)

Created directory: ./data
Created directory: ./data/raw
Created directory: ./data/processed
Created directory: ./data/external
Created directory: ./src
Created directory: ./src/data
Created directory: ./src/models
Created directory: ./src/features
Created directory: ./src/training
Created directory: ./src/evaluation
Created directory: ./src/utils
Created directory: ./src/visualization
Created directory: ./notebooks
Created directory: ./experiments
Created directory: ./results
Created directory: ./configs
Created directory: ./logs
Created directory: ./tests
Created file: ./README.md
Created file: ./requirements.txt
Created file: ./src/data/data_loader.py
Created file: ./src/data/preprocess.py
Created file: ./src/models/model_architecture.py
Created file: ./src/models/model_utils.py
Created file: ./src/training/train_model.py
Created file: ./src/training/hyperparameter_tuning.py
Created file: ./src/evaluation/evaluate.py
Created file: ./src/evaluation/metrics.py
Created file: ./src/utils

Đảm bảo việc chạy lại code khởi tạo cấu trúc project không phá hỏng kiến trúc đã có

In [1]:
import os

# Định nghĩa cấu trúc thư mục
project_structure = {
    "docs": ["for_source_code", "for_data"],
    "docs/for_source_code": ["data", "models", "features", "training", "evaluation", "utils", "visualization"],
    "docs/for_data": ["raw", "processed", "augmented", "external"],
    "data": ["raw", "processed", "augmented", "external"],
    "src": ["data", "models", "features", "training", "evaluation", "utils", "visualization"],
    "src/models": ["module1", "module2"],
    "notebooks": [],
    "experiments": [],
    "results": [],
    "configs": [],
    "logs": [],
    "tests": ["temp_data_for_tests"],
    "tests/temp_data_for_tests": ["raw", "processed", "augmented", "external"]
}

# Các file Python mặc định cần tạo
default_python_files = {
    "src/data": ["data_loader.py", "process.py"],
    "src/models": ["model_architecture.py", "model_utils.py"],
    # "src/features": ["feature_engineering.py", "feature_selection.py"], 
    # Hiện tại gộp bước này trong module 1 của model
    "src/training": ["train_model.py", "hyperparameter_tuning.py"],
    "src/evaluation": ["evaluate.py", "metrics.py"],
    "src/utils": ["utils.py", "helpers.py", "logger.py"],
    "src/visualization": ["visualize.py", "plot_metrics.py"],
    "tests": ["test_data_loader.py", "test_model.py", "test_utils.py"]
}

# Hàm tạo thư mục nếu chưa tồn tại
def create_dir(path):
    if not os.path.exists(path):
        os.makedirs(path)
        print(f"Created directory: {path}")
    else:
        print(f"Directory already exists: {path}")

# Hàm tạo file nếu chưa tồn tại
def create_file(file_path, content=""):
    if not os.path.exists(file_path):
        with open(file_path, "w") as f:
            f.write(content)
        print(f"Created file: {file_path}")
    else:
        print(f"File already exists: {file_path}")

# Hàm tạo cấu trúc dự án
def create_project_structure(base_path):
    # Tạo các thư mục chính
    for main_dir, sub_dirs in project_structure.items():
        main_dir_path = os.path.join(base_path, main_dir)
        create_dir(main_dir_path)
        
        # Tạo các thư mục con
        for sub_dir in sub_dirs:
            sub_dir_path = os.path.join(main_dir_path, sub_dir)
            create_dir(sub_dir_path)
    
    # Tạo các file mặc định
    create_default_files(base_path)

# Tạo các file mặc định
def create_default_files(base_path):
    # File README.md
    readme_path = os.path.join(base_path, "README.md")
    create_file(readme_path, "# Project Title\n\nDescribe your project here.\n")
    
    # File requirements.txt
    requirements_path = os.path.join(base_path, "requirements.txt")
    create_file(requirements_path, "# List your dependencies here\n")

    # Tạo các file Python mặc định trong các thư mục
    for folder, filenames in default_python_files.items():
        for filename in filenames:
            file_path = os.path.join(base_path, folder, filename)
            create_file(file_path, f"# {filename} content\n")

# Đường dẫn cơ sở cho dự án
base_project_path = "."

# Khởi tạo cấu trúc dự án
create_project_structure(base_project_path)

Directory already exists: ./docs
Directory already exists: ./docs/for_source_code
Directory already exists: ./docs/for_data
Directory already exists: ./docs/for_source_code
Directory already exists: ./docs/for_source_code/data
Directory already exists: ./docs/for_source_code/models
Directory already exists: ./docs/for_source_code/features
Directory already exists: ./docs/for_source_code/training
Directory already exists: ./docs/for_source_code/evaluation
Directory already exists: ./docs/for_source_code/utils
Directory already exists: ./docs/for_source_code/visualization
Directory already exists: ./docs/for_data
Directory already exists: ./docs/for_data/raw
Directory already exists: ./docs/for_data/processed
Directory already exists: ./docs/for_data/augmented
Directory already exists: ./docs/for_data/external
Directory already exists: ./data
Directory already exists: ./data/raw
Directory already exists: ./data/processed
Directory already exists: ./data/augmented
Directory already exists

In [4]:
'#' * 25

'#########################'

src/
│
├── utils/
│   ├── utils.py        # Chứa hàm load config, các hàm tiện ích chung
│   ├── helpers.py      # Chứa các hàm hỗ trợ việc tính toán chỉ số
│   └── logger.py       # Xử lý việc ghi log và lưu model
│
├── visualization/
│   ├── visualize.py    # Hàm vẽ trực quan ma trận nhầm lẫn, f1 score
│   └── plot_metrics.py # Vẽ biểu đồ loss, accuracy, f1 qua các epoch
│
└── train.py            # File huấn luyện chính
