# Script de limpeza

- parâmetros dinâmicos (qual pasta limpar)
- opções para manter ou remover apenas certos tipos de arquivo
- logs mais claros e coloridos
- proteção contra exclusões acidentais

In [1]:
# Etapa 1: Configurar a API do Kaggle
# 1. Montar o Google Drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


### Limpando a pasta models

In [4]:
# =========================================================
# 🧹 UNIVERSAL CLEANUP UTILITY — HEART FAIRNESS PROJECT
# =========================================================
# Permite limpar qualquer subpasta (results, models, data/splits, etc.)
# mantendo logs, filtros e pastas definidas dinamicamente.
# =========================================================

import os
import shutil

def clean_directory(
    base_path: str,
    subfolder: str,
    keep_folders: list = None,
    keep_extensions: list = None,
    confirm: bool = True
):
    """
    Limpa arquivos e subpastas de um diretório, com exceções configuráveis.

    Parâmetros:
    -----------
    base_path : str
        Caminho raiz do projeto.
    subfolder : str
        Nome da subpasta a ser limpa (ex: 'results', 'models/xgboost/rounds').
    keep_folders : list[str]
        Lista de subpastas a manter (ex: ['eda_summary']).
    keep_extensions : list[str]
        Lista de extensões a manter (ex: ['.csv', '.json']).
    confirm : bool
        Se True, pede confirmação antes da exclusão.
    """

    target_path = os.path.join(base_path, subfolder)
    if not os.path.exists(target_path):
        print(f"❌ Diretório não encontrado: {target_path}")
        return

    keep_folders = keep_folders or []
    keep_extensions = keep_extensions or []

    print("=" * 80)
    print(f"🧹 LIMPEZA DE DIRETÓRIO — {subfolder.upper()}")
    print("=" * 80)
    print(f"📁 Caminho alvo: {target_path}")
    print(f"🟢 Pastas preservadas: {keep_folders}")
    print(f"🟡 Extensões preservadas: {keep_extensions}\n")

    # Confirmação de segurança
    if confirm:
        resp = input("⚠️ Confirmar limpeza? (y/n): ").strip().lower()
        if resp != "y":
            print("🚫 Operação cancelada pelo usuário.")
            return

    # Loop pelos itens do diretório
    for item in os.listdir(target_path):
        item_path = os.path.join(target_path, item)

        # Pastas a manter
        if item in keep_folders:
            print(f"🟡 Mantendo pasta: {item}/")
            continue

        # Arquivos com extensões preservadas
        if os.path.isfile(item_path):
            _, ext = os.path.splitext(item)
            if ext in keep_extensions:
                print(f"🟡 Mantendo arquivo: {item}")
                continue
            os.remove(item_path)
            print(f"🧾 Removido arquivo: {item}")

        # Pastas a remover
        elif os.path.isdir(item_path):
            shutil.rmtree(item_path)
            print(f"📂 Removida pasta: {item}/")

    print("\n✅ Limpeza concluída com sucesso.")
    print(f"📂 Estrutura preservada: {keep_folders if keep_folders else 'Nenhuma'}")
    print(f"📄 Extensões preservadas: {keep_extensions if keep_extensions else 'Nenhuma'}")
    print("=" * 80)


# =========================================================
# 💡 EXEMPLOS DE USO
# =========================================================

base_path = "/content/drive/MyDrive/AI-HealthCare/EHR/heart-disease-fairness/models/xgboost/rounds"

# 🔹 Exemplo 1 — limpar apenas /results (mantendo EDA)
clean_directory(
    base_path=base_path,
    subfolder="round_02",
#    keep_folders=["eda_summary"],
    confirm=False
)

# 🔹 Exemplo 2 — limpar /models/xgboost/rounds inteiro
# clean_directory(
#     base_path=base_path,
#     subfolder="models/xgboost/rounds",
#     confirm=True
# )

# 🔹 Exemplo 3 — limpar /data/splits mas manter os .csv
# clean_directory(
#     base_path=base_path,
#     subfolder="data/splits",
#     keep_extensions=[".csv"],
#     confirm=True
# )


🧹 LIMPEZA DE DIRETÓRIO — ROUND_02
📁 Caminho alvo: /content/drive/MyDrive/AI-HealthCare/EHR/heart-disease-fairness/models/xgboost/rounds/round_02
🟢 Pastas preservadas: []
🟡 Extensões preservadas: []

🧾 Removido arquivo: round_02_xgb_best_model_20251024_170245.json
🧾 Removido arquivo: round_02_classification_report_20251024_170245.txt
🧾 Removido arquivo: round_02_train_log_20251024_170245.txt
🧾 Removido arquivo: round_02_round_summary_20251024_170245.txt
🧾 Removido arquivo: training_curves_summary.txt
🧾 Removido arquivo: confusion_matrix_summary.txt
🧾 Removido arquivo: false_negatives.txt
📂 Removida pasta: shap_error_analysis/
🧾 Removido arquivo: false_positives.txt

✅ Limpeza concluída com sucesso.
📂 Estrutura preservada: Nenhuma
📄 Extensões preservadas: Nenhuma


### Limpando eda_sumary

In [5]:
# =========================================================
# 🧹 UNIVERSAL CLEANUP UTILITY — HEART FAIRNESS PROJECT
# =========================================================
# Permite limpar qualquer subpasta (results, models, data/splits, etc.)
# mantendo logs, filtros e pastas definidas dinamicamente.
# =========================================================

import os
import shutil

def clean_directory(
    base_path: str,
    subfolder: str,
    keep_folders: list = None,
    keep_extensions: list = None,
    confirm: bool = True
):
    """
    Limpa arquivos e subpastas de um diretório, com exceções configuráveis.

    Parâmetros:
    -----------
    base_path : str
        Caminho raiz do projeto.
    subfolder : str
        Nome da subpasta a ser limpa (ex: 'results', 'models/xgboost/rounds').
    keep_folders : list[str]
        Lista de subpastas a manter (ex: ['eda_summary']).
    keep_extensions : list[str]
        Lista de extensões a manter (ex: ['.csv', '.json']).
    confirm : bool
        Se True, pede confirmação antes da exclusão.
    """

    target_path = os.path.join(base_path, subfolder)
    if not os.path.exists(target_path):
        print(f"❌ Diretório não encontrado: {target_path}")
        return

    keep_folders = keep_folders or []
    keep_extensions = keep_extensions or []

    print("=" * 80)
    print(f"🧹 LIMPEZA DE DIRETÓRIO — {subfolder.upper()}")
    print("=" * 80)
    print(f"📁 Caminho alvo: {target_path}")
    print(f"🟢 Pastas preservadas: {keep_folders}")
    print(f"🟡 Extensões preservadas: {keep_extensions}\n")

    # Confirmação de segurança
    if confirm:
        resp = input("⚠️ Confirmar limpeza? (y/n): ").strip().lower()
        if resp != "y":
            print("🚫 Operação cancelada pelo usuário.")
            return

    # Loop pelos itens do diretório
    for item in os.listdir(target_path):
        item_path = os.path.join(target_path, item)

        # Pastas a manter
        if item in keep_folders:
            print(f"🟡 Mantendo pasta: {item}/")
            continue

        # Arquivos com extensões preservadas
        if os.path.isfile(item_path):
            _, ext = os.path.splitext(item)
            if ext in keep_extensions:
                print(f"🟡 Mantendo arquivo: {item}")
                continue
            os.remove(item_path)
            print(f"🧾 Removido arquivo: {item}")

        # Pastas a remover
        elif os.path.isdir(item_path):
            shutil.rmtree(item_path)
            print(f"📂 Removida pasta: {item}/")

    print("\n✅ Limpeza concluída com sucesso.")
    print(f"📂 Estrutura preservada: {keep_folders if keep_folders else 'Nenhuma'}")
    print(f"📄 Extensões preservadas: {keep_extensions if keep_extensions else 'Nenhuma'}")
    print("=" * 80)


# =========================================================
# 💡 EXEMPLOS DE USO
# =========================================================

base_path = "/content/drive/MyDrive/AI-HealthCare/EHR/heart-disease-fairness/results"

# 🔹 Exemplo 1 — limpar apenas /results (mantendo EDA)
clean_directory(
    base_path=base_path,
    subfolder="eda_summary",
#    keep_folders=["eda_summary"],
    confirm=False
)


🧹 LIMPEZA DE DIRETÓRIO — EDA_SUMMARY
📁 Caminho alvo: /content/drive/MyDrive/AI-HealthCare/EHR/heart-disease-fairness/results/eda_summary
🟢 Pastas preservadas: []
🟡 Extensões preservadas: []

📂 Removida pasta: .ipynb_checkpoints/
🧾 Removido arquivo: eda_overview.txt
🧾 Removido arquivo: feature_stats.txt
🧾 Removido arquivo: feature_descriptions.txt
🧾 Removido arquivo: feature_importance.txt

✅ Limpeza concluída com sucesso.
📂 Estrutura preservada: Nenhuma
📄 Extensões preservadas: Nenhuma
