# Notebook: Crear estructura del proyecto fraud-detection

Este notebook crea programáticamente la estructura de carpetas y archivos del proyecto `fraude-detection`. Ejecuta cada celda en orden.

In [None]:
# 1) Importar librerías y definir la ruta raíz
from pathlib import Path
import os
from pprint import pprint

# Usar la ruta absoluta del proyecto fraud-detection dentro del workspace
ROOT = Path(r'C:/dev/repos-deep-learning/fraude-detection').resolve()
print('ROOT:', ROOT)

In [None]:
# 2) Crear la estructura de carpetas con pathlib
dirs = [
    ROOT / 'config',
    ROOT / 'data' / 'raw',
    ROOT / 'data' / 'processed',
    ROOT / 'src',
    ROOT / 'src' / 'data',
    ROOT / 'src' / 'models',
    ROOT / 'src' / 'visualization',
    ROOT / 'models',
    ROOT / 'notebooks',
    ROOT / 'reports' / 'figures',
]
for d in dirs:
    d.mkdir(parents=True, exist_ok=True)
print('Directorios creados o existentes:')
pprint([str(d) for d in dirs])

In [None]:
# 3) Crear archivos __init__.py en src y subpaquetes
init_files = [
    ROOT / 'src' / '__init__.py',
    ROOT / 'src' / 'data' / '__init__.py',
    ROOT / 'src' / 'models' / '__init__.py',
    ROOT / 'src' / 'visualization' / '__init__.py',
]
for f in init_files:
    if not f.exists():
        f.write_text('# Paquete Python: ' + f.parent.name + "\n")
print('Archivos __init__.py creados:')
pprint([str(f) for f in init_files])

In [None]:
# 4) Generar config/config.py con configuración base
config_py = ROOT / 'config' / 'config.py'
config_content = '''"""Configuración básica del proyecto fraud-detection"""
from pathlib import Path

BASE_DIR = Path(__file__).resolve().parent.parent
DATA_DIR = BASE_DIR / 'data'
RAW_DIR = DATA_DIR / 'raw'
PROCESSED_DIR = DATA_DIR / 'processed'
MODELS_DIR = BASE_DIR / 'models'

# Ejemplo (comentado): cargar variables de entorno
# from dotenv import load_dotenv
# load_dotenv()
'''
if not config_py.exists():
    config_py.write_text(config_content)
print('Creado:', config_py)

In [None]:
# 5) Crear archivos esqueleto para scripts (load, preprocess, train, evaluate, plots)
files = {
    'src/data/load.py': """"""""""Carga de datos crudos"""\nfrom pathlib import Path\nimport pandas as pd\n\nfrom config.config import RAW_DIR\n\n\ndef load_raw(path: Path | None = None) -> 'pd.DataFrame':\n    path = Path(path) if path else RAW_DIR / 'creditcard.csv'\n    return pd.read_csv(path)\n\nif __name__ == '__main__':\n    df = load_raw()\n    print(df.head())\n""",
    'src/data/preprocess.py': """"""""""Preprocesamiento básico"""\nimport pandas as pd\n\n\ndef preprocess(df: 'pd.DataFrame') -> tuple:\n    df = df.copy()\n    if 'Class' in df.columns:\n        y = df['Class']\n        X = df.drop(columns=['Class'])\n    else:\n        X, y = df, None\n    return X, y\n\nif __name__ == '__main__':\n    import pandas as pd\n    df = pd.DataFrame({'V1':[0], 'Class':[0]})\n    print(preprocess(df))\n""",
    'src/models/train.py': """"""""""Entrenamiento (esqueleto)"""\nfrom typing import Any\nimport joblib\nimport os\n\ndef train_model(X: Any, y: Any, save_path: str | None = None):\n    # placeholder\n    print('Entrenando...')\n    if save_path:\n        joblib.dump({}, save_path)\n\nif __name__ == '__main__':\n    train_model(None, None)\n""",
    'src/models/evaluate.py': """"""""""Evaluación (esqueleto)"""\nfrom typing import Any\n\ndef evaluate_model(model: Any, X: Any, y: Any):\n    print('Evaluando...')\n\nif __name__ == '__main__':\n    evaluate_model(None, None, None)\n""",
    'src/visualization/plots.py': """"""""""Visualizaciones (esqueleto)"""\nimport matplotlib.pyplot as plt\n\ndef plot_overview(df, output_path: str | None = None):\n    fig = plt.figure()\n    if output_path:\n        fig.savefig(output_path)\n    return fig\n\nif __name__ == '__main__':\n    import pandas as pd\n    df = pd.DataFrame({'Amount':[10,20,30]})\n    plot_overview(df)\n""",
}
for rel, content in files.items():
    p = ROOT / rel
    p.parent.mkdir(parents=True, exist_ok=True)
    if not p.exists():
        p.write_text(content)
print('Archivos esqueleto creados:')
pprint([str(ROOT / r) for r in files.keys()])

In [None]:
# 6) Crear models/, notebooks/ y notebook 01_exploratory_analysis.ipynb mínimo
(ROOT / 'models').mkdir(exist_ok=True)
(ROOT / 'models' / '.gitkeep').write_text('')
(ROOT / 'notebooks').mkdir(exist_ok=True)
# El notebook actual ya existe; la celda se limita a confirmar la creación
print('models y notebooks creados')

In [None]:
# 7) Crear reports/figures/ y README.md en reports
(ROOT / 'reports' / 'figures').mkdir(parents=True, exist_ok=True)
readme = ROOT / 'reports' / 'README.md'
if not readme.exists():
    readme.write_text('# Reports\nGuarda aquí las figuras y resultados del proyecto.')
print('Reports creado:', readme)

In [None]:
# 8) Crear requirements.txt y main.py con esqueleto ejecutable
req = ROOT / 'requirements.txt'
if not req.exists():
    req.write_text('\n'.join(['pandas','numpy','scikit-learn','matplotlib','joblib']))
main_py = ROOT / 'main.py'
if not main_py.exists():
    main_py.write_text('''"""Main pipeline placeholder"""\nfrom src.data.load import load_raw\n\ndef run_pipeline():\n    print('Pipeline placeholder')\n\nif __name__ == '__main__':\n    run_pipeline()\n''')
print('requirements.txt y main.py creados')

In [None]:
# 9) Verificar la estructura y listar archivos
for p in sorted(ROOT.rglob('*')):
    print(p.relative_to(ROOT))

print('\nProceso completado. Ejecuta las celdas en orden para crear la estructura.')