# Test de Migration - Nouvelle Structure Modulaire (Version Fix√©e)

Ce notebook teste la nouvelle structure modulaire du projet STA211 avec gestion automatique des chemins.

## 0. Configuration des chemins d'import

In [None]:
import sys
import os
from pathlib import Path

# D√©tection automatique de la racine du projet
def find_project_root():
    """Trouve la racine du projet en cherchant les marqueurs."""
    current_dir = Path.cwd()
    
    # Si on ex√©cute depuis notebooks/, remonter d'un niveau
    if current_dir.name == 'notebooks':
        project_root = current_dir.parent
    else:
        # Chercher les marqueurs dans les r√©pertoires parents
        for parent in [current_dir] + list(current_dir.parents):
            markers = ['.git', '.project_root', 'modules', 'requirements.txt']
            if any((parent / marker).exists() for marker in markers):
                project_root = parent
                break
        else:
            project_root = current_dir
    
    return project_root

# Trouver et ajouter la racine du projet au PATH
project_root = find_project_root()
print(f"üìÅ Racine du projet d√©tect√©e: {project_root}")

# Ajouter au sys.path si pas d√©j√† pr√©sent
if str(project_root) not in sys.path:
    sys.path.insert(0, str(project_root))
    print(f"‚úÖ Ajout√© au sys.path: {project_root}")
else:
    print(f"‚ÑπÔ∏è D√©j√† dans sys.path: {project_root}")

# V√©rifier que le r√©pertoire modules existe
modules_dir = project_root / 'modules'
if modules_dir.exists():
    print(f"‚úÖ R√©pertoire modules trouv√©: {modules_dir}")
else:
    print(f"‚ùå R√©pertoire modules non trouv√©: {modules_dir}")
    print("Contenu du r√©pertoire racine:")
    for item in project_root.iterdir():
        print(f"  - {item.name}")

## 1. Test de la configuration

In [None]:
try:
    from modules.config import cfg
    print("‚úÖ Configuration import√©e avec succ√®s")
    
    print(f"üìÅ Racine du projet: {cfg.root}")
    print(f"üè∑Ô∏è Nom du projet: {cfg.project.project_name}")
    print(f"üë§ Auteur: {cfg.project.author}")
    print(f"üìä Random state: {cfg.project.random_state}")

    print("\nüìÇ Chemins configur√©s:")
    for attr_name in ['data', 'raw', 'processed', 'outputs', 'figures', 'models', 'imputers', 'transformers']:
        try:
            path = getattr(cfg.paths, attr_name)
            exists = "‚úÖ" if path.exists() else "‚ùå"
            print(f"  {exists} {attr_name}: {path}")
        except AttributeError:
            print(f"  ‚ö†Ô∏è {attr_name}: attribut non trouv√©")
            
except ImportError as e:
    print(f"‚ùå Erreur d'import de la configuration: {e}")
    print(f"R√©pertoire de travail actuel: {Path.cwd()}")
    print(f"sys.path contient: {sys.path[:3]}...")  # Premier 3 √©l√©ments

## 2. Test des utilitaires de stockage

In [None]:
try:
    from modules.utils import save_artifact, load_artifact, artifact_exists
    import numpy as np

    print("‚úÖ Utilitaires de stockage import√©s")

    # Test de sauvegarde/rechargement
    test_data = {'test': 'data', 'array': np.array([1, 2, 3])}
    test_filename = "test_artifact.pkl"

    # Sauvegarder
    saved_path = save_artifact(test_data, test_filename, cfg.paths.models)
    print(f"üíæ Donn√©es sauvegard√©es: {saved_path}")

    # V√©rifier existence
    exists = artifact_exists(test_filename, cfg.paths.models)
    print(f"üîç Artefact existe: {exists}")

    # Recharger
    loaded_data = load_artifact(test_filename, cfg.paths.models)
    print(f"üìÇ Donn√©es recharg√©es: {loaded_data}")

    # V√©rifier int√©grit√©
    integrity_check = (
        loaded_data['test'] == test_data['test'] and 
        np.array_equal(loaded_data['array'], test_data['array'])
    )
    print(f"‚úÖ Int√©grit√© des donn√©es: {integrity_check}")
    
except ImportError as e:
    print(f"‚ùå Erreur d'import des utilitaires: {e}")
except Exception as e:
    print(f"‚ùå Erreur lors du test: {e}")

## 3. Test du module de pr√©traitement

In [None]:
try:
    from modules.notebook1_preprocessing import (
        load_and_clean_data,
        perform_knn_imputation,
        apply_optimal_transformations,
        detect_and_cap_outliers
    )
    import pandas as pd
    import numpy as np

    print("‚úÖ Module de pr√©traitement import√©")
    print("üì¶ Fonctions disponibles:")
    print("  - load_and_clean_data")
    print("  - perform_knn_imputation")
    print("  - apply_optimal_transformations")
    print("  - detect_and_cap_outliers")

    # Test avec des donn√©es factices
    np.random.seed(42)

    # Cr√©er des donn√©es de test
    n_samples = 100
    test_df = pd.DataFrame({
        'feature1': np.random.normal(0, 1, n_samples),
        'feature2': np.random.normal(5, 2, n_samples),
        'target': np.random.binomial(1, 0.3, n_samples)
    })

    # Introduire quelques valeurs manquantes
    missing_idx = np.random.choice(n_samples, 10, replace=False)
    test_df.loc[missing_idx, 'feature1'] = np.nan

    print(f"\nüìä Donn√©es de test cr√©√©es: {test_df.shape}")
    print(f"üï≥Ô∏è Valeurs manquantes: {test_df.isnull().sum().sum()}")

    # Test KNN imputation
    df_imputed, imputer = perform_knn_imputation(
        test_df, ['feature1'], n_neighbors=5, save_imputer=False
    )

    remaining_missing = df_imputed.isnull().sum().sum()
    print(f"‚úÖ Imputation KNN: {remaining_missing} valeurs manquantes restantes")
    
except ImportError as e:
    print(f"‚ùå Erreur d'import du module de pr√©traitement: {e}")
    # Diagnostics suppl√©mentaires
    modules_path = project_root / 'modules'
    if modules_path.exists():
        print(f"Contenu du dossier modules:")
        for item in modules_path.iterdir():
            print(f"  - {item.name}")
except Exception as e:
    print(f"‚ùå Erreur lors du test: {e}")

## 4. Test des imports simples

In [None]:
# Test basique des imports un par un pour diagnostiquer
print("üîç DIAGNOSTIC DES IMPORTS")
print("=" * 40)

modules_to_test = [
    'modules',
    'modules.config',
    'modules.utils',
    'modules.utils.storage',
    'modules.evaluation',
    'modules.modeling',
    'modules.notebook1_preprocessing',
    'modules.notebook2_modeling'
]

for module_name in modules_to_test:
    try:
        __import__(module_name)
        print(f"‚úÖ {module_name}")
    except ImportError as e:
        print(f"‚ùå {module_name}: {e}")
    except Exception as e:
        print(f"‚ö†Ô∏è {module_name}: {e}")

print(f"\nüìç R√©pertoire de travail: {Path.cwd()}")
print(f"üìç Racine du projet: {project_root}")
print(f"üìç sys.path[0]: {sys.path[0]}")

## 5. V√©rification de l'environnement

In [None]:
print("üîç V√âRIFICATION DE L'ENVIRONNEMENT")
print("=" * 50)

# V√©rifier les d√©pendances principales
dependencies = [
    'pandas', 'numpy', 'sklearn', 'matplotlib', 'seaborn', 
    'xgboost', 'joblib', 'scipy'
]

print("üì¶ D√©pendances:")
for dep in dependencies:
    try:
        __import__(dep)
        print(f"  ‚úÖ {dep}")
    except ImportError:
        print(f"  ‚ùå {dep}")

# V√©rifier les d√©pendances optionnelles
optional_deps = ['chardet', 'missingno', 'ydata_profiling']
print("\nüì¶ D√©pendances optionnelles:")
for dep in optional_deps:
    try:
        __import__(dep)
        print(f"  ‚úÖ {dep}")
    except ImportError:
        print(f"  ‚ö†Ô∏è {dep} (optionnel)")

print(f"\nüêç Version Python: {sys.version}")
print(f"üíª Plateforme: {os.name}")

# Instructions d'installation si n√©cessaire
missing_deps = []
for dep in dependencies:
    try:
        __import__(dep)
    except ImportError:
        missing_deps.append(dep)

if missing_deps:
    print(f"\n‚ö†Ô∏è D√©pendances manquantes: {', '.join(missing_deps)}")
    print("\nüí° Pour installer les d√©pendances:")
    print("   pip install -r requirements.txt")
    print("   ou")
    print(f"   pip install {' '.join(missing_deps)}")
else:
    print("\nüéâ Toutes les d√©pendances principales sont install√©es !")

## Instructions de d√©pannage

Si vous rencontrez encore des probl√®mes d'import :

### 1. V√©rifier la structure du projet
```
sta211-project/
‚îú‚îÄ‚îÄ modules/
‚îÇ   ‚îú‚îÄ‚îÄ config.py
‚îÇ   ‚îú‚îÄ‚îÄ utils/
‚îÇ   ‚îú‚îÄ‚îÄ evaluation/
‚îÇ   ‚îî‚îÄ‚îÄ ...
‚îî‚îÄ‚îÄ notebooks/
    ‚îî‚îÄ‚îÄ 00_Test_Migration_Fixed.ipynb
```

### 2. Installer les d√©pendances
```bash
pip install -r requirements.txt
```

### 3. Ex√©cuter depuis le bon r√©pertoire
- Si vous utilisez Jupyter Notebook, d√©marrez-le depuis la racine du projet
- Si vous utilisez JupyterLab ou VS Code, ouvrez le dossier racine du projet

### 4. Import manuel alternatif
Si les imports automatiques √©chouent, vous pouvez utiliser :

```python
import sys
from pathlib import Path
sys.path.insert(0, str(Path.cwd().parent))  # Depuis notebooks/
# ou
sys.path.insert(0, r'C:\chemin\vers\sta211-project')  # Chemin absolu
```