# 📒 Notebook : 02_bronze_to_table

---

## 📝 Objectif

- Migrer les fichiers de la **couche bronze** (`/files/bronze`) vers des tables Delta cataloguées.
- Garantir la cohérence et la traçabilité entre les fichiers déposés et la table officielle “bronze”.
- Permettre la requête SQL directe sur les jeux de données bronze (`bronze.nom_table`).

---

## 📥 Inputs

| Dataset         | Format     | Emplacement                        | Description                        |
|-----------------|-----------|-------------------------------------|-------------------------------------|
| icd_code       | Delta      | /health_lakehouse/Files/bronze/icd_code         | Données catégorie de maladie après nettoyage    |
| patient      | Delta      | /health_lakehouse/Files/bronze/patient         | Données patient après nettoyage    |
| maladie       | Delta      | /health_lakehouse/Files/bronze/maladie         | Données maladie après nettoyage    |
| motif_admission       | Delta      | /health_lakehouse/Files/bronze/motif_admission         | Données motif admission après nettoyage    |
| medicament       | Delta      | /health_lakehouse/Files/bronze/medicament         | Données médicament après nettoyage    |
| meds_code        | Delta        | /health_lakehouse/Files/bronze/meds_code       | Données catégorie de médicaments après nettoyage       |
| motifs_code        | Delta        | /health_lakehouse/Files/bronze/motifs_code       | Données catégorie de motifs d'admission après nettoyage     |
---

## 📤 Outputs

| Table           | Format     | Nom de Table           | Description                    |
|-----------------|-----------|------------------------|---------------------------------|
| icd_code        | Delta      | bronze_icd_code        | Table bronze catégorie de maladie          |
| patient      | Delta      | bronze_patient         | Table bronze patient    |
| maladie       | Delta      | bronze_maladie         | Table bronze maladie    |
| motif_admission       | Delta      | bronze_motif_admission         | Table bronze motif admission    |
| medicament       | Delta      | bronze_medicament         | Table bronze médicament    |
| meds_code       | Delta      | bronze_meds_code         | Table bronze catégorie de médicament    |
| motifs_code       | Delta      | bronze_motifs_code         | Table bronze catégorie de motifs d'admission    |
---

## 👤 Auteur(s) / Contact

- SEKARI Inès — [ines.sekari@efrei.net]
- NKUIDA Malaïka - [malaika.nkuida@efrei.net]

---

## 🗓️ Versioning & Mise à jour

| Version | Date        | Modifications                          |
|---------|-------------|----------------------------------------|
| 1.0     | 2025-04-27  | Création du script de migration        |


In [3]:
# 0. ENVIRONNEMENT
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()


# 1. VARIABLES
datasets = [
    "maladie",
    "icd_code",
    "meds_code",
    "motifs_code",
    "medicament",
    "motif_admission",
    "patient"
]
file_format = "delta"


# 2. MIGRATION FILE → TABLE (écriture dans le Lakehouse)
for dataset in datasets:
    src_path = f"Files/bronze/{dataset}"
    table_name = f"bronze_{dataset.replace('-', '_')}"  # remplace '-' car interdit dans les noms de tables SQL
    # Lecture du fichier Delta
    df = spark.read.format(file_format).load(src_path)
    # Écriture dans le Lakehouse (table Delta)
    df.write.format("delta").mode("overwrite").saveAsTable(table_name)
    print(f"✅ Table créée/MAJ : {table_name}")


# 3. VÉRIFICATION : Afficher toutes les tables du Lakehouse
display(spark.sql("SHOW TABLES"))




StatementMeta(, 541d8d7b-1563-4942-ab16-7a2f3022e82e, 5, Finished, Available, Finished)

✅ Table créée/MAJ : bronze_maladie
✅ Table créée/MAJ : bronze_icd_code
✅ Table créée/MAJ : bronze_meds_code
✅ Table créée/MAJ : bronze_motifs_code
✅ Table créée/MAJ : bronze_medicament
✅ Table créée/MAJ : bronze_motif_admission
✅ Table créée/MAJ : bronze_patient


SynapseWidget(Synapse.DataFrame, f28da78b-73a7-4b12-9383-a551b1740498)