# 📒 Notebook : 04_silver_to_table

---

## 📝 Objectif

- Migrer les fichiers de la **couche silver** (`/files/silver`) vers des tables Delta cataloguées.
- Garantir la cohérence et la traçabilité entre les fichiers déposés et la table officielle “silver”.
- Permettre la requête SQL directe sur les jeux de données silver (`silver.nom_table`).

---

## 📥 Inputs

| Dataset         | Format     | Emplacement                        | Description                        |
|-----------------|-----------|-------------------------------------|-------------------------------------|
| icd_code       | Delta      | /health_lakehouse/Files/silver/icd_code         | Données catégorie de maladie enrichies    |
| patient      | Delta      | /health_lakehouse/Files/silver/patient         | Données patient enrichies    |
| maladie       | Delta      | /health_lakehouse/Files/silver/maladie         | Données maladie listées    |
| motif_admission       | Delta      | /health_lakehouse/Files/silver/motif_admission         | Données motif admission listées    |
| medicament       | Delta      | /health_lakehouse/Files/silver/medicament         | Données médicament listées    |
| meds_code        | Delta        | /health_lakehouse/Files/silver/meds_code       | Données catégorie de médicaments enrichies       |
| motifs_code        | Delta        | /health_lakehouse/Files/silver/motifs_code       | Données catégorie de motifs d'admission enrichies     |
---

## 📤 Outputs

| Table           | Format     | Nom de Table           | Description                    |
|-----------------|-----------|------------------------|---------------------------------|
| icd_code        | Delta      | silver_icd_code        | Table silver catégorie de maladie          |
| hopital      | Delta      | silver_hopital         | Table silver hopital (concaténation des 4 df)    |
| meds_code        | Delta      | silver_meds_code        | Table silver catégorie de médicament          |
| motifs_code        | Delta      | silver_motifs_code        | Table silver catégorie de motifs d'admission          |

---

## 👤 Auteur(s) / Contact

- SEKARI Inès — [ines.sekari@efrei.net]
- NKUIDA Malaïka - [malaika.nkuida@efrei.net]

---

## 🗓️ Versioning & Mise à jour

| Version | Date        | Modifications                          |
|---------|-------------|----------------------------------------|
| 1.0     | 2025-05-05  | Création du script de migration        |


In [3]:
# 0. ENVIRONNEMENT
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()

# 1. VARIABLES
datasets = [
    "icd_code",
    "meds_code",
    "motifs_code",
    "hopital",
]

file_format = "delta"

# 2. MIGRATION FILE → TABLE (écriture dans le Lakehouse)
for dataset in datasets:
    src_path = f"Files/silver/{dataset}"
    table_name = f"silver_{dataset.replace('-', '_')}"  # remplace '-' car interdit dans les noms de tables SQL
    # Lecture du fichier Delta
    df = spark.read.format(file_format).load(src_path)
    # Écriture dans le Lakehouse (table Delta)
    df.write.format("delta").mode("overwrite").saveAsTable(table_name)
    print(f"✅ Table créée/MAJ : {table_name}")


# 3. VÉRIFICATION : Afficher toutes les tables du Lakehouse
display(spark.sql("SHOW TABLES"))

StatementMeta(, d2141806-0e4c-4a0e-ad51-fc86979f8dae, 5, Finished, Available, Finished)

✅ Table créée/MAJ : silver_icd_code
✅ Table créée/MAJ : silver_meds_code
✅ Table créée/MAJ : silver_motifs_code
✅ Table créée/MAJ : silver_hopital


SynapseWidget(Synapse.DataFrame, 838de0f6-62c7-469a-895f-ec3e57ce180f)