In [9]:
import os
import nbformat

def replace_variable_in_notebook(notebook_path, old_name, new_name):
    """
    Replace a variable name in all code cells of a Jupyter notebook (.ipynb).

    Parameters:
    - notebook_path (str): Path to the notebook file.
    - old_name (str): Variable name to replace.
    - new_name (str): New variable name.

    Returns:
    - None (Modifies the notebook in place if replacements are found).
    """

    # 🔹 Vérifier si le fichier existe
    if not os.path.exists(notebook_path):
        print(f"❌ Erreur : Le fichier '{notebook_path}' n'existe pas dans le répertoire courant !")
        print(f"📂 Répertoire actuel : {os.getcwd()}")
        return
    
    print(f"✅ Le fichier '{notebook_path}' a été trouvé !\n")

    # 🔹 Charger le notebook
    with open(notebook_path, "r", encoding="utf-8") as f:
        notebook = nbformat.read(f, as_version=4)

    # 🔹 Afficher un extrait du fichier pour vérifier son contenu
#     print("🔍 Aperçu des 500 premiers caractères du notebook :")
#     notebook_content = str(notebook)
#     print(notebook_content[:500])  # Afficher un extrait pour voir si `old_name` est dedans

    # 🔹 Remplacement des occurrences dans les cellules de code
    modifications = 0
    for cell in notebook["cells"]:
        if cell["cell_type"] == "code" and old_name in cell["source"]:
            print(f"✅ Trouvé dans une cellule de code :\n{cell['source'][:100]}...\n")
            cell["source"] = cell["source"].replace(old_name, new_name)
            modifications += 1

    # 🔹 Vérification avant sauvegarde
    if modifications > 0:
        print(f"\n✅ Remplacement terminé : {old_name} → {new_name} ({modifications} modifications)")

        # 🔹 Sauvegarder le notebook modifié
        with open(notebook_path, "w", encoding="utf-8") as f:
            nbformat.write(notebook, f)

        print(f"📁 Fichier sauvegardé : {notebook_path}")

    else:
        print(f"\n⚠️ Aucune occurrence de '{old_name}' trouvée dans {notebook_path}.")


In [12]:
# replace_variable_in_notebook("4_Text_Cleaning.ipynb", "df_xtrain", "X_train")
replace_variable_in_notebook("4_Text_Cleaning.ipynb", "df_xtest", "X_test")

✅ Le fichier '4_Text_Cleaning.ipynb' a été trouvé !

🔍 Aperçu des 500 premiers caractères du notebook :
{'cells': [{'cell_type': 'code', 'execution_count': None, 'id': 'ca9ea376', 'metadata': {}, 'outputs': [], 'source': '#Mourad\nX_train = load_pickle(train_pickle_path, "X_train_img.pkl")\ndf_xtest = load_pickle(test_pickle_path, "X_test_img.pkl")\n'}, {'cell_type': 'markdown', 'id': 'd0a3a4f1', 'metadata': {}, 'source': '# Text Cleaning  \n\n## 📌 Notebook Objective  \n\nIn this notebook, we focus on **cleaning and preprocessing text data** to enhance the quality of textual features for modeling.
✅ Trouvé dans une cellule de code :
#Mourad
X_train = load_pickle(train_pickle_path, "X_train_img.pkl")
df_xtest = load_pickle(test_pick...

✅ Trouvé dans une cellule de code :
import os
import pandas as pd

# Adjust the display width for columns
pd.set_option('display.max_col...

✅ Trouvé dans une cellule de code :

# Convert designation and description to string type explicitly
X_train["des

In [8]:
#V0

# import os
# import nbformat

# # 📌 Nom du notebook à modifier
# notebook_path = "4_Text_Cleaning.ipynb"

# # 🔹 Ancien et nouveau nom de variable
# old_name = "df_train"
# new_name = "X_train"

# # 🔹 Vérifier si le notebook existe
# if not os.path.exists(notebook_path):
#     print(f"❌ Erreur : Le fichier '{notebook_path}' n'existe pas dans le répertoire courant !")
#     print(f"📂 Répertoire actuel : {os.getcwd()}")
# else:
#     print(f"✅ Le fichier '{notebook_path}' a été trouvé !\n")

#     # 🔹 Charger le notebook
#     with open(notebook_path, "r", encoding="utf-8") as f:
#         notebook = nbformat.read(f, as_version=4)

#     # 🔹 Afficher les premières lignes du fichier (pour vérifier son contenu)
#     print("🔍 Aperçu des 500 premiers caractères du notebook :")
#     notebook_content = str(notebook)
#     print(notebook_content[:1000])  # Afficher un extrait pour voir si `df_xtrain` est dedans

#     # 🔹 Remplacer toutes les occurrences dans les cellules de code
#     modifications = 0
#     for cell in notebook["cells"]:
#         if cell["cell_type"] == "code":
#             if old_name in cell["source"]:
#                 print(f"✅ Trouvé dans une cellule de code :\n{cell['source'][:100]}...\n")
#                 cell["source"] = cell["source"].replace(old_name, new_name)
#                 modifications += 1

#     # Vérification avant sauvegarde
#     if modifications > 0:
#         print(f"\n✅ Remplacement terminé : {old_name} → {new_name} ({modifications} modifications)")

#         # 🔹 Sauvegarder le notebook modifié
#         with open(notebook_path, "w", encoding="utf-8") as f:
#             nbformat.write(notebook, f)

#         print(f"📁 Fichier sauvegardé : {notebook_path}")

#     else:
#         print(f"\n⚠️ Aucune occurrence de '{old_name}' trouvée dans {notebook_path}.")


✅ Le fichier '4_Text_Cleaning.ipynb' a été trouvé !

🔍 Aperçu des 500 premiers caractères du notebook :
{'cells': [{'cell_type': 'code', 'execution_count': None, 'id': 'ca9ea376', 'metadata': {}, 'outputs': [], 'source': '#Mourad\ndf_train = load_pickle(train_pickle_path, "df_train_img.pkl")\ndf_xtest = load_pickle(test_pickle_path, "X_test_img.pkl")\n'}, {'cell_type': 'markdown', 'id': 'd0a3a4f1', 'metadata': {}, 'source': '# Text Cleaning  \n\n## 📌 Notebook Objective  \n\nIn this notebook, we focus on **cleaning and preprocessing text data** to enhance the quality of textual features for modeling.  \n\nText cleaning is a crucial step in **Natural Language Processing (NLP)**, ensuring that the input data is **consistent, structured, and noise-free**. This will **improve model performance** for text-based classification.  \n\n###  **Key Steps**  \n\n✔ **Loading structured datasets** → Import cleaned product metadata (`df_train_img.pkl` & `X_test_img.pkl`).  \n✔ **Creating a unified tex