In [2]:
import pandas as pd
import json

# 1️⃣ Charger le fichier Excel local
file_path = "data.xlsx"  # Remplace par le chemin de ton fichier Excel
df = pd.read_excel(file_path)  # Lire le fichier Excel

# 2️⃣ Transformer les données en liste de dictionnaires
data_list = df.to_dict(orient="records")  # Convertir les lignes en liste de dictionnaires

# 3️⃣ Extraire uniquement les champs "content"
content_list = [item["content"] for item in data_list if "content" in item]

# 🔹 Vérification du type des éléments extraits
print("Type des éléments de content_list :", type(content_list[0]))  # Vérifie si ce sont des dicts ou des str

# 4️⃣ Convertir les chaînes JSON en dictionnaires si nécessaire
for i, content in enumerate(content_list):
    if isinstance(content, str):  # Si "content" est une chaîne, on essaie de le convertir en JSON
        try:
            # Remplacer les guillemets simples par doubles si nécessaire
            if "'" in content and '"' not in content:
                content = content.replace("'", '"')

            # Essayer de charger le JSON proprement
            content_list[i] = json.loads(content)

        except json.JSONDecodeError:
            print(f"❌ Erreur de conversion JSON sur l'élément {i} : {content}")
            continue  # Passer à l'élément suivant

# 5️⃣ Convertir les valeurs numériques correctement
for content in content_list:
    if isinstance(content, dict):  # Vérifier que content est bien un dictionnaire
        for key, value in content.items():
            if isinstance(value, str) and value.replace(".", "", 1).isdigit():
                content[key] = float(value) if "." in value else int(value)

# 6️⃣ Enregistrer les données extraites dans un fichier JSON
with open("excel_content_data.json", "w", encoding="utf-8") as json_file:
    json.dump(content_list, json_file, indent=4, ensure_ascii=False)

print(f"✅ {len(content_list)} Données extraites et enregistrées dans excel_content_data.json sans guillemets autour des nombres.")


Type des éléments de content_list : <class 'str'>
✅ 6 Données extraites et enregistrées dans excel_content_data.json sans guillemets autour des nombres.


In [3]:
print(type("excel_content_data.json"))

<class 'str'>
