In [9]:
import re
import json

def process_js_array(js_file_path, output_file_path):
    with open(js_file_path, 'r', encoding='utf-8') as f:
        js_content = f.read()

    array_match = re.search(r'export\s+const\s+\w+\s*=\s*(\[[\s\S]*\]);?', js_content)
    if not array_match:
        raise ValueError("Aucun tableau trouvé dans le fichier JS.")
    array_str = array_match.group(1)

    array_str = re.sub(r',\s*([\]}])', r'\1', array_str)

    data = json.loads(array_str)

    # Garder seulement les objets dont 'genre' est une seule lettre de A à Z (maj ou min)
    data = [
        obj for obj in data
        if isinstance(obj.get('genre'), str) and re.fullmatch(r'[A-Za-z]', obj.get('genre'))
    ]

    data_sorted = sorted(data, key=lambda x: x.get('genre', ''))

    with open(output_file_path, 'w', encoding='utf-8') as f:
        json.dump(data_sorted, f, ensure_ascii=False, indent=2)

# Exemple d'utilisation :
process_js_array('./medicament.js', 'donnees_traite.json')


In [2]:
import json

def modifier_json_avec_id_et_status(input_file, output_file):
    with open(input_file, 'r', encoding='utf-8') as f:
        data = json.load(f)

    for idx, obj in enumerate(data, 4000):
        obj['_id'] = str(idx)
        fournisseur = obj.get('fournisseur')
        if isinstance(fournisseur, dict) and 'status' in fournisseur:
            fournisseur['fournisseurStatus'] = fournisseur.pop('status')

    with open(output_file, 'w', encoding='utf-8') as f:
        json.dump(data, f, ensure_ascii=False, indent=2)

# Exemple d'utilisation :
modifier_json_avec_id_et_status('./medicament_all_processed_modified.json', 'fichier.json')

In [2]:
import re
import json

def add_id_to_js_objects(js_file_path, output_file_path):
    with open(js_file_path, 'r', encoding='utf-8') as f:
        js_content = f.read()

    # Extraire le tableau d'objets du fichier JS
    array_match = re.search(r'export\s+const\s+\w+\s*=\s*(\[[\s\S]*\]);?', js_content)
    if not array_match:
        raise ValueError("Aucun tableau trouvé dans le fichier JS.")
    array_str = array_match.group(1)

    # Corriger les virgules finales
    array_str = re.sub(r',\s*([\]}])', r'\1', array_str)

    data = json.loads(array_str)

    # Ajouter un id unique à chaque objet
    for idx, obj in enumerate(data, 1):
        obj['id'] = idx

    # Sauvegarder le résultat dans un nouveau fichier
    with open(output_file_path, 'w', encoding='utf-8') as f:
        json.dump(data, f, ensure_ascii=False, indent=2)

# Exemple d'utilisation :
add_id_to_js_objects('./medicament.js', 'donnees_traite_avec_id.json')

In [None]:
import json

# Charger les données depuis un fichier .json
with open("./", "r", encoding="utf-8") as f:
    objets = json.load(f)

# Compter les genres
compteur_genres = {}

for objet in objets:
    genre = objet.get("genre")
    if not genre:
        genre = "Inconnu"
    compteur_genres[genre] = compteur_genres.get(genre, 0) + 1

# Afficher les résultats
print("Résumé des genres :")
for genre, count in sorted(compteur_genres.items()):
    print(f"{genre} ==> {count} objet(s)")


Résumé des genres :
Inconnu ==> 5258 objet(s)
