In [4]:
import json
from datetime import datetime
import locale
import re

# Définir la locale en français pour interpréter les noms de mois/jours en français
try:
    locale.setlocale(locale.LC_TIME, "fr_FR.UTF-8")
except locale.Error:
    print("Locale 'fr_FR.UTF-8' non disponible, utilisation de la locale par défaut.")

# Fonction pour normaliser la date au format "DD/MM/YYYY à HHhMM" et supprimer "Le "
def normalize_date(date_str):
    if not date_str:  # Vérifier si la date est vide ou None
        return ""

    # Supprimer "Le " en début de chaîne s'il est présent
    date_str = re.sub(r"^Le\s+", "", date_str, flags=re.IGNORECASE)
    
    formats = [
        "%A %d %B %Y - %H:%M",  # Exemple : dimanche 16 février 2025 - 20:34
        "%d/%m/%Y à %Hh%M"       # Déjà au bon format
    ]
    
    for fmt in formats:
        try:
            return datetime.strptime(date_str, fmt).strftime("%d/%m/%Y à %Hh%M")
        except ValueError:
            continue
    return date_str  # Retourne la date originale si aucun format ne correspond

# Charger les fichiers JSON en gérant les erreurs
def load_json(filename):
    try:
        with open(filename, "r", encoding="utf-8") as f:
            return json.load(f)
    except (json.JSONDecodeError, FileNotFoundError) as e:
        print(f"Erreur lors de la lecture du fichier {filename}: {e}")
        return []

data1 = load_json("hespress_db.json")
data2 = load_json("Le360_db.json")

# Liste pour stocker les articles combinés
combined_data = []

# Traitement des fichiers
for dataset in [data1, data2]:
    for item in dataset:
        combined_data.append({
            "title": item.get("title", ""),
            "date": normalize_date(item.get("date", "")),
            "category": item.get("category", ""),
            "content": item.get("content", "")
        })

# Sauvegarde des données combinées dans un nouveau fichier JSON
with open("combined_db.json", "w", encoding="utf-8") as f:
    json.dump(combined_data, f, ensure_ascii=False, indent=4)

print("Fusion terminée avec succès. Résultat enregistré dans 'combined_db.json'.")


Fusion terminée avec succès. Résultat enregistré dans 'combined_db.json'.
