In [1]:
pip install wfdb pandas matplotlib


Note: you may need to restart the kernel to use updated packages.


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import wfdb
import os

# Définir le chemin vers les sous-dossiers records100
base_path =r'D:\ECG_data\ptb-xl-a-large-publicly-available-electrocardiography-dataset-1.0.1\records100'

output_dir = "D:\ECG_data\ECG_images_Filtered"  # Dossier pour sauvegarder les images
# Créer le dossier de sortie s'il n'existe pas
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# Définir le sous-dossier spécifique à traiter
target_folder = "18000"  # Remplacez par le nom du dossier que vous souhaitez traiter
folder_path = os.path.join(base_path, target_folder)


# Vérifier que le dossier 6000 existe bien
if os.path.isdir(folder_path):
    print(f"Traitement du dossier : {folder_path}")

    # Parcourir chaque fichier .dat dans le dossier 6000
    for file_name in os.listdir(folder_path):
        if file_name.endswith(".dat"):
            # Générer le chemin complet du fichier .dat
            file_path = os.path.join(folder_path, file_name)

            # Définir le nom de l'image de sortie
            image_name = file_name.replace('.dat', '.png')
            image_path = os.path.join(output_dir, image_name)

            # Vérifier si l'image existe déjà
            if os.path.exists(image_path):
                print(f"Image déjà existante, passage : {image_path}")
                continue  # Passer au fichier suivant
            
            try:
                # Lire le fichier .dat avec wfdb
                record = wfdb.rdrecord(file_path[:-4])  # retirer l'extension .dat
                print(f"Signal bien chargé : {file_path}")
                
                # Extraire les signaux ECG et autres informations
                signal = record.p_signal  # Signal ECG (1000 échantillons x 12 leads)
                leads = record.sig_name   # Noms des leads (ex: ['I', 'II', 'III', ..., 'V6'])
                fs = record.fs            # Fréquence d'échantillonnage (100 Hz)

                # Vérification de la structure du signal
                num_samples, num_leads = signal.shape
                assert num_leads == 12, "Le signal doit contenir 12 dérivations"

                # Organisation des leads en deux colonnes
                leads_left = leads[:6]   # Premiers 6 leads
                leads_right = leads[6:]  # Derniers 6 leads

                # Paramètres standards d'affichage
                speed = 25  # mm/s
                amplitude = 10  # mm/mV

                # Conversion en unités de l'affichage ECG
                time_conversion = speed / fs  # 25 mm/s correspond à fs échantillons
                amplitude_conversion = 10  # 10 mm/mV

                # Création de la figure
                fig, ax = plt.subplots(figsize=(15, 8))
                fig.patch.set_facecolor('white')

                # Ajouter le quadrillage ECG
                def draw_ecg_grid(ax):
                    ax.set_facecolor('white')

                    # Quadrillage fin (1 mm, soit 0.04s en horizontal et 0.1mV en vertical)
                    ax.set_xticks(np.arange(0, num_samples / fs, 0.04), minor=True)
                    ax.set_yticks(np.arange(-11 * amplitude_conversion, 11 * amplitude_conversion, 1), minor=True)
                    ax.grid(which='minor', linestyle=':', linewidth=0.5, color='red', alpha=0.5)

                    # Quadrillage épais (5 mm, soit 0.2s en horizontal et 0.5mV en vertical)
                    ax.set_xticks(np.arange(0, num_samples / fs, 0.2))
                    ax.set_yticks(np.arange(-7 * amplitude_conversion, 7 * amplitude_conversion, 5))
                    ax.grid(which='major', linestyle='-', linewidth=0.8, color='red', alpha=0.8)

                draw_ecg_grid(ax)

                # Temps en secondes ajusté à la vitesse d'affichage
                time = np.linspace(0, num_samples / fs, num_samples) * time_conversion

                # Espacement vertical entre les signaux en tenant compte de l’amplitude
                spacing = 2 * amplitude_conversion  # Ajustable pour lisibilité

                # Tracé des leads en deux colonnes
                for i in range(6):
                    # Leads de gauche
                    ax.plot(time, signal[:, i] * amplitude_conversion - i * spacing, color='black', linewidth=1)
                    ax.text(-0.1, -i * spacing, leads_left[i], fontsize=12, fontweight='bold', ha='right', va='center')

                    # Leads de droite (décalés pour être à droite)
                    ax.plot(time + 2.6, signal[:, i + 6] * amplitude_conversion - i * spacing, color='black', linewidth=1)
                    ax.text(2.59, -i * spacing, leads_right[i], fontsize=12, fontweight='bold', ha='right', va='center')

                # Suppression des axes
                ax.set_xticks([])
                ax.set_yticks([])
                ax.set_frame_on(True)

                # Sauvegarder l'image dans le dossier de sortie
                plt.savefig(image_path, dpi=300, bbox_inches='tight', transparent=False)
                print(f"Image sauvegardée : {image_path}")

                # Fermer la figure pour libérer de la mémoire
                plt.close(fig)

            except Exception as e:
                # En cas d'erreur, afficher le message d'erreur
                print(f"Erreur de chargement pour {file_path}: {e}")

else:
    print(f"Le dossier {folder_path} n'existe pas.")


  output_dir = "D:\ECG_data\ECG_images_Filtered"  # Dossier pour sauvegarder les images


Traitement du dossier : D:\ECG_data\ptb-xl-a-large-publicly-available-electrocardiography-dataset-1.0.1\records100\18000
Signal bien chargé : D:\ECG_data\ptb-xl-a-large-publicly-available-electrocardiography-dataset-1.0.1\records100\18000\18000_lr.dat
Image sauvegardée : D:\ECG_data\ECG_images_Filtered\18000_lr.png
Signal bien chargé : D:\ECG_data\ptb-xl-a-large-publicly-available-electrocardiography-dataset-1.0.1\records100\18000\18001_lr.dat
Image sauvegardée : D:\ECG_data\ECG_images_Filtered\18001_lr.png
Signal bien chargé : D:\ECG_data\ptb-xl-a-large-publicly-available-electrocardiography-dataset-1.0.1\records100\18000\18002_lr.dat
Image sauvegardée : D:\ECG_data\ECG_images_Filtered\18002_lr.png
Signal bien chargé : D:\ECG_data\ptb-xl-a-large-publicly-available-electrocardiography-dataset-1.0.1\records100\18000\18003_lr.dat
Image sauvegardée : D:\ECG_data\ECG_images_Filtered\18003_lr.png
Image déjà existante, passage : D:\ECG_data\ECG_images_Filtered\18004_lr.png
Image déjà existan