In [17]:
import os
import shutil


def copiaza_dcm_din_subfoldere(dir_sursa, dir_destinatie, nr_directoare=3):
    os.makedirs(dir_destinatie, exist_ok=True)
    subfoldere_dest = [os.path.join(dir_destinatie, f"dir_{i + 1}") for i in range(nr_directoare)]
    for d in subfoldere_dest:
        os.makedirs(d, exist_ok=True)

    index_dir = 0
    for root, _, files in os.walk(dir_sursa):
        for file in files:
            if file.lower().endswith(".dcm"):
                cale_sursa = os.path.join(root, file)
                cale_dest = os.path.join(subfoldere_dest[index_dir % nr_directoare], file)

                # Asigură-te că nu suprascrii fișierele cu același nume
                if os.path.exists(cale_dest):
                    nume, extensie = os.path.splitext(file)
                    count = 1
                    while os.path.exists(cale_dest):
                        cale_dest = os.path.join(subfoldere_dest[index_dir % nr_directoare],
                                                 f"{nume}_{count}{extensie}")
                        count += 1

                shutil.copy2(cale_sursa, cale_dest)
                print(f"Copiat: {cale_sursa} → {cale_dest}")
                index_dir += 1


# Exemplu de rulare

sursa = "rawdata"
destinatie = "dcm_imaginiv2"
copiaza_dcm_din_subfoldere(sursa, destinatie, nr_directoare=3)


Copiat: rawdata\benign\Calc-Test_P_00038_LEFT_CC_1\08-29-2017-DDSM-NA-94942\1.000000-ROI mask images-18515\1-1.dcm → dcm_imaginiv2\dir_1\1-1.dcm
Copiat: rawdata\benign\Calc-Test_P_00038_LEFT_CC_1\08-29-2017-DDSM-NA-94942\1.000000-ROI mask images-18515\1-2.dcm → dcm_imaginiv2\dir_2\1-2.dcm
Copiat: rawdata\benign\Calc-Test_P_00038_LEFT_MLO_1\08-29-2017-DDSM-NA-11739\1.000000-ROI mask images-88680\1-1.dcm → dcm_imaginiv2\dir_3\1-1.dcm
Copiat: rawdata\benign\Calc-Test_P_00038_LEFT_MLO_1\08-29-2017-DDSM-NA-11739\1.000000-ROI mask images-88680\1-2.dcm → dcm_imaginiv2\dir_1\1-2.dcm
Copiat: rawdata\benign\Calc-Test_P_00100_RIGHT_CC_1\08-29-2017-DDSM-NA-29651\1.000000-ROI mask images-97035\1-1.dcm → dcm_imaginiv2\dir_2\1-1.dcm
Copiat: rawdata\benign\Calc-Test_P_00100_RIGHT_CC_1\08-29-2017-DDSM-NA-29651\1.000000-ROI mask images-97035\1-2.dcm → dcm_imaginiv2\dir_3\1-2.dcm
Copiat: rawdata\benign\Calc-Test_P_00100_RIGHT_MLO_1\08-29-2017-DDSM-NA-16849\1.000000-ROI mask images-04668\1-1.dcm → dcm_ima

In [18]:
import os
import pydicom
import numpy as np
from PIL import Image

def converteste_dcm_in_jpg(director_sursa, director_destinatie):
    for root, _, files in os.walk(director_sursa):
        for file in files:
            if file.lower().endswith(".dcm"):
                cale_dcm = os.path.join(root, file)

                try:
                    dcm = pydicom.dcmread(cale_dcm)
                    pixel_array = dcm.pixel_array

                    # Normalizare imagine (0-255)
                    pixel_array = pixel_array.astype(float)
                    pixel_array = (np.maximum(pixel_array, 0) / pixel_array.max()) * 255.0
                    pixel_array = np.uint8(pixel_array)

                    img = Image.fromarray(pixel_array)

                    # Calea relativă față de directorul sursă
                    cale_relativa = os.path.relpath(root, director_sursa)
                    cale_destin = os.path.join(director_destinatie, cale_relativa)
                    os.makedirs(cale_destin, exist_ok=True)

                    nume_fara_ext = os.path.splitext(file)[0]
                    cale_jpg = os.path.join(cale_destin, f"{nume_fara_ext}.jpg")

                    img.save(cale_jpg)
                    print(f"Convertit: {cale_dcm} → {cale_jpg}")

                except Exception as e:
                    print(f"Eroare la {cale_dcm}: {e}")

# Exemplu de rulare

converteste_dcm_in_jpg("dcm_imaginiv2", "all_data")

Convertit: dcm_imaginiv2\dir_1\1-1.dcm → all_data\dir_1\1-1.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_1.dcm → all_data\dir_1\1-1_1.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_10.dcm → all_data\dir_1\1-1_10.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_11.dcm → all_data\dir_1\1-1_11.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_12.dcm → all_data\dir_1\1-1_12.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_13.dcm → all_data\dir_1\1-1_13.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_14.dcm → all_data\dir_1\1-1_14.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_15.dcm → all_data\dir_1\1-1_15.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_16.dcm → all_data\dir_1\1-1_16.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_17.dcm → all_data\dir_1\1-1_17.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_18.dcm → all_data\dir_1\1-1_18.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_19.dcm → all_data\dir_1\1-1_19.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_2.dcm → all_data\dir_1\1-1_2.jpg
Convertit: dcm_imaginiv2\dir_1\1-1_20.dcm → all_data\dir_1\1-1_20.jpg
Convertit: dcm_imaginiv2\dir_1

In [23]:
import os
import random
import shutil

def imparte_imagini_pe_foldere(input_base_dir, output_base_dir, split_ratio=0.8):
    random.seed(42)  # Pentru reproducibilitate

    for dir_name in ['dir_1', 'dir_2', 'dir_3']:
        sursa = os.path.join(input_base_dir, dir_name)
        imagini = [f for f in os.listdir(sursa) if f.lower().endswith(".jpg")]
        random.shuffle(imagini)

        nr_train = int(len(imagini) * split_ratio)
        train_set = imagini[:nr_train]
        val_set = imagini[nr_train:]

        train_dest = os.path.join(output_base_dir, 'train', dir_name)
        val_dest = os.path.join(output_base_dir, 'val', dir_name)
        os.makedirs(train_dest, exist_ok=True)
        os.makedirs(val_dest, exist_ok=True)

        for img in train_set:
            shutil.copy(os.path.join(sursa, img), os.path.join(train_dest, img))
        for img in val_set:
            shutil.copy(os.path.join(sursa, img), os.path.join(val_dest, img))

        print(f"{dir_name}: {len(train_set)} imagini în train, {len(val_set)} în val")

imparte_imagini_pe_foldere("all_data", "data")


dir_1: 100 imagini în train, 26 în val
dir_2: 100 imagini în train, 25 în val
dir_3: 99 imagini în train, 25 în val


✅ Imaginile au fost împărțite în train/ și val/
