In [None]:
import os
import pandas as pd
from sklearn.model_selection import train_test_split
import shutil
from tqdm import tqdm

# Données d'entrées

# dossier contenant les tuiles 
LAME_DIR_F="/"
LAME_DIR_G="/"

# Dossier test 
TEST_DIR="/Test/"

if not os.path.exists(TEST_DIR):
    os.makedirs(TEST_DIR)

# Dossier train
TRAIN_DIR="/Train/"

if not os.path.exists(TRAIN_DIR):
    os.makedirs(TRAIN_DIR)
    os.makedirs(TRAIN_DIR+"lit/")
    os.makedirs(TRAIN_DIR+"background/")

# Dossier valid 
VALID_DIR="/Valid/"

if not os.path.exists(VALID_DIR):
    os.makedirs(VALID_DIR)
    os.makedirs(VALID_DIR+"lit/")
    os.makedirs(VALID_DIR+"background/")

In [None]:
# Création de la partie 10% Test et 90% entrainement 

lame_f = os.listdir(LAME_DIR_F)
df_f = pd.DataFrame({"Nom des Lames": lame_f})
Train_f, Test_f= train_test_split(df_f, test_size=0.1, random_state=10)
print(Train_f.shape)
print(Test_f.shape)

lame_g = os.listdir(LAME_DIR_G)
df_g = pd.DataFrame({"Nom des Lames": lame_g})
Train_g, Test_g= train_test_split(df_g, test_size=0.2, random_state=10)
print(Train_g.shape)
print(Test_g.shape)

Train=pd.concat([Train_f,Train_g],axis=0)
Test=pd.concat([Test_f,Test_g],axis=0)

print(Train.shape)
print(Test.shape)

In [None]:
# Enregistrement des lames dans Test

for dossier in tqdm(Test["Nom des Lames"]):
    if os.path.isdir(LAME_DIR_F+dossier):
        
        shutil.copytree(LAME_DIR_F+dossier, TEST_DIR+dossier)
        
    elif os.path.isdir(LAME_DIR_G+dossier):
        
        shutil.copytree(LAME_DIR_G+dossier, TEST_DIR+dossier)
    else : 
        print("ERREUR ",dossier,"non trouvé")

In [None]:
# Créé dataset avec tuiles et non lames afin de pouvoir les mélanger 

df_Train_lit=[]
df_Train_background=[]
for lame in tqdm(Train["Nom des Lames"]):
    if os.path.isdir(LAME_DIR_F+lame):
        tile_lit=os.listdir(LAME_DIR_F+lame+"/lit")
        df_Train_lit.extend(tile_lit)
        tile_background=os.listdir(LAME_DIR_F+lame+"/background")
        df_Train_background.extend(tile_background)
    elif os.path.isdir(LAME_DIR_G+lame):
        tile_lit=os.listdir(LAME_DIR_G+lame+"/lit")
        df_Train_lit.extend(tile_lit)
        tile_background=os.listdir(LAME_DIR_G+lame+"/background")
        df_Train_background.extend(tile_background)   

df_lit = pd.DataFrame({'Tile': df_Train_lit})
print(df_lit.shape)

df_temp_background=pd.DataFrame({'Tile': df_Train_background})
print(df_temp_background.shape)

In [None]:
# Séparation du lit en 80% Train et 20% Valid

df_train_lit,df_valid_lit= train_test_split(df_lit, test_size=0.2, random_state=42)

print(df_train_lit.shape)
print(df_valid_lit.shape)

In [None]:
# Enregistrement des tuiles lit pour Train 

x=0
for fichier in tqdm(df_train_lit["Tile"]):
    x+=1
    if x>0:
        f=fichier.split(" ")
        if os.path.isdir(LAME_DIR_F+f[0]):
            
            shutil.copy(LAME_DIR_F+f[0]+"/lit/"+fichier, TRAIN_DIR+"lit/"+fichier)
            p=fichier.split(".")
        elif os.path.isdir(LAME_DIR_G+f[0]):
            
            shutil.copy(LAME_DIR_G+f[0]+"/lit/"+fichier, TRAIN_DIR+"lit/"+fichier)
            p=fichier.split(".")
        else : 
            print("ERREUR ",fichier,"non trouvé")

In [None]:
# Enregistrement des tuiles lit pour Valid

for fichier in tqdm(df_valid_lit["Tile"]):
    
    f=fichier.split(" ")
    if os.path.isdir(LAME_DIR_F+f[0]):
        
        shutil.copy(LAME_DIR_F+f[0]+"/lit/"+fichier, VALID_DIR+"lit/"+fichier)
        p=fichier.split(".")
    elif os.path.isdir(LAME_DIR_G+f[0]):
        
        shutil.copy(LAME_DIR_G+f[0]+"/lit/"+fichier, VALID_DIR+"lit/"+fichier)
        p=fichier.split(".")
    else : 
        print("ERREUR ",fichier,"non trouvé")

In [None]:
# Créationn background avec même nombre de tuile que pour le lit

df_background = df_temp_background.sample(n=df_lit.shape[0], random_state=42)
print(df_background.shape)


In [None]:
# Séparation 80% Train et 20% Valid pour backgroud 

df_train_background,df_valid_background= train_test_split(df_background, test_size=0.2, random_state=42)

print(df_train_background.shape)
print(df_valid_background.shape)

In [None]:
# Enregistrement des tuiles background pour Train 

x=0
for fichier in tqdm(df_train_background["Tile"]):
    x=x+1
    if x>0:
        f=fichier.split(" ")
        if os.path.isdir(LAME_DIR_F+f[0]):
            
            shutil.copy(LAME_DIR_F+f[0]+"/background/"+fichier, TRAIN_DIR+"background/"+fichier)
            p=fichier.split(".")
        elif os.path.isdir(LAME_DIR_G+f[0]):
            
            shutil.copy(LAME_DIR_G+f[0]+"/background/"+fichier, TRAIN_DIR+"background/"+fichier)
            p=fichier.split(".")
        else : 
            print("ERREUR ",fichier,"non trouvé")

In [None]:
# Enregistrement des tuiles background pour Valid 


x=0
for fichier in tqdm(df_valid_background["Tile"]):
    x+=1
    if x>0:
        f=fichier.split(" ")
        if os.path.isdir(LAME_DIR_F+f[0]):
            
            shutil.copy(LAME_DIR_F+f[0]+"/background/"+fichier, VALID_DIR+"background/"+fichier)
            p=fichier.split(".")
        elif os.path.isdir(LAME_DIR_G+f[0]):
            
            shutil.copy(LAME_DIR_G+f[0]+"/background/"+fichier, VALID_DIR+"background/"+fichier)
            p=fichier.split(".")
        else : 
            print("ERREUR ",fichier,"non trouvé")