# Programa auxiliar para separar las imágenes para Entrenamiento y Validación:

1) Cargar librerías:

In [None]:
import os
import os.path
import numpy as np
import shutil

print ("Librerías cargadas.")

2) Montar el Drive:

In [None]:
# monta Google Drive:
# Nota: la primera vez se debe confirmar el uso logueandose en "Google Drive File Stream" y obteniendo código de autentificación.
from google.colab import drive
drive.mount('/content/gdrive', force_remount=True)

# directorio local en Google Drive
path = '/content/gdrive/My Drive/GEMIS/objDetectionCursogramas'

3) Levantar y procesar la carpeta de imágenes a distribuir:

In [None]:
# variables auxiliares
all_images_array = []
auxiPath = path + "/Cursogramas/Generados/casos"

# crea los directorios, si es necesario
dirDestTrain = path +'/Cursogramas/train/'
dirDestTest = path +'/Cursogramas/validation/' 
if not os.path.isdir(dirDestTrain):
  os.makedirs(dirDestTrain)
if not os.path.isdir(dirDestTest):
  os.makedirs(dirDestTest)

# procesa los archicos
allFileNames = []
train_FileNames = []
test_FileNames = []

# levanta la lista de imágenes de cada letra
allFileNames = [ fn for fn in os.listdir( auxiPath ) if fn.endswith('.png') or fn.endswith('.jpg') ]

# desordena y separa datos para train y para validación
np.random.shuffle(allFileNames)
train_FileNames, test_FileNames = np.split(np.array(allFileNames), [int(len(allFileNames)*0.98)])

print('Total Imágenes Disponibles: ', len(allFileNames))
print('- Imágenes para Entrenaiento: ', len(train_FileNames))
print('- Imágenes para Validación: ', len(test_FileNames))
print("\n")


In [None]:
# mueve archivos para Entrenamiento
cant = 0
cantXML = 0

# crea destinos
auxImgDir = dirDestTrain + 'images'
auxXMLDir = dirDestTrain + 'annotations'

if not os.path.isdir(auxImgDir):
  os.makedirs(auxImgDir)

if not os.path.isdir(auxXMLDir):
  os.makedirs(auxXMLDir)

for name in train_FileNames:
  # mueve la imagen
  if os.path.isfile(auxImgDir + '/' + name):
    print("**", name, " ya existe en ", auxImgDir)      
  else:
    shutil.move(auxiPath + '/' + name, auxImgDir)
    cant = cant + 1
  # mueve el xml
  nameXML = name.replace(".png", ".xml")
  if os.path.isfile(auxXMLDir + '/' + nameXML):
    print("**", nameXML, " ya existe en ", auxXMLDir)      
  else:
    shutil.move(auxiPath + '/' + nameXML, auxXMLDir)
    cantXML = cantXML + 1
print(cant, " imágenes movidas a ", auxImgDir)
print(cantXML, " XML movidos a ", auxXMLDir)
print("\n")


In [None]:
# mueve archivos para Validación
cant = 0
cantXML = 0

# crea destinos
auxImgDir = dirDestTest + 'images'
auxXMLDir = dirDestTest + 'annotations'

if not os.path.isdir(auxImgDir):
  os.makedirs(auxImgDir)

if not os.path.isdir(auxXMLDir):
  os.makedirs(auxXMLDir)

for name in test_FileNames:
  # mueve la imagen
  if os.path.isfile(auxImgDir + '/' + name):
    print("**", name, " ya existe en ", auxImgDir)      
  else:
    shutil.move(auxiPath + '/' + name, auxImgDir)
    cant = cant + 1
  # mueve el xml
  nameXML = name.replace(".png", ".xml")
  if os.path.isfile(auxXMLDir + '/' + nameXML):
    print("**", nameXML, " ya existe en ", auxXMLDir)      
  else:
    shutil.move(auxiPath + '/' + nameXML, auxXMLDir)
    cantXML = cantXML + 1
print(cant, " imágenes movidas a ", auxImgDir)
print(cantXML, " XML movidos a ", auxXMLDir)
print("\n")


In [None]:
# fuerza la actualizacion del drive
drive.flush_and_unmount()

4) Chequea que se haya pasado todo:

In [None]:
# vuelve a montar
drive.mount('/content/gdrive', force_remount=True)

# variables auxiliares
allFileNames = []
train_FileNames = []
test_FileNames = []

 # muestra cantidades de imágenes
allFileNames = [ fn for fn in os.listdir( auxiPath ) if fn.endswith('.png') ]
train_FileNames = [ fn for fn in os.listdir( dirDestTrain + '/' + 'images' ) if fn.endswith('.png') ]
test_FileNames = [ fn for fn in os.listdir( dirDestTest + '/' + 'images' ) if fn.endswith('.png') ]
print('Total de Imágenes Generadas: ', len(allFileNames))
print('- Total de Imágenes en Training: ', len(train_FileNames))
print('- Total de Imágenes en Validación: ', len(test_FileNames))
print("\n")

# muestra cantidades de XML
allFileNames = [ fn for fn in os.listdir( auxiPath ) if fn.endswith('.xml') ]
train_FileNames = [ fn for fn in os.listdir( dirDestTrain + '/' + 'annotations') if fn.endswith('.xml') ]
test_FileNames = [ fn for fn in os.listdir( dirDestTest + '/' + 'annotations') if fn.endswith('.xml') ]
print('Total de XML Generados: ', len(allFileNames))
print('- Total de XML en Training: ', len(train_FileNames))
print('- Total de XML en Validación: ', len(test_FileNames))
print("\n")