In [95]:
import os
from PIL import Image

# ONLY CONVERTING SYDNEY AND UCM DATASETS TO RSICD'S SIZE AND FORMAT (.jpg AND 224 X 224)
SYDNEY_PATH = "/Users/apple/Documents/MDS_labs/DSCI_591/misc/raw_sydney"
UCM_PATH = "/Users/apple/Documents/MDS_labs/DSCI_591/misc/raw_ucm"

In [103]:
def preprocess(dataset_name, directory_path, output_format = '.jpg', size = (224, 224)):
    '''
    Preprocess all the images in a folder. By converting the image
    format to the desired format and resizing the image to the 
    desired size
    
    Parameters:
    ------------
    dataset_name : str
        This name will be appeneded to every image name as well as
        used for the name of directory which will house the images
    directory_path : str
        Absolute path, where the directory containing all the images
        are at. Don't know if relative path works...
    output_format : str
        output format you want example (.jpg, .png, .tif) 
        INCLUDE THE PERIOD before the type
    size : tuple of int (WIDTH, HEIGHT)
        size of the image to be converted 
    
    Return:
    --------
    nothing explict, but it'll create a folder in the same directory
    as the image folder you wanted to preprocess, with all the pre-
    processed images inside
    '''
    # Get the string of the last part of the given directory path
    base_folder = os.path.basename(os.path.normpath(directory_path))
    # Get the absolute path of the upstream folder of the base folder
    upstream_folder = directory_path[:-len(base_folder)]

    # Make new directory to house the preprocessed images 
    os.mkdir(upstream_folder + "preprocessed_" + dataset_name)
    
    for filename in os.listdir(directory_path):
        # debugging purposes 
        print(filename)
        
        # convert everything in the folder that's not the 
        # desired output_format
        if not filename.endswith(output_format):
            # To get rid of the current suffix tag representing
            # current type of image file
            name = filename[:-4]
            name = dataset_name + "_" + name + output_format
            
            # PILLOW library functions 
            im = Image.open(directory_path + "/" + filename)
            rgb_im = im.convert('RGB')
            rgb_im.thumbnail(size, Image.ANTIALIAS)
            
            output_path = upstream_folder + "preprocessed_" + dataset_name + "/" + name
            
            # Pillow Format Type (JPEG, PNG, TIFF)
            if output_format == '.jpg':
                pillow_format = 'JPEG'
            elif output_format == '.png':
                pillow_format = 'PNG'
            elif output_format == '.tif':
                pillow_format = 'TIFF'
            else:
                print("should make a throw statement, and some try catch")
            
            rgb_im.save(output_path, pillow_format)
            
            continue
        else:
            continue 

In [104]:
preprocess('sydney', SYDNEY_PATH)

304.tif
462.tif
476.tif
310.tif
338.tif
489.tif
106.tif
112.tif
13.tif
270.tif
516.tif
502.tif
264.tif
258.tif
259.tif
503.tif
265.tif
271.tif
517.tif
12.tif
113.tif
107.tif
488.tif
339.tif
477.tif
311.tif
305.tif
463.tif
313.tif
475.tif
461.tif
307.tif
449.tif
111.tif
105.tif
139.tif
38.tif
10.tif
267.tif
501.tif
515.tif
273.tif
529.tif
298.tif
299.tif
528.tif
514.tif
272.tif
266.tif
500.tif
11.tif
39.tif
138.tif
104.tif
110.tif
448.tif
460.tif
306.tif
312.tif
474.tif
458.tif
470.tif
316.tif
302.tif
464.tif
128.tif
114.tif
100.tif
15.tif
29.tif
538.tif
504.tif
262.tif
276.tif
510.tif
289.tif
288.tif
277.tif
511.tif
505.tif
263.tif
539.tif
28.tif
14.tif
101.tif
115.tif
129.tif
303.tif
465.tif
471.tif
317.tif
459.tif
329.tif
467.tif
301.tif
315.tif
473.tif
498.tif
103.tif
117.tif
16.tif
249.tif
513.tif
275.tif
261.tif
507.tif
260.tif
506.tif
512.tif
274.tif
248.tif
17.tif
116.tif
102.tif
499.tif
314.tif
472.tif
466.tif
300.tif
328.tif
401.tif
367.tif
373.tif
415.tif
429.tif
398.tif
165.

In [105]:
preprocess('ucm', UCM_PATH)

304.tif
1690.tif
1848.tif
462.tif
476.tif
1684.tif
310.tif
338.tif
1874.tif
1860.tif
1653.tif
1135.tif
1121.tif
1647.tif
1109.tif
489.tif
660.tif
1492.tif
106.tif
112.tif
1486.tif
674.tif
884.tif
648.tif
890.tif
1337.tif
1451.tif
1445.tif
1323.tif
847.tif
1479.tif
853.tif
13.tif
1280.tif
714.tif
700.tif
1294.tif
728.tif
1243.tif
1525.tif
1531.tif
2038.tif
1257.tif
933.tif
1519.tif
2010.tif
2004.tif
927.tif
270.tif
516.tif
1082.tif
1096.tif
502.tif
1928.tif
264.tif
1900.tif
1914.tif
258.tif
1727.tif
1041.tif
1055.tif
1733.tif
1069.tif
1068.tif
1054.tif
1732.tif
1726.tif
1040.tif
259.tif
1915.tif
1901.tif
503.tif
1097.tif
265.tif
1929.tif
271.tif
1083.tif
517.tif
2005.tif
926.tif
932.tif
2011.tif
1518.tif
2039.tif
1530.tif
1256.tif
1242.tif
1524.tif
729.tif
1295.tif
701.tif
715.tif
1281.tif
1478.tif
12.tif
852.tif
846.tif
1444.tif
1322.tif
1336.tif
1450.tif
891.tif
649.tif
885.tif
1487.tif
113.tif
675.tif
661.tif
107.tif
1493.tif
488.tif
1108.tif
1120.tif
1646.tif
1652.tif
1134.tif
1861.

1027.tif
1033.tif
1755.tif
1032.tif
1754.tif
1998.tif
1740.tif
1026.tif
1768.tif
565.tif
203.tif
1797.tif
1783.tif
217.tif
571.tif
559.tif
1973.tif
1967.tif
1556.tif
1230.tif
968.tif
1224.tif
1542.tif
2063.tif
940.tif
798.tif
954.tif
1218.tif
2077.tif
1595.tif
767.tif
773.tif
1581.tif
2088.tif
983.tif
997.tif
1422.tif
1344.tif
48.tif
808.tif
1350.tif
1436.tif
1378.tif
74.tif
834.tif
60.tif
820.tif
175.tif
1387.tif
613.tif
607.tif
1393.tif
161.tif
149.tif
1146.tif
1620.tif
1634.tif
1152.tif
388.tif
1608.tif
411.tif
1185.tif
377.tif
363.tif
1191.tif
405.tif
1807.tif
1813.tif
439.tif
420.tif
346.tif
352.tif
434.tif
1188.tif
1836.tif
1822.tif
408.tif
1177.tif
1611.tif
385.tif
391.tif
1605.tif
1163.tif
1639.tif
144.tif
622.tif
636.tif
150.tif
178.tif
86.tif
92.tif
187.tif
1413.tif
839.tif
1375.tif
79.tif
1361.tif
1407.tif
193.tif
805.tif
1349.tif
45.tif
811.tif
51.tif
3.tif
756.tif
742.tif
2091.tif
1598.tif
2085.tif
1567.tif
795.tif
1201.tif
1215.tif
781.tif
959.tif
1573.tif
2052.tif
971.ti

652.tif
1488.tif
108.tif
1675.tif
487.tif
1113.tif
1107.tif
493.tif
1661.tif
1649.tif
1891.tif
1885.tif
322.tif
444.tif
450.tif
336.tif
1852.tif
478.tif
1846.tif
1688.tif
1850.tif
308.tif
1844.tif
446.tif
320.tif
334.tif
1878.tif
452.tif
1893.tif
1887.tif
1139.tif
1111.tif
485.tif
1677.tif
1663.tif
491.tif
1105.tif
678.tif
122.tif
644.tif
650.tif
888.tif
136.tif
1449.tif
863.tif
23.tif
877.tif
37.tif
1475.tif
687.tif
1313.tif
1307.tif
693.tif
1461.tif
1298.tif
718.tif
730.tif
724.tif
2034.tif
917.tif
903.tif
1529.tif
2020.tif
1501.tif
2008.tif
1267.tif
1273.tif
1515.tif
1924.tif
268.tif
1930.tif
532.tif
1918.tif
254.tif
240.tif
526.tif
1059.tif
1065.tif
1703.tif
297.tif
283.tif
1717.tif
1071.tif
1716.tif
282.tif
1070.tif
1064.tif
296.tif
1702.tif
1058.tif
241.tif
527.tif
533.tif
255.tif
1919.tif
1931.tif
269.tif
1925.tif
1272.tif
1514.tif
2009.tif
1500.tif
1266.tif
902.tif
2021.tif
1528.tif
2035.tif
916.tif
725.tif
731.tif
719.tif
1299.tif
692.tif
1306.tif
1460.tif
1474.tif
1312.tif
68