In [1]:
import os
from tqdm import tqdm
from shutil import copy
from collections import defaultdict

In [2]:
def train_test_split(txt_path, image_path, dst_path):
    labels_dict = defaultdict(list)
    if not os.path.exists(dst_path):
        os.mkdir(dst_path)
    with open(txt_path, 'r') as txt:
        paths = [path.strip() + '.jpg' for path in txt.readlines()]
        for path in tqdm(paths):
            label, img_name = path.split('/')
            labels_dict[label].append(img_name)
        for label in tqdm(labels_dict.keys()):
            label_path = os.path.join(dst_path, label)
            if not os.path.exists(label_path):
                os.mkdir(label_path)
            for img_name in tqdm(labels_dict[label]):
                copy(os.path.join(image_path, label, img_name), os.path.join(label_path, img_name))

In [3]:
txt_train = 'food-101/meta/train.txt'
images_path = 'food-101/images'
dest_path = 'train/'
train_test_split(txt_train, images_path, dest_path)

100%|███████████████████████████████████████████████████████████████████████| 75750/75750 [00:00<00:00, 1651232.13it/s]
  0%|                                                                                          | 0/101 [00:00<?, ?it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 20%|███████████████▎                                                              | 147/750 [00:00<00:00, 1458.90it/s]
 38%|█████████████████████████████▍                                                | 283/750 [00:00<00:00, 1424.62it/s]
 57%|████████████████████████████████████████████▊                                 | 431/750 [00:00<00:00, 1437.72it/s]
 77%|███████████████████████████████████████████████████████████▉                  | 576/750 [00:00<00:00, 1438.14it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1424.26it/s]
  1%|▊                                  

 55%|███████████████████████████████████████████▎                                  | 416/750 [00:00<00:00, 1379.32it/s]
 71%|███████████████████████████████████████████████████████▌                      | 534/750 [00:00<00:00, 1311.76it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1295.49it/s]
 10%|████████                                                                         | 10/101 [00:05<00:51,  1.75it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 18%|█████████████▊                                                                | 133/750 [00:00<00:00, 1320.36it/s]
 35%|███████████████████████████▎                                                  | 263/750 [00:00<00:00, 1307.34it/s]
 51%|███████████████████████████████████████▌                                      | 381/750 [00:00<00:00, 1263.37it/s]
 69%|███████████████████████████████████

 17%|█████████████▍                                                                | 129/750 [00:00<00:00, 1280.49it/s]
 33%|█████████████████████████▊                                                    | 248/750 [00:00<00:00, 1249.10it/s]
 51%|███████████████████████████████████████▌                                      | 381/750 [00:00<00:00, 1269.65it/s]
 69%|█████████████████████████████████████████████████████▊                        | 517/750 [00:00<00:00, 1292.77it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1294.33it/s]
 20%|████████████████                                                                 | 20/101 [00:11<00:46,  1.73it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 19%|██████████████▋                                                               | 141/750 [00:00<00:00, 1405.15it/s]
 38%|█████████████████████████████▋     

100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1380.43it/s]
 29%|███████████████████████▎                                                         | 29/101 [00:17<00:43,  1.65it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 17%|█████████████▎                                                                | 128/750 [00:00<00:00, 1270.62it/s]
 36%|███████████████████████████▉                                                  | 269/750 [00:00<00:00, 1306.82it/s]
 55%|███████████████████████████████████████████▎                                  | 416/750 [00:00<00:00, 1349.12it/s]
 75%|██████████████████████████████████████████████████████████▋                   | 564/750 [00:00<00:00, 1383.05it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1395.19it/s]
 30%|████████████████████████           

 57%|████████████████████████████████████████████▌                                 | 428/750 [00:00<00:00, 1424.56it/s]
 75%|██████████████████████████████████████████████████████████▏                   | 559/750 [00:00<00:00, 1387.09it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 831.79it/s]
 39%|███████████████████████████████▎                                                 | 39/101 [00:23<00:41,  1.50it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 18%|██████████████▎                                                               | 138/750 [00:00<00:00, 1369.99it/s]
 37%|█████████████████████████████                                                 | 280/750 [00:00<00:00, 1381.67it/s]
 57%|████████████████████████████████████████████                                  | 424/750 [00:00<00:00, 1395.69it/s]
 76%|███████████████████████████████████

 19%|██████████████▍                                                               | 139/750 [00:00<00:00, 1380.01it/s]
 37%|████████████████████████████▋                                                 | 276/750 [00:00<00:00, 1373.97it/s]
 55%|██████████████████████████████████████████▊                                   | 412/750 [00:00<00:00, 1366.73it/s]
 69%|█████████████████████████████████████████████████████▍                        | 514/750 [00:00<00:00, 1236.84it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1292.06it/s]
 49%|███████████████████████████████████████▎                                         | 49/101 [00:29<00:29,  1.76it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 19%|██████████████▋                                                               | 141/750 [00:00<00:00, 1399.77it/s]
 38%|█████████████████████████████▊     

 63%|████████████████████████████████████████████████▉                             | 470/750 [00:00<00:00, 1074.79it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1255.44it/s]
 57%|██████████████████████████████████████████████▌                                  | 58/101 [00:35<00:27,  1.58it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 20%|███████████████▎                                                              | 147/750 [00:00<00:00, 1459.64it/s]
 39%|██████████████████████████████▋                                               | 295/750 [00:00<00:00, 1464.65it/s]
 58%|█████████████████████████████████████████████▍                                | 437/750 [00:00<00:00, 1447.72it/s]
 77%|███████████████████████████████████████████████████████████▋                  | 574/750 [00:00<00:00, 1422.19it/s]
100%|███████████████████████████████████

 37%|████████████████████████████▋                                                 | 276/750 [00:00<00:00, 1383.03it/s]
 55%|███████████████████████████████████████████                                   | 414/750 [00:00<00:00, 1379.17it/s]
 74%|██████████████████████████████████████████████████████████                    | 558/750 [00:00<00:00, 1395.06it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1397.08it/s]
 67%|██████████████████████████████████████████████████████▌                          | 68/101 [00:40<00:18,  1.80it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 19%|██████████████▉                                                               | 144/750 [00:00<00:00, 1429.66it/s]
 38%|█████████████████████████████▊                                                | 287/750 [00:00<00:00, 1426.63it/s]
 56%|███████████████████████████████████

  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 19%|███████████████▏                                                              | 146/750 [00:00<00:00, 1448.98it/s]
 39%|██████████████████████████████▎                                               | 291/750 [00:00<00:00, 1446.15it/s]
 58%|█████████████████████████████████████████████▍                                | 437/750 [00:00<00:00, 1447.10it/s]
 73%|████████████████████████████████████████████████████████▋                     | 545/750 [00:00<00:00, 1307.45it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 1334.85it/s]
 77%|██████████████████████████████████████████████████████████████▌                  | 78/101 [00:47<00:13,  1.75it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
  0%|▎                                  

 65%|███████████████████████████████████████████████████                            | 485/750 [00:00<00:00, 762.13it/s]
 80%|███████████████████████████████████████████████████████████████▎               | 601/750 [00:00<00:00, 848.18it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 750/750 [00:00<00:00, 992.07it/s]
 86%|█████████████████████████████████████████████████████████████████████▊           | 87/101 [00:52<00:09,  1.55it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 20%|███████████████▉                                                              | 153/750 [00:00<00:00, 1519.06it/s]
 40%|██████████████████████████████▉                                               | 297/750 [00:00<00:00, 1491.06it/s]
 59%|█████████████████████████████████████████████▋                                | 439/750 [00:00<00:00, 1465.68it/s]
 78%|███████████████████████████████████

 17%|█████████████                                                                 | 126/750 [00:00<00:00, 1250.86it/s]
 34%|██████████████████████████▊                                                   | 258/750 [00:00<00:00, 1268.11it/s]
 52%|████████████████████████████████████████▏                                     | 387/750 [00:00<00:00, 1271.89it/s]
 70%|██████████████████████████████████████████████████████▍                       | 523/750 [00:00<00:00, 1294.40it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 750/750 [00:01<00:00, 700.79it/s]
 96%|█████████████████████████████████████████████████████████████████████████████▊   | 97/101 [00:58<00:02,  1.40it/s]
  0%|                                                                                          | 0/750 [00:00<?, ?it/s]
 19%|██████████████▊                                                               | 143/750 [00:00<00:00, 1419.28it/s]
 38%|█████████████████████████████▊     

In [4]:
txt = 'food-101/meta/test.txt'
images_path = 'food-101/images'
dest_path = 'test/'
train_test_split(txt, images_path, dest_path)

100%|███████████████████████████████████████████████████████████████████████| 25250/25250 [00:00<00:00, 1947484.89it/s]
  0%|                                                                                          | 0/101 [00:00<?, ?it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1333.35it/s]
  1%|▊                                                                                 | 1/101 [00:00<00:19,  5.22it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1305.57it/s]
  2%|█▌                                                                                | 2/101 [00:00<00:19,  5.19it/s]
  0%|                                   

100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1336.76it/s]
 22%|█████████████████▋                                                               | 22/101 [00:04<00:15,  5.24it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1362.34it/s]
 23%|██████████████████▍                                                              | 23/101 [00:04<00:14,  5.26it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1247.11it/s]
 24%|███████████████████▏                                                             | 24/101 [00:04<00:14,  5.15it/s]
  0%|                                   

 43%|██████████████████████████████████▍                                              | 43/101 [00:09<00:13,  4.29it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1351.28it/s]
 44%|███████████████████████████████████▎                                             | 44/101 [00:09<00:12,  4.54it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1384.91it/s]
 45%|████████████████████████████████████                                             | 45/101 [00:09<00:11,  4.78it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|███████████████████████████████████

100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1448.75it/s]
 64%|████████████████████████████████████████████████████▏                            | 65/101 [00:13<00:06,  5.29it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1385.48it/s]
 65%|████████████████████████████████████████████████████▉                            | 66/101 [00:13<00:06,  5.33it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
  0%|▎                                                                                 | 1/250 [00:00<00:25,  9.90it/s]
100%|███████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 841.79it/s]
 66%|███████████████████████████████████

100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1448.74it/s]
 86%|█████████████████████████████████████████████████████████████████████▊           | 87/101 [00:17<00:02,  5.43it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1457.17it/s]
 87%|██████████████████████████████████████████████████████████████████████▌          | 88/101 [00:18<00:02,  5.51it/s]
  0%|                                                                                          | 0/250 [00:00<?, ?it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 250/250 [00:00<00:00, 1377.11it/s]
 88%|███████████████████████████████████████████████████████████████████████▍         | 89/101 [00:18<00:02,  5.46it/s]
  0%|                                   