In [1]:
import os
import pathlib
import numpy as np
import matplotlib.pyplot as plt
import cv2
import sys
from xml.etree.ElementTree import parse
import zipfile


### crop 위치 찾는 함수

In [2]:
def find_crop_pos(file_name, folder_name, xml_path):
    file_name = file_name.split('.')[0]
    path = f'{xml_path}/{folder_name}'
    xmin, xmax, ymin, ymax = 0, 0, 0, 0
    

    tree = parse(f'{path}/{file_name}.xml')
    root = tree.getroot()

    for root_object in root.findall('object'):
        if 'dish' not in root_object.find('name').text or 'ref_' not in root_object.find('name').text:
            xmin = root_object.find('bndbox').find('xmin').text
            xmax = root_object.find('bndbox').find('xmax').text
            ymin = root_object.find('bndbox').find('ymin').text
            ymax = root_object.find('bndbox').find('ymax').text

    return int(xmin), int(xmax), int(ymin), int(ymax)

### crop, resize 후 저장하는 함수

In [3]:
def img_crop_resize(file_name, folder_name, origin_img_path, resize_img_path, xml_path, x_size, y_size):
    
    try:
        # imread로 영상을 불러온다.
        
        img = cv2.imread(f'{origin_img_path}/{folder_name}/{file_name}') 

        if img is None:
            print('Image lado failed!') # 이미지가 없으면 출력
            sys.exit()
        
        xmin, xmax, ymin, ymax = find_crop_pos(file_name, folder_name, xml_path)

        crop_img = img[ymin:ymax, xmin:xmax]
        resize_img = cv2.resize(crop_img, dsize=(x_size, y_size), interpolation=cv2.INTER_AREA)
        
        # 저장할 폴더가 있는지 확인하고 없으면 만들기
        if not os.path.exists(f'{resize_img_path}/{folder_name}'):
            os.makedirs(f'{resize_img_path}/{folder_name}')

        cv2.imwrite(f'{resize_img_path}/{folder_name}/{file_name}', resize_img)
    except Exception as e:
        print(str(e))

    

## resize 세팅 및 실행

In [15]:

# path 설정
origin_img_path = '/Users/hanbyul/Downloads/음식 데이터세트/음식 이미지 및 영양정보 텍스트/Training/train'
resize_img_path = './data/resize(299)'
xml_path = '/Users/hanbyul/Downloads/음식 데이터세트/음식 이미지 및 영양정보 텍스트/Training/[라벨]음식분류_TRAIN/xml'

# 원하는 resize 크기
x_size = 299
y_size = 299

folder_list = os.listdir(origin_img_path)
# .DS_Store 파일 리스트 삭제
if '.DS_Store' in folder_list:
    folder_list.remove('.DS_Store')

for f_idx, folder in enumerate(folder_list):
    file_list = os.listdir(f'{origin_img_path}/{folder}')
    for idx, file in enumerate(file_list):
        if '.DS_Store' in file:
            continue
        print(f'{f_idx+1}번째 폴더: {folder}[{idx}] - {file} 리사이즈 중...')
        img_crop_resize(file, folder, origin_img_path, resize_img_path, xml_path, x_size, y_size)

print('리사이즈 완료!')


1번째 폴더: 07013012[0] - 07_073_07013012_160839051350422_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1] - 07_073_07013012_160647055485072_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[2] - 07_073_07013012_160855883352713_0.jpg 리사이즈 중...
1번째 폴더: 07013012[3] - 07_073_07013012_160851904249475_0.jpg 리사이즈 중...
1번째 폴더: 07013012[4] - 07_073_07013012_160843175154722_0.jpg 리사이즈 중...
1번째 폴더: 07013012[5] - 07_073_07013012_160855591655895_1.jpg 리사이즈 중...
1번째 폴더: 07013012[6] - 07_073_07013012_160855088356390_0.jpeg 리사이즈 중...
1번째 폴더: 07013012[7] - 07_073_07013012_160842982380833_1.jpg 리사이즈 중...
1번째 폴더: 07013012[8] - 07_073_07013012_160843065062905_0.jpg 리사이즈 중...
1번째 폴더: 07013012[9] - 07_073_07013012_160846355191534_0.jpg 리사이즈 중...
1번째 폴더: 07013012[10] - 07_073_07013012_160837110055494_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[11] - 07_073_07013012_160844368669384_1.jpg 리사이즈 중...
1번째 폴더: 07013012[12] - 07_073_07013012_160855562846468_1.jpg 리사이즈 중...
1번째 폴더: 07013012[13] - 07_073_07013012_160847304682252_1.JPG 리사이즈 중...
1번째 폴더: 07013

Invalid SOS parameters for sequential JPEG


1번째 폴더: 07013012[1227] - 07_073_07013012_160844352563289_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1228] - 07_073_07013012_160843111085923_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1229] - 07_073_07013012_160836500190604_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1230] - 07_073_07013012_160853330993403_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[1231] - 07_073_07013012_160842563039522_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1232] - 07_073_07013012_160844576142802_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1233] - 07_073_07013012_160851907772847_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1234] - 07_073_07013012_160846300222881_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1235] - 07_073_07013012_160837473486920_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1236] - 07_073_07013012_160843150425404_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1237] - 07_073_07013012_160835940660047_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[1238] - 07_073_07013012_160846313318474_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1239] - 07_073_07013012_160838329592503_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1240] - 07_073_07013012_16083834

Invalid SOS parameters for sequential JPEG


1번째 폴더: 07013012[1319] - 07_073_07013012_160855678913021_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1320] - 07_073_07013012_160855744892729_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1321] - 07_073_07013012_160855892250961_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1322] - 07_073_07013012_160861092119141_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[1323] - 07_073_07013012_160639124354043_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[1324] - 07_073_07013012_160853344148225_0.jpeg 리사이즈 중...
1번째 폴더: 07013012[1325] - 07_073_07013012_160854952626974_0.JPEG 리사이즈 중...
1번째 폴더: 07013012[1326] - 07_073_07013012_160835920767423_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[1327] - 07_073_07013012_160844763184567_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1328] - 07_073_07013012_160843128852780_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1329] - 07_073_07013012_160819635847002_1.jpeg 리사이즈 중...
1번째 폴더: 07013012[1330] - 07_073_07013012_160837858440719_0.jpg 리사이즈 중...
1번째 폴더: 07013012[1331] - 07_073_07013012_160854347685741_1.jpg 리사이즈 중...
1번째 폴더: 07013012[1332] - 07_073_07013012_1608

Invalid SOS parameters for sequential JPEG


2번째 폴더: 07014002[214] - 07_074_07014002_160560336927084_1.jpeg 리사이즈 중...
2번째 폴더: 07014002[215] - 07_074_07014002_160947575087280_0.jpg 리사이즈 중...
2번째 폴더: 07014002[216] - 07_074_07014002_160602465070499_1.jpeg 리사이즈 중...
2번째 폴더: 07014002[217] - 07_074_07014002_160982112926439_0.jpg 리사이즈 중...
2번째 폴더: 07014002[218] - 07_074_07014002_160950332352437_1.jpeg 리사이즈 중...
2번째 폴더: 07014002[219] - 07_074_07014002_160515469861651_0.jpg 리사이즈 중...
2번째 폴더: 07014002[220] - 07_074_07014002_160947589177814_1.jpg 리사이즈 중...
2번째 폴더: 07014002[221] - 07_074_07014002_160922365117935_1.jpg 리사이즈 중...
2번째 폴더: 07014002[222] - 07_074_07014002_160484225933453_1.jpeg 리사이즈 중...
2번째 폴더: 07014002[223] - 07_074_07014002_160981911961195_1.jpg 리사이즈 중...
2번째 폴더: 07014002[224] - 07_074_07014002_160308772990842_0.jpg 리사이즈 중...
2번째 폴더: 07014002[225] - 07_074_07014002_160950363016050_0.jpeg 리사이즈 중...
2번째 폴더: 07014002[226] - 07_074_07014002_160802573343055_1.jpg 리사이즈 중...
2번째 폴더: 07014002[227] - 07_074_07014002_160715759364672_0.j

Invalid SOS parameters for sequential JPEG


3번째 폴더: 08011001[1567] - 08_081_08011001_160782840190345_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1568] - 08_081_08011001_160924456340608_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1569] - 08_081_08011001_160975309941046_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1570] - 08_081_08011001_160282494958900.jpg 리사이즈 중...
3번째 폴더: 08011001[1571] - 08_081_08011001_160942610359350_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1572] - 08_081_08011001_160785986112445_1.jpeg 리사이즈 중...
3번째 폴더: 08011001[1573] - 08_081_08011001_160984320450339_0.jpeg 리사이즈 중...
3번째 폴더: 08011001[1574] - 08_081_08011001_160864378450417_0.jpeg 리사이즈 중...
3번째 폴더: 08011001[1575] - 08_081_08011001_160864373212303_1.jpeg 리사이즈 중...
3번째 폴더: 08011001[1576] - 08_081_08011001_160782840190345_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1577] - 08_081_08011001_160975309941046_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1578] - 08_081_08011001_160924456340608_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1579] - 08_081_08011001_160821330248626_1.jpeg 리사이즈 중...
3번째 폴더: 08011001[1580] - 08_081_08011001_1605587

Invalid SOS parameters for sequential JPEG


3번째 폴더: 08011001[1581] - 08_081_08011001_160984337883803_0.jpeg 리사이즈 중...
3번째 폴더: 08011001[1582] - 08_081_08011001_160929379597452_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1583] - 08_081_08011001_160897885489812_0.jpeg 리사이즈 중...
3번째 폴더: 08011001[1584] - 08_081_08011001_160864273650890_1.jpeg 리사이즈 중...
3번째 폴더: 08011001[1585] - 08_081_08011001_160913847510232_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1586] - 08_081_08011001_160945873158192_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1587] - 08_081_08011001_160959564017948_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1588] - 08_081_08011001_160448078210250_1.jpg 리사이즈 중...
3번째 폴더: 08011001[1589] - 08_081_08011001_160925676257017_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1590] - 08_081_08011001_160602879464077_0.jpeg 리사이즈 중...
3번째 폴더: 08011001[1591] - 08_081_08011001_160957614580055_1.jpeg 리사이즈 중...
3번째 폴더: 08011001[1592] - 08_081_08011001_160821699691341_0.jpeg 리사이즈 중...
3번째 폴더: 08011001[1593] - 08_081_08011001_160567201076230_0.jpg 리사이즈 중...
3번째 폴더: 08011001[1594] - 08_081_08011001_1608

Invalid SOS parameters for sequential JPEG


6번째 폴더: 07014001[801] - 07_074_07014001_160670293556285_0.jpg 리사이즈 중...
6번째 폴더: 07014001[802] - 07_074_07014001_160457458187660_0.jpg 리사이즈 중...
6번째 폴더: 07014001[803] - 07_074_07014001_160414309857133_1.jpg 리사이즈 중...
6번째 폴더: 07014001[804] - 07_074_07014001_160462048682503_0.jpg 리사이즈 중...
6번째 폴더: 07014001[805] - 07_074_07014001_160638570375422_1.jpg 리사이즈 중...
6번째 폴더: 07014001[806] - 07_074_07014001_160682227987792_0.jpg 리사이즈 중...
6번째 폴더: 07014001[807] - 07_074_07014001_160497929022983_0.jpeg 리사이즈 중...
6번째 폴더: 07014001[808] - 07_074_07014001_160543724743260_0.jpeg 리사이즈 중...
6번째 폴더: 07014001[809] - 07_074_07014001_160648648246768_1.jpeg 리사이즈 중...
6번째 폴더: 07014001[810] - 07_074_07014001_160273825379310.jpg 리사이즈 중...
6번째 폴더: 07014001[811] - 07_074_07014001_160550887980750_1.jpg 리사이즈 중...
6번째 폴더: 07014001[812] - 07_074_07014001_160671357554815_1.jpg 리사이즈 중...
6번째 폴더: 07014001[813] - 07_074_07014001_160562045982847_0.jpg 리사이즈 중...
6번째 폴더: 07014001[814] - 07_074_07014001_160618894525101_0.jpg 리

Invalid SOS parameters for sequential JPEG


7번째 폴더: 08011003[267] - 08_081_08011003_160406298173190_0.jpg 리사이즈 중...
7번째 폴더: 08011003[268] - 08_081_08011003_160541670557850_0.jpg 리사이즈 중...
7번째 폴더: 08011003[269] - 08_081_08011003_160480558434105_1.jpg 리사이즈 중...
7번째 폴더: 08011003[270] - 08_081_08011003_160410492264721_0.jpg 리사이즈 중...
7번째 폴더: 08011003[271] - 08_081_08011003_160342717091795_1.jpg 리사이즈 중...
7번째 폴더: 08011003[272] - 08_081_08011003_160298888475221_0.jpg 리사이즈 중...
7번째 폴더: 08011003[273] - 08_081_08011003_160451162951242_0.jpeg 리사이즈 중...
7번째 폴더: 08011003[274] - 08_081_08011003_160508377225371_0.jpg 리사이즈 중...
7번째 폴더: 08011003[275] - 08_081_08011003_160284852993808.jpeg 리사이즈 중...
7번째 폴더: 08011003[276] - 08_081_08011003_160362428123737_1.jpg 리사이즈 중...
7번째 폴더: 08011003[277] - 08_081_08011003_160568435377650_0.jpg 리사이즈 중...
7번째 폴더: 08011003[278] - 08_081_08011003_160371389977406_1.jpeg 리사이즈 중...
7번째 폴더: 08011003[279] - 08_081_08011003_160281851886809.jpg 리사이즈 중...
7번째 폴더: 08011003[280] - 08_081_08011003_160517613068209_0.jpeg 리사

Invalid SOS parameters for sequential JPEG


7번째 폴더: 08011003[327] - 08_081_08011003_160474326873239_0.jpg 리사이즈 중...
7번째 폴더: 08011003[328] - 08_081_08011003_160367981036511_1.jpg 리사이즈 중...
7번째 폴더: 08011003[329] - 08_081_08011003_160424228226049_0.jpg 리사이즈 중...
7번째 폴더: 08011003[330] - 08_081_08011003_160284704320070.jpg 리사이즈 중...
7번째 폴더: 08011003[331] - 08_081_08011003_160448471072171_1.jpg 리사이즈 중...
7번째 폴더: 08011003[332] - 08_081_08011003_160559857159747_0.jpg 리사이즈 중...
7번째 폴더: 08011003[333] - 08_081_08011003_160450110439681_0.jpg 리사이즈 중...
7번째 폴더: 08011003[334] - 08_081_08011003_160369554194634_0.jpeg 리사이즈 중...
7번째 폴더: 08011003[335] - 08_081_08011003_160506680724204_1.jpg 리사이즈 중...
7번째 폴더: 08011003[336] - 08_081_08011003_160463893680614_0.jpg 리사이즈 중...
7번째 폴더: 08011003[337] - 08_081_08011003_160566235858777_1.jpg 리사이즈 중...
7번째 폴더: 08011003[338] - 08_081_08011003_160439817479937_1.jpeg 리사이즈 중...
7번째 폴더: 08011003[339] - 08_081_08011003_160519352941844_0.jpg 리사이즈 중...
7번째 폴더: 08011003[340] - 08_081_08011003_160448407659499_1.jpg 리사

Invalid SOS parameters for sequential JPEG


7번째 폴더: 08011003[1559] - 08_081_08011003_160462145021201_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1560] - 08_081_08011003_160526058822335_0.jpeg 리사이즈 중...
7번째 폴더: 08011003[1561] - 08_081_08011003_160378968833699_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1562] - 08_081_08011003_160490617144736_1.jpg 리사이즈 중...
7번째 폴더: 08011003[1563] - 08_081_08011003_160344980693932_1.jpg 리사이즈 중...
7번째 폴더: 08011003[1564] - 08_081_08011003_160518884065353_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1565] - 08_081_08011003_160457431877863_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1566] - 08_081_08011003_160518884065353_1.jpg 리사이즈 중...
7번째 폴더: 08011003[1567] - 08_081_08011003_160276214418015.jpg 리사이즈 중...
7번째 폴더: 08011003[1568] - 08_081_08011003_160344980693932_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1569] - 08_081_08011003_160334266829893_1.jpeg 리사이즈 중...
7번째 폴더: 08011003[1570] - 08_081_08011003_160276254616980.jpg 리사이즈 중...
7번째 폴더: 08011003[1571] - 08_081_08011003_160490617144736_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1572] - 08_081_08011003_160428708982

Invalid SOS parameters for sequential JPEG


7번째 폴더: 08011003[1578] - 08_081_08011003_160462410248520_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1579] - 08_081_08011003_160379194995434_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1580] - 08_081_08011003_160549121340599_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1581] - 08_081_08011003_160438292831005_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1582] - 08_081_08011003_160289824651057_0.jpeg 리사이즈 중...
7번째 폴더: 08011003[1583] - 08_081_08011003_160414898118027_1.jpg 리사이즈 중...
7번째 폴더: 08011003[1584] - 08_081_08011003_160523989227100_1.jpeg 리사이즈 중...
7번째 폴더: 08011003[1585] - 08_081_08011003_160352702980080_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1586] - 08_081_08011003_160318076956492_1.jpeg 리사이즈 중...
7번째 폴더: 08011003[1587] - 08_081_08011003_160422260877332_1.jpg 리사이즈 중...
7번째 폴더: 08011003[1588] - 08_081_08011003_160523779962959_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1589] - 08_081_08011003_160421146770553_0.jpeg 리사이즈 중...
7번째 폴더: 08011003[1590] - 08_081_08011003_160367272713053_0.jpg 리사이즈 중...
7번째 폴더: 08011003[1591] - 08_081_08011003_160534

In [11]:
29

10