#### 【 이미지 분류 모델을 위한 준비 】

- 데이터 준비 : 수집된 데이터 ==> 하나의 데이터로 저장
- scikit-learn
    * 피쳐 데이터 : 2D ==> 이미지 파일 1개 ==> 1개 행 데이터. 픽셀이 컬럼이 됨!
    * 타겟 데이터 : 1D ==> 이미지 파일명

- 데이터 즉, 피쳐와 타겟 => csv, json, xlsx, ... 저장

[1] 모듈 로딩 및 데이터 준비 <hr>

In [2]:
## 모듈 로딩
import cv2
import pandas as pd
import os

In [3]:
## 데이터 설정
DATA_DIR = '../PrData/White'

## 이미지 파일리스트
files = os.listdir(DATA_DIR)

In [4]:
## 체크
for idx, filename in enumerate(files):
    if idx<10:
        print(f'[{idx}] {filename}')
    else:
        break

[0] imgi_11_default.jpg
[1] imgi_12_default.jpg
[2] imgi_13_default.jpg
[3] imgi_146_face-young-caucasian-man-shirtless-looking-camera_251136-13233.jpg
[4] imgi_152_fair-haired-woman-looking-with-pleased-calm-expression_176420-15145.jpg
[5] imgi_156_36d75cc934009739f598d7a1ce7faf82.jpg
[6] imgi_157_a483e61b15fb2530b3a748bcca3ad6fb.jpg
[7] imgi_159_face-36yearold-caucasian-man_528985-2280.jpg
[8] imgi_15_default.jpg
[9] imgi_163_woman-with-blond-short-hair-tanned-smiling-cute-gazing-camera-with-friendly_176420-44610.jpg


[2] 기계학습을 위한 데이터셋 파일 생성<hr>
- csv 파일 저장 => [형식] 타겟,픽셀1,픽셀2,,,,,,,,,픽셀n
- 이미지 사이즈 일치
- 이미지 로우데이터 읽어오기
- 타겟 추출
- csv 파일에 쓰기

In [5]:
## ---------------------------------------------------
## [2-1] CSV 파일명
## ---------------------------------------------------
CSV_DIR  = '../PrData/csv'
CSV_FILE = '../PrData/csv/White.csv'

if not os.path.exists(CSV_DIR):
    os.mkdir(CSV_DIR)
else:
    print(f'{CSV_DIR} : 이미 존재합니다.')

../PrData/csv : 이미 존재합니다.


In [6]:
## ---------------------------------------------------
## [2-2] 이미지 처리
## ---------------------------------------------------

## 파일 1개 처리
for filename in files:
    img_path  = f'{DATA_DIR}/{filename}'
    save_path = f'{DATA_DIR}/re_{filename}'
    print(img_path)

    ##-> 사이즈 변환
    img=cv2.resize( cv2.imread(img_path, cv2.IMREAD_GRAYSCALE),
                    (0, 0),
                    fx=0.5, fy=0.5,
                    interpolation=cv2.INTER_AREA)
    print("1차", img.shape)

    img=cv2.resize( img,
                    (70, 70),
                    interpolation=cv2.INTER_AREA)
    print("2차", img.shape)

    cv2.imwrite(save_path, img)

    break

../PrData/White/imgi_11_default.jpg
1차 (138, 92)
2차 (70, 70)


In [7]:
## ---------------------------------------------------
## [2-2] 이미지 처리
## ---------------------------------------------------

## 파일 1개 처리
for filename in files:
    img_path  = f'{DATA_DIR}/{filename}'
    print(img_path)

    ##-> 사이즈 변환
    img=cv2.resize( cv2.imread(img_path, cv2.IMREAD_GRAYSCALE),
                    (0, 0),
                    fx=0.5, fy=0.5,
                    interpolation=cv2.INTER_AREA)
    print("1차", img.shape)

    img=cv2.resize( img,
                    (70, 70),
                    interpolation=cv2.INTER_AREA)
    print("2차", img.shape)

    img = img.reshape(-1)
    print("2D->1D", img.shape)

    raw = [str(i) for i in img.tolist()]
    raw = ','.join(raw)
    print(raw)

    break

../PrData/White/imgi_11_default.jpg
1차 (138, 92)
2차 (70, 70)
2D->1D (4900,)
248,248,248,248,248,248,242,215,156,122,114,133,142,124,105,94,89,90,70,82,108,135,160,173,180,180,177,179,183,186,189,194,198,199,201,203,206,209,211,212,213,214,216,219,221,222,221,220,219,221,222,223,224,225,227,228,230,230,232,234,236,237,238,239,240,238,237,233,230,227,248,248,248,248,248,248,242,184,123,104,129,135,117,105,103,84,87,62,69,111,139,162,176,178,182,184,187,187,188,191,194,198,202,204,205,208,211,212,214,215,215,217,219,222,224,225,224,223,222,223,223,224,224,225,227,228,230,230,232,234,236,236,237,237,235,234,232,229,226,223,248,248,248,249,248,247,215,137,108,112,121,114,93,102,97,82,61,65,101,146,163,176,184,185,191,179,165,159,157,165,176,183,194,205,209,211,213,214,215,216,217,219,222,225,226,226,225,225,225,224,224,224,224,225,226,228,230,232,233,234,236,237,236,235,233,231,230,226,222,218,248,248,248,249,248,238,170,110,102,125,125,110,105,87,69,62,64,98,149,175,180,188,186,187,168,143

In [8]:
with open(CSV_FILE, mode='a', encoding='utf-8') as F:
    for filename in files:
        img_path  = f'{DATA_DIR}/{filename}'

        img=cv2.resize( cv2.imread(img_path, cv2.IMREAD_GRAYSCALE),
                       (0, 0), fx=0.5, fy=0.5, interpolation=cv2.INTER_AREA)
        img=cv2.resize( img, (70, 70), interpolation=cv2.INTER_AREA)
        img = img.reshape(-1)

        raw = [str(i) for i in img.tolist()]
        raw = ','.join(raw)
        
        F.write('white,'+raw+'\n')