### 표정 분류

https://drive.google.com/file/d/1lpwQNwijBfaSr8knSNHKWu5KUmzYWU9d/view?usp=drive_link

#### train

In [1]:
from glob import glob
import os

# 이미지가 저장되어 있는 경로 지정
root = './datasets/face/original/'

# 해당 경로를 통해 이미지 폴더를 찾아옴
directories = glob(os.path.join(root, '*'))

In [2]:
directories

['./datasets/face/original\\angry',
 './datasets/face/original\\disgust',
 './datasets/face/original\\fear',
 './datasets/face/original\\happy',
 './datasets/face/original\\neutral',
 './datasets/face/original\\sad',
 './datasets/face/original\\surprise']

In [3]:
# 폴더 이름 저장할 초기 list 생성
directory_names = []

for directory in directories:
    # 디렉토리의 이름을 찾아와서 list에 저장
    directory_names.append(directory[directory.rindex('\\') + 1:])

print(directory_names)

['angry', 'disgust', 'fear', 'happy', 'neutral', 'sad', 'surprise']


In [4]:
# 이미지 별 폴더 안 이미지들의 파일명 변경
for name in directory_names:
    for i, file_name in enumerate(os.listdir(os.path.join(root, name))):
        # 이전 파일의 전체 경로
        old_file = os.path.join(root + name + '/', file_name)
        # 신규 파일 전체 경로 작성
        new_file = os.path.join(root + name + '/', name + str(i + 1) + '.png')

        # 이전 파일의 이름을 신규 파일로 변경
        os.rename(old_file, new_file)

In [5]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 이미지의 픽셀 값을 0에서 255 사이에서 0에서 1 사이의 값으로 조정
image_data_generator = ImageDataGenerator(rescale=1./255)

# 디렉토리에서 이미지를 가져와 배치로 변환
generator = image_data_generator.flow_from_directory(root, target_size=(150, 150), batch_size=32, class_mode='categorical')

print(generator.class_indices)

Found 28709 images belonging to 7 classes.
{'angry': 0, 'disgust': 1, 'fear': 2, 'happy': 3, 'neutral': 4, 'sad': 5, 'surprise': 6}


In [6]:
generator.filepaths

['./datasets/face/original/angry\\angry1.png',
 './datasets/face/original/angry\\angry10.png',
 './datasets/face/original/angry\\angry100.png',
 './datasets/face/original/angry\\angry1000.png',
 './datasets/face/original/angry\\angry1001.png',
 './datasets/face/original/angry\\angry1002.png',
 './datasets/face/original/angry\\angry1003.png',
 './datasets/face/original/angry\\angry1004.png',
 './datasets/face/original/angry\\angry1005.png',
 './datasets/face/original/angry\\angry1006.png',
 './datasets/face/original/angry\\angry1007.png',
 './datasets/face/original/angry\\angry1008.png',
 './datasets/face/original/angry\\angry1009.png',
 './datasets/face/original/angry\\angry101.png',
 './datasets/face/original/angry\\angry1010.png',
 './datasets/face/original/angry\\angry1011.png',
 './datasets/face/original/angry\\angry1012.png',
 './datasets/face/original/angry\\angry1013.png',
 './datasets/face/original/angry\\angry1014.png',
 './datasets/face/original/angry\\angry1015.png',
 './dat

In [7]:
import pandas as pd

# 파일 경로와 타겟값을 가지고 새로운 데이터 프레임 생성
train_df = pd.DataFrame({'file_paths': generator.filepaths, 'targets': generator.classes})
train_df

Unnamed: 0,file_paths,targets
0,./datasets/face/original/angry\angry1.png,0
1,./datasets/face/original/angry\angry10.png,0
2,./datasets/face/original/angry\angry100.png,0
3,./datasets/face/original/angry\angry1000.png,0
4,./datasets/face/original/angry\angry1001.png,0
...,...,...
28704,./datasets/face/original/surprise\surprise995.png,6
28705,./datasets/face/original/surprise\surprise996.png,6
28706,./datasets/face/original/surprise\surprise997.png,6
28707,./datasets/face/original/surprise\surprise998.png,6


In [8]:
# 경로 중 \\(역슬래시)로 되어 있는 부분을 /(슬래시)로 변경
train_df.loc[:, 'file_paths'] = train_df.file_paths.apply(lambda x: x.replace('\\', '/'))
train_df

Unnamed: 0,file_paths,targets
0,./datasets/face/original/angry/angry1.png,0
1,./datasets/face/original/angry/angry10.png,0
2,./datasets/face/original/angry/angry100.png,0
3,./datasets/face/original/angry/angry1000.png,0
4,./datasets/face/original/angry/angry1001.png,0
...,...,...
28704,./datasets/face/original/surprise/surprise995.png,6
28705,./datasets/face/original/surprise/surprise996.png,6
28706,./datasets/face/original/surprise/surprise997.png,6
28707,./datasets/face/original/surprise/surprise998.png,6


#### test

In [9]:
from glob import glob
import os

# 이미지가 저장되어 있는 경로 지정
root = './datasets/face/test/'

# 해당 경로를 통해 이미지 폴더를 찾아옴
directories = glob(os.path.join(root, '*'))

In [10]:
# 폴더 이름 저장할 초기 list 생성
directory_names = []

for directory in directories:
    # 디렉토리의 이름을 찾아와서 list에 저장
    directory_names.append(directory[directory.rindex('\\') + 1:])

print(directory_names)

['angry', 'disgust', 'fear', 'happy', 'neutral', 'sad', 'surprise']


In [11]:
# 이미지 별 폴더 안 이미지들의 파일명 변경
for name in directory_names:
    for i, file_name in enumerate(os.listdir(os.path.join(root, name))):
        # 이전 파일의 전체 경로
        old_file = os.path.join(root + name + '/', file_name)
        # 신규 파일 전체 경로 작성
        new_file = os.path.join(root + name + '/', name + str(i + 1) + '.png')

        os.rename(old_file, new_file)

In [12]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 이미지의 픽셀 값을 0에서 255 사이에서 0에서 1 사이의 값으로 조정
image_data_generator = ImageDataGenerator(rescale=1./255)

# 디렉토리에서 이미지를 가져와 배치로 변환
generator = image_data_generator.flow_from_directory(root, target_size=(150, 150), batch_size=32, class_mode='categorical')

print(generator.class_indices)

Found 7178 images belonging to 7 classes.
{'angry': 0, 'disgust': 1, 'fear': 2, 'happy': 3, 'neutral': 4, 'sad': 5, 'surprise': 6}


In [13]:
import pandas as pd

# 파일 경로와 타겟값을 가지고 새로운 데이터 프레임 생성
test_df = pd.DataFrame({'file_paths': generator.filepaths, 'targets': generator.classes})
test_df

Unnamed: 0,file_paths,targets
0,./datasets/face/test/angry\angry1.png,0
1,./datasets/face/test/angry\angry10.png,0
2,./datasets/face/test/angry\angry100.png,0
3,./datasets/face/test/angry\angry101.png,0
4,./datasets/face/test/angry\angry102.png,0
...,...,...
7173,./datasets/face/test/surprise\surprise95.png,6
7174,./datasets/face/test/surprise\surprise96.png,6
7175,./datasets/face/test/surprise\surprise97.png,6
7176,./datasets/face/test/surprise\surprise98.png,6


In [14]:
# 경로 중 \\(역슬래시)로 되어 있는 부분을 /(슬래시)로 변경
test_df.loc[:, 'file_paths'] = test_df.file_paths.apply(lambda x: x.replace('\\', '/'))
test_df

Unnamed: 0,file_paths,targets
0,./datasets/face/test/angry/angry1.png,0
1,./datasets/face/test/angry/angry10.png,0
2,./datasets/face/test/angry/angry100.png,0
3,./datasets/face/test/angry/angry101.png,0
4,./datasets/face/test/angry/angry102.png,0
...,...,...
7173,./datasets/face/test/surprise/surprise95.png,6
7174,./datasets/face/test/surprise/surprise96.png,6
7175,./datasets/face/test/surprise/surprise97.png,6
7176,./datasets/face/test/surprise/surprise98.png,6


#### 데이터 세트 분리

In [15]:
from sklearn.model_selection import train_test_split

# 학습 및 검증용 데이터 세트 분리
X_train, X_val, y_train, y_val = \
train_test_split(train_df.file_paths, train_df.targets, stratify=train_df.targets, test_size=0.2, random_state=124)

print(y_train.value_counts())
print(y_val.value_counts())

targets
3    5772
4    3972
5    3864
2    3277
0    3196
6    2537
1     349
Name: count, dtype: int64
targets
3    1443
4     993
5     966
2     820
0     799
6     634
1      87
Name: count, dtype: int64


In [16]:
# 테스트 데이터 세트 분리
X_test = test_df.file_paths
y_test = test_df.targets

print(y_test.value_counts())

targets
3    1774
5    1247
4    1233
2    1024
0     958
6     831
1     111
Name: count, dtype: int64


In [17]:
import shutil

# 경로 지정
root = './datasets/face/'

for file_path in X_train:
    # 이미지 파일의 원본 디렉터리 경로 저장
    face_dir = file_path[len(root + 'original/'): file_path.rindex('/')]
    # 이미지 파일을 복사할 훈련용 디렉터리의 경로 저장
    destination = os.path.join(root, 'train/' + face_dir)

    # 훈련용 디렉터리가 없는 경우 해당 디렉터리를 생성
    if not os.path.exists(destination):
        os.makedirs(destination)

    # 이미지 파일을 훈련용 디렉터리로 복사
    shutil.copy2(file_path, destination)

In [18]:
import shutil

# 경로 지정
root = './datasets/face/'

for file_path in X_val:
    # 이미지 파일의 원본 디렉터리 경로 저장
    face_dir = file_path[len(root + 'original/'): file_path.rindex('/')]
    # 이미지 파일을 복사할 훈련용 디렉터리의 경로 저장
    destination = os.path.join(root, 'validation/' + face_dir)

    # 훈련용 디렉터리가 없는 경우 해당 디렉터리를 생성
    if not os.path.exists(destination):
        os.makedirs(destination)

    # 이미지 파일을 훈련용 디렉터리로 복사
    shutil.copy2(file_path, destination)