In [1]:
import pandas as pd
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split
from imblearn.over_sampling import SMOTE
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.image import resize

2025-01-17 03:13:24.817099: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.


# 데이터 훑어보기

In [2]:
# CSV 파일 경로
fer2013_path = '/data/face1/fer/fer2013/fer2013.csv'

# CSV 파일 읽기
data = pd.read_csv(fer2013_path)

# 데이터 확인
print(data.head())  # 상위 5개 행 출력
print(data.info())  # 데이터 정보 출력


   emotion                                             pixels     Usage
0        0  70 80 82 72 58 58 60 63 54 58 60 48 89 115 121...  Training
1        0  151 150 147 155 148 133 111 140 170 174 182 15...  Training
2        2  231 212 156 164 174 138 161 173 182 200 106 38...  Training
3        4  24 32 36 30 32 23 19 20 30 41 21 22 32 34 21 1...  Training
4        6  4 0 0 0 0 0 0 0 0 0 0 0 3 15 23 28 48 50 58 84...  Training
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 35887 entries, 0 to 35886
Data columns (total 3 columns):
 #   Column   Non-Null Count  Dtype 
---  ------   --------------  ----- 
 0   emotion  35887 non-null  int64 
 1   pixels   35887 non-null  object
 2   Usage    35887 non-null  object
dtypes: int64(1), object(2)
memory usage: 841.2+ KB
None


In [3]:
# Usage 열의 값 종류 확인
usage_values = data['Usage'].unique()
print("Usage 열의 고유 값:", usage_values)

Usage 열의 고유 값: ['Training' 'PublicTest' 'PrivateTest']


In [4]:
# 감정 라벨 정의
emotion_labels = {
    0: 'Angry',
    1: 'Disgust',
    2: 'Fear',
    3: 'Happy',
    4: 'Sad',
    5: 'Surprise',
    6: 'Neutral'
}

# emotion 값별 데이터 개수 세기
emotion_counts = data['emotion'].value_counts().sort_index()  # 감정별 데이터 개수
emotion_counts.index = emotion_counts.index.map(emotion_labels)  # 숫자 라벨을 감정 이름으로 매핑

# 출력
print("감정별 데이터 개수")
print(emotion_counts)

감정별 데이터 개수
emotion
Angry       4953
Disgust      547
Fear        5121
Happy       8989
Sad         6077
Surprise    4002
Neutral     6198
Name: count, dtype: int64


# 데이터 전처리
1. SMOTE
2. 데이터 증강

In [None]:
# # 이미지 전처리 함수
# def preprocess_pixels(pixel_data):
#   images = []
#   for i in range(len(pixel_data)):
#     img = np.fromstring(pixel_data[i], dtype='int', sep=' ')
#     img = img.reshape(48,48,1)
#     images.append(img)

#   X = np.array(images)

#   return X

In [5]:
X_raw = data['pixels']  # 픽셀 데이터 (문자열 형태)
y = data['emotion']  # 감정 라벨

## SMOTE

In [6]:
# 이미지를 벡터 형태로 변환 (SMOTE를 위해)
X = []
for i in range(len(X_raw)):
    img = np.fromstring(X_raw[i], dtype='int', sep=' ')  # 문자열 -> 숫자 배열
    X.append(img)
X = np.array(X)  # (샘플 수, 2304) 형태
y = np.array(y)  # 라벨도 배열로 변환

In [7]:
# SMOTE 적용
smote = SMOTE(random_state=42)
X_smote, y_smote = smote.fit_resample(X, y)

In [8]:
# SMOTE 결과 확인
print("Before SMOTE:", np.bincount(y))
print("After SMOTE:", np.bincount(y_smote))

Before SMOTE: [4953  547 5121 8989 6077 4002 6198]
After SMOTE: [8989 8989 8989 8989 8989 8989 8989]


In [9]:
# SMOTE로 생성된 데이터를 다시 48x48 이미지 형태로 변환
X_smote_images = []
for i in range(len(X_smote)):
    img = X_smote[i].reshape(48, 48, 1)  # 48x48 크기로 재구성
    X_smote_images.append(img)
X_smote_images = np.array(X_smote_images)

In [14]:
from tensorflow.keras.utils import to_categorical
# 라벨을 One-hot Encoding
num_classes = len(np.unique(y_smote))  # 클래스 개수
y_smote_onehot = to_categorical(y_smote, num_classes=num_classes)

## Data Argumentation

In [15]:
# 데이터 증강 설정
datagen = ImageDataGenerator(
    rotation_range=10,         # 최대 10도 회전
    width_shift_range=0.1,     # 가로 이동 10%
    height_shift_range=0.1,    # 세로 이동 10%
    zoom_range=0.1,            # 확대/축소 10%
    horizontal_flip=True,      # 좌우 반전
    brightness_range=[0.8, 1.2], # 밝기 조정
    fill_mode='nearest'        # 빈 공간을 채우는 방식
)

In [11]:
# 증강된 데이터를 저장할 배열
X_augmented = []
y_augmented = []

In [None]:
for i in range(len(X_smote_images)):
    img = X_smote_images[i]  # 이미지 데이터
    label = y_smote[i]       # 라벨

    # 이미지를 증강하고 추가
    img = img.reshape((1, 48, 48, 1))  # (배치 크기, 48, 48, 1)로 변환
    for batch in datagen.flow(img, batch_size=1):
        X_augmented.append(batch[0])  # 증강된 이미지 추가
        y_augmented.append(label)     # 라벨 추가
        if len(X_augmented) >= len(X_smote_images):  # 원하는 증강 개수만큼 생성
            break

In [None]:
# 증강된 데이터를 배열로 변환
X_augmented = np.array(X_augmented)
y_augmented = np.array(y_augmented)

# Grayscale 데이터를 RGB로 변환 (채널 복제)
# X_augmented_rgb = np.repeat(X_augmented, 3, axis=-1)  # (48, 48, 1) -> (48, 48, 3)

# # 이미지를 (224, 224, 3)으로 리사이즈
# X_augmented_resized = np.array([resize(img, (224, 224)).numpy() for img in X_augmented_rgb])

# # 데이터 크기 확인
# print("증강된 데이터 크기 (RGB, Resized):", X_augmented_resized.shape)
# print("증강된 라벨 크기:", y_augmented.shape)

print("증강된 데이터 크기:", X_augmented.shape)
print("증강된 라벨 크기:", y_augmented.shape)

In [None]:
# # Numpy 배열로 저장
# np.save('X_augmented.npy', X_augmented)  # 증강된 데이터 저장
# np.save('y_augmented.npy', y_augmented)  # 라벨 저장

In [None]:
# angry_path = '/data/face1/train/angry/Training_99982465.jpg'
# disgust_path = '/data/face1/train/disgust/Training_11550217.jpg'
# fear_path = '/data/face1/train/fear/Training_10126156.jpg'
# happy_path = '/data/face1/train/happy/Training_10019449.jpg'
# sad_path = '/data/face1/train/sad/Training_10031481.jpg'
# surprise_path = '/data/face1/train/surprise/Training_1002457.jpg'
# neutral_path = '/data/face1/train/neutral/Training_10078021.jpg'

In [None]:
# import matplotlib.pyplot as plt
# import matplotlib.image as mpimg
# img = mpimg.imread(angry_path)

# # 그레이스케일 변환 (RGB 평균값 사용)
# if len(img.shape) == 3:  # RGB 이미지인지 확인
#     img_gray = np.mean(img, axis=2)  # RGB 채널 평균값으로 변환
# else:
#     img_gray = img  # 이미 그레이스케일인 경우 그대로 사용

# # 이미지 표시
# plt.imshow(img_gray, cmap='gray')  # cmap='gray'로 설정
# plt.axis('off')  # 축 숨기기
# plt.show()