In [1]:
import os
import pandas as pd
import numpy as np

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader,random_split
from torchvision.models import googlenet, resnet18, resnet50
import torchvision.transforms as transforms
import torch.nn.functional as F
from torchvision.transforms import functional as TF
import sklearn
import librosa
import numpy as np
import pandas as pd
from tqdm import tqdm
from PIL import Image

In [3]:
import random
import numpy as np
import torch

seed = 20236
deterministic = True

random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed_all(seed)
if deterministic:
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

In [4]:
RAVDESS = "test/ravdess-emotional-speech-audio/audio_speech_actors_01-24/"
CREMA = "test/cremad/AudioWAV/"
TESS = "test/toronto-emotional-speech-set-tess/tess toronto emotional speech set data/TESS Toronto emotional speech set data/"
SAVEE = "test/surrey-audiovisual-expressed-emotion-savee/ALL/"

In [5]:
ravdess_dir_lis = os.listdir(RAVDESS)
path_list = []
gender_list = []
emotion_list = []

emotion_dic = {
    '03' : 'happy',
    '01' : 'neutral',
    '04' : 'sad',
    '05' : 'angry',
    '06' : 'fear',
    '07' : 'disgust',
}

for directory in ravdess_dir_lis:
    actor_files = os.listdir(os.path.join(RAVDESS, directory))
    for audio_file in actor_files: 
        part = audio_file.split('.')[0]
        key = part.split('-')[2]
        if key in emotion_dic:
            gender_code = int(part.split('-')[6])
            path_list.append(f"{RAVDESS}{directory}/{audio_file}")
            gender_list.append('female' if gender_code & 1 == 0 else 'male')
            emotion_list.append(emotion_dic[key])
            
ravdess_df = pd.concat([
    pd.DataFrame(path_list, columns=['path']),
    pd.DataFrame(gender_list, columns=['sex']),
    pd.DataFrame(emotion_list, columns=['emotion'])
], axis=1)

ravdess_df.head()

Unnamed: 0,path,sex,emotion
0,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
1,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
2,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
3,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
4,test/ravdess-emotional-speech-audio/audio_spee...,male,happy


In [6]:
crema_dir_list = os.listdir(CREMA)
path_list = []
gender_list = []
emotion_list = []

emotion_dic = {
    'HAP' : 'happy',
    'NEU' : 'neutral',
    'SAD' : 'sad',
    'ANG' : 'angry',
    'FEA' : 'fear',
    'DIS' : 'disgust',
}

female_id_list = [
    '1002', '1003', '1004', '1006', '1007', '1008', '1009', '1010', '1012', '1013', '1018', 
    '1020', '1021', '1024', '1025', '1028', '1029', '1030', '1037', '1043', '1046', '1047', 
    '1049', '1052', '1053', '1054', '1055', '1056', '1058', '1060', '1061', '1063', '1072', 
    '1073', '1074', '1075', '1076', '1078', '1079', '1082', '1084', '1089', '1091',
]

for audio_file in crema_dir_list:
    part = audio_file.split('_')
    key = part[2]
    if key in emotion_dic and part[3] == 'HI.wav':
        path_list.append(f"{CREMA}{audio_file}")
        gender_list.append('female' if part[0] in female_id_list else 'male')
        emotion_list.append(emotion_dic[key])

crema_df = pd.concat([
    pd.DataFrame(path_list, columns=['path']),
    pd.DataFrame(gender_list, columns=['sex']),
    pd.DataFrame(emotion_list, columns=['emotion'])
], axis=1)

crema_df.head()

Unnamed: 0,path,sex,emotion
0,test/cremad/AudioWAV/1001_IEO_ANG_HI.wav,male,angry
1,test/cremad/AudioWAV/1001_IEO_DIS_HI.wav,male,disgust
2,test/cremad/AudioWAV/1001_IEO_FEA_HI.wav,male,fear
3,test/cremad/AudioWAV/1001_IEO_HAP_HI.wav,male,happy
4,test/cremad/AudioWAV/1001_IEO_SAD_HI.wav,male,sad


In [7]:
tess_dir_list = os.listdir(TESS)
path_list = []
gender_list = []
emotion_list = [] 

emotion_dic = {
    'happy'   : 'happy',
    'neutral' : 'neutral',
    'sad'     : 'sad',
    'Sad'     : 'sad',
    'angry'   : 'angry',
    'fear'    : 'fear',
    'disgust'  : 'disgust',
}

for directory in tess_dir_list:
    audio_files = os.listdir(os.path.join(TESS, directory))
    for audio_file in audio_files:
        part = audio_file.split('.')[0]
        key = part.split('_')[2]
        if key in emotion_dic:
            path_list.append(f"{TESS}{directory}/{audio_file}") 
            gender_list.append('female') # female only dataset
            emotion_list.append(emotion_dic[key])
            
tess_df = pd.concat([
    pd.DataFrame(path_list, columns=['path']),
    pd.DataFrame(gender_list, columns=['sex']),
    pd.DataFrame(emotion_list, columns=['emotion'])
], axis=1)

tess_df.head()

Unnamed: 0,path,sex,emotion
0,test/toronto-emotional-speech-set-tess/tess to...,female,angry
1,test/toronto-emotional-speech-set-tess/tess to...,female,angry
2,test/toronto-emotional-speech-set-tess/tess to...,female,angry
3,test/toronto-emotional-speech-set-tess/tess to...,female,angry
4,test/toronto-emotional-speech-set-tess/tess to...,female,angry


In [8]:
savee_dir_list = os.listdir(SAVEE)
path_list = []
gender_list = []
emotion_list = []

emotion_dic = {
    'h'  : 'happy',
    'n'  : 'neutral',
    'sa' : 'sad',
    'a'  : 'angry',
    'f'  : 'fear',
    'd'  : 'disgust'
}

for audio_file in savee_dir_list:
    part = audio_file.split('_')[1]
    key = part[:-6]
    if key in emotion_dic:
        path_list.append(f"{SAVEE}{audio_file}")
        gender_list.append('male') # male only dataset
        emotion_list.append(emotion_dic[key])
        
savee_df = pd.concat([
    pd.DataFrame(path_list, columns=['path']),
    pd.DataFrame(gender_list, columns=['sex']),
    pd.DataFrame(emotion_list, columns=['emotion'])
], axis=1)

savee_df.head()

Unnamed: 0,path,sex,emotion
0,test/surrey-audiovisual-expressed-emotion-save...,male,angry
1,test/surrey-audiovisual-expressed-emotion-save...,male,angry
2,test/surrey-audiovisual-expressed-emotion-save...,male,angry
3,test/surrey-audiovisual-expressed-emotion-save...,male,angry
4,test/surrey-audiovisual-expressed-emotion-save...,male,angry


In [9]:
df = pd.concat([
    ravdess_df, 
    crema_df, 
    tess_df, 
    savee_df
], axis=0)
df.head()

Unnamed: 0,path,sex,emotion
0,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
1,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
2,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
3,test/ravdess-emotional-speech-audio/audio_spee...,male,neutral
4,test/ravdess-emotional-speech-audio/audio_spee...,male,happy


In [10]:
df.drop('sex', axis=1, inplace=True)
df.head()

Unnamed: 0,path,emotion
0,test/ravdess-emotional-speech-audio/audio_spee...,neutral
1,test/ravdess-emotional-speech-audio/audio_spee...,neutral
2,test/ravdess-emotional-speech-audio/audio_spee...,neutral
3,test/ravdess-emotional-speech-audio/audio_spee...,neutral
4,test/ravdess-emotional-speech-audio/audio_spee...,happy


In [11]:
import librosa
from pydub import AudioSegment, effects

In [12]:
def preprocess_audio(path):
    _, sr = librosa.load(path)
    raw_audio = AudioSegment.from_file(path)
    
    samples = np.array(raw_audio.get_array_of_samples(), dtype='float32')
    trimmed, _ = librosa.effects.trim(samples, top_db=25)
    if (len(trimmed)>180000):
        padded = trimmed[:180000]
    else:
        padded = np.pad(trimmed, (0, 180000-len(trimmed)), 'constant')
    return padded, sr

In [12]:
def noise(data):
    noise_amp = 0.035*np.random.uniform()*np.amax(data)
    data = data + noise_amp*np.random.normal(size=data.shape[0])
    return data

In [13]:
emotion_dic = {
    'neutral' : 0,
    'happy'   : 1,
    'sad'     : 2, 
    'angry'   : 3, 
    'fear'    : 4, 
    'disgust' : 5
}

def encode(label):
    return emotion_dic.get(label)

In [14]:
list(emotion_dic.keys())

['neutral', 'happy', 'sad', 'angry', 'fear', 'disgust']

In [15]:
zcr_list = []
rms_list = []
mfccs_list = []
emotion_list = []

FRAME_LENGTH = 2048
HOP_LENGTH = 512

for row in df.itertuples(index=False):
    try: 
        y, sr = preprocess_audio(row.path)
        zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
        zcr_list.append(zcr)
        rms_list.append(rms)
        mfccs_list.append(mfccs)

        emotion_list.append(encode(row.emotion))
    except:
        print(f"Failed for path: {row.path}")

In [16]:
X = np.concatenate((
    np.swapaxes(zcr_list, 1, 2), 
    np.swapaxes(rms_list, 1, 2), 
    np.swapaxes(mfccs_list, 1, 2)), 
    axis=2
)
X = X.astype('float32')

y = np.asarray(emotion_list)

In [28]:
df.iloc[1].path

'test/ravdess-emotional-speech-audio/audio_speech_actors_01-24/Actor_01/03-01-01-01-01-02-01.wav'

In [55]:
class EmotionDataset(Dataset):
    def __init__(self, df):
        self.df = df
        self.emotion_list = []

        self.FRAME_LENGTH = 2048
        self.HOP_LENGTH = 512

        for row in df.itertuples(index=False):
            self.emotion_list.append(encode(row.emotion))
            
        self.len = len(self.emotion_list)

    def __len__(self):
        return self.len

    def __getitem__(self, idx):
        y, sr = preprocess_audio(df.iloc[idx].path)
        y = noise(y)
        mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=self.HOP_LENGTH)
        mfccs = mfccs.T.astype('float32')
            
        label = self.emotion_list[idx]
        return mfccs, label

In [16]:
class EmotionDataset(Dataset):
    def __init__(self, images, labels):
        self.images = []
        self.emotions = torch.Tensor(labels).to(torch.int64)
        transform = transforms.Compose([
            transforms.Resize((224,224)),
            transforms.ToTensor(),
            transforms.Normalize([0.485, 0.456, 0.406],[0.229, 0.224, 0.225])
        ])

        for i in tqdm(range(len(images))):
            
            # MFCC를 이미지로 변환하여 크기를 조정합니다.
            image = Image.fromarray(images[i],"RGB")
            image = transform(image)
            self.images.append(image)
            
        self.len = len(images)

    def __len__(self):
        return self.len

    def __getitem__(self, idx):
        image = self.images[idx]
        label = self.emotions[idx]
        return image, label

In [17]:
class EmotionDataset(Dataset):
    def __init__(self, inputs, labels):
        self.inputs = inputs
        self.emotions = torch.Tensor(labels).to(torch.int64)

    def __len__(self):
        return len(self.emotions)

    def __getitem__(self, idx):
        inputs = self.inputs[idx]
        labels = self.emotions[idx]
        return inputs, labels

In [38]:
class EmotionLSTM(nn.Module):
    def __init__(self, input_shape, hidden_size, n_class):
        super(EmotionLSTM, self).__init__()
        self.lstm1 = nn.LSTM(input_size=input_shape[1], hidden_size=hidden_size, batch_first=True)
        self.lstm2 = nn.LSTM(input_size=hidden_size, hidden_size=hidden_size, batch_first=True)
        self.fc = nn.Linear(hidden_size, n_class)

    def forward(self, x):
        x, _ = self.lstm1(x)
        x, _ = self.lstm2(x)
        x = x[:, -1, :] 
        x = self.fc(x)
        return x

In [18]:
class EmotionLSTM(nn.Module):
    def __init__(self, input_shape, hidden_size, n_class):
        super(EmotionLSTM, self).__init__()
        self.lstm1 = nn.LSTM(input_size=input_shape[1], hidden_size=hidden_size, batch_first=True, dropout = 0.3)
        self.lstm2 = nn.LSTM(input_size=hidden_size, hidden_size=hidden_size, batch_first=True, dropout=0.3)
        self.lstm3 = nn.LSTM(input_size=hidden_size, hidden_size=hidden_size//2, batch_first=True, dropout=0.3)
        self.fc = nn.Linear(hidden_size//2, n_class)

    def forward(self, x):
        x, _ = self.lstm1(x)
        x, _ = self.lstm2(x)
        x, _ = self.lstm3(x)
        x = x[:, -1, :] 
        x = self.fc(x)
        return x

In [56]:
dataset = EmotionDataset(df)
dataset_size = len(dataset)
train_size = int(dataset_size * 0.8)
validation_size = int(dataset_size * 0.1)
test_size = dataset_size - train_size - validation_size

train_dataset, validation_dataset, test_dataset = random_split(dataset, [train_size, validation_size, test_size])

In [19]:
dataset = EmotionDataset(X,y)
dataset_size = len(dataset)
train_size = int(dataset_size * 0.8)
validation_size = int(dataset_size * 0.1)
test_size = dataset_size - train_size - validation_size

train_dataset, validation_dataset, test_dataset = random_split(dataset, [train_size, validation_size, test_size])

In [20]:
dataloader = DataLoader(train_dataset, batch_size=16, shuffle=True, drop_last=True)
validation_loader = DataLoader(validation_dataset, batch_size=4, shuffle=True, drop_last=True)
test_loader = DataLoader(test_dataset, batch_size=4, shuffle=True, drop_last=True)

In [117]:
y, sr = preprocess_audio("../input.wav")
zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)

In [112]:
testX = np.concatenate((
    np.swapaxes(zcr, 0, 1), 
    np.swapaxes(rms, 0, 1), 
    np.swapaxes(mfccs, 0, 1)), 
    axis=1
)
testX = testX.astype('float32')

In [95]:
X.shape[1:3]

(352, 15)

In [61]:
model = EmotionLSTM(X.shape[1:3],256,6)

In [21]:
model = EmotionLSTM(X.shape[1:3],512,6)

In [38]:
model = EmotionLSTM((352, 13),512,6)

In [19]:
model = resnet18(pretrained=True)
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 

In [22]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

In [23]:
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

In [32]:
len(X[0][0])

15

In [24]:
def test(model, test_loader):
    model.eval()
    correct = 0
    total = 0

    with torch.no_grad():
        for images, labels in tqdm(test_loader):
            images = images.to(device)
            labels = labels.to(device)

            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

    accuracy = 100 * correct / total
    print(f'Test Accuracy: {accuracy}%')
    return accuracy

In [72]:
from sklearn.metrics import f1_score

In [93]:
def f1score(model, test_loader):
    model.eval()
    correct = 0
    total = 0
    predict = []
    label_data = []

    with torch.no_grad():
        for images, labels in tqdm(test_loader):
            images = images.to(device)
            labels = labels.to(device)
            label_data = label_data + labels.squeeze().tolist()

            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
            predict = predict + predicted.squeeze().tolist()

    accuracy = 100 * correct / total
    f1 = f1_score(label_data, predict,average="macro")
    print(f'Accuracy: {accuracy}%')
    print(f'f1 score: {f1*100}%')
    return accuracy

In [94]:
f1score(model,validation_loader)

100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.59it/s]

Accuracy: 81.25%
f1 score: 81.48568868514351%





81.25

In [25]:
num_epochs = 200

In [27]:
accuracy_list = []
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    accuracy_list.append(test(model,test_loader))
    torch.save(model.state_dict(), "result/model_LSTM_512_3_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.16it/s, loss=1.56]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.42it/s]


Test Accuracy: 35.18518518518518%


Epoch [2/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.02it/s, loss=1.43]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.84it/s]


Test Accuracy: 35.879629629629626%


Epoch [3/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.14it/s, loss=1.39]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.22it/s]


Test Accuracy: 35.648148148148145%


Epoch [4/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.23it/s, loss=1.37]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.63it/s]


Test Accuracy: 38.425925925925924%


Epoch [5/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.15it/s, loss=1.29]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.72it/s]


Test Accuracy: 43.51851851851852%


Epoch [6/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.26it/s, loss=1.29]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.93it/s]


Test Accuracy: 45.601851851851855%


Epoch [7/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.32it/s, loss=1.27]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.69it/s]


Test Accuracy: 43.98148148148148%


Epoch [8/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.12it/s, loss=1.23]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.61it/s]


Test Accuracy: 48.148148148148145%


Epoch [9/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.16it/s, loss=1.22]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.36it/s]


Test Accuracy: 53.7037037037037%


Epoch [10/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.31it/s, loss=1.17]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.56it/s]


Test Accuracy: 52.5462962962963%


Epoch [11/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.35it/s, loss=1.11]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.73it/s]


Test Accuracy: 52.77777777777778%


Epoch [12/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.40it/s, loss=1.09]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.82it/s]


Test Accuracy: 51.157407407407405%


Epoch [13/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.40it/s, loss=1.05]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.68it/s]


Test Accuracy: 54.166666666666664%


Epoch [14/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.55it/s, loss=1.06]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.70it/s]


Test Accuracy: 54.861111111111114%


Epoch [15/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.41it/s, loss=1.02]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.51it/s]


Test Accuracy: 55.78703703703704%


Epoch [16/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.29it/s, loss=0.981]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.82it/s]


Test Accuracy: 53.7037037037037%


Epoch [17/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.35it/s, loss=1.01]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.63it/s]


Test Accuracy: 56.25%


Epoch [18/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.41it/s, loss=0.995]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.41it/s]


Test Accuracy: 58.7962962962963%


Epoch [19/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.34it/s, loss=0.957]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.79it/s]


Test Accuracy: 55.78703703703704%


Epoch [20/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.31it/s, loss=0.951]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.01it/s]


Test Accuracy: 53.93518518518518%


Epoch [21/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.30it/s, loss=0.959]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.67it/s]


Test Accuracy: 59.49074074074074%


Epoch [22/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.26it/s, loss=0.898]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.38it/s]


Test Accuracy: 62.5%


Epoch [23/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.44it/s, loss=0.889]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.82it/s]


Test Accuracy: 61.342592592592595%


Epoch [24/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.38it/s, loss=0.87]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.96it/s]


Test Accuracy: 62.96296296296296%


Epoch [25/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.37it/s, loss=0.869]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.85it/s]


Test Accuracy: 62.03703703703704%


Epoch [26/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.36it/s, loss=0.862]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.66it/s]


Test Accuracy: 61.80555555555556%


Epoch [27/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.32it/s, loss=0.846]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.28it/s]


Test Accuracy: 65.27777777777777%


Epoch [28/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.36it/s, loss=0.833]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.64it/s]


Test Accuracy: 61.80555555555556%


Epoch [29/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.44it/s, loss=0.848]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.69it/s]


Test Accuracy: 65.04629629629629%


Epoch [30/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.34it/s, loss=0.855]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.31it/s]


Test Accuracy: 65.50925925925925%


Epoch [31/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.29it/s, loss=0.818]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.11it/s]


Test Accuracy: 61.111111111111114%


Epoch [32/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.33it/s, loss=0.8]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.51it/s]


Test Accuracy: 68.98148148148148%


Epoch [33/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.29it/s, loss=0.804]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.93it/s]


Test Accuracy: 67.12962962962963%


Epoch [34/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.25it/s, loss=0.814]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.39it/s]


Test Accuracy: 66.43518518518519%


Epoch [35/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.37it/s, loss=0.74]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.96it/s]


Test Accuracy: 68.28703703703704%


Epoch [36/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.15it/s, loss=0.731]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.94it/s]


Test Accuracy: 63.888888888888886%


Epoch [37/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.12it/s, loss=0.771]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.73it/s]


Test Accuracy: 67.12962962962963%


Epoch [38/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.93it/s, loss=0.757]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.96it/s]


Test Accuracy: 72.22222222222223%


Epoch [39/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.54it/s, loss=0.686]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.38it/s]


Test Accuracy: 68.51851851851852%


Epoch [40/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.26it/s, loss=0.757]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.47it/s]


Test Accuracy: 66.20370370370371%


Epoch [41/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.16it/s, loss=0.693]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.62it/s]


Test Accuracy: 68.05555555555556%


Epoch [42/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.15it/s, loss=0.688]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.43it/s]


Test Accuracy: 67.12962962962963%


Epoch [43/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.84it/s, loss=0.705]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.79it/s]


Test Accuracy: 69.44444444444444%


Epoch [44/200]: 100%|██████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.04it/s, loss=0.7]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.78it/s]


Test Accuracy: 64.35185185185185%


Epoch [45/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.68it/s, loss=0.651]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.93it/s]


Test Accuracy: 68.75%


Epoch [46/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.86it/s, loss=0.667]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 29.83it/s]


Test Accuracy: 68.75%


Epoch [47/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.59it/s, loss=0.65]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.16it/s]


Test Accuracy: 68.28703703703704%


Epoch [48/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.89it/s, loss=0.653]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.06it/s]


Test Accuracy: 68.98148148148148%


Epoch [49/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.10it/s, loss=0.597]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.27it/s]


Test Accuracy: 72.91666666666667%


Epoch [50/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.69it/s, loss=0.632]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.49it/s]


Test Accuracy: 72.68518518518519%


Epoch [51/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.99it/s, loss=0.642]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.02it/s]


Test Accuracy: 69.9074074074074%


Epoch [52/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.33it/s, loss=0.59]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.40it/s]


Test Accuracy: 72.45370370370371%


Epoch [53/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.42it/s, loss=0.625]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.44it/s]


Test Accuracy: 70.13888888888889%


Epoch [54/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.38it/s, loss=0.582]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.75it/s]


Test Accuracy: 72.45370370370371%


Epoch [55/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.03it/s, loss=0.608]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.10it/s]


Test Accuracy: 72.45370370370371%


Epoch [56/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.53it/s, loss=0.564]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.13it/s]


Test Accuracy: 74.76851851851852%


Epoch [57/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.04it/s, loss=0.592]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.76it/s]


Test Accuracy: 73.8425925925926%


Epoch [58/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.27it/s, loss=0.569]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.22it/s]


Test Accuracy: 73.37962962962963%


Epoch [59/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.90it/s, loss=0.555]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.16it/s]


Test Accuracy: 75.92592592592592%


Epoch [60/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.35it/s, loss=0.554]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.21it/s]


Test Accuracy: 75.92592592592592%


Epoch [61/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.06it/s, loss=0.563]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.73it/s]


Test Accuracy: 74.53703703703704%


Epoch [62/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.19it/s, loss=0.546]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.10it/s]


Test Accuracy: 70.60185185185185%


Epoch [63/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.38it/s, loss=0.54]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.35it/s]


Test Accuracy: 69.21296296296296%


Epoch [64/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.34it/s, loss=0.519]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.90it/s]


Test Accuracy: 73.8425925925926%


Epoch [65/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.52it/s, loss=0.526]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.82it/s]


Test Accuracy: 74.30555555555556%


Epoch [66/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.65it/s, loss=0.559]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.40it/s]


Test Accuracy: 67.36111111111111%


Epoch [67/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.35it/s, loss=0.635]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.09it/s]


Test Accuracy: 71.99074074074075%


Epoch [68/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.89it/s, loss=0.51]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.14it/s]


Test Accuracy: 74.30555555555556%


Epoch [69/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.91it/s, loss=0.515]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.14it/s]


Test Accuracy: 74.30555555555556%


Epoch [70/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.95it/s, loss=0.504]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.68it/s]


Test Accuracy: 73.37962962962963%


Epoch [71/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.01it/s, loss=0.496]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.21it/s]


Test Accuracy: 74.53703703703704%


Epoch [72/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.36it/s, loss=0.486]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.00it/s]


Test Accuracy: 74.07407407407408%


Epoch [73/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.11it/s, loss=0.499]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.54it/s]


Test Accuracy: 73.14814814814815%


Epoch [74/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.05it/s, loss=0.789]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.81it/s]


Test Accuracy: 68.28703703703704%


Epoch [75/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.18it/s, loss=0.707]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.68it/s]


Test Accuracy: 67.5925925925926%


Epoch [76/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.23it/s, loss=0.639]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.89it/s]


Test Accuracy: 70.60185185185185%


Epoch [77/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.25it/s, loss=0.551]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.45it/s]


Test Accuracy: 73.61111111111111%


Epoch [78/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.54it/s, loss=0.537]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.05it/s]


Test Accuracy: 69.44444444444444%


Epoch [79/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.44it/s, loss=0.596]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.64it/s]


Test Accuracy: 55.78703703703704%


Epoch [80/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.24it/s, loss=0.613]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.51it/s]


Test Accuracy: 72.91666666666667%


Epoch [81/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.30it/s, loss=0.502]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.92it/s]


Test Accuracy: 72.68518518518519%


Epoch [82/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.20it/s, loss=0.513]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.11it/s]


Test Accuracy: 72.45370370370371%


Epoch [83/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.10it/s, loss=0.53]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 30.87it/s]


Test Accuracy: 74.76851851851852%


Epoch [84/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.04it/s, loss=0.499]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.77it/s]


Test Accuracy: 75.0%


Epoch [85/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.06it/s, loss=0.496]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.85it/s]


Test Accuracy: 73.61111111111111%


Epoch [86/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.00it/s, loss=0.48]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.02it/s]


Test Accuracy: 74.53703703703704%


Epoch [87/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.51it/s, loss=0.485]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.20it/s]


Test Accuracy: 73.61111111111111%


Epoch [88/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.23it/s, loss=0.46]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.63it/s]


Test Accuracy: 74.07407407407408%


Epoch [89/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.00it/s, loss=0.479]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.79it/s]


Test Accuracy: 76.38888888888889%


Epoch [90/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.84it/s, loss=0.447]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.21it/s]


Test Accuracy: 77.77777777777777%


Epoch [91/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.93it/s, loss=0.439]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.71it/s]


Test Accuracy: 75.0%


Epoch [92/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.79it/s, loss=0.467]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.28it/s]


Test Accuracy: 76.85185185185185%


Epoch [93/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.35it/s, loss=0.417]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.80it/s]


Test Accuracy: 73.14814814814815%


Epoch [94/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.16it/s, loss=0.448]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.18it/s]


Test Accuracy: 75.92592592592592%


Epoch [95/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.12it/s, loss=0.44]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.11it/s]


Test Accuracy: 77.77777777777777%


Epoch [96/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.19it/s, loss=0.438]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.97it/s]


Test Accuracy: 75.0%


Epoch [97/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.11it/s, loss=0.415]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.27it/s]


Test Accuracy: 75.0%


Epoch [98/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.45it/s, loss=0.42]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.67it/s]


Test Accuracy: 76.38888888888889%


Epoch [99/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.42it/s, loss=0.449]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.26it/s]


Test Accuracy: 77.77777777777777%


Epoch [100/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.31it/s, loss=0.429]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.23it/s]


Test Accuracy: 77.77777777777777%


Epoch [101/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.47it/s, loss=0.42]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.59it/s]


Test Accuracy: 70.37037037037037%


Epoch [102/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.42it/s, loss=0.422]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.39it/s]


Test Accuracy: 77.31481481481481%


Epoch [103/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.43it/s, loss=0.407]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.18it/s]


Test Accuracy: 73.61111111111111%


Epoch [104/200]: 100%|█████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.33it/s, loss=0.4]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.14it/s]


Test Accuracy: 78.00925925925925%


Epoch [105/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.22it/s, loss=0.42]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.55it/s]


Test Accuracy: 75.69444444444444%


Epoch [106/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.09it/s, loss=0.389]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.26it/s]


Test Accuracy: 76.85185185185185%


Epoch [107/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.98it/s, loss=0.412]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.66it/s]


Test Accuracy: 76.62037037037037%


Epoch [108/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.02it/s, loss=0.391]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.03it/s]


Test Accuracy: 73.8425925925926%


Epoch [109/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.77it/s, loss=0.38]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.52it/s]


Test Accuracy: 75.23148148148148%


Epoch [110/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.69it/s, loss=0.399]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.31it/s]


Test Accuracy: 75.0%


Epoch [111/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.69it/s, loss=0.393]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.15it/s]


Test Accuracy: 76.38888888888889%


Epoch [112/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.46it/s, loss=0.389]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.44it/s]


Test Accuracy: 74.53703703703704%


Epoch [113/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.11it/s, loss=0.391]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.47it/s]


Test Accuracy: 75.69444444444444%


Epoch [114/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.08it/s, loss=0.353]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.82it/s]


Test Accuracy: 76.62037037037037%


Epoch [115/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.94it/s, loss=0.376]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.21it/s]


Test Accuracy: 77.54629629629629%


Epoch [116/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.02it/s, loss=0.383]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.21it/s]


Test Accuracy: 76.38888888888889%


Epoch [117/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.11it/s, loss=0.386]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.14it/s]


Test Accuracy: 76.62037037037037%


Epoch [118/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.06it/s, loss=0.509]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.83it/s]


Test Accuracy: 73.37962962962963%


Epoch [119/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.32it/s, loss=0.456]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 29.85it/s]


Test Accuracy: 75.0%


Epoch [120/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.16it/s, loss=0.406]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.24it/s]


Test Accuracy: 76.38888888888889%


Epoch [121/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.32it/s, loss=0.38]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.54it/s]


Test Accuracy: 74.07407407407408%


Epoch [122/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.32it/s, loss=0.423]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.41it/s]


Test Accuracy: 78.24074074074075%


Epoch [123/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.25it/s, loss=0.366]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:05<00:00, 20.69it/s]


Test Accuracy: 75.0%


Epoch [124/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:25<00:00,  8.53it/s, loss=0.358]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 27.84it/s]


Test Accuracy: 80.78703703703704%


Epoch [125/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.05it/s, loss=0.367]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:05<00:00, 21.16it/s]


Test Accuracy: 75.92592592592592%


Epoch [126/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.24it/s, loss=0.357]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:05<00:00, 20.95it/s]


Test Accuracy: 76.62037037037037%


Epoch [127/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.16it/s, loss=0.353]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.48it/s]


Test Accuracy: 78.00925925925925%


Epoch [128/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:20<00:00, 10.54it/s, loss=0.349]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:05<00:00, 19.31it/s]


Test Accuracy: 76.1574074074074%


Epoch [129/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:25<00:00,  8.44it/s, loss=0.311]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:04<00:00, 26.93it/s]


Test Accuracy: 78.93518518518519%


Epoch [130/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.94it/s, loss=0.314]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.47it/s]


Test Accuracy: 75.0%


Epoch [131/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.31it/s, loss=0.329]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.44it/s]


Test Accuracy: 73.61111111111111%


Epoch [132/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.02it/s, loss=0.312]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.61it/s]


Test Accuracy: 78.24074074074075%


Epoch [133/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.30it/s, loss=0.295]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 28.45it/s]


Test Accuracy: 73.8425925925926%


Epoch [134/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:18<00:00, 11.90it/s, loss=0.32]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.68it/s]


Test Accuracy: 77.08333333333333%


Epoch [135/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.03it/s, loss=0.352]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.96it/s]


Test Accuracy: 75.0%


Epoch [136/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.08it/s, loss=0.36]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.26it/s]


Test Accuracy: 77.77777777777777%


Epoch [137/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.17it/s, loss=0.311]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.89it/s]


Test Accuracy: 75.46296296296296%


Epoch [138/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.58it/s, loss=0.279]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.36it/s]


Test Accuracy: 75.92592592592592%


Epoch [139/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.57it/s, loss=0.285]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.88it/s]


Test Accuracy: 75.46296296296296%


Epoch [140/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.37it/s, loss=0.329]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.08it/s]


Test Accuracy: 77.08333333333333%


Epoch [141/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.59it/s, loss=0.334]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.30it/s]


Test Accuracy: 76.38888888888889%


Epoch [142/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.33it/s, loss=0.353]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.16it/s]


Test Accuracy: 78.93518518518519%


Epoch [143/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.39it/s, loss=0.341]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.29it/s]


Test Accuracy: 76.38888888888889%


Epoch [144/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.78it/s, loss=0.307]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.49it/s]


Test Accuracy: 76.62037037037037%


Epoch [145/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.14it/s, loss=0.303]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.80it/s]


Test Accuracy: 77.31481481481481%


Epoch [146/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.16it/s, loss=0.321]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.99it/s]


Test Accuracy: 71.29629629629629%


Epoch [147/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.56it/s, loss=0.305]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.44it/s]


Test Accuracy: 77.77777777777777%


Epoch [148/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.22it/s, loss=0.33]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.36it/s]


Test Accuracy: 76.62037037037037%


Epoch [149/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.21it/s, loss=0.276]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.54it/s]


Test Accuracy: 74.07407407407408%


Epoch [150/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.21it/s, loss=0.312]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.19it/s]


Test Accuracy: 77.31481481481481%


Epoch [151/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.17it/s, loss=0.274]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.59it/s]


Test Accuracy: 76.62037037037037%


Epoch [152/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.09it/s, loss=0.27]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.27it/s]


Test Accuracy: 74.76851851851852%


Epoch [153/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.30it/s, loss=0.282]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.17it/s]


Test Accuracy: 78.00925925925925%


Epoch [154/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.17it/s, loss=0.259]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.69it/s]


Test Accuracy: 75.92592592592592%


Epoch [155/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.30it/s, loss=0.253]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.18it/s]


Test Accuracy: 76.38888888888889%


Epoch [156/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.59it/s, loss=0.284]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.76it/s]


Test Accuracy: 77.08333333333333%


Epoch [157/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.83it/s, loss=0.282]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.73it/s]


Test Accuracy: 75.0%


Epoch [158/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.63it/s, loss=0.255]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.70it/s]


Test Accuracy: 75.23148148148148%


Epoch [159/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.91it/s, loss=0.264]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.26it/s]


Test Accuracy: 79.39814814814815%


Epoch [160/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.46it/s, loss=0.254]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.19it/s]


Test Accuracy: 77.54629629629629%


Epoch [161/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.33it/s, loss=0.279]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.24it/s]


Test Accuracy: 75.69444444444444%


Epoch [162/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.19it/s, loss=0.501]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.51it/s]


Test Accuracy: 75.0%


Epoch [163/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.74it/s, loss=0.313]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.25it/s]


Test Accuracy: 75.69444444444444%


Epoch [164/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.48it/s, loss=0.629]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.18it/s]


Test Accuracy: 68.98148148148148%


Epoch [165/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.81it/s, loss=0.464]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.71it/s]


Test Accuracy: 74.76851851851852%


Epoch [166/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.23it/s, loss=0.35]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.94it/s]


Test Accuracy: 76.1574074074074%


Epoch [167/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.53it/s, loss=0.285]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.64it/s]


Test Accuracy: 79.16666666666667%


Epoch [168/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.57it/s, loss=0.283]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.66it/s]


Test Accuracy: 79.86111111111111%


Epoch [169/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.78it/s, loss=0.234]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.08it/s]


Test Accuracy: 76.85185185185185%


Epoch [170/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.16it/s, loss=0.234]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.49it/s]


Test Accuracy: 77.54629629629629%


Epoch [171/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.95it/s, loss=0.249]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.81it/s]


Test Accuracy: 76.85185185185185%


Epoch [172/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.15it/s, loss=0.247]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.62it/s]


Test Accuracy: 78.70370370370371%


Epoch [173/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.49it/s, loss=0.255]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.87it/s]


Test Accuracy: 76.85185185185185%


Epoch [174/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.03it/s, loss=0.272]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.31it/s]


Test Accuracy: 79.39814814814815%


Epoch [175/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.28it/s, loss=0.209]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.38it/s]


Test Accuracy: 79.86111111111111%


Epoch [176/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.12it/s, loss=0.218]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.16it/s]


Test Accuracy: 77.08333333333333%


Epoch [177/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.97it/s, loss=0.288]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.26it/s]


Test Accuracy: 76.1574074074074%


Epoch [178/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.06it/s, loss=0.352]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.24it/s]


Test Accuracy: 78.00925925925925%


Epoch [179/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.18it/s, loss=0.259]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.70it/s]


Test Accuracy: 80.0925925925926%


Epoch [180/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.49it/s, loss=0.243]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.69it/s]


Test Accuracy: 79.16666666666667%


Epoch [181/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.57it/s, loss=0.226]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.21it/s]


Test Accuracy: 77.31481481481481%


Epoch [182/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.65it/s, loss=0.267]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.59it/s]


Test Accuracy: 78.47222222222223%


Epoch [183/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.62it/s, loss=0.222]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.78it/s]


Test Accuracy: 76.85185185185185%


Epoch [184/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.09it/s, loss=0.228]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.02it/s]


Test Accuracy: 76.1574074074074%


Epoch [185/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.62it/s, loss=0.248]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.37it/s]


Test Accuracy: 77.08333333333333%


Epoch [186/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.77it/s, loss=0.22]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.44it/s]


Test Accuracy: 77.08333333333333%


Epoch [187/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.75it/s, loss=0.244]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.88it/s]


Test Accuracy: 78.70370370370371%


Epoch [188/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.38it/s, loss=0.242]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 34.21it/s]


Test Accuracy: 77.31481481481481%


Epoch [189/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.20it/s, loss=0.213]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.30it/s]


Test Accuracy: 77.31481481481481%


Epoch [190/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.93it/s, loss=0.176]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.50it/s]


Test Accuracy: 78.00925925925925%


Epoch [191/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.89it/s, loss=0.222]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.63it/s]


Test Accuracy: 78.70370370370371%


Epoch [192/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.09it/s, loss=0.231]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.67it/s]


Test Accuracy: 77.08333333333333%


Epoch [193/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 13.23it/s, loss=0.218]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.66it/s]


Test Accuracy: 80.32407407407408%


Epoch [194/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.66it/s, loss=0.228]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.54it/s]


Test Accuracy: 75.69444444444444%


Epoch [195/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.08it/s, loss=0.259]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.31it/s]


Test Accuracy: 79.16666666666667%


Epoch [196/200]: 100%|████████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.80it/s, loss=0.23]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.20it/s]


Test Accuracy: 76.38888888888889%


Epoch [197/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.74it/s, loss=0.266]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.52it/s]


Test Accuracy: 78.24074074074075%


Epoch [198/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.58it/s, loss=0.223]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 33.31it/s]


Test Accuracy: 79.39814814814815%


Epoch [199/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:16<00:00, 12.72it/s, loss=0.212]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 32.48it/s]


Test Accuracy: 79.39814814814815%


Epoch [200/200]: 100%|███████████████████████████████████████████████████| 216/216 [00:17<00:00, 12.63it/s, loss=0.189]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.52it/s]

Test Accuracy: 78.00925925925925%
Training finished!





In [28]:
test(model, validation_loader)

100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:03<00:00, 31.69it/s]

Test Accuracy: 78.70370370370371%





78.70370370370371

In [53]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_LSTM_512_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.81it/s, loss=1.59]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 40.42it/s]


Test Accuracy: 42.129629629629626%


Epoch [2/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.95it/s, loss=1.51]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 41.76it/s]


Test Accuracy: 40.0462962962963%


Epoch [3/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.07it/s, loss=1.44]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.10it/s]


Test Accuracy: 35.879629629629626%


Epoch [4/100]: 100%|███████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.09it/s, loss=1.4]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 41.49it/s]


Test Accuracy: 44.675925925925924%


Epoch [5/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.07it/s, loss=1.35]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.08it/s]


Test Accuracy: 43.05555555555556%


Epoch [6/100]: 100%|███████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.09it/s, loss=1.3]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 41.24it/s]


Test Accuracy: 47.4537037037037%


Epoch [7/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.93it/s, loss=1.25]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.09it/s]


Test Accuracy: 53.47222222222222%


Epoch [8/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.10it/s, loss=1.22]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.09it/s]


Test Accuracy: 53.00925925925926%


Epoch [9/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.09it/s, loss=1.18]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.32it/s]


Test Accuracy: 51.620370370370374%


Epoch [10/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.77it/s, loss=1.25]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.79it/s]


Test Accuracy: 42.592592592592595%


Epoch [11/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.89it/s, loss=1.26]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 46.01it/s]


Test Accuracy: 49.30555555555556%


Epoch [12/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.94it/s, loss=1.26]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.51it/s]


Test Accuracy: 40.50925925925926%


Epoch [13/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.04it/s, loss=1.23]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 40.98it/s]


Test Accuracy: 48.379629629629626%


Epoch [14/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.22it/s, loss=1.18]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.05it/s]


Test Accuracy: 56.01851851851852%


Epoch [15/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.36it/s, loss=1.12]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.55it/s]


Test Accuracy: 56.71296296296296%


Epoch [16/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.62it/s, loss=1.1]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.52it/s]


Test Accuracy: 57.638888888888886%


Epoch [17/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.63it/s, loss=1.08]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.27it/s]


Test Accuracy: 55.78703703703704%


Epoch [18/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.51it/s, loss=1.1]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.40it/s]


Test Accuracy: 59.25925925925926%


Epoch [19/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.56it/s, loss=1.06]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.14it/s]


Test Accuracy: 58.333333333333336%


Epoch [20/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.68it/s, loss=1.06]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.70it/s]


Test Accuracy: 58.7962962962963%


Epoch [21/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.57it/s, loss=1.03]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.34it/s]


Test Accuracy: 58.7962962962963%


Epoch [22/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.78it/s, loss=0.998]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.67it/s]


Test Accuracy: 62.5%


Epoch [23/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.61it/s, loss=0.978]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.93it/s]


Test Accuracy: 60.648148148148145%


Epoch [24/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.72it/s, loss=0.988]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.50it/s]


Test Accuracy: 60.18518518518518%


Epoch [25/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.51it/s, loss=0.938]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.80it/s]


Test Accuracy: 60.648148148148145%


Epoch [26/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.61it/s, loss=0.967]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.09it/s]


Test Accuracy: 57.407407407407405%


Epoch [27/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.55it/s, loss=0.909]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.64it/s]


Test Accuracy: 61.80555555555556%


Epoch [28/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.16it/s, loss=0.903]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.41it/s]


Test Accuracy: 64.81481481481481%


Epoch [29/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.52it/s, loss=0.9]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.21it/s]


Test Accuracy: 65.27777777777777%


Epoch [30/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.65it/s, loss=0.912]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.59it/s]


Test Accuracy: 65.74074074074075%


Epoch [31/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.74it/s, loss=0.869]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.68it/s]


Test Accuracy: 65.50925925925925%


Epoch [32/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.24it/s, loss=0.842]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.64it/s]


Test Accuracy: 68.05555555555556%


Epoch [33/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.11it/s, loss=0.813]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 41.45it/s]


Test Accuracy: 70.37037037037037%


Epoch [34/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.08it/s, loss=0.797]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.49it/s]


Test Accuracy: 59.02777777777778%


Epoch [35/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.30it/s, loss=0.853]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.33it/s]


Test Accuracy: 69.21296296296296%


Epoch [36/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.56it/s, loss=0.823]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.30it/s]


Test Accuracy: 65.27777777777777%


Epoch [37/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.61it/s, loss=0.831]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.90it/s]


Test Accuracy: 67.12962962962963%


Epoch [38/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.81it/s, loss=0.794]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.44it/s]


Test Accuracy: 63.657407407407405%


Epoch [39/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.08it/s, loss=0.839]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.70it/s]


Test Accuracy: 68.75%


Epoch [40/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.17it/s, loss=0.796]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.03it/s]


Test Accuracy: 68.05555555555556%


Epoch [41/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.19it/s, loss=0.752]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.79it/s]


Test Accuracy: 71.06481481481481%


Epoch [42/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.98it/s, loss=0.757]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.87it/s]


Test Accuracy: 65.04629629629629%


Epoch [43/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.47it/s, loss=0.803]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.88it/s]


Test Accuracy: 70.37037037037037%


Epoch [44/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.38it/s, loss=0.747]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.45it/s]


Test Accuracy: 71.52777777777777%


Epoch [45/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.75it/s, loss=0.735]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.33it/s]


Test Accuracy: 65.97222222222223%


Epoch [46/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.52it/s, loss=0.753]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.92it/s]


Test Accuracy: 65.97222222222223%


Epoch [47/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.29it/s, loss=0.715]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.38it/s]


Test Accuracy: 69.9074074074074%


Epoch [48/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.59it/s, loss=0.788]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.89it/s]


Test Accuracy: 68.98148148148148%


Epoch [49/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.47it/s, loss=0.73]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.97it/s]


Test Accuracy: 71.99074074074075%


Epoch [50/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.49it/s, loss=0.721]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.48it/s]


Test Accuracy: 69.67592592592592%


Epoch [51/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.43it/s, loss=0.731]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.88it/s]


Test Accuracy: 67.5925925925926%


Epoch [52/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.40it/s, loss=0.739]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.09it/s]


Test Accuracy: 72.45370370370371%


Epoch [53/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.66it/s, loss=0.667]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.26it/s]


Test Accuracy: 74.07407407407408%


Epoch [54/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.68it/s, loss=0.696]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.24it/s]


Test Accuracy: 72.22222222222223%


Epoch [55/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.36it/s, loss=0.662]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.03it/s]


Test Accuracy: 71.29629629629629%


Epoch [56/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.17it/s, loss=0.678]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.15it/s]


Test Accuracy: 71.75925925925925%


Epoch [57/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.60it/s, loss=0.638]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.17it/s]


Test Accuracy: 73.8425925925926%


Epoch [58/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.56it/s, loss=0.649]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.03it/s]


Test Accuracy: 73.37962962962963%


Epoch [59/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.79it/s, loss=0.663]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.77it/s]


Test Accuracy: 72.91666666666667%


Epoch [60/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.77it/s, loss=0.635]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.80it/s]


Test Accuracy: 75.0%


Epoch [61/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.70it/s, loss=0.651]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.11it/s]


Test Accuracy: 71.99074074074075%


Epoch [62/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.58it/s, loss=0.627]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.27it/s]


Test Accuracy: 69.21296296296296%


Epoch [63/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.53it/s, loss=0.648]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.96it/s]


Test Accuracy: 71.75925925925925%


Epoch [64/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.73it/s, loss=0.597]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.23it/s]


Test Accuracy: 72.91666666666667%


Epoch [65/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.28it/s, loss=0.607]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.83it/s]


Test Accuracy: 68.51851851851852%


Epoch [66/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.72it/s, loss=0.637]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.75it/s]


Test Accuracy: 74.53703703703704%


Epoch [67/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.71it/s, loss=0.614]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.08it/s]


Test Accuracy: 75.69444444444444%


Epoch [68/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.52it/s, loss=0.593]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.57it/s]


Test Accuracy: 73.8425925925926%


Epoch [69/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.76it/s, loss=0.568]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.99it/s]


Test Accuracy: 74.53703703703704%


Epoch [70/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.61it/s, loss=0.613]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.49it/s]


Test Accuracy: 66.20370370370371%


Epoch [71/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.50it/s, loss=0.617]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.59it/s]


Test Accuracy: 73.61111111111111%


Epoch [72/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.69it/s, loss=0.616]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.36it/s]


Test Accuracy: 71.75925925925925%


Epoch [73/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.31it/s, loss=0.571]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.51it/s]


Test Accuracy: 72.91666666666667%


Epoch [74/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.60it/s, loss=0.555]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.99it/s]


Test Accuracy: 74.53703703703704%


Epoch [75/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.40it/s, loss=0.558]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.04it/s]


Test Accuracy: 74.53703703703704%


Epoch [76/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.01it/s, loss=0.546]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.40it/s]


Test Accuracy: 71.75925925925925%


Epoch [77/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.08it/s, loss=0.538]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.64it/s]


Test Accuracy: 75.46296296296296%


Epoch [78/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.36it/s, loss=0.549]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 46.08it/s]


Test Accuracy: 75.92592592592592%


Epoch [79/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.12it/s, loss=0.62]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.05it/s]


Test Accuracy: 75.69444444444444%


Epoch [80/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.41it/s, loss=0.626]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 47.23it/s]


Test Accuracy: 77.31481481481481%


Epoch [81/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.47it/s, loss=0.562]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 46.36it/s]


Test Accuracy: 74.07407407407408%


Epoch [82/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.31it/s, loss=0.597]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.95it/s]


Test Accuracy: 74.07407407407408%


Epoch [83/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.48it/s, loss=0.596]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 43.73it/s]


Test Accuracy: 73.8425925925926%


Epoch [84/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.05it/s, loss=0.592]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.60it/s]


Test Accuracy: 71.29629629629629%


Epoch [85/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.14it/s, loss=0.626]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 42.19it/s]


Test Accuracy: 74.76851851851852%


Epoch [86/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.83it/s, loss=0.569]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 46.28it/s]


Test Accuracy: 72.68518518518519%


Epoch [87/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.49it/s, loss=0.57]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.75it/s]


Test Accuracy: 76.85185185185185%


Epoch [88/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.18it/s, loss=0.574]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.23it/s]


Test Accuracy: 74.76851851851852%


Epoch [89/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.80it/s, loss=0.544]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.44it/s]


Test Accuracy: 71.52777777777777%


Epoch [90/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.54it/s, loss=0.549]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.22it/s]


Test Accuracy: 73.61111111111111%


Epoch [91/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.85it/s, loss=0.55]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.58it/s]


Test Accuracy: 73.37962962962963%


Epoch [92/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.58it/s, loss=0.517]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 46.26it/s]


Test Accuracy: 74.53703703703704%


Epoch [93/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.42it/s, loss=0.518]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.02it/s]


Test Accuracy: 73.37962962962963%


Epoch [94/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.84it/s, loss=0.62]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.84it/s]


Test Accuracy: 74.53703703703704%


Epoch [95/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.74it/s, loss=0.564]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.18it/s]


Test Accuracy: 73.61111111111111%


Epoch [96/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.59it/s, loss=0.564]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.80it/s]


Test Accuracy: 76.1574074074074%


Epoch [97/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.89it/s, loss=0.577]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 46.62it/s]


Test Accuracy: 76.1574074074074%


Epoch [98/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.95it/s, loss=0.556]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 44.84it/s]


Test Accuracy: 74.07407407407408%


Epoch [99/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.76it/s, loss=0.526]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.56it/s]


Test Accuracy: 78.00925925925925%


Epoch [100/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:12<00:00, 17.87it/s, loss=0.522]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 45.91it/s]

Test Accuracy: 77.08333333333333%
Training finished!





In [48]:
for epoch in range(60,60+num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_LSTM_256_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [61/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.39it/s, loss=0.649]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 69.62it/s]


Test Accuracy: 70.60185185185185%


Epoch [62/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.31it/s, loss=0.643]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 60.34it/s]


Test Accuracy: 72.45370370370371%


Epoch [63/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.33it/s, loss=0.708]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.83it/s]


Test Accuracy: 67.5925925925926%


Epoch [64/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.44it/s, loss=0.755]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 68.94it/s]


Test Accuracy: 69.21296296296296%


Epoch [65/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.59it/s, loss=0.702]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.54it/s]


Test Accuracy: 69.21296296296296%


Epoch [66/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.56it/s, loss=0.691]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.33it/s]


Test Accuracy: 72.45370370370371%


Epoch [67/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 19.64it/s, loss=0.663]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.83it/s]


Test Accuracy: 68.98148148148148%


Epoch [68/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.10it/s, loss=0.627]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 69.34it/s]


Test Accuracy: 73.61111111111111%


Epoch [69/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 19.65it/s, loss=0.609]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.61it/s]


Test Accuracy: 75.46296296296296%


Epoch [70/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 19.73it/s, loss=0.603]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.11it/s]


Test Accuracy: 70.83333333333333%


Epoch [71/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.42it/s, loss=0.574]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 69.23it/s]


Test Accuracy: 75.23148148148148%


Epoch [72/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 19.73it/s, loss=0.578]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.69it/s]


Test Accuracy: 74.07407407407408%


Epoch [73/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.00it/s, loss=0.594]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.27it/s]


Test Accuracy: 73.61111111111111%


Epoch [74/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.62it/s, loss=0.584]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.62it/s]


Test Accuracy: 75.23148148148148%


Epoch [75/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.50it/s, loss=0.561]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.33it/s]


Test Accuracy: 73.61111111111111%


Epoch [76/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 19.64it/s, loss=0.573]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.68it/s]


Test Accuracy: 76.62037037037037%


Epoch [77/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.59it/s, loss=0.556]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.81it/s]


Test Accuracy: 74.76851851851852%


Epoch [78/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.98it/s, loss=0.526]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.72it/s]


Test Accuracy: 74.76851851851852%


Epoch [79/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.12it/s, loss=0.528]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.53it/s]


Test Accuracy: 75.0%


Epoch [80/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.26it/s, loss=0.526]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 69.84it/s]


Test Accuracy: 75.69444444444444%


Epoch [81/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 20.12it/s, loss=0.505]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 70.39it/s]


Test Accuracy: 74.53703703703704%


Epoch [82/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.41it/s, loss=0.507]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.36it/s]


Test Accuracy: 74.30555555555556%


Epoch [83/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.84it/s, loss=0.574]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 70.53it/s]


Test Accuracy: 75.69444444444444%


Epoch [84/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 20.60it/s, loss=0.543]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 71.98it/s]


Test Accuracy: 73.61111111111111%


Epoch [85/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 19.84it/s, loss=0.537]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 67.32it/s]


Test Accuracy: 75.0%


Epoch [86/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.56it/s, loss=0.563]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 62.44it/s]


Test Accuracy: 76.85185185185185%


Epoch [87/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.87it/s, loss=0.511]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.20it/s]


Test Accuracy: 77.31481481481481%


Epoch [88/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.70it/s, loss=0.498]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.21it/s]


Test Accuracy: 75.23148148148148%


Epoch [89/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.95it/s, loss=0.487]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.48it/s]


Test Accuracy: 77.31481481481481%


Epoch [90/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.54it/s, loss=0.477]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.88it/s]


Test Accuracy: 71.75925925925925%


Epoch [91/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.79it/s, loss=0.481]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.66it/s]


Test Accuracy: 75.92592592592592%


Epoch [92/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.84it/s, loss=0.476]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.44it/s]


Test Accuracy: 75.0%


Epoch [93/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.45it/s, loss=0.473]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.36it/s]


Test Accuracy: 74.30555555555556%


Epoch [94/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.91it/s, loss=0.445]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.11it/s]


Test Accuracy: 77.54629629629629%


Epoch [95/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.45it/s, loss=0.443]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.67it/s]


Test Accuracy: 78.47222222222223%


Epoch [96/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.12it/s, loss=0.453]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.99it/s]


Test Accuracy: 75.23148148148148%


Epoch [97/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.56it/s, loss=0.44]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.73it/s]


Test Accuracy: 78.00925925925925%


Epoch [98/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.89it/s, loss=0.426]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.40it/s]


Test Accuracy: 78.93518518518519%


Epoch [99/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 19.18it/s, loss=0.423]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.21it/s]


Test Accuracy: 75.92592592592592%


Epoch [100/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.63it/s, loss=0.422]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.15it/s]


Test Accuracy: 76.1574074074074%


Epoch [101/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.72it/s, loss=0.436]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.14it/s]


Test Accuracy: 71.75925925925925%


Epoch [102/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.93it/s, loss=0.429]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.02it/s]


Test Accuracy: 76.1574074074074%


Epoch [103/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.74it/s, loss=0.412]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.17it/s]


Test Accuracy: 76.62037037037037%


Epoch [104/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.71it/s, loss=0.387]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.09it/s]


Test Accuracy: 78.00925925925925%


Epoch [105/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.85it/s, loss=0.355]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.43it/s]


Test Accuracy: 78.00925925925925%


Epoch [106/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.89it/s, loss=0.865]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.46it/s]


Test Accuracy: 70.13888888888889%


Epoch [107/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.55it/s, loss=0.628]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.90it/s]


Test Accuracy: 72.68518518518519%


Epoch [108/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.35it/s, loss=0.521]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.64it/s]


Test Accuracy: 74.53703703703704%


Epoch [109/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.75it/s, loss=0.48]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.07it/s]


Test Accuracy: 75.46296296296296%


Epoch [110/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.77it/s, loss=0.501]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.36it/s]


Test Accuracy: 73.61111111111111%


Epoch [111/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.60it/s, loss=0.529]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.47it/s]


Test Accuracy: 75.23148148148148%


Epoch [112/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.45it/s, loss=0.438]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 61.26it/s]


Test Accuracy: 78.93518518518519%


Epoch [113/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.64it/s, loss=0.419]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.05it/s]


Test Accuracy: 73.37962962962963%


Epoch [114/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.89it/s, loss=0.406]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.35it/s]


Test Accuracy: 76.1574074074074%


Epoch [115/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.42it/s, loss=0.51]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.84it/s]


Test Accuracy: 74.07407407407408%


Epoch [116/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.67it/s, loss=0.456]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 65.58it/s]


Test Accuracy: 76.38888888888889%


Epoch [117/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.84it/s, loss=0.414]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 62.88it/s]


Test Accuracy: 75.69444444444444%


Epoch [118/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.57it/s, loss=0.422]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 64.58it/s]


Test Accuracy: 76.38888888888889%


Epoch [119/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.40it/s, loss=0.474]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 63.83it/s]


Test Accuracy: 78.47222222222223%


Epoch [120/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:11<00:00, 18.38it/s, loss=0.368]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 60.82it/s]

Test Accuracy: 78.93518518518519%
Training finished!





In [105]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_resnet_new_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.47it/s, loss=0.733]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 194.13it/s]


Test Accuracy: 71.47435897435898%


Epoch [2/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.78it/s, loss=0.548]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 186.43it/s]


Test Accuracy: 59.294871794871796%


Epoch [3/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.25it/s, loss=0.497]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 172.58it/s]


Test Accuracy: 75.32051282051282%


Epoch [4/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.24it/s, loss=0.476]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 187.95it/s]


Test Accuracy: 72.11538461538461%


Epoch [5/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.23it/s, loss=0.397]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 183.90it/s]


Test Accuracy: 71.7948717948718%


Epoch [6/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.77it/s, loss=0.348]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 183.26it/s]


Test Accuracy: 72.43589743589743%


Epoch [7/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.36it/s, loss=0.349]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 175.70it/s]


Test Accuracy: 82.05128205128206%


Epoch [8/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.17it/s, loss=0.263]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 180.98it/s]


Test Accuracy: 75.0%


Epoch [9/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.95it/s, loss=0.233]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 178.48it/s]


Test Accuracy: 81.73076923076923%


Epoch [10/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.14it/s, loss=0.22]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 175.97it/s]


Test Accuracy: 76.92307692307692%


Epoch [11/60]: 100%|█████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.19it/s, loss=0.138]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 179.81it/s]


Test Accuracy: 83.33333333333333%


Epoch [12/60]: 100%|█████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.21it/s, loss=0.132]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 185.29it/s]


Test Accuracy: 78.84615384615384%


Epoch [13/60]: 100%|█████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.27it/s, loss=0.161]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 181.91it/s]


Test Accuracy: 83.33333333333333%


Epoch [14/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.18it/s, loss=0.0729]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 180.44it/s]


Test Accuracy: 78.2051282051282%


Epoch [15/60]: 100%|█████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.58it/s, loss=0.115]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 180.14it/s]


Test Accuracy: 80.44871794871794%


Epoch [16/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.42it/s, loss=0.0749]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 186.03it/s]


Test Accuracy: 81.73076923076923%


Epoch [17/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.13it/s, loss=0.0587]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 174.60it/s]


Test Accuracy: 77.24358974358974%


Epoch [18/60]: 100%|██████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.11it/s, loss=0.08]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 183.68it/s]


Test Accuracy: 81.73076923076923%


Epoch [19/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.31it/s, loss=0.0571]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 185.48it/s]


Test Accuracy: 75.64102564102564%


Epoch [20/60]: 100%|█████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.05it/s, loss=0.043]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 175.52it/s]


Test Accuracy: 83.01282051282051%


Epoch [21/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.31it/s, loss=0.0831]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 144.95it/s]


Test Accuracy: 72.11538461538461%


Epoch [22/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.21it/s, loss=0.0734]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 183.54it/s]


Test Accuracy: 66.98717948717949%


Epoch [23/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.25it/s, loss=0.0921]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 184.36it/s]


Test Accuracy: 81.41025641025641%


Epoch [24/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.97it/s, loss=0.0307]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 177.59it/s]


Test Accuracy: 83.33333333333333%


Epoch [25/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.09it/s, loss=0.0403]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 176.35it/s]


Test Accuracy: 83.65384615384616%


Epoch [26/60]: 100%|█████████████████████████████████████████████████████| 157/157 [00:06<00:00, 22.85it/s, loss=0.027]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 187.95it/s]


Test Accuracy: 81.73076923076923%


Epoch [27/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.31it/s, loss=0.0466]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 183.69it/s]


Test Accuracy: 78.2051282051282%


Epoch [28/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.37it/s, loss=0.0521]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 170.26it/s]


Test Accuracy: 80.44871794871794%


Epoch [29/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.33it/s, loss=0.0203]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 175.36it/s]


Test Accuracy: 83.65384615384616%


Epoch [30/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.20it/s, loss=0.0166]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 191.97it/s]


Test Accuracy: 77.24358974358974%


Epoch [31/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.17it/s, loss=0.0541]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 180.97it/s]


Test Accuracy: 79.16666666666667%


Epoch [32/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.48it/s, loss=0.0212]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 168.71it/s]


Test Accuracy: 79.16666666666667%


Epoch [33/60]: 100%|████████████████████████████████████████████████████| 157/157 [00:06<00:00, 23.25it/s, loss=0.0632]
100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 168.45it/s]


Test Accuracy: 80.12820512820512%


Epoch [34/60]:  52%|███████████████████████████▏                        | 82/157 [00:03<00:03, 22.93it/s, loss=0.00913]


KeyboardInterrupt: 

## 남녀 데이터 둘다

In [106]:
df = pd.concat([
    ravdess_df, 
    crema_df, 
    tess_df, 
    savee_df
], axis=0)
df.head()

Unnamed: 0,path,sex,emotion
0,ravdess-emotional-speech-audio/audio_speech_ac...,male,neutral
1,ravdess-emotional-speech-audio/audio_speech_ac...,male,neutral
2,ravdess-emotional-speech-audio/audio_speech_ac...,male,neutral
3,ravdess-emotional-speech-audio/audio_speech_ac...,male,neutral
4,ravdess-emotional-speech-audio/audio_speech_ac...,male,happy


In [107]:
zcr_list = []
rms_list = []
mfccs_list = []
emotion_list = []

FRAME_LENGTH = 2048
HOP_LENGTH = 512

for row in df.itertuples(index=False):
    try: 
        y, sr = preprocess_audio(row.path)
        zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
        zcr_list.append(zcr)
        rms_list.append(rms)
        mfccs_list.append(mfccs)

        emotion_list.append(encode(row.emotion))
    except:
        print(f"Failed for path: {row.path}")

Failed for path: ravdess-emotional-speech-audio/audio_speech_actors_01-24/Actor_20/03-01-06-01-01-02-20.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_a13.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_a14.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d01.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d04.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d08.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d09.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d10.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d13.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d14.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_d15.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_f11.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/DC_

Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_h15.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_n11.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_n14.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa04.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa05.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa10.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa11.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa12.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa13.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa14.wav
Failed for path: surrey-audiovisual-expressed-emotion-savee/ALL/KL_sa15.wav


In [108]:
X = np.concatenate((
    np.swapaxes(zcr_list, 1, 2), 
    np.swapaxes(rms_list, 1, 2), 
    np.swapaxes(mfccs_list, 1, 2)), 
    axis=2
)
X = X.astype('float32')

y = np.asarray(emotion_list)

In [109]:
dataset = EmotionDataset(X,y)
dataset_size = len(dataset)
train_size = int(dataset_size * 0.8)
validation_size = int(dataset_size * 0.1)
test_size = dataset_size - train_size - validation_size

train_dataset, validation_dataset, test_dataset = random_split(dataset, [train_size, validation_size, test_size])

100%|█████████████████████████████████████████████████████████████████████████████| 4211/4211 [00:05<00:00, 749.53it/s]


In [110]:
model = resnet18(pretrained=True)
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 

In [111]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

In [112]:
criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)

In [24]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_resnet_new_all_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:12<00:00, 16.69it/s, loss=1.46]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 177.73it/s]


Test Accuracy: 36.342592592592595%


Epoch [2/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.72it/s, loss=1.11]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 166.05it/s]


Test Accuracy: 56.71296296296296%


Epoch [3/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.88it/s, loss=0.967]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 178.52it/s]


Test Accuracy: 56.71296296296296%


Epoch [4/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.43it/s, loss=0.863]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 174.30it/s]


Test Accuracy: 62.5%


Epoch [5/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.68it/s, loss=0.754]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 172.41it/s]


Test Accuracy: 59.72222222222222%


Epoch [6/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.65it/s, loss=0.716]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 181.82it/s]


Test Accuracy: 63.425925925925924%


Epoch [7/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.77it/s, loss=0.645]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 167.38it/s]


Test Accuracy: 64.12037037037037%


Epoch [8/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.64it/s, loss=0.561]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 176.56it/s]


Test Accuracy: 64.35185185185185%


Epoch [9/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.86it/s, loss=0.481]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 174.68it/s]


Test Accuracy: 65.74074074074075%


Epoch [10/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.87it/s, loss=0.423]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 175.31it/s]


Test Accuracy: 60.416666666666664%


Epoch [11/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.64it/s, loss=0.354]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 177.89it/s]


Test Accuracy: 62.96296296296296%


Epoch [12/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.88it/s, loss=0.268]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 169.96it/s]


Test Accuracy: 65.50925925925925%


Epoch [13/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.75it/s, loss=0.24]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 165.96it/s]


Test Accuracy: 59.02777777777778%


Epoch [14/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.59it/s, loss=0.151]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 164.84it/s]


Test Accuracy: 67.12962962962963%


Epoch [15/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.32it/s, loss=0.137]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 164.11it/s]


Test Accuracy: 62.5%


Epoch [16/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.31it/s, loss=0.14]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 164.98it/s]


Test Accuracy: 63.657407407407405%


Epoch [17/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.75it/s, loss=0.0974]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 173.07it/s]


Test Accuracy: 65.27777777777777%


Epoch [18/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.77it/s, loss=0.0826]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 178.47it/s]


Test Accuracy: 67.12962962962963%


Epoch [19/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.47it/s, loss=0.056]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 166.91it/s]


Test Accuracy: 66.66666666666667%


Epoch [20/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.70it/s, loss=0.102]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 172.42it/s]


Test Accuracy: 63.19444444444444%


Epoch [21/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.86it/s, loss=0.0774]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 174.90it/s]


Test Accuracy: 67.12962962962963%


Epoch [22/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.58it/s, loss=0.045]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.92it/s]


Test Accuracy: 67.5925925925926%


Epoch [23/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.77it/s, loss=0.0468]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.58it/s]


Test Accuracy: 67.12962962962963%


Epoch [24/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.61it/s, loss=0.0736]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 156.19it/s]


Test Accuracy: 63.888888888888886%


Epoch [25/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.06it/s, loss=0.0671]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 169.56it/s]


Test Accuracy: 64.81481481481481%


Epoch [26/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.61it/s, loss=0.0722]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 169.94it/s]


Test Accuracy: 66.66666666666667%


Epoch [27/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.29it/s, loss=0.0794]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 167.63it/s]


Test Accuracy: 64.35185185185185%


Epoch [28/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.47it/s, loss=0.0785]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.12it/s]


Test Accuracy: 67.5925925925926%


Epoch [29/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.17it/s, loss=0.0296]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 167.65it/s]


Test Accuracy: 67.36111111111111%


Epoch [30/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.36it/s, loss=0.0212]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 152.43it/s]


Test Accuracy: 66.43518518518519%


Epoch [31/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.17it/s, loss=0.0182]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 166.58it/s]


Test Accuracy: 66.43518518518519%


Epoch [32/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.60it/s, loss=0.097]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 169.16it/s]


Test Accuracy: 67.12962962962963%


Epoch [33/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.27it/s, loss=0.0897]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 160.93it/s]


Test Accuracy: 65.04629629629629%


Epoch [34/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.27it/s, loss=0.0397]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 157.40it/s]


Test Accuracy: 67.12962962962963%


Epoch [35/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 20.98it/s, loss=0.0119]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 166.72it/s]


Test Accuracy: 66.89814814814815%


Epoch [36/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.12it/s, loss=0.0116]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 170.51it/s]


Test Accuracy: 67.12962962962963%


Epoch [37/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.24it/s, loss=0.0102]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 164.52it/s]


Test Accuracy: 65.74074074074075%


Epoch [38/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.36it/s, loss=0.0494]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 170.33it/s]


Test Accuracy: 62.96296296296296%


Epoch [39/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 20.74it/s, loss=0.0984]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 162.60it/s]


Test Accuracy: 66.66666666666667%


Epoch [40/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.64it/s, loss=0.0516]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 176.37it/s]


Test Accuracy: 65.97222222222223%


Epoch [41/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.67it/s, loss=0.0356]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 154.82it/s]


Test Accuracy: 65.74074074074075%


Epoch [42/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.48it/s, loss=0.0127]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 164.28it/s]


Test Accuracy: 67.12962962962963%


Epoch [43/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.44it/s, loss=0.0068]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.40it/s]


Test Accuracy: 65.97222222222223%


Epoch [44/60]: 100%|███████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.49it/s, loss=0.00699]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 172.22it/s]


Test Accuracy: 66.43518518518519%


Epoch [45/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.35it/s, loss=0.0965]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 167.27it/s]


Test Accuracy: 64.58333333333333%


Epoch [46/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.35it/s, loss=0.0536]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 165.50it/s]


Test Accuracy: 67.82407407407408%


Epoch [47/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.29it/s, loss=0.0728]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 166.94it/s]


Test Accuracy: 66.43518518518519%


Epoch [48/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.38it/s, loss=0.0421]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 170.48it/s]


Test Accuracy: 65.27777777777777%


Epoch [49/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.61it/s, loss=0.0401]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 168.46it/s]


Test Accuracy: 63.425925925925924%


Epoch [50/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.57it/s, loss=0.0471]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 167.52it/s]


Test Accuracy: 63.888888888888886%


Epoch [51/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.69it/s, loss=0.0157]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 169.46it/s]


Test Accuracy: 66.20370370370371%


Epoch [52/60]: 100%|███████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.72it/s, loss=0.00552]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 157.87it/s]


Test Accuracy: 70.13888888888889%


Epoch [53/60]: 100%|███████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.70it/s, loss=0.00405]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 169.70it/s]


Test Accuracy: 71.06481481481481%


Epoch [54/60]: 100%|███████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.83it/s, loss=0.00347]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 172.22it/s]


Test Accuracy: 67.5925925925926%


Epoch [55/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.36it/s, loss=0.0743]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 164.70it/s]


Test Accuracy: 63.657407407407405%


Epoch [56/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.51it/s, loss=0.039]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 168.31it/s]


Test Accuracy: 70.37037037037037%


Epoch [57/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.48it/s, loss=0.0348]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.57it/s]


Test Accuracy: 67.36111111111111%


Epoch [58/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.31it/s, loss=0.021]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.17it/s]


Test Accuracy: 66.43518518518519%


Epoch [59/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.53it/s, loss=0.0379]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 171.95it/s]


Test Accuracy: 64.58333333333333%


Epoch [60/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:10<00:00, 21.50it/s, loss=0.0314]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 167.70it/s]

Test Accuracy: 67.82407407407408%
Training finished!





100%|█████████████████████████████████████████████████████████████████████████████████| 78/78 [00:00<00:00, 123.31it/s]

Test Accuracy: 80.76923076923077%





80.76923076923077

## googlenet

In [25]:
model = googlenet(pretrained=True)
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 

In [26]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

In [27]:
criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)

In [28]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)                                                                          
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_googlenet_new_all_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.53it/s, loss=1.36]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.60it/s]


Test Accuracy: 19.675925925925927%


Epoch [2/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.51it/s, loss=1.05]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.06it/s]


Test Accuracy: 46.99074074074074%


Epoch [3/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.56it/s, loss=0.933]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.92it/s]


Test Accuracy: 59.49074074074074%


Epoch [4/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.65it/s, loss=0.831]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.00it/s]


Test Accuracy: 60.648148148148145%


Epoch [5/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.09it/s, loss=0.764]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.95it/s]


Test Accuracy: 56.94444444444444%


Epoch [6/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.85it/s, loss=0.683]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.79it/s]


Test Accuracy: 50.0%


Epoch [7/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.98it/s, loss=0.652]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.61it/s]


Test Accuracy: 64.12037037037037%


Epoch [8/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.89it/s, loss=0.559]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.96it/s]


Test Accuracy: 64.35185185185185%


Epoch [9/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.04it/s, loss=0.527]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.31it/s]


Test Accuracy: 62.26851851851852%


Epoch [10/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.99it/s, loss=0.477]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 81.22it/s]


Test Accuracy: 60.416666666666664%


Epoch [11/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.96it/s, loss=0.44]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.87it/s]


Test Accuracy: 65.04629629629629%


Epoch [12/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.99it/s, loss=0.335]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 75.45it/s]


Test Accuracy: 59.49074074074074%


Epoch [13/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.87it/s, loss=0.317]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.23it/s]


Test Accuracy: 60.648148148148145%


Epoch [14/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.93it/s, loss=0.282]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.13it/s]


Test Accuracy: 63.888888888888886%


Epoch [15/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.78it/s, loss=0.223]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.84it/s]


Test Accuracy: 62.96296296296296%


Epoch [16/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.00it/s, loss=0.239]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.55it/s]


Test Accuracy: 64.58333333333333%


Epoch [17/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.97it/s, loss=0.228]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.01it/s]


Test Accuracy: 64.35185185185185%


Epoch [18/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.04it/s, loss=0.176]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.34it/s]


Test Accuracy: 66.66666666666667%


Epoch [19/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.99it/s, loss=0.106]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.77it/s]


Test Accuracy: 66.89814814814815%


Epoch [20/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.90it/s, loss=0.163]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.91it/s]


Test Accuracy: 64.81481481481481%


Epoch [21/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.96it/s, loss=0.118]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 81.67it/s]


Test Accuracy: 67.5925925925926%


Epoch [22/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.06it/s, loss=0.136]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.55it/s]


Test Accuracy: 68.28703703703704%


Epoch [23/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.00it/s, loss=0.14]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.48it/s]


Test Accuracy: 68.05555555555556%


Epoch [24/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.86it/s, loss=0.116]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.64it/s]


Test Accuracy: 60.18518518518518%


Epoch [25/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.95it/s, loss=0.109]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 75.78it/s]


Test Accuracy: 65.97222222222223%


Epoch [26/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.96it/s, loss=0.113]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.75it/s]


Test Accuracy: 62.03703703703704%


Epoch [27/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.02it/s, loss=0.124]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.44it/s]


Test Accuracy: 66.89814814814815%


Epoch [28/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.03it/s, loss=0.0766]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.61it/s]


Test Accuracy: 70.83333333333333%


Epoch [29/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.93it/s, loss=0.0477]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.75it/s]


Test Accuracy: 65.97222222222223%


Epoch [30/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.97it/s, loss=0.104]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.78it/s]


Test Accuracy: 62.96296296296296%


Epoch [31/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.92it/s, loss=0.0829]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.38it/s]


Test Accuracy: 63.657407407407405%


Epoch [32/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.12it/s, loss=0.0984]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 81.21it/s]


Test Accuracy: 64.81481481481481%


Epoch [33/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.97it/s, loss=0.0781]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.21it/s]


Test Accuracy: 68.51851851851852%


Epoch [34/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.06it/s, loss=0.0865]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.61it/s]


Test Accuracy: 60.648148148148145%


Epoch [35/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.84it/s, loss=0.102]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.69it/s]


Test Accuracy: 67.12962962962963%


Epoch [36/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.70it/s, loss=0.0456]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.17it/s]


Test Accuracy: 66.89814814814815%


Epoch [37/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.07it/s, loss=0.0285]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.35it/s]


Test Accuracy: 68.98148148148148%


Epoch [38/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.98it/s, loss=0.0603]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.34it/s]


Test Accuracy: 62.73148148148148%


Epoch [39/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.04it/s, loss=0.107]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.42it/s]


Test Accuracy: 58.333333333333336%


Epoch [40/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.01it/s, loss=0.0851]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.67it/s]


Test Accuracy: 69.21296296296296%


Epoch [41/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.97it/s, loss=0.0669]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 76.90it/s]


Test Accuracy: 68.75%


Epoch [42/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.04it/s, loss=0.0389]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.96it/s]


Test Accuracy: 66.20370370370371%


Epoch [43/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.96it/s, loss=0.0585]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.97it/s]


Test Accuracy: 67.5925925925926%


Epoch [44/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.03it/s, loss=0.0627]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.45it/s]


Test Accuracy: 66.20370370370371%


Epoch [45/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.95it/s, loss=0.0467]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.20it/s]


Test Accuracy: 67.5925925925926%


Epoch [46/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.05it/s, loss=0.0868]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.95it/s]


Test Accuracy: 64.58333333333333%


Epoch [47/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.85it/s, loss=0.074]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.18it/s]


Test Accuracy: 65.74074074074075%


Epoch [48/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.93it/s, loss=0.0389]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.14it/s]


Test Accuracy: 68.98148148148148%


Epoch [49/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.97it/s, loss=0.0722]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.78it/s]


Test Accuracy: 70.83333333333333%


Epoch [50/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.83it/s, loss=0.051]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.87it/s]


Test Accuracy: 63.657407407407405%


Epoch [51/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.87it/s, loss=0.0311]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.12it/s]


Test Accuracy: 72.22222222222223%


Epoch [52/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.86it/s, loss=0.0248]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 77.98it/s]


Test Accuracy: 66.66666666666667%


Epoch [53/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.11it/s, loss=0.0867]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.73it/s]


Test Accuracy: 66.66666666666667%


Epoch [54/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.87it/s, loss=0.0872]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.34it/s]


Test Accuracy: 71.29629629629629%


Epoch [55/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 14.00it/s, loss=0.0554]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.46it/s]


Test Accuracy: 68.98148148148148%


Epoch [56/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.82it/s, loss=0.0581]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.98it/s]


Test Accuracy: 68.51851851851852%


Epoch [57/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.85it/s, loss=0.0296]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 74.38it/s]


Test Accuracy: 73.37962962962963%


Epoch [58/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.73it/s, loss=0.0221]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 79.70it/s]


Test Accuracy: 70.37037037037037%


Epoch [59/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.99it/s, loss=0.0398]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 81.58it/s]


Test Accuracy: 70.60185185185185%


Epoch [60/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:15<00:00, 13.99it/s, loss=0.0577]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.06it/s]

Test Accuracy: 66.89814814814815%
Training finished!





In [29]:
def preprocess_audio(path):
    _, sr = librosa.load(path)
    raw_audio = AudioSegment.from_file(path)
    
    samples = np.array(raw_audio.get_array_of_samples(), dtype='float32')
    trimmed, _ = librosa.effects.trim(samples, top_db=25)
    if (len(trimmed)>240000):
        padded = trimmed[:240000]
    else:
        padded = np.pad(trimmed, (0, 240000-len(trimmed)), 'constant')
    return padded, sr

In [30]:
zcr_list = []
rms_list = []
mfccs_list = []
emotion_list = []

FRAME_LENGTH = 2048
HOP_LENGTH = 512

for row in df.itertuples(index=False):
    try: 
        y, sr = preprocess_audio(row.path)
        zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
        zcr_list.append(zcr)
        rms_list.append(rms)
        mfccs_list.append(mfccs)

        emotion_list.append(encode(row.emotion))
    except:
        print(f"Failed for path: {row.path}")

In [31]:
X = np.concatenate((
    np.swapaxes(zcr_list, 1, 2), 
    np.swapaxes(rms_list, 1, 2), 
    np.swapaxes(mfccs_list, 1, 2)), 
    axis=2
)
X = X.astype('float32')

y = np.asarray(emotion_list)

In [32]:
dataset = EmotionDataset(X,y)
dataset_size = len(dataset)
train_size = int(dataset_size * 0.8)
validation_size = int(dataset_size * 0.1)
test_size = dataset_size - train_size - validation_size

train_dataset, validation_dataset, test_dataset = random_split(dataset, [train_size, validation_size, test_size])

100%|█████████████████████████████████████████████████████████████████████████████| 4331/4331 [00:06<00:00, 652.57it/s]


In [33]:
model = resnet18(pretrained=True)
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 

In [34]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

In [35]:
criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)

In [36]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)                                                                          
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_resnet_240000_all_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/60]: 100%|████████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.00it/s, loss=1.4]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 128.65it/s]


Test Accuracy: 28.47222222222222%


Epoch [2/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.58it/s, loss=1.06]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 135.45it/s]


Test Accuracy: 54.398148148148145%


Epoch [3/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.52it/s, loss=0.877]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 124.05it/s]


Test Accuracy: 46.75925925925926%


Epoch [4/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.76it/s, loss=0.802]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 117.92it/s]


Test Accuracy: 65.97222222222223%


Epoch [5/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.62it/s, loss=0.746]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 133.61it/s]


Test Accuracy: 60.648148148148145%


Epoch [6/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.62it/s, loss=0.643]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.04it/s]


Test Accuracy: 63.19444444444444%


Epoch [7/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.51it/s, loss=0.605]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 111.61it/s]


Test Accuracy: 61.342592592592595%


Epoch [8/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.92it/s, loss=0.526]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 134.71it/s]


Test Accuracy: 66.43518518518519%


Epoch [9/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.40it/s, loss=0.451]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 133.13it/s]


Test Accuracy: 62.96296296296296%


Epoch [10/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.68it/s, loss=0.329]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.33it/s]


Test Accuracy: 53.7037037037037%


Epoch [11/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.31it/s, loss=0.329]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 136.07it/s]


Test Accuracy: 60.648148148148145%


Epoch [12/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.33it/s, loss=0.218]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 118.90it/s]


Test Accuracy: 62.5%


Epoch [13/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.50it/s, loss=0.201]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 127.28it/s]


Test Accuracy: 66.43518518518519%


Epoch [14/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.59it/s, loss=0.165]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 136.19it/s]


Test Accuracy: 66.89814814814815%


Epoch [15/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.51it/s, loss=0.11]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 121.87it/s]


Test Accuracy: 68.51851851851852%


Epoch [16/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.70it/s, loss=0.101]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 113.92it/s]


Test Accuracy: 65.27777777777777%


Epoch [17/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.56it/s, loss=0.107]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 137.18it/s]


Test Accuracy: 67.12962962962963%


Epoch [18/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.49it/s, loss=0.108]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 126.57it/s]


Test Accuracy: 64.58333333333333%


Epoch [19/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 21.94it/s, loss=0.121]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 131.92it/s]


Test Accuracy: 61.111111111111114%


Epoch [20/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.42it/s, loss=0.0827]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.82it/s]


Test Accuracy: 65.04629629629629%


Epoch [21/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.64it/s, loss=0.0672]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.95it/s]


Test Accuracy: 67.12962962962963%


Epoch [22/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.57it/s, loss=0.0822]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 133.71it/s]


Test Accuracy: 66.66666666666667%


Epoch [23/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.44it/s, loss=0.0614]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.46it/s]


Test Accuracy: 67.12962962962963%


Epoch [24/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.48it/s, loss=0.0429]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 121.36it/s]


Test Accuracy: 70.37037037037037%


Epoch [25/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.48it/s, loss=0.0135]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 133.50it/s]


Test Accuracy: 66.43518518518519%


Epoch [26/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.35it/s, loss=0.0661]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 127.67it/s]


Test Accuracy: 66.89814814814815%


Epoch [27/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.60it/s, loss=0.0606]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.15it/s]


Test Accuracy: 68.28703703703704%


Epoch [28/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.43it/s, loss=0.0302]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 126.16it/s]


Test Accuracy: 71.75925925925925%


Epoch [29/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.41it/s, loss=0.0375]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.59it/s]


Test Accuracy: 68.28703703703704%


Epoch [30/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.45it/s, loss=0.0708]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 134.12it/s]


Test Accuracy: 67.82407407407408%


Epoch [31/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.47it/s, loss=0.0444]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.46it/s]


Test Accuracy: 69.44444444444444%


Epoch [32/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.63it/s, loss=0.0556]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 115.62it/s]


Test Accuracy: 62.73148148148148%


Epoch [33/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.59it/s, loss=0.116]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 133.26it/s]


Test Accuracy: 67.36111111111111%


Epoch [34/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.52it/s, loss=0.0363]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.72it/s]


Test Accuracy: 67.82407407407408%


Epoch [35/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.52it/s, loss=0.0266]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 128.63it/s]


Test Accuracy: 65.04629629629629%


Epoch [36/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.06it/s, loss=0.0419]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 115.63it/s]


Test Accuracy: 67.12962962962963%


Epoch [37/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.31it/s, loss=0.0365]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 120.81it/s]


Test Accuracy: 69.44444444444444%


Epoch [38/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.49it/s, loss=0.0575]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.09it/s]


Test Accuracy: 68.28703703703704%


Epoch [39/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.53it/s, loss=0.0344]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.97it/s]


Test Accuracy: 69.44444444444444%


Epoch [40/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.74it/s, loss=0.0438]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 127.68it/s]


Test Accuracy: 66.66666666666667%


Epoch [41/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.46it/s, loss=0.0492]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 136.90it/s]


Test Accuracy: 67.82407407407408%


Epoch [42/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.50it/s, loss=0.0696]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 127.14it/s]


Test Accuracy: 68.51851851851852%


Epoch [43/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.49it/s, loss=0.0202]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 137.57it/s]


Test Accuracy: 69.9074074074074%


Epoch [44/60]: 100%|███████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.48it/s, loss=0.00976]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.84it/s]


Test Accuracy: 71.75925925925925%


Epoch [45/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.70it/s, loss=0.0236]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.37it/s]


Test Accuracy: 66.89814814814815%


Epoch [46/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.57it/s, loss=0.03]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.07it/s]


Test Accuracy: 66.66666666666667%


Epoch [47/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.40it/s, loss=0.0286]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 126.39it/s]


Test Accuracy: 66.20370370370371%


Epoch [48/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.43it/s, loss=0.0429]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 134.49it/s]


Test Accuracy: 68.51851851851852%


Epoch [49/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.58it/s, loss=0.0362]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 130.01it/s]


Test Accuracy: 70.60185185185185%


Epoch [50/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.51it/s, loss=0.0181]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 123.05it/s]


Test Accuracy: 68.51851851851852%


Epoch [51/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.59it/s, loss=0.0187]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 130.70it/s]


Test Accuracy: 66.89814814814815%


Epoch [52/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.55it/s, loss=0.04]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 127.07it/s]


Test Accuracy: 67.5925925925926%


Epoch [53/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.49it/s, loss=0.0368]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 135.52it/s]


Test Accuracy: 69.21296296296296%


Epoch [54/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.51it/s, loss=0.0355]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.03it/s]


Test Accuracy: 68.75%


Epoch [55/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.65it/s, loss=0.026]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 128.07it/s]


Test Accuracy: 68.28703703703704%


Epoch [56/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.60it/s, loss=0.0261]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 133.53it/s]


Test Accuracy: 67.12962962962963%


Epoch [57/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.43it/s, loss=0.0208]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 129.20it/s]


Test Accuracy: 70.13888888888889%


Epoch [58/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.41it/s, loss=0.0173]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 135.58it/s]


Test Accuracy: 67.5925925925926%


Epoch [59/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.52it/s, loss=0.033]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 124.95it/s]


Test Accuracy: 67.82407407407408%


Epoch [60/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:09<00:00, 22.30it/s, loss=0.0388]
100%|███████████████████████████████████████████████████████████████████████████████| 108/108 [00:00<00:00, 125.80it/s]

Test Accuracy: 65.50925925925925%
Training finished!





In [37]:
model = googlenet(pretrained=True)
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 

In [38]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

In [39]:
criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)

In [40]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)                                                                          
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_googlenet_240000_all_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.12it/s, loss=1.35]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.02it/s]


Test Accuracy: 46.75925925925926%


Epoch [2/60]: 100%|███████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.98it/s, loss=1.06]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.32it/s]


Test Accuracy: 50.925925925925924%


Epoch [3/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.01it/s, loss=0.903]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.93it/s]


Test Accuracy: 43.75%


Epoch [4/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.14it/s, loss=0.814]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.96it/s]


Test Accuracy: 55.78703703703704%


Epoch [5/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.17it/s, loss=0.757]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.16it/s]


Test Accuracy: 65.27777777777777%


Epoch [6/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.10it/s, loss=0.667]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.97it/s]


Test Accuracy: 59.49074074074074%


Epoch [7/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.01it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.80it/s]


Test Accuracy: 64.12037037037037%


Epoch [8/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.03it/s, loss=0.573]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.88it/s]


Test Accuracy: 64.58333333333333%


Epoch [9/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.14it/s, loss=0.497]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.10it/s]


Test Accuracy: 53.7037037037037%


Epoch [10/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.00it/s, loss=0.504]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.16it/s]


Test Accuracy: 58.7962962962963%


Epoch [11/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.96it/s, loss=0.401]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.83it/s]


Test Accuracy: 65.97222222222223%


Epoch [12/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.357]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.32it/s]


Test Accuracy: 52.77777777777778%


Epoch [13/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.11it/s, loss=0.34]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.37it/s]


Test Accuracy: 40.27777777777778%


Epoch [14/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.294]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.43it/s]


Test Accuracy: 61.342592592592595%


Epoch [15/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.12it/s, loss=0.232]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.45it/s]


Test Accuracy: 60.648148148148145%


Epoch [16/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.245]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.50it/s]


Test Accuracy: 60.416666666666664%


Epoch [17/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.95it/s, loss=0.197]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 52.83it/s]


Test Accuracy: 65.74074074074075%


Epoch [18/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.09it/s, loss=0.184]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.57it/s]


Test Accuracy: 60.879629629629626%


Epoch [19/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.93it/s, loss=0.207]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.97it/s]


Test Accuracy: 63.19444444444444%


Epoch [20/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:20<00:00, 10.68it/s, loss=0.128]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 52.93it/s]


Test Accuracy: 65.74074074074075%


Epoch [21/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.0927]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.10it/s]


Test Accuracy: 62.5%


Epoch [22/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.13it/s, loss=0.111]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.27it/s]


Test Accuracy: 51.388888888888886%


Epoch [23/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.04it/s, loss=0.17]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.93it/s]


Test Accuracy: 63.19444444444444%


Epoch [24/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.14it/s, loss=0.103]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.33it/s]


Test Accuracy: 65.97222222222223%


Epoch [25/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.18it/s, loss=0.0973]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.52it/s]


Test Accuracy: 54.398148148148145%


Epoch [26/60]: 100%|██████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.10it/s, loss=0.13]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.68it/s]


Test Accuracy: 65.27777777777777%


Epoch [27/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.10it/s, loss=0.101]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.29it/s]


Test Accuracy: 52.77777777777778%


Epoch [28/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.81it/s, loss=0.132]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.88it/s]


Test Accuracy: 63.657407407407405%


Epoch [29/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.06it/s, loss=0.0743]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 58.63it/s]


Test Accuracy: 63.425925925925924%


Epoch [30/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.09it/s, loss=0.0772]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.01it/s]


Test Accuracy: 67.36111111111111%


Epoch [31/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.02it/s, loss=0.0844]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.97it/s]


Test Accuracy: 59.25925925925926%


Epoch [32/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.12it/s, loss=0.149]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.26it/s]


Test Accuracy: 63.888888888888886%


Epoch [33/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.01it/s, loss=0.0905]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.73it/s]


Test Accuracy: 63.425925925925924%


Epoch [34/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.07it/s, loss=0.0741]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.08it/s]


Test Accuracy: 64.12037037037037%


Epoch [35/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.11it/s, loss=0.0517]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.09it/s]


Test Accuracy: 64.81481481481481%


Epoch [36/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.97it/s, loss=0.0602]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.77it/s]


Test Accuracy: 66.89814814814815%


Epoch [37/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.94it/s, loss=0.0611]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.22it/s]


Test Accuracy: 67.36111111111111%


Epoch [38/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.09it/s, loss=0.0546]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.14it/s]


Test Accuracy: 66.89814814814815%


Epoch [39/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.04it/s, loss=0.0382]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.07it/s]


Test Accuracy: 64.12037037037037%


Epoch [40/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.07it/s, loss=0.0581]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.88it/s]


Test Accuracy: 62.73148148148148%


Epoch [41/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.07it/s, loss=0.0923]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.72it/s]


Test Accuracy: 63.19444444444444%


Epoch [42/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.04it/s, loss=0.148]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.91it/s]


Test Accuracy: 64.12037037037037%


Epoch [43/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.02it/s, loss=0.0641]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.54it/s]


Test Accuracy: 68.51851851851852%


Epoch [44/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.93it/s, loss=0.0387]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 50.77it/s]


Test Accuracy: 68.75%


Epoch [45/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.82it/s, loss=0.0266]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.34it/s]


Test Accuracy: 67.12962962962963%


Epoch [46/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.01it/s, loss=0.0264]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.62it/s]


Test Accuracy: 68.28703703703704%


Epoch [47/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.12it/s, loss=0.0564]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.05it/s]


Test Accuracy: 67.36111111111111%


Epoch [48/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.09it/s, loss=0.0759]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.90it/s]


Test Accuracy: 63.425925925925924%


Epoch [49/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.06it/s, loss=0.0934]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.54it/s]


Test Accuracy: 63.19444444444444%


Epoch [50/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.0775]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.96it/s]


Test Accuracy: 63.19444444444444%


Epoch [51/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.00it/s, loss=0.0382]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.42it/s]


Test Accuracy: 68.28703703703704%


Epoch [52/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.13it/s, loss=0.0432]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.26it/s]


Test Accuracy: 60.879629629629626%


Epoch [53/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.037]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 54.83it/s]


Test Accuracy: 66.43518518518519%


Epoch [54/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.97it/s, loss=0.0579]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.39it/s]


Test Accuracy: 64.12037037037037%


Epoch [55/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.09it/s, loss=0.0617]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.03it/s]


Test Accuracy: 66.89814814814815%


Epoch [56/60]: 100%|█████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.09it/s, loss=0.057]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 57.65it/s]


Test Accuracy: 64.12037037037037%


Epoch [57/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.08it/s, loss=0.0369]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 56.24it/s]


Test Accuracy: 67.36111111111111%


Epoch [58/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.96it/s, loss=0.0224]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 55.18it/s]


Test Accuracy: 66.43518518518519%


Epoch [59/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 10.97it/s, loss=0.0186]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.82it/s]


Test Accuracy: 65.50925925925925%


Epoch [60/60]: 100%|████████████████████████████████████████████████████| 216/216 [00:19<00:00, 11.15it/s, loss=0.0384]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:02<00:00, 53.71it/s]

Test Accuracy: 59.49074074074074%
Training finished!





In [45]:
df = pd.read_csv("datasets/emotion_test.csv")

In [46]:
df = df[["wav_id","상황"]]

In [58]:
from tqdm import tqdm

In [59]:
df.iloc[0][0]

'5f7940c59e04b149046cc19a'

In [None]:
emotion_dic = {
    'neutral' : 0,
    'happy'   : 1,
    'sad'     : 2, 
    'angry'   : 3, 
    'fear'    : 4, 
    'disgust' : 5
}

In [90]:
emotion_dic = {'anger': 3, 'angry': 3, 'disgust': 5, 'fear': 4, 'happy': 1, 'happiness': 1,
                               'neutral': 0, 'sad': 2, 'sadness': 2, 'surprise': 6}

def encode(label):
    return emotion_dic.get(label)

In [91]:
import librosa
from pydub import AudioSegment, effects

In [92]:
def preprocess_audio(path):
    _, sr = librosa.load(path)
    raw_audio = AudioSegment.from_file(path)
    effects.normalize(raw_audio)
    
    samples = np.array(raw_audio.get_array_of_samples(), dtype='float32')
    trimmed, _ = librosa.effects.trim(samples, top_db=25)
    if (len(trimmed)>180000):
        padded = trimmed[:180000]
    else:
        padded = np.pad(trimmed, (0, 180000-len(trimmed)), 'constant')
    return padded, sr

In [93]:
zcr_list = []
rms_list = []
mfccs_list = []
emotion_list = []

FRAME_LENGTH = 2048
HOP_LENGTH = 512

for row in df.itertuples(index=False):
    try: 
        y, sr = preprocess_audio(row.path)
        zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
        zcr_list.append(zcr)
        rms_list.append(rms)
        mfccs_list.append(mfccs)

        emotion_list.append(encode(row.emotion))
    except:
        print(f"Failed for path: {row.path}")

In [77]:
zcr_list = []
rms_list = []
mfccs_list = []
emotion_list = []

FRAME_LENGTH = 2048
HOP_LENGTH = 512

for i in tqdm(range(len(df))):
    try:
        if (encode(df.iloc[i][1])==6): continue
        y, sr = preprocess_audio("datasets/emotion_audio_data/"+df.iloc[i][0]+".wav")
        zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
        mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
        zcr_list.append(zcr)
        rms_list.append(rms)
        mfccs_list.append(mfccs)

        emotion_list.append(encode(df.iloc[i][1]))
    except:
        print(f"Failed for path: datasets/emotion_audio_data/{df.iloc[i][0]}.wav")

100%|██████████████████████████████████████████████████████████████████████████████| 8793/8793 [17:30<00:00,  8.37it/s]


In [94]:
X = np.concatenate((
    np.swapaxes(zcr_list, 1, 2), 
    np.swapaxes(rms_list, 1, 2), 
    np.swapaxes(mfccs_list, 1, 2)), 
    axis=2
)
X = X.astype('float32')

y = np.asarray(emotion_list)

In [26]:
tmpX = X.copy()
tmpy = y.copy()

In [27]:
class EmotionDataset(Dataset):
    def __init__(self, images, labels):
        self.images = []
        self.emotions = torch.Tensor(labels).to(torch.int64)
        transform = transforms.Compose([
            transforms.Resize((224,224)),
            transforms.ToTensor(),
            transforms.Normalize([0.485, 0.456, 0.406],[0.229, 0.224, 0.225])
        ])

        for i in tqdm(range(len(images))):
            
            # MFCC를 이미지로 변환하여 크기를 조정합니다.
            image = Image.fromarray(images[i],"RGB")
            image = transform(image)
            self.images.append(image)
            
        self.len = len(images)

    def __len__(self):
        return self.len

    def __getitem__(self, idx):
        image = self.images[idx]
        label = self.emotions[idx]
        return image, label

In [37]:
model = resnet50(pretrained=True)
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 

In [38]:
criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)

In [30]:
dataset = EmotionDataset(X,y)
dataset_size = len(dataset)
train_size = int(dataset_size * 0.8)
validation_size = int(dataset_size * 0.1)
test_size = dataset_size - train_size - validation_size

train_dataset, validation_dataset, test_dataset = random_split(dataset, [train_size, validation_size, test_size])

100%|█████████████████████████████████████████████████████████████████████████████| 4331/4331 [00:04<00:00, 870.71it/s]


In [31]:
dataloader = DataLoader(train_dataset, batch_size=16, shuffle=True, drop_last=True)
validation_loader = DataLoader(validation_dataset, batch_size=4, shuffle=True, drop_last=True)
test_loader = DataLoader(test_dataset, batch_size=4, shuffle=True, drop_last=True)

In [55]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

In [40]:
num_epochs = 100

In [95]:
dataset = EmotionDataset(X,y)
test_loader = DataLoader(dataset, batch_size=4, shuffle=True, drop_last=True)

100%|█████████████████████████████████████████████████████████████████████████████| 4331/4331 [00:07<00:00, 607.47it/s]


In [41]:
def test(model, test_loader):
    model.eval()
    correct = 0
    total = 0

    with torch.no_grad():
        for images, labels in tqdm(test_loader):
            images = images.to(device)
            labels = labels.to(device)

            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

    accuracy = 100 * correct / total
    print(f'Test Accuracy: {accuracy}%')
    return accuracy

In [96]:
test(model,test_loader)

100%|██████████████████████████████████████████████████████████████████████████████| 1082/1082 [00:23<00:00, 45.16it/s]

Test Accuracy: 94.29297597042513%





94.29297597042513

In [80]:
test(model,test_loader)

100%|██████████████████████████████████████████████████████████████████████████████| 2106/2106 [00:48<00:00, 43.24it/s]

Test Accuracy: 21.616809116809115%





21.616809116809115

In [42]:
for epoch in range(num_epochs):
    running_loss = 0.0
    loop = tqdm(dataloader, total=len(dataloader), leave=True)
    model.train()
    
    for images, labels in loop:
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)                                                                          
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loop.set_description(f'Epoch [{epoch+1}/{num_epochs}]')
        loop.set_postfix(loss=running_loss / (len(dataloader)))
    test(model,test_loader)
    torch.save(model.state_dict(), "result/model_resnet50_final_{}.pth".format(epoch))
    
print('Training finished!')

Epoch [1/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:24<00:00,  8.99it/s, loss=1.59]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.83it/s]


Test Accuracy: 37.73148148148148%


Epoch [2/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.05it/s, loss=1.34]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.97it/s]


Test Accuracy: 24.76851851851852%


Epoch [3/100]: 100%|██████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.13it/s, loss=1.12]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.75it/s]


Test Accuracy: 57.638888888888886%


Epoch [4/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.21it/s, loss=0.999]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.05it/s]


Test Accuracy: 57.175925925925924%


Epoch [5/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.18it/s, loss=0.887]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.04it/s]


Test Accuracy: 57.638888888888886%


Epoch [6/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.14it/s, loss=0.823]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.29it/s]


Test Accuracy: 63.19444444444444%


Epoch [7/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.753]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.73it/s]


Test Accuracy: 65.74074074074075%


Epoch [8/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.21it/s, loss=0.688]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.14it/s]


Test Accuracy: 47.68518518518518%


Epoch [9/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.08it/s, loss=0.682]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.49it/s]


Test Accuracy: 59.25925925925926%


Epoch [10/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.20it/s, loss=0.604]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.94it/s]


Test Accuracy: 63.888888888888886%


Epoch [11/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.28it/s, loss=0.572]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.69it/s]


Test Accuracy: 61.574074074074076%


Epoch [12/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.08it/s, loss=0.465]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.36it/s]


Test Accuracy: 64.35185185185185%


Epoch [13/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.12it/s, loss=0.431]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 78.64it/s]


Test Accuracy: 60.648148148148145%


Epoch [14/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.10it/s, loss=0.367]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.15it/s]


Test Accuracy: 64.12037037037037%


Epoch [15/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.21it/s, loss=0.274]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.59it/s]


Test Accuracy: 65.74074074074075%


Epoch [16/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.25it/s, loss=0.247]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.43it/s]


Test Accuracy: 62.96296296296296%


Epoch [17/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.204]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 83.38it/s]


Test Accuracy: 61.111111111111114%


Epoch [18/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.31it/s, loss=0.177]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.50it/s]


Test Accuracy: 67.12962962962963%


Epoch [19/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.28it/s, loss=0.177]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.94it/s]


Test Accuracy: 59.72222222222222%


Epoch [20/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.33it/s, loss=0.107]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 82.36it/s]


Test Accuracy: 63.657407407407405%


Epoch [21/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.54it/s, loss=0.115]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.05it/s]


Test Accuracy: 62.73148148148148%


Epoch [22/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.60it/s, loss=0.0926]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.29it/s]


Test Accuracy: 62.5%


Epoch [23/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.58it/s, loss=0.126]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 89.02it/s]


Test Accuracy: 67.5925925925926%


Epoch [24/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.59it/s, loss=0.0853]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 89.09it/s]


Test Accuracy: 59.9537037037037%


Epoch [25/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.59it/s, loss=0.0949]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.58it/s]


Test Accuracy: 66.43518518518519%


Epoch [26/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.60it/s, loss=0.109]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 91.50it/s]


Test Accuracy: 61.574074074074076%


Epoch [27/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.59it/s, loss=0.0645]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.43it/s]


Test Accuracy: 65.74074074074075%


Epoch [28/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.53it/s, loss=0.0623]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.78it/s]


Test Accuracy: 66.43518518518519%


Epoch [29/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.56it/s, loss=0.0527]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.99it/s]


Test Accuracy: 66.20370370370371%


Epoch [30/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.58it/s, loss=0.0344]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.64it/s]


Test Accuracy: 67.82407407407408%


Epoch [31/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.49it/s, loss=0.151]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.36it/s]


Test Accuracy: 64.81481481481481%


Epoch [32/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.49it/s, loss=0.0281]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.51it/s]


Test Accuracy: 64.58333333333333%


Epoch [33/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.17it/s, loss=0.0148]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 89.24it/s]


Test Accuracy: 68.51851851851852%


Epoch [34/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.41it/s, loss=0.0138]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 89.02it/s]


Test Accuracy: 65.50925925925925%


Epoch [35/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.37it/s, loss=0.0595]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 83.38it/s]


Test Accuracy: 68.28703703703704%


Epoch [36/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.59it/s, loss=0.125]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.74it/s]


Test Accuracy: 64.35185185185185%


Epoch [37/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:20<00:00, 10.57it/s, loss=0.0687]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 95.64it/s]


Test Accuracy: 68.75%


Epoch [38/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.71it/s, loss=0.0522]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.97it/s]


Test Accuracy: 66.20370370370371%


Epoch [39/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.73it/s, loss=0.0485]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.88it/s]


Test Accuracy: 62.5%


Epoch [40/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.76it/s, loss=0.0408]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 95.30it/s]


Test Accuracy: 67.36111111111111%


Epoch [41/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.45it/s, loss=0.0241]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.04it/s]


Test Accuracy: 66.66666666666667%


Epoch [42/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.20it/s, loss=0.0491]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.54it/s]


Test Accuracy: 64.35185185185185%


Epoch [43/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.0646]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.58it/s]


Test Accuracy: 66.20370370370371%


Epoch [44/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.16it/s, loss=0.0281]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.63it/s]


Test Accuracy: 64.35185185185185%


Epoch [45/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.27it/s, loss=0.0251]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 82.74it/s]


Test Accuracy: 62.73148148148148%


Epoch [46/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.31it/s, loss=0.0956]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.08it/s]


Test Accuracy: 61.574074074074076%


Epoch [47/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.28it/s, loss=0.0626]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.76it/s]


Test Accuracy: 58.7962962962963%


Epoch [48/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.29it/s, loss=0.039]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 89.53it/s]


Test Accuracy: 69.21296296296296%


Epoch [49/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.37it/s, loss=0.0367]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.86it/s]


Test Accuracy: 68.28703703703704%


Epoch [50/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.29it/s, loss=0.019]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.90it/s]


Test Accuracy: 69.21296296296296%


Epoch [51/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.27it/s, loss=0.0232]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.07it/s]


Test Accuracy: 65.50925925925925%


Epoch [52/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.0332]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.15it/s]


Test Accuracy: 67.12962962962963%


Epoch [53/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.21it/s, loss=0.0332]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.50it/s]


Test Accuracy: 66.89814814814815%


Epoch [54/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.0276]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.50it/s]


Test Accuracy: 65.74074074074075%


Epoch [55/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.21it/s, loss=0.0918]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.42it/s]


Test Accuracy: 61.574074074074076%


Epoch [56/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.0426]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.38it/s]


Test Accuracy: 67.82407407407408%


Epoch [57/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.25it/s, loss=0.0172]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.36it/s]


Test Accuracy: 68.51851851851852%


Epoch [58/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.25it/s, loss=0.00577]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.82it/s]


Test Accuracy: 64.58333333333333%


Epoch [59/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.00138]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.29it/s]


Test Accuracy: 67.12962962962963%


Epoch [60/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.27it/s, loss=0.000826]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.56it/s]


Test Accuracy: 68.75%


Epoch [61/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.20it/s, loss=0.00044]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 83.96it/s]


Test Accuracy: 68.51851851851852%


Epoch [62/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.000603]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.38it/s]


Test Accuracy: 65.74074074074075%


Epoch [63/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.000265]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.87it/s]


Test Accuracy: 66.20370370370371%


Epoch [64/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.24it/s, loss=0.000124]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.87it/s]


Test Accuracy: 67.12962962962963%


Epoch [65/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.20it/s, loss=0.000363]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.22it/s]


Test Accuracy: 69.44444444444444%


Epoch [66/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.0181]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.17it/s]


Test Accuracy: 59.72222222222222%


Epoch [67/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.306]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.93it/s]


Test Accuracy: 64.35185185185185%


Epoch [68/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.0331]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.80it/s]


Test Accuracy: 65.97222222222223%


Epoch [69/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.25it/s, loss=0.00734]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.22it/s]


Test Accuracy: 65.97222222222223%


Epoch [70/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.00505]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.97it/s]


Test Accuracy: 68.28703703703704%


Epoch [71/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.000976]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.82it/s]


Test Accuracy: 67.82407407407408%


Epoch [72/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.24it/s, loss=0.000811]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.94it/s]


Test Accuracy: 67.12962962962963%


Epoch [73/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.20it/s, loss=0.000518]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.36it/s]


Test Accuracy: 67.12962962962963%


Epoch [74/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.27it/s, loss=0.000279]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 83.51it/s]


Test Accuracy: 67.5925925925926%


Epoch [75/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.000206]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.62it/s]


Test Accuracy: 67.5925925925926%


Epoch [76/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.000271]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 84.49it/s]


Test Accuracy: 66.89814814814815%


Epoch [77/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.0003]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.57it/s]


Test Accuracy: 67.5925925925926%


Epoch [78/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.24it/s, loss=0.000236]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.14it/s]


Test Accuracy: 68.28703703703704%


Epoch [79/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.000182]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.94it/s]


Test Accuracy: 68.98148148148148%


Epoch [80/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.23it/s, loss=0.000111]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.80it/s]


Test Accuracy: 67.36111111111111%


Epoch [81/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.000139]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.43it/s]


Test Accuracy: 68.75%


Epoch [82/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.27it/s, loss=0.00012]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.87it/s]


Test Accuracy: 67.5925925925926%


Epoch [83/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.25it/s, loss=0.31]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.93it/s]


Test Accuracy: 66.20370370370371%


Epoch [84/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.105]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 83.44it/s]


Test Accuracy: 67.5925925925926%


Epoch [85/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.07it/s, loss=0.0309]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.59it/s]


Test Accuracy: 66.66666666666667%


Epoch [86/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.12it/s, loss=0.00659]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 76.15it/s]


Test Accuracy: 70.13888888888889%


Epoch [87/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.43it/s, loss=0.00786]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.87it/s]


Test Accuracy: 68.98148148148148%


Epoch [88/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.49it/s, loss=0.0105]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 88.36it/s]


Test Accuracy: 68.28703703703704%


Epoch [89/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.24it/s, loss=0.0116]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.42it/s]


Test Accuracy: 68.51851851851852%


Epoch [90/100]: 100%|█████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.19it/s, loss=0.05]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.22it/s]


Test Accuracy: 68.51851851851852%


Epoch [91/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.25it/s, loss=0.0437]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.86it/s]


Test Accuracy: 66.43518518518519%


Epoch [92/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.34it/s, loss=0.0114]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 80.34it/s]


Test Accuracy: 67.36111111111111%


Epoch [93/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.22it/s, loss=0.00243]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 85.56it/s]


Test Accuracy: 66.43518518518519%


Epoch [94/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.43it/s, loss=0.0138]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 87.01it/s]


Test Accuracy: 67.82407407407408%


Epoch [95/100]: 100%|████████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.34it/s, loss=0.021]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 89.09it/s]


Test Accuracy: 67.5925925925926%


Epoch [96/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.42it/s, loss=0.0664]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.13it/s]


Test Accuracy: 67.36111111111111%


Epoch [97/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:22<00:00,  9.48it/s, loss=0.0246]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.87it/s]


Test Accuracy: 67.12962962962963%


Epoch [98/100]: 100%|███████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.21it/s, loss=0.0121]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.66it/s]


Test Accuracy: 67.12962962962963%


Epoch [99/100]: 100%|██████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.26it/s, loss=0.00769]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 90.81it/s]


Test Accuracy: 66.20370370370371%


Epoch [100/100]: 100%|█████████████████████████████████████████████████| 216/216 [00:23<00:00,  9.10it/s, loss=0.00271]
100%|████████████████████████████████████████████████████████████████████████████████| 108/108 [00:01<00:00, 86.04it/s]


Test Accuracy: 68.05555555555556%
Training finished!


In [57]:
state = torch.load("result/model_resnet50_final_85.pth")

In [58]:
model = resnet50()
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 
model.load_state_dict(state)

<All keys matched successfully>

In [59]:
model = model.to(device)

In [60]:
test(model,test_loader)

100%|██████████████████████████████████████████████████████████████████████████████| 2106/2106 [00:30<00:00, 68.51it/s]

Test Accuracy: 19.931149097815766%





19.931149097815766

In [71]:
from keras.models import Sequential
from keras import layers, optimizers, callbacks
import keras

In [72]:
MODEL = Sequential()
MODEL.add(layers.LSTM(256, return_sequences=True, input_shape=(X.shape[1:3])))
MODEL.add(layers.LSTM(256))
MODEL.add(layers.Dense(6, activation='softmax'))

print(MODEL.summary())

NotImplementedError: Cannot convert a symbolic Tensor (lstm_3/strided_slice:0) to a numpy array. This error may indicate that you're trying to pass a Tensor to a NumPy call, which is not supported

In [76]:
model = keras.models.load_model('.mdl_wts_256.hdf5')

NotImplementedError: Cannot convert a symbolic Tensor (lstm_6/strided_slice:0) to a numpy array. This error may indicate that you're trying to pass a Tensor to a NumPy call, which is not supported

## Test

In [8]:
import speech_recognition as speech

In [9]:
r = speech.Recognizer()
with speech.Microphone() as source:
    audio = r.listen(source)
    with open("input.wav","wb") as f:
        f.write(audio.get_wav_data())

In [55]:
emotion_decode = {
    0 : 'neutral',
    1 : 'happy',
    2 : 'sad', 
    3 : 'angry', 
    4 : 'fear', 
    5 : 'disgust'
}

In [10]:
import librosa
from pydub import AudioSegment, effects

In [25]:
def preprocess_audio(path):
    _, sr = librosa.load(path)
    raw_audio = AudioSegment.from_file(path)
    
    samples = np.array(raw_audio.get_array_of_samples(), dtype='float32')
    trimmed, _ = librosa.effects.trim(samples, top_db=25)
    if (len(trimmed)>180000):
        padded = trimmed[:180000]
    else:
        padded = np.pad(trimmed, (0, 180000-len(trimmed)), 'constant')
    return padded, sr

In [12]:
input_wav = "input.wav"

FRAME_LENGTH = 2048
HOP_LENGTH = 512

try: 
    y, sr = preprocess_audio(input_wav)
    zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
    rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
    mfcc = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
except:
    print(f"Failed for path: {input_wav}")
    
X = np.concatenate((
    np.swapaxes(zcr, 0, 1), 
    np.swapaxes(rms, 0, 1), 
    np.swapaxes(mfcc, 0, 1)), 
    axis=1
)
X = X.astype('float32')

Failed for path: input.wav


In [3]:
input_wav = "input.wav"

FRAME_LENGTH = 2048
HOP_LENGTH = 512

try: 
    y, sr = preprocess_audio(input_wav)
    zcr = librosa.feature.zero_crossing_rate(y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
    rms = librosa.feature.rms(y=y, frame_length=FRAME_LENGTH, hop_length=HOP_LENGTH)
    mfcc = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13, hop_length=HOP_LENGTH)
except:
    print(f"Failed for path: {input_wav}")
    
X = np.concatenate((
    np.swapaxes(zcr, 0, 1), 
    np.swapaxes(rms, 0, 1), 
    np.swapaxes(mfcc, 0, 1)), 
    axis=1
)
X = X.astype('float32')

In [4]:
from emotion_model import emotion_predict

In [5]:
result = emotion_predict(X)

In [6]:
print(result)

neutral


In [57]:
transform = transforms.Compose([
    transforms.Resize((224,224)),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406],[0.229, 0.224, 0.225])
])

image = Image.fromarray(X,"RGB")
image = transform(image)
image = image.unsqueeze(dim=0)

In [49]:
state = torch.load("test/result/model_resnet_new_all_55.pth")

In [50]:
model = resnet18()
num_features = model.fc.in_features
num_classes = 6
model.fc = nn.Linear(num_features, num_classes) 
model.load_state_dict(state)

<All keys matched successfully>

In [58]:
model.eval()
result = model.forward(image)

In [59]:
emotion_decode[torch.argmax(result.squeeze()).item()]

'neutral'

In [61]:
import nemo.collections.asr as nemo_asr
asr_net = nemo_asr.models.ASRModel.from_pretrained("eesungkim/stt_kr_conformer_transducer_large")

[NeMo W 2023-06-13 00:33:58 optimizers:54] Apex was not found. Using the lamb or fused_adam optimizer will error out.
[NeMo W 2023-06-13 00:33:59 experimental:27] Module <class 'nemo.collections.asr.modules.audio_modules.SpectrogramToMultichannelFeatures'> is experimental, not ready for production and is not fully supported. Use at your own risk.


[NeMo I 2023-06-13 00:34:01 mixins:170] Tokenizer SentencePieceTokenizer initialized with 2261 tokens


[NeMo W 2023-06-13 00:34:02 modelPT:161] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/public/rw/chris/manifests/ksponspeech//train.json
    sample_rate: 16000
    batch_size: 8
    shuffle: true
    num_workers: 8
    pin_memory: true
    use_start_end_token: true
    trim_silence: false
    max_duration: 17
    min_duration: 0.1
    shuffle_n: 2048
    
[NeMo W 2023-06-13 00:34:02 modelPT:168] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath: /data/public/rw/chris/manifests/ksponspeech//dev.json
    sample_rate: 16000
    batch_size: 16
    shuffle: false
    num_workers: 8
    pin_memory: true
    use_start_e

[NeMo I 2023-06-13 00:34:02 features:287] PADDING: 0
[NeMo I 2023-06-13 00:34:03 rnnt_models:206] Using RNNT Loss : warprnnt_numba
    Loss warprnnt_numba_kwargs: {'fastemit_lambda': 0.0, 'clamp': 5}
[NeMo I 2023-06-13 00:34:03 audio_preprocessing:517] Numba CUDA SpecAugment kernel is being used
[NeMo I 2023-06-13 00:34:04 save_restore_connector:249] Model EncDecRNNTBPEModel was successfully restored from C:\Users\good\.cache\huggingface\hub\models--eesungkim--stt_kr_conformer_transducer_large\snapshots\fdc8412fe0d089913524767b20ff244ff1007ed0\stt_kr_conformer_transducer_large.nemo.


In [63]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
asr_net = asr_net.to(device)

In [64]:
asr_net.transcribe(['input.wav'])

(['이엇 허'], ['이엇 허'])