# 最終課題

In [None]:
# This is the main file (240713)

In [4]:
!pip install wandb
!pip install omegaconf
!pip install termcolor
!pip install einops
!pip install git+https://github.com/openai/CLIP.git

Defaulting to user installation because normal site-packages is not writeable
Defaulting to user installation because normal site-packages is not writeable
Defaulting to user installation because normal site-packages is not writeable
Defaulting to user installation because normal site-packages is not writeable


In [1]:
import os
import numpy as np
import torch
from typing import Tuple
from termcolor import cprint
import sys
import torch.nn.functional as F
#from torchmetrics import Accuracy
#import hydra
from omegaconf import DictConfig
import wandb
from tqdm import tqdm

#filter
import scipy.signal
from sklearn.preprocessing import MinMaxScaler


import random

import pandas as pd
from PIL import Image
from sklearn.model_selection import train_test_split

import math

import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from einops.layers.torch import Rearrange
from einops import rearrange

import clip

from torchmetrics import Accuracy


#from src.datasets import ThingsMEGDataset
#from src.utils import set_seed

In [2]:

class ThingsMEGDataset(torch.utils.data.Dataset):
    def __init__(self, split: str, filtering: bool = True, data_dir: str = "data") -> None:
        super().__init__()

        assert split in ["train", "val", "test"], f"Invalid split: {split}"
        self.split = split
        self.filtering = filtering
        self.num_classes = 1854

        self.X = torch.load(os.path.join(data_dir, f"{split}_X.pt"))[:,:,:-1]
        if filtering:
            for ii in tqdm(range(len(self.X))):
                self.X[ii] = self.filter(self.X[ii])

        self.subject_idxs = torch.load(os.path.join(data_dir, f"{split}_subject_idxs.pt"))

        if split in ["train", "val"]:
            self.y = torch.load(os.path.join(data_dir, f"{split}_y.pt"))
            assert len(torch.unique(self.y)) == self.num_classes, "Number of classes do not match."

    def __len__(self) -> int:
        return len(self.X)

    def __getitem__(self, i):
        if hasattr(self, "y"):
            return self.X[i], self.y[i], self.subject_idxs[i]
        else:
            return self.X[i], self.subject_idxs[i]

    def butter_bandpass(self, lowcut=0.5, highcut=50.0, fs=200, order=5):
        nyquist = 0.5 * fs
        low = lowcut / nyquist
        high = highcut / nyquist
        b, a = scipy.signal.butter(order, [low, high], btype='band')
        return b, a
    
    def bandpass_filter(self, data, lowcut=0.5, highcut=50.0, fs=200, order=5):
        b, a = self.butter_bandpass(lowcut, highcut, fs, order=order)
        y = scipy.signal.lfilter(b, a, data)
        return y

    def minmaxscl(self, data, feature_range=(-1, 1)):
        scaler = MinMaxScaler(feature_range)
        return scaler.fit_transform(data)

    def filter(self, x):
        x = self.bandpass_filter(x)
        x = self.minmaxscl(x)
        return torch.Tensor(x)
    
    @property
    def num_channels(self) -> int:
        return self.X.shape[1]

    @property
    def seq_len(self) -> int:
        return self.X.shape[2]




class ThingsMEGDataset_selective(torch.utils.data.Dataset):
    def __init__(self, split: str, sj_idx: None, filtering: bool = True, data_dir: str = "data") -> None:
        super().__init__()

        assert split in ["train", "val", "test"], f"Invalid split: {split}"
        self.split = split
        self.filtering = filtering
        self.num_classes = 1854

        self.X = torch.load(os.path.join(data_dir, f"{split}_X.pt"))[:,:,:-1]
        self.subject_idxs = torch.load(os.path.join(data_dir, f"{split}_subject_idxs.pt"))

        
        if split in ["train", "val"]:
            self.y = torch.load(os.path.join(data_dir, f"{split}_y.pt"))
            assert len(torch.unique(self.y)) == self.num_classes, "Number of classes do not match."
            if sj_idx is not None:
                self.sjselected = torch.nonzero(self.subject_idxs == sj_idx).squeeze()
                self.X = self.X[self.sjselected]
                self.subject_idxs = self.subject_idxs[self.sjselected]
                self.y = self.y[self.sjselected]
                
        if filtering:
            for ii in tqdm(range(len(self.X))):
                self.X[ii] = self.filter(self.X[ii])

    def __len__(self) -> int:
        return len(self.X)

    def __getitem__(self, i):
        if hasattr(self, "y"):
            return self.X[i], self.y[i], self.subject_idxs[i]
        else:
            return self.X[i], self.subject_idxs[i]

    def butter_bandpass(self, lowcut=0.5, highcut=50.0, fs=200, order=5):
        nyquist = 0.5 * fs
        low = lowcut / nyquist
        high = highcut / nyquist
        b, a = scipy.signal.butter(order, [low, high], btype='band')
        return b, a
    
    def bandpass_filter(self, data, lowcut=0.5, highcut=50.0, fs=200, order=5):
        b, a = self.butter_bandpass(lowcut, highcut, fs, order=order)
        y = scipy.signal.lfilter(b, a, data)
        return y

    def minmaxscl(self, data, feature_range=(-1, 1)):
        scaler = MinMaxScaler(feature_range)
        return scaler.fit_transform(data)

    def filter(self, x):
        x = self.bandpass_filter(x)
        x = self.minmaxscl(x)
        return torch.Tensor(x)
    
    @property
    def num_channels(self) -> int:
        return self.X.shape[1]

    @property
    def seq_len(self) -> int:
        return self.X.shape[2]



class ThingsMEGDataset5_PreloadSplit(torch.utils.data.Dataset):
    def __init__(self, preprocess, split: str, sj_idx: int=None, filtering: bool = True, data_dir: str = "data", img_dir: str="images-002/images/", clip_model: str="RN50", save_dir: str="save_imgs/", device: str="cuda" if torch.cuda.is_available() else "cpu", just_load: bool=True) -> None:
        super().__init__()

        assert split in ["train", "val", "test"], f"Invalid split: {split}"
        self.split = split
        self.filtering = filtering
        self.img_dir = img_dir
        self.num_classes = 1854

        self.X = torch.load(os.path.join(data_dir, f"{split}_X.pt"))[:,:,:-1]
        self.subject_idxs = torch.load(os.path.join(data_dir, f"{split}_subject_idxs.pt"))

        self.device = device
        #self.preprocess = preprocess
        self.CLIP, self.preprocess = clip.load(clip_model, device=self.device)
        
        if split in ["train", "val"]:
            if sj_idx is not None:
                self.sjselected = torch.nonzero(self.subject_idxs == sj_idx).squeeze()
                self.X = self.X[self.sjselected]
                self.subject_idxs = self.subject_idxs[self.sjselected]
            self.y = torch.load(os.path.join(data_dir, f"{split}_y.pt"))
            assert len(torch.unique(self.y)) == self.num_classes, "Number of classes do not match."
            
        if filtering:
            for ii in tqdm(range(len(self.X)), "Filtering for "+split):
                self.X[ii] = self.filter(self.X[ii])
        
        if hasattr(self, "y"):
            f = open(os.path.join(data_dir, f"{split}_image_paths.txt"))
            self.paths = []
            while True:
              line = f.readline()
              if line == '':
                break
              self.paths.append(line.strip())
            f.close()

            self.paths = [self.paths[idx] for idx in self.sjselected]
            separator = 500
            if not just_load:
                flg = True
                for ii, path in tqdm(enumerate(self.paths), "Compressing images for "+split):
                    if flg:
                        self.images = self.preprocess(Image.open(os.path.join(self.img_dir, path))).unsqueeze(0)
                        flg = False
                    else:
                        self.images = torch.cat((self.images, self.preprocess(Image.open(os.path.join(self.img_dir, path))).unsqueeze(0)),dim=0)
                    if (ii+1)%separator==0:
                        with torch.no_grad():
                            self.img_features = self.CLIP.encode_image(self.images.to(device))
                        torch.save(self.img_features, os.path.join(save_dir,self.split+str((ii+1)//separator)+".pt"))
                        flg = True
                
                if (ii+1)%separator!=0:
                    with torch.no_grad():
                        self.img_features = self.CLIP.encode_image(self.images.to(device))
                    torch.save(self.img_features, os.path.join(save_dir,self.split+str((ii+1)//separator+1)+".pt"))
                num_loaded = ii
            else:
                num_loaded = len(self.paths)
                
            
            if (num_loaded+1)%separator!=0:
                flg = True
                for ii in range((num_loaded+1)//separator+1):
                    if flg:
                        self.images_clip = torch.load(os.path.join(save_dir,self.split+str(ii+1)+".pt"))
                        flg = False
                    else:
                        self.images_clip = torch.cat(( self.images_clip, torch.load(os.path.join(save_dir,self.split+str(ii+1)+".pt")) ), dim=0)
            else:
                flg = True
                for ii in range((num_loaded+1)//separator):
                    if flg:
                        self.images_clip = torch.load(os.path.join(save_dir,self.split+str(ii+1)+".pt"))
                        flg = False
                    else:
                        self.images_clip = torch.cat(( self.images_clip, torch.load(os.path.join(save_dir,self.split+str(ii+1)+".pt")) ), dim=0)
        
    def __len__(self) -> int:
        return len(self.X)

    def __getitem__(self, i):
        if hasattr(self, "y"):
            return self.X[i], self.y[i], self.subject_idxs[i], self.images_clip[i]
        else:
            return self.X[i], self.subject_idxs[i]

    def butter_bandpass(self, lowcut=0.5, highcut=50.0, fs=200, order=5):
        nyquist = 0.5 * fs
        low = lowcut / nyquist
        high = highcut / nyquist
        b, a = scipy.signal.butter(order, [low, high], btype='band')
        return b, a
    
    def bandpass_filter(self, data, lowcut=0.5, highcut=50.0, fs=200, order=5):
        b, a = self.butter_bandpass(lowcut, highcut, fs, order=order)
        y = scipy.signal.lfilter(b, a, data)
        return y

    def minmaxscl(self, data, feature_range=(-1, 1)):
        scaler = MinMaxScaler(feature_range)
        return scaler.fit_transform(data)

    def filter(self, x):
        x = self.bandpass_filter(x)
        x = self.minmaxscl(x)
        return torch.Tensor(x)
    
    @property
    def num_channels(self) -> int:
        return self.X.shape[1]

    @property
    def seq_len(self) -> int:
        return self.X.shape[2]

    

# MAE

In [10]:
args = {"batch_size": 256, "epochs": 80, "lr": 0.001, "device": "cuda", "num_workers": 0, "seed": 1234, "use_wandb": False, "data_dir": "data/", "model_path": "A"}


#set_seed(args.seed)
#logdir = hydra.core.hydra_config.HydraConfig.get().runtime.output_dir

#if args.use_wandb:
#    wandb.init(mode="online", dir=logdir, project="MEG-classification")

# ------------------
#    Dataloader
# ------------------
loader_args = {"batch_size": args["batch_size"], "num_workers": args["num_workers"]}

train_set = ThingsMEGDataset("train", args["data_dir"])
train_loader = torch.utils.data.DataLoader(train_set, shuffle=True, **loader_args)
val_set = ThingsMEGDataset("val", args["data_dir"])
val_loader = torch.utils.data.DataLoader(val_set, shuffle=False, **loader_args)
test_set = ThingsMEGDataset("test", args["data_dir"])
test_loader = torch.utils.data.DataLoader(
    test_set, shuffle=False, batch_size=args["batch_size"], num_workers=args["num_workers"]
)


100%|███████████████████████████████████████████████████████████████████████████| 65728/65728 [01:10<00:00, 938.75it/s]
100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 944.57it/s]
100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 940.75it/s]


In [3]:
#240707 Change this block to fit the dataset to use them as MAE input

def fix_seed(seed=1234):
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)


fix_seed(seed=42)


def random_indexes(size):
    """
    パッチをランダムに並べ替えるためのindexを生成する関数．

    Argument
    --------
    size : int
        入力されるパッチの数（系列長Nと同じ値）．
    """
    forward_indexes = np.arange(size)  # 0からsizeまでを並べた配列を作成
    np.random.shuffle(forward_indexes)  # 生成した配列をシャッフルすることで，パッチの順番をランダムに決定
    backward_indexes = np.argsort(forward_indexes)  # 並べ替えたパッチをもとの順番に戻すためのidx

    return forward_indexes, backward_indexes


def take_indexes(sequences, indexes):
    """
    パッチを並べ替えるための関数．

    Argument
    --------
    sequences : torch.Tensor
        入力画像をパッチ分割したデータ．(B, N, dim)の形状をしている．
    indexes : np.ndarray
        並べ替えるために利用するindex．
        random_indexesで生成したforward_indexesかbackward_indexesが入ることが想定されている．
    """
    return torch.gather(sequences, dim=1, index=indexes.unsqueeze(2).repeat(1, 1, sequences.shape[-1]))


############################################################################################

class Attention(nn.Module):
    def __init__(self, dim, heads, dim_head, dropout=0.):
        """
        Arguments
        ---------
        dim : int
            入力データの次元数．埋め込み次元数と一致する．
        heads : int
            ヘッドの数．
        dim_head : int
            各ヘッドのデータの次元数．
        dropout : float
            Dropoutの確率(default=0.)．
        """
        super().__init__()

        self.dim = dim
        self.dim_head = dim_head
        inner_dim = dim_head * heads  # ヘッドに分割する前のQ, K, Vの次元数．self.dimと異なっても良い．
        project_out = not (heads == 1 and dim_head == dim)  # headsが1，dim_headがdimと等しければ通常のSelf-Attention

        self.heads = heads
        self.scale = math.sqrt(dim_head)  # ソフトマックス関数を適用する前のスケーリング係数(dim_k)

        self.attend = nn.Softmax(dim=-1)  # アテンションスコアの算出に利用するソフトマックス関数
        self.dropout = nn.Dropout(dropout)

        # Q, K, Vに変換するための全結合層
        self.to_q = nn.Linear(in_features=dim, out_features=inner_dim)
        self.to_k = nn.Linear(in_features=dim, out_features=inner_dim)
        self.to_v = nn.Linear(in_features=dim, out_features=inner_dim)

        # dim != inner_dimなら線形層を入れる，そうでなければそのまま出力
        self.to_out = nn.Sequential(
            nn.Linear(in_features=inner_dim, out_features=dim),
            nn.Dropout(dropout),
        ) if project_out else nn.Identity()

    def forward(self, x):
        """
        B: バッチサイズ
        N: 系列長
        D: データの次元数(dim)
        """
        B, N, D = x.size()

        # 入力データをQ, K, Vに変換する
        # (B, N, dim) -> (B, N, inner_dim)
        q = self.to_q(x)
        k = self.to_k(x)
        v = self.to_v(x)

        # Q, K, Vをヘッドに分割する
        # (B, N, inner_dim) -> (B, heads, N, dim_head)
        q = rearrange(q, "b n (h d) -> b h n d", h=self.heads, d=self.dim_head)
        k = rearrange(k, "b n (h d) -> b h n d", h=self.heads, d=self.dim_head)
        v = rearrange(v, "b n (h d) -> b h n d", h=self.heads, d=self.dim_head)

        # QK^T / sqrt(d_k)を計算する
        # (B, heads, N, dim_head) x (B, heads, dim_head, N) -> (B, heads, N, N)
        dots = torch.matmul(q, k.transpose(-2, -1)) / self.scale

        # ソフトマックス関数でスコアを算出し，Dropoutをする
        attn = self.attend(dots)
        attn = self.dropout(attn)

        # softmax(QK^T / sqrt(d_k))Vを計算する
        # (B, heads, N, N) x (B, heads, N, dim_head) -> (B, heads, N, dim_head)
        out = torch.matmul(attn ,v)

        # もとの形に戻す
        # (B, heads, N, dim_head) -> (B, N, dim)
        out = rearrange(out, "b h n d -> b n (h d)", h=self.heads, d=self.dim_head)

        # 次元が違っていればもとに戻して出力
        # 表現の可視化のためにattention mapも返すようにしておく
        return self.to_out(out), attn

############################################################################################

class FFN(nn.Module):
    def __init__(self, dim, hidden_dim, dropout=0.):
        """
        Arguments
        ---------
        dim : int
            入力データの次元数．
        hidden_dim : int
            隠れ層の次元．
        dropout : float
            各全結合層の後のDropoutの確率(default=0.)．
        """
        super().__init__()

        self.net = nn.Sequential(
            nn.Linear(in_features=dim, out_features=hidden_dim),
            nn.GELU(),
            nn.Dropout(dropout),
            nn.Linear(in_features=hidden_dim, out_features=dim),
            nn.Dropout(dropout),
        )

    def forward(self, x):
        """
        (B, D) -> (B, D)
        B: バッチサイズ
        D: 次元数
        """
        return self.net(x)


############################################################################################

class Block(nn.Module):
    def __init__(self, dim, heads, dim_head, mlp_dim, dropout):
        """
        TransformerのEncoder Blockの実装．

        Arguments
        ---------
        dim : int
            埋め込みされた次元数．PatchEmbedのembed_dimと同じ値．
        heads : int
            Multi-Head Attentionのヘッドの数．
        dim_head : int
            Multi-Head Attentionの各ヘッドの次元数．
        mlp_dim : int
            Feed-Forward Networkの隠れ層の次元数．
        dropout : float
            Droptou層の確率p．
        """
        super().__init__()

        self.attn_ln = nn.LayerNorm(dim)  # Attention前のLayerNorm
        self.attn = Attention(dim, heads, dim_head, dropout)
        self.ffn_ln = nn.LayerNorm(dim)  # FFN前のLayerNorm
        self.ffn = FFN(dim, mlp_dim, dropout)

    def forward(self, x, return_attn=False):
        """
        x: (B, N, dim)
        B: バッチサイズ
        N: 系列長
        dim: 埋め込み次元
        """
        y, attn = self.attn(self.attn_ln(x))
        if return_attn:  # attention mapを返す（attention mapの可視化に利用）
            return attn
        x = y + x
        out = self.ffn(self.ffn_ln(x)) + x

        return out

############################################################################################

class PatchEmbedding(nn.Module):
    def __init__(self, image_size, patch_size, in_channels, embed_dim):
        """
        入力画像をパッチごとに埋め込むための層．

        Arguments
        ---------
        image_size : Tuple[int]
            入力画像のサイズ．
        patch_size : Tuple[int]
            各パッチのサイズ．
        in_channels : int
            入力画像のチャネル数．
        embed_dim : int
            埋め込み後の次元数．
        """
        super().__init__()

        image_height, image_width = image_size
        patch_height, patch_width = patch_size

        #print(image_height, patch_height, image_width, patch_width)

        assert image_height % patch_height == 0 and image_width % patch_width == 0, "パッチサイズは，入力画像のサイズを割り切れる必要があります．"

        num_patches = (image_height // patch_height) * (image_width // patch_width)  # パッチの数
        patch_dim = in_channels * patch_height * patch_width  # 各パッチを平坦化したときの次元数

        self.to_patch_embedding = nn.Sequential(
            Rearrange("b c (h p1) (w p2) -> b (h w) (p1 p2 c)", p1=patch_height, p2=patch_width),  # 画像をパッチに分割して平坦化
            nn.Linear(in_features=patch_dim, out_features=embed_dim),  # 埋め込みを行う
        )

    def forward(self, x):
        """
        B: バッチサイズ
        C: 入力画像のチャネル数
        H: 入力画像の高さ
        W: 入力画像の幅
        """
        return self.to_patch_embedding(x)  # (B, C, H, W) -> (B, num_patches, embed_dim)

############################################################################################

class PatchShuffle(nn.Module):
    def __init__(self, ratio):
        # ratio: Encoderに入力しないパッチの割合
        super().__init__()
        self.ratio = ratio

    def forward(self, patches):
        """
        B: バッチサイズ
        N: 系列長（＝パッチの数）
        dim: 次元数（＝埋め込みの次元数）
        """
        B, N, dim = patches.shape
        remain_N = int(N * (1 - self.ratio))  # Encoderに入力するパッチの数

        indexes = [random_indexes(N) for _ in range(B)]  # バッチごとに異なる順番のindexを作る
        forward_indexes = torch.as_tensor(np.stack([i[0] for i in indexes], axis=-1), dtype=torch.long).T.to(patches.device)  # バッチを並べ替えるときのidx (B, N)
        backward_indexes = torch.as_tensor(np.stack([i[1] for i in indexes], axis=-1), dtype=torch.long).T.to(patches.device)  # 並べ替えたパッチをもとの順番に戻すためのidx  (B, N)

        patches = take_indexes(patches, forward_indexes)  # パッチを並べ替える
        patches = patches[:, :remain_N, :]  # Encoderに入力するパッチを抽出

        return patches, forward_indexes, backward_indexes


    def random_indexes(size):
        """
        パッチをランダムに並べ替えるためのindexを生成する関数．

        Argument
        --------
        size : int
            入力されるパッチの数（系列長Nと同じ値）．
        """
        forward_indexes = np.arange(size)  # 0からsizeまでを並べた配列を作成
        np.random.shuffle(forward_indexes)  # 生成した配列をシャッフルすることで，パッチの順番をランダムに決定
        backward_indexes = np.argsort(forward_indexes)  # 並べ替えたパッチをもとの順番に戻すためのidx

        return forward_indexes, backward_indexes



    def take_indexes(sequences, indexes):
        """
        パッチを並べ替えるための関数．

        Argument
        --------
        sequences : torch.Tensor
            入力画像をパッチ分割したデータ．(B, N, dim)の形状をしている．
        indexes : np.ndarray
            並べ替えるために利用するindex．
            random_indexesで生成したforward_indexesかbackward_indexesが入ることが想定されている．
        """
        return torch.gather(sequences, dim=1, index=indexes.unsqueeze(2).repeat(1, 1, sequences.shape[-1]))

############################################################################################

class MAE_Encoder(nn.Module):
    def __init__(self, image_size=[272, 286], patch_size=[34, 13], emb_dim=192, num_layer=12,
                 heads=3, dim_head=64, mlp_dim=192, mask_ratio=0.75, dropout=0.):
        """
        Arguments
        ---------

        image_size : List[int]
            入力画像の大きさ．
        patch_size : List[int]
            各パッチの大きさ．
        emb_dim : int
            データを埋め込む次元の数．
        num_layer : int
            Encoderに含まれるBlockの数．
        heads : int
            Multi-Head Attentionのヘッドの数．
        dim_head : int
            Multi-Head Attentionの各ヘッドの次元数．
        mlp_dim : int
            Feed-Forward Networkの隠れ層の次元数．
        mask_ratio : float
            入力パッチのマスクする割合．
        dropout : float
            ドロップアウトの確率．
        """
        super().__init__()
        img_height, img_width = image_size
        patch_height, patch_width = patch_size
        num_patches = (img_height // patch_height) * (img_width // patch_width)

        self.cls_token = torch.nn.Parameter(torch.randn(1, 1, emb_dim))  # class tokenの初期化
        self.pos_embedding = torch.nn.Parameter(torch.randn(1, num_patches, emb_dim))  # positional embedding（学習可能にしている）
        self.shuffle = PatchShuffle(mask_ratio)

        # 入力画像をパッチに分割する
        self.patchify = PatchEmbedding(image_size, patch_size, 1, emb_dim)

        # Encoder（Blockを重ねる）
        self.transformer = torch.nn.Sequential(*[Block(emb_dim, heads, dim_head, mlp_dim, dropout) for _ in range(num_layer)])

        self.layer_norm = nn.LayerNorm(emb_dim)

        self.init_weight()

    def init_weight(self):
        torch.nn.init.normal_(self.cls_token, std=0.02)
        torch.nn.init.normal_(self.pos_embedding, std=0.02)

    def forward(self, img):
        # 1. 入力画像をパッチに分割して，positional embeddingする
        patches = self.patchify(img)
        patches = patches + self.pos_embedding

        # 2. 分割したパッチをランダムに並べ替えて，必要なパッチのみ得る
        patches, forward_indexes, backward_indexes = self.shuffle(patches)

        # class tokenを結合
        patches = torch.cat([self.cls_token.repeat(patches.shape[0], 1, 1), patches], dim=1)

        # 3. Encoderで入力データを処理する
        features = self.layer_norm(self.transformer(patches))

        return features, backward_indexes


############################################################################################

class MAE_Decoder(nn.Module):
    def __init__(self, image_size=[272, 286], patch_size=[34, 13], emb_dim=192, num_layer=4,
                 heads=3, dim_head=64, mlp_dim=192, dropout=0.):
        """
        Arguments
        ---------

        image_size : List[int]
            入力画像の大きさ．
        patch_size : List[int]
            各パッチの大きさ．
        emb_dim : int
            データを埋め込む次元の数．
        num_layer : int
            Decoderに含まれるBlockの数．
        heads : int
            Multi-Head Attentionのヘッドの数．
        dim_head : int
            Multi-Head Attentionの各ヘッドの次元数．
        mlp_dim : int
            Feed-Forward Networkの隠れ層の次元数．
        dropout : float
            ドロップアウトの確率．
        """
        super().__init__()
        img_height, img_width = image_size
        patch_height, patch_width = patch_size
        num_patches = (img_height // patch_height) * (img_width // patch_width)

        self.mask_token = torch.nn.Parameter(torch.rand(1, 1, emb_dim))
        self.pos_embedding = torch.nn.Parameter(torch.rand(1, num_patches+1, emb_dim))

        # Decoder(Blockを重ねる）
        self.transformer = torch.nn.Sequential(*[Block(emb_dim, heads, dim_head, mlp_dim, dropout) for _ in range(num_layer)])

        # 埋め込みされた表現から画像を復元するためのhead
        self.head = torch.nn.Linear(emb_dim, 1 * patch_height * patch_width)
        # (B, N, dim)から(B, C, H, W)にreshapeするためのインスタンス
        self.patch2img = Rearrange("b (h w) (c p1 p2) -> b c (h p1) (w p2)", p1=patch_height, p2=patch_width, h=img_height // patch_height)

        self.init_weight()

    def init_weight(self):
        torch.nn.init.normal_(self.mask_token, std=0.02)
        torch.nn.init.normal_(self.pos_embedding, std=0.02)

    def forward(self, features, backward_indexes):
        # 系列長
        T = features.shape[1]

        # class tokenがある分backward_indexesの最初に0を追加する
        # .toはデバイスの変更でよく利用するが，tensorを渡すことでdtypeを変えることができる
        backward_indexes = torch.cat([torch.zeros(backward_indexes.shape[0], 1).to(backward_indexes), backward_indexes+1], dim=1)

        # 1. mask_tokenを結合して並べ替える．
        # (B, N*(1-mask_ratio)+1, dim) -> (B, N+1, dim)
        features = torch.cat([features, self.mask_token.repeat(features.shape[0], backward_indexes.shape[1] - features.shape[1], 1)], dim=1)
        features = take_indexes(features, backward_indexes)
        features = features + self.pos_embedding

        features = self.transformer(features)

        # class tokenを除去する
        # (B, N+1, dim) -> (B, N, dim)
        features = features[:, 1:, :]

        # 2. 画像を再構成する．
        # (B, N, dim) -> (B, N, 3 * patch_height * patch_width)
        patches = self.head(features)

        # MAEではマスクした部分でのみ損失関数を計算するため，maskも一緒に返す
        mask = torch.zeros_like(patches)
        mask[:, T-1:] = 1  # cls tokenを含めていた分ずらしている
        mask = take_indexes(mask, backward_indexes[:, 1:] - 1)

        img = self.patch2img(patches)
        mask = self.patch2img(mask)

        return img, mask


############################################################################################

class MAE_ViT(nn.Module):
    def __init__(self, image_size=[272, 286], patch_size=[34, 13], emb_dim=192,
                 enc_layers=12, enc_heads=3, enc_dim_head=64, enc_mlp_dim=768,
                 dec_layers=4, dec_heads=3, dec_dim_head=64, dec_mlp_dim=768,
                 mask_ratio=0.75, dropout=0.):
        """
        Arguments
        ---------
        image_size : List[int]
            入力画像の大きさ．
        patch_size : List[int]
            各パッチの大きさ．
        emb_dim : int
            データを埋め込む次元の数．
        {enc/dec}_layers : int
            Encoder / Decoderに含まれるBlockの数．
        {enc/dec}_heads : int
            Encoder / DecoderのMulti-Head Attentionのヘッドの数．
        {enc/dec}_dim_head : int
            Encoder / DecoderのMulti-Head Attentionの各ヘッドの次元数．
        {enc/dec}_mlp_dim : int
            Encoder / DecoderのFeed-Forward Networkの隠れ層の次元数．
        mask_ratio : float
            入力パッチのマスクする割合．
        dropout : float
            ドロップアウトの確率．
        """
        super().__init__()

        self.encoder = MAE_Encoder(image_size, patch_size, emb_dim, enc_layers,
                                   enc_heads, enc_dim_head, enc_mlp_dim, mask_ratio, dropout)
        self.decoder = MAE_Decoder(image_size, patch_size, emb_dim, dec_layers,
                                   dec_heads, dec_dim_head, dec_mlp_dim, dropout)

    def forward(self, img):
        features, backward_indexes = self.encoder(img)
        rec_img, mask = self.decoder(features, backward_indexes)
        return rec_img, mask

    def get_last_selfattention(self, x):
        patches = self.encoder.patchify(x)
        patches = patches + self.encoder.pos_embedding

        patches = torch.cat([self.encoder.cls_token.repeat(patches.shape[0], 1, 1), patches], dim=1)  # class tokenを結合
        for i, block in enumerate(self.encoder.transformer):
            if i < len(self.encoder.transformer) - 1:
                patches = block(patches)
            else:
                return block(patches, return_attn=True)



class Projection_Layer(nn.Module):
    def __init__(self, in_channels, out_channels, data_width):
        """
        Arguments
        ---------
        in_channels : int
            number of input channels．
        out_channels : int
            number of output channels
        data_width : int
            width of data
        """
        super().__init__()

        self.net = nn.Sequential(
            nn.Conv1d(in_channels =in_channels,out_channels=out_channels,kernel_size=1,stride=1),
            nn.GELU(),
            nn.Flatten(),
            nn.Linear(out_channels*data_width, 1024),
            nn.ReLU(),
            nn.Dropout(0.5)
        )

    def forward(self, x):
        """
        (B, D) -> (B, D)
        B: バッチサイズ
        D: 次元数
        """
        return self.net(x)


class Projection_LayerL(nn.Module):
    def __init__(self, in_channels, out_channels, data_width):
        """
        Arguments
        ---------
        in_channels : int
            number of input channels．
        out_channels : int
            number of output channels
        data_width : int
            width of data
        """
        super().__init__()

        """
        self.net = nn.Sequential(
            nn.Conv1d(in_channels =in_channels,out_channels=out_channels,kernel_size=1,stride=1),
            nn.GELU(),
            nn.Flatten(),
            nn.Linear(out_channels*data_width, 1024),
            nn.ReLU(),
            nn.Dropout(0.5)
        )
        """

        self.net = nn.Sequential(
            #input dim, output dim (num filters), size of filter (square)
            nn.Conv2d(in_channels, 64, 3,padding='same'),              # 32x32x1 -> 32x32x64
            nn.ReLU(),
            nn.Conv2d(64, 64, 3,padding='same'),              # 32x32x64 -> 32x32x64
            nn.ReLU(),
            nn.BatchNorm2d(64),
            nn.Conv2d(64, 64, 3,padding='same'),             # 32x32x64 -> 32x32x64
            nn.ReLU(),
            nn.MaxPool2d(2),                                 # 32x32x64 -> 16x16x64
            nn.Dropout(0.25),
        
            nn.Conv2d(64, 128, 3,padding='same'),              # 16x16x64 -> 16x16x128
            nn.ReLU(),
            nn.Conv2d(128, 128, 3,padding='same'),             # 16x16x128 -> 16x16x128
            nn.ReLU(),
            nn.BatchNorm2d(128),
            nn.Conv2d(128, 128, 3,padding='same'),             # 16x16x128 -> 16x16x128
            nn.ReLU(),
            nn.MaxPool2d(2),                                   # 16x16x128 -> 8x8x128
            nn.Dropout(0.25),
        
            nn.Conv2d(128, 256, 3,padding='same'),              # 8x8x128 -> 8x8x256
            nn.ReLU(),
            nn.Conv2d(256, 256, 3,padding='same'),              # 8x8x256 -> 8x8x256
            nn.ReLU(),
            nn.BatchNorm2d(256),
            nn.Conv2d(256, 256, 3,padding='same'),             # 8x8x256 -> 8x8x256
            nn.ReLU(),
            nn.Conv2d(256, 256, 3,padding='same'),             # 8x8x256 -> 8x8x256
            nn.ReLU(),
            nn.Conv2d(256, 256, 3,padding='same'),             # 8x8x256 -> 8x8x256
            nn.ReLU(),
            nn.BatchNorm2d(256),
            nn.Conv2d(256, 512, 3,padding='same'),             # 8x8x512 -> 8x8x512
            nn.ReLU(),
            nn.Conv2d(512, 512, 3,padding='same'),             # 8x8x512 -> 8x8x512
            nn.ReLU(),
            nn.AvgPool2d(8),                  # 8x8x512 -> 1x1x512
            
            nn.Flatten(),
            nn.Linear(15360, 1024),
            nn.ReLU(),
            nn.Dropout(0.25),
            nn.Linear(1024, 1024)
        )

    def forward(self, x):
        """
        (B, D) -> (B, D)
        B: バッチサイズ
        D: 次元数
        """
        return self.net(x)



class Projection_LayerS(nn.Module):
    def __init__(self, in_channels, out_channels, data_width):
        """
        Arguments
        ---------
        in_channels : int
            number of input channels．
        out_channels : int
            number of output channels
        data_width : int
            width of data
        """
        super().__init__()

        self.net = nn.Sequential(
            #input dim, output dim (num filters), size of filter (square)
            nn.Conv2d(in_channels, 8, 3,padding='same'),              # 32x32x1 -> 32x32x64
            nn.ReLU(),
            nn.Conv2d(8, 8, 3,padding='same'),              # 32x32x64 -> 32x32x64
            nn.ReLU(),
            nn.BatchNorm2d(64),
            nn.Conv2d(8, 8, 3,padding='same'),             # 32x32x64 -> 32x32x64
            nn.ReLU(),
            nn.AvgPool2d(10),                  # 8x8x512 -> 1x1x512
                 
            nn.Flatten(),
            nn.Linear(20672, 20672//10),
            nn.ReLU(),
            nn.Dropout(0.25),
            nn.Linear(20672//10, 1024)
        )

    def forward(self, x):
        """
        (B, D) -> (B, D)
        B: バッチサイズ
        D: 次元数
        """
        return self.net(x)



class BasicConvClassifier(nn.Module):
    def __init__(
        self,
        num_classes: int,
        seq_len: int,
        in_channels: int,
        hid_dim: int = 1024
    ) -> None:
        super().__init__()

        self.blocks = nn.Sequential(
            ConvBlock(in_channels, hid_dim),
            ConvBlock(hid_dim, hid_dim),
            ConvBlock(hid_dim, hid_dim)
        )

        self.head = nn.Sequential(
            nn.AdaptiveAvgPool1d(1),
            Rearrange("b d 1 -> b d"),
            nn.Linear(hid_dim, hid_dim*2),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(hid_dim*2, hid_dim),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(hid_dim, num_classes),
            nn.Softmax(dim=1)
        )

    def forward(self, X: torch.Tensor) -> torch.Tensor:
        """_summary_
        Args:
            X ( b, c, t ): _description_
        Returns:
            X ( b, num_classes ): _description_
        """
        X = self.blocks(X)

        return self.head(X)





class BasicConvProjector(nn.Module):
    def __init__(
        self,
        num_classes: int,
        seq_len: int,
        in_channels: int,
        hid_dim: int = 1024
    ) -> None:
        super().__init__()

        self.blocks = nn.Sequential(
            ConvBlock(in_channels, hid_dim),
            ConvBlock(hid_dim, hid_dim),
            ConvBlock(hid_dim, hid_dim)
        )

        self.head = nn.Sequential(
            nn.AdaptiveAvgPool1d(1),
            Rearrange("b d 1 -> b d"),
            nn.Linear(hid_dim, hid_dim*2),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(hid_dim*2, hid_dim),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(hid_dim, num_classes),
            nn.ReLU(),
            nn.Dropout(0.5),
        )

    def forward(self, X: torch.Tensor) -> torch.Tensor:
        """_summary_
        Args:
            X ( b, c, t ): _description_
        Returns:
            X ( b, num_classes ): _description_
        """
        X = self.blocks(X)

        return self.head(X)




class ConvBlock(nn.Module):
    def __init__(
        self,
        in_dim,
        out_dim,
        kernel_size: int = 3,
        p_drop: float = 0.50,
    ) -> None:
        super().__init__()
        
        self.in_dim = in_dim
        self.out_dim = out_dim

        self.conv0 = nn.Conv1d(in_dim, out_dim, kernel_size, padding="same")
        self.conv1 = nn.Conv1d(out_dim, out_dim, kernel_size, padding="same")
        # self.conv2 = nn.Conv1d(out_dim, out_dim, kernel_size) # , padding="same")
        
        self.batchnorm0 = nn.BatchNorm1d(num_features=out_dim)
        self.batchnorm1 = nn.BatchNorm1d(num_features=out_dim)

        self.dropout = nn.Dropout(p_drop)

    def forward(self, X: torch.Tensor) -> torch.Tensor:
        if self.in_dim == self.out_dim:
            X = self.conv0(X) + X  # skip connection
        else:
            X = self.conv0(X)

        X = F.gelu(self.batchnorm0(X))

        X = self.conv1(X) + X  # skip connection
        X = F.gelu(self.batchnorm1(X))

        # X = self.conv2(X)
        # X = F.glu(X, dim=-2)

        return self.dropout(X)




class BasicConvClassifier_original(nn.Module):
    def __init__(
        self,
        num_classes: int,
        seq_len: int,
        in_channels: int,
        hid_dim: int = 128
    ) -> None:
        super().__init__()

        self.blocks = nn.Sequential(
            ConvBlock_original(in_channels, hid_dim),
            ConvBlock_original(hid_dim, hid_dim),
            ConvBlock_original(hid_dim, hid_dim),
        )

        self.head = nn.Sequential(
            nn.AdaptiveAvgPool1d(1),
            Rearrange("b d 1 -> b d"),
            nn.Linear(hid_dim, hid_dim),
            nn.Linear(hid_dim, num_classes),
        )

    def forward(self, X: torch.Tensor) -> torch.Tensor:
        """_summary_
        Args:
            X ( b, c, t ): _description_
        Returns:
            X ( b, num_classes ): _description_
        """
        X = self.blocks(X)

        return self.head(X)


class ConvBlock_original(nn.Module):
    def __init__(
        self,
        in_dim,
        out_dim,
        kernel_size: int = 3,
        p_drop: float = 0.1,
    ) -> None:
        super().__init__()
        
        self.in_dim = in_dim
        self.out_dim = out_dim

        self.conv0 = nn.Conv1d(in_dim, out_dim, kernel_size, padding="same")
        self.conv1 = nn.Conv1d(out_dim, out_dim, kernel_size, padding="same")
        # self.conv2 = nn.Conv1d(out_dim, out_dim, kernel_size) # , padding="same")
        
        self.batchnorm0 = nn.BatchNorm1d(num_features=out_dim)
        self.batchnorm1 = nn.BatchNorm1d(num_features=out_dim)

        self.dropout = nn.Dropout(p_drop)

    def forward(self, X: torch.Tensor) -> torch.Tensor:
        if self.in_dim == self.out_dim:
            X = self.conv0(X) + X  # skip connection
        else:
            X = self.conv0(X)

        X = F.gelu(self.batchnorm0(X))

        X = self.conv1(X) + X  # skip connection
        X = F.gelu(self.batchnorm1(X))

        # X = self.conv2(X)
        # X = F.glu(X, dim=-2)

        return self.dropout(X)

In [4]:
class CosineScheduler:
    def __init__(self, epochs, lr, warmup_length=5):
        """
        Arguments
        ---------
        epochs : int
            学習のエポック数．
        lr : float
            学習率．
        warmup_length : int
            warmupを適用するエポック数．
        """
        self.epochs = epochs
        self.lr = lr
        self.warmup = warmup_length

    def __call__(self, epoch):
        """
        Arguments
        ---------
        epoch : int
            現在のエポック数．
        """
        progress = (epoch - self.warmup) / (self.epochs - self.warmup)
        progress = np.clip(progress, 0.0, 1.0)
        lr = self.lr * 0.5 * (1. + np.cos(np.pi * progress))

        if self.warmup:
            lr = lr * min(1., (epoch+1) / self.warmup)

        return lr

In [5]:
def set_lr(lr, optimizer):
  for param_group in optimizer.param_groups:
      param_group["lr"] = lr

In [6]:
def adjustment(x):
    sz = x.size()
    x_list = []
    for spl in x:
        x_ = torch.cat((spl, torch.zeros(spl.size(0), 5)), dim=1)
        avg_cnl = torch.mean(spl, dim=0, keepdim=True)
        avg_cnl = torch.cat((avg_cnl, torch.zeros(1, 5)), dim=1)
        x_ = torch.cat((x_,avg_cnl), dim=0)
        x_list.append(x_)
    
    x_list = torch.stack(x_list)
    x_list = torch.unsqueeze(x_list, dim=1)
    
    return x_list

In [25]:
# ハイパーパラメータの設定
config = {
    "image_size": [271, 280],
    "patch_size": [271, 20],
    "emb_dim": 1854,
    "enc_layers": 24,
    "enc_heads": 8,
    "enc_dim_head": 16,
    "enc_mlp_dim": 1854,
    "dec_layers": 4,
    "dec_heads": 5,
    "dec_dim_head": 16,
    "dec_mlp_dim": 1854,
    "mask_ratio": 0.4,
    "dropout": 0.25
}

device = "cuda" if torch.cuda.is_available() else "cpu"
model = MAE_ViT(**config).to(device)
epochs = 100
lr = 0.0004
step_count = 0
warmup_length = 25
batch_size = 128
optimizer = optim.AdamW(model.parameters(), lr=lr, betas=(0.9, 0.95), weight_decay=0.05)
scheduler = CosineScheduler(epochs, lr, warmup_length)

In [26]:
for epoch in range(epochs):
    # スケジューラで学習率を更新する
    new_lr = scheduler(epoch)
    set_lr(new_lr, optimizer)

    total_train_loss = 0.
    total_valid_loss = 0.

    # モデルの訓練
    for x, _, _ in tqdm(train_loader):
        x = x.unsqueeze(1)
        step_count += 1
        model.train()
        x = x.to(device)

        rec_img, mask = model(x)
        train_loss = torch.mean((rec_img - x) ** 2 * mask) / config["mask_ratio"]
        train_loss.backward()

        if step_count % 8 == 0:  # 8イテレーションごとに更新することで，擬似的にバッチサイズを大きくしている
            optimizer.step()
            optimizer.zero_grad()

        total_train_loss += train_loss.item()

    # モデルの評価
    with torch.no_grad():
        for x, _, _ in val_loader:
            x = x.unsqueeze(1)
            model.eval()

            with torch.no_grad():
                x = x.to(device)

                rec_img, mask = model(x)
                valid_loss = torch.mean((rec_img - x) ** 2 * mask) / config["mask_ratio"]

                total_valid_loss += valid_loss.item()


    print(f"Epoch[{epoch+1} / {epochs}] Train Loss: {total_train_loss/len(train_loader):.4f} Valid Loss: {total_valid_loss/len(val_loader):.4f}")


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:08<00:00,  1.03it/s]


Epoch[1 / 100] Train Loss: 0.2590 Valid Loss: 0.1784


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[2 / 100] Train Loss: 0.1938 Valid Loss: 0.1712


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:09<00:00,  1.03it/s]


Epoch[3 / 100] Train Loss: 0.1809 Valid Loss: 0.1707


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:08<00:00,  1.03it/s]


Epoch[4 / 100] Train Loss: 0.1778 Valid Loss: 0.1701


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:10<00:00,  1.03it/s]


Epoch[5 / 100] Train Loss: 0.1752 Valid Loss: 0.1695


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[6 / 100] Train Loss: 0.1725 Valid Loss: 0.1679


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[7 / 100] Train Loss: 0.1710 Valid Loss: 0.1668


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[8 / 100] Train Loss: 0.1702 Valid Loss: 0.1667


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[9 / 100] Train Loss: 0.1690 Valid Loss: 0.1669


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:24<00:00,  1.03s/it]


Epoch[10 / 100] Train Loss: 0.1689 Valid Loss: 0.1670


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:20<00:00,  1.01s/it]


Epoch[11 / 100] Train Loss: 0.1682 Valid Loss: 0.1659


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:23<00:00,  1.03s/it]


Epoch[12 / 100] Train Loss: 0.1676 Valid Loss: 0.1655


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:23<00:00,  1.03s/it]


Epoch[13 / 100] Train Loss: 0.1671 Valid Loss: 0.1658


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:29<00:00,  1.05s/it]


Epoch[14 / 100] Train Loss: 0.1666 Valid Loss: 0.1653


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:33<00:00,  1.07s/it]


Epoch[15 / 100] Train Loss: 0.1666 Valid Loss: 0.1642


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:34<00:00,  1.07s/it]


Epoch[16 / 100] Train Loss: 0.1659 Valid Loss: 0.1641


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:31<00:00,  1.06s/it]


Epoch[17 / 100] Train Loss: 0.1655 Valid Loss: 0.1638


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:36<00:00,  1.07s/it]


Epoch[18 / 100] Train Loss: 0.1651 Valid Loss: 0.1629


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[19 / 100] Train Loss: 0.1644 Valid Loss: 0.1626


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[20 / 100] Train Loss: 0.1635 Valid Loss: 0.1616


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[21 / 100] Train Loss: 0.1628 Valid Loss: 0.1600


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[22 / 100] Train Loss: 0.1619 Valid Loss: 0.1587


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[23 / 100] Train Loss: 0.1602 Valid Loss: 0.1564


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[24 / 100] Train Loss: 0.1586 Valid Loss: 0.1536


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[25 / 100] Train Loss: 0.1560 Valid Loss: 0.1518


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[26 / 100] Train Loss: 0.1540 Valid Loss: 0.1483


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[27 / 100] Train Loss: 0.1519 Valid Loss: 0.1460


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[28 / 100] Train Loss: 0.1499 Valid Loss: 0.1444


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[29 / 100] Train Loss: 0.1483 Valid Loss: 0.1425


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[30 / 100] Train Loss: 0.1469 Valid Loss: 0.1417


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[31 / 100] Train Loss: 0.1457 Valid Loss: 0.1407


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[32 / 100] Train Loss: 0.1445 Valid Loss: 0.1396


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[33 / 100] Train Loss: 0.1437 Valid Loss: 0.1389


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[34 / 100] Train Loss: 0.1426 Valid Loss: 0.1383


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[35 / 100] Train Loss: 0.1420 Valid Loss: 0.1377


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[36 / 100] Train Loss: 0.1412 Valid Loss: 0.1376


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[37 / 100] Train Loss: 0.1406 Valid Loss: 0.1365


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[38 / 100] Train Loss: 0.1399 Valid Loss: 0.1357


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[39 / 100] Train Loss: 0.1394 Valid Loss: 0.1360


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[40 / 100] Train Loss: 0.1392 Valid Loss: 0.1352


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[41 / 100] Train Loss: 0.1384 Valid Loss: 0.1347


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[42 / 100] Train Loss: 0.1379 Valid Loss: 0.1342


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[43 / 100] Train Loss: 0.1376 Valid Loss: 0.1339


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[44 / 100] Train Loss: 0.1370 Valid Loss: 0.1337


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[45 / 100] Train Loss: 0.1368 Valid Loss: 0.1338


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[46 / 100] Train Loss: 0.1362 Valid Loss: 0.1331


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[47 / 100] Train Loss: 0.1360 Valid Loss: 0.1328


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[48 / 100] Train Loss: 0.1356 Valid Loss: 0.1324


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[49 / 100] Train Loss: 0.1352 Valid Loss: 0.1323


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[50 / 100] Train Loss: 0.1348 Valid Loss: 0.1319


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[51 / 100] Train Loss: 0.1345 Valid Loss: 0.1319


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[52 / 100] Train Loss: 0.1342 Valid Loss: 0.1318


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[53 / 100] Train Loss: 0.1338 Valid Loss: 0.1312


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[54 / 100] Train Loss: 0.1334 Valid Loss: 0.1310


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[55 / 100] Train Loss: 0.1330 Valid Loss: 0.1308


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[56 / 100] Train Loss: 0.1328 Valid Loss: 0.1305


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[57 / 100] Train Loss: 0.1325 Valid Loss: 0.1306


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:16<00:00,  1.00it/s]


Epoch[58 / 100] Train Loss: 0.1322 Valid Loss: 0.1304


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[59 / 100] Train Loss: 0.1319 Valid Loss: 0.1304


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[60 / 100] Train Loss: 0.1315 Valid Loss: 0.1300


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:18<00:00,  1.01s/it]


Epoch[61 / 100] Train Loss: 0.1313 Valid Loss: 0.1300


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:38<00:00,  1.09s/it]


Epoch[62 / 100] Train Loss: 0.1309 Valid Loss: 0.1299


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[63 / 100] Train Loss: 0.1306 Valid Loss: 0.1301


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[64 / 100] Train Loss: 0.1304 Valid Loss: 0.1302


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[65 / 100] Train Loss: 0.1300 Valid Loss: 0.1296


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[66 / 100] Train Loss: 0.1298 Valid Loss: 0.1297


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[67 / 100] Train Loss: 0.1295 Valid Loss: 0.1296


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[68 / 100] Train Loss: 0.1292 Valid Loss: 0.1296


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[69 / 100] Train Loss: 0.1290 Valid Loss: 0.1297


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[70 / 100] Train Loss: 0.1286 Valid Loss: 0.1295


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[71 / 100] Train Loss: 0.1284 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[72 / 100] Train Loss: 0.1281 Valid Loss: 0.1295


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[73 / 100] Train Loss: 0.1280 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[74 / 100] Train Loss: 0.1276 Valid Loss: 0.1294


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[75 / 100] Train Loss: 0.1273 Valid Loss: 0.1294


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[76 / 100] Train Loss: 0.1271 Valid Loss: 0.1295


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[77 / 100] Train Loss: 0.1269 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[78 / 100] Train Loss: 0.1267 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[79 / 100] Train Loss: 0.1265 Valid Loss: 0.1295


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[80 / 100] Train Loss: 0.1262 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[81 / 100] Train Loss: 0.1261 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[82 / 100] Train Loss: 0.1259 Valid Loss: 0.1290


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[83 / 100] Train Loss: 0.1257 Valid Loss: 0.1291


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[84 / 100] Train Loss: 0.1255 Valid Loss: 0.1290


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[85 / 100] Train Loss: 0.1254 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[86 / 100] Train Loss: 0.1253 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[87 / 100] Train Loss: 0.1252 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[88 / 100] Train Loss: 0.1251 Valid Loss: 0.1290


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[89 / 100] Train Loss: 0.1250 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:15<00:00,  1.01it/s]


Epoch[90 / 100] Train Loss: 0.1248 Valid Loss: 0.1290


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[91 / 100] Train Loss: 0.1247 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[92 / 100] Train Loss: 0.1247 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[93 / 100] Train Loss: 0.1245 Valid Loss: 0.1290


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[94 / 100] Train Loss: 0.1246 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[95 / 100] Train Loss: 0.1246 Valid Loss: 0.1294


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:12<00:00,  1.02it/s]


Epoch[96 / 100] Train Loss: 0.1245 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:11<00:00,  1.02it/s]


Epoch[97 / 100] Train Loss: 0.1245 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:22<00:00,  1.02s/it]


Epoch[98 / 100] Train Loss: 0.1243 Valid Loss: 0.1292


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:38<00:00,  1.08s/it]


Epoch[99 / 100] Train Loss: 0.1244 Valid Loss: 0.1293


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [04:37<00:00,  1.08s/it]


Epoch[100 / 100] Train Loss: 0.1245 Valid Loss: 0.1292


In [27]:
# モデルを保存しておく
torch.save(model.state_dict(), "model/MAE_pretrain_params_240716_1.pth")
del model, train_loss, valid_loss, train_set, val_set, test_set
torch.cuda.empty_cache()

In [None]:
# ViT Classifier (adapted from Lecture 9) (240716)

In [55]:
class ViT_Classifier(nn.Module):
    def __init__(self, encoder: MAE_Encoder, num_classes=1854):
        super().__init__()
        self.cls_token = encoder.cls_token
        self.pos_embedding = encoder.pos_embedding
        self.patchify = encoder.patchify
        self.transformer = encoder.transformer
        self.layer_norm = encoder.layer_norm

        """
        self.head = nn.Sequential(
            nn.Linear(self.pos_embedding.shape[-1], num_classes),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(num_classes, num_classes),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(num_classes, num_classes)
        )
        """
        
        self.head = nn.Sequential(
            nn.Linear(self.pos_embedding.shape[-1], num_classes),
            nn.ReLU(),
            nn.Dropout(0.20),
            nn.Linear(num_classes, num_classes)
        )
        

    def forward(self, img):
        patches = self.patchify(img)
        patches = patches + self.pos_embedding  # positional embedding

        patches = torch.cat([self.cls_token.repeat(patches.shape[0], 1, 1), patches], dim=1)  # class tokenを結合
        features = self.layer_norm(self.transformer(patches))
        logits = self.head(features[:, 0])  # cls tokenのみを入力する
        return logits

    def get_last_selfattention(self, x):
        patches = self.patchify(x)
        patches = patches + self.pos_embedding

        patches = torch.cat([self.cls_token.repeat(patches.shape[0], 1, 1), patches], dim=1)  # class tokenを結合
        for i, block in enumerate(self.transformer):
            if i < len(self.transformer) - 1:
                patches = block(patches)
            else:
                return block(patches, return_attn=True)


class ViT_Classifier_ensemble(nn.Module):
    def __init__(self, encoder: MAE_Encoder, num_classes=1854):
        super().__init__()
        self.cls_token = encoder.cls_token
        self.pos_embedding = encoder.pos_embedding
        self.patchify = encoder.patchify
        self.transformer = encoder.transformer
        self.layer_norm = encoder.layer_norm

        self.head1 = nn.Sequential(
            nn.Linear(self.pos_embedding.shape[-1], num_classes),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(num_classes, num_classes)
        )

        self.head2 = nn.Sequential(
            nn.Linear(self.pos_embedding.shape[-1], num_classes),
            nn.ReLU(),
            nn.Dropout(0.25),
            nn.Linear(num_classes, num_classes)
        )

        self.head3 = nn.Sequential(
            nn.Linear(self.pos_embedding.shape[-1], num_classes),
            nn.ReLU(),
            nn.Dropout(0.28),
            nn.Linear(num_classes, num_classes)
        )

    def forward(self, img):
        patches = self.patchify(img)
        patches = patches + self.pos_embedding  # positional embedding

        patches = torch.cat([self.cls_token.repeat(patches.shape[0], 1, 1), patches], dim=1)  # class tokenを結合
        features = self.layer_norm(self.transformer(patches))
        logits1 = self.head1(features[:, 0])  # cls tokenのみを入力する
        logits2 = self.head2(features[:, 0])
        logits3 = self.head3(features[:, 0])
        logits = (logits1+logits2+logits3)/3
        return logits

    def get_last_selfattention(self, x):
        patches = self.patchify(x)
        patches = patches + self.pos_embedding

        patches = torch.cat([self.cls_token.repeat(patches.shape[0], 1, 1), patches], dim=1)  # class tokenを結合
        for i, block in enumerate(self.transformer):
            if i < len(self.transformer) - 1:
                patches = block(patches)
            else:
                return block(patches, return_attn=True)

In [56]:
# ハイパーパラメータの設定

subject_index = None

config = {
    "image_size": [271, 280],
    "patch_size": [271, 20],
    "emb_dim": 1854,
    "enc_layers": 24,
    "enc_heads": 8,
    "enc_dim_head": 16,
    "enc_mlp_dim": 1854,
    "dec_layers": 4,
    "dec_heads": 5,
    "dec_dim_head": 16,
    "dec_mlp_dim": 1854,
    "mask_ratio": 0.,
    "dropout": 0.25
}


device = "cuda" if torch.cuda.is_available() else "cpu"
pretrained_model = MAE_ViT(**config).to(device)
#pretrained_model.load_state_dict(torch.load("model/MAE_pretrain_params_subject"+str(subject_index)+"_240713.pth", map_location=device))
#pretrained_model.load_state_dict(torch.load("model/MAE_pretrain_params_withCLIP_subject"+str(subject_index)+"_240715.pth", map_location=device))
pretrained_model.load_state_dict(torch.load("model/MAE_pretrain_params_240716_1.pth", map_location=device))


encoder = pretrained_model.encoder

# モデルの定義
model = ViT_Classifier(encoder).to(device)


In [10]:

subject_index = None
args = {"batch_size": 256, "epochs": 80, "lr": 0.001, "device": "cuda", "num_workers": 0, "seed": 1234, "use_wandb": False, "data_dir": "data/", "model_path": "A"}

# ------------------
#    Dataloader
# ------------------
loader_args = {"batch_size": args["batch_size"], "num_workers": args["num_workers"]}

train_set = ThingsMEGDataset_selective("train", subject_index, args["data_dir"])
train_loader = torch.utils.data.DataLoader(train_set, shuffle=True, **loader_args)
val_set = ThingsMEGDataset_selective("val", subject_index, args["data_dir"])
val_loader = torch.utils.data.DataLoader(val_set, shuffle=False, **loader_args)
test_set = ThingsMEGDataset_selective("test", subject_index, args["data_dir"])
test_loader = torch.utils.data.DataLoader(test_set, shuffle=False, **loader_args)

100%|███████████████████████████████████████████████████████████████████████████| 65728/65728 [01:09<00:00, 945.88it/s]
100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 957.31it/s]
100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 951.71it/s]


In [57]:
device = "cuda" if torch.cuda.is_available() else "cpu"


epochs_csf = 400
lr_csf = 0.001
warmup_length_csf = 25
#optimizer_csf = optim.AdamW(list(model.head1.parameters())+list(model.head2.parameters())+list(model.head3.parameters()), lr=lr_csf, betas=(0.9, 0.999), weight_decay=0.1)  # 分類器部分のみ学習
optimizer_csf = optim.AdamW(model.head.parameters(), lr=lr_csf, betas=(0.9, 0.999), weight_decay=0.05)  # 分類器部分のみ学習
scheduler = CosineScheduler(epochs_csf, lr_csf, warmup_length_csf)
criterion = nn.CrossEntropyLoss()

In [58]:

accuracy = Accuracy(
    task="multiclass", num_classes=train_set.num_classes, top_k=10
).to(device)

best_acc = -1
cnt = 1
# モデルの訓練
for epoch_csf in range(epochs_csf):
    
    total_train_loss_csf = 0.
    total_valid_loss_csf = 0.
    train_loss, train_acc, val_loss, val_acc = [], [], [], []
    step_count = 0

    model.train()
    for x, y, subject_idxs in tqdm(train_loader):
        x, y = x.to(device), y.to(device)
        model.zero_grad()
        
        #with torch.no_grad():
        y_pred = model(x.unsqueeze(1))

        train_loss_csf = criterion(y_pred, y)
        total_train_loss_csf += train_loss_csf.item()
        train_loss.append(train_loss_csf.item())
        
        optimizer_csf.zero_grad()
        train_loss_csf.backward()
        
        optimizer_csf.step()

        acc = accuracy(y_pred, y)
        train_acc.append(acc.item())
        
        step_count += 1
    
    model.eval()
    # モデルの評価
    with torch.no_grad():
        for x, y, subject_idxs in val_loader:
            x, y = x.to(device), y.to(device)
    
            y_pred = model(x.unsqueeze(1))

            valid_loss_csf = criterion(y_pred, y)
            val_loss.append(valid_loss_csf)
            val_acc.append(accuracy(y_pred, y).item())

            total_valid_loss_csf += valid_loss_csf.item()

        
    print(f"Epoch[{epoch_csf+1} / {epochs_csf}] Train Loss: {total_train_loss_csf/len(train_loader):.4f} Valid Loss: {total_valid_loss_csf/len(val_loader):.4f} Train Acc: {np.mean(train_acc):.4f}  Valid Acc: {np.mean(val_acc):.4f} ")

    if (np.mean(val_acc)>=best_acc)*(np.mean(val_acc)>=0.015):
        torch.save(model.state_dict(), "final_model_save/model"+str(cnt)+"_acc"+str(np.mean(val_acc))+".pth")
        best_acc = np.mean(val_acc)
        cnt += 1

100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.75it/s]


Epoch[1 / 400] Train Loss: 7.5211 Valid Loss: 7.5002 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[2 / 400] Train Loss: 7.5066 Valid Loss: 7.4974 Train Acc: 0.0080  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.77it/s]


Epoch[3 / 400] Train Loss: 7.5027 Valid Loss: 7.4950 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.77it/s]


Epoch[4 / 400] Train Loss: 7.5015 Valid Loss: 7.4943 Train Acc: 0.0076  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.76it/s]


Epoch[5 / 400] Train Loss: 7.5005 Valid Loss: 7.4939 Train Acc: 0.0077  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.77it/s]


Epoch[6 / 400] Train Loss: 7.5001 Valid Loss: 7.4936 Train Acc: 0.0077  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.76it/s]


Epoch[7 / 400] Train Loss: 7.4995 Valid Loss: 7.4935 Train Acc: 0.0077  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.77it/s]


Epoch[8 / 400] Train Loss: 7.4993 Valid Loss: 7.4934 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.76it/s]


Epoch[9 / 400] Train Loss: 7.4990 Valid Loss: 7.4930 Train Acc: 0.0073  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.74it/s]


Epoch[10 / 400] Train Loss: 7.4987 Valid Loss: 7.4932 Train Acc: 0.0072  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[11 / 400] Train Loss: 7.4985 Valid Loss: 7.4934 Train Acc: 0.0069  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[12 / 400] Train Loss: 7.4984 Valid Loss: 7.4929 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[13 / 400] Train Loss: 7.4981 Valid Loss: 7.4925 Train Acc: 0.0074  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[14 / 400] Train Loss: 7.4981 Valid Loss: 7.4926 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[15 / 400] Train Loss: 7.4978 Valid Loss: 7.4936 Train Acc: 0.0074  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[16 / 400] Train Loss: 7.4978 Valid Loss: 7.4932 Train Acc: 0.0067  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.78it/s]


Epoch[17 / 400] Train Loss: 7.4976 Valid Loss: 7.4936 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[18 / 400] Train Loss: 7.4976 Valid Loss: 7.4928 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[19 / 400] Train Loss: 7.4973 Valid Loss: 7.4928 Train Acc: 0.0077  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[20 / 400] Train Loss: 7.4973 Valid Loss: 7.4924 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[21 / 400] Train Loss: 7.4975 Valid Loss: 7.4925 Train Acc: 0.0068  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[22 / 400] Train Loss: 7.4971 Valid Loss: 7.4931 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[23 / 400] Train Loss: 7.4971 Valid Loss: 7.4934 Train Acc: 0.0071  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[24 / 400] Train Loss: 7.4971 Valid Loss: 7.4926 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[25 / 400] Train Loss: 7.4971 Valid Loss: 7.4928 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[26 / 400] Train Loss: 7.4970 Valid Loss: 7.4927 Train Acc: 0.0080  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[27 / 400] Train Loss: 7.4969 Valid Loss: 7.4928 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[28 / 400] Train Loss: 7.4968 Valid Loss: 7.4927 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[29 / 400] Train Loss: 7.4969 Valid Loss: 7.4929 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[30 / 400] Train Loss: 7.4969 Valid Loss: 7.4928 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[31 / 400] Train Loss: 7.4967 Valid Loss: 7.4925 Train Acc: 0.0067  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.77it/s]


Epoch[32 / 400] Train Loss: 7.4967 Valid Loss: 7.4931 Train Acc: 0.0066  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[33 / 400] Train Loss: 7.4965 Valid Loss: 7.4926 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[34 / 400] Train Loss: 7.4966 Valid Loss: 7.4928 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[35 / 400] Train Loss: 7.4966 Valid Loss: 7.4928 Train Acc: 0.0079  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[36 / 400] Train Loss: 7.4965 Valid Loss: 7.4929 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[37 / 400] Train Loss: 7.4965 Valid Loss: 7.4928 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[38 / 400] Train Loss: 7.4965 Valid Loss: 7.4924 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[39 / 400] Train Loss: 7.4964 Valid Loss: 7.4935 Train Acc: 0.0068  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[40 / 400] Train Loss: 7.4964 Valid Loss: 7.4924 Train Acc: 0.0068  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[41 / 400] Train Loss: 7.4965 Valid Loss: 7.4926 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[42 / 400] Train Loss: 7.4963 Valid Loss: 7.4925 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[43 / 400] Train Loss: 7.4963 Valid Loss: 7.4927 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[44 / 400] Train Loss: 7.4963 Valid Loss: 7.4927 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[45 / 400] Train Loss: 7.4963 Valid Loss: 7.4930 Train Acc: 0.0076  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.75it/s]


Epoch[46 / 400] Train Loss: 7.4962 Valid Loss: 7.4925 Train Acc: 0.0069  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[47 / 400] Train Loss: 7.4962 Valid Loss: 7.4931 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[48 / 400] Train Loss: 7.4962 Valid Loss: 7.4925 Train Acc: 0.0074  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[49 / 400] Train Loss: 7.4962 Valid Loss: 7.4928 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[50 / 400] Train Loss: 7.4960 Valid Loss: 7.4924 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[51 / 400] Train Loss: 7.4961 Valid Loss: 7.4924 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[52 / 400] Train Loss: 7.4960 Valid Loss: 7.4924 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.75it/s]


Epoch[53 / 400] Train Loss: 7.4963 Valid Loss: 7.4926 Train Acc: 0.0065  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.78it/s]


Epoch[54 / 400] Train Loss: 7.4961 Valid Loss: 7.4927 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.75it/s]


Epoch[55 / 400] Train Loss: 7.4961 Valid Loss: 7.4928 Train Acc: 0.0070  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[56 / 400] Train Loss: 7.4960 Valid Loss: 7.4927 Train Acc: 0.0073  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[57 / 400] Train Loss: 7.4961 Valid Loss: 7.4928 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[58 / 400] Train Loss: 7.4960 Valid Loss: 7.4927 Train Acc: 0.0067  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[59 / 400] Train Loss: 7.4961 Valid Loss: 7.4929 Train Acc: 0.0070  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[60 / 400] Train Loss: 7.4960 Valid Loss: 7.4929 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[61 / 400] Train Loss: 7.4960 Valid Loss: 7.4926 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[62 / 400] Train Loss: 7.4960 Valid Loss: 7.4926 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[63 / 400] Train Loss: 7.4960 Valid Loss: 7.4924 Train Acc: 0.0069  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[64 / 400] Train Loss: 7.4959 Valid Loss: 7.4923 Train Acc: 0.0067  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[65 / 400] Train Loss: 7.4961 Valid Loss: 7.4923 Train Acc: 0.0074  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[66 / 400] Train Loss: 7.4960 Valid Loss: 7.4927 Train Acc: 0.0074  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[67 / 400] Train Loss: 7.4960 Valid Loss: 7.4927 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[68 / 400] Train Loss: 7.4959 Valid Loss: 7.4928 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.78it/s]


Epoch[69 / 400] Train Loss: 7.4960 Valid Loss: 7.4926 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[70 / 400] Train Loss: 7.4959 Valid Loss: 7.4925 Train Acc: 0.0065  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.78it/s]


Epoch[71 / 400] Train Loss: 7.4958 Valid Loss: 7.4924 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[72 / 400] Train Loss: 7.4959 Valid Loss: 7.4927 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[73 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[74 / 400] Train Loss: 7.4958 Valid Loss: 7.4927 Train Acc: 0.0073  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[75 / 400] Train Loss: 7.4959 Valid Loss: 7.4923 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[76 / 400] Train Loss: 7.4959 Valid Loss: 7.4926 Train Acc: 0.0073  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[77 / 400] Train Loss: 7.4958 Valid Loss: 7.4924 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[78 / 400] Train Loss: 7.4958 Valid Loss: 7.4932 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[79 / 400] Train Loss: 7.4959 Valid Loss: 7.4924 Train Acc: 0.0068  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[80 / 400] Train Loss: 7.4958 Valid Loss: 7.4928 Train Acc: 0.0067  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[81 / 400] Train Loss: 7.4958 Valid Loss: 7.4923 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[82 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[83 / 400] Train Loss: 7.4959 Valid Loss: 7.4930 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[84 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[85 / 400] Train Loss: 7.4958 Valid Loss: 7.4928 Train Acc: 0.0076  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[86 / 400] Train Loss: 7.4956 Valid Loss: 7.4924 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[87 / 400] Train Loss: 7.4958 Valid Loss: 7.4924 Train Acc: 0.0077  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[88 / 400] Train Loss: 7.4957 Valid Loss: 7.4924 Train Acc: 0.0071  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[89 / 400] Train Loss: 7.4958 Valid Loss: 7.4931 Train Acc: 0.0079  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[90 / 400] Train Loss: 7.4958 Valid Loss: 7.4925 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[91 / 400] Train Loss: 7.4958 Valid Loss: 7.4927 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[92 / 400] Train Loss: 7.4959 Valid Loss: 7.4928 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[93 / 400] Train Loss: 7.4957 Valid Loss: 7.4926 Train Acc: 0.0070  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[94 / 400] Train Loss: 7.4957 Valid Loss: 7.4929 Train Acc: 0.0071  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[95 / 400] Train Loss: 7.4956 Valid Loss: 7.4926 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[96 / 400] Train Loss: 7.4959 Valid Loss: 7.4924 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[97 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0072  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[98 / 400] Train Loss: 7.4957 Valid Loss: 7.4923 Train Acc: 0.0067  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[99 / 400] Train Loss: 7.4957 Valid Loss: 7.4927 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[100 / 400] Train Loss: 7.4957 Valid Loss: 7.4928 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[101 / 400] Train Loss: 7.4957 Valid Loss: 7.4929 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[102 / 400] Train Loss: 7.4957 Valid Loss: 7.4925 Train Acc: 0.0070  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[103 / 400] Train Loss: 7.4957 Valid Loss: 7.4925 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[104 / 400] Train Loss: 7.4958 Valid Loss: 7.4924 Train Acc: 0.0071  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[105 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0069  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[106 / 400] Train Loss: 7.4956 Valid Loss: 7.4930 Train Acc: 0.0069  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[107 / 400] Train Loss: 7.4958 Valid Loss: 7.4925 Train Acc: 0.0075  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[108 / 400] Train Loss: 7.4956 Valid Loss: 7.4924 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[109 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[110 / 400] Train Loss: 7.4956 Valid Loss: 7.4924 Train Acc: 0.0069  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[111 / 400] Train Loss: 7.4957 Valid Loss: 7.4924 Train Acc: 0.0071  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[112 / 400] Train Loss: 7.4956 Valid Loss: 7.4928 Train Acc: 0.0077  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[113 / 400] Train Loss: 7.4958 Valid Loss: 7.4923 Train Acc: 0.0069  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[114 / 400] Train Loss: 7.4957 Valid Loss: 7.4925 Train Acc: 0.0065  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[115 / 400] Train Loss: 7.4957 Valid Loss: 7.4926 Train Acc: 0.0070  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[116 / 400] Train Loss: 7.4956 Valid Loss: 7.4924 Train Acc: 0.0077  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[117 / 400] Train Loss: 7.4956 Valid Loss: 7.4925 Train Acc: 0.0073  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[118 / 400] Train Loss: 7.4956 Valid Loss: 7.4925 Train Acc: 0.0072  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[119 / 400] Train Loss: 7.4956 Valid Loss: 7.4926 Train Acc: 0.0070  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[120 / 400] Train Loss: 7.4957 Valid Loss: 7.4925 Train Acc: 0.0071  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[121 / 400] Train Loss: 7.4958 Valid Loss: 7.4926 Train Acc: 0.0072  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[122 / 400] Train Loss: 7.4957 Valid Loss: 7.4925 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[123 / 400] Train Loss: 7.4956 Valid Loss: 7.4924 Train Acc: 0.0073  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[124 / 400] Train Loss: 7.4957 Valid Loss: 7.4930 Train Acc: 0.0073  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[125 / 400] Train Loss: 7.4956 Valid Loss: 7.4924 Train Acc: 0.0071  Valid Acc: 0.0101 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[126 / 400] Train Loss: 7.4957 Valid Loss: 7.4927 Train Acc: 0.0076  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:08<00:00,  3.78it/s]


Epoch[127 / 400] Train Loss: 7.4956 Valid Loss: 7.4930 Train Acc: 0.0075  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[128 / 400] Train Loss: 7.4956 Valid Loss: 7.4931 Train Acc: 0.0076  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[129 / 400] Train Loss: 7.4956 Valid Loss: 7.4923 Train Acc: 0.0073  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[130 / 400] Train Loss: 7.4957 Valid Loss: 7.4928 Train Acc: 0.0069  Valid Acc: 0.0099 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.80it/s]


Epoch[131 / 400] Train Loss: 7.4956 Valid Loss: 7.4926 Train Acc: 0.0067  Valid Acc: 0.0107 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.79it/s]


Epoch[132 / 400] Train Loss: 7.4956 Valid Loss: 7.4925 Train Acc: 0.0074  Valid Acc: 0.0096 


100%|████████████████████████████████████████████████████████████████████████████████| 257/257 [01:07<00:00,  3.78it/s]


Epoch[133 / 400] Train Loss: 7.4956 Valid Loss: 7.4926 Train Acc: 0.0070  Valid Acc: 0.0099 


 70%|███████████████████████████████████████████████████████▋                        | 179/257 [00:48<00:21,  3.66it/s]


KeyboardInterrupt: 

In [47]:
logdir = ""
preds = [] 
model.eval()
for X, subject_idxs in tqdm(test_loader, desc="Validation"):        
    preds.append(model(X.to(device).unsqueeze(1)).detach().cpu())
    
preds = torch.cat(preds, dim=0).numpy()
np.save(os.path.join(logdir, "submission"), preds)
cprint(f"Submission {preds.shape} saved at {logdir}", "cyan")


Validation: 100%|██████████████████████████████████████████████████████████████████████| 65/65 [00:09<00:00,  7.10it/s]


[36mSubmission (16432, 1854) saved at [0m


In [None]:
# Model implementation ends here. Further attempts for improvements are shown below this line

In [None]:
# Training MAEs for individual subjects MEG images WITH CLIP (240713)

In [8]:
for ii in range(4):
    # ハイパーパラメータの設定
    config = {
        "image_size": [271, 280],
        "patch_size": [271, 4],
        "emb_dim": 256,
        "enc_layers": 24,
        "enc_heads": 3,
        "enc_dim_head": 16,
        "enc_mlp_dim": 256,
        "dec_layers": 4,
        "dec_heads": 3,
        "dec_dim_head": 16,
        "dec_mlp_dim": 256,
        "mask_ratio": 0.1,
        "dropout": 0.25
    }
    
    device = "cuda" if torch.cuda.is_available() else "cpu"
    model = MAE_ViT(**config).to(device)
    model.load_state_dict(torch.load("model/MAE_pretrain_params_240713.pth", map_location=device))


    # load CLIP
    device = "cuda" if torch.cuda.is_available() else "cpu"
    clip_model = "ViT-L/14"
    CLIP, preprocess = clip.load(clip_model, device=device)

    PL_model = BasicConvProjector(768, 255, 64).to(device)


    args = {"batch_size": 128, "device": "cuda", "num_workers": 0, "seed": 1234, "use_wandb": False, "data_dir": "data/"}
    img_path = "images-002/images/"
    # ------------------
    #    Dataloader
    # ------------------
    
    sj_idx = ii
    img_save_path = "save_imgs/"
    loader_args = {"batch_size": args["batch_size"], "num_workers": args["num_workers"]}
    train_set = ThingsMEGDataset5_PreloadSplit(preprocess, "train", sj_idx, True, args["data_dir"], img_path, clip_model, img_save_path, device, False)
    print("train_set loaded")
    train_loader = torch.utils.data.DataLoader(train_set, shuffle=True, **loader_args)
    val_set = ThingsMEGDataset5_PreloadSplit(preprocess, "val", sj_idx, True, args["data_dir"], img_path, clip_model, img_save_path, device, False)
    print("val_set loaded")
    val_loader = torch.utils.data.DataLoader(val_set, shuffle=False, **loader_args)
    #test_set = ThingsMEGDataset5_PreloadSplit(preprocess, "test", sj_idx, True, args["data_dir"], img_path, clip_model, img_save_path, device, False)
    #print("test_set loaded")
    #test_loader = torch.utils.data.DataLoader(test_set, shuffle=False, batch_size=args["batch_size"], num_workers=args["num_workers"])
        

    
    
    epochs = 100
    lr = 0.0001
    step_count = 0
    warmup_length = 25
    lbd = 0.08
    optimizer = optim.AdamW(list(model.parameters())+list(PL_model.parameters()), lr=lr, betas=(0.9, 0.95), weight_decay=5e-5)
    scheduler = CosineScheduler(epochs, lr, warmup_length)
    cossim = nn.CosineSimilarity(dim=1, eps=1e-6)
    scheduler = CosineScheduler(epochs, lr, warmup_length)


    for epoch in range(epochs):
        # スケジューラで学習率を更新する
        new_lr = scheduler(epoch)
        set_lr(new_lr, optimizer)
    
        total_train_loss_MAE = 0.
        total_valid_loss_MAE = 0.

        total_train_loss_CLIP = 0.
        total_valid_loss_CLIP = 0.

        total_train_loss = 0.
        total_valid_loss = 0.
    
        # モデルの訓練
        model.train()
        CLIP.eval()
        PL_model.train()
        for x, _, _, image_features  in tqdm(train_loader):
            x = x.unsqueeze(1)
            step_count += 1
            x = x.to(device)
            image_features = image_features.to(device)
    
            rec_img, mask = model(x)
            train_loss_MAE = torch.mean((rec_img - x) ** 2 * mask) / config["mask_ratio"]

            #with torch.no_grad():
            features, bk_idx = model.encoder(x)
            meg_features = PL_model(features)
            
            train_loss_CLIP = 1-torch.mean(cossim(meg_features, image_features))
            
            
            train_loss = train_loss_MAE + lbd*train_loss_CLIP
            train_loss.backward()
        
            if step_count % 8 == 0:  # 8イテレーションごとに更新することで，擬似的にバッチサイズを大きくしている
                optimizer.step()
                optimizer.zero_grad()

            total_train_loss_MAE += train_loss_MAE.item()
            total_train_loss_CLIP += train_loss_CLIP.item()
            total_train_loss += train_loss.item()
    
        # モデルの評価
        with torch.no_grad():
            model.eval()
            PL_model.eval()
            for x, _, _, image_features in val_loader:
                x = x.to(device)
                x = x.unsqueeze(1)
                image_features = image_features.to(device)

                rec_img, mask = model(x)
                valid_loss_MAE = torch.mean((rec_img - x) ** 2 * mask) / config["mask_ratio"]

                features, bk_idx = model.encoder(x)
                meg_features = PL_model(features)

                valid_loss_CLIP = 1-torch.mean(cossim(meg_features, image_features))

                valid_loss = train_loss_MAE + lbd*train_loss_CLIP

                total_valid_loss_MAE += valid_loss_MAE.item()
                total_valid_loss_CLIP += valid_loss_CLIP.item()
                total_valid_loss += valid_loss.item()

        
    
        print(f"Epoch[{epoch+1} / {epochs}] Train Loss (MAE): {total_train_loss_MAE/len(train_loader):.4f} Valid Loss (MAE): {total_valid_loss_MAE/len(val_loader):.4f} Train Loss (CLIP): {total_train_loss_CLIP/len(train_loader):.4f} Valid Loss (CLIP): {total_valid_loss_CLIP/len(val_loader):.4f} Train Loss (Total): {total_train_loss/len(train_loader):.4f} Valid Loss (Total): {total_valid_loss/len(val_loader):.4f}")






    torch.save(model.state_dict(), "model/MAE_pretrain_params_withCLIP_subject_240717.pth")
    del model, CLIP, PL_model, train_loss, valid_loss, train_set, val_set
    torch.cuda.empty_cache()







Filtering for train: 100%|██████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 956.28it/s]


train_set loaded


Filtering for val: 100%|██████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 956.89it/s]


val_set loaded


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.20it/s]


Epoch[1 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0394 Train Loss (CLIP): 0.9952 Valid Loss (CLIP): 0.9925 Train Loss (Total): 0.1263 Valid Loss (Total): 0.1276


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[2 / 100] Train Loss (MAE): 0.0466 Valid Loss (MAE): 0.0394 Train Loss (CLIP): 0.9521 Valid Loss (CLIP): 0.9794 Train Loss (Total): 0.1228 Valid Loss (Total): 0.1223


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[3 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.8712 Valid Loss (CLIP): 0.9425 Train Loss (Total): 0.1162 Valid Loss (Total): 0.1121


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[4 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0396 Train Loss (CLIP): 0.7981 Valid Loss (CLIP): 0.8969 Train Loss (Total): 0.1104 Valid Loss (Total): 0.1109


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[5 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0395 Train Loss (CLIP): 0.7497 Valid Loss (CLIP): 0.8445 Train Loss (Total): 0.1064 Valid Loss (Total): 0.1069


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[6 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0395 Train Loss (CLIP): 0.7157 Valid Loss (CLIP): 0.7820 Train Loss (Total): 0.1037 Valid Loss (Total): 0.0989


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[7 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.7018 Valid Loss (CLIP): 0.7130 Train Loss (Total): 0.1025 Valid Loss (Total): 0.1051


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[8 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0395 Train Loss (CLIP): 0.6924 Valid Loss (CLIP): 0.6476 Train Loss (Total): 0.1018 Valid Loss (Total): 0.1034


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[9 / 100] Train Loss (MAE): 0.0466 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6870 Valid Loss (CLIP): 0.5965 Train Loss (Total): 0.1015 Valid Loss (Total): 0.1022


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[10 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0396 Train Loss (CLIP): 0.6822 Valid Loss (CLIP): 0.5595 Train Loss (Total): 0.1009 Valid Loss (Total): 0.1026


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[11 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0397 Train Loss (CLIP): 0.6839 Valid Loss (CLIP): 0.5379 Train Loss (Total): 0.1010 Valid Loss (Total): 0.1008


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[12 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0394 Train Loss (CLIP): 0.6818 Valid Loss (CLIP): 0.5233 Train Loss (Total): 0.1009 Valid Loss (Total): 0.0973


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[13 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6809 Valid Loss (CLIP): 0.5128 Train Loss (Total): 0.1007 Valid Loss (Total): 0.0964


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[14 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6780 Valid Loss (CLIP): 0.5042 Train Loss (Total): 0.1003 Valid Loss (Total): 0.0985


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[15 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6775 Valid Loss (CLIP): 0.4975 Train Loss (Total): 0.1004 Valid Loss (Total): 0.1005


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[16 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6793 Valid Loss (CLIP): 0.4913 Train Loss (Total): 0.1007 Valid Loss (Total): 0.1071


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[17 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6784 Valid Loss (CLIP): 0.4885 Train Loss (Total): 0.1005 Valid Loss (Total): 0.0997


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[18 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6772 Valid Loss (CLIP): 0.4851 Train Loss (Total): 0.1004 Valid Loss (Total): 0.0969


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[19 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6740 Valid Loss (CLIP): 0.4822 Train Loss (Total): 0.1001 Valid Loss (Total): 0.1000


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[20 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0397 Train Loss (CLIP): 0.6744 Valid Loss (CLIP): 0.4803 Train Loss (Total): 0.1001 Valid Loss (Total): 0.0978


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[21 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6736 Valid Loss (CLIP): 0.4787 Train Loss (Total): 0.1001 Valid Loss (Total): 0.1020


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[22 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6718 Valid Loss (CLIP): 0.4767 Train Loss (Total): 0.0999 Valid Loss (Total): 0.0983


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[23 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6698 Valid Loss (CLIP): 0.4754 Train Loss (Total): 0.0999 Valid Loss (Total): 0.1015


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[24 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0395 Train Loss (CLIP): 0.6714 Valid Loss (CLIP): 0.4745 Train Loss (Total): 0.0999 Valid Loss (Total): 0.1000


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[25 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6697 Valid Loss (CLIP): 0.4734 Train Loss (Total): 0.0998 Valid Loss (Total): 0.1026


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[26 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6683 Valid Loss (CLIP): 0.4726 Train Loss (Total): 0.0996 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[27 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6673 Valid Loss (CLIP): 0.4717 Train Loss (Total): 0.0996 Valid Loss (Total): 0.0968


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[28 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0396 Train Loss (CLIP): 0.6690 Valid Loss (CLIP): 0.4713 Train Loss (Total): 0.0997 Valid Loss (Total): 0.1022


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[29 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6673 Valid Loss (CLIP): 0.4708 Train Loss (Total): 0.0996 Valid Loss (Total): 0.0990


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[30 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6642 Valid Loss (CLIP): 0.4702 Train Loss (Total): 0.0992 Valid Loss (Total): 0.1019


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[31 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0398 Train Loss (CLIP): 0.6653 Valid Loss (CLIP): 0.4700 Train Loss (Total): 0.0995 Valid Loss (Total): 0.0943


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[32 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6654 Valid Loss (CLIP): 0.4696 Train Loss (Total): 0.0992 Valid Loss (Total): 0.0981


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[33 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6621 Valid Loss (CLIP): 0.4693 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1006


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[34 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6654 Valid Loss (CLIP): 0.4691 Train Loss (Total): 0.0993 Valid Loss (Total): 0.0970


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[35 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6654 Valid Loss (CLIP): 0.4688 Train Loss (Total): 0.0993 Valid Loss (Total): 0.0989


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[36 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6651 Valid Loss (CLIP): 0.4686 Train Loss (Total): 0.0993 Valid Loss (Total): 0.1003


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[37 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6652 Valid Loss (CLIP): 0.4683 Train Loss (Total): 0.0993 Valid Loss (Total): 0.1003


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.35it/s]


Epoch[38 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6610 Valid Loss (CLIP): 0.4681 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0982


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[39 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6653 Valid Loss (CLIP): 0.4679 Train Loss (Total): 0.0993 Valid Loss (Total): 0.0983


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[40 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0394 Train Loss (CLIP): 0.6621 Valid Loss (CLIP): 0.4678 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1009


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.39it/s]


Epoch[41 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6624 Valid Loss (CLIP): 0.4676 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0962


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[42 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0394 Train Loss (CLIP): 0.6612 Valid Loss (CLIP): 0.4676 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0966


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[43 / 100] Train Loss (MAE): 0.0461 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6626 Valid Loss (CLIP): 0.4673 Train Loss (Total): 0.0991 Valid Loss (Total): 0.1027


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[44 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4672 Train Loss (Total): 0.0988 Valid Loss (Total): 0.1004


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[45 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6619 Valid Loss (CLIP): 0.4671 Train Loss (Total): 0.0987 Valid Loss (Total): 0.1009


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[46 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4671 Train Loss (Total): 0.0987 Valid Loss (Total): 0.0991


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[47 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6625 Valid Loss (CLIP): 0.4670 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0999


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[48 / 100] Train Loss (MAE): 0.0459 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6618 Valid Loss (CLIP): 0.4669 Train Loss (Total): 0.0988 Valid Loss (Total): 0.0996


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[49 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0393 Train Loss (CLIP): 0.6619 Valid Loss (CLIP): 0.4669 Train Loss (Total): 0.0987 Valid Loss (Total): 0.1038


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[50 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0394 Train Loss (CLIP): 0.6609 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0987 Valid Loss (Total): 0.0961


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[51 / 100] Train Loss (MAE): 0.0459 Valid Loss (MAE): 0.0392 Train Loss (CLIP): 0.6597 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0987 Valid Loss (Total): 0.0994


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[52 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6615 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0975


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[53 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4666 Train Loss (Total): 0.0986 Valid Loss (Total): 0.0981


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[54 / 100] Train Loss (MAE): 0.0459 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6608 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0987 Valid Loss (Total): 0.1017


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[55 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6608 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0986 Valid Loss (Total): 0.0979


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[56 / 100] Train Loss (MAE): 0.0460 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6582 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0986 Valid Loss (Total): 0.0958


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[57 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6609 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0987 Valid Loss (Total): 0.0956


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.34it/s]


Epoch[58 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6626 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0988 Valid Loss (Total): 0.0995


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[59 / 100] Train Loss (MAE): 0.0459 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6603 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0988 Valid Loss (Total): 0.1005


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[60 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6610 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0986 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.35it/s]


Epoch[61 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0985 Valid Loss (Total): 0.1012


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[62 / 100] Train Loss (MAE): 0.0458 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.6611 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0987 Valid Loss (Total): 0.0972


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[63 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0986 Valid Loss (Total): 0.0996


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[64 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6599 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0984 Valid Loss (Total): 0.0989


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[65 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6613 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0986 Valid Loss (Total): 0.1006


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[66 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6588 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0949


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[67 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0985 Valid Loss (Total): 0.0950


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[68 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0985 Valid Loss (Total): 0.0991


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[69 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0984 Valid Loss (Total): 0.0992


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[70 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6586 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0984 Valid Loss (Total): 0.0978


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[71 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6591 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0984 Valid Loss (Total): 0.0929


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[72 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6617 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0984 Valid Loss (Total): 0.1007


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[73 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6591 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0986


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[74 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0391 Train Loss (CLIP): 0.6579 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0973


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.34it/s]


Epoch[75 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0954


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[76 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6588 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0926


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[77 / 100] Train Loss (MAE): 0.0457 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6591 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0984 Valid Loss (Total): 0.1011


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.35it/s]


Epoch[78 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6586 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0955


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[79 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6592 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[80 / 100] Train Loss (MAE): 0.0453 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.1005


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.36it/s]


Epoch[81 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6571 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.0987


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[82 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6587 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.0945


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[83 / 100] Train Loss (MAE): 0.0456 Valid Loss (MAE): 0.0388 Train Loss (CLIP): 0.6578 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0997


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.35it/s]


Epoch[84 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0965


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[85 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0983 Valid Loss (Total): 0.1015


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[86 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6592 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.0967


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[87 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6592 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0960


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[88 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6584 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.0957


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[89 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6611 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0983 Valid Loss (Total): 0.1011


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[90 / 100] Train Loss (MAE): 0.0453 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6596 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.1023


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[91 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6579 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.0995


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[92 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6596 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0944


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[93 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6575 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0980 Valid Loss (Total): 0.0972


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.34it/s]


Epoch[94 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6599 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0980


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.35it/s]


Epoch[95 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6588 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0990


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[96 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6594 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0976


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[97 / 100] Train Loss (MAE): 0.0453 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.6603 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0981 Valid Loss (Total): 0.0992


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[98 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6606 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0983 Valid Loss (Total): 0.0938


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[99 / 100] Train Loss (MAE): 0.0454 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0982 Valid Loss (Total): 0.1015


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[100 / 100] Train Loss (MAE): 0.0455 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0983 Valid Loss (Total): 0.1034


Filtering for train: 100%|██████████████████████████████████████████████████████| 16432/16432 [00:18<00:00, 891.34it/s]


train_set loaded


Filtering for val: 100%|██████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 933.28it/s]


val_set loaded


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[1 / 100] Train Loss (MAE): 0.0476 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.9902 Valid Loss (CLIP): 1.0091 Train Loss (Total): 0.1269 Valid Loss (Total): 0.1264


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[2 / 100] Train Loss (MAE): 0.0475 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.9349 Valid Loss (CLIP): 0.9925 Train Loss (Total): 0.1223 Valid Loss (Total): 0.1177


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[3 / 100] Train Loss (MAE): 0.0478 Valid Loss (MAE): 0.0390 Train Loss (CLIP): 0.8601 Valid Loss (CLIP): 0.9528 Train Loss (Total): 0.1166 Valid Loss (Total): 0.1145


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[4 / 100] Train Loss (MAE): 0.0475 Valid Loss (MAE): 0.0387 Train Loss (CLIP): 0.7961 Valid Loss (CLIP): 0.8980 Train Loss (Total): 0.1112 Valid Loss (Total): 0.1099


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[5 / 100] Train Loss (MAE): 0.0475 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.7495 Valid Loss (CLIP): 0.8246 Train Loss (Total): 0.1075 Valid Loss (Total): 0.1073


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[6 / 100] Train Loss (MAE): 0.0475 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.7177 Valid Loss (CLIP): 0.7315 Train Loss (Total): 0.1049 Valid Loss (Total): 0.1087


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[7 / 100] Train Loss (MAE): 0.0473 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.7002 Valid Loss (CLIP): 0.6418 Train Loss (Total): 0.1034 Valid Loss (Total): 0.1016


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[8 / 100] Train Loss (MAE): 0.0475 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.6896 Valid Loss (CLIP): 0.5762 Train Loss (Total): 0.1027 Valid Loss (Total): 0.0980


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[9 / 100] Train Loss (MAE): 0.0474 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6848 Valid Loss (CLIP): 0.5418 Train Loss (Total): 0.1022 Valid Loss (Total): 0.0996


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[10 / 100] Train Loss (MAE): 0.0473 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6870 Valid Loss (CLIP): 0.5237 Train Loss (Total): 0.1022 Valid Loss (Total): 0.1063


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[11 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6832 Valid Loss (CLIP): 0.5113 Train Loss (Total): 0.1018 Valid Loss (Total): 0.1018


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[12 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6823 Valid Loss (CLIP): 0.5038 Train Loss (Total): 0.1018 Valid Loss (Total): 0.1019


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.18it/s]


Epoch[13 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6813 Valid Loss (CLIP): 0.4988 Train Loss (Total): 0.1015 Valid Loss (Total): 0.1007


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[14 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6818 Valid Loss (CLIP): 0.4951 Train Loss (Total): 0.1017 Valid Loss (Total): 0.1038


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[15 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0382 Train Loss (CLIP): 0.6779 Valid Loss (CLIP): 0.4903 Train Loss (Total): 0.1015 Valid Loss (Total): 0.1033


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[16 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6776 Valid Loss (CLIP): 0.4880 Train Loss (Total): 0.1014 Valid Loss (Total): 0.0969


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.34it/s]


Epoch[17 / 100] Train Loss (MAE): 0.0473 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6773 Valid Loss (CLIP): 0.4851 Train Loss (Total): 0.1015 Valid Loss (Total): 0.0971


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[18 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0386 Train Loss (CLIP): 0.6729 Valid Loss (CLIP): 0.4827 Train Loss (Total): 0.1010 Valid Loss (Total): 0.1008


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[19 / 100] Train Loss (MAE): 0.0471 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.6722 Valid Loss (CLIP): 0.4806 Train Loss (Total): 0.1009 Valid Loss (Total): 0.0992


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[20 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6718 Valid Loss (CLIP): 0.4789 Train Loss (Total): 0.1010 Valid Loss (Total): 0.1058


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[21 / 100] Train Loss (MAE): 0.0473 Valid Loss (MAE): 0.0382 Train Loss (CLIP): 0.6768 Valid Loss (CLIP): 0.4775 Train Loss (Total): 0.1015 Valid Loss (Total): 0.0981


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[22 / 100] Train Loss (MAE): 0.0471 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.6716 Valid Loss (CLIP): 0.4758 Train Loss (Total): 0.1008 Valid Loss (Total): 0.0995


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[23 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6705 Valid Loss (CLIP): 0.4743 Train Loss (Total): 0.1008 Valid Loss (Total): 0.1036


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[24 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6690 Valid Loss (CLIP): 0.4731 Train Loss (Total): 0.1007 Valid Loss (Total): 0.1029


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[25 / 100] Train Loss (MAE): 0.0472 Valid Loss (MAE): 0.0384 Train Loss (CLIP): 0.6696 Valid Loss (CLIP): 0.4722 Train Loss (Total): 0.1008 Valid Loss (Total): 0.1036


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[26 / 100] Train Loss (MAE): 0.0471 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6688 Valid Loss (CLIP): 0.4718 Train Loss (Total): 0.1006 Valid Loss (Total): 0.0946


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[27 / 100] Train Loss (MAE): 0.0471 Valid Loss (MAE): 0.0389 Train Loss (CLIP): 0.6660 Valid Loss (CLIP): 0.4712 Train Loss (Total): 0.1004 Valid Loss (Total): 0.1027


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[28 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6667 Valid Loss (CLIP): 0.4707 Train Loss (Total): 0.1003 Valid Loss (Total): 0.0969


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[29 / 100] Train Loss (MAE): 0.0471 Valid Loss (MAE): 0.0380 Train Loss (CLIP): 0.6657 Valid Loss (CLIP): 0.4702 Train Loss (Total): 0.1004 Valid Loss (Total): 0.1041


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[30 / 100] Train Loss (MAE): 0.0469 Valid Loss (MAE): 0.0382 Train Loss (CLIP): 0.6659 Valid Loss (CLIP): 0.4698 Train Loss (Total): 0.1002 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[31 / 100] Train Loss (MAE): 0.0469 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6667 Valid Loss (CLIP): 0.4694 Train Loss (Total): 0.1003 Valid Loss (Total): 0.0988


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[32 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6653 Valid Loss (CLIP): 0.4693 Train Loss (Total): 0.1002 Valid Loss (Total): 0.1038


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[33 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6634 Valid Loss (CLIP): 0.4689 Train Loss (Total): 0.1001 Valid Loss (Total): 0.0981


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[34 / 100] Train Loss (MAE): 0.0471 Valid Loss (MAE): 0.0385 Train Loss (CLIP): 0.6649 Valid Loss (CLIP): 0.4686 Train Loss (Total): 0.1003 Valid Loss (Total): 0.1035


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[35 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6646 Valid Loss (CLIP): 0.4684 Train Loss (Total): 0.1002 Valid Loss (Total): 0.1028


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[36 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6629 Valid Loss (CLIP): 0.4684 Train Loss (Total): 0.1001 Valid Loss (Total): 0.1002


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[37 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6614 Valid Loss (CLIP): 0.4681 Train Loss (Total): 0.0999 Valid Loss (Total): 0.0983


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[38 / 100] Train Loss (MAE): 0.0469 Valid Loss (MAE): 0.0382 Train Loss (CLIP): 0.6633 Valid Loss (CLIP): 0.4679 Train Loss (Total): 0.0999 Valid Loss (Total): 0.1016


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[39 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0380 Train Loss (CLIP): 0.6646 Valid Loss (CLIP): 0.4677 Train Loss (Total): 0.1002 Valid Loss (Total): 0.0978


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[40 / 100] Train Loss (MAE): 0.0469 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6630 Valid Loss (CLIP): 0.4676 Train Loss (Total): 0.0999 Valid Loss (Total): 0.1044


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[41 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0380 Train Loss (CLIP): 0.6644 Valid Loss (CLIP): 0.4676 Train Loss (Total): 0.0999 Valid Loss (Total): 0.0967


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[42 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0380 Train Loss (CLIP): 0.6619 Valid Loss (CLIP): 0.4673 Train Loss (Total): 0.0997 Valid Loss (Total): 0.1040


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[43 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6633 Valid Loss (CLIP): 0.4672 Train Loss (Total): 0.0999 Valid Loss (Total): 0.0967


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[44 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6616 Valid Loss (CLIP): 0.4672 Train Loss (Total): 0.0997 Valid Loss (Total): 0.0994


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[45 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6613 Valid Loss (CLIP): 0.4671 Train Loss (Total): 0.0997 Valid Loss (Total): 0.0983


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[46 / 100] Train Loss (MAE): 0.0470 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4670 Train Loss (Total): 0.0997 Valid Loss (Total): 0.1027


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[47 / 100] Train Loss (MAE): 0.0469 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4669 Train Loss (Total): 0.0997 Valid Loss (Total): 0.1028


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[48 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0383 Train Loss (CLIP): 0.6629 Valid Loss (CLIP): 0.4668 Train Loss (Total): 0.0998 Valid Loss (Total): 0.0981


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[49 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0382 Train Loss (CLIP): 0.6586 Valid Loss (CLIP): 0.4668 Train Loss (Total): 0.0994 Valid Loss (Total): 0.1021


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[50 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6589 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0995 Valid Loss (Total): 0.0955


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[51 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0380 Train Loss (CLIP): 0.6623 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0998 Valid Loss (Total): 0.0961


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[52 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0381 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4666 Train Loss (Total): 0.0993 Valid Loss (Total): 0.1037


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[53 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0377 Train Loss (CLIP): 0.6607 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0995 Valid Loss (Total): 0.0983


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[54 / 100] Train Loss (MAE): 0.0468 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6621 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0997 Valid Loss (Total): 0.1046


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[55 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0995 Valid Loss (Total): 0.1005


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[56 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6571 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0991 Valid Loss (Total): 0.0943


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[57 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0376 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0993 Valid Loss (Total): 0.1028


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[58 / 100] Train Loss (MAE): 0.0466 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6616 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0995 Valid Loss (Total): 0.0968


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[59 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0377 Train Loss (CLIP): 0.6615 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0997 Valid Loss (Total): 0.0992


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[60 / 100] Train Loss (MAE): 0.0467 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6588 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0994 Valid Loss (Total): 0.1015


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[61 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0379 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0993 Valid Loss (Total): 0.0960


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[62 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0377 Train Loss (CLIP): 0.6586 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0992 Valid Loss (Total): 0.1037


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[63 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6611 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0994 Valid Loss (Total): 0.0994


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[64 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6583 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0991 Valid Loss (Total): 0.0992


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[65 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0375 Train Loss (CLIP): 0.6621 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0994 Valid Loss (Total): 0.1030


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[66 / 100] Train Loss (MAE): 0.0466 Valid Loss (MAE): 0.0376 Train Loss (CLIP): 0.6606 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0995 Valid Loss (Total): 0.0971


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[67 / 100] Train Loss (MAE): 0.0466 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0994 Valid Loss (Total): 0.0972


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[68 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0374 Train Loss (CLIP): 0.6596 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0993 Valid Loss (Total): 0.0986


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[69 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0377 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0992 Valid Loss (Total): 0.1001


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.20it/s]


Epoch[70 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6629 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0996 Valid Loss (Total): 0.1027


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[71 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0375 Train Loss (CLIP): 0.6599 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0992 Valid Loss (Total): 0.1023


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[72 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6615 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0993 Valid Loss (Total): 0.0996


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[73 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0376 Train Loss (CLIP): 0.6568 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0975


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[74 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0372 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0991 Valid Loss (Total): 0.0957


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[75 / 100] Train Loss (MAE): 0.0465 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6596 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0992 Valid Loss (Total): 0.0960


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[76 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6562 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0970


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[77 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0375 Train Loss (CLIP): 0.6580 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0971


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[78 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0374 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0991 Valid Loss (Total): 0.1027


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[79 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0371 Train Loss (CLIP): 0.6623 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0994 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[80 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0372 Train Loss (CLIP): 0.6582 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1007


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[81 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0376 Train Loss (CLIP): 0.6578 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0976


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.35it/s]


Epoch[82 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0374 Train Loss (CLIP): 0.6606 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0992 Valid Loss (Total): 0.0977


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[83 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6579 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1002


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[84 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0375 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0991 Valid Loss (Total): 0.1015


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[85 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0378 Train Loss (CLIP): 0.6616 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0992 Valid Loss (Total): 0.0955


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[86 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0372 Train Loss (CLIP): 0.6580 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0981


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[87 / 100] Train Loss (MAE): 0.0464 Valid Loss (MAE): 0.0374 Train Loss (CLIP): 0.6586 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0991 Valid Loss (Total): 0.0968


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.34it/s]


Epoch[88 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0376 Train Loss (CLIP): 0.6606 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0992 Valid Loss (Total): 0.1018


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[89 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0374 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0986


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[90 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0373 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1009


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[91 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0373 Train Loss (CLIP): 0.6607 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0992 Valid Loss (Total): 0.0968


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[92 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0375 Train Loss (CLIP): 0.6585 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0969


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[93 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0372 Train Loss (CLIP): 0.6615 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0991 Valid Loss (Total): 0.0982


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[94 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0374 Train Loss (CLIP): 0.6581 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0973


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[95 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0376 Train Loss (CLIP): 0.6592 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1039


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[96 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0371 Train Loss (CLIP): 0.6576 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0989 Valid Loss (Total): 0.0976


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[97 / 100] Train Loss (MAE): 0.0463 Valid Loss (MAE): 0.0372 Train Loss (CLIP): 0.6589 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.1019


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[98 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0377 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0991 Valid Loss (Total): 0.0976


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[99 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0370 Train Loss (CLIP): 0.6591 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0997


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[100 / 100] Train Loss (MAE): 0.0462 Valid Loss (MAE): 0.0373 Train Loss (CLIP): 0.6591 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0994


Filtering for train: 100%|██████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 951.02it/s]


train_set loaded


Filtering for val: 100%|██████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 943.58it/s]


val_set loaded


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[1 / 100] Train Loss (MAE): 0.0442 Valid Loss (MAE): 0.0360 Train Loss (CLIP): 0.9849 Valid Loss (CLIP): 0.9838 Train Loss (Total): 0.1229 Valid Loss (Total): 0.1193


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[2 / 100] Train Loss (MAE): 0.0439 Valid Loss (MAE): 0.0358 Train Loss (CLIP): 0.9255 Valid Loss (CLIP): 0.9583 Train Loss (Total): 0.1179 Valid Loss (Total): 0.1142


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[3 / 100] Train Loss (MAE): 0.0438 Valid Loss (MAE): 0.0360 Train Loss (CLIP): 0.8542 Valid Loss (CLIP): 0.9189 Train Loss (Total): 0.1121 Valid Loss (Total): 0.1072


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[4 / 100] Train Loss (MAE): 0.0438 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.7899 Valid Loss (CLIP): 0.8681 Train Loss (Total): 0.1070 Valid Loss (Total): 0.1028


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[5 / 100] Train Loss (MAE): 0.0437 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.7470 Valid Loss (CLIP): 0.8054 Train Loss (Total): 0.1035 Valid Loss (Total): 0.0996


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.20it/s]


Epoch[6 / 100] Train Loss (MAE): 0.0438 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.7172 Valid Loss (CLIP): 0.7340 Train Loss (Total): 0.1011 Valid Loss (Total): 0.0985


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[7 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.7016 Valid Loss (CLIP): 0.6601 Train Loss (Total): 0.0996 Valid Loss (Total): 0.0957


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[8 / 100] Train Loss (MAE): 0.0437 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6912 Valid Loss (CLIP): 0.5965 Train Loss (Total): 0.0990 Valid Loss (Total): 0.0986


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[9 / 100] Train Loss (MAE): 0.0438 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6871 Valid Loss (CLIP): 0.5554 Train Loss (Total): 0.0988 Valid Loss (Total): 0.0948


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[10 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6875 Valid Loss (CLIP): 0.5301 Train Loss (Total): 0.0986 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[11 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6860 Valid Loss (CLIP): 0.5178 Train Loss (Total): 0.0985 Valid Loss (Total): 0.0972


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[12 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6818 Valid Loss (CLIP): 0.5088 Train Loss (Total): 0.0982 Valid Loss (Total): 0.0957


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[13 / 100] Train Loss (MAE): 0.0437 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6803 Valid Loss (CLIP): 0.5026 Train Loss (Total): 0.0981 Valid Loss (Total): 0.1005


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[14 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6796 Valid Loss (CLIP): 0.4982 Train Loss (Total): 0.0979 Valid Loss (Total): 0.0971


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[15 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6780 Valid Loss (CLIP): 0.4945 Train Loss (Total): 0.0977 Valid Loss (Total): 0.1017


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[16 / 100] Train Loss (MAE): 0.0437 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6773 Valid Loss (CLIP): 0.4906 Train Loss (Total): 0.0979 Valid Loss (Total): 0.0923


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[17 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6758 Valid Loss (CLIP): 0.4878 Train Loss (Total): 0.0977 Valid Loss (Total): 0.1010


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[18 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6757 Valid Loss (CLIP): 0.4852 Train Loss (Total): 0.0977 Valid Loss (Total): 0.0985


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[19 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6731 Valid Loss (CLIP): 0.4829 Train Loss (Total): 0.0972 Valid Loss (Total): 0.0938


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.20it/s]


Epoch[20 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6744 Valid Loss (CLIP): 0.4806 Train Loss (Total): 0.0974 Valid Loss (Total): 0.1018


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[21 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6719 Valid Loss (CLIP): 0.4788 Train Loss (Total): 0.0974 Valid Loss (Total): 0.1002


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[22 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6713 Valid Loss (CLIP): 0.4772 Train Loss (Total): 0.0972 Valid Loss (Total): 0.0987


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[23 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6730 Valid Loss (CLIP): 0.4761 Train Loss (Total): 0.0974 Valid Loss (Total): 0.1011


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[24 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6701 Valid Loss (CLIP): 0.4744 Train Loss (Total): 0.0971 Valid Loss (Total): 0.0962


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[25 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6705 Valid Loss (CLIP): 0.4735 Train Loss (Total): 0.0973 Valid Loss (Total): 0.0998


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[26 / 100] Train Loss (MAE): 0.0436 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6663 Valid Loss (CLIP): 0.4724 Train Loss (Total): 0.0969 Valid Loss (Total): 0.0933


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[27 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6671 Valid Loss (CLIP): 0.4717 Train Loss (Total): 0.0968 Valid Loss (Total): 0.0939


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[28 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0357 Train Loss (CLIP): 0.6691 Valid Loss (CLIP): 0.4714 Train Loss (Total): 0.0970 Valid Loss (Total): 0.0952


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[29 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6678 Valid Loss (CLIP): 0.4705 Train Loss (Total): 0.0969 Valid Loss (Total): 0.1044


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[30 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6663 Valid Loss (CLIP): 0.4702 Train Loss (Total): 0.0968 Valid Loss (Total): 0.1012


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[31 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0357 Train Loss (CLIP): 0.6677 Valid Loss (CLIP): 0.4697 Train Loss (Total): 0.0969 Valid Loss (Total): 0.1005


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[32 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0358 Train Loss (CLIP): 0.6676 Valid Loss (CLIP): 0.4694 Train Loss (Total): 0.0968 Valid Loss (Total): 0.0976


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[33 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6649 Valid Loss (CLIP): 0.4692 Train Loss (Total): 0.0966 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[34 / 100] Train Loss (MAE): 0.0435 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6634 Valid Loss (CLIP): 0.4687 Train Loss (Total): 0.0965 Valid Loss (Total): 0.0947


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[35 / 100] Train Loss (MAE): 0.0433 Valid Loss (MAE): 0.0354 Train Loss (CLIP): 0.6647 Valid Loss (CLIP): 0.4687 Train Loss (Total): 0.0965 Valid Loss (Total): 0.0928


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[36 / 100] Train Loss (MAE): 0.0433 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6639 Valid Loss (CLIP): 0.4684 Train Loss (Total): 0.0965 Valid Loss (Total): 0.0977


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[37 / 100] Train Loss (MAE): 0.0433 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6645 Valid Loss (CLIP): 0.4682 Train Loss (Total): 0.0964 Valid Loss (Total): 0.0973


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[38 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0357 Train Loss (CLIP): 0.6628 Valid Loss (CLIP): 0.4680 Train Loss (Total): 0.0963 Valid Loss (Total): 0.0931


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[39 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6641 Valid Loss (CLIP): 0.4678 Train Loss (Total): 0.0963 Valid Loss (Total): 0.0918


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[40 / 100] Train Loss (MAE): 0.0434 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6619 Valid Loss (CLIP): 0.4677 Train Loss (Total): 0.0964 Valid Loss (Total): 0.0991


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.20it/s]


Epoch[41 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0355 Train Loss (CLIP): 0.6607 Valid Loss (CLIP): 0.4675 Train Loss (Total): 0.0961 Valid Loss (Total): 0.0999


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[42 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6622 Valid Loss (CLIP): 0.4674 Train Loss (Total): 0.0961 Valid Loss (Total): 0.0943


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[43 / 100] Train Loss (MAE): 0.0433 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6627 Valid Loss (CLIP): 0.4673 Train Loss (Total): 0.0963 Valid Loss (Total): 0.0972


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[44 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6615 Valid Loss (CLIP): 0.4672 Train Loss (Total): 0.0961 Valid Loss (Total): 0.1030


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[45 / 100] Train Loss (MAE): 0.0433 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6611 Valid Loss (CLIP): 0.4671 Train Loss (Total): 0.0962 Valid Loss (Total): 0.0927


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[46 / 100] Train Loss (MAE): 0.0431 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6616 Valid Loss (CLIP): 0.4670 Train Loss (Total): 0.0961 Valid Loss (Total): 0.0938


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[47 / 100] Train Loss (MAE): 0.0433 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6608 Valid Loss (CLIP): 0.4669 Train Loss (Total): 0.0962 Valid Loss (Total): 0.0953


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[48 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0356 Train Loss (CLIP): 0.6642 Valid Loss (CLIP): 0.4668 Train Loss (Total): 0.0964 Valid Loss (Total): 0.1021


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[49 / 100] Train Loss (MAE): 0.0431 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6615 Valid Loss (CLIP): 0.4668 Train Loss (Total): 0.0960 Valid Loss (Total): 0.0945


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[50 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6602 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0960 Valid Loss (Total): 0.0962


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[51 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0353 Train Loss (CLIP): 0.6613 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0961 Valid Loss (Total): 0.0968


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[52 / 100] Train Loss (MAE): 0.0431 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4667 Train Loss (Total): 0.0959 Valid Loss (Total): 0.0935


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[53 / 100] Train Loss (MAE): 0.0432 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6612 Valid Loss (CLIP): 0.4666 Train Loss (Total): 0.0961 Valid Loss (Total): 0.0989


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[54 / 100] Train Loss (MAE): 0.0431 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6613 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0960 Valid Loss (Total): 0.0975


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[55 / 100] Train Loss (MAE): 0.0431 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6607 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0960 Valid Loss (Total): 0.0924


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[56 / 100] Train Loss (MAE): 0.0429 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6596 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0941


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[57 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0352 Train Loss (CLIP): 0.6616 Valid Loss (CLIP): 0.4665 Train Loss (Total): 0.0959 Valid Loss (Total): 0.0973


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.31it/s]


Epoch[58 / 100] Train Loss (MAE): 0.0429 Valid Loss (MAE): 0.0350 Train Loss (CLIP): 0.6603 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0986


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[59 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6581 Valid Loss (CLIP): 0.4664 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0921


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[60 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6624 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0960 Valid Loss (Total): 0.0879


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[61 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0347 Train Loss (CLIP): 0.6625 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0960 Valid Loss (Total): 0.0979


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.34it/s]


Epoch[62 / 100] Train Loss (MAE): 0.0429 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6591 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0978


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[63 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0959 Valid Loss (Total): 0.0979


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[64 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0350 Train Loss (CLIP): 0.6584 Valid Loss (CLIP): 0.4663 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0940


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[65 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0347 Train Loss (CLIP): 0.6578 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0954 Valid Loss (Total): 0.0932


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.32it/s]


Epoch[66 / 100] Train Loss (MAE): 0.0429 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6601 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0989


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[67 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0958 Valid Loss (Total): 0.0949


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[68 / 100] Train Loss (MAE): 0.0429 Valid Loss (MAE): 0.0347 Train Loss (CLIP): 0.6628 Valid Loss (CLIP): 0.4662 Train Loss (Total): 0.0959 Valid Loss (Total): 0.0944


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.36it/s]


Epoch[69 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0350 Train Loss (CLIP): 0.6566 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0953 Valid Loss (Total): 0.0953


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[70 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6594 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0973


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[71 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6612 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0983


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.37it/s]


Epoch[72 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0977


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[73 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0966


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.31it/s]


Epoch[74 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6580 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0955


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:38<00:00,  3.33it/s]


Epoch[75 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6594 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0954 Valid Loss (Total): 0.0993


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.29it/s]


Epoch[76 / 100] Train Loss (MAE): 0.0430 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6579 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0938


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.30it/s]


Epoch[77 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6607 Valid Loss (CLIP): 0.4661 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0904


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[78 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6604 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0957


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[79 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0345 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0972


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[80 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0347 Train Loss (CLIP): 0.6616 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0911


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[81 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6598 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0909


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[82 / 100] Train Loss (MAE): 0.0428 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6618 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0951


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[83 / 100] Train Loss (MAE): 0.0425 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6605 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0954 Valid Loss (Total): 0.0894


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.22it/s]


Epoch[84 / 100] Train Loss (MAE): 0.0425 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6599 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0953 Valid Loss (Total): 0.0901


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[85 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0345 Train Loss (CLIP): 0.6614 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0984


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.28it/s]


Epoch[86 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0350 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0955


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.19it/s]


Epoch[87 / 100] Train Loss (MAE): 0.0429 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6604 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0957 Valid Loss (Total): 0.0967


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[88 / 100] Train Loss (MAE): 0.0425 Valid Loss (MAE): 0.0343 Train Loss (CLIP): 0.6626 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0916


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[89 / 100] Train Loss (MAE): 0.0425 Valid Loss (MAE): 0.0343 Train Loss (CLIP): 0.6574 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0951 Valid Loss (Total): 0.0951


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[90 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6608 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0957


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[91 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6595 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0962


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[92 / 100] Train Loss (MAE): 0.0427 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6606 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0956 Valid Loss (Total): 0.0954


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[93 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0347 Train Loss (CLIP): 0.6618 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0955 Valid Loss (Total): 0.0965


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.24it/s]


Epoch[94 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0344 Train Loss (CLIP): 0.6600 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0954 Valid Loss (Total): 0.0985


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.26it/s]


Epoch[95 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6586 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0953 Valid Loss (Total): 0.0971


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.21it/s]


Epoch[96 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0343 Train Loss (CLIP): 0.6601 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0954 Valid Loss (Total): 0.0956


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:40<00:00,  3.20it/s]


Epoch[97 / 100] Train Loss (MAE): 0.0425 Valid Loss (MAE): 0.0346 Train Loss (CLIP): 0.6594 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0953 Valid Loss (Total): 0.0970


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.23it/s]


Epoch[98 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0348 Train Loss (CLIP): 0.6592 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0953 Valid Loss (Total): 0.0985


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.25it/s]


Epoch[99 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0351 Train Loss (CLIP): 0.6593 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0953 Valid Loss (Total): 0.0953


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [00:39<00:00,  3.27it/s]


Epoch[100 / 100] Train Loss (MAE): 0.0426 Valid Loss (MAE): 0.0349 Train Loss (CLIP): 0.6596 Valid Loss (CLIP): 0.4660 Train Loss (Total): 0.0954 Valid Loss (Total): 0.0966


In [None]:
# Training MAEs for individual subjects MEG images (240713)

In [14]:
for ii in range(4):

    args = {"batch_size": 256, "epochs": 80, "lr": 0.001, "device": "cuda", "num_workers": 0, "seed": 1234, "use_wandb": False, "data_dir": "data/", "model_path": "A"}
    
    # ------------------
    #    Dataloader
    # ------------------
    loader_args = {"batch_size": args["batch_size"], "num_workers": args["num_workers"]}
    
    train_set = ThingsMEGDataset_selective("train", ii, args["data_dir"])
    train_loader = torch.utils.data.DataLoader(train_set, shuffle=True, **loader_args)
    val_set = ThingsMEGDataset_selective("val", ii, args["data_dir"])
    val_loader = torch.utils.data.DataLoader(val_set, shuffle=False, **loader_args)

    
    # ハイパーパラメータの設定
    config = {
        "image_size": [271, 280],
        "patch_size": [271, 4],
        "emb_dim": 256,
        "enc_layers": 24,
        "enc_heads": 3,
        "enc_dim_head": 16,
        "enc_mlp_dim": 256,
        "dec_layers": 4,
        "dec_heads": 3,
        "dec_dim_head": 16,
        "dec_mlp_dim": 256,
        "mask_ratio": 0.1,
        "dropout": 0.25
    }
    
    device = "cuda" if torch.cuda.is_available() else "cpu"
    model = MAE_ViT(**config).to(device)
    model.load_state_dict(torch.load("model/MAE_pretrain_params_with_240713.pth", map_location=device))

    epochs = 500
    lr = 0.00005
    step_count = 0
    warmup_length = 80
    batch_size = 128
    optimizer = optim.AdamW(model.parameters(), lr=lr, betas=(0.9, 0.95), weight_decay=0.05)
    scheduler = CosineScheduler(epochs, lr, warmup_length)


    for epoch in range(epochs):
        # スケジューラで学習率を更新する
        new_lr = scheduler(epoch)
        set_lr(new_lr, optimizer)
    
        total_train_loss = 0.
        total_valid_loss = 0.
    
        # モデルの訓練
        for x, _, _ in tqdm(train_loader):
            x = x.unsqueeze(1)
            step_count += 1
            model.train()
            x = x.to(device)
    
            rec_img, mask = model(x)
            train_loss = torch.mean((rec_img - x) ** 2 * mask) / config["mask_ratio"]
            train_loss.backward()
    
            if step_count % 8 == 0:  # 8イテレーションごとに更新することで，擬似的にバッチサイズを大きくしている
                optimizer.step()
                optimizer.zero_grad()
    
            total_train_loss += train_loss.item()
    
        # モデルの評価
        with torch.no_grad():
            for x, _, _ in val_loader:
                x = x.unsqueeze(1)
                model.eval()
    
                with torch.no_grad():
                    x = x.to(device)
    
                    rec_img, mask = model(x)
                    valid_loss = torch.mean((rec_img - x) ** 2 * mask) / config["mask_ratio"]
    
                    total_valid_loss += valid_loss.item()
    
    
        print(f"Epoch[{epoch+1} / {epochs}] Train Loss: {total_train_loss/len(train_loader):.4f} Valid Loss: {total_valid_loss/len(val_loader):.4f}")






    torch.save(model.state_dict(), "model/MAE_pretrain_params_subject"+str(ii)+"_240713.pth")
    del model, train_loss, valid_loss, train_set, val_set
    torch.cuda.empty_cache()

100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 935.72it/s]
100%|█████████████████████████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 948.85it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.63it/s]


Epoch[1 / 500] Train Loss: 0.0411 Valid Loss: 0.0338


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[2 / 500] Train Loss: 0.0411 Valid Loss: 0.0336


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[3 / 500] Train Loss: 0.0413 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[4 / 500] Train Loss: 0.0413 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[5 / 500] Train Loss: 0.0412 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[6 / 500] Train Loss: 0.0412 Valid Loss: 0.0337


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[7 / 500] Train Loss: 0.0410 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[8 / 500] Train Loss: 0.0410 Valid Loss: 0.0337


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[9 / 500] Train Loss: 0.0410 Valid Loss: 0.0339


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[10 / 500] Train Loss: 0.0409 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[11 / 500] Train Loss: 0.0410 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[12 / 500] Train Loss: 0.0410 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[13 / 500] Train Loss: 0.0410 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[14 / 500] Train Loss: 0.0410 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[15 / 500] Train Loss: 0.0408 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[16 / 500] Train Loss: 0.0408 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[17 / 500] Train Loss: 0.0411 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[18 / 500] Train Loss: 0.0410 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[19 / 500] Train Loss: 0.0410 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[20 / 500] Train Loss: 0.0409 Valid Loss: 0.0337


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[21 / 500] Train Loss: 0.0409 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[22 / 500] Train Loss: 0.0409 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[23 / 500] Train Loss: 0.0408 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[24 / 500] Train Loss: 0.0406 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[25 / 500] Train Loss: 0.0408 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[26 / 500] Train Loss: 0.0407 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[27 / 500] Train Loss: 0.0408 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[28 / 500] Train Loss: 0.0407 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[29 / 500] Train Loss: 0.0407 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[30 / 500] Train Loss: 0.0407 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[31 / 500] Train Loss: 0.0407 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[32 / 500] Train Loss: 0.0407 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[33 / 500] Train Loss: 0.0408 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[34 / 500] Train Loss: 0.0406 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[35 / 500] Train Loss: 0.0409 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[36 / 500] Train Loss: 0.0405 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[37 / 500] Train Loss: 0.0406 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[38 / 500] Train Loss: 0.0406 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[39 / 500] Train Loss: 0.0404 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[40 / 500] Train Loss: 0.0406 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[41 / 500] Train Loss: 0.0407 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[42 / 500] Train Loss: 0.0404 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[43 / 500] Train Loss: 0.0405 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[44 / 500] Train Loss: 0.0406 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[45 / 500] Train Loss: 0.0405 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[46 / 500] Train Loss: 0.0406 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[47 / 500] Train Loss: 0.0406 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[48 / 500] Train Loss: 0.0406 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[49 / 500] Train Loss: 0.0406 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[50 / 500] Train Loss: 0.0406 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[51 / 500] Train Loss: 0.0406 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[52 / 500] Train Loss: 0.0405 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[53 / 500] Train Loss: 0.0405 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[54 / 500] Train Loss: 0.0406 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[55 / 500] Train Loss: 0.0403 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[56 / 500] Train Loss: 0.0404 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[57 / 500] Train Loss: 0.0405 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[58 / 500] Train Loss: 0.0404 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[59 / 500] Train Loss: 0.0404 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[60 / 500] Train Loss: 0.0406 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[61 / 500] Train Loss: 0.0406 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[62 / 500] Train Loss: 0.0404 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[63 / 500] Train Loss: 0.0404 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[64 / 500] Train Loss: 0.0404 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[65 / 500] Train Loss: 0.0405 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[66 / 500] Train Loss: 0.0403 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[67 / 500] Train Loss: 0.0405 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[68 / 500] Train Loss: 0.0403 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[69 / 500] Train Loss: 0.0404 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[70 / 500] Train Loss: 0.0405 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[71 / 500] Train Loss: 0.0405 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[72 / 500] Train Loss: 0.0405 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[73 / 500] Train Loss: 0.0406 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[74 / 500] Train Loss: 0.0404 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[75 / 500] Train Loss: 0.0403 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[76 / 500] Train Loss: 0.0404 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[77 / 500] Train Loss: 0.0403 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[78 / 500] Train Loss: 0.0402 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[79 / 500] Train Loss: 0.0402 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[80 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[81 / 500] Train Loss: 0.0403 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[82 / 500] Train Loss: 0.0403 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[83 / 500] Train Loss: 0.0403 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[84 / 500] Train Loss: 0.0404 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[85 / 500] Train Loss: 0.0403 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[86 / 500] Train Loss: 0.0404 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[87 / 500] Train Loss: 0.0403 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.20it/s]


Epoch[88 / 500] Train Loss: 0.0403 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[89 / 500] Train Loss: 0.0404 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.20it/s]


Epoch[90 / 500] Train Loss: 0.0404 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[91 / 500] Train Loss: 0.0403 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[92 / 500] Train Loss: 0.0402 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[93 / 500] Train Loss: 0.0402 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[94 / 500] Train Loss: 0.0402 Valid Loss: 0.0335


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.18it/s]


Epoch[95 / 500] Train Loss: 0.0404 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[96 / 500] Train Loss: 0.0403 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[97 / 500] Train Loss: 0.0403 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[98 / 500] Train Loss: 0.0403 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[99 / 500] Train Loss: 0.0401 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.25it/s]


Epoch[100 / 500] Train Loss: 0.0402 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[101 / 500] Train Loss: 0.0402 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[102 / 500] Train Loss: 0.0404 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[103 / 500] Train Loss: 0.0403 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[104 / 500] Train Loss: 0.0402 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[105 / 500] Train Loss: 0.0401 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.16it/s]


Epoch[106 / 500] Train Loss: 0.0401 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[107 / 500] Train Loss: 0.0401 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.18it/s]


Epoch[108 / 500] Train Loss: 0.0401 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[109 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[110 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[111 / 500] Train Loss: 0.0402 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[112 / 500] Train Loss: 0.0401 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[113 / 500] Train Loss: 0.0402 Valid Loss: 0.0332


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[114 / 500] Train Loss: 0.0401 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[115 / 500] Train Loss: 0.0400 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[116 / 500] Train Loss: 0.0401 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[117 / 500] Train Loss: 0.0401 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[118 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[119 / 500] Train Loss: 0.0402 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[120 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[121 / 500] Train Loss: 0.0401 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[122 / 500] Train Loss: 0.0401 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[123 / 500] Train Loss: 0.0400 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[124 / 500] Train Loss: 0.0401 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[125 / 500] Train Loss: 0.0401 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[126 / 500] Train Loss: 0.0401 Valid Loss: 0.0334


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.12it/s]


Epoch[127 / 500] Train Loss: 0.0400 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[128 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[129 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[130 / 500] Train Loss: 0.0401 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[131 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[132 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[133 / 500] Train Loss: 0.0402 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.27it/s]


Epoch[134 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[135 / 500] Train Loss: 0.0400 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[136 / 500] Train Loss: 0.0399 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[137 / 500] Train Loss: 0.0401 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[138 / 500] Train Loss: 0.0400 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[139 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.16it/s]


Epoch[140 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[141 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[142 / 500] Train Loss: 0.0401 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[143 / 500] Train Loss: 0.0400 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[144 / 500] Train Loss: 0.0400 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.12it/s]


Epoch[145 / 500] Train Loss: 0.0401 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[146 / 500] Train Loss: 0.0400 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[147 / 500] Train Loss: 0.0402 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[148 / 500] Train Loss: 0.0401 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[149 / 500] Train Loss: 0.0402 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[150 / 500] Train Loss: 0.0400 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[151 / 500] Train Loss: 0.0401 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[152 / 500] Train Loss: 0.0400 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[153 / 500] Train Loss: 0.0400 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[154 / 500] Train Loss: 0.0400 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[155 / 500] Train Loss: 0.0400 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[156 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[157 / 500] Train Loss: 0.0399 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[158 / 500] Train Loss: 0.0399 Valid Loss: 0.0331


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[159 / 500] Train Loss: 0.0399 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[160 / 500] Train Loss: 0.0401 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[161 / 500] Train Loss: 0.0399 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[162 / 500] Train Loss: 0.0399 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[163 / 500] Train Loss: 0.0399 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[164 / 500] Train Loss: 0.0398 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[165 / 500] Train Loss: 0.0400 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.20it/s]


Epoch[166 / 500] Train Loss: 0.0399 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[167 / 500] Train Loss: 0.0399 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.21it/s]


Epoch[168 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.12it/s]


Epoch[169 / 500] Train Loss: 0.0399 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[170 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.21it/s]


Epoch[171 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[172 / 500] Train Loss: 0.0398 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.16it/s]


Epoch[173 / 500] Train Loss: 0.0399 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[174 / 500] Train Loss: 0.0398 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[175 / 500] Train Loss: 0.0399 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[176 / 500] Train Loss: 0.0400 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[177 / 500] Train Loss: 0.0399 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[178 / 500] Train Loss: 0.0398 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[179 / 500] Train Loss: 0.0401 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[180 / 500] Train Loss: 0.0401 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[181 / 500] Train Loss: 0.0399 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[182 / 500] Train Loss: 0.0398 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[183 / 500] Train Loss: 0.0399 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[184 / 500] Train Loss: 0.0399 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[185 / 500] Train Loss: 0.0399 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[186 / 500] Train Loss: 0.0400 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[187 / 500] Train Loss: 0.0397 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[188 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[189 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[190 / 500] Train Loss: 0.0399 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[191 / 500] Train Loss: 0.0398 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[192 / 500] Train Loss: 0.0398 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[193 / 500] Train Loss: 0.0397 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[194 / 500] Train Loss: 0.0400 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[195 / 500] Train Loss: 0.0400 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[196 / 500] Train Loss: 0.0399 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[197 / 500] Train Loss: 0.0398 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[198 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[199 / 500] Train Loss: 0.0398 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[200 / 500] Train Loss: 0.0396 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[201 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[202 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[203 / 500] Train Loss: 0.0397 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[204 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[205 / 500] Train Loss: 0.0398 Valid Loss: 0.0333


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[206 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[207 / 500] Train Loss: 0.0397 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[208 / 500] Train Loss: 0.0397 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[209 / 500] Train Loss: 0.0399 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[210 / 500] Train Loss: 0.0397 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[211 / 500] Train Loss: 0.0399 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[212 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.21it/s]


Epoch[213 / 500] Train Loss: 0.0397 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[214 / 500] Train Loss: 0.0399 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[215 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[216 / 500] Train Loss: 0.0397 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[217 / 500] Train Loss: 0.0398 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[218 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[219 / 500] Train Loss: 0.0398 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[220 / 500] Train Loss: 0.0397 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[221 / 500] Train Loss: 0.0399 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[222 / 500] Train Loss: 0.0398 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[223 / 500] Train Loss: 0.0397 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[224 / 500] Train Loss: 0.0397 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[225 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[226 / 500] Train Loss: 0.0399 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[227 / 500] Train Loss: 0.0398 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.21it/s]


Epoch[228 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[229 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[230 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.21it/s]


Epoch[231 / 500] Train Loss: 0.0398 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[232 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[233 / 500] Train Loss: 0.0398 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[234 / 500] Train Loss: 0.0396 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[235 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[236 / 500] Train Loss: 0.0398 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[237 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[238 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[239 / 500] Train Loss: 0.0396 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[240 / 500] Train Loss: 0.0397 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[241 / 500] Train Loss: 0.0396 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[242 / 500] Train Loss: 0.0395 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[243 / 500] Train Loss: 0.0395 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[244 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[245 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[246 / 500] Train Loss: 0.0397 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[247 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[248 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[249 / 500] Train Loss: 0.0396 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[250 / 500] Train Loss: 0.0396 Valid Loss: 0.0319


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[251 / 500] Train Loss: 0.0397 Valid Loss: 0.0330


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[252 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[253 / 500] Train Loss: 0.0397 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[254 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[255 / 500] Train Loss: 0.0398 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[256 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[257 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[258 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[259 / 500] Train Loss: 0.0398 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[260 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[261 / 500] Train Loss: 0.0397 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[262 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[263 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[264 / 500] Train Loss: 0.0397 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[265 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[266 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[267 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[268 / 500] Train Loss: 0.0397 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[269 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[270 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[271 / 500] Train Loss: 0.0398 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[272 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[273 / 500] Train Loss: 0.0397 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[274 / 500] Train Loss: 0.0397 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[275 / 500] Train Loss: 0.0397 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[276 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[277 / 500] Train Loss: 0.0397 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[278 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[279 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[280 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[281 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[282 / 500] Train Loss: 0.0398 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[283 / 500] Train Loss: 0.0397 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[284 / 500] Train Loss: 0.0397 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[285 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[286 / 500] Train Loss: 0.0395 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[287 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[288 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[289 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[290 / 500] Train Loss: 0.0396 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[291 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[292 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.54it/s]


Epoch[293 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[294 / 500] Train Loss: 0.0396 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[295 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[296 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[297 / 500] Train Loss: 0.0395 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[298 / 500] Train Loss: 0.0395 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[299 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[300 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[301 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[302 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[303 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[304 / 500] Train Loss: 0.0394 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[305 / 500] Train Loss: 0.0397 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[306 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[307 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[308 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[309 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[310 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[311 / 500] Train Loss: 0.0395 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[312 / 500] Train Loss: 0.0395 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[313 / 500] Train Loss: 0.0395 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[314 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[315 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[316 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[317 / 500] Train Loss: 0.0395 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[318 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[319 / 500] Train Loss: 0.0396 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[320 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[321 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[322 / 500] Train Loss: 0.0396 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[323 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[324 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[325 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[326 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[327 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[328 / 500] Train Loss: 0.0396 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[329 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[330 / 500] Train Loss: 0.0396 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[331 / 500] Train Loss: 0.0397 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[332 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[333 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[334 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[335 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[336 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[337 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[338 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[339 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[340 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[341 / 500] Train Loss: 0.0396 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[342 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[343 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[344 / 500] Train Loss: 0.0394 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[345 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[346 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[347 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[348 / 500] Train Loss: 0.0396 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[349 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[350 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[351 / 500] Train Loss: 0.0393 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[352 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[353 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[354 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[355 / 500] Train Loss: 0.0394 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[356 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[357 / 500] Train Loss: 0.0394 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[358 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[359 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[360 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[361 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[362 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[363 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.22it/s]


Epoch[364 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.18it/s]


Epoch[365 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.14it/s]


Epoch[366 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[367 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[368 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[369 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[370 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[371 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[372 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[373 / 500] Train Loss: 0.0395 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[374 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[375 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[376 / 500] Train Loss: 0.0393 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[377 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[378 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[379 / 500] Train Loss: 0.0394 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[380 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[381 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[382 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[383 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[384 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[385 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.23it/s]


Epoch[386 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[387 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[388 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[389 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.12it/s]


Epoch[390 / 500] Train Loss: 0.0394 Valid Loss: 0.0319


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[391 / 500] Train Loss: 0.0392 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[392 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[393 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.24it/s]


Epoch[394 / 500] Train Loss: 0.0395 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[395 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[396 / 500] Train Loss: 0.0394 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[397 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[398 / 500] Train Loss: 0.0394 Valid Loss: 0.0319


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[399 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[400 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[401 / 500] Train Loss: 0.0394 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[402 / 500] Train Loss: 0.0393 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[403 / 500] Train Loss: 0.0396 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[404 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[405 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[406 / 500] Train Loss: 0.0394 Valid Loss: 0.0329


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[407 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[408 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[409 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[410 / 500] Train Loss: 0.0394 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[411 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[412 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[413 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[414 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[415 / 500] Train Loss: 0.0395 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.12it/s]


Epoch[416 / 500] Train Loss: 0.0394 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[417 / 500] Train Loss: 0.0393 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[418 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[419 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[420 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[421 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[422 / 500] Train Loss: 0.0395 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[423 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[424 / 500] Train Loss: 0.0395 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[425 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[426 / 500] Train Loss: 0.0394 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[427 / 500] Train Loss: 0.0394 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[428 / 500] Train Loss: 0.0395 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[429 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[430 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[431 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[432 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[433 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[434 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[435 / 500] Train Loss: 0.0393 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[436 / 500] Train Loss: 0.0392 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[437 / 500] Train Loss: 0.0392 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[438 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[439 / 500] Train Loss: 0.0392 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[440 / 500] Train Loss: 0.0393 Valid Loss: 0.0318


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[441 / 500] Train Loss: 0.0393 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[442 / 500] Train Loss: 0.0394 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[443 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[444 / 500] Train Loss: 0.0392 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[445 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[446 / 500] Train Loss: 0.0394 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[447 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[448 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[449 / 500] Train Loss: 0.0395 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[450 / 500] Train Loss: 0.0395 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[451 / 500] Train Loss: 0.0394 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[452 / 500] Train Loss: 0.0394 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[453 / 500] Train Loss: 0.0394 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[454 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[455 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[456 / 500] Train Loss: 0.0392 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[457 / 500] Train Loss: 0.0393 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[458 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[459 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[460 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[461 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[462 / 500] Train Loss: 0.0395 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[463 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[464 / 500] Train Loss: 0.0393 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[465 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[466 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[467 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[468 / 500] Train Loss: 0.0394 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[469 / 500] Train Loss: 0.0394 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[470 / 500] Train Loss: 0.0393 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[471 / 500] Train Loss: 0.0394 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[472 / 500] Train Loss: 0.0393 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[473 / 500] Train Loss: 0.0394 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[474 / 500] Train Loss: 0.0393 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[475 / 500] Train Loss: 0.0394 Valid Loss: 0.0326


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[476 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[477 / 500] Train Loss: 0.0393 Valid Loss: 0.0325


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[478 / 500] Train Loss: 0.0393 Valid Loss: 0.0319


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[479 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[480 / 500] Train Loss: 0.0393 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[481 / 500] Train Loss: 0.0394 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[482 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[483 / 500] Train Loss: 0.0395 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[484 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.15it/s]


Epoch[485 / 500] Train Loss: 0.0394 Valid Loss: 0.0328


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[486 / 500] Train Loss: 0.0393 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.21it/s]


Epoch[487 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[488 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.17it/s]


Epoch[489 / 500] Train Loss: 0.0393 Valid Loss: 0.0320


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[490 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[491 / 500] Train Loss: 0.0394 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[492 / 500] Train Loss: 0.0394 Valid Loss: 0.0322


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[493 / 500] Train Loss: 0.0393 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[494 / 500] Train Loss: 0.0393 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[495 / 500] Train Loss: 0.0393 Valid Loss: 0.0324


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[496 / 500] Train Loss: 0.0394 Valid Loss: 0.0327


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[497 / 500] Train Loss: 0.0396 Valid Loss: 0.0323


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[498 / 500] Train Loss: 0.0393 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[499 / 500] Train Loss: 0.0392 Valid Loss: 0.0321


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[500 / 500] Train Loss: 0.0395 Valid Loss: 0.0323


100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 944.74it/s]
100%|█████████████████████████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 951.32it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.62it/s]


Epoch[1 / 500] Train Loss: 0.0467 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[2 / 500] Train Loss: 0.0465 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[3 / 500] Train Loss: 0.0466 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[4 / 500] Train Loss: 0.0466 Valid Loss: 0.0401


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[5 / 500] Train Loss: 0.0465 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[6 / 500] Train Loss: 0.0466 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[7 / 500] Train Loss: 0.0465 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[8 / 500] Train Loss: 0.0464 Valid Loss: 0.0397


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[9 / 500] Train Loss: 0.0465 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[10 / 500] Train Loss: 0.0464 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[11 / 500] Train Loss: 0.0465 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.56it/s]


Epoch[12 / 500] Train Loss: 0.0464 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[13 / 500] Train Loss: 0.0464 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[14 / 500] Train Loss: 0.0465 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[15 / 500] Train Loss: 0.0464 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[16 / 500] Train Loss: 0.0464 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[17 / 500] Train Loss: 0.0462 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[18 / 500] Train Loss: 0.0463 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[19 / 500] Train Loss: 0.0463 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[20 / 500] Train Loss: 0.0463 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[21 / 500] Train Loss: 0.0462 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[22 / 500] Train Loss: 0.0464 Valid Loss: 0.0399


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[23 / 500] Train Loss: 0.0463 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[24 / 500] Train Loss: 0.0463 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[25 / 500] Train Loss: 0.0461 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[26 / 500] Train Loss: 0.0461 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[27 / 500] Train Loss: 0.0463 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[28 / 500] Train Loss: 0.0463 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[29 / 500] Train Loss: 0.0462 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[30 / 500] Train Loss: 0.0464 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[31 / 500] Train Loss: 0.0460 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[32 / 500] Train Loss: 0.0462 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[33 / 500] Train Loss: 0.0463 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[34 / 500] Train Loss: 0.0462 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[35 / 500] Train Loss: 0.0462 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[36 / 500] Train Loss: 0.0462 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[37 / 500] Train Loss: 0.0463 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.09it/s]


Epoch[38 / 500] Train Loss: 0.0462 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[39 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[40 / 500] Train Loss: 0.0462 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[41 / 500] Train Loss: 0.0465 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[42 / 500] Train Loss: 0.0461 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[43 / 500] Train Loss: 0.0461 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[44 / 500] Train Loss: 0.0460 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[45 / 500] Train Loss: 0.0460 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[46 / 500] Train Loss: 0.0461 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[47 / 500] Train Loss: 0.0460 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[48 / 500] Train Loss: 0.0462 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[49 / 500] Train Loss: 0.0461 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[50 / 500] Train Loss: 0.0461 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[51 / 500] Train Loss: 0.0461 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[52 / 500] Train Loss: 0.0461 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[53 / 500] Train Loss: 0.0462 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[54 / 500] Train Loss: 0.0460 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[55 / 500] Train Loss: 0.0461 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[56 / 500] Train Loss: 0.0460 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[57 / 500] Train Loss: 0.0462 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[58 / 500] Train Loss: 0.0460 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[59 / 500] Train Loss: 0.0461 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[60 / 500] Train Loss: 0.0461 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[61 / 500] Train Loss: 0.0461 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[62 / 500] Train Loss: 0.0460 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[63 / 500] Train Loss: 0.0458 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[64 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[65 / 500] Train Loss: 0.0459 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[66 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[67 / 500] Train Loss: 0.0459 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[68 / 500] Train Loss: 0.0458 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[69 / 500] Train Loss: 0.0460 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[70 / 500] Train Loss: 0.0459 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[71 / 500] Train Loss: 0.0459 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[72 / 500] Train Loss: 0.0459 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.13it/s]


Epoch[73 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[74 / 500] Train Loss: 0.0458 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[75 / 500] Train Loss: 0.0460 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.19it/s]


Epoch[76 / 500] Train Loss: 0.0459 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[77 / 500] Train Loss: 0.0458 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[78 / 500] Train Loss: 0.0458 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[79 / 500] Train Loss: 0.0460 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[80 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[81 / 500] Train Loss: 0.0459 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[82 / 500] Train Loss: 0.0459 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[83 / 500] Train Loss: 0.0460 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[84 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[85 / 500] Train Loss: 0.0458 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[86 / 500] Train Loss: 0.0459 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[87 / 500] Train Loss: 0.0460 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[88 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[89 / 500] Train Loss: 0.0459 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[90 / 500] Train Loss: 0.0459 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[91 / 500] Train Loss: 0.0458 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.11it/s]


Epoch[92 / 500] Train Loss: 0.0459 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[93 / 500] Train Loss: 0.0460 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[94 / 500] Train Loss: 0.0459 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[95 / 500] Train Loss: 0.0457 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[96 / 500] Train Loss: 0.0458 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[97 / 500] Train Loss: 0.0457 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[98 / 500] Train Loss: 0.0455 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[99 / 500] Train Loss: 0.0457 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[100 / 500] Train Loss: 0.0457 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[101 / 500] Train Loss: 0.0459 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[102 / 500] Train Loss: 0.0458 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[103 / 500] Train Loss: 0.0459 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[104 / 500] Train Loss: 0.0458 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[105 / 500] Train Loss: 0.0458 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[106 / 500] Train Loss: 0.0460 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[107 / 500] Train Loss: 0.0459 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[108 / 500] Train Loss: 0.0458 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[109 / 500] Train Loss: 0.0458 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[110 / 500] Train Loss: 0.0458 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[111 / 500] Train Loss: 0.0457 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[112 / 500] Train Loss: 0.0456 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[113 / 500] Train Loss: 0.0458 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[114 / 500] Train Loss: 0.0459 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[115 / 500] Train Loss: 0.0458 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[116 / 500] Train Loss: 0.0459 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[117 / 500] Train Loss: 0.0458 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[118 / 500] Train Loss: 0.0459 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[119 / 500] Train Loss: 0.0459 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[120 / 500] Train Loss: 0.0457 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[121 / 500] Train Loss: 0.0457 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[122 / 500] Train Loss: 0.0457 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.58it/s]


Epoch[123 / 500] Train Loss: 0.0457 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[124 / 500] Train Loss: 0.0457 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[125 / 500] Train Loss: 0.0459 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[126 / 500] Train Loss: 0.0458 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[127 / 500] Train Loss: 0.0458 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[128 / 500] Train Loss: 0.0456 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[129 / 500] Train Loss: 0.0458 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[130 / 500] Train Loss: 0.0458 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[131 / 500] Train Loss: 0.0457 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[132 / 500] Train Loss: 0.0458 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[133 / 500] Train Loss: 0.0457 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[134 / 500] Train Loss: 0.0458 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[135 / 500] Train Loss: 0.0457 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[136 / 500] Train Loss: 0.0457 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[137 / 500] Train Loss: 0.0457 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[138 / 500] Train Loss: 0.0456 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[139 / 500] Train Loss: 0.0458 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[140 / 500] Train Loss: 0.0457 Valid Loss: 0.0396


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[141 / 500] Train Loss: 0.0456 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[142 / 500] Train Loss: 0.0456 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[143 / 500] Train Loss: 0.0455 Valid Loss: 0.0395


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[144 / 500] Train Loss: 0.0458 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[145 / 500] Train Loss: 0.0456 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[146 / 500] Train Loss: 0.0456 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.12it/s]


Epoch[147 / 500] Train Loss: 0.0455 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[148 / 500] Train Loss: 0.0457 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[149 / 500] Train Loss: 0.0457 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[150 / 500] Train Loss: 0.0456 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[151 / 500] Train Loss: 0.0456 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[152 / 500] Train Loss: 0.0457 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[153 / 500] Train Loss: 0.0456 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[154 / 500] Train Loss: 0.0457 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[155 / 500] Train Loss: 0.0456 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[156 / 500] Train Loss: 0.0456 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[157 / 500] Train Loss: 0.0456 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[158 / 500] Train Loss: 0.0457 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[159 / 500] Train Loss: 0.0455 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[160 / 500] Train Loss: 0.0456 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[161 / 500] Train Loss: 0.0454 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[162 / 500] Train Loss: 0.0455 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[163 / 500] Train Loss: 0.0455 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[164 / 500] Train Loss: 0.0457 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[165 / 500] Train Loss: 0.0454 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[166 / 500] Train Loss: 0.0456 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[167 / 500] Train Loss: 0.0456 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[168 / 500] Train Loss: 0.0456 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[169 / 500] Train Loss: 0.0457 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[170 / 500] Train Loss: 0.0455 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[171 / 500] Train Loss: 0.0456 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[172 / 500] Train Loss: 0.0456 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[173 / 500] Train Loss: 0.0456 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[174 / 500] Train Loss: 0.0455 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[175 / 500] Train Loss: 0.0454 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[176 / 500] Train Loss: 0.0455 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[177 / 500] Train Loss: 0.0455 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[178 / 500] Train Loss: 0.0456 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[179 / 500] Train Loss: 0.0456 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[180 / 500] Train Loss: 0.0456 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[181 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[182 / 500] Train Loss: 0.0454 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[183 / 500] Train Loss: 0.0456 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[184 / 500] Train Loss: 0.0457 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[185 / 500] Train Loss: 0.0455 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[186 / 500] Train Loss: 0.0454 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[187 / 500] Train Loss: 0.0456 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[188 / 500] Train Loss: 0.0455 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[189 / 500] Train Loss: 0.0454 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[190 / 500] Train Loss: 0.0454 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[191 / 500] Train Loss: 0.0455 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[192 / 500] Train Loss: 0.0455 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[193 / 500] Train Loss: 0.0454 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[194 / 500] Train Loss: 0.0454 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[195 / 500] Train Loss: 0.0454 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[196 / 500] Train Loss: 0.0454 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.10it/s]


Epoch[197 / 500] Train Loss: 0.0456 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[198 / 500] Train Loss: 0.0455 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[199 / 500] Train Loss: 0.0455 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[200 / 500] Train Loss: 0.0455 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[201 / 500] Train Loss: 0.0455 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[202 / 500] Train Loss: 0.0454 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.05it/s]


Epoch[203 / 500] Train Loss: 0.0455 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[204 / 500] Train Loss: 0.0454 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[205 / 500] Train Loss: 0.0454 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[206 / 500] Train Loss: 0.0454 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[207 / 500] Train Loss: 0.0455 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[208 / 500] Train Loss: 0.0455 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[209 / 500] Train Loss: 0.0453 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[210 / 500] Train Loss: 0.0455 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[211 / 500] Train Loss: 0.0454 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[212 / 500] Train Loss: 0.0454 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[213 / 500] Train Loss: 0.0455 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[214 / 500] Train Loss: 0.0454 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[215 / 500] Train Loss: 0.0454 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[216 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[217 / 500] Train Loss: 0.0454 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[218 / 500] Train Loss: 0.0455 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[219 / 500] Train Loss: 0.0455 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[220 / 500] Train Loss: 0.0455 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[221 / 500] Train Loss: 0.0453 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[222 / 500] Train Loss: 0.0454 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[223 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[224 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[225 / 500] Train Loss: 0.0453 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[226 / 500] Train Loss: 0.0453 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[227 / 500] Train Loss: 0.0454 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[228 / 500] Train Loss: 0.0456 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[229 / 500] Train Loss: 0.0455 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[230 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[231 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[232 / 500] Train Loss: 0.0453 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.62it/s]


Epoch[233 / 500] Train Loss: 0.0455 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[234 / 500] Train Loss: 0.0453 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[235 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[236 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[237 / 500] Train Loss: 0.0453 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[238 / 500] Train Loss: 0.0455 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[239 / 500] Train Loss: 0.0454 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.03it/s]


Epoch[240 / 500] Train Loss: 0.0454 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[241 / 500] Train Loss: 0.0453 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.07it/s]


Epoch[242 / 500] Train Loss: 0.0454 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[243 / 500] Train Loss: 0.0455 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[244 / 500] Train Loss: 0.0452 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[245 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[246 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[247 / 500] Train Loss: 0.0454 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[248 / 500] Train Loss: 0.0453 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[249 / 500] Train Loss: 0.0453 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[250 / 500] Train Loss: 0.0453 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[251 / 500] Train Loss: 0.0454 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[252 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[253 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[254 / 500] Train Loss: 0.0453 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[255 / 500] Train Loss: 0.0453 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[256 / 500] Train Loss: 0.0454 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[257 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[258 / 500] Train Loss: 0.0452 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[259 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[260 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[261 / 500] Train Loss: 0.0453 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[262 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[263 / 500] Train Loss: 0.0452 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[264 / 500] Train Loss: 0.0453 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[265 / 500] Train Loss: 0.0454 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[266 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[267 / 500] Train Loss: 0.0452 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[268 / 500] Train Loss: 0.0453 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[269 / 500] Train Loss: 0.0453 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[270 / 500] Train Loss: 0.0452 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[271 / 500] Train Loss: 0.0454 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[272 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[273 / 500] Train Loss: 0.0454 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[274 / 500] Train Loss: 0.0453 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[275 / 500] Train Loss: 0.0453 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[276 / 500] Train Loss: 0.0454 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[277 / 500] Train Loss: 0.0454 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[278 / 500] Train Loss: 0.0453 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[279 / 500] Train Loss: 0.0452 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[280 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[281 / 500] Train Loss: 0.0452 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[282 / 500] Train Loss: 0.0453 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[283 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[284 / 500] Train Loss: 0.0452 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[285 / 500] Train Loss: 0.0453 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[286 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[287 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[288 / 500] Train Loss: 0.0452 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[289 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[290 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[291 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[292 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[293 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[294 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[295 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[296 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.01it/s]


Epoch[297 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[298 / 500] Train Loss: 0.0452 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[299 / 500] Train Loss: 0.0451 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[300 / 500] Train Loss: 0.0453 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[301 / 500] Train Loss: 0.0452 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[302 / 500] Train Loss: 0.0452 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[303 / 500] Train Loss: 0.0452 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[304 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[305 / 500] Train Loss: 0.0451 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[306 / 500] Train Loss: 0.0452 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[307 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[308 / 500] Train Loss: 0.0453 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[309 / 500] Train Loss: 0.0453 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[310 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[311 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[312 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[313 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[314 / 500] Train Loss: 0.0452 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[315 / 500] Train Loss: 0.0452 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[316 / 500] Train Loss: 0.0452 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[317 / 500] Train Loss: 0.0452 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[318 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[319 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[320 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[321 / 500] Train Loss: 0.0452 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[322 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[323 / 500] Train Loss: 0.0453 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[324 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[325 / 500] Train Loss: 0.0453 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[326 / 500] Train Loss: 0.0451 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[327 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[328 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[329 / 500] Train Loss: 0.0451 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[330 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[331 / 500] Train Loss: 0.0451 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[332 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[333 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[334 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[335 / 500] Train Loss: 0.0452 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[336 / 500] Train Loss: 0.0452 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[337 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[338 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[339 / 500] Train Loss: 0.0451 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[340 / 500] Train Loss: 0.0450 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[341 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[342 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.62it/s]


Epoch[343 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[344 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[345 / 500] Train Loss: 0.0450 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[346 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[347 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[348 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[349 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[350 / 500] Train Loss: 0.0453 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[351 / 500] Train Loss: 0.0450 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[352 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[353 / 500] Train Loss: 0.0453 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[354 / 500] Train Loss: 0.0452 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[355 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[356 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[357 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[358 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[359 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[360 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[361 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[362 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[363 / 500] Train Loss: 0.0453 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[364 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[365 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[366 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[367 / 500] Train Loss: 0.0452 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[368 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[369 / 500] Train Loss: 0.0450 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[370 / 500] Train Loss: 0.0450 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[371 / 500] Train Loss: 0.0449 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[372 / 500] Train Loss: 0.0451 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[373 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[374 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[375 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[376 / 500] Train Loss: 0.0452 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[377 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[378 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[379 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[380 / 500] Train Loss: 0.0452 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[381 / 500] Train Loss: 0.0449 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[382 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[383 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[384 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[385 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[386 / 500] Train Loss: 0.0450 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[387 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[388 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[389 / 500] Train Loss: 0.0450 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[390 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[391 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[392 / 500] Train Loss: 0.0452 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[393 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[394 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[395 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[396 / 500] Train Loss: 0.0450 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[397 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[398 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[399 / 500] Train Loss: 0.0449 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[400 / 500] Train Loss: 0.0449 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[401 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[402 / 500] Train Loss: 0.0450 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[403 / 500] Train Loss: 0.0450 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[404 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[405 / 500] Train Loss: 0.0450 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[406 / 500] Train Loss: 0.0451 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[407 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[408 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[409 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[410 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[411 / 500] Train Loss: 0.0452 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[412 / 500] Train Loss: 0.0452 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[413 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[414 / 500] Train Loss: 0.0452 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[415 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[416 / 500] Train Loss: 0.0449 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[417 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[418 / 500] Train Loss: 0.0452 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[419 / 500] Train Loss: 0.0449 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[420 / 500] Train Loss: 0.0451 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[421 / 500] Train Loss: 0.0451 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[422 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[423 / 500] Train Loss: 0.0449 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[424 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[425 / 500] Train Loss: 0.0450 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[426 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[427 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[428 / 500] Train Loss: 0.0450 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[429 / 500] Train Loss: 0.0450 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[430 / 500] Train Loss: 0.0451 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[431 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[432 / 500] Train Loss: 0.0450 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[433 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[434 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[435 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[436 / 500] Train Loss: 0.0450 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[437 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[438 / 500] Train Loss: 0.0448 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[439 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[440 / 500] Train Loss: 0.0450 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[441 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[442 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[443 / 500] Train Loss: 0.0450 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[444 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[445 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[446 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[447 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[448 / 500] Train Loss: 0.0449 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[449 / 500] Train Loss: 0.0450 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[450 / 500] Train Loss: 0.0452 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[451 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[452 / 500] Train Loss: 0.0450 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.52it/s]


Epoch[453 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[454 / 500] Train Loss: 0.0450 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[455 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[456 / 500] Train Loss: 0.0451 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[457 / 500] Train Loss: 0.0450 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[458 / 500] Train Loss: 0.0450 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[459 / 500] Train Loss: 0.0450 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[460 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[461 / 500] Train Loss: 0.0451 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[462 / 500] Train Loss: 0.0451 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[463 / 500] Train Loss: 0.0449 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[464 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[465 / 500] Train Loss: 0.0450 Valid Loss: 0.0391


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[466 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[467 / 500] Train Loss: 0.0451 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[468 / 500] Train Loss: 0.0450 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[469 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.50it/s]


Epoch[470 / 500] Train Loss: 0.0452 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[471 / 500] Train Loss: 0.0449 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[472 / 500] Train Loss: 0.0451 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[473 / 500] Train Loss: 0.0450 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[474 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[475 / 500] Train Loss: 0.0450 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[476 / 500] Train Loss: 0.0451 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[477 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[478 / 500] Train Loss: 0.0451 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[479 / 500] Train Loss: 0.0450 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[480 / 500] Train Loss: 0.0451 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[481 / 500] Train Loss: 0.0450 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[482 / 500] Train Loss: 0.0449 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[483 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[484 / 500] Train Loss: 0.0451 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[485 / 500] Train Loss: 0.0452 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[486 / 500] Train Loss: 0.0450 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[487 / 500] Train Loss: 0.0452 Valid Loss: 0.0393


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[488 / 500] Train Loss: 0.0449 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[489 / 500] Train Loss: 0.0451 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[490 / 500] Train Loss: 0.0450 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[491 / 500] Train Loss: 0.0451 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[492 / 500] Train Loss: 0.0450 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[493 / 500] Train Loss: 0.0450 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[494 / 500] Train Loss: 0.0449 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[495 / 500] Train Loss: 0.0451 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[496 / 500] Train Loss: 0.0450 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[497 / 500] Train Loss: 0.0452 Valid Loss: 0.0387


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[498 / 500] Train Loss: 0.0451 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[499 / 500] Train Loss: 0.0450 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[500 / 500] Train Loss: 0.0449 Valid Loss: 0.0385


100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 917.78it/s]
100%|█████████████████████████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 921.80it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[1 / 500] Train Loss: 0.0479 Valid Loss: 0.0392


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[2 / 500] Train Loss: 0.0477 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[3 / 500] Train Loss: 0.0475 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[4 / 500] Train Loss: 0.0478 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[5 / 500] Train Loss: 0.0477 Valid Loss: 0.0394


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[6 / 500] Train Loss: 0.0478 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[7 / 500] Train Loss: 0.0479 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[8 / 500] Train Loss: 0.0476 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[9 / 500] Train Loss: 0.0477 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[10 / 500] Train Loss: 0.0477 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[11 / 500] Train Loss: 0.0477 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[12 / 500] Train Loss: 0.0477 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[13 / 500] Train Loss: 0.0475 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[14 / 500] Train Loss: 0.0475 Valid Loss: 0.0390


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[15 / 500] Train Loss: 0.0477 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[16 / 500] Train Loss: 0.0475 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[17 / 500] Train Loss: 0.0474 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[18 / 500] Train Loss: 0.0475 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[19 / 500] Train Loss: 0.0475 Valid Loss: 0.0389


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[20 / 500] Train Loss: 0.0473 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[21 / 500] Train Loss: 0.0474 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[22 / 500] Train Loss: 0.0471 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[23 / 500] Train Loss: 0.0474 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[24 / 500] Train Loss: 0.0472 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[25 / 500] Train Loss: 0.0473 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[26 / 500] Train Loss: 0.0474 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[27 / 500] Train Loss: 0.0472 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[28 / 500] Train Loss: 0.0472 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[29 / 500] Train Loss: 0.0473 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[30 / 500] Train Loss: 0.0472 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[31 / 500] Train Loss: 0.0472 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[32 / 500] Train Loss: 0.0473 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[33 / 500] Train Loss: 0.0473 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[34 / 500] Train Loss: 0.0471 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[35 / 500] Train Loss: 0.0472 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[36 / 500] Train Loss: 0.0470 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[37 / 500] Train Loss: 0.0473 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[38 / 500] Train Loss: 0.0470 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[39 / 500] Train Loss: 0.0472 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[40 / 500] Train Loss: 0.0472 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[41 / 500] Train Loss: 0.0472 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[42 / 500] Train Loss: 0.0470 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[43 / 500] Train Loss: 0.0471 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[44 / 500] Train Loss: 0.0471 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[45 / 500] Train Loss: 0.0470 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[46 / 500] Train Loss: 0.0471 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[47 / 500] Train Loss: 0.0472 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[48 / 500] Train Loss: 0.0469 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[49 / 500] Train Loss: 0.0472 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[50 / 500] Train Loss: 0.0472 Valid Loss: 0.0386


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[51 / 500] Train Loss: 0.0469 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[52 / 500] Train Loss: 0.0469 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[53 / 500] Train Loss: 0.0469 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[54 / 500] Train Loss: 0.0470 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[55 / 500] Train Loss: 0.0470 Valid Loss: 0.0388


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[56 / 500] Train Loss: 0.0470 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[57 / 500] Train Loss: 0.0471 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[58 / 500] Train Loss: 0.0469 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.50it/s]


Epoch[59 / 500] Train Loss: 0.0470 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[60 / 500] Train Loss: 0.0471 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[61 / 500] Train Loss: 0.0469 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[62 / 500] Train Loss: 0.0469 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[63 / 500] Train Loss: 0.0470 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[64 / 500] Train Loss: 0.0469 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[65 / 500] Train Loss: 0.0470 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[66 / 500] Train Loss: 0.0468 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[67 / 500] Train Loss: 0.0470 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[68 / 500] Train Loss: 0.0468 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[69 / 500] Train Loss: 0.0469 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[70 / 500] Train Loss: 0.0469 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[71 / 500] Train Loss: 0.0468 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[72 / 500] Train Loss: 0.0468 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[73 / 500] Train Loss: 0.0469 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[74 / 500] Train Loss: 0.0469 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[75 / 500] Train Loss: 0.0468 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[76 / 500] Train Loss: 0.0470 Valid Loss: 0.0385


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[77 / 500] Train Loss: 0.0469 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[78 / 500] Train Loss: 0.0469 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[79 / 500] Train Loss: 0.0466 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[80 / 500] Train Loss: 0.0469 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[81 / 500] Train Loss: 0.0469 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[82 / 500] Train Loss: 0.0468 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[83 / 500] Train Loss: 0.0468 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[84 / 500] Train Loss: 0.0467 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[85 / 500] Train Loss: 0.0468 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[86 / 500] Train Loss: 0.0468 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[87 / 500] Train Loss: 0.0468 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[88 / 500] Train Loss: 0.0468 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[89 / 500] Train Loss: 0.0468 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[90 / 500] Train Loss: 0.0467 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[91 / 500] Train Loss: 0.0469 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[92 / 500] Train Loss: 0.0469 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[93 / 500] Train Loss: 0.0468 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[94 / 500] Train Loss: 0.0468 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[95 / 500] Train Loss: 0.0468 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[96 / 500] Train Loss: 0.0468 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[97 / 500] Train Loss: 0.0466 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[98 / 500] Train Loss: 0.0468 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[99 / 500] Train Loss: 0.0467 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[100 / 500] Train Loss: 0.0466 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[101 / 500] Train Loss: 0.0467 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[102 / 500] Train Loss: 0.0467 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[103 / 500] Train Loss: 0.0467 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[104 / 500] Train Loss: 0.0467 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[105 / 500] Train Loss: 0.0466 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[106 / 500] Train Loss: 0.0469 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[107 / 500] Train Loss: 0.0467 Valid Loss: 0.0384


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[108 / 500] Train Loss: 0.0466 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[109 / 500] Train Loss: 0.0466 Valid Loss: 0.0382


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[110 / 500] Train Loss: 0.0465 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[111 / 500] Train Loss: 0.0466 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[112 / 500] Train Loss: 0.0465 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[113 / 500] Train Loss: 0.0467 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[114 / 500] Train Loss: 0.0466 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[115 / 500] Train Loss: 0.0466 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[116 / 500] Train Loss: 0.0467 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[117 / 500] Train Loss: 0.0467 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[118 / 500] Train Loss: 0.0467 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[119 / 500] Train Loss: 0.0466 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[120 / 500] Train Loss: 0.0466 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[121 / 500] Train Loss: 0.0466 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[122 / 500] Train Loss: 0.0466 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[123 / 500] Train Loss: 0.0464 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[124 / 500] Train Loss: 0.0467 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[125 / 500] Train Loss: 0.0466 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[126 / 500] Train Loss: 0.0467 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[127 / 500] Train Loss: 0.0465 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[128 / 500] Train Loss: 0.0466 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[129 / 500] Train Loss: 0.0466 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[130 / 500] Train Loss: 0.0466 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[131 / 500] Train Loss: 0.0466 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[132 / 500] Train Loss: 0.0466 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[133 / 500] Train Loss: 0.0465 Valid Loss: 0.0383


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[134 / 500] Train Loss: 0.0464 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[135 / 500] Train Loss: 0.0464 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[136 / 500] Train Loss: 0.0466 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[137 / 500] Train Loss: 0.0467 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[138 / 500] Train Loss: 0.0465 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[139 / 500] Train Loss: 0.0466 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[140 / 500] Train Loss: 0.0466 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[141 / 500] Train Loss: 0.0464 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[142 / 500] Train Loss: 0.0464 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[143 / 500] Train Loss: 0.0466 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[144 / 500] Train Loss: 0.0465 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[145 / 500] Train Loss: 0.0466 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[146 / 500] Train Loss: 0.0467 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[147 / 500] Train Loss: 0.0465 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[148 / 500] Train Loss: 0.0464 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[149 / 500] Train Loss: 0.0465 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[150 / 500] Train Loss: 0.0465 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[151 / 500] Train Loss: 0.0465 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[152 / 500] Train Loss: 0.0464 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[153 / 500] Train Loss: 0.0466 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[154 / 500] Train Loss: 0.0464 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[155 / 500] Train Loss: 0.0465 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[156 / 500] Train Loss: 0.0465 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[157 / 500] Train Loss: 0.0464 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[158 / 500] Train Loss: 0.0464 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[159 / 500] Train Loss: 0.0464 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[160 / 500] Train Loss: 0.0464 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[161 / 500] Train Loss: 0.0464 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[162 / 500] Train Loss: 0.0465 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[163 / 500] Train Loss: 0.0464 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[164 / 500] Train Loss: 0.0463 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[165 / 500] Train Loss: 0.0464 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[166 / 500] Train Loss: 0.0463 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[167 / 500] Train Loss: 0.0463 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[168 / 500] Train Loss: 0.0464 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[169 / 500] Train Loss: 0.0463 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[170 / 500] Train Loss: 0.0465 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[171 / 500] Train Loss: 0.0464 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[172 / 500] Train Loss: 0.0464 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[173 / 500] Train Loss: 0.0464 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[174 / 500] Train Loss: 0.0465 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[175 / 500] Train Loss: 0.0463 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[176 / 500] Train Loss: 0.0462 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[177 / 500] Train Loss: 0.0463 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[178 / 500] Train Loss: 0.0463 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[179 / 500] Train Loss: 0.0464 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[180 / 500] Train Loss: 0.0463 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[181 / 500] Train Loss: 0.0462 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[182 / 500] Train Loss: 0.0465 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[183 / 500] Train Loss: 0.0464 Valid Loss: 0.0381


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[184 / 500] Train Loss: 0.0462 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[185 / 500] Train Loss: 0.0461 Valid Loss: 0.0379


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[186 / 500] Train Loss: 0.0461 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[187 / 500] Train Loss: 0.0464 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[188 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[189 / 500] Train Loss: 0.0463 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[190 / 500] Train Loss: 0.0463 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[191 / 500] Train Loss: 0.0463 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[192 / 500] Train Loss: 0.0463 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[193 / 500] Train Loss: 0.0463 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[194 / 500] Train Loss: 0.0463 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[195 / 500] Train Loss: 0.0463 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[196 / 500] Train Loss: 0.0463 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[197 / 500] Train Loss: 0.0462 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[198 / 500] Train Loss: 0.0462 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[199 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[200 / 500] Train Loss: 0.0463 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[201 / 500] Train Loss: 0.0463 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[202 / 500] Train Loss: 0.0463 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[203 / 500] Train Loss: 0.0464 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[204 / 500] Train Loss: 0.0462 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[205 / 500] Train Loss: 0.0464 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[206 / 500] Train Loss: 0.0464 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[207 / 500] Train Loss: 0.0464 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[208 / 500] Train Loss: 0.0462 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[209 / 500] Train Loss: 0.0462 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[210 / 500] Train Loss: 0.0463 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[211 / 500] Train Loss: 0.0462 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[212 / 500] Train Loss: 0.0462 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[213 / 500] Train Loss: 0.0461 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[214 / 500] Train Loss: 0.0461 Valid Loss: 0.0380


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[215 / 500] Train Loss: 0.0462 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[216 / 500] Train Loss: 0.0461 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[217 / 500] Train Loss: 0.0462 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[218 / 500] Train Loss: 0.0463 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[219 / 500] Train Loss: 0.0461 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[220 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[221 / 500] Train Loss: 0.0462 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[222 / 500] Train Loss: 0.0463 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[223 / 500] Train Loss: 0.0462 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[224 / 500] Train Loss: 0.0462 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[225 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[226 / 500] Train Loss: 0.0463 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[227 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[228 / 500] Train Loss: 0.0463 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[229 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[230 / 500] Train Loss: 0.0461 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[231 / 500] Train Loss: 0.0462 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[232 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[233 / 500] Train Loss: 0.0462 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[234 / 500] Train Loss: 0.0462 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[235 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[236 / 500] Train Loss: 0.0462 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[237 / 500] Train Loss: 0.0462 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[238 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[239 / 500] Train Loss: 0.0461 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[240 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[241 / 500] Train Loss: 0.0460 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[242 / 500] Train Loss: 0.0462 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[243 / 500] Train Loss: 0.0461 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[244 / 500] Train Loss: 0.0461 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[245 / 500] Train Loss: 0.0461 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[246 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[247 / 500] Train Loss: 0.0462 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.08it/s]


Epoch[248 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[249 / 500] Train Loss: 0.0462 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[250 / 500] Train Loss: 0.0461 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[251 / 500] Train Loss: 0.0461 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[252 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[253 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[254 / 500] Train Loss: 0.0461 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[255 / 500] Train Loss: 0.0462 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[256 / 500] Train Loss: 0.0462 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[257 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[258 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[259 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[260 / 500] Train Loss: 0.0460 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[261 / 500] Train Loss: 0.0462 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[262 / 500] Train Loss: 0.0461 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[263 / 500] Train Loss: 0.0460 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[264 / 500] Train Loss: 0.0461 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[265 / 500] Train Loss: 0.0461 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[266 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[267 / 500] Train Loss: 0.0460 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[268 / 500] Train Loss: 0.0460 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[269 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[270 / 500] Train Loss: 0.0462 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[271 / 500] Train Loss: 0.0460 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[272 / 500] Train Loss: 0.0460 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[273 / 500] Train Loss: 0.0460 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[274 / 500] Train Loss: 0.0460 Valid Loss: 0.0376


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[275 / 500] Train Loss: 0.0460 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[276 / 500] Train Loss: 0.0462 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[277 / 500] Train Loss: 0.0460 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.30it/s]


Epoch[278 / 500] Train Loss: 0.0461 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[279 / 500] Train Loss: 0.0461 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[280 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[281 / 500] Train Loss: 0.0460 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[282 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[283 / 500] Train Loss: 0.0459 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[284 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[285 / 500] Train Loss: 0.0460 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[286 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[287 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[288 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[289 / 500] Train Loss: 0.0460 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[290 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[291 / 500] Train Loss: 0.0460 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[292 / 500] Train Loss: 0.0461 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[293 / 500] Train Loss: 0.0460 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[294 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[295 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[296 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[297 / 500] Train Loss: 0.0460 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[298 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[299 / 500] Train Loss: 0.0461 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[300 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[301 / 500] Train Loss: 0.0460 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[302 / 500] Train Loss: 0.0461 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[303 / 500] Train Loss: 0.0461 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[304 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[305 / 500] Train Loss: 0.0460 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[306 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[307 / 500] Train Loss: 0.0458 Valid Loss: 0.0378


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[308 / 500] Train Loss: 0.0458 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[309 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.68it/s]


Epoch[310 / 500] Train Loss: 0.0459 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[311 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[312 / 500] Train Loss: 0.0461 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[313 / 500] Train Loss: 0.0459 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[314 / 500] Train Loss: 0.0460 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[315 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[316 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[317 / 500] Train Loss: 0.0459 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[318 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[319 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[320 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.40it/s]


Epoch[321 / 500] Train Loss: 0.0460 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[322 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[323 / 500] Train Loss: 0.0460 Valid Loss: 0.0363


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[324 / 500] Train Loss: 0.0457 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[325 / 500] Train Loss: 0.0460 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[326 / 500] Train Loss: 0.0460 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[327 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[328 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[329 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[330 / 500] Train Loss: 0.0459 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[331 / 500] Train Loss: 0.0460 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[332 / 500] Train Loss: 0.0460 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[333 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[334 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[335 / 500] Train Loss: 0.0460 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[336 / 500] Train Loss: 0.0460 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[337 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[338 / 500] Train Loss: 0.0459 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[339 / 500] Train Loss: 0.0460 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[340 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[341 / 500] Train Loss: 0.0460 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[342 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[343 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[344 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[345 / 500] Train Loss: 0.0461 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[346 / 500] Train Loss: 0.0460 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[347 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[348 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[349 / 500] Train Loss: 0.0459 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[350 / 500] Train Loss: 0.0459 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[351 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[352 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[353 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[354 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[355 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[356 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[357 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[358 / 500] Train Loss: 0.0460 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[359 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[360 / 500] Train Loss: 0.0459 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[361 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[362 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[363 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[364 / 500] Train Loss: 0.0458 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[365 / 500] Train Loss: 0.0459 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[366 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.63it/s]


Epoch[367 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[368 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[369 / 500] Train Loss: 0.0458 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[370 / 500] Train Loss: 0.0460 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[371 / 500] Train Loss: 0.0457 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[372 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[373 / 500] Train Loss: 0.0459 Valid Loss: 0.0375


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[374 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[375 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[376 / 500] Train Loss: 0.0458 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[377 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[378 / 500] Train Loss: 0.0457 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[379 / 500] Train Loss: 0.0459 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[380 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[381 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[382 / 500] Train Loss: 0.0459 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[383 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[384 / 500] Train Loss: 0.0460 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[385 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[386 / 500] Train Loss: 0.0459 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[387 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[388 / 500] Train Loss: 0.0459 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[389 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[390 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[391 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[392 / 500] Train Loss: 0.0457 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[393 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[394 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[395 / 500] Train Loss: 0.0459 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[396 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[397 / 500] Train Loss: 0.0459 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[398 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[399 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[400 / 500] Train Loss: 0.0458 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[401 / 500] Train Loss: 0.0458 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[402 / 500] Train Loss: 0.0458 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[403 / 500] Train Loss: 0.0457 Valid Loss: 0.0362


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[404 / 500] Train Loss: 0.0458 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[405 / 500] Train Loss: 0.0457 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[406 / 500] Train Loss: 0.0459 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[407 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.55it/s]


Epoch[408 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[409 / 500] Train Loss: 0.0457 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[410 / 500] Train Loss: 0.0460 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[411 / 500] Train Loss: 0.0457 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[412 / 500] Train Loss: 0.0459 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[413 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.68it/s]


Epoch[414 / 500] Train Loss: 0.0458 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[415 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[416 / 500] Train Loss: 0.0457 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[417 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[418 / 500] Train Loss: 0.0458 Valid Loss: 0.0374


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[419 / 500] Train Loss: 0.0458 Valid Loss: 0.0365


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[420 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[421 / 500] Train Loss: 0.0458 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[422 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[423 / 500] Train Loss: 0.0460 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[424 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[425 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[426 / 500] Train Loss: 0.0459 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[427 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[428 / 500] Train Loss: 0.0458 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[429 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[430 / 500] Train Loss: 0.0457 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[431 / 500] Train Loss: 0.0456 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[432 / 500] Train Loss: 0.0460 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[433 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[434 / 500] Train Loss: 0.0459 Valid Loss: 0.0365


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[435 / 500] Train Loss: 0.0458 Valid Loss: 0.0363


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[436 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[437 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[438 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[439 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[440 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[441 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[442 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[443 / 500] Train Loss: 0.0457 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[444 / 500] Train Loss: 0.0457 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[445 / 500] Train Loss: 0.0458 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[446 / 500] Train Loss: 0.0458 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[447 / 500] Train Loss: 0.0458 Valid Loss: 0.0365


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[448 / 500] Train Loss: 0.0458 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.58it/s]


Epoch[449 / 500] Train Loss: 0.0458 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[450 / 500] Train Loss: 0.0457 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[451 / 500] Train Loss: 0.0457 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[452 / 500] Train Loss: 0.0456 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[453 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[454 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[455 / 500] Train Loss: 0.0457 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[456 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[457 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[458 / 500] Train Loss: 0.0458 Valid Loss: 0.0363


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[459 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[460 / 500] Train Loss: 0.0458 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[461 / 500] Train Loss: 0.0457 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[462 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[463 / 500] Train Loss: 0.0456 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[464 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[465 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[466 / 500] Train Loss: 0.0458 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[467 / 500] Train Loss: 0.0456 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[468 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[469 / 500] Train Loss: 0.0458 Valid Loss: 0.0365


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[470 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[471 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.63it/s]


Epoch[472 / 500] Train Loss: 0.0459 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[473 / 500] Train Loss: 0.0458 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[474 / 500] Train Loss: 0.0458 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[475 / 500] Train Loss: 0.0457 Valid Loss: 0.0366


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[476 / 500] Train Loss: 0.0459 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[477 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[478 / 500] Train Loss: 0.0459 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[479 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[480 / 500] Train Loss: 0.0458 Valid Loss: 0.0377


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[481 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[482 / 500] Train Loss: 0.0457 Valid Loss: 0.0365


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[483 / 500] Train Loss: 0.0457 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[484 / 500] Train Loss: 0.0458 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[485 / 500] Train Loss: 0.0458 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[486 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[487 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[488 / 500] Train Loss: 0.0459 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[489 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[490 / 500] Train Loss: 0.0457 Valid Loss: 0.0367


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[491 / 500] Train Loss: 0.0458 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[492 / 500] Train Loss: 0.0459 Valid Loss: 0.0368


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[493 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[494 / 500] Train Loss: 0.0458 Valid Loss: 0.0371


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[495 / 500] Train Loss: 0.0457 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.55it/s]


Epoch[496 / 500] Train Loss: 0.0457 Valid Loss: 0.0372


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[497 / 500] Train Loss: 0.0457 Valid Loss: 0.0373


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[498 / 500] Train Loss: 0.0458 Valid Loss: 0.0369


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[499 / 500] Train Loss: 0.0458 Valid Loss: 0.0370


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[500 / 500] Train Loss: 0.0457 Valid Loss: 0.0368


100%|███████████████████████████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 955.37it/s]
100%|█████████████████████████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 934.08it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.40it/s]


Epoch[1 / 500] Train Loss: 0.0441 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[2 / 500] Train Loss: 0.0439 Valid Loss: 0.0359


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[3 / 500] Train Loss: 0.0438 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[4 / 500] Train Loss: 0.0440 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[5 / 500] Train Loss: 0.0438 Valid Loss: 0.0358


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[6 / 500] Train Loss: 0.0439 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[7 / 500] Train Loss: 0.0438 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[8 / 500] Train Loss: 0.0438 Valid Loss: 0.0360


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[9 / 500] Train Loss: 0.0439 Valid Loss: 0.0358


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.06it/s]


Epoch[10 / 500] Train Loss: 0.0439 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[11 / 500] Train Loss: 0.0440 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[12 / 500] Train Loss: 0.0437 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[13 / 500] Train Loss: 0.0439 Valid Loss: 0.0363


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[14 / 500] Train Loss: 0.0438 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[15 / 500] Train Loss: 0.0439 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[16 / 500] Train Loss: 0.0437 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[17 / 500] Train Loss: 0.0440 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[18 / 500] Train Loss: 0.0436 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[19 / 500] Train Loss: 0.0436 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[20 / 500] Train Loss: 0.0437 Valid Loss: 0.0358


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[21 / 500] Train Loss: 0.0436 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[22 / 500] Train Loss: 0.0438 Valid Loss: 0.0358


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[23 / 500] Train Loss: 0.0437 Valid Loss: 0.0359


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[24 / 500] Train Loss: 0.0436 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[25 / 500] Train Loss: 0.0436 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[26 / 500] Train Loss: 0.0436 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[27 / 500] Train Loss: 0.0436 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[28 / 500] Train Loss: 0.0436 Valid Loss: 0.0359


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[29 / 500] Train Loss: 0.0437 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[30 / 500] Train Loss: 0.0433 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[31 / 500] Train Loss: 0.0434 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[32 / 500] Train Loss: 0.0434 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[33 / 500] Train Loss: 0.0435 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[34 / 500] Train Loss: 0.0436 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[35 / 500] Train Loss: 0.0434 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[36 / 500] Train Loss: 0.0435 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[37 / 500] Train Loss: 0.0434 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[38 / 500] Train Loss: 0.0436 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[39 / 500] Train Loss: 0.0433 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[40 / 500] Train Loss: 0.0433 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[41 / 500] Train Loss: 0.0434 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[42 / 500] Train Loss: 0.0434 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[43 / 500] Train Loss: 0.0433 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[44 / 500] Train Loss: 0.0434 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[45 / 500] Train Loss: 0.0434 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[46 / 500] Train Loss: 0.0433 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[47 / 500] Train Loss: 0.0433 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[48 / 500] Train Loss: 0.0435 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[49 / 500] Train Loss: 0.0434 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[50 / 500] Train Loss: 0.0434 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[51 / 500] Train Loss: 0.0433 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[52 / 500] Train Loss: 0.0434 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[53 / 500] Train Loss: 0.0433 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[54 / 500] Train Loss: 0.0434 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[55 / 500] Train Loss: 0.0434 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[56 / 500] Train Loss: 0.0432 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[57 / 500] Train Loss: 0.0433 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[58 / 500] Train Loss: 0.0434 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[59 / 500] Train Loss: 0.0432 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.61it/s]


Epoch[60 / 500] Train Loss: 0.0433 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.95it/s]


Epoch[61 / 500] Train Loss: 0.0432 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[62 / 500] Train Loss: 0.0432 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[63 / 500] Train Loss: 0.0432 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[64 / 500] Train Loss: 0.0433 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[65 / 500] Train Loss: 0.0434 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[66 / 500] Train Loss: 0.0434 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[67 / 500] Train Loss: 0.0432 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[68 / 500] Train Loss: 0.0432 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[69 / 500] Train Loss: 0.0432 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[70 / 500] Train Loss: 0.0432 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[71 / 500] Train Loss: 0.0432 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[72 / 500] Train Loss: 0.0432 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[73 / 500] Train Loss: 0.0431 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[74 / 500] Train Loss: 0.0431 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[75 / 500] Train Loss: 0.0432 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[76 / 500] Train Loss: 0.0432 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[77 / 500] Train Loss: 0.0432 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[78 / 500] Train Loss: 0.0434 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[79 / 500] Train Loss: 0.0432 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.59it/s]


Epoch[80 / 500] Train Loss: 0.0432 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[81 / 500] Train Loss: 0.0432 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[82 / 500] Train Loss: 0.0430 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[83 / 500] Train Loss: 0.0432 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[84 / 500] Train Loss: 0.0433 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[85 / 500] Train Loss: 0.0431 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[86 / 500] Train Loss: 0.0432 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[87 / 500] Train Loss: 0.0432 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[88 / 500] Train Loss: 0.0432 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[89 / 500] Train Loss: 0.0430 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[90 / 500] Train Loss: 0.0432 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[91 / 500] Train Loss: 0.0429 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[92 / 500] Train Loss: 0.0431 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[93 / 500] Train Loss: 0.0431 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[94 / 500] Train Loss: 0.0430 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[95 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[96 / 500] Train Loss: 0.0429 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.04it/s]


Epoch[97 / 500] Train Loss: 0.0430 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[98 / 500] Train Loss: 0.0430 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[99 / 500] Train Loss: 0.0429 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[100 / 500] Train Loss: 0.0431 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.99it/s]


Epoch[101 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.48it/s]


Epoch[102 / 500] Train Loss: 0.0430 Valid Loss: 0.0356


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[103 / 500] Train Loss: 0.0431 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[104 / 500] Train Loss: 0.0429 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[105 / 500] Train Loss: 0.0431 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[106 / 500] Train Loss: 0.0429 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[107 / 500] Train Loss: 0.0431 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[108 / 500] Train Loss: 0.0429 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[109 / 500] Train Loss: 0.0430 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[110 / 500] Train Loss: 0.0429 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.35it/s]


Epoch[111 / 500] Train Loss: 0.0431 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.47it/s]


Epoch[112 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.48it/s]


Epoch[113 / 500] Train Loss: 0.0430 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.68it/s]


Epoch[114 / 500] Train Loss: 0.0430 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[115 / 500] Train Loss: 0.0430 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[116 / 500] Train Loss: 0.0429 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[117 / 500] Train Loss: 0.0432 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[118 / 500] Train Loss: 0.0429 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.00it/s]


Epoch[119 / 500] Train Loss: 0.0429 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[120 / 500] Train Loss: 0.0432 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[121 / 500] Train Loss: 0.0430 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[122 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[123 / 500] Train Loss: 0.0428 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[124 / 500] Train Loss: 0.0428 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[125 / 500] Train Loss: 0.0429 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[126 / 500] Train Loss: 0.0430 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[127 / 500] Train Loss: 0.0430 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[128 / 500] Train Loss: 0.0431 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[129 / 500] Train Loss: 0.0429 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[130 / 500] Train Loss: 0.0430 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[131 / 500] Train Loss: 0.0430 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[132 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[133 / 500] Train Loss: 0.0429 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.68it/s]


Epoch[134 / 500] Train Loss: 0.0430 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[135 / 500] Train Loss: 0.0428 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[136 / 500] Train Loss: 0.0431 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[137 / 500] Train Loss: 0.0430 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[138 / 500] Train Loss: 0.0430 Valid Loss: 0.0357


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[139 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[140 / 500] Train Loss: 0.0428 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[141 / 500] Train Loss: 0.0429 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[142 / 500] Train Loss: 0.0428 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[143 / 500] Train Loss: 0.0428 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[144 / 500] Train Loss: 0.0428 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[145 / 500] Train Loss: 0.0428 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[146 / 500] Train Loss: 0.0427 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[147 / 500] Train Loss: 0.0428 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[148 / 500] Train Loss: 0.0428 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.68it/s]


Epoch[149 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[150 / 500] Train Loss: 0.0429 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[151 / 500] Train Loss: 0.0429 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[152 / 500] Train Loss: 0.0429 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[153 / 500] Train Loss: 0.0428 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[154 / 500] Train Loss: 0.0428 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[155 / 500] Train Loss: 0.0430 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[156 / 500] Train Loss: 0.0427 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[157 / 500] Train Loss: 0.0429 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[158 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[159 / 500] Train Loss: 0.0426 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[160 / 500] Train Loss: 0.0427 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[161 / 500] Train Loss: 0.0428 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[162 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[163 / 500] Train Loss: 0.0428 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[164 / 500] Train Loss: 0.0427 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[165 / 500] Train Loss: 0.0427 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[166 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[167 / 500] Train Loss: 0.0427 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[168 / 500] Train Loss: 0.0428 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[169 / 500] Train Loss: 0.0428 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[170 / 500] Train Loss: 0.0426 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[171 / 500] Train Loss: 0.0428 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[172 / 500] Train Loss: 0.0429 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[173 / 500] Train Loss: 0.0428 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[174 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[175 / 500] Train Loss: 0.0427 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[176 / 500] Train Loss: 0.0427 Valid Loss: 0.0354


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[177 / 500] Train Loss: 0.0427 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[178 / 500] Train Loss: 0.0426 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.63it/s]


Epoch[179 / 500] Train Loss: 0.0427 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[180 / 500] Train Loss: 0.0429 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[181 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[182 / 500] Train Loss: 0.0426 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[183 / 500] Train Loss: 0.0428 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[184 / 500] Train Loss: 0.0428 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.57it/s]


Epoch[185 / 500] Train Loss: 0.0429 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[186 / 500] Train Loss: 0.0427 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[187 / 500] Train Loss: 0.0426 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[188 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[189 / 500] Train Loss: 0.0427 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[190 / 500] Train Loss: 0.0426 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[191 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[192 / 500] Train Loss: 0.0427 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  9.02it/s]


Epoch[193 / 500] Train Loss: 0.0427 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[194 / 500] Train Loss: 0.0425 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[195 / 500] Train Loss: 0.0426 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[196 / 500] Train Loss: 0.0426 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[197 / 500] Train Loss: 0.0428 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[198 / 500] Train Loss: 0.0427 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[199 / 500] Train Loss: 0.0425 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[200 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[201 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[202 / 500] Train Loss: 0.0425 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[203 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[204 / 500] Train Loss: 0.0425 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[205 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[206 / 500] Train Loss: 0.0426 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[207 / 500] Train Loss: 0.0427 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[208 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[209 / 500] Train Loss: 0.0428 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[210 / 500] Train Loss: 0.0427 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.52it/s]


Epoch[211 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[212 / 500] Train Loss: 0.0425 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[213 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[214 / 500] Train Loss: 0.0427 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[215 / 500] Train Loss: 0.0427 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[216 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[217 / 500] Train Loss: 0.0424 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[218 / 500] Train Loss: 0.0428 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[219 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[220 / 500] Train Loss: 0.0427 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[221 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[222 / 500] Train Loss: 0.0424 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[223 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[224 / 500] Train Loss: 0.0427 Valid Loss: 0.0353


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[225 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[226 / 500] Train Loss: 0.0427 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[227 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[228 / 500] Train Loss: 0.0425 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[229 / 500] Train Loss: 0.0425 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[230 / 500] Train Loss: 0.0427 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[231 / 500] Train Loss: 0.0426 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[232 / 500] Train Loss: 0.0425 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[233 / 500] Train Loss: 0.0427 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[234 / 500] Train Loss: 0.0426 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[235 / 500] Train Loss: 0.0426 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[236 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[237 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[238 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[239 / 500] Train Loss: 0.0425 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[240 / 500] Train Loss: 0.0424 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[241 / 500] Train Loss: 0.0425 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[242 / 500] Train Loss: 0.0425 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[243 / 500] Train Loss: 0.0425 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[244 / 500] Train Loss: 0.0425 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[245 / 500] Train Loss: 0.0428 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[246 / 500] Train Loss: 0.0424 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[247 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[248 / 500] Train Loss: 0.0423 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.68it/s]


Epoch[249 / 500] Train Loss: 0.0423 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[250 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[251 / 500] Train Loss: 0.0424 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[252 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[253 / 500] Train Loss: 0.0425 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[254 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[255 / 500] Train Loss: 0.0426 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[256 / 500] Train Loss: 0.0425 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[257 / 500] Train Loss: 0.0426 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[258 / 500] Train Loss: 0.0426 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[259 / 500] Train Loss: 0.0425 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[260 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[261 / 500] Train Loss: 0.0424 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[262 / 500] Train Loss: 0.0425 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[263 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.57it/s]


Epoch[264 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[265 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[266 / 500] Train Loss: 0.0424 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[267 / 500] Train Loss: 0.0426 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[268 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[269 / 500] Train Loss: 0.0426 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[270 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[271 / 500] Train Loss: 0.0424 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[272 / 500] Train Loss: 0.0425 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[273 / 500] Train Loss: 0.0425 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[274 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[275 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[276 / 500] Train Loss: 0.0427 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[277 / 500] Train Loss: 0.0422 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[278 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[279 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[280 / 500] Train Loss: 0.0426 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[281 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[282 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[283 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[284 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[285 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[286 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[287 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[288 / 500] Train Loss: 0.0424 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[289 / 500] Train Loss: 0.0423 Valid Loss: 0.0355


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[290 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[291 / 500] Train Loss: 0.0424 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.60it/s]


Epoch[292 / 500] Train Loss: 0.0426 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[293 / 500] Train Loss: 0.0424 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[294 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[295 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[296 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[297 / 500] Train Loss: 0.0423 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[298 / 500] Train Loss: 0.0424 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[299 / 500] Train Loss: 0.0425 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.98it/s]


Epoch[300 / 500] Train Loss: 0.0422 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[301 / 500] Train Loss: 0.0425 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[302 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[303 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[304 / 500] Train Loss: 0.0424 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[305 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[306 / 500] Train Loss: 0.0425 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[307 / 500] Train Loss: 0.0424 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[308 / 500] Train Loss: 0.0425 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[309 / 500] Train Loss: 0.0424 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[310 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[311 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[312 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[313 / 500] Train Loss: 0.0423 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[314 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[315 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[316 / 500] Train Loss: 0.0424 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[317 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[318 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[319 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[320 / 500] Train Loss: 0.0422 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.96it/s]


Epoch[321 / 500] Train Loss: 0.0424 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[322 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[323 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[324 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[325 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[326 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[327 / 500] Train Loss: 0.0424 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.46it/s]


Epoch[328 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.56it/s]


Epoch[329 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[330 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[331 / 500] Train Loss: 0.0421 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[332 / 500] Train Loss: 0.0422 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[333 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[334 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[335 / 500] Train Loss: 0.0423 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[336 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[337 / 500] Train Loss: 0.0424 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[338 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[339 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[340 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[341 / 500] Train Loss: 0.0422 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[342 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[343 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[344 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[345 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[346 / 500] Train Loss: 0.0424 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[347 / 500] Train Loss: 0.0424 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[348 / 500] Train Loss: 0.0425 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[349 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[350 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[351 / 500] Train Loss: 0.0424 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[352 / 500] Train Loss: 0.0424 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[353 / 500] Train Loss: 0.0422 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[354 / 500] Train Loss: 0.0422 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[355 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[356 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[357 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[358 / 500] Train Loss: 0.0422 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[359 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[360 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[361 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[362 / 500] Train Loss: 0.0423 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[363 / 500] Train Loss: 0.0422 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[364 / 500] Train Loss: 0.0422 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[365 / 500] Train Loss: 0.0423 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[366 / 500] Train Loss: 0.0424 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[367 / 500] Train Loss: 0.0422 Valid Loss: 0.0339


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[368 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[369 / 500] Train Loss: 0.0422 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[370 / 500] Train Loss: 0.0423 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[371 / 500] Train Loss: 0.0421 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[372 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[373 / 500] Train Loss: 0.0422 Valid Loss: 0.0351


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[374 / 500] Train Loss: 0.0423 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.59it/s]


Epoch[375 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[376 / 500] Train Loss: 0.0421 Valid Loss: 0.0350


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[377 / 500] Train Loss: 0.0422 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[378 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[379 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.62it/s]


Epoch[380 / 500] Train Loss: 0.0422 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[381 / 500] Train Loss: 0.0421 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[382 / 500] Train Loss: 0.0424 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[383 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.79it/s]


Epoch[384 / 500] Train Loss: 0.0421 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[385 / 500] Train Loss: 0.0421 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[386 / 500] Train Loss: 0.0422 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[387 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[388 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[389 / 500] Train Loss: 0.0421 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[390 / 500] Train Loss: 0.0422 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[391 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[392 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[393 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[394 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[395 / 500] Train Loss: 0.0421 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.62it/s]


Epoch[396 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[397 / 500] Train Loss: 0.0421 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[398 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[399 / 500] Train Loss: 0.0421 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[400 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[401 / 500] Train Loss: 0.0422 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[402 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[403 / 500] Train Loss: 0.0423 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[404 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.92it/s]


Epoch[405 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[406 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[407 / 500] Train Loss: 0.0421 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[408 / 500] Train Loss: 0.0421 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[409 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[410 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[411 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[412 / 500] Train Loss: 0.0423 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[413 / 500] Train Loss: 0.0421 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[414 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.93it/s]


Epoch[415 / 500] Train Loss: 0.0422 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.66it/s]


Epoch[416 / 500] Train Loss: 0.0421 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.85it/s]


Epoch[417 / 500] Train Loss: 0.0424 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[418 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[419 / 500] Train Loss: 0.0423 Valid Loss: 0.0338


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[420 / 500] Train Loss: 0.0422 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[421 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[422 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[423 / 500] Train Loss: 0.0424 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[424 / 500] Train Loss: 0.0421 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.65it/s]


Epoch[425 / 500] Train Loss: 0.0422 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[426 / 500] Train Loss: 0.0421 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[427 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.54it/s]


Epoch[428 / 500] Train Loss: 0.0424 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[429 / 500] Train Loss: 0.0421 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.77it/s]


Epoch[430 / 500] Train Loss: 0.0421 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[431 / 500] Train Loss: 0.0420 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.97it/s]


Epoch[432 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[433 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[434 / 500] Train Loss: 0.0421 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[435 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.71it/s]


Epoch[436 / 500] Train Loss: 0.0422 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[437 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[438 / 500] Train Loss: 0.0423 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[439 / 500] Train Loss: 0.0421 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.60it/s]


Epoch[440 / 500] Train Loss: 0.0422 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[441 / 500] Train Loss: 0.0420 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[442 / 500] Train Loss: 0.0423 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.83it/s]


Epoch[443 / 500] Train Loss: 0.0421 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.72it/s]


Epoch[444 / 500] Train Loss: 0.0422 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.81it/s]


Epoch[445 / 500] Train Loss: 0.0424 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.65it/s]


Epoch[446 / 500] Train Loss: 0.0423 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[447 / 500] Train Loss: 0.0421 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[448 / 500] Train Loss: 0.0423 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[449 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[450 / 500] Train Loss: 0.0422 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[451 / 500] Train Loss: 0.0421 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[452 / 500] Train Loss: 0.0421 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[453 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[454 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.91it/s]


Epoch[455 / 500] Train Loss: 0.0421 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.75it/s]


Epoch[456 / 500] Train Loss: 0.0424 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.94it/s]


Epoch[457 / 500] Train Loss: 0.0422 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[458 / 500] Train Loss: 0.0422 Valid Loss: 0.0352


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[459 / 500] Train Loss: 0.0421 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.76it/s]


Epoch[460 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[461 / 500] Train Loss: 0.0421 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[462 / 500] Train Loss: 0.0423 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[463 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[464 / 500] Train Loss: 0.0422 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[465 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[466 / 500] Train Loss: 0.0422 Valid Loss: 0.0347


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.90it/s]


Epoch[467 / 500] Train Loss: 0.0422 Valid Loss: 0.0349


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[468 / 500] Train Loss: 0.0421 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[469 / 500] Train Loss: 0.0422 Valid Loss: 0.0339


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[470 / 500] Train Loss: 0.0421 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.74it/s]


Epoch[471 / 500] Train Loss: 0.0421 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.70it/s]


Epoch[472 / 500] Train Loss: 0.0423 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[473 / 500] Train Loss: 0.0422 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.82it/s]


Epoch[474 / 500] Train Loss: 0.0422 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[475 / 500] Train Loss: 0.0422 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[476 / 500] Train Loss: 0.0421 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[477 / 500] Train Loss: 0.0421 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[478 / 500] Train Loss: 0.0424 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.63it/s]


Epoch[479 / 500] Train Loss: 0.0423 Valid Loss: 0.0340


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.62it/s]


Epoch[480 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.65it/s]


Epoch[481 / 500] Train Loss: 0.0421 Valid Loss: 0.0342


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[482 / 500] Train Loss: 0.0422 Valid Loss: 0.0345


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[483 / 500] Train Loss: 0.0421 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.67it/s]


Epoch[484 / 500] Train Loss: 0.0422 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.69it/s]


Epoch[485 / 500] Train Loss: 0.0422 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.51it/s]


Epoch[486 / 500] Train Loss: 0.0421 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.51it/s]


Epoch[487 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.73it/s]


Epoch[488 / 500] Train Loss: 0.0421 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.64it/s]


Epoch[489 / 500] Train Loss: 0.0421 Valid Loss: 0.0348


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.49it/s]


Epoch[490 / 500] Train Loss: 0.0422 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.88it/s]


Epoch[491 / 500] Train Loss: 0.0424 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[492 / 500] Train Loss: 0.0421 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.59it/s]


Epoch[493 / 500] Train Loss: 0.0421 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.80it/s]


Epoch[494 / 500] Train Loss: 0.0421 Valid Loss: 0.0339


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.84it/s]


Epoch[495 / 500] Train Loss: 0.0421 Valid Loss: 0.0346


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[496 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.78it/s]


Epoch[497 / 500] Train Loss: 0.0423 Valid Loss: 0.0343


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.87it/s]


Epoch[498 / 500] Train Loss: 0.0420 Valid Loss: 0.0341


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.86it/s]


Epoch[499 / 500] Train Loss: 0.0422 Valid Loss: 0.0344


100%|██████████████████████████████████████████████████████████████████████████████████| 65/65 [00:07<00:00,  8.89it/s]


Epoch[500 / 500] Train Loss: 0.0423 Valid Loss: 0.0346


In [None]:
# CLIP with MAE training enabled (240715)

In [7]:
device = "cuda" if torch.cuda.is_available() else "cpu"
clip_model = "ViT-L/14"
CLIP, preprocess = clip.load(clip_model, device=device)
clip.available_models()

['RN50',
 'RN101',
 'RN50x4',
 'RN50x16',
 'RN50x64',
 'ViT-B/32',
 'ViT-B/16',
 'ViT-L/14',
 'ViT-L/14@336px']

In [8]:
args = {"batch_size": 128, "device": "cuda", "num_workers": 0, "seed": 1234, "use_wandb": False, "data_dir": "data/"}
img_path = "images-002/images/"
# ------------------
#    Dataloader
# ------------------

sj_idx = 0
img_save_path = "save_imgs/"
loader_args = {"batch_size": args["batch_size"], "num_workers": args["num_workers"]}
train_set = ThingsMEGDataset5_PreloadSplit(preprocess, "train", sj_idx, True, args["data_dir"], img_path, clip_model, img_save_path, device, False)
print("train_set loaded")
train_loader = torch.utils.data.DataLoader(train_set, shuffle=True, **loader_args)
val_set = ThingsMEGDataset5_PreloadSplit(preprocess, "val", sj_idx, True, args["data_dir"], img_path, clip_model, img_save_path, device, False)
print("val_set loaded")
val_loader = torch.utils.data.DataLoader(val_set, shuffle=False, **loader_args)
test_set = ThingsMEGDataset5_PreloadSplit(preprocess, "test", sj_idx, True, args["data_dir"], img_path, clip_model, img_save_path, device, False)
print("test_set loaded")
test_loader = torch.utils.data.DataLoader(test_set, shuffle=False, batch_size=args["batch_size"], num_workers=args["num_workers"])

Filtering for train: 100%|██████████████████████████████████████████████████████| 16432/16432 [00:17<00:00, 934.46it/s]
Compressing images for train: 16432it [10:52, 25.20it/s]


train_set loaded


Filtering for val: 100%|██████████████████████████████████████████████████████████| 4108/4108 [00:04<00:00, 894.18it/s]
Compressing images for val: 4108it [02:43, 25.11it/s]


val_set loaded


Filtering for test:  13%|███████▌                                                | 2211/16432 [00:02<00:15, 914.94it/s]


ValueError: could not convert b, a, and x to a common type

In [33]:
# ハイパーパラメータの設定
config = {
    "image_size": [271, 280],
    "patch_size": [271, 4],
    "emb_dim": 256,
    "enc_layers": 24,
    "enc_heads": 3,
    "enc_dim_head": 16,
    "enc_mlp_dim": 256,
    "dec_layers": 4,
    "dec_heads": 3,
    "dec_dim_head": 16,
    "dec_mlp_dim": 256,
    "mask_ratio": 0.1,
    "dropout": 0.25
}

model = MAE_ViT(**config).to(device)
model.load_state_dict(torch.load("model/MAE_pretrain_params_subject0_240713.pth", map_location=device))
PL_model = BasicConvProjector(768, 255, 64).to(device)

In [34]:
epochs_CLIP = 100
lr_CLIP = 0.0024
step_count_CLIP = 0
warmup_length_CLIP = 25
optimizer_CLIP = optim.AdamW(list(model.parameters())+list(PL_model.parameters()), lr=lr_CLIP, betas=(0.9, 0.95), weight_decay=5e-5)
scheduler_CLIP = CosineScheduler(epochs_CLIP, lr_CLIP, warmup_length_CLIP)
cossim = nn.CosineSimilarity(dim=1, eps=1e-6)

In [35]:
# モデルの訓練
img_dir = "images-002/images/"

lr_list = []
for epoch_CLIP in range(epochs_CLIP):
    # スケジューラで学習率を更新する
    new_lr_CLIP = scheduler_CLIP(epochs_CLIP)
    lr_list.append(new_lr_CLIP)
    set_lr(new_lr_CLIP, optimizer_CLIP)
    
    total_train_loss_CLIP = 0.
    total_valid_loss_CLIP = 0.

    step_count = 0

    model.train()
    CLIP.eval()
    PL_model.train()
    for x, _, _, image_features in tqdm(train_loader):
        x = x.to(device)
        model.zero_grad()
        PL_model.zero_grad()
        
        #with torch.no_grad():
        features, bk_idx = model.encoder(x.unsqueeze(1))

        #features = features.unsqueeze(1)
        meg_features = PL_model.forward(features)
        
        # Image Encoder (CLIP)
        #images = images.to(device)
        #image_features = CLIP.encode_image(images)
        image_features = image_features.to(device)

        train_loss_CLIP = 1-torch.mean(cossim(meg_features, image_features))
        #with torch.no_grad():
        train_loss_CLIP.backward()
    
        total_train_loss_CLIP += train_loss_CLIP.item()
    
        if step_count % 8 == 0:  # 8イテレーションごとに更新することで，擬似的にバッチサイズを大きくしている
            optimizer_CLIP.step()
            optimizer_CLIP.zero_grad()
        
        step_count += 1
    
    model.eval()
    PL_model.eval()
    # モデルの評価
    with torch.no_grad():
        for x, _, _, image_features in val_loader:
            with torch.no_grad():
                x = x.to(device)
    
                features, bk_idx = model.encoder(x.unsqueeze(1))
                meg_features = PL_model(features)

                # Image Encoder (CLIP)
                #images = images.to(device)
                #image_features = CLIP.encode_image(images)
                image_features = image_features.to(device)
    
                valid_loss_CLIP = 1-torch.mean(cossim(meg_features, image_features))
    
                total_valid_loss_CLIP += valid_loss_CLIP.item()
    
        
    print(f"Epoch[{epoch_CLIP+1} / {epochs_CLIP}] Train Loss: {total_train_loss_CLIP/len(train_loader):.4f} Valid Loss: {total_valid_loss_CLIP/len(val_loader):.4f}")




100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[1 / 100] Train Loss: 0.7108 Valid Loss: 0.4842


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[2 / 100] Train Loss: 0.6791 Valid Loss: 0.4780


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[3 / 100] Train Loss: 0.6764 Valid Loss: 0.4766


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[4 / 100] Train Loss: 0.6726 Valid Loss: 0.4741


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[5 / 100] Train Loss: 0.6697 Valid Loss: 0.4729


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[6 / 100] Train Loss: 0.6692 Valid Loss: 0.4721


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[7 / 100] Train Loss: 0.6687 Valid Loss: 0.4716


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[8 / 100] Train Loss: 0.6646 Valid Loss: 0.4708


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[9 / 100] Train Loss: 0.6651 Valid Loss: 0.4702


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[10 / 100] Train Loss: 0.6642 Valid Loss: 0.4700


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[11 / 100] Train Loss: 0.6657 Valid Loss: 0.4696


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[12 / 100] Train Loss: 0.6638 Valid Loss: 0.4693


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[13 / 100] Train Loss: 0.6640 Valid Loss: 0.4689


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[14 / 100] Train Loss: 0.6630 Valid Loss: 0.4689


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[15 / 100] Train Loss: 0.6642 Valid Loss: 0.4687


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[16 / 100] Train Loss: 0.6608 Valid Loss: 0.4686


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[17 / 100] Train Loss: 0.6619 Valid Loss: 0.4684


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[18 / 100] Train Loss: 0.6639 Valid Loss: 0.4685


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[19 / 100] Train Loss: 0.6616 Valid Loss: 0.4686


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[20 / 100] Train Loss: 0.6620 Valid Loss: 0.4682


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[21 / 100] Train Loss: 0.6612 Valid Loss: 0.4682


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[22 / 100] Train Loss: 0.6615 Valid Loss: 0.4682


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[23 / 100] Train Loss: 0.6619 Valid Loss: 0.4681


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[24 / 100] Train Loss: 0.6625 Valid Loss: 0.4682


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[25 / 100] Train Loss: 0.6613 Valid Loss: 0.4684


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[26 / 100] Train Loss: 0.6626 Valid Loss: 0.4681


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[27 / 100] Train Loss: 0.6605 Valid Loss: 0.4681


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[28 / 100] Train Loss: 0.6611 Valid Loss: 0.4681


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[29 / 100] Train Loss: 0.6605 Valid Loss: 0.4680


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[30 / 100] Train Loss: 0.6621 Valid Loss: 0.4680


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[31 / 100] Train Loss: 0.6639 Valid Loss: 0.4681


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[32 / 100] Train Loss: 0.6608 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[33 / 100] Train Loss: 0.6614 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[34 / 100] Train Loss: 0.6611 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[35 / 100] Train Loss: 0.6606 Valid Loss: 0.4680


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[36 / 100] Train Loss: 0.6603 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[37 / 100] Train Loss: 0.6605 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[38 / 100] Train Loss: 0.6611 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[39 / 100] Train Loss: 0.6604 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[40 / 100] Train Loss: 0.6613 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[41 / 100] Train Loss: 0.6593 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[42 / 100] Train Loss: 0.6622 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[43 / 100] Train Loss: 0.6615 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[44 / 100] Train Loss: 0.6588 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[45 / 100] Train Loss: 0.6590 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:09<00:00,  1.87it/s]


Epoch[46 / 100] Train Loss: 0.6620 Valid Loss: 0.4679


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[47 / 100] Train Loss: 0.6602 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[48 / 100] Train Loss: 0.6592 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.90it/s]


Epoch[49 / 100] Train Loss: 0.6598 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[50 / 100] Train Loss: 0.6611 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[51 / 100] Train Loss: 0.6603 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[52 / 100] Train Loss: 0.6599 Valid Loss: 0.4678


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[53 / 100] Train Loss: 0.6606 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[54 / 100] Train Loss: 0.6618 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[55 / 100] Train Loss: 0.6600 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[56 / 100] Train Loss: 0.6586 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[57 / 100] Train Loss: 0.6601 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[58 / 100] Train Loss: 0.6612 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[59 / 100] Train Loss: 0.6591 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[60 / 100] Train Loss: 0.6600 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[61 / 100] Train Loss: 0.6595 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[62 / 100] Train Loss: 0.6617 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[63 / 100] Train Loss: 0.6575 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[64 / 100] Train Loss: 0.6587 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[65 / 100] Train Loss: 0.6586 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[66 / 100] Train Loss: 0.6599 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[67 / 100] Train Loss: 0.6588 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[68 / 100] Train Loss: 0.6613 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[69 / 100] Train Loss: 0.6590 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[70 / 100] Train Loss: 0.6612 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[71 / 100] Train Loss: 0.6595 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[72 / 100] Train Loss: 0.6616 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[73 / 100] Train Loss: 0.6600 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[74 / 100] Train Loss: 0.6582 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[75 / 100] Train Loss: 0.6611 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[76 / 100] Train Loss: 0.6598 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[77 / 100] Train Loss: 0.6601 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[78 / 100] Train Loss: 0.6591 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[79 / 100] Train Loss: 0.6580 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[80 / 100] Train Loss: 0.6593 Valid Loss: 0.4677


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[81 / 100] Train Loss: 0.6605 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[82 / 100] Train Loss: 0.6606 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[83 / 100] Train Loss: 0.6620 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[84 / 100] Train Loss: 0.6603 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[85 / 100] Train Loss: 0.6565 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[86 / 100] Train Loss: 0.6624 Valid Loss: 0.4676


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.91it/s]


Epoch[87 / 100] Train Loss: 0.6587 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:07<00:00,  1.90it/s]


Epoch[88 / 100] Train Loss: 0.6632 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.87it/s]


Epoch[89 / 100] Train Loss: 0.6616 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[90 / 100] Train Loss: 0.6634 Valid Loss: 0.4674


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[91 / 100] Train Loss: 0.6601 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[92 / 100] Train Loss: 0.6602 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.88it/s]


Epoch[93 / 100] Train Loss: 0.6582 Valid Loss: 0.4674


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[94 / 100] Train Loss: 0.6597 Valid Loss: 0.4674


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[95 / 100] Train Loss: 0.6591 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[96 / 100] Train Loss: 0.6580 Valid Loss: 0.4674


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[97 / 100] Train Loss: 0.6609 Valid Loss: 0.4674


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[98 / 100] Train Loss: 0.6602 Valid Loss: 0.4675


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[99 / 100] Train Loss: 0.6594 Valid Loss: 0.4674


100%|████████████████████████████████████████████████████████████████████████████████| 129/129 [01:08<00:00,  1.89it/s]


Epoch[100 / 100] Train Loss: 0.6614 Valid Loss: 0.4674


In [36]:
# モデルを保存しておく
torch.save(model.state_dict(), "model/MAE_pretrain_params_subject0_CLIP_body_240715.pth")
torch.save(PL_model.state_dict(), "model/MAE_pretrain_params_subject0_CLIP_head_240715.pth")
del model, PL_model, train_loss, valid_loss, train_set, val_set, test_set

NameError: name 'train_loss' is not defined

In [21]:
torch.save(PL_model.state_dict(), "model/ProjectionLayer_params.pth")