# プロダクト開発演習  
## テーマ：JPEG圧縮画像の超解像モデル開発  
### 摘要  
**画像の保存領域削減のため縮小かつJPEG圧縮された画像を補完して美しく参照するため、JPEG圧縮画像の超解像モデルを開発する。JPEG圧縮画像の超解像モデルを実装し超解像処理結果の確認と考察を行う。基本とするニューラルネットワークモデルはSRCNNとし、Pytorchフレームワーク上に参照論文記載の構成を実装した。まず初めに、BICUBIC拡大縮小画像を学習対象として、SRCNNの基本性能を確認した。次に、BICUBIC拡大縮小に加えて、OoenCVによるJPEG圧縮処理した画像を学習対象として、複数のモデルを提案し、その性能を評価した。データセットとして、[General100](http://mmlab.ie.cuhk.edu.hk/projects/FSRCNN.html)データセットを用い学習並びにホールドアウト法によるPSNR(dB)にて評価を行った。最後に、テスト結果(testview.ipynb)検討から提案モデルの優劣を考察した。**  

**学習処理(train.ipynb)概要（本jupyter-notebook）**  
  1. 環境定義  
  2. データローディングとデータ拡張、画像劣化処理
  3. モデル定義とインスタンス  
  4. 学習ループ  

**学習結果表示処理(viewres.ipynb)**  
学習過程のPSNRとLossグラフ化  

**テストデータ評価(testview.ipynb)**  
テスト用画像を用いた各モデルの評価とPSNRまとめ

### 参照論文モデル(train.ipynb)  
**SRCNN**    
参照論文:"Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang. Learning a Deep Convolutional Network for Image Super-Resolution, in Proceedings of European Conference on Computer Vision (ECCV), 2014"  

### 学習データ及びデータ拡張  
[General100 Dataset](http://mmlab.ie.cuhk.edu.hk/projects/FSRCNN.html)を学習データとして用いる  
100画像を学習用途80、バリデーション用途、テスト用途に各10画像に分け学習を行うが、データセットのダウンロード、展開、dataディレクトリへの分割については[付録参照](#学習データ)  
**データ拡張：PILのFlip, Mirror, Rotateを実装**  
**画像劣化手法：PILのBICUBLIC拡大縮小並びにOpenCVによるJPEG圧縮処理を実装**  

### 提案モデル(train.ipynb)  
**特徴抽出層のカーネルサイズ9x9に11x11の特徴抽出層を追加：SRCNN11**  
演算量は同等のまま特徴抽出方法を変更  
広範囲の特徴を加味した推論を可能とする  
**5層モデル：SYM**  
SRCNNに残差機構を追加し、低層の情報を上位層へ直接伝えると共に、勾配消失を回避  

### 学習結果(viewres.ipynb)
**PSNRの推移グラフ：学習結果(dB推移)をnpyで保存し、別ipynb(viewres.ipynb)で表示**  
自身のGPU環境ではjupyter-notebook未サポートのため 

### 考察並びに改善案(testview.ipynb)  

**環境定義**

In [None]:
import os, sys
from pathlib import Path
if __name__=='__main__':
    import argparse
    parser = argparse.ArgumentParser(description='SRCNN Training')
    parser.add_argument('--cuda' , action='store_true', default=False)
    parser.add_argument('--naive', action='store_true', default=False)
    parser.add_argument('--c11'  , action='store_true', default=False)
    parser.add_argument('--sym'  , action='store_true', default=False)
    parser.add_argument('--comp' , action='store_true', default=False)
    parser.add_argument('--q'    , type=int, default=10,help='Compress Quality Factor')
    parser.add_argument('--epoch', type=int, default=50*1000)
    parser.add_argument('--snap' , type=int, default=500)
    parser.add_argument('--con'  , action='store_true', default=False)
    if Path(sys.argv[0]).stem == 'ipykernel_launcher':
        # On Jupyter
        args = []
#       args.append("--comp")
#       args.append("--naive")
#       args.append("--c11")
        args.append("--sym")
        args.append("--con")
#       args.append("--q")
#       args.append("--epoch")
#       args.extend(["--snap","5"])
#       args.append("--q","8")
        opt = parser.parse_args(args=args)
    else:
        # On Console python3
        opt = parser.parse_args()

    result_fileout=not opt.con  #To fileout
    result_dir=Path('result')
    if opt.comp:
        result_dir = Path(str(result_dir)+'-comp'+str(opt.q))
    result_dir/='SRCNN'    
    if opt.naive:
        result_dir = Path(str(result_dir)+'-naive')
    if opt.c11:
        result_dir = Path(str(result_dir)+'-c11')
    if opt.sym:
        result_dir = Path(str(result_dir)+'-sym')

    sample_dir = result_dir / 'sample'
    weight_dir = result_dir / 'weights'
    os.makedirs(str(sample_dir), exist_ok=True)
    os.makedirs(str(weight_dir), exist_ok=True)
    os.makedirs(str(result_dir),exist_ok=True)
    resultdB = result_dir / 'dBhistory.npy'
    backup_stdout = backup_stderr = None
    if result_fileout:
        backup_stdout = sys.stdout
        backup_stderr = sys.stderr
        sys.stdout = open(str(result_dir)+'/log.stdout','w')
        sys.stderr = open(str(result_dir)+'/log.stderr','w')
    print("Result on {}, File : {}".format(result_dir, resultdB))
    print(" CUDA  : {}".format(opt.cuda))
    print(" AUG   : {}".format(not opt.naive))
    print(" C11   : {}".format(opt.c11))
    print(" SYM   : {}".format(opt.sym))
    print(" COMP  : {}".format(opt.comp))

import torch
from torch import nn
from torch import optim
from torch.utils.data import DataLoader
from torch.autograd import Variable
from torchvision.utils import save_image

import numpy as np
from math import log10

# from model import SRCNN
from torch.nn.functional import relu
from torch.nn import MSELoss

import torch.utils.data as data
from torchvision import transforms
from torchvision.transforms import ToTensor, RandomCrop
from PIL import Image, ImageOps
import cv2
from pathlib import Path
import random
from pdb import set_trace

## SRCNNモデル定義(SRCNN)  
論文に従いモデルを定義   

In [None]:
class SRCNN(nn.Module):
    def __init__(self):
        super(SRCNN, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=64, kernel_size=9, padding=4)
        self.conv2 = nn.Conv2d(in_channels=64, out_channels=32, kernel_size=1, padding=0)
        self.conv3 = nn.Conv2d(in_channels=32, out_channels=3, kernel_size=5, padding=2)

        for m in self.modules():
            if isinstance(m, (nn.Conv2d)):
                nn.init.normal_(m.weight, mean=0, std=0.001)
                nn.init.constant_(m.bias, val=0)

            self.params = [
                        {'params': self.conv1.parameters()},
                        {'params': self.conv2.parameters()},
                        {'params': self.conv3.parameters(),
                        'lr': 1e-5}]

    def forward(self, x):
        x = self.conv1(x)
        x = relu(x)
        x = self.conv2(x)
        x = relu(x)
        x = self.conv3(x)
        return x

## 11x11カーネルを持つSRCNN(SRCNN-c11)  
原論文では、カーネルサイズ９x９の特徴抽出層が第１層に当たる  
これにカーネルサイズ１１x１１の層を追加し広範囲の特徴抽出を行う  

In [None]:
class SRCNN11(nn.Module):
    def __init__(self):
        super(SRCNN11, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=32, kernel_size=9, padding=4)
        self.conv11= nn.Conv2d(in_channels=3, out_channels=32, kernel_size=11, padding=5)
        self.conv2 = nn.Conv2d(in_channels=64, out_channels=32, kernel_size=1, padding=0)
        self.conv3 = nn.Conv2d(in_channels=32, out_channels=3, kernel_size=5, padding=2)

        for m in self.modules():
            if isinstance(m, (nn.Conv2d)):
                nn.init.normal_(m.weight, mean=0, std=0.001)
                nn.init.constant_(m.bias, val=0)

        self.params = [
                        {'params': self.conv1.parameters()},
                        {'params': self.conv11.parameters()},
                        {'params': self.conv2.parameters()},
                        {'params': self.conv3.parameters(),
                        'lr': 1e-5}]
    def forward(self, x):
        x9 = self.conv1(x)
        x9 = relu(x9)
        x11 = self.conv11(x)
        x11 = relu(x11)
        x = torch.cat((x9, x11),dim=1)
        x = self.conv2(x)
        x = relu(x)
        x = self.conv3(x)
        return x

## 5層モデル(SYM)  
SRCNNに残差機構を追加し、低層の情報を上位層へ直接伝えると共に、勾配消失を回避:SYMモデル  

In [None]:
class SYM(nn.Module):
    def __init__(self):
        super(SYM, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=64, kernel_size=9, padding=4)
        self.conv2 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, padding=1)
        self.conv3 = nn.Conv2d(in_channels=128, out_channels=64, kernel_size=1, padding=0)
        self.conv4 = nn.Conv2d(in_channels=64, out_channels=3, kernel_size=5, padding=2)

        for m in self.modules():
            if isinstance(m, (nn.Conv2d)):
                nn.init.normal_(m.weight, mean=0, std=0.001)
                nn.init.constant_(m.bias, val=0)

            self.params = [
                        {'params': self.conv1.parameters()},
                        {'params': self.conv2.parameters()},
                        {'params': self.conv3.parameters()},
                        {'params': self.conv4.parameters(),
                        'lr': 1e-5}]

    def forward(self, x):
        x = self.conv1(x) # 64
        x1 = relu(x)
        x = self.conv2(x1) #128
        x = relu(x)
        x = self.conv3(x) # 64
        x = relu(x) + x1
        x = self.conv4(x) # 3
        return x

## 使用モデルのインスタンス  
モデルインスタンス  
オプティマイザ定義  

In [None]:
if __name__=='__main__':
    if opt.c11:
        print('load model: SRCNN11')
        model = SRCNN11()
    elif opt.sym:
        print('load model: SYM')
        model = SYM()
    else:
        print('load model: SRCNN')
        model = SRCNN()

    criterion = MSELoss()
    if opt.cuda:
        model = model.cuda()
        criterion = criterion.cuda()

    optimizer = optim.Adam( model.parameters(), lr=1e-4 )

## データローダ定義  
学習用画像のミニバッチをロード  
評価用画像を1枚づつロード  
イテレータを戻す  

### 画像劣化モデル  
**BICUBLIC拡大縮小処理  
JPEG圧縮**  

### データ拡張  
flip  
mirror  
rotate  

In [None]:
def compress(img, Quality=10):
    img = np.array(img)
    encode_param = [int(cv2.IMWRITE_JPEG_QUALITY), Quality]
    result, img = cv2.imencode(".jpg", img, encode_param) # JPEG Encode
    out_img = cv2.imdecode(img, cv2.IMREAD_UNCHANGED)
    out_img  = Image.fromarray(np.uint8(out_img))
    return out_img

class DatasetLoader4Train(data.Dataset):
    def __init__(self, image_dir, patch_size, scale_factor, data_augmentation=True, comp=False, quality=10):
        super(DatasetLoader4Train, self).__init__()
        self.filenames = [str(filename) for filename in Path(image_dir).glob('*') if filename.suffix in ['.bmp', '.jpg', '.png']]
        self.patch_size = patch_size
        self.scale_factor = scale_factor
        self.data_augmentation = data_augmentation
        self.crop = RandomCrop(self.patch_size)
        self.comp = comp
        self.quality = quality

    def __getitem__(self, index):
        target_img = Image.open(self.filenames[index]).convert('RGB')
        target_img = self.crop(target_img)

        # Data Augmentation
        if self.data_augmentation:
            if random.random() < 0.5:
                target_img = ImageOps.flip(target_img)
            if random.random() < 0.5:
                target_img = ImageOps.mirror(target_img)
            if random.random() < 0.5:
                target_img = target_img.rotate(180)

        # BICUBIC
        input_img = target_img.resize((self.patch_size // self.scale_factor,) * 2, Image.BICUBIC)
        input_img = input_img.resize((self.patch_size,) * 2, Image.BICUBIC)

        # COMPRESS
        if self.comp:input_img = compress(input_img, self.quality)

        return ToTensor()(input_img), ToTensor()(target_img)

    def __len__(self):
        return len(self.filenames)

class DatasetLoader4Eval(data.Dataset):
    def __init__(self, image_dir, scale_factor, comp=False, quality=10):
        super(DatasetLoader4Eval, self).__init__()
        self.filenames = [str(filename) for filename in Path(image_dir).glob('*') if filename.suffix in ['.bmp', '.jpg', '.png']]
        self.scale_factor = scale_factor
        self.comp = comp
        self.quality = quality

    def __getitem__(self, index):
        target_img = Image.open(self.filenames[index]).convert('RGB')

        # BICUBIC
        input_img = target_img.resize((target_img.size[0] // self.scale_factor, target_img.size[1] // self.scale_factor), Image.BICUBIC)
        input_img = input_img.resize(target_img.size, Image.BICUBIC)

        # COMPRESS
        if self.comp: input_img = compress(input_img,self.quality)
            
        return ToTensor()(input_img), ToTensor()(target_img), Path(self.filenames[index]).stem

    def __len__(self):
        return len(self.filenames)

## Training Loop with MiniBatch  
epoch and snapshot size can be specified command args  

In [None]:
if __name__=='__main__':

    train_set = DatasetLoader4Train(image_dir='./data/General-100/train', patch_size=96, scale_factor=4, data_augmentation=not opt.naive, comp=opt.comp)
    train_loader = DataLoader(dataset=train_set, batch_size=10, shuffle=True)

    val_set = DatasetLoader4Eval(image_dir='./data/General-100/val', scale_factor=4, comp=opt.comp)
    val_loader = DataLoader(dataset=val_set, batch_size=1, shuffle=False)

    try:
        epochs = opt.epoch
        snaps  = opt.snap
    except:
        epochs = 5*10000
        snaps  = 5*  100
    trainProgress = []
#   progressLoss = []
    from pdb import set_trace
    for epoch in range(epochs):
        model.train() # Training Phase
        epoch_loss, epoch_psnr = 0, 0
        for batch in train_loader:
            inputs, targets = Variable(batch[0]), Variable(batch[1])
            if opt.cuda:
                inputs = inputs.cuda()
                targets = targets.cuda()

            optimizer.zero_grad()
            prediction = model(inputs)
            loss = criterion(prediction, targets)
            epoch_loss += float(loss.data)
            epoch_psnr += 10 * log10(1 / loss.data)

            loss.backward()
            optimizer.step()

        avrg_train_loss = epoch_loss / len(train_loader) # TrainData Pred vs GTruth
        avrg_train_psnr = epoch_psnr / len(train_loader)
        print('[Epoch {}] Loss: {:.4f}, PSNR: {:.4f} dB'.format(epoch + 1, avrg_train_loss, avrg_train_psnr))
        sys.stdout.flush()

        if (epoch + 1) % snaps != 0:
            continue

        model.eval()  # Validation Phase
        val_loss, val_psnr = 0, 0
        val_loss0,val_psnr0= 0, 0
        with torch.no_grad():
            for batch in val_loader:
                inputs, targets = batch[0], batch[1]
                if opt.cuda:
                    inputs = inputs.cuda()
                    targets = targets.cuda()

                prediction = model(inputs)
                loss = criterion(prediction, targets)
                val_loss += float(loss.data)
                val_psnr += 10 * log10(1 / loss.data)
            
                loss0= criterion(inputs, targets)
                val_loss0+= float(loss0.data)
                val_psnr0+= 10 * log10(1 / loss0.data)

                pred_file   = sample_dir / '{}_epoch{:05}.png'.format(batch[2][0], epoch + 1)
                target_file = sample_dir / '{}_epoch{:05}.png'.format(batch[2][0], 00000)
                save_image(prediction, pred_file, nrow=1)
                if not target_file.exists(): save_image(targets, target_file, nrow=1)

        avrg_val_loss0= val_loss0/ len(val_loader) # ValData Input vs GTruth
        avrg_val_psnr0= val_psnr0/ len(val_loader)
        avrg_val_loss = val_loss / len(val_loader) # ValData Prediction vs GTruth
        avrg_val_psnr = val_psnr / len(val_loader)
        trainProgress.append([ avrg_train_loss, avrg_train_psnr, avrg_val_loss, avrg_val_psnr ]) # TrainLoss, TrainPSNR, ValLoss, ValPSNR

        print("===> Avrg Loss: {:.4f} PSNR: {:.4f} dB [ VAL {:.4f} / {:.4f} dB ]".format(avrg_val_loss, avrg_val_psnr, avrg_val_loss0, avrg_val_psnr0))
        np.save(str(resultdB),trainProgress)
    
        torch.save(model.state_dict(), str(result_dir / 'latest_weight.pth')) # Save Latest Weight
        torch.save(model.state_dict(), str(weight_dir / 'weight_epoch{:05}.pth'.format(epoch + 1)))

    # retrieve stdio
    if result_fileout:
        sys.stdout = backup_stdout if backup_stdout else None
        sys.stderr = backup_stderr if backup_stderr else None

### 学習結果(viewres.ipynb)
**viewres.ipynbにて学習処理の結果表示並びに考察**

<a name="学習データ"></a>  
**付録**  
学習データは、提供サイトよりダウンロード、圧縮展開後、以下の３つのディレクトリへ分けて置く  
data/General-100/train data/General-100/val data/General-100/test  
学習データ80画像、バリデーション10画像、テスト10画像をランダムに選択  

**提出物**  
train.ipynb  
viewres.ipynb  
testview.ipynb  
result/SRCNN/latest_weight.pth  
result/SRCNN-naive/latest_weight.pth  
result-comp10/SRCNN/latest_weight.pth  
result-comp10/SRCNN-c11/latest_weight.pth  
result-comp10/SRCNN-sym/latest_weight.pth  
result/SRCNN/dBhistory.npy  
result/SRCNN-naive/dBhistory.npy  
result-comp10/SRCNN/dBhistory.npy  
result-comp10/SRCNN-c11/dBhistory.npy  
result-comp10/SRCNN-sym/dBhistory.npy  
data/General-100/test/im_\*.bmp    