Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Perceptual Adversarial Networks for Image-to-Image Transformation #344

Open
crcrpar opened this issue Jun 29, 2017 · 0 comments
Open

Perceptual Adversarial Networks for Image-to-Image Transformation #344

crcrpar opened this issue Jun 29, 2017 · 0 comments

Comments

@crcrpar
Copy link

crcrpar commented Jun 29, 2017

一言でいうと

画像変換。GANに基づいた手法だが、real/fakeの識別誤差だけでなくperceptual lossを用いることでより鮮やかな画風変換ができるようになった。

論文リンク

著者/所属機関

  • Chaoyue Wang
  • Chang Xu
  • Chaohui Wang
  • Dacheng Tao

概要

データセットはxとyのペア。yがground truth(gt)でxがTの入力になる。
GANのreal / fakeの誤差だけでは予測とgtのズレを潰し切るのが困難で、画像のぼやけた感じの原因になるとし、perceptual lossを導入。ImageNetなどで学習したCNNの中間層の出力はデータの高次元の特徴であると考えられ、T(x)とy(= gt)それぞれに対してDiscriminatorの中間層出力のズレが小さければ
よりgtに近いものになる。またDiscriminatorはT(x)とgtの中間層のズレが十分小さければ、まだ埋められていないギャップを見つけようと更新される。

CNNの第i層の出力をD^i(・)とすると、Perceptural lossは
D^i(T(x)) - D^i(y)のノルムで表される。L1やL2が選択されることが多いが、この論文ではL1を用いている。

新規性・差分

  • perceptual loss

手法

  • アーキテクチャ
    • image
  • ロス
    • 全体

image
- perceptual: lambdaは重み、mは定数
-
image

結果

image

image

image

コメント

  • モデルのアーキテクチャの詳細が書かれていた。
  • skip connectionも聞いていそう。
    • 少しARっぽい気もする
  • 層数が現実的で良い
    • Theano実装ということも影響しているのだろうか。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants