Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness [ICLR 2019] #5

Open
futakw opened this issue Aug 27, 2020 · 0 comments
Assignees

Comments

@futakw
Copy link
Collaborator

futakw commented Aug 27, 2020

論文リンク

https://arxiv.org/abs/1811.12231

概要

・非常に高精度である深層学習による画像認識が、人間とどのように異なるのか分析した。
・ImageNetで学習したCNNモデルにとって画像のテクスチャが重要であるという仮説を検証するために、形状とテクスチャが矛盾した画像(例:画像右)によるStylized-ImageNetというデータセットを構築し、形状に対応するクラスとテクスチャに対応するクラスのどちらであると認識するかを、人間・CNNモデルで比較。
スクリーンショット 2020-08-27 19 00 53
・結果、以下の画像のように人間は形状に偏った認識を行うのに対し、ImageNetで学習したCNNモデルはテクスチャに偏った認識を行うことがわかった。
スクリーンショット 2020-08-27 19 04 43
・また、Stylized-ImageNetで学習させたCNNモデルは形状に偏った認識を行うようになり、perturbationに対して一定のロバスト性を持つようになった。

先行研究との差異

過去の研究でも、CNNにおけるshapeとtextureの重要性の比較は行われてきた。本研究は、中でも非常に直感的に分かりやすい実験によって、人間による評価も加えたうえで比較しているため、評価できる。

手法のキモ

shape, textureで異なるクラスとなっているStylized-ImageNetを構築したところ。

議論

ある程度のノイズにはロバストになったものの、Adversarial Examples には効果がなかったらしいので、さらなる研究が必要である。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants