🏷️chap_cv
医療診断、自動運転車、カメラモニタリング、スマートフィルタなど、コンピュータビジョンの分野における多くのアプリケーションは、私たちの現在と将来の生活に密接に関係しています。近年、ディープラーニングはコンピュータービジョンシステムのパフォーマンスを向上させる変革力となっています。最先端のコンピュータービジョンアプリケーションは、ディープラーニングとほとんど切り離せないと言えます。この観点から、本章ではコンピュータビジョンの分野に焦点を当て、近年学界や産業界で影響を与えている手法や応用について検討する。
:numref:chap_cnn
と :numref:chap_modern_cnn
では、コンピュータービジョンで一般的に使用されるさまざまな畳み込みニューラルネットワークを研究し、単純な画像分類タスクに適用しました。この章の冒頭では、モデルの汎化を改善する2つの方法、つまり画像拡張 と微調整について説明し、それらを画像分類に適用します。ディープニューラルネットワークは複数のレベルでイメージを効果的に表現できるため、このようなレイヤーワイズ表現は、オブジェクト検出、セマンティックセグメンテーション、スタイル転送 などのさまざまなコンピュータービジョンタスクでうまく使用されています。コンピュータービジョンでレイヤーワイズ表現を活用するという重要なアイデアに従い、まずは物体検出のための主要なコンポーネントとテクニックから始めます。次に、イメージのセマンティックセグメンテーションに完全畳み込みネットワークを使用する方法を説明します。次に、この本の表紙のようなイメージを生成するために、スタイル転送テクニックを使用する方法を説明します。最後に、この章とそれまでのいくつかの章の資料を、2つの一般的なコンピュータービジョンのベンチマークデータセットに適用して、この章を締めくくります。
:maxdepth: 2
image-augmentation
fine-tuning
bounding-box
anchor
multiscale-object-detection
object-detection-dataset
ssd
rcnn
semantic-segmentation-and-dataset
transposed-conv
fcn
neural-style
kaggle-cifar10
kaggle-dog