Skip to content

Latest commit

 

History

History
75 lines (44 loc) · 4.38 KB

deformable_detr.md

File metadata and controls

75 lines (44 loc) · 4.38 KB

Deformable DETR

Overview

変形可能 DETR モデルは、Xizhou Zhu、Weijie Su、Lewei Lu、Bin Li、Xiaogang Wang, Jifeng Dai によって Deformable DETR: Deformable Transformers for End-to-End Object Detection で提案されました 変形可能な DETR は、参照周囲の少数の主要なサンプリング ポイントのみに注目する新しい変形可能なアテンション モジュールを利用することにより、収束の遅さの問題と元の DETR の制限された特徴の空間解像度を軽減します。

論文の要約は次のとおりです。

DETR は、優れたパフォーマンスを実証しながら、物体検出における多くの手作業で設計されたコンポーネントの必要性を排除するために最近提案されました。ただし、画像特徴マップの処理における Transformer アテンション モジュールの制限により、収束が遅く、特徴の空間解像度が制限されるという問題があります。これらの問題を軽減するために、私たちは Deformable DETR を提案しました。この DETR のアテンション モジュールは、参照周囲の少数の主要なサンプリング ポイントのみに注目します。変形可能な DETR は、10 分の 1 のトレーニング エポックで、DETR よりも優れたパフォーマンス (特に小さなオブジェクトの場合) を達成できます。 COCO ベンチマークに関する広範な実験により、私たちのアプローチの有効性が実証されました。

描画

変形可能な DETR アーキテクチャ。 元の論文から抜粋。

このモデルは、nielsr によって提供されました。元のコードは ここ にあります。

Usage tips

  • トレーニング Deformable DETR は、元の DETR モデルをトレーニングすることと同等です。デモ ノートブックについては、以下の resources セクションを参照してください。

Resources

Deformable DETR の使用を開始するのに役立つ公式 Hugging Face およびコミュニティ (🌎 で示される) リソースのリスト。

  • [DeformableDetrForObjectDetection] のカスタム データセットでの推論と微調整に関するデモ ノートブックは、こちら にあります。
  • 物体検出タスクガイド も参照してください。

ここに含めるリソースの送信に興味がある場合は、お気軽にプル リクエストを開いてください。審査させていただきます。リソースは、既存のリソースを複製するのではなく、何か新しいものを示すことが理想的です。

DeformableDetrImageProcessor

[[autodoc]] DeformableDetrImageProcessor - preprocess - post_process_object_detection

DeformableDetrFeatureExtractor

[[autodoc]] DeformableDetrFeatureExtractor - call - post_process_object_detection

DeformableDetrConfig

[[autodoc]] DeformableDetrConfig

DeformableDetrModel

[[autodoc]] DeformableDetrModel - forward

DeformableDetrForObjectDetection

[[autodoc]] DeformableDetrForObjectDetection - forward