# 物体検出
物体検出タスクに取り組みながらSSD(Single Short MultiBox Detector)と呼ばれるディープラーニングモデルを見ていきます。

## 物体検出の概要

物体検出は1枚の画像中に含まれている複数の物体に対して、物体の領域と物体名を特定するタスクです。<br>画像のどこに、何が写っているのか？を明らかにします。

![jpg](image/bouding.jpg)
<center>図：物体検出の結果<\center>

図は物体検出の結果を表示しています。
枠が人と馬をそれぞれ囲っています。
この物体の位置を示す枠を「バウンディングボックス（Bounding Box）」と呼びます。
枠にはラベル名が表示され、このラベル名は検出した物体のクラス名を示します。
クラス名の検出には確信度（confidence）を使います。
この数字が高いほど（最大1.0）自信をもって検出していることがわかります。

## 物体検出のインプットとアウトプット

物体検出のインプットは画像です。
アウトプットは3つの情報になります。
1. 物体の存在を示すバウンディングボックスの位置と大きさ
2. 各バウンディングボックスが何の物体化を示すラベル情報
3. ラベル情報に対する確信度=confidence



1.	物体検出で使用するDatasetクラスを作成できるようになる
2.	SSDの学習時のデータオーギュメンテーションで、何をしているのかを理解する

データ取得

In [None]:
import os
import urllib.request
import zipfile
import tarfile

In [2]:
# フォルダ「data」が存在しない場合は作成する
data_dir = './data/'
if not os.path.exists(data_dir):
    os.mkdir(data_dir)

In [3]:
# フォルダ「weights」が存在しない場合は作成する
weights_dir = './weights/'
if not os.path.exists(weights_dir):
    os.mkdir(weights_dir)

In [None]:
# VOC2012のデータセットをここからダウンロードします
# 時間がかかります（約15分）
url = 'http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar'
target_path = os.path.join(data_dir, 'VOCtrainval_11-May-2012.tar') 

if not os.path.exists(target_path):
    urllib.request.urlretrieve(url, target_path)
    
    tar = tarfile.TarFile(target_path)  # tarファイルを読み込み
    tar.extractall(data_dir)  # tarを解凍
    tar.close()  # tarファイルをクローズ
    

In [None]:
# 学習済みのSSD用のVGGのパラメータをフォルダ「weights」にダウンロード
# MIT License
# Copyright (c) 2017 Max deGroot, Ellis Brown
# https://github.com/amdegroot/ssd.pytorch
    
url = 'https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pth'
target_path = os.path.join(weights_dir, 'vgg16_reducedfc.pth') 

if not os.path.exists(target_path):
    urllib.request.urlretrieve(url, target_path)

乗馬の画像を手動でダウンロード

https://pixabay.com/ja/photos/%E3%82%AB%E3%82%A6%E3%83%9C%E3%83%BC%E3%82%A4-%E9%A6%AC-%E4%B9%97%E9%A6%AC-%E6%B0%B4-%E6%B5%B7-757575/
の640×426サイズの画像
（画像権利情報：商用利用無料、帰属表示は必要ありません）

を、フォルダ「data」の直下に置く。

本章の内容で筆者が作成した学習済みのSSD300モデル「ssd300_50.pth」


https://drive.google.com/open?id=1_zTTYQ2j0r-Qe3VBbHzvURD0c1P2ZSE9   
    
    
必ずしもダウンロードの必要はありませんが、
自分でSSDネットワークを学習させる前に、学習済みモデルを試したい場合は、
手動ダウンロードした「ssd300_50.pth」をフォルダ「wights」に配置してください。

In [None]:
!pip install opencv-contrib-python