応用情報工学演習 -- OpenCV, カスケード識別器によるオブジェクト検出

<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#復習：GUIプログラミング" data-toc-modified-id="復習：GUIプログラミング-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>復習：GUIプログラミング</a></span></li><li><span><a href="#ビデオをキャプチャして画面に表示" data-toc-modified-id="ビデオをキャプチャして画面に表示-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>ビデオをキャプチャして画面に表示</a></span><ul class="toc-item"><li><span><a href="#ソースコード" data-toc-modified-id="ソースコード-2.1"><span class="toc-item-num">2.1&nbsp;&nbsp;</span>ソースコード</a></span></li><li><span><a href="#練習問題１：ビデオ画像処理" data-toc-modified-id="練習問題１：ビデオ画像処理-2.2"><span class="toc-item-num">2.2&nbsp;&nbsp;</span>練習問題１：ビデオ画像処理</a></span></li></ul></li><li><span><a href="#OpenCVカスケード識別器を使用して顔検出を実装してみる" data-toc-modified-id="OpenCVカスケード識別器を使用して顔検出を実装してみる-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>OpenCVカスケード識別器を使用して顔検出を実装してみる</a></span><ul class="toc-item"><li><span><a href="#画像を読み込んで顔検出を行う" data-toc-modified-id="画像を読み込んで顔検出を行う-3.1"><span class="toc-item-num">3.1&nbsp;&nbsp;</span>画像を読み込んで顔検出を行う</a></span></li><li><span><a href="#練習問題２：-ビデオをキャプチャして物体検出" data-toc-modified-id="練習問題２：-ビデオをキャプチャして物体検出-3.2"><span class="toc-item-num">3.2&nbsp;&nbsp;</span>練習問題２： ビデオをキャプチャして物体検出</a></span></li></ul></li></ul></div>

# 復習：GUIプログラミング


先週まででPyQt5を利用しGUIプログラミングについて学んだ．QApplicationクラスとQMainWindowクラスを使うだけで，ウィンドウを持つアプリケーションを作成できる．

In [1]:
import sys
from PyQt5.QtWidgets import *

def main():
    app = QApplication(sys.argv)
    w = QMainWindow()             # 1. MainWindow()クラスのインスタンスを生成し変数wに代入
    w.resize(250, 150)            # 2. ウィンドウwを250x150ピクセルにリサイズ
    w.setWindowTitle('QtSample')  #   ウィンドウwのタイトルを設定
    w.show()                      #   ウィンドウwを表示（実際は，app.exec_()を呼ぶまで表示されない）
    app.exec_()

if __name__ == '__main__': 
    main()

# ビデオをキャプチャして画面に表示

OpenCVのライブラリ機能 VideoCaptureクラスを利用して，PC内蔵カメラで撮影した画像をキャプチャしウィンドウ内に表示するだけのアプリケーションを作成します．

ソフトウェアの構造についてはPowerPoint資料を参考にしてください．


## ソースコード

In [1]:
import sys, os
from PyQt5.QtWidgets import *
from PyQt5.QtCore import *
from PyQt5.QtGui import *
import cv2
import numpy as np

class VideoCaptureView(QGraphicsView):
    """ ビデオキャプチャ """
    repeat_interval = 200 # ms 間隔で画像更新

    def __init__(self, parent = None):
        """ コンストラクタ（インスタンスが生成される時に呼び出される） """
        super(VideoCaptureView, self).__init__(parent)
        
        # 変数を初期化
        self.pixmap = None
        self.item = None
        
        # VideoCapture (カメラからの画像取り込み)を初期化
        self.capture = cv2.VideoCapture(0)

        if self.capture.isOpened() is False:
            raise IOError("failed in opening VideoCapture")

        # ウィンドウの初期化
        self.scene = QGraphicsScene()   # 描画用キャンバスを作成
        self.setScene(self.scene) 
        self.setVideoImage()
        
        # タイマー更新 (一定間隔でsetVideoImageメソッドを呼び出す)
        self.timer = QTimer(self)
        self.timer.timeout.connect(self.setVideoImage)
        self.timer.start(self.repeat_interval)
        
    def setVideoImage(self):
        """ ビデオの画像を取得して表示 """
        ret, cv_img = self.capture.read()                # ビデオキャプチャデバイスから画像を取得
        if ret == False:
            return
        cv_img = cv2.cvtColor(cv_img,cv2.COLOR_BGR2RGB)  # 色変換 BGR->RGB
        
        cv_img = self.processing(cv_img)

        height, width, dim = cv_img.shape
        bytesPerLine = dim * width                       # 1行辺りのバイト数
        
        #cv_img = self.processing(cv_img)
        
        self.image = QImage(cv_img.data, width, height, bytesPerLine, QImage.Format_RGB888)
        if self.pixmap == None:                          # 初回はQPixmap, QGraphicPixmapItemインスタンスを作成
            self.pixmap = QPixmap.fromImage(self.image)
            self.item = QGraphicsPixmapItem(self.pixmap)
            self.scene.addItem(self.item)                # キャンバスに配置
        else:
            self.pixmap.convertFromImage(self.image)     # ２回目以降はQImage, QPixmapを設定するだけ
            self.item.setPixmap(self.pixmap)
    
    def processing(self, src):
        """ 画像処理 """
        im = src.copy()
        
        # <-- 練習問題1: ここにコードを追加
        im = cv2.resize(im, (320, 240))
        # ここで画像を加工
        font = cv2.FONT_HERSHEY_SIMPLEX
        im = cv2.putText(im, 'OpenCV', (10,470), font, 1, (255,255,255), 2, cv2.LINE_AA)
        
        # 階調変換
        #im = (lambda x: 255 - x)(im)
        #im = (lambda x: np.uint8(-127 * np.cos(x/255*3*np.pi) + 128))(im)
        
        # 空間フィルタ
        #im = cv2.GaussianBlur(im, (9, 9), 0)
        #im = cv2.Sobel(im, cv2.CV_8U, 1, 0, ksize=3)
        im = cv2.Sobel(im , cv2.CV_64F, 1, 0, ksize=3)
        #im = cv2.Laplacian(im, cv2.CV_64F, ksize=3)
        
        range2 = np.maximum(np.max(im), np.min(im))
        im = np.absolute((im/range2+1.0)*127)
        im = np.uint8(im)
        
        # 一部領域のみ処理
        #dst = src
        #dst[200:400, 200:400, :] = im[200:400, 200:400, :]
        dst = im
        
        return dst
            
if __name__ == '__main__':
    app = QApplication(sys.argv)
    app.aboutToQuit.connect(app.deleteLater)
    
    main = QMainWindow()              # メインウィンドウmainを作成
    main.setWindowTitle("Video Capture")
    viewer = VideoCaptureView()       # VideoCaptureView ウィジエットviewを作成
    main.setCentralWidget(viewer)     # mainにviewを埋め込む
    main.show()
    
    app.exec_()
    
    viewer.capture.release()

## 練習問題１：ビデオ画像処理

(1) 画像を幅320ピクセル, 高さ240ピクセルに縮小して表示するようにプログラムを変更しなさい．`VideoCaptureView.processing()`メソッドを変更する．
  - `cv2.resize(src, dsize)`関数を使用してよい．ここで，`src`は入力画像，`dsize=(width, height)`は出力サイズを表す．
  - 再標本化のオプション`-interpolation`を変更してみてなさい．
 

(2) 画像に以下のフィルタを作用してリアルタイムに表示するようにプログラムを修正しなさい
  - 階調変換：例えば，ネガポジ反転，ソラリゼーション
  - 空間フィルタ：例えば，ガウシアンフィルタ，Sobelフィルタ
  - 領域制限：例えば，上半分だけフィルタを作用する
  - 空間フィルタの実装にはOpenCVの関数を使用して良い(cv2.filter2D, cv2.Sobel, cv2.GaussianBlurなど)
  
 ＜出力例＞
 Sobelフィルタ（横方向）
![image.png](attachment:image.png)


 領域制限＋ソラリゼーション
![image.png](attachment:image.png)

# OpenCVカスケード識別器を使用して顔検出を実装してみる

OpenCVには，カスケード識別器を用いた物体検出アルゴリズムとモデルファイル（学習済みパラメータ）が標準で組み込まれています．OpenCVには，以下のモデルファイルが付属しています．
* 正面顔(frontalface)
* 横顔(profileface)
* 目(eye, righteye, lefteye)
* ネコ(catface)
* 全身(fullbody)
* ナンバープレート(licece_plate)
* 笑顔(smile)
* 上半身(upperbody)
* 歩行者(pedestrians)
* 銀製食器(silverware)
 
ソフトウェアの構造についてはPowerPoint資料を参考にしてください．


## 画像を読み込んで顔検出を行う
下のコードを動かしてlena.jpgを選択してみてください．<br>
動かない場合は，jupyter notebookのメニュー [Kernel]-[Restart]でインタプリタを再起動してください．<br>
動いた人は以下に取り組んでみましょう．
* 自分の持っている画像で顔検出をしてみてください．
* scalefactorとminneighborsのパラメータを変えて結果がどう変わるか見てみましょう．
* 上記のように，顔検出以外にもいろいろモデルファイルが用意されているので，"models/lbpcascades/lbpcascade_frontalface.xml"の部分を書き換えて試してみましょう．

In [5]:
import sys, os
from PyQt5.QtWidgets import *
from PyQt5.QtCore import *
from PyQt5.QtGui import *
import cv2
import numpy as np

class ObjDetector():
    """ 物体検出器 """
    def __init__(self, filename = None):
        # カスケード分類器の初期化
        self.cascade = cv2.CascadeClassifier()  # カスケード識別器のインスタンスを作成
        if filename != None:
            self.cascade.load(filename) # モデルファイルを読み込み
    
    def load(self, filename):
        self.cascade.load(filename)
        if self.cascade.empty():
            raise IOError("error in loading cascade file \"" + filename + "\"")
        
    def detect(self, im):
        """ 物体検出処理 """
        if self.cascade.empty():
            return []
        
        scalefactor = 1.1
        minneighbors = 3
        objects = self.cascade.detectMultiScale(im,
            scaleFactor=scalefactor, minNeighbors=minneighbors)

        #count = len(objects)
        #print('detection count: %s' % (count,))

        return objects
    

class MyWindow(QMainWindow):
    
    def __init__(self, viewer):
        """ インスタンスが生成されたときに呼び出されるメソッド """
        super(MyWindow, self).__init__()
        self.initUI(viewer)
  
    def initUI(self, viewer):
        """ UIの初期化 """
        """↓ ここから """
        # (1) ニュー項目[File]-[Select]が選択されたときのアクションを生成
        selectAction = QAction('&Select', self)
        # (2) メニュー項目が選択されたときの処理として，MyViewクラスのsetImageメソッドを設定
        selectAction.triggered.connect(viewer.setImage)
        
        # (3) メインウィンドウのメニューバーオブジェクトを取得
        menubar = self.menuBar()
        # (4) メニューバーに[File]メニューを追加し，そのアクションとしてselectActionを登録
        fileMenu = menubar.addMenu('&File')
        fileMenu.addAction(selectAction)
        
        self.resize(600, 600)
    
    
class MyView(QGraphicsView):

    def __init__(self, parent = None):
        """ コンストラクタ（インスタンスが生成される時に呼び出される） """
        super(MyView, self).__init__(parent)
        
        # 変数を初期化
        self.pixmap = None
        self.item = None
        self.rect_items = []

        # 描画キャンバスの初期化
        self.scene = QGraphicsScene()
        self.setScene(self.scene) 
        self.pen = QPen(QColor(0xff, 0x00, 0x00))     # ペンを作成 (RGB)
        self.pen.setWidth(3)                          # ペンの太さを設定
        #self.brush = QBrush(QColor(0xff, 0xff, 0xff), Qt.SolidPattern)    #ブラシを作成
        self.brush = QBrush()

    def setImage(self):
        """ 画像を取得して表示 """
        file_name = QFileDialog.getOpenFileName(self, 'Open file', './')     # 画像を選択してファイル名を取得
        n = np.fromfile(file_name[0], dtype=np.uint8)    # imreadだと日本語のファイル名に対応できないため，np.fromfileとcv2.imdecodeを使う
        cv_img = cv2.imdecode(n, cv2.IMREAD_COLOR)        
        if cv_img is None:
            return
        cv_img = cv2.cvtColor(cv_img,cv2.COLOR_BGR2RGB)  # 色変換 BGR->RGB
        height, width, dim = cv_img.shape
        bytesPerLine = dim * width                       # 1行辺りのバイト数
        
        self.image = QImage(cv_img.data, width, height, bytesPerLine, QImage.Format_RGB888)
        if self.pixmap == None:                          # 初回はQPixmap, QGraphicPixmapItemインスタンスを作成
            self.pixmap = QPixmap.fromImage(self.image)
            self.item = QGraphicsPixmapItem(self.pixmap)
            self.scene.addItem(self.item)                # キャンバスに配置
        else:
            self.pixmap.convertFromImage(self.image)     # ２回目以降はQImage, QPixmapを設定するだけ
            self.item.setPixmap(self.pixmap)

        # 物体検出を実行
        rects = detector.detect(cv_img)
        # 直前に描画した矩形を削除
        for item in self.rect_items:
            self.scene.removeItem(item)
        # 新しい矩形を描画
        self.rect_items = []
        for (x, y, w, h) in rects:
            self.rect_items.append(self.scene.addRect(x, y, w, h, self.pen, self.brush))
    
    
if __name__ == '__main__':
    app = QApplication(sys.argv)
    app.aboutToQuit.connect(app.deleteLater)
    
    detector = ObjDetector("models/haarcascades/haarcascade_frontalface_default.xml")
    
    viewer = MyView()       # MyView ウィジエットviewを作成
    main = MyWindow(viewer)
    main.setWindowTitle("Face Detector")
    main.setCentralWidget(viewer)     # mainにviewを埋め込む
    main.show()
    
    app.exec_()

## 練習問題２： ビデオをキャプチャして物体検出
(1) 以下のセルの未完成部分にプログラムを完成させ，正しく動作することを確認しなさい．<br>
(2) モデルファイルを“models/haarcascades/haarcascade_smile.xml”に変更して動作を確認しなさい．<br>


In [4]:
import sys, os
from PyQt5.QtWidgets import *
from PyQt5.QtCore import *
from PyQt5.QtGui import *
import cv2

class ObjDetector():
    """ 物体検出器 """
    def __init__(self, filename = None):
        # カスケード分類器の初期化
        self.cascade = cv2.CascadeClassifier()  # カスケード識別器のインスタンスを作成
        if filename != None:
            self.cascade.load(filename) # モデルファイルを読み込み
    
    def load(self, filename):
        self.cascade.load(filename)
        if self.cascade.empty():
            raise IOError("error in loading cascade file \"" + filename + "\"")
        
    def detect(self, im):
        """ 物体検出処理 """
        if self.cascade.empty():
            return []
        
        scalefactor = 1.1
        minneighbors = 3
        objects = self.cascade.detectMultiScale(im,
            scaleFactor=scalefactor, minNeighbors=minneighbors)

        #count = len(objects)
        #print('detection count: %s' % (count,))

        return objects
    
class VideoCaptureView(QGraphicsView):
    """ ビデオキャプチャ """
    repeat_interval = 200 # ms 間隔で画像更新

    def __init__(self, parent = None):
        """ コンストラクタ（インスタンスが生成される時に呼び出される） """
        super(VideoCaptureView, self).__init__(parent)
        
        # 変数を初期化
        self.pixmap = None
        self.item = None
        self.rect_items = []
        
        # VideoCapture (カメラからの画像取り込み)を初期化
        self.capture = cv2.VideoCapture(0)

        if self.capture.isOpened() is False:
            raise IOError("failed in opening VideoCapture")

        # 描画キャンバスの初期化
        self.scene = QGraphicsScene()
        self.setScene(self.scene) 
        self.pen = QPen(QColor(0xff, 0x00, 0x00))     # ペンを作成 (RGB)
        self.pen.setWidth(3)                          # ペンの太さを設定
        #self.brush = QBrush(QColor(0xff, 0xff, 0xff), Qt.SolidPattern)    #ブラシを作成
        self.brush = QBrush()
        
        self.setVideoImage()
        
        # タイマー更新 (一定間隔でsetVideoImageメソッドを呼び出す)
        self.timer = QTimer(self)
        self.timer.timeout.connect(self.setVideoImage)
        self.timer.start(self.repeat_interval)

    def setVideoImage(self):
        """ ビデオの画像を取得して表示 """
        ret, cv_img = self.capture.read()                # ビデオキャプチャデバイスから画像を取得
        if ret == False:
            return
        cv_img = cv2.cvtColor(cv_img,cv2.COLOR_BGR2RGB)  # 色変換 BGR->RGB
        height, width, dim = cv_img.shape
        bytesPerLine = dim * width                       # 1行辺りのバイト数
        
        self.image = QImage(cv_img.data, width, height, bytesPerLine, QImage.Format_RGB888)
        if self.pixmap == None:                          # 初回はQPixmap, QGraphicPixmapItemインスタンスを作成
            self.pixmap = QPixmap.fromImage(self.image)
            self.item = QGraphicsPixmapItem(self.pixmap)
            self.scene.addItem(self.item)                # キャンバスに配置
        else:
            self.pixmap.convertFromImage(self.image)     # ２回目以降はQImage, QPixmapを設定するだけ
            self.item.setPixmap(self.pixmap)

        # 物体検出を実行
        rects = detector.detect(cv_img)
        # 直前に描画した矩形を削除
        for item in self.rect_items:
            self.scene.removeItem(item)
        # 新しい矩形を描画
        self.rect_items = []
        for (x, y, w, h) in rects:
            self.rect_items.append(self.scene.addRect(x, y, w, h, self.pen, self.brush))
            
if __name__ == '__main__':
    app = QApplication(sys.argv)
    app.aboutToQuit.connect(app.deleteLater)
    
    #detector = ObjDetector("models/lbpcascades/lbpcascade_frontalface.xml")
    detector = ObjDetector("models/haarcascades/haarcascade_frontalface_default.xml")

    main = QMainWindow()              # メインウィンドウmainを作成
    main.setWindowTitle("Face Detector")
    viewer = VideoCaptureView()       # VideoCaptureView ウィジエットviewを作成
    main.setCentralWidget(viewer)     # mainにviewを埋め込む
    main.show()
    
    app.exec_()
    
    viewer.capture.release()