# ステレオカメラ映像を用いたコンピュータビジョンによる距離計測システム

Computer Vision Based Distance Measurement System using Stereo Camera View

Emre DANDIL, Kerim Kürşat ÇEVİK 発表者: 22S1023 高見俊介

In recent years, especially in industrial automation systems, in order for robots to understand their distances and positions according to the target, close to human vision, computer vision systems are needed. Computer vision close to human vision can only be created using stereo cameras. In this study, a computer vision system is developed using the stereo camera system for measuring object distances. In the study, first of all, for the distance measurement, the distance of the face images obtained from the stereo camera system to the screen is calculated. In measuring the distances of the face images to screen, the disparity maps are first extracted and the face region is detected. Afterwards, the distance measurements are performed on the obtained images in the stereo camera system on account of calculating the shifts between the frames. In the experimental studies, the actual distance values such as 71, 74, 75, 79, 110, 125, and 115 of the face to the screen are measured as 70, 72, 73, 77, 97, 120, 132 cm by proposed system, respectively. When the experimental results are examined, we can say that the proposed computer vision system is successful in distance measurement using stereo camera view.

**Key Words:** Distance, measurement, image processing, computer vision, stereo camera, disparity maps

#### 1 緒言

コンピュータを介して視覚とシミュレーションを提供するコンピュータビジョンシステムは,日常生活の様々な分野で利用されている.ビジョンシステムは,シングルカメラ,ステレオカメラ,マルチカメラによって行われる.ステレオカメラは,2台のカメラや複数台のカメラを使って,コンピュータビジョンイベントを実現することができる.ステレオカメラは,異なる2台のカメラで撮影された画像から,3次元空間上の点座標を再現する視覚化技術である.このステレオビジョンシステムは,携帯型自律型ロボットシステム,3次元計測,物体追跡,映画産業,拡張現実,物体認識など多くの分野で活用されている.

視差マップの取得は、ステレオビジョンシステムにおいて解決しなけれならない重要な問題の一つである。視差マップを得るために、様々な方法が用いられている。2つの画像間のピクセルのマッチングによって提供される幾何学に基づく方法が一般的に使われている。

このように,校正されたステレオビジョンシステムを用いた実用的なアプリケーションは少ないのが現状である.そこで本研究では,ステレオカメラ映像を用いた物体距離計測のためのコンピュータビジョンシステムを開発した.本研究では,まず,ステレオカメラで撮影された顔画像の画面に対する距離を計算し,物体距離を計測した.次に,視差マップを用いて,顔画像の画面に対する距離を求めた.最後に,距離の測定値を提案するコンピュータビジョンシステムと実際の距離の値と比較することで,システムの性能を検証した.

#### 2 関連研究

 ${
m Mingas}$  らは [3] でグローバルマップとローカルスキャンの間で ICP アルゴリズムを実行し、その結果を利用する  ${
m SLAM}$  を

FPGA 上に実装している. Ratter らは [4] で GraphSLAM を並列に GPU 上に ICP ベースで実装し,計算を高速化している.

# 3 アプローチ方法

## ${\bf 3.1}\quad {\bf Graph SLAM}$

GraphSLAM は,環境をグラフとして表す SLAM アルゴリズムである.操作可能な GraphSLAM アルゴリズムは,

- 1. 状態ベクトルと情報行列からなる線形方程式系の作成
- 2. システム内のループクロージャを探す
- 3. ループクロージャの線形方程式のシステムへの組み込み
- 4. 方程式の線形システムを解き,状態ベクトルを更新
- 5. 環境の地図を作成

### の手順で構築する.

ステップ 1, 3, 4 で表される誤差の収束に焦点を当てるため, ステップ 2 は手作業で行う. マッピングはステップ 5 で実行されるが, GraphSLAM の状態推定には含まれない. 今回設計するシステムを用いて姿勢を推定することで姿勢が既知の状態でマッピングすることができる.

 $\operatorname{GraphSLAM}$  アルゴリズムのステップ 1 と 3 では,ループクロージャによって誤差を収束するための線形システムを式 (1) として構築する. $\Delta \vec{x}$  に現在の状態ベクトル  $\vec{x}$  に適用される状態変化を含む.状態ベクトル内の状態間の関係は情報行列  $\mathbf H$  で,見つかる誤差は誤差ベクトル  $\vec{b}$  で表す.

$$\mathbf{H}\Delta \vec{x} = -\vec{b} \tag{1}$$

誤差の合計は , 式 (1) の線形システムを反復的に解くことによって最小にすることができる .

# 3.2 FPGA への実装

まず数学的記述から始め,次にこれらの記述を関数型言語で実装する. $\mathrm{C}\lambda\mathrm{aSH}$  の文法や構文は関数型言語である  $\mathrm{Haskell}$  を元に

構成されており,組み合せ回路と同期回路の両方に対して構造的な設計アプローチをとることができる.設計プロセスは,

- A. 数学的解法/アルゴリズムを選択
- B. Haskell で数学的記述を指定して CλaSH に変換
- C. ハードウェア制約を決定
- D. 面積-時間トレードオフを作成
- E. シミュレーションと合成

の 5 つの手順に分かれている. ステップ A では問題の解について 数学的に定義する.情報行列 H には通常多くのゼロが含まれてい るため、スパース表現にするとメモリ使用量を減らすことができ る. FPGA 上で GraphSLAM を効率的に実装するには,アルゴ リズムが決定論的である必要がある. 再利用しやすい規則的な構 造となることが望ましい.ステップBでは Haskell で数学的記述 を指定した後, Haskell インタプリタを使用して記述をシミュレー トする.FPGA の仕様上の限界に達しておらず,完全な並列設計 が可能な場合は,直接ステップEに進み, $C\lambda aSH$ コンパイラで HDL を生成する.ステップ C ではシステムのどの部分がボトル ネックになるかを決定する.FPGA は面積と時間によって制約を 受ける.面積によって FPGA が論理要素またはデジタル信号プ ロセッサ (DSP) で作成された演算子で並列に実行できる操作の数 が決定される.時間はFPGAが動作するクロック周波数によっ て定義され,組合せパスの長さによって定義される.できる限り 多くの計算資源を並列に使用するような機能設計が要求されるが, FPGA で並列計算可能なリソースより多い場合には並列に処理で きない分を逐次的に計算することで解決する. ステップ D では使 用するハードウェアの使用率を高めるため, すべてのアルゴリズム の全体的な構造を見て,時間の経過とともに再利用されるハード ウェアの規則的な部分を決定する . ステップ E では  $C\lambda aSH$  コン パイラが FPGA 上で直接合成可能な HDL を自動的に生成する. 以上の 5 ステップをハードウェアに GraphSLAM を記述するた めに用いる.

#### 4 評価

設計したシステムのシミュレーションを行い, GraphSLAM でループを閉じる前と閉じた後を比較した. さらに設計したシステムを実機に実装し, ハードウェアリソースの利用率を確認した.

#### 4.1 シミュレーションとシミュレーション結果

状態ベクトルを入力し、GraphSLAM によって状態ベクトルを修正する.入力の状態ベクトルは、インテル研究所の SLAM データセットの最初の 336 ポーズで構成されており、建物の廊下を通る最初のループを含む.図 1 の左に補正されていない状態ベクトル(経路)を、右にループを閉じた後に GraphSLAM によって修正された状態ベクトルを示す.



Fig.1: Example input (left) and output state vector (right) of the GraphSLAM algorithm

この画像には地図が描かれていないが,ロボットが移動した軌跡

を示す.右側は正方形の図形を示しており,実際の建物の構造に一致している.データセットのオドメトリデータは ICP アルゴリズムで修正されており,GraphSLAM でループを閉じた結果,オドメトリのみでの場合と比較して状態推定が良好になった.一方,修正前のオドメトリは,ループを閉じた後も状態推定において誤差が収束することはなかった.ICP アルゴリズムで修正したオドメトリの状態ベクトルのループを閉じることは,修正されていない状態ベクトルよりも容易である.

#### 4.2 実機への実装

3 章にて示した手法を用いて実際に Altera 社の FPGA である Cyclone V 上に  $C\lambda$ aSH を用いて GraphSLAM を決定論的に構築した.このアーキテクチャに対応する合成結果を表 1 に示す.

Table 1: FPGA SYNTHESIS RESULTS

|                | Used    | Available | Utilization |
|----------------|---------|-----------|-------------|
| ALMs           | 2611    | 41,910    | 6%          |
| BlockRAM(bits) | 412,784 | 5,662,720 | 7%          |
| m DSPs         | 8       | 112       | 7%          |

システムは 15 bit の整数ビットと 12 bit の小数ビットで構成される 27 bit 符号付き固定小数点データ型を使用してシミュレートされ,合成された.ベクトル ALU は,8 つの計算を並列に実行する算術演算ユニットとしてシミュレートされ,合成された.表 1 の合成結果が示す 27 bit DSP の数に等しい.

### 5 結言

FPGA 上に GraphSLAM アルゴリズムを実装するために使用する方法論を示した. $C\lambda aSH$  を用いて数学的記述を低級なハードウェア記述に変換し,FPGA 上に GraphSLAM を実装した.設計時間を定量化することは難しい問題であるが,従来の方法ではハードウェアアーキテクチャの開発に膨大な時間がかかる SLAM のような大規模なアプリケーションに対して  $C\lambda aSH$  による抽象化で開発を大幅に簡略化することができた.

### 5.1 今後の展望

面積-時間トレードオフを手作業で行ったが,これは時間のかかるプロセスである.リソースと並列化性能の観点からハードウェアの性能限界とアルゴリズムをパラメータ化することにより,設計がパラメータ化可能であれば,面積-時間トレードオフを自動的に行うことができ,さらなる設計時間の短縮が可能である.

### 参考文献

- G. Grisetti, R. Kummerle, C. Stachniss, and W. Burgard: "A Tutorial on Graph-Based SLAM," IEEE Intelligent Transportation Systems Magazine, Vol. 2, No. 4, pp. 31-43, 2010.
- [2] C. Baaij, M. Kooijman, J. Kuper, A. Boeijink, and M. Gerards: "CλaSH: Structural Descriptions of Synchronous Hardware Using Haskell," 2010 13th Euromicro Conference on Digital System Design: Architectures, Methods and Tools, pp. 714-721, 2010.
- [3] Grigorios Mingas, Emmanouil Tsardoulias, and Loukas Petrou: "An FPGA implementation of the SMG-SLAM algorithm," Microprocessors and Microsystems, Vol. 36, No. 3, pp. 190 – 204, 2012.
- [4] A. Ratter, C. Sammut, and M. McGill: "GPU accelerated graph SLAM and occupancy voxel based ICP for encoder-free mobile robots," 2013 IEEE/RSJ International Conference on Intelligent Robots and Systems, pp. 540-547, 2013.