# Computer Vision Service用いた画像解析

<p style='text-align:center'><img src='./images/computer_vision.jpg' alt='写真を持っているロボット'/></p>


*コンピュータビジョン*は、カメラを介してリアルタイムに、あるいは画像や映像を解析することで、世界を「見る」ことができるAIシステムの開発を目指す人工知能（AI）の一分野です。これは、デジタル画像が基本的に数値のピクセル値の配列であるという事実によって可能になり、それらのピクセル値を*特徴*として使用して機械学習モデルを訓練することができます。

## Computer Vision Cognitive Serviceを使う

Microsoft Azureには、一般的なAI機能をカプセル化した多くの *cognitive services* が含まれており、その中にはコンピュータビジョンソリューションの構築に役立つものも含まれています。

*コンピュータビジョン* コグニティブサービスは、Azureでのコンピュータビジョンの探索の出発点となるものです。これは、事前に訓練された機械学習モデルを使用して画像を分析し、画像に関する情報を抽出します。

例えば、Northwind Tradersが「スマートストア」を実装することを決めたとしましょう。コンピュータビジョンサービスを利用することで、店舗内の至る所に設置されたカメラで撮影された画像を分析して、何を描写しているのかを意味のある説明をすることができるようになります。


まずはAzureサブスクリプションで **Cognitive services** リソースを作成してみましょう。:

1. 別のブラウザタブで、https://portal.azure.com の Azure ポータルを開き、Microsoft アカウントでサインインします。
2. **[&#65291;リソースの作成]**ボタンをクリックして、*Cognitive Services* を検索し、次の設定で**Cognitive Services**リソースを作成します。:
    - **Name**: *一意の名前を入力してください*.
    - **Subscription**: *Azureサブスクリプション*.
    - **Location**: *利用可能なリージョンを選択します*.
    - **Pricing tier**: S0
    - **Resource group**: *一意な名前を持つリソースグループを作成します*.
3. デプロイが完了するのを待ちます。次に、Cognitive Servicesリソースに移動し、**クイックスタート** ページで、キーとエンドポイントに注意してください。クライアント アプリケーションからCognitive Services リソースに接続するには、これらが必要です。
4. リソースの **Key1** をコピーして、**YOUR_COG_KEY** を置き換えて、以下のコードに貼り付けます。
5. リソースの **endpoint** をコピーして、以下のコードに貼り付け、 **YOUR_COG_ENDPOINT** を置き換えます
6. 下のセルの緑色の<span style="color:green">&#9655</span>ボタン（セルの左上）をクリックして、下のセルでコードを実行します。

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_endpoint = 'YOUR_COG_ENDPOINT'

print('キー{}を使用して{}でCognitive Servicesを使用する準備ができました。'.format(cog_key, cog_endpoint))

これでキーとエンドポイントの設定が完了しました。

次のステップへ進む前に、AzureのCognitive Servicesの関連パッケージのインストールが必要になります。以下のセルを実行してください：

In [None]:
! pip install azure-cognitiveservices-vision-computervision

これで設定が完了しましたので、カスタムビジョンサービスを使用して画像を解析することができます。

以下のセルを実行して、/data/vision/store_cam1.jpg ファイル内の画像の説明を取得します。

In [None]:
from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from msrest.authentication import CognitiveServicesCredentials
from python_code import vision
import os
%matplotlib inline

# 画像ファイルへのパスを取得します
image_path = os.path.join('data', 'vision', 'store_cam1.jpg')

# computer vision serviceのクライアントを初期化する
computervision_client = ComputerVisionClient(cog_endpoint, CognitiveServicesCredentials(cog_key))

# computer vision serviceから説明を得る
image_stream = open(image_path, "rb")
description = computervision_client.describe_image_in_stream(image_stream)

# 画像とキャプションを表示する (コードはhelper_scripts/vision.pyにあります)
vision.show_image_caption(image_path, description)


妥当な精度のようですね。

別の画像を見てみよう

In [None]:
# 画像ファイルへのパスを取得します
image_path = os.path.join('data', 'vision', 'store_cam2.jpg')

# コンピュータビジョンサービスから説明を得る
image_stream = open(image_path, "rb")
description = computervision_client.describe_image_in_stream(image_stream)

# 画像とキャプションを表示する (コードはhelper_scripts/vision.pyにあります)
vision.show_image_caption(image_path, description)

繰り返しになりますが、提案されたキャプションはかなり正確なようです。

## 画像の特徴を分析する

ここまでで、Computer Vision serviceを使用して、いくつかの画像に説明的なキャプションを作成しましたが、できることはもっとたくさんあります。Computer Vision serviceは、以下のような詳細な情報を抽出できる分析機能を提供します。

- 画像内で検出された一般的な種類の物体の位置。
- 画像に写っている人の顔の位置、性別、年齢の目安。
- 画像に「アダルト」、「レイシー」、「グロい」コンテンツが含まれているかどうか。
- 画像を見つけやすくするために、データベースにある画像に関連するタグ。

以下のコードを実行して、買い物客の画像を分析します。

In [None]:
# 画像ファイルへのパスを取得する
image_path = os.path.join('data', 'vision', 'store_cam1.jpg')

# 解析したい機能を指定します
features = ['Description', 'Tags', 'Adult', 'Objects', 'Faces']

# computer vision serviceから解析結果を受ける
image_stream = open(image_path, "rb")
analysis = computervision_client.analyze_image_in_stream(image_stream, visual_features=features)

# 解析結果を表示する (コードはhelper_scripts/vision.pyにあります)
vision.show_image_analysis(image_path, analysis)

## Learn More

このノートブックで探索した機能に加えて、Computer Vision cognitive serviceには以下の機能が含まれています。

- 画像内の有名人を識別する。
- 画像内のブランドロゴを検出する
- 光学式文字認識（OCR）を実行して、画像内のテキストを読み取る。

コンピュータビジョンコグニティブサービスの詳細については、[コンピュータビジョンのドキュメント] (https://docs.microsoft.com/azure/cognitive-services/computer-vision/)を参照してください。