In [None]:
# Licensed under the Apache License, Version 2.0 (the "License"); you may
# not use this file except in compliance with the License. You may obtain
# a copy of the License at
#
#      http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
# WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
# License for the specific language governing permissions and limitations
# under the License.

# Lab3: Visual Recognition 画像認識

https://www.ibm.com/watson/jp-ja/developercloud/visual-recognition.html

Visual RecognitionはWatsonの画像認識機能です。すぐにお使いいただけるようにWatsonが既に学習をしており、画像・映像フレームに写った複数のものや、情景を分析・認識することができます。また、機械学習によりWatsonに独自の学習をさせることもできます。すでに、自社製品の認識・分類や、製造ラインにおける欠陥検出といった多種多様なお客様の業務で、高い精度の画像認識を少ない画像枚数による短時間の機械学習で実現しています。さらに、日本語・英語を含む多数の言語で認識結果を返すことができます。

API Doc: https://cloud.ibm.com/apidocs/visual-recognition?code=python

## 1. サービスの作成
[ハンズオン資料](https://speakerdeck.com/kyokonishito/watson-studio-watson-api-hands-on)に従い、IBM CloudのWeb画面から`Visual Recognition`サービスを作成してください。

## 2. 資格情報取得
[ハンズオン資料](https://speakerdeck.com/kyokonishito/watson-studio-watson-api-hands-on)に従い、　作成した`Visual Recognition`の資格情報であるAPI KEY(API鍵)とURLを下のセルの変数にセットして実行してください。

(ただし、2019年6月15日現在`Visual Recognition`のURLは1つしかないため、URLはAPIで指定不要となっています)

In [54]:
API_KEY='XXXXXXXXXXXXXX'
API_URL='XXXXXXXXXXXXXX'

## 3.  最新の Watson Developer Cloud, パッケージの導入
Watson APIのpython SDKであるWatson Developer Cloudパッケージを導入します。

参考: https://cloud.ibm.com/apidocs/visual-recognition?code=python

下のセルを実行してください。

In [None]:
!pip install --upgrade "ibm-watson>=3.0.3"


## 4. API呼び出し
### 4.1 インスタンス作成

参考: https://cloud.ibm.com/apidocs/visual-recognition?code=python#authentication

versionは特に指定がなければhttps://cloud.ibm.com/apidocs/visual-recognition?code=python#versioning を参照して最新のものを記入。2019年6月5日現在の最新version`2018-03-19`を記入済み。

下のセルを実行してください。

In [None]:
from ibm_watson import VisualRecognitionV3

visual_recognition = VisualRecognitionV3(
    version='2018-03-19',
    iam_apikey=API_KEY
)

### 4.2 画像認識  一般モデル `default` - urlで指定-
参考: https://cloud.ibm.com/apidocs/visual-recognition?code=python#classify-images

事前学習済みの分類器の出力を返します。
一般モデルでは、数千種類の様々なクラス・キーワードから該当するものを識別します。いわゆる画像へのタグ付けです。クラス・キーワード（タグ）は、階層的にカテゴライズされていて、最上位カテゴリーとしては、動物、 人間および個人とそのアクティビティ、食品、植物、スポーツ、自然、運輸、家具、フルーツ、楽器、工具、色、装置・機器、武器、建物、構造物・人工物、衣類等々があります。

入力:
画像を送信して認識させる場合： 
- 認識させたい画像（JPEG形式・PNG形式）
URLを送信して認識させる場合： 
- インターネット上の画像またはWebサイトのURL

出力:
画像認識結果： 
- 画像に写っているもの、分類結果 
- スコア(認識結果の確信度) 
- もの・分類結果の階層構造 (動物-家畜-犬-小型犬･･･といったタグの階層)

最初はurlで画像を指定して認識させてみましょう！
以下の画像を認識させてみます。
<img src="https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/fruitbowl.jpg">


下のセルを実行してください。

実行がうまくいったら、自分の好きな画像のurlを`image_url`にセットして実行してみてください。

In [None]:
image_url = 'https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/fruitbowl.jpg'

import json

classes = visual_recognition.classify(
        url=image_url,
        threshold='0.6',
        accept_language='ja').get_result()
print(json.dumps(classes, indent=2,  ensure_ascii=False))

### 4.3 画像認識  一般モデル `default` - ファイルを指定-
参考: https://cloud.ibm.com/apidocs/visual-recognition?code=python#classify-images

次は自分の好きなPC上の画像ファイルを認識させてみまましょう。
ファイルはWatson Studio上にアップロードして、Notebookの作業領域にコピーする必要があります。

>もしお手元に画像ファイルがない場合は、回転すしの画像を用意しましたので、下記をダウンロードしてお使いください:<br/>
[回転すしの画像](https://raw.githubusercontent.com/kyokonishito/python_watson/master/data/sushi.jpg) (リンクを右クリックし、「リンク先を別名で保存」をしてください。)

１. Watson StudioのNotebook上、右上の`0100`というアイコンをクリックし、Fileアップロードの画面を出します。`Drop your file here or browse your files to add a new file` と書いてある場所に、認識させたい画像ファイルをドロップし、Watson Studio上のProjectにアップロードします。<br />
![](https://github.com/kyokonishito/python_watson/raw/master/notebooks/images/upload.png)

<br />
<br />

２. ロードが終わったらFilesをクリックしてファイルがあることを確認し、最後に✖️をクリックしてFile画面を閉じる<br />
![](https://github.com/kyokonishito/python_watson/raw/master/notebooks/images/upload_comp.png)
 
3: StreamingBody object作成

3-1. **下のセルを選択して、空の行にカーソルを置いてください。** 

3-2. 右上の`0100`アイコンをクリックし、アップロードしたsample.txtファイルの下にある `Insert to code`の下にある`Insert StreamingBody object`をクリックしてください。

3-3. ファイルを読み込むストリーム`streaming_body_2`をセットするコードが挿入されます。

3-4.  4箇所ある`streaming_body_2`は　全て`streaming_body_1`に変更します。(後のコードで使用するため)

3-5.  編集が終わったらセルを実行します。

<p><span style="color: teal">
# Your data file was loaded into a botocore.response.StreamingBody object.<br/>
# Please read the documentation of ibm_boto3 and pandas to learn more about your possibilities to load the data.<br/>
# ibm_boto3 documentation: https://ibm.github.io/ibm-cos-sdk-python/<br/>
# pandas documentation: http://pandas.pydata.org/<br/></span>
<strong>streaming_body_2</strong> = client_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.get_object(Bucket='wordcloud-donotdelete-pr-wyztdevipqhfkt', Key='sample.txt')['Body']</p>
<p><span style="color: teal">
 # add missing __iter__ method, so pandas accepts body as file-like object</span>
if not hasattr(<strong>streaming_body_2</strong>, "__iter__"): <strong>streaming_body_2</strong>.__iter__ = types.MethodType( __iter__, <strong>streaming_body_2</strong> ) 
</p>


## <span style="color: red">この下に入力 </span>

In [None]:
# この行の下にカーソルを置いて、Insert StreamingBody objectをクリック 



４. StreamingBody objectを使ってファイルのコピー

下記`filename`にファイル名をセットし、セルを実行してください。


In [None]:
filename = 'sushi.jpg'

import io

file=io.BytesIO(streaming_body_1.read())   ## Getting a File represented as a BytesIO Object
with open(filename,'wb') as out:                    ## Open  filename as bytes
    out.write(file.read())                                   ## Read bytes into file

では早速読み込んだファイルを認識してみましょう!

下のセルを実行してください。

In [None]:
with open(filename, 'rb') as images_file:
    classes = visual_recognition.classify(
        images_file,
        threshold='0.6',
       accept_language='ja').get_result()
    print(json.dumps(classes, indent=2, ensure_ascii=False))

### 4.4 画像認識  一般モデル `food` - urlで指定-  
参考: https://cloud.ibm.com/apidocs/visual-recognition?code=python#classify-images

一般モデルには、`default`の分類クラス以外に`food``explicit`という2つの特別な目的の分類クラスがあります。
`food`は食べ物に特化した分類クラスです。`explicit`はネット上で不適切な画像をチェックするクラスとなっています。


最初の画像を今度は`food`の分類クラスで認識させてみます。
<img src="https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/fruitbowl.jpg">


下のセルを実行してください。

実行がうまくいったら、自分の好きな画像のurlを`image_url2`にセットして実行してみてください。

In [None]:
image_url2 = 'https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/fruitbowl.jpg'

classes = visual_recognition.classify(
        url=image_url2,
        threshold='0.6',
         classifier_ids=["food"],  # ここでfoodを指定
        accept_language='ja').get_result()
print(json.dumps(classes, indent=2,  ensure_ascii=False))


### 4.5 顔検出  Facial Detection 

イメージ内の人物の顔を検出し、顔の一般的な年齢層と性別も示します。


以下は　 [G20大阪サミット](https://g20.org/jp/)の[写真・動画](https://g20.org/jp/photos/)にある、「U20代表による安倍総理表敬（2019年5月22日）」の「U20代表による安倍総理表敬2」にある写真のURLです: <br/>
https://g20.org/photos/0522-02.jpg   
![](https://g20.org/photos/0522-02.jpg)
(将来的には上記URLは無効になっている可能性があります)

これを使用して顔検出を行ってみましょう。

下のセルを実行してください。

In [None]:
!!wget https://g20.org/photos/0522-02.jpg  -O people.jpg

with open('./people.jpg', 'rb') as images_file:
    faces = visual_recognition.detect_faces(images_file).get_result()
print(json.dumps(faces, indent=2))

たくさんあってよくわからないので、わかるように写真に印を付けて、一覧で表示しましょう!
下のセルを実行してください。

In [None]:
from PIL import Image, ImageDraw,ImageFont
import os

def draw_face_area(image_file, face_detect_res):
    
    if  len(face_detect_res) < 1:
        print('No face detection')
        return        
    
    image = Image.open(image_file)
    draw = ImageDraw.Draw(image, "RGBA")
    #日本語フォントの導入  
    jp_font_path ='ipaexg00301/ipaexg.ttf'

    if not os.path.exists(jp_font_path):
        !wget https://oscdl.ipa.go.jp/IPAexfont/ipaexg00301.zip
        !unzip ipaexg00301.zip
    else:
        print('IPA font haｓ been already installed')
    
    col_name =  ["gender", "gender_score", "age_max", "age_min", "age_score"]
    df_face_detect_res = pd.DataFrame(columns=[])
  
    for i, faceinfo in enumerate(face_detect_res):
        x0 = faceinfo['face_location']['left']
        x1= x0 +  faceinfo['face_location']['width']
        y0 = faceinfo['face_location']['top']
        y1 = y0 + faceinfo['face_location']['height']
        
        
        df_face_detect_res.loc[i, "gender"] = faceinfo['gender']['gender']
        df_face_detect_res.loc[i, "gender_score"] = faceinfo['gender']['score']
        df_face_detect_res.loc[i, "age_max"] = faceinfo['age']['max']
        df_face_detect_res.loc[i, "age_min"] = faceinfo['age']['min']
        df_face_detect_res.loc[i, "age_score"] = faceinfo['age']['score']
        
        font_size = 20
        font = ImageFont.truetype(jp_font_path, font_size)
        text_size = draw.textsize('88', font=font)
        if not ( x1-x0 < text_size[0] or y1-y0 < text_size[1]):
            while x1-x0 > text_size[0] or y1-y0 > text_size[1]:
                font = ImageFont.truetype(jp_font_path, font_size)
                text_size = draw.textsize('88', font=font)
                font_size += 1
            
        font = ImageFont.truetype(jp_font_path, font_size)
        draw.rectangle(xy=(x0,y0, x1, y1), outline=(0, 249, 0))
        draw.text(xy=(x0+5,y0+5), text=str(i), fill=(0, 249, 0), font=font)
        
    display(image)
    pd.options.display.max_rows = None
    display(df_face_detect_res)
      
draw_face_area('people.jpg', faces['images'][0]['faces'])


### 4.6 顔検出  Facial Detection 自分の写真をアップロードして顔検出

最後に自分の写真(または自分で持っている写真イメージ)をアップロードして顔検出してみましょう。

ファイルはWatson Studio上にアップロードして、Notebookの作業領域にコピーする必要があります。

１. Watson StudioのNotebook上、右上の`0100`というアイコンをクリックし、Fileアップロードの画面を出します。`Drop your file here or browse your files to add a new file` と書いてある場所に、認識させたい画像ファイルをドロップし、Watson Studio上のProjectにアップロードします。<br />
![](https://github.com/kyokonishito/python_watson/raw/master/notebooks/images/upload.png)

<br />
<br />

２. ロードが終わったらFilesをクリックしてファイルがあることを確認し、最後に✖️をクリックしてFile画面を閉じる<br />
![](https://github.com/kyokonishito/python_watson/raw/master/notebooks/images/upload_comp.png)
 
3: StreamingBody object作成

3-1. **下のセルを選択して、空の行にカーソルを置いてください。** 

3-2. 右上の`0100`アイコンをクリックし、アップロードしたsample.txtファイルの下にある `Insert to code`の下にある`Insert StreamingBody object`をクリックしてください。

3-3. ファイルを読み込むストリーム`streaming_body_2`をセットするコードが挿入されます。

3-4.  もし4箇所ある`streaming_body_*`の`*`部分がが`2`になっていない場合は、`streaming_body_*`は４箇所全て`streaming_body_2`に変更します。(後のコードで使用するため)

3-5.  編集が終わったらセルを実行します。

<p><span style="color: teal">
# Your data file was loaded into a botocore.response.StreamingBody object.<br/>
# Please read the documentation of ibm_boto3 and pandas to learn more about your possibilities to load the data.<br/>
# ibm_boto3 documentation: https://ibm.github.io/ibm-cos-sdk-python/<br/>
# pandas documentation: http://pandas.pydata.org/<br/></span>
<strong>streaming_body_3</strong> = client_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.get_object(Bucket='wordcloud-donotdelete-pr-wyztdevipqhfkt', Key='sample.txt')['Body']</p>
<p><span style="color: teal">
 # add missing __iter__ method, so pandas accepts body as file-like object</span>
if not hasattr(<strong>streaming_body_3</strong>, "__iter__"): <strong>streaming_body_3</strong>.__iter__ = types.MethodType( __iter__, <strong>streaming_body_3</strong> ) 
</p>


## <span style="color: red">この下に入力 </span>

In [53]:
# この行の下にカーソルを置いて、Insert StreamingBody objectをクリック 


４. StreamingBody objectを使ってファイルのコピー

下記`filename`にファイル名をセットし、セルを実行してください。


In [None]:
myface_filename = 'mypeople.jpg'

import io

file=io.BytesIO(streaming_body_２.read())   ## Getting a File represented as a BytesIO Object
with open(myface_filename,'wb') as out:                    ## Open  filename as bytes
    out.write(file.read())                                   ## Read bytes into file

ではアップロードした写真で検出画像もつけて顔検出を行ってみましょう。

下のセルを実行してください。

In [None]:
with open(myface_filename, 'rb') as images_file:
    myfaces = visual_recognition.detect_faces(images_file).get_result()

    draw_face_area(myface_filename, myfaces['images'][0]['faces'])


## 5. カスタム翻訳モデル (オプション)

上記の内容は、Watson Visual Recognitionがデフォルトで用意している学習済みモデルを使って、画像認識を「体験」してみました。Watson Visual Recognitionではユーザー自身の用途に応じた画像認識のために、学習を通じたカスタム・モデルも作成可能です。

**(こちらはNotebookを使用しないのでオプションです)**<br/>
Watson Studioだけで簡単にできるカスタム・モデルを作成してみたい場合は、以下のチュートリアルをお試しください:

[Watson Studioで素早く簡単にAI／ディープラーニング！- Visual Recognitionによる画像認識③](https://www.ibm.com/blogs/solutions/jp-ja/watsonstudio-vr3/)

をお試しください。尚このチュートリアルに使用するデータは同じページの一番下にあるリンクの`サンプルデータ`となります。

# NEXT
本日のNotebookを使用したハンズオンはこれで終了となります。おつかれさまでした！

お時間に余裕があり、Watson Studioを使用したコーディングなしの機械学習に興味がある場合は
[オプションハンズオン](https://github.com/kyokonishito/python_watson#OptionHandsOn)に進んでください。