# IBM Watson APIの利用

このファイルは参考資料です。   
IBM Watson APIを利用するためには、同社のサイトにてアカウントの取得が必要です。      
個人情報を登録することが必要となるため、**このファイルは実行しなくてもいいです。**   

## 1. ライブラリのインストール

[IBM Watsonのホームページ](https://www.ibm.com/watson/jp-ja/)のインストラクションに従い、以下のコマンドでライブラリをインストールします。

```
pip install --upgrade ibm-watson
```

## 2. 機械翻訳API

機械翻訳APIは、送信したテキストを、所定の言語に変換して返します。   

Watson Language Translator サービスでは、英語、アラビア語、ブラジル・ポルトガル語、フランス語、ドイツ語、イタリア語、日本語、韓国語、スペイン語、といった合計25種類の言語を対象としています。

以下は[IBM Watson Language Translator](https://www.ibm.com/watson/jp-ja/developercloud/language-translator.html)より抜粋。   
実際の事例として以下のようなものがあります

- 英語を話すヘルプ・デスク担当者が、スペイン語を話す顧客をチャットでサポートする事例(「会話」の翻訳モデルを使用)
- 西アフリカのニュースWebサイトが、世界中の英語ニュースをキュレートして、購読者にフランス語で提供する事例(「ニュース」の翻訳モデルを使用)
- 韓国の特許庁の韓国語で書かれた発明開示書から米国の弁理士が抵触の可能性のある先行技術を効率的に探索する事例(「特許」の翻訳モデルを使用)
- 銀行において金融商品名と業務独自の用語に特化したカスタム・モデルを作成してすべての商品説明を英語からアラビア語に翻訳した事例(カスタム翻訳モデルを使用)

IBM Watson Language Translatorのコードは以下の通りです。   
デモは[こちら](https://language-translator-demo.ng.bluemix.net/)にありますので、試してみてください。

In [3]:
import json
from ibm_watson import LanguageTranslatorV3

language_translator = LanguageTranslatorV3(
    version='2019-04-19',
    url='YOUR IBM TRANS URL',
    iam_apikey='YOUR IBM TRANS API KEY')

text = '東京大学は、日本東京都文京区本郷七丁目3番1号に本部を置く日本の国立大学である。1877年に設置された。大学の略称は東大。'

# 翻訳
translation = language_translator.translate(
    text=text,  # 翻訳したいテキストを渡します
    model_id='ja-en' # 言語の組み合わせを指定します。ここでは日本語(ja)から英語(en)への変換です
    ).get_result()
print(json.dumps(translation, indent=2, ensure_ascii=False))


{
  "translations": [
    {
      "translation": "The University of Tokyo is a Japanese national university located in Hongo, Bunkyo Ward, Tokyo, and is headquarlocated in Nanchome, Tokyo.It was established in 1877.The abbreviated name of the university is Higashi University."
    }
  ],
  "word_count": 15,
  "character_count": 61
}


## 画像認識API

大量の画像や映像をタグ付けや分類する、あるいは、画像を分析して特定のものや状態を検出することができます。   
以下、[IBM Watson Visual Recognition](https://www.ibm.com/watson/jp-ja/developercloud/visual-recognition.html)を参照。

- 大量の画像・映像コンテンツに対して、自動的にタグ付けや分類を行う
- 食事や食品に関する画像を検出し、写っている料理や食べ物を分析する (食べ物に特化した機能あり)
- 画像に写っている人物の顔を検出し、年齢層・性別をタグ付けする
- 画像認識により書類やエビデンスを仕分けする
- 製造ラインにおける画像検査により不良品を検出する
- ドローンが撮影した画像を使って、家屋や鉄塔の破損箇所を検出する
- 人工衛星が撮影した画像から、知見を得るための分析・分類を行う
- 自社サイトに顧客がアップロードした画像から、不適切な画像を検出する
- SNS等の画像から自社製品を探し出し、コメントをマーケティングに使用する

コードは以下のようになります。   
画像認識APIのデモは[こちら](https://www.ibm.com/watson/services/visual-recognition/demo/)です。

In [4]:
import json
from ibm_watson import VisualRecognitionV3

visual_recognition = VisualRecognitionV3(
    '2018-03-19',
    iam_apikey='YOUR VR KEY')

#url = 'https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/640px-IBM_VGA_90X8941_on_PS55.jpg'
#classes_result = visual_recognition.classify(url=url).get_result()

#imname = 'img/Cathedoral.jpg'
#imname = 'img/LakeAndShip.jpg'
#imname = 'img/TomYumSoup.jpg'
#imname = 'img/CaffeAndJuice.jpg'
#imname = 'img/StainedGlass.jpg'
imname = 'img/CristmasCake.JPG'
#imname = 'img/TaiwanHotPotAndNoodle.JPG'
#imname = 'img/WineBottle.jpg'
#imname = 'img/GenovesePasta.jpg'
    
image_file=open(imname,'rb')

# 食事画像認識ならばこちら
classes_result = visual_recognition.classify( images_file = image_file, classifier_ids='food' ).get_result()
# 一般物体認識ならこちら(classifier_ids='default'としてもいい）
#classes_result = visual_recognition.classify(images_file=image_file).get_result()
image_file.close()

print(json.dumps(classes_result, indent=2))


{
  "images": [
    {
      "classifiers": [
        {
          "classifier_id": "food",
          "name": "food",
          "classes": [
            {
              "class": "shortcake",
              "score": 0.714,
              "type_hierarchy": "/bread/quick bread/biscuit/shortcake"
            },
            {
              "class": "biscuit",
              "score": 0.714
            },
            {
              "class": "quick bread",
              "score": 0.714
            },
            {
              "class": "bread",
              "score": 0.714
            },
            {
              "class": "whip",
              "score": 0.514,
              "type_hierarchy": "/dessert/whip"
            },
            {
              "class": "dessert",
              "score": 0.543
            },
            {
              "class": "cake mix",
              "score": 0.5,
              "type_hierarchy": "/food mixture/food mix/ready-mix/cake mix"
            },
            {
     

## 音声認識API

音声による入出力やコミュニケーションが必要な場面で使用します。   
以下、[IBM Watson Speech to Text API](https://www.ibm.com/watson/jp-ja/developercloud/speech-to-text.html)より抜粋。

- コール・センターのオペレーターの音声をリアルタイムでテキスト化し、FAQなどのガイドをオペレーターの画面に表示する
- 会議における発言をテキスト化し、リアルタイムにモニタリングしたり議事録として保管する
- スマートフォンのアプリケーションやIoT家電などを音声で操作する
- 電話の自動応答システムで，お客様の声を認識する
- メディア・ファイル等に含まれる音声を書き起こす
- 他のWatsonAPIの入力手段として用いる(Conversation等)

コードは以下のようになります。   
WAVフォーマットで録音した音声を指定して、その認識結果を獲得します。   
音声認識APIのデモは[こちら](https://speech-to-text-demo.mybluemix.net/)です。

In [5]:
from ibm_watson import SpeechToTextV1
import json

speech_to_text = SpeechToTextV1(
    iam_apikey = YOUR_IBM_TTS_APIKEY,
    url = YOUR_IBM_TTS_URL
)
audio_file = open("sound/voice.wav", "rb")

results = speech_to_text.recognize(
    audio=audio_file,
    content_type='audio/wav',
    model='ja-JP_BroadbandModel',
    timestamps=True,
    word_alternatives_threshold=0.3)


In [6]:
print('認識結果：', results.result['results'][0]['alternatives'][0]['transcript'])
print('信頼度：', results.result['results'][0]['alternatives'][0]['confidence'])
print('\n----- 単語ごとの認識結果 ----')
for word_res in results.result['results'][0]['alternatives'][0]['timestamps']:
    print('単語認識結果：', word_res[0], '\t開始時刻：', word_res[1], '\t終了時刻：',word_res[2])

print('\n----- 単語ごとの認識結果とその信頼度 ----')
num = 1
for word_res in results.result['results'][0]['word_alternatives']:
    print('\t ==== ', num, '単語目 ======')
    print('\t単語認識結果', word_res['alternatives'][0]['word'])
    print('\t開始時刻：', word_res['start_time'])
    print('\t単語認識信頼度：', word_res['alternatives'][0]['confidence'])


print('\n----- JSONを書き出し ----')
print(json.dumps(results.result, indent=2, ensure_ascii=False))



認識結果： 東京 大学 は とても いい 大学 です 
信頼度： 0.83

----- 単語ごとの認識結果 ----
単語認識結果： 東京 	開始時刻： 1.04 	終了時刻： 1.57
単語認識結果： 大学 	開始時刻： 1.57 	終了時刻： 2.08
単語認識結果： は 	開始時刻： 2.08 	終了時刻： 2.2
単語認識結果： とても 	開始時刻： 2.2 	終了時刻： 2.66
単語認識結果： いい 	開始時刻： 2.66 	終了時刻： 2.88
単語認識結果： 大学 	開始時刻： 2.88 	終了時刻： 3.34
単語認識結果： です 	開始時刻： 3.34 	終了時刻： 3.85

----- 単語ごとの認識結果とその信頼度 ----
	単語認識結果 東京
	開始時刻： 1.04
	単語認識信頼度： 1.0
	単語認識結果 大学
	開始時刻： 1.57
	単語認識信頼度： 0.91
	単語認識結果 は
	開始時刻： 2.08
	単語認識信頼度： 0.91
	単語認識結果 とても
	開始時刻： 2.2
	単語認識信頼度： 0.86
	単語認識結果 いい
	開始時刻： 2.66
	単語認識信頼度： 0.57
	単語認識結果 大学
	開始時刻： 2.88
	単語認識信頼度： 0.57

----- JSONを書き出し ----
{
  "results": [
    {
      "word_alternatives": [
        {
          "start_time": 1.04,
          "alternatives": [
            {
              "confidence": 1.0,
              "word": "東京"
            }
          ],
          "end_time": 1.57
        },
        {
          "start_time": 1.57,
          "alternatives": [
            {
              "confidence": 0.91,
              "word": "大学"
            }
     