In [None]:
# Licensed under the Apache License, Version 2.0 (the "License"); you may
# not use this file except in compliance with the License. You may obtain
# a copy of the License at
#
#      http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
# WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
# License for the specific language governing permissions and limitations
# under the License.

# Lab2: Natural Language Understanding 自然言語解析

https://www.ibm.com/watson/services/natural-language-understanding/

Natural Language Understandingは、高度な自然言語処理技法を使用して記事内容を分析し、筆者が持っていた感情を洞察します。

API Doc: https://cloud.ibm.com/apidocs/natural-language-understanding?code=python

## 1. サービスの作成
[Watson APIを使うための前準備: サービスの作成と資格情報の取得](https://qiita.com/nishikyon/items/9b8f697db7ad0a693839)に従い、IBM CloudのWeb画面から`Natural Language Understanding`サービスを作成してください。

## 2. 資格情報取得
[Watson APIを使うための前準備: サービスの作成と資格情報の取得](https://qiita.com/nishikyon/items/9b8f697db7ad0a693839)に従い、　作成した`Natural Language Understanding`の資格情報であるAPI KEY(API鍵)とURLを下のセルの変数にセットして実行してください。

In [None]:
API_KEY='XXXXXXXXXXXXXX'
API_URL='XXXXXXXXXXXXXX'

## 3.  最新の Watson Developer Cloud, パッケージの導入
Watson APIのpython SDKであるWatson Developer Cloudパッケージを導入します。

参考: https://cloud.ibm.com/apidocs/natural-language-understanding?code=python

下のセルを実行してください。

In [None]:
!pip install --upgrade "ibm-watson>=3.0.3"


## 4. API呼び出し
### 4.1 インスタンス作成

参考: https://cloud.ibm.com/apidocs/natural-language-understanding?code=python#authentication

versionは特に指定がなければhttps://cloud.ibm.com/apidocs/natural-language-understanding?code=python#authentication　を参照して最新のものを記入。2019年6月5日現在の最新version`2018-11-16`を記入済み。

下のセルを実行してください。

In [None]:
from ibm_watson import NaturalLanguageUnderstandingV1

natural_language_understanding = NaturalLanguageUnderstandingV1(
    version='2018-11-16',
    iam_apikey=API_KEY,
    url=API_URL
)


### 4.2 テキスト分析 analyze
参考: https://cloud.ibm.com/apidocs/natural-language-understanding?code=python#analyze-text

テキストを分析し、概念、エンティティー、キーワード、カテゴリー、感情、関係、意味役割などのメタデータを抽出します。

抽出できるもの
- エンティティ(Entities)
- 関係(Relations)
- 概念(Concepts)
- キーワード(Keywords)
- 評判 (Sentiment)
- 感情 (Emotion) ※
- カテゴリー(Categories)
- 構文解析(Semantic Roles)

※ 感情分析(Emotion)は日本語には対応していません

### 4.2.1 テキスト分析 英文サンプル
下記のコードは英文のエンティティ、キーワードを抽出し、それぞれのSentimentとEmotionを出しています。
下のセルを実行して、結果を確認してみてください。

In [None]:
import json
from ibm_watson.natural_language_understanding_v1 \
    import Features, EntitiesOptions, KeywordsOptions

response = natural_language_understanding.analyze(
    text='IBM is an American multinational technology company '
    'headquartered in Armonk, New York, United States, '
    'with operations in over 170 countries.',
    features=Features(#Featuresで抽出するメタデータを指定します
        entities=EntitiesOptions(emotion=True, sentiment=True, limit=2),#Emotionは英語のみ対応します
        keywords=KeywordsOptions(emotion=True, sentiment=True,
                                 limit=2))).get_result()

print(json.dumps(response, indent=2))

### 4.2.3 テキスト分析 URLで指定

今度は分析したいテキストをURLで指定してみましょう。
分析したいテキストのあるURLをURL_TO_ANALIZEにセットしてください。そのままでも実行可能です。初期値はおなじみWikipediaの名古屋上のURLです。

`features=Features(）`で指定しているオプションもいろいろ変更してみましょう。
https://cloud.ibm.com/apidocs/natural-language-understanding?code=python#analyze-text　のRequestのPARAMETERSの中のfeaturesの下の`features`のリンクをクリックして、何が指定できるか確認して、変更してみてください。
新しいオプションを追加したら、<br />
` import Features, EntitiesOptions, KeywordsOptions, ConceptsOptions,CategoriesOptions,SentimentOptions
`<br />
に該当オプションを追加するのをお忘れなく！

下のセルを編集後、実行して、結果を確認してみてください。

In [None]:
URL_TO_ANALIZE = 'https://ja.wikipedia.org/wiki/%E5%90%8D%E5%8F%A4%E5%B1%8B%E5%9F%8E'


from ibm_watson.natural_language_understanding_v1 \
    import Features, EntitiesOptions, KeywordsOptions, ConceptsOptions,CategoriesOptions,SentimentOptions

response = natural_language_understanding.analyze(
    url=URL_TO_ANALIZE,
    features=Features( 
        concepts=ConceptsOptions(limit=10),
        categories=CategoriesOptions(limit=10),
        entities=EntitiesOptions(limit=10),
        keywords=KeywordsOptions(limit=10),
        sentiment=SentimentOptions(),
                
    )).get_result()

print(json.dumps(response, indent=2, ensure_ascii=False))

## 5. 応用例
TwitterやFacebookテキストからキーワード分析したり、センチメント分析したりなど、多数の文章を組み合わせていろいろ考えられます。またNatural Language Understandingを使用して内部で分析し、その結果を検索できる[Watson
 Discovery](https://www.ibm.com/watson/jp-ja/developercloud/discovery.html)などを使うこともできます。
 
 参考資料(こちらは本日実施の必要はありません):
 
- [Watson StudioでTweetデータを可視化しよう! ]( https://speakerdeck.com/kyokonishito/visualize-tweets-with-watson-studio )   ---- 実行にはTwitter開発者登録が必要です。

- [PixieDustとコグニティブJupyterノートブックでFacebookからの洞察を発見する](https://github.com/IBM/pixiedust-facebook-analysis/blob/master/README-jp.md)

# NEXT
[完了の処理](https://github.com/kyokonishito/python_watson#LabComptele)を行って、　[Lab3](https://github.com/kyokonishito/python_watson#HandsOn)に進んでください。