# Natural language processing / 自然言語処理

Google Cloud Platform offers also several services for language processing.

Google Cloud Platformは言語処理のためのいくつかのサービスを提供しています。

## Text sentiment analysis / テキストの感情分析

Sentiment analysis is the process of estimating what is the basic sentiment of a text - positive, like happy, or negative, e.g. angry. 

The code for doing sentiment analysis with GCP is similar to the previous examples, except that we use text instead of images. 
Below we go step by step through one example.

(Similar to google-cloud-vision, if you use your own local installation you will need to install the necessary libraries first: `pip install google-cloud-language`)

感情分析は、テキストの基本的な感情が何であるか（嬉しい等のポジティブな感情、または怒っている等のネガティブな感情）を推定する処理です。

GCPを使用して感情分析を実行するためのコードは前の例と似ていますが、画像の代わりにテキストを使用します。
以下では、一例を順を追って説明します。

（google-cloud-visionの時と同じ、ローカルインストールを使う場合、まず必要なライブラリをインストールする必要があります：`pip install google-cloud-language`）

In [None]:
%env GOOGLE_APPLICATION_CREDENTIALS=gcp_credentials/mlpractice2020.json

Load the needed Google Cloud libraries

必要なGoogle Cloudライブラリをインポートします

In [None]:
from google.cloud import language
from google.cloud.language import enums
from google.cloud.language import types

To test the sentiment analysis we will use a dataset of reviews from the Internet Movie Database (IMDB) page. These are reviews of movies which people wrote on the site. Each review also has associated a numerical value - the number of stars that the person gave to the movie. We can expect that the sentiment of the review should correlate well with the number of stars.

The whole dataset is very large (it is available [here](http://ai.stanford.edu/~amaas/data/sentiment/aclImdb_v1.tar.gz)) so we provided just a small sample of 5 positive and 5 negative reviews. 

The files are inside the folder `imdb`. Open the folder and check its content.

感情分析を試すために、Internet Movie Database（IMDB）ページからのレビューのデータセットを使用します。これらはユーザがサイトに書いた映画のレビューです。各レビューには、数値（映画に付けた星の数）も関連付けられています。レビューの感想は星の数とよく相関すると思われます。

データセット全体がかなり大きいため（[ここ](http://ai.stanford.edu/~amaas/data/sentiment/aclImdb_v1.tar.gz)で入手可能）、5つのポジティブレビューと5つのネガティブレビューのほんの一部を予めダウンロードしました。

レビューが入っているファイルはフォルダimdbの中にあります。フォルダを開いて中身を見てください。

The files whose names end with `_1.txt` recieved 1 star (very negative review), whereas the ones ending with `_10.txt` recieved 10 stars (very positive review).
<br>
Let's see the content of one of them.

名前が`_1.txt`で終わるファイルは1つ星（非常に否定的なレビュー）をつけられた映画のレビューです。一方、`_10.txt`で終わるファイルは10つ星（非常に肯定的なレビュー）のレビューです。
<br>
1つのファイルの内容を見てみましょう。

In [None]:
## SET THIS TO NAME OF ONE OF THE REVIEW FILES 
movie_review_filename="imdb/27_10.txt"

with open(movie_review_filename, 'r') as review_file:
    print(review_file.read())

Next read file contaning the review and prepare data

レビューをファイルから読み込んで、データの準備をします。

In [None]:
# read content of file
with open(movie_review_filename, 'r') as review_file:
    content = review_file.read()

# define Document data
document = types.Document(
    content=content,
    type=enums.Document.Type.PLAIN_TEXT)

Run sentiment analysis

感情分析の実行

In [None]:
client = language.LanguageServiceClient()
annotations = client.analyze_sentiment(document=document)

Print the result. `score` takes value from -1 to 1. Negative score value means negative sentiment, and positive value positive.

結果をプリントしましょう。変数`score`には-1から1までの値です。負のスコア値は負の感情を意味し、正の値は正を意味します。

In [None]:
score = annotations.document_sentiment.score

# print sentiment for whole review
print('Overall Sentiment: score of {}'.format(score))

Does the score match the expected sentiment?

スコアは予想された感情と一致しますか？

Results also contain the detected sentiment for each sentence so you can also see how each sentence contributes to the overall score.

結果には、各センテンスに対して検出された感情も含まれています。各センテンスが全体的なスコアにどのように影響しているかもわかります。

In [None]:
for index, sentence in enumerate(annotations.sentences):
    print('Sentence {}\n"{}"\nhas a sentiment score of {}'.format(
        index, sentence.text.content, sentence.sentiment.score))

Try running the analysis also on a few other reviews from the `imdb` folder.

`imdb`フォルダーからの他のいくつかのレビューでも分析を実行してみてください。

## Try  it yourself ! / 自分で試そう！

Now open the [notebook with exercises](session4-playground.ipynb) to try more things. 

他にいろいろ試すために[練習問題のノートブック](session4-playground.ipynb)を開いてください。