# Translation(翻訳)

人類が文明を発展させてきた原動力の一つは、お互いにコミュニケーションをとる能力です。ほとんどの人間の努力において、コミュニケーションが鍵を握っています。

<p style='text-align:center'><img src='./images/translation.jpg' alt='多言語ロボット'/></p>

人工知能（AI）は、言語間のテキストや音声を翻訳することでコミュニケーションを簡素化し、国や文化を超えたコミュニケーションの障壁を取り除くのに役立ちます。

## Cognitive Servicesリソースの作成

これらのレビューのテキストを分析するには、**Text Analytics**コグニティブサービスを使用できます。これを使用するには、Azureサブスクリプションで**Text Analytics**または**Cognitive Services**リソースのいずれかをプロビジョニングする必要があります(これが唯一のサービスであるか、またはその使用状況を個別に追跡したい場合は、Text Analyticsリソースを使用してください。それ以外の場合は、コグニティブサービスリソースを使用してText Analyticsサービスを他のコグニティブサービスと組み合わせることができます。)

まだ持っていない場合は、次の手順を使用して、Azureサブスクリプションで**Cognitive Services**リソースを作成します。

1. 別のブラウザタブで、https://portal.azure.com の Azure ポータルを開き、Microsoft アカウントでサインインします。
2. **[&#65291;リソースの作成]**ボタンをクリックして、*Cognitive Services*を検索し、次の設定で**Cognitive Services**リソースを作成します。:
    - **Name**:  *一意の名前を入力してください*
    - **Subscription**: *あなたのAzureサブスクリプション*
    - **Location**: *利用可能な場所*
    - **Pricing tier**: S0
    - **Resource group**: *固有の名前を持つリソースグループ*を作成
3. デプロイが完了するのを待ちます。次に、コグニティブサービスリソースに移動し、**クイックスタート**ページで、キーとエンドポイントに注意してください。クライアント アプリケーションからコグニティブ サービス リソースに接続するには、これらが必要です。

## Cognitive Servicesリソースのキーとエンドポイントを取得する

認知サービス リソースを使用するには、クライアント アプリケーションにそのエンドポイントと認証キーが必要です。

1. Azure ポータルで、コグニティブサービスリソースの **クイックスタート** ページで、リソースの **Key1** をコピーして、**YOUR_COG_KEY** を置き換えて、以下のコードに貼り付けます。
2. 2. リソースの **endpoint** をコピーして、以下のコードに貼り付けて、 **YOUR_COG_ENDPOINT** を置き換えます。
3. 3. 以下のセルを実行します。

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_endpoint = 'YOUR_COG_ENDPOINT'
cog_region = 'YOUR_COG_REGION'

print('Ready to use cognitive services in {} using key {}'.format(cog_region, cog_key))

## テキストを翻訳する

その名が示すように、**Translator Text** サービスは、ある言語から別の言語へのテキスト翻訳を可能にします。

このサービスのための Python SDK はありませんが、その REST インターフェイスを使って HTTP 経由でエンドポイントにリクエストを送信することができ、 **requests** ライブラリを使うことで比較的簡単に Python で行うことができます。翻訳するテキストに関する情報と、翻訳された結果のテキストをJSON形式でやり取りします。

以下のセルを実行して、これを行う関数を作成し、英語からフランス語への簡単な翻訳で関数をテストします。

In [None]:
# テキスト翻訳サービスへのRESTリクエストを行う関数を作成します
def translate_text(cog_region, cog_key, text, to_lang='fr', from_lang='en'):
    import requests, uuid, json

    # Text TranslatorサービスのRESTリクエスト用のURLを作成します。
    path = 'https://api.cognitive.microsofttranslator.com/translate?api-version=3.0'
    params = '&from={}&to={}'.format(from_lang, to_lang)
    constructed_url = path + params

    # Cognitive Services のリソースキーと地域を含むリクエストヘッダーを準備する
    headers = {
        'Ocp-Apim-Subscription-Key': cog_key,
        'Ocp-Apim-Subscription-Region':cog_region,
        'Content-type': 'application/json',
        'X-ClientTraceId': str(uuid.uuid4())
    }

    # 本文に翻訳されるテキストを追加する
    body = [{
        'text': text
    }]

    # 翻訳を取得する
    request = requests.post(constructed_url, headers=headers, json=body)
    response = request.json()
    return response[0]["translations"][0]["text"]


# 関数をテストする
text_to_translate = "Hello"

translation = translate_text(cog_region, cog_key, text_to_translate, to_lang='fr', from_lang='en')
print('{} -> {}'.format(text_to_translate,translation))

サービスは英語のテキスト "Hello "をフランス語の "Bonjour "に翻訳しているはずです。

言語は、英語では*en*、フランス語では*fr*と、標準的な言語省略形のシステムを使用して指定されていることに注意してください。また、特定の文化を含む略語を使用することもできます。これは、同じ言語が地理的に異なる地域で使用されている場合に便利です。たとえば、*en-US* はアメリカ合衆国の英語を、*en-GB* はイギリスの英語を表します。

次のセルを実行して、イギリス英語とイタリア語を翻訳します。

In [None]:
text_to_translate = "Hello"

translation = translate_text(cog_region, cog_key, text_to_translate, to_lang='it-IT', from_lang='en-GB')
print('{} -> {}'.format(text_to_translate,translation))

今度はアメリカ英語からアメリカスペイン語に翻訳してみましょう。

In [None]:
text_to_translate = "Hola"

translation = translate_text(cog_region, cog_key, text_to_translate, to_lang='en-US', from_lang='es-US')
print('{} -> {}'.format(text_to_translate,translation))

特定のリンガス系イディオムの直訳がない場合もあります。例えば、英語の「hello」は中国語のような言語では文字通りの等価語がないかもしれませんが、一般的に使用されている等価語句が存在するかもしれません。

以下のセルを実行して、英単語「hello」を中国語に翻訳し、翻訳を逆にして同等のものを見てみましょう。

In [None]:
text_to_translate = "Hello"

translation = translate_text(cog_region, cog_key, text_to_translate, to_lang='zh-CN', from_lang='es-US')
print('{} -> {}'.format(text_to_translate,translation))

reverse_translation = translate_text(cog_region, cog_key, translation, to_lang='en-US', from_lang='zh-CN')
print('{} -> {}'.format(translation, reverse_translation))

## Speech Translation(音声翻訳)

音声言語を翻訳するには **Speech** サービスを使用することができます。

SpeechサービスはPython SDKを提供しており、マイクやオーディオファイルから入力された可聴音声を翻訳するために使用することができます。

次のセルを実行して、可聴音声を翻訳する関数を作成してテストします。

> **注**. 音声を聞くにはスピーカーが必要です。

In [None]:
# ある言語の音声を別の言語のテキストに翻訳する関数を作成する
def translate_speech(cog_region, cog_key, audio_file=None, to_lang='fr-FR', from_lang='en-US'):
    from azure.cognitiveservices.speech import SpeechConfig, AudioConfig, ResultReason
    from azure.cognitiveservices.speech.translation import SpeechTranslationConfig, TranslationRecognizer

    # 音声翻訳サービスの設定
    translation_config = SpeechTranslationConfig(subscription=cog_key, region=cog_region)
    translation_config.speech_recognition_language = from_lang
    translation_config.add_target_language(to_lang)

    # オーディオ入力の設定
    if audio_file is None:
        audio_config = AudioConfig() # Use default input (microphone)
    else:
        audio_config = AudioConfig(filename=audio_file) # Use file input

    # 翻訳認識器を作成し、音声入力の翻訳に使用する
    recognizer = TranslationRecognizer(translation_config, audio_config)
    result = recognizer.recognize_once()

    # 届きましたか？
    translation = ''
    speech_text = ''
    if result.reason == ResultReason.TranslatedSpeech:
        speech_text = result.text
        translation =  result.translations[to_lang]
    elif result.reason == ResultReason.RecognizedSpeech:
        speech_text = result.text
        translation =  'Unable to translate speech'
    else:
        translation = 'Unknown'
        speech_text = 'Unknown'

    # 翻訳を返す
    return speech_text, translation
    

# 関数をテストする
import os, IPython

file_name = 'english.wav'
file_path = os.path.join('data', 'translation', file_name)
speech, translated_speech = translate_speech(cog_region, cog_key, file_path, to_lang='es', from_lang='en-US')
result = '{} -> {}'.format(speech, translated_speech)

# オーディオを再生し、翻訳されたテキストを表示する
IPython.display.display(IPython.display.Audio(file_path, autoplay=True),
                        IPython.display.HTML(result))

「to」の言語は2文字の言語コード(例: *en*)を使用して識別する必要があり、「from」の言語は文化指標(例: *en-US*)を含む必要があることに注意してください。

フランス語から英語に翻訳してみましょう。

In [None]:
import os, IPython

file_name = 'french.wav'
file_path = os.path.join('data', 'translation', file_name)
speech, translated_speech = translate_speech(cog_region, cog_key, file_path, to_lang='en', from_lang='fr-FR')
result = '{} -> {}'.format(speech, translated_speech)

# オーディオを再生し、翻訳されたテキストを表示する
IPython.display.display(IPython.display.Audio(file_path, autoplay=True),
                        IPython.display.HTML(result))

## Learn More

[Translator Text
](https://docs.microsoft.com/azure/cognitive-services/translator/)や[translation with the Speech service](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-speech-translation)については、サービスドキュメントで詳しく説明しています。