# 翻訳

人類の文明が発展できた原動力の 1 つは、互いにコミュニケーションする能力です。人類が成し遂げてきたことの多くは、コミュニケーションが鍵でした。

![多国語を話すロボット](./images/translation.jpg)

人工知能 (AI) を利用すると、複数の言語の間でテキストや音声を翻訳できるので、コミュニケーションが簡単になり、国や文化を超えたやりとりを妨げる壁を取り除くことができます。

## Cognitive Services リソースを作成する

Azure の Cognitive Services を使用すると、複数の言語間で翻訳を行えます。

まだリソースを作成していない場合は、次の手順で Azure サブスクリプションに **Cognitive Services** リソースを作成します。

> **注**: Cognitive Services リソースが既にある場合は、Azure portal で**クイック スタート**ページを開き、キーとエンドポイントを以下のセルにコピーするだけで作成できます。それ以外の場合は、以下の手順に従って作成してください。

1. ブラウザーの新しいタブで Azure portal (https://portal.azure.com) を開き、Microsoft アカウントでサインインします。
2. 「**&#65291;リソースの作成**」 ボタンをクリックし、*Cognitive Services* を検索して、以下の設定で **Cognitive Services** リソースを作成します。
    - **サブスクリプション**: *使用する Azure サブスクリプション*
    - **リソース グループ**: *一意の名前のリソース グループを選択または作成します*
    - **リージョン**: *利用可能な任意のリージョンを選択します*。
    - **名前**: *一意の名前を入力します*。
    - **価格レベル**: S0
    - **注意事項を読み理解しました**: 選択されています。
3. デプロイが完了するまで待ちます。そのあと Cognitive Services リソースに移動し、「**概要**」 ページでリンクをクリックしてサービスのキーを管理します。クライアント アプリケーションから Cognitive Services リソースに接続するには、エンドポイントとキーが必要です。

### Cognitive Services リソースのキーと場所を取得する

Cognitive Services リソースを使用するには、クライアント アプリケーションに認証キーと場所が必要です。

1. Azure portalで、Cognitive Services リソースの 「**キーとエンドポイント**」 ページからリソースの 「**キー 1**」 の値をコピーし、以下のコードに貼り付けます (**YOUR_COG_KEY** と置き換える)。
2. リソースの**場所**をコピーして以下のコードに貼り付けます (**YOUR_COG_LOCATION** を置き換える)。
>**注**: 「**キーとエンドポイント**」 ページにとどまり、このページから**場所**をコピーします (例: _westus_)。「場所」 フィールドの単語の間には空白を入れ _ないで_ ください。 
3. セルの左側にある 「**セルの実行**」 (&#9655;) ボタンをクリックして、以下のコードを実行します。

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_location = 'YOUR_COG_LOCATION'

print('Ready to use cognitive services in {} using key {}'.format(cog_location, cog_key))

## テキストの翻訳

**Translator Text** サービスを使用すると、その名前の通り、テキストをある言語から別の言語に翻訳できます。

このサービス用の Python SDK はありませんが、REST インターフェイスを使用して、HTTP 経由でエンドポイントにリクエストを送信できます。**リクエスト** ライブラリを使用することで Python で比較的簡単に実行できます。翻訳するテキストと翻訳されたテキストの情報は、JSON 形式で交換します。

次のセルを実行してこの翻訳を行う関数を作成し、英語からフランス語への簡単な翻訳で関数をテストします。

In [None]:
# Create a function that makes a REST request to the Text Translation service
def translate_text(cog_location, cog_key, text, to_lang='fr', from_lang='en'):
    import requests, uuid, json

    # Create the URL for the Text Translator service REST request
    path = 'https://api.cognitive.microsofttranslator.com/translate?api-version=3.0'
    params = '&from={}&to={}'.format(from_lang, to_lang)
    constructed_url = path + params

    # Prepare the request headers with Cognitive Services resource key and region
    headers = {
        'Ocp-Apim-Subscription-Key': cog_key,
        'Ocp-Apim-Subscription-Region':cog_location,
        'Content-type': 'application/json',
        'X-ClientTraceId': str(uuid.uuid4())
    }

    # Add the text to be translated to the body
    body = [{
        'text': text
    }]

    # Get the translation
    request = requests.post(constructed_url, headers=headers, json=body)
    response = request.json()
    return response[0]["translations"][0]["text"]


# Test the function
text_to_translate = "Hello"

translation = translate_text(cog_location, cog_key, text_to_translate, to_lang='fr', from_lang='en')
print('{} -> {}'.format(text_to_translate,translation))

英語のテキスト「Hello」が、フランス語の「Bonjour」に翻訳されました。

言語は、言語の略語の標準体系で指定します。英語の場合は *en*、フランス語の場合は *fr* などです。特定の文化を表す略語も使用できます。これは、異なる地域で同じ言語が使用されている場合に役立ちます。多くの場合、スペルが異なります。たとえば、*en-US* は米国の英語を表し、*en-GB* は英国の英語を表します。

次のセルを実行して、イギリス英語とイタリア語の間で翻訳します。

In [None]:
text_to_translate = "Hello"

translation = translate_text(cog_location, cog_key, text_to_translate, to_lang='it-IT', from_lang='en-GB')
print('{} -> {}'.format(text_to_translate,translation))

ほかの翻訳も試してください (アメリカ英語から中国語への翻訳など)。

In [None]:
text_to_translate = "Hello"

translation = translate_text(cog_location, cog_key, text_to_translate, to_lang='zh-CN', from_lang='en-US')
print('{} -> {}'.format(text_to_translate,translation))

## 音声翻訳

**Speech** サービスを使用すると、話し言葉を翻訳できます。

次のセルを実行すると、Speech SDK を使用した関数を作成してテストし、聞こえてくる音声を翻訳できます。

> **注**: 音声を聞くにはスピーカーが必要です。

In [None]:
from playsound import playsound 

# Create a function to translate audio in one language to text in another
def translate_speech(cog_location, cog_key, audio_file=None, to_lang='fr-FR', from_lang='en-US'):
    from azure.cognitiveservices.speech import SpeechConfig, AudioConfig, ResultReason
    from azure.cognitiveservices.speech.translation import SpeechTranslationConfig, TranslationRecognizer

    # Configure the speech translation service
    translation_config = SpeechTranslationConfig(subscription=cog_key, region=cog_location)
    translation_config.speech_recognition_language = from_lang
    translation_config.add_target_language(to_lang)

    # Configure audio input
    if audio_file is None:
        audio_config = AudioConfig() # Use default input (microphone)
    else:
        audio_config = AudioConfig(filename=audio_file) # Use file input

    # Create a translation recognizer and use it to translate speech input
    recognizer = TranslationRecognizer(translation_config, audio_config)
    result = recognizer.recognize_once()

    # Did we get it?
    translation = ''
    speech_text = ''
    if result.reason == ResultReason.TranslatedSpeech:
        speech_text = result.text
        translation =  result.translations[to_lang]
    elif result.reason == ResultReason.RecognizedSpeech:
        speech_text = result.text
        translation =  'Unable to translate speech'
    else:
        translation = 'Unknown'
        speech_text = 'Unknown'

    # rturn the translation
    return speech_text, translation
    

# Test the function
import os

file_name = 'english.wav'
file_path = os.path.join('data', 'translation', file_name)
speech, translated_speech = translate_speech(cog_location, cog_key, file_path, to_lang='es', from_lang='en-US')
result = '{} -> {}'.format(speech, translated_speech)

# Show translated text
playsound(file_path)
print(result)

翻訳「先」の言語は 2 文字の言語コード (*en* など) を使用して識別する必要があり、翻訳「元」の言語にはカルチャ インジケータも加える必要があります (*en-US* など)。

フランス語から英語に翻訳してみましょう。

In [None]:
from playsound import playsound
import os

file_name = 'french.wav'
file_path = os.path.join('data', 'translation', file_name)
speech, translated_speech = translate_speech(cog_location, cog_key, file_path, to_lang='en', from_lang='fr-FR')
result = '{} -> {}'.format(speech, translated_speech)

# Show translated text
playsound(file_path)
print(result)

## 詳細情報

[Translator Text](https://docs.microsoft.com/azure/cognitive-services/translator/) と [Speech サービスを使用した翻訳](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-speech-translation)の詳細については、サービス ドキュメントを参照してください。