# Azure Cognitive ServicesのAPIを用いた機械翻訳

このノートブックでは、Azure Cognitive Servicesの提供しているAPIを用いて、機械翻訳をする方法を紹介します。前提条件として、AzureサブスクリプションとTranslatorリソースの作成があります。詳細は以下を御覧ください。

- [クイックスタート: Translator を使ってみる](https://docs.microsoft.com/ja-jp/azure/cognitive-services/translator/quickstart-translator?tabs=python)

## 準備

### パッケージのインストール

In [1]:
!pip install -q requests==2.23.0



### インポート

In [2]:
import json
import os
import uuid

import requests

## 使い方

In [6]:
# サブスクリプションキーを作成したリソースのものに置き換えます。
subscription_key = "YOUR_SUBSCRIPTION_KEY"
endpoint = "https://api.cognitive.microsofttranslator.com"

# リソースのロケーションを設定します。
location = "YOUR_RESOURCE_LOCATION"

path = '/translate'
constructed_url = endpoint + path

# 英語からドイツ語と日本語に翻訳してみましょう。
params = {
    'api-version': '3.0',
    'from': 'en',
    'to': ['de', 'ja']
}

headers = {
    'Ocp-Apim-Subscription-Key': subscription_key,
    'Ocp-Apim-Subscription-Region': location,
    'Content-type': 'application/json',
    'X-ClientTraceId': str(uuid.uuid4())
}

# bodyには複数のオブジェクトを渡すことができます。
body = [
    {
        'text': 'Hello, World!'
    },
    {
        'text': 'The problems are solved, not by giving new information, but by arranging what we have known since long.'
    }
]

request = requests.post(constructed_url, params=params, headers=headers, json=body)
response = request.json()

print(json.dumps(response, sort_keys=True, ensure_ascii=False, indent=4, separators=(',', ': ')))

[
    {
        "translations": [
            {
                "text": "Hallo Welt!",
                "to": "de"
            },
            {
                "text": "ハローワールド！",
                "to": "ja"
            }
        ]
    },
    {
        "translations": [
            {
                "text": "Die Probleme werden gelöst, nicht indem wir neue Informationen geben, sondern indem wir das arrangieren, was wir seit langem wissen.",
                "to": "de"
            },
            {
                "text": "問題は、新しい情報を提供するのではなく、長い間知っていることを整理することによって解決されます。",
                "to": "ja"
            }
        ]
    }
]


Google CloudやAWSも同様の翻訳サービスを提供しています。それらについては皆様の演習としておきましょう。

今回使ったテキスト翻訳の他に、ドキュメント翻訳の機能も提供しています。ドキュメント翻訳では、さまざまなファイル形式の文書を、元の構造や形式を維持したまま、文書全体を翻訳できます。WordやPowerPoint、Excel、PDFなどのリッチコンテンツを含むファイルを翻訳できます。また、カスタム用語集やカスタムモデルをサポートしているので、特定のドメイン向けに品質を上げることもできるでしょう。

ドキュメント翻訳の概要と詳細については、以下の記事を参照してください。

- [Translate full documents with Document Translation ― Now in General Availability](https://www.microsoft.com/en-us/translator/blog/2021/05/25/translate-full-documents-with-document-translation-%E2%80%95-now-in-general-availability/)
- [What is Document Translation?](https://docs.microsoft.com/en-us/azure/cognitive-services/translator/document-translation/overview)

## 参考資料

サポートしている言語は以下のページから確認できます。

- [Translator language support](https://docs.microsoft.com/en-us/azure/cognitive-services/translator/language-support)

その他、ドキュメントです。

- [Translator documentation](https://docs.microsoft.com/en-us/azure/cognitive-services/translator/)