# Речь

Все чаще мы ожидаем, что сможем общаться с системами искусственного интеллекта, разговаривая с ними, часто с ожиданием разговорного ответа.

![Говорящий робот](./images/speech.jpg)

*Распознавание речи* (система ИИ, интерпретирующая разговорный язык) и *синтез речи* (система ИИ, генерирующая речевую реакцию) являются ключевыми компонентами решения ИИ по поддержке речи.

## Создание ресурса Cognitive Services

Для создания программного обеспечения, которое может интерпретировать слышимую речь и отвечать на нее в устной форме, можно воспользоваться когнитивной службой **Речь**, которая предоставляет простой способ расшифровки разговорной речи в текст и наоборот.

Если у вас нет такого ресурса, воспользуйтесь следующими пошаговыми инструкциями для создания ресурса **Cognitive Services** в вашей подписке Azure:

> **Примечание**. Если у вас уже есть ресурс Cognitive Services, просто откройте его страницу **Быстрый запуск** и скопируйте его ключ и конечную точку в ячейку ниже. В противном случае следуйте приведенным ниже действиям для создания этого ресурса.

1. На другой вкладке браузера откройте портал Azure по адресу https://portal.azure.com, выполнив вход под своей учетной записью Microsoft.
2. Нажмите кнопку **&#65291;Создать ресурс**, выполните поиск по строке *Cognitive Services* и создайте ресурс **Cognitive Services** со следующими настройками:
    - **Подписка**. *Ваша подписка Azure*.
    - **Группа ресурсов**. *Выберите или создайте группу ресурсов с уникальным именем*.
    - **Регион**. *Выберите любой доступный регион:*
    - **Имя**. *Введите уникальное имя*.
    - **Ценовая категория**. S0
    - **Подтверждаю, что прочитал и понял уведомления**. Выбрано.
3. Дождитесь завершения развертывания. Затем перейдите на свой ресурс Cognitive Services и на странице **Обзор** щелкните ссылку для управления ключами службы. Для подключения к вашему ресурсу когнитивных служб из клиентских приложений вам понадобятся ключ и месторасположение.

### Получите ключ и расположение вашего ресурса Cognitive Services

Чтобы использовать свой ресурс Cognitive Services, клиентским приложениям требуется ключ проверки подлинности и расположение:

1. На портале Azure откройте страницу **Ключи и конечная точка** для вашего ресурса Cognitive Service, скопируйте **Ключ1** для вашего ресурса и вставьте его в приведенный ниже код, заменив подстановочный текст **YOUR_COG_KEY**.
2. Скопируйте **Расположение** для вашего ресурса и вставьте его в приведенный ниже код, заменив **YOUR_COG_LOCATION**.
> **Примечание**. На той же странице **Ключи и конечная точка** скопируйте значение **Расположение** на этой странице (пример: _westus_). _Не_ добавляйте пробелы между словами в поле «Расположение». 
3. Выполните приведенный ниже код, нажав кнопку **Выполнить ячейку** (&#9655;) слева от ячейки.

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_location = 'YOUR_COG_LOCATION'

print('Ready to use cognitive services in {} using key {}'.format(cog_location, cog_key))

## Распознавание речи

Предположим, вы хотите построить систему домашней автоматизации, которая принимает голосовые инструкции, такие как «включить свет» или «выключить свет». Ваше приложение должно уметь принимать аудиоввод (вашу устную инструкцию) и интерпретировать его, транскрибируя в текст, который затем можно будет разобрать и проанализировать.

Теперь все готово для расшифровки некоторой речи. Входной сигнал может быть с **микрофона** или из **аудиофайла**. 


### Распознавание речи с помощью аудиофайла

Выполните код из ячейки ниже, чтобы увидеть службу «Распознавание речи» в действии с **аудиофайлом**. 


In [None]:
import os
from playsound import playsound
from azure.cognitiveservices.speech import SpeechConfig, SpeechRecognizer, AudioConfig

# Get spoken command from audio file
file_name = 'light-on.wav'
audio_file = os.path.join('data', 'speech', file_name)

# Configure speech recognizer
speech_config = SpeechConfig(cog_key, cog_location)
speech_config.speech_synthesis_voice_name = 'en-US-ChristopherNeural'
audio_config = AudioConfig(filename=audio_file) # Use file instead of default (microphone)
speech_recognizer = SpeechRecognizer(speech_config, audio_config)

# Use a one-time, synchronous call to transcribe the speech
speech = speech_recognizer.recognize_once()

# Play the original audio file
playsound(audio_file)

# Show transcribed text from audio file
print(speech.text)

## Синтез речи

Итак, вы увидели, как служба «Речь» может быть использована для расшифровки речи в текст; а как насчет обратного? Как можно преобразовать текст в речь?

Предположим, что ваша система домашней автоматизации интерпретировала команду на включение света. Соответствующим ответом может быть признание команды устно (а также фактическое выполнение задания!).

In [None]:
import os
import matplotlib.pyplot as plt
from PIL import Image
from azure.cognitiveservices.speech import SpeechConfig, SpeechSynthesizer, AudioConfig
%matplotlib inline

# Get text to be spoken
response_text = 'Turning the light on.'

# Configure speech synthesis
speech_config = SpeechConfig(cog_key, cog_location)
speech_config.speech_synthesis_voice_name = 'en-US-ChristopherNeural'
speech_synthesizer = SpeechSynthesizer(speech_config)

# Transcribe text into speech
result = speech_synthesizer.speak_text(response_text)

# Display an appropriate image 
file_name = response_text.lower() + "jpg"
img = Image.open(os.path.join("data", "speech", file_name))
plt.axis('off')
plt. imshow(img)

Попробуйте изменить переменную **response_text** на *Выключить свет.* (включая точку в конце) и снова выполните код из ячейки, чтобы услышать результат.

## Дополнительные сведения

В этой записной книжке вы увидели очень простой пример использования когнитивной службы «Речь». Подробнее о преобразовании [речи в текст](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-speech-to-text) и [текста в речь](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-text-to-speech) см. в документации по службе «Речь».