# Parole

De plus en plus, nous nous attendons à pouvoir communiquer avec des systèmes d’intelligence artificielle (IA) en leur parlant, souvent dans l’attente d’une réponse orale.

![Un robot qui parle](./images/speech.jpg)

La *reconnaissance vocale* (système d’IA interprétant le langage parlé) et la *synthèse vocale* (système d’IA générant une réponse orale) sont les composants clés d’une solution d’IA basée sur la parole.

## Créer une ressource Cognitive Services

Pour créer un logiciel capable d’interpréter un discours audible et de répondre verbalement, vous pouvez utiliser le service cognitif **Parole**, qui offre un moyen simple de transcrire le langage parlé en texte et vice-versa.

Si vous n’en avez pas encore, suivez les étapes suivantes pour créer une ressource **Cognitive Services** dans votre abonnement Azure :

> **Remarque** : Si vous disposez déjà d’une ressource Cognitive Services, il suffit d’ouvrir sa page **Démarrage rapide** dans le portail Azure et de copier sa clé et son point de terminaison dans la cellule ci-dessous. Sinon, suivez les étapes ci-dessous pour en créer une.

1. Dans un autre onglet du navigateur, ouvrez le portail Azure à l’adresse https://portal.azure.com, en vous connectant avec votre compte Microsoft.
2. Cliquez sur le bouton **&#65291; Créer une ressource**, recherchez *Cognitive Services* et créez une ressource **Cognitive Services** avec les paramètres suivants :
    - **Abonnement** : *Votre abonnement Azure*.
    - **Groupe de ressources** : *Sélectionnez ou créez un groupe de ressources portant un nom unique*.
    - **Région** : *Choisissez une région disponible* :
    - **Nom** : *Saisissez un nom unique*.
    - **Niveau tarifaire** : S0
    - **Je confirme avoir lu et compris les avis** : Sélectionné.
3. Attendez la fin du déploiement. Ensuite, accédez à votre ressource Cognitive Services et, sur la page **Aperçu**, cliquez sur le lien permettant de gérer les clés du service. Vous aurez besoin de la clé et de l’emplacement pour vous connecter à votre ressource Cognitive Services à partir d’applications clientes.

### Obtenir la clé et l’emplacement de votre ressource Cognitive Services

Pour utiliser votre ressource Cognitive Services, les applications clientes ont besoin de sa clé d’authentification et de son emplacement :

1. Dans le portail Azure, sur la page **Clés et Point de terminaison** de votre ressource Cognitive Services, copiez la **Clé 1** de votre ressource et collez-la dans le code ci-dessous, en remplaçant **YOUR_COG_KEY**.
2. Copiez **Emplacement** de votre ressource et collez-le dans le code ci-dessous, en remplaçant **YOUR_COG_LOCATION**.
>**Remarque** : Restez sur la page **Clés et Point de terminaison** et copiez **Emplacement** de cette page (exemple : _westus_). N’ajoutez pas d’espaces entre les mots dans le champ Emplacement. 
3. Exécutez le code ci-dessous en cliquant sur le bouton **Exécuter la cellule** (&#9655;) à gauche de la cellule.

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_location = 'YOUR_COG_LOCATION'

print('Ready to use cognitive services in {} using key {}'.format(cog_location, cog_key))

## Reconnaissance vocale

Supposons que vous vouliez construire un système domotique qui accepte les instructions vocales, telles que « allumer la lumière » ou « éteindre la lumière ». Votre application doit être capable de prendre l’entrée audio (vos instructions vocales) et de l’interpréter en la transcrivant en texte qu’elle peut ensuite analyser.

Vous êtes maintenant prêt à transcrire la parole. L’entrée peut provenir d’un **microphone** ou d’un **fichier audio**. 


### Reconnaissance vocale avec un fichier audio

Exécutez la cellule ci-dessous pour voir le service Reconnaissance vocale en action avec un **fichier audio**. 


In [None]:
import os
from playsound import playsound
from azure.cognitiveservices.speech import SpeechConfig, SpeechRecognizer, AudioConfig

# Get spoken command from audio file
file_name = 'light-on.wav'
audio_file = os.path.join('data', 'speech', file_name)

# Configure speech recognizer
speech_config = SpeechConfig(cog_key, cog_location)
speech_config.speech_synthesis_voice_name = 'en-US-ChristopherNeural'
audio_config = AudioConfig(filename=audio_file) # Use file instead of default (microphone)
speech_recognizer = SpeechRecognizer(speech_config, audio_config)

# Use a one-time, synchronous call to transcribe the speech
speech = speech_recognizer.recognize_once()

# Play the original audio file
playsound(audio_file)

# Show transcribed text from audio file
print(speech.text)

## Synthèse vocale

Vous avez maintenant vu comment le service Parole peut être utilisé pour transcrire la parole en texte ; mais qu’en est-il de l’inverse ? Comment convertir du texte en parole ?

Eh bien, supposons que votre système domotique ait interprété une commande d’allumage de la lampe. Une réponse appropriée pourrait être de reconnaissance verbale de la commande (et d’effectuer la tâche commandée !).

In [None]:
import os
import matplotlib.pyplot as plt
from PIL import Image
from azure.cognitiveservices.speech import SpeechConfig, SpeechSynthesizer, AudioConfig
%matplotlib inline

# Get text to be spoken
response_text = 'Turning the light on.'

# Configure speech synthesis
speech_config = SpeechConfig(cog_key, cog_location)
speech_config.speech_synthesis_voice_name = 'en-US-ChristopherNeural'
speech_synthesizer = SpeechSynthesizer(speech_config)

# Transcribe text into speech
result = speech_synthesizer.speak_text(response_text)

# Display an appropriate image 
file_name = response_text.lower() + "jpg"
img = Image.open(os.path.join("data", "speech", file_name))
plt.axis('off')
plt. imshow(img)

Essayez de changer la variable **response_text** en *Éteindre la lumière.* (y compris la période à la fin) et exécutez à nouveau la cellule pour entendre le résultat.

## En savoir plus

Vous avez vu un exemple très simple d’utilisation du Cognitive Services Parole dans ce carnet de notes. Vous pouvez en savoir plus sur la [conversion de parole en texte](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-speech-to-text) et la [conversion de texte en parole](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-text-to-speech) dans la documentation du service Parole.