# Ucapan

Semakin lama, kami berharap dapat berkomunikasi dengan sistem kecerdasan buatan (AI) dengan berbicara kepadanya, seringkali dengan harapan mendapatkan respons lisan.

![Robot berbicara](./images/speech.jpg)

*Pendahuluan ucapan* (sistem AI yang menafsirkan bahasa lisan) dan *sintesis ucapan* (sistem AI yang membuat respons lisan) adalah komponen penting dari solusi AI yang didukung oleh ucapan.

## Membuat sumber daya Cognitive Services

Untuk membuat perangkat lunak yang dapat menafsirkan ucapan yang dapat didengar dan merespons secara verbal, Anda dapat menggunakan layanan kognitif **Ucapan**, yang menyediakan cara sederhana untuk mentranskripsikan bahasa lisan menjadi teks dan sebaliknya.

Jika Anda belum memilikinya, gunakan langkah-langkah berikut untuk membuat sumber daya **Cognitive Services** di langganan Azure Anda:

> **Catatan**: Jika Anda sudah memiliki sumber daya Cognitive Services, cukup buka halaman Mulai cepat di portal Microsoft Azure dan salin kunci dan titik akhirnya ke sel di bawah. Atau, ikuti langkah-langkah di bawah untuk membuatnya.

1. Di tab browser lain, buka portal Microsoft Azure di https://portal.azure.com, masuk menggunakan akun Microsoft Anda.
2. Klik tombol **&#65291;Buat sumber daya**, cari *Cognitive Services*, dan buat sumber daya **Cognitive Services** dengan pengaturan berikut:
    - **Langganan**: *Langganan Azure Anda*.
    - **Grup sumber daya**: *Pilih atau buat grup sumber daya dengan nama unik*.
    - **Wilayah**: *Pilih wilayah yang tersedia*:
    - **Nama**: *Masukkan nama yang unik*.
    - **Tingkat Harga**: S0
    - **Saya mengonfirmasi bahwa saya telah membaca dan memahami pemberitahuan tersebut**: Dipilih.
3. Tunggu penyebaran hingga selesai. Lalu, buka sumber daya layanan kognitif, dan di halaman **Ringkasan**, klik tautan untuk mengelola kunci layanan. Anda akan memerlukan kunci dan lokasi untuk terhubung ke sumber daya layanan kognitif dari aplikasi klien.

### Mendapatkan Kunci dan Lokasi untuk sumber daya Cognitive Services Anda

Untuk menggunakan sumber daya layanan kognitif, aplikasi klien memerlukan lokasi dan kunci autentikasinya:

1. Di portal Azure, di halaman **Kunci dan Titik Akhir** untuk sumber daya layanan kognitif Anda, salin **Kunci1** untuk sumber daya dan tempel pada kode di bawah, menggantikan **YOUR_COG_KEY**.
2. Salin **Lokasi** untuk sumber daya Anda dan tempel pada kode di bawah, menggantikan **YOUR_COG_LOCATION**.
>Catatan: Tetap di halaman **Kunci dan Titik Akhir** dan salin **Lokasi** dari halaman ini (contoh: _westus_). Jangan _tambahkan_ spasi di antara kata untuk bidang Lokasi. 
3. Jalankan kode di bawah dengan mengeklik tombol **Jalankan sel** (&#9655;) di sebelah kiri sel.

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_location = 'YOUR_COG_LOCATION'

print('Ready to use cognitive services in {} using key {}'.format(cog_location, cog_key))

## Pendahuluan ucapan

Misalkan Anda ingin membangun sistem otomatisasi rumah yang menerima instruksi lisan, seperti "nyalakan lampu" atau "matikan lampu". Aplikasi Anda harus dapat menerima input berbasis audio (instruksi lisan Anda), dan menafsirkannya dengan mentranskripsikannya ke teks yang kemudian dapat diuraikan dan dianalisis.

Sekarang Anda siap untuk mentranskripsikan beberapa ucapan. Input tersebut bisa berasal dari **mikrofon** atau **file audio**. 


### Pendahuluan Ucapan dengan file audio

Jalankan sel di bawah untuk melihat layanan Pendahuluan Ucapan bekerja dengan **file audio**. 


In [None]:
import os
from playsound import playsound
from azure.cognitiveservices.speech import SpeechConfig, SpeechRecognizer, AudioConfig

# Get spoken command from audio file
file_name = 'light-on.wav'
audio_file = os.path.join('data', 'speech', file_name)

# Configure speech recognizer
speech_config = SpeechConfig(cog_key, cog_location)
speech_config.speech_synthesis_voice_name = 'en-US-ChristopherNeural'
audio_config = AudioConfig(filename=audio_file) # Use file instead of default (microphone)
speech_recognizer = SpeechRecognizer(speech_config, audio_config)

# Use a one-time, synchronous call to transcribe the speech
speech = speech_recognizer.recognize_once()

# Play the original audio file
playsound(audio_file)

# Show transcribed text from audio file
print(speech.text)

## Sintesis ucapan

Jadi sekarang Anda telah melihat bagaimana layanan Ucapan dapat digunakan untuk mentranskripsikan ucapan menjadi teks; tapi bagaimana dengan sebaliknya? Bagaimana Anda dapat mengonversi teks menjadi ucapan?

Nah, mari kita asumsikan sistem otomatisasi rumah Anda telah menafsirkan perintah untuk menyalakan lampu. Respons yang sesuai bisa jadi mengetahui perintah secara verbal (serta melakukan tugas yang diperintahkan secara aktual!).

In [None]:
import os
import matplotlib.pyplot as plt
from PIL import Image
from azure.cognitiveservices.speech import SpeechConfig, SpeechSynthesizer, AudioConfig
%matplotlib inline

# Get text to be spoken
response_text = 'Turning the light on.'

# Configure speech synthesis
speech_config = SpeechConfig(cog_key, cog_location)
speech_config.speech_synthesis_voice_name = 'en-US-ChristopherNeural'
speech_synthesizer = SpeechSynthesizer(speech_config)

# Transcribe text into speech
result = speech_synthesizer.speak_text(response_text)

# Display an appropriate image
file_name = response_text.lower() + "jpg"
img = Image.open(os.path.join("data", "speech", file_name))
plt.axis('off')
plt. imshow(img)

Coba dengan mengubah variabel **response_text** ke *Mematikan lampu.* (termasuk titik di akhir) dan jalankan sel lagi untuk mendengar hasilnya.

## Pelajari selengkapnya

Anda telah melihat contoh yang sangat sederhana menggunakan layanan kognitif Ucapan di buku catatan ini. Anda dapat mempelajari selengkapnya tentang [ucapan-ke-teks](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-speech-to-text) dan [teks-ke-ucapan](https://docs.microsoft.com/azure/cognitive-services/speech-service/index-text-to-speech) dalam dokumentasi layanan Ucapan.