<a href="https://colab.research.google.com/github/SihyunPark01/AI_Speaker/blob/main/TTS(text_to_speech).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 음성 합성: TTS(Text-to-Speech)

### 구글 API 문서: https://developers.kakao.com/docs/latest/ko/voice/rest-api

### Text를 음성으로 변환하는 문자-음성 변환 서비스

### XML(SSML) 형식으로 합성하고자 하는 텍스트를 요청 바디에 담아 전송

> **SSML(Speech Synthesis Markup Language)**<br>
음성 합성에 사용되는 XML 기반 태그 언어(피치, 발음, 말하기 속도, 볼륨 조절 가능)

### 카카오 SSML 문서: https://developers.kakao.com/assets/guide/kakao_ssml_guide.pdf

### Request 
```
POST /v1/synthesize HTTP/1.1
Host: kakaoi-newtone-openapi.kakao.com
Content-Type: application/xml
Authorization: KakaoAK {REST_API_KEY}
```

## 1. 모듈 가져오기

In [None]:
import requests
import json
import speech_recognition as sr
import multiprocessing
from playsound import playsound

## 2. Request 파라미터 설정

In [None]:
url = "https://kakaoi-newtone-openapi.kakao.com/v1/synthesize"
key = "58df5a2afd5c776e6d4e95f5cabf709e"
headers = {
    "Content-Type": "application/xml",
    "Authorization": "KakaoAK " + key,
}

## 3. TTS 요청 함수

In [None]:
def RequestTTS(data, path):
    data = data.encode('utf-8').decode('latin1')
    res = requests.post(url, headers=headers, data=data)
    if (res.status_code == 200):
        with open(path, "wb") as f:
            f.write(res.content)
    return res

## 4. 음성파일 재생함수

In [None]:
def PlayAudio(path):
    p = multiprocessing.Process(target=playsound, args=(path,))
    p.start()
    return p

## 4. 함수 테스트

### 1) text 데이터 준비

### 2) TTS 요청 전송 => 음성으로 변환된 데이터 수신 => 파일에 저장

### 3) 음성파일 재생


In [None]:
if __name__ == "__main__":
    
    path = "hello.mp3"
    
    data = f'<speak>안녕하세요. 반가워요.</speak>'

    res = RequestTTS(data, path)  # TTS 요청, 파일 저장
    if (res.status_code != 200):
        print(f'TTS 요청이 실패하였습니다.(code={res.json()["msg"]})')
    else:
        p = PlayAudio(path) # 음성파일 재생

# 6. SSML 사용

In [None]:
if __name__ == "__main__":
    data = f'<speak>오늘은 <say-as interpret-as="kakao:none">박주건</say-as>가 태어난 날로, <say-as interpretas="kakao:none">부처님 오신날</say-as>예요.</speak>'
    path = "hello1.mp3"
    res = RequestTTS(data, path)
    if (res.status_code != 200):
        print(f'TTS 요청이 실패하였습니다.(code={res.json()["msg"]})')
    else:
        p = PlayAudio(path)

In [None]:
        p.terminate()