# 簡介
AI Voice是宏正自動科技的語音合成服務優聲學，使用本SDK是必須租用優聲學服務。租用服務請至`https://www.aivoice.com.tw`上留下聯絡資料。<br>
宏正優聲學，推出限量企業體驗版之語音合成服務，提供六個優質美聲，大量語音合成，歡迎企業用戶填寫表格連繫, 了解更多企業體驗版方案細節!
****

## 事前準備
1. 至語音合成網頁"啟動" `API Access Token`
2. 至語音合成網頁"複製" `API_ACCESS_TOKEN`

****
## AI Vioce SDK 範例

### 目前提供多位聲優：

| 語音 | 聲優 | SDK 參數 |
| :---: | :---: | :---: |
| 知性女聲 | 嘉妮 | `NOETIC` |
| 文學男聲 | 裕祥 | `LITERARY` |
| 陽光男聲 | 力晨 | `CHEERFUL` |
| 主持女聲 | 貝拉 | `HOST` |
| 活潑女聲 | 貝拉 | `VIVID` |
| 柔美女聲 | 貝拉 | `GRACEFUL` |

### 建立轉換器
- 以下為建立轉換器的流程：
    1. 代入token與伺服器位置，並建立轉換器設定檔
    2. 修改設定檔內選用的語音(預設參數為`None`，未設定語音參數將不會進行轉換)
    3. 代入設定檔並建立轉換器
    4. 更新轉換器設定 (Optional)

In [2]:
import ai_voice_sdk as aivoice

token = 'API_ACCESS_TOKEN' # 改為語音網頁上的 API_ACCESS_TOKEN
server = 'SERVER_URL' # 需要有帶"https"

# 1.建立轉換器設定檔
config = aivoice.ConverterConfig(token=token, server_url=server)

# 2.選擇設定檔內選用的語音
config.voice = aivoice.Voice.LITERARY

# 3.建立轉換器
converter = aivoice.VoiceConverter(config=config)

# 4.更新轉換器設定
new_config = aivoice.ConverterConfig(token=token, server_url=server)
new_config.voice = aivoice.Voice.NOETIC
converter.update_config(new_config)

<br>

### 加入文章
1. 轉換器的文字以段落清單的形式儲存
2. 以下有兩種方式加入文章

方法1: 透過程式碼加入

In [3]:
# 方法1: 透過程式碼加入
# 參數 (str)     text，要加入的文字內容
# 參數 (int) position，要加入的段落，預設為加入清單最後
converter.text.add_text(text="歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。", position=-1)

方法2: 讀取文字檔加入

In [4]:
# 方法2: 讀取文字檔加入
# 參數 (str) file_path，要加入的文字內容
# 參數 (str)    encode，編碼格式，預設為"utf-8"
converter.text.open_text_file(file_path="examples/textfile.txt", encode="utf-8")

<br>

### 獲得/顯示文章
- 文章以清單的形式儲存

In [5]:
# 印出文章清單
print(f"{converter.text.get_text()}\n")

# 印出文章
converter.text.show()

['歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。', '歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。\n宏正自動科技的人工智慧語音合成技術，帶來超逼真的合成語音：自然、真實，讓您拉近與客戶的距離，提高滿意度，帶來轉換率。\n按下合成鍵之前，我們建議您先確認2個問題：\n您的文章轉成語音之後，是好聽流暢的嗎？\n您有將閱讀文，轉為聆聽文嗎？\n微調一下文章結構，參考合成使用說明，讓文章看起來像閱讀文，也適合您的聆聽者。\n有任何對我們的合成服務的建議，也請您不吝指教！\nATEN 專注開發智慧製造及物聯網解決方案，堅持客戶優先的理念，也將持續實現承諾，提供客戶最佳的服務。\n']

 0 : 歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。
 1 : 歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。
宏正自動科技的人工智慧語音合成技術，帶來超逼真的合成語音：自然、真實，讓您拉近與客戶的距離，提高滿意度，帶來轉換率。
按下合成鍵之前，我們建議您先確認2個問題：
您的文章轉成語音之後，是好聽流暢的嗎？
您有將閱讀文，轉為聆聽文嗎？
微調一下文章結構，參考合成使用說明，讓文章看起來像閱讀文，也適合您的聆聽者。
有任何對我們的合成服務的建議，也請您不吝指教！
ATEN 專注開發智慧製造及物聯網解決方案，堅持客戶優先的理念，也將持續實現承諾，提供客戶最佳的服務。



<br>

### 刪除文章內容
- 刪除文章內容有以下兩種方法

方法1: 刪除文章段落

In [6]:
# 參數 (int) position，要刪除的段落
converter.text.delete_paragraph(position=0)
# 印出文章
converter.text.show()

 0 : 歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。
宏正自動科技的人工智慧語音合成技術，帶來超逼真的合成語音：自然、真實，讓您拉近與客戶的距離，提高滿意度，帶來轉換率。
按下合成鍵之前，我們建議您先確認2個問題：
您的文章轉成語音之後，是好聽流暢的嗎？
您有將閱讀文，轉為聆聽文嗎？
微調一下文章結構，參考合成使用說明，讓文章看起來像閱讀文，也適合您的聆聽者。
有任何對我們的合成服務的建議，也請您不吝指教！
ATEN 專注開發智慧製造及物聯網解決方案，堅持客戶優先的理念，也將持續實現承諾，提供客戶最佳的服務。



方法2: 清空文章

In [11]:
# 清除文章所有內容
converter.text.clear()
# 印出文章
converter.text.show()

Text is empty.


<br>

### 合成語音
- 合成語音有兩種使用方法：

方法1: 執行後不等待語音合成

In [7]:
# 方法1：執行後不等待語音合成

# 參數 (int) interval_time，伺服器忙碌時，重試合成任務間隔時間，最小值=0 (不重試), 最大值=10
# 參數 (bool) is_wait_speech，是否等待語音合成完成，如果為True，執行後會等待語音合成結束，其Result與get_speech(func)相同
result = converter.run(interval_time=0, is_wait_speech=False)

if result.status != aivoice.ConverterStatus.ConverVoiceStart:
    if result.status == aivoice.ConverterStatus.ConverVoiceFail:
        print(f"Error message: {result.error_message}")

Waitting for server...


方法2: 執行後等待語音合成結束並將資料取回

In [8]:
# 方法2: 執行後等待語音合成結束並將資料取回

# 參數 (int)  interval_time，伺服器忙碌時，重試合成任務間隔時間，最小值=0 (不重試), 最大值=10
# 參數 (bool) is_wait_speech，是否等待語音合成完成，如果為True，執行後會等待語音合成結束，Result與get_speech(func)相同
result = converter.run(interval_time=1, is_wait_speech=True)

if result.status == aivoice.ConverterStatus.GetSpeechSuccess:
    print("Get speech data success.")
    # 將語音另存為"aivoice.wav"
    result.save("aivoice")
elif result.status == aivoice.ConverterStatus.GetSpeechFail:
    print(f"Error message: {result.error_message}")
else:
    print(f"Converter status: {result.status.name}, Detail: {result.detail}")
    

Waitting for server...
Get speech data success.


<br>

### 確認語音合成狀態
- 需要先執行過`(function) run`，才能夠執行

In [9]:
result = converter.check_status()

if result.status == aivoice.ConverterStatus.ConverVoiceCompleted:
    print("Convert success.")
else: 
    if result.status == aivoice.ConverterStatus.ConverVoiceRunning:
        print(f"Convert processing: {result.detail}")
    if result.status == aivoice.ConverterStatus.ConverVoiceFail:
        print(f"Error message: {result.error_message}")

Convert success.


<br>

### 取得語音合成資料
- 注：需要先執行過`(function) run`，才能夠執行

In [10]:
result = converter.get_speech()

if result.status == aivoice.ConverterStatus.GetSpeechSuccess:
    print("Get speech data success.")
    # 將語音另存為"aivoice.wav"
    result.save("aivoice")
elif result.status == aivoice.ConverterStatus.GetSpeechFail:
    print(f"Error message: {result.error_message}")
else:
    print(f"Converter status: {result.status.name}, Detail: {result.detail}")

Get speech data success.


<br>

### 進階應用
1. 插入停頓
2. 調整語速、音調、以及音量
3. 修改發音
4. 修改發音並且調整語速、音調、以及音量

<br>

- 插入停頓

In [12]:
# 參數 (int) break_time，插入停頓時間(毫秒)
# 參數 (int)   position，要插入停頓的段落

# 在段落最後加入300毫秒的停頓
converter.text.insert_break(break_time=300, position=-1)

- 調整與速、音調、以及音量

In [13]:
# 參數 (str)     text，要調整的文字內容
# 參數 (float)   rate，調整語速 (0.8 ~ 1.2)
# 參數 (int)    pitch，調整音調 (-2 ~ 2)
# 參數 (float) volume，調整音量 (-6.0 ~ 6.0)
# 參數 (int) position，要插入的段落

# 在段落最後加入文字，並調整與速、音調、以及音量
converter.text.insert_prosody(text="歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。", rate=1.2, pitch=2, volume=-3.3, position=-1)

- 修改發音

In [14]:
# 參數 (str)     text，要修改發音的文字內容
# 參數 (str)       ph，修改後的發音
# 參數 (int) position，要插入的段落

# 在段落最後加入文字，並修改文字內容的發音
converter.text.insert_phoneme(text="大家好", ph="ㄧㄡ ㄕㄥ ㄒㄩㄝˊ", position=-1)

- 修改發音並且調整語速、音調、以及音量

In [16]:
# 參數 (str)     text，要修改發音的文字內容
# 參數 (str)       ph，修改後的發音
# 參數 (float)   rate，調整語速 (0.8 ~ 1.2)
# 參數 (int)    pitch，調整音調 (-2 ~ 2)
# 參數 (float) volume，調整音量 (-6.0 ~ 6.0)
# 參數 (int) position，要插入的段落

# 在段落1，插入修改發音後的文字內容，並且調整與速、音調、以及音量
converter.text.insert_prosody_and_phoneme(text="優聲學", ph="ㄉㄚˋ ㄐㄧㄚ ㄏㄠˇ", rate=0.8, pitch=-2, volume=5.5, position=1)

In [17]:
# 印出文章
converter.text.show()

 0 : <break time="300ms"/>
 1 : <prosody rate="0.8" pitch="-2st" volume="+5.5dB"><phoneme alphabet="bopomo" lang="TW" ph="ㄉㄚˋ ㄐㄧㄚ ㄏㄠˇ">優聲學</phoneme></prosody>
 2 : <prosody rate="0.8" pitch="-2st" volume="+5.5dB"><phoneme alphabet="bopomo" lang="TW" ph="ㄉㄚˋ ㄐㄧㄚ ㄏㄠˇ">優聲學</phoneme></prosody>
 3 : <prosody rate="1.2" pitch="+2st" volume="-3.3dB">歡迎體驗宏正優聲學，讓好聲音為您的應用提供加值服務。</prosody>
 4 : <phoneme alphabet="bopomo" lang="TW" ph="ㄧㄡ ㄕㄥ ㄒㄩㄝˊ">大家好</phoneme>
