# Sintetização de Vóz

+ Conhecida pela sigla TTS (Text-To-Speech)
+ Processo de produção artificial da fala humana.
+ Consiste basicamente transformar um texto em uma fala.
+ O reconhecimento de fala (speech-to-text) é o processo inverso da sintetização ou seja é a capacidade computacional de transformar uma fala em texto.

## Utilizando Espeak

In [1]:
import os

In [2]:
os.system('espeak "Hello, How are you"')

0

In [3]:
os.system('espeak -v pt "Olá mundo, o python é demais"')

0

In [4]:
os.system('espeak -v pt -s 140 "Olá mundo, o python é demais"')

0

+ Utilizando Subprocess

In [5]:
from subprocess import call

In [6]:
minhafala = "Olá Mundo, vamos sintetizar vóz com python"

In [7]:
call(["espeak", minhafala])

0

## Utilizando Pyttsx3

In [None]:
!pip install pyttsx3

In [None]:
!pip install pypiwin32

In [8]:
import pyttsx3

In [10]:
en = pyttsx3.init()
en.say("Olá Mundo, seja bem vindo")
#en.setProperty('voice', b'brazil') #tentar idioma português
en.runAndWait()
en.stop()

In [11]:
""" RATE"""
rate = en.getProperty('rate')   # getting details of current speaking rate
print (rate)                    #printing current voice rate
en.setProperty('rate', 125)     # setting up new voice rate

200


In [12]:
"""VOLUME"""
volume = en.getProperty('volume')   #getting to know current volume level (min=0 and max=1)
print (volume)                          #printing current volume level
en.setProperty('volume',1.0)    # setting up volume level  between 0 and 1

1.0


In [19]:
"""VOICE"""
voices = en.getProperty('voices')       #getting details of current voice
#engine.setProperty('voice', voices[0].id)  #changing index, changes voices. o for male
#en.setProperty('voice', voices[1].id)   #changing index, changes voices. 1 for female

In [20]:
en.say("Hello World!")
en.say('My current speaking rate is ' + str(rate))
en.runAndWait()
en.stop()

### Teste Progressivo com "rate" e "volume"

+ Velocidade

In [21]:
import pyttsx3

engine = pyttsx3.init()

texto_fala = "Testando a velocidade"
velocidade_fala = 50

#engine.setProperty("rate", velocidade_fala)
#engine.say(texto_fala)
#engine.runAndWait()
#engine.stop()

while velocidade_fala<=300:
    
    engine.setProperty("rate", velocidade_fala)
    engine.say(texto_fala)
    engine.runAndWait()
    engine.stop()
    
    velocidade_fala = velocidade_fala + 50
    

+ Volume

In [22]:
import pyttsx3

engine = pyttsx3.init()

#setando a velocidade padrão
engine.setProperty("rate", 120)

texto_fala = "Testando o volume"
volume_fala = 0.2

while volume_fala <= 1:
    
    engine.setProperty("volume", volume_fala)
    engine.say(texto_fala)
    engine.runAndWait()
    engine.stop()
    
    volume_fala = volume_fala + 0.2

### Desafio 1

Criar um trecho de fala com o uso da biblioteca datetime

In [23]:
import pyttsx3
from datetime import datetime

nome = "Renato Tavares"
agora = datetime.now()
hora = agora.hour
minute = agora.minute

trecho_fala = "Olá, " + nome + ". Seja bem vindo agora são: " + str(hora) + " hora(s)" + " e " + str(minute) + " minuto(s)."

print(trecho_fala)

engine = pyttsx3.init()
engine.setProperty("rate", 120)
engine.setProperty("volume", 1)
#engine.setProperty('voice', b'brazil') #tentar idioma português
engine.say(trecho_fala)
engine.runAndWait()
engine.stop()

Olá, Renato Tavares. Seja bem vindo agora são: 17 hora(s) e 45 minuto(s).


In [2]:
en.setProperty('rate', 125)

In [24]:
#teste
import pyttsx3
en = pyttsx3.init("sapi5")
en.say("Olá Mundo, seja bem vindo")
#en.setProperty('voice', b'brazil') #tentar idioma português
en.runAndWait()
en.stop()

## Sintetização usando GTTS(Google-Text-To-Speech)

Vantagens e Desvantagens

+ Vantagens:
    + Suporta varios idiomas inclusive português
    + Tem uma boa precisão
    
+ Desvantagens:
    + o processo de sintetização é online 
    + Tem uma precisão muito grande em relação as demais bibliotecas

In [None]:
!pip install gtts

In [None]:
!pip install pygame

In [25]:
from gtts import gTTS

In [26]:
voz = gTTS("Olá vamos sintetizar vóz com python", lang='pt')
voz.save("audios/voz.mp3")

### Utilizar o pygame para executar o Audio

In [27]:
from pygame import mixer

pygame 1.9.4
Hello from the pygame community. https://www.pygame.org/contribute.html


In [30]:
mixer.init()
mixer.music.load("audios/voz.mp3")
mixer.music.play()

### Utilizar "import os" para executar o Audio

In [32]:
#criar um novo arquivo
voz = gTTS("Olá vamos sintetizar vóz com python", lang='pt')
voz.save("audios/voz1.mp3")

In [34]:
import os
os.system('audios/voz1.mp3')

1

### Desafio 2
Criar um leitor de arquivo de texto em Português

In [35]:
from gtts import gTTS
from pygame import mixer
import os.path

diretorio = input("Digite o caminho do diretorio de texto:")

verifica_diretorio = os.path.isfile(diretorio)

if verifica_diretorio == True:
    
    print("O arquivo está sendo carregado aguarde...")
    file_data = open(diretorio)
    file_data = file_data.read()
    
    print("Salvando arquivo, aguarde...")
    voz = gTTS(file_data, lang='pt')
    voz.save("audios/voz_texto.mp3")
    
    print("Falando...")
    
    mixer.init()
    mixer.music.load("audios/voz_texto.mp3")
    mixer.music.play()
    
else:
    print("diretorio não encontrado!")

Digite o caminho do diretorio de texto:C:\Users\r.tavares.da.silva\OneDrive\Inteligencia Artificial\Curso_Udemy\reconhecimento-e-sintetizacao-de-voz-com-python\meutexto.txt
O arquivo está sendo carregado aguarde...
Salvando arquivo, aguarde...
Falando...


Criar um leitor de arquivo de texto em Inglês

In [36]:
from gtts import gTTS
from pygame import mixer
import os.path

diretorio = input("Digite o caminho do diretorio de texto:")

verifica_diretorio = os.path.isfile(diretorio)

if verifica_diretorio == True:
    
    print("O arquivo está sendo carregado aguarde...")
    file_data = open(diretorio)
    file_data = file_data.read()
    
    print("Salvando arquivo, aguarde...")
    voz = gTTS(file_data)
    voz.save("audios/Fala.mp3")
    
    print("Falando...")
    
    mixer.init()
    mixer.music.load("audios/Fala.mp3")
    mixer.music.play()
    
else:
    print("diretorio não encontrado!")

Digite o caminho do diretorio de texto:C:\Users\r.tavares.da.silva\OneDrive\Inteligencia Artificial\Curso_Udemy\reconhecimento-e-sintetizacao-de-voz-com-python\Fala.txt
O arquivo está sendo carregado aguarde...
Salvando arquivo, aguarde...
Falando...
