# Utilizando o Speech Recognition para transcrição de aúdio para texto e arquivo MP3

## Preparação do ambiente

#### Essa sessão foi executado no prompt de comando do windows.

Instalando a biblioteca SpeechRecognition (biblioteca de reconhecimento de voz)

    pip install SpeechRecognition
    
Instalando a biblioteca PyAudio (essa biblioteca é utilizada pela SpeechRecognition)

Obs: o PyAudio não é suportado pela versão 3.7 do Python. Como a minha versão é a 3.8
e eu não queria fazer um downgrade e nem criar uma env para separar o ambiente eu utilizei 
o "pipwin" que instala versões não oficiais para o windows, podendo assim, instalar o PyAudio 
em uma versão mais atual.

    pip install pipwin
    pipwin install pyaudio
    
    
Instalação das bilitecas gTTS (interface com a API text-to-speech do Google Translate) e PlaySound (módulo para a execução de arquivos de áudio).

    pip install --user gTTS
    pip install --user playsound
    
Necessário para trancrição de MP3 em WAV

    pip install pydub
 

### Importação das bibliotecas necessárias

In [None]:
#Importa as bibliotecas de reconhecimento de voz
#Reconhecimento de voz
import speech_recognition as sr
from gtts import gTTS
from playsound import playsound
from pydub import AudioSegment

### O código abaixo pega o que é captado no microfone e transforma em retorno da função.

In [None]:
#Essa função vai ouvir e fazer o reconhecimento da fala
def ouvir():
    #Habilita o microfone
    mic = sr.Recognizer()
    
    #Criando um arquivo fonte com o audio a ser transcrito
    with sr.Microphone() as source:
        #Aciona a função de redução de ruído
        mic.adjust_for_ambient_noise(source)
        #Avisa que está pronto pra ouvir
        print("Pode falar:")
        #Armazena a informação de audio em uma variável
        audio = mic.listen(source)
        print("Gravação concluída.")
        
    try:
        #Passa o áudio para o reconhecedor de padroes do speech_recognition e retorna o resultado.
        return mic.recognize_google(audio,language='pt-BR')
    except sr.LookupError:
        #Caso nao tenha reconhecido o padrao de fala retorna um código de erro.
        return "codErro000"

### Aciona a função de ouvir e armazena seu retorno

In [None]:
frase = ouvir()

### Imprimi o retorno na saída padrão

In [None]:
if (frase != "codErro000"):
    print("Você disse: " + frase)
else:
    print("Não entendi.")

### Grava o retorno em um arquivo de texto

In [None]:
if (frase != "codErro000"):
    #Abre o arquivo gravacao.txt em modo de escrita
    with open('gravacao.txt', mode ='w') as file:
        print("Escrevendo texto:")
        #Escreve a trancsrição no arquivo de texto
        file.write(frase)
        print("Gravação do arquivo concluída!")
else:
    print("Não entendi.")

### Pega o retorno da gravação e armazena em um arquivo de áudio

In [None]:
tts = gTTS(frase, lang='pt-br')
tts.save('gravacao.mp3')
print("Arquivo MP3 gravado")

### Executa o arquivo de áudio armazenado

In [None]:
playsound('gravacao.mp3')
print("Arquivo executado")

### Converte o arquivo MP3 para WAV

In [None]:
sound = AudioSegment.from_mp3("audio.mp3")
sound.export("audio.wav", format="wav")

### Carrega o audio de um arquivo WAV

In [None]:
def carrega_audio():
    r = sr.Recognizer()
    #usa o arquivo audio.wav como fonte
    with sr.AudioFile("audio.wav") as source:
        #extrai áudio do arquivo
        print("Carregando arquivo de áudio")
        audio = r.record(source)
    try:
        print("Iniciando receonhecimento do áudio")
        #efetua o reconhecimento do áudio carregado
        transcricao = r.recognize_google(audio, language='pt-BR')
        print("Transcrição concluída")
        return transcricao
    except sr.LookupError:
        #Caso nao tenha reconhecido o padrao de fala retorna um código de erro.
        return "codErro000"

### Aciona a função carrega_audio() e aemazena seu retorno

In [None]:
transcricao = carrega_audio()

### Exibe a transcrição na saída padrão

In [None]:
if (transcricao != "codErro000"):
    print("Transcrição: " + transcricao)
else:
    print("Não entendi.")

### Grava a transcrição em um arquivo de texto

In [None]:
if (transcricao != "codErro000"):
    #Abre o arquivo transcricao.txt em modo de escrita
    with open('transcricao.txt', mode ='w') as file:
        print("Escrevendo texto:")
        #Escreve a trancsrição no arquivo de texto
        file.write(transcricao)
        print("Gravação do arquivo concluída!")
else:
    print("Não entendi.")