#### Instala os módulos necessários

In [None]:
%pip install gTTS
%pip install os
%pip install playsound
%pip install warnings
%pip install google-cloud-speech

#### Importa os módulos necessários

In [2]:
from google.oauth2 import service_account
from google.cloud import speech
from gtts import gTTS
from playsound import playsound
import warnings

#### Ignora warnings que serão gerados

In [3]:
warnings.filterwarnings("ignore")

#### Definição da função para converter texto em áudio

In [4]:
def text_to_speech(sentences : list, audio_file_path : str) -> None:
    """
    A função converte uma lista de textos escritos em português (brasileiro) e converte em arquivos MP3 em português (brasileiro).
    
    Args:
        sentences (list): Lista de textos.
        directory (str): Nome do diretório onde serão salvos os arquivos de áudio.
    """

    counter = 0 

    for sentence in sentences:
        audio = gTTS(text=sentence, lang="pt", slow=False)
        audio.save(f"./audio/{audio_file_path}/{counter}.mp3")
        print(f'\nArquivo MP3 salvo no diretório: "./audio/{audio_file_path}/{counter}.mp3".')
        counter += 1

#### Definição da função para converter áudio em texto

In [5]:
def speech_to_text(audio_file_path : str) -> str:
    """
    A função recebe um arquivo MP3 em português (brasileiro) e retorna o conteúdo do áudio convertido em texto.

    Args:
        audio_file_path (str): Nome do diretório onde o arquivo MP3 foi armazenado.

    Returns:
        str: Transcrição de áudio de arquivos MP3.
    """

    # Realiza a autenticação e inicializa a comunicação com a API da Google Cloud Platform
    json_file_path = "/home/leonardo/workspace/keys/google_access_key.json"
    credentials = service_account.Credentials.from_service_account_file(json_file_path)
    client = speech.SpeechClient(credentials=credentials)
    
    # Abre o arquivo MP3 como binário e armazena o seu conteúdo na variável "content"
    with open(audio_file_path, "rb") as audio_file:
        content = audio_file.read()

    # Processa o conteúdo da variável "content" com o módulo de TTS
    audio = speech.RecognitionAudio(content=content)

    # Define as configurações de reconhecimento de falar (formato, qualidade e idioma do áudio)    
    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.MP3,
        sample_rate_hertz=44100,
        language_code="pt-BR",
    )

    # Informa a configuração e o áudio a ser convertido para texto usando a API
    response = client.recognize(config=config, audio=audio)

    # Retorna o resultado da API
    for result in response.results:
        return result.alternatives[0].transcript

#### Definição dos diretórios dos arquivos

In [6]:
%%bash 
rm -rf audio*
sleep 3
mkdir audio audio/central audio/customer

#### Gravação das falas da central de atendimento e do cliente

In [7]:
central_phrases = [
    "Olá, você entrou em contato com o Banco de Konoha!", 
    
    "Para consultar o saldo em conta, diga saldo em conta.", 
    "Você escolheu a opção consultar saldo em conta.", 
    "O seu saldo em conta é cinco mil reais.",
    
    "Para simular uma compra internacional, diga compra internacional.", 
    "Você escolheu a opção simular uma compra internacional.", 
    "Infelizmente a opção não está disponível no momento, pedimos que tente novamente mais tarde.",
    
    "Para falar com um de nossos atendentes, diga falar com atendimento.", 
    "Você escolheu a opção falar com um de nossos atendentes.", 
    "Aguarde enquanto encaminhamos você para um de nossos atendentes.",

    "Caso queira encerrar a ligação, diga encerrar ligação.",
    "Vocẽ escolheu a opção encerrar a ligação.",
    "A ligação será encerrada nos próximos segundos."]

text_to_speech(central_phrases, "central")


customer_phrases = [
    "Saldo em conta.", 
    
    "Compra internacional.", 
    
    "Falar com atendimento.", 
    
    "Encerrar ligação."]

text_to_speech(customer_phrases, "customer")


Arquivo MP3 salvo no diretório: "./audio/central/0.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/1.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/2.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/3.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/4.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/5.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/6.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/7.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/8.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/9.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/10.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/11.mp3".

Arquivo MP3 salvo no diretório: "./audio/central/12.mp3".

Arquivo MP3 salvo no diretório: "./audio/customer/0.mp3".

Arquivo MP3 salvo no diretório: "./audio/customer/1.mp3".

Arquivo MP3 salvo no diretório: "./audio/customer/2.mp3".

Arquivo MP3 salvo no diretório: "./audio/customer/3.mp3".


#### Simulação de interação do cliente com a central de atendimento

In [8]:
def simulate(customer_choice : str) -> None:
    # Central de atendimento informa as opções disponíveis
    for option in [0, 1, 4, 7, 10]:
        playsound(f"audio/central/{option}.mp3")
        reading = speech_to_text(f"audio/central/{option}.mp3").capitalize()
        print(f"Central\n-> {reading}.")

    # Cliente seleciona uma das opções
    playsound(f"audio/customer/{customer_choice}.mp3")
    answer = speech_to_text(f"audio/customer/{customer_choice}.mp3").capitalize()
    print(f"\nCliente\n-> {answer}.")

    # Lógica para reprodução dos aúdios
    if answer == "Saldo em conta":
        playsound("audio/central/2.mp3")
        playsound("audio/central/3.mp3")
        reading_a = speech_to_text(f"audio/central/2.mp3").capitalize()
        reading_b = speech_to_text(f"audio/central/3.mp3").capitalize()
        print(f"\nCentral\n-> {reading_a}.")
        print(f"Central\n-> {reading_b}.")
    
    elif answer == "Compra internacional":
        playsound("audio/central/5.mp3")
        playsound("audio/central/6.mp3")
        reading_a = speech_to_text(f"audio/central/5.mp3").capitalize()
        reading_b = speech_to_text(f"audio/central/6.mp3").capitalize()
        print(f"\nCentral\n-> {reading_a}.")
        print(f"Central\n-> {reading_b}.")

    elif answer == "Falar com atendimento":
        playsound("audio/central/8.mp3")
        playsound("audio/central/9.mp3")
        reading_a = speech_to_text(f"audio/central/8.mp3").capitalize()
        reading_b = speech_to_text(f"audio/central/9.mp3").capitalize()
        print(f"\nCentral\n-> {reading_a}.")
        print(f"Central\n-> {reading_b}.")
    
    else:
        playsound("audio/central/11.mp3")
        playsound("audio/central/12.mp3")
        reading_a = speech_to_text(f"audio/central/11.mp3").capitalize()
        reading_b = speech_to_text(f"audio/central/12.mp3").capitalize()
        print(f"\nCentral\n-> {reading_a}.")
        print(f"Central\n-> {reading_b}.")

Caso de uso: saldo em conta

In [9]:
simulate("0")

Central
-> Olá você entrou em contato com o banco de conoha.
Central
-> Para consultar o saldo em conta diga saldo em conta.
Central
-> Para simular uma compra internacional diga compra internacional.
Central
-> Para falar com um de nossos atendentes diga falar com atendimento.
Central
-> Caso queira encerrar a ligação diga encerrar ligação.

Cliente
-> Saldo em conta.

Central
-> Você escolheu a opção consultar saldo em conta.
Central
-> O seu saldo em conta é r$ 5000.


Caso de uso: compra internacional

In [10]:
simulate("1")

Central
-> Olá você entrou em contato com o banco de conoha.
Central
-> Para consultar o saldo em conta diga saldo em conta.
Central
-> Para simular uma compra internacional diga compra internacional.
Central
-> Para falar com um de nossos atendentes diga falar com atendimento.
Central
-> Caso queira encerrar a ligação diga encerrar ligação.

Cliente
-> Compra internacional.

Central
-> Você escolheu a opção simular uma compra internacional.
Central
-> Infelizmente a opção não está disponível no momento pedimos que tente novamente mais tarde.


Caso de uso: falar com atendimento

In [11]:
simulate("2")

Central
-> Olá você entrou em contato com o banco de conoha.
Central
-> Para consultar o saldo em conta diga saldo em conta.
Central
-> Para simular uma compra internacional diga compra internacional.
Central
-> Para falar com um de nossos atendentes diga falar com atendimento.
Central
-> Caso queira encerrar a ligação diga encerrar ligação.

Cliente
-> Falar com atendimento.

Central
-> Você escolheu a opção falar com um de nossos atendentes.
Central
-> Aguarde enquanto encaminhamos você para um de nossos atendentes.


Caso de uso: encerrar ligação

In [12]:
simulate("3")

Central
-> Olá você entrou em contato com o banco de conoha.
Central
-> Para consultar o saldo em conta diga saldo em conta.
Central
-> Para simular uma compra internacional diga compra internacional.
Central
-> Para falar com um de nossos atendentes diga falar com atendimento.
Central
-> Caso queira encerrar a ligação diga encerrar ligação.

Cliente
-> Encerrar ligação.

Central
-> Você escolheu a opção encerrar a ligação.
Central
-> A ligação será encerrada nos próximos segundos.
