<a href="https://colab.research.google.com/github/Santosdevbjj/assistVirtualPLN/blob/main/notebooks/01_speech_recognition.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Notebook 01: Demonstração de Speech-to-Text**

Este notebook demonstra como utilizar a biblioteca `SpeechRecognition` em Python para converter áudio capturado do microfone em texto. Este é o componente central para o funcionamento de um assistente virtual.

### **1. Instalação das Bibliotecas**

Primeiro, instalamos as bibliotecas necessárias. O `SpeechRecognition` é a principal, e o `PyAudio` é necessário para o acesso ao microfone.

In [None]:
# Instala as bibliotecas SpeechRecognition e PyAudio
!pip install SpeechRecognition
!pip install PyAudio

### **2. Função de Reconhecimento de Fala**

Definimos uma função para encapsular a lógica de ouvir e reconhecer a fala. Esta função utiliza o serviço de reconhecimento de voz do Google por ser robusto e gratuito.

In [None]:
import speech_recognition as sr

def listen_and_recognize():
    """
    Captura áudio do microfone e o converte em texto usando o Google Speech Recognition.
    Retorna o texto reconhecido ou None em caso de erro.
    """
    r = sr.Recognizer()
    with sr.Microphone() as source:
        print("Por favor, diga algo...")
        # Ajusta para o ruído ambiente para melhorar a qualidade do reconhecimento
        r.adjust_for_ambient_noise(source, duration=1)
        try:
            audio = r.listen(source, timeout=5, phrase_time_limit=5)
        except sr.WaitTimeoutError:
            print("Nenhuma fala detectada. Tente novamente.")
            return None

    print("Processando...\n")
    try:
        # Reconhece a fala usando o Google Web Speech API
        text = r.recognize_google(audio, language='pt-BR')
        print(f"Você disse: {text}")
        return text
    except sr.UnknownValueError:
        print("Desculpe, não consegui entender o áudio.")
        return None
    except sr.RequestError as e:
        print(f"Erro no serviço de reconhecimento de fala; {e}")
        return None

### **3. Teste da Função**

Agora, execute a função e veja o resultado. Certifique-se de que seu navegador tenha permissão para usar o microfone.

In [None]:
recognized_text = listen_and_recognize()
if recognized_text:
    print("\nReconhecimento concluído.")

### **Conclusão**

Este é o primeiro passo para o seu assistente virtual. O texto retornado pela função `listen_and_recognize()` pode ser usado para tomar decisões e acionar outras funções, como pesquisar na Wikipedia ou abrir um vídeo no YouTube, conforme visto no arquivo `src/main.py`.