
---

# Assistente Virtual Médico com Whisper, LLaMA 3.1 e gTTS

Este projeto é um assistente virtual médico que utiliza tecnologias de ponta para capturar áudio, transcrever perguntas, gerar respostas usando um modelo de linguagem (LLaMA 3.1) e sintetizar a resposta em voz. O sistema é projetado para ser executado localmente, utilizando Python 3.12 e o modelo LLaMA 3.1 8B instalado na sua máquina.

---

## Funcionalidades

- **Captura de Áudio em Tempo Real**: Captura áudio do microfone usando a biblioteca `sounddevice`.
- **Transcrição de Áudio**: Utiliza o modelo **Whisper tiny** da OpenAI para transcrever o áudio em texto.
- **Geração de Respostas**: Usa o modelo **LLaMA 3.1** (ou outro modelo menor) via **Ollama** para gerar respostas contextualizadas.
- **Síntese de Fala**: Converte a resposta gerada em voz usando a biblioteca **gTTS**.
- **Loop de Interação Contínua**: O sistema funciona em um loop contínuo, permitindo interações sucessivas.

---

## Requisitos

- **Python 3.12**
- **Modelo LLaMA 3.1 8B** instalado localmente via Ollama.
- Dependências Python listadas no arquivo `requirements.txt`.

---

## Instalação

1. **Clone o repositório**:
   ```bash
   git clone https://github.com/seu-usuario/assistente-virtual-medico.git
   cd assistente-virtual-medico
   ```

2. **Crie um ambiente virtual** (opcional, mas recomendado):
   ```bash
   python -m venv .venv
   source .venv/bin/activate  # Linux/macOS
   .venv\Scripts\activate     # Windows
   ```

3. **Instale as dependências**:
   ```bash
   pip install -r requirements.txt
   ```

4. **Baixe o modelo Whisper tiny** (será baixado automaticamente na primeira execução).

5. **Instale o modelo LLaMA 3.1 via Ollama**:
   ```bash
   ollama pull llama3
   ```

6. **Instale o `mpg321`** (para reprodução de áudio no Linux):
   ```bash
   sudo apt install mpg321
   ```

   No Windows, você pode usar outro player de áudio compatível com a linha de comando.

---

## Como Executar

1. **Execute o script**:
   ```bash
   python main.py
   ```

2. **Interaja com o assistente**:
   - Fale ao microfone após o prompt "🎙 Capturando áudio...".
   - O assistente transcreverá sua pergunta, gerará uma resposta e a reproduzirá em voz alta.

3. **Para interromper o programa**, pressione `Ctrl+C`.

---

## Estrutura do Código

- **capturar_audio**: Captura áudio do microfone.
- **transcrever_audio**: Transcreve o áudio em texto usando Whisper.
- **gerar_resposta**: Gera uma resposta usando o modelo LLaMA 3.1 via Ollama.
- **falar_texto**: Converte a resposta em voz usando gTTS.
- **Loop principal**: Gerencia a interação contínua com o usuário.

---

## Dependências

- **sounddevice**: Para captura de áudio.
- **whisper**: Para transcrição de áudio.
- **gTTS**: Para síntese de fala.
- **ollama**: Para interação com o modelo LLaMA 3.1.
- **numpy**: Para manipulação de áudio.

---

## Observações

- **Memória RAM**: O modelo LLaMA 3.1 8B requer pelo menos 6-8 GB de RAM. Se o seu sistema tiver menos memória, considere usar um modelo menor, como `llama2-7b` ou `llama3-7b`.
- **Whisper Tiny**: O modelo `tiny` foi escolhido para reduzir o uso de memória. Para maior precisão, você pode usar `base` ou `small`, mas isso exigirá mais recursos.

---

## Licença

Este projeto é licenciado sob a [MIT License](LICENSE).

---
