
---

# Assistente Virtual M√©dico com Whisper, LLaMA 3.1 e gTTS

Este projeto √© um assistente virtual m√©dico que utiliza tecnologias de ponta para capturar √°udio, transcrever perguntas, gerar respostas usando um modelo de linguagem (LLaMA 3.1) e sintetizar a resposta em voz. O sistema √© projetado para ser executado localmente, utilizando Python 3.12 e o modelo LLaMA 3.1 8B instalado na sua m√°quina.

---

## Funcionalidades

- **Captura de √Åudio em Tempo Real**: Captura √°udio do microfone usando a biblioteca `sounddevice`.
- **Transcri√ß√£o de √Åudio**: Utiliza o modelo **Whisper tiny** da OpenAI para transcrever o √°udio em texto.
- **Gera√ß√£o de Respostas**: Usa o modelo **LLaMA 3.1** (ou outro modelo menor) via **Ollama** para gerar respostas contextualizadas.
- **S√≠ntese de Fala**: Converte a resposta gerada em voz usando a biblioteca **gTTS**.
- **Loop de Intera√ß√£o Cont√≠nua**: O sistema funciona em um loop cont√≠nuo, permitindo intera√ß√µes sucessivas.

---

## Requisitos

- **Python 3.12**
- **Modelo LLaMA 3.1 8B** instalado localmente via Ollama.
- Depend√™ncias Python listadas no arquivo `requirements.txt`.

---

## Instala√ß√£o

1. **Clone o reposit√≥rio**:
   ```bash
   git clone https://github.com/seu-usuario/assistente-virtual-medico.git
   cd assistente-virtual-medico
   ```

2. **Crie um ambiente virtual** (opcional, mas recomendado):
   ```bash
   python -m venv .venv
   source .venv/bin/activate  # Linux/macOS
   .venv\Scripts\activate     # Windows
   ```

3. **Instale as depend√™ncias**:
   ```bash
   pip install -r requirements.txt
   ```

4. **Baixe o modelo Whisper tiny** (ser√° baixado automaticamente na primeira execu√ß√£o).

5. **Instale o modelo LLaMA 3.1 via Ollama**:
   ```bash
   ollama pull llama3
   ```

6. **Instale o `mpg321`** (para reprodu√ß√£o de √°udio no Linux):
   ```bash
   sudo apt install mpg321
   ```

   No Windows, voc√™ pode usar outro player de √°udio compat√≠vel com a linha de comando.

---

## Como Executar

1. **Execute o script**:
   ```bash
   python main.py
   ```

2. **Interaja com o assistente**:
   - Fale ao microfone ap√≥s o prompt "üéô Capturando √°udio...".
   - O assistente transcrever√° sua pergunta, gerar√° uma resposta e a reproduzir√° em voz alta.

3. **Para interromper o programa**, pressione `Ctrl+C`.

---

## Estrutura do C√≥digo

- **capturar_audio**: Captura √°udio do microfone.
- **transcrever_audio**: Transcreve o √°udio em texto usando Whisper.
- **gerar_resposta**: Gera uma resposta usando o modelo LLaMA 3.1 via Ollama.
- **falar_texto**: Converte a resposta em voz usando gTTS.
- **Loop principal**: Gerencia a intera√ß√£o cont√≠nua com o usu√°rio.

---

## Depend√™ncias

- **sounddevice**: Para captura de √°udio.
- **whisper**: Para transcri√ß√£o de √°udio.
- **gTTS**: Para s√≠ntese de fala.
- **ollama**: Para intera√ß√£o com o modelo LLaMA 3.1.
- **numpy**: Para manipula√ß√£o de √°udio.

---

## Observa√ß√µes

- **Mem√≥ria RAM**: O modelo LLaMA 3.1 8B requer pelo menos 6-8 GB de RAM. Se o seu sistema tiver menos mem√≥ria, considere usar um modelo menor, como `llama2-7b` ou `llama3-7b`.
- **Whisper Tiny**: O modelo `tiny` foi escolhido para reduzir o uso de mem√≥ria. Para maior precis√£o, voc√™ pode usar `base` ou `small`, mas isso exigir√° mais recursos.

---

## Licen√ßa

Este projeto √© licenciado sob a [MIT License](LICENSE).

---
