transcriber é uma biblioteca TypeScript que encapsula a CLI do whisper.cpp para permitir transcrição de fala para texto localmente a partir do Node.js.
- Um binário
whisper.cppcompilado embin/whisper(oubin/whisper.exeno Windows) - Um arquivo de modelo como
ggml-base.binemmodels/ggml-base.bin
Você pode baixar modelos dos releases oficiais do whisper.cpp ou compilá-los seguindo as instruções no repositório upstream.
import { transcribe } from "transcriber";
const result = await transcribe({
file: "audio.wav",
language: "pt",
});
console.log(result.text);modelPath: Substitui o caminho do arquivo de modelo. Padrão:models/ggml-base.binthreads: Define o número de threads de CPU para usar com owhisper.cpptranslate: Quando true, owhisper.cpptraduzirá a fala para inglês
checkWhisperBinary()verifica se o binário existe e retorna o caminho resolvidocheckModel()verifica se o modelo existe e retorna o caminho resolvido
Esta biblioteca apenas orquestra a CLI do whisper.cpp e não reimplementa nenhuma inferência do Whisper.