使用 Faster-whisper 模拟实时语音转写

使用方法

1. 拆分服务端与客户端

适合 GPU 在云端的场景。

服务端

负责接收客户端发送的音频数据，进行语音识别，然后把识别结果返回给客户端。

git clone https://github.com/ultrasev/stream-whisper
apt -y install libcublas11
cd stream-whisper
pip3 install -r requirements.txt

注：

libcublas11 是 NVIDIA CUDA Toolkit 的依赖，如果需要使用 CUDA Toolkit，需要安装。
经 @muzian666 提示，aioredis 包目前仍然不支持 Python3.11，Python 版本建议 3.8 ~ 3.10

把 .env 文件中的 REDIS_SERVER 改成自己的 Redis 地址，然后运行 python3 -m src.server，服务端就启动了。第一次执行时，会从 huggingface 上下载语音识别模型，需要等待一段时间。Huggingface 已经被防火墙特别对待了，下载速度很慢，建议使用代理。

客户端

负责录音，然后把音频数据发送给服务端，接收服务端返回的识别结果。

git clone https://github.com/ultrasev/stream-whisper
apt -y install portaudio19-dev
cd stream-whisper
pip3 install -r requirements.txt

注：

portaudio19-dev 是 pyaudio 的依赖，如果系统已安装，可以忽略。

同样需要把 .env 文件中的 REDIS_SERVER 改成自己的 Redis 地址，在本地机器上运行 python3 -m src.client，客户端就启动了。运行前先测试一下麦克风是否正常工作，确认能够正常录音。

2. 本地直接运行

如果本地有 GPU，可以直接运行 src/local_deploy.py，这样就可以在本地直接运行服务端和客户端了。

git clone https://github.com/ultrasev/stream-whisper
apt -y install portaudio19-dev  libcublas11
python3 src/local_deploy.py

Docker 一键部署自己的 whisper 转写服务

docker run -d --name whisper \
    -e MODEL
    -p 8000:8000 ghcr.io/ultrasev/whisper

接口兼容 OpenAI 的 API 规范，可以直接使用 OpenAI 的 SDK 进行调用。

from openai import OpenAI
client = OpenAI(base_url="http://localhost:8000")

audio_file= open("/path/to/file/audio.mp3", "rb")
transcription = client.audio.transcriptions.create(
  model="whisper-1",
  file=audio_file
)
print(transcription.text)

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
.github/workflows		.github/workflows
assets		assets
docs		docs
scripts		scripts
src		src
Dockerfile		Dockerfile
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

使用 Faster-whisper 模拟实时语音转写

使用方法

1. 拆分服务端与客户端

服务端

客户端

2. 本地直接运行

Docker 一键部署自己的 whisper 转写服务

About

Releases

Packages

Contributors 2

Languages

ultrasev/stream-whisper

Folders and files

Latest commit

History

Repository files navigation

使用 Faster-whisper 模拟实时语音转写

使用方法

1. 拆分服务端与客户端

服务端

客户端

2. 本地直接运行

Docker 一键部署自己的 whisper 转写服务

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages