Skip to content

download all models-下载所有语音识别模型

Compare
Choose a tag to compare
@jianchang512 jianchang512 released this 28 Dec 16:34
· 65 commits to main since this release

faster-whisper 模型下载,适用于 stt 项目 和 “pyvideotrans视频翻译配音”项目的faster模型模式使用,openai模型请往下拉

image

tiny 64MB
tiny.en 64MB

base 124MB
base.en 124MB

small 415MB
small 百度网盘
small.en 415MB

medium 1.27G
medium.en 1.27G

large-v1 百度网盘
large-v1 huggingface

large-v2 huggingface
large-v2 百度网盘

large-v3 huggingface
large-v3 百度网盘

distil-whisper-small.en 282MB

distil-whisper-medium.en 671MB
distil-medium百度网盘

distil-whisper-large-v2 1.27G
distil-large-v2 百度网盘

distil-whisper-large-v3 1.3G
distil-whisper-large-v3百度网盘

下载后解压,将压缩包内的"models--Systran--faster-xx"文件夹复制到models目录内,解压复制后 models 目录下文件夹列表如下

压缩包内容

image

正确放置后的 models 目录下的文件夹列表

image




openai-whisper模型下载,仅适用于“pyvideotrans视频翻译配音软件”的 openai模型 下载使用

image

下载后将pt文件放到软件目录下的models文件夹内
image

tiny.pt模型
tiny.en.pt模型

base.pt模型
base.en.pt模型

small.pt模型

small.en.pt模型

medium.pt模型

medium.en.pt模型

large-v1.pt模型

large-v2.pt模型

large-v3.pt模型

image



cuBLASxx.dll和cudnn下载

如果遇到 "cublasxxx.dll不存在"或启用cuda加速后闪退问题,请下载该文件,然后将里面的dll文件复制到 C:/Windows/System32 目录下 或者 软件根目录下即exe所在目录下

任意文件夹地址栏输入cmd打开黑窗口,输入命令nvcc -V查看当前CUDA版本

CUDA11.x版本点击此处下载 https://github.com/jianchang512/stt/releases/download/0.0/cuBLAS.and.cuDNN_CUDA11_win_v4.7z

CUDA12.x版本点击此处下载 https://github.com/jianchang512/stt/releases/download/0.0/cuBLAS.and.cuDNN_CUDA12_win_v1.7z



uvr5模型下载

点击下载uvr5模型

下载后解压,得到一个 uvr5_weights 文件夹,将该文件夹复制到视频翻译配音软件根目录下。