GitHub - Ikaros-G/video-subtitle-generator: 视频音频转字幕，生成srt文件。无需申请第三方API，本地实现音频转文本。基于Transformer的视频字幕生成框架，包含字幕生成、字幕翻译。A tool for generating subtitle from videos and generating srt files.

项目介绍

Video-subtitle-generator (vsg) 是一款将视频中的语音提取为外挂字幕文件(srt格式)的软件。

支持中文、英文、韩文、日文、越南语、俄语、西班牙语、葡萄语等语言的字幕生成
large 模型错词率（WER）如下：

DEMO

源码使用说明

运行要求：需要Nvidia GPU显卡（显存大于1G可使用base模型，大于5G可使用medium模型，大于10G可使用large模型）

1. 下载安装Miniconda

Windows: Miniconda3-py38_4.11.0-Windows-x86_64.exe
MacOS：Miniconda3-py38_4.11.0-MacOSX-x86_64.pkg
Linux: Miniconda3-py38_4.11.0-Linux-x86_64.sh

2. 创建并激活虚机环境

（1）切换到源码所在目录：

cd <源码所在目录>

例如：如果你的源代码放在D盘的tools文件下，并且源代码的文件夹名为video-subtitle-generator，就输入 cd D:/tools/video-subtitle-generator-main

（2）创建激活conda环境

conda create -n vsgEnv python=3.8

conda activate vsgEnv

3. 安装依赖文件

请确保你已经安装 python 3.8+，使用conda创建项目虚拟环境并激活环境 (建议创建虚拟环境运行，以免后续出现问题)

安装依赖：

pip install -r requirements.txt

4. 运行程序

运行命令行版本(CLI)

python backend/main.py

代码调用：

    # 1.指定音视频文件路径
    wav_path = './test/test.flv'
    # 2. 新建字幕提取器
    sg = SubtitleGenerator(wav_path)
    # 3. 运行字幕生成
    ret = sg.run()

5. 程序配置

设置模型文件

修改settings.ini中的Mode，取值为：base, medium, large，即可使用对应的识别模型

Mode	要求显存	速度
base	大于1 GB	~16x
medium	大于5 GB	~2x
large	大于10 GB	1x

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
backend		backend
design		design
test		test
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

项目介绍

DEMO

源码使用说明

1. 下载安装Miniconda

2. 创建并激活虚机环境

3. 安装依赖文件

4. 运行程序

5. 程序配置

About

Releases

Packages

Languages

License

Ikaros-G/video-subtitle-generator

Folders and files

Latest commit

History

Repository files navigation

项目介绍

DEMO

源码使用说明

1. 下载安装Miniconda

2. 创建并激活虚机环境

3. 安装依赖文件

4. 运行程序

5. 程序配置

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages