Skip to content

视频音频转字幕,生成srt文件。无需申请第三方API,本地实现音频转文本。基于Transformer的视频字幕生成框架,包含字幕生成、字幕翻译。A tool for generating subtitle from videos and generating srt files.

License

Notifications You must be signed in to change notification settings

Ikaros-G/video-subtitle-generator

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

项目介绍

Video-subtitle-generator (vsg) 是一款将视频中的语音提取为外挂字幕文件(srt格式)的软件。

  • 支持中文、英文、韩文、日文、越南语、俄语、西班牙语、葡萄语等语言的字幕生成
  • large 模型错词率(WER)如下:

demo

DEMO

demo

源码使用说明

运行要求:需要Nvidia GPU显卡(显存大于1G可使用base模型,大于5G可使用medium模型,大于10G可使用large模型)

1. 下载安装Miniconda

2. 创建并激活虚机环境

(1)切换到源码所在目录:

cd <源码所在目录>

例如:如果你的源代码放在D盘的tools文件下,并且源代码的文件夹名为video-subtitle-generator,就输入 cd D:/tools/video-subtitle-generator-main

(2)创建激活conda环境

conda create -n vsgEnv python=3.8
conda activate vsgEnv

3. 安装依赖文件

请确保你已经安装 python 3.8+,使用conda创建项目虚拟环境并激活环境 (建议创建虚拟环境运行,以免后续出现问题)

安装依赖:

pip install -r requirements.txt

4. 运行程序

  • 运行命令行版本(CLI)
python backend/main.py
  • 代码调用:
    # 1.指定音视频文件路径
    wav_path = './test/test.flv'
    # 2. 新建字幕提取器
    sg = SubtitleGenerator(wav_path)
    # 3. 运行字幕生成
    ret = sg.run()

5. 程序配置

  • 设置模型文件

修改settings.ini中的Mode,取值为:base, medium, large,即可使用对应的识别模型

Mode 要求显存 速度
base 大于1 GB ~16x
medium 大于5 GB ~2x
large 大于10 GB 1x

About

视频音频转字幕,生成srt文件。无需申请第三方API,本地实现音频转文本。基于Transformer的视频字幕生成框架,包含字幕生成、字幕翻译。A tool for generating subtitle from videos and generating srt files.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%