Chenyme-AAVT V0.6.5

AI Auto Video(Audio) Translation

群聊二维码	说明
	本人是一位普通的大学生，而且最近时间比较紧可能不会及时看issues，还请多多担待。而且由于个人技术水平，项目的很多地方还不尽人意，欢迎各位大佬和家人们加入群聊互相学习交流，一起完善这个项目，感谢支持！

Note ：字幕翻译的错位问题会逐步优化。由于开始准备考研，更新速度可能会放缓，感谢理解~~~

非常感谢您来到我的 AI Auto Video-Audio Translation 项目！该项目旨在提供一个简单易用的全自动视频（音频）识别、翻译工具，帮助您快速识别声音并翻译生成字幕文件，然后将翻译后的字幕与原视频合并，以便您更快速的实现视频翻译。

Tips：推荐选用 Faster-whisper 和 Large 模型以获得最好的断句、识别体验。

注意： 首次使用 Whisper 模型时需下载，国内建议开启 VPN 下载。启用 GPU 加速需下载 CUDA 和 PyTorch，且保证PyTorch 版本与 CUDA 匹配，否则程序识别失败会默认禁用GPU加速。

给一颗免费的星鼓励一下叭~感谢!!!

测试效果点击下载

项目亮点

支持 faster-whisper 后端。

支持 GPU 加速。

支持 VAD 辅助识别。

支持 ChatGPT、KIMI 翻译。

支持多种语言识别、翻译。

支持多种字幕格式输出。

支持字幕修改，二次精翻。

支持字幕、视频预览。

支持AI总结、问答。

如何安装

更快速的安装（省去下载FFmpeg）

见releases

正常安装

本项目需要依赖 Python 环境和 FFmpeg,可能会用到 CUDA 和 PyTorch 。

安装 Python 环境

您需要安装 Python 3.8 或更高版本。
您可以从 Python官网下载并安装最新版本的 Python。

安装 FFmpeg

您需要安装 FFmpeg。
您可以从 FFmpeg官网下载并安装 FFmpeg。

设置 FFmpeg 为环境变量

按下 Win+R 快捷键打开运行对话框。
在弹出的框中输入 rundll32 sysdm.cpl,EditEnvironmentVariables，然后点击确定。
在上面的用户变量中找到 Path，双击。
点击新建，输入刚刚下载的 FFmpeg 的路径。示例：D:\APP\ffmpeg（请根据自己的实际路径调整！）。

运行 install.bat

在项目根目录下运行 install.bat 来安装所有依赖库。

Note ：项目默认的Pytorch为CPU版本，若要使用GPU，请下载 CUDA（必须12）并从 PyTorch官网下载对应版本的Pytorch

如何使用

设置参数

在config内设置 OPENAI_API_KEY、OPENAI_BASE_URL、KIMI_API_KEY，以便使用翻译引擎。
您也可以在网页中设置各项参数，目前版本已经可以自动保存到config中，无需重新设置。

运行程序

运行 webui.bat
等待网页跳转，如果没有跳转请自行在浏览器输入http://localhost:8501/
首次使用streamlit，可能会要求输入email，直接Enter跳过即可。
上传文件，设置模型，运行程序，耐心等待处理

注意事项

请确保您的系统已经正确安装了 Python，并且版本号为 3.8 或更高。
请确保已经安装了 FFmpeg，并设置 FFmpeg 为环境变量。
请确保运行 install.bat，安装所有依赖库。
使用 GPU 加速时请确保安装了正确的 CUDA 和 Pytorch 版本
推荐使用 faster-whisper 和 Large 模型，以获得最好的断句体验，但模型需要从 Huggingface 下载。

TODO

识别相关

翻译相关

ChatGPT翻译优化*
更多的语种翻译
更多的翻译模型
更多的翻译引擎

字幕相关

其他

注：含`*`的功能还不稳定，可能存在某些BUG。

特别鸣谢

本人是 AI 时代的受益者，本项目的开发基本是站在巨人的肩膀上实现的。主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕，利用 Streamlit 搭建快速使用的 WebUI 界面，以及 FFmpeg 来实现字幕与视频的合并。

Name		Name	Last commit message	Last commit date
Latest commit History 106 Commits
config		config
models		models
pages		pages
public		public
utils		utils
1_install.bat		1_install.bat
2_webui.bat		2_webui.bat
AAVT-HomePage.py		AAVT-HomePage.py
LICENSE		LICENSE
README-EN.md		README-EN.md
README.md		README.md

License

Chenyme/Chenyme-AAVT

Folders and files

Latest commit

History

Repository files navigation

Chenyme-AAVT V0.6.5

Note ：字幕翻译的错位问题会逐步优化。由于开始准备考研，更新速度可能会放缓，感谢理解~~~

给一颗免费的星鼓励一下叭~感谢!!!

项目亮点

如何安装

更快速的安装（省去下载FFmpeg）

正常安装

Note ：项目默认的Pytorch为CPU版本，若要使用GPU，请下载 CUDA（必须12） 并从 PyTorch官网 下载对应版本的Pytorch

最新版本仅支持 CUDA 12。对于 CUDA 11，当前的解决方法是降级。pip install --force-reinsall ctranslate2==3.24

如何使用

注意事项

TODO

识别相关

翻译相关

字幕相关

其他

注：含*的功能还不稳定，可能存在某些BUG。

特别鸣谢

非常感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper、kimi 等开发人员！

如有问题和建议，随时联系我!

项目界面截图

主页面

设置

日志

音频

视频

视频生成

视频二次修改

About

Topics

Resources

License

Stars

Watchers

Forks

Languages

Note ：项目默认的Pytorch为CPU版本，若要使用GPU，请下载 CUDA（必须12）并从 PyTorch官网下载对应版本的Pytorch

注：含`*`的功能还不稳定，可能存在某些BUG。