Skip to content

v2.0.0 Rel “永远进步,永远开源”更新

Choose a tag to compare

@MurthiNext MurthiNext released this 31 Mar 06:35
· 76 commits to main since this release

是的,2.0.0!在此感谢每一位为开源作出贡献的开发者与支持者!♪

  • 这一次更新相当于给底层代码来了次彻彻底底的大换血。
  • 语音识别库由Faster Whisper转向Stable Whisper。
  • 语音识别模型仍然使用Faster Whisper CTranslate2格式模型。
  • 整体识别精度再上一个台阶!(也许吧,我这边测试样本不多。)

AMD显卡支持!☆

  • 通过使用特定版本的Python与PyTorch,ScriptDirector现已支持AMD显卡,请下载专属客户端。
    • Q: 为毛ROCm版本体积是CUDA版本的四倍?
    • A: 因为ROCm有四种写法——开玩笑的,是因为我在其中封装了ROCm SDK,类似于一个中间层前置,所以才把体积撑的这么大。
  • 如果有需要,请转到“rocm-version”频道查看AMD专属自述文件。
  • 理论上讲,现在ScriptDirector可以使用ROCm运行CTranslate2了,但……我也不确定。
  • 如果你愿意为此项目作出贡献,请帮我试着在有AMD显卡的电脑上部署源代码并调试。
  • 任何错误日志与发现都是有用的!请积极汇报!我会尽量支持AMD的!(CUDA太好用了你们知道吗)

“只对齐”功能加入!

  • 现在,你可以通过输入一份台本文件与一份字幕文件来运行只对齐功能,如下。
  • .\cli.exe process "script.txt,subtitles.srt" -t lrc -n output
  • GUI则可以输入“台本文件”与“已有字幕”来自动选择只对齐功能。
  • 但请注意:只对齐模式下无法使用短句模式。
  • Issue #1 完成!

一些小更新~

  • 优化了日志处理与进度条计算方式。
    • 现在ScriptDirector处理完成后,会在日志输出具体对齐信息(只能看个大概就是了)。
  • 优化了项目结构。
  • 精简部分冗余代码。

MurthiNext今天也很可爱!♡