Speech Enhancement

Speech Enhancement 是一个基于深度学习模型的语音降噪和去混响工具。

安装

你可以通过浏览器访问主机的端口，即可使用该服务。

我们的处理链默认音频格式为采样率44100Hz,采样深度16bit的wav文件，如果你的文件不是这个格式会进行转码操作，从而会增加一定的处理时间。

最终完成的文件将是一个wav文件，所以文件会比原文件大很多。以mp3为例，如果原文件大小为10M，那么处理后的文件大小将会是50M左右。

在 4 核 8 线程的 CPU 上，处理 40 分钟的音频文件，耗时在5分钟左右。

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.github/workflows		.github/workflows
dist		dist
docs/img		docs/img
media_info		media_info
meta		meta
process		process
templates		templates
tests		tests
upload		upload
uploads		uploads
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
go.mod		go.mod
go.sum		go.sum
main.go		main.go