# 使用 ICASSP2022 论文随附源代码 + Google Colab 在线扒人声谱
## 综述
这个笔记本通过 Google Colab 平台使用论文 *Pseudo-Label Transfer from Frame-level to Note-level in a Teacher-student Framework for Singing Transcription from Polyphonic Music*, ICASSP2022, Singapore <[链接](https://ieeexplore.ieee.org/document/9747147)> 随附的源代码，以论文中提到的新型人工智能技术将人声音频转换成 MIDI 谱，方便进一步调整后导入到歌声合成软件中做调音。由于所有操作均在 Colab 提供的免费 T4 GPU 远程资源上完成，只要你的个人计算机可以使用支持现代前端技术的浏览器，并且有条件绕过防火长城注册/登录谷歌账号和正常使用谷歌服务，就可以享受这一新技术带来的便利。

## 格式
- 输入格式（上传人声音频的文件格式）：`.mp3` 或 `.wav`
- 输出格式：`.mid`

## 笔记本基本信息
- 灵感来源：https://www.vsqx.top/article/an40
- 原始项目来源：https://github.com/keums/icassp2022-vocal-transcription
- 笔记本原始来源：https://github.com/upright2003/icassp2022-vocal-transcription/blob/main/One_Key_Colab.ipynb
- 更新日期：2024/07/11

## 代码实现


In [None]:
#@title 确认 Python 版本
!python --version

In [None]:
#@title 配置环境和安装依赖
!git clone https://github.com/Diamochang/midi-vocal-transcription
!pip install --upgrade pip
!pip install poetry
%cd /content/midi-vocal-transcription/
!poetry install
!rm -rf /content/midi-vocal-transcription/output/output.txt

In [None]:
#@title 简陋 Web UI 和主程序
%cd /content/midi-vocal-transcription/audio
import os
from google.colab import files
uploaded = files.upload()
file_name = list(uploaded.keys())[0]
print(file_name)

basename = os.path.splitext(os.path.basename(file_name))[0]
print('File basename: ' + basename)

!poetry run python /content/midi-vocal-transcription/src/singing_transcription.py -i "../audio/{file_name}" -o ../output -ot fps
#@markdown 在下面的框中输入 BPM 曲速，可至 [Tunebat](https://tunebat.com/Analyzer) 或 [Songbpm](https://songbpm.com/) 网站、MixMeister BPM Analyzer 或 WaveTone 等软件查询。
bpm = "94" #@param {type:"string"}
#@markdown 点击“代码执行程序”下的“全部运行"，待运行至本单元格且下面的输出中出现上传按钮时，点击该按钮上传人声音频。如果歌曲没有现成的人声音频，可用[在线工具](https://vocalremover.org/)进行生成，依需要编辑后即可上传。

#@markdown 选择文件并上传后，等待即可。完成后会自动下载打包好的 MIDI 谱。
!poetry run python /content/midi-vocal-transcription/src/txt2csv.py -bpm {bpm} "../output/{basename}.txt"
#更改 txr2midi 文件名称
%cd /content/midi-vocal-transcription/output/results/midi
!mv {basename}.mid  {basename}_text2midi.mid
%cd /content/midi-vocal-transcription
#压缩并下载
!zip -r midi.zip output
from google.colab import files
files.download("midi.zip")