<a href="https://colab.research.google.com/github/ailab-nda/ML/blob/main/Demucs_demo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Demucs による音源分離

論文<br>
https://arxiv.org/abs/2111.03600<br>
<br>
GitHub<br>
https://github.com/facebookresearch/demucs<br>
<br>

# ランタイムの設定
「ランタイム」→「ランタイムのタイプを変更」→「ハードウェアアクセラレータ」をGPUに変更

# 実行方法
「ランタイム」→「すべてのセルを実行」を選択

# 環境セットアップ

In [None]:
!nvidia-smi

## GithubからCode clone

In [None]:
%cd /content

## ライブラリのインストール

In [None]:
!pip install demucs
!pip install yt-dlp moviepy
!pip install imageio==2.4.1

## ライブラリのインポート

In [None]:
from yt_dlp import YoutubeDL

from moviepy.video.fx.resize import resize
from moviepy.editor import VideoFileClip, AudioFileClip, ImageSequenceClip, CompositeAudioClip
from moviepy.video.io.ffmpeg_tools import ffmpeg_extract_subclip
import IPython.display as ipd

# テスト動画のセットアップ

In [None]:
video_url = 'https://www.youtube.com/watch?v=D6DVTLvOupE' #@param {type:"string"}

#@markdown 動画の切り抜き範囲(秒)を指定してください。\
#@markdown 30秒以上の場合OOM発生の可能性が高いため注意
start_sec =  0#@param {type:"integer"}
end_sec =  30#@param {type:"integer"}

(start_pt, end_pt) = (start_sec, end_sec)

## ダウンロード

In [None]:
!mkdir -p /content/videos /content/audios

download_resolution = 360
full_video_path = '/content/videos/full_video.mp4'
input_clip_path = '/content/videos/input_clip.mp4'
input_audio_path = '/content/audios/input_clip.wav'

# 動画ダウンロード
ydl_opts = {'format': f'best[height<={download_resolution}]', 'overwrites': True, 'outtmpl': full_video_path}
with YoutubeDL(ydl_opts) as ydl:
    ydl.download([video_url])

## clip

In [None]:
# 指定区間切り抜き
with VideoFileClip(full_video_path) as video:
    subclip = video.subclip(start_pt, end_pt)
    subclip.write_videofile(input_clip_path)

## 音声ファイル保存

In [None]:
# 音声抽出
clip = VideoFileClip(input_clip_path)
clip.audio.write_audiofile(input_audio_path, codec='pcm_s16le')

ipd.Audio(input_audio_path, rate=44100)

# 音源分離

In [None]:
#!python3 -m demucs --two-stems=vocals {input_audio_path}
!python3 -m demucs {input_audio_path}

## パートごとの再生

### ヴォーカル

In [None]:
vocal_wav = '/content/separated/htdemucs/input_clip/vocals.wav'
ipd.Audio(vocal_wav, rate=44100)

### ドラム

In [None]:
drums_wav = '/content/separated/htdemucs/input_clip/drums.wav'
ipd.Audio(drums_wav, rate=44100)

### ベース

In [None]:
bass_wav = '/content/separated/htdemucs/input_clip/bass.wav'
ipd.Audio(bass_wav, rate=44100)

### その他

In [None]:
other_wav = '/content/separated/htdemucs/input_clip/other.wav'
ipd.Audio(other_wav, rate=44100)

## ボーカルのみの動画を作成

In [None]:
vocal_video = '/content/vocal.mp4'

videoclip = VideoFileClip(input_clip_path)
audioclip = AudioFileClip(vocal_wav)

new_audioclip = CompositeAudioClip([audioclip])
videoclip.audio = new_audioclip
videoclip.write_videofile(vocal_video)

In [None]:
clip = VideoFileClip(vocal_video)

clip = resize(clip, height=420)
clip.ipython_display()