Skip to content

動作環境と設定例

SATOH Kiyoshi edited this page Apr 20, 2023 · 10 revisions

設定ファイルの設定例です。

Client 設定

AMD A10-9700 Radeon R7

v0.3.2
Vega 8 Graphicと同じ設定でぎりぎりリアルタイム変換が追いつくが動画配信などと組み合わせて使うのはきつい。

"vc_conf": {
    "delay_flames": 16384,
    "overlap": 0,
    "dispose_stft_specs": 0,
    "dispose_conv1d_specs": 0,
    "onnx": {
      "use_onnx": true,
      "onnx_providers": ["DmlExecutionProvider", "CPUExecutionProvider"]
    }
}

AMD Radeon Vega 8 Graphic

v0.3.1
AMD Ryzen 5 3500U with Radeon Vega Mobile Gfx
delay_flames等のパラメータを変更してこの設定でぎりぎりリアルタイム変換が追いつくようになった。

"vc_conf": {
    "delay_flames": 16384,
    "overlap": 0,
    "dispose_stft_specs": 0,
    "dispose_conv1d_specs": 0,
    "onnx": {
      "use_onnx": true,
      "onnx_providers": ["DmlExecutionProvider", "CPUExecutionProvider"]
    }
}

GeForce GTX750Ti

v0.3.1
GTX1660Sメインで、GTX750Tiをリアルタイム変換用に設定して動作確認し、重いゲームの動作中でも正常に変換が行えることを確認。
GPUの使用率は無音状態で1.2%、変換動作中でも2.0%を超えることはありませんでした。
conf/myprofile.conf

"vc_conf": {
    "frame_length":8192,
    "delay_flames":4096,
    "overlap":1024,
    "dispose_stft_specs":2,
    "dispose_conv1d_specs":10,
    "source_id":107,
    "target_id":108,
    "onnx": {
      "use_onnx": true,
      "onnx_providers": ["DmlExecutionProvider"]
    }
  },

Intel i7-1195G7(Tigerlake) IrisXe96EU

v0.3.1
Windows11 22H2 ドライバは31.0.101.4032
DirectML:30~50秒待つと変換が始まるものの1秒おきくらいに音が出たり消えたりする
CPU:使用率100%張り付きなものの初期設定のままでも変換はできる
conf/myprofile.conf

"vc_conf": {
    "frame_length": 8192,
    "delay_flames": 4096,
    "overlap": 1024,
    "dispose_stft_specs": 2,
    "dispose_conv1d_specs": 10,
    "onnx": {
      "use_onnx": true,
      "onnx_providers": ["DmlExecutionProvider", "CPUExecutionProvider"]
    }
}

Intel i5-1240P Xe Graphics

v0.3.1
GPU使用率は40%前後。遅延は1秒弱。
conf/myprofile.conf

"vc_conf": {
    "frame_length": 8192,
    "delay_flames": 8192,
    "overlap": 256,
    "dispose_stft_specs": 2,
    "dispose_conv1d_specs": 0,
    "onnx": {
      "use_onnx": true,
      "onnx_providers": ["DmlExecutionProvider", "CPUExecutionProvider"]
    }
}

Radeon RX5700XT

v0.3.1
ゲームしながらの変換設定例
conf/myprofile.conf

"vc_conf": {
    "frame_length": 16384,
    "delay_flames": 8192,
    "overlap": 2048,
    "dispose_stft_specs": 2,
    "dispose_conv1d_specs": 10,
    "onnx": {
      "use_onnx": true,
      "onnx_providers": ["DmlExecutionProvider", "CPUExecutionProvider"]
    }
}

同じ音声を変換して品質を確認する

ファイルから変換を行ってファイルに出力することで、同じ音声を変換して比較することが出来ます。
リアルタイム変換時と同じ処理を行うため、リアルタイム変換での音質の劣化も確認できます。
詳しくは設定ファイル説明#リアルタイム音声変更の設定してください。
conf/myprofile.conf

"others": {
  "input_filename": ".\\wav\\test_sample.wav",
  "output_filename": ".\\output\\test_output.wav",
}

"vc_conf": {
  "source_id":1,
  "target_id":100
}

ここではwavフォルダの「test_sample.wav」ファイルを、変換元の声IDを「1」、変換先の声IDを「100」として変換して、outputフォルダの「test_output.wav」に出力します。

Trainer 設定

configs/train_config.json

Colab

バッチファイルサイズ例など

RTX3090

バッチファイルサイズ例など

低負荷用学習設定

CPUなど低負荷で使用するための学習設定例