Skip to content

Releases: oatsu-gh/ENUNU

スタイルシフト用の拡張機能を追加

24 Sep 15:29
Compare
Choose a tag to compare

更新内容

  • USTのフラグ欄に + または - が含まれるときに合成失敗することへの対策機能を追加
  • f0_feedbacker と f0_smoother の標準出力を削減
  • スタイルシフト用の拡張機能 (style_shifter.py) を追加
    • enuconfig の ust_editoracoustic_editor 欄に %e/extensions/style_shifter と記載することで使えるようになります。
    • USTの各ノートのフラグ欄に S5S-4 のように記述すると歌い方が変わります。
      • たとえば S5 とすると半音5つ分だけ高いときの歌い方で歌い、S-4 とすると半音4つ分だけ低いときの歌い方で歌います。
    • 動作仕様
      • フラグに基づいてUST内の各ノートの音程を上下させる → 各種パラメーターをENUNU用モデルで計算する → 最初に下げた分だけ f0 の高さを戻す → WAVを生成する

Full Changelog: v0.5.2...v0.6.0

不具合修正

19 Sep 06:36
Compare
Choose a tag to compare

更新内容

  • 新しめのモデルで動かない不具合( #19 )を修正
    • 同梱のライブラリをバージョンアップ
      • joblib==1.2.0
      • numpy==1.22.4
      • pyyaml==6.0
      • ほか動作に影響なさそうなライブラリ
    • scikit-learn はバージョンアップで不具合が出るので据え置き

Full Changelog: v0.5.1...v0.5.2

不具合修正

11 Aug 07:59
Compare
Choose a tag to compare

更新内容 / What's Changed

  • mgc_postfilter まわりの不具合を修正 / Fix to enable mgc_postfilter and some bug fix by @taroushirani in #17

Full Changelog: v0.5.0...v0.5.1

最新のNNSVS(20220802時点)に対応

05 Aug 14:51
97b197f
Compare
Choose a tag to compare

What's Changed

  • Vibrato model and GAN-based mgc postfilter support. by @taroushirani in #16
    • taroushirani さんのプルリクエストにより、2022年8月2日時点での最新のNNSVSを組み込み、一部の新機能に対応しました。

Full Changelog: v0.4.1...v0.5.0

不具合修正

10 Jul 15:28
Compare
Choose a tag to compare
  • 出力音声がノイズのようになる不具合を修正

最新版のNNSVSに対応

24 Apr 11:14
Compare
Choose a tag to compare

Full Changelog: v0.3.1...v0.4.0

v0.4.0 (2022-04-24)

  • nnsvs を master ブランチの最新版に更新しました。
    • SHA : 4da3adccd42a581b8c69e01d0e15d9e0b4704373
  • f0 ファイルなどを加工できるようにしました。
  • enuconfig.yaml の任意項目から以下の項目を削除しました。
    • extensions
      • timelag_calculator
      • timelag_calculator
      • duration_calculator
      • duration_editor
  • 急激なf0変化を滑らかにする拡張機能を追加しました。
    • enuconofig.yaml の extentions のうち acoustic_editor"%e/extensions/f0_smoother.py" を指定することで利用できます。

不具合修正

30 Mar 13:07
Compare
Choose a tag to compare
  • timing_editor で指定したタイミング補正ツールを使えない不具合を修正

外部ソフト呼び出し機能を追加

27 Mar 07:59
Compare
Choose a tag to compare
  • mgc, bap, f0 ファイルの出力機能をいったん削除しました。
    • 拡張機能として後日復活実装予定です。
  • タイミングや音素を加工するための、拡張機能を呼び出す機能を追加しました。
  • enuconfig.yaml の必須項目から以下の項目を削除しました。
    • trained_for_enunu
  • enuconfig.yaml に任意項目に以下の項目をを追加しました。
    • extensions
      • ust_editor
      • ust_converter
      • score_editor
      • timelag_calculator
      • timelag_calculator
      • duration_calculator
      • duration_editor
      • timing_calculator
      • timing_editor
      • acoustic_calculator
      • acoustic_editor
      • wav_synthesizer
      • wav_editor
  • USTの子音速度を利用する拡張機能を追加しました。
    • enuconofig.yaml の extentions のうち timing_editor"%e/extensions/velocity_applier.py" を指定することで利用できます。
extensions:
    timing_editor: "%e/extensions/velocity_applier.py"

合成時に出力されるUSTファイルを修正

24 Sep 11:27
Compare
Choose a tag to compare

ENUNU 0.2.5 (stable)

ENUNU の更新内容

  • 合成時に出力されるUSTファイルを修正
    • 1ノートごとに長さ15の歌詞なしノートが挿入される不具合を修正

ENUNU-0.2.5+GTD20211022 について

  • ENUNU (Ground Truth Duration) ver. 2021-10-22 の略です。
  • *_timing.lab*_full_score.lab から WAVファイルを生成するプラグインです。
  • ラベル補正ツールを使って発生タイミングを補正した *_timing.lab ファイル を入力すれば、狙ったタイミングで発声してくれます。

ENUNU-0.2.5+GTD20211022 の使い方

  1. UTAUを開いてENUNUモデルをUTAU音源として指定してください。
  2. プラグインとして ENUNU-0.2.5+GTD20211022 を起動してください。
  3. 画面の指示に従って、timing と full_score ファイルを指定してください。
  4. もとの timing ファイルがあったフォルダに新しいフォルダが作成され、その中にWAVファイルが生成されます。

ENUNU-0.2.5+GTD20211022 の開発者向け備考

  • ENUNU v0.2.5 よりあとの2021年10月22日追加のため、ソースコードのzipと食い違いがあることに注意。
  • 同梱の utaupy の label.py が v1.15.1 相当に改造されていることに注意。

出力フォルダの不具合を修正

23 Sep 16:02
Compare
Choose a tag to compare
  • 出力フォルダが適切に設定されない不具合を修正
  • 学習用スクリプトに、音声ファイル点検機能を追加
    • 全ファイルがモノラルであるか確認
    • 全ファイルのサンプリングレートが一致するか確認
    • 全ファイルのビット深度が一致するか確認
  • nnmnkwii でのフルラベル読み取り時の文字コードを UTF-8 に固定
  • CUDA 10 の環境で PyTorch のバージョン選択が適切でない不具合を修正
  • CUDA 11, 10 の環境で自動インストールする PyTorch バージョンを 1.9.0 から 1.9.1 に変更