ソング：音量が正しく生成されていないのを修正 #2030

sigprogramming · 2024-04-27T13:14:46Z

内容

~~音量生成時に音域調整の処理（noteのkeyのシフト）が行われて~~、正しく音量が生成されていないのを修正します。
また、歌い方生成直後のscaleGuideVolumeは行う必要はないので、削除します。

スクリーンショット・動画など

VOICEVOX小夜、音域調整-3、声量調整-4
0.18.1→このPRの順です。

default.mp4

その他

たぶんこれで0.18.1以前と同じ声量に戻ったはず

Hiroshiba

ありがとうございます！！

もしかしたらまだロジック異なってるかも…？

ノートシフト→f0生成→volume生成→f0シフト→volumeシフト→合成
だったのが
ノートシフト→f0生成→f0シフト→volume生成→volumeシフト→合成
になってるかもです！！
声が低い龍星くんあたりで試すと顕著かも…？

f0シフトも遅らせればとりあえず合いそうですが…次はキャッシュ周りが大丈夫か不安になってきますね…。

sigprogramming · 2024-04-27T15:13:00Z

@Hiroshiba
なるほどです！！
f0シフトを遅らせるとピッチがノートとずれて表示されてしまうと思います…

違いが発生しているのは音量生成のところなので、
ノートシフト→f0生成→f0シフト→もう一回f0シフト→volume生成→volumeシフト→合成
とするとロジックが合うかもです。

一旦これでやってみます…！

Hiroshiba · 2024-04-27T15:22:50Z

@sigprogramming ありがとうございます！！
（実際手元でやってみたらピッチがずれちゃいました。。）

sigprogramming · 2024-04-27T16:12:38Z

音量生成用にクエリをコピーし、もう一度f0シフトして音量生成する形にしました。
これで同じになったはず……

音声はこんな感じです（音量生成の実装前→このPRの順です）
VOICEVOX青山龍星、音域調整-22、声量調整+2

2.mp4

sigprogramming · 2024-04-28T00:15:38Z

データの流れ（音域調整-3、声量調整-4の場合）を図にしてみました。
（カッコ内の数字は、それが実際にどれくらいシフトされているかを表しています）

flowchart TB

notes1[ノーツ]
notes2[ノーツ（+3）]
notes3[ノーツ（+3）]
guideStyle[歌い方スタイル]
voiceStyle[歌声スタイル]
timing[音素タイミング]
pitch1[ピッチ（+3）]
pitch2[ピッチ]
pitchEditData[ピッチ編集データ]
editedPitch1[ピッチ編集を適用したピッチ]
editedPitch2[ピッチ編集を適用したピッチ（+3）]
volume1[ボリューム]
volume2[ボリューム（-4）]
audio[音声]

keyRange[音域調整]
volumeRange[声量調整]

fetchQuery[/sing_frame_audio_query\]
inferenceVolume[/sing_frame_volume\]
synthesis[/frame_synthesis\]

notes1 ---> notes2
keyRange --> notes2

notes2 --> fetchQuery
guideStyle --> fetchQuery

fetchQuery --> timing

fetchQuery --> pitch1

pitch1 --> pitch2
keyRange --> pitch2

pitch2 --> editedPitch1
pitchEditData --> editedPitch1

editedPitch1 --> editedPitch2
keyRange --> editedPitch2

keyRange --> notes3
notes1 --------> notes3

timing --> inferenceVolume
editedPitch2 --> inferenceVolume
guideStyle --> inferenceVolume
notes3 --> inferenceVolume

inferenceVolume --> volume1

volume1 --> volume2
volumeRange --> volume2

voiceStyle --> synthesis
timing --> synthesis
editedPitch1 --> synthesis
volume2 --> synthesis

synthesis --> audio

Hiroshiba

LGTM！！

ちょっとコードは追いきれてないのですが、実際に試してみて良さそうだったのを確認しました！

図もありがとうございます！！
今singingVoicesとsingingVoiceCachesは同じ型になっていて、どっちがどっちなのか用途が分かりづらい形になってることに気づきました。
このあたりも１行コメントあるとよりわかりやすいかもです！

* 音量生成時に音域調整の処理（noteのkeyのシフト）が行われて正しく音量が生成されていないのを修正 * 音量生成用にクエリをコピーして、もう一度f0シフトして音量生成する形に修正 * コメントを修正

音量生成時に音域調整の処理（noteのkeyのシフト）が行われて正しく音量が生成されていないのを修正

f08206c

sigprogramming requested review from Hiroshiba and y-chan April 27, 2024 13:14

sigprogramming requested a review from a team as a code owner April 27, 2024 13:14

sigprogramming changed the title ~~音量生成時に音域調整の処理（noteのkeyのシフト）が行われているのを修正~~ ソング：音量生成時に音域調整の処理（noteのkeyのシフト）が行われているのを修正 Apr 27, 2024

Hiroshiba reviewed Apr 27, 2024

View reviewed changes

sigprogramming added 2 commits April 28, 2024 00:40

音量生成用にクエリをコピーして、もう一度f0シフトして音量生成する形に修正

b90b70b

コメントを修正

81845af

sigprogramming changed the title ~~ソング：音量生成時に音域調整の処理（noteのkeyのシフト）が行われているのを修正~~ ソング：音量が正しく生成されていないのを修正 Apr 27, 2024

Hiroshiba approved these changes Apr 28, 2024

View reviewed changes

Hiroshiba merged commit be4b896 into VOICEVOX:main Apr 28, 2024
9 checks passed

sigprogramming mentioned this pull request May 5, 2024

ソング：pauが重ならないようにする #2056

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ソング：音量が正しく生成されていないのを修正 #2030

ソング：音量が正しく生成されていないのを修正 #2030

sigprogramming commented Apr 27, 2024 •

edited

Hiroshiba left a comment

sigprogramming commented Apr 27, 2024

Hiroshiba commented Apr 27, 2024

sigprogramming commented Apr 27, 2024

sigprogramming commented Apr 28, 2024 •

edited

Hiroshiba left a comment

ソング：音量が正しく生成されていないのを修正 #2030

ソング：音量が正しく生成されていないのを修正 #2030

Conversation

sigprogramming commented Apr 27, 2024 • edited

内容

スクリーンショット・動画など

その他

Hiroshiba left a comment

Choose a reason for hiding this comment

sigprogramming commented Apr 27, 2024

Hiroshiba commented Apr 27, 2024

sigprogramming commented Apr 27, 2024

sigprogramming commented Apr 28, 2024 • edited

Hiroshiba left a comment

Choose a reason for hiding this comment

sigprogramming commented Apr 27, 2024 •

edited

sigprogramming commented Apr 28, 2024 •

edited