Skip to content

v0.0.2-alpha — DACVAE int4 codec + HF auto-download

Pre-release
Pre-release

Choose a tag to compare

@mera-chan mera-chan released this 20 May 11:52

コーデックまで含めたエンドツーエンドの省メモリ化と、重みの配布まわりを整えた版です。

追加

  • DACVAE コーデックの 4-bit 化configure(codec_int4=True))。NormConv1d / NormConvTranspose1d を uint8-nibble pack のまま保持し、forward 内で 1 レイヤずつ on-the-fly dequant。Conv 重み 377 → 59 MB(▲84%)、エンドツーエンドのピーク VRAM 1513 → 989 MB
  • HF からの重み自動ダウンロード: 初回実行時に kizuna-intelligence/Irodori-TTS-Lite-int4 から取得(HF キャッシュ保存)。Git LFS 同梱を廃止。
  • 上流クレジットを明記(Aratako/Irodori-TTS / Semantic-DACVAE-Japanese-32dim)。

計測(RTX PRO 4000 Blackwell, 6 RF step)

  • エンドツーエンドピーク VRAM: 988.7 MB--codec-int4、DiT + コーデック + トークナイザ込み)
  • decode_latent: コーデック fp16 ~170 ms / int4 ~330 ms / CPU offload ~3.3 s

MIT License。