v0.0.2-alpha — DACVAE int4 codec + HF auto-download
Pre-release
Pre-release
コーデックまで含めたエンドツーエンドの省メモリ化と、重みの配布まわりを整えた版です。
追加
- DACVAE コーデックの 4-bit 化(
configure(codec_int4=True))。NormConv1d / NormConvTranspose1d を uint8-nibble pack のまま保持し、forward 内で 1 レイヤずつ on-the-fly dequant。Conv 重み 377 → 59 MB(▲84%)、エンドツーエンドのピーク VRAM 1513 → 989 MB。 - HF からの重み自動ダウンロード: 初回実行時に
kizuna-intelligence/Irodori-TTS-Lite-int4から取得(HF キャッシュ保存)。Git LFS 同梱を廃止。 - 上流クレジットを明記(Aratako/Irodori-TTS / Semantic-DACVAE-Japanese-32dim)。
計測(RTX PRO 4000 Blackwell, 6 RF step)
- エンドツーエンドピーク VRAM: 988.7 MB(
--codec-int4、DiT + コーデック + トークナイザ込み) - decode_latent: コーデック fp16 ~170 ms / int4 ~330 ms / CPU offload ~3.3 s
MIT License。