# StyleTTS2 環境セットアップ

RTX 4070ti (VRAM 12GB) 環境でのStyleTTS2学習のための環境構築を行います。

## 目的
- StyleTTS2リポジトリの確認/クローン
- 依存パッケージのインストール
- CUDA対応PyTorchの確認
- 環境の動作確認


In [1]:
import sys
import subprocess
from pathlib import Path
import torch

# プロジェクトルートを取得
# notebooks/styletts2/ から実行される場合: 2階層上がる
# notebooks/ から実行される場合: 1階層上がる
current_dir = Path.cwd()
if current_dir.name == "styletts2":
    PROJECT_ROOT = current_dir.parent.parent  # notebooks/styletts2 -> notebooks -> project_root
elif current_dir.name == "notebooks":
    PROJECT_ROOT = current_dir.parent  # notebooks -> project_root
else:
    PROJECT_ROOT = current_dir  # プロジェクトルートから直接実行

STYLETTS2_DIR = PROJECT_ROOT / "StyleTTS2"

print("="*60)
print("環境セットアップ開始")
print("="*60)
print(f"\n現在のディレクトリ: {current_dir}")
print(f"プロジェクトルート: {PROJECT_ROOT}")
print(f"StyleTTS2ディレクトリ: {STYLETTS2_DIR}")
print(f"StyleTTS2存在確認: {STYLETTS2_DIR.exists()}")

# CUDA確認
print("\n" + "-"*60)
print("CUDA確認")
print("-"*60)
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"Device: {torch.cuda.get_device_name(0)}")
    print(f"CUDA version: {torch.version.cuda}")
    print(f"cuDNN version: {torch.backends.cudnn.version()}")
else:
    print("⚠️ CUDAが利用できません。GPU環境を確認してください。")


環境セットアップ開始

現在のディレクトリ: /mnt/e/dev/minimal-feature-corpus-tts/notebooks/styletts2
プロジェクトルート: /mnt/e/dev/minimal-feature-corpus-tts
StyleTTS2ディレクトリ: /mnt/e/dev/minimal-feature-corpus-tts/StyleTTS2
StyleTTS2存在確認: True

------------------------------------------------------------
CUDA確認
------------------------------------------------------------
CUDA available: True
Device: NVIDIA GeForce RTX 4070 Ti
CUDA version: 12.8
cuDNN version: 91002


In [2]:
# StyleTTS2が存在しない場合の自動クローン（オプション）
# 既存のStyleTTS2ディレクトリを確認済みなので、このセルは通常スキップされます
if not STYLETTS2_DIR.exists():
    print(f"\n⚠️ StyleTTS2 ディレクトリが見つかりません: {STYLETTS2_DIR}")
    print("\n自動クローンを試みます...")
    try:
        subprocess.check_call(
            ["git", "clone", "https://github.com/yl4579/StyleTTS2.git"],
            cwd=str(PROJECT_ROOT),
            stdout=subprocess.PIPE,
            stderr=subprocess.PIPE
        )
        print(f"✓ StyleTTS2 をクローンしました: {STYLETTS2_DIR}")
    except subprocess.CalledProcessError as e:
        print("✗ 自動クローンに失敗しました")
        print("手動でクローンしてください:")
        print(f"  cd {PROJECT_ROOT}")
        print("  git clone https://github.com/yl4579/StyleTTS2.git")
else:
    print(f"\n✓ StyleTTS2 は既にプロジェクトルートに存在します: {STYLETTS2_DIR}")



✓ StyleTTS2 は既にプロジェクトルートに存在します: /mnt/c/dev/minimal-feature-corpus-tts/StyleTTS2


In [3]:
# Pythonパスに追加
if STYLETTS2_DIR.exists() and str(STYLETTS2_DIR) not in sys.path:
    sys.path.insert(0, str(STYLETTS2_DIR))
    print(f"✓ StyleTTS2をPythonパスに追加しました")

# requirements.txtの確認
if STYLETTS2_DIR.exists():
    req_file = STYLETTS2_DIR / "requirements.txt"
    if req_file.exists():
        print(f"\n✓ requirements.txt が見つかりました: {req_file}")
        with open(req_file, 'r', encoding='utf-8') as f:
            requirements = f.read()
        print("\n依存パッケージリスト:")
        print(requirements)
    else:
        print(f"\n⚠️ requirements.txt が見つかりません")


✓ StyleTTS2をPythonパスに追加しました

✓ requirements.txt が見つかりました: /mnt/c/dev/minimal-feature-corpus-tts/StyleTTS2/requirements.txt

依存パッケージリスト:
SoundFile
torchaudio
munch
torch
pydub
pyyaml
librosa
nltk
matplotlib
accelerate
transformers
einops
einops-exts
tqdm
typing
typing-extensions
git+https://github.com/resemble-ai/monotonic_align.git


In [4]:
# 依存パッケージのインストール確認・インストール
print("\n" + "-"*60)
print("依存パッケージの確認・インストール")
print("-"*60)

if STYLETTS2_DIR.exists():
    req_file = STYLETTS2_DIR / "requirements.txt"
    if req_file.exists():
        # 主要なパッケージをチェック
        import importlib
        required_packages = [
            'soundfile', 'torchaudio', 'munch', 'torch', 'pydub',
            'yaml', 'librosa', 'nltk', 'matplotlib', 'accelerate',
            'transformers', 'einops', 'tqdm'
        ]
        
        missing_packages = []
        for pkg in required_packages:
            try:
                # パッケージ名の変換 (yaml -> pyyamlなど)
                import_name = pkg
                if pkg == 'yaml':
                    import_name = 'yaml'
                importlib.import_module(import_name)
                print(f"  ✓ {pkg}")
            except ImportError:
                print(f"  ✗ {pkg} (未インストール)")
                missing_packages.append(pkg)
        
        if missing_packages:
            print(f"\n未インストールのパッケージ: {missing_packages}")
            print("以下のコマンドでインストールしてください:")
            print(f"  pip install -r {req_file}")
        else:
            print("\n✓ すべての主要パッケージがインストールされています")
    else:
        print("requirements.txtが見つかりません")



------------------------------------------------------------
依存パッケージの確認・インストール
------------------------------------------------------------
  ✓ soundfile
  ✓ torchaudio
  ✓ munch
  ✓ torch
  ✓ pydub
  ✓ yaml
  ✓ librosa
  ✓ nltk
  ✓ matplotlib
  ✓ accelerate
  ✓ transformers
  ✓ einops
  ✓ tqdm

✓ すべての主要パッケージがインストールされています


In [9]:
# phonemizerの確認（日本語音素化に必要）
print("\n" + "-"*60)
print("phonemizerの確認")
print("-"*60)

try:
    from phonemizer import phonemize
    from phonemizer.backend import EspeakBackend
    print("✓ phonemizer がインストールされています")
    
    # eSpeak-NGバックエンドの確認
    try:
        backend = EspeakBackend('ja')
        print("✓ eSpeak-NG バックエンドが利用可能です (日本語対応)")
    except Exception as e:
        print(f"⚠️ eSpeak-NGバックエンドの初期化に失敗: {e}")
        print("eSpeak-NGがインストールされているか確認してください")
except ImportError:
    print("✗ phonemizer がインストールされていません")
    print("以下のコマンドでインストールしてください:")
    print("  pip install phonemizer")
    print("\n注意: eSpeak-NGもインストールが必要です")
    print("  Windows: https://github.com/espeak-ng/espeak-ng/releases")
    print("  Linux: sudo apt-get install espeak-ng")
    print("  macOS: brew install espeak-ng")



------------------------------------------------------------
phonemizerの確認
------------------------------------------------------------
✓ phonemizer がインストールされています
✓ eSpeak-NG バックエンドが利用可能です (日本語対応)


In [10]:
# 音素化テスト
print("\n" + "-"*60)
print("音素化テスト")
print("-"*60)

try:
    from phonemizer import phonemize
    from phonemizer.backend import EspeakBackend
    
    test_text = "こんにちは、今日は良い天気ですね。"
    backend = EspeakBackend('ja')
    phonemized = phonemize(
        test_text,
        backend='espeak',
        language='ja',
        strip=True,
        preserve_punctuation=True,
        with_stress=False,
        njobs=1
    )
    print(f"元のテキスト: {test_text}")
    print(f"音素化結果: {phonemized}")
    print("✓ 音素化が正常に動作しています")
except Exception as e:
    print(f"✗ 音素化テストに失敗: {e}")
    import traceback
    traceback.print_exc()



------------------------------------------------------------
音素化テスト
------------------------------------------------------------
元のテキスト: こんにちは、今日は良い天気ですね。
音素化結果: ko̞nnitɕihä (en)tʃaɪniːz(ja)le̞tə (en)tʃaɪniːz(ja)le̞tə hä (en)tʃaɪniːz(ja)le̞tə i (en)tʃaɪniːz(ja)le̞tə (en)tʃaɪniːz(ja)le̞tə te̞ (en)dʒapəniːz(ja)le̞tə sɯᵝ ne̞
✓ 音素化が正常に動作しています


In [11]:
# StyleTTS2のインポートテスト
print("\n" + "-"*60)
print("StyleTTS2モジュールのインポートテスト")
print("-"*60)

if STYLETTS2_DIR.exists():
    try:
        # 主要モジュールのインポートテスト
        sys.path.insert(0, str(STYLETTS2_DIR))
        
        modules_to_test = [
            'text_utils',
            'meldataset',
            'utils'
        ]
        
        for module_name in modules_to_test:
            try:
                __import__(module_name)
                print(f"  ✓ {module_name}")
            except Exception as e:
                print(f"  ✗ {module_name}: {e}")
        
        print("\n✓ StyleTTS2の主要モジュールがインポート可能です")
    except Exception as e:
        print(f"⚠️ モジュールのインポートに問題があります: {e}")
        import traceback
        traceback.print_exc()
else:
    print("StyleTTS2ディレクトリが存在しません")



------------------------------------------------------------
StyleTTS2モジュールのインポートテスト
------------------------------------------------------------
  ✓ text_utils
  ✓ meldataset
  ✓ utils

✓ StyleTTS2の主要モジュールがインポート可能です


In [12]:
# 環境情報のまとめ
print("\n" + "="*60)
print("環境セットアップ確認完了")
print("="*60)

print(f"\nプロジェクトルート: {PROJECT_ROOT}")
print(f"StyleTTS2ディレクトリ: {STYLETTS2_DIR} ({'存在' if STYLETTS2_DIR.exists() else '不存在'})")

if torch.cuda.is_available():
    print(f"\nGPU: {torch.cuda.get_device_name(0)}")
    print(f"CUDA version: {torch.version.cuda}")
    print(f"PyTorch version: {torch.__version__}")

print("\n次のステップ:")
print("  1. 01_prepare_datasets.ipynb でデータセットを準備")
print("  2. 02_generate_configs.ipynb で設定ファイルを生成")
print("  3. 03_train_models.ipynb で学習を実行")
print("  4. 04_generate_evaluation_audio.ipynb で評価音声を生成")



環境セットアップ確認完了

プロジェクトルート: /mnt/c/dev/minimal-feature-corpus-tts
StyleTTS2ディレクトリ: /mnt/c/dev/minimal-feature-corpus-tts/StyleTTS2 (存在)

GPU: NVIDIA GeForce RTX 4070 Ti
CUDA version: 12.1
PyTorch version: 2.5.1+cu121

次のステップ:
  1. 01_prepare_datasets.ipynb でデータセットを準備
  2. 02_generate_configs.ipynb で設定ファイルを生成
  3. 03_train_models.ipynb で学習を実行
  4. 04_generate_evaluation_audio.ipynb で評価音声を生成
