<a href="https://colab.research.google.com/github/Takenoko0/Japanese-Tongue-twister-Generator/blob/main/Untitled1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [5]:
import random
import os
import tempfile
import time
from IPython.display import Audio, display
# 音声生成用のライブラリ
# 事前に !pip install gTTS pydub && !apt-get install ffmpeg を実行してください
from gtts import gTTS
from pydub import AudioSegment

class TongueTwisterGenerator:
    def __init__(self):
        """初期化メソッド：設定から全データを読み込む"""
        self.initialize_settings()

    def initialize_settings(self):
        """設定を初期化するメソッド"""
        # ユーザー設定値を読み込む
        self.output_count = OUTPUT_COUNT
        self.difficulty_level = DIFFICULTY_LEVEL
        self.selected_dialects = SELECTED_DIALECTS
        self.enable_auto_generate = ENABLE_AUTO_GENERATE
        self.generation_mode = GENERATION_MODE
        self.pattern_weights = PATTERN_WEIGHTS
        self.speech_settings = SPEECH_SETTINGS

        # 基本の早口言葉
        self.classic_twisters = CLASSIC_TWISTERS

        # 難読熟語・言いにくい言葉
        self.difficult_phrases = DIFFICULT_PHRASES

        # 方言の早口言葉
        self.dialect_twisters = DIALECT_TWISTERS

        # 行別・段別の言葉グループ
        self.row_words = ROW_WORDS
        self.column_words = COLUMN_WORDS

        # 音韻パターン関連の単語グループ
        self.sound_repetition_twisters = SOUND_REPETITION_TWISTERS
        self.mora_exchange_twisters = MORA_EXCHANGE_TWISTERS
        self.consonant_cluster_twisters = CONSONANT_CLUSTER_TWISTERS

        # 特殊パターンの早口言葉
        self.similar_sound_twisters = SIMILAR_SOUND_TWISTERS
        self.palindrome_twisters = PALINDROME_TWISTERS
        self.counting_pattern_twisters = COUNTING_PATTERN_TWISTERS

        # バリエーション拡張用の単語データ
        self.nouns = NOUNS
        self.verbs = VERBS
        self.adjectives = ADJECTIVES
        self.adverbs = ADVERBS
        self.places = PLACES
        self.seasons = SEASONS
        self.time_expressions = TIME_EXPRESSIONS
        self.food_items = FOOD_ITEMS
        self.animals = ANIMALS
        self.particles = PARTICLES
        self.conjunctions = CONJUNCTIONS

        # 意味のある文のパターン
        self.meaningful_patterns = MEANINGFUL_PATTERNS

        # 単語の組み合わせルール
        self.word_combination_rules = WORD_COMBINATION_RULES

        # 難易度レベルマッピング
        self.difficulty_levels = DIFFICULTY_LEVELS

        # 拡張早口言葉リストを生成
        self.expanded_twisters = []
        self.generate_expanded_twisters()

    def calculate_combinations(self):
        """早口言葉の理論上の組み合わせ数を計算する"""
        # 基本組み合わせパターン数
        basic_combinations = len(self.classic_twisters) + len(self.difficult_phrases)

        # 方言パターン数
        dialect_combinations = sum(len(phrases) for phrases in self.dialect_twisters.values())

        # 音韻パターン数
        sound_pattern_combinations = (
            len(self.sound_repetition_twisters) +
            len(self.mora_exchange_twisters) +
            len(self.consonant_cluster_twisters) +
            len(self.similar_sound_twisters) +
            len(self.palindrome_twisters) +
            len(self.counting_pattern_twisters)
        )

        # 行・段パターン
        row_column_combinations = 0
        for row in self.row_words:
            row_column_combinations += len(self.row_words[row]) * (len(self.row_words[row]) - 1) // 2
        for column in self.column_words:
            row_column_combinations += len(self.column_words[column]) * (len(self.column_words[column]) - 1) // 2

        # 自動生成可能な組み合わせ数
        auto_generated_combinations = 0
        if self.enable_auto_generate:
            # 名詞+助詞+動詞パターン
            auto_generated_combinations += len(self.nouns) * len(self.particles) * len(self.verbs)

            # 形容詞+名詞パターン（単体および繰り返し）
            auto_generated_combinations += len(self.adjectives) * len(self.nouns) * 2

            # 名詞の列挙パターン（2個および3個）
            auto_generated_combinations += (
                len(self.nouns) * (len(self.nouns) - 1) +
                len(self.nouns) * (len(self.nouns) - 1) * (len(self.nouns) - 2) // 6
            )

            # 場所+時間+動詞パターン
            auto_generated_combinations += len(self.places) * len(self.time_expressions) * len(self.verbs)

            # 副詞+動詞パターン
            auto_generated_combinations += len(self.adverbs) * len(self.verbs)

            # 季節+形容詞+名詞パターン
            auto_generated_combinations += len(self.seasons) * len(self.adjectives) * len(self.nouns)

            # 動物+助詞+食べ物+動詞パターン
            auto_generated_combinations += len(self.animals) * len(self.particles) * len(self.food_items) * len(self.verbs)

            # 意味のあるパターン数
            auto_generated_combinations += len(self.meaningful_patterns) * 10  # 各パターンに対して約10の変数

            # 単語組み合わせルールによるパターン数
            auto_generated_combinations += len(self.word_combination_rules) * 20  # 各ルールに対して約20の適用可能ケース

        # 合計組み合わせ数
        total_combinations = basic_combinations + dialect_combinations + sound_pattern_combinations + row_column_combinations
        if self.enable_auto_generate:
            total_combinations += auto_generated_combinations

        # 結果を表示
        print("\n=== 早口言葉の組み合わせ数 ===")
        print(f"基本パターン: {basic_combinations}通り")
        print(f"方言パターン: {dialect_combinations}通り")
        print(f"音韻パターン: {sound_pattern_combinations}通り")
        print(f"行・段パターン: {row_column_combinations}通り")
        if self.enable_auto_generate:
            print(f"自動生成可能: {auto_generated_combinations}通り")
        print(f"理論上の合計: {total_combinations}通り")
        print("===========================")

        return total_combinations

    def generate_expanded_twisters(self):
        """多様な早口言葉パターンを生成する"""
        # 拡張早口言葉リストを初期化
        self.expanded_twisters = []

        # 選択されたモードに基づいて早口言葉を生成
        if self.generation_mode == "standard":
            # 標準モード：すべての種類の早口言葉を含む
            self._add_standard_twisters()
        elif self.generation_mode == "dialect_only":
            # 方言のみモード：選択された方言の早口言葉だけを使用
            self._add_dialect_twisters()
        elif self.generation_mode == "classic_only":
            # 古典のみモード：定番の早口言葉だけを使用
            self.expanded_twisters.extend(self.classic_twisters)
        elif self.generation_mode == "sound_patterns":
            # 音韻パターンモード：音の特徴を活かした早口言葉を使用
            self._add_sound_pattern_twisters()
        elif self.generation_mode == "row_column":
            # 行・段パターンモード：同じ行や段の音を組み合わせた早口言葉を使用
            self._add_row_column_twisters()

        # 自動生成が有効で、かつ標準モードの場合、追加のパターンを生成
        if self.enable_auto_generate and self.generation_mode == "standard":
            self._generate_additional_patterns()

        # 拡張完了後の確認
        print(f"早口言葉バリエーション数: {len(self.expanded_twisters)}個")

    def _add_standard_twisters(self):
        """標準的な早口言葉を追加（統合版）"""
        # 既存の早口言葉を追加
        self.expanded_twisters.extend(self.classic_twisters)
        self.expanded_twisters.extend(self.difficult_phrases)

        # 選択された方言のみ追加
        for dialect in self.selected_dialects:
            if dialect in self.dialect_twisters:
                self.expanded_twisters.extend(self.dialect_twisters[dialect])

  # 難易度に応じたリストの追加
difficulty_index = DIFFICULTY_LEVELS.index(DIFFICULTY_LEVEL)

# 簡単な早口言葉は全難易度で含める
self.expanded_twisters.extend(self.sound_repetition_twisters)

# 普通以上の難易度では複雑な早口言葉を追加
if difficulty_index >= 1:  # 普通以上
    self.expanded_twisters.extend(self.mora_exchange_twisters)
    self.expanded_twisters.extend(self.palindrome_twisters)
    self.expanded_twisters.extend(self.counting_pattern_twisters)

# 難しい以上の難易度ではさらに難しい早口言葉を追加
if difficulty_index >= 2:  # 難しい以上
    self.expanded_twisters.extend(self.consonant_cluster_twisters)
    self.expanded_twisters.extend(self.similar_sound_twisters)

# 超難しい以上は最大の難易度
if difficulty_index >= 3:  # 超難しい以上
    # 追加の難しい組み合わせを生成
    for i in range(30):
        twister1 = random.choice(self.difficult_phrases)
        twister2 = random.choice(self.consonant_cluster_twisters)
        self.expanded_twisters.append(f"{twister1}、{twister2}")

        # 【統合機能１】行・段パターンの早口言葉を追加（数を増加）
self._generate_row_column_patterns(200)  # 200個の行・段パターンを追加

# 【統合機能２】意味のある文のパターンを追加
self._generate_meaningful_patterns(150)  # 150個の意味のある文を追加

# 【統合機能３】単語組み合わせルールを使った早口言葉を追加
self._generate_word_rule_patterns(150)  # 150個の単語ルールパターンを追加

# パターン生成後の重複チェックと不自然な組み合わせの除外
cleaned_twisters = []
for twister in self.expanded_twisters:
    # 重複チェック
    if twister not in cleaned_twisters:
        # 不自然な組み合わせのチェック
        if self._check_natural_combination(twister):
            cleaned_twisters.append(twister)

# 清書されたリストで更新
self.expanded_twisters = cleaned_twisters

# デバッグ情報の出力
print(f"行・段パターン、意味パターン、単語ルールパターンを含む早口言葉の生成完了")
print(f"生成された早口言葉の総数: {len(self.expanded_twisters)}個")
def _generate_additional_patterns(self):
    """追加の早口言葉パターンを生成"""
    target_count = 1000  # 最終的な目標数

    # 追加パターン生成が必要な場合のみ実行
    if len(self.expanded_twisters) < target_count:
        patterns_needed = target_count - len(self.expanded_twisters)
        pattern_count = {
            "adj_noun_pattern": int(patterns_needed * self.pattern_weights["adj_noun_pattern"]),
            "noun_list_pattern": int(patterns_needed * self.pattern_weights["noun_list_pattern"]),
            "noun_particle_verb_pattern": int(patterns_needed * self.pattern_weights["noun_particle_verb_pattern"]),
            "place_time_pattern": int(patterns_needed * self.pattern_weights["place_time_pattern"]),
            "adverb_verb_pattern": int(patterns_needed * self.pattern_weights["adverb_verb_pattern"]),
            "season_adj_noun_pattern": int(patterns_needed * self.pattern_weights["season_adj_noun_pattern"]),
            "animal_food_pattern": int(patterns_needed * self.pattern_weights["animal_food_pattern"]),
            "combined_pattern": int(patterns_needed * self.pattern_weights["combined_pattern"]),
            "row_column_pattern": int(patterns_needed * self.pattern_weights["row_column_pattern"]),
            "meaningful_pattern": int(patterns_needed * self.pattern_weights["meaningful_pattern"]),
            "word_rule_pattern": int(patterns_needed * self.pattern_weights["word_rule_pattern"])
        }

        # 先に意味のある文パターンを生成（意味のある文を優先）
        self._generate_meaningful_patterns(pattern_count["meaningful_pattern"])

        # 1. 形容詞+名詞パターン（繰り返しを制限）
        self._generate_adj_noun_patterns(pattern_count["adj_noun_pattern"])

        # 2. 名詞の列挙パターン
        self._generate_noun_list_patterns(pattern_count["noun_list_pattern"])

        # 3. 名詞+助詞+動詞パターン
        self._generate_noun_verb_patterns(pattern_count["noun_particle_verb_pattern"])

        # 4. 場所+時間+動詞パターン
        self._generate_place_time_patterns(pattern_count["place_time_pattern"])

        # 5. 副詞+動詞パターン
        self._generate_adverb_verb_patterns(pattern_count["adverb_verb_pattern"])

        # 6. 季節+形容詞+名詞パターン
        self._generate_season_patterns(pattern_count["season_adj_noun_pattern"])

        # 7. 動物+助詞+食べ物+動詞パターン
        self._generate_animal_food_patterns(pattern_count["animal_food_pattern"])

        # 8. 既存パターンの組み合わせ
        self._generate_combined_patterns(pattern_count["combined_pattern"])

        # 9. 行・段パターン
        self._generate_row_column_patterns(pattern_count["row_column_pattern"])

        # 10. 単語組み合わせルールパターン
        self._generate_word_rule_patterns(pattern_count["word_rule_pattern"])

def _generate_row_patterns(self, count):
    """同じ行の音を使った早口言葉を生成"""
    for _ in range(count):
        # ランダムに行を選択
        row_key = random.choice(list(self.row_words.keys()))
        row_words = self.row_words[row_key]

        if len(row_words) >= 3:
            # その行から3つの単語をランダムに選択
            selected_words = random.sample(row_words, 3)

            # パターンタイプを選択
            pattern_type = random.randint(1, 3)

            if pattern_type == 1:
                # パターン1: 単語を並べる
                new_twister = f"{selected_words[0]}、{selected_words[1]}、{selected_words[2]}"
            elif pattern_type == 2:
                # パターン2: 助詞で結合
                particles = ["が", "を", "に", "は", "と", "の"]
                particle1 = random.choice(particles)
                particle2 = random.choice(particles)
                new_twister = f"{selected_words[0]}{particle1}{selected_words[1]}{particle2}{selected_words[2]}"
            else:
                # パターン3: 意味のある文章形式
                verb = random.choice(["ある", "いる", "見る", "買う", "持つ"])
                new_twister = f"{selected_words[0]}の{selected_words[1]}で{selected_words[2]}を{verb}"

            # 意味チェック
            if self._check_natural_combination(new_twister):
                if new_twister not in self.expanded_twisters:
                    self.expanded_twisters.append(new_twister)

def _generate_column_patterns(self, count):
    """同じ段の音を使った早口言葉を生成"""
    for _ in range(count):
        # ランダムに段を選択
        column_key = random.choice(list(self.column_words.keys()))
        column_words = self.column_words[column_key]

        if len(column_words) >= 3:
            # その段から3つの単語をランダムに選択
            selected_words = random.sample(column_words, 3)

            # パターンタイプを選択
            pattern_type = random.randint(1, 3)

            if pattern_type == 1:
                # パターン1: 単語を並べる
                new_twister = f"{selected_words[0]}、{selected_words[1]}、{selected_words[2]}"
            elif pattern_type == 2:
                # パターン2: 助詞で結合
                particles = ["が", "を", "に", "は", "と", "の"]
                particle1 = random.choice(particles)
                particle2 = random.choice(particles)
                new_twister = f"{selected_words[0]}{particle1}{selected_words[1]}{particle2}{selected_words[2]}"
            else:
                # パターン3: 意味のある文章形式
                verb = random.choice(["ある", "いる", "見る", "買う", "持つ"])
                new_twister = f"{selected_words[0]}の{selected_words[1]}で{selected_words[2]}を{verb}"

            # 意味チェック
            if self._check_natural_combination(new_twister):
                if new_twister not in self.expanded_twisters:
                    self.expanded_twisters.append(new_twister)

def _generate_row_column_patterns(self, count):
    """行と段を組み合わせたパターンを生成"""
    # 行パターンと段パターンを均等に生成
    row_count = count // 2
    column_count = count - row_count

    self._generate_row_patterns(row_count)
    self._generate_column_patterns(column_count)

def _check_natural_combination(self, text):
    """文章の組み合わせが自然かどうかをチェック"""
    # 不自然な組み合わせリスト
    unnatural_combinations = [
        ("地図", "伸ばす"),
        ("テレビ", "泳ぐ"),
        ("山", "飲む"),
        ("花", "運転する"),
        ("本", "泳ぐ"),
        ("机", "歌う"),
        ("椅子", "溶ける"),
        ("靴", "煮る"),
        ("窓", "食べる"),
        ("道路", "読む")
    ]

    # 不自然な組み合わせがあるかチェック
    for bad_word1, bad_word2 in unnatural_combinations:
        if bad_word1 in text and bad_word2 in text:
            return False

    # 特定の助詞と動詞の不自然な組み合わせ
    if "を食べる" in text and any(word in text for word in ["椅子", "机", "窓", "靴"]):
        return False
    if "を飲む" in text and any(word in text for word in ["本", "地図", "山", "花"]):
        return False

    return True
def _generate_meaningful_patterns(self, count):
    """意味のある文のパターンを生成"""
    for _ in range(count):
        # ランダムにパターンを選択
        pattern = random.choice(self.meaningful_patterns)

        # パターンに合わせて単語を選択
        if "{animal}" in pattern:
            pattern = pattern.replace("{animal}", random.choice(self.animals))
        if "{food}" in pattern:
            pattern = pattern.replace("{food}", random.choice(self.food_items))
        if "{place}" in pattern:
            pattern = pattern.replace("{place}", random.choice(self.places))
        if "{time}" in pattern:
            pattern = pattern.replace("{time}", random.choice(self.time_expressions))
        if "{season}" in pattern:
            pattern = pattern.replace("{season}", random.choice(self.seasons))
        if "{adj}" in pattern:
            pattern = pattern.replace("{adj}", random.choice(self.adjectives))
        if "{noun}" in pattern:
            pattern = pattern.replace("{noun}", random.choice(self.nouns))
        if "{verb}" in pattern:
            pattern = pattern.replace("{verb}", random.choice(self.verbs))
        if "{adverb}" in pattern:
            pattern = pattern.replace("{adverb}", random.choice(self.adverbs))

        # 生成された文を追加（重複チェック）
        if pattern not in self.expanded_twisters:
            self.expanded_twisters.append(pattern)

def _generate_word_rule_patterns(self, count):
    """単語組み合わせルールを使った早口言葉を生成"""
    for _ in range(count):
        # ランダムに単語を選択
        base_word = random.choice(list(self.word_combination_rules.keys()))

        # 選択した単語のルールを取得
        rules = self.word_combination_rules[base_word]

        # ルールに基づいてパターンを生成
        if "verbs" in rules:
            verb = random.choice(rules["verbs"])

            # 助詞を選択
            if "particles" in rules:
                particle = random.choice(rules["particles"])
            else:
                particle = random.choice(["が", "を", "に", "は", "で"])

            # 形容詞があれば追加
            if "adjectives" in rules and random.random() < 0.5:
                adj = random.choice(rules["adjectives"])
                new_twister = f"{adj}{base_word}{particle}{verb}"
            else:
                new_twister = f"{base_word}{particle}{verb}"

        # 名詞同士の組み合わせ
        elif "related_nouns" in rules:
            related_noun = random.choice(rules["related_nouns"])

            # 助詞を選択
            particle = random.choice(["と", "や", "の"])

            new_twister = f"{base_word}{particle}{related_noun}"

        # シンプルな繰り返し
        else:
            new_twister = f"{base_word}、{base_word}、{base_word}"

        # 生成された文を追加（重複チェック）
        if new_twister not in self.expanded_twisters:
            self.expanded_twisters.append(new_twister)

def _generate_adj_noun_patterns(self, count):
    """形容詞+名詞パターン（「形容詞+名詞」を最大2回繰り返し）を生成"""
    for _ in range(count):
        adj = random.choice(self.adjectives)
        noun = random.choice(self.nouns)

        # 形容詞と名詞の組み合わせが自然かチェック
        if not self._is_natural_adj_noun(adj, noun):
            continue

        repeat_count = random.randint(1, 2)  # 繰り返し回数を1〜2回に制限

        if repeat_count == 1:
            new_twister = f"{adj}{noun}"
        else:
            new_twister = f"{adj}{noun}、{adj}{noun}"

        # 意味チェック
        if self._check_natural_combination(new_twister):
            if new_twister not in self.expanded_twisters:
                self.expanded_twisters.append(new_twister)

def _is_natural_adj_noun(self, adj, noun):
    """形容詞+名詞の組み合わせが自然かどうかをチェック"""
    # 不自然な組み合わせリスト
    unnatural_combinations = [
        ("赤い", "海"),
        ("青い", "ご飯"),
        ("嬉しい", "山"),
        ("悲しい", "机"),
        ("寒い", "夏"),
        ("熱い", "冬")
    ]

    # 不自然な組み合わせがあればFalseを返す
    for bad_adj, bad_noun in unnatural_combinations:
        if adj == bad_adj and noun == bad_noun:
            return False

    return True

def generate(self, count=None):
    """指定された数の早口言葉をランダムに生成する"""
    if count is None:
        count = self.output_count

    # expanded_twistersからランダムに選択
    if len(self.expanded_twisters) < count:
        return self.expanded_twisters
    return random.sample(self.expanded_twisters, count)

def generate_audio(self, text, filename=None, speed=1.0, play_in_colab=True):
    """早口言葉の音声ファイルを生成し、Colab上で再生する"""
    if filename is None:
        # 一時ファイル名を生成
        temp_dir = tempfile.gettempdir()
        filename = os.path.join(temp_dir, f"tongue_twister_{hash(text)}.mp3")

    # 音声生成
    tts = gTTS(text=text, lang='ja', slow=False)
    temp_file = f"{filename}_temp.mp3"
    tts.save(temp_file)

    # 速度調整
    sound = AudioSegment.from_mp3(temp_file)

    # speedが1.0より大きい場合は早く、小さい場合は遅く
    if speed != 1.0:
        # speedupメソッドを用いて速度を変更
        sound = self._change_speed(sound, speed)

    # 最終的なファイルを保存
    sound.export(filename, format="mp3")

    # 一時ファイルを削除
    if os.path.exists(temp_file):
        os.remove(temp_file)

    print(f"音声ファイルを生成しました: {filename} (速度: {speed}倍)")

    # Colab上で直接再生するが、自動再生はしない
    if play_in_colab:
        try:
            display(Audio(filename, autoplay=False))  # autoplayをFalseに変更
            print("再生ボタンを押して音声を聞くことができます")
        except Exception as e:
            print(f"Colabでの再生に失敗しました: {e}")

    return filename

def _change_speed(self, sound, speed_factor):
    """音声の速度を変更する"""
    # speedupメソッドを使用する場合（速度を上げる場合）
    if speed_factor > 1.0:
        # speedup関数は内部的にはフレームレートを変更する
        return sound.speedup(playback_speed=speed_factor)
    # 遅くする場合
    elif speed_factor < 1.0:
        # スピードダウンの場合は逆数を取って処理
        return sound._spawn(sound._data, overrides={
            "frame_rate": int(sound.frame_rate * speed_factor)
        }).set_frame_rate(sound.frame_rate)
    return sound

# Google Colab用の実行関数
def run_generator(count=None, generate_audio=False, audio_speed=1.5, play_in_colab=True):
    """早口言葉ジェネレーターを実行する関数"""
    generator = TongueTwisterGenerator()
    results = generator.generate(count)

    for i, result in enumerate(results, 1):
        print(f"{i}. {result}")

        # 音声生成オプションがオンの場合
        if generate_audio:
            filename = f"twister_{i}.mp3"
            generator.generate_audio(result, filename, speed=audio_speed, play_in_colab=play_in_colab)
            # 連続再生の場合は少し間を空ける
            if play_in_colab and i < len(results):
                time.sleep(2)  # 2秒待機

#############################################################
#          ユーザー設定部分 - 以下を自由に変更できます         #
#############################################################

# 出力数の設定
OUTPUT_COUNT = 50  # 生成する早口言葉の数

# 難易度設定（"簡単", "普通", "難しい", "超難しい", "鬼畜級"から選択）
DIFFICULTY_LEVEL = "普通"  # ここを変更すると出力される早口言葉の難易度が変わります

# 難易度レベルマッピング
DIFFICULTY_LEVELS = ["簡単", "普通", "難しい", "超難しい", "鬼畜級"]

# 方言の選択（使用したい方言を配列に入れてください）
# 選択肢: "博多弁", "関西弁", "津軽弁", "沖縄方言", "東北弁"
SELECTED_DIALECTS = ["博多弁", "関西弁", "津軽弁", "沖縄方言", "東北弁"]

# 生成モード設定
# "standard": 標準モード - すべての種類の早口言葉を含む（word_rules/meaningful/row_columnを統合）
# "dialect_only": 方言のみモード - 選択された方言の早口言葉だけを使用
# "classic_only": 古典のみモード - 定番の早口言葉だけを使用
# "sound_patterns": 音韻パターンモード - 音の特徴を活かした早口言葉を使用
GENERATION_MODE = "standard"  # 統合モードをデフォルトに設定

# 自動生成機能（True/False）
ENABLE_AUTO_GENERATE = True

# 自動生成時のパターン比率設定
PATTERN_WEIGHTS = {
    "adj_noun_pattern": 0.05,
    "noun_list_pattern": 0.05,
    "noun_particle_verb_pattern": 0.10,
    "place_time_pattern": 0.05,
    "adverb_verb_pattern": 0.05,
    "season_adj_noun_pattern": 0.05,
    "animal_food_pattern": 0.05,
    "combined_pattern": 0.05,
    "row_column_pattern": 0.25,
    "meaningful_pattern": 0.15,
    "word_rule_pattern": 0.20
}

# 音声生成設定
SPEECH_SETTINGS = {
    "enable": True,
    "default_speed": 1.5,
    "output_dir": "audio",
    "play_in_colab": True
}

# 行別の言葉グループ
ROW_WORDS = {
    "あ行": ["あめ", "あき", "いす", "いぬ", "うみ", "うた", "えき", "えび", "おか", "おと"],
    "か行": ["かさ", "かぜ", "きく", "きつね", "くつ", "くま", "けむり", "けん", "こえ", "こども"],
    "さ行": ["さくら", "さる", "しお", "しか", "すし", "すみ", "せき", "せみ", "そら", "そば"],
    "た行": ["たこ", "たま", "ちず", "ちどり", "つき", "つばめ", "てら", "てん", "とり", "とけい"],
    "な行": ["なつ", "なみ", "にく", "にわ", "ぬま", "ぬの", "ねこ", "ねずみ", "のり", "のみもの"],
    "は行": ["はな", "はし", "ひと", "ひかり", "ふね", "ふゆ", "へび", "へや", "ほし", "ほん"],
    "ま行": ["まど", "まつり", "みず", "みかん", "むし", "むら", "めがね", "めろん", "もり", "もち"],
    "や行": ["やま", "やさい", "ゆき", "ゆめ", "よる", "よもぎ"],
    "ら行": ["らいおん", "らくだ", "りんご", "りす", "るすばん", "れんこん", "れもん", "ろうそく", "ろば"],
    "わ行": ["わに", "わらい"]
}

# 段別の言葉グループ
COLUMN_WORDS = {
    "あ段": ["あめ", "かさ", "さくら", "たこ", "なつ", "はな", "まど", "やま", "らいおん", "わに"],
    "い段": ["いす", "きつね", "しお", "ちず", "にく", "ひと", "みず", "りんご"],
    "う段": ["うみ", "くつ", "すし", "つき", "ぬま", "ふね", "むし", "ゆき", "るすばん"],
    "え段": ["えき", "けむり", "せき", "てら", "ねこ", "へび", "めがね", "れんこん"],
    "お段": ["おか", "こども", "そら", "とり", "のり", "ほし", "もり", "よる", "ろうそく"]
}

# 意味のある早口言葉パターン
MEANINGFUL_PATTERNS = [
    # 動物の行動パターン
    "{animal}が{food}を食べる",
    "{animal}が{place}で{food}を見つける",
    "{animal}が{place}の中を{adverb}走る",
    "{animal}は{season}になると{place}に現れる",

    # 場所と時間のパターン
    "{place}で{time}に{verb}人が多い",
    "{time}の{place}は{adj}雰囲気だ",
    "{season}の{place}で{adverb}{verb}",
    "{place}で{animal}と{verb}のは楽しい",

    # 自然な文法パターン
    "{adj}{noun}を{place}で{verb}",
    "{animal}と{animal}が{adverb}{verb}",
    "{place}の{noun}は{adj}と言われている",
    "{adverb}{verb}と{noun}が{adj}くなる",

    # 早口言葉向けの音の繰り返しパターン
    "{animal}が{animal}を{adverb}追いかける",
    "{place}の{place}で{noun}の{noun}を{verb}",
    "{adj}{adj}{noun}を{adverb}{verb}",
    "{season}の{season}らしい{place}で{verb}"
]

# 単語の組み合わせルール
WORD_COMBINATION_RULES = {
    "地図": {
        "verbs": ["見る", "広げる", "たたむ", "使う", "持つ"],
        "particles": ["を", "で", "と"],
        "adjectives": ["詳しい", "古い", "新しい", "大きな"],
        "related_nouns": ["地球儀", "コンパス", "旅行", "場所"]
    },
    "本": {
        "verbs": ["読む", "借りる", "返す", "開く", "閉じる"],
        "particles": ["を", "が", "は"],
        "adjectives": ["分厚い", "面白い", "古い", "新しい"],
        "related_nouns": ["雑誌", "新聞", "文庫", "図書館"]
    },
    "猫": {
        "verbs": ["鳴く", "寝る", "遊ぶ", "走る", "眠る"],
        "particles": ["が", "は", "と"],
        "adjectives": ["小さな", "かわいい", "大きな", "黒い", "白い"],
        "related_nouns": ["犬", "鳥", "魚", "ネズミ"]
    }
    # 他の単語も同様に定義...
}

# 基本の早口言葉
CLASSIC_TWISTERS = [
    "生麦生米生卵",
    "隣の客はよく柿食う客だ",
    "赤巻紙青巻紙黄巻紙",
    "坊主が屏風に上手に坊主の絵を描いた",
    "この釘は引き抜きにくい釘だ",
    "東京特許許可局",
    "庭には二羽ニワトリがいる",
    "バスガス爆発",
    "竹やぶに竹立てかけた",
    "すももも桃も桃のうち"
    # 他の基本早口言葉...
]

# 難読熟語・言いにくい言葉
DIFFICULT_PHRASES = [
    "憲法記念日",
    "豪華客船",
    "校内放送",
    "正式採用",
    "新記録樹立",
    "高速増殖炉",
    "特別急行列車",
    "著作権侵害",
    "図書館司書",
    "消費税率"
    # 他の難読熟語...
]

# その他の設定変数も同様に定義...

# 実行部分
if __name__ == "__main__":
    # 説明を表示
    print("=== 早口言葉ジェネレーター ===")
    print(f"生成モード: {GENERATION_MODE}")
    print(f"難易度: {DIFFICULTY_LEVEL}")
    if SELECTED_DIALECTS:
        print(f"使用方言: {', '.join(SELECTED_DIALECTS)}")
    else:
        print("使用方言: なし")

    # 音声生成機能の案内
    if SPEECH_SETTINGS["enable"]:
        print(f"音声生成: 有効 (速度: {SPEECH_SETTINGS['default_speed']}倍)")
        print(f"Colab再生: {'有効（自動再生なし）' if SPEECH_SETTINGS['play_in_colab'] else '無効'}")
    else:
        print("音声生成: 無効")

    # 意味チェック機能の案内
    print("意味チェック: 単語組み合わせルール使用")
    print("==========================")

    # 音声生成オプションを設定
    generate_audio = SPEECH_SETTINGS["enable"]
    audio_speed = SPEECH_SETTINGS["default_speed"]
    play_in_colab = SPEECH_SETTINGS["play_in_colab"]

    # ジェネレーターを実行
    run_generator(generate_audio=generate_audio, audio_speed=audio_speed, play_in_colab=play_in_colab)



NameError: name 'DIFFICULTY_LEVELS' is not defined

In [3]:
!pip install gTTS pydub
!apt-get install ffmpeg

Collecting gTTS
  Downloading gTTS-2.5.4-py3-none-any.whl.metadata (4.1 kB)
Collecting pydub
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Downloading gTTS-2.5.4-py3-none-any.whl (29 kB)
Downloading pydub-0.25.1-py2.py3-none-any.whl (32 kB)
Installing collected packages: pydub, gTTS
Successfully installed gTTS-2.5.4 pydub-0.25.1
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
ffmpeg is already the newest version (7:4.4.2-0ubuntu0.22.04.1).
0 upgraded, 0 newly installed, 0 to remove and 5 not upgraded.
