In [4]:
import os
import random
import math
from PIL import Image, ImageDraw, ImageFont
import matplotlib.font_manager as fm

OUTPUT_DIR = "dataset"  # 出力ディレクトリ
NUM_IMAGES_PER_SET = 100  # 各文字セットごとの画像枚数
IMAGE_SIZES = [20, 30, 40, 50, 60]  # 出力する文字サイズのバリエーション
CANVAS_SIZE = 100  # 画像のキャンバスサイズ（正方形）

# 文字セット（カテゴリごと）
CHARACTER_SETS = {
    "digit": list("0123456789"),
    "alphabet": list("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"),
    "hiragana": list("あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをん"),
    "katakana": list("アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲン"),
    "kanji": list("田山川中木本林森小大高校長松村石井谷野原内上下金青白黒西東南北藤佐清平安斉斎浜島岩社会部課店室長係業務企画販売営業製造開発電機通信商工産設計技術情報資料政経理財務代表示員者人統括主幹次役理監査責様御名氏令和市区町村道府県都京阪名港台橋坂浜島岩谷原")
}

# システム上のすべてのフォントを取得（ttf/otf対象）
ALL_FONTS = [
    f for f in fm.findSystemFonts(fontpaths=None, fontext='ttf') + fm.findSystemFonts(fontext='otf')
    if "Emoji" not in f  # 絵文字フォントを除外
]

# 各カテゴリごとに使えそうなフォント候補をフィルタリング
FONT_CANDIDATES = {
    "digit": [
        f for f in ALL_FONTS if any(x in f.lower() for x in [
            "arial", "liberation", "dejavu", "freesans", "verdana", "times"
        ])
    ],
    "alphabet": [
        f for f in ALL_FONTS if any(x in f.lower() for x in [
            "arial", "liberation", "dejavu", "freesans", "verdana", "times"
        ])
    ],
    "hiragana": [
        f for f in ALL_FONTS if any(x in f.lower() for x in [
            "meiryo", "msgothic", "msmincho", "ipag", "noto", "osaka", "takao", "mplus"
        ])
    ],
    "katakana": [
        f for f in ALL_FONTS if any(x in f.lower() for x in [
            "meiryo", "msgothic", "msmincho", "ipag", "noto", "osaka", "takao", "mplus"
        ])
    ],
    "kanji": [
        f for f in ALL_FONTS if any(x in f.lower() for x in [
            "meiryo", "msgothic", "msmincho", "ipag", "noto", "osaka", "takao", "mplus"
        ])
    ],
}

def get_best_font_size(char, font_path, target_size, max_attempts=10):
    """
    指定した文字がtarget_size内に収まるような最大のフォントサイズをバイナリサーチで探す。
    :param char: 描画する文字
    :param font_path: 使用するフォントファイルのパス
    :param target_size: 描画したいサイズ（幅・高さ）
    :param max_attempts: 探索の試行回数（デフォルト10）
    :return: 最適なフォントサイズ
    """
    low, high = 1, target_size * 3  # フォントサイズの探索範囲
    best_size = low

    for _ in range(max_attempts):
        mid = (low + high) // 2
        try:
            font = ImageFont.truetype(font_path, mid)
        except Exception:
            break  # 読み込み失敗ならスキップ

        # 仮の画像に描いてサイズを計測
        dummy_img = Image.new("L", (target_size * 4, target_size * 4), 255)
        draw = ImageDraw.Draw(dummy_img)
        bbox = draw.textbbox((0, 0), char, font=font)
        w, h = bbox[2] - bbox[0], bbox[3] - bbox[1]

        if w <= target_size and h <= target_size:
            best_size = mid      # 収まるなら更新
            low = mid + 1        # もっと大きく
        else:
            high = mid - 1       # 小さくする

    return best_size

def generate_images():
    """
    各カテゴリの文字ごとに指定サイズの画像を生成し、ラベルファイルも同時に作成。
    フォントはカテゴリに応じてランダムに選択。
    """
    os.makedirs(OUTPUT_DIR, exist_ok=True)

    for category, characters in CHARACTER_SETS.items():
        label_lines = []

        # 文字ごとの枚数を均等に配分（不足分は繰り返し）
        num_chars = len(characters)
        per_char_count = math.ceil(NUM_IMAGES_PER_SET / num_chars)
        all_chars = (characters * per_char_count)[:NUM_IMAGES_PER_SET]

        fonts_for_cat = FONT_CANDIDATES.get(category, ALL_FONTS)
        if not fonts_for_cat:
            fonts_for_cat = ALL_FONTS  # 候補が空ならすべて使う

        # 出力ディレクトリ作成（サイズごと）
        for size in IMAGE_SIZES:
            os.makedirs(os.path.join(OUTPUT_DIR, category, "images", str(size)), exist_ok=True)

        # 各文字に対して画像を生成
        for i, char in enumerate(all_chars):
            font_path = random.choice(fonts_for_cat)

            for size in IMAGE_SIZES:
                # サイズに合わせた最適なフォントサイズを取得
                best_font_size = get_best_font_size(char, font_path, size)

                try:
                    font = ImageFont.truetype(font_path, best_font_size)
                except Exception:
                    continue  # フォント読み込み失敗時はスキップ

                # キャンバス作成と描画
                img = Image.new("L", (CANVAS_SIZE, CANVAS_SIZE), color=255)
                draw = ImageDraw.Draw(img)

                # 実際の文字サイズ（bbox）を取得
                bbox = draw.textbbox((0, 0), char, font=font)
                w, h = bbox[2] - bbox[0], bbox[3] - bbox[1]

                # bboxの位置を補正して中央に描画
                pos_x = (CANVAS_SIZE - w) // 2 - bbox[0]
                pos_y = (CANVAS_SIZE - h) // 2 - bbox[1]
                draw.text((pos_x, pos_y), char, font=font, fill=0)

                # 保存処理
                fname = f"img_{i:04d}.png"
                rel_path = os.path.join("images", str(size), fname)
                img.save(os.path.join(OUTPUT_DIR, category, rel_path))

                # ラベルに追加
                label_lines.append(f"{rel_path} {char}")

        # ラベルファイルの保存
        with open(os.path.join(OUTPUT_DIR, category, "labels.txt"), "w", encoding="utf-8") as f:
            f.write("\n".join(label_lines))

# メイン処理
if __name__ == "__main__":
    generate_images()