In [3]:
import math
import csv

# -------------------------------------------------
# 1 距離ベースのスコア (length_score)
# -------------------------------------------------
def length_score(text, target=100):
    """
    目標文字数との絶対差に基づいたスコアを計算する。
    差が目標文字数以上の場合はスコア0。
    """
    length = len(text)
    diff = abs(length - target)
    # スコア = 1 - (目標からの差分 / 目標文字数)
    score = max(0, 1 - diff / target)
    return score

# -------------------------------------------------
# 2 許容範囲 ± tolerance (evaluate_summary_length)
# -------------------------------------------------
def evaluate_summary_length(text, target=100, tolerance=5):
    """
    許容範囲(tolerance)を設けた実用的なスコアを計算する。
    許容範囲内の場合はスコア1.0。
    """
    length = len(text)
    diff = abs(length - target)

    # 許容範囲内なら満点
    if diff <= tolerance:
        return 1.0

    # 許容範囲を超えた差分のみをペナルティとして計算
    # スコア = 1 - ((差分 - 許容範囲) / 目標文字数)
    score = max(0, 1 - (diff - tolerance) / target)
    return score

# -------------------------------------------------
# TXTファイル読み込み → CSVへ結果保存
# -------------------------------------------------
def process_txt_to_csv(input_file, output_csv, target=100, tolerance=5):
    results = []

    # TXT 読み込み: readlines()で行ごとにリスト化される
    with open(input_file, "r", encoding="utf-8") as f:
        lines = f.readlines()

    # 各行（=一つの文章）を解析
    for idx, line in enumerate(lines, start=1):
        # line.strip() で行頭・行末の空白と改行文字を削除
        text = line.strip() 
        
        # 空行はスキップ
        if not text:
            continue

        length = len(text)
        score1 = length_score(text, target)
        score2 = evaluate_summary_length(text, target, tolerance)

        results.append([
            idx,
            text,
            length,
            round(score1, 4),
            round(score2, 4)
        ])

    # CSV 出力
    with open(output_csv, "w", newline="", encoding="utf-8-sig") as f:
        writer = csv.writer(f)
        writer.writerow(["行番号", "文章", "文字数", "simple score", "practical score"])
        writer.writerows(results)

    print(f"CSV 出力完了: {output_csv}")


# -------------------------------------------------
# 実行部
# -------------------------------------------------
if __name__ == "__main__":
    # ここで、解析したい文章が格納されたTXTファイル名を指定します。
    # 例: "articles.txt"
    # 出力されるCSVファイル名を指定します。
    process_txt_to_csv("qwen1.5.txt", "qwem1.51.csv")

✅ CSV 出力完了: qwem1.51.csv
