<a href="https://colab.research.google.com/github/kou1342/kou1342.github.io/blob/main/recall%E7%B7%8F%E5%BD%93%E3%81%9F%E3%82%8A%E6%88%A6%E6%B3%95.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install ragas datasets rapidfuzz

Collecting ragas
  Downloading ragas-0.2.15-py3-none-any.whl.metadata (9.0 kB)
Collecting rapidfuzz
  Downloading rapidfuzz-3.13.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (12 kB)
Collecting langchain-community (from ragas)
  Downloading langchain_community-0.3.24-py3-none-any.whl.metadata (2.5 kB)
Collecting langchain_openai (from ragas)
  Downloading langchain_openai-0.3.18-py3-none-any.whl.metadata (2.3 kB)
Collecting appdirs (from ragas)
  Downloading appdirs-1.4.4-py2.py3-none-any.whl.metadata (9.0 kB)
Collecting diskcache>=5.6.3 (from ragas)
  Downloading diskcache-5.6.3-py3-none-any.whl.metadata (20 kB)
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain-community->ragas)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting pydantic-settings<3.0.0,>=2.4.0 (from langchain-community->ragas)
  Downloading pydantic_settings-2.9.1-py3-none-any.whl.metadata (3.8 kB)
Collecting httpx-sse<1.0.0,>=0.4.0 (from langchain-community

In [None]:
import asyncio
import math
import pandas as pd
from ragas import SingleTurnSample
from ragas.metrics import NonLLMContextPrecisionWithReference

def load_group_from_csv(path: str) -> list[str]:
    """
    CSV ファイルを読み込み、1 列目の各行を文字列のリストとして返す。
    ヘッダー行がある場合は、header=0 に変更してください。
    """
    df = pd.read_csv(path, header=None, encoding='utf-8')
    return df.iloc[:, 0].dropna().astype(str).tolist()

async def compute_all_vs_all_precision(group_a: list[str], group_b: list[str]) -> dict[str, dict[str, float]]:
    """
    group_a の各要素を retrieved_contexts、group_b の各要素を reference_contexts として
    Precision スコアを計算し、辞書形式で返す。
    """
    precision_metric = NonLLMContextPrecisionWithReference()
    results: dict[str, dict[str, float]] = {}

    for a in group_a:
        row: dict[str, float] = {}
        for b in group_b:
            sample = SingleTurnSample(
                retrieved_contexts=[a],
                reference_contexts=[b]
            )
            score = await precision_metric.single_turn_ascore(sample)
            row[b] = score
        results[a] = row

    return results

def main():
    # CSV から読み込み
    group_a = load_group_from_csv("group_a.csv")
    group_b = load_group_from_csv("group_b.csv")

    # Precision 計算（非同期実行）
    results = asyncio.run(compute_all_vs_all_precision(group_a, group_b))

    # Precision==1.0 のペア数をカウント→倍カウントされる気がするから割る2してます
    total_exact_matches = sum(
        1
        for row in results.values()
        for score in row.values()
        if math.isclose(score, 1.0, rel_tol=1e-9, abs_tol=0.0)
    )/2


    # 分母は要素数が多い方
    denominator = max(len(group_a), len(group_b))
    precision_ALL = total_exact_matches / denominator if denominator > 0 else 0.0

    # 結果表示
    for a, row in results.items():
        for b, score in row.items():
            print(f"───\nA: {a}\nB: {b}\nPrecision: {score:.4f}\n")

    print(f"Precision==1.0 のペア数: {total_exact_matches}")
    print(f"要素数が多い方の数 ({denominator}) で割った precision_ALL: {precision_ALL:.4f}")

if __name__ == "__main__":
    main()

───
A: 左肩の痛みは軽減した
B: リハビリ実施中
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 痛みは解消傾向
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 患者はエプロンの着脱や棚のものも取りやすくなったと感じている
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 左肩屈曲150度
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 左肩真横120度
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 左肩外旋40度
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 左肩の指椎間距離がLの4番
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 左肩SSP5で疼痛なし
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 右肩屈曲150度
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 右肩真横120度
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 右肩外旋60度
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 右肩の指椎間距離がLの5番
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: 医師はリハビリの継続を指示した
Precision: 0.0000

───
A: 左肩の痛みは軽減した
B: １ヶ月後再診予定
Precision: 0.0000

───
A: 左肩の可動域が改善した
B: リハビリ実施中
Precision: 0.0000

───
A: 左肩の可動域が改善した
B: 痛みは解消傾向
Precision: 0.0000

───
A: 左肩の可動域が改善した
B: 患者はエプロンの着脱や棚のものも取りやすくなったと感じている
Precision: 0.0000

───
A: 左肩の可動域が改善した
B: 左肩屈曲150度
Precision: 0.0000

───
A: 左肩の可動域が改善した
B: 左肩真横120度
Precision: 0.0000

───
A:

In [None]:
import asyncio
import math
import pandas as pd
from ragas import SingleTurnSample
from ragas.metrics import NonLLMContextRecall

def load_group_from_csv(path: str) -> list[str]:
    """
    CSV ファイルを読み込み、1 列目の各行を文字列のリストとして返す。
    ヘッダー行がある場合は header=0 に変更してください。
    """
    df = pd.read_csv(path, header=None, encoding='utf-8')
    return df.iloc[:, 0].dropna().astype(str).tolist()

async def compute_all_vs_all_recall(group_a: list[str], group_b: list[str]) -> dict[str, dict[str, float]]:
    """
    group_a の各要素を retrieved_contexts、
    group_b の各要素を reference_contexts として
    NonLLMContextRecallWithReference を用いて
    リコールスコアを計算し、辞書形式で返す。
    """
    recall_metric = NonLLMContextRecall()  #
    results: dict[str, dict[str, float]] = {}
    for a in group_a:
        row: dict[str, float] = {}
        for b in group_b:
            sample = SingleTurnSample(
                retrieved_contexts=[a],
                reference_contexts=[b]
            )
            score = await recall_metric.single_turn_ascore(sample)
            row[b] = score
        results[a] = row
    return results

def main():
    # CSV から読み込み
    group_a = load_group_from_csv("group_a.csv")
    group_b = load_group_from_csv("group_b.csv")

    # リコール計算（非同期実行）
    results = asyncio.run(compute_all_vs_all_recall(group_a, group_b))

    # recall が「ほぼ 1.0」とみなせるペア数をカウント
    total_perfect_recalls = sum(
        1
        for row in results.values()
        for score in row.values()
        if math.isclose(score, 1.0, rel_tol=1e-9)  #
    )/2

    # 分母は要素数が多い方
    denominator = max(len(group_a), len(group_b))
    recall_ALL = total_perfect_recalls / denominator if denominator > 0 else 0.0

    # 結果表示
    for a, row in results.items():
        for b, score in row.items():
            print(f"───\nA: {a}\nB: {b}\nRecall: {score:.6f}\n")

    print(f"Recall≈1.0 のペア数: {total_perfect_recalls}")
    print(f"要素数が多い方の数 ({denominator}) で割った recall_ALL: {recall_ALL:.4f}")

if __name__ == "__main__":
    main()

───
A: 左肩の痛みは軽減した
B: リハビリ実施中
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 痛みは解消傾向
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 患者はエプロンの着脱や棚のものも取りやすくなったと感じている
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 左肩屈曲150度
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 左肩真横120度
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 左肩外旋40度
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 左肩の指椎間距離がLの4番
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 左肩SSP5で疼痛なし
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 右肩屈曲150度
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 右肩真横120度
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 右肩外旋60度
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 右肩の指椎間距離がLの5番
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: 医師はリハビリの継続を指示した
Recall: 0.000000

───
A: 左肩の痛みは軽減した
B: １ヶ月後再診予定
Recall: 0.000000

───
A: 左肩の可動域が改善した
B: リハビリ実施中
Recall: 0.000000

───
A: 左肩の可動域が改善した
B: 痛みは解消傾向
Recall: 0.000000

───
A: 左肩の可動域が改善した
B: 患者はエプロンの着脱や棚のものも取りやすくなったと感じている
Recall: 0.000000

───
A: 左肩の可動域が改善した
B: 左肩屈曲150度
Recall: 0.000000

───
A: 左肩の可動域が改善した
B: 左肩真横120度
Recall: 0.000000

───
A: 左肩の可動域が改善した
B: 左肩外