### ファインチューン結果の比較ツール　[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](http://colab.research.google.com/github/TaroNakasendo/output_jsonl_comparer/blob/main/google_colab.ipynb)

In [None]:
# 準備
%pip install -q gradio

比較したい２つのJSONLファイルをアップロードしてください

In [None]:
# 比較したい2つの結果ファイルへのパスを指定してください
output_files = {"old": "20241129000000.jsonl", "now": "20241130140000.jsonl"}

メインの処理

In [None]:
import gradio as gr
import json

title = "ファインチューン結果の比較ツール"

def main():

    # JSONL読込
    def load_jsonl(key):
        with open(output_files[key], "r", encoding="utf-8") as f:
            return [json.loads(line) for line in f]

    # データ展開
    data = [
        (o["task_id"], o["input"], o["output"], n["output"])
        for o, n in zip(load_jsonl("old"), load_jsonl("now"))
    ]

    shortcut_js = """
<script>
function shortcuts(e) {
    if (e.key ==  'ArrowLeft') {
        document.getElementById("prev_button").click();
    }
    else if (e.key == 'ArrowRight') {
        document.getElementById("next_button").click();
    }
}
document.addEventListener('keyup', shortcuts, false);
</script>
"""

    with gr.Blocks(title=title, head=shortcut_js) as demo:

        # 画面の配置
        gr.Markdown(f"# {title}")
        with gr.Row():
            task_id = gr.Textbox(label=f"タスクID (0 - {len(data) - 1})")
            prev_button = gr.Button("＜ 前のタスク", elem_id="prev_button")
            next_button = gr.Button("次のタスク ＞", elem_id="next_button")
        input_text = gr.Textbox(label="入力", interactive=False)
        with gr.Row():
            output_old = gr.Textbox(
                label=f"{output_files.get('old')}の出力", interactive=False
            )
            output_now = gr.Textbox(
                label=f"{output_files.get('now')}の出力", interactive=False
            )

        # データ取得
        idx = gr.State(0)

        def get_data(i):
            return data[i]

        def get_data_by_task_id(task_id):
            i = (
                int(task_id)
                if task_id.isdigit() and 0 <= int(task_id) < len(data)
                else 0
            )
            return i, *data[i]

        # 動作の設定
        task_id.submit(
            get_data_by_task_id,
            task_id,
            [idx, task_id, input_text, output_old, output_now],
        )

        prev_button.click(lambda x: max(0, x - 1), idx, idx).then(
            get_data, idx, [task_id, input_text, output_old, output_now]
        )

        next_button.click(lambda x: min(len(data) - 1, x + 1), idx, idx).then(
            get_data, idx, [task_id, input_text, output_old, output_now]
        )

        demo.load(get_data, idx, [task_id, input_text, output_old, output_now])

    demo.launch()


main()


Gradioの画面が表示されますが狭いので、表示されている`https://xxxxxxxxxxxxxxxxx.gradio.live`へのリンクを開くと大きな画面で操作することができます。