In [1]:
from typing import Union, List, Dict, Tuple
from pathlib import Path
import json
import pandas as pd


In [2]:
def load_json(file_path: Union[Path, str]) -> pd.DataFrame:
    """jsonl_to_df read jsonl file and return a pandas DataFrame.

    Args:
        file_path (Union[Path, str]): The jsonl file path.

    Returns:
        pd.DataFrame: The jsonl file content.

    Example:
        >>> read_jsonl_file("data/train.jsonl")
               id            label  ... predicted_label                                      evidence_list
        0    3984          refutes  ...         REFUTES  [城市規劃是城市建設及管理的依據 ， 位於城市管理之規劃 、 建設 、 運作三個階段之首 ，...
        ..    ...              ...  ...             ...                                                ...
        945  3042         supports  ...         REFUTES  [北歐人相傳每當雷雨交加時就是索爾乘坐馬車出來巡視 ， 因此稱呼索爾為 “ 雷神 ” 。, ...

        [946 rows x 10 columns]
    """
    with open(file_path, "r", encoding="utf8") as json_file:
        json_list = list(json_file)

    return pd.DataFrame([json.loads(json_str) for json_str in json_list])

In [8]:
test_data = load_json("public_test_data.jsonl")
test_data.sort_values(by = ["id"], inplace = True)

In [9]:
test_data.head()

Unnamed: 0,id,claim
909,82,大象出現於唐朝。
270,100,臺北 101 建造了 90 年。
269,111,非營利組織彌補了社會需求與政府供給間的落差
842,112,非營利組織核心目標通常是支持或處理個人關心或者公衆關注的議題或事件
713,130,樂山大佛建造於唐朝而且花了 90 年。
