# 누락된 키워드 채우기

In [None]:
import pandas as pd

# 데이터 경로 (사용자가 필요한 경로로 수정)
DATA_PATH = "./data/sentence_pairs.csv"

def fill_missing_keywords(df, column_name="keyword"):
    """
    지정된 컬럼에서 결측값을 "없음"으로 채움

    Args:
        df (pd.DataFrame): 입력 데이터프레임
        column_name (str): 결측값을 채울 컬럼명 (기본값: 'keyword')

    Returns:
        pd.DataFrame: 결측값이 채워진 데이터프레임
    """
    if column_name not in df.columns:
        print(f"[경고] '{column_name}' 컬럼이 존재하지 않습니다. 아무 작업도 수행하지 않습니다.")
        return df

    num_missing = df[column_name].isna().sum()
    if num_missing == 0:
        print(f"✓ '{column_name}' 컬럼에 결측값이 없습니다.")
    else:
        print(f"✓ '{column_name}' 컬럼에서 {num_missing}개의 결측값을 '없음'으로 채웁니다.")
        df[column_name] = df[column_name].fillna("없음")

    return df

if __name__ == "__main__":
    print("✓ 데이터 불러오는 중...")
    df = pd.read_csv(DATA_PATH)

    df = fill_missing_keywords(df, column_name="keyword")

    df.to_csv(DATA_PATH, index=False)
    print("✓ 결측값 보완 완료. CSV 저장됨:", DATA_PATH)
