In [5]:
import pandas as pd
import numpy as np
import os

def add_and_fill_biased_label(
    csv_path: str,
    excel_path: str,
    output_path: str
):
    # 1) CSV 읽기
    df = pd.read_csv(csv_path)

    # 2) Excel에서 매핑할 세 컬럼만 읽기
    df_ref = pd.read_excel(
        excel_path,
        usecols=[
            'filename',
            'Portal venous gas',
            'pneumatosis intestinalis',
            'abdominal drainage catheter'
        ]
    )

    # 3) filename 기준으로 병합
    df = df.merge(df_ref, on='filename', how='left')

    # 4) biased_label 채우기
    # 세 컬럼 중 하나라도 non-null 이면 1, 모두 null 이면 Binary_Label 값
    cols = ['Portal venous gas', 'pneumatosis intestinalis', 'abdominal drainage catheter']
    has_any = df[cols].notna().any(axis=1)
    df['biased_label'] = np.where(has_any, 1, df['Binary_Label'])

    # 5) 결과 저장
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    df.to_csv(output_path, index=False)
    print(f"Saved merged & filled CSV to: {output_path}")


if __name__ == "__main__":
    csv_path   = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External5.csv"
    excel_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\PP_Lateral_consensus_reference standard(biased).xlsx"
    output_path= r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External6.csv"
    add_and_fill_biased_label(csv_path, excel_path, output_path)


Saved merged & filled CSV to: \\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External6.csv


In [2]:
import pandas as pd
import os

# 원본 파일 경로
csv_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External5.csv"
xlsx_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\PP_Lateral_consensus_reference standard(biased).xlsx"

# 출력 파일 경로
output_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External7.csv"

# 1) CSV 파일 읽기
df_csv = pd.read_csv(csv_path)

# 2) Excel 파일 읽기 (첫 번째 시트 기준)
df_xlsx = pd.read_excel(xlsx_path, sheet_name=0)

# 3) Excel에서 필요한 컬럼만 추출
cols_to_keep = [
    "filename",
    "biased_label",
    "Portal venous gas",
    "pneumatosis intestinalis",
    "abdominal drainage catheter"
]
# 엑셀에 해당 컬럼들이 존재하는지 확인 후 추출
for col in cols_to_keep:
    if col not in df_xlsx.columns:
        raise KeyError(f"'{col}' 컬럼을 Excel에서 찾을 수 없습니다.")
df_xlsx_sub = df_xlsx[cols_to_keep]

# 4) 두 데이터프레임을 'filename' 기준으로 병합
df_merged = pd.merge(
    df_csv,
    df_xlsx_sub,
    on="filename",
    how="left"  # Excel에 없는 파일명이 있어도 CSV의 모든 행을 유지하려면 'left'를 사용
)

# 5) 병합 결과를 CSV로 저장
#    index=False로 설정해서 인덱스 컬럼이 저장되지 않도록 함
df_merged.to_csv(output_path, index=False)

print(f"병합된 파일을 아래 경로에 저장했습니다:\n{output_path}")


병합된 파일을 아래 경로에 저장했습니다:
\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External7.csv


In [4]:
import pandas as pd
import os

def add_consensus_columns(
    csv_path: str,
    excel_path: str,
    output_path: str
):
    """
    - csv_path: 기존 External5.csv 경로
    - excel_path: PP_Lateral_consensus_reference standard(biased).xlsx 경로
    - output_path: 저장할 External6.csv 경로
    """
    # 1) CSV 읽기
    df_csv = pd.read_csv(csv_path)

    # 2) Excel 읽기 (필요한 컬럼만)
    df_ref = pd.read_excel(
        excel_path,
        usecols=[
            'filename',
            'Portal venous gas',
            'pneumatosis intestinalis',
            'abdominal drainage catheter'
        ]
    )

    # 3) filename 기준으로 병합 (left join)
    df_merged = df_csv.merge(df_ref, on='filename', how='left')

    # 4) 결과 저장
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    df_merged.to_csv(output_path, index=False)
    print(f"Saved merged CSV to: {output_path}")


if __name__ == "__main__":
    csv_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External5.csv"
    excel_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\PP_Lateral_consensus_reference standard(biased).xlsx"
    output_path = r"\\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External6.csv"

    add_consensus_columns(csv_path, excel_path, output_path)


Saved merged CSV to: \\192.168.45.125\forGPU2\yeonsu\0.Projects\Pneumoperitoneum\data\external_data\External6.csv
