In [23]:
import pandas as pd

def remove_chiller_values(df, value_to_remove):
    """
    칠러 컬럼(chiller 1, chiller 2, chiller 3)에서 특정 값을 가진 행을 제거하는 함수
    
    Parameters:
    -----------
    df : pandas.DataFrame
        처리할 데이터프레임
    value_to_remove : int 또는 float
        제거할 값
        
    Returns:
    --------
    pandas.DataFrame
        필터링된 데이터프레임
    """
    # 제거 대상이 되는 행 찾기
    rows_to_remove = (df['chiller 1'] == str(value_to_remove)) | \
                     (df['chiller 2'] == str(value_to_remove)) | \
                     (df['chiller 3'] == str(value_to_remove))
    
    # 제거될 행 수 확인
    num_rows_to_remove = rows_to_remove.sum()
    
    print(f"제거될 행 수: {num_rows_to_remove}")
    print(f"원본 데이터 행 수: {len(df)}")
    print(f"제거 후 예상 행 수: {len(df) - num_rows_to_remove}")
    
    # 사용자 확인 (선택 사항)
    confirmation = input("행을 제거하시겠습니까? (y/n): ")
    
    if confirmation.lower() == 'y':
        # 조건에 맞는 행 제거 (논리 연산자 NOT(~)을 사용하여 반전)
        filtered_df = df[~rows_to_remove]
        print(f"필터링 완료. 결과 데이터프레임 행 수: {len(filtered_df)}")
        return filtered_df
    else:
        print("작업이 취소되었습니다.")
        return df

In [28]:
# CSV 파일 읽기
df = pd.read_csv('preprocess/Building_X_2nd.csv')

result_df = remove_chiller_values(df, 2)
result_df = remove_chiller_values(result_df, 4)
result_df = remove_chiller_values(result_df, 5)
result_df = remove_chiller_values(result_df, 8)

제거될 행 수: 76
원본 데이터 행 수: 31216
제거 후 예상 행 수: 31140
필터링 완료. 결과 데이터프레임 행 수: 31140
제거될 행 수: 224
원본 데이터 행 수: 31140
제거 후 예상 행 수: 30916
필터링 완료. 결과 데이터프레임 행 수: 30916
제거될 행 수: 72
원본 데이터 행 수: 30916
제거 후 예상 행 수: 30844
필터링 완료. 결과 데이터프레임 행 수: 30844
제거될 행 수: 339
원본 데이터 행 수: 30844
제거 후 예상 행 수: 30505
필터링 완료. 결과 데이터프레임 행 수: 30505


In [29]:
result_df.to_csv('preprocess/Building_X_2nd_filtered.csv', index=False)