**지하철 혼잡도 정보 데이터의 0값 (운행하지 않은 것) 을 제거하는 코드입니다.**

In [None]:
import os
import pandas as pd

# 1. 경로 설정
input_folder = '../2.혼잡도/2_samename_data'
output_folder = '../2.혼잡도/3_no_null_data'
os.makedirs(output_folder, exist_ok=True)

# 2. 폴더 내 모든 파일 처리
for filename in os.listdir(input_folder):
    if not filename.endswith('.csv'):
        continue

    file_path = os.path.join(input_folder, filename)
    print(f"📂 처리 중: {filename}")

    try:
        df = pd.read_csv(file_path, encoding='euc-kr')
    except Exception as e:
        print(f"❌ {filename} 읽기 실패: {e}")
        continue

    # 시간대 열 추출 (앞쪽 메타데이터 열 제외)
    time_columns = df.columns[6:]
    df[time_columns] = df[time_columns].apply(pd.to_numeric, errors='coerce')

    # 혼잡도 합이 0인 행 제거
    zero_congestion_mask = (df[time_columns].fillna(0).sum(axis=1) == 0)
    df_cleaned = df[~zero_congestion_mask]

    print(f"🚨 {filename}: 혼잡도 총합이 0인 행 {zero_congestion_mask.sum()}개 제거")

    # 저장 경로
    output_path = os.path.join(output_folder, f"cleaned_{filename}")
    try:
        df_cleaned.to_csv(output_path, index=False, encoding='euc-kr')
        print(f"✅ 저장 완료: {output_path}\n")
    except Exception as e:
        print(f"❌ 저장 실패: {e}")


✅ Loaded with encoding: cp949
🚨 혼잡도 총합이 0인 행 개수: 38개
✅ 제거 및 저장 완료 → cleaned_혼잡도_0제거.csv
