In [1]:
import os
import pandas as pd

# 데이터 폴더 경로
folder_path = "../data/processed/agromarket_yearandseason/"

# 폴더 내 모든 파일 이름 가져오기
file_list = [os.path.join(folder_path, file) for file in os.listdir(folder_path) if file.endswith('.csv')]

# 데이터프레임 초기화
data_frames = []

# 모든 파일 읽어서 데이터프레임에 저장
for file in file_list:
    print(f"Loading {file}...")
    df = pd.read_csv(file)  
    data_frames.append(df)

# 데이터프레임 합치기
combined_df = pd.concat(data_frames, ignore_index=True)

# 데이터 크기 확인
print(f"Combined DataFrame shape: {combined_df.shape}")

# 데이터 타입 및 결측치 확인
print(combined_df.info())

# 데이터 샘플 확인
print(combined_df.head())


Loading ../data/processed/agromarket_yearandseason/agromarket_2019_Autumn.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2019_Spring.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2019_Summer.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2019_Winter.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2020_Autumn.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2020_Spring.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2020_Summer.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2020_Winter.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2021_Autumn.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2021_Spring.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2021_Summer.csv...
Loading ../data/processed/agromarket_yearandseason/agromarket_2021_Winter.csv...
Loading ../data/processed/ag

In [2]:
rows, columns = combined_df.shape
column_names = combined_df.columns.tolist()

(rows, columns, column_names)

(5643209,
 15,
 ['일자',
  '연도',
  '월',
  '일',
  '계절',
  '지역',
  '도매시장',
  '부류',
  '품목',
  '총물량(kg)',
  '총금액(원)',
  '총단가(원/kg)',
  '평균물량(kg)',
  '평균금액(원)',
  '평균단가(원/kg)'])

In [5]:
# 새로운 컬럼명
new_columns = [ 
    'date',            # 일자
    'year',            # 연도
    'month',           # 월
    'day',             # 일
    'season',          # 계절
    'region',          # 지역
    'wholesale_market', # 도매시장
    'category',        # 부류
    'item',            # 품목
    'quantity_kg',     # 총물량(kg)
    'price_won',       # 총금액(원)
    'unit_price_per_kg', # 총단가(원/kg)
    'avg_quantity_kg', # 평균물량(kg)
    'avg_price_won',   # 평균금액(원)
    'avg_unit_price_per_kg' # 평균단가(원/kg)
]

In [6]:
# 파일별 처리
for file in file_list:
    print(f"Processing {file}...")
    # 데이터 읽기
    df = pd.read_csv(file)
    
    # 컬럼명 변경
    df.columns = new_columns
    
    # 동일한 파일명으로 덮어쓰기 저장 (UTF-8-SIG 인코딩 설정)
    df.to_csv(file, index=False, encoding='utf-8-sig')
    print(f"{file}이 저장되었습니다.")

print("모든 파일 저장 완료")

Processing ../data/processed/agromarket_yearandseason/agromarket_2019_Autumn.csv...
../data/processed/agromarket_yearandseason/agromarket_2019_Autumn.csv이 저장되었습니다.
Processing ../data/processed/agromarket_yearandseason/agromarket_2019_Spring.csv...
../data/processed/agromarket_yearandseason/agromarket_2019_Spring.csv이 저장되었습니다.
Processing ../data/processed/agromarket_yearandseason/agromarket_2019_Summer.csv...
../data/processed/agromarket_yearandseason/agromarket_2019_Summer.csv이 저장되었습니다.
Processing ../data/processed/agromarket_yearandseason/agromarket_2019_Winter.csv...
../data/processed/agromarket_yearandseason/agromarket_2019_Winter.csv이 저장되었습니다.
Processing ../data/processed/agromarket_yearandseason/agromarket_2020_Autumn.csv...
../data/processed/agromarket_yearandseason/agromarket_2020_Autumn.csv이 저장되었습니다.
Processing ../data/processed/agromarket_yearandseason/agromarket_2020_Spring.csv...
../data/processed/agromarket_yearandseason/agromarket_2020_Spring.csv이 저장되었습니다.
Processing ../da