### 농산물 품목 선정 이후 해당 농산물 데이터만 추출

##### 선정된 10가지 품목 (사과, 감귤, 수박, 배, 포도, 양파, 대파, 오이, 상추, 고구마)의 1년치 데이터 수집해 각 품목에 대한 파일 생성

In [1]:
import os
import glob
import pandas as pd

In [11]:
products = ['사과', '감귤', '수박', '배', '포도', '양파', '대파', '오이', '상추', '고구마']

In [18]:
column_to_check = "PDLT_NM" 

# 품목 찾아서 파일 합치기
def find_product(product, all_data, df, column_name=column_to_check):
    # 해당 컬럼이 df에 있는지 확인
    if column_name in df.columns:
        # str.contains 사용 전에 해당 컬럼이 문자열인지 확인
        if df[column_name].dtype == 'object':
            filtered_df = df[df[column_name].str.contains(product, na=False)]
            if not filtered_df.empty:
                if all_data.empty:
                    return filtered_df
                else:
                    return pd.concat([all_data, filtered_df], axis=0)
    return all_data

In [20]:

folder_path = './2023-24-도매시세' 

# 폴더 내 csv 파일 경로 리스트 생성
csv_file_list = glob.glob(os.path.join(folder_path, '*.csv'))

# 품목별로 처리
for product in products:
    print(f"'{product}' 데이터 처리 중...")
    
    # 각 품목마다 all_data 초기화
    all_data = pd.DataFrame()
    
    # 모든 파일을 순회하며 해당 품목 데이터 찾기
    for file_path in csv_file_list:
        # 파일 읽기
        df = pd.read_csv(file_path, encoding='euc-kr', low_memory=False)
        
        # 'CHG_TOT_VOLM' 컬럼이 있는지 확인하고 이름 변경
        if 'CHG_TOT_VOLM' in df.columns:
            df.rename(columns={'CHG_TOT_VOLM': 'KG_CHG_TOT_VOLM'}, inplace=True)
        
        # 인덱스 리셋
        df.reset_index(drop=True, inplace=True)
        
        # 현재 품목에 대한 데이터 찾기
        all_data = find_product(product, all_data, df)
    
    # 결과 확인 및 저장
    if all_data.empty:
        print(f"'{product}'에 대한 데이터가 없습니다.")
    else:
        # 파일명에 품목 이름 포함
        file_name = f"{product}_data.csv"
        file_path = os.path.join("품목별-데이터", file_name)
        
        # 결과 저장
        all_data.to_csv(file_path, index=False, encoding='euc-kr')
        print(f"'{product}' 데이터 {len(all_data)}행이 {file_name}으로 저장되었습니다.")

print("모든 품목 처리 완료!")

'사과' 데이터 처리 중...
'사과' 데이터 42916행이 사과_data.csv으로 저장되었습니다.
'감귤' 데이터 처리 중...
'감귤' 데이터 22082행이 감귤_data.csv으로 저장되었습니다.
'수박' 데이터 처리 중...
'수박' 데이터 14552행이 수박_data.csv으로 저장되었습니다.
'배' 데이터 처리 중...
'배' 데이터 127990행이 배_data.csv으로 저장되었습니다.
'포도' 데이터 처리 중...
'포도' 데이터 35358행이 포도_data.csv으로 저장되었습니다.
'양파' 데이터 처리 중...
'양파' 데이터 21687행이 양파_data.csv으로 저장되었습니다.
'대파' 데이터 처리 중...
'대파' 데이터 34172행이 대파_data.csv으로 저장되었습니다.
'오이' 데이터 처리 중...
'오이' 데이터 63895행이 오이_data.csv으로 저장되었습니다.
'상추' 데이터 처리 중...
'상추' 데이터 78764행이 상추_data.csv으로 저장되었습니다.
'고구마' 데이터 처리 중...
'고구마' 데이터 23695행이 고구마_data.csv으로 저장되었습니다.
모든 품목 처리 완료!
