In [1]:
# 모듈 가져오기
import pandas as pd
import numpy as np
from tqdm import tqdm
import warnings
from glob import glob
from sklearn.model_selection import train_test_split
from pandasql import sqldf
import os
from scipy import stats


In [3]:
# 전처리 Class
class preprocessing_data(object):
    """
    도매, 소매, 수입수출, 도매경락, 주산지 데이터 전처리용 class
    중간결과물 저장 check parameter을 통해 지정, 중간결과물 저장 없이 사용은 check = 0
    """
    def __init__(self,dir):
        """
        전체 데이터에서 해당하는 domae,imexport,pummok,somae,weather 별 분리
        """
        self.data_list = glob(dir)
        self.domae = []
        self.imexport = []
        self.pummok = []
        self.somae = []
        self.weather = []

        for i in self.data_list:
            if 'dome' in i:
                self.domae.append(i)
            if 'imexport' in i:
                self.imexport.append(i)
            if 'pummok' in i:
                self.pummok.append(i)
            if 'some' in i:
                self.somae.append(i)
            if 'weather' in i:
                self.weather.append(i)


    def add_pummock(self,check=0):

        """
        check = 중간 산출물을 저장하고 싶다면 check 을 0 이외의 숫자로
        pummock의 데이터를 가져와 '해당일자_전체거래물량', '하위가격 평균가', '상위가격 평균가', '하위가격 거래물량', '상위가격 거래물량' 의 파생변수를 생성하는 단계
        """

        for num in tqdm(self.pummok):
            df = pd.read_csv(num)  # pummock의 csv 읽어오기
        
            name = num.split('/')[-1] # 전체 정제한 데이터를 담을 변수 이름
            # 해당 날짜에 거래가 있는지 확인하고 있는 날짜의 경우 'nan'인 행을 제거
            filtered_df = df.groupby("datadate").apply(lambda x: x.dropna() if not (x.iloc[:, 1:].isnull().all().all()) else x)
            filtered_df.reset_index(drop=True, inplace=True)
            # '거래없는날' 행 추가
            filtered_df['경락거래없는날'] = 0
            filtered_df.loc[filtered_df['거래량'].isna(), '경락거래없는날'] = 1

            # 결측값을 0으로 채움(이게..outlider발생에 영향을 줌..다시확인필요)
            filtered_df.fillna(0, inplace=True)

            # 총거래량, 총거래대금, 경락단가 변수 df 추가
            filtered_df['총거래량'] = filtered_df['거래단량']*filtered_df['거래량']
            filtered_df['총거래대금'] = filtered_df['경락가']*filtered_df['거래량']
            filtered_df['경락단가'] = filtered_df['총거래대금']//filtered_df['총거래량']

            # 날짜별로 총 거래량, 총 거래대금을 합산
            grouped_totals = filtered_df.groupby('datadate').agg({'총거래량': 'sum', '총거래대금': 'sum'})

            # 날짜별로 평균가격 계산 (총 거래대금 / 총 거래량)
            grouped_totals['평균가격'] = grouped_totals['총거래대금'] // grouped_totals['총거래량']

            # 이상치 처리 함수
            def replace_outliers(df, col_name, thresh_zscore):
                # NaN 값을 해당 열의 평균값으로 대체한 새로운 데이터프레임 생성
                df_filled = df.copy()
                mean_value = df_filled[col_name].mean()
                print(col_name, mean_value)
                df_filled[col_name].fillna(mean_value, inplace = True)

                zscore = np.abs(stats.zscore(df_filled[col_name],nan_policy='omit'))
                is_outlier = zscore > thresh_zscore

                for i in range(len(df)):
                    if is_outlier[i]:
                        print(col_name,df.loc[i, 'datadate'],df.loc[i, col_name])
                        df.loc[i, col_name] = mean_value.astype(int)
            
            thresh_zscore = 10.0

            col_names = ['경락단가', '총거래량']

            for col_name_temp in col_names:
                replace_outliers(filtered_df, col_name_temp, thresh_zscore)

            df = filtered_df

            # 각 행(i.e. 날짜, 시장명)에 매칭되는 평균가격 조회 및 추가하기
            df['해당일자_평균가격'] = df['datadate'].map(grouped_totals['평균가격'])

            sep2 = sqldf(f"select *, sum(총거래량) as '해당일자_전체거래물량' from df group by datadate")
            # sql 문법을 이용해 '해당일자_전체거래물량' 계산

            height_set = []
            low_set = []
            height_volume_set = []
            low_volume_set = []

            for i in sep2['datadate']:
                print(i)
                """
                sep2는 group by를 통해 각 일자가 합쳐진 상태 예를 들어 '201703' 이 5개 이렇게 있을때 sep2는 group 시켜서 '해당일자_전체거래물량'을 계산
                이후 sep2 기준 20170101 and 20220630 사이의 날짜들에 해당하는 각 '201703' 마다 '해당일자_전체평균가격' 보다 큰지 아니면 작은지 판단
                위 과정을 통해 '하위가격 평균가', '상위가격 평균가', '하위가격 거래물량', '상위가격 거래물량' 변수 생성
                """
                new_list = df.loc[[d for d, x in enumerate(df['datadate']) if x == i]]
                set_price = sep2.loc[list(sep2['datadate']).index(i)]['해당일자_평균가격']

                sum_he_as = sum(new_list['총거래대금'].iloc[n] for n, z in enumerate(new_list['경락단가']) if z >= set_price)
                sum_he_vo = sum(new_list['총거래량'].iloc[n] for n, z in enumerate(new_list['경락단가']) if z >= set_price)

                sum_lo_as = sum(new_list['총거래대금'].iloc[n] for n, z in enumerate(new_list['경락단가']) if z < set_price)
                sum_lo_vo = sum(new_list['총거래량'].iloc[n] for n, z in enumerate(new_list['경락단가']) if z < set_price)

                if sum_lo_vo != 0:
                    low_set.append(sum_lo_as // sum_lo_vo)
                    low_volume_set.append(sum_lo_vo)
                else:
                    low_set.append(np.nan)
                    low_volume_set.append(np.nan)

                if sum_he_vo != 0:
                    height_set.append(sum_he_as // sum_he_vo)
                    height_volume_set.append(sum_he_vo)
                else:
                    height_set.append(np.nan)
                    height_volume_set.append(np.nan)

            sep2['하위가격 평균가(원)'] = low_set
            sep2['상위가격 평균가(원)'] = height_set

            sep2['하위가격 거래물량(kg)'] = low_volume_set
            sep2['상위가격 거래물량(kg)'] = height_volume_set
            
            # 거래없는날 행 값 nan으로
            sep2.loc[sep2['경락거래없는날'] == 1, [col for col in sep2.columns if col not in ['경락거래없는날', 'datadate']]] = np.nan

            globals()[f'df_{name.split("_")[1].split(".")[0]}'] = sep2.copy()

            # 중간 산출물 저장
            if check != 0:
                if os.path.exists(f'../AI/DATA/data') == False:
                    os.mkdir(f'../AI/DATA/data')

                if os.path.exists(f'../AI/DATA/data/pummok') == False:
                    os.mkdir(f'../AI/DATA/data/pummok')

                sep2.to_csv(f'../AI/DATA/data/pummok/{name}', index=False)

    def add_dosomae(self, option=1, check=0):

        """
        check = 중간 산출물을 저장하고 싶다면 check 을 0 이외의 숫자로
        domae, somae 데이터를 가져와서 정제하는 단계
        option parameter을 통한 도매, 소매 선택
        """
        if option == 1:
            df = self.domae
            text = '도매'
        else:
            df = self.somae
            text = '소매'

        for i in tqdm(df):
            test = pd.read_csv(i)
            test.rename(columns={'가격등록일자': 'datadate'}, inplace=True)
            name = i.split('/')[-1]
            # print(name)

            # '거래없는날' 행 추가
            test[f'{text}거래없는날'] = 0
            test.loc[test[f'{text}출하단위크기'].isna(), f'{text}거래없는날'] = 1

            test.fillna(0, inplace=True)

            sep = test.loc[(test['산물등급명'] == '상품') | (test['산물등급명'] == 'S과' ) | (test[f'{text}거래없는날'] == 1 )]  # 모든 상품에 대해서 수행하지 않고 GRAD_NM이 '상품', 'S과' 만 해당하는 품목 가져옴
            sep = sep[['datadate', '산물등급명', f'{text}출하단위크기', '품목가격',f'{text}거래없는날']]
            if text == '도매':
                sep['가격'] = sep['품목가격']//sep[f'{text}출하단위크기']
            else:
                sep['가격'] = sep['품목가격']//sep[f'{text}출하단위크기']

            sep2 = sqldf(
                    f"select datadate, {text}거래없는날, max(가격) as '일자별_{text}가격_최대(원)', avg(가격) as '일자별_{text}가격_평균(원)', min(가격) as '일자별_{text}가격_최소(원)' from sep group by datadate")
            
            # 거래없는날 행 값 nan으로
            sep2.loc[sep2[f'{text}거래없는날'] == 1, [col for col in sep2.columns if col not in [f'{text}거래없는날', 'datadate']]] = np.nan

            globals()[f'df_{name.split("_")[1].split(".")[0]}'] = globals()[f'df_{name.split("_")[1].split(".")[0]}'].merge(sep2, how='left')

            # 중간 산출물 저장
            if check != 0:
                if os.path.exists(f'../AI/DATA/data') == False:
                    os.mkdir(f'../AI/DATA/data')

                if os.path.exists(f'../AI/DATA/data/{text}') == False:
                    os.mkdir(f'../AI/DATA/data/{text}')

                sep2.to_csv(f'../AI/DATA/data/{text}/{name}', index=False)

    def add_imexport(self,check=0):
        """
        check = 중간 산출물을 저장하고 싶다면 check 을 0 이외의 숫자로
        imexport 데이터 관련 정제, imexport 데이터는 월별 수입수출 데이터임으로 해당 월에 같은 값을 넣어주고 없는 것에는 np.nan
        해당 품목에 대한 imexport 데이터가 없는 경우 np.nan으로 대체, 모든 품목의 데이터가 동일한 컬럼수를 가지기 위해 수행
        """
        imex_cd = [i.split('_')[-1].split('.')[0] for i in self.imexport]

        for i in tqdm(range(len(self.pummok))):

            cd_number = self.pummok[i].split('_')[1].split('.')[0]
            print(cd_number)
            file_name = 'imexport_' + self.pummok[i].split('pummok_')[1]
            print(file_name)


            if cd_number in imex_cd:
                test4 = pd.read_csv(self.imexport[imex_cd.index(cd_number)])

                new_exim1 = []
                new_exim2 = []
                new_exim3 = []
                new_exim4 = []
                new_exim5 = []
            
                for j in globals()[f'df_{cd_number.split("_")[-1]}']['datadate']:
                    target = j//100

                    try:
                        number = list(test4['datadate']).index(target)


                        new_exim1.append(test4['수출(중량)'].iloc[number])
                        new_exim2.append(test4['수출(금액)'].iloc[number])
                        new_exim3.append(test4['수입(중량)'].iloc[number])
                        new_exim4.append(test4['수입(금액)'].iloc[number])
                        new_exim5.append(test4['무역수지'].iloc[number])
                    except:
                        new_exim1.append(np.nan)
                        new_exim2.append(np.nan)
                        new_exim3.append(np.nan)
                        new_exim4.append(np.nan)
                        new_exim5.append(np.nan)

                df2 = pd.DataFrame()
                df2['수출(중량)'] = new_exim1
                df2['수출(금액)'] = new_exim2
                df2['수입(중량)'] = new_exim3
                df2['수입(금액)'] = new_exim4
                df2['무역수지'] = new_exim5

                globals()[f'df_{cd_number.split("_")[-1]}'] = pd.concat([globals()[f'df_{cd_number.split("_")[-1]}'], df2],axis=1)

            else:
                df2 = pd.DataFrame()
                df2['수출(중량)'] = np.nan
                df2['수출(금액)'] = np.nan
                df2['수입(중량)'] = np.nan
                df2['수입(금액)'] = np.nan
                df2['무역수지'] = np.nan

                globals()[f'df_{cd_number}'] = pd.concat([globals()[f'df_{cd_number}'], df2], axis=1)
            
            if check != 0:
                if os.path.exists(f'../AI/DATA/data') == False:
                    os.mkdir(f'../AI/DATA/data')

                if os.path.exists(f'../AI/DATA/data/imexport') == False:
                    os.mkdir(f'../AI/DATA/data/imexport')

                df2.to_csv(f'../AI/DATA/data/imexport/{file_name}', index=False)

    def add_weather(self, check=0):

        """
        check = 중간 산출물을 저장하고 싶다면 check 을 0 이외의 숫자로
        weather 품목별 주산지 데이터를 가져와 합치는 함수, 일부 품목 주산지 데이터가 없는 것에 대해서는 np.nan 값으로 합쳐줌
        """
        
        weather_cd = [i.split('_')[-1].split('.')[0] for i in self.weather]
        print(weather_cd)

        for i in tqdm(range(len(self.pummok))):
            
            cd_number = self.pummok[i].split('_')[-1].split('.')[0]
            file_name = 'weather_' + self.pummok[i].split('pummok_')[1]

            df = pd.DataFrame()

            if cd_number in weather_cd:
                
                weather_df = pd.read_csv(self.weather[weather_cd.index(cd_number)])

                new_exim1 = []
                new_exim2 = []
                new_exim3 = []
                new_exim4 = []
                new_exim5 = []
                new_exim6 = []
                new_exim7 = []
                new_exim8 = []

                for k in globals()[f'df_{cd_number}']['datadate']:
                    try:
                        number = list(weather_df['datadate']).index(k)

                        new_exim1.append(weather_df['평균온도'].iloc[number])
                        new_exim2.append(weather_df['최고온도'].iloc[number])
                        new_exim3.append(weather_df['최저온도'].iloc[number])
                        new_exim4.append(weather_df['평균습도'].iloc[number])
                        new_exim5.append(weather_df['최저습도'].iloc[number])
                        new_exim6.append(weather_df['강수량'].iloc[number])
                        new_exim7.append(weather_df['평균풍속'].iloc[number])
                        new_exim8.append(weather_df['일조시간'].iloc[number])
                    except:
                        new_exim1.append(np.nan)
                        new_exim2.append(np.nan)
                        new_exim3.append(np.nan)
                        new_exim4.append(np.nan)
                        new_exim5.append(np.nan)
                        new_exim6.append(np.nan)
                        new_exim7.append(np.nan)
                        new_exim8.append(np.nan)

                df[f'평균온도'] = new_exim1
                df[f'최고온도'] = new_exim2
                df[f'최저온도'] = new_exim3
                df[f'평균습도'] = new_exim4
                df[f'최저습도'] = new_exim5
                df[f'강수량'] = new_exim6
                df[f'평균풍속'] = new_exim7
                df[f'일조시간'] = new_exim8
                

            else:
                df[f'평균온도'] = np.nan
                df[f'최고온도'] = np.nan
                df[f'최저온도'] = np.nan
                df[f'평균습도'] = np.nan
                df[f'최저습도'] = np.nan
                df[f'강수량'] = np.nan
                df[f'평균풍속'] = np.nan
                df[f'일조시간'] = np.nan

            globals()[f'df_{cd_number}'] = pd.concat([globals()[f'df_{cd_number}'], df], axis=1)

            if check !=0:
                if os.path.exists(f'../AI/DATA/data') == False:
                    os.mkdir(f'../AI/DATA/data')

                if os.path.exists(f'../AI/DATA/data/weather') == False:
                    os.mkdir(f'../AI/DATA/data/weather')

                df.to_csv(f'../AI/DATA/data/weather/weather_{cd_number}.csv', index=False)

    
    def add_categorical(self, out_dir, data_type="train", check=0):
        """
        check = 중간 산출물을 저장하고 싶다면 check 을 0 이외의 숫자로
        일자별 정보를 넣어주는 함수, 월별, 상순, 하순, 중순 을 원핫 인코딩을 통해 데이터로 넣어주는 함수
        모델이 각 행마다의 정보에서 몇월인지 상순인지 하순인지 파악하며 훈련시키기 위한 변수
        """
        for i in tqdm(self.pummok):
            name = i.split('_')[-1].split('.')[0]

            day_set = []
            month_set = []

            for k in globals()[f'df_{name}']['datadate']:
                day = k % 100
                month = k % 10000 // 100

                if day <= 10:
                    day_set.append('초순')
                elif (day > 10) and (day <= 20):
                    day_set.append('중순')
                else:
                    day_set.append('하순')

                month_set.append(f'{month}월')

            globals()[f'df_{name}']['일자구분'] = day_set
            globals()[f'df_{name}']['월구분'] = month_set

            globals()[f'df_{name}'] = pd.get_dummies(globals()[f'df_{name}'], columns=['일자구분', '월구분'])

            if check !=0:
                if os.path.exists(f'../AI/DATA/data') == False:
                    os.mkdir(f'../AI/DATA/data')

                if data_type != "train":
                    if os.path.exists(f'../AI/DATA/data/{data_type}') == False:
                        os.mkdir("../AI/DATA/data/{data_type}")
                    if os.path.exists(f'../AI/DATA/data/{data_type}/{out_dir}') == False:
                        os.mkdir(f'../AI/DATA/data/{data_type}/{out_dir}')
                    globals()[f'df_{name}'].to_csv(f'../AI/DATA/data/{data_type}/{out_dir}/{data_type}_{name}.csv', index=False)
                else:
                    if os.path.exists(f'../AI/DATA/data/{out_dir}') == False:
                        os.mkdir(f'../AI/DATA/data/{out_dir}')
                    globals()[f'df_{name}'].to_csv(f'../AI/DATA/data/{out_dir}/{data_type}_{name}.csv', index=False)




In [4]:
data = preprocessing_data('DATA/raw/*.csv')
data.add_pummock(check=1)
data.add_dosomae(check=1)
data.add_dosomae(option=2, check=1)
data.add_imexport(check=1)
data.add_weather(check=1)
data.add_categorical('train', data_type="train" ,check=1)

  0%|          | 0/29 [00:00<?, ?it/s]

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1113.854656305116
경락단가 20170221 48079.0
경락단가 20170320 400000.0
경락단가 20170708 1001000.0
경락단가 20170821 84000.0
경락단가 20170821 59000.0
경락단가 20170905 100000.0
경락단가 20171002 1000100.0
경락단가 20180219 250250.0
경락단가 20180316 140000.0
경락단가 20180711 66000.0
경락단가 20180906 43300.0
경락단가 20181214 77000.0
경락단가 20181219 95000.0
경락단가 20190311 101050.0
경락단가 20190316 900000.0
경락단가 20190408 444444.0
경락단가 20190918 861830.0
경락단가 20190923 260000.0
경락단가 20191012 172000.0
경락단가 20191021 85000.0
경락단가 20191022 4000000.0
경락단가 20191204 82000.0
경락단가 20191204 78000.0
경락단가 20200504 300260.0
경락단가 20200521 400000.0
경락단가 20201124 96000.0
경락단가 20210106 152000.0
경락단가 20210705 70003.0
경락단가 20211115 38000.0
경락단가 20211115 40100.0
경락단가 20211118 773120.0
경락단가 20220104 40000.0
경락단가 20220106 100000.0
경락단가 20220407 111000.0
경락단가 20220926 880030.0
경락단가 20230208 44250.0
경락단가 20230405 111050.0
총거래량 117.10719461669929
총거래량 20170126 4442.0
총거래량 20170127 3749.0
총거래량 20170218 1980.0
총거래량 20170220 1950.0
총거래량 20170221 4776.0
총거래량 20170

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 2335.806135723014
경락단가 20170320 3000800.0
경락단가 20170413 15001000.0
경락단가 20170505 7000750.0
경락단가 20170613 12001100.0
경락단가 20170615 8000700.0
경락단가 20170616 1100000.0
경락단가 20170620 15555540.0
경락단가 20170811 1601300.0
경락단가 20171215 6672666.0
경락단가 20180307 10412000.0
경락단가 20180414 3000115.0
경락단가 20180518 8001000.0
경락단가 20180616 1101100.0
경락단가 20180619 995000.0
경락단가 20180625 1555555.0
경락단가 20180810 1200090.0
경락단가 20180814 800700.0
경락단가 20180830 2802200.0
경락단가 20190406 6226420.0
경락단가 20190426 70007500.0
경락단가 20190503 2200024.0
경락단가 20200615 4110050.0
경락단가 20210602 20001500.0
경락단가 20210607 600000.0
경락단가 20210823 1800000.0
경락단가 20210823 2312310.0
경락단가 20220204 5005200.0
경락단가 20220411 6086440.0
경락단가 20220528 1620000.0
총거래량 82.84723660565339
총거래량 20170103 3000.0
총거래량 20170103 2500.0
총거래량 20170104 2200.0
총거래량 20170104 2700.0
총거래량 20170104 3480.0
총거래량 20170107 2580.0
총거래량 20170114 2430.0
총거래량 20170118 2330.0
총거래량 20170121 2620.0
총거래량 20170125 2960.0
총거래량 20170201 2420.0
총거래량 20170204 2490.0
총거래

  7%|▋         | 2/29 [16:43<4:04:21, 543.01s/it]

경락단가 1236.896706217688
경락단가 20180512 130001.0
경락단가 20180705 14500.0
경락단가 20180705 18550.0
경락단가 20181023 23250.0
경락단가 20181023 23250.0
경락단가 20181023 30650.0
경락단가 20190426 15500.0
경락단가 20190426 16500.0
경락단가 20200312 14400.0
경락단가 20200818 22500.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201020 22000.0
경락단가 20201109 140500.0
경락단가 20201121 440800.0
경락단가 20220128 100000.0
경락단가 20220507 16900.0
경락단가 20220725 130001.0
경락단가 20220812 159500.0
경락단가 20220919 35050.0
경락단가 20230118 17750.0
경락단가 20230501 16000.0
총거래량 957.2906288990614
총거래량 20170418 31930.0
총거래량 20170418 31930.0
총거래량 20170428 110000.0
총거래량 20170428 110000.0
총거래량 20170509 62460.0
총거래량 20170509 62460.0
총거래량 20170605 24000.0
총거래량 20170609 25400.0
총거래량 20170710 26140.0
총거래량 20170808 21800.0
총거래량 20170914 25460.0
총거래량 20171019 26730.0
총거래량 20171030 14000.0
총거래량 20171110 14600.0
총거래량 20171110 20540.0


 10%|█         | 3/29 [17:22<2:15:34, 312.87s/it]

20230504
20230505
20230506
20230507
20230508
20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1644.275687251603
경락단가 20170127 1125000.0
경락단가 20170501 1500101.0
경락단가 20170620 1001000.0
경락단가 20170701 125000.0
경락단가 20170726 150000.0
경락단가 20170821 125025.0
경락단가 20170902 437500.0
경락단가 20170911 625562.0
경락단가 20170911 875625.0
경락단가 20171016 625312.0
경락단가 20171101 965900.0
경락단가 20171102 125000.0
경락단가 20171102 875812.0
경락단가 20171106 375000.0
경락단가 20171212 10250000.0
경락단가 20180321 201625.0
경락단가 20180405 171400.0
경락단가 20180512 125000.0
경락단가 20180606 6300470.0
경락단가 20180709 231255.0
경락단가 20180711 142500.0
경락단가 20180823 2500280.0
경락단가 20180917 1000000.0
경락단가 20181013 125000.0
경락단가 20181027 1350510.0
경락단가 20181206 8750750.0
경락단가 20181214 3001460.0
경락단가 20190227 175000.0
경락단가 20190401 787500.0
경락단가 20190423 112500.0
경락단가 20190509 304666.0
경락단가 20190709 626750.0
경락단가 20190802 252625.0
경락단가 20190814 250025.0
경락단가 20191206 8750625.0
경락단가 20191220 900850.0
경락단가 20200208 195000.0
경락단가 20200324 110001.0
경락단가 20200328 375250.0
경락단가 20200422 1187513.0
경락단가 20200427 125000.0
경락단가 20200721 7501625

 14%|█▍        | 4/29 [32:08<3:44:41, 539.25s/it]

경락단가 17225.617878192534
경락단가 20190826 150000.0
경락단가 20220826 746666.0
총거래량 30.503820780648706
총거래량 20201111 2000.0
총거래량 20201111 2000.0
총거래량 20201111 2000.0
총거래량 20201125 2000.0
총거래량 20201223 2000.0
총거래량 20201230 2000.0
총거래량 20201230 2000.0
총거래량 20201230 1200.0
총거래량 20210804 1440.0
총거래량 20220824 1470.0
총거래량 20220824 2205.0
20170101
20170102
20170103
20170104
20170105
20170106
20170107
20170108
20170109
20170110
20170111
20170112
20170113
20170114
20170115
20170116
20170117
20170118
20170119
20170120
20170121
20170122
20170123
20170124
20170125
20170126
20170127
20170128
20170129
20170130
20170131
20170201
20170202
20170203
20170204
20170205
20170206
20170207
20170208
20170209
20170210
20170211
20170212
20170213
20170214
20170215
20170216
20170217
20170218
20170219
20170220
20170221
20170222
20170223
20170224
20170225
20170226
20170227
20170228
20170301
20170302
20170303
20170304
20170305
20170306
20170307
20170308
20170309
20170310
20170311
20170312
20170313
20170314
20170315
20170316


 17%|█▋        | 5/29 [32:10<2:18:13, 345.55s/it]

20230112
20230113
20230114
20230115
20230116
20230117
20230118
20230119
20230120
20230121
20230122
20230123
20230124
20230125
20230126
20230127
20230128
20230129
20230130
20230131
20230201
20230202
20230203
20230204
20230205
20230206
20230207
20230208
20230209
20230210
20230211
20230212
20230213
20230214
20230215
20230216
20230217
20230218
20230219
20230220
20230221
20230222
20230223
20230224
20230225
20230226
20230227
20230228
20230301
20230302
20230303
20230304
20230305
20230306
20230307
20230308
20230309
20230310
20230311
20230312
20230313
20230314
20230315
20230316
20230317
20230318
20230319
20230320
20230321
20230322
20230323
20230324
20230325
20230326
20230327
20230328
20230329
20230330
20230331
20230401
20230402
20230403
20230404
20230405
20230406
20230407
20230408
20230409
20230410
20230411
20230412
20230413
20230414
20230415
20230416
20230417
20230418
20230419
20230420
20230421
20230422
20230423
20230424
20230425
20230426
20230427
20230428
20230429
20230430
20230501
20230502
2

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1089.5130018476377
경락단가 20170113 700625.0
경락단가 20170228 1388781.0
경락단가 20170401 500000.0
경락단가 20170627 21500525.0
경락단가 20170703 2000150.0
경락단가 20170914 750350.0
경락단가 20170929 2000250.0
경락단가 20180302 8501200.0
경락단가 20180523 6250500.0
경락단가 20180523 6250500.0
경락단가 20181105 16250875.0
경락단가 20190130 6500575.0
경락단가 20190309 4600460.0
경락단가 20190604 1251625.0
경락단가 20200602 975025.0
경락단가 20210114 5500575.0
경락단가 20210311 22001375.0
경락단가 20210709 625675.0
경락단가 20210908 1001200.0
경락단가 20211207 8327833.0
경락단가 20220616 10000900.0
총거래량 195.40832300413243
총거래량 20170125 3500.0
총거래량 20170126 4064.0
총거래량 20170127 4240.0
총거래량 20170208 3500.0
총거래량 20170221 8108.0
총거래량 20170228 3832.0
총거래량 20170228 3832.0
총거래량 20170309 50000.0
총거래량 20170329 3500.0
총거래량 20170330 6484.0
총거래량 20170330 3500.0
총거래량 20170331 6760.0
총거래량 20170331 3500.0
총거래량 20170405 3500.0
총거래량 20170406 3000.0
총거래량 20170408 3500.0
총거래량 20170411 3500.0
총거래량 20170412 3000.0
총거래량 20170417 3000.0
총거래량 20170418 3500.0
총거래량 20170420 3500.0
총거래량 20

 21%|██        | 6/29 [36:23<2:00:23, 314.07s/it]

20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 3414.6994514888115
경락단가 20170715 7832200.0
경락단가 20170726 2506750.0
경락단가 20180210 500000.0
경락단가 20180726 1275100.0
경락단가 20180730 6252750.0
경락단가 20180823 15008600.0
경락단가 20180831 479900.0
경락단가 20180831 1325000.0
경락단가 20190506 20751925.0
경락단가 20190916 530000.0
경락단가 20200116 812500.0
경락단가 20200312 20002250.0
경락단가 20200430 13000950.0
경락단가 20200806 13786650.0
경락단가 20200812 662500.0
경락단가 20200819 499975.0
경락단가 20200826 4779850.0
경락단가 20200916 972200.0
경락단가 20201005 2472200.0
경락단가 20201020 2002950.0
경락단가 20201228 388875.0
경락단가 20210222 15751575.0
경락단가 20210403 2027750.0
경락단가 20210619 2502875.0
경락단가 20210819 959425.0
경락단가 20210902 1540475.0
경락단가 20211021 1187500.0
경락단가 20211102 2254000.0
경락단가 20211209 1675162.0
경락단가 20220128 382850.0
경락단가 20220630 390000.0
경락단가 20220801 5003500.0
경락단가 20221202 12501350.0
총거래량 70.82075724109964
총거래량 20170109 716.0
총거래량 20170110 1500.0
총거래량 20170112 1120.0
총거래량 20170119 952.0
총거래량 20170121 1040.0
총거래량 20170123 1120.0
총거래량 20170124 720.0
총거래량 20170206 2080.0


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 3486.6441691776795
경락단가 20170306 848825.0
경락단가 20170504 140000.0
경락단가 20170505 125000.0
경락단가 20170526 222200.0
경락단가 20170612 175000.0
경락단가 20170811 525000.0
경락단가 20180404 165000.0
경락단가 20180728 250250.0
경락단가 20181001 2250000.0
경락단가 20181022 10003700.0
경락단가 20181103 187500.0
경락단가 20190110 130000.0
경락단가 20190622 137500.0
경락단가 20190917 222200.0
경락단가 20190928 222200.0
경락단가 20191008 149900.0
경락단가 20200423 5500500.0
경락단가 20200427 151550.0
경락단가 20200429 222275.0
경락단가 20200523 275000.0
경락단가 20200729 138875.0
경락단가 20200806 165000.0
경락단가 20200901 3028050.0
경락단가 20200921 250000.0
경락단가 20200929 177500.0
경락단가 20210306 3527500.0
경락단가 20210426 222025.0
경락단가 20211015 362500.0
경락단가 20211023 138875.0
경락단가 20211118 220000.0
경락단가 20211208 222200.0
경락단가 20211227 175016.0
경락단가 20220110 250000.0
경락단가 20220315 197200.0
경락단가 20220404 148850.0
경락단가 20220709 277777.0
경락단가 20220901 425000.0
경락단가 20220927 250000.0
경락단가 20221214 325000.0
경락단가 20230420 169000.0
경락단가 20230508 147200.0
총거래량 72.71827480930271
총거래량

 28%|██▊       | 8/29 [43:42<1:31:03, 260.18s/it]

20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 2430.6355472263494
경락단가 20170121 1401600.0
경락단가 20170208 1672000.0
경락단가 20170825 1956325.0
경락단가 20171031 20001850.0
경락단가 20171127 11126800.0
경락단가 20180210 15251550.0
경락단가 20180604 1451400.0
경락단가 20180628 18501875.0
경락단가 20181012 1250000.0
경락단가 20181110 1500050.0
경락단가 20190114 2402400.0
경락단가 20190126 1251725.0
경락단가 20190204 6000825.0
경락단가 20191026 1254775.0
경락단가 20191118 13001075.0
경락단가 20191231 1250125.0
경락단가 20200115 1800200.0
경락단가 20200117 1101000.0
경락단가 20200304 17251775.0
경락단가 20200316 22221700.0
경락단가 20200317 18251950.0
경락단가 20200506 10001350.0
경락단가 20200514 15751100.0
경락단가 20200722 22503650.0
경락단가 20200828 6006025.0
경락단가 20201008 16501700.0
경락단가 20201229 900800.0
경락단가 20201230 74202560.0
경락단가 20210224 3001200.0
경락단가 20210422 2752725.0
경락단가 20210609 10001500.0
경락단가 20210612 9001075.0
경락단가 20211021 1804125.0
경락단가 20220212 3228300.0
경락단가 20220305 777500.0
경락단가 20220526 1862325.0
총거래량 132.7962560553833
총거래량 20170103 62500.0
총거래량 20170103 62500.0
총거래량 20170103 62500.0
총거래량 201701

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1620.3671351604794
경락단가 20170316 200000.0
경락단가 20170424 115006.0
경락단가 20170426 700010.0
경락단가 20170522 912011.0
경락단가 20170605 101500.0
경락단가 20170717 190004.0
경락단가 20170717 125000.0
경락단가 20170721 100000.0
경락단가 20180221 166666.0
경락단가 20180310 133333.0
경락단가 20180510 2778388.0
경락단가 20180512 100000.0
경락단가 20180519 106000.0
경락단가 20180531 103750.0
경락단가 20180607 6000520.0
경락단가 20180702 166666.0
경락단가 20180709 1667472.0
경락단가 20180721 3334144.0
경락단가 20180816 850000.0
경락단가 20180908 243750.0
경락단가 20181001 220000.0
경락단가 20181025 200000.0
경락단가 20181113 444440.0
경락단가 20181129 353333.0
경락단가 20190208 129000.0
경락단가 20190220 2332710.0
경락단가 20190313 200000.0
경락단가 20190423 100000.0
경락단가 20190516 7000660.0
경락단가 20190620 205275.0
경락단가 20190708 138333.0
경락단가 20190719 180885.0
경락단가 20190723 3600960.0
경락단가 20190826 111000.0
경락단가 20190903 2300900.0
경락단가 20191014 800000.0
경락단가 20191231 280555.0
경락단가 20200323 112222.0
경락단가 20200413 112220.0
경락단가 20200514 127779.0
경락단가 20200708 172222.0
경락단가 20200803 280000.0
경락

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1874.2271460233724
경락단가 20170112 351500.0
경락단가 20170114 400000.0
경락단가 20170120 200000.0
경락단가 20170408 5001220.0
경락단가 20170421 600500.0
경락단가 20170502 5001260.0
경락단가 20170609 2002000.0
경락단가 20170612 8000200.0
경락단가 20170621 300000.0
경락단가 20170821 5600360.0
경락단가 20170825 8000900.0
경락단가 20170825 179000.0
경락단가 20170914 880680.0
경락단가 20170916 4300400.0
경락단가 20170922 9600660.0
경락단가 20171214 511100.0
경락단가 20180214 1202960.0
경락단가 20180713 1771880.0
경락단가 20180814 600000.0
경락단가 20181219 200001.0
경락단가 20190403 8000800.0
경락단가 20190426 700000.0
경락단가 20190521 700000.0
경락단가 20190926 300000.0
경락단가 20200103 200001.0
경락단가 20200304 200000.0
경락단가 20200418 7000550.0
경락단가 20200608 4000300.0
경락단가 20200826 8000860.0
경락단가 20201029 300000.0
경락단가 20210129 352000.0
경락단가 20210129 320000.0
경락단가 20210308 6003600.0
경락단가 20210421 200000.0
경락단가 20210713 188520.0
경락단가 20210906 500800.0
경락단가 20220209 246002.0
경락단가 20220423 200000.0
경락단가 20220726 772000.0
경락단가 20220921 218002.0
경락단가 20230208 210001.0
총거래량 95.0506642764

 38%|███▊      | 11/29 [1:11:57<2:15:52, 452.92s/it]

20230510
경락단가 1336.7066825127858
경락단가 20170610 69999.0
경락단가 20170610 84999.0
경락단가 20170610 99999.0
경락단가 20170623 5000000.0
경락단가 20170714 115220.0
경락단가 20180418 131420.0
경락단가 20180808 144000.0
경락단가 20181228 188000.0
경락단가 20190416 8500930.0
경락단가 20190724 70006.0
경락단가 20200827 771200.0
경락단가 20210329 700000.0
경락단가 20220708 188001.0
총거래량 107.9151263661808
총거래량 20170109 3000.0
총거래량 20170225 4000.0
총거래량 20170306 2710.0
총거래량 20170320 6300.0
총거래량 20170330 3000.0
총거래량 20170403 5460.0
총거래량 20170420 4300.0
총거래량 20170421 4510.0
총거래량 20170421 2460.0
총거래량 20170421 2460.0
총거래량 20170421 4100.0
총거래량 20170427 6000.0
총거래량 20170429 5670.0
총거래량 20170501 7500.0
총거래량 20170508 4760.0
총거래량 20170526 10000.0
총거래량 20170527 10000.0
총거래량 20170603 3939.0
총거래량 20170622 2840.0
총거래량 20170622 24140.0
총거래량 20170626 2560.0
총거래량 20170627 4000.0
총거래량 20170629 5000.0
총거래량 20170705 9000.0
총거래량 20170717 2548.0
총거래량 20170722 5000.0
총거래량 20170807 2727.0
총거래량 20170907 3000.0
총거래량 20170911 4949.0
총거래량 20171018 3000.0
총거래량 20171104 

 41%|████▏     | 12/29 [1:18:04<2:00:56, 426.88s/it]

20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 3710.6618051163427
경락단가 20170320 3001500.0
경락단가 20180417 11943800.0
경락단가 20200115 560000.0
경락단가 20200116 667000.0
경락단가 20200117 4520010.0
경락단가 20200205 1111052.0
경락단가 20200205 2962806.0
경락단가 20211009 646000.0
경락단가 20220328 32805600.0
경락단가 20221019 22502325.0
총거래량 100.23878660838655
총거래량 20170116 8040.0
총거래량 20170216 6390.0
총거래량 20170317 4800.0
총거래량 20170427 9000.0
총거래량 20170523 4920.0
총거래량 20170601 5560.0
총거래량 20170607 5000.0
총거래량 20170919 6020.0
총거래량 20180125 5400.0
총거래량 20180330 120000.0
총거래량 20180330 12000.0
총거래량 20180330 120000.0
총거래량 20180330 8000.0
총거래량 20180330 216000.0
총거래량 20180330 8000.0
총거래량 20180330 141600.0
총거래량 20180330 144000.0
총거래량 20190401 24000.0
총거래량 20190401 50000.0
총거래량 20200401 20000.0
총거래량 20200401 20000.0
총거래량 20200401 20000.0
총거래량 20200401 16000.0
총거래량 20200401 16000.0
총거래량 20200401 24000.0
총거래량 20200401 24000.0
총거래량 20200401 24000.0
총거래량 20200402 12000.0
총거래량 20200403 16000.0
총거래량 20200404 12000.0
총거래량 20200404 8000.0
총거래량 20200410 8000.0
총거래량 20200414 80

 45%|████▍     | 13/29 [1:20:10<1:29:28, 335.56s/it]

20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 730.4287437169394
경락단가 20170228 830000.0
경락단가 20170615 666666.0
경락단가 20170728 3600330.0
경락단가 20171021 2100220.0
경락단가 20171110 450000.0
경락단가 20171125 5600550.0
경락단가 20180108 8002880.0
경락단가 20180529 4000400.0
경락단가 20180709 6000520.0
경락단가 20181117 383333.0
경락단가 20190506 2300230.0
경락단가 20190509 1800200.0
경락단가 20191119 5500510.0
경락단가 20200104 4600650.0
경락단가 20200321 9000900.0
경락단가 20200921 4500000.0
경락단가 20201117 4600300.0
경락단가 20201205 510000.0
경락단가 20210106 3700380.0
경락단가 20210729 600000.0
경락단가 20220402 5632100.0
경락단가 20220628 555810.0
총거래량 1930.3410167150387
총거래량 20170603 118150.0
총거래량 20171002 50000.0
총거래량 20171206 50000.0
총거래량 20171209 50000.0
총거래량 20171209 50000.0
총거래량 20171227 50000.0
총거래량 20180314 41340.0
총거래량 20180907 50000.0
총거래량 20180914 50000.0
총거래량 20190201 50000.0
총거래량 20190201 40000.0
총거래량 20190202 40000.0
총거래량 20190202 33500.0
총거래량 20201121 96800.0
총거래량 20201127 91960.0
총거래량 20201202 32500.0
총거래량 20201225 79588.0
총거래량 20210812 160380.0
총거래량 20210914 1000000.0
총거래량 20211

 48%|████▊     | 14/29 [1:21:50<1:06:07, 264.52s/it]

20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 613.9910739275341
경락단가 20170107 115011.0
경락단가 20170613 325000.0
경락단가 20170714 100110.0
경락단가 20170824 687500.0
경락단가 20170824 250000.0
경락단가 20171108 675650.0
경락단가 20171230 125000.0
경락단가 20180209 222222.0
경락단가 20180625 5600230.0
경락단가 20181001 97500.0
경락단가 20181012 555375.0
경락단가 20181110 550010.0
경락단가 20181121 250362.0
경락단가 20190104 125000.0
경락단가 20190708 78756.0
경락단가 20200406 95000.0
경락단가 20200602 5750575.0
경락단가 20200824 113750.0
경락단가 20200912 133750.0
경락단가 20200924 101250.0
경락단가 20200925 100010.0
경락단가 20201118 81250.0
경락단가 20201123 90000.0
경락단가 20201205 160000.0
경락단가 20210105 375000.0
경락단가 20210224 300280.0
경락단가 20210710 562600.0
경락단가 20210831 1000000.0
경락단가 20220111 375000.0
경락단가 20220226 375000.0
경락단가 20220326 118750.0
경락단가 20220429 100000.0
경락단가 20220905 153750.0
총거래량 894.4090632669428
총거래량 20170417 35860.0
총거래량 20170429 80000.0
총거래량 20170429 80000.0
총거래량 20170601 15000.0
총거래량 20170601 15000.0
총거래량 20170601 18780.0
총거래량 20170619 21000.0
총거래량 20170619 21000.0
총거래량 20170620 21000.0

 52%|█████▏    | 15/29 [1:24:53<55:59, 239.95s/it]  

경락단가 2988.612956386724
경락단가 20170614 75000000.0
경락단가 20180831 1955555.0
경락단가 20190128 9999999.0
경락단가 20190418 900000.0
경락단가 20200314 2300000.0
경락단가 20200511 11801800.0
경락단가 20210206 3000000.0
경락단가 20220122 1500000.0
경락단가 20220316 1668500.0
경락단가 20220607 900000.0
경락단가 20221031 3003300.0
총거래량 151.54985500193624
총거래량 20170124 70000.0
총거래량 20170124 70000.0
총거래량 20170124 70000.0
총거래량 20170321 13800.0
총거래량 20170328 50000.0
총거래량 20170331 80000.0
총거래량 20170401 40000.0
총거래량 20170410 40000.0
총거래량 20170410 40000.0
총거래량 20170411 50000.0
총거래량 20170411 50000.0
총거래량 20170413 90000.0
총거래량 20170808 25000.0
총거래량 20170808 25000.0
총거래량 20170808 25000.0
총거래량 20170808 25000.0
총거래량 20170808 25000.0
총거래량 20170808 25000.0
총거래량 20170809 25000.0
총거래량 20170809 25000.0
총거래량 20170809 25000.0
총거래량 20170809 25000.0
총거래량 20170809 25000.0
총거래량 20170809 25000.0
총거래량 20170810 25000.0
총거래량 20170810 25000.0
총거래량 20170811 25000.0
총거래량 20170811 25000.0
총거래량 20170811 50000.0
총거래량 20170811 20000.0
총거래량 20170812 25000.0
총거래량 20

 55%|█████▌    | 16/29 [1:27:34<46:48, 216.07s/it]

20230508
20230509
20230510
경락단가 775.3035690127234
경락단가 20170112 955833.0
경락단가 20180612 150000.0
경락단가 20180613 3000250.0
경락단가 20180619 280300.0
경락단가 20181001 81670.0
경락단가 20190128 4000555.0
경락단가 20190606 3000275.0
경락단가 20190706 1250075.0
경락단가 20200513 80000.0
경락단가 20200513 79999.0
경락단가 20200513 79999.0
경락단가 20200826 402902.0
경락단가 20210408 134753.0
경락단가 20220125 666666.0
경락단가 20220729 522006.0
총거래량 1539.14741627834
총거래량 20170112 100800.0
총거래량 20170113 100000.0
총거래량 20170211 80000.0
총거래량 20170213 80000.0
총거래량 20170315 100000.0
총거래량 20170322 80000.0
총거래량 20170327 40000.0
총거래량 20170405 100000.0
총거래량 20170405 100000.0
총거래량 20170428 160000.0
총거래량 20170428 160000.0
총거래량 20170429 100000.0
총거래량 20170429 100000.0
총거래량 20170511 100000.0
총거래량 20170511 100000.0
총거래량 20170512 60000.0
총거래량 20170512 60000.0
총거래량 20170515 96000.0
총거래량 20170515 96000.0
총거래량 20170531 72000.0
총거래량 20170621 120000.0
총거래량 20170622 80000.0
총거래량 20170623 60000.0
총거래량 20170627 60000.0
총거래량 20170721 60000.0
총거래량 20170725 67500.0

 59%|█████▊    | 17/29 [1:29:16<36:22, 181.91s/it]

20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1132.3467174131788
경락단가 20170606 171260.0
경락단가 20170610 961000.0
경락단가 20170712 3001250.0
경락단가 20170718 3001285.0
경락단가 20180120 1250650.0
경락단가 20180530 190000.0
경락단가 20180531 600500.0
경락단가 20180606 600400.0
경락단가 20180705 585000.0
경락단가 20180810 1951745.0
경락단가 20180822 166500.0
경락단가 20180917 166150.0
경락단가 20181025 181660.0
경락단가 20181127 161600.0
경락단가 20190107 1900455.0
경락단가 20190112 1251175.0
경락단가 20190219 334995.0
경락단가 20190417 1176200.0
경락단가 20190523 4986275.0
경락단가 20190605 1251300.0
경락단가 20190613 300230.0
경락단가 20190617 325750.0
경락단가 20190617 300000.0
경락단가 20190626 200000.0
경락단가 20191017 1000100.0
경락단가 20191107 1006050.0
경락단가 20191206 1001300.0
경락단가 20200325 200000.0
경락단가 20200506 5001500.0
경락단가 20200508 160000.0
경락단가 20200527 555557.0
경락단가 20200603 451050.0
경락단가 20200617 400000.0
경락단가 20200702 505650.0
경락단가 20210408 8500000.0
경락단가 20210426 6600280.0
경락단가 20210515 8011650.0
경락단가 20210520 6001400.0
경락단가 20210623 2800280.0
경락단가 20220324 220750.0
경락단가 20220819 1111363.0
경락단가 20220921 

 62%|██████▏   | 18/29 [1:33:16<36:33, 199.39s/it]

20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1840.904859642432
경락단가 20170613 1000800.0
경락단가 20170911 1711600.0
경락단가 20180822 2000300.0
경락단가 20180904 231010.0
경락단가 20181219 266240.0
경락단가 20181227 260000.0
경락단가 20190919 771000.0
경락단가 20191021 9000850.0
경락단가 20191113 890010.0
경락단가 20200326 292930.0
경락단가 20200819 8000700.0
경락단가 20200902 405000.0
경락단가 20201027 1561450.0
경락단가 20201028 6002100.0
경락단가 20201116 7000800.0
경락단가 20210114 2001020.0
경락단가 20210316 7002060.0
경락단가 20211001 3500520.0
경락단가 20220704 600000.0
경락단가 20220715 300000.0
경락단가 20220811 900000.0
경락단가 20220909 8800810.0
경락단가 20220927 8001410.0
총거래량 179.13618992389553
총거래량 20170103 2450.0
총거래량 20170105 2650.0
총거래량 20170109 2480.0
총거래량 20170109 3180.0
총거래량 20170109 2790.0
총거래량 20170110 2560.0
총거래량 20170113 2680.0
총거래량 20170113 2410.0
총거래량 20170114 4940.0
총거래량 20170116 4800.0
총거래량 20170119 3430.0
총거래량 20170120 2730.0
총거래량 20170124 2660.0
총거래량 20170201 2560.0
총거래량 20170202 2430.0
총거래량 20170203 2670.0
총거래량 20170206 2700.0
총거래량 20170209 2640.0
총거래량 20170215 2470.0
총거래량 2017021

 66%|██████▌   | 19/29 [1:35:41<30:31, 183.10s/it]

20230508
20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 1544.4749989735703
경락단가 20170126 16501400.0
경락단가 20170215 1711740.0
경락단가 20170727 2500650.0
경락단가 20170809 3076200.0
경락단가 20170817 17252100.0
경락단가 20171011 4600550.0
경락단가 20171114 520550.0
경락단가 20171122 2001050.0
경락단가 20171213 8500950.0
경락단가 20180307 2002050.0
경락단가 20181018 7855925.0
경락단가 20181105 10001150.0
경락단가 20190424 8750900.0
경락단가 20190920 13501500.0
경락단가 20191115 4001400.0
경락단가 20191128 2500000.0
경락단가 20191221 9500975.0
경락단가 20200115 650600.0
경락단가 20200306 6250650.0
경락단가 20200423 960950.0
경락단가 20200530 10251075.0
경락단가 20200904 470000.0
경락단가 20201015 762220.0
경락단가 20201113 21752225.0
경락단가 20201116 1027800.0
경락단가 20201204 11667766.0
경락단가 20201228 13334333.0
경락단가 20210109 2472350.0
경락단가 20210111 5002820.0
경락단가 20210210 452500.0
경락단가 20210315 3754525.0
경락단가 20210325 484500.0
경락단가 20210407 5042000.0
경락단가 20210722 3250375.0
경락단가 20210727 6500750.0
경락단가 20210805 12501275.0
경락단가 20210827 5000533.0
경락단가 20211009 10251075.0
경락단가 20220905 18251825.0
경락단가 20230420 650000.0
총거래량 520.0103

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 4897.17349316978
경락단가 20180418 56500.0
경락단가 20180727 119999.0
경락단가 20190802 559999.0
경락단가 20190822 799999.0
경락단가 20191211 55000.0
경락단가 20200117 105000.0
경락단가 20200305 112000.0
경락단가 20201005 48880.0
경락단가 20201020 53664.0
경락단가 20201020 55120.0
경락단가 20201021 55600.0
경락단가 20201026 46800.0
경락단가 20210224 86000.0
경락단가 20210312 95000.0
경락단가 20210313 400000.0
경락단가 20210825 66700.0
경락단가 20211216 47500.0
경락단가 20220104 84000.0
경락단가 20220128 240000.0
경락단가 20220307 72500.0
경락단가 20220427 67500.0
경락단가 20220523 72500.0
경락단가 20220706 66500.0
경락단가 20220906 69000.0
총거래량 54.14002014322837
총거래량 20170221 1715.0
총거래량 20171124 820.0
총거래량 20180222 890.0
총거래량 20180222 825.0
총거래량 20180307 1050.0
총거래량 20180309 1140.0
총거래량 20180330 1050.0
총거래량 20180402 840.0
총거래량 20180406 900.0
총거래량 20180409 1050.0
총거래량 20180414 780.0
총거래량 20180417 780.0
총거래량 20180418 780.0
총거래량 20180502 780.0
총거래량 20180503 780.0
총거래량 20180505 780.0
총거래량 20180517 900.0
총거래량 20180522 900.0
총거래량 20180822 1102.0
총거래량 20181109 760.0
총거래량 20181115 

 72%|███████▏  | 21/29 [1:42:14<23:20, 175.07s/it]

20230430
20230501
20230502
20230503
20230504
20230505
20230506
20230507
20230508
20230509
20230510
경락단가 4891.506576807622
경락단가 20170104 65010.0
경락단가 20170224 675000.0
경락단가 20170224 674999.0
경락단가 20170224 674999.0
경락단가 20170224 674999.0
경락단가 20170224 675000.0
경락단가 20170224 674999.0
경락단가 20170224 625000.0
경락단가 20170224 624999.0
경락단가 20170224 624999.0
경락단가 20170224 625000.0
경락단가 20170224 699999.0
경락단가 20170330 59200.0
경락단가 20170518 260000.0
경락단가 20170524 80000.0
경락단가 20170606 130000.0
경락단가 20170620 64999.0
경락단가 20170626 72222.0
경락단가 20170707 130000.0
경락단가 20170801 122500.0
경락단가 20170804 72222.0
경락단가 20170807 72222.0
경락단가 20170815 72222.0
경락단가 20170921 72222.0
경락단가 20170922 61111.0
경락단가 20170928 61111.0
경락단가 20170928 72222.0
경락단가 20171014 63750.0
경락단가 20171019 72222.0
경락단가 20171028 118000.0
경락단가 20171125 62000.0
경락단가 20180222 65000.0
경락단가 20180222 396666.0
경락단가 20180222 413333.0
경락단가 20180302 280000.0
경락단가 20180502 380000.0
경락단가 20180502 393333.0
경락단가 20180625 136500.0
경락단가 20180725 115000

 76%|███████▌  | 22/29 [1:43:17<16:28, 141.27s/it]

경락단가 3928.9212006628854
경락단가 20210611 3000366.0
경락단가 20211001 172000.0
경락단가 20211001 196000.0
경락단가 20211001 300000.0
경락단가 20211001 292000.0
총거래량 81.8156724189572
총거래량 20170105 2500.0
총거래량 20170621 660.0
총거래량 20180416 750.0
총거래량 20180416 750.0
총거래량 20190408 980.0
총거래량 20190628 1188.0
총거래량 20190701 900.0
총거래량 20191122 963.0
총거래량 20191122 963.0
총거래량 20230509 954.0
총거래량 20230509 954.0
20170101
20170102
20170103
20170104
20170105
20170106
20170107
20170108
20170109
20170110
20170111
20170112
20170113
20170114
20170115
20170116
20170117
20170118
20170119
20170120
20170121
20170122
20170123
20170124
20170125
20170126
20170127
20170128
20170129
20170130
20170131
20170201
20170202
20170203
20170204
20170205
20170206
20170207
20170208
20170209
20170210
20170211
20170212
20170213
20170214
20170215
20170216
20170217
20170218
20170219
20170220
20170221
20170222
20170223
20170224
20170225
20170226
20170227
20170228
20170301
20170302
20170303
20170304
20170305
20170306
20170307
20170308
20170309
2017

 79%|███████▉  | 23/29 [1:43:26<10:08, 101.47s/it]

20221025
20221026
20221027
20221028
20221029
20221030
20221031
20221101
20221102
20221103
20221104
20221105
20221106
20221107
20221108
20221109
20221110
20221111
20221112
20221113
20221114
20221115
20221116
20221117
20221118
20221119
20221120
20221121
20221122
20221123
20221124
20221125
20221126
20221127
20221128
20221129
20221130
20221201
20221202
20221203
20221204
20221205
20221206
20221207
20221208
20221209
20221210
20221211
20221212
20221213
20221214
20221215
20221216
20221217
20221218
20221219
20221220
20221221
20221222
20221223
20221224
20221225
20221226
20221227
20221228
20221229
20221230
20221231
20230101
20230102
20230103
20230104
20230105
20230106
20230107
20230108
20230109
20230110
20230111
20230112
20230113
20230114
20230115
20230116
20230117
20230118
20230119
20230120
20230121
20230122
20230123
20230124
20230125
20230126
20230127
20230128
20230129
20230130
20230131
20230201
20230202
20230203
20230204
20230205
20230206
20230207
20230208
20230209
20230210
20230211
20230212
2

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 573.042386728875
경락단가 20170703 63333.0
경락단가 20170722 102778.0
경락단가 20171003 79444.0
경락단가 20171013 130555.0
경락단가 20171108 119444.0
경락단가 20171129 89444.0
경락단가 20180712 56965.0
경락단가 20180725 100780.0
경락단가 20180803 250000.0
경락단가 20180809 55525.0
경락단가 20181010 2065730.0
경락단가 20181013 151250.0
경락단가 20181017 52000.0
경락단가 20181103 159500.0
경락단가 20190723 50000.0
경락단가 20190906 444440.0
경락단가 20190920 55590.0
경락단가 20191128 85840.0
경락단가 20200813 40000.0
경락단가 20200917 499999.0
경락단가 20201020 750515.0
경락단가 20201104 499999.0
경락단가 20210625 42500.0
경락단가 20210727 499999.0
경락단가 20210901 390010.0
경락단가 20210915 375010.0
경락단가 20220618 58000.0
경락단가 20220702 499999.0
경락단가 20220709 76500.0
경락단가 20220715 97500.0
경락단가 20220718 67500.0
경락단가 20220905 180500.0
경락단가 20220905 170010.0
경락단가 20221006 119130.0
총거래량 1712.0345787266494
총거래량 20171121 240000.0
총거래량 20171121 3768000.0
총거래량 20201028 600000.0
총거래량 20201028 704000.0
총거래량 20201028 704000.0
총거래량 20211126 14400000.0
20170101
20170102
20170103
20170104
20170105


 83%|████████▎ | 24/29 [1:44:46<07:55, 95.12s/it] 

20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 6522.622712734793
경락단가 20170120 450000.0
경락단가 20170329 370133.0
경락단가 20170329 33004050.0
경락단가 20170616 3270600.0
경락단가 20170705 2233566.0
경락단가 20170719 3170500.0
경락단가 20170728 605900.0
경락단가 20170808 4000000.0
경락단가 20170819 405500.0
경락단가 20180328 500000.0
경락단가 20180404 496666.0
경락단가 20180404 383333.0
경락단가 20180511 444443.0
경락단가 20180528 2752250.0
경락단가 20180829 3104066.0
경락단가 20190204 550000.0
경락단가 20190327 555400.0
경락단가 20190424 706750.0
경락단가 20190521 445000.0
경락단가 20191001 20009100.0
경락단가 20191214 750007.0
경락단가 20200420 5440600.0
경락단가 20200522 500000.0
경락단가 20200618 4000000.0
경락단가 20200620 375042.0
경락단가 20200708 501500.0
경락단가 20200716 18750500.0
경락단가 20200716 454750.0
경락단가 20200814 1283333.0
경락단가 20200820 1411600.0
경락단가 20200820 739833.0
경락단가 20200822 1000000.0
경락단가 20200908 950206.0
경락단가 20200910 1250000.0
경락단가 20200928 502250.0
경락단가 20201007 4171166.0
경락단가 20201210 7757500.0
경락단가 20201221 365000.0
경락단가 20210120 500000.0
경락단가 20210128 25007950.0
경락단가 20210206 444400.0
경락단가 2021042

 86%|████████▌ | 25/29 [2:00:00<22:43, 340.84s/it]

경락단가 1936.0206726555177
경락단가 20170826 11601300.0
경락단가 20171227 200000.0
경락단가 20181127 8001800.0
경락단가 20190924 3000000.0
총거래량 119.75749643872074
총거래량 20170116 1500.0
총거래량 20170415 1550.0
총거래량 20170429 1590.0
총거래량 20170429 1603.0
총거래량 20170717 1500.0
총거래량 20170724 1500.0
총거래량 20170816 1750.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20170823 2000.0
총거래량 20171002 1600.0
총거래량 20171219 2000.0
총거래량 20171219 2000.0
총거래량 20171219 2000.0
총거래량 20171219 2000.0
총거래량 20171219 2000.0
총거래량 20171219 2000.0
총거래량 20171219 2000.0
총거래량 20180501 1500.0
총거래량 20180810 1600.0
총거래량 20181016 2000.0
총거래량 20181023 5000.0
총거래량 20181031 2000.0
총거래량 20190308 1674.0
총거래량 20190515 7500.0
총거래량 20191007 5000.0
총거래량 20191219 3150.0
총거래량 20191219 3150.0
총거래량 20191219 3150.0
총거래량 20191219 3150.0
총거래량 20191219 3150.0
총거래량 20200113 15

 90%|████████▉ | 26/29 [2:01:57<13:41, 273.71s/it]

20230508
20230509
20230510


  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 4441.84093100823
경락단가 20170306 6877875.0
경락단가 20170801 687500.0
경락단가 20170905 12500250.0
경락단가 20170918 24999975.0
경락단가 20180322 2212500.0
경락단가 20180716 3654075.0
경락단가 20180920 5004650.0
경락단가 20181203 17500000.0
경락단가 20190724 2328325.0
경락단가 20190911 800000.0
경락단가 20190916 15004200.0
경락단가 20191017 12505375.0
경락단가 20191019 22222220.0
경락단가 20191021 637502.0
경락단가 20200131 24999975.0
경락단가 20200211 638888.0
경락단가 20200212 5004125.0
경락단가 20200408 5002575.0
경락단가 20200505 3003250.0
경락단가 20200730 3253000.0
경락단가 20200817 653900.0
경락단가 20200902 479500.0
경락단가 20200924 950000.0
경락단가 20201012 4004375.0
경락단가 20210202 7382500.0
경락단가 20210705 20003750.0
경락단가 20210710 4705525.0
경락단가 20210827 465000.0
경락단가 20210927 1750000.0
경락단가 20211011 15001750.0
경락단가 20211102 6381375.0
경락단가 20211218 2803375.0
경락단가 20220207 562500.0
경락단가 20220331 679750.0
경락단가 20220531 7504350.0
경락단가 20220629 500000.0
경락단가 20220901 470000.0
경락단가 20221008 2499997.0
경락단가 20221130 20251775.0
경락단가 20230421 775004.0
총거래량 48.8041235237968

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 3627.0332177897094
경락단가 20170317 185000.0
경락단가 20170522 1101100.0
경락단가 20170708 400000.0
경락단가 20170711 200000.0
경락단가 20170902 230000.0
경락단가 20170907 377000.0
경락단가 20170908 700000.0
경락단가 20170914 616020.0
경락단가 20170927 385000.0
경락단가 20171026 330000.0
경락단가 20180119 154800.0
경락단가 20180127 430000.0
경락단가 20180328 265003.0
경락단가 20180331 500200.0
경락단가 20180602 8001200.0
경락단가 20180614 300000.0
경락단가 20180626 161300.0
경락단가 20180706 154000.0
경락단가 20180719 1653150.0
경락단가 20180801 261000.0
경락단가 20180814 220001.0
경락단가 20180822 5552500.0
경락단가 20180822 300000.0
경락단가 20180901 300000.0
경락단가 20180906 6002580.0
경락단가 20181010 8001800.0
경락단가 20181012 2001860.0
경락단가 20181015 3232450.0
경락단가 20181020 2375000.0
경락단가 20181221 260000.0
경락단가 20190110 222220.0
경락단가 20190122 9993500.0
경락단가 20190327 415000.0
경락단가 20190411 266000.0
경락단가 20190429 200650.0
경락단가 20190504 343860.0
경락단가 20190723 233900.0
경락단가 20190726 5552580.0
경락단가 20190812 185000.0
경락단가 20190919 261900.0
경락단가 20191001 180000.0
경락단가 20191012 182000.0

  df = pd.read_csv(num)  # pummock의 csv 읽어오기


경락단가 2534.029707170138
경락단가 20180515 1977025.0
경락단가 20180602 1751875.0
경락단가 20180730 1576625.0
경락단가 20181022 33003350.0
경락단가 20190614 14501750.0
경락단가 20190720 1138750.0
경락단가 20190725 1851925.0
경락단가 20190928 2077200.0
경락단가 20200408 1626500.0
경락단가 20200606 42001650.0
경락단가 20201127 13889500.0
경락단가 20210106 1791900.0
경락단가 20210201 4279250.0
경락단가 20210630 1001500.0
경락단가 20220301 30503050.0
경락단가 20220305 2000000.0
경락단가 20220416 24002550.0
경락단가 20220426 7501050.0
경락단가 20220606 37003550.0
경락단가 20220628 26002650.0
경락단가 20220829 504900.0
총거래량 124.60623927405078
총거래량 20170103 30000.0
총거래량 20170104 30000.0
총거래량 20170105 22500.0
총거래량 20170106 15000.0
총거래량 20170107 37500.0
총거래량 20170109 22500.0
총거래량 20170112 20000.0
총거래량 20170113 24000.0
총거래량 20170116 45000.0
총거래량 20170117 45000.0
총거래량 20170118 45000.0
총거래량 20170119 45000.0
총거래량 20170120 45000.0
총거래량 20170121 60000.0
총거래량 20170123 60000.0
총거래량 20170124 45000.0
총거래량 20170125 60000.0
총거래량 20170126 37500.0
총거래량 20170206 22500.0
총거래량 20170207 45000.0
총거

100%|██████████| 29/29 [2:29:14<00:00, 308.79s/it]
100%|██████████| 29/29 [00:02<00:00, 12.78it/s]
100%|██████████| 29/29 [00:10<00:00,  2.74it/s]
  3%|▎         | 1/29 [00:00<00:03,  8.53it/s]

16
imexport_16.csv
17
imexport_17.csv
29
imexport_29.csv
15
imexport_15.csv


 24%|██▍       | 7/29 [00:00<00:01, 16.05it/s]

14
imexport_14.csv
28
imexport_28.csv
10
imexport_10.csv
9
imexport_9.csv


 31%|███       | 9/29 [00:00<00:01, 14.65it/s]

8
imexport_8.csv
11
imexport_11.csv
13
imexport_13.csv


 48%|████▊     | 14/29 [00:00<00:00, 15.13it/s]

12
imexport_12.csv
23
imexport_23.csv
6
imexport_6.csv
7
imexport_7.csv


 59%|█████▊    | 17/29 [00:01<00:00, 16.52it/s]

22
imexport_22.csv
20
imexport_20.csv
5
imexport_5.csv
4
imexport_4.csv


 76%|███████▌  | 22/29 [00:01<00:00, 16.71it/s]

21
imexport_21.csv
25
imexport_25.csv
19
imexport_19.csv
1
imexport_1.csv
18
imexport_18.csv


 90%|████████▉ | 26/29 [00:01<00:00, 18.39it/s]

24
imexport_24.csv
26
imexport_26.csv
3
imexport_3.csv
2
imexport_2.csv


100%|██████████| 29/29 [00:01<00:00, 15.81it/s]


27
imexport_27.csv
['16', '15', '29', '28', '8', '14', '11', '13', '12', '3', '23', '22', '2', '20', '21', '1', '19', '5', '24', '4', '18', '6', '7']


100%|██████████| 29/29 [00:07<00:00,  3.97it/s]
100%|██████████| 29/29 [00:00<00:00, 31.62it/s]


In [9]:
# # 데이터 전처리 및 저장 (중간저장 X, 최종저장 O) - train
# data = preprocessing_data('./aT_train_raw/*.csv')
# data.add_pummock()
# data.add_dosomae()
# data.add_dosomae(option=2)
# data.add_imexport()
# data.add_weather()
# data.add_categorical('train', data_type="train" ,check=1)

In [3]:
data = preprocessing_data('DATA/test/*.csv')

In [None]:
data.add_pummock(check=1)

In [5]:
data.add_dosomae(check=1)


100%|██████████| 3/3 [00:00<00:00, 13.48it/s]

dome_1.csv
dome_25.csv
dome_29.csv





In [6]:
data.add_dosomae(option=2, check=1)

  0%|          | 0/3 [00:00<?, ?it/s]

some_29.csv


 33%|███▎      | 1/3 [00:00<00:00,  3.14it/s]

some_1.csv


 67%|██████▋   | 2/3 [00:00<00:00,  3.05it/s]

some_25.csv


100%|██████████| 3/3 [00:01<00:00,  2.99it/s]


In [7]:
data.add_imexport(check=1)

100%|██████████| 3/3 [00:00<00:00, 38.89it/s]

29
imexport_29.csv
25
imexport_25.csv
1
imexport_1.csv





In [8]:
data.add_weather(check=1)

['29', '28', '1', '24']


100%|██████████| 3/3 [00:00<00:00,  4.88it/s]


In [9]:
data.add_categorical('train', data_type="train" ,check=1)

100%|██████████| 3/3 [00:00<00:00, 32.44it/s]
