전국 아파트 실거래가 전처리 모듈
==
---
공공데이터 포털에서 수집한 Data를 이용하여 Looker Dashboard를 구성한다.  
(참고) 국토 교통부 실거래가 정보 링크 : <https://www.data.go.kr/dataset/3050988/openapi.do>
<br/><br/>
초기에는 데이터 수집, 전처리, 저장 등의 작업을 수동으로 진행하였으나,  
Looker 대시보드에 전국 아파트 실거래가 자료를 실시간 시각화 필요성에 따라 linux에 crontab으로 예약작업을 주기적으로 진행할 것이다.
> 예를들어,  
과거 데이터 : 연 1회 업데이트  
3개월 이내 데이터 : 2주 마다 업데이트  
이번달 데이터 : 매일 1:00AM 업데이트

<br/>
주기 작업을 위해서 `전처리`, `저장`, `데이터 테이블 분할` 등의 작업을 수행하는 모듈을 개발하고,  
해당 모듈을 서버에 올려 예약 작업을 진행할 것이다.

먼저 모듈을 개발하는 과정에 대해 적어본다.


<br/><br/>

## 0. Import Library
****
필요 라이브러리를 불러온다

In [1]:
#### Import Library
import numpy as np
import pandas as pd
from pandas import Series, DataFrame

import csv

import re

import requests
import json


# MySQL Connector using pymysql; create_engine(), to_sql()
import pymysql
from sqlalchemy import create_engine
pymysql.install_as_MySQLdb() 
import MySQLdb

#from datetime import datetime 
from datetime import datetime

<br/><br/>
##### 크롤링/전처리 분리
>초기 기획은 전국의 아파트, 연립, 독립, 다세대, 토지 등의 실거래가 정보를 전부 통합하여 처리하여  
하나의 대시보드로 구성하고, 전반적인 실거래 정보를 파악하고자 하였다.  
(그 때문에 현재 `UrlSetting()` 함수에 `api_url`과 `operation`에 이를 반영한 요소가 저장되어있긴 하다...)  
>  
>그러나 각각의 오퍼레이션에 대한 column 내용이 서로 다르기 때문에  
하나의 전처리 모듈로 테이블을 구성하기는 무리가 있을 것으로 보이고,  
아파트 실거래가 이외의 부분을 진행하게 된다면  
API로 불러온 `불러온 Json데이터를 DataTable 형식으로 구성하는 부분 :`**`Data Importing`**과  
DataTable에 `추가 column을 생성하는 부분 :`**`Data Formatting`**을 분리해야 할 것이다.  

<br/><br/><br/>

## 1. Data Importing
---
데이터를 수집한다.  
조건에 맞는 api url을 생성한 후  
그 url로 부터 json데이터를 호출한다.  
호출된 데이터를 원하는 형식에 맞도록 전처리한 후  
MySQL DB에 저장한다.

*(참고) url을 구성할 때 사용하는 `api_key`는 매년 리셋되는 값이므로 공공 데이터 포털에서 주기적으로 refresh 해주어야 한다.*


<br/><br/>
### 1.1. UrlSetting()
> 호출할 url을 준비하는 Function.  
아파트, 연립주택, 단독주택, 오피스텔, 토지 실거래가를 조회할 수 있고  
  각각의 `api_url`과 `operation`을 리스트에 저장하여 index 조정을 통해 선택적으로 호출할 수 있도록 구성하였다.  
Input 값으로 "법정동코드"`lawd_cd`와 "날짜"`ymd(yyyymm)`를 받고,  
Output 값으로 url주소를 return한다.

In [2]:
def UrlSetting(lawd_cd, ymd):
    i=0;j=0 ## apartment

    api_url = ["http://openapi.molit.go.kr:8081/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc",
               "http://openapi.molit.go.kr/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc"]
    operation = [["/getRTMSDataSvcAptTrade", "/getRTMSDataSvcRHTrade", "/getRTMSDataSvcSHTrade"],
                 ["/getRTMSDataSvcOffiTrade","/getRTMSDataSvcLandTrade"]]

    api_key = "?ServiceKey=AtnSYq4MYaLBML6390yGYtovZxKjRM1uriC0t8Pd7qKERb6cia%2FTq7uZet8o1NtL61tSzypTcC3jzpwyYsw9UQ%3D%3D"

    lcd = "&LAWD_CD=" + str(lawd_cd)
    deal_ymd = "&DEAL_YMD=" + str(ymd)

    requestUrl = api_url[i]+operation[i][j]+api_key+lcd+deal_ymd +"&_type=json"

    return(requestUrl)

In [3]:
UrlSetting('45130','201811')

'http://openapi.molit.go.kr:8081/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc/getRTMSDataSvcAptTrade?ServiceKey=AtnSYq4MYaLBML6390yGYtovZxKjRM1uriC0t8Pd7qKERb6cia%2FTq7uZet8o1NtL61tSzypTcC3jzpwyYsw9UQ%3D%3D&LAWD_CD=45130&DEAL_YMD=201811&_type=json'

### 1.2. UrlImporting()
>`UrlSetting`을 통해 호출 url을 불러오고,  
불러온 url로부터 html 객체를 생성한다.  
생성된 html객체로부터 text 값이 dictionary 형태임을 확인할 수 있고,  
text형식의 데이터를 eval함수를 통해 dictionary 형태로 바꾸어준다.  
dictionary 데이터를 다시 DataFrame 형태로 변환하여 저장한다.  

>**(수정)** 
requests.get(url) 이후 바로 json 형식(dictionary 형식)으로 저장하는 방법을 찾아서 이를 수정함.

In [4]:
'''def UrlImporting(url):
    html = requests.get(url)
    dict0 = eval(html.text)
    
    df = DataFrame.from_records(dict0["response"]["body"]["items"]["item"])
    
    return df'''

'def UrlImporting(url):\n    html = requests.get(url)\n    dict0 = eval(html.text)\n    \n    df = DataFrame.from_records(dict0["response"]["body"]["items"]["item"])\n    \n    return df'

In [36]:
'''def UrlImporting(url):
    dict0 = requests.get(url).json()
    df = DataFrame.from_records(dict0["response"]["body"]["items"]["item"])
    
    return df'''

'def UrlImporting(url):\n    dict0 = requests.get(url).json()\n    df = DataFrame.from_records(dict0["response"]["body"]["items"]["item"])\n    \n    return df'

In [5]:
def UrlImporting(url):
    dict0 = requests.get(url).json()

    if dict0["response"]["body"]["totalCount"]==1:
        df = DataFrame(data=dict0["response"]["body"]["items"]["item"],index=[0])
    else:
        df = DataFrame.from_records(dict0["response"]["body"]["items"]["item"])

    return df

In [16]:
url = UrlSetting('45130','201901')
html = requests.get(url)
html

<Response [200]>

In [17]:
eval(html.text)

{'response': {'header': {'resultCode': '00', 'resultMsg': 'NORMAL SERVICE.'},
  'body': {'items': '', 'numOfRows': 10, 'pageNo': 1, 'totalCount': 0}}}

In [40]:
html.json()

{'response': {'header': {'resultCode': '00', 'resultMsg': 'NORMAL SERVICE.'},
  'body': {'items': {'item': [{'거래금액': '     4,000',
      '건축년도': 1989,
      '년': 2018,
      '법정동': ' 금동',
      '아파트': '한신88맨션',
      '월': 11,
      '일': '1~10',
      '전용면적': 83.16,
      '지번': '26-2',
      '지역코드': 45130,
      '층': 3},
     {'거래금액': '     6,100',
      '건축년도': 1992,
      '년': 2018,
      '법정동': ' 금동',
      '아파트': '동신',
      '월': 11,
      '일': '11~20',
      '전용면적': 74.86,
      '지번': 10,
      '지역코드': 45130,
      '층': 9},
     {'거래금액': '    10,300',
      '건축년도': 2002,
      '년': 2018,
      '법정동': ' 월명동',
      '아파트': '다원파크빌',
      '월': 11,
      '일': '1~10',
      '전용면적': 84.829,
      '지번': '7-3',
      '지역코드': 45130,
      '층': 3},
     {'거래금액': '    11,000',
      '건축년도': 2003,
      '년': 2018,
      '법정동': ' 월명동',
      '아파트': '현대오솔',
      '월': 11,
      '일': '21~30',
      '전용면적': 84.966,
      '지번': '15-1',
      '지역코드': 45130,
      '층': 3},
     {'거래금액': '     8,850',

In [41]:
requests.get(url).json()

{'response': {'header': {'resultCode': '00', 'resultMsg': 'NORMAL SERVICE.'},
  'body': {'items': {'item': [{'거래금액': '     4,000',
      '건축년도': 1989,
      '년': 2018,
      '법정동': ' 금동',
      '아파트': '한신88맨션',
      '월': 11,
      '일': '1~10',
      '전용면적': 83.16,
      '지번': '26-2',
      '지역코드': 45130,
      '층': 3},
     {'거래금액': '     6,100',
      '건축년도': 1992,
      '년': 2018,
      '법정동': ' 금동',
      '아파트': '동신',
      '월': 11,
      '일': '11~20',
      '전용면적': 74.86,
      '지번': 10,
      '지역코드': 45130,
      '층': 9},
     {'거래금액': '    10,300',
      '건축년도': 2002,
      '년': 2018,
      '법정동': ' 월명동',
      '아파트': '다원파크빌',
      '월': 11,
      '일': '1~10',
      '전용면적': 84.829,
      '지번': '7-3',
      '지역코드': 45130,
      '층': 3},
     {'거래금액': '    11,000',
      '건축년도': 2003,
      '년': 2018,
      '법정동': ' 월명동',
      '아파트': '현대오솔',
      '월': 11,
      '일': '21~30',
      '전용면적': 84.966,
      '지번': '15-1',
      '지역코드': 45130,
      '층': 3},
     {'거래금액': '     8,850',

In [42]:
DataFrame.from_records(html.json()["response"]["body"]["items"]["item"]).head(10)

Unnamed: 0,거래금액,건축년도,년,법정동,아파트,월,일,전용면적,지번,지역코드,층
0,4000,1989,2018,금동,한신88맨션,11,1~10,83.16,26-2,45130,3
1,6100,1992,2018,금동,동신,11,11~20,74.86,10,45130,9
2,10300,2002,2018,월명동,다원파크빌,11,1~10,84.829,7-3,45130,3
3,11000,2003,2018,월명동,현대오솔,11,21~30,84.966,15-1,45130,3
4,8850,1992,2018,문화동,삼성,11,1~10,84.87,26,45130,4
5,10000,1992,2018,문화동,삼성,11,21~30,84.87,26,45130,8
6,7700,1996,2018,삼학동,삼학대우,11,21~30,59.892,811-1,45130,7
7,13000,2011,2018,대명동,현대메트로타워,11,1~10,84.9348,385-60,45130,29
8,16100,2011,2018,대명동,현대메트로타워,11,21~30,84.9348,385-60,45130,33
9,15700,2011,2018,대명동,현대메트로타워,11,21~30,84.9348,385-60,45130,26


## 2. Data Formatting
---
아파트, 단독주택, 연립주택, 오피스텔, 토지 등의 원본 DataFrame 차원이 다르기 때문에
Data Importing 함수와 Data Formatting 함수를 분리하였다.



### 2.1. DataFormatting()
>수집된 Data를 저장 형식에 맞게 처리하는 과정이다.  
>Formatting 과정에서도 몇 가지 처리 방법이 적용된다.
>1. 제거 : `지번` column의 경우 사용되지 않기 때문에 제거한다.
><br/><br/>
>2. 변환 :   
    1) `거래금액`의 경우 '1,000'와 같은 형식의 string 타입으로 저장되어있다.  
    이를 integer로 변환하여 연산이 가능하도록 처리한다.  
    2) `전용면적`을 3.3으로 나눠 `평`column을 생성한다.  
    3) `거래금액`에서 `평`을 나누어 `평당가격`column을 생성한다.  
><br/>
>3. 그룹화 : `건축년도`, `거래금액`, `평`, `평당가격`, `층`을 각각의 case에 맞게 그룹화하여 저장한다.


In [6]:
def DataFormatting(df):
    
    # 지번 제거
    df_mod = df.drop('지번',axis=1)
    
    # 거래금액 integer 변환
    for i in range(len(df)):
        df_mod.iloc[i,0]=re.sub(",","",df.iloc[i,0])
    df_mod["거래금액"]=df_mod["거래금액"].astype(int)
    
    # 평, 평당가격 생성
    df_mod["평"] = df_mod["전용면적"]/3.3
    df_mod["평당가격"] = df_mod["거래금액"]/df_mod["평"]
    
    # 법정동 양 끝 공백문자 제거
    df_mod["법정동"]= df_mod["법정동"].apply(lambda x: x.strip())


    # Grouping
    for i in range(len(df_mod)):
        
        #건축년대
        if df_mod.loc[i,"건축년도"]<1980:
            df_mod.loc[i,"건축년대"]="1960,70년대"
        elif df_mod.loc[i,"건축년도"]<1990:
            df_mod.loc[i,"건축년대"]="1980년대"
        elif df_mod.loc[i,"건축년도"]<2000:
            df_mod.loc[i,"건축년대"]="1990년대"
        elif df_mod.loc[i,"건축년도"]<2010:
            df_mod.loc[i,"건축년대"]="2000년대"
        else :
            df_mod.loc[i,"건축년대"]="2010년대"
        
        #거래금액그룹
        if df_mod.loc[i,"거래금액"]<10000:
            df_mod.loc[i,"거래금액그룹"]="01억 미만"
        elif df_mod.loc[i,"거래금액"]<50000:
            df_mod.loc[i,"거래금액그룹"]="01억 ~ 05억"
        elif df_mod.loc[i,"거래금액"]<100000:
            df_mod.loc[i,"거래금액그룹"]="05억 ~ 10억"
        elif df_mod.loc[i,"거래금액"]<200000:
            df_mod.loc[i,"거래금액그룹"]="10억 ~ 20억"
        elif df_mod.loc[i,"거래금액"]<300000:
            df_mod.loc[i,"거래금액그룹"]="20억 ~ 30억"
        else :
            df_mod.loc[i,"거래금액그룹"]="30억 이상"
            

        #평그룹
        if df_mod.loc[i,"평"]<10:
            df_mod.loc[i,"평그룹"]="10평 미만"
        elif df_mod.loc[i,"평"]<20:
            df_mod.loc[i,"평그룹"]="10평 대"
        elif df_mod.loc[i,"평"]<30:
            df_mod.loc[i,"평그룹"]="20평 대"
        elif df_mod.loc[i,"평"]<40:
            df_mod.loc[i,"평그룹"]="30평 대"
        elif df_mod.loc[i,"평"]<50:
            df_mod.loc[i,"평그룹"]="40평 대"
        elif df_mod.loc[i,"평"]<60:
            df_mod.loc[i,"평그룹"]="50평 대"
        else :
            df_mod.loc[i,"평그룹"]="60평 이상"

                        
        # 층그룹
        if df_mod.loc[i,"층"]<1:
            df_mod.loc[i,"층그룹"]="지하"
        elif df_mod.loc[i,"층"]<2:
            df_mod.loc[i,"층그룹"]="1층"
        elif df_mod.loc[i,"층"]<5:
            df_mod.loc[i,"층그룹"]="2층~5층"
        elif df_mod.loc[i,"층"]<10:
            df_mod.loc[i,"층그룹"]="5층~9층"
        elif df_mod.loc[i,"층"]<20:
            df_mod.loc[i,"층그룹"]="10층~19층"
        elif df_mod.loc[i,"층"]<30:
            df_mod.loc[i,"층그룹"]="20층~29층"
        elif df_mod.loc[i,"층"]<40:
            df_mod.loc[i,"층그룹"]="30층~39층"
        elif df_mod.loc[i,"층"]<50:
            df_mod.loc[i,"층그룹"]="40층~49층"
        else :
            df_mod.loc[i,"층그룹"]="50층 이상"
            
        # 평당가격그룹
        if df_mod.loc[i,"평당가격"]<1000:
            df_mod.loc[i,"평당가격그룹"]="1,000만 미만"
        elif df_mod.loc[i,"평당가격"]<2500:
            df_mod.loc[i,"평당가격그룹"]="1,000만~2,500만"
        elif df_mod.loc[i,"평당가격"]<5000:
            df_mod.loc[i,"평당가격그룹"]="2,500만~5,000만"
        elif df_mod.loc[i,"평당가격"]<10000:
            df_mod.loc[i,"평당가격그룹"]="5,000만~1억"
        elif df_mod.loc[i,"평당가격"]<20000:
            df_mod.loc[i,"평당가격그룹"]="1억~2억"
        else :
            df_mod.loc[i,"평당가격그룹"]="2억 이상"

    return df_mod

## 3. Data Export to Mysql DB
---
처리 된 데이터를 Mysql 데이터베이스에 Export시켜 Looker Dashboard를 구성할 수 있도록 준비하는 과정이다.

작업 과정은 다음과 같다.
>1. 법정동코드 조회 :  
    DB에 준비해놓은 `"전국지역정보 마스터 테이블"`에서 `법정동코드`를 불러온다.
    <br/><br/>
>2. 개별 월 데이터 구성 :  
    해당 월에 대한 전국 아파트 실거래가를 하나의 Dataframe으로 구성한다. 
<br/><br/>
>3. 데이터베이스에 월별 데이터 저장 :  
    현재 월과 조사 대상 월의 차이 비교를 통해 update rule을 설정한다.  
>    update rule을 따라서 DB에 Table을 Export한다.  
    - update rule :  
        현재월, 1개월 전은 **매일 update**  
        2개월, 3개월 전은 **1,15일 마다 update**  
        나머지는 **update를 실시하지 않음**.  
    
<br/><br/>
### 3.1. CdImporting()
>CdImporting는 사전에 준비되어 있던 `지역정보 Table`로부터 distinct한 lawd_cd를 불러와 urlImport()의 Input 값을 준비한다.  

In [7]:
def CdImporting():
    con = MySQLdb.connect(host='192.168.1.214',
                          port=4406,
                          user="temp",
                          password="temp",
                          db="Looker_TF",
                          charset="utf8")
    curs=con.cursor()
    
    sql="select distinct sicode from lawd_cd_lati"
    curs.execute(sql)
    sicode = curs.fetchall()

    con.close()
    
    return sicode

In [14]:
lcd = CdImporting()
lcd

((11000,),
 (11110,),
 (11140,),
 (11170,),
 (11200,),
 (11215,),
 (11230,),
 (11260,),
 (11290,),
 (11305,),
 (11320,),
 (11350,),
 (11380,),
 (11410,),
 (11440,),
 (11470,),
 (11500,),
 (11530,),
 (11545,),
 (11560,),
 (11590,),
 (11620,),
 (11650,),
 (11680,),
 (11710,),
 (11740,),
 (26000,),
 (26110,),
 (26140,),
 (26170,),
 (26200,),
 (26230,),
 (26260,),
 (26290,),
 (26320,),
 (26350,),
 (26380,),
 (26410,),
 (26440,),
 (26470,),
 (26500,),
 (26530,),
 (26710,),
 (27000,),
 (27110,),
 (27140,),
 (27170,),
 (27200,),
 (27230,),
 (27260,),
 (27290,),
 (27710,),
 (28000,),
 (28110,),
 (28140,),
 (28177,),
 (28185,),
 (28200,),
 (28237,),
 (28245,),
 (28260,),
 (28710,),
 (28720,),
 (29000,),
 (29110,),
 (29140,),
 (29155,),
 (29170,),
 (29200,),
 (30000,),
 (30110,),
 (30140,),
 (30170,),
 (30200,),
 (30230,),
 (31000,),
 (31110,),
 (31140,),
 (31170,),
 (31200,),
 (31710,),
 (36110,),
 (41000,),
 (41110,),
 (41111,),
 (41113,),
 (41115,),
 (41117,),
 (41130,),
 (41131,),
 (41133,),

In [15]:
lcd[3][0]

11170

### 3.2. DataConcat()
>월 별 데이터를 구성한다.
조회하고자 하는 월을 고정하고 lawd_cd 값 전체를 조회하면서 Dataframe을 차례로 병합한다.

In [75]:
def DataConcat(ymd):

    sicode = CdImporting()
    
    df_res = DataFrame([])
    for i in range(len(sicode)):
        requestUrl=UrlSetting(sicode[i][0],ymd)
        dict0 = requests.get(requestUrl).json()

        if dict0["response"]["body"]["totalCount"]==0:
            continue
        else :
            df=UrlImporting(requestUrl)
            df_mod=DataFormatting(df)
            df_res= pd.concat([df_res,df_mod],ignore_index=True)


    return df_res

### 3.3. run()
> `월 별 전국 매매 데이터프레임`를 Mysql DB에 저장하며 실제 주기적으로 수행 될 모듈이다.
<br/><br/>
1) 현재 월, 직전 월의 경우 3 일 간격으로 업데이트  
2) 2,3개월 전의 경우 매달 30일에 업데이트  
3) 나머지 개월의 경우는 업데이트를 진행 X  
>
>위의 규칙을 조건문으로 적용하여 DB에 Export 하는 모듈을 개발한다.  

In [79]:
def run():

    year_now = (datetime.today().year)
    month_now = (datetime.today().month)
    day_now =  (datetime.today().day)
    
    #month_now = 3
    #day_now = 30
    
    engine = create_engine("mysql+mysqldb://temp"+":temp"+"@192.168.1.214:4406"+"/Looker_TF",encoding='utf-8')
    conn = engine.connect()

    print("Module was started at "+str(datetime.now().time()))
    
    if day_now%3 == 0:
        
        if day_now == 30:
            num_month = 4
        else :
            num_month=2

        for j in range(num_month):
            exp_month = month_now-j

            if exp_month<10 and exp_month>0:
                str_exp_month="0"+str(exp_month)
                str_exp_year = str(year_now)
                ymd=str_exp_year+str_exp_month

                df_name = "kor_apt_"+ str_exp_year + str_exp_month

            elif exp_month>=10 :
                str_exp_month= str(exp_month)
                str_exp_year = str(year_now)
                ymd=str_exp_year+str_exp_month

                df_name = "kor_apt_"+ str_exp_year + str_exp_month

            elif exp_month<=0:
                str_exp_month= str(exp_month)
                str_exp_year = str(year_now-1)
                ymd=str_exp_year+str_exp_month

                df_name = "kor_apt_"+ str_exp_year + str_exp_month
                

            df_res=DataConcat(ymd)
                                    
            if len(df_res.columns) == 0:
                df_res=DataFrame(columns=['거래금액','건축년도','년','법정동','아파트','월','일','전용면적','지역코드','층',
                                   '평','평당가격','건축년대','거래금액그룹','평그룹','층그룹','평당가격그룹'])

            df_res.to_sql(name=df_name, con=conn, if_exists='replace',index=False)

            print(df_name + " was done at "+str(datetime.now().time()))
            
        Concat_Main()
        Concat_Refresh()
        Concat_tmp()
        print("Table was refreshed")
    conn.close()


## 4. Concatenating Table
---

3 개월이 지난 테이블은 변동된 내용이 거의 없을 것이다.  
(과거에는 매매거래를 3개월 이내에 신고해야 했지만 최근에는 1개월 이내로 신고하도록 변경되었기 때문에  
여러 조건을 감안하더라도 3 개월 이후의 테이블에 새로 추가되는 데이터는 없을 것이라 생각하는 것이 타당하다.)  

따라서 **4 개월 이후**의 데이터를 `Main 테이블`로 묶고,  
**4 개월 이내**의 데이터는 `Refresh 테이블`로 구성한다.  
위의 두 테이블을 합친 `Main_tmp 테이블`을 Looker에서 호출할 테이블로 지정할 것이다.  

>이후 LookML을 통해 월 별 분리된 테이블을 하나의 테이블로 묶어주는 방법을 찾게 된다면  
Concatenating 과정을 거칠 필요가 없을 것이라 생각되지만  
아직 그 방법을 모르기 때문에 위의 과정이 필요하다.

<br/>
구성될 3개의 테이블은 다음과 같다.

* kor_apt_main : 매매거래 신고된 시점이 현재 월로부터 4개월 이상 지난 데이터 (매 월 3일마다 Refresh)
* kor_apt_refresh : 매매거래 신고 시점이 현재 월로부터 4개월 이내인 데이터
* kor_apt_main_tmp : Main + Refresh 테이블 (Looker에 연결될 테이블)
<br/>

In [10]:
def Concat_Main():
    day_now =  (datetime.today().day)

    con = MySQLdb.connect(host='192.168.1.214',
                          port=4406,
                          user="temp",
                          password="temp",
                          db="Looker_TF",
                          charset="utf8")
    curs=con.cursor()

    sql1='''SELECT TABLE_NAME
    FROM INFORMATION_SCHEMA.TABLES 
    WHERE TABLE_SCHEMA = \'Looker_TF\' and TABLE_NAME REGEXP\'^kor_apt_20\' '''

    curs.execute(sql1)
    tabname = curs.fetchall()

    if day_now == 3:
        sql = '''insert into kor_apt_main select * from {0}'''.format(tabname[-5][0])
        curs.execute(sql)

    con.commit()
    con.close()


In [11]:
def Concat_Refresh():
    con = MySQLdb.connect(host='192.168.1.214',
                          port=4406,
                          user="temp",
                          password="temp",
                          db="Looker_TF",
                          charset="utf8")
    curs=con.cursor()
    
    sql1='''SELECT TABLE_NAME
    FROM INFORMATION_SCHEMA.TABLES 
    WHERE TABLE_SCHEMA = \'Looker_TF\' and TABLE_NAME REGEXP\'^kor_apt_20\' '''

    sql2 = 'drop table kor_apt_refresh'
    
    sql3 = '''CREATE TABLE kor_apt_refresh
    (거래금액 int(11),
    건축년도 bigint(20),
    년 bigint(20),
    법정동 text,
    아파트 text,
    월 bigint(20),
    일 text,
    전용면적 double,
    지역코드 bigint(20),
    층 bigint(20),
    평 double,
    평당가격 double,
    건축년대 text,
    거래금액그룹 text,
    평그룹 text,
    층그룹 text,
    평당가격그룹 text)
    '''
    curs.execute(sql1)
    tabname = curs.fetchall()

    curs.execute(sql2)
    curs.execute(sql3)
    
    for i in range(len(tabname)-1,len(tabname)-4-1,-1):
        sql4 = 'insert into kor_apt_refresh select * from {0}'.format(tabname[i][0])
        curs.execute(sql4)

    con.commit()
    con.close()

In [12]:
def Concat_tmp():
    con = MySQLdb.connect(host='192.168.1.214',
                          port=4406,
                          user="temp",
                          password="temp",
                          db="Looker_TF",
                          charset="utf8")
    curs=con.cursor()

    sql2 = 'drop table kor_apt_tmp'

    sql3 = '''CREATE TABLE kor_apt_tmp
    (거래금액 int(11),
    건축년도 bigint(20),
    년 bigint(20),
    법정동 text,
    아파트 text,
    월 bigint(20),
    일 text,
    전용면적 double,
    지역코드 bigint(20),
    층 bigint(20),
    평 double,
    평당가격 double,
    건축년대 text,
    거래금액그룹 text,
    평그룹 text,
    층그룹 text,
    평당가격그룹 text)
    '''

    curs.execute(sql2)
    curs.execute(sql3)

    sql4 = 'insert into kor_apt_tmp select * from kor_apt_main'
    sql5 = 'insert into kor_apt_tmp select * from kor_apt_refresh'
    curs.execute(sql4)
    curs.execute(sql5)
    con.commit()
    con.close()

In [80]:
run()

Module was started at 16:02:49.329055
kor_apt_201901 was done at 16:03:15.064243
kor_apt_20180 was done at 16:03:35.857636
Table was refreshed
