In [1]:
import PublicDataReader as pdr
from config import OpenAPI
import pandas as pd

# DataFrame 디스플레이 설정
pd.set_option('display.max_columns', 250)
pd.set_option('display.max_rows', 250)
pd.set_option('display.width', 100)

print(pdr.__all__)
print(pdr.__version__)
print(pdr.__info__)

['__version__', '__info__', 'Transaction', 'Building', 'code_list']
2021.11.
- Author : Wooil Jeong
- E-mail : wooil@kakao.com
- Github : https://github.com/WooilJeong/PublicDataReader
- Blog : https://wooiljeong.github.io


In [None]:
# 법정동코드 목록
code = pdr.code_list()

In [None]:
# 공공 데이터 포털 Open API 서비스키
serviceKey = OpenAPI['molit']
self = pdr.Transaction(serviceKey, debug=True)

In [None]:
prod="아파트"
trans="매매"
sigunguCode="41135"
yearMonth="202101"

df = self.read_data(prod, trans, sigunguCode, yearMonth)
df

In [None]:
df = self.collect_data(prod, trans, sigunguCode, "201901", "202111")
df

## Building Class

In [11]:
import pandas as pd
import numpy as np
from dateutil.relativedelta import relativedelta
import datetime
import logging
import requests
from bs4 import BeautifulSoup

In [12]:
def read_data(self, category, **kwargs):
    
    # 엔드포인트, 파라미터 및 컬럼 목록 매핑
    try:
        endpoint = self.metaDict[category]['url']
        parameters = self.metaDict[category]['parameters']
        columns = self.metaDict[category]['columns']
    except:
        self.logger.error(f"{category} 참조 오류")
        return

    try:
        params = ""
        for key, value in kwargs.items():
            params += f"&{key}={value}"
    except:
        self.logger.error(f"{category} 파라미터 파싱 오류")
        return
    
    try:
        # URL
        url=f"""{endpoint}{params}&numOfRows=99999"""
        
        print(url)

        # Open API 호출
        result = requests.get(url, verify=False)
        xmlsoup = BeautifulSoup(result.text, "lxml-xml")
        header = xmlsoup.find("header")
        result_code = header.find("resultCode").text
        result_msg = header.find("resultMsg").text
        items = xmlsoup.findAll("item")

    except:
        self.logger.error(f"Open API 호출 오류")
        return
    
    if result_code == "00":
        """
        결과 정상
        """
        # 데이터프레임 생성
        try:
            df = pd.DataFrame()
            for item in items:
                row = {}
                for col in columns:
                    try:
                        tag = item.find(col)
                        row[col] = tag.text.strip()
                    except:
                        row[col] = ""
                df_ = pd.DataFrame([row])
                df = df.append(df_)

            if len(df) != 0:
                df = df[columns]
                df.index = range(len(df))
            else:
                self.logger.info(f"조회 결과 없음")
                return pd.DataFrame(columns=columns)

        except:
            self.logger.error(f"조회 로직 오류")
            return

    else:
        """
        결과 에러
        """
        self.logger.error(f"({result_code}) {result_msg}")
        return

    return df

In [13]:
# 공공 데이터 포털 Open API 서비스키
serviceKey = OpenAPI['molit']
self = pdr.Building(serviceKey, debug=False)

In [None]:
self.getBrExposInfo()

In [23]:
df = read_data(self, "전유부", sigunguCd='41135', bjdongCd='11000', bun='0541', ji='0000')
df

http://apis.data.go.kr/1613000/BldRgstService_v2/getBrExposInfo?serviceKey=3jDBC6n6Bic0TceuOPjhpDuHrsAVl7czZAMq3Q1wQxGVgkfgUJjISPts8tiBqBT1TgY5S0LaeRb4d7Qk5vKMvA%3D%3D&sigunguCd=41135&bjdongCd=11000&bun=0541&ji=0000&numOfRows=99999


Unnamed: 0,bjdongCd,bldNm,block,bun,crtnDay,dongNm,flrGbCd,flrGbCdNm,flrNo,hoNm,ji,lot,mgmBldrgstPk,naBjdongCd,naMainBun,naRoadCd,naSubBun,naUgrndCd,newPlatPlc,platGbCd,platPlc,regstrGbCd,regstrGbCdNm,regstrKindCd,regstrKindCdNm,rnum,sigunguCd,splotNm


In [None]:
kwargs = {
    "sigunguCd": 41135,
    "bjdongCd": "11000",
    "bun": "0541",
    "ji": "0000"
}

In [None]:
# 건축물대장 항목
category = "기본개요"

url = self.metaDict[category]['url']
parameters = self.metaDict[category]['parameters']
columns = self.metaDict[category]['columns']



In [None]:
sigunguCd = "41135"
bjdongCd = "11000"
bun = "541".zfill(4)
ji = "".zfill(4)

test(sigunguCd=sigunguCd, bjdongCd=bjdongCd, bun=bun, ji=ji)

In [None]:
    # 엔드포인트 및 컬럼 목록 매핑
    try:
        endpoint = self.metaDict[prod][trans]['url']
        parameters = self.metaDict[category]['parameters']
        columns = self.metaDict[prod][trans]['columns']
    except:
        self.logger.error(f"{prod} {trans} 참조 오류")
        return

    try:
        # URL
        url=f"""{endpoint}&LAWD_CD={str(sigunguCode)}&DEAL_YMD={str(yearMonth)}&numOfRows=99999"""
        # Open API 호출
        result = requests.get(url, verify=False)
        xmlsoup = BeautifulSoup(result.text, "lxml-xml")
        header = xmlsoup.find("header")
        result_code = header.find("resultCode").text
        result_msg = header.find("resultMsg").text
        items = xmlsoup.findAll("item")

    except:
        self.logger.error(f"Open API 호출 오류")
        return

    if result_code == "00":
        """
        결과 정상
        """
        # 데이터프레임 생성
        try:
            df = pd.DataFrame()
            for item in items:
                row = {}
                for col in columns:
                    try:
                        tag = item.find(col)
                        row[col] = tag.text.strip()
                    except:
                        row[col] = ""
                df_ = pd.DataFrame([row])
                df = df.append(df_)

            if len(df) != 0:
                df = df[columns]
                df.index = range(len(df))
            else:
                self.logger.info(f"조회 결과 없음")
                return pd.DataFrame(columns=columns)

        except:
            self.logger.error(f"조회 로직 오류")
            return

    else:
        """
        결과 에러
        """
        self.logger.error(f"({result_code}) {result_msg}")
        return

    return df

In [None]:
# Sample Parameter - (판교 현대백화점)
# 시군구코드(5)
sigunguCd = "41135"
# 읍면동코드(5)
bjdongCd = "11000"
# 본번
bun = "541".zfill(4)
# 부번
ji = "".zfill(4)

# (Operaion 01) 기본개요
df1 = self.getBrBasisOulnInfo(
    sigunguCd_=sigunguCd,
    bjdongCd_=bjdongCd,
    platGbCd_="0",
    bun_=bun,
    ji_=ji,
    startDate_="",
    endDate_=""
)
df1 = self.ChangeCols(df1, "getBrBasisOulnInfo")

## Transaction Class

In [None]:
# 11종 데이터 조회 테스트
sigunguCode = "11680"
yearMonth = "202110"

df_list = []
for prod in self.metaDict.keys():
    for trans in self.metaDict[prod].keys():
        print()
        print("▶", prod, trans)
        print()
        df= self.read_data(prod, trans, sigunguCode, yearMonth)
        df_list.append(df)
        print(df.head(1))

In [None]:
prod = "아파트"
trans = "매매"
sigunguCode = "11680"
yearMonth = "202110"
startYearMonth = "202101"
endYearMonth = "202103"

In [None]:
df = self.read_data(prod, trans, sigunguCode, yearMonth)
df

In [None]:
df_sum = self.collect_data(prod, trans, sigunguCode, startYearMonth, endYearMonth)
df_sum

## 컬럼 리스트 추출

In [None]:
# LAWD_CD=11680
# DEAL_YMD=202110


# for prod in ['아파트','오피스텔','단독다가구','연립다세대','상업업무용','분양입주권','토지']:
#     for trans in ['매매', '전월세']:
#         try:
#             print()
#             print(f">> {prod} {trans}")
#             print()
#             service_url = self.metaDict[prod][trans]['url']

#             # URL
#             url=f"""\
# {service_url}\
# &LAWD_CD={str(LAWD_CD)}\
# &DEAL_YMD={str(DEAL_YMD)}\
# &numOfRows=99999\
#             """

#             result = requests.get(url, verify=False)
#             xmlsoup = BeautifulSoup(result.text, "lxml-xml")
#             item = xmlsoup.find("item")

#             col_list = []
#             for i in item:
#                 col_list.append(i.name)
#             for col in col_list: 
#                 print(f"'{col}'", end=',')
                
#         except:
#             print("Error")
#             pass

### Features

- 공통

    - 로깅 기능
        - 세션 초기화 시 `debug` 인자 추가
            - False(Default): 오류 레벨만 출력
            - True: 모든 레벨 출력
        - OPEN API 에러 코드 출력

    - Air Korea Open API 모듈 제거
    
    - 법정동코드 테이블 조회 함수 추가

- 부동산 실거래가

    - Operation 별 조회 항목 수정
        - 매매자료 '해제사유발생일' 항목 추가
        - 거래유형, 중개사소재지 항목 추가
    - 데이터 조회 메서드 일원화
        - molit.read_data('아파트', '매매', '11680', '202111')
            - 서비스별 End-point 및 컬럼 매핑 딕셔너리 추가
    - 데이터 수집 메서드 신규 메서드 추가
        - molit.collect_data('아파트', '매매', '11680', '202101', '202103')

- 건축물대장

