# 공공데이터: 아파트 실거래가

- 공공데이터포털에서 제공되는 데이터를 쉽게 수집하기 위하여 오픈 API를 이용합니다.
- 국토교통부 아파트매매 실거래가 데이터를 수집하는 예제를 실행합니다.

### 관련 라이브러리 호출

In [None]:
# 관련 라이브러리를 호출합니다.
import requests
import xmltodict
import pandas as pd
import os, datetime

### HTTP 요청 실행

In [None]:
# 요청 URL을 지정합니다.
url = 'http://openapi.molit.go.kr:8081'
path = '/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc'
oper = '/getRTMSDataSvcAptTrade'

In [None]:
# 요청 변수를 딕셔너리로 지정합니다.(서울특별시 강남구, 2021년 12월)
query = {'LAWD_CD': '11680', 
         'DEAL_YMD': '202112', 
         'serviceKey': '공공데이터포털 일반 인증키(Decoding) 붙여넣기'}

In [None]:
# HTTP 요청을 실행합니다.
res = requests.get(url = url + path + oper, params = query)

### HTTP 응답 확인

In [None]:
# HTTP 응답 상태코드를 확인합니다.
res.status_code

In [None]:
# HTTP 응답 헤더를 확인합니다.
# [참고] Content-Type이 'xml'입니다.
res.headers

In [None]:
# HTTP 응답 바디(텍스트)의 일부를 출력합니다.
res.text[:1000]

### XML 데이터 수집

- Open API는 XML 또는 JSON 형태로 제공합니다.
- 이번 예제에서는 XML로 받은 응답 텍스트를 데이터프레임으로 변환하는 방법을 소개합니다.

In [None]:
# 문자열을 collections.OrderedDict로 변환하여 dat를 생성합니다.
dat = xmltodict.parse(xml_input = res.text)

In [None]:
# dat를 출력합니다. [참고] dat의 클래스는 collections.OrderedDict 입니다.
dat

In [None]:
# dat의 key를 연결하여 필요한 부분만 선택합니다.
dat['response']['body']['items']['item']

In [None]:
# dat로 데이터프레임을 생성합니다.
df = pd.DataFrame(data = dat['response']['body']['items']['item'])

### xlsx 파일로 저장

In [None]:
# data 폴더로 작업 경로를 변경합니다.
os.chdir(path = '../data')

In [None]:
# xlsx 파일명을 설정합니다.
today = datetime.datetime.now().strftime('%Y%m%d')
fileName = f'DATAGOKR_APT_Price_{today}.xlsx'

In [None]:
# df를 xlsx 파일로 저장합니다.
df.to_excel(excel_writer = fileName, index = None)

## End of Document