# 공공데이터포털 실습: 활용 가이드

- 공공데이터포털에서 제공되는 데이터를 쉽게 수집하기 위하여 오픈 API를 이용합니다.
- 국토교통부 아파트매매 실거래가 데이터를 수집하는 예제를 실행합니다.

### HTTP 요청 실행

In [None]:
# 관련 라이브러리를 호출합니다.
import requests

In [None]:
# 요청 URL을 설정합니다.
url = 'http://openapi.molit.go.kr:8081/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc/getRTMSDataSvcAptTrade'

In [None]:
# Query String의 파라미터 값을 설정합니다.
# 오퍼레이션의 예제로 설정합니다. : 서울특별시 종로구, 2015년 12월 매매
areaCd = '11110'
ymonth = '201512'

In [None]:
# 공공데이터포털 일반인증키를 설정합니다.
apiKey = '공공데이터포털에서 발급받은 일반인증키를 여기에 붙여넣으세요!'

In [None]:
# Query String을 딕셔너리로 생성합니다.
query = {'LAWD_CD': areaCd, 'DEAL_YMD': ymonth, 'serviceKey': apiKey}

In [None]:
# HTTP 요청을 실행합니다.
res = requests.get(url = url, params = query)

### HTTP 응답 확인

In [None]:
# HTTP 응답 상태코드를 확인합니다.
res.status_code

In [None]:
# HTTP 응답 헤더를 확인합니다.
# [참고] Content-Type이 'xml'입니다.
res.headers

In [None]:
# HTTP 요청 URL만 확인합니다.
# [참고] Query String이 조립되는 과정에서 퍼센트(더블) 인코딩 문제 발생합니다.
# [참고] 퍼센트 인코딩 문제는 웹 서버로 전달되는 문자열 '%'가 '%25'로 바뀌는 현상입니다.
res.url

In [None]:
# HTTP 응답 Body를 출력합니다.
res.text

### 필요한 데이터 수집

- Open API는 XML 또는 JSON 형태로 제공합니다.
- 이번 예제에서는 XML로 받은 응답 텍스트를 데이터프레임으로 변환하는 방법을 소개합니다.

In [None]:
# 관련 라이브러리를 설치합니다.
# !pip install xmltodict

# 관련 라이브러리를 호출합니다.
import xmltodict
import pandas as pd

In [None]:
# str 자료형을 collections.OrderedDict 자료형으로 변환합니다.
dat = xmltodict.parse(xml_input = res.text)

In [None]:
# dat의 클래스를 확인합니다.
type(dat)

In [None]:
# 딕셔너리를 인덱싱하듯이 key를 연결하면 리스트로 반환됩니다.
dat['response']['body']['items']['item']

In [None]:
# dat를 데이터프레임으로 변환합니다.
apt = pd.DataFrame(data = dat['response']['body']['items']['item'])

In [None]:
# 데이터프레임의 정보를 확인합니다.
apt.info()

In [None]:
# 처음 다섯 행만 출력합니다.
apt.head()

## End of Document