## 공공데이터포털: 아파트 실거래가

- 공공데이터포털(https://www.data.go.kr) 페이지를 탐색합니다.
  - 국토교통부 아파트매매 실거래자료 오퍼레이션을 찾고 활용신청합니다.
  - 일반 인증키(Decoding)를 복사하여 Jupyter Notebook에 붙여넣습니다.
  - 활용가이드에서 요청 및 응답 메시지를 확인합니다.

### HTTP 요청 실행

In [None]:
# 관련 라이브러리를 호출합니다.
import requests

In [None]:
# 요청 URL을 세 개의 변수에 나눠서 설정합니다.
url = 'http://openapi.molit.go.kr:8081'
path = '/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc'
oper = '/getRTMSDataSvcAptTrade'

In [None]:
# 공공데이터포털 오픈 API 인증키를 설정합니다.
apiKey = '일반 인증키(Decoding) 붙여넣기'

# 공공데이터포털 오픈 API 인증키를 설정합니다.
apiKey = 'w/bHomeyexLDCQwnrMN18xTTSewt4c6MnoL8+6PLqlYpoeuuXpsMJfmGG0OFIxCr3yY/PHvyJFwgw+mSRlIAjg=='

In [None]:
# 쿼리 문자열을 딕셔너리로 설정합니다.
query = {
    'LAWD_CD': '11680', 
    'DEAL_YMD': '202306', 
    'serviceKey': apiKey
}

In [None]:
# HTTP 요청을 실행합니다.
res = requests.get(url = url + path + oper, params = query)

### HTTP 응답 확인

In [None]:
# HTTP 응답 상태코드를 확인합니다.
res.status_code

In [None]:
# HTTP 응답 헤더에서 Content-Type을 확인합니다.
res.headers['content-type']

In [None]:
# HTTP 응답 바디 문자열을 출력합니다.
res.text

In [None]:
# HTTP 요청 URL을 출력합니다.
res.url

### XML 데이터 전처리

In [None]:
# 관련 라이브러리를 호출합니다.
import xmltodict

In [None]:
# HTTP 응답 바디 문자열을 딕셔너리로 변환합니다.
dat = xmltodict.parse(xml_input = res.text)

In [None]:
# dat를 출력합니다.
dat

In [None]:
# dat의 클래스를 확인합니다.
type(dat)

In [None]:
# dat에서 결과를 선택하고 result에 할당합니다.
result = dat['response']['body']['items']['item']

### 데이터프레임 생성

In [None]:
# 관련 라이브러리를 호출합니다.
import pandas as pd

In [None]:
# result로 데이터프레임을 생성합니다.
df = pd.DataFrame(data = result)

In [None]:
# df의 정보를 확인합니다.
df.info()

In [None]:
# df의 처음 5행을 출력합니다.
df.head()

### 데이터 전처리

In [None]:
# '년', '월', '일'을 원소로 갖는 리스트를 생성합니다.
cols = ['년', '월', '일']

In [None]:
# '년', '월', '일'을 결합하여 거래일을 생성합니다.
df['거래일'] = df[cols].apply(func = lambda x: '-'.join(x), axis = 1)

In [None]:
# 거래금액에서 콤마를 삭제합니다.
df['거래금액'] = df['거래금액'].str.replace(pat = ',', repl = '')

In [None]:
# df에서 거래일을 날짜시간형, 거래금액을 정수형으로 변환합니다.
df = df.astype(dtype = {'거래일': 'datetime64[ns]', '거래금액': int})

In [None]:
# df의 열이름을 출력합니다.
df.columns

In [None]:
# 선택할 열이름을 원소로 갖는 리스트를 생성합니다.
cols = ['지역코드', '아파트', '법정동', '지번', '건축년도', '거래일',
        '전용면적', '층', '거래금액']

In [None]:
# df에서 일부 열을 선택하고 df에 재할당합니다.
df = df[cols]

### 작업 경로 확인 및 변경

In [None]:
# 관련 라이브러리를 호출합니다.
import os

In [None]:
# 현재 작업 경로를 확인합니다.
os.getcwd()

In [None]:
# data 폴더로 작업 경로를 변경합니다.
os.chdir(path = '../data')

### xlsx 파일로 저장

In [None]:
# xlsx 파일로 저장합니다.
df.to_excel(excel_writer = 'DataGoKr_APT_Price.xlsx', index = None)

In [None]:
# 현재 작업 경로에 있는 폴더명과 파일명을 출력합니다.
os.listdir()

## End of Document