## 자료 받아오기(Open API 활용)

In [1]:
# API를 이용해 자료를 받아오기 위해 requests 라이브러리를, 자료를 저장하기 위해 pandas 라이브러리를  불러오겠습니다. 

import requests
import pandas as pd

In [2]:
# 서울열린데이터광장에서 받은 API 인증키를 입력합니다. 
apikey = ''   # 받은 키 값을 입력하기

In [3]:
# 요청할 URL 주소를 만들겠습니다. 
# 한번에 최대 1천개까지만 가능하므로, 먼저 1부터 1000번 자전거 정류장의 데이터를 가져오도록 하겠습니다. 
startnum = 1
endnum = 1000
url1 = f'http://openapi.seoul.go.kr:8088/{apikey}/json/bikeList/{startnum}/{endnum}'

In [4]:
# 자료를 요청합니다. 
json1 = requests.get(url1).json()

In [5]:
json1

{'rentBikeStatus': {'list_total_count': 1000,
  'RESULT': {'CODE': 'INFO-000', 'MESSAGE': '정상 처리되었습니다.'},
  'row': [{'rackTotCnt': '15',
    'stationName': '102. 망원역 1번출구 앞',
    'parkingBikeTotCnt': '14',
    'shared': '93',
    'stationLatitude': '37.55564880',
    'stationLongitude': '126.91062927',
    'stationId': 'ST-4'},
   {'rackTotCnt': '14',
    'stationName': '103. 망원역 2번출구 앞',
    'parkingBikeTotCnt': '15',
    'shared': '107',
    'stationLatitude': '37.55495071',
    'stationLongitude': '126.91083527',
    'stationId': 'ST-5'},
   {'rackTotCnt': '13',
    'stationName': '104. 합정역 1번출구 앞',
    'parkingBikeTotCnt': '0',
    'shared': '0',
    'stationLatitude': '37.55062866',
    'stationLongitude': '126.91498566',
    'stationId': 'ST-6'},
   {'rackTotCnt': '5',
    'stationName': '105. 합정역 5번출구 앞',
    'parkingBikeTotCnt': '0',
    'shared': '0',
    'stationLatitude': '37.55000687',
    'stationLongitude': '126.91482544',
    'stationId': 'ST-7'},
   {'rackTotCnt': '12',

In [6]:
# 필요한 정보를 선택하겠습니다. 
json1.keys()

dict_keys(['rentBikeStatus'])

In [7]:
# 필요한 정보를 선택하겠습니다. 
json1['rentBikeStatus'].keys()

dict_keys(['list_total_count', 'RESULT', 'row'])

In [8]:
# 데이터 구조를 확인합니다. 
json1['rentBikeStatus']['list_total_count']  # 데이터의 개수

1000

In [9]:
# 데이터 구조를 확인합니다. 
json1['rentBikeStatus']['RESULT']  # 오류 여부

{'CODE': 'INFO-000', 'MESSAGE': '정상 처리되었습니다.'}

In [10]:
# 데이터 구조를 확인합니다. 
json1['rentBikeStatus']['row']  # 자전거 정류장별 자전거 현황

[{'rackTotCnt': '15',
  'stationName': '102. 망원역 1번출구 앞',
  'parkingBikeTotCnt': '14',
  'shared': '93',
  'stationLatitude': '37.55564880',
  'stationLongitude': '126.91062927',
  'stationId': 'ST-4'},
 {'rackTotCnt': '14',
  'stationName': '103. 망원역 2번출구 앞',
  'parkingBikeTotCnt': '15',
  'shared': '107',
  'stationLatitude': '37.55495071',
  'stationLongitude': '126.91083527',
  'stationId': 'ST-5'},
 {'rackTotCnt': '13',
  'stationName': '104. 합정역 1번출구 앞',
  'parkingBikeTotCnt': '0',
  'shared': '0',
  'stationLatitude': '37.55062866',
  'stationLongitude': '126.91498566',
  'stationId': 'ST-6'},
 {'rackTotCnt': '5',
  'stationName': '105. 합정역 5번출구 앞',
  'parkingBikeTotCnt': '0',
  'shared': '0',
  'stationLatitude': '37.55000687',
  'stationLongitude': '126.91482544',
  'stationId': 'ST-7'},
 {'rackTotCnt': '12',
  'stationName': '106. 합정역 7번출구 앞',
  'parkingBikeTotCnt': '3',
  'shared': '25',
  'stationLatitude': '37.54864502',
  'stationLongitude': '126.91282654',
  'stationId':

In [11]:
# 판다스의 데이터 프레임으로 전환합니다. 
raw1 = pd.DataFrame(json1['rentBikeStatus']['row'])
raw1.head()

Unnamed: 0,rackTotCnt,stationName,parkingBikeTotCnt,shared,stationLatitude,stationLongitude,stationId
0,15,102. 망원역 1번출구 앞,14,93,37.5556488,126.91062927,ST-4
1,14,103. 망원역 2번출구 앞,15,107,37.55495071,126.91083527,ST-5
2,13,104. 합정역 1번출구 앞,0,0,37.55062866,126.91498566,ST-6
3,5,105. 합정역 5번출구 앞,0,0,37.55000687,126.91482544,ST-7
4,12,106. 합정역 7번출구 앞,3,25,37.54864502,126.91282654,ST-8


In [12]:
# 다음은 1001번부터 2000번 자전거 정류장의 데이터를 가져오겠습니다. 
startnum = 1001
endnum = 2000
url2 = f'http://openapi.seoul.go.kr:8088/{apikey}/json/bikeList/{startnum}/{endnum}/'
json2 = requests.get(url2).json()

In [13]:
json2

{'rentBikeStatus': {'list_total_count': 1000,
  'RESULT': {'CODE': 'INFO-000', 'MESSAGE': '정상 처리되었습니다.'},
  'row': [{'rackTotCnt': '15',
    'stationName': '1403. 중화빌딩 앞 (동부시장)',
    'parkingBikeTotCnt': '20',
    'shared': '133',
    'stationLatitude': '37.59424973',
    'stationLongitude': '127.07657623',
    'stationId': 'ST-566'},
   {'rackTotCnt': '10',
    'stationName': '1404. 동일로 지하차도',
    'parkingBikeTotCnt': '13',
    'shared': '130',
    'stationLatitude': '37.59529877',
    'stationLongitude': '127.08003235',
    'stationId': 'ST-599'},
   {'rackTotCnt': '10',
    'stationName': '1405. 망우역 1번출구',
    'parkingBikeTotCnt': '5',
    'shared': '50',
    'stationLatitude': '37.59909821',
    'stationLongitude': '127.09294891',
    'stationId': 'ST-568'},
   {'rackTotCnt': '10',
    'stationName': '1406. 망우청소년수련관',
    'parkingBikeTotCnt': '11',
    'shared': '110',
    'stationLatitude': '37.60625076',
    'stationLongitude': '127.10826874',
    'stationId': 'ST-569'},
   {'rac

In [14]:
# 판다스의 데이터프레임으로 전환합니다. 
raw2 = pd.DataFrame(json2['rentBikeStatus']['row'])
raw2.head()

Unnamed: 0,rackTotCnt,stationName,parkingBikeTotCnt,shared,stationLatitude,stationLongitude,stationId
0,15,1403. 중화빌딩 앞 (동부시장),20,133,37.59424973,127.07657623,ST-566
1,10,1404. 동일로 지하차도,13,130,37.59529877,127.08003235,ST-599
2,10,1405. 망우역 1번출구,5,50,37.59909821,127.09294891,ST-568
3,10,1406. 망우청소년수련관,11,110,37.60625076,127.10826874,ST-569
4,10,1407. 먹골역 1번출구 뒤,7,70,37.61151123,127.07788849,ST-847


In [15]:
# 두 데이터를 통합하겠습니다. 
data = raw1.append(raw2)
data.head()

Unnamed: 0,rackTotCnt,stationName,parkingBikeTotCnt,shared,stationLatitude,stationLongitude,stationId
0,15,102. 망원역 1번출구 앞,14,93,37.5556488,126.91062927,ST-4
1,14,103. 망원역 2번출구 앞,15,107,37.55495071,126.91083527,ST-5
2,13,104. 합정역 1번출구 앞,0,0,37.55062866,126.91498566,ST-6
3,5,105. 합정역 5번출구 앞,0,0,37.55000687,126.91482544,ST-7
4,12,106. 합정역 7번출구 앞,3,25,37.54864502,126.91282654,ST-8


In [16]:
data.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 2000 entries, 0 to 999
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   rackTotCnt         2000 non-null   object
 1   stationName        2000 non-null   object
 2   parkingBikeTotCnt  2000 non-null   object
 3   shared             2000 non-null   object
 4   stationLatitude    2000 non-null   object
 5   stationLongitude   2000 non-null   object
 6   stationId          2000 non-null   object
dtypes: object(7)
memory usage: 125.0+ KB


In [17]:
# 엑셀 파일로 저장합니다. 
data.to_excel('./data/bycicle.xlsx', index = False)