In [None]:
"""
<Open-Api 방식>
 - 특정 기관에서 데이터를 제공하는 방식으로,
 - 웹URL을 이용해서 제공하는 방식(정확하게는 웹프로토콜을 이용해서 제공)
  -> 프로토콜이라 함은 : 규약, 규칙이라는 의미입니다.
 - 데이터를 요청하는 사람(수집자)과 / 데이터를 제공하는 기관(제공자)이 있습니다.
 - 수집자는 제공자가 제공하는 URL을 사용해야 하며,
  -> 제공자가 정의한 key : value의 값들을 받아와서 사용해야 합니다.
 - 제공자는 아무에게나 데이터를 제공하지 않으며, 승인된 수집자에게만 데이터를 제공합니다.
  -> 승입여부 : 제공자가 발급한 API-Key를 수집자가 전달 받아서 요청 시 사용합니다.

 <중요 용어>
 - 수집자 == 요청자(클라이언트, client) == request
 - 제공자 == 응답자(서버, server) == response
"""

In [None]:
"""
 - 공공데이터포털 접속 : www.data.go.kr
 - 회원가입 되어 있어야 합니다. (로그인 필요)
 - 검색어에 '한국공학공사 전국공항 주차장 혼잡도'로 검색
 - [활용신청] 버튼 클릭 
     -> 활용 신청 시 활용목적을 작성할 때는 '학술/연구'로...
"""

## 사용할 라이브러리 정의

In [3]:
### 데이터 처리
import pandas as pd

### 웹 프로토콜을 통해서 요청 URL을 전송하고 결과를 받아오는 라이브러리
import requests

### 전달받은 태그 코드의 데이터를 검색 추출하기 위한 라이브러리
from bs4 import BeautifulSoup

### 전달받은 태그 코드를 인식하지 못하는 경우를 대비해서 라이브러리 추가만 해놓기
# - 설치 필요 : pip install lxml
# - 설치 후 커널 재시작해야 합니다.
from openpyxl.workbook import Workbook

## 요청 처리를 위한 변수 정의하기

In [4]:
### API 인증키 변수정의
# api_key = '742HGd21WfbEf7CQo47sG4r%2B5bKm38NSkuyUQthDu1%2BjhyylvgAN0BgU7nB%2BNgp2l%2Bc27O4TxWRP3koINEP4%2Fw%3D%3D'
api_key='PVdeh44WlF%2BHj6bGzfI2BXUldlea7Ggo%2FjjXvhbHCMNNFotchb2byGTopt4uAFS07RQzqmeU3M2Y8HcMmlYW9w%3D%3D'

### 요청에 사용할 공항코드 변수 정의
schAirportCode_list = ['GMP','PUS', 'CJU', 'TAE', 'KWJ',
                       'RSU', 'USN', 'KUV', 'WJU', 'CJJ']

### 한페이지 행의 수
numOfRows = 10

### 페이지 번호
pageNo = 1

In [5]:
### 요청 URL 완성하기
api_url = 'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT'
api_url += f'?schAirportCode={schAirportCode_list[0]}'
api_url += f'&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}'
api_url

'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT?schAirportCode=GMP&serviceKey=PVdeh44WlF%2BHj6bGzfI2BXUldlea7Ggo%2FjjXvhbHCMNNFotchb2byGTopt4uAFS07RQzqmeU3M2Y8HcMmlYW9w%3D%3D&numOfRows=10&pageNo=1'

## 요청 및 응답 받아오기

In [6]:
### requests 라이브러리를 이용해서 서버로 url을 넘겨주기(요청)
rs_data = requests.get(api_url)
rs_data
### Response [200] : Response 클래스 객체에 의해 잘 전송받았다는 코드
# - API-Key 발급 후 즉시 데이터는 받아오지 못하는 경우 있음(인증에 시간 걸림)

<Response [200]>

In [7]:
### 응답 받은 데이터 확인하기
rs_text = rs_data.text
rs_text

'<?xml version="1.0" encoding="UTF-8" standalone="yes"?><response><header><resultCode>00</resultCode><resultMsg>NORMAL SERVICE.</resultMsg></header><body><items><item><airportEng>GIMPO INTERNATIONAL AIRPORT</airportEng><airportKor>김포국제공항</airportKor><parkingAirportCodeName>국내선 제1주차장</parkingAirportCodeName><parkingCongestion>혼잡</parkingCongestion><parkingCongestionDegree>91.84%</parkingCongestionDegree><parkingOccupiedSpace>2093</parkingOccupiedSpace><parkingTotalSpace>2279</parkingTotalSpace><sysGetdate>2025-02-21</sysGetdate><sysGettime>10:43:03</sysGettime></item><item><airportEng>GIMPO INTERNATIONAL AIRPORT</airportEng><airportKor>김포국제공항</airportKor><parkingAirportCodeName>국내선 제2주차장</parkingAirportCodeName><parkingCongestion>원활</parkingCongestion><parkingCongestionDegree>51.24%</parkingCongestionDegree><parkingOccupiedSpace>888</parkingOccupiedSpace><parkingTotalSpace>1733</parkingTotalSpace><sysGetdate>2025-02-21</sysGetdate><sysGettime>10:43:03</sysGettime></item><item><airportEn

In [8]:
### 문자열 타입의 데이터에 -> 태그(xml) 포맷이라는 의미 부여시키기
# - 의미 부여를 -> 파싱(변환, parsing) 처리라고 합니다.
# - BeautifulSoup() 라이브러리를 사용합니다.
rs_xml = BeautifulSoup(rs_text, 'xml')
rs_xml

<?xml version="1.0" encoding="utf-8"?>
<response><header><resultCode>00</resultCode><resultMsg>NORMAL SERVICE.</resultMsg></header><body><items><item><airportEng>GIMPO INTERNATIONAL AIRPORT</airportEng><airportKor>김포국제공항</airportKor><parkingAirportCodeName>국내선 제1주차장</parkingAirportCodeName><parkingCongestion>혼잡</parkingCongestion><parkingCongestionDegree>91.84%</parkingCongestionDegree><parkingOccupiedSpace>2093</parkingOccupiedSpace><parkingTotalSpace>2279</parkingTotalSpace><sysGetdate>2025-02-21</sysGetdate><sysGettime>10:43:03</sysGettime></item><item><airportEng>GIMPO INTERNATIONAL AIRPORT</airportEng><airportKor>김포국제공항</airportKor><parkingAirportCodeName>국내선 제2주차장</parkingAirportCodeName><parkingCongestion>원활</parkingCongestion><parkingCongestionDegree>51.24%</parkingCongestionDegree><parkingOccupiedSpace>888</parkingOccupiedSpace><parkingTotalSpace>1733</parkingTotalSpace><sysGetdate>2025-02-21</sysGetdate><sysGettime>10:43:03</sysGettime></item><item><airportEng>GIMPO INTERNATI

In [9]:
### 태그 이름 : key
### 태그와 태그 사이의 텍스트 : value
# - find_all(찾고자하는 태그이름 - key) : 해당 태그이름이 있는 모든 태그를 리스트 타입으로 변환
rs_xml.find_all('airportKor')

[<airportKor>김포국제공항</airportKor>,
 <airportKor>김포국제공항</airportKor>,
 <airportKor>김포국제공항</airportKor>,
 <airportKor>김포국제공항</airportKor>,
 <airportKor>김포국제공항</airportKor>]

In [10]:
# - find(찾고자하는 태그이름 - key) : 해당 태그이름이 있는 모든 태그 중에서 첫번째 태그만 반환 (xml 타입)
rs_xml.find('airportKor')

<airportKor>김포국제공항</airportKor>

In [11]:
### 태그와 태그사잉의 값 추출하기
# - xml 타입인 경우만 가능
# - 문자열로 반환함
rs_xml.find("airportKor").text

'김포국제공항'

In [12]:
rs_xml.find_all("airportKor")[0].text

'김포국제공항'

In [13]:
### 주차장 혼잡률에 대한 모든 태그 정보 가지고 오기...
rs_xml.find_all('parkingCongestionDegree')[0].text

'91.84%'

In [14]:
### 혼잡도
print(f"혼잡도 : {rs_xml.find_all('parkingCongestion')[0].text}")
### 주차장이름
print(f"주차장이름 : {rs_xml.find_all('parkingAirportCodeName')[0].text}")
### 총주차면수
print(f"총주차면수 : {rs_xml.find_all('parkingTotalSpace')[0].text}")
### 입고된차량수
print(f"입고된차량수 : {rs_xml.find_all('parkingOccupiedSpace')[0].text}")
### 수집 기준년월일
print(f"수집 기준년월일 : {rs_xml.find_all('sysGetdate')[0].text}")
### 수집 기준시간
(f"수집 기준시간 : {rs_xml.find_all('sysGettime')[0].text}")
### 주차 가능한 여유공간 수
tot = int(rs_xml.find_all('parkingTotalSpace')[0].text)
occ = int(rs_xml.find_all('parkingOccupiedSpace')[0].text)
print(f"주차 가능한 여유공간 수: {tot - occ}")

혼잡도 : 혼잡
주차장이름 : 국내선 제1주차장
총주차면수 : 2279
입고된차량수 : 2093
수집 기준년월일 : 2025-02-21
주차 가능한 여유공간 수: 186


In [15]:
"""
김포 국제공항에 대한 전체 주차장 정보를 출력해 주세요..
출력 결과는 아래와 같이..
[공항명] : 김포국제공항
[기준 년월일 시분초] : 0000-00-00 00:00:00
--------------------------------------------
[주차장명] : 국내선 제1주차장
 총주차면수 : 111
 ...
 주차장 정보 모두
 -------------------------------------------
[주차장명] : 국내선 제2주차장
 총주차면수 : 222
 ...
 주차장 정보 모두
 --------------------------------------------
 

"""

'\n김포 국제공항에 대한 전체 주차장 정보를 출력해 주세요..\n출력 결과는 아래와 같이..\n[공항명] : 김포국제공항\n[기준 년월일 시분초] : 0000-00-00 00:00:00\n--------------------------------------------\n[주차장명] : 국내선 제1주차장\n 총주차면수 : 111\n ...\n 주차장 정보 모두\n -------------------------------------------\n[주차장명] : 국내선 제2주차장\n 총주차면수 : 222\n ...\n 주차장 정보 모두\n --------------------------------------------\n \n\n'

In [16]:
print(f"[공항명] : {rs_xml.find_all('airportKor')[0].text}")
### 수집 기준년월일
print(f"[기준 년월일 시분초] : {rs_xml.find_all('sysGetdate')[0].text} {rs_xml.find_all('sysGettime')[0].text}")
print("--------------------------------------------------")
### 주차장이름
print(f"[주차장명] : {rs_xml.find_all('parkingAirportCodeName')[0].text}")
### 총주차면수
print(f" - 총주차면수 : {rs_xml.find_all('parkingTotalSpace')[0].text}")
### 입고된차량수
print(f" - 입고된차량수 : {rs_xml.find_all('parkingOccupiedSpace')[0].text}")
### 주차 가능한 여유공간 수
tot = int(rs_xml.find_all('parkingTotalSpace')[0].text)
occ = int(rs_xml.find_all('parkingOccupiedSpace')[0].text)
print(f" - 주차 가능한 여유공간 수: {tot - occ}")

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
--------------------------------------------------
[주차장명] : 국내선 제1주차장
 - 총주차면수 : 2279
 - 입고된차량수 : 2093
 - 주차 가능한 여유공간 수: 186


In [17]:
for i in range(len(rs_xml.find_all('airportKor'))):
    print(f"[공항명] : {rs_xml.find_all('airportKor')[i].text}")
    ### 수집 기준년월일
    print(f"[기준 년월일 시분초] : {rs_xml.find_all('sysGetdate')[i].text} {rs_xml.find_all('sysGettime')[i].text}")
    print("------------------------------------------")
    ### 주차장이름
    print(f"[주차장명] : {rs_xml.find_all('parkingAirportCodeName')[i].text}")
    ### 총주차면수
    print(f" - 총 주차면 수 : {rs_xml.find_all('parkingTotalSpace')[i].text}")
    ### 입고된차량수
    print(f" - 입고된 차량 수 : {rs_xml.find_all('parkingOccupiedSpace')[i].text}")
    ### 주차 가능한 여유공간 수
    tot = int(rs_xml.find_all('parkingTotalSpace')[i].text)
    occ = int(rs_xml.find_all('parkingOccupiedSpace')[i].text)
    print(f" - 주차 가능한 여유공간 수: {tot - occ}")
    print("------------------------------------------\n")

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국내선 제1주차장
 - 총 주차면 수 : 2279
 - 입고된 차량 수 : 2093
 - 주차 가능한 여유공간 수: 186
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국내선 제2주차장
 - 총 주차면 수 : 1733
 - 입고된 차량 수 : 888
 - 주차 가능한 여유공간 수: 845
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국제선 주차빌딩
 - 총 주차면 수 : 567
 - 입고된 차량 수 : 521
 - 주차 가능한 여유공간 수: 46
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국제선 지하
 - 총 주차면 수 : 599
 - 입고된 차량 수 : 532
 - 주차 가능한 여유공간 수: 67
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 화물청사
 - 총 주차면 수 : 737
 - 입고된 차량 수 : 737
 - 주차 가능한

In [18]:
### 전체 국내 공항 코드
schAirportCode_list

['GMP', 'PUS', 'CJU', 'TAE', 'KWJ', 'RSU', 'USN', 'KUV', 'WJU', 'CJJ']

## 전체 국내 공항에 대한 주차장 정보 조회하기

In [35]:
for air in range(len(schAirportCode_list)):
    ### 요청 URL 완성하기
    api_url = 'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT'
    api_url += f'?schAirportCode={schAirportCode_list[air]}'
    api_url += f'&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}'
    api_url
    
    ### requests 라이브러리를 이용해서 서버로 url을 넘겨주기(요청)
    air_data = requests.get(api_url)
    # print(air_data)

    ### 응답 받은 데이터 확인하기
    air_text = air_data.text
    # print(air_text)

    ### 문자열 타입의 데이터에 -> 태그(xml) 포맷이라는 의미 부여시키기
    # - 의미 부여를 -> 파싱(변환, parsing) 처리라고 합니다.
    # - BeautifulSoup() 라이브러리를 사용합니다.
    air_xml = BeautifulSoup(air_text, 'xml')
    # print(air_xml)

    for i in range(len(air_xml.find_all('airportKor'))):
        print("==========================================")
        print(f"[공항명] : {air_xml.find_all('airportKor')[i].text}")
        ### 수집 기준년월일
        print(f"[기준 년월일 시분초] : {air_xml.find_all('sysGetdate')[i].text} {rs_xml.find_all('sysGettime')[i].text}")
        print("------------------------------------------")
        ### 주차장이름
        print(f"[주차장명] : {air_xml.find_all('parkingAirportCodeName')[i].text}")
        ### 총주차면수
        print(f" - 총 주차면 수 : {air_xml.find_all('parkingTotalSpace')[i].text}")
        ### 입고된차량수
        print(f" - 입고된 차량 수 : {air_xml.find_all('parkingOccupiedSpace')[i].text}")
        ### 주차 가능한 여유공간 수
        tot = int(air_xml.find_all('parkingTotalSpace')[i].text)
        occ = int(air_xml.find_all('parkingOccupiedSpace')[i].text)
        print(f" - 주차 가능한 여유공간 수: {tot - occ}")
        print("------------------------------------------\n")

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국내선 제1주차장
 - 총 주차면 수 : 2279
 - 입고된 차량 수 : 2113
 - 주차 가능한 여유공간 수: 166
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국내선 제2주차장
 - 총 주차면 수 : 1733
 - 입고된 차량 수 : 885
 - 주차 가능한 여유공간 수: 848
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국제선 주차빌딩
 - 총 주차면 수 : 567
 - 입고된 차량 수 : 534
 - 주차 가능한 여유공간 수: 33
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 국제선 지하
 - 총 주차면 수 : 599
 - 입고된 차량 수 : 540
 - 주차 가능한 여유공간 수: 59
------------------------------------------

[공항명] : 김포국제공항
[기준 년월일 시분초] : 2025-02-21 10:43:03
------------------------------------------
[주차장명] : 화물청사
 - 총 주차면 수 : 737
 - 입고된 차량 수 : 737
 - 주차 가능한

## 수집 데이터 데이터프레임에 저장하기

In [20]:
"""
수집한 데이터 데이터프레임에 저장하기
 - 데이터프레임 변수명 : df_all
 - 컬럼명 : 공항명, 기준년월일, 기준시분초, 주차장명, 혼잡도, 혼잡율, 총주차면수, 입고된차량수
 - (위 컬럼 외 추가하고 싶은 경우 자유롭게...)
"""

'\n수집한 데이터 데이터프레임에 저장하기\n - 데이터프레임 변수명 : df_all\n - 컬럼명 : 공항명, 기준년월일, 기준시분초, 주차장명, 혼잡도, 혼잡율, 총주차면수, 입고된차량수\n - (위 컬럼 외 추가하고 싶은 경우 자유롭게...)\n'

In [36]:
data_list = []

for air in range(len(schAirportCode_list)):
    ### 요청 URL 완성하기
    api_url = 'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT'
    api_url += f'?schAirportCode={schAirportCode_list[air]}'
    api_url += f'&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}'
    api_url

    ### requests 라이브러리를 이용해서 서버로 url을 넘겨주기(요청)
    air_data = requests.get(api_url)

    ### 응답 받은 데이터 확인하기
    air_text = air_data.text
    # print(air_text)

    ### 문자열 타입의 데이터에 -> 태그(xml) 포맷이라는 의미 부여시키기
    # - 의미 부여를 -> 파싱(변환, parsing) 처리라고 합니다.
    # - BeautifulSoup() 라이브러리를 사용합니다.
    air_xml = BeautifulSoup(air_text, 'xml')

    ### 변수만들기
    for i in range(len(air_xml.find_all('airportKor'))):
        air_name = air_xml.find_all('airportKor')[i].text
        date = air_xml.find_all('sysGetdate')[i].text
        time = air_xml.find_all('sysGettime')[i].text
        ps_name = air_xml.find_all('parkingAirportCodeName')[i].text
        ps_con = air_xml.find_all('parkingCongestion')[i].text
        ps_conde = air_xml.find_all('parkingCongestionDegree')[i].text
        tot_ps = int(air_xml.find_all('parkingTotalSpace')[i].text)
        occ_ps = int(air_xml.find_all('parkingOccupiedSpace')[i].text)
        ava_ps = tot_ps - occ_ps
        
        ### 테스트
        # print("==========================================")
        # print(f"[공항명] : {air_name}")
        # ### 수집 기준년월일
        # print(f"[기준 년월일 시분초] : {date}{time}")
        # print("------------------------------------------")
        # ### 주차장이름
        # print(f"[주차장명] : {ps_name}")
        # ### 혼잡도
        # print(f"혼잡도 : {ps_con}")
        # ### 주차장 혼잡률에 대한 모든 태그 정보 가지고 오기...
        # print(f"혼잡율 : {ps_conde}")
        # ### 총주차면수
        # print(f" - 총 주차면 수 : {tot_ps}")
        # ### 입고된차량수
        # print(f" - 입고된 차량 수 : {occ_ps}")
        # ### 주차 가능한 여유공간 수
        # print(f" - 주차 가능한 여유공간 수: {ava_ps}")
        # print("------------------------------------------\n")

        ### 데이터리스트에 변수 담기
        data_list.append({"공항명":air_name,
                          "기준년월일":date,
                          "기준시분초":time,
                          "주차장명":ps_name,
                          "혼잡도":ps_con,
                          "혼잡율":tot_ps,
                          "총주차면수":tot_ps,
                          "입고된차량수":occ_ps,
                          "주차_가능한_여유공간_수":ava_ps})

### 데이터프레임에 저장하기
df_all = pd.DataFrame(data_list)

In [37]:
df_all

Unnamed: 0,공항명,기준년월일,기준시분초,주차장명,혼잡도,혼잡율,총주차면수,입고된차량수,주차_가능한_여유공간_수
0,김포국제공항,2025-02-21,11:08:02,국내선 제1주차장,혼잡,2279,2279,2113,166
1,김포국제공항,2025-02-21,11:08:02,국내선 제2주차장,원활,1733,1733,885,848
2,김포국제공항,2025-02-21,11:08:02,국제선 주차빌딩,혼잡,567,567,534,33
3,김포국제공항,2025-02-21,11:08:02,국제선 지하,혼잡,599,599,540,59
4,김포국제공항,2025-02-21,11:08:02,화물청사,만차,737,737,737,0
5,김해국제공항,2025-02-21,11:08:02,P1 여객주차장,만차,2005,2005,2005,0
6,김해국제공항,2025-02-21,11:08:02,P2 여객주차장,만차,2453,2453,2453,0
7,김해국제공항,2025-02-21,11:08:02,P3 여객(화물),만차,878,878,878,0
8,제주국제공항,2025-02-21,11:08:02,P1주차장,만차,1763,1763,1763,0
9,제주국제공항,2025-02-21,11:08:02,P2장기주차장,혼잡,488,488,451,37


In [42]:
df2_all = pd.DataFrame()
idx = 0
for air in range(len(schAirportCode_list)):
    api_url = 'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT'
    api_url += f'?schAirportCode={schAirportCode_list[air]}'
    api_url += f'&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}'
    api_url

    air_data = requests.get(api_url)
    air_text = air_data.text

    air_xml = BeautifulSoup(air_text, 'xml')

    for i in range(len(air_xml.find_all('airportKor'))):
        df2_all.loc[idx, "공항명"] = air_xml.find_all('airportKor')[i].text
        df2_all.loc[idx, "기준년월일"] = air_xml.find_all('sysGetdate')[i].text
        df2_all.loc[idx, "기준시분초"] = air_xml.find_all('sysGettime')[i].text
        df2_all.loc[idx, "주차장명"] = air_xml.find_all('parkingAirportCodeName')[i].text
        df2_all.loc[idx, "혼잡도"] = air_xml.find_all('parkingCongestion')[i].text
        df2_all.loc[idx, "혼잡율"] = air_xml.find_all('parkingCongestionDegree')[i].text
        df2_all.loc[idx, "총주차면수"] = air_xml.find_all('parkingTotalSpace')[i].text
        df2_all.loc[idx, "입고된차량수"] = air_xml.find_all('parkingOccupiedSpace')[i].text
        df2_all.loc[idx, "주차_가능한_여유공간_수"] = (int(air_xml.find_all('parkingTotalSpace')[i].text) - int(air_xml.find_all('parkingOccupiedSpace')[i].text))
        idx += 1

df2_all

Unnamed: 0,공항명,기준년월일,기준시분초,주차장명,혼잡도,혼잡율,총주차면수,입고된차량수,주차_가능한_여유공간_수
0,김포국제공항,2025-02-21,11:18:03,국내선 제1주차장,혼잡,93.37%,2279,2128,151.0
1,김포국제공항,2025-02-21,11:18:03,국내선 제2주차장,원활,51.53%,1733,893,840.0
2,김포국제공항,2025-02-21,11:18:03,국제선 주차빌딩,혼잡,94.18%,567,534,33.0
3,김포국제공항,2025-02-21,11:18:03,국제선 지하,혼잡,90.98%,599,545,54.0
4,김포국제공항,2025-02-21,11:18:03,화물청사,만차,100%,737,737,0.0
5,김해국제공항,2025-02-21,11:18:03,P1 여객주차장,만차,100%,2005,2005,0.0
6,김해국제공항,2025-02-21,11:18:03,P2 여객주차장,만차,100%,2453,2453,0.0
7,김해국제공항,2025-02-21,11:18:03,P3 여객(화물),만차,100%,878,878,0.0
8,제주국제공항,2025-02-21,11:18:03,P1주차장,만차,100%,1763,1763,0.0
9,제주국제공항,2025-02-21,11:18:03,P2장기주차장,혼잡,93.44%,488,456,32.0


In [50]:
df3_all_list = []

for air in range(len(schAirportCode_list)):
    api_url = 'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT'
    api_url += f'?schAirportCode={schAirportCode_list[air]}'
    api_url += f'&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}'

    air_data = requests.get(api_url)
    air_text = air_data.text

    air_xml = BeautifulSoup(air_text, 'xml')

    temp_list = []

    for i in range(len(air_xml.find_all('airportKor'))):
        temp_dict = {
            "공항명": air_xml.find_all('airportKor')[i].text,
            "기준년월일": air_xml.find_all('sysGetdate')[i].text,
            "기준시분초": air_xml.find_all('sysGettime')[i].text,
            "주차장명": air_xml.find_all('parkingAirportCodeName')[i].text,
            "혼잡도": air_xml.find_all('parkingCongestion')[i].text,
            "혼잡율": air_xml.find_all('parkingCongestionDegree')[i].text,
            "총주차면수": air_xml.find_all('parkingTotalSpace')[i].text,
            "입고된차량수": air_xml.find_all('parkingOccupiedSpace')[i].text,
            "주차_가능한_여유공간_수": (int(air_xml.find_all('parkingTotalSpace')[i].text) - int(air_xml.find_all('parkingOccupiedSpace')[i].text))
        }
        temp_list.append(temp_dict)
    
    
    df3_all_list.append(pd.DataFrame(temp_list))

df3_all = pd.concat(df3_all_list, ignore_index=True)

df3_all


Unnamed: 0,공항명,기준년월일,기준시분초,주차장명,혼잡도,혼잡율,총주차면수,입고된차량수,주차_가능한_여유공간_수
0,김포국제공항,2025-02-21,12:13:03,국내선 제1주차장,혼잡,93.81%,2279,2138,141
1,김포국제공항,2025-02-21,12:13:03,국내선 제2주차장,원활,52.22%,1733,905,828
2,김포국제공항,2025-02-21,12:13:03,국제선 주차빌딩,혼잡,90.65%,567,514,53
3,김포국제공항,2025-02-21,12:13:03,국제선 지하,원활,88.48%,599,530,69
4,김포국제공항,2025-02-21,12:13:03,화물청사,만차,100%,737,737,0
5,김해국제공항,2025-02-21,12:13:03,P1 여객주차장,만차,100%,2005,2005,0
6,김해국제공항,2025-02-21,12:13:03,P2 여객주차장,만차,100%,2453,2453,0
7,김해국제공항,2025-02-21,12:13:03,P3 여객(화물),만차,100%,878,878,0
8,제주국제공항,2025-02-21,12:13:03,P1주차장,만차,100%,1763,1763,0
9,제주국제공항,2025-02-21,12:13:03,P2장기주차장,혼잡,92.42%,488,451,37


In [51]:
df4_all = pd.DataFrame()

In [56]:
# 빈 데이터프레임을 초기화합니다.
df4_all = pd.DataFrame()

for air in range(len(schAirportCode_list)):
    # 임시 데이터프레임을 딕셔너리로 초기화합니다.
    df4_temp = {}

    # API 호출 URL 생성
    api_url = 'http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT'
    api_url += f'?schAirportCode={schAirportCode_list[air]}'
    api_url += f'&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}'

    # API 호출
    air_data = requests.get(api_url)
    air_text = air_data.text

    # XML 파싱
    air_xml = BeautifulSoup(air_text, 'xml')

    # 필요한 값들 추출하여 딕셔너리에 저장
    df4_temp["공항명"] = [v_xml.text for v_xml in air_xml.find_all('airportKor')]
    df4_temp["기준년월일"] = [v_xml.text for v_xml in air_xml.find_all('sysGetdate')]
    df4_temp["기준시분초"] = [v_xml.text for v_xml in air_xml.find_all('sysGettime')]
    df4_temp["주차장명"] = [v_xml.text for v_xml in air_xml.find_all('parkingAirportCodeName')]
    df4_temp["혼잡도"] = [v_xml.text for v_xml in air_xml.find_all('parkingCongestion')]
    df4_temp["혼잡율"] = [v_xml.text for v_xml in air_xml.find_all('parkingCongestionDegree')]
    df4_temp["총주차면수"] = [v_xml.text for v_xml in air_xml.find_all('parkingTotalSpace')]
    df4_temp["입고된차량수"] = [v_xml.text for v_xml in air_xml.find_all('parkingOccupiedSpace')]

    # 주차 가능한 여유공간 수 계산 (총주차면수 - 입고된차량수)
    total_space = [int(v_xml.text) for v_xml in air_xml.find_all('parkingTotalSpace')]
    occupied_space = [int(v_xml.text) for v_xml in air_xml.find_all('parkingOccupiedSpace')]
    available_space = [total - occupied for total, occupied in zip(total_space, occupied_space)]

    df4_temp["주차_가능한_여유공간_수"] = available_space

    # 임시 데이터프레임을 실제 데이터프레임에 추가
    df4_all = pd.concat([df4_all, pd.DataFrame(df4_temp)], ignore_index=True)

# 결과 출력
df4_all


Unnamed: 0,공항명,기준년월일,기준시분초,주차장명,혼잡도,혼잡율,총주차면수,입고된차량수,주차_가능한_여유공간_수
0,김포국제공항,2025-02-21,12:18:02,국내선 제1주차장,혼잡,93.94%,2279,2141,138
1,김포국제공항,2025-02-21,12:18:02,국내선 제2주차장,원활,52.63%,1733,912,821
2,김포국제공항,2025-02-21,12:18:02,국제선 주차빌딩,혼잡,91.18%,567,517,50
3,김포국제공항,2025-02-21,12:18:02,국제선 지하,원활,88.31%,599,529,70
4,김포국제공항,2025-02-21,12:18:02,화물청사,만차,100%,737,737,0
5,김해국제공항,2025-02-21,12:18:02,P1 여객주차장,만차,100%,2005,2005,0
6,김해국제공항,2025-02-21,12:18:02,P2 여객주차장,만차,100%,2453,2453,0
7,김해국제공항,2025-02-21,12:18:02,P3 여객(화물),만차,100%,878,878,0
8,제주국제공항,2025-02-21,12:18:02,P1주차장,만차,100%,1763,1763,0
9,제주국제공항,2025-02-21,12:18:02,P2장기주차장,혼잡,92.42%,488,451,37


In [None]:
### 수집된 데이터는 파일ㄹ 저장해서 이후 사용하시면 됩니다.

In [None]:
# ### 수집 데이터 데이터프레임에 저장하기

# """
# 수집한 데이터 데이터프레임에 저장하기
#  - 데이터프레임 변수명 : df_all
#  - 컬럼명 : 공항명, 기준년월일, 기준시분초, 주차장명, 혼잡도, 혼잡율, 총주차면수, 입고된차량수
#  - (위 컬럼 외 추가하고 싶은 경우 자유롭게...)
# """
# # df5_all = pd.DataFrame()

# ### 공항 10개 반복 수행
# for i in range(0, len(schAirportCode_list), 1) :
#     df_temp = pd.DataFrame()
    
#     ### 요청 URL 완성하기
#     api_url = "http://openapi.airport.co.kr/service/rest/AirportParkingCongestion/airportParkingCongestionRT"
#     api_url += f"?schAirportCode={schAirportCode_list[i]}"
#     api_url += f"&serviceKey={api_key}&numOfRows={numOfRows}&pageNo={pageNo}"

#     ### requests 라이브러리를 이용해서 서버로 url을 넘겨주기(요청)
#     rs_data = requests.get(api_url)

#     ### 문자열 타입의 데이터에 -> 태그(xml) 포멧이라는 의미 부여시키기
#     # - 의미 부여를 -> 파싱(변환, parsing) 처리라고 합니다.
#     # - BueatifulShoup() 라이브러리를 사용합니다.
#     rs_xml = BeautifulSoup(rs_data.text, "xml")
    
#     ### df_temp에 데이터 넣기
#     df_temp["공항명"] = [v_xml.text for v_xml in rs_xml.find_all("airportKor")]
    
#     df_temp["기준년월일"] = [v_xml.text for v_xml in rs_xml.find_all("sysGetdate")]
#     df_temp["기준시분초"] = [v_xml.text for v_xml in rs_xml.find_all('sysGettime')]
    
#     df_temp["주차장명"] = [v_xml.text for v_xml in rs_xml.find_all('parkingAirportCodeName')]
#     df_temp["혼잡도"] = [v_xml.text for v_xml in rs_xml.find_all('parkingCongestion')]
#     df_temp["혼잡율"] = [v_xml.text for v_xml in rs_xml.find_all('parkingCongestionDegree')]
#     df_temp["총주차면수"] = [v_xml.text for v_xml in rs_xml.find_all('parkingTotalSpace')]
#     df_temp["입고된차량수"] = [v_xml.text for v_xml in rs_xml.find_all('parkingOccupiedSpace')]

#     ### 깨끗한 데이터프레임에 행단위 추가하기
#     df_all = pd.concat([df_all, df_temp], ignore_index=True)

# df_all