# AIVLE스쿨 4기 DX트랙 5차 미니프로젝트 
## [미션#1] API를 이용하여 공공 데이터 가져오기

 
 - <font size =+1> 공공데이터포털(https://data.go.kr)에서 제공되는 [국립중앙의료원 - 전국응급의료기관 조회 서비스]에서 필요한 자료를 API를 통해 가져옵니다.
 - <font size =+1> 회원 가입 후 해당 자료에 [활용 신청]을 한 뒤, 마이페이지에서 일반 인증키(encoding)을 확인합니다. (PDF 교재 참고)
 - <font size =+1> 대구광역시 중심으로 데이터 추출 
 

 * 사전 확인 사항 
   * haversine 설치
   * python : 3.11.3 (아나콘다 2023.07 버전 설치 기준)

In [None]:
# 필요한 라이브러리 불러오기

import pandas as pd
import numpy as np
from urllib.parse import quote

In [None]:
# 코드 수정 없이 실행

import ssl
from urllib.request import urlopen
context=ssl.create_default_context()
context.set_ciphers("DEFAULT")


* 공공데이터 수집을 위한 기본값 설정

In [None]:
# 개인 인증키 저장
# [국립중앙의료원 - 전국응급의료기관 조회 서비스] 활용을 위한 개인 일반 인증키(Encoding) 값 저장
key = ""

# 조회할 도시 지정
# city = 대구광역시, 인코딩 필요
city = quote("대구광역시")

### 1) 대구광역시 응급의료기관 목록정보 조회하기

 * 주소 (대구광역시)를 기준으로 응급 의료 기관 목록 정보 조회
 * 기관ID, 주소, 기관명, 응급실전화, 병원 위치(경도/위도) 정보를 확인

In [None]:
# 대구광역시내이 응급의료기관 목록정보 조회하기
# url : https://apis.data.go.kr/B552657/ErmctInfoInqireService/getEgytListInfoInqire
# 인증키 지정 : serviceKey = key  ## 갱
# 도시 지정 : Q0 = city
# 출력 행수 : numofRows = 100 
# page 번호 : pageNo = 1


url = 'https://apis.data.go.kr/B552657/ErmctInfoInqireService/getEgytListInfoInqire' + '?serviceKey=' + key + '&Q0=' + city + '&pageNo=1&numOfRows=100'
print(url)

# emrList = pd.read_xml(url, xpath='/response/body/items/item')
result = urlopen(url, context=context)
emrList = pd.read_xml(result, xpath='.//item')

emrList.head()

In [None]:
# 응급의료기관 수 확인하기 : shape 

emrList.shape

In [None]:
## 응급의료기관 목록정보 중 기관코드(hpid), 응급기관명(dutyName), 주소(dutyAddr), 응급실연락처(dutyTel3), 위도(wgs84Lat), 경도(wgs84Lon) 정보만 추출
## ermList 중 [hpid, dutyName, dutyAddr, dutyTel3, wgs84Lat, wgs84Lon] 컬럼 활용
## solution_df 에 저장하기

solution_df = emrList[['hpid', 'dutyName', 'dutyAddr', 'dutyTel3', 'wgs84Lat', 'wgs84Lon']].copy()
solution_df.head()

### 2) 응급의료기관별 기본정보 조회 - 응급실수, 수술실 수 확인

 * <b>기관ID</b>를 기준으로 응급실, 수술실 정보 등 응급의료기관 기본 정보 조회 가능
 * 응급실수 (hperyn)와 수술실 수(hpopyn) 정보를 확인

In [None]:
# 대구광역시내이 응급의료기관 목록정보 조회하기
# url : https://apis.data.go.kr/B552657/ErmctInfoInqireService/getEgytBassInfoInqire
# 인증키 지정 : serviceKey = key
# 응급의료기관 지정 : HPID = hpid
# 응급의료기관 하나씩 조회해야 함

# 응급의료기관에 대한 hpid값을 list로 추출
hpidList = list(solution_df['hpid'])

# 각 응급의료기관의 응급실 병상수(hperyn), 수술실 수(hpopyn) 를 저장하기 위한 빈 리스트 생성
hperynList = []
hpopynList = []

# 대구광역시의 응급의료기관을 hpid 기준으로 하나씩 조회하여, 응급실 병상수/수술실 수를 확인
# for문을 이용하여 hpid 하나씩 조회하고, hperyn, hpopy 정보를 각 hperynList, hpopynList 리스트에 저장

for hpid in hpidList:
    
    url_basic = 'https://apis.data.go.kr/B552657/ErmctInfoInqireService/getEgytBassInfoInqire' + '?serviceKey=' + key + '&HPID=' + hpid 
    result = urlopen(url_basic, context=context)
    df_temp = pd.read_xml(result, xpath='.//item')

    # hperyn, hpopyn이 필수가 아닌 옵션값으로, 값이 전달되지 않을 때를 대비하여 예외처리로 0의 값을 입력
    
    if 'hperyn' in list(df_temp.columns) :
        hperynList.append(df_temp['hperyn'][0])
    else:
        hperynList.append(0)
    
    if 'hpopyn' in list(df_temp.columns) :
        hpopynList.append(df_temp['hpopyn'][0])
    else:
        hpopynList.append(0)
    
    

In [None]:
# 기존 solution_df에 응급실수, 수술실 수 정보 추가하기
# 응급실 수 : solution_df['hperyn']
# 수술실 수 : solution_df['hpopyn']

solution_df['hperyn'] = hperynList
solution_df['hpopyn'] = hpopynList

# 확인하기
solution_df.head()

In [None]:
## hperyn, hpopyn값이 0 이하인 병원 삭제

solution_df = solution_df[solution_df['hpopyn']>0]
solution_df = solution_df[solution_df['hperyn']>0]

In [None]:
## solution_df 크기 확인 : shape

solution_df.shape

In [None]:
## solution_df 를 파일로 저장 
## 파일명 : daegu_hospital_list.csv, index = False

solution_df.to_csv('./daegu_hospital_list.csv', index=False)

In [None]:
## 정상적으로 저장되었는지 확인 

solution_df = pd.read_csv('./daegu_hospital_list.csv')
solution_df.head()

### 7) 병원 거리 구하기

 * 병원 위치(위도/경도)와 환자의 위치(임의의 위도/경도) 간의 거리 측정
 * haversine 라이브러리를 활용 (https://pypi.org/project/haversine/)
 * 병원 ~ 환자간의 거리를 ['2km이내', '5km이내', '10km이내', '10km이상'] 4단계로 구분

In [None]:
# 환자와 병원간의 거리 측정을 위한 라이브러리 설치
# !pip install haversine

In [None]:
# 라이브러리 import
from haversine import haversine

# 거리 측정 예시
# 거리 측정 예시
# 위치1 : (35.209710, 129.004751)
# 위치2 : (35.1631139, 129.1635509)

location1 = (35.209710, 129.004751)
location2 = (35.1631139, 129.1635509)

haversine(location1, location2, unit = 'km') 