# 종관지상관측 API

- 위치 : 기상청 API 허브
- 지상관측 > 종관기상관측(ASOS) > 1.지상 관측자료조회 > 시간자료

In [None]:
url = "https://apihub.kma.go.kr/api/typ01/url/kma_sfctm2.php?"

- 요청 인자
    - tm : 202211300900 형식 / 년월일시분(KST)년월일(KST): 해당 시간 (없으면 현재시간)
    - tm1 : 위와 같음 : 기간: 시작시간 또는 시작일 (없으면 현재 시간)
    - tm2 : 위와 같음 : 기간: 종료시간 또는 종료일 (없으면 현재 시간)
    - obs : 관측 종류 : 없으면 전체 관측 종류
    - stn = 지점번호 : 해당 지점들(:로 구분)의 정보 표출(0이거나 없으면 전체 지점) > 밑에 딕셔너리를 참조
    - help = : 1 이면 필드에 대한 약간의 도움말 추가 (0 이거나 없으면 없음)
    - mode = : 0:해독결과만 표출, 1:기사도 표출, 2:기사만 표출
    - authKey="jvwEqhhGTIW8BKoYRhyFkQ"

In [None]:
station_dictionary = {'서울' : '108',
                  '동두천':'98', 
                  '수원':'119', 
                  "양평":'202', 
                  '이천':'203', 
                  '파주':'99', 
                  '백령도':"102", 
                  '인천':"112",
                  '강화도':'201'}

- 결과 항목
    - 1. TM     : 관측시각 (KST)
    -  2. STN    : 국내 지점번호
    -  3. WD     : 풍향 (16방위)
    -  4. WS     : 풍속 (m/s)
    -  5. GST_WD : 돌풍향 (16방위)
    -  6. GST_WS : 돌풍속 (m/s)
    -  7. GST_TM : 돌풍속이 관측된 시각 (시분)
    -  8. PA     : 현지기압 (hPa)
    -  9. PS     : 해면기압 (hPa)
    - 10. PT     : 기압변화경향 (Code 0200) 
    - 11. PR     : 기압변화량 (hPa)
    - 12. TA     : 기온 (C)
    - 13. TD     : 이슬점온도 (C)
    - 14. HM     : 상대습도 (%)
    - 15. PV     : 수증기압 (hPa)
    - 16. RN     : 강수량 (mm) : 여름철에는 1시간강수량, 겨울철에는 3시간강수량
    - 17. RN_DAY : 일강수량 (mm) : 해당시간까지 관측된 양(통계표)
    - 18. RN_JUN : 일강수량 (mm) : 해당시간까지 관측된 양을 전문으로 입력한 값(전문)
    - 19. RN_INT : 강수강도 (mm/h) : 관측하는 곳이 별로 없음
    - 20. SD_HR3 : 3시간 신적설 (cm) : 3시간 동안 내린 신적설의 높이
    - 21. SD_DAY : 일 신적설 (cm) : 00시00분부터 위 관측시간까지 내린 신적설의 높이
    - 22. SD_TOT : 적설 (cm) : 치우지 않고 그냥 계속 쌓이도록 놔눈 경우의 적설의 높이
    - 23. WC     : GTS 현재일기 (Code 4677)
    - 24. WP     : GTS 과거일기 (Code 4561) .. 3(황사),4(안개),5(가랑비),6(비),7(눈),8(소나기),9(뇌전)
    - 25. WW     : 국내식 일기코드 (문자열 22개) : 2자리씩 11개까지 기록 가능 (코드는 기상자원과 문의)
    - 26. CA_TOT : 전운량 (1/10)
    - 27. CA_MID : 중하층운량 (1/10)
    - 28. CH_MIN : 최저운고 (100m)
    - 29. CT     : 운형 (문자열 8개) : 2자리 코드로 4개까지 기록 가능
    - 30. CT_TOP : GTS 상층운형 (Code 0509)
    - 31. CT_MID : GTS 중층운형 (Code 0515)
    - 32. CT_LOW : GTS 하층운형 (Code 0513)
    - 33. VS     : 시정 (10m)
    - 34. SS     : 일조 (hr)
    - 35. SI     : 일사 (MJ/m2)
    - 36. ST_GD  : 지면상태 코드 (코드는 기상자원과 문의)
    - 37. TS     : 지면온도 (C)
    - 38. TE_005 : 5cm 지중온도 (C)
    - 39. TE_01  : 10cm 지중온도 (C)
    - 40. TE_02  : 20cm 지중온도 (C)
    - 41. TE_03  : 30cm 지중온도 (C)
    - 42. ST_SEA : 해면상태 코드 (코드는 기상자원과 문의)
    - 43. WH     : 파고 (m) : 해안관측소에서 목측한 값
    - 44. BF     : Beaufart 최대풍력(GTS코드)
    - 45. IR     : 강수자료 유무 (Code 1819) .. 1(Sec1에 포함), 2(Sec3에 포함), 3(무강수), 4(결측)
    - 46. IX     : 유인관측/무인관측 및 일기 포함여부 (code 1860) .. 1,2,3(유인) 4,5,6(무인) / 1,4(포함), 2,5(생략), 3,6(결측)

# 기상관측 전처리

- 현재 시간 데이터를 불러왔다고 가정 
    - 202302070800 일때

- 결과로 나오는 컬럼명
     - YYMMDDHHMI, STN, WD, WS, GST, GST, GST, PA, PS, PT, PR, TA, TD, HM, PV, RN, RN, RN, RN, SD, SD, SD, WC, WP, WW, CA, CA, CH, CT, CT, CT, CT, VS, SS, SI, ST, TS, TE, TE, TE, TE, ST, WH, BF, IR, IX
     - KST  ID  16  m/s  WD   WS   TM    hPa    hPa  -   hPa     C     C     %   hPa     mm    DAY    JUN    INT    HR3    DAY    TOT -- -- ---------------------- TOT MID  MIN -------- TOP MID LOW                  GD     C     5    10    20    30 SEA    m --  -  -
     
    
- 실제 컬럼명
    - GST_WD, GST_WS, GST_TM, PT, PR, TA, TD, HM, PV, RN, RN_DAY, RN_JUN, RN_INT, SD_HR3, SD_DAY, SD_TOT, WC, WP, WW, CA_TOT, CA_MID, CH_MIN, CT, CT_TOP, CT_MID, CT_LOW, VS, SS, SI, ST_GD, TS, TE_005, TE_01, TE_02, TE_03, ST_SEA, WH, BF, IR, IX

-  삭제할 컬럼
     - TM, STN, WD, WS, GST_WD, GST_WS, GST_TM, PA, PS, PT, PR, RN_DAY, RN_JUN, RN_INT, SD_HR3, SD_DAY, WW, CT_TOP, CT_MID, CT_LOW, ST_GD, TS


- 시간 열이름 "datetime" 으로 변경
    - df.rename(columns = {"YYMMDDHHMI" : "datetime"}, inplace = True)


- 기상 코드 onehot_encoding
    - dummy = pd.get_dummies(df["ww"], prefix = "dmstMtphNo")
    - df = pd.concat([df, dummy], axis = 1)
    - df.drop("ww", axis=1, inplace=True)

# 대기오염 API

- 위치: 공공데이터포털 한국환경공단_에어코리아_대기오염통계 현황
- 시군구별 실시간 평균정보 조회

In [None]:
url = "http://apis.data.go.kr/B552584/ArpltnStatsSvc/getCtprvnMesureSidoLIst?"

- 요청 변수
    - serviceKey = "BVQCCUgpx/b8HvRWaOf+lXv7wzOcIMh6bXw/JyBoqDbstzhj6bDJhPY7UW+H296mK5kLc/jmUs4+kpuAUA7t+g=="
    - returnType : "json"
    - numOfRows : "100"
    - pageNo : "1"
    - sidoName : 밑에 참조
    - searchCondition : "HOUR"
    
- sidoName 값
    - "서울"
    - "인천"
    - "경기"

- 위에서 필요한 태그
    - so2Value
    - coValue
    - cityNameEng
    - pm10Value
    - datatime
    - no2Value
    - o3Value
    - sidoName

# 대기오염 전처리

- 필요 없는 컬럼
    - cityName
    - districtNumSeq
    - pm25Value
- 시간 열이름 "datatime" "datetime" 으로 변경
- sidoName 영어로 변경 

# 가져온 데이터의 결측치 처리

- 쌓여있는 데이터베이스 테이블에서 각 일자:시간 별 평균을 가져와서 빈 값을 대체