# Amentities

## Import

- 공공데이터 포털 : [전국도시공원정보표준데이터](https://www.data.go.kr/data/15012890/standard.do) 사용

In [1]:
import pandas as pd
import re

In [2]:
try:
    df = pd.read_csv('/Users/kyeong6/Desktop/analysis/park/urban_park_data/urban_park.csv', encoding='utf-8')
except UnicodeDecodeError:
    try:
        df = pd.read_csv('/Users/kyeong6/Desktop/analysis/park/urban_park_data/urban_park.csv', encoding='utf-8')
    except Exception as e:
        print(f"Error: {e}")

In [3]:
df.head()

Unnamed: 0,관리번호,공원명,공원구분,소재지도로명주소,소재지지번주소,위도,경도,공원면적,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설),지정고시일,관리기관명,전화번호,데이터기준일자,제공기관코드,제공기관명
0,41830-00017,광탄2호 소공원,소공원,,경기도 양평군 용문면 광탄리 711,37.509628,127.628406,856.0,,,,,,1994-02-25,경기도 양평군청,031-770-2358,2023-05-26,4170000,경기도 양평군
1,41830-00031,광탄3호 소공원,소공원,,경기도 양평군 용문면 광탄리 762,37.508443,127.627414,847.0,,,,,,1994-02-25,경기도 양평군청,031-770-2358,2023-05-26,4170000,경기도 양평군
2,41830-00018,공흥 소공원,소공원,,경기도 양평군 양평읍 공흥리 885-1,37.493844,127.509326,1276.0,,,,,,2012-11-22,경기도 양평군청,031-770-2358,2023-05-26,4170000,경기도 양평군
3,41830-00019,한강아트로드 공원,소공원,,경기도 양평군 강하면 운심리 43-25,37.496021,127.408216,3300.0,,,,,,2012-08-30,경기도 양평군청,031-770-2358,2023-05-26,4170000,경기도 양평군
4,41830-00020,강하 소공원,소공원,경기도 양평군 강하면 운심길 58,경기도 양평군 강하면 운심리 28-1,37.496164,127.412326,394.0,농구장+축구장+테니스장,,,,,2012-08-30,경기도 양평군청,031-770-2358,2023-05-26,4170000,경기도 양평군


## 필요한 열 유지

In [4]:
df.columns

Index(['관리번호', '공원명', '공원구분', '소재지도로명주소', '소재지지번주소', '위도', '경도', '공원면적',
       '공원보유시설(운동시설)', '공원보유시설(유희시설)', '공원보유시설(편익시설)', '공원보유시설(교양시설)',
       '공원보유시설(기타시설)', '지정고시일', '관리기관명', '전화번호', '데이터기준일자', '제공기관코드', '제공기관명'],
      dtype='object')

In [5]:
df = df[['공원명', '소재지지번주소', '공원보유시설(운동시설)','공원보유시설(유희시설)', '공원보유시설(편익시설)', '공원보유시설(교양시설)',
        '공원보유시설(기타시설)']]

In [6]:
df.head()

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설)
0,광탄2호 소공원,경기도 양평군 용문면 광탄리 711,,,,,
1,광탄3호 소공원,경기도 양평군 용문면 광탄리 762,,,,,
2,공흥 소공원,경기도 양평군 양평읍 공흥리 885-1,,,,,
3,한강아트로드 공원,경기도 양평군 강하면 운심리 43-25,,,,,
4,강하 소공원,경기도 양평군 강하면 운심리 28-1,농구장+축구장+테니스장,,,,


## 데이터 전처리 전략
- 소재지지번주소로 오름차순 정렬
- 도시에 따른 공원의 개수 파악
- 도시에 따른 각 공원보유시설 개수 파악

In [7]:
# 소재지 지번주소에 따른 오름차순 정렬
df = df.sort_values(by='소재지지번주소').reset_index(drop=True)

In [8]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설)
0,초당 분수공원,강원도 강릉시 강문동 41-18,,,,,
1,경포2공원,강원도 강릉시 강문동 산1 일원,,,,,
2,안목 해맞이 소공원,강원도 강릉시 견소동 산 1-3,,,,,
3,교동7공원,강원도 강릉시 교동 1071-1 일원,,,,,
4,말나눔터공원,강원도 강릉시 교동 156-11,,,,,
...,...,...,...,...,...,...,...
18853,일산봉어린이공원,,,조합놀이대+그네+흔들놀이기구,,,
18854,광명어린이공원,,,조합놀이대+시소,,,
18855,달 빛,,,,미끄럼대+파고라+화장실,,
18856,달맞이,,,,교통공원시설+조합놀이대+화장실,,


In [9]:
# 소재지지번주소 Nan값 처리
df = df.dropna(subset=['소재지지번주소'])

In [10]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설)
0,초당 분수공원,강원도 강릉시 강문동 41-18,,,,,
1,경포2공원,강원도 강릉시 강문동 산1 일원,,,,,
2,안목 해맞이 소공원,강원도 강릉시 견소동 산 1-3,,,,,
3,교동7공원,강원도 강릉시 교동 1071-1 일원,,,,,
4,말나눔터공원,강원도 강릉시 교동 156-11,,,,,
...,...,...,...,...,...,...,...
18629,어린이공원/44,충청북도 충주시 호암동 529,,,,,
18630,근린공원/9(호암공원),충청북도 충주시 호암동 569,운동기구등31+체육관,조합놀이대등4,화장실1,청소년수련관등,의자+정자등99
18631,근린공원/27,충청북도 충주시 호암동 681-8,,,,,
18632,근린공원/28,충청북도 충주시 호암동 699-8,,,,,


## 도시에 따른 공원 개수 파악

- 면적 부분에서 도시의 공원 개수 파악 완료

## 도시에 따른 각 공원 보유시설물 개수 파악

- 시설물의 개수가 텍스트와 같이 존재하여 "정규식"을 이용한 전처리 필요

In [11]:
# 공원보유시설 5개 열에서 모든 부분이 Nan값이라면 제거 가능
df = df.dropna(subset=['공원보유시설(운동시설)','공원보유시설(유희시설)','공원보유시설(편익시설)','공원보유시설(교양시설)', 
                       '공원보유시설(기타시설)'], how='all')

In [12]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설)
86,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,,정자+의자+탁자+화장실,,
87,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,,정자+의자+탁자+화장실,,
88,토골샘터 쌈지공원,강원도 고성군 간성읍 상리 500,운동기구5,,의자,,약수터
89,금수리1길 녹색쌈지공원,강원도 고성군 간성읍 상리 530번지 일원,,,정자,,
90,간성 수성샘터 산림욕장,강원도 고성군 간성읍 상리 산19-1번지 일원,운동기구9,,정자+의자+탁자,,산책로+가로등+기념비
...,...,...,...,...,...,...,...
18621,어린이공원/5,충청북도 충주시 칠금동 627,운동기구등9,조합놀이대등5,,,의자+정자등13
18622,어린이공원/6,충청북도 충주시 칠금동 632,운동기구등7,조합놀이대등5,음수대1,,의자+정자등17
18623,근린공원/20(금릉소공원),충청북도 충주시 칠금동 823,풋살장+체력단련시설,,화장실,야외무대,
18624,어린이공원/9,충청북도 충주시 칠금동 965,운동기구등10,조합놀이대등6,음수대1,,의자+정자등32


In [13]:
# Nan값 0으로 치환
df.fillna(0, inplace=True)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df.fillna(0, inplace=True)


In [14]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설)
86,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,0,정자+의자+탁자+화장실,0,0
87,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,0,정자+의자+탁자+화장실,0,0
88,토골샘터 쌈지공원,강원도 고성군 간성읍 상리 500,운동기구5,0,의자,0,약수터
89,금수리1길 녹색쌈지공원,강원도 고성군 간성읍 상리 530번지 일원,0,0,정자,0,0
90,간성 수성샘터 산림욕장,강원도 고성군 간성읍 상리 산19-1번지 일원,운동기구9,0,정자+의자+탁자,0,산책로+가로등+기념비
...,...,...,...,...,...,...,...
18621,어린이공원/5,충청북도 충주시 칠금동 627,운동기구등9,조합놀이대등5,0,0,의자+정자등13
18622,어린이공원/6,충청북도 충주시 칠금동 632,운동기구등7,조합놀이대등5,음수대1,0,의자+정자등17
18623,근린공원/20(금릉소공원),충청북도 충주시 칠금동 823,풋살장+체력단련시설,0,화장실,야외무대,0
18624,어린이공원/9,충청북도 충주시 칠금동 965,운동기구등10,조합놀이대등6,음수대1,0,의자+정자등32


In [15]:
df = df.reset_index(drop=True)

In [16]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설)
0,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,0,정자+의자+탁자+화장실,0,0
1,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,0,정자+의자+탁자+화장실,0,0
2,토골샘터 쌈지공원,강원도 고성군 간성읍 상리 500,운동기구5,0,의자,0,약수터
3,금수리1길 녹색쌈지공원,강원도 고성군 간성읍 상리 530번지 일원,0,0,정자,0,0
4,간성 수성샘터 산림욕장,강원도 고성군 간성읍 상리 산19-1번지 일원,운동기구9,0,정자+의자+탁자,0,산책로+가로등+기념비
...,...,...,...,...,...,...,...
9641,어린이공원/5,충청북도 충주시 칠금동 627,운동기구등9,조합놀이대등5,0,0,의자+정자등13
9642,어린이공원/6,충청북도 충주시 칠금동 632,운동기구등7,조합놀이대등5,음수대1,0,의자+정자등17
9643,근린공원/20(금릉소공원),충청북도 충주시 칠금동 823,풋살장+체력단련시설,0,화장실,야외무대,0
9644,어린이공원/9,충청북도 충주시 칠금동 965,운동기구등10,조합놀이대등6,음수대1,0,의자+정자등32


In [17]:
# 공원보유시설 값들의 종류의 개수 파악
columns_amentities = ['공원보유시설(운동시설)', '공원보유시설(유희시설)', '공원보유시설(편익시설)', '공원보유시설(교양시설)', 
                      '공원보유시설(기타시설)']

In [18]:
# 모든 값을 확인하였는데, 텍스트와 같이 존재하여 다양한 값 존재
for column in columns_amentities:
    counts = df[column].value_counts()
    print(f"{counts}")
    print()
    print("-"*40)

공원보유시설(운동시설)
0                        4203
운동기구                      395
체력단련시설                    318
농구장                       248
야외운동기구                    194
                         ... 
운동기구(10)                    1
농구대(2)+운동기구(6)              1
국국장(1)+농구대(2)+운동기구(4)       1
운동기구(18)                    1
운동기구등31+체육관                 1
Name: count, Length: 1988, dtype: int64

----------------------------------------
공원보유시설(유희시설)
0                        3025
조합놀이대                    1570
어린이놀이터                    283
조합놀이대+그네                  264
조합놀이대1                    216
                         ... 
조합놀이대+흔들놀이기구+모래놀이집+그네       1
마운틴코스타+발물놀이터+놀이터            1
조합놀이기구+시소(2)                1
조합놀이대+흔들놀이대(3)+시소           1
시소 외3종                      1
Name: count, Length: 1352, dtype: int64

----------------------------------------
공원보유시설(편익시설)
0                  4275
화장실                 940
파고라                 202
정자+벤치               167
벤치                  155
                 

## 값이 중구난방.. 전처리 전략 필요

**고려사항**
1. 시설물+숫자 : 운동기구3
2. 시설물+시설물 : 바닥분수+경관터널 -> "+" 구분자
3. 시설물+개수 : 운동기구10개, 화장실 1개소, 정자4개소
4. 2번과 3번 합친 경우
5. 앞에 번호 존재 : 1.조합놀이대 2.그네 3.시소
6. 괄호를 이용한 개수 표현 : 1.파고라 2.벤치(2)
7. 개수를 종으로 표현 : 미끄럼틀 등 10종
8. 개수를 개로 표현 : 흔들놀이기구 등 5개

In [19]:
# 시설물의 개수를 추출하는 함수
def extract_count(item):
    # 모든 입력을 문자열로 처리
    item = str(item)
    if item == 'nan' or item == '0':
        return 0
    total_count = 0
    facilities = item.split('+')
    for facility in facilities:
        # 시설명 앞의 번호와 점을 제거
        facility = re.sub(r'^\d+\.', '', facility).strip()
        
        # '개' 또는 괄호로 구체적인 숫자가 명시된 경우 그 숫자를 사용
        detailed_count = re.search(r'(\d+)개', facility) or re.search(r'\((\d+)\)', facility)
        if detailed_count:
            count = int(detailed_count.group(1))
        else:
            # 숫자만 있는 경우 그 숫자를 사용
            simple_count = re.search(r'\d+', facility)
            count = int(simple_count.group()) if simple_count else 1
        total_count += count
    return total_count

In [20]:
# 각 공원 시설 항목의 개수 계산
columns_to_process = ['공원보유시설(운동시설)', '공원보유시설(유희시설)', '공원보유시설(편익시설)', '공원보유시설(교양시설)', '공원보유시설(기타시설)']
for column in columns_to_process:
    df[f'{column}_count'] = df[column].apply(extract_count)

In [21]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(유희시설),공원보유시설(편익시설),공원보유시설(교양시설),공원보유시설(기타시설),공원보유시설(운동시설)_count,공원보유시설(유희시설)_count,공원보유시설(편익시설)_count,공원보유시설(교양시설)_count,공원보유시설(기타시설)_count
0,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,0,정자+의자+탁자+화장실,0,0,3,0,4,0,0
1,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,0,정자+의자+탁자+화장실,0,0,3,0,4,0,0
2,토골샘터 쌈지공원,강원도 고성군 간성읍 상리 500,운동기구5,0,의자,0,약수터,5,0,1,0,1
3,금수리1길 녹색쌈지공원,강원도 고성군 간성읍 상리 530번지 일원,0,0,정자,0,0,0,0,1,0,0
4,간성 수성샘터 산림욕장,강원도 고성군 간성읍 상리 산19-1번지 일원,운동기구9,0,정자+의자+탁자,0,산책로+가로등+기념비,9,0,3,0,3
...,...,...,...,...,...,...,...,...,...,...,...,...
9641,어린이공원/5,충청북도 충주시 칠금동 627,운동기구등9,조합놀이대등5,0,0,의자+정자등13,9,5,0,0,14
9642,어린이공원/6,충청북도 충주시 칠금동 632,운동기구등7,조합놀이대등5,음수대1,0,의자+정자등17,7,5,1,0,18
9643,근린공원/20(금릉소공원),충청북도 충주시 칠금동 823,풋살장+체력단련시설,0,화장실,야외무대,0,2,0,1,1,0
9644,어린이공원/9,충청북도 충주시 칠금동 965,운동기구등10,조합놀이대등6,음수대1,0,의자+정자등32,10,6,1,0,33


In [22]:
# 열 순서 바꾸기
new_column_order = ['공원명','소재지지번주소','공원보유시설(운동시설)','공원보유시설(운동시설)_count','공원보유시설(유희시설)', '공원보유시설(유희시설)_count',
                   '공원보유시설(편익시설)','공원보유시설(편익시설)_count','공원보유시설(교양시설)', '공원보유시설(교양시설)_count',
                   '공원보유시설(기타시설)','공원보유시설(기타시설)_count']

# reindex() 메서드를 사용하여 열 순서 변경
df = df.reindex(columns=new_column_order)

In [23]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설),공원보유시설(운동시설)_count,공원보유시설(유희시설),공원보유시설(유희시설)_count,공원보유시설(편익시설),공원보유시설(편익시설)_count,공원보유시설(교양시설),공원보유시설(교양시설)_count,공원보유시설(기타시설),공원보유시설(기타시설)_count
0,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,3,0,0,정자+의자+탁자+화장실,4,0,0,0,0
1,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,운동기구3,3,0,0,정자+의자+탁자+화장실,4,0,0,0,0
2,토골샘터 쌈지공원,강원도 고성군 간성읍 상리 500,운동기구5,5,0,0,의자,1,0,0,약수터,1
3,금수리1길 녹색쌈지공원,강원도 고성군 간성읍 상리 530번지 일원,0,0,0,0,정자,1,0,0,0,0
4,간성 수성샘터 산림욕장,강원도 고성군 간성읍 상리 산19-1번지 일원,운동기구9,9,0,0,정자+의자+탁자,3,0,0,산책로+가로등+기념비,3
...,...,...,...,...,...,...,...,...,...,...,...,...
9641,어린이공원/5,충청북도 충주시 칠금동 627,운동기구등9,9,조합놀이대등5,5,0,0,0,0,의자+정자등13,14
9642,어린이공원/6,충청북도 충주시 칠금동 632,운동기구등7,7,조합놀이대등5,5,음수대1,1,0,0,의자+정자등17,18
9643,근린공원/20(금릉소공원),충청북도 충주시 칠금동 823,풋살장+체력단련시설,2,0,0,화장실,1,야외무대,1,0,0
9644,어린이공원/9,충청북도 충주시 칠금동 965,운동기구등10,10,조합놀이대등6,6,음수대1,1,0,0,의자+정자등32,33


## 필요한 열 추출
- 각 시설 별 count열을 통해 확인

In [24]:
df = df[['공원명','소재지지번주소','공원보유시설(운동시설)_count','공원보유시설(유희시설)_count','공원보유시설(편익시설)_count',
        '공원보유시설(교양시설)_count','공원보유시설(기타시설)_count']]

In [25]:
df

Unnamed: 0,공원명,소재지지번주소,공원보유시설(운동시설)_count,공원보유시설(유희시설)_count,공원보유시설(편익시설)_count,공원보유시설(교양시설)_count,공원보유시설(기타시설)_count
0,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,3,0,4,0,0
1,남천하구 체육공원,강원도 고성군 간성읍 동호리 12-1,3,0,4,0,0
2,토골샘터 쌈지공원,강원도 고성군 간성읍 상리 500,5,0,1,0,1
3,금수리1길 녹색쌈지공원,강원도 고성군 간성읍 상리 530번지 일원,0,0,1,0,0
4,간성 수성샘터 산림욕장,강원도 고성군 간성읍 상리 산19-1번지 일원,9,0,3,0,3
...,...,...,...,...,...,...,...
9641,어린이공원/5,충청북도 충주시 칠금동 627,9,5,0,0,14
9642,어린이공원/6,충청북도 충주시 칠금동 632,7,5,1,0,18
9643,근린공원/20(금릉소공원),충청북도 충주시 칠금동 823,2,0,1,1,0
9644,어린이공원/9,충청북도 충주시 칠금동 965,10,6,1,0,33


## 도시에 따른 각 시설들 총합 구하기

In [26]:
# 공원명 삭제
df = df.drop(['공원명'], axis=1)

In [27]:
# 도시명
cities = [
    '대구광역시', '광주광역시', '대전광역시', '부산광역시', '서울특별시', '세종특별자치시', '울산광역시', '인천광역시',
    '강릉시', '동해시', '삼척시', '속초시', '원주시', '춘천시', '태백시', '고양시', '과천시', '광명시', '광주시', 
    '구리시', '군포시', '김포시', '남양주시', '동두천시', '부천시', '성남시', '수원시', '시흥시', '안산시', 
    '안성시', '안양시', '양주시', '여주시', '오산시', '용인시', '의왕시', '의정부시', '이천시', '파주시', 
    '평택시', '포천시', '하남시', '화성시', '거제시', '김해시', '밀양시', '사천시', '양산시', '진주시', 
    '창원시', '통영시', '경산시', '경주시', '구미시', '김천시', '문경시', '상주시', '안동시', '영주시', 
    '영천시', '포항시', '광양시', '나주시', '목포시', '순천시', '여수시', '군산시', '김제시', '남원시', 
    '익산시', '전주시', '정읍시', '서귀포시', '제주시', '계룡시', '공주시', '논산시', '당진시', '보령시', 
    '서산시', '아산시', '천안시', '제천시', '청주시', '충주시'
]

In [28]:
# 도시명 추출 함수
def extract_city(address):
    for city in cities:
        if city in address:
            return city
    # 도시명을 찾지 못한 경우
    return 'Unknown'  

In [29]:
# 도시명을 새로운 열에 저장
df['도시명'] = df['소재지지번주소'].apply(extract_city)

In [30]:
# 각 도시별 공원 시설물 개수 집계
city_facilities_count = df.groupby('도시명').agg({
    '공원보유시설(운동시설)_count': 'sum',
    '공원보유시설(유희시설)_count': 'sum',
    '공원보유시설(편익시설)_count': 'sum',
    '공원보유시설(교양시설)_count': 'sum',
    '공원보유시설(기타시설)_count': 'sum'
})

In [31]:
city_facilities_count

Unnamed: 0_level_0,공원보유시설(운동시설)_count,공원보유시설(유희시설)_count,공원보유시설(편익시설)_count,공원보유시설(교양시설)_count,공원보유시설(기타시설)_count
도시명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Unknown,6021,835,4134,450,1406
거제시,39,49,12,0,0
경산시,509,267,39,2,444
경주시,51,42,17,0,0
계룡시,218,24,382,4,424
...,...,...,...,...,...
통영시,4,14,13,4,1
파주시,56,110,26,6,32
평택시,1821,918,280,4,1279
포천시,60,55,9,4,0


In [32]:
# 'Unknown' 행 삭제
city_facilities_count = city_facilities_count.drop('Unknown', errors='ignore')

In [33]:
city_facilities_count

Unnamed: 0_level_0,공원보유시설(운동시설)_count,공원보유시설(유희시설)_count,공원보유시설(편익시설)_count,공원보유시설(교양시설)_count,공원보유시설(기타시설)_count
도시명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
거제시,39,49,12,0,0
경산시,509,267,39,2,444
경주시,51,42,17,0,0
계룡시,218,24,382,4,424
고양시,219,335,91,4,1
...,...,...,...,...,...
통영시,4,14,13,4,1
파주시,56,110,26,6,32
평택시,1821,918,280,4,1279
포천시,60,55,9,4,0


## 도시공원은 존재하나 시설물이 없는 경우 발생
 
- 해결방안 : [정보공개포털](https://www.open.go.kr/com/main/mainView.do)을 통해 85개 도시에 직접 청구

In [34]:
# 인덱스에서 지정된 도시명들의 존재 여부 확인
missing_cities = [city for city in cities if city not in city_facilities_count.index]

In [35]:
missing_cities

['강릉시',
 '동해시',
 '춘천시',
 '군포시',
 '남양주시',
 '동두천시',
 '안성시',
 '안양시',
 '용인시',
 '하남시',
 '화성시',
 '창원시',
 '김천시',
 '영주시',
 '김제시',
 '논산시',
 '당진시',
 '청주시']

In [36]:
# Excel 정렬 순서에 맞게 인덱스 재정렬
sorted_city_facilities_count = city_facilities_count.reindex(cities)

In [37]:
sorted_city_facilities_count

Unnamed: 0_level_0,공원보유시설(운동시설)_count,공원보유시설(유희시설)_count,공원보유시설(편익시설)_count,공원보유시설(교양시설)_count,공원보유시설(기타시설)_count
도시명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
대구광역시,143.0,584.0,364.0,18.0,15.0
광주광역시,713.0,376.0,94.0,23.0,1163.0
대전광역시,699.0,401.0,288.0,28.0,572.0
부산광역시,1209.0,538.0,169.0,33.0,8598.0
서울특별시,1694.0,1289.0,1773.0,45.0,85.0
...,...,...,...,...,...
아산시,664.0,311.0,2892.0,3.0,54.0
천안시,166.0,261.0,30.0,0.0,0.0
제천시,65.0,90.0,30.0,4.0,198.0
청주시,,,,,


In [38]:
# NaN 값을 0으로 대체하고, 데이터 타입을 정수로 변환
sorted_city_facilities_count = sorted_city_facilities_count.fillna(0).astype(int)

In [39]:
sorted_city_facilities_count

Unnamed: 0_level_0,공원보유시설(운동시설)_count,공원보유시설(유희시설)_count,공원보유시설(편익시설)_count,공원보유시설(교양시설)_count,공원보유시설(기타시설)_count
도시명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
대구광역시,143,584,364,18,15
광주광역시,713,376,94,23,1163
대전광역시,699,401,288,28,572
부산광역시,1209,538,169,33,8598
서울특별시,1694,1289,1773,45,85
...,...,...,...,...,...
아산시,664,311,2892,3,54
천안시,166,261,30,0,0
제천시,65,90,30,4,198
청주시,0,0,0,0,0


In [40]:
# sorted_city_facilities_count.to_csv('amentities_result.csv')