### 서울시 공원 시각화

In [1]:
import numpy as np
import pandas as pd
import folium

In [2]:
#info 기본적인 정보를 출력하는 메소드
df = pd.read_csv('data/서울시 주요 공원현황.csv', encoding='euc-kr')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 132 entries, 0 to 131
Data columns (total 19 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   연번            132 non-null    int64  
 1   공원명           132 non-null    object 
 2   공원개요          131 non-null    object 
 3   면적            129 non-null    object 
 4   개원일           122 non-null    object 
 5   주요시설          124 non-null    object 
 6   주요식물          88 non-null     object 
 7   안내도           102 non-null    object 
 8   오시는길          115 non-null    object 
 9   이용시참고사항       120 non-null    object 
 10  이미지           132 non-null    object 
 11  지역            131 non-null    object 
 12  공원주소          132 non-null    object 
 13  관리부서          132 non-null    object 
 14  전화번호          132 non-null    object 
 15  X좌표(GRS80TM)  122 non-null    float64
 16  Y좌표(GRS80TM)  122 non-null    float64
 17  X좌표(WGS84)    131 non-null    float64
 18  Y좌표(WGS84)    131 non-null    

In [3]:
df = df[['공원명','면적','공원주소','Y좌표(WGS84)','X좌표(WGS84)']]
df.columns =['공원명','면적','주소','위도','경도']
df.head(3)

Unnamed: 0,공원명,면적,주소,위도,경도
0,남산도시자연공원,2896887㎡ 임 야 : 2454140㎡ 녹지대 및 기타시설 : 442747㎡,서울특별시 중구 삼일대로 231(예장동),37.55014,126.990377
1,길동생태공원,80683㎡,서울특별시 강동구 천호대로 1291(길동생태공원),37.540394,127.154779
2,서울대공원,9132690m²,경기도 과천시 대공원광장로 102,37.426449,127.019846


In [4]:
df.dropna(subset=['면적','경도'],inplace=True)
df.isna().sum().sum()

0

- 면적에 따라 공원크기를 지도에 표시

In [5]:
# 10개씩 보겠다
df.면적.head(60).tail(10)

50                                            총 16500㎥ 
51                                             585652㎥ 
52                                           649709.6㎡ 
53                                               72132㎡
54                                             66027.8㎡
55                                              265582㎡
56                                           2088704.9㎡
57                                              112070㎡
58                                              993724㎡
59    219167㎡ 곰두리체육센터 : 7370㎡(지하2층 지상3층) 송파도서관 : 825...
Name: 면적, dtype: object

In [6]:
df.면적[6]
df.drop([6],inplace=True)

In [7]:
#시작할때 총 144m 같은 글에서 '총' 지우기
df.면적 =df.면적.str.replace('총','')


In [8]:
#앞에 있는 숫자만 추출하기 - 구분자 ㎡,m,㎥
#구분자가 여려개인 경우 split()
import re
re.split('[,.]','a,b,c')

['a', 'b', 'c']

In [9]:
df.면적 = df.면적.apply(lambda x : re.split('[㎡m㎥]',x)[0])
df.면적.head()

0    2896887
1      80683
2    9132690
3     480994
4    2284085
Name: 면적, dtype: object

In [10]:
# 면적을 정수로 변경함 데이터에 실수가있어서 문자열 > 실수>정수로 변환
df.면적 =df.면적.astype(float).astype(int)

In [11]:
df.head()

Unnamed: 0,공원명,면적,주소,위도,경도
0,남산도시자연공원,2896887,서울특별시 중구 삼일대로 231(예장동),37.55014,126.990377
1,길동생태공원,80683,서울특별시 강동구 천호대로 1291(길동생태공원),37.540394,127.154779
2,서울대공원,9132690,경기도 과천시 대공원광장로 102,37.426449,127.019846
3,서울숲,480994,서울특별시 성동구 뚝섬로 273 (성수동1가),37.543072,127.041798
4,월드컵공원,2284085,서울특별시 마포구 하늘공원로 84(월드컵공원),37.571805,126.878907


- 공원 크기에 따라 분류

In [12]:
# 기준 : 소형 < 100000, 중형<1000000, 대형
criteria =[0,100000,1000000,20000000]
labels =['소형','중형','대형']          #분류기준
size_info =[3,7,15]                     # CircleMarker의 크기
df['분류']=pd.cut(df.면적,criteria,labels=labels)
df['크기'] =pd.cut(df.면적,criteria,labels=size_info)
df.head()

Unnamed: 0,공원명,면적,주소,위도,경도,분류,크기
0,남산도시자연공원,2896887,서울특별시 중구 삼일대로 231(예장동),37.55014,126.990377,대형,15
1,길동생태공원,80683,서울특별시 강동구 천호대로 1291(길동생태공원),37.540394,127.154779,소형,3
2,서울대공원,9132690,경기도 과천시 대공원광장로 102,37.426449,127.019846,대형,15
3,서울숲,480994,서울특별시 성동구 뚝섬로 273 (성수동1가),37.543072,127.041798,중형,7
4,월드컵공원,2284085,서울특별시 마포구 하늘공원로 84(월드컵공원),37.571805,126.878907,대형,15


In [13]:
df['크기'] =df['크기'] .astype(int)

In [14]:
df['크기']

0      15
1       3
2      15
3       7
4      15
       ..
126     7
127     7
128     7
129     7
130     7
Name: 크기, Length: 128, dtype: int32

In [15]:
df.to_csv('data/서울공원요약.csv',index=False)

- 공원 시각화

In [16]:
park = folium.Map([37.55, 126.98], zoom_start=11)
for i in df.index:
    folium.CircleMarker(
        location=[df.위도[i],df.경도[i]],
        radius=int(df.크기[i]),         # type int로 바꿔줘야함
        tooltip=df.공원명[i],
        popup=folium.Popup(df.주소[i], max_width=200),
        color='crimson',fill_color='crimson'

).add_to(park)
title_html = '<h3 align="center" style="font-size:20px">서울시 공원 현황</h3>' # 지도 제목달기
park.get_root().html.add_child(folium.Element(title_html))
park