공공 빅데이터 청년 인턴십 프로젝트
- 도시재생은 지역의 특색 있는 자원을 활용해 역량과 잠재력을 끌어내는 것을 목표로 한다.
- 특히 문화는 지역의 특성을 대표하는 중요한 변수로 여겨진다. 최근에는 문화적 관점에서 공간과 도시를 재구성하는 등, 도시의 패러다임이 변화하면서 그 중요성이 더욱 부각된다.
- 현재 도시재생 사업은 지원 방식에 있어 지역적 특성을 적절히 반영하지 못하는 것이 문제점으로 대두되고 있다.
- 이에 본 프로젝트에서는 문화의 측면에서 각 지역별 도시재생 사업을 공간적으로 파악하고, 클러스터링과 같은 데이터 기반 방법론을 활용해 도시재생 사업의 맹점을 보완하고자 한다.
- Directory
- 분석 프로세스
- 데이터 수집
- 데이터 전처리
- 활성화 필요지역 선정 - Clustering
- 문화 취약 지역 선정 및 Target 지역 선정
- 인프라 선정
- 수요지 선정
- 인프라 제안
├─Data : 프로젝트에 사용되는 데이터 모음
│ ├─Processing : 전처리 데이터
│ ├─Rawdata
│ └─Result : 모델 결과 데이터
├─Location : 수요지 선정을 위한 파일 모음
│ ├─QGIS : QGIS 데이터 & 수요지 선정용 코드
│ │ ├─Administrative_area : 행정동 경계 데이터
│ │ │ └─Demand_Singil 3,4 : 최종 수요 후보지 데이터
│ │ ├─Demand : 수요 후보지 도출을 위한 데이터
│ │ ├─Infra : 영등포구 인프라 데이터
│ │ └─Population : 총인구수 격자 데이터 (2020. 10)
├─Model_code : 클러스터링 코드
└─Processing_code : 전처리 코드
① 도시재생 활성화 진단지표를 활용하여 도시재생 사업이 필요한 지역을 Clustering 결과 비교를 통해 선정
② 문화생활에 대한 만족도를 통해 '만족 대비 불만족 비율'인 '개선효용도'가 상대적으로 낮은 문화 개선이 필요한 지역을 탐색
③ ①과 ②를 만족하는 분석 대상 지역(행정동) 선정
① 히트맵을 기반으로 대상 지역의 문화, 휴식, 운동 중 부족한 인프라 파악
② 대분류 인프라의 하위 카테고리 중 생활 밀접도를 기반으로 구체적인 문화 인프라 선정
① 대상 자치구의 총인구 상위 지역에 해당하는 격자 도출
- 공간가중행렬(Spatial weights matrix)의 Queen contiguity를 통해 격자별 인근 값의 가중합 사용
② 기존 문화시설의 영향 범위(500m 버퍼)를 제외한 문화 취약 격자 집합 도출
③ ①과 ②를 만족하는 문화 인프라 수요지(설치 후보지) 선정
① 후보지 중 Minimum Vertex Cover 알고리즘을 통해 최적 입지 개수 선정
② 최종 입지에 적합한 문화 인프라 선정 및 제안
분석을 위하여 아래 데이터를 수집했다.
① 서울시 활성화 지표 - 도시재생종합정보체계
② 서울시 기초생활 수급자 통계 - 서울 열린 데이터 광장
③ 서울시 고령자현황 - 서울 열린 데이터 광장
④ 행정구역코드 - 행정안전부
⑤ 서울시 문화환경 만족도 - 서울 열린 데이터 광장
⑥. 영등포구 총인구수 - 국토정보맵, 서울특별시 영등포구 총 인구 수 100M 격자(2020.10)
전처리 : Processing_code 내부 ipynb 참조
1) 행정동 코드 통일
- 행정동 코드 통일 : 활성화 지표를 기준으로 읍면동명 변경
2) 활성화 지표 생성
- 서울특별시 활성화 지표 추출 : 전국 데이터 정보를 가지고 있는 도시쇠퇴현황에서 서울특별시와 관련된 활성화 지표만 추출
- 추가 변수 생성 : 국민기초생활보장 수급자, 고령자현황 데이터를 이용하여 비율 변수 생성
- 변수를 추가한 활성화 지표 생성 : 활성화 지표, 추가 변수, 행정동 코드 병합하여 새로운 활성화 지표 생성
활성화 지표를 이용하여 Clustering을 진행, Cluster별 특징을 분석해 활성화가 필요한 지역을 선정
Model_code 내부 ipynb 참조
① 필요 라이브러리 import
② 군집 개수별 aic, bic를 비교하여 최적의 n 선정
③ Cluster별 데이터 분포를 분석하여 Target cluster 선정
① 필요 라이브러리 import
② Elbow chart를 통해 최적의 n 선정
③ Cluster 데이터 분포를 분석하여 Target cluster 선정
① 필요 라이브러리 import
② Elbow chart를 통해 최적의 n 선정
③ Cluster 데이터 분포를 분석하여 Target cluster 선정
① 필요 라이브러리 import
② 3개의 Target cluster에 모두 포함되는 행정동을 활성화 필요 지역으로 선정
③ 선정된 지역들과 전체 지역의 활성화 지표 특징 추출
④ 선정된 지역들과 전체 지역의 활성화 지표 특징 비교/분석
- 서울시 25개 자치구에 대한 문화생활 만족도 조사를 이용, '만족 대비 불만족 비율'인 개선효용도를 도출
- 개선효용도를 통하여 문화 개선이 필요한 자치구 선정
- 활성화 필요 지역(행정동)과 문화 취약 지역(자치구)에 동시에 해당하는 지역
- 도출된 결과 7개 행정동 중 42%를 차지하는 영등포구의 신길3동, 신길4동, 신길5동을 Target 지역으로 선정
- 히트맵을 이용하여 Target 지역의 카테고리(문화, 휴식, 체육)별 시설 현황 분석
- 분석 결과 문화 카테고리가 Target 지역에 부족하다는 것을 확인
- 문화 카테고리 중 타요소들에 비해 생활 밀집도가 높은 도서관, 문화센터를 최종 문화 시설로 선정
- 도보 생활권은 지점에서 걸어서 10분 즉, 500m 반경 내에 있는 범위를 의미
- 생활 밀접도는 근거리(도보 생활권)에서 자주 이용할 정도로 생활에 밀접한 관련이 있다는 것을 의미
- 따라서 생활 밀접도가 높은 시설은 높은 도보 생활권에 있어서 밀접하게 이용할 수 있는 시설을 의미
수요지 선정을 위하여 아래 두 가지 가설을 만족하는 지역을 수요지 후보로 선정
- 총인구수가 많은 곳이 인프라의 수요가 많을 것임
- 문화 시설의 영향을 받지 못하는 곳이 인프라의 수요가 많을 것임
인구는 한 곳에 머물러 있는 것이 아니라 유동적인 지표이기 때문에 공간가중행렬(Spatial weights matrix)의 Queen contiguity를 이용하여 격자별 인근 값으로 가중합을 구함
Location 내부 spatial weights matrix.ipynb 참조
① 라이브러리 설치 및 import
② 가중합 = 기준 격자 값 + 인접한 8개 격자의 평균값(Queen contiguity) 계산
③ 새로운 인구 격자 생성
- 생성된 격자에서 총인구 상위 지역 격자 선정
- 기존 문화시설로부터 500m 버퍼를 생성해 격자에 적용
- 버퍼에 해당하지 않는 부분을 문화 시설이 없는 곳으로 가정
- 총인구수 상위 지역과 문화 시설이 없는 곳을 수요 후보지로 선정
- 선정된 수요 후보지들 중 신길3, 4, 5동 기준으로 500m 영향권 안에 있는 수요 후보지 추출
수요 후보지들 중 최적의 입지 선정을 위해 Minimum vertex cover 알고리즘을 이용
Location 내부 Vertex_Cover.ipynb 참조
① 라이브러리 설치 및 import
② 인접행렬 정의
③ Minimum vertex cover 알고리즘 적용
④ 축소된 수요 후보지 도출
- Minimum vertex cover 알고리즘을 통해 13개의 수요 후보지를 6개로 축소
- 축소된 6개 중에서 모든 수요 후보지를 포함할 수 있는 3곳을 최종으로 선정
공공도서관과 국립도서관, 문화센터의 입지 현황을 히트맵으로 파악했을 때 신길3동, 신길4동, 신길5동에 속한 최적 입지 현황 분석 진행
- 현황 분석 결과, 신길3동의 경우 문화센터가 적합하다고 판단하여 문화센터를 제안
- 신길4동, 신길5동의 경우 도서관이 적합하다고 판단하여 도서관을 제안