# 서울시 범죄 현황 분석
1. 데이터 획득하기
    - 범죄정보
    - 경찰서 위치 정보
2. pandas를 이용하여 데이터 정리하기  
3. 지도 정보를 얻을 수 있는 Google Maps 라이브러리 설치
    - 아나콘다 베이스(base)에서 pip list 확인 후 없으면 설치
    - conda install -c conda-forge googlemaps
4. Google Maps를 이용해서 주소와 위도, 경도 정보 얻기 #key = "AIzaSyBeeHDA1SOtATzLQGqcmf-vo0xtZ3k3i0s"
5. pandas의 pivot_table 사용하기
6. pivot_table을 이용해서 데이터 정리하기
7. 데이터 표현을 위해 다듬기
8. 좀 더 편리한 시각화 도구 - seaborn 사용하기
9. 범죄 데이터 시각화하기
10. 지도 시각화 도구 - Folium
11. 서울시 범죄율에 대한 지도 시각화
12. 서울시 경찰서별 검거율과 구별 범죄 발생율을 동시에 시각화 하기

### 모듈 import 

In [2]:
import googlemaps
import numpy as np
import pandas as pd

## 데이터 정리

### 범죄 현황 데이터 로드 : 02.crime_in_seoul.csv
1. 데이터 위치 : 현재 주피터 노트북이 위치한 폴더의 포로젝트 내부


In [3]:
# thousands='.' 천단위 콤마 제거
# 인코딩은 CP949
filepath = "./02.crime_in_Seoul.csv"
crime_anal_police = pd.read_csv(filepath, thousands='.', encoding="cp949")
crime_anal_police

Unnamed: 0,관서명,살인 발생,살인 검거,강도 발생,강도 검거,강간 발생,강간 검거,절도 발생,절도 검거,폭력 발생,폭력 검거
0,중부서,2,2,3,2,105,65,1395,477,1355,1170
1,종로서,3,3,6,5,115,98,1070,413,1278,1070
2,남대문서,1,0,6,4,65,46,1153,382,869,794
3,서대문서,2,2,5,4,154,124,1812,738,2056,1711
4,혜화서,3,2,5,4,96,63,1114,424,1015,861
5,용산서,5,5,14,14,194,173,1557,587,2050,1704
6,성북서,2,2,2,1,86,71,953,409,1194,1015
7,동대문서,5,5,13,13,173,146,1981,814,2548,2227
8,마포서,8,8,14,10,294,247,2555,813,2983,2519
9,영등포서,14,12,22,20,295,183,2964,978,3572,2961


In [4]:
gmaps_key = 'AIzaSyBeeHDA1SOtATzLQGqcmf-vo0xtZ3k3i0s'
gmaps = googlemaps.Client(key=gmaps_key)

 - 구글 맵에서 '서울중부경찰서'로 검색

In [5]:
# tmp = list type, tmp의 length는 1개
tmp = gmaps.geocode('서울중부경찰서', language='ko')
tmp[0] # tmp 안에 있는 첫 번째 dict에 접슨, 그 dict안에 또 dict 형태로 정보가 분류되어 있음.
       # tmp[0].get('formatted_address') # 경찰서의 정식 주소를 추출하는 방법

{'address_components': [{'long_name': '２７',
   'short_name': '２７',
   'types': ['premise']},
  {'long_name': '수표로',
   'short_name': '수표로',
   'types': ['political', 'sublocality', 'sublocality_level_4']},
  {'long_name': '중구',
   'short_name': '중구',
   'types': ['political', 'sublocality', 'sublocality_level_1']},
  {'long_name': '서울특별시',
   'short_name': '서울특별시',
   'types': ['administrative_area_level_1', 'political']},
  {'long_name': '대한민국', 'short_name': 'KR', 'types': ['country', 'political']},
  {'long_name': '100-032', 'short_name': '100-032', 'types': ['postal_code']}],
 'formatted_address': '대한민국 서울특별시 중구 수표로 27',
 'geometry': {'location': {'lat': 37.56361709999999, 'lng': 126.9896517},
  'location_type': 'ROOFTOP',
  'viewport': {'northeast': {'lat': 37.5649660802915,
    'lng': 126.9910006802915},
   'southwest': {'lat': 37.5622681197085, 'lng': 126.9883027197085}}},
 'partial_match': True,
 'place_id': 'ChIJc-9q5uSifDURLhQmr5wkXmc',
 'plus_code': {'compound_code': 'HX7Q+C

> ### 경찰서 명칭 변경
 - 경찰서명을 정식명칭으로 정리
 - 정식 명칭을 구글 map api에서 정식 주소와 위경도 정보 추출

In [7]:
## 관서명 데이터 정리
station_name = [] # 정리된 관서명 저장

# 관서명을 '중부서' -> '중부경찰서'로 변경
for name in crime_anal_police['관서명']:
    station_name.append('서울' + str(name[:-1]) + '경찰서')
    
### 서울시 경찰서의 주소, 위치 저장
# 서울시 경찰서의 주소, 구글 map정보에서 ('formatted_address') 항목
station_address = []

# 구글맵이 응답한 데이터중, 'geometry' : {'location' : {'lat' : 37.5636465, 'lng' : 126.9895796}}
station_lat = []
station_lng = []

# 경찰서 명으로 구글에서 조회해서 주소, 위도, 경도 정보 추출
for name in station_name:
    # 한경찰서의 모든 정보가 list type으로 반환
    tmp = gmaps.geocode(name, language='ko')
    
    # 정식 주소 추출 tmp : list type, tmp[0] : dict type
    station_address.append(tmp[0].get('formatted_address'))
    
    # 위도, 경도 추출
    tmp_loc = tmp[0].get('geometry')
    
    # 위도, 경도 분리
    station_lat.append(tmp_loc['location']['lat'])ㅇ
    station_lng.append(tmp_loc['location']['lng'])
    
    # 테스트용
    print(name + '--------> ' + tmp[0].get('formatted_address'))

서울중부경찰서--------> 대한민국 서울특별시 중구 수표로 27
서울종로경찰서--------> 대한민국 서울특별시 종로구 인사동5길 41
서울남대문경찰서--------> 대한민국 서울특별시 중구 한강대로 410
서울서대문경찰서--------> 대한민국 서울특별시 서대문구 통일로 113
서울혜화경찰서--------> 대한민국 서울특별시 종로구 창경궁로 112-16
서울용산경찰서--------> 대한민국 서울특별시 용산구 백범로 329
서울성북경찰서--------> 대한민국 서울특별시 성북구 삼선동 보문로 170
서울동대문경찰서--------> 대한민국 서울특별시 동대문구 약령시로21길 29
서울마포경찰서--------> 대한민국 서울특별시 마포구 마포대로 183
서울영등포경찰서--------> 대한민국 서울특별시 영등포구 국회대로 608
서울성동경찰서--------> 대한민국 서울특별시 성동구 행당동 왕십리광장로 9
서울동작경찰서--------> 대한민국 서울특별시 동작구 노량진로 148
서울광진경찰서--------> 대한민국 서울특별시 광진구 구의동 자양로 167
서울서부경찰서--------> 대한민국 서울특별시 은평구 녹번동 177-15
서울강북경찰서--------> 대한민국 서울특별시 강북구 오패산로 406
서울금천경찰서--------> 대한민국 서울특별시 금천구 시흥대로73길 50
서울중랑경찰서--------> 대한민국 서울특별시 중랑구 묵2동 249-2
서울강남경찰서--------> 대한민국 서울특별시 강남구 테헤란로114길 11
서울관악경찰서--------> 대한민국 서울특별시 관악구 관악로5길 33
서울강서경찰서--------> 대한민국 서울특별시 양천구 신월동 화곡로 73
서울강동경찰서--------> 대한민국 서울특별시 강동구 성내로 57
서울종암경찰서--------> 대한민국 서울특별시 성북구 종암로 135
서울구로경찰서--------> 대한민국 서울특별시 구로구 가마산로 235
서울서초경찰서--------> 대한민국 서울특별시 서초구 서초

 > ### 경찰서 주소중, '구' 부분만 추출하여 별도의 리스트에 저장
 
 1. 대한민국 서울 특별시 중구 을지로동 수표로 27 -> 중구
 
 2. 행정 구역이 변경된 경찰서가 있는 지 확인
 
 3. 동일한 구내에 두 개 이상의 경찰서가 존재하는 지 확인, (존재시 주 경찰서의 데이터 합)
 

In [8]:
# 대한민국 서울 특별시 중구 을지로동 수표로 27 -> '중구' : split()

gu_name = [] # 구 이름만 저장

for name in station_address:
    tmp = name.split()
    gu_name.append(tmp[2])
    print(gu_name)

['중구']
['중구', '종로구']
['중구', '종로구', '중구']
['중구', '종로구', '중구', '서대문구']
['중구', '종로구', '중구', '서대문구', '종로구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구', '성동구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구', '성동구', '동작구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구', '성동구', '동작구', '광진구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구', '성동구', '동작구', '광진구', '은평구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구', '성동구', '동작구', '광진구', '은평구', '강북구']
['중구', '종로구', '중구', '서대문구', '종로구', '용산구', '성북구', '동대문구', '마포구', '영등포구', '성동구', '동작구', '광진구', '은평구', '강북구', '금천구']
['중구', '종로구', '중구', '서대문구', '종로구'