## 서울시 범죄 현황 분석

**[학습목표]**

- 서울시 구별 범죄 현황과 검거율 지표 사용 분석
- pandas pivot_table 사용
- Google Map API 사용
- Seaborn 시각화

In [1]:
# 1. 데이터 로딩
import numpy as np
import pandas as pd

In [2]:
# 주의 : 천자리 , 처리 필요 , 인코딩 방식 : euc-kr
crime_anal_police = pd.read_csv(
    './data/02. crime_in_Seoul.csv'
    , thousands=','
    , encoding='euc-kr'
)
crime_anal_police.head()

Unnamed: 0,관서명,살인 발생,살인 검거,강도 발생,강도 검거,강간 발생,강간 검거,절도 발생,절도 검거,폭력 발생,폭력 검거
0,중부서,2,2,3,2,105,65,1395,477,1355,1170
1,종로서,3,3,6,5,115,98,1070,413,1278,1070
2,남대문서,1,0,6,4,65,46,1153,382,869,794
3,서대문서,2,2,5,4,154,124,1812,738,2056,1711
4,혜화서,3,2,5,4,96,63,1114,424,1015,861


In [6]:
crime_anal_police.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 31 entries, 0 to 30
Data columns (total 11 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   관서명     31 non-null     object
 1   살인 발생   31 non-null     int64 
 2   살인 검거   31 non-null     int64 
 3   강도 발생   31 non-null     int64 
 4   강도 검거   31 non-null     int64 
 5   강간 발생   31 non-null     int64 
 6   강간 검거   31 non-null     int64 
 7   절도 발생   31 non-null     int64 
 8   절도 검거   31 non-null     int64 
 9   폭력 발생   31 non-null     int64 
 10  폭력 검거   31 non-null     int64 
dtypes: int64(10), object(1)
memory usage: 2.8+ KB


In [7]:
crime_anal_police['관서명']

0      중부서
1      종로서
2     남대문서
3     서대문서
4      혜화서
5      용산서
6      성북서
7     동대문서
8      마포서
9     영등포서
10     성동서
11     동작서
12     광진서
13     서부서
14     강북서
15     금천서
16     중랑서
17     강남서
18     관악서
19     강서서
20     강동서
21     종암서
22     구로서
23     서초서
24     양천서
25     송파서
26     노원서
27     방배서
28     은평서
29     도봉서
30     수서서
Name: 관서명, dtype: object

In [3]:
# 구별 범죄 현황 <= 경찰서 : 어느 구에 있는지 확인
# 경찰서 주소 추출 : 구글맵 api
import googlemaps

In [4]:
gmap_key = 'AIzaSyCRxIgstOs32GDCO9t3CzdfaLAnb5tu0fI'
gmaps = googlemaps.Client(key=gmap_key)

In [17]:
addr_list = gmaps.geocode('서울중부경찰서', language='ko')
addr_list[0]
# addr_list[0].get('formatted_address')
# 'geometry': {'location': {'lat': 37.56361709999999, 'lng': 126.9896517},
addr_list[0].get('geometry').get('location').get('lat')
# addr_list[0]['geometry']['locatoin']['lat']
# addr_list[0]['geometry']['locatoin']['lng']

37.56361709999999

In [12]:
# 1. 기존 관서명 (중부서) => 서울중부경찰서 => 구글 => 주소 정보 추출

# 0      중부서
# 1      종로서
# 2     남대문서
# 3     서대문서
# 4      혜화서

name = '중부서'

print(name[:-1])
print('서울' + name[:-1] + '경찰서')

중부
서울중부경찰서


In [13]:
# name[:-1] : '중부' <= object numpy data type
station_names = [] # 변경된 관서명을 저장하는 리스트

for name in crime_anal_police['관서명']:
    station_names.append('서울' + str(name[:-1]) + '경찰서')
    
station_names

['서울중부경찰서',
 '서울종로경찰서',
 '서울남대문경찰서',
 '서울서대문경찰서',
 '서울혜화경찰서',
 '서울용산경찰서',
 '서울성북경찰서',
 '서울동대문경찰서',
 '서울마포경찰서',
 '서울영등포경찰서',
 '서울성동경찰서',
 '서울동작경찰서',
 '서울광진경찰서',
 '서울서부경찰서',
 '서울강북경찰서',
 '서울금천경찰서',
 '서울중랑경찰서',
 '서울강남경찰서',
 '서울관악경찰서',
 '서울강서경찰서',
 '서울강동경찰서',
 '서울종암경찰서',
 '서울구로경찰서',
 '서울서초경찰서',
 '서울양천경찰서',
 '서울송파경찰서',
 '서울노원경찰서',
 '서울방배경찰서',
 '서울은평경찰서',
 '서울도봉경찰서',
 '서울수서경찰서']

In [18]:
# 2. 구글에 관서명을 보내서 주소, lat, lng 추출
station_address = []
station_lat = []
station_lng = []

for name in station_names: # name : 서울중부경찰서, 경찰서명이 31개 반복
    tmp = gmaps.geocode(name, language='ko')
    # 주소 추출
    station_address.append(tmp[0].get('formatted_address'))
    # lat, lng 추출
    tmp_loc = tmp[0]['geometry']['location']
    station_lat.append(tmp_loc['lat'])
    station_lng.append(tmp_loc['lng'])
    
    # name : 경찰서명, 주소
    print(name + ' ---> ' + tmp[0].get('formatted_address'))

서울중부경찰서 ---> 대한민국 서울특별시 중구 수표로 27
서울종로경찰서 ---> 대한민국 서울특별시 종로구 인사동5길 41
서울남대문경찰서 ---> 대한민국 서울특별시 중구 한강대로 410
서울서대문경찰서 ---> 대한민국 서울특별시 서대문구 충정로 13
서울혜화경찰서 ---> 대한민국 서울특별시 종로구 창경궁로 112-16
서울용산경찰서 ---> 대한민국 서울특별시 용산구 백범로 329
서울성북경찰서 ---> 대한민국 서울특별시 성북구
서울동대문경찰서 ---> 대한민국 서울특별시 동대문구 약령시로21길 29
서울마포경찰서 ---> 대한민국 서울특별시 마포구 마포대로 183
서울영등포경찰서 ---> 대한민국 서울특별시 영등포구 국회대로 608
서울성동경찰서 ---> 대한민국 서울특별시 성동구 왕십리광장로 9
서울동작경찰서 ---> 대한민국 서울특별시 동작구 본동
서울광진경찰서 ---> 대한민국 서울특별시 광진구 자양로 167
서울서부경찰서 ---> 대한민국 서울특별시 은평구 진흥로 58
서울강북경찰서 ---> 대한민국 서울특별시 강북구 오패산로 406
서울금천경찰서 ---> 대한민국 서울특별시 금천구 시흥대로73길 50
서울중랑경찰서 ---> 대한민국 서울특별시 중랑구 묵제2동 249-2
서울강남경찰서 ---> 대한민국 서울특별시 강남구 테헤란로114길 11
서울관악경찰서 ---> 대한민국 서울특별시 관악구 관악로5길 33
서울강서경찰서 ---> 대한민국 서울특별시 강서구 화곡로 308
서울강동경찰서 ---> 대한민국 서울특별시 강동구 성내로 57
서울종암경찰서 ---> 대한민국 서울특별시 성북구 화랑로7길 32
서울구로경찰서 ---> 대한민국 서울특별시 구로구 새말로 97 신도림테크노마트 5층
서울서초경찰서 ---> 대한민국 서울특별시 서초구 반포대로 179
서울양천경찰서 ---> 대한민국 서울특별시 양천구 목동동로 99
서울송파경찰서 ---> 대한민국 서울특별시 송파구 중대로 221
서울노원경찰서 ---> 대한민국 서울특별시 노원구 노원로 283
서울방

In [19]:
station_address[:5]

['대한민국 서울특별시 중구 수표로 27',
 '대한민국 서울특별시 종로구 인사동5길 41',
 '대한민국 서울특별시 중구 한강대로 410',
 '대한민국 서울특별시 서대문구 충정로 13',
 '대한민국 서울특별시 종로구 창경궁로 112-16']

In [20]:
station_lat[:5]

[37.56361709999999, 37.571824, 37.5547584, 37.560607, 37.5719679]

In [21]:
station_lng[:5]

[126.9896517, 126.9841533, 126.9734981, 126.9626106, 126.9989574]

In [22]:
import pickle

with open('./station_address.pickle', 'wb') as f:
    pickle.dump(station_address, f)
    
with open('./station_lat.pickle', 'wb') as f:
    pickle.dump(station_lat, f)
    
with open('./station_lng.pickle', 'wb') as f:
    pickle.dump(station_lng, f)