In [1]:
import numpy as np
import pandas as pd

# 관서별 5대범죄 발생 및 검거 엑셀 파일 경로
crime_occurrence_file_path = 'data/crime_occurrence.xlsx'
# 구별 데이터 csv 파일 경로
district_data_file_path = 'data/district_data.csv'

# 엑셀 파일을 데이터프레임으로 변환
crime_occurrence_df = pd.read_excel(crime_occurrence_file_path, engine='openpyxl')
# print(crime_occurrence_df)

# 경찰서와 구 이름 매핑 딕셔너리
mapping = {
    '서대문서': '서대문구', '수서서': '강남구', '강서서': '강서구', '서초서': '서초구',
    '서부서': '은평구', '중부서': '중구', '종로서': '종로구', '남대문서': '중구',
    '혜화서': '종로구', '용산서': '용산구', '성북서': '성북구', '동대문서': '동대문구',
    '마포서': '마포구', '영등포서': '영등포구', '성동서': '성동구', '동작서': '동작구',
    '광진서': '광진구', '강북서': '강북구', '금천서': '금천구', '중랑서': '중랑구',
    '강남서': '강남구', '관악서': '관악구', '강동서': '강동구', '종암서': '성북구',
    '구로서': '구로구', '양천서': '양천구', '송파서': '송파구', '노원서': '노원구',
    '방배서': '서초구', '은평서': '은평구', '도봉서': '도봉구'
}

# '구별' 컬럼 생성
crime_occurrence_df['구별'] = crime_occurrence_df['관서명'].map(mapping).fillna('구 없음')
# print(crime_occurrence_df)

# 죄종

columns_to_pivot = [
    '강간(검거)', '강간(발생)', '강도(검거)', '강도(발생)', '살인(검거)', '살인(발생)',
    '소계(검거)', '소계(발생)', '절도(검거)', '절도(발생)', '폭력(검거)', '폭력(발생)'
]

crime_occurrence_pivot = crime_occurrence_df.pivot_table(index='구별', values=columns_to_pivot, aggfunc='sum')
crime_occurrence_pivot.drop('구 없음', inplace=True)

# 각 항목별 검거율 추가
crime_occurrence_pivot['강간검거율'] = crime_occurrence_pivot['강간(검거)'] / crime_occurrence_pivot['강간(발생)'] * 100
crime_occurrence_pivot['강도검거율'] = crime_occurrence_pivot['강도(검거)'] / crime_occurrence_pivot['강도(발생)'] * 100
crime_occurrence_pivot['살인검거율'] = crime_occurrence_pivot['살인(검거)'] / crime_occurrence_pivot['살인(발생)'] * 100
crime_occurrence_pivot['절도검거율'] = crime_occurrence_pivot['절도(검거)'] / crime_occurrence_pivot['절도(발생)'] * 100
crime_occurrence_pivot['폭력검거율'] = crime_occurrence_pivot['폭력(검거)'] / crime_occurrence_pivot['폭력(발생)'] * 100

del_colum_list = ['강간(검거)', '강간(발생)', '강도(검거)', '강도(발생)', '살인(검거)', '살인(발생)', '절도(검거)', '절도(발생)', '폭력(검거)', '폭력(발생)']
for del_column in del_colum_list:
    del crime_occurrence_pivot[del_column]

rename_dic = {
    '소계(검거)': '검거율', '소계(발생)': '발생율', '강간검거율': '강간', '강도검거율': '강도', '살인검거율': '살인', '절도검거율': '절도', '폭력검거율': '폭력'
}
crime_occurrence_pivot.rename(columns=rename_dic, inplace=True)

print(crime_occurrence_pivot)

       검거율   발생율          강간          강도          살인         절도         폭력
구별                                                                        
강남구   5732  8617   77.728285   85.714286   76.923077  42.857143  86.484594
강동구   3171  5244   78.846154  133.333333   75.000000  33.347422  82.890855
강북구   3113  4257   82.352941   92.857143  114.285714  43.096234  88.637222
강서구   4190  5585   72.900763  100.000000  114.285714  60.114504  84.752105
관악구   3712  6345   69.062500  116.666667   88.888889  30.561715  80.109157
광진구   3707  5909   91.666667  185.714286  100.000000  42.200925  83.047619
구로구   3502  5646   58.362989   73.333333   75.000000  38.072805  80.877951
금천구   2796  3781   80.794702  100.000000  133.333333  56.668794  86.465433
노원구   3268  5130   61.421320  100.000000  100.000000  36.525308  85.530665
도봉구   1900  2664  103.921569  111.111111  100.000000  44.967074  87.626093
동대문구  3205  4720   84.393064  100.000000  100.000000  41.090358  87.401884
동작구   2397  4074   48.771