## 1인 당 범죄 발생수

In [41]:
import pandas as pd

In [42]:
# 서울시 범죄 데이터 CSV 파일 읽기
crime_file_path = '../data/crime.csv'
crime_df = pd.read_csv(crime_file_path, encoding='utf-8') 

In [43]:
# 전국 인구 데이터 CSV 파일 읽기
population_file_path = '../data/population.csv'
population_df = pd.read_csv(population_file_path, encoding='euc-kr') 

In [44]:
# 범죄 데이터 필요없는 값들 행 제거
crime_df = crime_df.iloc[4:]

# 범죄 유형 별 발생 수 정리
safe_df = pd.DataFrame({
    '자치구': crime_df.iloc[:,1],
    '합계': crime_df.iloc[:,2],
    '살인': crime_df.iloc[:,4],
    '강도': crime_df.iloc[:,6],
    '강간': crime_df.iloc[:,8],
    '절도': crime_df.iloc[:,10],
    '폭력': crime_df.iloc[:,12],
})

print(safe_df)

     자치구    합계  살인  강도   강간    절도    폭력
4    종로구  3138   2   8  228  1313  1587
5     중구  3071   1   5  194  1365  1506
6    용산구  2967   5   7  280   978  1697
7    성동구  2194   2   2  125   979  1086
8    광진구  3619   6   -  230  1670  1713
9   동대문구  3253   4   2  125  1556  1566
10   중랑구  3599   2   2  150  1508  1937
11   성북구  2749   3   1  158  1143  1444
12   강북구  2832   5   5  177   872  1773
13   도봉구  2141   3   -   70   969  1099
14   노원구  3896   3   3  180  1504  2206
15   은평구  3487   4   5  176  1497  1805
16  서대문구  2374   5   6  157  1114  1092
17   마포구  4096   2   2  436  1451  2205
18   양천구  3169   2   3  114  1474  1576
19   강서구  4663   3   7  261  1991  2401
20   구로구  3857  11   8  217  1565  2056
21   금천구  2577   2   3  127  1118  1327
22  영등포구  4819   5  10  327  2062  2415
23   동작구  2735   2   5  212  1195  1321
24   관악구  4879  10   9  327  1966  2567
25   서초구  4459   3   3  431  1921  2101
26   강남구  6947  12  11  667  2495  3762
27   송파구  5167   2   5  290  2201  2669


In [45]:
# 인구 데이터 서울특별시만 추출
population_df = population_df[(population_df['시도명'] == '서울특별시')]

# 자치구 별 인구 합 데이터 프레임으로
filtered_population_df = population_df.groupby('시군구명')['계'].sum().reset_index()

filtered_population_df = filtered_population_df.rename(columns={'시군구명': '자치구', '계': '인구'})

print(filtered_population_df)

     자치구      인구
0    강남구  544873
1    강동구  459167
2    강북구  288113
3    강서구  563058
4    관악구  481956
5    광진구  335554
6    구로구  392405
7    금천구  227481
8    노원구  498213
9    도봉구  306948
10  동대문구  341149
11   동작구  378769
12   마포구  363697
13  서대문구  306231
14   서초구  407664
15   성동구  277361
16   성북구  425602
17   송파구  654166
18   양천구  436028
19  영등포구  374794
20   용산구  213151
21   은평구  466770
22   종로구  139417
23    중구  121312
24   중랑구  382155


In [46]:
# 동별 인구 데이터와 공원 면적 데이터 인구 데이터 기준 병합
merged_df = pd.merge(safe_df, filtered_population_df, on='자치구')

# 1인 당 범죄 발생수 계산
merged_df['1인 당 범죄 발생수'] = pd.to_numeric(merged_df['합계']) / merged_df['인구']

# 1인 당 범죄 발생수 내림차순 정렬
merged_df.sort_values('1인 당 범죄 발생수', ascending=False)

print(merged_df)

     자치구    합계  살인  강도   강간    절도    폭력      인구  1인 당 범죄 발생수
0    종로구  3138   2   8  228  1313  1587  139417     0.022508
1     중구  3071   1   5  194  1365  1506  121312     0.025315
2    용산구  2967   5   7  280   978  1697  213151     0.013920
3    성동구  2194   2   2  125   979  1086  277361     0.007910
4    광진구  3619   6   -  230  1670  1713  335554     0.010785
5   동대문구  3253   4   2  125  1556  1566  341149     0.009535
6    중랑구  3599   2   2  150  1508  1937  382155     0.009418
7    성북구  2749   3   1  158  1143  1444  425602     0.006459
8    강북구  2832   5   5  177   872  1773  288113     0.009829
9    도봉구  2141   3   -   70   969  1099  306948     0.006975
10   노원구  3896   3   3  180  1504  2206  498213     0.007820
11   은평구  3487   4   5  176  1497  1805  466770     0.007470
12  서대문구  2374   5   6  157  1114  1092  306231     0.007752
13   마포구  4096   2   2  436  1451  2205  363697     0.011262
14   양천구  3169   2   3  114  1474  1576  436028     0.007268
15   강서구  4663   3   7  

In [47]:
# 최종 결과 데이터 프레임 저장
output_file_path = '../data/safe_result.csv'
merged_df.to_csv(output_file_path, encoding='utf-8')