In [None]:
import pandas as pd

# 파일 경로
file_path = '경찰청_음주운전_2023.csv'

In [None]:
# 데이터 불러오기
data = pd.read_csv(file_path, encoding='cp949')

In [None]:
# 경찰서와 군구 매핑 딕셔너리
police_to_gungu = {
    '부산강서경찰서': '강서구',
    '부산금정경찰서': '금정구',
    '부산기장경찰서': '기장군',
    '부산남부경찰서': '남구',
    '부산동부경찰서': '동구',
    '부산동래경찰서': '동래구',
    '부산진경찰서': '부산진구',
    '부산북부경찰서': '북구',
    '부산사상경찰서': '사상구',
    '부산사하경찰서': '사하구',
    '부산서부경찰서': '서구',
    '부산수영경찰서': '수영구',
    '부산연제경찰서': '연제구',
    '부산영도경찰서': '영도구',
    '부산중부경찰서': '중구',
    '부산해운대경찰서': '해운대구'
}

# 관할 경찰서를 군구로 매핑
data['군구'] = data['관할경찰서'].map(police_to_gungu)


In [None]:

# 군구별 데이터가 제대로 매핑되었는지 확인
print(data['군구'].isna().sum())  # NaN 값이 있는지 확인

119953


In [None]:
# 첫 번째 데이터셋: 연령대별 음주운전 건수

# '나이' 컬럼을 숫자로 변환 (문자열로 저장된 경우 처리)
data['나이'] = pd.to_numeric(data['나이'], errors='coerce')

# 군구별 연령대 데이터셋 생성
data['연령대'] = (data['나이'] // 10 * 10).astype(str) + '대'
age_busan = data.groupby(['군구', '연령대']).size().unstack(fill_value=0)

# 결과 출력
print("군구별 연령대 데이터셋:")
print(age_busan)

군구별 연령대 데이터셋:
연령대   10.0대  20.0대  30.0대  40.0대  50.0대  60.0대  70.0대  80.0대  nan대
군구                                                                
강서구       1     49    129    112     79     45      5      0     1
금정구       2    102    107    101     93     44      8      1     0
기장군       4     53    127    190     98     52     11      0     0
남구       18    113    136    101     93     37     15      3     0
동구        0     25     39     24     18     13      3      0     0
동래구      12     62     63     82     48     22      6      0     0
부산진구     18    146    140    114     70     37      5      0     0
북구        3     53     61     71     49     38      5      0     0
사상구       2     65    103    112    101     38      9      0     0
사하구       3     57    100     89     74     37      3      0     0
서구        2     31     38     40     35     22      6      0     0
연제구       5     63     85     74     47     25      4      0     0
영도구       1     53     56     49     47     16  

In [None]:
# 두 번째 데이터셋: 시간대별 음주운전 건수

# 군구별 시간대 데이터셋 생성
data['측정시간'] = pd.to_datetime(data['측정일시'], errors='coerce').dt.hour
time_busan = data.groupby(['군구', '측정시간']).size().unstack(fill_value=0)

# 결과 출력
print("\n군구별 시간대 데이터셋:")
print(time_busan)



군구별 시간대 데이터셋:
측정시간  0   1   2   3   4   5   6   7   8   9   ...  14  15  16  17  18  19  20  \
군구                                            ...                               
강서구   34  32  28  16  14  15   6  12  13  10  ...  12   1   5  10   9  13  13   
금정구   42  50  31  29  35  23  24  17  16  15  ...   8   4   6   6  11  11  16   
기장군   30  31  27  15  10  13   9   8   4   3  ...  12   4   2   6   8  10  46   
남구    50  57  41  45  29  27  15  11   7   9  ...  12  11   4   7   8  13  15   
동구    10  12   8   8   6   4   5   4   2   5  ...   4   1   1   4   2   1   7   
동래구   24  35  16  15  24  14  10   5   7   8  ...   8   3   4   5   3   7   9   
부산진구  44  37  51  41  38  31  38  18   6  13  ...   9   7   4   6   7   9  16   
북구    26  27  33  15  10  11   9   8   6   7  ...   8   2   4   6   7   9   8   
사상구   30  31  23   9  13  13   7  14   9   6  ...  10   5  10   8  10   6  17   
사하구   39  31  25  19  23  12  18  17   8   6  ...   6   7   5   7   3  10  17   
서구    11   5 

In [None]:
# 세 번째 데이터셋: 요일별 음주운전 건수

# 영어 요일로 변환 후 한글로 매핑
weekday_mapping = {
    'Monday': '월요일',
    'Tuesday': '화요일',
    'Wednesday': '수요일',
    'Thursday': '목요일',
    'Friday': '금요일',
    'Saturday': '토요일',
    'Sunday': '일요일'
}

data['측정요일'] = pd.to_datetime(data['측정일시'], errors='coerce').dt.day_name()
data['측정요일'] = data['측정요일'].map(weekday_mapping)

# 군구별 요일 데이터셋 생성
day_busan = data.groupby(['군구', '측정요일']).size().unstack(fill_value=0).reindex(
    columns=['월요일', '화요일', '수요일', '목요일', '금요일', '토요일', '일요일'], fill_value=0
)

print("\n군구별 요일 데이터셋:")
print(day_busan)



군구별 요일 데이터셋:
측정요일  월요일  화요일  수요일  목요일  금요일  토요일  일요일
군구                                     
강서구    52   41   71   56   69   69   63
금정구    48   54   56   67   77   82   74
기장군    66   86   82   70   73   94   64
남구     39   48   62   91   75  106   95
동구     14   15   18   15   23   22   15
동래구    21   40   41   49   44   55   45
부산진구   64   63   66   86   86   81   84
북구     28   38   39   49   33   49   44
사상구    50   51   61   63   74   72   59
사하구    45   59   43   51   49   66   50
서구     16   20   17   26   42   29   24
연제구    40   42   44   38   33   53   53
영도구    26   17   27   20   34   56   44
중구      7   15   16   16   14   21   15
해운대구   68   78   72   86   68   77   74


In [None]:
# 필요 시 결과 저장
age_busan.to_csv('군구별_연령대_음주운전2023.csv', encoding='utf-8-sig')
time_busan.to_csv('군구별_시간대_음주운전2023.csv', encoding='utf-8-sig')
day_busan.to_csv('군구별_요일_음주운전2023.csv', encoding='utf-8-sig')