In [None]:
import pandas as pd

# 파일 경로
file_path = '경찰청_음주운전적발기록_2021.csv'

In [None]:
# 데이터 불러오기
data = pd.read_csv(file_path, encoding='utf-16', sep='\t')

In [None]:
# 경찰서와 군구 매핑 딕셔너리
police_to_gungu = {
    '부산강서경찰서': '강서구',
    '부산금정경찰서': '금정구',
    '부산기장경찰서': '기장군',
    '부산남부경찰서': '남구',
    '부산동부경찰서': '동구',
    '부산동래경찰서': '동래구',
    '부산진경찰서': '부산진구',
    '부산북부경찰서': '북구',
    '부산사상경찰서': '사상구',
    '부산사하경찰서': '사하구',
    '부산서부경찰서': '서구',
    '부산수영경찰서': '수영구',
    '부산연제경찰서': '연제구',
    '부산영도경찰서': '영도구',
    '부산중부경찰서': '중구',
    '부산해운대경찰서': '해운대구'
}

# 관할 경찰서를 군구로 매핑
data['군구'] = data['관할경찰서'].map(police_to_gungu)


In [None]:
# 첫 번째 데이터셋: 연령대별 음주운전 건수

# '나이' 컬럼을 숫자로 변환 (문자열로 저장된 경우 처리)
data['나이'] = pd.to_numeric(data['나이'], errors='coerce')

# 군구별 연령대 데이터셋 생성
data['연령대'] = (data['나이'] // 10 * 10).astype(str) + '대'
age_busan = data.groupby(['군구', '연령대']).size().unstack(fill_value=0)

# 결과 출력
print("군구별 연령대 데이터셋:")
print(age_busan)

군구별 연령대 데이터셋:
연령대   10.0대  120.0대  20.0대  30.0대  40.0대  50.0대  60.0대  70.0대  80.0대
군구                                                                  
강서구       4       1     58     99     97     59     30      8      1
금정구       4       0     80    101     93     87     30      4      0
기장군       2       0     56    106    130    102     40      8      0
남구        9       0    105    115     90     67     37      2      0
동구        0       0     26     37     36     27     10      3      0
동래구       3       1     92    109    100     68     28      5      0
부산진구     11       0    164    125    104     67     34      6      0
북구        3       0     70     48     61     61     25      5      0
사상구       6       0     74     79     81     76     37      6      0
사하구       4       0     73     84     96     86     53      8      1
서구        1       0     12     18     22     23      9      3      0
연제구       0       0     93     92     91     64     29      2      0
영도구       0       0 

In [None]:
# 두 번째 데이터셋: 시간대별 음주운전 건수

# 군구별 시간대 데이터셋 생성
data['측정시간'] = pd.to_datetime(data['측정일시'], errors='coerce').dt.hour
time_busan = data.groupby(['군구', '측정시간']).size().unstack(fill_value=0)

# 결과 출력
print("\n군구별 시간대 데이터셋:")
print(time_busan)


군구별 시간대 데이터셋:
측정시간  0   1   2   3   4   5   6   7   8   9   ...  14  15  16  17  18  19  20  \
군구                                            ...                               
강서구   34  34  13   9  11  11  12   8   8   1  ...   5   0   4   4  10  10  12   
금정구   43  38  37  19  17  20  10   9   3   5  ...   3   8  11  10   5   7  12   
기장군   29  14  19   7  10   7   5   1   4   4  ...   3   7  11   5  11  16  41   
남구    49  32  35  21  24  13  10   6   6   6  ...   3   3   4   5   2  14  13   
동구     7   7  10   5   5   4   4   5   2   0  ...   3   1   2   0   1   5   3   
동래구   27  17  15  11  14   6   6   8   2   0  ...   1   0   1   5   4  12  20   
부산진구  40  40  31  38  24  12  22   7  14   4  ...   4   6   1   6  10  16  16   
북구    24  29  18   5  12   8   2   5   1   6  ...   3   3   2   0  11  16  11   
사상구   45  28  23  13  13   5   5   8   4   3  ...   1   3   9   5  12  15  10   
사하구   42  25  19  26  10   8   5   4   6   2  ...   5   9   5   7   8  12  15   
서구     8   7 

In [None]:
# 세 번째 데이터셋: 요일별 음주운전 건수

# 영어 요일로 변환 후 한글로 매핑
weekday_mapping = {
    'Monday': '월요일',
    'Tuesday': '화요일',
    'Wednesday': '수요일',
    'Thursday': '목요일',
    'Friday': '금요일',
    'Saturday': '토요일',
    'Sunday': '일요일'
}

data['측정요일'] = pd.to_datetime(data['측정일시'], errors='coerce').dt.day_name()
data['측정요일'] = data['측정요일'].map(weekday_mapping)

# 군구별 요일 데이터셋 생성
day_busan = data.groupby(['군구', '측정요일']).size().unstack(fill_value=0).reindex(
    columns=['월요일', '화요일', '수요일', '목요일', '금요일', '토요일', '일요일'], fill_value=0
)

print("\n군구별 요일 데이터셋:")
print(day_busan)




군구별 요일 데이터셋:
측정요일  월요일  화요일  수요일  목요일  금요일  토요일  일요일
군구                                     
강서구    41   48   40   53   64   61   50
금정구    49   61   51   47   49   81   61
기장군    53   61   62   63   77   72   56
남구     47   59   53   58   59   84   65
동구     19   22   24   13   21   23   17
동래구    46   50   67   45   74   77   47
부산진구   63   71   72   70   71   92   72
북구     20   37   45   37   47   51   36
사상구    38   46   47   48   54   72   54
사하구    59   40   67   45   57   66   71
서구     13   11   14   19   14   11    6
연제구    36   51   68   47   61   56   52
영도구    13   25   26   23   28   37   34
중구     11   14   11   10    5   15   13
해운대구   63   65   53   62   82   92   74


In [None]:
# 필요 시 결과 저장
age_busan.to_csv('군구별_연령대_음주운전2021.csv', encoding='utf-8-sig')
time_busan.to_csv('군구별_시간대_음주운전2021.csv', encoding='utf-8-sig')
day_busan.to_csv('군구별_요일_음주운전2021.csv', encoding='utf-8-sig')