
# 해운대구 빅데이터 공모전 [데이터 분석을 활용한 노인 복지 시설 입지 최적화]
1. 18, 20, 23년 해운대구 인구 현황 데이터 활용 -> 고령 인구 높은 지역 탐색 , 고령화 증감율
2. 사회 복지 시설 위치 데이터 시각화 -> 과밀, 과소 현황 파악
3. 독거 노인 현황 조사

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
# 나눔 폰트 설치
#!sudo apt-get install -y fonts-nanum*
#!sudo fc-cache -fv
#!rm ~/.cache/matplotlib -rf

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# 시각화에서 한글 폰트 설정
plt.rc('font', family='NanumBarunGothic')

In [None]:
def read_csv_with_encodings(file_path, encodings):
    for encoding in encodings:
        try:
            df = pd.read_csv(file_path, encoding=encoding)
            return df
        except UnicodeDecodeError:
            continue
    raise UnicodeDecodeError("해당 인코딩으로 파일을 디코딩할 수 없습니다.")

# 시도할 인코딩 목록
encodings_to_try = ['utf-8', 'cp949', 'euc-kr', 'utf-16']

# 각 파일을 지정된 인코딩으로 읽기
location = read_csv_with_encodings('/content/drive/MyDrive/공모전/해운대/사회복지시설 정보.csv', encodings_to_try)
df_23 = read_csv_with_encodings('/content/drive/MyDrive/공모전/해운대/부산광역시 해운대구_인구현황_20230430 (1).csv', encodings_to_try)
df_20 = read_csv_with_encodings('/content/drive/MyDrive/공모전/해운대/부산광역시_해운대구_인구현황_20200531.csv', encodings_to_try)
df_18 = read_csv_with_encodings('/content/drive/MyDrive/공모전/해운대/부산광역시_해운대구_인구현황_20180531.csv', encodings_to_try)
df_alone = read_csv_with_encodings('/content/drive/MyDrive/공모전/해운대/부산광역시 해운대구_독거노인 현황_20240213.csv', encodings_to_try)


In [None]:
df_23

Unnamed: 0,행정기관명,동명,연령,성별구분,인구수
0,부산광역시 해운대구,우제1동,0세 - 9세,남,596
1,부산광역시 해운대구,우제1동,0세 - 9세,여,640
2,부산광역시 해운대구,우제1동,10세 - 19세,남,820
3,부산광역시 해운대구,우제1동,10세 - 19세,여,773
4,부산광역시 해운대구,우제1동,20세 - 29세,남,1285
...,...,...,...,...,...
427,부산광역시 해운대구,재송제2동,90세 - 99세,여,91
428,부산광역시 해운대구,재송제2동,100세 - 109세,남,1
429,부산광역시 해운대구,재송제2동,100세 - 109세,여,2
430,부산광역시 해운대구,재송제2동,110세 이상,남,0


In [None]:
total_population_by_dong_23 = df_23.groupby("동명")["인구수"].sum()

# 동 별로 60세 이상 인구 수 합계 계산
population_60_and_over_by_dong_23 = df_23[df_23["연령"].str.split('세').str[0].astype(int) >= 60].groupby("동명")["인구수"].sum()
portion_23 = population_60_and_over_by_dong_23/total_population_by_dong_23

print("\n동 별 전체 인구 수 합계:")
print(total_population_by_dong_23)

print("\n동 별 60세 이상 인구 수 합계:")
print(population_60_and_over_by_dong_23)

print("\n동 별 60세 이상 인구 비율:")
print(portion_23)


동 별 전체 인구 수 합계:
동명
반송제1동    13050
반송제2동    22086
반여제1동    34605
반여제2동    12006
반여제3동     8100
반여제4동    15120
송정동       9548
우제1동     22171
우제2동     30155
우제3동     28129
재송제1동    36772
재송제2동    23322
좌제1동     17559
좌제2동     31067
좌제3동     15531
좌제4동     22419
중제1동     27341
중제2동     15354
Name: 인구수, dtype: int64

동 별 60세 이상 인구 수 합계:
동명
반송제1동     5958
반송제2동    10111
반여제1동     8788
반여제2동     4930
반여제3동     3616
반여제4동     4144
송정동       3724
우제1동      6906
우제2동      7663
우제3동      7257
재송제1동     7652
재송제2동     7714
좌제1동      4047
좌제2동      7736
좌제3동      4676
좌제4동      5348
중제1동      6694
중제2동      4359
Name: 인구수, dtype: int64

동 별 60세 이상 인구 비율:
동명
반송제1동    0.456552
반송제2동    0.457801
반여제1동    0.253952
반여제2동    0.410628
반여제3동    0.446420
반여제4동    0.274074
송정동      0.390029
우제1동     0.311488
우제2동     0.254120
우제3동     0.257990
재송제1동    0.208093
재송제2동    0.330761
좌제1동     0.230480
좌제2동     0.249010
좌제3동     0.301075
좌제4동     0.238548
중제1동     0.244834
중제2동     0.283900
Name: 인구수, dtype: floa

In [None]:
total_population_by_dong_20 = df_20.groupby("동명")["인구수"].sum()

# 동 별로 60세 이상 인구 수 합계 계산
population_60_and_over_by_dong_20 = df_20[df_20["연령"].str.split('세').str[0].astype(int) >= 60].groupby("동명")["인구수"].sum()
portion_20 = population_60_and_over_by_dong_20/total_population_by_dong_20


print("\n동 별 60세 이상 인구 비율:")
print(portion_20)


동 별 60세 이상 인구 비율:
동명
반송제1동    0.392669
반송제2동    0.384054
반여제1동    0.217099
반여제2동    0.343015
반여제3동    0.371124
반여제4동    0.216683
송정동      0.328256
우제1동     0.284575
우제2동     0.220254
우제3동     0.222339
재송제1동    0.177422
재송제2동    0.275328
좌제1동     0.188752
좌제2동     0.204740
좌제3동     0.245224
좌제4동     0.197766
중제1동     0.238531
중제2동     0.249274
Name: 인구수, dtype: float64


In [None]:
total_population_by_dong_18 = df_18.groupby("동명")["인구수"].sum()

# 동 별로 60세 이상 인구 수 합계 계산
population_60_and_over_by_dong_18 = df_18[df_18["연령"].str.split('세').str[0].astype(int) >= 60].groupby("동명")["인구수"].sum()
portion_18 = population_60_and_over_by_dong_18/total_population_by_dong_18


print("\n동 별 60세 이상 인구 비율:")
print(portion_18)


동 별 60세 이상 인구 비율:
동명
반송제1동    0.338966
반송제2동    0.334889
반여제1동    0.190225
반여제2동    0.315223
반여제3동    0.314384
반여제4동    0.190821
송정동      0.284840
우제1동     0.277039
우제2동     0.202196
우제3동     0.198095
재송제1동    0.160012
재송제2동    0.232620
좌제1동     0.168317
좌제2동     0.179616
좌제3동     0.210860
좌제4동     0.173272
중제1동     0.221147
중제2동     0.218547
Name: 인구수, dtype: float64


In [None]:
result_df = pd.DataFrame({
    '18년 노령 인구 비율': portion_18,
    '20년 노령 인구 비율': portion_20,
    '23년 노령 인구 비율': portion_23,
    })

In [None]:
result_df
# result_df를 엑셀 파일로 저장
#result_df.to_csv("result.csv")


Unnamed: 0_level_0,18년 노령 인구 비율,20년 노령 인구 비율,23년 노령 인구 비율
동명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
반송제1동,0.338966,0.392669,0.456552
반송제2동,0.334889,0.384054,0.457801
반여제1동,0.190225,0.217099,0.253952
반여제2동,0.315223,0.343015,0.410628
반여제3동,0.314384,0.371124,0.44642
반여제4동,0.190821,0.216683,0.274074
송정동,0.28484,0.328256,0.390029
우제1동,0.277039,0.284575,0.311488
우제2동,0.202196,0.220254,0.25412
우제3동,0.198095,0.222339,0.25799


In [None]:
result_df["20년 증감율"] = (result_df["20년 노령 인구 비율"] - result_df["18년 노령 인구 비율"]) / result_df["18년 노령 인구 비율"]

# 23년 증감율 계산 및 추가
result_df["23년 증감율"] = (result_df["23년 노령 인구 비율"] - result_df["20년 노령 인구 비율"]) / result_df["20년 노령 인구 비율"]

# 결과 출력
result_df

Unnamed: 0_level_0,18년 노령 인구 비율,20년 노령 인구 비율,23년 노령 인구 비율,20년 증감율,23년 증감율
동명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
반송제1동,0.338966,0.392669,0.456552,0.158431,0.162688
반송제2동,0.334889,0.384054,0.457801,0.146812,0.192023
반여제1동,0.190225,0.217099,0.253952,0.141271,0.169753
반여제2동,0.315223,0.343015,0.410628,0.088165,0.197115
반여제3동,0.314384,0.371124,0.44642,0.18048,0.202886
반여제4동,0.190821,0.216683,0.274074,0.135528,0.264863
송정동,0.28484,0.328256,0.390029,0.152425,0.188185
우제1동,0.277039,0.284575,0.311488,0.0272,0.094574
우제2동,0.202196,0.220254,0.25412,0.089308,0.153762
우제3동,0.198095,0.222339,0.25799,0.122385,0.160345


In [None]:
# result_df를 엑셀 파일로 저장
#result_df.to_csv("result.csv", index=True)


In [None]:
location

Unnamed: 0,시설명,주소,전화번호,관리기관,동명,위도,경도,시설구분
0,1318해피존꿈&amp;꾼,"신반송로 138-2, 302호(반송동, 대성빌라)",0515421813,-,-,35.230000,129.161300,지역아동센터
1,영진종합사회복지관,해운대구 반여로165(반여동),5290005,복 지 관,-,35.205740,129.126330,무료경로식당
2,박 애 원,해운대구 해운대로469번길76,7420217,-,-,35.166504,129.143940,아동양육시설
3,성현여성의 집,해운대구 반송로 819,5459272,-,-,35.226723,129.146150,여성복지시설
4,해운대지역자활센터,해운대구 신리1길 84,5430015,-,-,35.229610,129.156575,기타 복지기관
...,...,...,...,...,...,...,...,...
112,신기의료기 해운대점,"재반로104번길 22, 지하층 2호 (재송동, 상록빌라)",-,-,-,35.186877,129.126772,노인복지시설
113,참사랑복지용구,"신반송로 174, 1층 (반송동)",-,-,-,35.228963,129.160852,노인복지시설
114,정담시니어요양원,해운대로469번나길 69,-,-,-,35.167854,129.144992,노인복지시설
115,영진재가노인지원서비스센터,"반여로165, 4층(반여동)",-,-,-,35.205728,129.126359,노인복지시설


In [None]:
!pip install folium



In [None]:
location.columns

Index(['시설명', '주소', '전화번호', '관리기관', '동명', '위도 ', '경도', '시설구분'], dtype='object')

In [None]:
import folium
Gwangalli=[35.1542634, 129.1204897]

map_busan = folium.Map(location = Gwangalli, zoom_start = 11)

for i in range(len(location)):
    name = location['시설명']
    long = float(location['위도 '][i])
    lat = float(location['경도'][i])
    folium.CircleMarker((long,lat), color='red', popup=name).add_to(map_busan)

map_busan

In [None]:
df_alone
mapping = {
    '반송1동': '반송제1동',
    '반송2동': '반송제2동',
    '반여1동': '반여제1동',
    '반여2동': '반여제2동',
    '반여3동': '반여제3동',
    '반여4동': '반여제4동',
    '재송1동': '재송제1동',
    '재송2동': '재송제2동',
    '좌1동': '좌제1동',
    '좌2동': '좌제2동',
    '좌3동': '좌제3동',
    '좌4동': '좌제4동',
    '중1동': '중제1동',
    '중2동': '중제2동',
    '우1동': '우제1동',
    '우2동': '우제2동',
    '우3동': '우제3동',
}
df_alone['행정동명'] = df_alone['행정동명'].replace(mapping)
df_alone.rename(columns={'행정동명': '동명'}, inplace=True)

In [None]:
alone_dong_totals = df_alone.groupby('동명')['합계(명)'].sum()
print(alone_dong_totals)

동명
반송제1동    1951
반송제2동    3257
반여제1동    1291
반여제2동    1494
반여제3동    1028
반여제4동     471
송정동       813
우제1동     1291
우제2동     1028
우제3동      818
재송제1동    1043
재송제2동    1599
좌제1동      689
좌제2동     1104
좌제3동      826
좌제4동      720
중제1동     1102
중제2동      816
Name: 합계(명), dtype: int64


In [None]:
result_df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 18 entries, 반송제1동 to 중제2동
Data columns (total 5 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   18년 노령 인구 비율  18 non-null     float64
 1   20년 노령 인구 비율  18 non-null     float64
 2   23년 노령 인구 비율  18 non-null     float64
 3   20년 증감율       18 non-null     float64
 4   23년 증감율       18 non-null     float64
dtypes: float64(5)
memory usage: 864.0+ bytes


In [None]:
# Check the lengths of the Series and DataFrame
print("Length of alone_dong_totals:", len(alone_dong_totals))
print("Length of population_60_and_over_by_dong_23:", len(population_60_and_over_by_dong_23))
print("Length of total_population_by_dong_23:", len(total_population_by_dong_23))

# Make sure the lengths match before assigning columns to the DataFrame


Length of alone_dong_totals: 18
Length of population_60_and_over_by_dong_23: 18
Length of total_population_by_dong_23: 18


In [None]:
aloneToOver60_Ratio = alone_dong_totals / population_60_and_over_by_dong_23
aloneToTotal_Ratio = alone_dong_totals / total_population_by_dong_23

result_df['aloneToOver60_Ratio'] = aloneToOver60_Ratio
result_df['aloneToTotal_Ratio'] = aloneToTotal_Ratio

In [None]:
result_df

Unnamed: 0_level_0,18년 노령 인구 비율,20년 노령 인구 비율,23년 노령 인구 비율,20년 증감율,23년 증감율,aloneToOver60_Ratio,aloneToTotal_Ratio
동명,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
반송제1동,0.338966,0.392669,0.456552,0.158431,0.162688,0.327459,0.149502
반송제2동,0.334889,0.384054,0.457801,0.146812,0.192023,0.322124,0.147469
반여제1동,0.190225,0.217099,0.253952,0.141271,0.169753,0.146905,0.037307
반여제2동,0.315223,0.343015,0.410628,0.088165,0.197115,0.303043,0.124438
반여제3동,0.314384,0.371124,0.44642,0.18048,0.202886,0.284292,0.126914
반여제4동,0.190821,0.216683,0.274074,0.135528,0.264863,0.113658,0.031151
송정동,0.28484,0.328256,0.390029,0.152425,0.188185,0.218314,0.085149
우제1동,0.277039,0.284575,0.311488,0.0272,0.094574,0.186939,0.058229
우제2동,0.202196,0.220254,0.25412,0.089308,0.153762,0.134151,0.034091
우제3동,0.198095,0.222339,0.25799,0.122385,0.160345,0.112719,0.02908


In [None]:
# result_df를 엑셀 파일로 저장
#result_df.to_csv("result_fin.csv")