# 입지별 최종 점수 산출 및 최적입지 도출

### 1. 데이터 불러오기

In [1]:
import pandas as pd

In [2]:
df = pd.read_csv('./output/최종minmax_2.csv', encoding = 'cp949')
df.head(1)

Unnamed: 0,ARS-ID,정류소명,좌표X,좌표Y,승하차평균,gid,구,동,RN,거주인구,유아인구,고령인구,수급자밀도,생활인구밀,범죄밀도,유흥업소개,최한월평균,최난월평균,초미세먼지,재비산먼지
0,23105,압구정역4번출구,127.028349,37.526151,0.185023,다사58a47b,강남구,압구정동,논현로,0.259809,0.139985,0.32675,0.008464,0.306676,0.361064,0.017094,0.674553,0.633756,0.285605,0.099437


In [3]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10578 entries, 0 to 10577
Data columns (total 20 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   ARS-ID  10578 non-null  int64  
 1   정류소명    10578 non-null  object 
 2   좌표X     10578 non-null  float64
 3   좌표Y     10578 non-null  float64
 4   승하차평균   10578 non-null  float64
 5   gid     10578 non-null  object 
 6   구       10578 non-null  object 
 7   동       10578 non-null  object 
 8   RN      10557 non-null  object 
 9   거주인구    10578 non-null  float64
 10  유아인구    10578 non-null  float64
 11  고령인구    10578 non-null  float64
 12  수급자밀도   10578 non-null  float64
 13  생활인구밀   10578 non-null  float64
 14  범죄밀도    10578 non-null  float64
 15  유흥업소개   10578 non-null  float64
 16  최한월평균   10578 non-null  float64
 17  최난월평균   10578 non-null  float64
 18  초미세먼지   10578 non-null  float64
 19  재비산먼지   10578 non-null  float64
dtypes: float64(14), int64(1), object(5)
memory usage: 1.6+ MB


### 2. 데이터 정리

In [4]:
cols = df.columns.tolist()
print(cols)

['ARS-ID', '정류소명', '좌표X', '좌표Y', '승하차평균', 'gid', '구', '동', 'RN', '거주인구', '유아인구', '고령인구', '수급자밀도', '생활인구밀', '범죄밀도', '유흥업소개', '최한월평균', '최난월평균', '초미세먼지', '재비산먼지']


In [5]:
#열 재정렬
df = df[['ARS-ID', '정류소명', '좌표X', '좌표Y', 'gid', '구', '동', 'RN',
         '거주인구', '생활인구밀', '승하차평균', '유아인구', '고령인구', '수급자밀도', 
         '범죄밀도', '유흥업소개', '최한월평균', '최난월평균', '초미세먼지', '재비산먼지']]

In [6]:
df.head(1)

Unnamed: 0,ARS-ID,정류소명,좌표X,좌표Y,gid,구,동,RN,거주인구,생활인구밀,승하차평균,유아인구,고령인구,수급자밀도,범죄밀도,유흥업소개,최한월평균,최난월평균,초미세먼지,재비산먼지
0,23105,압구정역4번출구,127.028349,37.526151,다사58a47b,강남구,압구정동,논현로,0.259809,0.306676,0.185023,0.139985,0.32675,0.008464,0.361064,0.017094,0.674553,0.633756,0.285605,0.099437


In [7]:
df.set_index(['ARS-ID', '정류소명', '좌표X', '좌표Y', 'gid', '구', '동', 'RN'], inplace=True)
df.columns = ['거주인구', '생활인구밀도', '평균승하차인원', '유아인구', '고령인구', '수급자밀도', 
              '범죄밀도', '유흥업소개수', '최한월평균기온', '최난월평균기온', '초미세먼지평균농도', '재비산먼지평균농도']

df.head(1)

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,Unnamed: 4_level_0,Unnamed: 5_level_0,Unnamed: 6_level_0,Unnamed: 7_level_0,거주인구,생활인구밀도,평균승하차인원,유아인구,고령인구,수급자밀도,범죄밀도,유흥업소개수,최한월평균기온,최난월평균기온,초미세먼지평균농도,재비산먼지평균농도
ARS-ID,정류소명,좌표X,좌표Y,gid,구,동,RN,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
23105,압구정역4번출구,127.028349,37.526151,다사58a47b,강남구,압구정동,논현로,0.259809,0.306676,0.185023,0.139985,0.32675,0.008464,0.361064,0.017094,0.674553,0.633756,0.285605,0.099437


### 3. 가중치 부여  
AHP분석에 따른 가중치

In [8]:
w_거주인구           = 0.282
w_생활인구밀도       = 0.438
w_평균승하차인원     = 0.780

w_유아인구           = 0.156
w_고령인구           = 0.672
w_수급자밀도         = 0.672

w_범죄밀도           = 0.093
w_유흥업소개수       = 0.061

w_최한월평균기온     = 0.263
w_최난월평균기온     = 0.316

w_초미세먼지평균농도 = 0.147
w_재비산먼지평균농도 = 0.120

In [10]:
점수칼럼 = df.columns.tolist()
가중치 = [w_거주인구, w_생활인구밀도, w_평균승하차인원, w_유아인구, w_고령인구, w_수급자밀도, w_범죄밀도, w_유흥업소개수,
          w_최한월평균기온, w_최난월평균기온, w_초미세먼지평균농도, w_재비산먼지평균농도]
    
print('가중치를 부여할 칼럼: ', 점수칼럼)
print('---------------------------------------------------------------------------------------------------------------------------------------')
print('칼럼별 가중치: ', 가중치)

가중치를 부여할 칼럼:  ['거주인구', '생활인구밀도', '평균승하차인원', '유아인구', '고령인구', '수급자밀도', '범죄밀도', '유흥업소개수', '최한월평균기온', '최난월평균기온', '초미세먼지평균농도', '재비산먼지평균농도']
---------------------------------------------------------------------------------------------------------------------------------------
칼럼별 가중치:  [0.282, 0.438, 0.78, 0.156, 0.672, 0.672, 0.093, 0.061, 0.263, 0.316, 0.147, 0.12]


In [11]:
df_sum = df.copy()

### 4. 점수계산

In [12]:
for i in range(len(점수칼럼)):
    col = 점수칼럼[i]
    df_sum[col] = df_sum[col] * 가중치[i]
    
df_sum['합계'] = df_sum[점수칼럼].sum(1)
df_sum.reset_index(inplace=True)

df_sum.head(2)

Unnamed: 0,ARS-ID,정류소명,좌표X,좌표Y,gid,구,동,RN,거주인구,생활인구밀도,...,유아인구,고령인구,수급자밀도,범죄밀도,유흥업소개수,최한월평균기온,최난월평균기온,초미세먼지평균농도,재비산먼지평균농도,합계
0,23105,압구정역4번출구,127.028349,37.526151,다사58a47b,강남구,압구정동,논현로,0.073266,0.134324,...,0.021838,0.219576,0.005688,0.033579,0.001043,0.177408,0.200267,0.041984,0.011932,1.065222
1,23429,압구정역3번출구,127.028499,37.52601,다사58a47b,강남구,압구정동,논현로,0.073266,0.134324,...,0.021838,0.219576,0.005688,0.033579,0.001043,0.177408,0.200267,0.041984,0.011932,1.048473


In [13]:
# 최적입지 순위 산정
df_sum['순위'] = df_sum['합계'].rank(method='dense', ascending=False).astype(int)
df_sum.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10578 entries, 0 to 10577
Data columns (total 22 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   ARS-ID     10578 non-null  int64  
 1   정류소명       10578 non-null  object 
 2   좌표X        10578 non-null  float64
 3   좌표Y        10578 non-null  float64
 4   gid        10578 non-null  object 
 5   구          10578 non-null  object 
 6   동          10578 non-null  object 
 7   RN         10557 non-null  object 
 8   거주인구       10578 non-null  float64
 9   생활인구밀도     10578 non-null  float64
 10  평균승하차인원    10578 non-null  float64
 11  유아인구       10578 non-null  float64
 12  고령인구       10578 non-null  float64
 13  수급자밀도      10578 non-null  float64
 14  범죄밀도       10578 non-null  float64
 15  유흥업소개수     10578 non-null  float64
 16  최한월평균기온    10578 non-null  float64
 17  최난월평균기온    10578 non-null  float64
 18  초미세먼지평균농도  10578 non-null  float64
 19  재비산먼지평균농도  10578 non-null  float64
 20  합계    

In [14]:
final = df_sum.sort_values(by='순위')
final.reset_index(drop=True, inplace=True)

In [16]:
# 최종 결과 저장
final.to_csv('결과_총점_최종.csv', index=False, sep=',', encoding='cp949')

이후 조건을 만족하지 않는 보도데이터 제거 및 반경 500m 중복 버스정류장 제거 작업 후 분석 마무리

### 5. 결과확인

In [19]:
final.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10578 entries, 0 to 10577
Data columns (total 22 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   ARS-ID     10578 non-null  int64  
 1   정류소명       10578 non-null  object 
 2   좌표X        10578 non-null  float64
 3   좌표Y        10578 non-null  float64
 4   gid        10578 non-null  object 
 5   구          10578 non-null  object 
 6   동          10578 non-null  object 
 7   RN         10557 non-null  object 
 8   거주인구       10578 non-null  float64
 9   생활인구밀도     10578 non-null  float64
 10  평균승하차인원    10578 non-null  float64
 11  유아인구       10578 non-null  float64
 12  고령인구       10578 non-null  float64
 13  수급자밀도      10578 non-null  float64
 14  범죄밀도       10578 non-null  float64
 15  유흥업소개수     10578 non-null  float64
 16  최한월평균기온    10578 non-null  float64
 17  최난월평균기온    10578 non-null  float64
 18  초미세먼지평균농도  10578 non-null  float64
 19  재비산먼지평균농도  10578 non-null  float64
 20  합계    

In [15]:
final.head(4)

Unnamed: 0,ARS-ID,정류소명,좌표X,좌표Y,gid,구,동,RN,거주인구,생활인구밀도,...,고령인구,수급자밀도,범죄밀도,유흥업소개수,최한월평균기온,최난월평균기온,초미세먼지평균농도,재비산먼지평균농도,합계,순위
0,16221,서울호서전문학교.등촌주공3단지아파트,126.839516,37.562742,다사41b51b,강서구,등촌3동,강서로,0.136862,0.404678,...,0.399531,0.672,0.003263,0.002607,0.165214,0.174403,0.049203,0.022341,2.105748,1
1,16222,서울호서전문학교.등촌주공3단지아파트,126.839684,37.562758,다사41b51b,강서구,등촌3동,강서로,0.136862,0.404678,...,0.399531,0.672,0.003263,0.002607,0.165214,0.174403,0.049203,0.022341,2.089522,2
2,16296,등촌동부영아파트,126.843105,37.562607,다사41b51b,강서구,등촌3동,강서로,0.136862,0.404678,...,0.399531,0.672,0.003263,0.002607,0.165214,0.174403,0.049203,0.022341,2.074893,3
3,16295,등촌3동주공4단지아파트,126.843066,37.562497,다사41b51b,강서구,등촌3동,강서로,0.136862,0.404678,...,0.399531,0.672,0.003263,0.002607,0.165214,0.174403,0.049203,0.022341,2.072853,4


In [17]:
지도보기갯수 = 20

In [18]:
# 지도로 보여주기
import folium
for i in range(지도보기갯수):
    지도보기 = folium.Map(location=[final.loc[i,'좌표Y'],final.loc[i,'좌표X']], zoom_start = 15)
    folium.Marker([final.loc[i,'좌표Y'],final.loc[i,'좌표X']]).add_to(지도보기)
    print (final.loc[i,'좌표Y'],final.loc[i,'좌표X'])
    j = i+1
    display(f'상위 {j}번째 격자의 센터 위치 보기', 지도보기)

37.5627419748 126.8395162715


'상위 1번째 격자의 센터 위치 보기'

37.5627583789 126.8396842423


'상위 2번째 격자의 센터 위치 보기'

37.5626073253 126.8431050679


'상위 3번째 격자의 센터 위치 보기'

37.5624969962 126.8430663655


'상위 4번째 격자의 센터 위치 보기'

37.565476 126.840394


'상위 5번째 격자의 센터 위치 보기'

37.5648622129 126.8403633158


'상위 6번째 격자의 센터 위치 보기'

37.6128969541 127.0302404179


'상위 7번째 격자의 센터 위치 보기'

37.6457948167 127.0648650883


'상위 8번째 격자의 센터 위치 보기'

37.6438971185 127.0645691655


'상위 9번째 격자의 센터 위치 보기'

37.6460258156 127.06377737


'상위 10번째 격자의 센터 위치 보기'

37.565001071 126.847859358


'상위 11번째 격자의 센터 위치 보기'

37.564497085 126.8484744595


'상위 12번째 격자의 센터 위치 보기'

37.6460466232 127.0654180083


'상위 13번째 격자의 센터 위치 보기'

37.6375218186 127.0251835464


'상위 14번째 격자의 센터 위치 보기'

37.5617579634 126.8455711338


'상위 15번째 격자의 센터 위치 보기'

37.5622911678 126.8473823577


'상위 16번째 격자의 센터 위치 보기'

37.562006839 126.8473221266


'상위 17번째 격자의 센터 위치 보기'

37.5893269191 127.0083640454


'상위 18번째 격자의 센터 위치 보기'

37.5616607856 126.8454863202


'상위 19번째 격자의 센터 위치 보기'

37.5615325673 126.8486513967


'상위 20번째 격자의 센터 위치 보기'