# Setting

두 역의 최적화된 거리를 찾습니다.

In [1]:
import pandas as pd
import numpy as np
import folium

station_side = pd.read_csv('./DATA/station_side.csv')

In [2]:
df_count = station_side['st_name'].value_counts().to_frame('transit').reset_index()

In [3]:
station_side = (station_side.
                merge(df_count, how='left', left_on='st_name', right_on='index').
                drop(columns='index'))

In [4]:
station_side.head()

Unnamed: 0,st_name,st_line,st_A,st_B,st_C,transit
0,소요산,1호선,동두천,,,1
1,동두천,1호선,소요산,보산,,1
2,보산,1호선,동두천,동두천중앙,,1
3,동두천중앙,1호선,보산,지행,,1
4,지행,1호선,동두천중앙,덕정,,1


# 동일한 호선에 있을 때

In [5]:
start = '신도림'
finish = '신설동'

## prob_line 함수

In [6]:
def prob_line(df,start,finish):
    st_line = df.loc[df['st_name']==start,'st_line'].unique()
    fn_line = df.loc[df['st_name']==finish,'st_line'].unique()
    output = []
    for i in range(len(st_line)):
        if st_line[i] in fn_line:
            output.append(st_line[i])
    return output

In [7]:
prob_line = prob_line(station_side, start, finish)

## Move 함수

역 이동을 카운트하도록 누적하는 함수입니다.

In [8]:
def move(df,st_name):
    temp = []
    for i in st_name:
        unit = df[df['st_name']==i]
        temp.append(unit.iloc[0]['st_A'])
        temp.append(unit.iloc[0]['st_B'])
        temp.append(unit.iloc[0]['st_C'])
    temp = pd.Series(temp)
    temp = temp[~temp.isnull()].tolist()
    return list(set(temp))

In [9]:
def move_count(df, line, start, finish):
    pool = df[df['st_line']==line]
    st_name = [start]
    count = 0
    if start == finish:
        pass
    else:
        while True:
            st_name = move(pool,st_name)
            count += 1
            if finish in st_name:
                break
    return count

In [135]:
move_count(station_side,'2호선','까치산','신설동')

28

# 환승이 필요할 때

1. 스타트 호선에서 하나를 잡고, 피니시 호선이 하나라도 나올 때까지 이동시킨다.
2. 피니시 호선이 나왔을 때 과정을 포함한다.
3. 여러개의 케이스 중 count 가 가장 낮은 것

만약 1번 이상의 환승이 좋다면? 3번까지 해본다.

### 1번 환승

In [29]:
start = '역곡'
finish = '합정'

In [30]:
st_line = station_side.loc[station_side['st_name']==start,'st_line'].unique()
fn_line = station_side.loc[station_side['st_name']==finish,'st_line'].unique()

In [33]:
fn_line

array(['2호선', '6호선'], dtype=object)

In [42]:
sp,tp,tn = [[],[],[]]
for i in st_line:
    pool = station_side.loc[station_side['st_line']==i,'st_name'].tolist()
    for j in fn_line:
        for k in pool:
            if k in station_side.loc[station_side['st_line']==j,'st_name'].tolist():
                sp.append(i);tp.append(j);tn.append(k)
output = pd.DataFrame({'sp':sp,'tp':tp,'tn':tn})

In [43]:
output

Unnamed: 0,sp,tp,tn
0,1호선,2호선,신설동
1,1호선,2호선,시청
2,1호선,2호선,신도림
3,1호선,6호선,석계
4,1호선,6호선,동묘앞


# Example

## centering 함수

- N명의 좌표가 주어졌을 때, 중점 그룹을 찾아주는 함수입니다.

In [25]:
def centering(geocodes):
    points = []
    if len(geocodes) > 2:
        for i in range(len(geocodes)):
            for j in range(len(geocodes)):
                if i != j:
                    point = {'lat':(geocodes[i]['lat'] + geocodes[j]['lat'])/2,
                             'lng':(geocodes[i]['lng'] + geocodes[j]['lng'])/2}
                    points.append(point)                        
    elif len(geocodes) == 2:
        point = {'lat':(geocodes[0]['lat'] + geocodes[1]['lat'])/2,
                 'lng':(geocodes[0]['lng'] + geocodes[1]['lng'])/2}
        points.append(point)
    else:
        point = {'lat':geocodes[0]['lat'],
                 'lng':geocodes[0]['lng']}
        points.append(point)
    
    # 중복된 데이터 제거
    compare = set()
    output = []
    for point in points:
        unit = tuple(point.items())
        if unit not in compare:
            compare.add(unit)
            output.append(point)
    return(output)

## distance 함수

- 중점 그룹과 서울에 있는 모든 역의 좌표와의 거리 평균을 계산해주는 함수입니다.

In [26]:
def distance(centers,lat,lng):
    distances = []
    for i in range(len(centers)):
        hor = (centers[i]['lat'] - lat)**2
        ver = (centers[i]['lng'] - lng)**2
        distances.append(math.sqrt(hor + ver))
    return np.mean(distances)

## optimize 함수

- Googlemaps를 통해 N명의 좌표를 불러오고, 중점 그룹에서 가까운 역을 거리 순으로 정렬하여 출력하는 함수입니다.

In [27]:
def optimize(location):
    geocodes = []
    for k in range(len(location)):
        result_01 = gmaps.geocode(location[k])[0].get('geometry')['location']
        result_02 = {'lat':float(result_01['lat']),
                     'lng':float(result_01['lng'])}
        geocodes.append(result_02)  
        
    centers = centering(geocodes)
    df['distance'] = df.apply(lambda x: distance(centers=centers,
                                                 lat=x['st_x'],
                                                 lng=x['st_y']), axis=1)
    place = df.sort_values('distance', ascending=True).head(5).reset_index(drop=True)
    return(place)

# 적용 사례

In [28]:
location = ['제이드카운티','청량리역','화곡동']
optimize(location)

NameError: name 'gmaps' is not defined