## Problem

Input : 
- จุดเริ่มต้น : ในที่นี้ให้เป็น A
- งาน(ต้นทาง-ปลายทาง) + จำนวนของแต่ละงาน : จากข้างล่างคือ table tasks
- ระยะทางระหว่างจุดทั้งหมด : ตัวแปร distances

Output : 
- หาทุกทางที่ทำให้งานจบ
- ทุกทางยาวเท่าไหร่
- บอกด้วยว่าจากระยะทางทั้งหมด แบ่งเป็นระยะทางมีของและไม่มีของอย่างละเท่าไหร่
- เอาทางที่ระยะทางซ้ำกันออก

Import Library

In [1]:
import numpy as np
import pandas as pd

### Input

In [2]:
start_point = np.array([['A']])
distances = np.load('data/distances.npy')
tasks = pd.read_csv('data/tasks.csv')
tasks['path'] = tasks['start'] +'-'+ tasks['end']
node_names = np.load('data/node_name.npy')

In [3]:
start_point

array([['A']], dtype='<U1')

In [4]:
distances

array([[  0,  65,   7,  46, 284],
       [ 65,   0,  88,  67,  86],
       [  7,  88,   0, 121, 294],
       [ 46,  67, 121,   0, 194],
       [284,  86, 294, 194,   0]])

In [5]:
tasks

Unnamed: 0,counts,start,end,path
0,2,A,B,A-B
1,1,A,C,A-C
2,1,A,E,A-E
3,1,C,B,C-B
4,2,C,D,C-D


In [6]:
node_names # ชื่อของ node ทั้งหมด เอาไว้ map กับ matrix distance

array(['A', 'B', 'C', 'D', 'E'], dtype='<U1')

# Solve

#### Idea
- ถ้าอยู่จุดรับ(มีของ) คิดว่ามีงานไรที่เริ่มจากจุดเราบ้าง (จากตาราง tasks ถ้าเราอยู่จุด A เราจะไปได้ 3 จุดคือ B, C, E)
- อยู่จุดส่ง(ว่าง) มองหาจุดรับ (ถ้าอยู่ที่ B ก็ต้องกลับไปไม่ A ก็ C เพื่อรับของไปส่งใหม่)
- ทำซ้ำไปเรื่อยๆ จนงานหมด

จาก idea พบว่าน่าจะมี function สำหรับแต่ละงานดังนี้
1. จาก table tasks ถ้าใส่ path ปัจจุบันเข้าไปแล้วบอกว่าตอนนี้เหลือ task อะไรบ้าง เช่น [A-B,B-A,A-C,C-X] อาจบอกว่าเหลือ 2 task คือ A-E กับ C-D
2. กรณีที่งานยังไม่หมด check ว่าที่ตัวเองอยู่เป็นจุดรับหรือส่ง แล้วบอกว่าจะไปจุดไหนต่อจากจุดนี้
    - ถ้าอยู่ส่ง ควรไปจุดรับ
    - ถ้าอยู่จุดรับ(หรือจุดที่ไม่ใช่จุดส่ง) ควรกลับไปจุดส่ง
3. ฟังก์ชั่นสร้าง matrix ของงานทั้งหมดที่เป็นไปได้ใน step ถัดไป จาก งานที่ทำไปแล้ว(row หนึ่ง) และ task ที่เหลือ(เอา row ยัดใส่ 1.)
4. ทำซ้ำเรื่อยๆ จน column สุดท้ายเป็น '0' หมด
5. คำนวณระยะทางของแต่ละเส้นทางจากตัวแปร distance
    - แบ่งเป็นระยะทางที่ + และ - 
    - ลบ path ที่ให้ผลเหมือนกันออก

In [8]:
# 1. for each path - check how much the job done.
def checkRemainingTasks(job_done, tasks):
    remaining_tasks = tasks.copy()
    active_path = tasks['path'].values
    
    # สนเฉพาะ job ที่อยู่ใน tasks
    job_done = job_done[np.isin(job_done, active_path)] 
    
    for job in job_done:
        if len(remaining_tasks) > 0:
            remaining_tasks.loc[remaining_tasks['path'] == job, 'counts'] = remaining_tasks[remaining_tasks['path'] == job]['counts'] - 1
            remaining_tasks = remaining_tasks[remaining_tasks['counts'] != 0]
            
    # return task ที่ job ยังไม่ได้ทำ ถ้าทำหมดแล้วจะ return table เปล่า
    return remaining_tasks

# 2.
def startOrEnd(current_position,rm_task):
    start_set = rm_tasks['start'].unique()

    # ถ้าอยู่ในกลุ่ม start ต้องไปจุด end ของ position ที่เราอยู่
    if current_position in start_set:
        return rm_task[rm_task['start'] == current_position]['end'].values
    # ถ้าไม่อยู่ทั้งคู่ไปจุด start
    else:
        return start_set

# 3.
def nextJobsMatrix(job_done,next_nodes):
    current_position = job_done[-1].split('-')[-1]
    next_jobs = current_position + '-' + next_nodes
    
    output = np.empty((0,len(job_done) + 1), str) if len(job_done[0]) > 1 else np.empty((0,1), str)

    for next_job in next_jobs:
        if len(job_done[0]) > 1:
            next_job_done = np.append(job_done,next_job)
            output = np.vstack((output, next_job_done))
        else:
            output = np.vstack((output, next_job))
    return output

# 4.
def allTasksPath(before_path,tasks):
    output = np.empty((0,before_path.shape[1] + 1), str) if len(before_path[0,0]) > 1 else np.empty((0,1), str)
    
    for each_row in before_path:
        remaining_jobs = checkRemainingTasks(each_row,tasks)
        if len(remaining_jobs) == 0:
            job_matrix = np.append(each_row,'0')
        else:
            current_position = each_row[-1].split('-')[-1]
            next_nodes = startOrEnd(current_position,remaining_jobs)
            job_matrix = nextJobsMatrix(each_row,next_nodes)
        output = np.vstack((output, job_matrix))

    last_column = output[:,-1]
    all_zero = sum(last_column == '0')
    print('Output :')
    print(output)
    if all_zero == len(last_column):
        return output
    else:
        return allTasksPath(output,tasks)

#### ทดสอบ

ตอนอยู่ A ที่จุดแรกเลย

In [9]:
start_point

array([['A']], dtype='<U1')

In [10]:
current_position = start_point[0][-1].split('-')[-1]
current_position

'A'

In [11]:
rm_tasks = checkRemainingTasks(start_point,tasks)
rm_tasks

Unnamed: 0,counts,start,end,path
0,2,A,B,A-B
1,1,A,C,A-C
2,1,A,E,A-E
3,1,C,B,C-B
4,2,C,D,C-D


อยู่ที่จุดเริ่ม งานที่เหลือเท่ากับงานทั้งหมด

In [12]:
next_nodes = startOrEnd(current_position,rm_tasks)
next_nodes

array(['B', 'C', 'E'], dtype=object)

จากจุด A ผลออกมาว่าควรไป B,C,E 

In [13]:
next_jobs = current_position + '-' + next_nodes
next_jobs

array(['A-B', 'A-C', 'A-E'], dtype=object)

ทำให้อยู่ใน format Start-End

ลองทำเป็น recursive function stack matrix ซ้อนกันเรื่อยๆ จะได้

In [14]:
all_paths = allTasksPath(start_point,tasks)

Output :
[['A-B']
 ['A-C']
 ['A-E']]
Output :
[['A-B' 'B-A']
 ['A-B' 'B-C']
 ['A-C' 'C-B']
 ['A-C' 'C-D']
 ['A-E' 'E-A']
 ['A-E' 'E-C']]
Output :
[['A-B' 'B-A' 'A-B']
 ['A-B' 'B-A' 'A-C']
 ['A-B' 'B-A' 'A-E']
 ['A-B' 'B-C' 'C-B']
 ['A-B' 'B-C' 'C-D']
 ['A-C' 'C-B' 'B-A']
 ['A-C' 'C-B' 'B-C']
 ['A-C' 'C-D' 'D-A']
 ['A-C' 'C-D' 'D-C']
 ['A-E' 'E-A' 'A-B']
 ['A-E' 'E-A' 'A-C']
 ['A-E' 'E-C' 'C-B']
 ['A-E' 'E-C' 'C-D']]
Output :
[['A-B' 'B-A' 'A-B' 'B-A']
 ['A-B' 'B-A' 'A-B' 'B-C']
 ['A-B' 'B-A' 'A-C' 'C-B']
 ['A-B' 'B-A' 'A-C' 'C-D']
 ['A-B' 'B-A' 'A-E' 'E-A']
 ['A-B' 'B-A' 'A-E' 'E-C']
 ['A-B' 'B-C' 'C-B' 'B-A']
 ['A-B' 'B-C' 'C-B' 'B-C']
 ['A-B' 'B-C' 'C-D' 'D-A']
 ['A-B' 'B-C' 'C-D' 'D-C']
 ['A-C' 'C-B' 'B-A' 'A-B']
 ['A-C' 'C-B' 'B-A' 'A-E']
 ['A-C' 'C-B' 'B-C' 'C-D']
 ['A-C' 'C-D' 'D-A' 'A-B']
 ['A-C' 'C-D' 'D-A' 'A-E']
 ['A-C' 'C-D' 'D-C' 'C-B']
 ['A-C' 'C-D' 'D-C' 'C-D']
 ['A-E' 'E-A' 'A-B' 'B-A']
 ['A-E' 'E-A' 'A-B' 'B-C']
 ['A-E' 'E-A' 'A-C' 'C-B']
 ['A-E' 'E-A' 'A-C' 'C-D']
 ['A

ลองเชคคำตอบ

In [15]:
all_paths.shape

(450, 14)

มีท้งหมด 450 วิธีที่ต่างกัน และจำนวนครั้งสูงสุดในการเดินงานคือ 13 (columns สุดท้ายเป็น 0 ไม่นับ)

ลอง print ดู ถ้า 0 คือเสร็จแล้ว ไม่นับ

In [16]:
np.set_printoptions(threshold=np.nan,linewidth=200)
all_paths

array([['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-B', 'B-A', 'A-E', 'E-C', 'C-D', 'D-C', 'C-D', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-E', 'E-C', 'C-D', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-B', 'B-C', 'C-D', 'D-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-A', 'A-E', 'E-C', 'C-B', 'B-C', 'C-D', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-A', 'A-E', 'E-C', 'C-D', 'D-C', 'C-B', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-C', 'C-B', 'B-A', 'A-E', 'E-C', 'C-D', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-C', 'C-D', 'D-A', 'A-E', 'E-C', 'C-B', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-C', 'C-D', 'D-C', 'C-B', 'B-A', 'A-E', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-A', 'A-E', 'E-A', 'A-C', 'C-B', 'B-C', 'C

ดูด้วยตาจากข้างบนคือ วิ่งน้อยสุด 12 งาน มากสุด 13 งาน

สุ่มทดสองสัก tasks ดูว่างานหมดจริงไหม

In [17]:
all_paths[309]

array(['A-C', 'C-D', 'D-C', 'C-B', 'B-A', 'A-B', 'B-A', 'A-E', 'E-C', 'C-D', 'D-A', 'A-B', '0', '0'], dtype='<U3')

In [18]:
checkRemainingTasks(all_paths[309], tasks)

Unnamed: 0,counts,start,end,path


งานหมดจริง

## Output : 
- ~~หาทุกทางที่ทำให้งานจบ~~
- ทุกทางยาวเท่าไหร่
- บอกด้วยว่าจากระยะทางทั้งหมด แบ่งเป็นระยะทางมีของและไม่มีของอย่างละเท่าไหร่
- เอาทางที่ระยะทางซ้ำกันออก

คำนวณ distances

In [19]:
distances

array([[  0,  65,   7,  46, 284],
       [ 65,   0,  88,  67,  86],
       [  7,  88,   0, 121, 294],
       [ 46,  67, 121,   0, 194],
       [284,  86, 294, 194,   0]])

In [20]:
node_names

array(['A', 'B', 'C', 'D', 'E'], dtype='<U1')

In [21]:
tasks

Unnamed: 0,counts,start,end,path
0,2,A,B,A-B
1,1,A,C,A-C
2,1,A,E,A-E
3,1,C,B,C-B
4,2,C,D,C-D


In [22]:
tasks_arr = tasks['path'].values
tasks_arr

array(['A-B', 'A-C', 'A-E', 'C-B', 'C-D'], dtype=object)

In [23]:
# 5. แปลงจาก A-B เป็น distances
def getDistance(startEndStr):
    global tasks_arr
    global distances
    global node_names
    
    if startEndStr == '0':
        return 0
    else:
        start,end = startEndStr.split('-')
        i,j = np.where(node_names == start)[0][0],np.where(node_names == end)[0][0]
        return distances[i,j] if startEndStr in tasks_arr else -1*distances[i,j]

In [24]:
getDistance('A-B')

65

In [25]:
getDistance('0')

0

In [26]:
getDistance('B-C')

-88

ทำกับทุก element ของ matrix (เปลี่ยน A-B ใน all_path ให้กลายเป็น distance ให้หมด) จะได้

In [27]:
getDistanceAllElement = np.vectorize(getDistance) 

In [28]:
result_array = getDistanceAllElement(all_paths)
result_array

array([[  65,  -65,   65,  -65,    7,   88,  -65,  284, -294,  121, -121,  121,    0,    0],
       [  65,  -65,   65,  -65,    7,   88,  -88,  121,  -46,  284, -294,  121,    0,    0],
       [  65,  -65,   65,  -65,    7,   88,  -88,  121, -121,  121,  -46,  284,    0,    0],
       [  65,  -65,   65,  -65,    7,  121,  -46,  284, -294,   88,  -88,  121,    0,    0],
       [  65,  -65,   65,  -65,    7,  121,  -46,  284, -294,  121, -121,   88,    0,    0],
       [  65,  -65,   65,  -65,    7,  121, -121,   88,  -65,  284, -294,  121,    0,    0],
       [  65,  -65,   65,  -65,    7,  121, -121,   88,  -88,  121,  -46,  284,    0,    0],
       [  65,  -65,   65,  -65,    7,  121, -121,  121,  -46,  284, -294,   88,    0,    0],
       [  65,  -65,   65,  -65,    7,  121, -121,  121, -121,   88,  -65,  284,    0,    0],
       [  65,  -65,   65,  -65,  284, -284,    7,   88,  -88,  121, -121,  121,    0,    0],
       [  65,  -65,   65,  -65,  284, -284,    7,  121, -121,   88,  -

In [29]:
result_array.shape

(450, 14)

รวมระยะทางที่วิ่งทั้งหมด แล้วพิจารณาเฉพาะที่ unique 

ปล.unique ที่ว่าคือ ต้อง unique ที่ระยะรวม, ระยะ +, ระยะทาง -

In [30]:
# 6.
def sumDistance(distance_arr):
    all_distances = sum(distance_arr)
    pos_distances = sum(distance_arr[distance_arr > 0])
    neg_distances = sum(distance_arr[distance_arr < 0])
    
    return pos_distances, neg_distances, all_distances

In [32]:
all_distance_path = np.apply_along_axis(sumDistance, 1, result_array)
all_distance_path

array([[ 751, -610,  141],
       [ 751, -558,  193],
       [ 751, -385,  366],
       [ 751, -558,  193],
       [ 751, -591,  160],
       [ 751, -610,  141],
       [ 751, -385,  366],
       [ 751, -591,  160],
       [ 751, -437,  314],
       [ 751, -623,  128],
       [ 751, -623,  128],
       [ 751, -656,   95],
       [ 751, -610,  141],
       [ 751, -558,  193],
       [ 751, -679,   72],
       [ 751, -558,  193],
       [ 751, -591,  160],
       [ 751, -610,  141],
       [ 751, -679,   72],
       [ 751, -591,  160],
       [ 751, -731,   20],
       [ 751, -558,  193],
       [ 751, -385,  366],
       [ 751, -623,  128],
       [ 751, -558,  193],
       [ 751, -679,   72],
       [ 751, -333,  418],
       [ 751, -571,  180],
       [ 751, -627,  124],
       [ 751, -692,   59],
       [ 751, -558,  193],
       [ 751, -333,  418],
       [ 751, -539,  212],
       [ 751, -385,  366],
       [ 751, -571,  180],
       [ 751, -604,  147],
       [ 751, -558,  193],
 

จะเห็นว่าระยะทาง + เท่ากันหมด แต่ - นั้นต่างกัน

In [33]:
len(all_distance_path[:,2])

450

จาก 450 ทางที่เป็นไปได้

In [34]:
len(np.unique(all_distance_path[:,2]))

18

มีแค่ 18 ทางเท่านั้นที่ unique ให้ค่าแตกต่างกัน

In [35]:
np.unique(all_distance_path[:,2])

array([  7,  20,  59,  72,  95, 111, 124, 128, 141, 147, 160, 180, 193, 199, 212, 314, 366, 418])

โดยทางที่ดีที่สุด (วิ่ง - น้อยที่สุด) วิ่งระยะรวมไป 418 

ลองกวาดดูว่ามีทางอะไรบ้าง

In [39]:
all_paths[all_distance_path[:,2] == 418]

array([['A-B', 'B-A', 'A-B', 'B-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-A', 'A-B', 'B-C', 'C-D', 'D-A', 'A-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-A', 'A-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-B', 'B-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-A', 'A-C', 'C-D', 'D-A', 'A-B', 'B-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-C', 'C-B', 'B-A', 'A-B', 'B-C', 'C-D', 'D-A', 'A-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-C', 'C-B', 'B-A', 'A-C', 'C-D', 'D-A', 'A-B', 'B-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-B', 'B-A', 'A-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-C', 'C-D', 'D-A', 'A-B', 'B-A', 'A-E', '0', '0'],
       ['A-B', 'B-C', 'C-D', 'D-A', 'A-B', 'B-A', 'A-C', 'C-B', 'B-C', 'C-D', 'D-A', 'A-E', '0', '0'],
       ['A-B', 'B-C', 'C-D', 'D-A', 'A-B', 'B-C', 'C-B', 'B-A', 'A-C', 'C

In [40]:
len(all_paths[all_distance_path[:,2] == 418])

21

จากผลข้างต้นพบว่ามี 21 วิธีที่จะวิ่งได้ระยะทางน้อยสุดสำหรับโจทย์นี้

และระยะทางน้อยสุดคือ 418