### Problem Statement

Given list of integers that contain numbers in random order, write a program to find the longest possible sub sequence of consecutive numbers in the array. Return this subsequence in sorted order. The solution must take O(n) time

For e.g. given the list `5, 4, 7, 10, 1, 3, 55, 2`, the output should be `1, 2, 3, 4, 5`

*Note- If two arrays are of equal length return the array whose index of smallest element comes first.*



In [35]:
'''
idea:
    去 hashmap 中查找需要的元素是否存在, 有的話記錄下連續的長度,
    最後用 element 起點 + 最大長度 就可以造出數列, ex: 你知道從  3 往上走連續 4個數,
    因此就是 3,4,5,6,7 
    
    ps.  check每一個element時, 都同時看往上走, 和往下走 
    ex: input 5, 4, 7, 10, 1, 3, 55, 2
    
    **
    就是想以 某個 value , 在中心,  往上往下延伸去找       
    往左到哪? <----5---> 往右到哪？ 全部用一個current_consec_count 來算
    
    
    
        當 current element = 5
            current_starts_idx = 0
            
            case1:往上找
            先打算看 5,6,7,8,9.... 如果 6,7,8...有在 dict map 裡的話, 就一路往上查找
            剛好沒有 6 於是 while 離開
            
            case2:往下找 4
            current_starts_idx = 1 (設成 4的index)
            有發現 4,3,2,1, 都在, 把它們在dict 都設成checked -1
            這時候 連續 current_consec_count = 5
            

'''

def longest_consecutive_subsequence(input_list):
    
    #build map for future reference
    element_idx_dict = dict()# <value, it's index in list>
    for index, element in enumerate(input_list):
        element_idx_dict[element] = index

    max_length = -1
    # 給 len() 跟 給 max = -999 一樣, 初值而已, 後面會替換掉
    starts_at = len(input_list)

    #當前這個 value 看過了, 先標記成 -1
    #標成看過,  有一樣的就不用重複看 ex: 3,2,1 這三個看過後標-1, 則 
    #當 current value 是 2的時候, 3, 1 自然不用看, 下面while 有擋
    
    for index, element in enumerate(input_list):
        current_starts_idx = index
        element_idx_dict[element] = -1
        #計算連續的數量
        current_consec_count = 1

        
        ############
        # 往右的case
        ###########
        # check upwards, 如果現在value 是數字3, 那看看他下一個人 4
        current_element = element + 1

        #如果 4 在 dict 裡面且還沒被check 過
        while current_element in element_idx_dict and element_idx_dict[current_element] > 0:

            #連續數量 + 1
            current_consec_count += 1
            #把剛才4 標程 -1
            element_idx_dict[current_element] = -1
            #如果 4 有, 再往上走 5
            current_element = current_element + 1

        #=> 因此, 走到這裡時, 已經把 current index value 往上相鄰的都算了

        ############
        # 往左的case
        ###########
        # check downwards, 往下看, ex: value 3, 現在看 2
        current_element = element - 1
        while current_element in element_idx_dict and element_idx_dict[current_element] > 0:
            #把index 給 current_starts, 不可能是-1 因為上面擋了
            #記錄下這波從哪個index 開始往下,因為他是從中心開始往下
            #而我們最後需要知道最左邊的index 才能靠 current_consec_count 數列往上推
            #因此這邊需要一直更新 current starts idx, 而上面不用, 因為如果只有case1往右
            #那current_starts_idx 就是中心的 index, 一開始set過了
            current_starts_idx = element_idx_dict[current_element]
            current_consec_count += 1
            element_idx_dict[current_element] = -1
            current_element = current_element - 1

        #紀錄最大值
        if current_consec_count >= max_length:
            #這個if 是題目的條件: 當遇到一樣長的 序列時,回傳擁有最小index的
            #因此如果你 current_start_idx 比 之前記錄下的 start_at 大, 跳過
            if current_consec_count == max_length and current_starts_idx > starts_at:
                continue
            starts_at = current_starts_idx
            max_length = current_consec_count

    start_element = input_list[starts_at]
    return [element for element in range(start_element, start_element + max_length)]

    


In [31]:
def test_function(test_case):
    output = longest_consecutive_subsequence(test_case[0])
    if output == test_case[1]:
        print("Pass")
    else:
        print("Fail")
    

In [32]:
test_case_1 = [[5, 4, 7, 10, 1, 3, 55, 2], [1, 2, 3, 4, 5]]
test_function(test_case_1)

Pass


In [33]:
test_case_2 = [[2, 12, 9, 16, 10, 5, 3, 20, 25, 11, 1, 8, 6 ], [8, 9, 10, 11, 12]]
test_function(test_case_2)

Pass


In [34]:
test_case_3 = [[0, 1, 2, 3, 4], [0, 1, 2, 3, 4]]
test_function(test_case_3)

Pass


In [8]:
def longest_consecutive_subsequence(input_list):
    element_dict = dict()

    for index, element in enumerate(input_list):
        element_dict[element] = index

    max_length = -1
    # 給 len() 跟 給 max = -999 一樣, 初值而已, 後面會替換掉
    starts_at = len(input_list)

    for index, element in enumerate(input_list):
        current_starts = index
        #當前這個 value 看過了, 先標記成 -1
        #標成看過,  有一樣的就不用重複看 ex: 3,2,1 這三個看過後標-1, 則 
        #當 current value 是 2的時候, 3, 1 自然不用看, 下面while 有擋
        element_dict[element] = -1
        #計算連續的數量
        current_count = 1

        # check upwards, 如果現在value 是數字3, 那看看他下一個人 4
        current = element + 1

        while current in element_dict and element_dict[current] > 0:

            #連續數量 + 1
            current_count += 1
            #把剛才4 標程 -1
            element_dict[current] = -1
            #如果 4 有, 再往上走 5
            current = current + 1

        #=> 因此, 走到這裡時, 已經把 current index value 往上相鄰的都算了
            
        # check downwards, 往下看, ex: value 3, 現在看 2
        current = element - 1
        while current in element_dict and element_dict[current] > 0:
            #把index 給 current_starts, 不可能是-1 因為上面擋了
            #記錄下這波從哪個index 開始往下
            current_starts = element_dict[current]
            current_count += 1
            element_dict[current] = -1
            current = current - 1

        #紀錄最大值
        if current_count >= max_length:
            if current_count == max_length and current_starts > starts_at:
                continue
            starts_at = current_starts
            max_length = current_count

    start_element = input_list[starts_at]
    return [element for element in range(start_element, start_element + max_length)]





<span class="graffiti-highlight graffiti-id_et1ek54-id_r15x1vg"><i></i><button>Show Solution</button></span>