# 目標
1. 透過「二分法」搜尋目標的索引值
2. 與使用「for迴圈」比較優劣

# 1. 透過「二分法」搜尋目標的索引值

# Step 1 導入套件

In [1]:
import warnings
warnings.filterwarnings('ignore')
import random
import time

# Step 2 產生搜尋目標

## (1)  產生一個排序過且不重複的隨機串列

In [2]:
N = 10000000   # 亂數上界
n = 1000000    # list個數
sorted_list = sorted(random.sample(range(N),n))

## (2) 從上面產生的串列中，隨機取一個數作為欲搜尋目標 ( target_value )

In [3]:
random_index = random.randint( 0 , len(sorted_list) - 1 )   # 抽搜尋目標的索引值
target_value = sorted_list[random_index]
print('target value =',target_value)

target value = 8887853


## 確認目標的索引值(正確答案)

In [4]:
# 目標的索引值
random_index

888638

# Step 3 建立二分法函數
- Binary_Search( sorted_list, target_value )
    - sorted_list : 上面產生的「排序過且不重複的隨機串列」
    - target_value : 上面產生的「欲搜尋目標」之數值
- lower_bond_index : sorted_list中最小值的索引值
- upper_bond_index : sorted_list中最大值的索引值
- mid_index : sorted_list中間值的索引值
- mid_value : sorted_list中間值的數值
- time_start : 程式開始執行時間
- time_end : 程式結束執行時間
- search_time : 搜尋到target_value所花費時間
- number_of_searches : 該程式搜尋到target_value所花費次數

In [5]:
def Binary_Search( sorted_list, target_value ) :
    
    time_start = time.perf_counter()   # 後面用於計算搜尋時間，此函數可測量極短的時間( 時間過短時使用time.time()輸出可能為0 )
    
    ##  設定二分法會使用到的參數初始值  ##
    
    lower_bond_index = 0   # sorted_list已進行排序了 
    upper_bond_index = len(sorted_list) - 1   # 最後一個索引值為n-1
    mid_index = int( ( lower_bond_index + upper_bond_index ) / 2 )   # 中間index，索引值必須為整數 
    mid_value = sorted_list[mid_index]  # 中間index對應的value
    
    ## 使用二分法搜尋  ##
    
    number_of_searches = 1   # 用於計算搜尋次數
    while not ( target_value == mid_value ) :          # 只要 target_value 不等於 mid_value 則一直執行該迴圈
        
        ###  用於查看搜尋過程  ###
        
        print(f'第{number_of_searches}次搜尋', end = '  ')
        print(f'target_value = {target_value}', end = '  ')
        print(f'mid_value = {mid_value}', end = '  ')
        print(f'lower_bond_index = {lower_bond_index}', end = '  ')
        print(f'upper_bond_index = {upper_bond_index}')
        
        ###  繼續進行迴圈  ###

        number_of_searches = number_of_searches + 1    # 每次進入while迴圈便+1，用於計算搜尋次數
        if target_value < mid_value :                  # 若 target_value 小於 mid_value
            upper_bond_index = mid_index               # 便將 mid_index 設為新的 upper_bond_index
            mid_index = int( ( lower_bond_index + upper_bond_index ) / 2 )   # 並且計算新的 mid_index
            mid_value = sorted_list[mid_index]                               # 以及計算新的 mid_value
        else :                                         # 若 target_value 大於 mid_value
            lower_bond_index = mid_index               # 便將 mid_index 設為新的 lower_bond_index
            mid_index = int( ( lower_bond_index + upper_bond_index ) / 2 )   # 並且計算新的 mid_index
            mid_value = sorted_list[mid_index]                               # 以及計算新的 mid_value
            
        if  number_of_searches > len(sorted_list) :  # 保護機制 : 若搜尋次數超過 len(sorted_list) 次 
            print('cannot search')                   #            ( len(sorted_list) = 不使用二分法直接用for去搜尋的次數，
            target_index = -1                        #              若二分法搜尋次數超過for次數則使用二分法無意義 )
            break                                    #           回傳cannot search並給target_index一個數值(隨意)，最後停止搜尋
    
    target_index = mid_index              # 若迴圈順利進行並找到目標值，則此時 target_index等於mid_index
    
    ## 用於查看「最後一次」搜尋的過程  ##
    
    print(f'第{number_of_searches}次搜尋', end = '  ')
    print(f'target_value = {target_value}', end = '  ')
    print(f'mid_value = {mid_value}', end = '  ')
    print(f'lower_bond_index = {lower_bond_index}', end = '  ')
    print(f'upper_bond_index = {upper_bond_index}')
    
    ##  計算搜尋時間  ##
    
    time_end = time.perf_counter()
    search_time = time_end - time_start
    
    return target_index, search_time, number_of_searches   # 回傳「目標的索引值、搜尋時間、搜尋次數」

## Step 4 輸出結果

In [6]:
target_index, search_time, number_of_searches = Binary_Search( sorted_list, target_value )

print('\n')

print('目標的索引值 =',target_index)
print(f'搜尋時間 = {search_time} 秒')
print(f'搜尋次數 = {number_of_searches :,} 次')

第1次搜尋  target_value = 8887853  mid_value = 5004125  lower_bond_index = 0  upper_bond_index = 999999
第2次搜尋  target_value = 8887853  mid_value = 7501939  lower_bond_index = 499999  upper_bond_index = 999999
第3次搜尋  target_value = 8887853  mid_value = 8751190  lower_bond_index = 749999  upper_bond_index = 999999
第4次搜尋  target_value = 8887853  mid_value = 9376541  lower_bond_index = 874999  upper_bond_index = 999999
第5次搜尋  target_value = 8887853  mid_value = 9064051  lower_bond_index = 874999  upper_bond_index = 937499
第6次搜尋  target_value = 8887853  mid_value = 8907631  lower_bond_index = 874999  upper_bond_index = 906249
第7次搜尋  target_value = 8887853  mid_value = 8829136  lower_bond_index = 874999  upper_bond_index = 890624
第8次搜尋  target_value = 8887853  mid_value = 8868597  lower_bond_index = 882811  upper_bond_index = 890624
第9次搜尋  target_value = 8887853  mid_value = 8888183  lower_bond_index = 886717  upper_bond_index = 890624
第10次搜尋  target_value = 8887853  mid_value = 8878348  lower_b

# 2. 與使用「for迴圈」比較優劣

In [7]:
start_time2 = time.perf_counter()
target_index_2 = sorted_list.index( target_value )  # .index()這個函數是透過for迴圈尋找value對應的index
end_time2 = time.perf_counter()  
search_time2 = end_time2 - start_time2
print('目標索引值 =', target_index_2)
print(f'搜尋時間 = {search_time2} 秒')
print(f'搜尋次數 = {len(sorted_list) :,} 次')
print(f'在資料數量為 { n :,} 個下，「for迴圈」的搜尋時間是「二方法」的 { int(search_time2 / search_time) } 倍')
print(f'在資料數量為 { n :,} 個下，「for迴圈」的搜尋次數是「二分法」的 { int( len(sorted_list) / number_of_searches) } 倍') 

               # { n :,} 將 n 用千分位隔開

目標索引值 = 888638
搜尋時間 = 0.04595150000022841 秒
搜尋次數 = 1,000,000 次
在資料數量為 1,000,000 個下，「for迴圈」的搜尋時間是「二方法」的 197 倍
在資料數量為 1,000,000 個下，「for迴圈」的搜尋次數是「二分法」的 50000 倍
