# การเรียงลำดับ
การเรียงลำดับเป็นกระบวนการจัดเรียงข้อมูลให้มีลำดับ เช่น ลำดับของตัวเลขจากน้อยไปมาก หรือจากมากไปน้อย ลำดับของตัวอักษรที่เรียงตาม a-z ลำดับของรหัสไปรษณีย์เรียงตามตัวเลข เป็นต้น เราเคยผ่านการใช้งานการเรียงลำดับไปแล้วจากปัญหาอนาแกรม ซึ่งทำการเรียงลำดับตัวอักษรแล้วค่อยเปรียบเทียบเป็นคู่ๆ

ขั้นตอนวิธีในการเรียงลำดับนั้นก็มีด้วยกันหลายวิธีซึ่งเราจะมาเรียนรู้การเขียนโปรแกรมและวิเคราะห์เวลาสำหรับขั้นตอนวิธีต่างๆ ซึ่งสิ่งที่เรามักจะเจอคือ วิธีที่เข้าใจง่ายๆ เขียนโปรแกรมง่ายๆ มักจะมีเวลาค่อนข้างแย่ ในขณะที่วิธีที่คาดไม่ถึงมักจะมีเวลาดี

## จุดประสงค์
* เพื่อให้เข้าใจถึงหลักการ การเขียนโปรแกรม สำหรับขั้นตอนวิธีการเรียงลำดับต่างๆ ประกอบด้วย
    * การเรียงลำดับแบบฟอง (bubble sort)
    * การเรียงลำดับแบบเลือก (selection sort)
    * การเรียงลำดับแบบแทรก (insertion sort)
    * การเรียงลำดับแบบผสาน (merge sort)
    * การเรียงลำดับแบบเร็ว (quick sort)
* เพื่อให้สามารถประยุกต์ใช้การเรียงลำดับในการแก้ปัญหาได้

## 1. การเรียงลำดับแบบฟอง
ใช้หลักการของการเปรียบเทียบเป็นคู่ๆ ที่ติดกัน แล้วค่อยๆ ดันกันขึ้นมา กล่าวคือ ถ้าเราต้องการเรียงจากน้อยไปมาก สมมติค่าที่ติดกันใน list l คือ l[i] กับ l[i+1] หาก l[i] > l[i+1] ก็ให้ทำการสลับตำแหน่งกัน 

เราจะทำการตรวจสอบและสลับที่แบบนี้ตั้งแต่ดัชนี 0 ถึง n-2 เมื่อ n คือจำนวนข้อมูลทั้งหมด เรียกว่า 1 การผ่าน (pass) เมื่อผ่าน 1 การผ่านแล้วเราจะเห็นได้ว่าจำนวนที่มากที่สุดจะถูกดันไปอยู่ด้านหลังของ list แล้วในรอบถัดไปจะกลับมาเริ่มทำการตรวจสอบและสลับที่ตั้งแต่ดัชนีที่ 0 ถึง n-3 เนื่องจากตดัชนีที่ n-1 เราไม่ต้องสนใจแล้วเนื่องจากเป็นค่ามากที่สุดอยู่ด้านท้ายก็ถูกต้องแล้ว เมื่อทำการผ่านที่สองเสร็จเราจะได้ว่าที่ดัชนี n-2 กับ n-1 ถูกเรียงไว้แล้ว รอบถัดๆ ไปก็เช่นกัน จะเห็นได้ว่าเมื่อเราทำถึงรอบการผ่านที่ n-1 ค่าที่ดัชนี 1 ถึง n-1 จะถูกเรียงลำดับเรียบร้อยและที่ดัชนีที่ 0 กลายเป็นค่าที่น้อยที่สุดด้วย [รูปที่ 1](#figure_01) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheBubbleSort.html)) แสดงตัวอย่างของการผ่านรอบแรก และจากเวบนี้มีตัวอย่างการสลับค่าให้เราได้เห็นจริงให้นิสิตลองเข้าไปดูการทำงานเพื่อความเข้าใจ

<a name="figure_01"></a> 
![alt text](/files/imgs/bubblepass.png)

เมื่อเรารู้ถึงการทำงานของการเรียงลำดับแบบฟองแล้ว ลองมาวิเคราะห์เวลาในการทำงานดูได้ดัง [ตารางที่ 1](#table_01)

<a name="table_01"></a>

| การผ่าน | จำนวนการเปรียบเทียบ             |
|-----------|----------------------|
| 1    | n-1   |
| 2    | n-2 |
| 3       | n-3          |
| ...       |...        |
| n -1      | 1         |

เวลาในการทำงานคือ $T(n) = (n-1) + (n-2) + (n-3) + ... + 1 = \frac{n(n-1)}{2}$ ซึ่งถ้าเราจำได้จะอยู่ในรูป $O(n^2)$ 

ส่วนของรหัสมีดังนี้

In [1]:
def bubbleSort(alist):
    for passnum in range(len(alist)-1,0,-1):
        for i in range(passnum):
            if alist[i]>alist[i+1]:
                temp = alist[i]
                alist[i] = alist[i+1]
                alist[i+1] = temp

alist = [54,26,93,17,77,31,44,55,20]
bubbleSort(alist)
print(alist)


[17, 20, 26, 31, 44, 54, 55, 77, 93]


โดย for ในบรรทัดที่ 2 เป็นตัวกำหนดรอบการผ่าน ในขณะที่ for ในบรรทัดที่ 3 กำหนดคู่ในการเปรียบเทียบ บรรทัดที่ 5-7 เป็นการสลับค่า แต่จากวิธีการนี้จะมีกระบวนการที่เสียเปล่าคือเมื่อทำรอบการผ่านแล้วไม่มีการสลับค่าเกิดขึ้น นั่นหมายถึงข้อมูลถูกเรียงเรียบร้อยแล้ว แต่ก็ยังจะต้องทำไปเรื่อยๆ จนกว่าจะครบทุกรอบการผ่าน

#### คำถาม
จงแก้ไขโปรแกรมการเรียงลำดับแบบฟองให้หยุดทำเมื่อไม่มีการสลับข้อมูลในรอบการผ่าน

In [2]:
# try here

## 2. การเรียงลำดับแบบเลือก
วิธีการเรียงลำดับเป็นไปดังชื่อเรียก คือจะทำการเลือกค่าที่มากที่สุดไปไว้ด้านหลังของ list แล้วทำเหมือนไม่สนใจตัวด้านหลัง กระบวนการนี้คือจบ 1 การผ่าน แล้วทำกระบวนการเดิมกับ list ที่ตัดตัวหลังสุดออก 

สมมติว่ามีข้อมูลทั้งหมด n ตัว แล้วเราทำกระบวนการเรียงลำดับไป m รอบ ข้อมูลด้านท้ายที่ถูกเรียงแล้วจะมีจำนวน m ตัว ทำจำนวน n-1 การผ่านก็จะได้ list ที่เรียงลำดับจากน้อยไปหามาก ดังตัวอย่างใน [รูปที่ 2](#figure_02) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheSelectionSort.html)) 

<a name="figure_02"></a> 
![alt text](/files/imgs/selectionsortnew.png)

ส่วนที่เป็นใจความสำคัญสำหรับการเรียงลำดับแบบเลือกคือการหาตัวที่มากที่สุดใน list ที่เหลือ ที่ใช้คำว่า list ที่เหลือเพราะทุกการผ่านเราจะลดปัญหาลงเรื่อยๆ เพราะตัวท้ายๆ ของ list ถูกเรียงลำดับไว้แล้ว

In [3]:
def selectionSort(alist):
   for fillslot in range(len(alist)-1,0,-1):
       positionOfMax=0
       for location in range(1,fillslot+1):
           if alist[location]>alist[positionOfMax]:
               positionOfMax = location

       temp = alist[fillslot]
       alist[fillslot] = alist[positionOfMax]
       alist[positionOfMax] = temp

alist = [54,26,93,17,77,31,44,55,20]
selectionSort(alist)
print(alist)

[17, 20, 26, 31, 44, 54, 55, 77, 93]


for ในบรรทัดที่ 2 เป็นตัวกำหนดการผ่าน ซึ่งจะระบุถึงตำแหน่งที่เราจะนำค่าที่มากที่สุดในแต่ละการผ่านเข้าไปเติมด้วยตัวแปร fillslot ส่วน for ในบรรทัดที่ 4 มีหน้าที่ไล่หา location หรือดัชนีที่มีค่ามากที่สุด เมื่อหาดัชนีแล้วจึงมาทำการสลับค่าดังบรรทัดที่ 8-10 จบ 1 การผ่านกลับไปยัง for ในบรรทัดที่ 2

การวิเคราะห์เวลาก็ทำได้ไม่ยาก เราทำทั้งหมด n-1 การผ่าน แต่ละการผ่านทำการเปรียบเทียบเท่ากับจำนวนข้อมูลใน list ที่เหลือแล้วลบด้วย 1 เราจึงได้ว่า $T(n) = (n-1) + (n-2) + ... + 1$ เหมือนกับการเรียงลำดับแบบฟองซึ่งมี $O(n^2)$ แต่ในทางปฎิบัติจะเร็วกว่าการเรียงลำดับแบบฟองเนื่องจากจำนวนครั้งในการสลับค่ามีน้อยกว่า

## 3. การเรียงลำดับแบบแทรก
จะใช้หลักการหยิบค่ามาแล้วนำไปแทรกยังตำแหน่งที่เหมาะสมใน list ที่ถูกเรียงลำดับไว้แล้ว จุดสำคัญคือการสร้าง list ที่ถูกเรียงลำดับ เราจะค่อยๆ สร้างจาก 1 ตัวไป 2 ตัว 3 ตัวโดยวิธีการแทรก ซึ่งจะรับประกันว่า list ที่ได้จะถูกเรียงลำดับเสมอ ดังตัวอย่างใน [รูปที่ 3](#figure_03) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheInsertionSort.html)) 

<a name="figure_03"></a> 
![alt text](/files/imgs/insertionsort.png)

ขั้นตอนเป็นดังนี้
* ในการผ่านที่ 1 เราจะมีข้อมูล 1 ตัวใน list คือ 54 ซึ่งข้อมูลตัวเดียวเรียงลำดับอยู่แล้ว
* ในการผ่านที่ 2 เราจะแทรกข้อมูลตัวถัดไปคือ 26 เข้าใน list ให้ถูกตำแหน่ง
* ทำแบบเดียวกันจนถึงข้อมูลตัวสุดท้าย

ประเด็นสำคัญจะอยู่ตรงที่เราจะรู้ได้อย่างไรว่าตำแหน่งไหนคือตำแหน่งที่จะแทรกเข้าไป ให้ลองดู  [รูปที่ 4](#figure_04) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheInsertionSort.html)) 

<a name="figure_04"></a> 
![alt text](/files/imgs/insertionpass.png)

เราต้องการจะแทรก 31 ที่อยู่ที่ดัชนี 5 เข้าไปยัง list สีเทาที่ถูกเรียงลำดับไว้แล้ว วิธีการคือ

* ทำการเปรียบเทียบ 31 กับสมาชิกใน list โดยเริ่มจากท้ายคือดัชนี 4 ก่อน หากพบว่าตัวที่นำมาเปรียบเทียบมีค่ามากกว่า 31 ให้นำค่าที่เปรียบเทียบไปแทนที่ดัชนี 5 ซึ่งเราพบว่า 93 มีค่ามากกว่า จึงนำ 93 มาอยู่ที่ดัชนี 5 แทน
* แล้วจึงนำตัวถัดไปใน list คือดัชนี 3 มาเปรียบเทียบต่อ พบว่าคือ 77 ซึ่งยังมากกว่า 31 อยู่จึงนำค่า 77 ไปแทนยังดัชนี 4
* นำตัวถัดไปใน list คือดัชนี 2 มาเปรียบเทียบต่อ พบว่า 54 มากกว่า 31 จึงนำ 54 ไปแทนที่ดัชนี 2
* นำตัวถัดไปใน list คือดัชนี 1 มาเปรียบเทียบต่อ พบว่า 26 น้อยกว่า 31 ซึ่งเมื่อเรามอง list เบื้องต้นว่าเราต้องการแทรก 31 ไว้ระหว่าง 26 กับ 54 ณ ตอนนี้ 26 อยู่ที่ดัชนี 1 และ 54 ย้ายไปอยู่ที่ดัชนี 3 ทำให้ดัชนี 2 ว่างและเป็นดัชนีที่นำ 31 ไปแทรก

รหัสเป็นดังนี้

In [4]:
def insertionSort(alist):
   for index in range(1,len(alist)):

     currentvalue = alist[index]
     position = index

     while position>0 and alist[position-1]>currentvalue:
         alist[position]=alist[position-1]
         position = position-1

     alist[position]=currentvalue

alist = [54,26,93,17,77,31,44,55,20]
insertionSort(alist)
print(alist)

[17, 20, 26, 31, 44, 54, 55, 77, 93]


for ในบรรทัดที่ 2 เป็นการบอกว่าดัชนีไหนที่จะนำเข้าไปแทรกใน list บรรทัดที่ 4 มีการเก็บค่าที่ดัชนีนั้นไว้เพือการเปรียบเทียบและการแทรกเข้า list วงวนที่ใช้หาตำแหน่งในการแทรกคือ while ในบรรทัดที่ 7 ส่วนบรรทัดที่ 8-9 เป็นการขยับค่าที่มากกว่าค่าที่ต้องการแทรก

## 4. การเรียงลำดับแบบผสาน
เป็นการเรียงลำดับแบบแบ่งแยกและเอาชนะ (divide and conquer) โดยใช้ความสัมพันธ์เวียนเกิดในการแก้ปัญหา โดยจะแบ่งปัญหาย่อยทีละครึ่งจนถึงกรณีฐานคือมีข้อมูลเหลือแค่ 1 ตัว แล้วจึงทำการผสานย้อนกลับไปเรื่อยๆ โดยการผสานแต่ละขั้นนั้นจะให้ผลข้อมูลที่เรียงลำดับแล้ว จากคำอธิบายนี้เราจะเห็นได้ว่าการแบ่งปัญหานั้นไม่มีความซับซ้อน แต่จะไปยากตรงการผสานที่จะให้ข้อมูลที่เรียงลำดับแล้วคืนมาเพื่อทำการผสานต่อในขั้นถัดไป 

ตัวอย่างของการแบ่งปัญหานั้นแสดง ดัง [รูปที่ 5](#figure_05) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheMergeSort.html)) 

<a name="figure_05"></a> 
![alt text](/files/imgs/mergesortA.png)

โดยจะแบ่งข้อมูลเป็นครึ่งซ้ายและครึ่งขวา (สีเทาและสีขาว) ไปเรื่อยๆ จนแบ่งไม่ได้แล้ว หลังจากนั้นจึงทำการผสานกลับดัง [รูปที่ 6](#figure_06) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheMergeSort.html)) 

<a name="figure_06"></a> 
![alt text](/files/imgs/mergesortB.png)

ซึ่งแต่ละขั้นในการผสานจะต้องให้ผลลัพธ์เป็นข้อมูลที่เรียงลำดับเสร็จเรียบร้อยแล้ว

อธิบายแบบนี้อาจจะทำให้สับสนว่าต้องเขียนวงวนเพื่อแบ่งข้อมูลแล้วค่อยๆ ผสานข้อมูลเรื่อยๆ แต่จริงๆ แล้วเราสามารถมองเป็นปัญหาย่อยๆ ได้ เสมือนกับว่าปัญหาย่อยนั้นถูกแก้มาเรียบร้อยแล้ว แล้วเราสนใจเฉพาะการผสานในขั้นตอนของตัวเองให้ถูกต้อง จึงขอเน้นการอธิบายที่การผสานก่อน

[รูปที่ 7](#figure_07) เป็นตัวอย่างการผสานโดยเราต้องการผสาน list ที่ถูกเรียงลำดับในตัวของมันเอง 2 ตัวเข้าหากัน ซึ่งสามารถใช้วิธีเปรียบเทียบค่าตามดัชนีของ list ทั้ง 2 (list ด้านบน) ไปเรื่อยๆ โดยเลือกหยิบตัวที่มีค่าน้อยมาใส่เข้าใน list ผสาน (list ด้านล่าง) เราต้องยุ่งเกี่ยวกับดัชนี 3 ตัว สำหรับ list ด้านบนคือ i กับ j และ list ผสานด้านล่างคือ k

จากตัวอย่างเริ่มต้นที่ i = j = k = 0 เปรียบเทียบ list ด้านซ้ายดัชนี i ขอเรียกว่า lefthalf[i] กับ list ด้านขวาดัชนี j ขอเรียกว่า righthalf[j] พบว่า lefthalf[i] < righthalf[j] เราจะกำหนด list ผสานดัชนี k ขอเรียกว่า alist[k] = lefthalf[i] แล้วทำการเลื่อนดัชนี i และ k ไป 1 แล้วเปรียบเทียบต่อพบว่า lefthalf[i] > righthalf[j] ก็จะกำหนด alist[k] = righthalf[j] แล้วทำการเลื่อนดัชนี j และ k ไป 1 ทำแบบนี้ไปเรื่อยๆ จนกว่า i หรือ j เลยดัชนีที่เป็นไปได้ ให้นำอีก list ที่เหลือผสานเข้ากับ alist ทั้งหมด

<a name="figure_07"></a> 
![alt text](/files/imgs/merge1.png)
![alt text](/files/imgs/merge2.png)
![alt text](/files/imgs/merge3.png)
![alt text](/files/imgs/merge4.png)
![alt text](/files/imgs/merge5.png)

ส่วนรหัสเป็นดังนี้ โดยบรรทัดที่ 5-9 เป็นการย่อยปัญหาลงทีละครึ่ง แล้วจึงเริ่มทำการผสานตามที่ได้อธิบายด้วยตัวอย่างตั้งแต่บรรทัดที่ 11-31 การเปรียบเทียบค่าที่ดัชนี i และ j แล้วค่อยๆ ขยับไปนั้นจะอยู่ในวงวน while ช่วงบรรทัดที่ 14-21 หากดัชนี j เลยค่าที่เป็นไปได้จะมาทำในบรรทัดที่ 23-26 ต่อ แต่หากดัชนี i เลยค่าที่เป็นไปได้จะมาทำในบรรทัดที่ 28-31

In [5]:
def mergeSort(alist):
    print("Splitting ",alist)
    if len(alist)>1:
        mid = len(alist)//2
        lefthalf = alist[:mid]
        righthalf = alist[mid:]

        mergeSort(lefthalf)
        mergeSort(righthalf)

        i=0
        j=0
        k=0
        while i < len(lefthalf) and j < len(righthalf):
            if lefthalf[i] < righthalf[j]:
                alist[k]=lefthalf[i]
                i=i+1
            else:
                alist[k]=righthalf[j]
                j=j+1
            k=k+1

        while i < len(lefthalf):
            alist[k]=lefthalf[i]
            i=i+1
            k=k+1

        while j < len(righthalf):
            alist[k]=righthalf[j]
            j=j+1
            k=k+1
    print("Merging ",alist)

alist = [54,26,93,17,77,31,44,55,20]
mergeSort(alist)
print(alist)

Splitting  [54, 26, 93, 17, 77, 31, 44, 55, 20]
Splitting  [54, 26, 93, 17]
Splitting  [54, 26]
Splitting  [54]
Merging  [54]
Splitting  [26]
Merging  [26]
Merging  [26, 54]
Splitting  [93, 17]
Splitting  [93]
Merging  [93]
Splitting  [17]
Merging  [17]
Merging  [17, 93]
Merging  [17, 26, 54, 93]
Splitting  [77, 31, 44, 55, 20]
Splitting  [77, 31]
Splitting  [77]
Merging  [77]
Splitting  [31]
Merging  [31]
Merging  [31, 77]
Splitting  [44, 55, 20]
Splitting  [44]
Merging  [44]
Splitting  [55, 20]
Splitting  [55]
Merging  [55]
Splitting  [20]
Merging  [20]
Merging  [20, 55]
Merging  [20, 44, 55]
Merging  [20, 31, 44, 55, 77]
Merging  [17, 20, 26, 31, 44, 54, 55, 77, 93]
[17, 20, 26, 31, 44, 54, 55, 77, 93]


สำหรับการวิเคราะห์เวลานั้นมีความซับซ้อน กระบวนการหลักๆ คือการแบ่งข้อมูลทีละครึ่งไปเรื่อยๆ เป็นจำนวน $\log n$ ขั้น อีกส่วนหนึ่งคือการรวมข้อมูลซึ่งทุกข้อมูล $n$ ตัวจะต้องถูกเข้าถึงในทุกขั้น ดังนั้นเวลาทั้งหมดจึงเป็น $O(n \log n)$

## 5. การเรียงลำดับแบบเร็ว
เป็นการเรียงลำดับอีกวิธีที่ใช้วิธีการแก้ปัญหาแบบแบ่งแยกและเอาชนะ โดยใช้หลักการคือเลือกหยิบค่ามา 1 ค่าเพื่อเป็นหมุด (pivot) ในการเปรียบเทียบเพื่อแบ่งข้อมูลออกเป็นสองส่วนคือ ส่วนที่มีค่าน้อยกว่าหมุด และส่วนที่มีค่ามากกว่าหมุด ของแทนว่าเป็น list ชื่อ less กับ more นั่นหมายถวามว่าหลักจากที่เราแบ่งข้อมูลแล้ว less และ more ถูกนำไปเรียงลำดับเรียบร้อย เราจะสามารถนำ less ต่อด้วยหมุดต่อด้วย more ก็จะได้ข้อมูลที่เรียงลำดับ

อย่างไรก็ดีวิธีการแบ่งข้อมูลนั้นไม่จำเป็นต้องประกาศ list มาเพิ่ม เราสามารถใช้ดัชนีสองตัวสมมติคือ leftmark และ rightmark เพื่อทำการไล่ข้อมูลและสลับข้อมูลกันได้ โดยมีวิธีการดังนี้คือ
* เลือกค่าหมุดพร้อมดัชนีแล้วนำไปสลับกับค่าที่ดัชนี 0
* เริ่ม leftmark ที่ดัชนี 1 และ rightmark ที่ดัชนี n-1
* ทำวงวนเพื่อ
    * ไล่หา leftmark จนเจอดัชนีที่มีค่ามากกว่าค่าหมุด โดยไล่ด้วยการเพิ่มค่าดัชนี
    * ไล่หา rightmark จนเจอดัชนีที่มีค่าน้อยกว่าหมุด
    * สลับค่าที่ดัชนี leftmark และ rightmark
    * จบวงวนเมื่อ leftmark ข้าม rightmark หรือ leftmark > rightmark แล้วทำการสลับค่าที่ดัชนี 0 กับ rightmark เราจะได้ list ที่ตำแหน่ง rightmark เก็บค่าหมุดโดยที่ฝั่งซ้ายจะน้อยกว่าหมุดและฝั่งขวาจะมากกว่าหมุดเสมอ ตัวอย่างดัง  [รูปที่ 8](#figure_08) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheQuickSort.html)) 

<a name="figure_08"></a> 
![alt text](/files/imgs/partitionA.png)

* เริ่มที่การเลือกหมุดคือ 54 แล้วนำไปวางไว้ที่ดัชนี 0
* leftmark = 1 และ rightmark = 9-1 = 8
* วงวนสลับค่า
    * leftmark คือ 26 ยังไม่มากกว่า 54 เลื่อนไปเรื่อยๆ จนเจอ 93 
    * rightmark คือ 20 มากกว่า 54 แล้ว
    * สลับ 93 กับ 20
    * leftmark เลื่อนไปจนเจอ 77 
    * rightmark เลื่อนไปจนเจอ 44
    * สลัีบ 77 กับ 44
    * leftmark เลื่อนไปจนเจอ 77 ที่ดัชนี 6
    * rightmark เลื่อนไปจนเจอ 31 ที่ดัชนี 5
    * leftmark > rightmark เรารู้ทันทีว่า rightmark ชี้ไปยังค่าที่น้อยกว่า 54 แน่ๆ สลับกับ 54
    
ผลที่ได้ดัง [รูปที่ 9](#figure_09) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheQuickSort.html)) แล้วจึงนำข้อมูลทั้งสองฝั่งไปทำการแบ่งข้อมูลต่อ แต่จะไม่ขอลงรายละเอียดการเขียนโปรแกรม ณ ทีนี้

<a name="figure_09"></a> 
![alt text](/files/imgs/partitionB.png)

การวิเคราะห์เวลา ในกรณีปกติถ้าสามารถแบ่งข้อมูลได้เท่าๆ กันจะได้การแบ่ง $\log n$ ขั้นและแต่ละขั้นจะทำการเลื่อนตำแหน่งข้อมูล $n$ ครั้ง ดังนั้นเวลาที่ได้คือ $n \log n$ ซึ่งจะดีกว่าการเรียงแบบผสานเพราะไม่ต้องใช้เนื้อที่เพิ่ม แต่ในความเป็นจริงแล้วการวิเคราะห์เวลาแบบ Big-O จะต้องคำนึงถึงกรณีที่แย่ที่สุด

ลองนึกถึงกรณีที่การแบ่งนั้นไม่เท่ากัน หรือแย่ที่สุดคือเราหยิบหมุดแล้วได้แต่หมุดที่มีค่าน้อยที่สุด การแบ่งข้อมูลจะได้เฉพาะส่วนที่มากกว่าหมุด ข้อมูลที่ถูกแยกออกเป็นแค่หมุดเท่านั้นซึ่งแต่ละการแบ่งลดข้อมูลไปได้แค่ 1 ดังนั้นจะใช้ทั้งหมด $n-1$ ขั้น และทุกขั้นเลื่อนตำแหน่งข้อมูล $n$ จึงมี $O(n^2)$ 

ดังนั้นประเด็นสำคัญคือการเลือกหมุด ซึ่งมีผู้เสนอไว้ให้ใช้วิธีการเลือกด้วยค่ามัธยฐานของสามค่า (median of three) โดยค่าสามค่าเลือกมาจากค่าที่ดัชนีแรก สุดท้าย และกลาง ซึ่งทางปฏิบัตแล้วจะสามารถหลีกเลี่ยงกรณีที่แย่ที่สุดได้ ทำให้การเรียงแบบเร็วทำงานได้เร็วตามชื่อในทางปฏิบัติ
   
## 6. การค้นหาแบบตามลำดับ (sequential search)
เป็นการค้นหาค่าใน list ว่ามีอยู่หรือไม่ หรืออยู่ที่ดัชนีใด โดยวิธีการค้นหานั้นเริ่มจากการไล่หาที่ดัชนี 0 ไปเรื่อยๆ จนถึงดัชนีสุดท้าย ตัวอย่างแสดงใน [รูปที่ 10](#figure_10) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheSequentialSearch.html))

<a name="figure_10"></a> 
![alt text](/files/imgs/seqsearch.png)

In [6]:
def sequentialSearch(alist, item):
    pos = 0
    found = False

    while pos < len(alist) and not found:
        if alist[pos] == item:
            found = True
        else:
            pos = pos+1

    return found
    
testlist = [1, 2, 32, 8, 17, 19, 42, 13, 0]
print(sequentialSearch(testlist, 3))
print(sequentialSearch(testlist, 13))

False
True


ส่วนของรหัสไม่มีอะไรซับซ้อนโดยจะมี pos เป็นตัวไล่ดัชนีและมี found เป็นตัวแปรที่เก็บว่าเจอแล้วหรือยัง โดยเงื่อนไขของวนวง while คือ ถ้าดัชนียังไม่เกินและ found ยังเป็น False (อย่าลืมว่า not False = True) หรือภาษาที่เราเข้าใจคือยังไม่เจอ ถ้าเจอแล้ว found จะถูกกำหนดเป็น True ในบรรทัดที่ 6-7 แต่ถ้ายังไม่เจอจะทำการขยับดัชนีดังบรรทัดที่ 9

จากการค้นหาแบบตามลำดับนี้จะเห็นว่าหากเราหาข้อมูลไม่พบ เราจะต้องทำการค้นหาจนหมด list จึงจะตอบได้ว่าไม่เจอ แต่ถ้าหาก list นั้นถูกเรียงลำดับไว้แล้ว เราจะสามารถตอบได้กลางทางว่าไม่เจอข้อมูล เช่น [รูปที่ 11](#figure_11) (จาก [interactivepython](http://interactivepython.org/runestone/static/pythonds/SortSearch/TheSequentialSearch.html)) สมมติว่า list เรียงลำดับจากน้อยไปมาก และเราต้องการค้นหาค่า 50 เมื่อเราค้นหาไปเรื่อยๆ จนเจอ 54 เราก็รู้ได้เลยว่าไม่มี 50 แน่นอนเพราะค้นต่อไปก็จะเจอค่าที่มากกว่า 50 ทั้งนั้น

<a name="figure_11"></a> 
![alt text](/files/imgs/seqsearch2.png)

#### คำถาม
จงเขียนโปรแกรมเพื่อทำการค้นหาแบบตามลำดับในกรณีที่ list ถูกเรียงลำดับจากน้อยไปมาก

In [7]:
# try here

อย่างไรก็ดีการค้นหาแบบตามลำดับมีกรณีที่แย่ที่สุดคือต้องไล่หาให้ครบทุกข้อมูลดังนั้นจึงมี $O(n)$

## 7. การค้นหาแบบทวิภาค (binary search)
เป็นการค้นหาอีกแบบซึ่งต้องอาศัยชุดข้อมูลที่ถูกเรียงลำดับมาแล้วจึงจะสามารถทำงานได้ โดยหลักการทำงานคือจะตัดการค้นหาข้อมูลไปทีละครึ่งจนกว่าจะเจอหรือไม่เจอข้อมูลที่ต้องการค้นหา ข้อมูลสำคัญคือข้อมูลที่อยู่ตรงกลางซึ่งใช้ในการตัดข้อมูล โดยจะดูว่าข้อมูลตรงกลางนั้นมีค่ามากกว่าหรือน้อยกว่าค่าที่ต้องการค้นหา หากมีค่าน้อยกว่า หากข้อมูลตรงกลางมีค่ามากกว่า หมายความว่าข้อมูลฝั่งขวาสามารถตัดทิ้งได้ ในทางกลับกันหากข้อมูลตรงกลางมีค่าน้อยกว่า หมายความว่าข้อมูลฝั่งซ้ายสามารถตัดทิ้งได้ ตัวอย่างดัง [รูปที่ 12](#figure_12) 

<a name="figure_12"></a> 
![alt text](/files/imgs/bs1.png)
![alt text](/files/imgs/bs2.png)
![alt text](/files/imgs/bs3.png)
![alt text](/files/imgs/bs4.png)

เราต้องการค้นหา 50 เริ่มจาก list ที่มีดัชนี 2 ตัวคือ f กับ l แทน first กับ last ตัวกลาง m แทน middle (f = 0, l = 8, m = 4)
* พบว่า list[4] = 44 < 50 จึงทำการเลื่อน f ไปเป็น m+1 แล้วคำนวณ m ใหม่ (f = 5, l = 8, m = 6)
* พบว่า list[6] = 55 > 50 จึงทำการเลื่อน l ไปเป็น m-1 แล้วคำนวณ m ใหม่ (f = 5, l = 5, m = 5)
* พบว่า list[5] = 54 > 50 จึงทำการเลื่อน l ไปเป็น m-1 พบว่า f > l จึงหยุดทำแล้วตอบว่าหา 50 ไม่เจอ (f = 5, l = 4)

การเขียนรหัสเป็นดังนี้

In [8]:
def binarySearch(alist, item):
    first = 0
    last = len(alist)-1
    found = False

    while first<=last and not found:
        midpoint = (first + last)//2
        if alist[midpoint] == item:
            found = True
        else:
            if item < alist[midpoint]:
                last = midpoint-1
            else:
                first = midpoint+1

    return found

testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42,]
print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

False
True


ตัวแปรที่่กำหนดส่วนของ list ในการค้นหาคือ first และ last เราจะใช้วงวน while เพื่อค้นหาโดยจะค้นจนว่า first > last ถึงจะหยุด หรือพบข้อมูลที่ต้องการค้นหาคือ found = True ก็จะหยุดเช่นกัน
การเปรียบเทียบว่าเจอข้อมูลอยู่ตรงบรรทัดที่ 8 แต่หากยังไม่เจอจะทำการแบ่งข้อมูลเพื่อค้นหาต่อที่บรรทัดที่ 11 - 14 

การวิเคราะห์เรานั้น เนื่องจากข้อมูลในการเปรียบเทียบจะแบ่งลงทีละครึ่งจำนวนครั้งในการเปรียบเทียบจะไม่เกิน $\log n$ ดังนั้นจึงมี $O(\log n)$

นิสิตบางคนอาจจะโต้แย้งว่าการค้นหาแบบทวิภาคเร็วกว่าก็จริง แต่ถ้าข้อมูลที่ให้มาตั้งแต่แรกไม่เรียงลำดับต้องเสียเวลาเรียงลำดับ $O(n \log n)$ ไม่น่าจะเร็วกว่า คำตอบคือไม่เร็วกว่า แต่หากลองคิดดูว่าข้อมูลชุดเดียวกันนี้ต้องการการค้นหาหลายๆ ครั้ง การเรียงลำดับก่อนก็เริ่มจะคุ้มค่าแล้ว ทั้งนี้จะเลือกแบบใดอยู่ที่ทางปฏิบัติว่าเราจะเจอข้อมูลเดียวกันค้นหาหลายๆ ครั้งหรือไม่

นอกจากการใช้วงวนแล้วยังสามารถแก้ปัญหาได้ด้วยความสัมพันธ์แบบเวียนเกิด

#### คำถาม
จงออกแบบขั้นตอนวิธีและเขียนโปรแกรมการค้นหาแบบทวิภาคด้วยความสัมพันธ์แบบเวียนเกิด

In [9]:
# try here

## 8. ปัญหาอนาแกรม
เราเคยได้กล่าวมาแล้วว่าปัญหาอนาแกรมสามารถแก้ได้ด้วยการเรียงลำดับ แต่ไม่ใช่วิธีที่ดีที่สุด เราจะมาลองใช้วิธีการเรียงลำดับในการแก้ปัญหากันดู

In [10]:
def isAnagram(s0,s1) :
    if not (len(s0) == len(s1)) :
        return False
    else :
        l0 = list(s0)
        l1 = list(s1)
        
        l0.sort()
        l1.sort()
        
        isAna = True
        i = 0
        while i < len(l0) and isAna :
            if(l0[i] != l1[i]) :
                isAna = False
            
            i = i+1
                
        return isAna

s0 = "earth"
s1 = "heart"
s2 = "eartt"
s3 = "heart"
print(isAnagram(s0,s1))
print(isAnagram(s2,s3))

True
False


ประเด็นสำคัญของรหัสคือ เราต้องแปลงจาก string ให้เป็น list ก่อนในบรรทัดที่ 5-6 แล้วนำมาเรียงลำดับด้วยเมธอดที่ python list มีให้ในบรรทัดที่ 8-9 แล้วจึงใช้วงวน while ในการตรวจสอบว่าเป็นตัวอักษรเดียวกันหรือไม่