# Sorting

初级排序算法:
- 选择排序Selection
- 插入排序Insertion
- 希尔排序Shell

归并排序(merge sort):
- 自顶向下Merge
- 自底向上MergeBU

快速排序Quick

堆排序Heap:
- 优先队列MaxPQ, MinPQ

In [10]:
%classpath D:\\GoogleDrive\\wiki\\jupyter-notebooks\\Algorithms\\java

// 编译:: build.sh
// 清理: clean.sh

# 2.1 Selection sort

In [4]:
import sorting.core.*;

/**
 * 选择排序.
 * 
 * 总是选择剩余的未排序的元素中最小的元素.
 * 
 * 首先, 找到数组中最小的元素, 将其与第一个元素交换;
 * 然后, 找到第二小的元素, 将其与第二个元素交换;
 * 直到整个数组已排序.
 */
public class Selection<T extends Comparable<T>> extends Op<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    int N = a.length;
    for (int i = 0; i < N; i++) {
      int min = i;
      // 定位[i, N-1]中最小元素的位置
      for (int j = i + 1; j < N; j++) {
        if (super.less(a[j], a[min])) {
          min = j;
        }
      }
      // 将第i小的元素放在a[i]中
      super.exch(a, i, min);

      super.show(a);// DEBUG
    }
  }
}

Character[] a = SortingData.data();
Selection<Character> sorting = new Selection<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

A O R T E X S M P L E 
A E R T O X S M P L E 
A E E T O X S M P L R 
A E E L O X S M P T R 
A E E L M X S O P T R 
A E E L M O S X P T R 
A E E L M O P X S T R 
A E E L M O P R S T X 
A E E L M O P R S T X 
A E E L M O P R S T X 
A E E L M O P R S T X 
true
A E E L M O P R S T X 


# 2.2 Insertion sort

In [5]:
import sorting.core.*;

/**
 * 插入排序.
 * 
 * 桥牌的一次一张排序.
 * 
 * 从最左边到当前索引的部分已排序, 但这些元素不一定是最终的位置;
 * 后续遇到更小的元素时, 需要后移以留出位置供该小元素插入.
 */
public class Insertion<T extends Comparable<T>> extends Op<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    int N = a.length;
    for (int i = 1; i < N; i++) {
      // 将第i个元素放到左边部分已部分排序中的恰当位置: 通过依次左移一个元素
      for (int j = i; j > 0 && less(a[j], a[j - 1]); j--) {
        exch(a, j, j - 1);
      }

      super.show(a);// DEBUG
    }
  }
}

Character[] a = SortingData.data();
Insertion<Character> sorting = new Insertion<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

O S R T E X A M P L E 
O R S T E X A M P L E 
O R S T E X A M P L E 
E O R S T X A M P L E 
E O R S T X A M P L E 
A E O R S T X M P L E 
A E M O R S T X P L E 
A E M O P R S T X L E 
A E L M O P R S T X E 
A E E L M O P R S T X 
true
A E E L M O P R S T X 


# 2.3 Shellsort

In [6]:
import sorting.core.*;

/**
 * 希尔排序.
 * 
 * h有序数组: 数组中任意间隔为h的元素都是有序的;
 * 插入排序的扩展: 一次比较移动相邻的元素 => 先将多个各元素相距较远的h序列分别排序, 使得部分有序, 最终使用插入排序完成.
 */
public class Shell<T extends Comparable<T>> extends Op<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    int N = a.length;
    int h = 1; // h序列(h为序列中元素数量)

    while (h < N / 3) {
      h = h * 3 + 1;// 1,4,13,40,121,364,...
    }

    super.show(a); // DEBUG
    while (h >= 1) {
      System.out.println("h=" + h); // DEBUG

      // h序列排序
      for (int i = h; i < N; i++) {
        // 将a[i]插入a[i-h], a[i-2h], a[i-3h]...
        for (int j = i; j >= h && super.less(a[j], a[j - h]); j -= h) {
          super.exch(a, j, j - h);
        }
      }
      super.show(a); // DEBUG

      h = h / 3;
    }

  }
}

Character[] a = SortingData.data();
Shell<Character> sorting = new Shell<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

S O R T E X A M P L E 
h=4
E L A M P O E T S X R 
h=1
A E E L M O P R S T X 
true
A E E L M O P R S T X 


# 2.4 Top-down mergesort, Bottom-up mergesort

In [7]:
import sorting.core.*;

/**
 * 归并排序: 自顶向下.
 * 
 * 递归方式处理, 归并左右两部分的排序结果, 使得数组元素有序.
 */
public class Merge<T extends Comparable<T>> extends MergingOp<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    this.sort(a, 0, a.length - 1);
  }

  private void sort(T[] a, int lo, int hi) {
    if (hi <= lo) return;

    // 左右两部分分别排序
    int mid = lo + (hi - lo) / 2;
    this.sort(a, lo, mid);
    this.sort(a, mid + 1, hi);

    // 归并: 使得有序
    super.merge(a, lo, mid, hi); // 使用辅助数组

    super.show(a);// DEBUG
  }
}

Character[] a = SortingData.data();
Merge<Character> sorting = new Merge<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

O S R T E X A M P L E 
O R S T E X A M P L E 
O R S E T X A M P L E 
O R S E T X A M P L E 
E O R S T X A M P L E 
E O R S T X A M P L E 
E O R S T X A M P L E 
E O R S T X A M P E L 
E O R S T X A E L M P 
A E E L M O P R S T X 
true
A E E L M O P R S T X 


In [8]:
import sorting.core.*;

/**
 * 归并排序: 自底向上.
 * 
 * 将数组拆分为sz大小的多个部分, 将各部分分别通过归并排序;
 * 随着sz的增大, 数组由部分有序变为整体有序.
 */
public class MergeBU<T extends Comparable<T>> extends MergingOp<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    int N = a.length;

    // sz为子数组的大小: 1,2,4,8,...
    for (int sz = 1; sz < N; sz = sz + sz) {
      for (int lo = 0; lo < N - sz; lo += sz + sz) { // lo: 子数组的索引
        super.merge(a, lo, lo + sz - 1, Math.min(lo + sz + sz - 1, N - 1));
      }
      System.out.print("sz=" + sz + " ");
      super.show(a); // DEBUG
    }
  }
}

Character[] a = SortingData.data();
MergeBU<Character> sorting = new MergeBU<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

sz=1 O S R T E X A M L P E 
sz=2 O R S T A E M X E L P 
sz=4 A E M O R S T X E L P 
sz=8 A E E L M O P R S T X 
true
A E E L M O P R S T X 


# 2.5 Quicksort, Quicksort with 3-way partitioning

In [9]:
import sorting.core.*;
import support.Statistics;

/**
 * 快速排序.
 * 
 * 将数组划分为两个子数组, 将两部分独立的排序;
 * 与归并排序不同的是, 当两个子数组都有序时, 整个数组有序了.
 * 
 * 划分操作:a[lo..hi], 返回j
 * a[j]已排定;
 * a[lo..j-1]均不大于a[j];
 * a[j+1..hi]均不小于a[j].
 */
public class Quick<T extends Comparable<T>> extends Op<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    Statistics.shuffle(a); // 消除输入的依赖

    this.sort(a, 0, a.length - 1);
  }

  private void sort(T[] a, int lo, int hi) {
    if (hi <= lo) {
      return;
    }

    int j = this.partition(a, lo, hi); // 划分
    System.out.println("j=" + j); // DEBUG
    this.sort(a, lo, j - 1);
    this.sort(a, j + 1, hi);

    super.show(a); // DEBUG
  }

  /**
   * 划分为a[lo..j-1], a[j], a[j+1..hi], 使得a[lo..j-1] <= a[j] <= a[j+1..hi].
   * @param a
   * @param lo
   * @param hi
   * @return
   */
  private int partition(T[] a, int lo, int hi) {
    // 分别从左向右/从右向左遍历的索引
    int i = lo;
    int j = hi + 1;

    T v = a[lo]; // 选择第一个元素作为划分基元素v

    while (true) {
      // 从左向右, 找到比v小的元素
      while (super.less(a[++i], v)) {
        if (i == hi) {
          break;
        }
      }
      // 从右向左, 找到比v大的元素
      while (super.less(v, a[--j])) {
        if (j == lo) {
          break;
        }
      }
      if (i >= j) {
        // 两个索引已碰撞, 退出
        break;
      }
      // 交换两个索引上的元素, 以满足基元素两侧左小右大的约束
      super.exch(a, i, j);
      System.out.println("i=" + i + ", j=" + j); // DEBUG
    }

    // 交换第一个元素与从右向左遍历索引上的元素
    super.exch(a, lo, j);
    return j;
  }
}

Character[] a = SortingData.data();
Quick<Character> sorting = new Quick<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

i=2, j=3
j=2
j=1
A E E M X O R S P L T 
i=4, j=9
j=4
j=5
i=7, j=8
j=7
j=8
j=10
A E E L M O P R S T X 
A E E L M O P R S T X 
A E E L M O P R S T X 
A E E L M O P R S T X 
A E E L M O P R S T X 
A E E L M O P R S T X 
true
A E E L M O P R S T X 


# 2.6 Heap priority queue

## Min

In [12]:
import sorting.core.*;
import sorting.priority.*;

/**
 * 基于堆的优先队列.
 */
public class MinPQ<Key extends Comparable<Key>> extends ReheapifyOp<Key> {

  private Key[] pq; // 堆排序的完全二叉树, pq[0]未使用, 使用pq[1..N-1]
  private int N = 0;

  public MinPQ() {
  }

  @SuppressWarnings("unchecked")
  public MinPQ(int maxN) {
    pq = (Key[]) new Comparable[maxN + 1];
  }

  @SuppressWarnings("unchecked")
  public MinPQ(Key[] a) {
    N = a.length;
    pq = (Key[]) new Comparable[a.length + 1];
    for (int i = 0; i < N; i++) {
      pq[i + 1] = a[i];
    }
    super.show(pq); // DEBUG
    // 堆的构造
    for (int k = N / 2; k >= 1; k--) {
      this.sink(pq, k, N);
    }
    super.show(pq); // DEBUG

    if (!this.isMinHeap()) {
      throw new IllegalStateException("不是最小堆");
    }
  }

  /**
   * 上浮: 自底向上的堆有序化.
   * @param a
   * @param k
   */
  @Override
  public void swim(Key[] a, int k) {
    // 位置k的父节点在位置k/2
    while (k > 1 && super.greater(a, k / 2, k)) {
      this.exch(a, k / 2, k);
      k = k / 2;
    }
  }

  /**
   * 下沉: 自顶向下的堆有序化.
   * <p>
   * 最大元素位于数组末端后, 待排序数组大小会减少.
   * @param a
   * @param k
   * @param n 堆在数组a中实际使用的大小
   */
  @Override
  public void sink(Key[] a, int k, int n) {
    int N = n;

    while (2 * k <= N) {
      // 位置k的子节点在位置2k和2k+1
      int j = 2 * k;
      if (j < N && super.greater(a, j, j + 1)) {
        j++;
      }
      if (!super.greater(a, k, j)) {
        break;
      }
      this.exch(a, k, j);
      k = j;
    }
  }

  public void insert(Key v) {

    if (N == pq.length - 1) {
      this.resize(2 * pq.length); // 扩大
    }

    pq[++N] = v; // 加在最后一个位置

    this.swim(pq, N); // 上浮调整堆

    if (!this.isMinHeap()) {
      throw new IllegalStateException("不是最小堆");
    }
  }

  public Key min() {
    if (this.isEmpty()) {
      throw new IllegalArgumentException("empty!");
    }

    return pq[1];
  }

  public Key delMin() {
    Key min = pq[1]; // 顶部元素为最小键

    // 交换第一个和最后一个位置上元素
    super.exch(pq, 1, N--); // 堆减小
    pq[N + 1] = null;

    // 下沉调整堆
    this.sink(pq, 1, N);

    if ((N > 0) && (N == (pq.length - 1) / 4)) {
      this.resize(pq.length / 2); // 缩小
    }
    if (!this.isMinHeap()) {
      throw new IllegalStateException("不是最小堆");
    }

    return min;
  }

  public boolean isEmpty() {
    return N == 0;
  }

  public int size() {
    return N;
  }

  private void resize(int capacity) {
    if (capacity <= N) {
      throw new IllegalArgumentException("Too small capacity!");
    }

    @SuppressWarnings("unchecked")
    Key[] temp = (Key[]) new Comparable[capacity];
    for (int i = 1; i <= N; i++) {
      temp[i] = pq[i];
    }
    pq = temp;
  }

  /**
   * pq[1..N]是否是最小堆.
   * @return
   */
  private boolean isMinHeap() {
    return this.isMinHeap(1);
  }

  // pq[1..N]中以位置k为根的子树是否是最小堆
  private boolean isMinHeap(int k) {
    if (k > N) return true;

    int left = 2 * k;
    int right = 2 * k + 1;
    if (left <= N && super.greater(pq[k], pq[left])) {
      return false;
    }
    if (right <= N && super.greater(pq[k], pq[right])) {
      return false;
    }
    return this.isMinHeap(left) && this.isMinHeap(right);
  }
}

MinPQ<Character> pq = new MinPQ<>(SortingData.data());
Character c = null;
while ((c = pq.delMin()) != null) {
  System.out.print(c + " ");
}


null S O R T E X A M P L E 
null A E R M E X S T P L O 
A E E L M O P R S T X 

## Max

In [13]:
import sorting.core.*;
import sorting.priority.*;

/**
 * 基于堆的优先队列.
 */
public class MaxPQ<Key extends Comparable<Key>> extends ReheapifyOp<Key> {

  private Key[] pq; // 堆排序的完全二叉树, pq[0]未使用, 使用pq[1..N-1]
  private int N = 0;

  public MaxPQ() {
  }

  @SuppressWarnings("unchecked")
  public MaxPQ(int maxN) {
    pq = (Key[]) new Comparable[maxN + 1];
  }

  @SuppressWarnings("unchecked")
  public MaxPQ(Key[] a) {
    N = a.length;
    pq = (Key[]) new Comparable[a.length + 1];
    for (int i = 0; i < N; i++) {
      pq[i + 1] = a[i];
    }
    super.show(pq); // DEBUG
    // 堆的构造
    for (int k = N / 2; k >= 1; k--) {
      super.sink(pq, k, N);
    }
    super.show(pq); // DEBUG

    if (!this.isMaxHeap()) {
      throw new IllegalStateException("不是最大堆");
    }
  }

  public void insert(Key v) {

    if (N == pq.length - 1) {
      this.resize(2 * pq.length); // 扩大
    }

    pq[++N] = v; // 加在最后一个位置

    super.swim(pq, N); // 上浮调整堆

    if (!this.isMaxHeap()) {
      throw new IllegalStateException("不是最大堆");
    }
  }

  public Key max() {
    if (this.isEmpty()) {
      throw new IllegalArgumentException("empty!");
    }

    return pq[1];
  }

  public Key delMax() {
    Key max = pq[1]; // 顶部元素为最大键

    // 交换第一个和最后一个位置上元素
    super.exch(pq, 1, N--); // 堆减小
    pq[N + 1] = null;

    // 下沉调整堆
    super.sink(pq, 1, N);

    if ((N > 0) && (N == (pq.length - 1) / 4)) {
      this.resize(pq.length / 2); // 缩小
    }
    if (!this.isMaxHeap()) {
      throw new IllegalStateException("不是最大堆");
    }

    return max;
  }

  public boolean isEmpty() {
    return N == 0;
  }

  public int size() {
    return N;
  }

  private void resize(int capacity) {
    if (capacity <= N) {
      throw new IllegalArgumentException("Too small capacity!");
    }

    @SuppressWarnings("unchecked")
    Key[] temp = (Key[]) new Comparable[capacity];
    for (int i = 1; i <= N; i++) {
      temp[i] = pq[i];
    }
    pq = temp;
  }

  /**
   * pq[1..N]是否是最大堆.
   * @return
   */
  private boolean isMaxHeap() {
    return this.isMaxHeap(1);
  }

  // pq[1..N]中以位置k为根的子树是否是最大堆
  private boolean isMaxHeap(int k) {
    if (k > N) return true;

    int left = 2 * k;
    int right = 2 * k + 1;
    if (left <= N && super.less(pq[k], pq[left])) {
      return false;
    }
    if (right <= N && super.less(pq[k], pq[right])) {
      return false;
    }
    return this.isMaxHeap(left) && this.isMaxHeap(right);
  }
}

MaxPQ<Character> pq = new MaxPQ<>(SortingData.data());
Character c = null;
while ((c = pq.delMax()) != null) {
  System.out.print(c + " ");
}


null S O R T E X A M P L E 
null X T S P L R A M O E E 
X T S R P O M L E E A 

# 2.7 Heapsort

In [11]:
import sorting.core.*;
import sorting.priority.*;

/**
 * 堆排序.
 * 
 * 两个阶段:
 * (1) 堆的构造
 * 如果一个节点的两个子节点已经是堆了, 那么在该节点上调用sink()可以将它变为一个堆.
 * 从右向左, 在数组的前半部分调用sink()构造堆.
 * 
 * (2) 下沉排序
 * 将堆中最大元素与数组最后一个位置元素交换, 缩小堆, 通过下沉操作使得堆有序化.
 */
public class Heap<T extends Comparable<T>> extends ReheapifyOp<T> implements ISorting<T> {

  @Override
  public void sort(T[] a) {
    int N = a.length;

    // 堆的构造
    for (int k = N / 2; k >= 1; k--) {
      this.sink(a, k, N);
    }

    // 下沉排序: 将a[1..N]排序
    // 注意: 这里将exch()和less()中索引减一以实现a[0..N-1]的排序
    while (N > 1) {
      this.exch(a, 1, N--);
      this.sink(a, 1, N);
    }
  }

  @Override
  public boolean less(T[] a, int i, int j) {
    return a[i - 1].compareTo(a[j - 1]) < 0;
  }

  @Override
  public void exch(T[] a, int i, int j) {
    T t = a[i - 1];
    a[i - 1] = a[j - 1];
    a[j - 1] = t;
  }

  public static void main(String[] args) {

  }
}

Character[] a = SortingData.data();
Heap<Character> sorting = new Heap<>();
sorting.sort(a);
System.out.println(sorting.isSorted(a));
sorting.show(a);

true
A E E L M O P R S T X 
