## SICP 习题 （2.69）解题总结：huffman树的生成

SICP 习题2.69沿着既有的方向前进，开始讲述huffman树的生成。

生成huffman树时输入是一堆的二元组，二元组里分别是符号和权重。

书中提及的解题思路是先把二元组按权重排序，然后把排好序的二元组转换成huffman树。

先考虑的是如何对二元组进行排序，书里面给了代码：

In [1]:
(define (adjoin-set x set)
  (cond ((null? set) (list x))
	((< (weight x) (weight (car set))) (cons x set))
	(else (cons (car set)
		    (adjoin-set x (cdr set))))))

(define (make-leaf-set pairs)
  (if (null? pairs)
      '()
      (let ((pair (car pairs)))
	(adjoin-set (make-leaf (car pair)
			       (cadr pair))
		    (make-leaf-set (cdr pairs))))))

基本思路和之前的(adjoin-set)是一样的，不同的是以前单纯根据元素的值进行排序，现在需要取元素的权重进行排序。

为了测试这个(make-leaf-set)函数，需要把前几道题的关于编码树的代码拷贝过来：

In [2]:
(define (make-leaf symbol weight)
  (list 'leaf symbol weight))

(define (leaf? object)
  (eq? (car object) 'leaf))

(define (symbol-leaf x) (cadr x))

(define (weight-leaf x) (caddr x))

(define (make-code-tree left right)
  (list left
	right
	(append (symbols left) (symbols right))
	(+ (weight left) (weight right))))

(define (left-branch tree) (car tree))

(define (right-branch tree) (cadr tree))

(define (symbols tree)
  (if (leaf? tree)
      (list (symbol-leaf tree))
      (caddr tree)))

(define (weight tree)
  (if (leaf? tree)
      (weight-leaf tree)
      (cadddr tree)))


测试一下，可以发现(make-leaf-set)函数可以针对输入二元组列表进行排序，排序的依据是二元组中的权重：

In [3]:
(make-leaf-set '((A 10) (B 5) (C 2) (D 13)))

((leaf C 2) (leaf B 5) (leaf A 10) (leaf D 13))

然后就来到题目的主体了，题目帮我们定义好了(generate-huffman-tree)函数，要求我们实现(successive-merge)函数。(generate-huffman-tree)函数做的事情就是先把输入的二元组列表进行排序，然后调用successive-merge

In [4]:
(define (generate-huffman-tree pairs)
  (successive-merge (make-leaf-set pairs)))

下面是successive-merge的实现。

这个方法的实现确实需要一点技巧，书里也有提示，让我们关注输入的序列是一个排序序列。

按题目上文的思路，基本上就是在输入的leafs里找到权重最小的两个元素，将这两个元素通过(make-code-tree)组合起来，然后在leafs里删除这两个元素，取而代之的是(make-code-tree)生成的树。

因为leafs是排序的，所以我们不需要搜索leafs，只需要处理leafs的前两个元素就好了，前两个就是最小的。

第二步麻烦一点，就是用两个元素的合成结果代替这两个元素，把两个元素删除比较简单，直接(cddr)就好了，如何把(make-code-tree)生成的结果放回去让我费了不少脑筋，因为我们要保证放了新元素以后的序列还是排序的。直接的想法是通过(adjoin-set)函数把新元素放进，但是刚开始的时候我没有意识到(adjoin-set)可以同时处理leaf和tree，总想着怎么通过一些技巧实现新元素的插入。

后来仔细看(adjoin-set)方法和(weight)方法，发现(weight)方法会根据输入元素是tree还是leaf做不同处理，意味着(adjoin-set)可以同时处理tree元素和leaf元素。

那问题就变得简单了，使用简单的递归就可以处理：


In [5]:
(define (successive-merge leafs)
  (cond ((null? leafs) '())
        ((= 1 (length leafs)) (car leafs))
        (else (successive-merge 
                   (adjoin-set 
                    (make-code-tree (car leafs) (cadr leafs))
                    (cddr leafs))))))

下面是一些测试代码：

In [6]:
(define sample-paris (make-leaf-set '((A 8) (B 3) (C 1) (D 1) (E 1) (F 1) (G 1) (H 1))))

In [7]:
sample-paris

((leaf H 1) (leaf G 1) (leaf F 1) (leaf E 1) (leaf D 1) (leaf C 1) (leaf B 3) (leaf A 8))

In [8]:
(define generate-code-tree (successive-merge sample-paris))

In [9]:
(weight generate-code-tree)

17

In [10]:
generate-code-tree

((leaf A 8) ((((leaf H 1) (leaf G 1) (H G) 2) ((leaf F 1) (leaf E 1) (F E) 2) (H G F E) 4) (((leaf D 1) (leaf C 1) (D C) 2) (leaf B 3) (D C B) 5) (H G F E D C B) 9) (A H G F E D C B) 17)

In [11]:

	

(define (start-test-2-69)
  (define new-sample-tree (generate-huffman-tree '((A 8) (B 3) (C 1) (D 1) (E 1) (F 1) (G 1) (H 1))))

  
  (display "new sample tree generates is:") (newline) (display new-sample-tree) (newline))

In [12]:
(start-test-2-69)

new sample tree generates is:
((leaf A 8) ((((leaf H 1) (leaf G 1) (H G) 2) ((leaf F 1) (leaf E 1) (F E) 2) (H G F E) 4) (((leaf D 1) (leaf C 1) (D C) 2) (leaf B 3) (D C B) 5) (H G F E D C B) 9) (A H G F E D C B) 17)
