# CH1 基础知识 

#### 黑盒子专栏 - list

Python中的list并不是传统意义上的列表，所以append操作会比insert操作效率高
<br>传统列表是链表
<br>Python中的list是数组 - 一整块单一连续的内存。

In [2]:
# 单链表
class Node:
    def __init__(self, value, next=None):
        self.value = value
        self.next = next

# 构造链表
L = Node("a", Node("b", Node("c", Node("d"))))

In [3]:
L.next.next.value

'c'

#### 使用timeit模块计时

In [4]:
import timeit
timeit.timeit("x=sum(range(10))")

0.8237282907909516

通过命令环境中的-m开关来调用timeit模块
```bash
python -m timeit -s"import mymoudle as m" "m.myfunction()"
```
timeit会运行多次，对于排序函数计算结果偏低

#### 使用profiler找出瓶颈

In [None]:
import cProfile
cProdfile.run(main()'')
# 可用profile代替

可视化代码调用[Python Call Graph](http://pycallgraph.slowchop.com)

两种常见性能图形化绘图：
* 反映问题规模与运行时间关系
* 相关运行时间的详细分布情况的盒型图

### 图与树的实现

用抽象术语来说，通常会倾向于采用被一种称为邻近函数N(v)的实现方式

#### 黑盒子专栏 - dict与set

在Python中，标准散列机制是由hash函数提供的，调用一个对象的`__hash__`方法：

In [5]:
hash(42)

42

In [6]:
hash("Hello, world!")

-8169609822927758064

散列值的构成基本上是在常数级时间内完成的，意味着我们对dict以及set中的元素进行访问时所耗费的（预期）时间都是常数级的。

如果某些代码保存在源文件中，希望引入交互式解释器，可以使用-i开关
```bash
python -i list_2_1.py
```
源文件会保留在交互式解释器中，以便我们可以在之后继续使用任何可用的全局定义。

#### 树的实现

In [10]:
# 二叉树类
class Tree:
    def __init__(self, left, right):
        self.left = left
        self.right = right

In [11]:
t = Tree(Tree('a', 'b'), Tree('c', 'd'))
t.right.left

'c'

In [30]:
# 多路搜索树
class Tree:
    def __init__(self, kids, next=None):
        self.kids = self.val = kids
        self.next = next

In [32]:
# 根节点下是a, b, c, d四个子节点
t = Tree(Tree("a", Tree("b", Tree("c", Tree("d")))))
t.kids.next.next.val

'c'

#### Bunch模式
当树这样的数据结构被原型化时，往往会是一个非常有用而灵活的类型，允许我们在其构造器中设置任何属性。在这种情况下，我们会需要用到一种叫做Bunch的设计模式，有许多实现方式，但基本都会具备以下要素：

In [34]:
class Bunch(dict):
    def __init__(self, *args, **kwds):
        super(Bunch, self).__init__(*args, **kwds)
        self.__dict__ = self

几个有用的方面。
<br>首先能让我们一命令行参数的形式创建相关对象，并设置任何属性：

In [35]:
x = Bunch(name='Jayne Cobb', position='Public Relations')
x.name

'Jayne Cobb'

其次，由于继承自dict类，可以自然而然地获得大量相关的内容，如对于相关键值/属性的遍历，或者简单的查询一个属性是否存在。

In [36]:
T = Bunch
t = T(left=T(left='a', right='b'), right=T(left='c'))
t.left

{'left': 'a', 'right': 'b'}

In [37]:
t.left.right

'b'

In [38]:
t['left']['right']

'b'

In [39]:
'left' in t.right

True

In [40]:
'right' in t.right

False

### 隐形平方级操作

In [None]:
# 从数据源提供的片段逐步构建字符串
chunks = []
for chunk in string_producer():
    chunks.append(chunk)
s = ''.join(chunks)

# 简化版本
s = ''.join(string_producer())

In [46]:
# sum进行的是平方级运行时间
lists = [[1,2],[3,4,5],[6]]
sum(list, [])

[1, 2, 3, 4, 5, 6]

In [48]:
# 更好的版本
res = []
for lst in lists:
    res.extend(lst)
res

[1, 2, 3, 4, 5, 6]

### 浮点数运算的麻烦

In [49]:
sum(0.1 for i in  range(10)) == 1.0

False

不要对浮点数进行等值比较，可以检查他们是否近似相等。采用与unittest模块中的assertAlmostEqual方法类似的思路。

In [50]:
def almost_quual(x, y, places=7):
    return round(abs(x-y), places) == 0

In [51]:
almost_quual(sum(0.1 for i in  range(10)), 1.0)

True

也可以用decimal模块表示某种精确的十进制浮点数表示法。

In [52]:
from decimal import *
sum(Decimal("0.1") for i in range(10)) == Decimal("1.0")

True

sage使用的是数学上的语义符号

In [None]:
sage: 3/5 * 11/7 + sqrt(5239)
13*sqrt(31) + 33/35

如果两个接近等值的表达式相减，通常会丢失大量有效数字，因此，想要提高精度，就得重写相关表达式。

In [54]:
from math import sqrt
x = 8762348761.13

In [55]:
sqrt(x + 1) - sqrt(x)

5.341455107554793e-06

In [56]:
1.0/(sqrt(x + 1) + sqrt(x))

5.3414570026237696e-06

应尽量避免相减