## 算法复杂度

算法的复杂度决定了算法的可用性，复杂度低的算法可以用于很大的实例，复杂度高的算法只能用于很小的实例，可用性有限。所以对解决问题的算法分析其算法复杂度可以决定算法本身的性能以及改善方向。

算法复杂度分为 **时间复杂度 $T(n)$** 和 **空间复杂度 $S(n)$**。

### 大O表示法

对于单调的整数函数 f,如果存在一个整数函数 g 和实常数 c>0，使得对于充分大的 n 总有 $f(n)<c\cdot g(n)$,就说 g 是 f 的一个**渐近函数**，记为

$$f(n)=O(g(n))$$

易见，$f(n)=O(g(n))$ 说明在趋向无穷的极限意义下，函数 f 的增长速度受到函数 g 的约束。

把上述描述方式应用于算法的代价问题，假设存在函数 g ，使得算法 A 的处理规模为 n 的问题实例所用的时间 $T(n)=O(g(n))$,则称 $=O(g(n))$ 是算法 A 的**渐近时间复杂度**，简称**时间复杂度**。

空间复杂度 $S(n)$ 定义类似。

如果有 $T(n)=O(g(n))$，我们说函数 g(n) 是算法实际时间开销的一个上界，并不表示实际开销真正具有与 g(n) 同样的增长速度。

### 算法复杂度分析

在基本的循环程序中，涉及到顺序组合、条件分支和循环结构，其时间复杂度有以下规则：

1. 基本操作：认为其时间复杂度是 $O(1)$；


2. 加法规则(顺序复合)：如果算法是两个部分的顺序复合，其复杂性如下：

$$T(n) = T_1(n) +  T_2(n) = O(g_1(n)) + O(g_2(n)) = O(\max(g_1(n),g_2(n)))$$

3. 乘法规则(循环结构)： 如果算法片段是一个循环体，循环体将执行 $T_1(n)$ 次，每次执行需要 $T_2(n)$ 时间，则

$$T(n) = T_1(n) \times T_2(n) = O(g_1(n)) \times O(g_2(n)) = O(g_1(n)\times g_2(n))$$

4. 取最大规则(分支结构)： 如果算法是条件分支，两个分支的时间复杂性分别是 $T_1(n)$ 和 $T_2(n)$，则：

$$T(n) = O(\max(g_1(n),g_2(n)))$$

### python 程序的复杂度

**时间开销**

python 中很多基本操作的时间复杂度不是常量时间：

* 基本算术操作是 $O(1)$，逻辑运算是 $O(1)$；


* 组合对象的操作有些是常量，有些不是：

    * 复制和切片操作通常是 $O(n)$;
    
    * list 和 tuple 的元素访问和元素赋值，是常量时间；
    
    * dict 操作情况复杂，之后会详细讨论。
    


* 字符串应该看做是组合对象，许多操作不是常量时间；


* 创建对象需要付出空间和时间，空间和时间代价都与对象大小有关；


* 构造新的空结构（空表/空集合等）是常量时间操作，构造包含 n 个元素的操作，至少需要 $O(n)$ 的时间；


* 一些 list 操作的效率： 表元素访问和元素修改是 $O(1)$ 的时间，但一般的加入/删除元素操作（即使只加入一个元素）也是 $O(n)$ 的时间；


* 字典 dict 操作的效率：主要操作是加入新的关键码-值对和基于关键码值对查找关联值，它们最坏情况复杂度是 $O(n)$,平均复杂度是 $O(1)$。

**空间开销**

包含 n 个元素的集合或字典，至少需要占用 $O(n)$ 的存储空间。

## 数据结构及其分类

### 结构性数据结构

数据结构是一个二元组

$$D = (E,R)$$

其中 E 是数据结构 D 的元素集合，是某个数据集合 $\epsilon$ 的一个有穷子集， $R\in E\times E$ 是 D 的元素之间的某种关系。

根据 R 的不同，总结出如下几种典型的数据结构：

* **集合结构：** 对应的关系 R 是空集，也就是说数据元素之间没有明确关系。这样的数据结构也就是其元素的集合，这是最简单的一种数据结构；


* **序列结构：** 数据元素之间有明确的先后关系（顺序关系 或者称之为 序关系），除了最后的元素外，每个元素都有一个唯一的后继元素，所有元素排列成一个线性序列，关系 R 就是这里的**线性顺序关系**。我们也称这种结构为**线性结构**。

    序列结构还有一些变形，如 **环形结构** 和 $\rho$  **形结构**。
    
    
* **层次结构：** 数据元素分属于不同的层次，一个上层元素可以关联一个或者多个下层元素，关系 R 形成一种明确的层次性:只从上层到下层(通常也允许跨层)。

    层次关系可以分为很多简单或者复杂的子类别。
    
    
* **树形结构：** 层次结构中最简单的一种关系是**树形关系**，其特点是在一个树形结构中只有一个最上层数据元素，称为**根**，其余元素都是根的直接或间接关联的下层元素。


* **图结构：** 数据元素之间可以有复杂的相互关系，数学领域中的“图”概念就是这类结构的抽象，因此人们把这样的结构称之为 **图结构**，把这样复杂的对象称为**图对象**。

实际上，可以认为图结构包含了前面几类结构，把上面的结构看做图的受限模式。

### 功能性数据结构

除了上面提到的结构性数据结构，即元素之间存在某种特别的 R 关系的结构之外，还有一类是对元素的相互关系没有任何结构性要求，只要求实现比如 **存储、访问、删除等**功能性操作，我们称这一类为**功能性数据结构**。

功能性数据结构包括**栈、队列、优先队列、字典等**。

因为只有功能要求，这类数据结构可以采用任何技术实现。**实际中人们通常首先把这类结构映射到某种结构性的数据结构，之后采用相应的实现技术，有时也开发专门的实现技术。**

### 算法和程序中的数据结构

在算法和程序中，用数据结构存储信息，不仅要考虑如何把抽象的数据结构映射到计算机或者程序可以表达和操作的数据存储形式，还要考虑作用于具体数据结构的各种**操作**，比如**结构的建立、元素的访问、插入或者删除等一般性操作**。

**数据结构上的操作需要通过算法来实现**。对复杂的数据结构，如树结构和图结构，存在许多非常有趣且有用的算法。

## 抽象数据类型

**抽象数据类型**的基本想法是把数据定义为抽象的对象集合，为它们定义可用的合法操作，并不暴露其内部实现的具体细节，不论是其数据的表示细节还是操作的实现细节。首先需要能**构造**这种对象，而后能**操作**它们。抽象数据类型提供的操作应该满足以下三种：

1. **构造操作：** 基于一些已知的信息来定义和产生出这种类型的一个新对象。

    例如基于一对整数来产生一个有理数对象；或者基于两个已有的有理数对象，产生一个表示它们之**和**的有理数对象；
    

2. **解析操作：** 从一个对象取得有用的信息，结果反映了被操作对象的某方面特性或属性，但结果并不是本类型的对象。

    例如可能需要有两个操作，分别从一个有理数获取其分子或分母，操作的结果应该是整数类型的对象。
    
    
3. **变动操作：** 这类操作修改被操作对象的内部状态，但操作不会改变对象的类型。

    例如银行账户对象，应该提供检查余额和修改余额的操作等。

在Python 中，`str,tuple,frozenset` 类型只提供了前两类操作，因此是一个不变数据类型；`list,set,dict`是可变数据类型。

我们一般通过如下的方式来给出**抽象数据类型的描述**，以有理数抽象数据类型为例：
***
ADT Rational:    $\qquad\qquad\qquad\qquad$ # 定义有理数的抽象数据类型
   1. Rational(int num,int den)  $\qquad\qquad$ # 构造有理数 num/den
   2. +(Rational r1, Rational r2) $\qquad\quad$ # 求出表示 r1+r2 的有理数
   3. -(Rational r1, Rational r2) $\qquad\quad$ # 求出表示 r1-r2 的有理数
   4. $\times$(Rational r1, Rational r2) $\qquad\quad$ # 求出表示 $r1\times r2$ 的有理数
   5. /(Rational r1, Rational r2) $\qquad\quad$ # 求出表示 r1/r2 的有理数
   6. num(Rational r1)$\qquad\qquad\quad$ # 取得有理数 r1 的分子
   7. den(Rational r1)$\qquad\qquad\quad$ # 取得有理数 r1 的分母
   

***

这里的 `ADT` 含义是 `abstract data type`，ADT的定义部分主要描述了一组操作，操作包含两部分：

* 用特殊标识符或特殊符号给出操作名和操作的参数表；


* 用类似python 注释的形式给出操作的功能描述。

上述定义的抽象数据类型名字是`Rational`，一共提供了7个操作：

* 第一个是基本的构造对象的操作；

* 第2-5 是基于 Raional 对象来生成构造新的 Rational 对象；

* 第6-7 操作是解析操作，取得有理数对象的属性。

**有理数类的python实现**

In [28]:
class Rational0:
    @staticmethod
    def _gcd(m,n):
        if n==0:
            m,n = n,m
        while m!=0:
            m,n = n%m,m
        return n
    
    def __init__(self,num,den=1):
        if not isinstance(num,int) or not isinstance(den, int):
            raise TypeError
        if den == 0:
            raise ZeroDivisionError
        
        sign = 1
        if num <0:
            num,sign = -num, -sign
        if den <0:
            den,sign = -den, -sign
        
        g = Rational0._gcd(num,den)
        self.num = sign*(num//g)
        self.den = den//g
        
    def plus(self,another):
        den = self.den*another.den
        num = self.num*another.den + another.num*self.den
        return Rational0(num,den)
    
    def print(self):
        print('{}/{}'.format(self.num,self.den))

In [29]:
r1 = Rational0(1,3)
print('den is {};num is {}'.format(r1.den,r1.num))

den is 3;num is 1


In [30]:
r1.print()

1/3


In [31]:
r1.plus(Rational0(1,2)).print()

5/6


## Python  类

### 静态方法和类方法

在类的定义中，除了实例方法之外，还可以定义另外两类函数：

* 静态方法：定义形式是在 `def`行前面加上`@staticmethod`。静态方法实际上就是定义在类内部的普通函数，不需要 `self` 参数。


* 类方法：定义形式是在 `def`行前面加上`@classmethod`。这种方法必须有一个表示其调用类的参数，习惯以 `cls` 作为参数名，此外也可以加任意多的其他参数。人们通常用类方法实现与本类的所有对象有关的操作。

下面这个例子定义的类功能是维护一个计数器，记录程序运行过程中创建该类的实例对象的个数。

In [5]:
class Countable:
    counter = 0
    
    def __init__(self):
        Countable.counter += 1
    
    @classmethod
    def get_count(cls):
        return Countable.counter

In [6]:
x = Countable()
y = Countable()
z = Countable()
Countable.get_count()

3

### 类的继承与改写

In [13]:
class Person(object):
 
    def __init__(self, name, age):
        self.name = name
        self.age = age
        self.weight = 'weight'
 
    def talk(self):
        print("person is talking....")
        
    def look(self):
        print('person is looking....')
        

class Chinese(Person):
    def __init__(self, name, age, language): # 先继承，再重构
        Person.__init__(self, name, age)     #继承父类的构造方法
        self.language = language             # 定义类的本身属性
        print(self.name, self.age, self.weight, self.language)
        
    def talk(self):  # 子类 重构方法
        print('%s is speaking chinese' % self.name)
        
    def walk(self):
        print('is walking...')

In [14]:
c = Chinese('bigberg', 22, 'Chinese')
c.talk()
c.walk()
c.look()

bigberg 22 weight Chinese
bigberg is speaking chinese
is walking...
person is looking....


### 类的动态约束

In [18]:
class B:
    def f(self):
        self.g()
    
    def g(self):
        print('B.g called!')
        
class C(B):
    def g(self):
        print('C.g called!')

In [19]:
x = B()
x.f()

B.g called!


In [20]:
y = C()
y.f()

C.g called!


注意：当创建 C类实例 y 的时候，在 C 类中没有属性 f，所以会到 B 类里去寻找，但 B 类里的 f 返回的是 self.g 。

在Python 中，此时的 self 还是在创建实例刚开始时的 C 类，所以此时的 self.g 会重新返回 C 类中定义的方法 C.g。我们称这个为**动态约束**。