# 面向对象编程

## 模块

### 提出背景

- 代码复用
- 大量代码混杂在一个，容易出现变量重名等问题，难以维护

### 基本概念

- 一个py文件就是一个模块
- 类似于java中的package

### 优点

- 提高代码的可维护性
- 提高了代码的复用度，当一个模块完毕，可以被多个地方引用
- 引用其他的模块(内置模块和三方模块和自定义模块)
- 避免函数名和变量名的冲突

### 导入方式

```Python
#常见的几种格式
import numpy
from numpy import abs
from numpy import *
from random import randrange as rr
```

## 函数

### 函数定义

- def 函数名()

### 函数调用

- 函数名()

### 函数参数

####  关键字参数

- 如果参数中有位置参数也有关键字参数时，关键字参数必须放在所有位置参数之后，包括定义形参时也要按照这个原则

####  缺省参数

- python为了简化函数的调用，提供了默认参数机制 调用函数时，缺省参数的值如果没有传入，则被认为是默认值

####  不定长参数

- 有时可能需要一个函数能处理比当初声明时更多的参数。这些参数叫做不定长参数，声明时不会命名。

- 基本语法如下：
```Python
def functionname([formal_args,] *args, **kwargs):

    "函数_文档字符串"
    function_suite 
    return [expression]
```

- <font color=red>加了星号*的变量args会存放所有未命名的变量参数，args为元组；</font>

- <font color=red>而加**的变量kwargs会存放命名参数，即形如key=value的参数， kwargs为字典。</font>


### 函数返回值

- python中默认返回None

### 函数的嵌套调用

- 一个函数中调用其他函数

### 匿名函数

#### 定义

- 不使用def这样的语句定义函数，使用lambda来创建匿名函数

- 用lambda关键字能创建小型匿名函数

#### 语法

- lambda [arg1 [,arg2,.....argn]]:expression

- 或者：lambda arg1,arg2,……,argn:expression

#### 特点

- lambda只是一个表达式，函数体比def简单
- lambda的主体是一个表达式，而不是代码块，仅仅只能在lambda表达式中封装简单的逻辑
- lambda函数有自己的命名空间,且不能访问自由参数列表之外的或全局命名空间的参数
- 虽然lambda是一个表达式且看起来只能写一行，与C和C++内联函数不同。

#### 注意事项

- Lambda函数能接收任何数量的参数但只能返回一个表达式的值
- 匿名函数不能直接调用print，因为lambda需要一个表达式

#### 适用场景

- 逻辑简单
- 只用一次或极少次
- 作为参数

### global关键字

#### 变量作用域

- 局部作用域：定义在函数内部，仅函数内部使用

- 全局作用域：定义在函数外部，可供全局使用

#### 使用场景

- 如果想要在函数内部用全局定义的变量的话，就需要用到global关键字

- 使用示例：

```Python
a = 5

def hello():
    global a
    # 声明告诉执行引擎用的是全局变量a
    a = 1
    print('In test func: a = %d' % a)

hello()
print('Global a = %d' % a)

# 从函数输出可以看到：hello函数里成功修改了全局变量a.。如果不使用global就相当于函数内部自己定义的变量，不会影响外部的a
```

## 面向对象

### 面向对象编程

- “把一组数据结构和处理它们的方法组成对象（object），把相同行为的对象归纳为类（class），通过类的封装（encapsulation）隐藏内部细节，通过继承（inheritance）实现类的特化（specialization）和泛化（generalization），通过多态（polymorphism）实现基于对象类型的动态分派。”

- 三大要素：封装、继承、多态

### 面向对象思想

- 面向过程：根据业务逻辑从上到下写代码

- 面向对象：将数据与函数绑定到一起，进行封装，这样能够更快速的开发程序，减少了重复代码的重写过程

- 定义：

面向对象(object-oriented ;简称: OO) 至今还没有统一的概念 我这里把它定义为: 按人们 认识客观世界的系统思维方式,采用基于对象(实体) 的概念建立模型,模拟客观世界分析、设计、实现软件的办法。

面向对象编程(Object Oriented Programming-OOP) 是一种解决软件复用的设计和编程方法。 这种方法把软件系统中相近相似的操作逻辑和操作 应用数据、状态,以类的型式描述出来,以对象实例的形式在软件系统中复用,以达到提高软件开发效率的作用。


### 类和对象

- 面向对象编程的2个非常重要的概念：类和对象

- 对象是面向对象编程的核心，在使用对象的过程中，为了将具有共同特征和行为的一组对象抽象定义，提出了另外一个新的概念——类

- 类就相当于制造飞机时的图纸，用它来进行创建的飞机就相当于对象


#### 类

- 具有相似内部状态和运动规律的实体集合（或统称为抽象）

- 具有相同属性和行为事物的统称

- 类是抽象的，使用的时候，不是直接使用类，而是使用类的一个具体实例，即对象

#### 对象

- 某一个具体事物的存在 ,在现实世界中可以是看得见摸得着的。

- 可以是直接使用的

#### 类和对象的关系

- 类和对象之间的关系：
- 就像利用玩具的模型来创建多种不同的玩具
- 类就是创建对象的模板

#### 区分对象和类


- 奔驰汽车 类

- 奔驰smart 类 

> 张三的那辆奔驰smart 对象

- 狗 类

- 大黄狗 类 

> 李四家那只大黄狗 对象 

- 注意：这里的奔驰smart和大黄狗也是类，而不是对象。这也是自己混淆的地方。为什么说具体到谁家的大黄狗才是对象呢，因为通过上面对对象的定义可以发现：对象必须是实实在在存在的，看得见摸得着的。

#### 类的设计

类(Class) 由3个部分构成

    类的名称:类名
    类的属性:一组数据
    类的方法:允许对进行操作的方法 (行为)
    
#### 类的定义

```Python
# 定义类
class Car:
    # 方法
    def getCarInfo(self):
        print('车轮子个数:%d, 颜色%s'%(self.wheelNum, self.color))

    def move(self):
        print("车正在移动...")

```
- 定义类有两种方式：经典类和新式类，上述的定义方式为经典类，如是Car(object)则为新式类

- 类名的规则按照"大驼峰"命名

#### 对象的创建和使用

- 创建

对象名 = 类名()

- 使用

对象名.属性 或 对象名.方法

#### 访问可见性

- 公有的

正常定义的

- 私有的：双划线开始

`__xxx` 双下划线的表示的是私有类型的变量。只能是允许这个类本身进行访问了。连子类也

不可以


- 受保护的：单划线开始

`_xxx` 不能用于`from module import *` 以单下划线开头的表示的是protected类型的变量。

即保护类型只能允许其本身与子类进行访问。


> <font color=red>注意： `__xxx__` 定义的是特列方法。像`__init__`之类的</font>


但是，Python并没有从语法上严格保证私有属性或方法的私密性，它只是给私有的属性和方法换了一个名字来“妨碍”对它们的访问，

事实上如果你知道更换名字的规则仍然可以访问到它们


#### 调用父类方法

- 为了调用父类(超类)的一个方法，可以使用 super() 函数

super().xxx

- super() 函数的一个常见用法是在 init() 方法中确保父类被正确的初始化了

super().__init__

- Python3.x 和 Python2.x 的一个区别是: Python 3 可以使用直接使用 super().xxx 代替 super(Class, self).xxx


## 面向对象进阶

### @property装饰器


之前我们讨论过Python中属性和方法访问权限的问题，虽然我们不建议将属性设置为私有的，但是如果直接将属性暴露给外界也是有问题的，比如我们没有办法检查赋给属性的值是否有效。我们之前的建议是将属性命名以单下划线开头，通过这种方式来暗示属性是受保护的，不建议外界直接访问，那么如果想访问属性可以通过属性的getter（访问器）和setter（修改器）方法进行对应的操作。如果要做到这点，就可以考虑使用@property包装器来包装getter和setter方法，使得对属性的访问既安全又方便，代码如下所示。


```Python
class Person(object):

    def __init__(self, name, age):
        self._name = name
        self._age = age

    # 访问器 - getter方法
    @property
    def name(self):
        return self._name

    # 访问器 - getter方法
    @property
    def age(self):
        return self._age

    # 修改器 - setter方法
    @age.setter
    def age(self, age):
        self._age = age

    def play(self):
        if self._age <= 16:
            print('%s正在玩飞行棋.' % self._name)
        else:
            print('%s正在玩斗地主.' % self._name)


def main():
    person = Person('王大锤', 12)
    person.play()
    person.age = 22
    person.play()
    # person.name = '白元芳'  # AttributeError: can't set attribute


if __name__ == '__main__':
    main()

```

### __slots__魔法

讲到这里，不知道大家是否已经意识到，Python是一门[动态语言](https://zh.wikipedia.org/wiki/%E5%8A%A8%E6%80%81%E8%AF%AD%E8%A8%80)。通常，动态语言允许我们在程序运行时给对象绑定新的属性或方法，当然也可以对已经绑定的属性和方法进行解绑定。但是如果我们需要限定自定义类型的对象只能绑定某些属性，可以通过在类中定义\_\_slots\_\_变量来进行限定。需要注意的是\_\_slots\_\_的限定只对当前类的对象生效，对子类并不起任何作用。

```Python

class Person(object):

    # 限定Person对象只能绑定_name, _age和_gender属性
    __slots__ = ('_name', '_age', '_gender')

    def __init__(self, name, age):
        self._name = name
        self._age = age

    @property
    def name(self):
        return self._name

    @property
    def age(self):
        return self._age

    @age.setter
    def age(self, age):
        self._age = age

    def play(self):
        if self._age <= 16:
            print('%s正在玩飞行棋.' % self._name)
        else:
            print('%s正在玩斗地主.' % self._name)


def main():
    person = Person('王大锤', 22)
    person.play()
    person._gender = '男'
    # AttributeError: 'Person' object has no attribute '_is_gay'
    # person._is_gay = True

```

尽管slots看上去是一个很有用的特性，很多时候你还是得减少对它的使用冲动。 Python的很多特性都依赖于普通的基于字典的实现。 另外，定义了slots后的类不再支持一些普通类特性了，比如多继承。 大多数情况下，你应该只在那些经常被使用到的类上定义slots (比如在程序中需要创建某个类的几百万个实例对象)。

关于 __slots__ 的一个常见误区是它可以作为一个封装工具来防止用户给实例增加新的属性。 尽管使用slots可以达到这样的目的，但是这个并不是它的初衷。 __slots__ 更多的是用来作为一个内存优化工具。【通过限定属性可以减少对象属性个数，从而减少内存占用】


### 静态方法和类方法

#### 静态方法：@staticmethod

- 常规的方法是需要通过对象去访问的，而静态方法是可以通过类直接访问的方法， 使用示例：

```Python

from math import sqrt


class Triangle(object):

    def __init__(self, a, b, c):
        self._a = a
        self._b = b
        self._c = c

    @staticmethod
    def is_valid(a, b, c):
        return a + b > c and b + c > a and a + c > b

    def perimeter(self):
        return self._a + self._b + self._c

    def area(self):
        half = self.perimeter() / 2
        return sqrt(half * (half - self._a) *
                    (half - self._b) * (half - self._c))


def main():
    a, b, c = 3, 4, 5
    # 静态方法和类方法都是通过给类发消息来调用的
    if Triangle.is_valid(a, b, c):
        t = Triangle(a, b, c)
        print(t.perimeter())
        # 也可以通过给类发消息来调用对象方法但是要传入接收消息的对象作为参数
        # print(Triangle.perimeter(t))
        print(t.area())
        # print(Triangle.area(t))
    else:
        print('无法构成三角形.')


if __name__ == '__main__':
    main()

```

#### 类方法：@classmethod

- 类方法的第一个参数约定名为cls，它代表的是当前类相关的信息的对象（类本身也是一个对象，有的地方也称之为类的元数据对象）

- 通过这个参数我们可以获取和类相关的信息并且可以创建出类的对象

- 它的作用就是有点像静态类，比静态类不一样的就是它可以传进来一个当前类作为第一个参数。

- 先调用类方法进行预处理，之后才调用初始化方法

使用示例：


```Python

from time import time, localtime, sleep


class Clock(object):
    """数字时钟"""

    def __init__(self, hour=0, minute=0, second=0):
        self._hour = hour
        self._minute = minute
        self._second = second

    @classmethod
    def now(cls):
        ctime = localtime(time())
        return cls(ctime.tm_hour, ctime.tm_min, ctime.tm_sec)

    def run(self):
        """走字"""
        self._second += 1
        if self._second == 60:
            self._second = 0
            self._minute += 1
            if self._minute == 60:
                self._minute = 0
                self._hour += 1
                if self._hour == 24:
                    self._hour = 0

    def show(self):
        """显示时间"""
        return '%02d:%02d:%02d' % \
               (self._hour, self._minute, self._second)


def main():
    # 通过类方法创建对象并获取系统时间
    clock = Clock.now()
    while True:
        print(clock.show())
        sleep(1)
        clock.run()


if __name__ == '__main__':
    main()

```


### 封装


#### 数据封装

- 数据封装的主要原因是：保护隐私【私有属性】

#### 方法封装

- 封装方法的主要原因是：隔离复杂度【函数封装】

### 继承

- 基本概念

继承描述的是事物之间的所属关系，例如猫和狗都属于动物，程序中便可以描述为猫和狗继承自动物；

- 定义格式

子类在继承的时候，在定义类时，小括号()中为父类的名字

父类的属性、方法，会被继承给子类

#### 单继承

- 只继承自一个父类

```Python

#单继承
# 定义一个父类，如下:
class Cat(object):
    def __init__(self, name, color="白色"):
        self.name = name
        self.color = color
    def run(self):
        print("%s--在跑"%self.name)
        
# 定义一个子类，继承Cat类如下:
class Bosi(Cat):
    def setNewName(self, newName):
        self.name = newName

    def eat(self):
        print("%s--在吃"%self.name)


bs = Bosi("印度猫")
print('bs的名字为:%s'%bs.name)
print('bs的颜色为:%s'%bs.color)
bs.eat()
bs.setNewName('波斯')
bs.run()


"""
总结：
    私有的属性，不能通过对象直接访问，但是可以通过方法访问
    私有的方法，不能通过对象直接访问
    私有的属性、方法，不会被子类继承，也不能被访问
    一般情况下，私有的属性、方法都是不对外公布的，往往用来做内部的事情，起到安全的作用
""" 

``` 

#### 多继承

- 同时继承自多个父类

```Python

class A:
    def printA(self):
        print('----A----')

# 定义一个父类
class B:
    def printB(self):
        print('----B----')

# 定义一个子类，继承自A、B
class C(A,B):
    def printC(self):
        print('----C----')

obj_C = C()
obj_C.printA()
obj_C.printB()

``` 

## 多态

- 多态的概念是应用于Java和C#这一类强类型语言中，而Python崇尚“鸭子类型”。

动态语言调用实例方法时不检查类型，只要方法存在，参数正确，就可以调用。这就是动态语言的“鸭子类型”，它并不要求严格的继承体系，一个对象只要“看起来像鸭子，走起路来像鸭子”，那它就可以被看做是鸭子。

- Pyhton中所谓的多态：定义时的类型和运行时的类型不一样，此时就成为多态

- 一个父类有多个子类

## 继承和多态

- 上面提到了，可以在已有类的基础上创建新类，这其中的一种做法就是让一个类从另一个类那里将属性和方法直接继承下来，从而减少重复代码的编写。提供继承信息的我们称之为父类，也叫超类或基类；得到继承信息的我们称之为子类，也叫派生类或衍生类。子类除了继承父类提供的属性和方法，还可以定义自己特有的属性和方法，所以子类比父类拥有的更多的能力，在实际开发中，我们经常会用子类对象去替换掉一个父类对象，这是面向对象编程中一个常见的行为，对应的原则称之为里氏替换原则。

- 子类在继承了父类的方法后，可以对父类已有的方法给出新的实现版本，这个动作称之为方法重写（override）。通过方法重写我们可以让父类的同一个行为在子类中拥有不同的实现版本，当我们调用这个经过子类重写的方法时，不同的子类对象会表现出不同的行为，这个就是多态（poly-morphism）。

## 类属性和实例属性

- 类属性就是类对象所拥有的属性，它被所有类对象的实例对象所共有

- 在内存中只存在一个副本，这个和C++中类的静态成员变量有点类似。对于公有的类属性

- 在类外可以通过类对象和实例对象访问


## 内容小结

### 类的结构

#### 实例


1. 使用面向对象开发，第 1 步 是设计 类
2. 使用 类名() 创建对象，创建对象 的动作有两步：

    - 在内存中为对象 分配空间
    - 调用初始化方法 init 为 对象初始化
    
**对象创建后，内存 中就有了一个对象的 实实在在 的存在 —— 实例**

- 创建出来的 对象 叫做 类 的 实例
- 创建对象的 动作 叫做 实例化
- 对象的属性 叫做 实例属性
- 对象调用的方法 叫做 实例方法

在程序执行时：

- 对象各自拥有自己的 实例属性
- 调用对象方法，可以通过 self.
- 访问自己的属性
- 调用自己的方法

结论

- 每一个对象 都有自己 独立的内存空间，保存各自不同的属性
- 多个对象的方法，在内存中只有一份，在调用方法时，需要把对象的引用 传递到方法内部


#### 类是一个特殊的对象

- Python 中 一切皆对象：
    - class AAA: 定义的类属于 类对象
    - obj1 = AAA() 属于 实例对象
    - 在程序运行时，类 同样 会被加载到内存
- 在 Python 中，类 是一个特殊的对象 —— 类对象
    - 在程序运行时，类对象 在内存中 只有一份，使用 一个类 可以创建出 很多个对象实例
    - 除了封装 实例 的 属性 和 方法外，类对象 还可以拥有自己的 属性 和 方法
        - 类属性
        - 类方法
- 通过 类名. 的方式可以 访问类的属性 或者 调用类的方法


### 类属性和实例属性

#### 概念和使用

- 类属性 就是给 类对象 中定义的 属性
    - 通常用来记录 与这个类相关 的特征
    - 类属性 不会用于记录 具体对象的特征
    
#### 属性的获取机制

在 Python 中 属性的获取 存在一个 向上查找机制
- 因此，要访问类属性有两种方式：
    - 类名.类属性
    - 对象.类属性 （不推荐）

- 注意
    - 如果使用 对象.类属性 = 值 赋值语句，只会 给对象添加一个属性，而不会影响到 类属性的值
    
### 类方法和静态方法

#### 类方法

- 类属性就是针对类对象定义的属性

    - 使用赋值语句在class关键字下方可以定义类属性
    - 类属性用于记录与这个类相关的特征
- 类方法就是针对类对象定义的方法
    - 在类方法内部可以直接访问类属性或者调用其他的类方法

语法如下
```Python
@classmethod
def 类方法名(cls):
    pass
```

- 类方法需要用 修饰器 @classmethod 来标识，告诉解释器这是一个类方法
- 类方法的 第一个参数 应该是 cls
    - 由 哪一个类 调用的方法，方法内的 cls 就是 哪一个类的引用
    - 这个参数和 实例方法 的第一个参数是 self 类似
    - 提示 使用其他名称也可以，不过习惯使用 cls
- 通过 类名. 调用 类方法，调用方法时，不需要传递 cls 参数
- 在方法内部
    - 可以通过 cls. 访问类的属性
    - 也可以通过 cls. 调用其他的类方法
    

#### 静态方法

- 在开发时，如果需要在类中封装一个方法，这个方法：
    - 既 不需要 访问 实例属性 或者调用 实例方法
    - 也 不需要 访问 类属性 或者调用 类方法

这个时候，可以把这个方法封装成一个 静态方法

语法如下
```Python
@staticmethod
def 静态方法名():
    pass
```
- 静态方法 需要用 修饰器 @staticmethod 来标识，告诉解释器这是一个静态方法
- 通过 类名. 调用 静态方法


# 文件操作

##  文件打开

在python，使用open函数，可以打开一个已经存在的文件，或者创建一个新文件

open(文件名，访问模式)

示例如下：

    f = open('test.txt', 'w')

说明:
访问模式 	说明
r 	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

w 	打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

a 	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到

已有内容之后。如果该文件不存在，创建新文件进行写入。

rb 	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。

wb 	以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

ab 	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，

新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

r+ 	打开一个文件用于读写。文件指针将会放在文件的开头。

w+ 	打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

a+ 	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。

如果该文件不存在，创建新文件用于读写。

rb+ 	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。

wb+ 	以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

ab+ 	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。

如果该文件不存在，创建新文件用于读写。

## 文件关闭

使用函数： close( )

## 文件读写

```Python

#使用write()可以完成向文件写入数据
f = open('test.txt', 'w')
f.write('hello world, i am here!')
f.close()
"""
注意：
    如果文件不存在那么创建，如果存在那么就先清空，然后写入数据
"""    

```  

### open() 函数 和 with open() 的异同点

- with 语句在不再需要访问文件后将其关闭。让python自己判断什么时候该关闭，并自己去关闭。
- 直接使用open()方法打开文件，要自己调用close()方法关闭文件。如果程序存在bug，导致close()语句未执行，文件将不会关闭。这看似微不足道，但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调用close(),我们会发现需要使用文件时它已关闭(无法访问)，这会导致更多的错误。并非任何情况下都能轻松地确定关闭文件的恰当时机。
- open()后是一个对象，这个对象有read()方法与write()方法。


- 读取内容
    1. read()
        - read([size])方法：从文件当前位置起读取size个字节，若无参数size，则表示读取至文件结束为止，它返回为字符串对象.
    2. readlines()
        - readlines()方法：读取整个文件所有行，保存在一个列表(list)变量中，该列表可以由Python的for  in 结果进行处理，每行作为一个元素，但读取大文件会比较占内存。
    3. readline()
        - readline()方法：从字面意思可以看出，该方法每次读出一行内容，所以，读取时占用内存小，比较适合大文件，该方法返回一个字符串对象。
        
        
- 文件的写入
    - 写模式w特点：
        1. 只能写，不能读；
        2. 写的时候会把原来文件的内容清空；
        3. 当文件不存在时，会创建新文件。
    - 写读模式w+特点：
        1. 可以写，也可以读；
        2. 写的时候会把原来文件的内容清空；
        3. 当文件不存在时，会创建新文件。
    - 追加模式a特点：
        1. 不能读；
        2. 可以写，是追加写，即在原内容末尾添加新内容；
        3. 当文件不存在时，创建新文件。
    - 追加读a+模式特点：
        1. 可读可写；
        2. 写的时候是追加写，即在原内容末尾添加新内容；
        3. 当文件不存在时，创建新文件
        

## 文件读写常用模式


| 操作模式 | 具体含义                         |
| :--- | :--- |
|  `'r'`  |	只能读|
|  `'r+'`  |	可读可写，不会创建不存在的文件，从顶部开始写，会覆盖之前此位置的内容|
|  `'w'`  |	只能写，覆盖整个原有文件（不要乱用），不存在则创建|
|  `'w+'`  |	可读可写，如果文件存在，则覆盖整个文件，不存在则创建|
|  `'a'`  |	只能写，从文件底部添加内容 不存在则创建|
|  `'a+'`  |	可读可写 从文件顶部读取内容 从文件底部添加内容 不存在则创建|


## 文件定位读写

什么是定位？

- 通俗的将就是找到一个合适的位置
- 在软件开发中文件的读写定位该如何实现？

获取当前读写的位置

- 在读写文件的过程中，如果想知道当前的位置，可以使用tell()来获取，这里是光标开始的位置

定义到某个位置

- 如果在读写文件的过程中，需要从另外一个位置进行操作的话，可以使用seek()


## 文件重命名

os模块中的rename()可以完成对文件的重命名操作

- 格式：rename(需要修改的文件名, 新的文件名)


## 文件删除

概述：os模块中的remove()可以完成对文件的删除操作

- 格式：remove(待删除的文件名)


## 文件夹操作


### 创建文件夹

使用os模块中的mkdir()函数

- 格式：mkdir(str)


### 获取当前目录

使用os模块中的getcwd()函数

- 格式： getcwd()


### 获取目录列表

使用os模块中的listdir()函数

- 格式： listdir()


### 删除文件夹

使用os模块中的rmdir()函数

- 格式： rmdir(str)--->str:表示需要删除的文件夹名称

# 异常

## 异常的处理

### 捕获异常

- 捕获异常的基本格式：

try ... except


### try...finally...

- 在程序中，如果一个代码段必须要执行，即无论异常是否产生都要执行，那么此时就需要使用finally

- 比如文件关闭，释放锁，把数据库连接返还给连接池等


### 自定义异常

- 可以使用raise语句来引发一个异常


## 文件异常综合

### 读写文本文件

读取文本文件时，需要在使用`open`函数时指定好带路径的文件名（可以使用相对路径或绝对路径）并将文件模式设置为`'r'`（如果不指定，默认值也是`'r'`），然后通过`encoding`参数指定编码（如果不指定，默认值是None，那么在读取文件时使用的是操作系统默认的编码），如果不能保证保存文件时使用的编码方式与encoding参数指定的编码方式是一致的，那么就可能因无法解码字符而导致读取失败。下面的例子演示了如何读取一个纯文本文件。

```Python
def main():
    f = open('致橡树.txt', 'r', encoding='utf-8')
    print(f.read())
    f.close()


if __name__ == '__main__':
    main()
```

请注意上面的代码，如果`open`函数指定的文件并不存在或者无法打开，那么将引发异常状况导致程序崩溃。为了让代码有一定的健壮性和容错性，我们可以使用Python的异常机制对可能在运行时发生状况的代码进行适当的处理，如下所示。

```Python
def main():
    f = None
    try:
        f = open('致橡树.txt', 'r', encoding='utf-8')
        print(f.read())
    except FileNotFoundError:
        print('无法打开指定的文件!')
    except LookupError:
        print('指定了未知的编码!')
    except UnicodeDecodeError:
        print('读取文件时解码错误!')
    finally:
        if f:
            f.close()


if __name__ == '__main__':
    main()
```

在Python中，我们可以将那些在运行时可能会出现状况的代码放在`try`代码块中，在`try`代码块的后面可以跟上一个或多个`except`来捕获可能出现的异常状况。例如在上面读取文件的过程中，文件找不到会引发`FileNotFoundError`，指定了未知的编码会引发`LookupError`，而如果读取文件时无法按指定方式解码会引发`UnicodeDecodeError`，我们在`try`后面跟上了三个`except`分别处理这三种不同的异常状况。最后我们使用`finally`代码块来关闭打开的文件，释放掉程序中获取的外部资源，由于`finally`块的代码不论程序正常还是异常都会执行到（甚至是调用了`sys`模块的`exit`函数退出Python环境，`finally`块都会被执行，因为`exit`函数实质上是引发了`SystemExit`异常），因此我们通常把`finally`块称为“总是执行代码块”，它最适合用来做释放外部资源的操作。如果不愿意在`finally`代码块中关闭文件对象释放资源，也可以使用上下文语法，通过`with`关键字指定文件对象的上下文环境并在离开上下文环境时自动释放文件资源，代码如下所示。

```Python
def main():
    try:
        with open('致橡树.txt', 'r', encoding='utf-8') as f:
            print(f.read())
    except FileNotFoundError:
        print('无法打开指定的文件!')
    except LookupError:
        print('指定了未知的编码!')
    except UnicodeDecodeError:
        print('读取文件时解码错误!')


if __name__ == '__main__':
    main()
```

除了使用文件对象的`read`方法读取文件之外，还可以使用`for-in`循环逐行读取或者用`readlines`方法将文件按行读取到一个列表容器中，代码如下所示。

```Python
import time


def main():
    # 一次性读取整个文件内容
    with open('致橡树.txt', 'r', encoding='utf-8') as f:
        print(f.read())

    # 通过for-in循环逐行读取
    with open('致橡树.txt', mode='r') as f:
        for line in f:
            print(line, end='')
            time.sleep(0.5)
    print()

    # 读取文件按行读取到列表中
    with open('致橡树.txt') as f:
        lines = f.readlines()
    print(lines)
    

if __name__ == '__main__':
    main()
```

要将文本信息写入文件文件也非常简单，在使用`open`函数时指定好文件名并将文件模式设置为`'w'`即可。注意如果需要对文件内容进行追加式写入，应该将模式设置为`'a'`。如果要写入的文件不存在会自动创建文件而不是引发异常。下面的例子演示了如何将1-9999之间的素数分别写入三个文件中（1-99之间的素数保存在a.txt中，100-999之间的素数保存在b.txt中，1000-9999之间的素数保存在c.txt中）。

```Python
from math import sqrt


def is_prime(n):
    """判断素数的函数"""
    assert n > 0
    for factor in range(2, int(sqrt(n)) + 1):
        if n % factor == 0:
            return False
    return True if n != 1 else False


def main():
    filenames = ('a.txt', 'b.txt', 'c.txt')
    fs_list = []
    try:
        for filename in filenames:
            fs_list.append(open(filename, 'w', encoding='utf-8'))
        for number in range(1, 10000):
            if is_prime(number):
                if number < 100:
                    fs_list[0].write(str(number) + '\n')
                elif number < 1000:
                    fs_list[1].write(str(number) + '\n')
                else:
                    fs_list[2].write(str(number) + '\n')
    except IOError as ex:
        print(ex)
        print('写文件时发生错误!')
    finally:
        for fs in fs_list:
            fs.close()
    print('操作完成!')


if __name__ == '__main__':
    main()
```

### 读写二进制文件

知道了如何读写文本文件要读写二进制文件也就很简单了，下面的代码实现了复制图片文件的功能。

```Python
def main():
    try:
        with open('guido.jpg', 'rb') as fs1:
            data = fs1.read()
            print(type(data))  # <class 'bytes'>
        with open('吉多.jpg', 'wb') as fs2:
            fs2.write(data)
    except FileNotFoundError as e:
        print('指定的文件无法打开.')
    except IOError as e:
        print('读写文件时出现错误.')
    print('程序执行结束.')


if __name__ == '__main__':
    main()
```

### 读写JSON文件

通过上面的讲解，我们已经知道如何将文本数据和二进制数据保存到文件中，那么这里还有一个问题，如果希望把一个列表或者一个字典中的数据保存到文件中又该怎么做呢？答案是将数据以JSON格式进行保存。JSON是“JavaScript Object Notation”的缩写，它本来是JavaScript语言中创建对象的一种字面量语法，现在已经被广泛的应用于跨平台跨语言的数据交换，原因很简单，因为JSON也是纯文本，任何系统任何编程语言处理纯文本都是没有问题的。目前JSON基本上已经取代了XML作为异构系统间交换数据的事实标准。关于JSON的知识，更多的可以参考[JSON的官方网站](http://json.org)，从这个网站也可以了解到每种语言处理JSON数据格式可以使用的工具或三方库，下面是一个JSON的简单例子。

```JSON
{
    "name": "张三",
    "age": 36,
    "qq": 957658,
    "friends": ["王大锤", "白元芳"],
    "cars": [
        {"brand": "BYD", "max_speed": 180},
        {"brand": "Audi", "max_speed": 280},
        {"brand": "Benz", "max_speed": 320}
    ]
}
```

可能大家已经注意到了，上面的JSON跟Python中的字典其实是一样一样的，事实上JSON的数据类型和Python的数据类型是很容易找到对应关系的，如下面两张表所示。

| JSON                | Python       |
| :------------------- | :------------ |
| object              | dict         |
| array               | list         |
| string              | str          |
| number (int / real) | int / float  |
| true / false        | True / False |
| null                | None         |

| Python                                 | JSON         |
| :-------------------------------------- | :------------ |
| dict                                   | object       |
| list, tuple                            | array        |
| str                                    | string       |
| int, float, int- & float-derived Enums | number       |
| True / False                           | true / false |
| None                                   | null         |

我们使用Python中的json模块就可以将字典或列表以JSON格式保存到文件中，代码如下所示。

```Python
import json


def main():
    mydict = {
        'name': '张三',
        'age': 36,
        'qq': 957658,
        'friends': ['王大锤', '白元芳'],
        'cars': [
            {'brand': 'BYD', 'max_speed': 180},
            {'brand': 'Audi', 'max_speed': 280},
            {'brand': 'Benz', 'max_speed': 320}
        ]
    }
    try:
        with open('data.json', 'w', encoding='utf-8') as fs:
            json.dump(mydict, fs)
    except IOError as e:
        print(e)
    print('保存数据完成!')


if __name__ == '__main__':
    main()
```

json模块主要有四个比较重要的函数，分别是：

- `dump` - 将Python对象按照JSON格式序列化到文件中
- `dumps` - 将Python对象处理成JSON格式的字符串
- `load` - 将文件中的JSON数据反序列化成对象
- `loads` - 将字符串的内容反序列化成Python对象

这里出现了两个概念，一个叫序列化，一个叫反序列化。自由的百科全书[维基百科](https://zh.wikipedia.org/)上对这两个概念是这样解释的：“序列化（serialization）在计算机科学的数据处理中，是指将数据结构或对象状态转换为可以存储或传输的形式，这样在需要的时候能够恢复到原先的状态，而且通过序列化的数据重新获取字节时，可以利用这些字节来产生原始对象的副本（拷贝）。与这个过程相反的动作，即从一系列字节中提取数据结构的操作，就是反序列化（deserialization）”。

# 生成器

## 基本概念

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。

而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，

那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？

这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，

称为生成器：generator。


## 为什么要有生成器

列表所有数据都在内存中，如果有海量数据的话将会非常耗内存。

如：仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

如果列表元素按照某种算法推算出来，那我们就可以在循环的过程中不断推算出后续的元素，这样就不必创建完整的list，从而节省大量的空间。

简单一句话：我又想要得到庞大的数据，又想让它占用空间少，那就用生成器！


## 创建生成器

### 方法一

- 第一种方法很简单，只需要把一个列表生成式的[] 修改成(), 就创建了一个generator

eg: g = (x * x for x in range(10))


### 方法二

- 如果一个函数中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator。

- 调用函数就是创建了一个生成器（generator）对象。

语法形式：


```Python
def func():
    yield
func()
```

## 生成器的工作原理

- 生成器(generator)能够迭代的关键是它有一个next()方法，

    - 工作原理就是通过重复调用next()方法，直到捕获一个异常。

- 带有 yield 的函数不再是一个普通函数，而是一个生成器generator。

    - 可用next()调用生成器对象来取值。next 两种方式 t.__next__()  |  next(t)。

    - 可用for 循环获取返回值（每执行一次，取生成器里面一个值）

    （基本上不会用next()来获取下一个返回值，而是直接使用for循环来迭代）。

- yield相当于 return 返回一个值，并且记住这个返回的位置，下次迭代时，代码从yield的下一条语句开始执行。

- .send() 和next()一样，都能让生成器继续往下走一步（下次遇到yield停），但send()能传一个值，这个值作为yield表达式整体的结果

　　——换句话说，就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值，a = yield 5，第一次迭代到这里会返回5，a还没有赋值。第二次迭代时，使用.send(10)，那么，就是强行修改yield 5表达式的值为10，本来是5的，那么a=10
  

使用示例;

```Python

def yield_test(n):
    for i in range(n):
        yield call(i)
        print("i=",i)
    print("Done.")

def call(i):
    return i*2

for i in yield_test(5):
    print(i,",")

```

# 迭代器

## 基本概念

### 迭代

- 访问集合元素的一种方式

### 迭代器

- 是一个可以记住遍历的位置的对象

- 迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束


### 迭代器的特点

- 迭代器只能往前不能后退


## 迭代对象


以直接作用于for循环的对象统称为可迭代对象：Iterable

- 一类是集合数据类型，如 list 、 tuple 、 dict 、 set 、 str 等

- 一类是 generator ，包括生成器和带 yield 的generator function


## 迭代器使用

在Python中，迭代器是遵循迭代协议的对象，用来表示一连串数据流。重复调用迭代器的__next__()方法（或将其传给内置函数 next()）将逐个返回数据流中的项。当没有数据可用时则将引发 StopIteration 异常。

- 迭代器分为两类：

    - 使用iter()从任何序列对象中得到迭代器（如list, tuple, dict, set等）。
    - 输入迭代器generator （包括生成器和带 yield 的函数）。
- 迭代器有两个基本方法：

    - iter() 返回一个迭代器对象
    - next() 逐一返回迭代对象中的项
    
## Iterator和Iterable的区别

### Python中 list，truple，str，dict这些都可以被迭代，但他们并不是迭代器。为什么？

- 因为和迭代器相比有一个很大的不同，list/truple/map/dict这些数据的大小是确定的，也就是说有多少事可知的。但迭代器不是，迭代器不知道要执行多少次，所以可以理解为不知道有多少个元素，每调用一次next()，就会往下走一步，是惰性的。

### isinstance() 函数来判断一个对象是否是一个已知的类型，类似 type()

- isinstance() 与 type() 区别：

    - type() 不会认为子类是一种父类类型，不考虑继承关系。

    - isinstance() 会认为子类是一种父类类型，考虑继承关系。

如果要判断两个类型是否相同推荐使用 isinstance()。

#### 判断是不是可迭代的，使用Iterable

示例：


```Python

from collections import Iterable
isinstance({}, Iterable) 
isinstance((), Iterable) 
isinstance(100, Iterable)

```

#### 判断是不是迭代器，使用Iterator

示例：


```Python

#表示一个可以修改内核选项ast_node_interactivity,使得jupyter对独占一行的所有变量都自动显示
%config ZMQInteractiveShell.ast_node_interactivity='all'
from collections import Iterator
isinstance({}, Iterator)
isinstance((), Iterator)
isinstance( (x for x in range(10)), Iterator)

```

## 总结

- 凡是可以for循环的，都是Iterable

- 凡是可以next()的，都是Iterator

- 集合数据类型如list，truple，dict，str，都是Itrable不是Iterator，但可以通过iter()函数获得一个Iterator对象

# 装饰器

装饰器是程序开发中经常会用到的一个功能，用好了装饰器，开发效率如虎添翼，所以这也是Python面试中必问的问题

## 闭包

如果在一个函数的内部定义了另一个函数，外部的叫做外函数，内部的叫做内函数

- 什么是闭包？
    - 在一个外函数中定义了一个内函数，内函数里运用了外函数的临时变量，并且外函数的返回值是内函数的引用，这样就构成了一个闭包。

一般情况下，在我们认知当中，如果一个函数结束，函数的内部所有东西都会释放掉，还给内存，局部变量都会消失。但是闭包是一种特殊情况，如果外函数在结束的时候发现有自己的临时变量将来会在内部函数中用到，就把这个临时变量绑定给了内部函数，然后自己再结束。

一般一个函数运行结束的时候，临时变量会被销毁。但是闭包是一个特别的情况。当外函数发现，自己的临时变量会在将来的内函数中用到，自己在结束的时候，返回内函数的同时，会把外函数的临时变量同内函数绑定在一起。这样即使外函数已经结束了，内函数仍然能够使用外函数的临时变量。这就是闭包的强大之处。

- 闭包使用示例

```Python

#闭包函数的实例
# outer是外部函数 a和b都是外函数的临时变量
def outer( a ):
    b = 10
    # inner是内函数
    def inner():
        #在内函数中 用到了外函数的临时变量
        print(a+b)
    # 外函数的返回值是内函数的引用
    return inner

if __name__ == '__main__':
    # 在这里我们调用外函数传入参数5
    #此时外函数两个临时变量 a是5 b是10 ，并创建了内函数，然后把内函数的引用返回存给了demo
    # 外函数结束的时候发现内部函数将会用到自己的临时变量，这两个临时变量就不会释放，会绑定给这个内部函数
    demo = outer(5)
    # 我们调用内部函数，看一看内部函数是不是能使用外部函数的临时变量
    # demo存了外函数的返回值，也就是inner函数的引用，这里相当于执行inner函数
    demo() # 15

    demo2 = outer(7)
    demo2()#17

```


### 外函数返回了内函数的引用

引用是什么？在python中一切都是对象，包括整型数据1，函数，其实是对象。

　　当我们进行a=1的时候，实际上在内存当中有一个地方存了值1，然后用a这个变量名存了1所在内存位置的引用。引用就好像c语言里的指针，大家可以把引用理解成地址。a只不过是一个变量名字，a里面存的是1这个数值所在的地址，就是a里面存了数值1的引用。


　　相同的道理，当我们在python中定义一个函数def demo():  的时候，内存当中会开辟一些空间，存下这个函数的代码、内部的局部变量等等。这个demo只不过是一个变量名字，它里面存了这个函数所在位置的引用而已。我们还可以进行x = demo， y = demo， 这样的操作就相当于，把demo里存的东西赋值给x和y，这样x 和y 都指向了demo函数所在的引用，在这之后我们可以用x() 或者 y() 来调用我们自己创建的demo() ，调用的实际上根本就是一个函数，x、y和demo三个变量名存了同一个函数的引用。
  

　　有了上面的解释，我们可以继续说，返回内函数的引用是怎么回事了。对于闭包，在外函数outer中 最后return inner，我们在调用外函数 demo = outer() 的时候，outer返回了inner，inner是一个函数的引用，这个引用被存入了demo中。所以接下来我们再进行demo() 的时候，相当于运行了inner函数。

　　同时我们发现，一个函数，如果函数名后紧跟一对括号，相当于现在我就要调用这个函数，如果不跟括号，相当于只是一个函数的名字，里面存了函数所在位置的引用。
  

### 闭包中的内函数修改外函数的局部变量

在基本的python语法当中，一个函数可以随意读取全局数据，但是要修改全局数据的时候有两种方法:

- 1 global 声明全局变量 
- 2 全局变量是可变类型数据的时候可以修改


在闭包内函数也是类似的情况。在内函数中想修改闭包变量（外函数绑定给内函数的局部变量）的时候：

- 在python3中，可以用nonlocal 关键字声明 一个变量， 表示这个变量不是局部变量空间的变量，需要向上一层变量空间找这个变量。
   
- 在python2中，没有nonlocal这个关键字，我们可以把闭包变量改成可变类型数据进行修改，比如列表。

使用示例：

```Python

#修改闭包变量的实例
# outer是外部函数 a和b都是外函数的临时变量
def outer( a ):
    b = 10  # a和b都是闭包变量
    c = [a] #这里对应修改闭包变量的方法2
    # inner是内函数
    def inner():
        #内函数中想修改闭包变量
        # 方法1 nonlocal关键字声明
        nonlocal  b
        b+=1
        # 方法二，把闭包变量修改成可变数据类型 比如列表
        c[0] += 1
        print(c[0])
        print(b)
    # 外函数的返回值是内函数的引用
    return inner

if __name__ == '__main__':

    demo = outer(5)
    demo() # 6  11

```

使用闭包的过程中，一旦外函数被调用一次返回了内函数的引用，虽然每次调用内函数，是开启一个函数执行过后消亡，但是闭包变量实际上只有一份，每次开启内函数都在使用同一份闭包变量

使用示例：

```Python

def outer(x):
    def inner(y):
        nonlocal x
        x+=y
        return x
    return inner


a = outer(10)
print(a(1)) 
print(a(3)) 

```

总结：

- 函数名只是函数代码空间的引用，当函数名赋值给一个对象的时候，就是引用传递

- 闭包就是一个嵌套定义的函数，在外层运行时才开始内层函数的定义，然后将内部函数的引用传递函数外的对象

- 内部函数和使用的外部函数提供的变量构成的整体称为闭包


## 装饰器

### 什么是装饰器

顾名思义，从字面意思就可以理解，它是用来"装饰"Python的工具，使得代码更具有Python简洁的风格。换句话说，它是一种函数的函数，因为装饰器传入的参数就是一个函数，然后通过实现各种功能来对这个函数的功能进行增强。

装饰器的本质就是一个python的函数,它在不需要更改任何代码的前提下增加额外的功能,


### 为什么用装饰器

前面提到了，装饰器是通过某种方式来增强函数的功能。当然，我们可以通过很多方式来增强函数的功能，只是装饰器有一个无法替代的优势--简洁。

你只需要在每个函数上方加一个@就可以对这个函数进行增强。

使用示例：

In [None]:
# 如何理解装饰器
# 需求：
# 一个企业有N个业务部门，1个基础平台部门，基础平台负责提供底层的功能，
############### 基础平台提供的功能如下 ###############


def f1():
    print('f1')


def f2():
    print('f2')


def f3():
    print('f3')


def f4():
    print('f4')

############### 业务部门A 调用基础平台提供的功能 ###############


f1()
f2()
f3()
f4()

############### 业务部门B 调用基础平台提供的功能 ###############

f1()
f2()
f3()
f4()

# 第一版
############### 基础平台提供的功能如下 ###############


def f1():
    # 验证1
    # 验证2
    # 验证3
    print('f1')


def f2():
    # 验证1
    # 验证2
    # 验证3
    print('f2')


def f3():
    # 验证1
    # 验证2
    # 验证3
    print('f3')


def f4():
    # 验证1
    # 验证2
    # 验证3
    print('f4')

############### 业务部门不变 ###############
### 业务部门A 调用基础平台提供的功能###


f1()
f2()
f3()
f4()

### 业务部门B 调用基础平台提供的功能 ###

f1()
f2()
f3()
f4()


# 第二版
############### 基础平台提供的功能如下 ###############

def check_login():
    # 验证1
    # 验证2
    # 验证3
    pass


def f1():

    check_login()

    print('f1')


def f2():

    check_login()

    print('f2')


def f3():

    check_login()

    print('f3')


def f4():

    check_login()

    print('f4')


# 第三版
def w1(func):
    def inner():
        # 验证1
        # 验证2
        # 验证3
        func()
    return inner


@w1
def f1():
    print('f1')


@w1
def f2():
    print('f2')


@w1
def f3():
    print('f3')


@w1
def f4():
    print('f4')

In [None]:
from time import time, sleep


def fun_one():
    start = time()
    sleep(1)
    end = time()
    cost_time = end - start
    print("func one run time {}".format(cost_time))


def fun_two():
    start = time()
    sleep(1)
    end = time()
    cost_time = end - start
    print("func two run time {}".format(cost_time))


def fun_three():
    start = time()
    sleep(1)
    end = time()
    cost_time = end - start
    print("func three run time {}".format(cost_time))

In [None]:
def run_time(func):
    def wrapper():
        start = time()
        func()                  # 函数在这里运行
        end = time()
        cost_time = end - start
        print("func three run time {}".format(cost_time))
    return wrapper


@run_time
def fun_one():
    sleep(1)


@run_time
def fun_two():
    sleep(1)


@run_time
def fun_three():
    sleep(1)

### 在哪里使用装饰器

装饰器最大的优势是用于解决重复性的操作，其主要使用的场景有如下几个：

- 计算函数运行时间
- 给函数打日志
- 类型检查
- 插入日志、性能测试、事务处理、缓存、权限校验等场景，装饰器是解决这类问题的绝佳设计

**当然，如果遇到其他重复操作的场景也可以类比使用装饰器。**有了装饰器，我们就可以抽离出大量与函数功能本身无关的雷同代码到装饰器中并继续重用。

**概括的讲，装饰器的作用就是为已经存在的对象添加额外的功能。**

使用示例：

In [None]:
import logging
def use_logging(func):

    def wrapper():
        logging.warning("%s is running" % func.__name__)
        return func()   # 把 foo 当做参数传递进来时，执行func()就相当于执行foo()
    return wrapper


def foo():
    print('i am foo')


foo = use_logging(foo)  # 因为装饰器 use_logging(foo) 返回的是函数对象 wrapper，这条语句相当于
# foo = wrapper
foo()                   # 执行foo()就相当于执行 wrapper()

In [None]:
def use_logging(func):

    def wrapper():
        logging.warning("%s is running" % func.__name__)
        return func()
    return wrapper


@use_logging
def foo():
    print("i am foo")


foo()

### 使用装饰器的方法

- 方法一：不用语法糖@符号

- 方法二：采用语法糖@符号

use_logging 就是一个装饰器，它一个普通的函数，它把执行真正业务逻辑的函数 func 包裹在其中，看起来像 foo 被 use_logging 装饰了一样，use_logging 返回的也是一个函数，这个函数的名字叫 wrapper。


@语法糖：

- @ 符号就是装饰器的语法糖，它放在函数开始定义的地方，这样就可以省略最后一步再次赋值的操作。
- 有了 @ ，我们就可以省去foo = use_logging(foo)这一句了，直接调用 foo() 即可得到想要的结果。foo() 函数不需要做任何修改，只需在定义的地方加上装饰器，调用的时候还是和以前一样，如果我们有其他的类似函数，我们可以继续调用装饰器来修饰函数，而不用重复修改函数或者增加新的封装。这样，我们就提高了程序的可重复利用性，并增加了程序的可读性。


##### `*args、**kwargs`

可能有人问，如果我的业务逻辑函数 foo 需要参数怎么办？比如：
```Python
def foo(name):
    print("i am %s" % name)
```
我们可以在定义 wrapper 函数的时候指定参数：
```Python
def wrapper(name):
        logging.warn("%s is running" % func.__name__)
        return func(name)
    return wrapper
```
这样 foo 函数定义的参数就可以定义在 wrapper 函数中。这时，又有人要问了，如果 foo 函数接收两个参数呢？三个参数呢？更有甚者，我可能传很多个。当装饰器不知道 foo 到底有多少个参数时，我们可以用 *args 来代替：
```Python
def wrapper(*args):
        logging.warn("%s is running" % func.__name__)
        return func(*args)
    return wrapper
```
如此一来，甭管 foo 定义了多少个参数，我都可以完整地传递到 func 中去。这样就不影响 foo 的业务逻辑了。这时还有读者会问，如果 foo 函数还定义了一些关键字参数呢？比如：
```Python
def foo(name, age=None, height=None):
    print("I am %s, age %s, height %s" % (name, age, height))
```
这时，你就可以把 wrapper 函数指定关键字函数：
```Python 
def wrapper(*args, **kwargs):
        # args是一个数组，kwargs一个字典
        logging.warn("%s is running" % func.__name__)
        return func(*args, **kwargs)
    return wrapper

```

### 带参数的装饰器

上面说的是带参数的函数，这个小结是将带参数的装饰器

- 装饰器还有更大的灵活性，例如带参数的装饰器，在上面的装饰器调用中，该装饰器接收唯一的参数就是执行业务的函数 foo 。装饰器的语法允许我们在调用时，提供其它参数，比如@decorator(a)。这样，就为装饰器的编写和使用提供了更大的灵活性。比如，我们可以在装饰器中指定日志的等级，因为不同业务函数可能需要的日志级别是不一样的。

使用示例：

```Python 
def use_logging(level):
    def decorator(func):
        def wrapper(*args, **kwargs):
            if level == "warn":
                logging.warn("%s is running" % func.__name__)
            elif level == "info":
                logging.info("%s is running" % func.__name__)
            return func(*args)
        return wrapper

    return decorator


@use_logging(level="warn")
def foo(name='foo'):
    print("i am %s" % name)


foo()

```

上面的 use_logging 是允许带参数的装饰器。它实际上是对原有装饰器的一个函数封装，并返回一个装饰器。我们可以将它理解为一个含有参数的闭包。当我 们使用@use_logging(level="warn")调用的时候，Python 能够发现这一层的封装，并把参数传递到装饰器的环境中。

@use_logging(level="warn")等价于@decorator

### 内置装饰器

常见的内置装饰器有三种，@property、@staticmethod、@classmethod


#### @property的使用

@property是python的一种装饰器，是用来修饰方法的。@property是把类内方法当成属性来使用，使用@property装饰器来创建只读属性，@property装饰器会将方法转换为相同名称的只读属性，必须要有返回值，相当于getter；

只读属性就是只有@func.getter，没有定义@func.setter。

使用示例：

```Python 

class Car:
    def __init__(self, name, price):
        self._name = name
        self._price = price

    @property
    def car_name(self):
        return self._name
    # car_name可以读写的属性
    @car_name.setter
    def car_name(self, value):
        self._name = value
    # car_price是只读属性
    @property
    def car_price(self):
        return str(self._price) + '万'

```

#### @staticmethod的使用

@staticmethod 静态方法不能使用类变量和实例变量，装饰器的函数不传入self或者cls，则不能访问类属性和实例属性。

使用示例：

```Python 

class cal:
    cal_name = '计算器'
    def __init__(self,x,y):
        self.x = x
        self.y = y
    @property           #在cal_add函数前加上@property，使得该函数可直接调用，封装起来
    def cal_add(self):
        return self.x + self.y
    @classmethod        #在cal_info函数前加上@classmethon，则该函数变为类方法，该函数只能访问到类的数据属性，不能获取实例的数据属性
    def cal_info(cls):  #python自动传入位置参数cls就是类本身
        print('这是一个%s'%cls.cal_name)   #cls.cal_name调用类自己的数据属性
    @staticmethod       #静态方法 类或实例均可调用
    def cal_test(a,b,c): #改静态方法函数里不传入self 或 cls
        print(a,b,c)

```

#### @classmethod的使用

@classmethod是用来指定一个类的方法为类方法，没有此参数指定的类的方法为实例方法，类方法的第一个参数cls，而实例方法的第一个参数是self，表示该类的一个实例。

使用示例：

```Python 

class A(object):
    bar = 1

    def foo(self):
        print 'foo'

    @staticmethod
    def static_foo():
        print 'static_foo'
        print A.bar

    @classmethod
    def class_foo(cls):
        print 'class_foo'
        print cls.bar
        cls().foo()


A.static_foo()
A.class_foo()

```


### @staticmethod和@classmethod区别

@staticmethod：静态方法

@classmethod：类方法

一般来说，要使用某个类的方法，需要先实例化一个对象再调用方法。

而使用@staticmethod或@classmethod，就可以不需要实例化，直接通过类名就可以实现调用

使用：直接类名.方法名()来调用。@staticmethod和@classmethod都可以直接类名.方法名()来调用,

@staticmethod不需要表示自身对象的self和自身类的cls参数（这两个参数都不需要添加），就跟使用函数一样。

使用：直接类名.属性名或直接类名.方法名。

@classmethod也不需要self参数，但第一个参数需要是表示自身类的cls参数。

使用：直接类名.属性名或直接类名.方法名。

两者定义的装饰器调用方法一样，但是@classmethod装饰器定义的类方法需要传入类参数cls。

@staticmethod中要调用到这个类的一些属性方法，只能直接类名.属性名或类名.方法名。

而@classmethod有cls参数，可以来调用类的属性，类的方法，实例化对象等，避免硬编码更灵活。

- 不需要用到与类相关的属性和方法时，就用静态方法@staticmethod

- 需要用到与类相关的属性和方法，然后又想表明这个方法时整个类通用的，而不是对象特有的，就可以用类方法@classmethod


使用示例：

```Python 

class A(object):
    def foo(self, x):
        print("executing foo(%s, %s)" % (self, x))
    @classmethod
    def class_foo(cls, x):
        print("executing class_foo(%s, %s)" % (cls, x))
    @staticmethod
    def static_foo(x):
        print("executing static_foo(%s)" % x)
a = A()
#通过实例调用方法，对象实例a作为第一个参数隐式传递。
a.foo (1)
#对于类方法，对象实例的类将隐式地作为第一个参数而不是传递self
a.class_foo(1)
#使用这个类调用class_foo
A.class_foo(1)
#对于staticmethods,self(对象实例)和cls(类)都不会作为第一个参数隐式传递。它们的行为类似普通函数，除了你可以从实例或类中调用它们
a.static_foo(1)
A.static_foo('hi')
print(a.foo)
print(a.class_foo)
print(a.static_foo)
print(a.static_foo)

```

### 类装饰器

没错，装饰器不仅可以是函数，还可以是类，相比函数装饰器，类装饰器具有灵活度大、高内聚、封装性等优点。使用类装饰器主要依靠类的call方法，当使用 @ 形式将装饰器附加到函数上时，就会调用此方法。

使用示例：

```Python 

class Foo(object):
    def __init__(self, func):
        self._func = func

    def __call__(self):
        print('class decorator runing')
        self._func()
        print('class decorator ending')


@Foo
def bar():
    print('bar')


bar()

```

####  functools.wraps

使用装饰器极大地复用了代码，但是他有一个缺点就是原函数的元信息不见了，比如函数的docstring、name、参数列表，先看例子：

示例：

```Python 

# 装饰器
def logged(func):
    def with_logging(*args, **kwargs):
        print(func.__name__)     # 输出 'with_logging'
        print(func.__doc__)      # 输出 None
        return func(*args, **kwargs)
    return with_logging

# 函数
@logged
def f(x):
    """does some math"""
    return x + x * x


logged(f)

```

不难发现，函数 f 被with_logging取代了，当然它的docstring，\__name__就是变成了with_logging函数的信息了。好在我们有functools.wraps，wraps本身也是一个装饰器，它能把原函数的元信息拷贝到装饰器里面的 func 函数中，这使得装饰器里面的 func 函数也有和原函数 foo 一样的元信息了。

修改后示例：

```Python 

from functools import wraps


def logged(func):
    @wraps(func)
    def with_logging(*args, **kwargs):
        print(func.__name__)      # 输出 'f'
        print(func.__doc__)      # 输出 'does some math'
        return func(*args, **kwargs)
    return with_logging


@logged
def f(x):
    """does some math"""
    return x + x * x

```

### 装饰器的顺序

一个函数还可以同时定义多个装饰器，比如：
```Python
@a
@b
@c
def f ():
    pass
```
它的执行顺序是从里到外，最先调用最里层的装饰器，最后调用最外层的装饰器，它等效于
```Python
f = a(b(c(f)))
```

### 装饰器的基本使用示例

```Python 

#定义函数：完成包裹数据
def makeBold(fn):
    def wrapped():
        return "<b>" + fn() + "</b>"
    return wrapped

#定义函数：完成包裹数据
def makeItalic(fn):
    def wrapped():
        return "<i>" + fn() + "</i>"
    return wrapped

@makeBold
def test1():
    return "hello world-1"

@makeItalic
def test2():
    return "hello world-2"

@makeBold
@makeItalic
def test3():
    return "hello world-3"

print(test1())
print(test2())
print(test3())

```

### 自定义属性的装饰器

预先定义了装饰器run_time，它就会按照我们定义的流程去工作，只具备这固定的一种功能，当然，我们前面介绍的通过带参数的装饰器让它具备了一定的灵活性，但是依然不够灵活。其实，我们还可以对装饰器添加一些属性，就如同给一个类定义实现不同功能的方法那样。

以输出日志为例，初学Python的同学都习惯用print打印输出信息，其实这不是一个好习惯，当开发商业工程时，你很容易把一些信息暴露给用户。在开发过程中，我更加鼓励使用日志进行输出，通过定义WARNING、DEBUG、INFO等不同等级来控制信息的输出，比如INFO是可以给用户看到的，让用户直到当前程序跑到哪一个阶段了。DEBUG是用于开发人员调试和定位问题时使用。WARING是用于告警和提示。

那么问题来了，如果我们预先定义一个打印日志的装饰器，
```Python
def logger_info(func):
    logmsg = func.__name__
    def wrapper():
        func() 
        log.log(logging.INFO, "{} if over.".format(logmsg))
    return wrapper
```

logging.INFO是打印日志的等级，如果我们仅仅写一个基本的日志装饰器logger_info，那么它的灵活度太差了，因为如果我们要输出DEBUG、WARING等级的日志，还需要重新写一个装饰器。

解决这个问题，有两个解决方法：
- 利用前面所讲的带参数装饰器，把日志等级传入装饰器
- 利用自定义属性来修改日志等级

由于第一种已经以统计函数运行时间的方式进行讲解，这里主要讲解第二种方法。

使用示例：

```Python

import logging
from functools import partial


def wrapper_property(obj, func=None):
    if func is None:
        return partial(wrapper_property, obj)
    setattr(obj, func.__name__, func)
    return func


def logger_info(level, name=None, message=None):
    def decorate(func):
        logmsg = message if message else func.__name__

        def wrapper(*args, **kwargs):
            logging.log(level, logmsg)
            return func(*args, **kwargs)

        @wrapper_property(wrapper)
        def set_level(newlevel):
            nonlocal level
            level = newlevel

        @wrapper_property(wrapper)
        def set_message(newmsg):
            nonlocal logmsg
            logmsg = newmsg
            
        return wrapper
    return decorate


@logger_info(logging.WARNING)
def main(x, y):
    return x + y


main(3, 3)
main.set_level(logging.ERROR)
main(5, 5)

# 输出：
WARNING:root:main
ERROR:root:main
10

```

# Python 性能优化的一些建议


## 合理使用copy 与 deepcopy

对于dict和list等数据结构的对象，直接赋值使用的是引用的方式。

而有些情况下需要复制整个对象，这时可以使用copy包里的copy和deepcopy，这两个函数的不同之处在于后者是递归复制的。

示例：

```Python

import copy

a = range(100000)

%timeit -n 10 copy.copy(a) # 运行10次 copy.copy(a)

%timeit -n 10 copy.deepcopy(a)

# 输出
457 ns ± 191 ns per loop (mean ± std. dev. of 7 runs, 10 loops each)
5.58 µs ± 928 ns per loop (mean ± std. dev. of 7 runs, 10 loops each)

```
**timeit后面的-n表示运行的次数**


## 优化包含多个判断表达式的顺序

对于and，应该把满足条件少的放在前面，对于or，把满足条件多的放在前面。


## 使用级联比较x < y < z

测试示例：

```Python

x, y, z = 1,2,3

%timeit -n 1000000 if x < y < z:pass

%timeit -n 1000000 if x < y and y < z:pass


# 输出
65.9 ns ± 0.878 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
70.7 ns ± 0.239 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

```


## 不借助中间变量交换两个变量的值 

使用a,b=b,a而不是c=a;a=b;b=c;来交换a,b的值，可以快1倍以上。

测试示例:

```Python

# 交换变量测试
%%timeit -n 10000
a, b = 1, 2
c = a
a = b
b = c

# 输出
68.2 ns ± 18.7 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


# 不交换变量测试
%%timeit -n 10000
a, b = 1, 2
a, b = b, a

# 输出
78.5 ns ± 7.82 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

```


## while 1 比 while Ture 更快        

while 1 比 while true快很多


## 使用** 而不是pow

**会是快10倍以上！

测试示例

```Python

%timeit -n 10000 c = pow(2,20)
%timeit -n 10000 c = 2**20

# 输出
517 ns ± 66.6 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
20 ns ± 1.03 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

```


## 在排序时使用键

Python含有许多古老的排序规则，这些规则在你创建定制的排序方法时会占用很多时间，而这些排序方法运行时也会拖延程序实际的运行速度。最佳的排序方法其实是尽可能多地使用键和内置的sort()方法。譬如，拿下面的代码来说：

使用示例：

```Python

import operator

somelist = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]
somelist.sort(key=operator.itemgetter(0))
somelist

# 输出：
[(1, 5, 8), (6, 2, 4), (9, 7, 5)]

somelist.sort(key=operator.itemgetter(1))
somelist

# 输出：
[(6, 2, 4), (1, 5, 8), (9, 7, 5)]

```

在每段例子里，list都是根据你选择的用作关键参数的索引进行排序的。这个方法不仅对数值类型有效，还同样适用于字符串类型。


## 针对循环的优化

每一种编程语言都强调最优化的循环方案。当使用Python时，你可以借助丰富的技巧让循环程序跑得更快。

然而，开发者们经常遗忘的一个技巧是：尽量避免在循环中访问变量的属性。

举例说明：

```Python

# 方式1：
lowerlist = ['this', 'is', 'lowercase']
upper = str.upper
upperlist = []
append = upperlist.append

for word in lowerlist:
    append(upper(word))

print(upperlist)

# 输出
['THIS', 'IS', 'LOWERCASE']


# 方式2
lowerlist = ['this', 'is', 'lowercase']
print([i.upper() for i in lowerlist])

# 输出
['THIS', 'IS', 'LOWERCASE']


```

每次你调用str.upper, Python都会计算这个式子的值。然而，如果你把这个求值赋值给一个变量，那么求值的结果就能提前知道，Python程序就能运行得更快。因此，关键就是尽可能减小Python在循环中的工作量。因为Python解释执行的特性，在上面的例子中会大大减慢它的速度。


（注意：优化循环的方法还有很多，这只是其中之一。比如，很多程序员会认为，列表推导式是提高循环速度的最佳方法。关键在于，优化循环方案是提高应用程序运行速度的上佳选择。）


对循环的优化所遵循的原则是尽量减少循环过程中的计算量，有多重循环的尽量将内层的计算提到上一层等。


## 尝试多种编程方法

每次创建应用时都使用同一种编码方法几乎无一例外会导致应用的运行效率不尽人意。可以在程序分析时尝试一些试验性的办法。譬如说，在处理字典中的数据项时，你既可以使用安全的方法，先确保数据项已经存在再进行更新，也可以直接对数据项进行更新，把不存在的数据项作为特例分开处理。

举例说明：

```Python

# 代码1：
n = 16
myDict = {}
for i in range(0, n):
    char = 'abcd'[i%4]
    if char not in myDict:
        myDict[char] = 0
    myDict[char] += 1
print(myDict)

# 输出
{'a': 4, 'b': 4, 'c': 4, 'd': 4}


# 当一开始myDict为空时，这段代码会跑得比较快。然而，通常情况下，myDict填满了数据，至少填有大部分数据，这时换另一种方法会更有效率。

# 方式2
n = 16
myDict = {}
for i in range(0, n):
    char = 'abcd'[i%4]
    try:
        myDict[char] += 1
    except KeyError:
        myDict[char] = 1
print(myDict)

# 输出
{'a': 4, 'b': 4, 'c': 4, 'd': 4}


```

在两种方法中输出结果都是一样的。区别在于输出是如何获得的。跳出常规的思维模式，创建新的编程技巧能使你的应用更有效率。


## 使用生成器和列表解析

一个普遍被忽略的内存优化是生成器的使用。

一个很好地例子就是创建一个很大的列表并将它们拼合在一起。

测试示例：

```Python

%timeit -n 100 a = (i for i in range(100000))

%timeit -n 100 b = [i for i in range(100000)]

# 输出：
560 ns ± 9.25 ns per loop (mean ± std. dev. of 7 runs, 100 loops each)
4.4 ms ± 275 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

```

使用()得到的是一个generator对象，所需要的内存空间与列表的大小无关，所以效率会高一些。

在具体应用上，比如set(i for i in range(100000))会比set([i for i in range(100000)])快。


但是对于需要循环遍历的情况，两者差不多。

测试示例：

```Python

%timeit -n 10 for x in (i for i in range(100000)): pass

%timeit -n 10 for x in [i for i in range(100000)]: pass

# 输出：
6.22 ms ± 939 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
7.5 ms ± 1.12 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

```


## 改进算法，选择合适的数据结构

- 一个良好的算法能够对性能起到关键作用，因此性能改进的首要点是对算法的改进。在算法的时间复杂度排序上依次是：

O(1) -> O(lg n) -> O(n lg n) -> O(n^2) -> O(n^3) -> O(n^k) -> O(k^n) -> O(n!)

因此如果能够在时间复杂度上对算法进行一定的改进，对性能的提高不言而喻。

### 优化算法时间复杂度

- 算法的时间复杂度对程序的执行效率影响最大，在Python中可以通过选择合适的数据结构来优化时间复杂度，

- 如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。

- 不同的场景有不同的优化方式，总得来说，一般有分治，分支界限，贪心，动态规划等思想。


### 使用dict 或 set 查找元素

- python dict和set都是使用hash表来实现(类似c++11标准库中unordered_map)，查找元素的时间复杂度是O(1)

### 字典与列表

- Python 字典中使用了hash table，因此查找操作的复杂度为 O(1)，而 list 实际是个数组，在 list 中，查找需要遍历整个 list，其复杂度为 O(n)，因此对成员的查找访问等操作字典要比 list 更快。

- 因此在需要多数据成员进行频繁的查找或者访问的时候，使用 dict 而不是 list 是一个较好的选择。


### 集合与列表

- set 的 union， intersection，difference 操作要比 list 的迭代要快。因此如果涉及到求 list 交集，并集或者差的问题可以转换为 set 来操作。

set常见用法


| 语法 |	操作 |	说明 |
|:-----------------------|:-----------------------|:--|
| set(list1) ｜ set(list2)| 	union	| 包含 list1 和 list2 所有数据的新集合| 
| set(list1) & set(list2)	| intersection| 	包含 list1 和 list2 中共同元素的新集合| 
| set(list1) - set(list2)	| difference	| 在 list1 中出现但不在 list2 中出现的元素的集合| 


## 充分利用Lazy if-evaluation 的特性

python 中条件表达式是 lazy evaluation 的，也就是说如果存在条件表达式 if x and y，在 x 为 false 的情况下 y 表达式的值将不再计算。因此可以利用该特性在一定程度上提高程序效率。


## 字符串的优化

python 中的字符串对象是不可改变的，因此对任何字符串的操作如拼接，修改等都将产生一个新的字符串对象，而不是基于原字符串，因此这种持续的 copy 会在一定程度上影响 python 的性能。对字符串的优化也是改善性能的一个重要的方面，特别是在处理文本较多的情况下。字符串的优化主要集中在以下几个方面：

- 在字符串连接的使用尽量使用 join() 而不是 +：

- 当对字符串可以使用正则表达式或者内置函数来处理的时候，选择内置函数。

- f-string比format、格式化以及拼接速度快


## 使用局部变量，避免“global”关键字

python 访问局部变量会比全局变量要快得多，因 此可以利用这一特性提升性能。


## if done is not None 比语句 if done != None 更快

测试示例：

```Python

#使用if is
a = range(10000)

%timeit -n 100 [i for i in a if i == True]

%timeit -n 100 [i for i in a if i is True]


# 输出：
382 µs ± 6.51 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
273 µs ± 9.33 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

```