# 面向对象编程

## 模块

### 提出背景

- 代码复用
- 大量代码混杂在一个，容易出现变量重名等问题，难以维护

### 基本概念

- 一个py文件就是一个模块
- 类似于java中的package

### 优点

- 提高代码的可维护性
- 提高了代码的复用度，当一个模块完毕，可以被多个地方引用
- 引用其他的模块(内置模块和三方模块和自定义模块)
- 避免函数名和变量名的冲突

### 导入方式

```Python
#常见的几种格式
import numpy
from numpy import abs
from numpy import *
from random import randrange as rr
```

## 函数

### 函数定义

- def 函数名()

### 函数调用

- 函数名()

### 函数参数

####  关键字参数

- 如果参数中有位置参数也有关键字参数时，关键字参数必须放在所有位置参数之后，包括定义形参时也要按照这个原则

####  缺省参数

- python为了简化函数的调用，提供了默认参数机制 调用函数时，缺省参数的值如果没有传入，则被认为是默认值

####  不定长参数

- 有时可能需要一个函数能处理比当初声明时更多的参数。这些参数叫做不定长参数，声明时不会命名。

- 基本语法如下：
```Python
def functionname([formal_args,] *args, **kwargs):

    "函数_文档字符串"
    function_suite 
    return [expression]
```

- <font color=red>加了星号*的变量args会存放所有未命名的变量参数，args为元组；</font>

- <font color=red>而加**的变量kwargs会存放命名参数，即形如key=value的参数， kwargs为字典。</font>


### 函数返回值

- python中默认返回None

### 函数的嵌套调用

- 一个函数中调用其他函数

### 匿名函数

#### 定义

- 不使用def这样的语句定义函数，使用lambda来创建匿名函数

- 用lambda关键字能创建小型匿名函数

#### 语法

- lambda [arg1 [,arg2,.....argn]]:expression

- 或者：lambda arg1,arg2,……,argn:expression

#### 特点

- lambda只是一个表达式，函数体比def简单
- lambda的主体是一个表达式，而不是代码块，仅仅只能在lambda表达式中封装简单的逻辑
- lambda函数有自己的命名空间,且不能访问自由参数列表之外的或全局命名空间的参数
- 虽然lambda是一个表达式且看起来只能写一行，与C和C++内联函数不同。

#### 注意事项

- Lambda函数能接收任何数量的参数但只能返回一个表达式的值
- 匿名函数不能直接调用print，因为lambda需要一个表达式

#### 适用场景

- 逻辑简单
- 只用一次或极少次
- 作为参数

### global关键字

#### 变量作用域

- 局部作用域：定义在函数内部，仅函数内部使用

- 全局作用域：定义在函数外部，可供全局使用

#### 使用场景

- 如果想要在函数内部用全局定义的变量的话，就需要用到global关键字

- 使用示例：

```Python
a = 5

def hello():
    global a
    # 声明告诉执行引擎用的是全局变量a
    a = 1
    print('In test func: a = %d' % a)

hello()
print('Global a = %d' % a)

# 从函数输出可以看到：hello函数里成功修改了全局变量a.。如果不使用global就相当于函数内部自己定义的变量，不会影响外部的a
```

## 面向对象

### 面向对象编程

- “把一组数据结构和处理它们的方法组成对象（object），把相同行为的对象归纳为类（class），通过类的封装（encapsulation）隐藏内部细节，通过继承（inheritance）实现类的特化（specialization）和泛化（generalization），通过多态（polymorphism）实现基于对象类型的动态分派。”

- 三大要素：封装、继承、多态

### 面向对象思想

- 面向过程：根据业务逻辑从上到下写代码

- 面向对象：将数据与函数绑定到一起，进行封装，这样能够更快速的开发程序，减少了重复代码的重写过程

- 定义：

面向对象(object-oriented ;简称: OO) 至今还没有统一的概念 我这里把它定义为: 按人们 认识客观世界的系统思维方式,采用基于对象(实体) 的概念建立模型,模拟客观世界分析、设计、实现软件的办法。

面向对象编程(Object Oriented Programming-OOP) 是一种解决软件复用的设计和编程方法。 这种方法把软件系统中相近相似的操作逻辑和操作 应用数据、状态,以类的型式描述出来,以对象实例的形式在软件系统中复用,以达到提高软件开发效率的作用。


### 类和对象

- 面向对象编程的2个非常重要的概念：类和对象

- 对象是面向对象编程的核心，在使用对象的过程中，为了将具有共同特征和行为的一组对象抽象定义，提出了另外一个新的概念——类

- 类就相当于制造飞机时的图纸，用它来进行创建的飞机就相当于对象


#### 类

- 具有相似内部状态和运动规律的实体集合（或统称为抽象）

- 具有相同属性和行为事物的统称

- 类是抽象的，使用的时候，不是直接使用类，而是使用类的一个具体实例，即对象

#### 对象

- 某一个具体事物的存在 ,在现实世界中可以是看得见摸得着的。

- 可以是直接使用的

#### 类和对象的关系

- 类和对象之间的关系：
- 就像利用玩具的模型来创建多种不同的玩具
- 类就是创建对象的模板

#### 区分对象和类


- 奔驰汽车 类

- 奔驰smart 类 

> 张三的那辆奔驰smart 对象

- 狗 类

- 大黄狗 类 

> 李四家那只大黄狗 对象 

- 注意：这里的奔驰smart和大黄狗也是类，而不是对象。这也是自己混淆的地方。为什么说具体到谁家的大黄狗才是对象呢，因为通过上面对对象的定义可以发现：对象必须是实实在在存在的，看得见摸得着的。

#### 类的设计

类(Class) 由3个部分构成

    类的名称:类名
    类的属性:一组数据
    类的方法:允许对进行操作的方法 (行为)
    
#### 类的定义

```Python
# 定义类
class Car:
    # 方法
    def getCarInfo(self):
        print('车轮子个数:%d, 颜色%s'%(self.wheelNum, self.color))

    def move(self):
        print("车正在移动...")

```
- 定义类有两种方式：经典类和新式类，上述的定义方式为经典类，如是Car(object)则为新式类

- 类名的规则按照"大驼峰"命名

#### 对象的创建和使用

- 创建

对象名 = 类名()

- 使用

对象名.属性 或 对象名.方法

#### 访问可见性

- 公有的

正常定义的

- 私有的：双划线开始

`__xxx` 双下划线的表示的是私有类型的变量。只能是允许这个类本身进行访问了。连子类也

不可以


- 受保护的：单划线开始

`_xxx` 不能用于`from module import *` 以单下划线开头的表示的是protected类型的变量。

即保护类型只能允许其本身与子类进行访问。


> <font color=red>注意： `__xxx__` 定义的是特列方法。像`__init__`之类的</font>


但是，Python并没有从语法上严格保证私有属性或方法的私密性，它只是给私有的属性和方法换了一个名字来“妨碍”对它们的访问，

事实上如果你知道更换名字的规则仍然可以访问到它们


#### 调用父类方法

- 为了调用父类(超类)的一个方法，可以使用 super() 函数

super().xxx

- super() 函数的一个常见用法是在 init() 方法中确保父类被正确的初始化了

super().__init__

- Python3.x 和 Python2.x 的一个区别是: Python 3 可以使用直接使用 super().xxx 代替 super(Class, self).xxx


## 面向对象进阶

### @property装饰器


之前我们讨论过Python中属性和方法访问权限的问题，虽然我们不建议将属性设置为私有的，但是如果直接将属性暴露给外界也是有问题的，比如我们没有办法检查赋给属性的值是否有效。我们之前的建议是将属性命名以单下划线开头，通过这种方式来暗示属性是受保护的，不建议外界直接访问，那么如果想访问属性可以通过属性的getter（访问器）和setter（修改器）方法进行对应的操作。如果要做到这点，就可以考虑使用@property包装器来包装getter和setter方法，使得对属性的访问既安全又方便，代码如下所示。


```Python
class Person(object):

    def __init__(self, name, age):
        self._name = name
        self._age = age

    # 访问器 - getter方法
    @property
    def name(self):
        return self._name

    # 访问器 - getter方法
    @property
    def age(self):
        return self._age

    # 修改器 - setter方法
    @age.setter
    def age(self, age):
        self._age = age

    def play(self):
        if self._age <= 16:
            print('%s正在玩飞行棋.' % self._name)
        else:
            print('%s正在玩斗地主.' % self._name)


def main():
    person = Person('王大锤', 12)
    person.play()
    person.age = 22
    person.play()
    # person.name = '白元芳'  # AttributeError: can't set attribute


if __name__ == '__main__':
    main()

```

### __slots__魔法

讲到这里，不知道大家是否已经意识到，Python是一门[动态语言](https://zh.wikipedia.org/wiki/%E5%8A%A8%E6%80%81%E8%AF%AD%E8%A8%80)。通常，动态语言允许我们在程序运行时给对象绑定新的属性或方法，当然也可以对已经绑定的属性和方法进行解绑定。但是如果我们需要限定自定义类型的对象只能绑定某些属性，可以通过在类中定义\_\_slots\_\_变量来进行限定。需要注意的是\_\_slots\_\_的限定只对当前类的对象生效，对子类并不起任何作用。

```Python

class Person(object):

    # 限定Person对象只能绑定_name, _age和_gender属性
    __slots__ = ('_name', '_age', '_gender')

    def __init__(self, name, age):
        self._name = name
        self._age = age

    @property
    def name(self):
        return self._name

    @property
    def age(self):
        return self._age

    @age.setter
    def age(self, age):
        self._age = age

    def play(self):
        if self._age <= 16:
            print('%s正在玩飞行棋.' % self._name)
        else:
            print('%s正在玩斗地主.' % self._name)


def main():
    person = Person('王大锤', 22)
    person.play()
    person._gender = '男'
    # AttributeError: 'Person' object has no attribute '_is_gay'
    # person._is_gay = True

```

尽管slots看上去是一个很有用的特性，很多时候你还是得减少对它的使用冲动。 Python的很多特性都依赖于普通的基于字典的实现。 另外，定义了slots后的类不再支持一些普通类特性了，比如多继承。 大多数情况下，你应该只在那些经常被使用到的类上定义slots (比如在程序中需要创建某个类的几百万个实例对象)。

关于 __slots__ 的一个常见误区是它可以作为一个封装工具来防止用户给实例增加新的属性。 尽管使用slots可以达到这样的目的，但是这个并不是它的初衷。 __slots__ 更多的是用来作为一个内存优化工具。【通过限定属性可以减少对象属性个数，从而减少内存占用】


### 静态方法和类方法

#### 静态方法：@staticmethod

- 常规的方法是需要通过对象去访问的，而静态方法是可以通过类直接访问的方法， 使用示例：

```Python

from math import sqrt


class Triangle(object):

    def __init__(self, a, b, c):
        self._a = a
        self._b = b
        self._c = c

    @staticmethod
    def is_valid(a, b, c):
        return a + b > c and b + c > a and a + c > b

    def perimeter(self):
        return self._a + self._b + self._c

    def area(self):
        half = self.perimeter() / 2
        return sqrt(half * (half - self._a) *
                    (half - self._b) * (half - self._c))


def main():
    a, b, c = 3, 4, 5
    # 静态方法和类方法都是通过给类发消息来调用的
    if Triangle.is_valid(a, b, c):
        t = Triangle(a, b, c)
        print(t.perimeter())
        # 也可以通过给类发消息来调用对象方法但是要传入接收消息的对象作为参数
        # print(Triangle.perimeter(t))
        print(t.area())
        # print(Triangle.area(t))
    else:
        print('无法构成三角形.')


if __name__ == '__main__':
    main()

```

#### 类方法：@classmethod

- 类方法的第一个参数约定名为cls，它代表的是当前类相关的信息的对象（类本身也是一个对象，有的地方也称之为类的元数据对象）

- 通过这个参数我们可以获取和类相关的信息并且可以创建出类的对象

- 它的作用就是有点像静态类，比静态类不一样的就是它可以传进来一个当前类作为第一个参数。

- 先调用类方法进行预处理，之后才调用初始化方法

使用示例：


```Python

from time import time, localtime, sleep


class Clock(object):
    """数字时钟"""

    def __init__(self, hour=0, minute=0, second=0):
        self._hour = hour
        self._minute = minute
        self._second = second

    @classmethod
    def now(cls):
        ctime = localtime(time())
        return cls(ctime.tm_hour, ctime.tm_min, ctime.tm_sec)

    def run(self):
        """走字"""
        self._second += 1
        if self._second == 60:
            self._second = 0
            self._minute += 1
            if self._minute == 60:
                self._minute = 0
                self._hour += 1
                if self._hour == 24:
                    self._hour = 0

    def show(self):
        """显示时间"""
        return '%02d:%02d:%02d' % \
               (self._hour, self._minute, self._second)


def main():
    # 通过类方法创建对象并获取系统时间
    clock = Clock.now()
    while True:
        print(clock.show())
        sleep(1)
        clock.run()


if __name__ == '__main__':
    main()

```


### 封装


#### 数据封装

- 数据封装的主要原因是：保护隐私【私有属性】

#### 方法封装

- 封装方法的主要原因是：隔离复杂度【函数封装】

### 继承

- 基本概念

继承描述的是事物之间的所属关系，例如猫和狗都属于动物，程序中便可以描述为猫和狗继承自动物；

- 定义格式

子类在继承的时候，在定义类时，小括号()中为父类的名字

父类的属性、方法，会被继承给子类

#### 单继承

- 只继承自一个父类

```Python

#单继承
# 定义一个父类，如下:
class Cat(object):
    def __init__(self, name, color="白色"):
        self.name = name
        self.color = color
    def run(self):
        print("%s--在跑"%self.name)
        
# 定义一个子类，继承Cat类如下:
class Bosi(Cat):
    def setNewName(self, newName):
        self.name = newName

    def eat(self):
        print("%s--在吃"%self.name)


bs = Bosi("印度猫")
print('bs的名字为:%s'%bs.name)
print('bs的颜色为:%s'%bs.color)
bs.eat()
bs.setNewName('波斯')
bs.run()


"""
总结：
    私有的属性，不能通过对象直接访问，但是可以通过方法访问
    私有的方法，不能通过对象直接访问
    私有的属性、方法，不会被子类继承，也不能被访问
    一般情况下，私有的属性、方法都是不对外公布的，往往用来做内部的事情，起到安全的作用
""" 

``` 

#### 多继承

- 同时继承自多个父类

```Python

class A:
    def printA(self):
        print('----A----')

# 定义一个父类
class B:
    def printB(self):
        print('----B----')

# 定义一个子类，继承自A、B
class C(A,B):
    def printC(self):
        print('----C----')

obj_C = C()
obj_C.printA()
obj_C.printB()

``` 

## 多态

- 多态的概念是应用于Java和C#这一类强类型语言中，而Python崇尚“鸭子类型”。

动态语言调用实例方法时不检查类型，只要方法存在，参数正确，就可以调用。这就是动态语言的“鸭子类型”，它并不要求严格的继承体系，一个对象只要“看起来像鸭子，走起路来像鸭子”，那它就可以被看做是鸭子。

- Pyhton中所谓的多态：定义时的类型和运行时的类型不一样，此时就成为多态

- 一个父类有多个子类

## 继承和多态

- 上面提到了，可以在已有类的基础上创建新类，这其中的一种做法就是让一个类从另一个类那里将属性和方法直接继承下来，从而减少重复代码的编写。提供继承信息的我们称之为父类，也叫超类或基类；得到继承信息的我们称之为子类，也叫派生类或衍生类。子类除了继承父类提供的属性和方法，还可以定义自己特有的属性和方法，所以子类比父类拥有的更多的能力，在实际开发中，我们经常会用子类对象去替换掉一个父类对象，这是面向对象编程中一个常见的行为，对应的原则称之为里氏替换原则。

- 子类在继承了父类的方法后，可以对父类已有的方法给出新的实现版本，这个动作称之为方法重写（override）。通过方法重写我们可以让父类的同一个行为在子类中拥有不同的实现版本，当我们调用这个经过子类重写的方法时，不同的子类对象会表现出不同的行为，这个就是多态（poly-morphism）。

## 类属性和实例属性

- 类属性就是类对象所拥有的属性，它被所有类对象的实例对象所共有

- 在内存中只存在一个副本，这个和C++中类的静态成员变量有点类似。对于公有的类属性

- 在类外可以通过类对象和实例对象访问


## 内容小结

### 类的结构

#### 实例


1. 使用面向对象开发，第 1 步 是设计 类
2. 使用 类名() 创建对象，创建对象 的动作有两步：

    - 在内存中为对象 分配空间
    - 调用初始化方法 init 为 对象初始化
    
**对象创建后，内存 中就有了一个对象的 实实在在 的存在 —— 实例**

- 创建出来的 对象 叫做 类 的 实例
- 创建对象的 动作 叫做 实例化
- 对象的属性 叫做 实例属性
- 对象调用的方法 叫做 实例方法

在程序执行时：

- 对象各自拥有自己的 实例属性
- 调用对象方法，可以通过 self.
- 访问自己的属性
- 调用自己的方法

结论

- 每一个对象 都有自己 独立的内存空间，保存各自不同的属性
- 多个对象的方法，在内存中只有一份，在调用方法时，需要把对象的引用 传递到方法内部


#### 类是一个特殊的对象

- Python 中 一切皆对象：
    - class AAA: 定义的类属于 类对象
    - obj1 = AAA() 属于 实例对象
    - 在程序运行时，类 同样 会被加载到内存
- 在 Python 中，类 是一个特殊的对象 —— 类对象
    - 在程序运行时，类对象 在内存中 只有一份，使用 一个类 可以创建出 很多个对象实例
    - 除了封装 实例 的 属性 和 方法外，类对象 还可以拥有自己的 属性 和 方法
        - 类属性
        - 类方法
- 通过 类名. 的方式可以 访问类的属性 或者 调用类的方法


### 类属性和实例属性

#### 概念和使用

- 类属性 就是给 类对象 中定义的 属性
    - 通常用来记录 与这个类相关 的特征
    - 类属性 不会用于记录 具体对象的特征
    
#### 属性的获取机制

在 Python 中 属性的获取 存在一个 向上查找机制
- 因此，要访问类属性有两种方式：
    - 类名.类属性
    - 对象.类属性 （不推荐）

- 注意
    - 如果使用 对象.类属性 = 值 赋值语句，只会 给对象添加一个属性，而不会影响到 类属性的值
    
### 类方法和静态方法

#### 类方法

- 类属性就是针对类对象定义的属性

    - 使用赋值语句在class关键字下方可以定义类属性
    - 类属性用于记录与这个类相关的特征
- 类方法就是针对类对象定义的方法
    - 在类方法内部可以直接访问类属性或者调用其他的类方法

语法如下
```Python
@classmethod
def 类方法名(cls):
    pass
```

- 类方法需要用 修饰器 @classmethod 来标识，告诉解释器这是一个类方法
- 类方法的 第一个参数 应该是 cls
    - 由 哪一个类 调用的方法，方法内的 cls 就是 哪一个类的引用
    - 这个参数和 实例方法 的第一个参数是 self 类似
    - 提示 使用其他名称也可以，不过习惯使用 cls
- 通过 类名. 调用 类方法，调用方法时，不需要传递 cls 参数
- 在方法内部
    - 可以通过 cls. 访问类的属性
    - 也可以通过 cls. 调用其他的类方法
    

#### 静态方法

- 在开发时，如果需要在类中封装一个方法，这个方法：
    - 既 不需要 访问 实例属性 或者调用 实例方法
    - 也 不需要 访问 类属性 或者调用 类方法

这个时候，可以把这个方法封装成一个 静态方法

语法如下
```Python
@staticmethod
def 静态方法名():
    pass
```
- 静态方法 需要用 修饰器 @staticmethod 来标识，告诉解释器这是一个静态方法
- 通过 类名. 调用 静态方法


# 文件操作

##  文件打开

在python，使用open函数，可以打开一个已经存在的文件，或者创建一个新文件

open(文件名，访问模式)

示例如下：

    f = open('test.txt', 'w')

说明:
访问模式 	说明
r 	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

w 	打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

a 	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到

已有内容之后。如果该文件不存在，创建新文件进行写入。

rb 	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。

wb 	以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

ab 	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，

新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

r+ 	打开一个文件用于读写。文件指针将会放在文件的开头。

w+ 	打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

a+ 	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。

如果该文件不存在，创建新文件用于读写。

rb+ 	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。

wb+ 	以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

ab+ 	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。

如果该文件不存在，创建新文件用于读写。

## 文件关闭

使用函数： close( )

## 文件读写

```Python

#使用write()可以完成向文件写入数据
f = open('test.txt', 'w')
f.write('hello world, i am here!')
f.close()
"""
注意：
    如果文件不存在那么创建，如果存在那么就先清空，然后写入数据
"""    

```  

### open() 函数 和 with open() 的异同点

- with 语句在不再需要访问文件后将其关闭。让python自己判断什么时候该关闭，并自己去关闭。
- 直接使用open()方法打开文件，要自己调用close()方法关闭文件。如果程序存在bug，导致close()语句未执行，文件将不会关闭。这看似微不足道，但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调用close(),我们会发现需要使用文件时它已关闭(无法访问)，这会导致更多的错误。并非任何情况下都能轻松地确定关闭文件的恰当时机。
- open()后是一个对象，这个对象有read()方法与write()方法。


- 读取内容
    1. read()
        - read([size])方法：从文件当前位置起读取size个字节，若无参数size，则表示读取至文件结束为止，它返回为字符串对象.
    2. readlines()
        - readlines()方法：读取整个文件所有行，保存在一个列表(list)变量中，该列表可以由Python的for  in 结果进行处理，每行作为一个元素，但读取大文件会比较占内存。
    3. readline()
        - readline()方法：从字面意思可以看出，该方法每次读出一行内容，所以，读取时占用内存小，比较适合大文件，该方法返回一个字符串对象。
        
        
- 文件的写入
    - 写模式w特点：
        1. 只能写，不能读；
        2. 写的时候会把原来文件的内容清空；
        3. 当文件不存在时，会创建新文件。
    - 写读模式w+特点：
        1. 可以写，也可以读；
        2. 写的时候会把原来文件的内容清空；
        3. 当文件不存在时，会创建新文件。
    - 追加模式a特点：
        1. 不能读；
        2. 可以写，是追加写，即在原内容末尾添加新内容；
        3. 当文件不存在时，创建新文件。
    - 追加读a+模式特点：
        1. 可读可写；
        2. 写的时候是追加写，即在原内容末尾添加新内容；
        3. 当文件不存在时，创建新文件
        

## 文件读写常用模式


| 操作模式 | 具体含义                         |
| :--- | :--- |
|  `'r'`  |	只能读|
|  `'r+'`  |	可读可写，不会创建不存在的文件，从顶部开始写，会覆盖之前此位置的内容|
|  `'w'`  |	只能写，覆盖整个原有文件（不要乱用），不存在则创建|
|  `'w+'`  |	可读可写，如果文件存在，则覆盖整个文件，不存在则创建|
|  `'a'`  |	只能写，从文件底部添加内容 不存在则创建|
|  `'a+'`  |	可读可写 从文件顶部读取内容 从文件底部添加内容 不存在则创建|


## 文件定位读写

什么是定位？

- 通俗的将就是找到一个合适的位置
- 在软件开发中文件的读写定位该如何实现？

获取当前读写的位置

- 在读写文件的过程中，如果想知道当前的位置，可以使用tell()来获取，这里是光标开始的位置

定义到某个位置

- 如果在读写文件的过程中，需要从另外一个位置进行操作的话，可以使用seek()


## 文件重命名

os模块中的rename()可以完成对文件的重命名操作

- 格式：rename(需要修改的文件名, 新的文件名)


## 文件删除

概述：os模块中的remove()可以完成对文件的删除操作

- 格式：remove(待删除的文件名)


## 文件夹操作


### 创建文件夹

使用os模块中的mkdir()函数

- 格式：mkdir(str)


### 获取当前目录

使用os模块中的getcwd()函数

- 格式： getcwd()


### 获取目录列表

使用os模块中的listdir()函数

- 格式： listdir()


### 删除文件夹

使用os模块中的rmdir()函数

- 格式： rmdir(str)--->str:表示需要删除的文件夹名称

# 异常

## 异常的处理

### 捕获异常

- 捕获异常的基本格式：

try ... except


### try...finally...

- 在程序中，如果一个代码段必须要执行，即无论异常是否产生都要执行，那么此时就需要使用finally

- 比如文件关闭，释放锁，把数据库连接返还给连接池等


### 自定义异常

- 可以使用raise语句来引发一个异常


## 文件异常综合

### 读写文本文件

读取文本文件时，需要在使用`open`函数时指定好带路径的文件名（可以使用相对路径或绝对路径）并将文件模式设置为`'r'`（如果不指定，默认值也是`'r'`），然后通过`encoding`参数指定编码（如果不指定，默认值是None，那么在读取文件时使用的是操作系统默认的编码），如果不能保证保存文件时使用的编码方式与encoding参数指定的编码方式是一致的，那么就可能因无法解码字符而导致读取失败。下面的例子演示了如何读取一个纯文本文件。

```Python
def main():
    f = open('致橡树.txt', 'r', encoding='utf-8')
    print(f.read())
    f.close()


if __name__ == '__main__':
    main()
```

请注意上面的代码，如果`open`函数指定的文件并不存在或者无法打开，那么将引发异常状况导致程序崩溃。为了让代码有一定的健壮性和容错性，我们可以使用Python的异常机制对可能在运行时发生状况的代码进行适当的处理，如下所示。

```Python
def main():
    f = None
    try:
        f = open('致橡树.txt', 'r', encoding='utf-8')
        print(f.read())
    except FileNotFoundError:
        print('无法打开指定的文件!')
    except LookupError:
        print('指定了未知的编码!')
    except UnicodeDecodeError:
        print('读取文件时解码错误!')
    finally:
        if f:
            f.close()


if __name__ == '__main__':
    main()
```

在Python中，我们可以将那些在运行时可能会出现状况的代码放在`try`代码块中，在`try`代码块的后面可以跟上一个或多个`except`来捕获可能出现的异常状况。例如在上面读取文件的过程中，文件找不到会引发`FileNotFoundError`，指定了未知的编码会引发`LookupError`，而如果读取文件时无法按指定方式解码会引发`UnicodeDecodeError`，我们在`try`后面跟上了三个`except`分别处理这三种不同的异常状况。最后我们使用`finally`代码块来关闭打开的文件，释放掉程序中获取的外部资源，由于`finally`块的代码不论程序正常还是异常都会执行到（甚至是调用了`sys`模块的`exit`函数退出Python环境，`finally`块都会被执行，因为`exit`函数实质上是引发了`SystemExit`异常），因此我们通常把`finally`块称为“总是执行代码块”，它最适合用来做释放外部资源的操作。如果不愿意在`finally`代码块中关闭文件对象释放资源，也可以使用上下文语法，通过`with`关键字指定文件对象的上下文环境并在离开上下文环境时自动释放文件资源，代码如下所示。

```Python
def main():
    try:
        with open('致橡树.txt', 'r', encoding='utf-8') as f:
            print(f.read())
    except FileNotFoundError:
        print('无法打开指定的文件!')
    except LookupError:
        print('指定了未知的编码!')
    except UnicodeDecodeError:
        print('读取文件时解码错误!')


if __name__ == '__main__':
    main()
```

除了使用文件对象的`read`方法读取文件之外，还可以使用`for-in`循环逐行读取或者用`readlines`方法将文件按行读取到一个列表容器中，代码如下所示。

```Python
import time


def main():
    # 一次性读取整个文件内容
    with open('致橡树.txt', 'r', encoding='utf-8') as f:
        print(f.read())

    # 通过for-in循环逐行读取
    with open('致橡树.txt', mode='r') as f:
        for line in f:
            print(line, end='')
            time.sleep(0.5)
    print()

    # 读取文件按行读取到列表中
    with open('致橡树.txt') as f:
        lines = f.readlines()
    print(lines)
    

if __name__ == '__main__':
    main()
```

要将文本信息写入文件文件也非常简单，在使用`open`函数时指定好文件名并将文件模式设置为`'w'`即可。注意如果需要对文件内容进行追加式写入，应该将模式设置为`'a'`。如果要写入的文件不存在会自动创建文件而不是引发异常。下面的例子演示了如何将1-9999之间的素数分别写入三个文件中（1-99之间的素数保存在a.txt中，100-999之间的素数保存在b.txt中，1000-9999之间的素数保存在c.txt中）。

```Python
from math import sqrt


def is_prime(n):
    """判断素数的函数"""
    assert n > 0
    for factor in range(2, int(sqrt(n)) + 1):
        if n % factor == 0:
            return False
    return True if n != 1 else False


def main():
    filenames = ('a.txt', 'b.txt', 'c.txt')
    fs_list = []
    try:
        for filename in filenames:
            fs_list.append(open(filename, 'w', encoding='utf-8'))
        for number in range(1, 10000):
            if is_prime(number):
                if number < 100:
                    fs_list[0].write(str(number) + '\n')
                elif number < 1000:
                    fs_list[1].write(str(number) + '\n')
                else:
                    fs_list[2].write(str(number) + '\n')
    except IOError as ex:
        print(ex)
        print('写文件时发生错误!')
    finally:
        for fs in fs_list:
            fs.close()
    print('操作完成!')


if __name__ == '__main__':
    main()
```

### 读写二进制文件

知道了如何读写文本文件要读写二进制文件也就很简单了，下面的代码实现了复制图片文件的功能。

```Python
def main():
    try:
        with open('guido.jpg', 'rb') as fs1:
            data = fs1.read()
            print(type(data))  # <class 'bytes'>
        with open('吉多.jpg', 'wb') as fs2:
            fs2.write(data)
    except FileNotFoundError as e:
        print('指定的文件无法打开.')
    except IOError as e:
        print('读写文件时出现错误.')
    print('程序执行结束.')


if __name__ == '__main__':
    main()
```

### 读写JSON文件

通过上面的讲解，我们已经知道如何将文本数据和二进制数据保存到文件中，那么这里还有一个问题，如果希望把一个列表或者一个字典中的数据保存到文件中又该怎么做呢？答案是将数据以JSON格式进行保存。JSON是“JavaScript Object Notation”的缩写，它本来是JavaScript语言中创建对象的一种字面量语法，现在已经被广泛的应用于跨平台跨语言的数据交换，原因很简单，因为JSON也是纯文本，任何系统任何编程语言处理纯文本都是没有问题的。目前JSON基本上已经取代了XML作为异构系统间交换数据的事实标准。关于JSON的知识，更多的可以参考[JSON的官方网站](http://json.org)，从这个网站也可以了解到每种语言处理JSON数据格式可以使用的工具或三方库，下面是一个JSON的简单例子。

```JSON
{
    "name": "张三",
    "age": 36,
    "qq": 957658,
    "friends": ["王大锤", "白元芳"],
    "cars": [
        {"brand": "BYD", "max_speed": 180},
        {"brand": "Audi", "max_speed": 280},
        {"brand": "Benz", "max_speed": 320}
    ]
}
```

可能大家已经注意到了，上面的JSON跟Python中的字典其实是一样一样的，事实上JSON的数据类型和Python的数据类型是很容易找到对应关系的，如下面两张表所示。

| JSON                | Python       |
| :------------------- | :------------ |
| object              | dict         |
| array               | list         |
| string              | str          |
| number (int / real) | int / float  |
| true / false        | True / False |
| null                | None         |

| Python                                 | JSON         |
| :-------------------------------------- | :------------ |
| dict                                   | object       |
| list, tuple                            | array        |
| str                                    | string       |
| int, float, int- & float-derived Enums | number       |
| True / False                           | true / false |
| None                                   | null         |

我们使用Python中的json模块就可以将字典或列表以JSON格式保存到文件中，代码如下所示。

```Python
import json


def main():
    mydict = {
        'name': '张三',
        'age': 36,
        'qq': 957658,
        'friends': ['王大锤', '白元芳'],
        'cars': [
            {'brand': 'BYD', 'max_speed': 180},
            {'brand': 'Audi', 'max_speed': 280},
            {'brand': 'Benz', 'max_speed': 320}
        ]
    }
    try:
        with open('data.json', 'w', encoding='utf-8') as fs:
            json.dump(mydict, fs)
    except IOError as e:
        print(e)
    print('保存数据完成!')


if __name__ == '__main__':
    main()
```

json模块主要有四个比较重要的函数，分别是：

- `dump` - 将Python对象按照JSON格式序列化到文件中
- `dumps` - 将Python对象处理成JSON格式的字符串
- `load` - 将文件中的JSON数据反序列化成对象
- `loads` - 将字符串的内容反序列化成Python对象

这里出现了两个概念，一个叫序列化，一个叫反序列化。自由的百科全书[维基百科](https://zh.wikipedia.org/)上对这两个概念是这样解释的：“序列化（serialization）在计算机科学的数据处理中，是指将数据结构或对象状态转换为可以存储或传输的形式，这样在需要的时候能够恢复到原先的状态，而且通过序列化的数据重新获取字节时，可以利用这些字节来产生原始对象的副本（拷贝）。与这个过程相反的动作，即从一系列字节中提取数据结构的操作，就是反序列化（deserialization）”。

# 生成器

## 基本概念

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。

而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，

那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？

这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，

称为生成器：generator。


## 为什么要有生成器

列表所有数据都在内存中，如果有海量数据的话将会非常耗内存。

如：仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

如果列表元素按照某种算法推算出来，那我们就可以在循环的过程中不断推算出后续的元素，这样就不必创建完整的list，从而节省大量的空间。

简单一句话：我又想要得到庞大的数据，又想让它占用空间少，那就用生成器！


## 创建生成器

### 方法一

- 第一种方法很简单，只需要把一个列表生成式的[] 修改成(), 就创建了一个generator

eg: g = (x * x for x in range(10))


### 方法二

- 如果一个函数中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator。

- 调用函数就是创建了一个生成器（generator）对象。

语法形式：


```Python
def func():
    yield
func()
```

## 生成器的工作原理

- 生成器(generator)能够迭代的关键是它有一个next()方法，

    - 工作原理就是通过重复调用next()方法，直到捕获一个异常。

- 带有 yield 的函数不再是一个普通函数，而是一个生成器generator。

    - 可用next()调用生成器对象来取值。next 两种方式 t.__next__()  |  next(t)。

    - 可用for 循环获取返回值（每执行一次，取生成器里面一个值）

    （基本上不会用next()来获取下一个返回值，而是直接使用for循环来迭代）。

- yield相当于 return 返回一个值，并且记住这个返回的位置，下次迭代时，代码从yield的下一条语句开始执行。

- .send() 和next()一样，都能让生成器继续往下走一步（下次遇到yield停），但send()能传一个值，这个值作为yield表达式整体的结果

　　——换句话说，就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值，a = yield 5，第一次迭代到这里会返回5，a还没有赋值。第二次迭代时，使用.send(10)，那么，就是强行修改yield 5表达式的值为10，本来是5的，那么a=10
  

使用示例;

```Python

def yield_test(n):
    for i in range(n):
        yield call(i)
        print("i=",i)
    print("Done.")

def call(i):
    return i*2

for i in yield_test(5):
    print(i,",")

```

# 迭代器

## 基本概念

### 迭代

- 访问集合元素的一种方式

### 迭代器

- 是一个可以记住遍历的位置的对象

- 迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束


### 迭代器的特点

- 迭代器只能往前不能后退


## 迭代对象


以直接作用于for循环的对象统称为可迭代对象：Iterable

- 一类是集合数据类型，如 list 、 tuple 、 dict 、 set 、 str 等

- 一类是 generator ，包括生成器和带 yield 的generator function


## 迭代器使用

在Python中，迭代器是遵循迭代协议的对象，用来表示一连串数据流。重复调用迭代器的__next__()方法（或将其传给内置函数 next()）将逐个返回数据流中的项。当没有数据可用时则将引发 StopIteration 异常。

- 迭代器分为两类：

    - 使用iter()从任何序列对象中得到迭代器（如list, tuple, dict, set等）。
    - 输入迭代器generator （包括生成器和带 yield 的函数）。
- 迭代器有两个基本方法：

    - iter() 返回一个迭代器对象
    - next() 逐一返回迭代对象中的项
    
## Iterator和Iterable的区别

### Python中 list，truple，str，dict这些都可以被迭代，但他们并不是迭代器。为什么？

- 因为和迭代器相比有一个很大的不同，list/truple/map/dict这些数据的大小是确定的，也就是说有多少事可知的。但迭代器不是，迭代器不知道要执行多少次，所以可以理解为不知道有多少个元素，每调用一次next()，就会往下走一步，是惰性的。

### isinstance() 函数来判断一个对象是否是一个已知的类型，类似 type()

- isinstance() 与 type() 区别：

    - type() 不会认为子类是一种父类类型，不考虑继承关系。

    - isinstance() 会认为子类是一种父类类型，考虑继承关系。

如果要判断两个类型是否相同推荐使用 isinstance()。

#### 判断是不是可迭代的，使用Iterable

示例：


```Python

from collections import Iterable
isinstance({}, Iterable) 
isinstance((), Iterable) 
isinstance(100, Iterable)

```

#### 判断是不是迭代器，使用Iterator

示例：


```Python

#表示一个可以修改内核选项ast_node_interactivity,使得jupyter对独占一行的所有变量都自动显示
%config ZMQInteractiveShell.ast_node_interactivity='all'
from collections import Iterator
isinstance({}, Iterator)
isinstance((), Iterator)
isinstance( (x for x in range(10)), Iterator)

```

## 总结

- 凡是可以for循环的，都是Iterable

- 凡是可以next()的，都是Iterator

- 集合数据类型如list，truple，dict，str，都是Itrable不是Iterator，但可以通过iter()函数获得一个Iterator对象

# 装饰器

装饰器是程序开发中经常会用到的一个功能，用好了装饰器，开发效率如虎添翼，所以这也是Python面试中必问的问题

## 闭包

如果在一个函数的内部定义了另一个函数，外部的叫做外函数，内部的叫做内函数

- 什么是闭包？
    - 在一个外函数中定义了一个内函数，内函数里运用了外函数的临时变量，并且外函数的返回值是内函数的引用，这样就构成了一个闭包。

