廖雪峰python教程学习笔记

基础语法

安装

MAC下python安装： brew install python3
Windows下安装：下载exe安装包，勾选 Add Python 3.X to PATH

字符编码

当python代码中包含中文字符时，需要指定保存为UTF8编码,一般在文件开头加入下面的两行注释

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

第一行注释是为了告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释；

第二行注释是为了告诉Python解释器，按照UTF-8编码读取源代码，否则，在源代码中写的中文输出可能会有乱码

Python3 的字符串使用Unicode，直接支持多语言

数据类型和字符串

整型、浮点型、字符串、布尔值（True\False）、空值（None）
关于字符串的函数
- ord(char): 函数获取字符的整数表示
- chr(num): 把编码转换为对应的字符
- len(str) : 计算字符串的长度
字符串方法
- count(str): 返回str在string里出现的次数
- find(str): 检查str是否包含在字符串中，如果在返回索引，否则返回-1
- replace(old, new [,max]): 把将字符串中的 old 替换成 new,如果 max 指定，则替换不超过 max 次。
- split(sep): 以指定分隔符将字符串转为列表
- join: 以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
- lower(): 转换字符串中所有大写字符为小写
- upper(): 转换字符串中所有小写字符为大写
- 占位符
```
%d 整数
%f 浮点数
%s 字符串
%x 十六进制整数
```

list和tuple

list
- len(list): 获得list元素的个数
- list[index]: 访问list中index位置的元素,index为-1直接获取最后一个元素
- list[start:end]: 获得list中从索引为start到end不包含end之间的元素
- list.append(item): 往list中追加元素到末尾
- list.insert(index,item): 把元素插入到索引为index的位置
- list.pop([index]): 删除list末尾的元素或删除指定位置的元素
tuple

tuple和list非常类似，但是tuple一旦初始化就不能修改。它也没有append()，insert()这样的方法。因为tuple不可变，所以代码更安全。如果可能，能用tuple代替list就尽量用tuple。 只有1个元素的tuple定义时必须加一个逗号,以免你误解成数学计算意义上的括号

循环

break 退出当前循环 
continue 退出本轮循环，开始下一轮循环

dict 和 set

dict的get方法取值，如果不存在返回None

要删除一个key,使用pop(key)方法，对应的value也会被删除

clear()方法清空字典中所有元素，del dict删除一个字典

set和dict类似，但不存储value。由于key不能重复，所以set中没有重复的key

add(key)方法可以添加元素到set中

remove(key)方法可以删除元素

两个set可以做数学意义上的交集(s1 & s2)和并集(s1 | s2)

函数

函数定义: def 函数名 ():, 没有返回值默认返回None
函数对象有一个__name__属性，可以拿到函数的名字
空函数: 使用pass用来作为占位符，先放一个pass，让代码能运行起来。
返回多个值: 函数返回多值其实就是返回一个tuple
默认参数: 默认参数必须指向不变对象！
可变参数:
- 定义: def calc(*arguments):
- 调用：calc(2,3,4,5,6)
- 如果已经有了一个list或tuple，list或tuple前面加一个*号，可以把list或tuple的元素变成可变参数传进去 calc(*nums)
关键字参数: 关键字参数允许传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict
- 定义: def person(name, age, **kw):
- 调用: 在调用时，可以只传入必选参数,也可以传入任意个数的关键字参数
- 和可变参数类似，也可以先组装出一个dict，然后，把该dict转换为关键字参数传进去

extra = {'city': 'Beijing', 'job': 'Engineer'}
person('Neil', 23, **extra)

命名关键字参数：

如果要限制关键字参数的名字，就可以用命名关键字参数，例如，只接收city和job作为关键字参数。def person(name, age, *, city, job):

和关键字参数**kw不同，命名关键字参数需要一个特殊分隔符*，*后面的参数被视为命名关键字参数。

如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符*了,但命名关键字参数必须传入参数名,如果没有传入参数名，调用将报错

参数组合

在Python中定义函数，可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数，这5种参数都可以组合使用。但是请注意，参数定义的顺序必须是：必选参数、默认参数、可变参数、命名关键字参数和关键字参数。

递归函数: 如果一个函数在内部调用自身本身，这个函数就是递归函数。

def fact(n):
    if n==1:
        return 1
    return n * fact(n - 1)

高级特性

迭代: 在Python中，迭代是通过for ... in来完成的

默认情况下，dict迭代的是key。如果要迭代value，可以用for value in d.values()，如果要同时迭代key和value，可以用for k, v in d.items()。

可以通过collections模块的Iterable类型判断一个对象是不是可迭代

Python内置的enumerate函数可以把一个list变成索引-元素对，这样就可以在for循环中同时迭代索引和元素本身

列表推导式

写列表生成式时，把要生成的元素x * x放到前面，后面跟for循环，就可以把list创建出来。

for循环后面还可以加上if判断,还可以使用两层循环，可以生成全排列

生成器

在Python中，一边循环一边计算的机制称为生成器：generator。要创建一个generator，有很多种方法。

第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个generator

如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator

generator保存的是算法，每次调用next()方法。使用for循环可以迭代generator对象。

迭代器

可以作用于for循环的对象统称为可迭代对象: Interable。可以直接作用于for循环的数据类型有以下几种：

一类是集合数据类型，如：list, tuple, dict, set, str等

一类是generator，包括生成器和带yield的generator function

可以使用isinstance()判断一个对象是否是Interable对象

可以被next()对象调用，并不断返回下一个值得对象称为迭代器:Interator

函数式编程

map

map()函数接收两个参数，一个是函数，一个是Interable，map将传入的函数依次作用到序列的每个元素，并把结果作为新的Iterator返回。

filter

和map()类似，filter()也接收一个函数和一个序列。和map()不同的是，filter()把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。filter返回的也是一个Interator对象。需要用list()函数获得所有结果并返回list。

reduce reduce需要从functools中进行导入： from functools import reduce

reduce把一个函数作用在一个序列[x1, x2, x3, ...]上，这个函数必须接收两个参数，reduce把结果继续和序列的下一个元素做累积计算。返回计算结果。

sorted 可以对list进行排序

它还可以接收一个key函数来实现自定义的排序。要进行反向排序，不必改动key函数，可以传入第三个参数reverse=True

装饰器

在代码运行期间动态增加功能的方式，称为装饰器Decorator。本质上decorator就是一个返回函数的高阶函数。

经过decorator装饰之后的函数，它们的__name__已经从原来的'now'变成了'wrapper'。因为返回的那个wrapper()函数名字就是'wrapper'。不需要编写wrapper.__name__ = func.__name__这样的代码，Python内置的functools.wraps就是干这个事的

偏函数

Python的functools模块提供了很多有用的功能，其中一个就是偏函数functools.partial。 functools.partial的作用就是，把一个函数的某些参数给固定住（也就是设置默认值），返回一个新的函数，调用这个新函数会更简单。

面向对象

类和实例

面向对象最重要的概念就是类(Class)和实例(Instance)，类是抽象的模板，而实例是根据类创建出来的一个个具体的对象。每个对象都拥有相同的方法，但各自的数据不同。

在Python中定义类是通过class关键字，class后面紧接着是类名，类名通常是大写开头的单词。紧接着是(object)，表示该类是从哪个类继承下来的，如果没有合适的继承类，就使用object类，这是所有类最终都会继承的类。

通过定义一个特殊的__init__方法，在创建实例的时候，把一些必须绑定的属性强制填写进去。__init__方法前后有两个下划线。__init__方法的第一个参数永远都是self，表示创建的实例本身。在__init__方法内部，可以把各种属性绑定到self

在类中定义函数，第一个参数永远都是实例变量self，并且调用时不用传递该参数。

如果要让内部属性不被外界访问，可以把属性的名称前加两个下划线__，实例的变量如果以__开头，就变成了一个私有变量。只有内部可以访问，外部不能访问。

在Python中，变量名类似__xxx__的，也就是以双下划线开头并以双下划线结尾的是特殊变量。特殊变量可以直接访问，不是private变量。

当子类和父类都存在相同的方法时，子类的方法会覆盖了父类的方法。某个子类的实例也可以被看作是父类的实例。

类属性在class中定义，类的所有实例都可以访问

Python允许在定义class的时候，定义一个特殊的__slots__变量，来限制class实例能添加的属性

Python内置的@property装饰器负责把一个方法变成属性调用的。@property本身又会创建一个setter装饰器，负责把一个setter方法变成属性赋值。如果不定义setter就是一个只读属性。

在设计类的继承关系时，通常主线都是单一继承下来，如果要混入其他功能，可以通过多重继承实现，这种设计成为Mixin

使用type()函数可以判断对象类型，它返回对象的Class类型。对于class的继承关系来说，使用type()就很不方便。要判断Class的类型，可以使用isinstance函数。

type()函数既可以查看对象类型，又可以创建出新的类型。要创建一个class对象，type()函数依次传入三个参数：class的名称，继承的父类集合，class方法名称与函数绑定

如果要获得一个对象的所有属性和方法，可以使用dir()方法，它返回一个包含字符串的list。

枚举类: 定义枚举类要导入enum模块，枚举定义用class关键字，继承Enum类。

定义枚举时，成员名称不允许重复。两个相同值的成员，第二个成员的名称被视作第一个成员的别名。如果枚举中存在相同值的成员，通过值获取成员只能获取到第一个成员。枚举支持迭代器，可以遍历枚举成员。枚举成员可以进行等值比较不可以进行大小比较。

错误和调试

Python采用try...except...finally错误处理机制。如果错误没有被捕获，它就会一直向上抛，最后被Python解释器捕获，打印一个错误信息，然后程序退出。

Python内置的logging模块可以记录错误信息

raise语句可以抛出一个错误实例。尽量使用Python内置的错误类型：ValueError,TypeError,IOError等。

IO编程

使用Python内置的open()函数，传入文件名和标识符。如果文件不存在，open()函数就会抛出一个IOError错误。

标识符

读文本�文件 r

读二进制文件 rb

写文本文件 w

写二进制文件 wb

追加文件文件 a

追加二进制文件 ab

读文件�

如果文件打开成功，调用read()方法一次读取文件的全部内容，调用readline可以一次读取一行内容，调用readlines()可以一次读取所有内容并按行返回list。最后调用close()方法关闭文件。文件读写一旦出现IOError，后面的�close()方法都不会执行，所以，为了保证无论是否出错都能正确地关闭文件，可以使用try ... finally来实现

使用with语句会自动调用close()方法

写文件

可以反复调用write()来写入文件，但是务必要调用close()来关闭文件

使用encoding参数指定编码，使用errors="ignore"参数忽略编码错误。

os模块

获取操作系统详细信息： os.uname()

获取操作系统定义的环境变量: os.environ, 获取某个变量的值: os.environ.get('key')

操作文件和目录的函数一部分放在os模块中，一部分放在os.path模块中

import os

# 查看当前目录的绝对路径
os.path.abspath('.')

# 在某个目录下创建一个新目录，首先把新目录的完整路径表示出来
newdir = os.path.join('/Users/neil/Documents','testdir')
# 创建目录
os.mkdir(newdir)
# 删除目录
os.rmdir(newdir)
# 重命名文件
os.rename('test.txt','text.py')
# 删除文件
os.remove('test.py')
# 判断路径是不是目录
os.path.isdir(newdir)
# 判断路径是不是文件
os.path.isfile(newdir)

把两个路径合成一个时，要通过os.path.join()函数，这样可以正确处理不同操作系统的路径分隔符要拆分路径时，也不要直接去拆字符串，而要通过os.path.split()函数，这样可以把一个路径拆分为两部分，后一部分总是最后级别的目录或文件名。os.path.splitext()函数可以直接得到文件扩展名。这些合并、拆分路径的函数并不要求目录或文件真实存在，他们只对字符串进行操作

序列化

Python内置的json模块可以将Python对象转换为json格式 dumps()方法返回一个str,内容就是标准的JSON。 dump()方法可以直接把json写入一个file-like Object 要把JSON反序列化为Python对象，用loads()或者对应的load()方法，前者把JSON的字符串反序列化，后者从file-like Object中读取字符串并反序列化：

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
demo		demo
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

廖雪峰python教程学习笔记

基础语法

安装

字符编码

数据类型和字符串

list和tuple

循环

dict 和 set

函数

高级特性

函数式编程

面向对象

错误和调试

IO编程

异步IO

进程和线程

正则表达式

常用模块

内建模块

第三方模块

网络编程

访问数据库

web开发

About

Uh oh!

Releases

Packages

isNeilLin/startPython

Folders and files

Latest commit

History

Repository files navigation

廖雪峰python教程学习笔记

基础语法

安装

字符编码

数据类型和字符串

list和tuple

循环

dict 和 set

函数

高级特性

函数式编程

面向对象

错误和调试

IO编程

异步IO

进程和线程

正则表达式

常用模块

内建模块

第三方模块

网络编程

访问数据库

web开发

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages