- MAC下python安装 :
brew install python3 - Windows下安装 :下载exe安装包,勾选
Add Python 3.X to PATH
- 当python代码中包含中文字符时,需要指定保存为UTF8编码,一般在文件开头加入下面的两行注释
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,在源代码中写的中文输出可能会有乱码
Python3 的字符串使用Unicode,直接支持多语言
- 整型、浮点型、字符串、布尔值(
True\False)、 空值(None) - 关于字符串的函数
ord(char): 函数获取字符的整数表示chr(num): 把编码转换为对应的字符len(str): 计算字符串的长度
- 字符串方法
count(str): 返回str在string里出现的次数find(str): 检查str是否包含在字符串中,如果在返回索引,否则返回-1replace(old, new [,max]): 把 将字符串中的 old 替换成 new,如果 max 指定,则替换不超过 max 次。split(sep): 以指定分隔符将字符串转为列表join: 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串lower(): 转换字符串中所有大写字符为小写upper(): 转换字符串中所有小写字符为大写- 占位符
%d 整数 %f 浮点数 %s 字符串 %x 十六进制整数
- list
len(list): 获得list元素的个数list[index]: 访问list中index位置的元素,index为-1直接获取最后一个元素list[start:end]: 获得list中从索引为start到end不包含end之间的元素list.append(item): 往list中追加元素到末尾list.insert(index,item): 把元素插入到索引为index的位置list.pop([index]): 删除list末尾的元素或删除指定位置的元素
- tuple
tuple和list非常类似,但是
tuple一旦初始化就不能修改。它也没有append(),insert()这样的方法。 因为tuple不可变,所以代码更安全。如果可能,能用tuple代替list就尽量用tuple。只有1个元素的tuple定义时必须加一个逗号,以免你误解成数学计算意义上的括号
break 退出当前循环
continue 退出本轮循环,开始下一轮循环
dict的get方法取值,如果不存在返回None
要删除一个key,使用pop(key)方法,对应的value也会被删除
clear()方法清空字典中所有元素,del dict删除一个字典
set和dict类似,但不存储value。由于key不能重复,所以set中没有重复的key
add(key)方法可以添加元素到set中
remove(key)方法可以删除元素
两个set可以做数学意义上的交集(s1 & s2)和并集(s1 | s2)
-
函数定义:
def 函数名 ():, 没有返回值默认返回None -
函数对象有一个
__name__属性,可以拿到函数的名字 -
空函数: 使用
pass用来作为占位符,先放一个pass,让代码能运行起来。 -
返回多个值: 函数返回多值其实就是返回一个
tuple -
默认参数: 默认参数必须指向不变对象!
-
可变参数:
- 定义:
def calc(*arguments): - 调用:
calc(2,3,4,5,6) - 如果已经有了一个list或tuple,list或tuple前面加一个*号,可以把list或tuple的元素变成可变参数传进去
calc(*nums)
- 定义:
-
关键字参数: 关键字参数允许传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict
- 定义:
def person(name, age, **kw): - 调用: 在调用时,可以只传入必选参数,也可以传入任意个数的关键字参数
- 和可变参数类似,也可以先组装出一个dict,然后,把该dict转换为关键字参数传进去
- 定义:
extra = {'city': 'Beijing', 'job': 'Engineer'}
person('Neil', 23, **extra)
- 命名关键字参数:
如果要限制关键字参数的名字,就可以用命名关键字参数,例如,只接收city和job作为关键字参数。def person(name, age, *, city, job):
和关键字参数**kw不同,命名关键字参数需要一个特殊分隔符*,*后面的参数被视为命名关键字参数。
如果函数定义中已经有了一个可变参数,后面跟着的命名关键字参数就不再需要一个特殊分隔符*了,但命名关键字参数必须传入参数名,如果没有传入参数名,调用将报错
- 参数组合
在Python中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数,这5种参数都可以组合使用。但是请注意,参数定义的顺序必须是:必选参数、默认参数、可变参数、命名关键字参数和关键字参数。
- 递归函数: 如果一个函数在内部调用自身本身,这个函数就是递归函数。
def fact(n):
if n==1:
return 1
return n * fact(n - 1)
- 迭代: 在Python中,迭代是通过
for ... in来完成的
默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。
可以通过collections模块的Iterable类型判断一个对象是不是可迭代
Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身
- 列表推导式
写列表生成式时,把要生成的元素x * x放到前面,后面跟for循环,就可以把list创建出来。
for循环后面还可以加上if判断,还可以使用两层循环,可以生成全排列
- 生成器
在Python中,一边循环一边计算的机制称为生成器:generator。要创建一个generator,有很多种方法。
第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator
如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator
generator保存的是算法,每次调用next()方法。使用for循环可以迭代generator对象。
- 迭代器
可以作用于for循环的对象统称为可迭代对象: Interable。可以直接作用于for循环的数据类型有以下几种:
一类是集合数据类型,如:list, tuple, dict, set, str等
一类是generator,包括生成器和带yield的generator function
可以使用isinstance()判断一个对象是否是Interable对象
可以被next()对象调用,并不断返回下一个值得对象称为迭代器:Interator
- map
map()函数接收两个参数,一个是函数,一个是Interable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。
- filter
和map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。filter返回的也是一个Interator对象。需要用list()函数获得所有结果并返回list。
- reduce reduce需要从functools中进行导入:
from functools import reduce
reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算。返回计算结果。
- sorted 可以对
list进行排序
它还可以接收一个key函数来实现自定义的排序。要进行反向排序,不必改动key函数,可以传入第三个参数reverse=True
- 装饰器
在代码运行期间动态增加功能的方式,称为装饰器Decorator。本质上decorator就是一个返回函数的高阶函数。
经过decorator装饰之后的函数,它们的__name__已经从原来的'now'变成了'wrapper'。因为返回的那个wrapper()函数名字就是'wrapper'。不需要编写wrapper.__name__ = func.__name__这样的代码,Python内置的functools.wraps就是干这个事的
- 偏函数
Python的functools模块提供了很多有用的功能,其中一个就是偏函数functools.partial。
functools.partial的作用就是,把一个函数的某些参数给固定住(也就是设置默认值),返回一个新的函数,调用这个新函数会更简单。
- 类和实例
面向对象最重要的概念就是类(Class)和实例(Instance),类是抽象的模板,而实例是根据类创建出来的一个个具体的对象。每个对象都拥有相同的方法,但各自的数据不同。
在Python中定义类是通过class关键字,class后面紧接着是类名,类名通常是大写开头的单词。紧接着是(object),表示该类是从哪个类继承下来的,如果没有合适的继承类,就使用object类,这是所有类最终都会继承的类。
通过定义一个特殊的__init__方法,在创建实例的时候,把一些必须绑定的属性强制填写进去。__init__方法前后有两个下划线。__init__方法的第一个参数永远都是self,表示创建的实例本身。在__init__方法内部,可以把各种属性绑定到self
在类中定义函数,第一个参数永远都是实例变量self,并且调用时不用传递该参数。
如果要让内部属性不被外界访问,可以把属性的名称前加两个下划线__,实例的变量如果以__开头,就变成了一个私有变量。只有内部可以访问,外部不能访问。
在Python中,变量名类似
__xxx__的,也就是以双下划线开头并以双下划线结尾的是特殊变量。特殊变量可以直接访问,不是private变量。
当子类和父类都存在相同的方法时,子类的方法会覆盖了父类的方法。某个子类的实例也可以被看作是父类的实例。
类属性在class中定义,类的所有实例都可以访问
Python允许在定义class的时候,定义一个特殊的__slots__变量,来限制class实例能添加的属性
Python内置的@property装饰器负责把一个方法变成属性调用的。@property本身又会创建一个setter装饰器,负责把一个setter方法变成属性赋值。如果不定义setter就是一个只读属性。
在设计类的继承关系时,通常主线都是单一继承下来,如果要混入其他功能,可以通过多重继承实现,这种设计成为Mixin
使用type()函数可以判断对象类型,它返回对象的Class类型。对于class的继承关系来说,使用type()就很不方便。要判断Class的类型,可以使用isinstance函数。
type()函数既可以查看对象类型,又可以创建出新的类型。要创建一个class对象,type()函数依次传入三个参数:class的名称,继承的父类集合,class方法名称与函数绑定
如果要获得一个对象的所有属性和方法,可以使用dir()方法,它返回一个包含字符串的list。
枚举类: 定义枚举类要导入enum模块,枚举定义用class关键字,继承Enum类。
定义枚举时,成员名称不允许重复。两个相同值的成员,第二个成员的名称被视作第一个成员的别名。 如果枚举中存在相同值的成员,通过值获取成员只能获取到第一个成员。枚举支持迭代器,可以遍历枚举成员。枚举成员可以进行等值比较不可以进行大小比较。
Python采用try...except...finally错误处理机制。如果错误没有被捕获,它就会一直向上抛,最后被Python解释器捕获,打印一个错误信息,然后程序退出。
Python内置的logging模块可以记录错误信息
raise语句可以抛出一个错误实例。尽量使用Python内置的错误类型:ValueError,TypeError,IOError等。
使用Python内置的open()函数,传入文件名和标识符。如果文件不存在,open()函数就会抛出一个IOError错误。
- 标识符
读文本�文件 r
读二进制文件 rb
写文本文件 w
写二进制文件 wb
追加文件文件 a
追加二进制文件 ab
- 读文件�
如果文件打开成功,调用read()方法一次读取文件的全部内容,调用readline可以一次读取一行内容,调用readlines()可以一次读取所有内容并按行返回list。最后调用close()方法关闭文件。
文件读写一旦出现IOError,后面的�close()方法都不会执行,所以,为了保证无论是否出错都能正确地关闭文件,可以使用try ... finally来实现
使用with语句会自动调用close()方法
- 写文件
可以反复调用write()来写入文件,但是务必要调用close()来关闭文件
使用encoding参数指定编码,使用errors="ignore"参数忽略编码错误。
os模块
获取操作系统详细信息: os.uname()
获取操作系统定义的环境变量: os.environ, 获取某个变量的值: os.environ.get('key')
操作文件和目录的函数一部分放在os模块中,一部分放在os.path模块中
import os
# 查看当前目录的绝对路径
os.path.abspath('.')
# 在某个目录下创建一个新目录,首先把新目录的完整路径表示出来
newdir = os.path.join('/Users/neil/Documents','testdir')
# 创建目录
os.mkdir(newdir)
# 删除目录
os.rmdir(newdir)
# 重命名文件
os.rename('test.txt','text.py')
# 删除文件
os.remove('test.py')
# 判断路径是不是目录
os.path.isdir(newdir)
# 判断路径是不是文件
os.path.isfile(newdir)把两个路径合成一个时,要通过os.path.join()函数,这样可以正确处理不同操作系统的路径分隔符
要拆分路径时,也不要直接去拆字符串,而要通过os.path.split()函数,这样可以把一个路径拆分为两部分,后一部分总是最后级别的目录或文件名。os.path.splitext()函数可以直接得到文件扩展名。这些合并、拆分路径的函数并不要求目录或文件真实存在,他们只对字符串进行操作
- 序列化
Python内置的json模块可以将Python对象转换为json格式
dumps()方法返回一个str,内容就是标准的JSON。
dump()方法可以直接把json写入一个file-like Object
要把JSON反序列化为Python对象,用loads()或者对应的load()方法,前者把JSON的字符串反序列化,后者从file-like Object中读取字符串并反序列化: