# Python入门
## 概念
### 定位
一种高级的，动态类型的多范型编程语言，写法近似伪代码，面向对象。哲学：“优雅”、“明确”、“简单”，简单优雅，尽量写容易看明白的代码，尽量写少的代码。
### 缺点
1. 运行速度慢，和C程序相比非常慢。Python为解释型语言
2. 源代码不能加密
## 安装
安装Python 3.6，mac默认安转Python2.7，可使用Homebrew，在命令行`homebrew install python3`，进行安装
## 第一个Python程序
使用sublime3开发，新建文件hello.py

> 输入

In [3]:
print('hello, world')

hello, world


   > 输出

In [None]:
name = input()
print(name)

**运行**  
cd到当前目录下， 使用 `python3 filename.py`

## 基础
### 数据类型和变量
- 整数: 程序中的表示方法和数学上的写法一致,例如:1,100,-8080,0
- 浮点数: `1.23e9`
- 字符串: 以单引号'或双引号"括起来的任意文本 `'I\'m \"OK\"!'`
- 布尔值: True、False,注意大小写，使用 `and`, `not`和`or`,代表与或非,如：`True or True`,`True and False`,`not True`
- 空值: 特殊的值, 使用`None`表示
> 变量

1. 变量在程序中就是用一个变量名表示，同一个变量可以反复赋值，而且可以是不同类型的变量。
2. 这种变量本身类型不固定的语言称之为动态语言，与之对应的是静态语言。静态语言在定义变量时必须指定变量类型，如果赋值的时候类型不匹配，就会报错
3. 最后，理解变量在计算机内存中的表示也非常重要。

In [19]:
a = "abc"

Python解释器干了两件事情：
- 在内存中创建了一个'ABC'的字符串；
- 在内存中创建了一个名为a的变量，并把它指向'ABC'。即python中变量名可以理解为一个指针。

In [3]:
a = 'ABC'
b = a
a = 'XYZ'
print('a:', a)
print('b:', b)

a: XYZ
b: ABC


**执行过程**
1. 执行a = 'ABC'，解释器创建了字符串'ABC'和变量a，并把a指向'ABC'。
2. 执行b = a，解释器创建了变量b，并把b指向a指向的字符串'ABC'。
3. 执行a = 'XYZ'，解释器创建了字符串'XYZ'，并把a的指向改为'XYZ'，但b并没有更改。
4. 所以，最后打印变量b的结果自然是'ABC'了。

> 常量

常量就是不能变的变量,Python根本没有任何机制保证PI不会被改变，所以，用全部大写的变量名表示常量只是一个习惯上的用法
在Python中，有两种除法，一种除法是`/`

In [20]:
10 / 3

3.3333333333333335

`/`除法计算结果是浮点数，即使是两个整数恰好整除，结果也是浮点数：
还有一种除法是`//`，称为地板除，两个整数的除法仍然是整数：

In [21]:
10 // 3

3

余数运算，可以得到两个整数相除的余数：

In [22]:
10 % 3

1

#### 小结
- Python支持多种数据类型，在计算机内部，可以把任何数据都看成一个“对象”，而变量就是在程序中用来指向这些数据对象的，对变量赋值就是把数据和变量给关联起来。
- 对变量赋值x = y是把变量x指向真正的对象，该对象是变量y所指向的。随后对变量y的赋值不影响变量x的指向。
- 注意：Python的整数没有大小限制，而某些语言的整数根据其存储长度是有大小限制的，例如Java对32位整数的范围限制在-2147483648-2147483647。
- Python的浮点数也没有大小限制，但是超出一定范围就直接表示为inf（无限大）。

### 字符串和编码
#### 字符编码
在计算机内存中，统一使用Unicode编码，即两个字节表示一个字符。当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。
#### Python的字符串
字符串是以Unicode编码的，也就是说，Python的字符串支持多语言。对于单个字符的编码，Python提供了`ord()`函数获取字符的整数表示，`chr()`函数把编码转换为对应的字符
#### 格式化
采用的格式化方式和C语言是一致的，用%实现，举例如下：

In [4]:
'Hello, %s' % 'world'

'Hello, world'

In [5]:
'Hi, %s, you have $%d.' % ('Michael', 1000000)

'Hi, Michael, you have $1000000.'

`%`运算符就是用来格式化字符串的。在字符串内部，`%s`表示用字符串替换，`%d`表示用整数替换，有几个`%?`占位符，后面就跟几个变量或者值，顺序要对应好。如果只有一个`%?`，括号可以省略。

### 使用list和tuple
#### list
Python内置的一种数据类型是列表：list。list是一种有序的集合，可以随时添加和删除其中的元素。

In [11]:
classmates = ['Michael', 'Bob', 'Tracy']
classmates

['Michael', 'Bob', 'Tracy']

取最后一个元素，除了计算索引位置外，还可以用`-1`做索引，直接获取最后一个元素。 list是一个可变的有序表，所以，可以往list中追加，插入，删除，修改等。
list是一个可变的有序表，所以，可以往list中追加元素到末尾：

In [14]:
classmates.append('Adam')
print('Append: Adam:', classmates)
classmates.insert(1, 'Jack')
print("insert Jack", classmates)
classmates.pop(2) # 替换某个数字
print("pop", classmates)
classmates[-1] = 'last'
print("classmates[-1]", classmates)

Append: Adam: ['Michael', 'Jack', 'Tracy', 'Adam', 'last', 'Adam']
insert Jack ['Michael', 'Jack', 'Jack', 'Tracy', 'Adam', 'last', 'Adam']
pop ['Michael', 'Jack', 'Tracy', 'Adam', 'last', 'Adam']
classmates[-1] ['Michael', 'Jack', 'Tracy', 'Adam', 'last', 'last']


In [16]:
# list里面的元素的数据类型也可以不同，比如：
L = ['Apple', 123, True]
L

['Apple', 123, True]

#### tuple
另一种有序列表叫元组：`tuple`。`tuple`和`list`非常类似，但是`tuple`一旦初始化就不能修改
它也没有`append()`，`insert()`这样的方法。其他获取元素的方法和list是一样的，你可以正常地使用`classmates[0]`，`classmates[-1]`，但不能赋值成另外的元素。

In [17]:
classmates = ('Michael', 'Bob', 'Tracy')
print("classmates:", classmates)

classmates: ('Michael', 'Bob', 'Tracy')


因为tuple不可变，所以代码更安全。如果可能，能用tuple代替list就尽量用tuple。

tuple的陷阱：当你定义一个tuple时，在定义的时候，tuple的元素就必须被确定下来，比如：

In [19]:
t = (1, 2)
print(t)
x = () # 如果要定义一个空的tuple，可以写成()：
x

(1, 2)


()

但是，要定义一个只有1个元素的tuple，如果你这么定义：

In [20]:
t = (1)
print(t)

1


定义的不是tuple，是1这个数！这是因为括号()既可以表示tuple，又可以表示数学公式中的小括号，这就产生了歧义，因此，Python规定，这种情况下，按小括号进行计算，计算结果自然是1。

所以，只有1个元素的tuple定义时必须加一个逗号,，来消除歧义：

In [22]:
t = (1,) # Python在显示只有1个元素的tuple时，也会加一个逗号,，以免你误解成数学计算意义上的括号。
t

(1,)

最后来看一个“可变的”tuple：

In [24]:
t = ('a', 'b', ['A', 'B'])
t[2][0] = "X"
t[2][1] = "Y"
print(t)

('a', 'b', ['X', 'Y'])


这个tuple定义的时候有3个元素，分别是'a'，'b'和一个list。不是说tuple一旦定义后就不可变了吗？怎么后来又变了？

变量作为指针；表面上看，tuple的元素确实变了，但其实变的不是tuple的元素，而是list的元素。tuple一开始指向的list并没有改成别的list，所以，tuple所谓的“不变”是说，tuple的每个元素，指向永远不变。即指向'a'，就不能改成指向'b'，指向一个list，就不能改成指向其他对象，但指向的这个list本身是可变的！

#### 条件判断
在Python程序中，用if语句实现：

In [25]:
age = 12
if age >= 18 and age <= 60:
    print('your age is', age)
    print('adult')
elif age >= 60:
    print('your age is', age)
    print('old')
else:
    print('your age is', age)
    print('teenage')

your age is 12
teenage


根据Python的缩进规则,注意不要少写了冒号`:`, if语句执行有个特点，它是从上往下判断，如果在某个判断上是True，把该判断对应的语句执行后，就忽略掉剩下的elif和else
**再议 input**
这是因为input()返回的数据类型是str，str不能直接和整数比较，必须先把str转换成整数。Python提供了int()函数来完成这件事情：

In [27]:
s = input('birth: ')
birth = int(s) # int() 转成数字型
if birth < 2000:
    print('00前')
else:
    print('00后')

birth: 1943
00前


#### 循环
`for x in ...`循环就是把每个元素代入变量x，然后执行缩进块的语句。
第二种循环是while循环，只要条件满足，就不断循环，条件不满足时退出循环

In [31]:
sum = 0
for x in [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]:
    print(x)
    sum = sum + x
print(sum)

list(range(5))# list 调用

1
2
3
4
5
6
7
8
9
10
55


[0, 1, 2, 3, 4]

In [34]:
sum = 0
n = 99
while n > 0:
    sum = sum + n
    n = n - 2
print(sum)

2500


### 使用dict和set
#### dict
Python内置了字典：dict的支持，dict全称dictionary，在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度。

In [39]:
d={"Maichel": 89, "Adele": "ss", "John":"dd"}
print(d["Maichel"])
print(d["Adele"])
print(d["John"])

89
ss
dd


1. 要避免key不存在的错误，有两种办法，一是通过in判断key是否存在
2. 二是通过dict提供的get()方法，如果key不存在，可以返回None，或者自己指定的value

In [44]:
print('Thomas' in d)
d.get('Thomas', -1)

False


-1

In [46]:
#要删除一个key，用pop(key)方法，对应的value也会从dict中删除：
d.pop('John')
print(d)

{'Maichel': 89, 'Adele': 'ss'}


使用key-value存储结构的dict在Python中非常有用，选择不可变对象作为key很重要，最常用的key是字符串。这是因为dict根据key来计算value的存储位置，如果每次计算相同的key得出的结果不同，那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法（Hash）。要保证hash的正确性，作为key的对象就不能变。在Python中，字符串、整数等都是不可变的，因此，可以放心地作为key。而list是可变的，就不能作为key。

#### set
set和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。
要创建一个set，需要提供一个list作为输入集合：

In [48]:
s = set([1, 2, 3])
s

{1, 2, 3}

In [51]:
sets = set([2, 4, 5])
sets.add(4) # 通过add(key)方法可以添加元素到set中，可以重复添加，但不会有效果
sets.add(1)
sets.remove(5) # 通过remove(key)方法可以删除元素
sets

{1, 2, 4}

In [54]:
# set可以看成数学意义上的无序和无重复元素的集合，因此，两个set可以做数学意义上的交集、并集等操作：
s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
print(s1 & s2)
print(s1 | s2)

{2, 3}
{1, 2, 3, 4}


#### 再议不可变对象
str是不变对象，而list是可变对象。
对于可变对象，比如list，对list进行操作，list内部的内容是会变化的，比如：

In [55]:
a = ['c', 'b', 'a']
a.sort()
print(a)

['a', 'b', 'c']


而对于不可变对象，比如str，对str进行操作：

In [57]:
a = 'abc'
b = a.replace('a', 'A')
print(b)
print(a)

Abc
abc


1. 要始终牢记的是，a是变量，而'abc'才是字符串对象！有些时候，我们经常说，对象a的内容是'abc'，但其实是指，a本身是一个变量，它指向的对象的内容才是'abc'：  a-------> 'abc';
2. 当我们调用a.replace('a', 'A')时，实际上调用方法replace是作用在字符串对象'abc'上的，而这个方法虽然名字叫replace，但却没有改变字符串'abc'的内容。相反，replace方法创建了一个新字符串'Abc'并返回，如果我们用变量b指向该新字符串，就容易理解了，变量a仍指向原有的字符串'abc'，但变量b却指向新字符串'Abc'了;
3. 所以，对于不变对象来说，调用对象自身的任意方法，也不会改变该对象自身的内容。相反，这些方法会创建新的对象并返回，这样，就保证了不可变对象本身永远是不可变的。

### 函数

#### 调用函数 
    要调用一个函数，需要知道函数的名称和参数,可以从Python的官方网站查看文档，另外从也可以在交互式命令行通过`help(abs)`查看`abs函数`的帮助信息。内置的abs(),绝对值函数；

In [61]:
print(abs(-4))
print(int('3'))
print(float('12.34'))
print(str(12.34))
print(bool(0))

4
3
12.34
12.34
False


#### 定义函数
1. 在Python中，定义一个函数要使用def语句，依次写出函数名、括号、括号中的参数和冒号`:`，然后，在缩进块中编写函数体，函数的返回值用return语句返回。
2. 请注意，函数体内部的语句在执行时，一旦执行到return时，函数就执行完毕，并将结果返回。因此，函数内部通过条件判断和循环可以实现非常复杂的逻辑。如果没有return语句，函数执行完毕后也会返回结果，只是结果为`None`。`return None`可以简写为`return`。
3. 如果你已经把`my_abs()`的函数定义保存为`abstest.py`文件了，那么，可以在该文件的当前目录下启动Python解释器，用`from abstest import my_abs`来导入`my_abs()`函数，注意abstest是文件名（不含.py扩展名）

**空函数**
1. 如果想定义一个什么事也不做的空函数，可以用pass语句：
2. pass语句什么都不做，那有什么用？实际上pass可以用来作为占位符，比如现在还没想好怎么写函数的代码，就可以先放一个pass，让代码能运行起来。

In [62]:
def op():
    pass

**参数检查**
 对参数类型做检查，只允许整数和浮点数类型的参数。数据类型检查可以用内置函数`isinstance()`实现：

In [68]:
def my_abs(x):
    if not isinstance(x, (int, float)):
        raise TypeError("bad operand type")
    if x < 0:
        x = -x
    else:
        x = x
    return x

my_abs(-3)
my_abs('a')

TypeError: bad operand type

**返回多个值**
比如在游戏中经常需要从一个点移动到另一个点，给出坐标、位移和角度，就可以计算出新的新的坐标：

In [70]:
import math
def move(x, y, step, angle):
    nx = x+step*math.cos(angle)
    ny = y - step*math.sin(angle)
    return nx, ny
x, y = move(100, 100, 60, math.pi / 6)
print(x, y)

151.96152422706632 70.0


但其实这只是一种假象，Python函数返回的仍然是单一值;原来返回值是一个tuple！但是，在语法上，返回一个tuple可以省略括号，而多个变量可以同时接收一个tuple，按位置赋给对应的值，所以，Python的函数返回多值其实就是返回一个tuple，但写起来更方便。

**小结**
- 定义函数时，需要确定函数名和参数个数；
- 如果有必要，可以先对参数的数据类型做检查；
- 函数体内部可以用return随时返回函数结果；
- 函数执行完毕也没有return语句时，自动return None。
- 函数可以同时返回多个值，但其实就是一个tuple。

#### 函数的参数
1. 定义函数的时候，我们把参数的名字和位置确定下来，函数的接口定义就完成了.
2. 除了正常定义的**必选参数**外，还可以使用**默认参数**、**可变参数**和**关键字参数**，使得函数定义出来的接口，不但能处理复杂的参数，还可以简化调用者的代码。

**位置参数**
1. 修改后的power(x, n)函数有两个参数：x和n，这两个参数都是位置参数，调用函数时，传入的两个值按照位置顺序依次赋给参数x和n。

In [72]:
def power(x, n):
    sum = 1
    while n > 0:
        sum = sum * x
        n = n - 1
    return sum
power(2, 3)

8

**默认参数**
1. 由于我们经常计算x2，所以，完全可以把第二个参数n的默认值设定为2
2. 设置默认参数时，有几点要注意：
    1. 是必选参数在前，默认参数在后，否则Python的解释器会报错
    2. 是如何设置默认参数:当函数有多个参数时，把变化大的参数放前面，变化小的参数放后面。变化小的参数就可以作为默认参数
3. 定义默认参数要牢记一点：默认参数必须指向不变对象！

In [74]:
def calc(numbers):
    sum = 0
    for n in numbers:
        sum = sum +n*n
    return sum
# 但是调用的时候，需要先组装出一个list或tuple：
print(calc([1,2,3]))
print(calc((1, 2, 3)))

14
14


**可变参数**
    1. 可变参数就是传入的参数个数是可变的，可以是1个、2个到任意个，还可以是0个。
    2. 给定一组数字a，b，c……，请计算a2 + b2 + c2 + ……， 要定义出这个函数，我们必须确定输入的参数。由于参数个数不确定，我们首先想到可以把a，b，c……作为一个list或tuple传进来，这样，函数可以定义如下：

In [75]:
# 函数的参数改为可变参数：
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum
print(calc(1, 2, 3))
print(calc(1, 2, 3, 4))

14
30


1. 定义可变参数和定义一个list或tuple参数相比，仅仅在参数前面加了一个*号。
2. 在函数内部，参数numbers接收到的是一个tuple，因此，函数代码完全不变。但是，调用该函数时，可以传入任意个参数，包括0个参数

如果已经有一个list或者tuple，要调用一个可变参数怎么办？可以这样做：

In [76]:
nums = [1, 2, 3]
calc(nums[0], nums[1], nums[2]) # 过于繁琐
calc(*nums) # 允许你在list或tuple前面加一个*号，把list或tuple的元素变成可变参数传进去

14

**关键字参数**
1. 可变参数允许你传入0个或任意个参数，这些可变参数在函数调用时自动组装为一个tuple。
2. 而关键字参数允许你传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict。请看示例：

In [84]:
def person(name, age, **kw):
    return ("name:", name, "age:", age, "others:",kw)
# 函数person除了必选参数name和age外，还接受关键字参数kw。在调用该函数时，可以只传入必选参数：
print(person("Maichel", 12))
print(person('Bob', 35, city='Beijing'))
print(person("AoA", 30, job="Engineer", city="HZ"))  # 它可以扩展函数的功能,

extra={"Job":"Engineer", "City": "HZ"}
print(person("COC", 22, **extra))

('name:', 'Maichel', 'age:', 12, 'others:', {})
('name:', 'Bob', 'age:', 35, 'others:', {'city': 'Beijing'})
('name:', 'AoA', 'age:', 30, 'others:', {'job': 'Engineer', 'city': 'HZ'})
('name:', 'COC', 'age:', 22, 'others:', {'Job': 'Engineer', 'City': 'HZ'})


 `**extra`表示把`extra`这个dict的所有`key-value`用关键字参数传入到函数的`**kw`参数，kw将获得一个dict，注意kw获得的dict是extra的一份拷贝，对kw的改动不会影响到函数外的extra

**命名关键字参数**
    1. 对于关键字参数，函数的调用者可以传入任意不受限制的关键字参数。至于到底传入了哪些，就需要在函数内部通过kw检查。
    2. 仍以person()函数为例，我们希望检查是否有city和job参数

In [85]:
def person(name, age, **kw):
    if 'city' in kw:
        pass
    if 'job' in kw:
        pass
    print('name:', name, 'age:', age, 'other:', kw)
# 但是调用者仍可以传入不受限制的关键字参数：
person('Jack', 24, city='Beijing', addr='Chaoyang', zipcode=123456)

name: Jack age: 24 other: {'city': 'Beijing', 'addr': 'Chaoyang', 'zipcode': 123456}


In [88]:
# 如果要限制关键字参数的名字，就可以用命名关键字参数，例如，只接收city和job作为关键字参数。这种方式定义的函数如下：
def person(name, age, *, job, city):
    print(name, age, city, job)
# 和关键字参数**kw不同，命名关键字参数需要一个特殊分隔符*，*后面的参数被视为命名关键字参数。
person('Jack', 24, city='Beijing', job='Engineer')
#如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符*了：
def person2(name, age, *args, city, job):
    print(name, age, args, city, job)

Jack 24 Beijing Engineer


In [89]:
# 命名关键字参数必须传入参数名，这和位置参数不同。如果没有传入参数名，调用将报错：
person('Jack', 24, 'Beijing', 'Engineer')
# 由于调用时缺少参数名city和job，Python解释器把这4个参数均视为位置参数，但person()函数仅接受2个位置参数。
# 命名关键字参数可以有缺省值，从而简化调用
def person(name, age, *, city='Beijing', job):
    print(name, age, city, job)

TypeError: person() takes 2 positional arguments but 4 were given

**参数组合**
    1. 定义函数，可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数，这5种参数都可以组合使用。
    2. 但是请注意，参数定义的顺序必须是：必选参数、默认参数、可变参数、命名关键字参数和关键字参数。

In [96]:
def f1(a, b, c=0, *args, **kw):
    print('a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw)
def f2(a, b, c=0, *, d, **kw):
    print('a =', a, 'b =', b, 'c =', c, 'd =', d, 'kw =', kw)
print(f1(1, 2))
print(f1(1, 2, c=3))
print(f1(1, 2, 3, 'a', 'b'))
f1(1, 2, 3, 'a', 'b', x=99)
f2(1, 2, d=99, ext=None)

a = 1 b = 2 c = 0 args = () kw = {}
None
a = 1 b = 2 c = 3 args = () kw = {}
None
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {}
None
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {'x': 99}
a = 1 b = 2 c = 0 d = 99 kw = {'ext': None}


**小结**
    1. Python的函数具有非常灵活的参数形态，既可以实现简单的调用，又可以传入非常复杂的参数。
    2. 默认参数一定要用不可变对象，如果是可变对象，程序运行时会有逻辑错误！
    3. 要注意定义可变参数和关键字参数的语法： 
        1. `*args`是可变参数，args接收的是一个tuple；
        2. `**kw`是关键字参数，kw接收的是一个dict。
    4. 以及调用函数时如何传入可变参数和关键字参数的语法：
        1. 可变参数既可以直接传入：`func(1, 2, 3)`，又可以先组装`list或tuple`，再通过`*args`传入：`func(*(1, 2, 3))`；
        2. 关键字参数既可以直接传入：func(a=1, b=2)，又可以先组装dict，再通过`**kw`传入：`func(**{'a': 1, 'b': 2})`。
        3. 使用`*args`和`**kw`是Python的习惯写法，当然也可以用其他参数名，但最好使用习惯用法。
        4. 命名的关键字参数是为了限制调用者可以传入的参数名，同时可以提供默认值。
        5. 定义命名的关键字参数在没有可变参数的情况下不要忘了写分隔符*，否则定义的将是位置参数。

#### 递归函数
    1. 在函数内部，可以调用其他函数。如果一个函数在内部调用自身本身，这个函数就是递归函数。
    2. 递归函数注意 递归公式与递归结束条件

## 高级特性
### 切片
取前3个元素，用一行代码就可以完成切片：

In [103]:
L=["AA","vvv", "dddd","ddd"]
print(L[0:3]) #左闭右开[) 

['AA', 'vvv', 'dddd']


前4个数，每两个取一个：

In [104]:
L=["AA","vvv", "dddd","ddd"]
print(L[0:3])
print(L[-2:])#记住倒数第一个元素的索引是-1。
print(L[-2:-1])
print(L[-1:-2])

['AA', 'vvv', 'dddd']
['dddd', 'ddd']
['dddd']
[]


反向：

In [32]:
L=["AA","vvv", "dddd","ddd"]
L[::-1]# 反向取值

['ddd', 'dddd', 'vvv', 'AA']

tuple也是一种list，唯一区别是tuple不可变。因此，tuple也可以用切片操作，只是操作的结果仍是tuple：

In [100]:
(0, 1, 2, 3, 4)[:3]

(0, 1, 2)

字符串'xxx'也可以看成是一种list，每个元素就是一个字符。因此，字符串也可以用切片操作，只是操作结果仍是字符串

In [105]:
'ABCDEF'[::-2]

'FDB'

### 迭代
如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。Python的for循环不仅可以用在list或tuple上，还可以作用在其他可迭代对象上.只要是可迭代对象，无论有无下标，都可以迭代，如dict，str等

In [19]:
dict = {"a":1, "b":2, "c":{"hello":4, "sky": "full"}}
for k,v in dict.items():
    print(k,v)
for key in dict:
    print(key)
for value in dict.values():
    print(value)

a 1
b 2
c {'hello': 4, 'sky': 'full'}
a
b
c
1
2
{'hello': 4, 'sky': 'full'}


1. 当我们使用for循环时，只要作用于一个可迭代对象，for循环就可以正常运行，而我们不太关心该对象究竟是list还是其他数据类型。
2. 那么，如何判断一个对象是可迭代对象呢？方法是通过collections模块的Iterable类型判断:

In [23]:
from collections import Iterable
print(isinstance("ABC", Iterable))
print(isinstance(123, Iterable))
# 要对list实现类似Java那样的下标循环，Python内置的enumerate函数可以把一个list变成索引-元素对，
# 这样就可以在for循环中同时迭代索引和元素本身：
for i, value in enumerate(["a","d", "f"]):
    print(i, value)
for (x, y) in [(1, 1,), (2, 3),(4, 5)]:
    print(x, y)

True
False
0 a
1 d
2 f
1 1
2 3
4 5


### 列表生成式
列表生成式即List Comprehensions，是Python内置的非常简单却强大的可以用来**创建list**的生成式。
生成`list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]`可以用`list(range(1, 11))`：
可以用:

In [26]:
# 写列表生成式时，把要生成的元素x * x放到(前面放输出结果)，后面跟for循环，就可以把list创建出来，十分有用，多写几次，很快就可以熟悉这种语法。
# for循环(后面放内容，判断条件)还可以加上if判断，这样我们就可以筛选出仅偶数的平方
[x*x for x in range(1, 11) if x%2 == 0]

[4, 16, 36, 64, 100]

### 生成器
如果列表元素可以按照某种算法推算出来，那我们可以在循环的过程中不断推算出后续的元素。这样就不必创建完整的list，从而节省大量的空间。
一边循环一边计算的机制，称为生成器：generator。
第一种方法很简单，只要把一个列表生成式的`[]`改成`()`，就创建了一个generator：

In [34]:
L = [x*x for x in range(10)]    
print(L)
L2 = (x*x for x in range(10))# 可以直接打印出list的每一个元素，要一个一个打印出来，可以通过next()函数获得generator的下一个返回值：
print(L2)
next(L2)
next(L2) # ，generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误。

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
<generator object <genexpr> at 0x7f82a028aa98>


1

In [36]:
# 正确的方法是使用for循环，因为generator也是可迭代对象：
L = (x*x for x in range(10))
for item in L:
    print(item)

0
1
4
9
16
25
36
49
64
81


定义generator的另一种方法。如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator：

In [2]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        print(b)
        a, b = b, a+b 
        n = n + 1
    return 'done'
# 其中a, b = b, a+b 
# 相当于 t = (b, a+b) t是一个元组，元素不变
# a = t[0] 
# b = t[1]
fib(5)

1
1
2
3
5


'done'

In [3]:
# 可以看出，fib函数实际上是定义了斐波拉契数列的推算规则，可以从第一个元素开始，推算出后续任意的元素，这种逻辑其实非常类似generator。
# 上面的函数和generator仅一步之遥。要把fib函数变成generator，只需要把print(b)改为yield b就可以了
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a+b
        n = n+1
    return 'done'
# 如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator：
f = fib(6)
f

<generator object fib at 0x7fdad92d8a98>

generator和函数的执行流程不一样。函数是顺序执行，遇到return语句或者最后一行函数语句就返回。而变成generator的函数，在每次调用next()的时候执行，遇到`yield语句`返回，再次执行时`从上次返回的yield语句处`继续执行。

In [4]:
def odd():
    print('step 1')
    yield 1
    print('step 2')
    yield(3)
    print('step 3')
    yield(5)
o = odd()
next(o)
next(o)
next(o)
next(o)

step 1
step 2
step 3


StopIteration: 

1. 可以看到，odd不是普通函数，而是generator，在执行过程中，遇到yield就中断，下次又继续执行。执行3次yield后，已经没有yield可以执行了，所以，第4次调用next(o)就报错。
2. 回到fib的例子，我们在循环过程中不断调用yield，就会不断中断。当然要给循环设置一个条件来退出循环，不然就会产生一个无限数列出来。
3. 同样的，把函数改成generator后，我们基本上从来不会用next()来获取下一个返回值，而是直接使用for循环来迭代：

In [5]:
for n in fib(6):
    print(n)

1
1
2
3
5
8


但是用for循环调用`generator`时，发现拿不到`generator`的`return`语句的返回值。如果想要拿到返回值，必须捕获`StopIteration`错误，返回值包含在`StopIteration`的`value`中：

In [7]:
g = fib(6)
# 格式 generator
while True:
    try:
        x = next(g)
        print("g:",x)
    except StopIteration as e:
        print("Generator return value:",e.value)
        break

g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
Generator return value: done


In [9]:
def triangles():# 杨辉triangles
    currentLine = [1]

    while True:
        yield currentLine
        next1 = [0] + currentLine
        next2 = currentLine + [0]
        i = 0   # i 表示list各项的下标，用于将两个list各项数值相加。list长度不变
        currentLine = []
        while i < len(next1):
            currentLine.append(next1[i] + next2[i])
            i = i+1
# 方法二
def triangles ():
    List = [1]
    while True:
        yield List
        List =[1] + [value + List[index - 1] for index, value in enumerate(List) if index - 1 >= 0] + [1]
n = 0
for i in triangles():
    print(i)
    n = n+1
    if n == 10:
        break

[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]


### 迭代器
我们已经知道，可以直接作用于for循环的数据类型有以下几种：
    1. 集合数据类型，如`list、tuple、dict、set、str`等；
    2. `generator`，包括生成器和带yield的`generator function`。
这些可以直接作用于for循环的对象统称为可迭代对象：Iterable。
可以使用`isinstance()`判断一个对象是否是Iterable对象。
生成器都是`Iterator`对象，但`list、dict、str`虽然是`Iterable`，却不是`Iterator`。

把`list、dict、str`等Iterable变成Iterator可以使用`iter()`函数

In [21]:
from collections import Iterable
from collections import Iterator
print(isinstance([], Iterable))
print(isinstance(12, Iterable))
print(isinstance([], Iterator))
print(isinstance(iter((x for x in [1, 2, 3])), Iterator))

True
False
False
True


为什么list、dict、str等数据类型不是Iterator？
    这是因为Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。
    Iterator甚至可以表示一个无限大的数据流，例如全体自然数。而使用list是永远不可能存储全体自然数的。

**小结**
- 凡是可作用于for循环的对象都是`Iterable`类型；
- 凡是可作用于`next()`函数的对象都是`Iterator`类型，它们表示一个惰性计算的序列；
- 集合数据类型如`list、dict、str`等是`Iterable`但不是`Iterator`，不过可以通过`iter()`函数获得一个`Iterator`对象。
- Pythonfor循环本质上就是通过不断调用next()函数实现的

## 函数式编程
1. 函数是Python内建支持的一种封装，我们通过把大段代码拆成函数，通过一层一层的函数调用，就可以把复杂任务分解成简单的任务，这种分解可以称之为面向过程的程序设计。函数就是面向过程的程序设计的基本单元。
2. 函数式编程（请注意多了一个“式”字）——Functional Programming，虽然也可以归结到面向过程的程序设计，但其思想更接近数学计算。函数式编程就是一种抽象程度很高的编程范式，纯粹的函数式编程语言编写的函数没有变量，因此，任意一个函数，只要输入是确定的，输出就是确定的，这种纯函数我们称之为没有副作用。而允许使用变量的程序设计语言，由于函数内部的变量状态不确定，同样的输入，可能得到不同的输出，因此，这种函数是有副作用的。
3. 函数式编程的一个特点就是，允许把函数本身作为参数传入另一个函数，还允许返回一个函数！Python对函数式编程提供部分支持。由于Python允许使用变量，因此，Python不是纯函数式编程语言。


### 高阶函数
高阶函数英文叫Higher-order function。什么是高阶函数？我们以实际代码为例子，一步一步深入概念。

1. **变量可以指向函数**: 函数本身也可以赋值给变量，即：变量可以指向函数

In [24]:
print(abs)# build-in function
# 可见，abs(-10)是函数调用，而abs是函数本身。
# 要获得函数调用结果，我们可以把结果赋值给变量：
x = abs(-10)
print(x)
# 如果一个变量指向了一个函数，那么，可否通过该变量来调用这个函数？用代码验证一下：
f = abs
print(f(-12))

<built-in function abs>
10
12


2. **函数名也是变量**: 函数名其实就是指向函数的变量,对于abs()这个函数，完全可以把函数名abs看成变量，它**指向一个可以计算绝对值的函数**！如果把abs指向其他对象，会有什么情况发生？`abs = 10, abs(-10)`报错
3. **传入函数**: 既然变量可以指向函数，函数的参数能接收变量，那么一个函数就可以接收另一个函数作为参数，这种函数就称之为高阶函数。

In [27]:
def add(x, y , f):
    return f(x) + f(y)
add(-1, -4, f)
# 把函数作为参数传入，这样的函数称为高阶函数，函数式编程就是指这种高度抽象的编程范式。

5

#### map/reduce
1. Python内建了map()和reduce()函数。
2. 我们先看map。map()函数接收两个参数，一个是函数，一个是Iterable，map将传入的函数依次作用到序列的每个元素，并把结果作为新的Iterator返回。
3. `map()`传入的第一个参数是f，即函数对象本身。由于结果r是一个`Iterator`，`Iterator`是惰性序列，因此通过`list()`函数让它把整个序列都计算出来并返回一个`list`。

In [39]:
list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))

['1', '2', '3', '4', '5', '6', '7', '8', '9']

`reduce`把一个函数作用在一个序列`[x1, x2, x3, ...]`上，这个函数必须接收两个参数，`reduce`把结果继续和序列的下一个元素做累积计算，其效果就是：`reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)`

In [29]:
from functools import reduce
def add(x, y):
    return 10*x +y
print('1',reduce(add, [2, 3, 4, 5]))
#from functools import reduce

1 2345


In [32]:
# 我们就可以写出把str转换为int的函数
from functools import reduce
def add(x, y):
    return 10*x + y
def char2num(c):
    digits = {'0':0, '1':1, '2':2, '3':3, '4':4, '5':5, '6':6, '7':7, '8':8, '9':9}
    return digits[c]
reduce(add, map(char2num, '124363'))

124363

In [37]:
from functools import reduce
DIGITS = {'0':0, '1':1, '2':2, '3':3, '4':4, '5':5, '6':6, '7':7, '8':8, '9':9}
def char2int(s):
    def add(x, y):
        return 10*x + y
    def char2num(s):
        return DIGITS[s]
    return reduce(add, map(char2num, s))
char2int('45609876543')
# =>用lambda函数进一步简化成：
def char2int2(s):
    def char2num(c):
        return DIGITS[c]
    return reduce(lambda x, y : 10*x+y, map(char2num, s))
char2int2('456098765431')

456098765431

#### filter
1. Python内建的`filter()`函数用于过滤序列。
2. 和`map()`类似，`filter()`也接收一个函数和一个序列。和`map()`不同的是，`filter()`把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。
3. `filter()`把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。

In [38]:
def is_odd(n):
    return n % 2 == 1

list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
# 可见用filter()这个高阶函数，关键在于正确实现一个“筛选”函数。
#注意到filter()函数返回的是一个Iterator，也就是一个惰性序列，所以要强迫filter()完成计算结果，需要用list()函数获得所有结果并返回list。

[1, 5, 9, 15]

In [42]:
# 先构造一个从3开始的奇数序列：
def _odd_iter(): #这是一个生成器，并且是一个无限序列。
    n = 1
    while True:
        n = n+2
        yield n
def _not_divisiable(n):# 定义一个筛选函数：
    return lambda x: x%n > 0
def primes():#定义一个生成器，不断返回下一个素数：
    yield 2
    it = _odd_iter()# 初始序列
    while True:
        n = next(it) # 返回序列的第一个数
        yield n
        it = filter(_not_divisiable(n), it)
for n in primes():
    if n < 10:
        print(n)
    else:
        break

2
3
5
7


#### sorted
sorted()函数也是一个高阶函数，它还可以接收一个key函数来实现自定义的排序，例如按绝对值大小排序：

In [45]:
print(sorted([2, -4, 5, -9], key=abs))
print(sorted(['alsd', 'Affne', 'ieur', 'Zeir'],key=str.lower, reverse=True))

[2, -4, 5, -9]
['Zeir', 'ieur', 'alsd', 'Affne']


### 返回函数
#### 函数作为返回值
高阶函数除了可以接受函数作为参数外，还可以把函数作为结果值返回。

In [51]:
def sum_calc(*args):
    sum = 0
    for n in args:
        sum = sum+n
    return sum
# 如果不需要立刻求和，而是在后面的代码中，根据需要再计算怎么办？可以不返回求和的结果，而是返回求和的函数：
def lazy_sum(*args):
    def sum_calc():
        sum = 0
        for n in args:
            sum = sum + n
            return sum
        return sum
    return sum_calc
f = lazy_sum(1, 4, 5, 9)
print(f)
print(f())

<function lazy_sum.<locals>.sum_calc at 0x7fdad89a6488>
1


在这个例子中，我们在函数lazy_sum中又定义了函数sum，并且，内部函数sum可以引用外部函数lazy_sum的参数和局部变量，当lazy_sum返回函数sum时，相关参数和变量都保存在返回的函数中，这种称为“闭包（Closure）”的程序结构拥有极大的威力。

In [53]:
# 请再注意一点，当我们调用lazy_sum()时，每次调用都会返回一个新的函数，即使传入相同的参数：
f1 = lazy_sum(1, 2, 3, 5, 6)
f2 = lazy_sum(1, 2, 3, 5, 6)
f1 == f2# f1()和f2()的调用结果互不影响

False

#### 闭包
注意到返回的函数在其定义内部引用了局部变量args，所以，当一个函数A返回了一个函数B后，其内部的局部变量还被新函数B引用，所以，闭包用起来简单，实现起来可不容易。

In [54]:
def count():
    fs = []
    for i in range(1, 4):
        def f():
            return i*i
        fs.append(f)
    return fs
f1, f2, f3 = count()
print(f1())
print(f2())
print(f3())

9
9
9


1. 全部都是9！原因就在于返回的函数引用了变量i，但它并非立刻执行。等到3个函数都返回时，它们所引用的变量i已经变成了3，因此最终结果为9。
2. 返回闭包时牢记一点：返回函数不要引用任何循环变量，或者后续会发生变化的变量。
3. 如果一定要引用循环变量怎么办？方法是再创建一个函数，用该函数的参数绑定循环变量当前的值，无论该循环变量后续如何更改，已绑定到函数参数的值不变：

In [56]:
def count():
    def f(j):
        def g():
            return j*j
        return g
    fs =[]
    for i in range(1, 4):
        fs.append(f(i))
    return fs
f1, f2, f3 = count()
print(f1())
print(f2())
print(f3())

1
4
9


### 匿名函数
关键字`lambda`表示匿名函数，冒号前面的x表示函数参数。

匿名函数有个限制，就是只能有一个表达式，不用写return，返回值就是该表达式的结果。

用匿名函数有个好处，因为函数没有名字，不必担心函数名冲突。

In [58]:
list(map(lambda x:x*x, [1, 2, 3, 4, 5, 6, 7, 8, 9]))

[1, 4, 9, 16, 25, 36, 49, 64, 81]

In [60]:
# 匿名函数也是一个函数对象，也可以把匿名函数赋值给一个变量，再利用变量来调用该函数：
f = lambda x: x*x
print(f)
print(f(5))

<function <lambda> at 0x7fdad89a6950>
25


### 装饰器
由于函数也是一个对象，而且函数对象可以被赋值给变量，所以，通过变量也能调用该函数。
质上，decorator就是一个返回函数的高阶函数。所以，我们要定义一个能打印日志的decorator.

In [63]:
def now():
    print('2018-10-10')
f = now
f()
# 函数对象有一个__name__属性，可以拿到函数的名字：
print(now.__name__)
print(f.__name__)

2018-10-10
now
now


假设我们要增强now()函数的功能，比如，在函数调用前后自动打印日志，但又不希望修改now()函数的定义，这种在代码运行期间动态增加功能的方式，称之为“装饰器”（Decorator）。

本质上，decorator就是一个返回函数的高阶函数。所以，我们要定义一个能打印日志的decorator，可以定义如下：

In [71]:
def log(func):#高阶函数 返回打印函数
    def wrapper(*args, **kw):# 打印函数 打印日志，返回传入的函数
        print("wrapper call %s()" % func.__name__)
        return func(*args, **kw)
    return wrapper
# 观察上面的log，因为它是一个decorator，所以接受一个函数作为参数，并返回一个函数。
# 我们要借助Python的@语法，把decorator置于函数的定义处：

@log
def now():
    print("2018-10-1")
    
now()

wrapper call now()
2018-10-1


分析：
1. 调用`now()`函数，不仅会运行`now()`函数本身，还会在运行`now()`函数前打印一行日志：
2. 把`@log`放到`now()`函数的定义处，相当于执行了语句：`now = log(now)`
3. 由于`log()`是一个decorator，返回一个函数，所以，原来的`now()`函数仍然存在，只是现在同名的now变量指向了新的函数，
4. 于是调用`now()`将执行新函数，即在`log()`函数中返回的`wrapper()`函数。
5. `wrapper()`函数的参数定义是`(*args, **kw)`，因此，`wrapper()`函数可以接受任意参数的调用。
6. 在`wrapper()`函数内，首先打印日志，再紧接着调用原始函数。

如果decorator本身需要传入参数，那就需要编写一个返回decorator的高阶函数，写出来会更复杂。比如，要自定义log的文本

In [74]:
def log(text):
    def decorator(func):
        def wrapper(*args, **kw):
            print("%s %s()" % (text, func.__name__))
            return func(*args, **kw)
        return wrapper
    return decorator

@log('execute')
def now():
    print('2018-10-10')

now()

excute now()
2018-10-10


**分析**
和两层嵌套的decorator相比，3层嵌套的效果是这样的：now = log('execute')(now)

我们来剖析上面的语句，首先执行`log('execute')`，返回的是decorator函数，再调用返回的函数，参数是now函数，返回值最终是wrapper函数。

以上两种decorator的定义都没有问题，但还差最后一步。因为我们讲了函数也是对象，它有__name__等属性，但你去看经过decorator装饰之后的函数，它们的__name__已经从原来的'now'变成了'wrapper'。

因为返回的那个wrapper()函数名字就是'wrapper'，所以，需要把原始函数的__name__等属性复制到wrapper()函数中，否则，有些依赖函数签名的代码执行就会出错。
不需要编写`wrapper.__name__ = func.__name__`这样的代码，Python内置的`functools.wraps`就是干这个事的，所以，一个完整的decorator的写法如下：

In [84]:
import functools
def log(func):
    @functools.wraps(func)
    def wrapper(*args, **kw):
        print("wrapper %s()"%func.__name__)
        return func(*args, **kw)
    return wrapper
@log
def now():
    print('2018003')
now()

# 针对带参数
def log2(text):
    def decorator(func):
        @functools.wraps(func)
        def wrapper(*args, **kw):
            print("%s %s()"%(text, func.__name__))
            return func(*args, **kw)
        return wrapper
    return decorator
@log2('fff')
def now2():
    print('fjnef')
now()

wrapper now()
2018003
wrapper now()
2018003


**小结**
1. 在面向对象（OOP）的设计模式中，decorator被称为装饰模式。OOP的装饰模式需要通过继承和组合来实现，而Python除了能支持OOP的decorator外，直接从语法层次支持decorator。Python的decorator可以用函数实现，也可以用类实现。
2. decorator可以增强函数的功能，定义起来虽然有点复杂，但使用起来非常灵活和方便。

请编写一个decorator，能在函数调用的前后打印出'begin call'和'end call'的日志。

In [93]:
import functools, time
def log(func):
    @functools.wraps(func)
    def wrapper(*args, **kw):
        print("begin call")
        result = func(*args, **kw)
        print("end call")
        return result
    return wrapper

# @log
# def fn(x, y):
#     time.sleep(0.5)
#     return x + y
# fn(2, 3)

def logger(text):
    # 有三种方法可以进行判断:
    # if(hasattr(text,'__call__')):
    # if(type(text)!=type('')):
    # if(callable(text)):
    if(callable(text)):
        @functools.wraps(text)
        def wrapper(*args, **kw):
            print("%s!!"%(text.__name__))
            return text(*args, **kw)
        return wrapper
    def decorator(func):
        @functools.wraps(text)
        def wrapper(*args, **kw):
            print("%s say: %s"% (func.__name__, text))
            return func(*args, **kw)
        return wrapper
    return decorator

@logger
def fn(x, y):
    return x+y

@logger("use execute")
def fn2(x, y):
    return x*y
print(fn())
print(fn2())

fn!!


NameError: name 'func' is not defined

### 偏函数
Python的functools模块提供了很多有用的功能，其中一个就是偏函数（Partial function）。要注意，这里的偏函数和数学意义上的偏函数不一样。当函数的参数个数太多，需要简化时，使用functools.partial可以创建一个新的函数，这个新函数可以固定住原函数的部分参数，从而在调用时更简单。
## 模块
模块是一组Python代码的集合，可以使用其他模块，也可以被其他模块使用。
创建自己的模块时，要注意：

- 模块名要遵循Python变量命名规范，不要使用中文、特殊字符；
- 模块名不要和系统模块名冲突，最好先查看系统是否已存在该模块，检查方法是在Python交互环境执行import abc，若成功则说明系统存在此模块。

### 使用
就是导入该模块，`import os`

## 面向对象编程
面向对象编程——Object Oriented Programming，简称OOP，是一种程序设计思想。OOP把对象作为程序的基本单元，一个对象包含了数据和操作数据的函数。

- 面向过程的程序设计把计算机程序视为一系列的命令集合，即一组函数的顺序执行。为了简化程序设计，面向过程把函数继续切分为子函数，即把大块函数通过切割成小块函数来降低系统的复杂度。
- 而面向对象的程序设计把计算机程序视为一组对象的集合，而每个对象都可以接收其他对象发过来的消息，并处理这些消息，计算机程序的执行就是一系列消息在各个对象之间传递。

### 类和实例
面向对象最重要的概念就是类（Class）和实例（Instance），必须牢记类是抽象的模板，比如Student类，而实例是根据类创建出来的一个个具体的“对象”，每个对象都拥有相同的方法，但各自的数据可能不同。
### 数据封装
面向对象编程的一个重要特点就是数据封装。