# Python Review by Xuefeng Liao

This notebook is about reviewing basic knowledge and approaching to more advanced topics. The material is based on Xuefeng Liao. For basic terms, I just noted some of the topics not familiar to me. For advanced topic, the material will contain more details. 

## Basic Knowledge

### 数据类型和变量
字符串
* 转义字符
    1. 转义字符\：可以转义很多字符，比如\n表示换行，\t表示制表符，字符\本身也要转义，所以\\表示的字符就是\
    2. r' '：表示' '内部的字符串默认不转义
    3. 换行：单行\n，多行'''...'''（...是提示符，不是代码）
空值：None

In [8]:
print('I\'m \"OK\"!')
print('\\\t\\')
print(r'\\\t\\')
print('''line1
line2
line3''')

I'm "OK"!
\	\
\\\t\\
line1
line2
line3


变量
* 变量在计算机内存中的表示：
    
    例：a = 'ABC'
    Python 解释器两步走：
    1. 在内存中创建'ABC'字符串
    2. 在内存中创建名为a的变量，并指向'ABC'
    
    
    例：b = a
    将a赋值给b，把变量b指向变量a所指向的数据，若a所指向的数据改变，则b不变

In [9]:
a = 'ABC'
b = a
a = 'XYZ'
print(b)

ABC


常量

通常用全部大写的变量名表示常量

除法
* /：计算结果是浮点数
* //：计算结果是整数
* %：余数

In [14]:
print(10/3)
print(10//3)
print(10%3)

3.3333333333333335
3
1


练习

In [15]:
print(r'Hello, \'Adam\'')

Hello, \'Adam\'


### 字符串和编码

* 编码

    1. ASCII：1个字节，只能用于英文字母
    2. Unicode：2个字节，可用于中文等
    3. UTF-8：1-6个字节，可以根据Unicode转换


* 格式化
    1. %

| 占位符 | 替换内容 |
| --- | ---|
| %d | 整数 |
| %2d | 两位整数 |
| %02d | 两位整数补0 |
| %f | 浮点数 |
| %.2f | 两位小数 |
| %s | 字符串 |
| %x | 十六进制整数 |
| %% | 转义% |

    
    2. format()

    '{0}, {1}'.format(xxx0, xxx1)

In [1]:
print('%2d-%02d' % (3, 1))
print('%.2f' % 3.1415926)

 3-01
3.14


练习

In [3]:
s1 = 72
s2 = 85
r = (s2-s1) / s1
print('%.1f%%' % r)

0.2%


### list和tuple

* List
    1. 可变的有序列表
    2. 元素的数据类型可以不同

In [None]:
classmates = ['Michael', 'Bob', 'Tracy']

# 追加元素到list末尾
classmates.append('Adam')

# 把元素插入指定位置
classmates.insert(1, 'Jack')

# 删除list末尾元素
classmates.pop()

# 删除指定位置元素
classmates.pop(2)

# 替换某个元素
classmates[1] = 'Sarah'

# list套list
s = ['python', 'java', ['asp', 'php'], 'scheme']

* tuple
    1. 不能修改，代码更安全
    2. tuple元素不能变指的是tuple每个元素的指向永远不变

In [None]:
# 只有1个元素的tuple
t = (1,)

# 可变的tuple：指向的list不变，但list里的元素可变
t = ('a', 'b', ['A', 'B'])
t[2][0] = 'X'
t[2][1] = 'Y'

# 空tuple
t = ()

### 条件语句

if <条件1>:

    <执行1>
    
elif <条件2>: 
    
    <执行2>

else: 
    
    <执行3>

* input: 输入的是str

In [None]:
birth = input('birth: ')

### 循环

1. for x in ...
2. while <condition>: 条件满足不断循环，条件不满足退出循环
3. break: 提前退出循环
4. continue: 跳过当前循环，直接进入下一次循环
    
注：a. 不要滥用break和continue，会造成代码执行逻辑分叉过多，可以通过改写循环条件实现
    
    b. Ctrl+C：退出程序

### dict和set

dict

vs list: 
1. dict查找和插入速度快，不会随着key的增加而变慢
2. dict需要占用大量内存， 内存浪费多

dict的key是不可变对象。通过key计算位置，该算法称为哈希算法（Hash）。

In [5]:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
d['Michael']

95

In [7]:
# 插入新数据
d['Adam'] = 67
d

{'Michael': 95, 'Bob': 75, 'Tracy': 85, 'Adam': 67}

In [8]:
# 通过in判断key是否存在
'Thomas' in d

False

In [9]:
# 用get()判断key是否存在，或指定value
d.get('Thomas')
d.get('Thomas', -1)

-1

In [10]:
# 删除key
d.pop('Bob')
d

{'Michael': 95, 'Tracy': 85, 'Adam': 67}

set

1. 一组key的集合，但不存储value
2. 由于key不能重复，set中没有重复的key

In [11]:
s = set([1, 1, 2, 2, 3, 3])
s

{1, 2, 3}

In [13]:
# 添加元素到set中
s.add(4)
s

{1, 2, 3, 4}

In [14]:
# 删除元素
s.remove(4)
s

{1, 2, 3}

In [15]:
# 交集
s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
s1 & s2

{2, 3}

In [16]:
# 并集
s1 | s2

{1, 2, 3, 4}

可变与不可变

对于不变对象来说，调用对象自身的任意方法，也不会改变该对象自身的内容，而是会创建新的对象并返回，如此保证不可变对象本身永远不可变。

In [18]:
# 对str进行操作
a = 'abc'
a.replace('a', 'A')

'Abc'

In [19]:
a

'abc'

In [20]:
b = a.replace('a', 'A')
b

'Abc'

a 是变量，'abc'是字符串对象。调用a.replace时，调用方法replace是作用在字符串对象'abc'上的，并没有改变字符串'abc'内容，而是创建了一个新字符串'Abc'并返回。如果用变量b指向该新字符串，b='Abc'，a='abc'.

## 函数

### 定义函数

栗子：求绝对值

In [2]:
def my_abs(x):
    if x >= 0:
        return x
    else:
        return -x
    
my_abs(-99)

99

如果你已经把my_abs()的函数定义保存为abstest.py文件了，那么，可以在该文件的当前目录下启动Python解释器，用from abstest import my_abs来导入my_abs()函数，注意abstest是文件名（不含.py扩展名）

In [None]:
from abstest import my_abs
my_abs(-9)

TypeError完善
* my_abs没有参数检查，输入str后会导致if语句出错，出错信息和abs不一样
* 解决办法：将参数类型检查加入my_abs定义

In [3]:
def my_abs(x):
    if not isinstance(x, (int, float)): # 检查数据类型
        raise TypeError('bad operand type')
    if x >= 0:
        return x
    else:
        return -x

In [4]:
my_abs('A')

TypeError: bad operand type

空函数

* pass语句：可以用作占位符，暂时没想好怎么写函数的时候可用

In [None]:
def nop(): 
    pass

返回多个值
* 栗子：移动到新的坐标，返回值为tuple

In [5]:
import math

def move(x, y, step, angle=0):
    nx = x + step * math.cos(angle)
    ny = y - step * math.sin(angle)
    return nx, ny

In [6]:
r = move(100, 100, 60, math.pi / 6)
print(r)

(151.96152422706632, 70.0)


### 函数的参数

栗子：$x^n$

In [None]:
def power(x):
    return x * x

位置参数

* power(x, n)，x和n都是位置参数，调用函数时，传入的两个值按照位置顺序依次赋给参数x和n

In [None]:
def power(x, n):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s

默认参数

* power(x, n=2)

In [7]:
def power(x, n=2):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s

In [8]:
power(5)

25

In [9]:
power(5, 2)

25

In [10]:
power(5, 3)

125

注意：
1. 必选参数在前，默认参数在后
2. 当函数有多个参数时，变化大的参数放前，变化小的放后
3. 默认参数必须指向不变对象（下方栗子）

In [11]:
def add_end(L=[]):
    L.append('END')
    return L

In [12]:
add_end()

['END']

In [13]:
add_end()

['END', 'END']

修改：用None这个不变对象来实现

In [15]:
def add_end(L=None):
    if L is None:
        L = []
    L.append('END')
    return L

In [17]:
add_end()

['END']

In [18]:
add_end()

['END']

可变参数

* 传入的参数个数是可变的，通常在参数前加*
* 可变参数在函数调用时自动组装为一个tuple

In [21]:
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

In [22]:
calc()

0

In [23]:
calc(1, 2)

5

In [25]:
nums = [1, 2, 3]
calc(*nums)

14

关键字参数

* 允许传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict

In [26]:
def person(name, age, **kw): # kw为关键字参数
    print('name:', name, 'age:', age, 'other:', kw)

In [27]:
person('Michael', 30)

name: Michael age: 30 other: {}


In [28]:
person('Adam', 45, gender='M', job='Engineer')

name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}


In [29]:
extra = {'city': 'Beijing', 'job': 'Engineer'}
person('Jack', 24, **extra)

name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}


 \*\*extra表示把extra这个dict的所有key-value用关键字参数传入到函数的\*\*kw参数，kw将获得一个dict，注意kw获得的dict是extra的一份拷贝，对kw的改动不会影响到函数外的extra

命名关键字参数

* 检查是否有city和job参数，仍可传入不受限制的关键字参数

In [30]:
def person(name, age, **kw):
    if 'city' in kw:
        # 有city参数
        pass
    if 'job' in kw:
        # 有job参数
        pass
    print('name:', name, 'age:', age, 'other:', kw)

In [31]:
person('Jack', 24, city='Beijing', addr='Chaoyang', zipcode=123456)

name: Jack age: 24 other: {'city': 'Beijing', 'addr': 'Chaoyang', 'zipcode': 123456}


* 如果要限制关键字参数的名字，可以用命名关键字参数
* 命名关键字参数需要一个特殊分隔符\*，\*后面的参数被视为命名关键字参数
* 例如，只接收city和job作为关键字参数

In [32]:
def person(name, age, *, city, job):
    print(name, age, city, job)

In [33]:
person('Jack', 24, city='Beijing', job='Engineer')

Jack 24 Beijing Engineer


* 如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符\*了
* 命名关键字参数必须传入参数名，如果没有传入参数名，调用将报错

In [36]:
def person(name, age, *args, city, job):
    print(name, age, args, city, job)

In [37]:
person('Jack', 24, 'Beijing', 'Engineer')

TypeError: person() missing 2 required keyword-only arguments: 'city' and 'job'

* 命名关键字参数city具有默认值，调用时，可不传入city参数

In [38]:
def person(name, age, *, city='Beijing', job):
    print(name, age, city, job)

In [39]:
person('Jack', 24, job='Engineer')

Jack 24 Beijing Engineer


小结： 

* 有\*为命名关键字参数，没有\*为位置参数
* \*为可变参数，\*\*为关键字参数，\*,为命名关键字参数

参数组合

* 参数定义顺序：必选参数>默认参数>可变参数>命名关键字参数>关键字参数

小结

* 默认参数一定要用不可变对象，如果是可变对象，程序运行时会有逻辑错误！

* 要注意定义可变参数和关键字参数的语法：

    - \*args是可变参数，args接收的是一个tuple；

    - \*\*kw是关键字参数，kw接收的是一个dict。

* 调用函数时如何传入可变参数和关键字参数的语法：

    - 可变参数既可以直接传入：func(1, 2, 3)，又可以先组装list或tuple，再通过\*args传入：func(\*(1, 2, 3))；

    - 关键字参数既可以直接传入：func(a=1, b=2)，又可以先组装dict，再通过\*\*kw传入：func(\*\*{'a': 1, 'b': 2})。

* 使用\*args和\*\*kw是Python的习惯写法，当然也可以用其他参数名，但最好使用习惯用法

* 命名的关键字参数是为了限制调用者可以传入的参数名，同时可以提供默认值

* 定义命名的关键字参数在没有可变参数的情况下不要忘了写分隔符*，否则定义的将是位置参数

练习
* 可接收一个或多个数并计算乘积
* 注意product()

In [41]:
def product(x, *args): 
    for i in args: 
        x = i * x
    return x

In [42]:
product()

TypeError: product() missing 1 required positional argument: 'x'

### 递归函数

* 一个函数在内部调用自身本身
* 使用递归函数需要注意防止栈（stack）溢出
    - 函数调用是通过栈（stack）这种数据结构实现的，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就会减一层栈帧，由于栈的大小不是无限的，所以，递归调用的次数过多，会导致栈溢出
    - 解决方法：尾递归优化，返回函数本身，使递归本身无论调用多少次，都只占用一个栈帧
    - Python标准的解释器没有针对尾递归做优化，任何递归函数都存在栈溢出的问题；栗子中，即使把fact(n)函数改成尾递归方式，也会导致栈溢出

In [43]:
# 无尾递归优化，返回表达式n * fact()
def fact(n):
    if n==1:
        return 1
    return n * fact(n - 1)

In [None]:
# 有尾递归优化，返回fact_iter本身
def fact(n):
    return fact_iter(n, 1)

def fact_iter(num, product):
    if num == 1:
        return product
    return fact_iter(num - 1, num * product)

## 高级特性

### 迭代

dict可迭代
* 迭代key

In [2]:
d = {'a': 1, 'b': 2, 'c': 3}
for key in d: 
    print(key)

a
b
c


* 迭代value

In [4]:
for value in d.values(): 
    print(value)

1
2
3


* 同时迭代key和value

In [5]:
for k, v in d.items(): 
    print(k, v)

a 1
b 2
c 3


判断对象是否可迭代
* from collections import Iterable

In [6]:
from collections import Iterable
isinstance('abc', Iterable)

  """Entry point for launching an IPython kernel.


True

对list实现下标循环
* enumerate

In [7]:
for i, value in enumerate(['A', 'B', 'C']): 
    print(i, value)

0 A
1 B
2 C


### 列表生成式

可以用一行语句代替循环。把要生成的元素放到前面，后面跟for循环。
* for前面必须是一个表达式
* for后if没有else，因为if是筛选条件
* for前if必须有else，因为for前需要是一个完整的表达式

In [1]:
[x*x for x in range(1, 11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [2]:
# if在for后
[x*x for x in range(1, 11) if x % 2 == 0]

[4, 16, 36, 64, 100]

In [6]:
# if在for前
[x if x % 2 == 0 else -x for x in range(1, 11)]

[-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]

In [3]:
# for + for
[m + n for m in 'ABC' for n in 'XYZ']

['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

In [4]:
# dict
d = {'x': 'A', 'y': 'B', 'z': 'C' }
[k + '=' + v for k, v in d.items()]

['x=A', 'y=B', 'z=C']

### 生成器（generator）

* 列表元素可以按照某种算法推算出来，在循环的过程中不断推算出后续的元素，这样就不必创建完整的list，从而节省大量的空间
* 生成方式：[]改为()

In [8]:
g = (x*x for x in range(10))

In [9]:
# 打印g每个元素
next(g)

0

每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误

In [10]:
for n in g: 
    print(n)

1
4
9
16
25
36
49
64
81


**将函数定义为generator**
* yield
    - 斐波拉契数列
* generator的工作原理，它是在for循环的过程中不断计算出下一个元素，并在适当的条件结束for循环。对于函数改成的generator来说，遇到return语句或者执行到函数体最后一行语句，就是结束generator的指令，for循环随之结束
* 普通函数调用直接返回结果，generator函数的“调用”实际返回一个generator对象

In [13]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        print(b)
        a, b = b, a + b
        n = n + 1
    return 'done'

赋值语句a, b = b, a + b相当于

In [14]:
t = (b, a + b) # t是一个tuple
a = t[0]
b = t[1]

NameError: name 'b' is not defined

推算逻辑类似generator。把fib函数变成generator，只需要把print(b)改为yield b就可以。

In [20]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a + b
        n = n + 1
    return 'done'

generator和函数的执行流程不一样。函数是顺序执行，遇到return语句或者最后一行函数语句就返回。而变成generator的函数，在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行。
* 栗子

In [15]:
def odd():
    print('step 1')
    yield 1
    print('step 2')
    yield(3)
    print('step 3')
    yield(5)

In [16]:
o = odd()
next(o)

step 1


1

In [17]:
next(o)

step 2


3

In [18]:
next(o)

step 3


5

把函数改成generator后，我们基本上从来不会用next()来获取下一个返回值，而是直接使用for循环来迭代

In [21]:
for n in fib(6):
    print(n)

1
1
2
3
5
8


用for循环拿不到返回值，需要捕获StopIteration错误，返回值包含在StopIteration的value中

In [24]:
g = fib(6)
while True:
     try:
         x = next(g)
         print('g:', x)
     except StopIteration as e:
         print('Generator return value:', e.value)
         break

g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
Generator return value: done


练习

### 迭代器

* 可迭代对象(Iterable)
    - 可以直接作用于for循环的对象
    - 使用isinstance()判断是否为iterable

In [25]:
from collections.abc import Iterable
isinstance([], Iterable)

True

* 迭代器(Iterator)
    - 可以被next()函数调用并不断返回下一个值的对象
    - 使用isinstance()判断是否为Iterator对象
    - generator都是iterator，但list, dcit, str是iterable不是iterator，可使用iter()把iterable变为iterator
    - Iterator是一个惰性计算序列：Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。Iterator甚至可以表示一个无限大的数据流，例如全体自然数。而使用list是永远不可能存储全体自然数的。
    - Python的for循环本质上就是通过不断调用next()函数实现的

In [26]:
from collections.abc import Iterator
isinstance((x for x in range(10)), Iterator)

True

In [27]:
isinstance(iter([]), Iterator)

True

## 函数式编程

### 高阶函数

**变量指向函数**
* 函数调用：abs(-10)
* 函数本身：abs
* 变量可以指向函数，例如f = abs
* 函数名也是变量

In [1]:
f = abs
f(-10)

10

**高阶函数**

一个函数接收另一个函数作为参数

In [2]:
def add(x, y, f): 
    return f(x) + f(y)

In [3]:
print(add(-5, 6, abs))

11


#### map/reduce

* map()
    - map(function, Iterable)
    - 将传入的函数依次作用到序列的每个元素，并把结果作为新的Iterator返回
    - 在栗子中，输出r是Iterator，由于是惰性序列，需要通过list()把整个序列都计算出来并返回一个list

In [4]:
def f(x): 
    return x*x

r = map(f, [1, 2, 3, 4, 5])
list(r)

[1, 4, 9, 16, 25]

In [5]:
list(map(str, [1, 2, 3, 4, 5]))

['1', '2', '3', '4', '5']

* reduce()
    - reduce(function, Iterable/Iterator)
    - function(x1, x2): 函数必须能接收两个参数
    - reduce把结果继续和序列的下一个元素做累积计算：
    
      reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
    - from functools import reduce

In [6]:
# 把序列[1, 3, 5, 7, 9]变换成整数13579
from functools import reduce
def fn(x, y):
    return x * 10 + y

reduce(fn, [1, 3, 5, 7, 9])

13579

结合map和reduce写出把str转换为int的函数

In [7]:
from functools import reduce

DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}

def char2num(s):
    return DIGITS[s]

def str2int(s):
    return reduce(lambda x, y: x * 10 + y, map(char2num, s))

练习

利用map和reduce编写一个str2float函数，把字符串'123.456'转换成浮点数123.456

In [8]:
from functools import reduce
def str2float(s):
    digits = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
    string = s.split('.')
    n = len(string[1])
    
    def str2int(st): 
        return digits[st]

    def int_prod(st): 
        return reduce(lambda x, y: x*10+y, map(str2int, st))
    
    return int_prod(string[0])+int_prod(string[1])*(10**-n)

In [9]:
print('str2float(\'123.456\') =', str2float('123.456'))
if abs(str2float('123.456') - 123.456) < 0.00001:
    print('测试成功!')
else:
    print('测试失败!')

str2float('123.456') = 123.456
测试成功!


#### filter

* filter(function, Iterable)用于过滤序列
* function依次作用于每个元素，根据返回值是True or False决定保留还是丢弃该元素，所以function的输出一定是True or False
* filter()返回的是Iterator，需要用list()函数获得所有结果并返回list

In [10]:
# 把一个序列中的空字符串删掉
def not_empty(s): 
    return s and s.strip()

list(filter(not_empty, ['A', '', 'B', None, 'C', ' ']))

['A', 'B', 'C']

用filter求素数

先构造一个从3开始的奇数序列

In [None]:
def _odd_iter():
    n = 1
    while True:
        n = n + 2
        yield n

然后定义一个筛选函数

In [None]:
def _not_divisible(n):
    return lambda x: x % n > 0

最后，定义一个生成器，不断返回下一个素数

In [None]:
def primes():
    yield 2
    it = _odd_iter() # 初始序列
    while True:
        n = next(it) # 返回序列的第一个数
        yield n
        it = filter(_not_divisible(n), it) # 构造新序列

由于primes()也是一个无限序列，所以调用时需要设置一个退出循环的条件

In [None]:
# 打印1000以内的素数:
for n in primes():
    if n < 1000:
        print(n)
    else:
        break

练习

回数是指从左向右读和从右向左读都是一样的数，例如12321，909。请利用filter()筛选出回数

In [3]:
def is_palindrome(n):
    return str(n) == str(n)[::-1]

output = filter(is_palindrome, range(1, 1000))
list(output)

[1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 11,
 22,
 33,
 44,
 55,
 66,
 77,
 88,
 99,
 101,
 111,
 121,
 131,
 141,
 151,
 161,
 171,
 181,
 191,
 202,
 212,
 222,
 232,
 242,
 252,
 262,
 272,
 282,
 292,
 303,
 313,
 323,
 333,
 343,
 353,
 363,
 373,
 383,
 393,
 404,
 414,
 424,
 434,
 444,
 454,
 464,
 474,
 484,
 494,
 505,
 515,
 525,
 535,
 545,
 555,
 565,
 575,
 585,
 595,
 606,
 616,
 626,
 636,
 646,
 656,
 666,
 676,
 686,
 696,
 707,
 717,
 727,
 737,
 747,
 757,
 767,
 777,
 787,
 797,
 808,
 818,
 828,
 838,
 848,
 858,
 868,
 878,
 888,
 898,
 909,
 919,
 929,
 939,
 949,
 959,
 969,
 979,
 989,
 999]

#### sorted

* sorted(list, key, reverse): 可对list排序，可以接收一个key函数来实现自定义的排序，key指定的函数将作用于list的每一个元素上，并根据Key函数返回的结果进行排序，最后按照对应关系返回list相应的元素
* 字符串排序：按照ASCII的大小比较；如果要忽略大小写排序，key函数可以是全变大写或小写
* 反向排序：传入第三个参数reverse=True

In [4]:
# 根据abs排序
sorted([36, 5, -12, 9, -21], key=abs)

[5, 9, -12, -21, 36]

In [5]:
# 字符串排序
sorted(['bob', 'about', 'Zoo', 'Credit'])

['Credit', 'Zoo', 'about', 'bob']

In [8]:
# 字符串忽略大小写，反向排序
sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)

['Zoo', 'Credit', 'bob', 'about']

### 返回函数

**函数作为返回值**

* return function
* 返回的不是计算结果，而是函数
* 再调用函数才返回结果
* “闭包”程序结构（closure）
* 每次调用都会返回一个新的函数，即使传入相同的参数

In [12]:
# 创建一个闭包函数求和
def lazy_sum(*args): 
    def sum(): 
        ax = 0
        for n in args: 
            ax = ax+n
        return ax
    return sum

In [13]:
# 调用lazy_sum()
f = lazy_sum(1, 3, 5, 7, 9)
f # f is a function

<function __main__.lazy_sum.<locals>.sum()>

In [14]:
# 调用f
f()

25

内部函数sum可以引用外部函数lazy_sum的参数和局部变量，当lazy_sum返回函数sum时，相关参数和变量都保存再返回的函数中

In [15]:
# 每次调用都会返回一个新的函数，即使传入相同参数
f1 = lazy_sum(1, 3, 5, 7, 9)
f2 = lazy_sum(1, 3, 5, 7, 9)
f1 == f2

False

**闭包**

* 由于返回的函数并不能立即执行，而是直到调用了f()才执行，要注意返回的函数引用的参数是否变化，不能用循环变量，见栗子

In [16]:
def count(): 
    fs = []
    for i in range(1, 4): 
        def f(): 
            return i*i
        fs.append(f)
    return fs

f1, f2, f3 = count()

In [17]:
f1()

9

In [18]:
f2()

9

In [19]:
f3()

9

实际结果不是1，4，9，而是全部都是9。原因在于返回的函数引用了变量i，但i并非立刻执行，等到3个函数都返回时，i已经变为3，因此最终结果时9。

如果一定要引用循环变量，可以再创建一个函数，用该函数的参数绑定循环变量当前的值，无论该循环变量后续如何更改，已绑定到函数参数的值不变。可以利用lambda函数缩短代码。

In [20]:
def count(): 
    def f(j): 
        def g(): 
            return j*j
        return g
    fs = []
    for i in range(1, 4): 
        fs.append(f(i))
    return fs

In [25]:
f1, f2, f3 = count() # 直接提取List里所有元素出来

In [26]:
f1()

1

In [27]:
f2()

4

In [28]:
f3()

9

练习

利用闭包返回一个计数器函数，每次调用它返回递增整数

In [29]:
# Version 1 -- Iterable
def createCounter(): 
    L = [0]
    def counter(): 
        L[0] += 1
        return L[0]
    return counter

外函数临时变量为可变类型，内函数与此变量绑定，由于是可变类型，会在元对象上更改而不是创建新对象。 

由于只有在调用函数的时候才会计算返回函数里的内容，所以每次调用时只运行内函数的部分，L[0]累计加1。外部函数只有在initiate的时候调用一次。

In [30]:
# Test
counterA = createCounter()
print(counterA(), counterA(), counterA())

1 2 3


In [33]:
# Version 2 -- nonlocal
def createCounter(): 
    L = 0
    def counter(): 
        nonlocal L 
        L += 1
        return L
    return counter

In [34]:
# Test
counterA = createCounter()
print(counterA(), counterA(), counterA())

1 2 3


### 匿名函数

* lambda x: x*x
* :前面的x表示函数参数
* 匿名函数也是一个函数对象，可以把匿名函数赋值给一个变量，再利用变量来调用该函数

In [37]:
f = lambda x: x*x
f

<function __main__.<lambda>(x)>

In [38]:
f(5)

25

* 可以把匿名函数作为返回值返回

In [None]:
def build(x, y):
    return lambda: x * x + y * y

### 装饰器

* 函数是一个对象，函数对象可以被赋值给变量，通过变量能调用该函数

In [1]:
def now(): 
    print('2015-3-25')

f = now
f()

2015-3-25


* 函数对象有一个__name__属性，可以拿到函数的名字

In [2]:
now.__name__

'now'

In [3]:
f.__name__

'now'

* 装饰器（Decorator）：能在代码运行期间动态增加功能，同时不修改原函数定义；本质是一个返回函数的高阶函数
* 在本栗子中，定义一个能打印日志的decorator，增强now()函数的功能，比如在函数调用前后自动打印日志，但不修改now()函数的定义

In [4]:
def log(func): 
    def wrapper(*args, **kw): # 接受任何参数的调用
        print('call %s():' % func.__name__) # 打印函数名
        return func(*args, **kw) # 返回原函数
    return wrapper

* decorator接收一个函数作为参数，并返回一个函数
* 要借助Python的@语法，把decorator置于函数的定义处，相当于执行了语句now = log(now)

In [6]:
@log
def now(): 
    print('2015-3-25')

调用now()函数，不仅会运行now()函数本身，还会在运行now()函数前打印一行日志：

In [7]:
now()

call now():
2015-3-25


如果decorator本身需要传入参数，需要编写一个返回decorator的高阶函数。

3层嵌套，效果相当于now = log('execute')(now)，首先执行log('execute')，返回的是decorator函数，再调用返回的函数，参数是now函数，返回值最终是wrapper函数。

In [1]:
def log(text):
    def decorator(func):
        def wrapper(*args, **kw):
            print('%s %s():' % (text, func.__name__))
            return func(*args, **kw)
        return wrapper
    return decorator

In [2]:
@log('execute')
def now():
    print('2015-3-25')

In [3]:
now()

execute now():
2015-3-25


经过decorator装饰的函数，\__name\__由'now'变为'wrapper'，原因是返回的是wrapper()函数

In [4]:
now.__name__

'wrapper'

使用@functools.wraps(func)还原函数名：

In [8]:
import functools

def log(func): 
    @functools.wraps(func)
    def wrapper(*args, **kw):
        print('call %s():' % func.__name__)
        return func(*args, **kw)
    return wrapper

In [9]:
import functools


def log(text):
    def decorator(func):
        @functools.wraps(func)
        def wrapper(*args, **kw):
            print('%s %s():' % (text, func.__name__))
            return func(*args, **kw)
        return wrapper
    return decorator

In [10]:
@log('execute')
def now():
    print('2015-3-25')

now()

execute now():
2015-3-25


In [11]:
now.__name__

'now'

### 偏函数

 * funtools.partial帮助创建偏函数，可以把一个函数的某些参数给固定住（设置默认值），返回一个新的函数，调用这个新函数会更简单
 * 栗子int(x, base)，base默认为10，为了将默认改为2，可以创建偏函数int2
 * 更改默认值后依然可以在调用int2时传入其他值

In [13]:
int('1000000')

1000000

In [14]:
int('1010101')

1010101

In [12]:
import functools
int2 = functools.partial(int, base=2)
int2('1000000')

64

In [15]:
int2('1010101')

85

In [16]:
int2('1010101', base=10)

1010101

创建偏函数时，实际上可以接收函数对象、\*args和\**kw三个参数，int2实际上固定了关键字参数base

栗子1

In [17]:
int2('10010')

18

相当于

In [18]:
kw = {'base': 2}
int('10010', **kw)

18

栗子2

In [19]:
max2 = functools.partial(max, 10)

会把10作为\*args的一部分自动加到左边

In [20]:
max2(5, 6, 7)

10

相当于

args = (10, 5, 6, 7)

max(\*args)

## 模块

以内建sys模块为栗，编写一个hello的模块：

In [None]:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

' a test module '

__author__ = 'Michael Liao'

import sys

def test():
    args = sys.argv
    if len(args)==1:
        print('Hello, world!')
    elif len(args)==2:
        print('Hello, %s!' % args[1])
    else:
        print('Too many arguments!')

if __name__=='__main__':
    test()

**Python模块的标准文件模板**
* line 1和2是标准注释
    - line 1：可以让这个hellp.py文件直接在Unix/Linux/Mac上运行
    - line 2：表示.py文件本身使用标准UTF-8编码
* line 4是一个字符串，表示模块的文档注释，任何模块代码的第一个字符串都被视为模块的文档注释
* line 6使用__author__变量把作者写进去

**真正的代码部分**
* 导入模块：import sys，变量sys指向该模块，利用sys变量可以访问模块中的所有功能
* sys模块有一个argv变量，用list存储了命令行的所有参数。argv至少有一个元素，因为第一个参数永远是该.py文件的名称，例如运行python 3 hello.py获得的sys.argv就是['hello.py']
* \__name\__ = \__main\__：当我们在命令行运行hello模块文件时，Python解释器把一个特殊变量\__name\__置为\__main\__，而如果在其他地方导入该hello模块时，if判断将失败，因此，这种if测试可以让一个模块通过命令行运行时执行一些额外的代码，最常见的就是运行测试

用命令行运行hello.py的效果：

\$ python3 hello.py

Hello, world!

\$ python hello.py Michael

Hello, Michael!

如果启动Python交互环境，再导入hello模块：

\$ python3

Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 23 2015, 02:52:03) 

[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin

Type "help", "copyright", "credits" or "license" for more information.

\>>> import hello

\>>>

导入时，没有打印Hello, world!，因为没有执行test()函数

调用hello.test()时才能打印出Hello, world!

\>>> hello.test()

Hello, world!

### 作用域

一个模块中，有的函数和变量可以public，有的仅允许再模块内部使用。在Python中是通过_前缀实现的。
* 正常的函数和变量名是公开的（public），可以直接引用，比如abc, x123等等
* \__xxx\__是特殊变量，可以被直接引用，但是有特殊用途，比如\__author\__，\__name\__就是特殊变量，hello模块定义的文档注释也可以用特殊变量\__doc\___访问
* \_xxx和\__xxx是非公开的（private），不应该直接引用，比如\_abc，\__abc等等
    - private函数和变量“不应该”被直接引用，而不是“不能”，因为Python并没有一种方法可以完全限制访问private函数或变量，但是从编程习惯上不应该引用private
    - private函数是一种非常有用的代码封装和抽象方法，栗子：

In [None]:
def _private_1(name):
    return 'Hello, %s' % name

def _private_2(name):
    return 'Hi, %s' % name

def greeting(name): # public function
    if len(name) > 3:
        return _private_1(name)
    else:
        return _private_2(name)

在模块里公开greeting()函数，而内部逻辑用private函数隐藏

### 安装第三方模块

**模块搜索路径**

* 默认情况下，Python解释器会搜索当前目录、所有已安装的内置模块和第三方模块，搜索路径存放在sys模块的path变量中

In [22]:
import sys
sys.path

['C:\\Users\\yzhao127\\Documents\\Learning\\Python Review',
 'C:\\ProgramData\\Anaconda3\\python37.zip',
 'C:\\ProgramData\\Anaconda3\\DLLs',
 'C:\\ProgramData\\Anaconda3\\lib',
 'C:\\ProgramData\\Anaconda3',
 '',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\win32',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\win32\\lib',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\Pythonwin',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\yzhao127\\.ipython']

* 添加自己的搜索目录： 
    - 方法一：直接修改sys.path，添加要搜索的目录，这种方法在运行时修改，运行结束后失效
    - 方法二：设置环境变量pythonpath，该环境变量的内容会被自动添加到模块搜索路径中，设置方式与设置path环境变量类似

In [None]:
# 方法一
import sys
sys.path.append('xxx/xxx')

## 面向对象编程