# Python代码结构
讲解如何组织代码和数据。

## 语法和句法

### 注释

在Python中使用`#`字符标记注释，从`#`开始到当前行结束的部分都是注释。可以把注释作为单独的一行或者把注释和代码放在同一行。

In [None]:
print("Hello, World!")  # 这是一个单行注释

### 把语句分成多行写
有时候一行代码太长，我们想分开，或者是出于美观、清晰的需要，可以用`\`来连接多行。

In [None]:
if (1 == 1) and \
   (2 == 2):
    print('Frivolous!')

### 使用`:`将代码块的头和身体分开

In [None]:
if (user == 'green'):       # 头
    print('hello, green')   # 身体

### 缩进

前面讲过，Python使用缩进来表示代码的逻辑结构，建议使用4个空格进行缩进（可参考[PEP8 Python编码规范](https://www.python.org/dev/peps/pep-0008/)）。

### 同一行写多个语句

同一行写多个语句，使用`;`分隔。

In [None]:
import sys; x = 'foo'; sys.stdout.write(x + '\n')
# 这样可行但并不好，降低了代码的可读性

## `if`-`elif`-`else`语句

In [None]:
today = input("Input: ")

if today == 'Mon':
    print('Today is Monday')
elif today == 'Tue':
    print('Today is Tuesday')
elif today == 'Wed':
    print('Today is Wednesday')
else:
    print('Today is a boring day')

`elif` 和C语言中的`else if`是等效的，C语言中的`switch case`结构在Python中没有等效的实现。

C语言中使用`if`和`else`最常见的一个问题就是**else悬挂**，很多时候初学者弄不清除哪个`else`和哪个`if`是一对（C语言中，任何一个`else`与其上方最近的一个`if`是一对）。这个问题在Python中不存在，之前我们说过，Python中的缩进所起到的作用不仅仅上是排版层面上的，更是逻辑层面上的。没有了大括号，使用缩进来控制流程的层次深度，便使得程序员无需考虑悬挂问题，只要**保证同样逻辑层次的语句有相同的缩进量**即可：

In [None]:
if username_is_right:
    if passwd_is_right:
        if cash > 0:
            print("you have extra money")
        else:
            print("you are in debt")
    else:
        print("wrong password")
else:
    print("username is not existed!")

### 条件表达式（三元操作符）

语法：`X if C else Y`

In [None]:
x, y = 3, 4
small = x if x < y else y
small

### 多重比较

如果想同时进行多重比较判断，可使用布尔操作符`and`、`or`或者`not`连接来决定最终表达式的布尔取值。布尔操作符的优先级没有比较表达式的代码段高，即，表达式要先计算然后再比较。

In [None]:
x = 7
x > 5 and x < 10   # True

避免混淆的办法是加圆括号。

In [None]:
(x > 5) or not (x < 10)  # True

### 什么是真值

下面的情况会被认为是**False**：

| 布尔     | False   |
|----------|---------|
| null类型 | `None`  |
| 整型     | `0`     |
| 浮点型   | `0.0`   |
| 空字符串 | `''`    |
| 空列表   | `[]`    |
| 空元组   | `()`    |
| 空字典   | `{}`    |
| 空集合   | `set()` |

剩下的都会被认为是`True`。

如果是在判断一个表达式，Python会先计算表达式的值，然后返回布尔型结果。

## `while`循环
语法：
```python
while expression:
    loop code
```

无限循环：
```python
white True:
    ...
```

## `for`循环

`for`循环是Python中最强大也最使用广泛的循环类型。
它可以遍历序列成员，由此可用于列表解析和生成器表达式中。

语法：
```python
for item_var in iterable:    # iterable是可迭代的对象
    code to process item_var
```

一些例子：


In [2]:
nameList = ['Walter', 'Nicole', 'Steven']
# 使用序列索引迭代
for nameIndex in range(len(nameList)):
    print("Liu,", nameList[nameIndex])

# 使用序列项迭代
for eachName in nameList:
    print(eachName, 'Lim')

Liu, Walter
Liu, Nicole
Liu, Steven
Walter Lim
Nicole Lim
Steven Lim


## `break`, `continue`, `pass`
和C语言中一样，`break`用于终止循环，可以使得流程跳出所在的`while`或者`for`循环。

和C语言中一样，`continue`用于终止当前循环，**忽略剩下的语句**，
回到循环开始（即终止当前循环，开始下一次循环）。

顾名思义，pass就是什么都不做，通常用作占位符，在函数原型设计中很有用：

```python
# main function
def main():
    pass  # 以后有功夫再来完善吧
```


### for...in... 的使用

In [3]:
for i in (1, 2, 3):
    print(i)

1
2
3


除了list、tuple这样的类型外，dict这种没有下标的类型也可以使用for：

In [1]:
d = {'a':1, 'b':2, 'c':3}

In [5]:
for i in d:
    print(d[i])

a
b
c


In [6]:
d.values()

dict_values([1, 2, 3])

In [7]:
d.items()

dict_items([('a', 1), ('b', 2), ('c', 3)])

In [2]:
for i in d.values():
    print(i)

1
2
3


In [3]:
for k, v in d.items():
    print(k, v)

a 1
b 2
c 3


str类型也可以使用for：

In [9]:
for ch in 'ABC':
     print(ch)

A
B
C


In [10]:
for i in {1, 2, 3}:
    print(i)

1
2
3


只要是一个可迭代对象，就可以使用for循环。

如何判断是否是可迭代对象？

***通过collections模块的Iterable类型判断：***

In [4]:
from collections import Iterable
# isinstance('abc', Iterable) # str是否可迭代
# isinstance([1,2,3], Iterable) # list是否可迭代
# isinstance(123, Iterable) # 整数是否可迭代

  """Entry point for launching an IPython kernel.


那么，如果要对list实现类似Java那样的下标循环怎么办？

Python内置的enumerate函数可以把一个list变成索引-元素对，这样就可以在for循环中同时迭代索引和元素本身：

In [14]:
# 使用项和索引迭代
for i, eachLee in enumerate(nameList):
    print("%d %s Lee" % (i+1, eachLee))

1 Walter Lee
2 Nicole Lee
3 Steven Lee


1. Python 中的for ... in... 使用灵活，不局限下标
2. 凡是可以使用for循环遍历的对象，都是可迭代对象

## 推导式（Comprehensions）

是Python内置的非常简单却强大的可以用来创建数据的生成式。

推导式是从一个或者多个迭代器快速简洁地创建数据结构的一种方法，
最早来源于Haskell编程语言，它可以将循环和条件判断结合，从而避免语法冗长的代码。

In [None]:
[1, 2, 3, 4, 5]
list('12345')
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [15]:
range(1, 11)

range(1, 11)

In [16]:
list(range(1, 11))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [18]:
L = []
for x in range(1, 11):
    if x % 2 == 0:
        L.append(x * x)

In [19]:
L

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [20]:
[x * x for x in range(1, 11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [23]:
[x * x if x % 2 == 0 else -x for x in range(1, 11)]

[-1, 4, -3, 16, -5, 36, -7, 64, -9, 100]

In [5]:
[x + y + z for x in 'ABC' for y in 'abc' for z in 'xyz']

['Aax',
 'Aay',
 'Aaz',
 'Abx',
 'Aby',
 'Abz',
 'Acx',
 'Acy',
 'Acz',
 'Bax',
 'Bay',
 'Baz',
 'Bbx',
 'Bby',
 'Bbz',
 'Bcx',
 'Bcy',
 'Bcz',
 'Cax',
 'Cay',
 'Caz',
 'Cbx',
 'Cby',
 'Cbz',
 'Ccx',
 'Ccy',
 'Ccz']

### 列表推导（解析）

语法：`[expr for item_var in iterable]`

该语句的核心是for循环：

In [None]:
print([x**2 for x in range(9)])
print([ss[::-1] for ss in ('green', 'red', 'blue')])

扩展语法可以实现条件控制： `[expr for item_var in iterable if cond_expr]`

另外，也可增加 `else` 语句：`[expr if cond_expr else else_expr for item_var in iterable]`

练习1：列表推导式实现100以内17的倍数

练习2：1-100中，不是3的倍数的数取相反数，其余的数保持不变

练习3：L = ['Hello', 'World', 18, 'Apple', None]，将字符串中字母变为小写，其余元素不变

### 字典推导

语法：`{key_expr: value_expr for expr in iterable}`

类似于列表推导，字典推导也有`if`条件判断以及多个`for`循环迭代语句。

In [26]:
word = 'letters'
letter_counts = {letter: word.count(letter) for letter in set(word)}
letter_counts

{'r': 1, 'e': 2, 'l': 1, 't': 2, 's': 1}

In [31]:
[x * x for x in range(1, 11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [29]:
num = (x * x for x in range(1, 11))

In [30]:
next(num)

1

In [41]:
next(num)

StopIteration: 

In [43]:
type(num)

generator

### 集合推导

与上面列表推导类似。

### 生成器表达式

一边循环，一边通过计算生成数据的机制，叫做生成器：generator。

生成器表达式是对列表解析的扩展，列表解析有一个不足，它一次性生成所有数据，
用以创建列表，这样在数据量很大，内存很有限的时候便会造成问题。
生成器表达式解决了这个问题，它一次生成一个数据，然后暂停，当下一次使用时，
生产出下一个数据，工作的过程就像迭代器一样。

语法很简单：`(expr for item_var in iterable if cond_expr)`

也就是将列表的`[]`换成`()`即可：

In [None]:
[x * x for x in range(1, 11)]

generator保存的是算法，每次调用next(num)，就计算出num的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误。

**注意：**一个生成器只能运行一次，其只在运行中产生值，不会被存下来，
所以不能重新使用或者备份一个生成器。

In [51]:
num = (x * x for x in range(1, 11))

In [44]:
isinstance(num, Iterable)

True

In [52]:
for num in num:
    print(num)

1
4
9
16
25
36
49
64
81
100


In [54]:
l = list(range(1, 11))

In [56]:
l1 = iter(l)

In [57]:
next(l1)

1

## 迭代器和`iter()`函数

### 什么是迭代器

迭代器是一种特殊的数据结构，在Python中，它也是以对象的形式存在的。
迭代器提供了一种遍历类序列对象的方法。
对于一般的序列类型，可以利用索引从0一直迭代到序列的最后一个元素；
对于字典、文件、自定义对象类型等，可以自定义迭代方式，从而实现对这些对象类型的遍历。

可以这样理解：
可以被next（）调用并不断返回下一个值的对象，称为迭代器。

对于一个集体中的每一个元素，要进行遍历，
那么针对这个集体的迭代器定义了遍历每一个元素的顺序或者方法。
例如：0, 1, 2, 3, 4...，或者1, 3, 5, 7, 9...

### 如何迭代

迭代器有一个`__next__()`方法，每次调用这个方法而实现计数（计数不是通过索引实现的），
在循环中，如果要获得下一个对象，迭代器自己调用`__next__()`方法，这个过程是透明的。
当遍历结束后（集合中再无未访问的项）会遇到`StopIteration`异常，从而结束循环。

迭代器有一些限制，只能向前迭代，不能后退，即**迭代是单向的**，当然，
可以独立创建一个反向的迭代器。迭代器不能复制，一旦需要重新迭代某个对象，
必须重新创建一个该对象的迭代器。

`reversed()`返回一个序列对象的逆序迭代器。
`enumerate()`也可以返回迭代器。

### 使用迭代器

生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。

### `iter()`函数

 `iter(obj)`  如果`obj`是一个序列类型，那么可以根据其索引从0开始迭代。

In [6]:
mylist = ['green', 'red', 'blue', 'white']
i = iter(mylist)

In [11]:
ri = reversed(mylist)  # reversed返回一个逆序迭代器
next(i)

StopIteration: 

In [60]:
next(ri)

'white'

#### 小结

凡是可作用于for循环的对象都是Iterable类型；

凡是可作用于next( )函数的对象都是Iterator类型，它们表示一个惰性计算的序列；

集合数据类型如list、dict、str等是Iterable但不是Iterator，不过可以通过iter()函数获得一个Iterator对象。

Python的for循环本质上就是通过不断调用next()函数实现的，例如：

In [None]:
for x in [1, 2, 3, 4, 5]:
    pass

## 函数

函数是一种代码的抽象方式，可以把大型的代码组织成可管理的代码段，实现代码复用。

### 函数定义

依次输入关键字def 、函数名、带有函数参数的圆括号,最后紧跟一个冒号( : ),然后，在缩进块中编写函数体，语法格式：

                     def <func_name>(<formal parameters>):
                           return <return expression>

In [None]:
def do_noting():
    pass

`def`是定义函数的关键字。

Python`函数命名规范`和变量命名一样（必须使用字母或者下划线`_`开头，仅能含有字母、数字和下划线）。上面代码示例中的`pass`表明函数没有做任何事情，仅用来进行占位。

函数后面的括号中声明参数名称，**括号，冒号不能一定不能省略**

**函数体开始必须缩进**

### 函数调用

语法格式：**函数名称()**,括号中传入参数值。调用函数时,Python 会执行函数内部的代码，函数执行完之后，返回到主程序。

In [62]:
#示例1
def print_things():
    print('hello,world!')

print_things()

hello,world!


#### 变量可以指向函数

In [63]:
f = print_things

In [64]:
id(print_things)

4588875016

In [65]:
id(f)

4588875016

In [66]:
f()

hello,world!


In [67]:
print_things = 5

In [None]:
print()

#### 函数名也是变量

### 参数的传递

函数的参数传递的本质上就是：从实参到形参的赋值操作。Python中“一切皆对象”，所有赋值操作都是“引用的赋值”。所以，Python中参数的传递都是“引用传递”，不是“值传递”。具体操作时一般分为两类：
1. 传递可变对象的引用
2. 传递不可变对象的引用

可变对象：字典、列表、集合等

不可变对象：数字、字符串、元组等

#### 传递可变对象的引用

In [None]:
b = [1,2]
print(id(b))

def test0(m):
    print(id(m))
    m.append(3)
    print(id(m))
    print(m)

test0(b)
print(b)

传递参数是可变对象（例如：列表、字典等），实际传递的是对象的引用，在函数体中不创建新的对象拷贝，而是可以直接修改所传递的对象。

#### 传递不可变对象的引用

In [68]:
b = 12
print(id(b))

def test0(m):
    print(id(m))
    m += 1
    print(m)

test0(b)
print(b)

4551939488
4551939488
13
12


In [69]:
a = 200
print(id(a))

def test0(m):
    print(id(m))
    m = m + 100
    print(id(m))
    print(m)

test0(a)
print(a)

4551945504
4551945504
4588287504
300
200


传递参数是不可变对象（例如：int，float，字符串、元组、布尔值），实际传递的还是对象的引用。在“赋值操作”时，由于不可变对象无法修改，系统会新创建一个对象。

### 函数参数类型

#### 位置参数

In [71]:
a = 12
b = 10
def test0(arg1, arg2):
    return arg1 + arg2

# test0(12,10)
test0(12)

TypeError: test0() missing 1 required positional argument: 'arg2'

函数调用时，实参默认按位置顺序传递，需要个数和形参匹配。按位置传递的参数，称为：“位置参数”

#### 关键字参数

In [None]:
def test0(a,b,c):
    print(a,b,c)

test0(1,2,3)
test0(a = 1,c = 3,b = 2)

调用函数时可以指定对应参数的名字，可以采用于与函数定义时形参列表不同的顺序调用。

#### 指定默认参数值

In [73]:
def test0(a,b,c = 10,d = 11):
    print(a,b,c,d)

test0(1,2)
test0(1,2,3)
test0(1,2,3,4)

1 2 10 11
1 2 3 11
1 2 3 4


当位置参数和关键字参数同时存在时，关键字参数必须放到位置参数的后面。

调用函数时如果没有提供关键字参数的参数值时，将使用函数定义时的默认参数值。

如果调用函数时提供关键字参数的参数值，则将代替默认值。


**注意：**函数的关键字参数的参数值在函数定义时已经计算出来了，而不是在函数运行时。

In [74]:
num = 1
def test0(arg1=num):
    print(arg1)
num = 2
test0()

1


所以，在定义函数时，不要把可变的数据类型（列表、字典）当作关键字参数的参数值。函数的关键字参数只会被求值一次，不管函数被怎么调用，当关键字参数的参数值是可变对象时，在函数体中如果其值被改变，再次调用函数时其默认值就是改变后的值。

In [76]:
def test0(n, alist=[]):
    alist.append(n)
    return alist

print(test0(1))
print(test0(2)) #[1, 2]
print(test0(3)) #[1, 2, 3]

[1]
[1, 2]
[1, 2, 3]


如何避免这种情况？

`None`是个内置常量，当然不能被改变，每次函数bar()被调用就会用这个值给alist赋值。

In [75]:
def test0(n, alist=None):
    if alist is None:
        alist = []
    alist.append(n)
    return alist

print(test0(1)) #[1]
print(test0(2)) #
print(test0(3))

[1]
[2]
[3]


#### 可变参数--使用 * 收集位置参数

In [None]:
def print_args(*args):
    print(args)

print_args(3, 2, 1, 'a', 'b', ['c', 'd'])

任意位置参数可以接受任意数量的位置参数。当参数被用在函数内部时，* 将一组可变数量的位置参数集合成参数值的元组。


In [12]:
def print_more(arg1, arg2, *rest_args):
    print(arg1)
    print(arg2)
    print(rest_args)

print_more(3, 2, 1, 'a', 'b', ['c', 'd'])

3
2
(1, 'a', 'b', ['c', 'd'])


这对于编写接受可变数量的参数的函数非常有用。如果函数同时有限定的位置参数，那么`*args`会收集剩下的参数。

#### 可变参数--使用 ** 收集关键字参数

In [77]:
def print_kwargs(**kwargs):
    print(kwargs)

print_kwargs(arg1=1, arg2=2, arg3='a')

{'arg1': 1, 'arg2': 2, 'arg3': 'a'}


使用 ** 可以将参数收集到一个字典中，参数的名字是字典的键，对应参数的值是字典的值。

### 匿名函数

In [None]:
sq = lambda x: x * x
print(sq(2))

print((lambda x: x * x)(2))

h = [lambda x: x * 2,lambda x: x * 3]
print(h[0](3))

lambda表达式可以用来声明匿名函数。lambda函数是一种简单的、在同一行中定义函数的方法。lambda实际生成了一个函数对象。

lambda表达式只允许包含一个表达式，不能包含复杂语句，该表达式的计算结果就是函数的返回值。

lambda表达式的基本语法如下：

                        lambda arg1，arg2，arg3...: <表达式>
                        
其arg1/arg2/arg3为函数的参数，<表达式>相当于函数体，函数返回值：表达式的计算结果。

## 装饰器

创建一个 time1 函数

In [2]:
import time

def time1():
    time.sleep(3)
    print('This is time1')
time1()

This is time1


In [10]:
def wrapper():
    t1 = time.time()
    time1()
    t2 = time.time()
    print(t2 - t1) 
wrapper()

This is time1
3.0042080879211426


In [9]:
time.time()

1584521028.7430332

**需求1：**
为函数添加新的功能,但不能修改原函数的代码

希望每次调用函数时输出函数执行所花费的时间

In [None]:
def wrapper():
    time_start = time.time()
    time1()
    time_stop = time.time()
    print(time_stop - time_start)

In [None]:
wrapper()

**需求2：**
为函数添加新的功能,但不能修改原函数的调用方式

In [12]:
def timer(func):
    def wrapper():
        time_start = time.time()
        func()
        time_stop = time.time()
        print(time_stop - time_start)
    return wrapper

In [13]:
@timer
def time1():
    time.sleep(3)
    print('This is time1')
time1()

This is time1
3.0036661624908447


In [14]:
@timer
def time1():
    [x * (x +10) for x in range(10000)]
    print('This is time2')

In [15]:
time1()

This is time2
0.0019838809967041016


In [None]:
#time1 = timer(time1)

In [None]:
time1()

**总结：**
1. 装饰器可以在不改变原函数的定义和调用方式的基础上，增强函数的功能。
2. Python内建了专门的装饰器写法，如：@timer

首先，要有个一个愿函数
其次，你要在这个函数上添加某些功能，但是又不想改变函数本来的样子
所以，你需要在原来函数的外面罩上一个盒子，这个盒子就是为函数添加的功能
即：
```python
# 这是一个盒子
def wapper():
    # 功能语句
    func()
    # 功能语句

```

然后你又不想改变函数的调用方式，所以你又加了一个盒子
```python 
# 这是外面的盒子
def name_zhangshi(func):
    def wapper():
        pass
    return wapper()
```

这样一来你就写好了一个装饰器 

下面用 @name_zhuangshi 来代替放到愿函数上的盒子。

你的带着特殊功能的愿函数pro 就完成了，它长着个样子：
```python 
@ name_zhangshi
def yuan_function():
    pass
```

然后你就可以通过原来的调用方式，获得pro的函数功能了：
```python 
yuan_function()
```