# Python 教程

## Python介绍与安装
### 历史

Python的创始人为Guido van Rossum。1989年圣诞节期间，在阿姆斯特丹，Guido为了打发圣诞节的无趣，决心开发一个新的脚本解释程序，作为ABC 语言的一种继承。之所以选中Python（大蟒蛇的意思）作为该编程语言的名字，是因为他是一个叫Monty Python的喜剧团体的爱好者。

Python本身是一门通用编程语言，借助各种功能强大的扩展库(numpy, scipy, matplotlib) ，python成为了科学计算领域不可或缺的一种必备技能。

同时随着AI领域的发展，以Python作为API interface的各种AI框架的流行，Python成为了从事AI研发领域的人员必备技能之一。

### Python2/3选择
由于历史原因，Python目前有2.x和3.x两个主要版本正在发行，2.x和3.x的语法有一些细节不同。这导致两个版本的代码很多时候不通用。

曾经，启动Python项目的时候，一般都面临版本选择的问题。如果是需要在一些比较陈旧的系统环境上运行，抑或要使用一些特殊的库，而同时这些库又没有python3版本的情况下，就需要使用python2.x系列。如果要使用一些比较新的库，那么python3.x是一个比较好的选择。

版本的选择，让很多初学者无所适从。同时支持两个版本系列，也让各扩展库的开发者耗费了大量的精力。

基于此种状况，Python社区决定，自2020年1月1日，python2.x系列不再提供社区支持。同时，很多扩展库，如numpy，matplotlib等，也宣布不再继续支持python2.x系列。

因此python3.x成为了目前最直接的选择。本教程不再介绍python2.x语法。

值得一提的是，python2.x只是不再提供社区支持，付费商业支持还是有提供的，所以已经存在的商业软件，不受影响，但社区仍然推荐尽快切换到python3.x系列。

#### 3.x版本选择
此教程编写的时候，官网能下载到的最新python版本是3.7.3，目前常用的各个科学计算库以及AI框架也都支持3.7系列。因此不管在哪个系统上安装，直接装最新版本即可。
> 如果python3.8发布，那么发布时刻短时间内，各框架未适配的情况下，仍然需要安装3.7版本的Python。这种情况请区别对待。

### win/mac/linux的python下载安装
不管是在哪个环境下，python的安装都有三种常用的不同的方式可以选择：
- 源代码编译安装
- 原生安装
    - win下安装包安装
    - mac下安装包安装
    - linux下通过包管理器安装
- anaconda/miniconda安装

#### 源代码编译安装
此种安装方式最不推荐，仅在确实必要的情况下使用此种安装方式。
>编译安装，由于可以使用目标平台的特定指令集，所以性能会有一定的提升（经验值在10%～30左右）。

#### 原生安装
**对于初学者来说，这是最推荐的安装方式，其他安装方式，都会引入其他比较复杂的步骤，比较适合有一定经验的用户**。
##### win下安装包安装
以3.7.3为例，去https://www.python.org/downloads/release/python-373/ 下载“Windows x86-64 executable installer”安装包名称为python-3.7.3-amd64.exe，下载后双击安装即可。
需要注意，安装过程中，一定要勾选PIP（Python包管理器），IDLE（Python自带的IDE）安装选项。同时为了使用方便，一定要勾选 “Add to PATH”选项。
##### mac下安装包安装
以3.7.3为例，去https://www.python.org/downloads/release/python-373/ 下载“macOS 64-bit installer”安装包名称为python-3.7.3-macosx10.9.pkg，下载后双击安装。
需要注意，安装过程中，一定要勾选PIP（Python包管理器），IDLE（Python自带的IDE）安装选项。同时为了使用方便，一定要勾选 “Add to PATH”选项。
> 注意，Mac自带了python2.x版本，使用的时候一定注意启动的是哪个版本。
##### linux下通过包管理器安装
以ubuntu18.04为例，直接执行以下命令安装即可：
```sh
sudo apt install python3 python3-pip
```

#### anaconda/miniconda安装
Anaconda是一个开源的包、环境管理器，可以用于在同一个机器上安装不同版本的软件包及其依赖，并能够在不同的环境之间切换，因为包含了大量的科学包，Anaconda 的下载文件比较大（500 MB以上），如果只需要某些包，或者需要节省带宽或存储空间，也可以使用Miniconda这个较小的发行版（仅包含conda和 Python）。
> anaconda/miniconda不仅可管理python的版本，还能管理其他一些科学计算库，是一个通用的环境管理器。

可以去https://www.anaconda.com/distribution/#download-section 下载windows/mac/linux版本的安装 包进行安装。
请到https://docs.anaconda.com/anaconda/install/ 下查找相关安装文档。


miniconda请到https://docs.conda.io/en/latest/miniconda.html 下载，安装文档请参考https://conda.io/projects/conda/en/latest/user-guide/install/index.html

> anaconda安装包过大，使用也比较复杂，推荐有一定经验的用户使用。miniconda作为anaconda的一个基础版本，安装包比较小，使用也比较灵活，相较与anaconda，本文作者更推荐使用miniconda。

**anaconda/miniconda安装后，会自动设置系统的环境变量，默认使用自带的python，这在系统环境比较复杂的情况下可能会导致一些严重问题，请一定注意这种情况**。




### win/mac/linux的python下使用（python console与cmd/shell）

安装完成之后，可以直接在命令行/terminal中执行python3,进入python shell，不管在哪个系统上，都可以看到类似下面的提示：
```sh
Python 3.7.3 (default, Apr  3 2019, 05:39:12) 
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> 
```
> windows和mac上面，一定注意安装的时候，勾选 “Add to PATH”选项。

这里需要注意的是，执行完python3程序进入的python shell，只能输入python代码，不能执行windows下cmd里面的命令或者mac/linux下terminal命令（如 ls ，mv，rm，cp等命令都是命令行执行，不是python代码）。

也可以通过IDLE启动python，各个系统上启动IDLE方式不太一样，这里不再赘述。

>IDLE 自带python shell和一个简单的文本编辑器，虽然功能很有限，但是已经足够日常使用。

### pip使用
前文提到，python拥有庞大的生态系统支持，数量众多质量优良的各种扩展库极大的扩充了python的能力，让python成为了各个领域的不二之选。包的安装和使用也是python的必备技能之一。

pip是python自己的包管理器，pyi则是python官方的包仓库，其官方网址为https://pypi.org/ ,截止本文编写之时，pypi仓库里面已经有179950个项目，可以为pyton提供功能上的扩展。

> pypi仓库服务器本身位于海外，访问速度比较慢，为了解决这个问题，可以使用tuna，ali，163，中科大等的国内pypi镜像，具体步骤可以666,有很多相关资料，各镜像源也有相关的配置文档，这里不再赘述。

本教程中，python安装的时候，就已经要求读者安装pip工具，所以后续内容默认pip已经安装。
常用命令如下：
```sh
pip install numpy # 安装numpy
pip install numpy==1.14.6 # 安装1.14.6版本的numpy
pip install -U numpy # 安装或者升级numpy
pip uninstall numpy # 卸载numpy
pip search numpy # 在pypi中查找numpy
pip --help # 显示帮助文档
pip -V # 显示版本信息
pip install -r requirements.txt # 一个个安装太麻烦了，可以把所有的库和相应版本都写到requirements.txt文件中，一次性安装，特别适合项目环境配置。
```
> 如果系统中同时安装有python2.x python3.x，则有可能出现pip/pip2/pip3等不同的名字的pip，这时，pip2一定是python2.x版本的，pip3一定是python3.x版本的，但是pip不一定是哪个版本，请一定要注意此类问题。

由于pip安装库的时候，需要联网下载相关库和依赖库的安装文件，所以请一定保证网络流畅可用，或者可以选择使用国内的pypi仓库镜像。



## Python基础语法

Python是一门动态强类型语言，由于其代码在拥有强大的程序表达能力的同时，还具备高度的可读性，因此很多时候被称为一门类伪代码的语言。下面是一个python代码的快速排序例子。进作为示例，这里不做展开。

In [91]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)


print((quicksort([3, 6, 8, 10, 1, 2, 1])))

[1, 1, 2, 3, 6, 8, 10]


### 缩进

与C语言，Java等语言使用大括号来标记语法边界不同，python中强制使用缩进来标记代码的语法边界 ，拥有同一缩进层级的代码属于同一个语法层次。

缩进可以使用tab，也可以使用空格，因为tab在各个编辑器上定义的宽度不同，所以为了代码的可读性，推荐使用空格进行代码的缩进。需要注意的是，虽然python规定必须使用缩进来标记语法边界，但是并未规定使用多少个字符作为一个缩进单位。因此空格或者tab的数量很灵活。google的代码，多使用两个空格进行缩进，这样复杂的，拥有多个缩进层次的代码，一行可以占用比较少的字符数量。

>甚至还有人使用3个空格作为一个缩进单位。



### 关键字
python中关键字如下代码所示，需要注意，有些常用功能如len，dir，print等为内建函数，不是关键字。

In [3]:
import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


重定义关键字是非法行为，会导致错误。

In [5]:
and = 1

SyntaxError: invalid syntax (<ipython-input-5-a3fd417c5b1e>, line 1)

### 基础语法

### 基础数据类型及相应运算
作为一门通用编程语言，Python中也有整数，浮点数，布尔型，字符串这几中基础数据类型，并且这几种类型的操作与其他编程语言基本一致。

#### 数字

In [30]:
x = 3
print((x, type(x)))

(3, <class 'int'>)


In [31]:
print(x + 1)   # 加法;
print(x - 1)   # 减法;
print(x * 2)   # 乘法;
print(x ** 2)  # 指数运算;
print(x / 2)  # divide除
print(x // 2)  # 地板除，向下取整

4
2
6
9
1.5
1


Python中也有复合运算符，但是没有++ --这种操作符。

In [34]:
x += 1
print(x)
x *= 2
print(x) 

4
8


In [33]:
x++
x--

SyntaxError: invalid syntax (<ipython-input-33-162eb8f3e7b9>, line 1)

浮点数运算与整数基本相同，这里不再赘述。

In [35]:
y = 2.5
print(type(y))  # Prints "<type 'float'>"
print(y, y + 1, y * 2, y ** 2)  # Prints "2.5 3.5 5.0 6.25"

<class 'float'>
2.5 3.5 5.0 6.25


python也内建了复数运算的支持，关于python中算数运算的更详细内容，请参考这个文档https://docs.python.org/3/library/stdtypes.html#numeric-types-int-float-long-complex

>和其他语言一样，python中的浮点数也有精度限制，对比两个浮点数的时候，不能使用==号比较。

python数字是没有值域限制的，可以表示任意大的数字。

In [37]:
'''
x = 2  # 著名的国际象棋的故事
for i in range(64):
    x = x*2
print(x) # 这个数字太大了，打印就要几十分钟
'''

x = 2 # 稍微改一下
for i in range(16):
    x = x**2
print(x)

2003529930406846464979072351560255750447825475569751419265016973710894059556311453089506130880933348101038234342907263181822949382118812668869506364761547029165041871916351587966347219442930927982084309104855990570159318959639524863372367203002916969592156108764948889254090805911457037675208500206671563702366126359747144807111774815880914135742720967190151836282560618091458852699826141425030123391108273603843767876449043205960379124490905707560314035076162562476031863793126484703743782954975613770981604614413308692118102485959152380195331030292162800160568670105651646750568038741529463842244845292537361442533614373729088303794601274724958414864915930647252015155693922628180691650796381064132275307267143998158508811292628901134237782705567421080070065283963322155077831214288551675554073345107213112427399562982719769150054883905223804357045848197956393157853510018992000024141963706813559840464039472194016069517690156119726982337890017641517190051133466306898140219383481435426387306539552

python3.6中为了数字的显示方便，增加了数字的千分位符，如下，可以用横线来分割数字。

In [9]:
# 千分位符
a = 368934881474191032321
b = 368_934_881_474_191_032_321
c = 123.456_789
print(a == b)
type(c)

True


float

#### 布尔型

In [39]:
t, f = True, False
print(type(t))

<class 'bool'>


需要注意的是，有C语言背景的话，C语言里面True和False是0和1的宏定义，但是Python里面不是这样的，Python里面True和False是保留字，是一个单独的定义，不能与0,1混用，同时还有一个None类型，与C语言中的NULL类似，但是也不是0的宏定义。

另外，python中逻辑运算全部用字母运算符表示，而且是保留关键字，这样能够避免语法的一些混乱。

In [43]:
print(t and f)  # 逻辑与;
print(t or f)  # 逻辑或;
print(not t)   # 逻辑非;
print(t != f)  # 逻辑异或;
print(None == 1)
print(None == False)
print(type(None))

False
True
False
True
False
False
<class 'NoneType'>


#### 字符串

在C或者java中使用字符串的时候，字符串中间插入单双引号需要进行转义，而python中为了解决这类问题，直接将单双引号等价，都可以用来定义字符串，而且是等价的，所以可以在一个字符串里面根据需要混用两种引号。对于多行字符串，还可以使用三单引号来定义。

In [45]:
hello = 'hel"lo!'
world = "w'r'ld"
hello_world = '''
'hello'
world
'''
print(hello, len(hello))
print(hello_world)

hel"lo! 7

'hello'
world



In [47]:
hw = hello + ' ' + world
print(hw)
x = 2
y = 2.1
print(hello + str(x) + str(y)) # 数字转换成字符串
print(int(str(x)), float(str(y))) # 同样的，字符串也可以转换成数字

hel"lo! w'r'ld
hel"lo!22.1
2 2.1


In [53]:
hw12 = '%s %s %d %.2f' % (hello, world, 12, 123.4567) # 老式C风格字符串格式化
print(hw12)  # prints "hello world 12"
hw13 = '{0} {1} {2} {3:.2f}'.format(hello, world, 12, 123.4567)  # python风格字符串格式化
print(hw13)
x = 123.4567
hwf = f'{hello} {world} {x:.2f}'  # python3.6以后才支持的f格式化
print(hwf)

hel"lo! w'r'ld 12 123.46
hel"lo! w'r'ld 12 123.46
hel"lo! w'r'ld 123.46


字符串内建了一系列有用的方法：

In [54]:
s = "hello"
print(s.capitalize())  # 首字母大写
print(s.upper())       # 大写
print(s.rjust(7))# 右边空格补齐
print(s.center(7))     # 剧中对齐
print(s.replace('l', '(ell)')) # 搜索替换
print('  world '.strip()) # 删除空白字符

Hello
HELLO
  hello
 hello 
he(ell)(ell)o
world


更详细的字符串相关文档，可以查阅https://docs.python.org/3/library/stdtypes.html#string-methods

>字符串也可以作为一个序列对象被遍历 ，后续会介绍到。

### 注释
python可以使用不同风格的注释来对代码进行解释

In [60]:
x = 1 # 这是一个单行注释
# 这也是一个单行注释
'任何一个没有变量承接的字符串都可以作为一个注释'

'''
python中没有单独的多行注释语法，
多行注释通过多行字符串来实现
'''

'''
x = 1
y =2 
对于需要临时注释掉的代码，可以使用多行注释来处理
因为字符串的左右边界字符是完全一样的，
所以一定注意不管使用单引号双引号还是三引号，都一定要成对使用
'''

'\nx = 1\ny =2 \n对于需要临时注释掉的代码，可以使用多行注释来处理\n因为字符串的左右边界字符是完全一样的，\n所以一定注意不管使用单引号双引号还是三引号，都一定要成对使用\n'

### 变量
python为动态强类型语言，变量可以声明即定义，或者都在某些特定场合先声明后定义。

In [7]:
a = 1
print(a, type(a)) # 可以使用type内建函数，获得变量的类型。

1 <class 'int'>


In [18]:
b = 2 
def fun():
    '''
    与其他语言一样，函数内部定义的变量会隐藏外部同名变量，
    这里函数内外的b是两个完全独立的变量
    '''
    b = 3
    def fun_inner():
        '''
       这是一个内嵌函数，一般来说这种使用方式应该避免，但是在使用装饰器的时候，
       比较常用这种定义，
        '''
        b = 4
        print(b)
    fun_inner()
    print(b) 
fun()
print(b)

4
3
2


In [22]:
b = 2 
def fun():
    '''
    使用gloab可以让函数内部能够够访问外部变量定义而不会引起覆盖
    '''
    global b
    b = 3
    print(b) 
fun()
print(b)

3
3


In [21]:
b = 2 
def fun():
    b = 3
    def fun_inner():
        '''
        在内部函数中可以使用nonlocal来访问外部函数的变量，这种技术是在编程中称为闭包的一种技术的基础。
        '''
        nonlocal b
        b = 4
        print(b)
    fun_inner()
    print(b) 
fun()
print(b)

4
4
2


**下面是python中，关于变量的使用，有点坑的地方**

In [28]:
for i in range(10):
    inner_var2 = i+1
    print(inner_var2)
print(i, inner_var2)

a = 1
if a > 0:
    inner_var = 2 #这一句因为判断条件满足而被执行了。
else:
    inner_var2 = 3
print(inner_var)
# 这里，inner_var是在if语句中定义的，但是在if语句外面，这个变量仍然可以访问。
# 同样的情况发生在for，while循环等语句中
print(inner_var2)   
# 这里的inner_var2用的是上面的for循环中定义的inner_var2，而不是if语句中的，
# 如果没有上面的for循环，这里应该是要报错的
# 这是一种比较常见的问题，循环结束后，没有确认就重用了循环里面的变量

1
2
3
4
5
6
7
8
9
10
9 10
2
10


**在python中，各语句不形成变量作用域，只有函数和class能够形成变量作用域**

### 控制结构

#### 循环
python拥有比较独特的循环结构，特别方便在程序中使用。
##### while循环

In [88]:
n = 100
count = 0
while n > 0:
    count += n
    n -= 1
else:
    print('end while loop') 
    # 当循环条件不满足的时候，这一行会被执行，平时比较少用，只在一些特殊的场合用到
    # 如果没有这个else，使用if也可以进行判断，但要多写几行代码

print("sum from 1 to %d is: %d" % (100, count))

end while loop
sum from 1 to 100 is: 5050


##### range函数
在介绍for循环之前，先介绍一下range函数，这个函数可以在需要使用数字序列的时候，产生一个我们需要的数字序列。
**一定注意range的右边界不可达。**


In [69]:
print(list(range(5))) # 默认从0开始
print(list(range(0, 10,))) # 也可以手动指定起始
print(list(range(0, 10, 2))) # 默认间隔为1,可以手动指定
print(list(range(10, 0, -1)))# 甚至可以逆序
print(range(10, 0, -1))# range生成的是一个generator，可以用于循环，
                                            #但直接打印是无法打印出里面的数字的，必须包一个list

[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 2, 4, 6, 8]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
range(10, 0, -1)


##### for循环
有了range，我们可以改写一下上面那个while循环了


In [89]:
count = 0
for i in range(101): # range右边界不可达
    count += i
else:
    print('end for loop')  # for也有类似while的else结构
print("sum from 1 to %d is: %d" % (100, count))

end for loop
sum from 1 to 100 is: 5050


事实上 ，后续介绍的所有容器类型都可以使用for循环来遍历，详情参考后续内容。

In [74]:
sum(range(101)) # 上面的代码都是演示，对于这个求和，有更简单直观的代码解决

5050

##### break/continue

循环中，并不一定需要针对所有的循环条件运行循环体，特别是有些特殊的行情况需要提前结束循环执行。

In [91]:
count = 0
for i in range(101):  # range右边界不可达
    if i % 2 == 0:
        continue
    count += i
    if i > 50:
        break
else:
    print('end for loop')  # break的时候，并不是由于循环条件不满足，所以这一句没有执行
print("sum of odd number from 1 to %d is: %d" % (50, count))

sum of even number from 1 to 50 is: 676


#### 分支
python中的分支只有if，没有C/java等的switch结构
>事实上，python里面也不需要switch结构，结合一些容器，遍历等语法，python的代码控制可以更加强大而简洁。

In [92]:
from math import sqrt
for i in range(10):
    if i % 2 == 0:
        print(' {} is a even number'.format(i))  # 偶数
    elif i % 2 != 0:  # 连续分支，可以替代switch结构
        for j in range(2, int(sqrt(i) + 1)):  # 只针对奇数判断素数，偶数肯定是合数
            if i % j == 0:
                print('{} is a composite number'.format(i))
                # 能被1和自己之外的数字整除，合数，后续计算没必要进行了
                break
                # else可以没有
        else:  # 注意这里是for循环的else
            print('{} is a prime number'.format(i))  # 只能被1和自己整除，所以是素数
        print(' {} is a odd number'.format(i))  # 奇数
    else:
        print(' this not even possible for {}'.format(i))

 0 is a even number
1 is a prime number
 1 is a odd number
 2 is a even number
3 is a prime number
 3 is a odd number
 4 is a even number
5 is a prime number
 5 is a odd number
 6 is a even number
7 is a prime number
 7 is a odd number
 8 is a even number
9 is a composite number
 9 is a odd number


### 函数

python里面，函数是由def来定义的：

In [93]:
def sign(x):
    if x > 0:
        return 'positive'
    elif x < 0:
        return 'negative'
    else:
        return 'zero'


print(sign(-1))
print(sign(0))
print(sign(1))

negative
zero
positive


python的函数还可以接受带默认值的keyword参数

In [125]:
def hello(name, loud=False):
    if loud:
        print('HELLO, %s' % name.upper())
    else:
        print('Hello, %s!' % name)


hello('Bob')
hello('Fred', loud=True)
hello('Fred', True)  # 不写keyword的情况下，也可以按照顺序判断传入的是哪个参数
hello(loud=True, name='Ray')
# python里面的参数，只要指定了name，
#就可以识别，不需要按照定义的顺序给出

Hello, Bob!
HELLO, FRED
HELLO, FRED
HELLO, RAY


##### 函数的参数
Python函数还能够接受变长参数，也就是定义的时候，可以不规定参数，在运行的时候实时解析参数。

In [126]:
def fun(var1, var2, var3=3, var4=4, **kw):
    '''
    kw即为可变参数，任何传入了，但不属于前面定义的已知参数都会被收集到这个kw里面供处理
    这个kw为python里面字典类型，关于字典类型参考后面的介绍
    '''

    print(kw)
    print(var1, var2, var3, var4)


fun(2, 1, var4=5, var5=5, var6=6)
print('#' * 10)


def fun2(var1, var2=3, *var3):
    '''
    对于不带keyword的顺序参数，可以使用星号语法进行收集
    '''
    print(var3)
    print(var1, var2)


fun2(1, 2, 3, 4, 5)
fun2(1, 2, *[3, 4, 5])  # 星号语法能收集参数，也可以用来传递参数。
print('#' * 10)


def fun3(var1, var2=3, *var3, **kw):
    '''
    顺序参数，keyword参数，和变长参数可以结合起来使用
    '''
    print(kw)
    print(var3)
    print(var1, var2)


fun3(1, 2, *[3, 4, 5], **{'var4': 5, 'var5': 6, 'var6': 6})
# 星号语法也可以用来传递字典类型的参数

print('#' * 10)


def fun4(var1, *var3, var2=3, **kw):
    '''
    需要注意这种情况，var2只能由keyword传入，不然就被var3收集起来了
    '''
    print(kw)
    print(var3)
    print(var1, var2)


fun4(1, 2, *[3, 4, 5], **{'var4': 5, 'var5': 6, 'var6': 6})
fun4(1, 2, *[3, 4, 5], var2=100, **{'var4': 5, 'var5': 6, 'var6': 6})

{'var5': 5, 'var6': 6}
2 1 3 5
##########
(3, 4, 5)
1 2
(3, 4, 5)
1 2
##########
{'var4': 5, 'var5': 6, 'var6': 6}
(3, 4, 5)
1 2
{'var4': 5, 'var5': 6, 'var6': 6}
(3, 4, 5)
1 2
##########
{'var4': 5, 'var5': 6, 'var6': 6}
(2, 3, 4, 5)
1 3
{'var4': 5, 'var5': 6, 'var6': 6}
(2, 3, 4, 5)
1 100


In [123]:
def fun5(var1,  *var3,  **kw,var2=3):
    '''
    当结合使用的时候，定义函数要遵守以下规则：
    1 星号顺序参数必须在星号字典顺序的前面
    2 顺序参数必须在keyword参数的前面
    3 keyword参数必须在星号字典参数的前面
    '''
    print(kw)
    print(var3)
    print(var1, var2)
fun5(1, 2, *[3, 4, 5], **{'var4': 5, 'var5': 6, 'var6': 6})

SyntaxError: invalid syntax (<ipython-input-123-354970997348>, line 1)

**强烈建议全部使用keyword参数来定义和使用函数，这样能避免很多问题。**

##### 函数的使用

函数在python中也是一种类型，可以被当作参数传递，再拿偶数奇数，素数合数的例子，改写一下

In [130]:
from math import sqrt


def fun_odd(var):
    print(' {} is a odd number'.format(var))


def fun_even(var):
    print(' {} is a even number'.format(var))


def fun_primary(var):
    print('{} is a prime number'.format(var))


def fun_composite(var):
    print('{} is a composite number'.format(var))


def is_primary(var):
    ret = False
    for j in range(2, int(sqrt(var) + 1)):  # 只针对奇数判断素数，偶数肯定是合数
        if var % j == 0:
            break
    else:  # 注意这里是for循环的else
        ret = True
    return ret


def judge_numbers(number,
                  odd_fun=fun_odd,
                  even_fun=fun_even,
                  primary_fun=fun_primary,
                  composite_fun=fun_composite):
    for i in range(number):
        if i % 2 == 0:
            even_fun(i)
        elif i % 2 != 0:
            if is_primary(i):
                primary_fun(i)
            else:
                composite_fun(i)
            odd_fun(i)
        else:
            print(' this not even possible for {}'.format(i))


judge_numbers(10)
print(is_primary, type(is_primary))

 0 is a even number
1 is a prime number
 1 is a odd number
 2 is a even number
3 is a prime number
 3 is a odd number
 4 is a even number
5 is a prime number
 5 is a odd number
 6 is a even number
7 is a prime number
 7 is a odd number
 8 is a even number
9 is a composite number
 9 is a odd number
<function is_primary at 0x7fecb653d8c8> <class 'function'>


关于函数的返回值，需要注意的是，任何python函数都是有返回值的，如果不写，则默认返回值为None，特别是有些内建函数，如果不注意会造成很隐蔽的bug。


In [136]:
a = fun_even(10)
print(a)

 10 is a even number
None


##### lambda函数
有时，一些函数很简单，单独定义个函数有些没必要，但是一些接口又必须以函数作为参数，则可以使用lambda函数，或称匿名函数。

lambda函数只能有一条语句，而且不能 包含赋值语句，语句的返回值，就是lambda函数的返回值

In [140]:
from math import sqrt

# lambda函数也可以用一个变量来承接。
fun_composite = lambda var: print('{} is a composite number'.format(var))


def is_primary(var):
    ret = False
    for j in range(2, int(sqrt(var) + 1)):  # 只针对奇数判断素数，偶数肯定是合数
        if var % j == 0:
            break
    else:  # 注意这里是for循环的else
        ret = True
    return ret


def judge_numbers(
        number,
        odd_fun=lambda var: print(' {} is a odd number'.format(var)),
        even_fun=lambda var: print(' {} is a even number'.format(var)),
        primary_fun=lambda var: print('{} is a prime number'.format(var)),
        composite_fun=fun_composite):
    for i in range(number):
        if i % 2 == 0:
            even_fun(i)
        elif i % 2 != 0:
            if is_primary(i):
                primary_fun(i)
            else:
                composite_fun(i)
            odd_fun(i)
        else:
            print(' this not even possible for {}'.format(i))


judge_numbers(10)
print(fun_composite, type(fun_composite), fun_composite(15))

# lambda 也可以有多个参数
add = lambda x, y: x + y
print(add(123, 456))

 0 is a even number
1 is a prime number
 1 is a odd number
 2 is a even number
3 is a prime number
 3 is a odd number
 4 is a even number
5 is a prime number
 5 is a odd number
 6 is a even number
7 is a prime number
 7 is a odd number
 8 is a even number
9 is a composite number
 9 is a odd number
15 is a composite number
<function <lambda> at 0x7fecb63db950> <class 'function'> None
579


##### 闭包
内层函数对外层函数非全局变量的引用，就叫做闭包函数。闭包会一直存在内存当中,不会因为函数执行结束而被释放。
设想如下情景，我们需要一个函数，这个函数可以记住自己被调用了多少次，该如何编写这个函数。
当然，可以用全局变量来实现，也可以考虑用后面的class来实现，但是这两种方式都需要引入额外的东西。

In [5]:
def fun_gen(): # 生成函数的函数
    count = 0
    def fun(var):
        nonlocal count # 声明，引用外部函数的变量，不加这个会报错
        print('got {}'.format(var))
        print('invoked {} times'.format(count))
        count += 1
    return fun

fun = fun_gen()

fun(1)
fun('duck')
fun('I am iron man!')

got 1
invoked 0 times
got duck
invoked 1 times
got I am iron man!
invoked 2 times


### 容器类型与相关操作，comprehension

Python有几种内建的容器类型lists, dictionaries, sets, and tuples，其附带的各种内建操作，结合循环等，可以极大的简化某些场景下的数据操作。

#### Lists，列表

list是python版本的数组，与C/Java中的数组不同，list中的数组可以灵活的增删，而且可以存储不同类型的数据。

In [7]:
xs = [3, 1, 2] 
print(xs, xs[2]) # 数组用下标访问，需要注意python中的下标从0开始
print(xs[-1]) 
len(xs) # 内建函数len经常被用来计算容器的元素数量

[3, 1, 2] 2
2


3

In [10]:
xs[2] = 'foo'   # list可以存储不同类型的元素，甚至是list
xs[0] = [1,2,3,4]
print(xs)

[[1, 2, 3, 4], 1, 'foo']


In [9]:
xs.append('bar')  # 像堆栈一样使用list
print(xs)
x = xs.pop()  # 被删除的元素会被返回
print(x, xs)

[3, 1, 'foo', 'bar']
bar [3, 1, 'foo']


关于list的更多详细信息https://docs.python.org/3/tutorial/datastructures.html#more-on-lists

#### Slicing/切片

除了能够以下标访问某个单独的元素之外，python的容器还提供一种可以同时操作多个元素的方式，切片

In [12]:
nums = list(range(5))
print(nums)     
print(nums[2:4]) # 获得从第2到第3个元素，左边界可达，右边界不可达
print(nums[4:2:-1]) # 逆序获取元素
print(nums[1:5:2]) # 隔一个元素获取一个元素，这里的2是步长
print(nums[5:1:-2])
print(nums[2:])   # 索引可以省略，代表获取到最后
print(nums[:2])
print(nums[:])  # 两个索引都省略，代表获取所有元素，相当于复制，但是这里有个坑，待会儿介绍
print(nums[:-1])    # 所以可以是负号，这个-1代表右边界，记得右边界不可达
nums[2:4] = [8, 9]  # 批量赋值
print(nums)  

[0, 1, 2, 3, 4]
[2, 3]
[4, 3]
[1, 3]
[4, 2]
[2, 3, 4]
[0, 1]
[0, 1, 2, 3, 4]
[0, 1, 2, 3]
[0, 1, 8, 9, 4]


#####  一个小坑，deepcopy深层copy/shallowcopy浅层copy问题
这个问题存在与所有的编程语言中，但是每个语言中的表现不同，在python中，除了基础的数字类型，tuple之外，其他所有的类型都有这个问题。


这里考虑一个最简单的版本。

In [27]:
l = [[1, 2, 3], 4, 5, 6]  # 嵌套的list

l2 = l[:]  #制一个
print(l, l2)

l[2]= 'a'
l2[2] = 'b'
print(l, l2) # 这里一切正常

l[0][2] = 'str1'
l2[0][2] = 'str2'
print(l, l2) # 这里出问题了，对l2的修改影响了l

# 事实上，list中存储的是对[1,2,3]这个内部list的引用，
# 复制的时候，只是复制了一个引用，并没有复制这个对象本身
print(id(l[0]) == id(l2[0])) # id可以用来返回一个对象的地址，这里可以看到l和l2持有的是同一个对象。
# 这里就是一个很典型的shallowcopy浅层copy

# 当然，一些情况下，这个现象是需要的，但是也有一些情况需要避免这个现象

# 解决方案很简单，针对内部对象，单独进行复制。
l2 = l[:] 
l2[0] = l[0][:] # 这种操作就是deepcopy深层复制

l[0][2] = 'str1'
l2[0][2] = 'str2'
print(l, l2) 

[[1, 2, 3], 4, 5, 6] [[1, 2, 3], 4, 5, 6]
[[1, 2, 3], 4, 'a', 6] [[1, 2, 3], 4, 'b', 6]
[[1, 2, 'str2'], 4, 'a', 6] [[1, 2, 'str2'], 4, 'b', 6]
True
[[1, 2, 'str1'], 4, 'a', 6] [[1, 2, 'str2'], 4, 'a', 6]


这里介绍的是很简单很浅显的情况，但是python代码上了一定的规模，特别是引入面向对象之后，很多时候，对象的构建过程比较复杂，浅层copy就不太容易被发现，需要小心处理。

#### 循环

python内建了强大的对容器类型的遍历支持，使用起来很方便。

In [21]:
animals = ['cat', 'dog', 'monkey']
for animal in animals:
    print(animal)

cat
dog
monkey


有时候，只访问元素值是不够的，还需要知道 元素的索引可以使用`enumerate` 函数

In [24]:
animals = ['cat', 'dog', 'monkey']
for idx, animal in enumerate(animals):
    print('#%d: %s' % (idx + 1, animal))

#1: cat
#2: dog
#3: monkey


#### List comprehensions/列表推导式

comprehensions是python内建的对容器元素进行操作的一种便捷方式，其非常简洁，当然很多时候不是必须的。

考虑需要把一个list中的整数都取平方这个应用场景，如果用for循环来做的话

In [23]:
nums = [0, 1, 2, 3, 4]
squares = []
for x in nums:
    squares.append(x ** 2)
print(squares)

[0, 1, 4, 9, 16]


而用comprehensions则可以表示成这样，代码简洁了很多

In [24]:
nums = [0, 1, 2, 3, 4]
squares = [x ** 2 for x in nums]
print(squares)

[0, 1, 4, 9, 16]


comprehensions 也可以包含判断条件

In [28]:
nums = [0, 1, 2, 3, 4]
even_squares = [x ** 2 for x in nums if x % 2 == 0]
print(even_squares)

[0, 4, 16]


#### Dictionaries字典

字典是键值对 (key, value)的一种数据结构，类似java中map，但是这里的字典可以存储任意类型的元素作为value，不过字典对key有一定的要求，这个稍后介绍。

In [26]:
d = {'cat': 'cute', 'dog': 'furry'} 
print(d['cat']) # 字典也可以用下标获取
print('cat' in d)  #检查某个元素是否在字典里

cute
True


In [27]:
d['fish'] = 'wet'    # 设置某个元素的值
print(d['fish']) 

wet


In [28]:
print(d['monkey'])  # 找没有的元素

KeyError: 'monkey'

In [29]:
print(d.get('monkey', 'N/A'))  # 可以给一个默认值，避免KeyError
print(d.get('fish', 'N/A'))

N/A
wet


In [30]:
del d['fish']        # 删除一个值
# 这个真的很少用，我自己完全没用过这个，比起删除
#我更喜欢直接用comprehension加判断条件直接创建一个新的。
print(d.get('fish', 'N/A'))  # "fish" is no longer a key; prints "N/A"

N/A


更多关于dict的资料可以查看python的官方文档https://docs.python.org/3/library/stdtypes.html#dict

dict也支持内建的forin遍历语法

In [31]:
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal in d:
    legs = d[animal]
    print('A %s has %d legs' % (animal, legs))

A person has 2 legs
A cat has 4 legs
A spider has 8 legs


也可以直接访问键值对

In [32]:
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal, legs in d.items():
    print('A %s has %d legs' % (animal, legs))

A person has 2 legs
A cat has 4 legs
A spider has 8 legs


Dictionary comprehensions: 跟list的类似

In [33]:
nums = [0, 1, 2, 3, 4]
even_num_to_square = {x: x ** 2 for x in nums if x % 2 == 0}
print(even_num_to_square)

{0: 0, 2: 4, 4: 16}


如果有有其他语言特别是javascript的背景的人，可能已经注意到，python里面的dict跟json格式如出一辙，事实上python里面的dict，可以非常方便的用json这个库跟json字符串互相转化。

In [27]:
d = {'person': 2, 'cat': 4, 'spider': 8}
import json
var_json = json.dumps(d)
print(type(var_json))
d2 = json.loads(var_json)
print(d2)
print(type(d2))

<class 'str'>
{'person': 2, 'cat': 4, 'spider': 8}
<class 'dict'>


#### Sets/集合

集合是唯一元素的list，跟list相似但又有独特的应用领域

In [28]:
animals = {'cat', 'dog'}
print('cat' in animals)
print('fish' in animals)

True
False


In [29]:
animals.add('fish') 
print('fish' in animals)
print(animals)
print(len(animals))   

True
{'dog', 'fish', 'cat'}
3


In [30]:
animals.add('cat') # 添加重复的元素不起作用
print(len(animals))
print(animals)
animals.remove('cat') 
print(len(animals))

3
{'dog', 'fish', 'cat'}
2


元素值唯一的特性，让set有独特的应用领域，但是set的使用真的不如list和dict广泛，甚至也比不上tuple。

set相关的详细信息可以查阅https://docs.python.org/3/library/stdtypes.html#set

_Loops_: set使用内建的hash算法来处理元素的内容比对，而不是按照元素放入的顺序，这个跟list不太一样，set是无序（unordered）的。
> 无序仅仅是相对于放入顺序来说，其实set可以保证只要内容不变，每次输出的顺序是完全一样的。

In [29]:
animals = {'cat', 'dog', 'fish'}
for animal in animals:
    print(animal)

animals = {'cat', 'dog', 'fish'}
for idx, animal in enumerate(animals):
    print(('#%d: %s' % (idx + 1, animal)))


fish
cat
dog
#1: fish
#2: cat
#3: dog


##### Set comprehensions: 
没啥好说得了，自己感受下

In [38]:
from math import sqrt
print({int(sqrt(x)) for x in range(30)})

{0, 1, 2, 3, 4, 5}


#### Tuples/元组

元组是不可变 (immutable)版本的list，其使用跟list基本一致，不同的是list的元素可变，而tuple的元素不可变，同时tuple可以作为dict的key，而list不行。

In [39]:
d = {(x, x + 1): x for x in range(10)}  # Create a dictionary with tuple keys
# list and dict and sets are not hashable.
t = (5, 6)       # Create a tuple
print(type(t))
print(d[t])
print(d[(1, 2)])

<class 'tuple'>
5
1


In [40]:
t[0] = 1

TypeError: 'tuple' object does not support item assignment

更多详细信息可以参考https://docs.python.org/3/tutorial/datastructures.html#tuples-and-sequences

##### 关于dict的kety
到这里我们终于可以回来介绍一下dict的key了，
官方对dict的介绍为
>A mapping object maps hashable values to arbitrary objects.

而关于hashable，python文档的介绍如下：
>An object is hashable if it has a hash value which never changes during its lifetime (it needs a \_\_hash\_\_() method), and can be compared to other objects (it needs an \_\_eq\_\_() method). Hashable objects which compare equal must have the same hash value.

换句话说，作为dict的key使用的值必须是稳定的，能被可靠的索引，而list内容是可变（mutable）的，所以不能作为dict的key。

在python中，所有immutable的对象，包括所有数值类型，字符串，tuple都是immutable的，所以可以被当作dict的key。

>对字符串的替换，拼接等操作，都会返回一个新的字符串，而不是在原有字符串上进行操作（inplace方式）

而用户定义的类型，如果其实现了\_\_hash\_\_方法，可以提供一个稳定的hash value用以区别两个不同的object，那么这个用户类型也可以作为dict的key，即使这个用户类型内部的元素会改变，本身是mutable的。

### Classes

Python提供面向对象的支持，在python中定义一个类很简单
>面向对象的内容比较庞大，这里仅介绍部分关键内容

In [16]:
class Greeter:
    member = 'Greeter' # 类属性
    # 构造器
    def __init__(self, name):
        self.name = name  #实例属性

    # 实例方法
    def greet(self, loud=False):
        '''
        这里的self是调用这个方法的本类的实例
        '''
        if loud:
            print('HELLO, %s!' % self.name.upper())
        else:
            print('Hello, %s' % self.name)
    
    # 类方法，需要通过classmethod进行定义
    @classmethod # 这是一个装饰器/decorator的用法，python中比较高级的一块内容
    def Greet(cls, loud=True):
        '''
        这里的cls是调用这个方法的本类的实例
        '''
        if loud:
            print('HELLO, %s!' % cls.member.upper())
        else:
            print('Hello, %s' % cls.member.name)


g = Greeter('Fred')
g.greet()
g.greet(loud=True)

Greeter.Greet()  # 类的方法可以通过类来调用，也可以通过实例调用
g.Greet()

print(g.member)  #类属性可以通过实例或者类本身读取
print(Greeter.member)

g.member = 'greeter'
# 但是直接在实例上赋值会创建一个新的实例属性，而不是修改类属性的值
# 所以如果用实例调用类方法，而里面又涉及了对类属性的修改，就会出问题
print(g.member)
print(Greeter.member)

Hello, Fred
HELLO, FRED!
HELLO, GREETER!
HELLO, GREETER!
Greeter
Greeter
greeter
Greeter


需要注意的是，这里的self 不是一个很特别的变量，只是约定俗成的写法，self也不是python的保留关键字，你可以用任何变量名替代self。

In [17]:
class Greeter2:
    # Constructor
    def __init__(this, name):
        this.name = name 

    def greet(this, loud=False):
        if loud:
            print('HELLO, %s!' % this.name.upper())
        else:
            print('Hello, %s' % this.name)
            
g = Greeter2('Fred')
g.greet()
g.greet(loud=True)

Hello, Fred
HELLO, FRED!


在python中，甚至类本身的定义都是可以随时被修改的。

In [18]:
class Greeter3:
    # Constructor
    def __init__(this, name):
        this.name = name

# 独立于类定义的一个函数定义
def greet(this, loud=False):
    if loud:
        print('HELLO, %s!' % this.name.upper())
    else:
        print('Hello, %s' % this.name)

Greeter3.greet = greet # 函数的定义可以在运行的时候被替换
g = Greeter3('Greeter3') 
g.greet()  
g.greet(loud=True)

Hello, Greeter3
HELLO, GREETER3!


#### class的继承与重载
既然涉及面向对象，那么就一定有类的继承与重载。

In [75]:
class Base:
    def __init__(self, name='Base'):
        print('init Base')
        self.name = name

    def fun(self):
        print('fun from Base [{}]'.format(self.name))

    def fun_2(self):
        print('fun_2 from Base [{}]'.format(self.name))

    def funBase(self):
        print('funBase from Base [{}]'.format(self.name))


class A(Base):
    def __init__(self, name='A'):
        super().__init__(name=name)
        # 如果这里的super init不加name会怎么样呢？
        print('init A')

    def fun(self):
        super().fun()
        print('fun from A [{}]'.format(self.name))

    def fun_2(self):
        print('fun_2 from A [{}]'.format(self.name))

    def funA(self):
        print('funA from A [{}]'.format(self.name))


class B(Base):
    def __init__(self, name='B'):
        super().__init__(name=name)
        print('init B')

    def fun(self):
        super().fun()
        print('from B [{}]'.format(self.name))

    def fun_2(self):
        super().fun_2()
        print('fun_2 from B [{}]'.format(self.name))

    def funB(self):
        print('funB from B [{}]'.format(self.name))


class DerivedA(A, B):
    def __init__(self, name='DerivedA'):
        #super(DerivedA, self).__init__(name=name)
        super().__init__(name=name)  # 也可以省略，作用一样
        print('init DerivedA')

    def fun(self):
        super().fun()
        print('fun from DerivedA[{}]'.format(self.name))

    def fun_2(self):
        super().fun_2()
        print('fun_2 from DerivedA [{}]'.format(self.name))
        
        
da = DerivedA()
# 这里，对子类的实例化，会沿着继承链从下到上， 从左到右（子类继承括号的顺序）的顺序查找基类，
# 然后按照相反的方式进行实例化
print('#' * 10)


# 可以使用super来调用父类的被重载的函数
# 一定注意继承链的查找顺序
da.fun()
print('#' * 10)

# 中间基类每一层都要调用super函数，
# 不然继承链会在没有调用super的那一层断掉
# 对init是如此，对普通函数也是如此
da.fun_2()
print('#' * 10)

da.funA()
print('#' * 10)

da.funB()
print('#' * 10)

da.funBase()

init Base
init B
init A
init DerivedA
##########
fun from Base [DerivedA]
from B [DerivedA]
fun from A [DerivedA]
fun from DerivedA[DerivedA]
##########
fun from Base [DerivedA]
from B [DerivedA]
fun from A [DerivedA]
fun from DerivedA[DerivedA]
##########
fun_2 from A [DerivedA]
fun_2 from DerivedA [DerivedA]
##########
funA from A [DerivedA]
##########
funB from B [DerivedA]
##########
funBase from Base [DerivedA]


除了super方式之外，其实还有下述方式，但是下述方式有个明显的问题

In [76]:
class Base:
    def __init__(self):
        print('init Base')


class A(Base):
    def __init__(self):
        Base.__init__(self)
        print('init A')


class B(Base):
    def __init__(self):
        Base.__init__(self)
        print('init B')


class DerivedA(A, B):
    def __init__(self):
        A.__init__(self)
        B.__init__(self)
        print('init DerivedA')


da = DerivedA()

init Base
init A
init Base
init B
init DerivedA


上面的Base，被调用了两次，所以除非确实需要，不要这么做。使用super能满足大多数场景下的需求。

#### Magic function/魔术方法
到这里，带双下划线的方法已经出现过很多次了，这里正式介绍一下。

Python中，所有以“__”双下划线包起来的方法，都统称为“Magic Method”，中文称魔术方法。

同时还存在“__”双下划线开头的成员，又是另外的用途，待会儿单独介绍。

Magic Function存在于类中，一般作为实例方法，其与特定的python内建函数或特定操作对应，一般都有特定的用途。

换句话说，python中有一批Magic Function，其名字和用途是已经确定了的，我们只需要根据自己的需要，实现这些MagicFunction即可，python的一些语法和内建函数会自动依赖这些MagicFunction来运行。

已经介绍过的\_\_init\_\_就是比较常见的一个，与之对应的是\_\_del\_\_这两个函数分别用于实例的初始化和删除，也就是其他面向对象语言中的构造器和析构器。
>python中有比较完善的垃圾回收机制，所以很多时候不需要使用析构器。虽然很多文献指出这个垃圾回收机制的效率不高（甚至有人指出，禁用垃圾回收能提高python的运行效率）。

前面已经用过的len函数，依赖于 \_\_len\_\_，而dict的key必须实现\_\_hash\_\_等。

关于Magic Function，可以使用dir这个内建函数去查询需要模仿实现的类型，里面都有什么方法。例如：

In [77]:
print(dir(list))

['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


#### 权限控制
提到面向对象，那么一定有对被访问对象的访问权限控制相关的功能，如public，protected，private等。

而这里是python比较特别的地方，python没有提供相关的机制，python的作者认为类的设计和使用者应该进行充分的沟通，而不是依赖这种语法设计来保证访问权限。

但是Python里面还是提供了一个替代方案来实现私有成员。在python中，以“__”双下划线开头的成员是私有成员，外部调用者不能**直接**访问，注意这里提了一个**直接**，事实上，想访问还是有办法的。

In [88]:
class A:
    def __init__(self):
        self.__var1 = 1
        self.__var2 = 2
a = A()

print(a._var1)

AttributeError: 'A' object has no attribute '_var1'

In [89]:
print(a._A__var1)

1


### Generator生成器

python的for语法和容器配合的方式，非常的直观好用，而在这背后支撑一切的，则是generator的使用。

大部分python开发人员差不多每天都在用generator，但是自己却没有意识到。

在介绍generator之前，先来看一下如果不使用for循环的情况下访问list会怎样。

In [4]:
l = [1, 2, 3, 4]

it = l.__iter__() 
# it = iter(l) # 或者可以用内建函数

print(it)
print(next(it))
# print(it.__next__()) # 也可以调用一个内建函数，效果是一样的。
print(next(it))
print(next(it))
print(next(it))

print(next(it)) # 已经访问完毕了，继续访问则会报错。

<list_iterator object at 0x7f1b56651080>
1
2
3
4


StopIteration: 

这里其实就是一个iterator，迭代器的用法，如果学过C++的话，会对迭代器的概念比较熟悉。

# 参考
http://cs231n.github.io/python-numpy-tutorial/
https://github.com/kuleshov/cs228-material/blob/master/tutorials/python/cs228-python-tutorial.ipynb