# Python基础教学与编程导论
## Python简介代卷首语

Python是一种高级编程语言，既然说高级编程语言，就有低级语言，比如C和JAVA，在语言的高级与低级中仅仅是指和机器的切合程度，从某种角度来说C++被列入中级语言。

不同的语言显然在不同的方向上有着不同的优势，例如C语言就非常适合编写系统级的程序，C++就适合大型程序和对性能要求非常高的程序——例如高频交易，还有适合网页编程的JS等等。

* 对于不同的需求，语言就会有不同的特性形成适合和不适合的语言，尽管在图灵机理论中任何一门经过图灵机的语言可以完成其他语言的工作——图灵完备性。

从另一种角度来比较高级和低级语言来说，同样的一个程序，Python可能只需要20行，而C就需要1000行代码，然而对于运行速度，Python可能就需要10秒，而C只需要1秒不到的时间。

Python最大的优势在于开发快速，相比于C，Python的开发速度大大快于C，在CPU不如时间贵的时代里，开发速度是非常重要的。

当然Python也有不能做的事情，例如编写操作系统，手机应用，3D游戏等等。

### Python历史

Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间，为了打发无聊的圣诞节而编写的一个编程语言。

### Python的缺点
第一个缺点就是运行速度慢，和C程序相比非常慢，因为Python是解释型语言，你的代码在执行时会一行一行地翻译成CPU能理解的机器码，这个翻译过程非常耗时，所以很慢。而C程序是运行前直接编译成CPU能执行的机器码，所以非常快。

第二个缺点就是代码不能加密。如果要发布你的Python程序，实际上就是发布源代码，这一点跟C语言不同，C语言不用发布源代码，只需要把编译后的机器码（也就是你在Windows上常见的xxx.exe文件）发布出去。要从机器码反推出C代码是不可能的，所以，凡是编译型的语言，都没有这个问题，而解释型的语言，则必须把源码发布出去。

### Python的环境搭建
* 以下仅关于Windows下的Python环境搭建问题



1. 对于版本选择，由于现在的主要库和主要开发环境依然在2.X上，故选择2.X是最合理的

2. 关于环境搭建的建议：Anaconda + PyCharm；前者是数据分析专用，后者则是Python工程中最优秀的IDE

3. 关于文本编辑器，vim学习曲线太大，sublime和notepad++是非常优秀的文本编辑器

## 从头开始——第一个程序

In [1]:
100 + 200

300

In [2]:
print 'hello world'

hello world


以上是最简单的Python程序，由于在Python的IDLE（或在Anaconda的QtConsole下）是交互式界面所以，把Python当做一个简单的计算器也是很容易的事情。

## 输入与输出

Python中，print命令即为输出的命令，对于Python3的问题，print成为了一个函数。

In [4]:
print 'Hello World'
print 'The quick brown fox', 'jumps over', 'the lazy dog'
print 'Hello World\n'
print 300
print 100 + 200

Hello World
The quick brown fox jumps over the lazy dog
Hello World

300
300


Python2中提供了两个输入命令，请注意两个命令的差别

In [5]:
name = raw_input('Please input your name:')
print 'Your name is ', name
b = raw_input('Please input int or float:')
print type(b)

Please input your name:Logic
Your name is  Logic
Please input int or float:2
<type 'str'>


In [6]:
a = input('Please input int or float:')
c = input('Please input int or float:')
print type(a), type(c)

Please input int or float:2
Please input int or float:2.0
<type 'int'> <type 'float'>


可以清楚地看到，input命令会自动辨识你所输入的对象是什么类型，而raw_input则都默认为是字符串类型，从编程的角度来说，我们更推荐raw_input，而非input。

## 基础语法

Python语言不适用类似于C语言一样的{}来表示代码块，而是使用缩进表示一个代码块，根据Python社区公认的编辑标准PEP-8来说，请尽量以四个空格代替tab键。

In [8]:
# 这里是注释在解释程序的时候，Python解释器会自动忽略
'''
这是另外一种注释方式，一般在开始或者需要的大段编辑的情况下作为使用
'''
a = 100
if a >= 0:
    print a
else:
    print -a

100


## 数据类型
* 整数
* 浮点数
* 字符串
* 布尔代数
* None（空值）
* 字典
* 列表
* 元组
* 集合

In [12]:
print type(1),type(0.1),type('I am OK'),type(''),type(True),type([1]),type((1,)),type({'ct':1})

<type 'int'> <type 'float'> <type 'str'> <type 'str'> <type 'bool'> <type 'list'> <type 'tuple'> <type 'dict'>


### 浮点数与整数需要注意的内容
对于浮点数和整数而言，Python不会自动分割，因此在计算中尽量集中为浮点数运算。

In [13]:
print 3/10,'\n', 3.0/10

0 
0.3


### 字符串的编码问题
Python2.X系列开始并不直接支持Utf-8，所以当使用中文的时候就会遇到编码错误，于是，解决方案应运而生，在代码的最开始添加一行就可以。

In [39]:
# -*- coding: utf-8 -*-
print '你好，世界，我是Python'

你好，世界，我是Python


In [15]:
print u'中文'

中文


### 字符串的格式化输出
在很多情况下，我们需要一种能够格式化输出的方式，这种方式在C语言的时候已经产生，并沿革到Python中

In [17]:
print 'Hello, %s, you have $%d' %('Mike', 10000000)

Hello, Mike, you have $10000000


|占位符|意义|
|---|---|
|%d|整数|
|%f|浮点数|
|%s|字符串|
|%x|十六进制数|
|%%|单纯的表示%符号|

In [18]:
print '%.2f' % 3.14159

3.14


### 列表
列表在Python的使用中可以说是一个神器，如果能够妥善的掌握了列表的一些特性，那么Python编程的水平和Geek度都会大幅度提升。

#### 列表的基本

* 列表是有序集合
* 列表是可变的

In [19]:
classmates = ['Mike', 'Bob', 'Tracy']
print classmates
print len(classmates)
print classmates[0], classmates[1], classmates[2], classmates[-1]

['Mike', 'Bob', 'Tracy']
3
Mike Bob Tracy Tracy


在上述的例子中，我们用到了列表的引用，在此可以很清晰的认识到，（-1）代表了从后往前取，而从前往后的索引在Python中则是从0开始的。

#### 列表的修改

In [20]:
classmates.append('Adam')
print classmates

['Mike', 'Bob', 'Tracy', 'Adam']


In [21]:
classmates.pop()
print classmates

['Mike', 'Bob', 'Tracy']


上述的两例可以看到，Python列表修改是非常简单的行为，然而在.append与.pop两者中，更重要的是Python列表同时可以作为一个栈(stack)数据模型应用。

![](http://see.xidian.edu.cn/cpp/uploads/allimg/140713/1-140G3150202349.jpg)

#### 额外之词：栈数据模型

* 定义：栈是限定仅在表头进行插入和删除操作的线性表。
* 栈解决了：



1. 是参数传递的问题。传递参数的目的，是为了代码可以重用，让一种方法可以应用到更多的场合，而不需要为N种情况写N套类似的代码。那用什么方法来做参数的传递，可以选择:

   1. 为了速度快，使用cpu的寄存器传递参数。这会碰到一个问题，cpu寄存器的数量是有限的，当函数内再想调用子函数的时候，再使用原有的cpu寄存器就会冲突了。想利用寄存器传参，就必须在调用子函数前吧寄存器存储起来，然后当函数退出的时候再恢复。

   2. 利用某些ram的区域来传递参数。这和上面a的情况几乎一样，当函数嵌套调用的时候，还是会出现冲突，依然面临要把原本数据保存到其他地方，再调用嵌套函数。并且保存到什么地方，也面临困难，无论临时存储到哪里，都会有上面传递参数一样的困境。

2. 函数里面必然要使用到局部变量，而不能总是用全局变量。则局部变量存储到哪里合适，即不能让函数嵌套的时候有冲突，又要注重效率。

In [22]:
classmates.insert(1, 'Jack')
print classmates

['Mike', 'Jack', 'Bob', 'Tracy']


In [23]:
classmates.pop(1)

'Jack'

In [24]:
print classmates

['Mike', 'Bob', 'Tracy']


In [25]:
classmates[1] = 'Sarah'
print classmates

['Mike', 'Sarah', 'Tracy']


In [27]:
L = ['Apple', 123, True]
s1 = ['python', 'java', ['as','php'], 'scheme']
p = ['as', 'php']
s2 = ['python','java',p,'scheme']

### 元组

* 元组是有序的
* 元组和列表的相似：有序
* 元组和列表的差异：不可变

In [28]:
cm2 = ('Mike', 'Bob', 'Tracy')

In [29]:
t = (1)
t1 = (1,)
print t, t1

1 (1,)


In [30]:
t = ('a', 'b', ['A', 'B'])
print t[2][0]

A


### 字典
字典，全称dictionary，简称dict，其他语言中也存在，称为map。

dictionary的特性：使用键-值存储，查找速度是极快的。

字典与JSON数据类型相似，甚至可以说一样。

请务必注意，dictionary内部存放的顺序与key放入的顺序是没有任何的关系的。也可以说，dictionary是一个无序的内置类型。

在定义dictionary的时候，有一点非常重要**dictionary的KEY必须是不可变的对象**

In [2]:
scored = {'Mike':95, 'Bob':75, 'Tracy':85}
print scored['Mike']

95


In [7]:
scored['Adam'] = 75

In [4]:
scored

{'Adam': 75, 'Bob': 75, 'Mike': 95, 'Tracy': 85}

In [5]:
scored['Kim'] = 99
print scored

{'Kim': 99, 'Mike': 95, 'Bob': 75, 'Adam': 75, 'Tracy': 85}


In [10]:
print scored.get('Thomas')

None


In [11]:
print scored.get('Thomas', -1)

-1


In [12]:
scored.pop('Bob')
print scored

{'Kim': 99, 'Mike': 95, 'Adam': 75, 'Tracy': 85}


#### Dictionary的算法——HASH算法

Dictionary是根据Key来计算Value存储的位置，而这种算法就成为“哈希算法”（HASH）

因此为了保证算法的正确性，key的对象就是不可变的，例如在Py中的字符串、整数等。而列表就不行。

### 集合——SET

SET与Dictionary是很类似的一种内置变量，是一组键/key的集合，但是并不能重复，而且key是不能重复的，就像集合论中的集合一样。

In [13]:
s = set([1,2,3])
print s

set([1, 2, 3])


In [14]:
print set([111,111,111,2222,2222,2222,33333,33333])

set([33333, 2222, 111])


In [15]:
s.add(4)
print s

set([1, 2, 3, 4])


In [22]:
s.remove(3)
print s

set([1, 2])


In [23]:
s1 = set([1,3,4,5,6])
s2 = set([2,3,3,4,5,6,7])
print s1 & s2,'\n'
print s1 | s2

set([3, 4, 5, 6]) 

set([1, 2, 3, 4, 5, 6, 7])


## 判断与循环

### 条件判断

计算机之所以能做很多自动化的任务，因为它可以自己做条件判断。

In [24]:
age = 20
if age >= 18:
    print 'your age is', age, 'adult'

your age is 20 adult


In [25]:
age = 3
if age >= 18:
    print 'your age is', age, 'adult'
else:
    print 'your age is', age, 'teenager'

your age is 3 teenager


In [26]:
age = 3
print 'your age is', age
if age >= 18:
    print 'adult'
elif age >= 6:
    print 'teenager'
else:
    print 'kid'

your age is 3
kid


### 循环
Python中又两类循环，一个是for循环一个是while循环，因此是没有switch循环的

#### for循环

for循环本质是一种for...in的循环

In [27]:
names = ['Michael', 'Bob', 'Tracy']
for name in names:
    print name

Michael
Bob
Tracy


In [30]:
sum = 0
for x in range(101):
    sum = sum + x
print sum

5050


#### while循环

while循环只要条件满足就不断循环，一旦满足条件便跳出循环。

In [31]:
sum = 0
n = 99
while n > 0:
    sum = sum + n
    n = n - 2
print sum

2500


### 数据类型与关系小结

在上面的内容中，大致了解了Python的各类数据类型与基本的if, for, while语句。上述内容最需要注意的是列表的使用方式与Dictionary的使用方式。灵活的使用会让Python的运用得心应手。

## 函数

从某一种角度来说函数也是Python的一种内置类型，而且在Python编程当中有着非常重要的作用，在未来，我们会非常清晰地了解Python中哪里不会import哪里的精彩。

我们可以将一系列的运算在未来抽象到一个函数内，让工作非常容易进行。

Python的内置函数一般来说我们在本节跳过，更多的相关内容可可以在网上查阅。

In [37]:
a = -100
print abs(a)
print abs(1,2)

100


TypeError: abs() takes exactly one argument (2 given)

In [35]:
print abs('a')

TypeError: bad operand type for abs(): 'str'

### 非常重要的内置函数——数据类型转换
在一开始我们引述的过，在Python中的输入尽量使用raw_input，因为对于input而言Python中会自动给你归类他的数值类型，虽然简单，但在Python中并非是好的行为，作为大家更乐意接受的是采用raw_input与数据类型转换的方式进行Python的输入。

In [1]:
a = raw_input('Print a Number')
print a, type(a)
b = float(a)
c = int(a)
print type(b), type(c)

Print a Number23
23 <type 'str'>
<type 'float'> <type 'int'>


### 定义函数

Python中最重要的一种类型之一——函数

In [2]:
def my_abs(x):
    if x >= 0:
        return x
    else:
        return -x

In [3]:
print my_abs(-12)

12


In [4]:
print my_abs(-1) == abs(-1)

True


In [8]:
print my_abs('A')
print abs('A')

A


TypeError: bad operand type for abs(): 'str'

In [9]:
def my_abs(x):
    if not isinstance(x, (int,float)):
        raise TypeError('bad operand type')
    if x >= 0:
        return x
    else:
        return -x

In [10]:
print my_abs('A')

TypeError: bad operand type

In [5]:
def nop():
    pass

#### pass的用法

Pass语句的作用是什么都不做，但在语法结构中，他可以作为一个占位符或者说他能够将代码能够运行起来。在还没想好怎么计算的时候先用pass占位是个不错的选择。能够让语法完整，是Pass的最重要的作用。

In [6]:
age = 21
if age >= 18:
    pass
else:
    print 'you are not allowed'

In [7]:
age = 21
if age >= 18:
else:
    print 'you are not allowed'

IndentationError: expected an indented block (<ipython-input-7-677c42583be2>, line 3)

#### 函数的返回值

In [1]:
import math
def move(x, y, step, angle = 0):
    nx = x + step * math.cos(angle)
    ny = y - step * math.sin(angle)
    return nx, ny

In [2]:
x, y = move(100, 100, 60, math.pi / 6)
print x, y

151.961524227 70.0


In [3]:
r = move(100, 100, 60, math.pi / 6)

In [4]:
print r

(151.96152422706632, 70.0)


### 函数的参数问题
定义函数的时候，我们把参数的名字和位置确定下来，函数的接口定义就完成了。对于函数的调用者来说，只需要知道如何传递正确的参数，以及函数将返回什么样的值就够了，函数内部的复杂逻辑被封装起来，调用者无需了解。

Python的函数定义非常简单，但灵活度却非常大。除了正常定义的必选参数外，还可以使用默认参数、可变参数和关键字参数，使得函数定义出来的接口，不但能处理复杂的参数，还可以简化调用者的代码。
#### 默认参数

In [9]:
def power(x):
    return x * x

In [6]:
print power(15)

225


In [8]:
def power2(x, n):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s

In [11]:
print power2(3, 3)

27


In [12]:
print power(3)
print power2(3,2)
print power2(3)

9
9


TypeError: power2() takes exactly 2 arguments (1 given)

In [13]:
def ower(x, n=2):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s

In [14]:
print ower(3)

9


#### 如何设置默认参数

1. 是必选参数在前，默认参数在后，否则Python的解释器会报错（思考一下为什么默认参数不能放在必选参数前面）；

2. 是如何设置默认参数。

> 当函数有多个参数时，把变化大的参数放前面，变化小的参数放后面。变化小的参数就可以作为默认参数。

> 使用默认参数有什么好处？最大的好处是能降低调用函数的难度。

In [17]:
def enroll(name, gender):
    print 'Name:', name
    print 'Gender:', gender

In [18]:
enroll('John', 'M')

Name: John
Gender: M


In [19]:
def enroll2(name, gender, age=6, city='Beijing'):
    print 'Name:', name
    print 'Gender:', gender
    print 'Age:', age
    print 'City:', city

In [21]:
print enroll2('Bob', 'M', 7),'\n'
print enroll2('Adam', 'M', city='Tianjin')

Name: Bob
Gender: M
Age: 7
City: Beijing
None 

Name: Adam
Gender: M
Age: 6
City: Tianjin
None


In [22]:
def add_end(L=[]):
    L.append('END')
    return L

In [23]:
add_end([1,2,3])

[1, 2, 3, 'END']

In [24]:
add_end()

['END']

In [25]:
add_end()

['END', 'END']

In [27]:
def add_end2(L=None):
    if L is None:
        L = []
    L.append('END')
    return L

In [28]:
add_end2()

['END']

In [29]:
add_end2()

['END']

#### 可变参数
在下面的例子中，我们必须使用tuple或者list作为参数调用，但每次这样总是非常麻烦，因此我们可以用可变参数。

In [1]:
def calc(numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

In [3]:
print calc([1,2,3,4,5,6])
print calc((1,23,4,5,6,7))

91
656


In [4]:
def calc2(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

In [5]:
print calc2(1,3,4,5,6,7)
print calc(1,3,4,5,6,7)

136


TypeError: calc() takes exactly 1 argument (6 given)

#### 可变参数的另一个用法

上述例子已经看到，可以用可变参数让函数调用简化，而下面的例子中则是从另一个方法来简化函数使用

In [7]:
nums = [1, 2, 3]
print calc2(nums[0], nums[1], nums[2])
print calc2(*nums)
print calc2(nums)

14
14


TypeError: can't multiply sequence by non-int of type 'list'

In [8]:
calc(nums)

14

### 关键字参数

* 可变参数
> 允许传入任意个参数，并将这些参数自动组装为一个元组(tuple)

* 关键字参数
> 允许传入人一多个含参数名的参数，并且自动组成一个字典(dict)

In [9]:
def person(name, age, **kw):
    print 'Name:', name, 'Age:', age, 'Other:', kw

In [10]:
person('Michael', 30)

Name: Michael Age: 30 Other: {}


In [11]:
person('Bob', 35, city='Beijing')

Name: Bob Age: 35 Other: {'city': 'Beijing'}


In [12]:
 person('Adam', 45, gender='M', job='Engineer')

Name: Adam Age: 45 Other: {'gender': 'M', 'job': 'Engineer'}


In [13]:
kw = {'city' : 'Beijing', 'job' : 'Engineer'}
print person('Jack', 24, city=kw['city'], job=kw['job'])

Name: Jack Age: 24 Other: {'city': 'Beijing', 'job': 'Engineer'}
None


In [14]:
print person('John', 24, **kw)

Name: John Age: 24 Other: {'city': 'Beijing', 'job': 'Engineer'}
None


### 参数组合问题

在Python中定义函数，可以用必选参数、默认参数、可变参数和关键字参数，这4种参数都可以一起使用，或者只用其中某些。

**注意，参数定义的顺序必须是：必选参数、默认参数、可变参数和关键字参数。**

In [17]:
def func(a, b, c=0, *args, **kw):
    print 'a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw

In [18]:
print func(1,2)
print func(1,2,3)
print func(1,2,3,'a','b')
print func(1,2,3,'a','b', x=99)
print func(1)

a = 1 b = 2 c = 0 args = () kw = {}
None
a = 1 b = 2 c = 3 args = () kw = {}
None
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {}
None
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {'x': 99}
None


TypeError: func() takes at least 2 arguments (1 given)

### 递归函数

**递归函数**：对于某一函数f(x)，其定义域是集合A，那么若对于A集合中的某一个值X0，其函数值f(x0)由f(f(x0))决定，那么就称f(x)为递归函数。

**递归函数**：函数Func(Type a,……)直接或间接调用函数本身，则该函数称为递归函数。

最显然的例子：

$$ f(x) = n! = 1 \times 2 \times 3\times 4\times ...\times n = n \times (n-1)!$$

In [19]:
def fact(n):
    if n == 1:
        return 1
    return n * fact(n-1)

In [20]:
print fact(1)
print fact(2)
print fact(15)

1
2
1307674368000


#### 上述递归函数的优势

从直观来看，上述递归函数的优势便在于定义简单，逻辑十分清晰。即解决了循环的逻辑不如递归的逻辑清晰的问题。

#### 上述递归函数的劣势

递归函数的使用中需要防止的是栈溢出的问题，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就会减一层栈帧。由于栈的大小不是无限的，所以，递归调用的次数过多，会导致栈溢出。

#### 解决栈溢出问题——尾递归

In [22]:
def fact(n):
    return fact_iter(n, 1)

def fact_iter(num, product):
    if num == 1:
        return product
    return fact_iter(num - 1, num * product)

In [23]:
fact_iter(1,120)

120

In [24]:
fact_iter(10,15)

54432000

尾递归调用时，如果做了优化，栈不会增长，因此，无论多少次调用也不会导致栈溢出。

遗憾的是，大多数编程语言没有针对尾递归做优化，Python解释器也没有做优化，所以，即使把上面的fact(n)函数改成尾递归方式，也会导致栈溢出。

**因此，在Python使用中应当尽量避免使用递归函数。**

## Python的高级特性

In [25]:
L = []
n = 1
while n <= 99:
    L.append(n)
    n = n + 2

print L

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99]


In [28]:
LI = range(1, 100, 2)
print LI

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99]


### 切片

**切片** ： 从列表或元组中获取一部分的元素。

In [32]:
L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']
print [L[0], L[1], L[2]]

['Michael', 'Sarah', 'Tracy']


In [31]:
r = []
n = 3
for i in range(n):
    r.append(L[i])
    
print r

['Michael', 'Sarah', 'Tracy']


In [33]:
print L[:3]

['Michael', 'Sarah', 'Tracy']


In [34]:
print L[1:3]

['Sarah', 'Tracy']


In [36]:
print L[-2:]

['Bob', 'Jack']


In [37]:
M = range(100)

In [38]:
M[:10]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [39]:
M[-10:]

[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

In [41]:
M[10:20]

[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

In [42]:
M[:10:2]

[0, 2, 4, 6, 8]

In [43]:
M[::5]

[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]

### 迭代

**迭代**：如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。

从程序的抽象程度来说，Python的迭代抽象程度，比Java的更抽象。因为Python的迭代不仅仅可以在列表、元组中，也可以在其他的可迭代对象上，譬如字符串，字典。

In [44]:
d = {'a':1, 'b':2, 'c':3}
for key in d:
    print key

a
c
b


**默认**情况下，dict迭代的是key。如果要迭代value，**可以用for value in d.itervalues()**，如果要同时迭代key和value，**可以用for k, v in d.iteritems()**。

In [45]:
for c in 'ABC':
    print c

A
B
C


#### 可迭代的判定
从collections模块的Iterable类型判断;

而对于任意可迭代的对象都可以作用于for循环。

In [1]:
from collections import Iterable
isinstance('abc', Iterable) # isinstance是用于检查前者是否是后者实例

True

In [2]:
isinstance([1,2,3],Iterable)

True

In [4]:
isinstance(123,Iterable)

False

In [5]:
for i, value in enumerate(['A','B','C']):
    print i, value

0 A
1 B
2 C


In [6]:
for x, y in [(1, 1), (2, 4), (3, 9)]:
    print x, y

1 1
2 4
3 9


### 列表解析式 List Comprehensions

在不同的翻译环境中有人将List Comprehensions翻译成列表解析式，有人把它翻译为列表生成式。

List Comprehensions在Python中有着非常有效率的作用，非常好用也非常清晰。同时可以用数学的概念清晰地进行表达。而且运用列表解析式能写出非常简洁的代码。

一般来说对于比较简单和在三层以内（不包括三层）还是可以使用的，但对于三层以外就不太适合。

In [7]:
range(1,11)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [8]:
L = []
for x in range(1,11):
    L.append(x * x)
    
print L

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


In [None]:
Y = [x * x for x in range(1, 11)]
print Y

In [9]:
Z = [m + n for m in 'ABC' for n in 'XYZ']
print Z

['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']


In [10]:
import os
[d for d in os.listdir('.')]

['.android',
 '.bash_history',
 '.bokeh',
 '.gitconfig',
 '.ipynb_checkpoints',
 '.ipython',
 '.jupyter',
 '.matplotlib',
 '.spyder2',
 '.ssh',
 'AppData',
 'Application Data',
 'Contacts',
 'Cookies',
 'Desktop',
 'Documents',
 'Links',
 'Local Settings',
 'My Documents',
 'NetHood',
 'NTUSER.DAT',
 'ntuser.dat.LOG1',
 'ntuser.dat.LOG2',
 'NTUSER.DAT{016888bd-6c6f-11de-8d1d-001e0bcde3ec}.TM.blf',
 'NTUSER.DAT{016888bd-6c6f-11de-8d1d-001e0bcde3ec}.TMContainer00000000000000000001.regtrans-ms',
 'NTUSER.DAT{016888bd-6c6f-11de-8d1d-001e0bcde3ec}.TMContainer00000000000000000002.regtrans-ms',
 'ntuser.ini',
 'PrintHood',
 'PyData.ipynb',
 'PythonBasic.ipynb',
 'PythonGit',
 'Python\xd3\xef\xd1\xd4\xbd\xcc\xb3\xcc\xa1\xaa\xa1\xaa\xbf\xce\xb3\xcc1.ipynb',
 'Recent',
 'Saved Games',
 'Searches',
 'SendTo',
 'Templates',
 'wc',
 '\xa1\xb8\xbf\xaa\xca\xbc\xa1\xb9\xb2\xcb\xb5\xa5',
 '\xcd\xb3\xbc\xc6\xcb\xbc\xce\xac.ipynb']

In [12]:
d = {'x':'A', 'y':'B', 'z':'C'}
for k, v in d.iteritems():
    print k, '=', v

y = B
x = A
z = C


In [13]:
L = ['Hello', 'World', 'IBM', 'Apple']
[s.lower() for s in L]

['hello', 'world', 'ibm', 'apple']

### 生成器

通过列表生成式，我们可以直接创建一个列表。但是，**受到内存限制**，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器（Generator）。

In [14]:
g = (x * x for x in range(10))
print g

<generator object <genexpr> at 0x0000000003C86E10>


In [15]:
type(g)

generator

In [16]:
g.next()

0

In [17]:
for n in g:
    print n

1
4
9
16
25
36
49
64
81


一般来说，基本永远不会调用next()，而是通过for循环来迭代它。

Generator非常强大。如果推算的算法比较复杂，用类似列表生成式的for循环无法实现的时候，还可以用函数来实现。

In [19]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        print b
        a, b = b, a + b
        n = n + 1

In [20]:
fib(6)

1
1
2
3
5
8


In [1]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b #定义生成器的另一种方式，利用yield关键字
        a, b = b, a + b
        n = n + 1

In [2]:
fib(6)

<generator object fib at 0x00000000040DAB88>

In [5]:
def odd():
    print 'step 1'
    yield 1
    print 'step 2'
    yield 3
    print 'step 3'
    yield 5

In [6]:
o = odd()

In [7]:
o.next()

step 1


1

In [8]:
o.next()

step 2


3

In [9]:
o.next()

step 3


5

In [10]:
o.next()

StopIteration: 

## Python的函数式编程

1. 函数式编程很抽象，相对于普通编程她更接近于数学中的概念
2. 编程语言的高级程度与抽象程度成正比与运行效率成反比
3. （无副作用）纯粹的函数式编程语言编写的函数没有变量，因此，任意一个函数，只要输入是确定的，输出就是确定的
4. （有副作用）允许使用变量的程序设计语言，由于函数内部的变量状态不确定，同样的输入，可能得到不同的输出
5. 特点：允许把函数本身作为参数传入另一个函数，还允许返回一个函数

Python部分支持函数式编程，若要研究函数式编程则请学习Haskell

### 高阶函数
高阶函数事实上就是函数里套函数。如同求导一次称为一阶导数，两次称为二阶导数一般。

In [11]:
abs

<function abs>

In [12]:
f = abs
print type(f)

<type 'builtin_function_or_method'>


In [13]:
f(-10)

10

In [14]:
def add(x, y, f):
    return f(x) + f(y)

In [15]:
add(-5, 6, abs)

11

###  返回函数

In [16]:
def calc_sum(*args):
    ax = 0
    for n in args:
        ax = ax + n
    return ax

In [18]:
calc_sum(1,2,3,4,5)

15

In [19]:
def lazy_sum(*args):
    def sum():
        ax = 0
        for n in args:
            ax = ax + n
        return ax
    return sum

In [20]:
f = lazy_sum(1,3,45,6,7)

In [21]:
f()

62

In [22]:
f1 = lazy_sum(1,2,3,4,5)
f2 = lazy_sum(1,2,3,4,5)
f1 == f2

False

In [23]:
def count():
    fs = []
    for i in range(1, 4):
        def f():
            return i * i
        fs.append(f)
    return fs

f1, f2, f3 = count()

In [24]:
print f1(), f2(), f3()

9 9 9


全部都是9！原因就在于返回的函数引用了变量i，但它并非立刻执行。等到3个函数都返回时，它们所引用的变量i已经变成了3，因此最终结果为9。

返回闭包时牢记的一点就是：返回函数不要引用任何循环变量，或者后续会发生变化的变量。

如果一定要引用循环变量怎么办？方法是再创建一个函数，用该函数的参数绑定循环变量当前的值，无论该循环变量后续如何更改，已绑定到函数参数的值不变：



In [25]:
def count():
    fs = []
    for i in range(1, 4):
        def f(j):
            def g():
                return j * j
            return g
        fs.append(f(i))
    return fs

In [26]:
f1, f2, f3 = count()
print f1(), f2(), f3()

1 4 9


### 大名鼎鼎的LAMBDA函数

LAMBDA函数又称为匿名函数，是非常重要的一个函数思想，在Python中对其有部分的支持，利用lambda函数可以让编程变得非常简单。但过度利用会造成一定的代码阅读问题，在对于建设一定工程的时候可以利用lambda函数。

In [27]:
def f(x):
    return x * x

In [28]:
y = lambda x : x * x

In [29]:
print f(10), y(10)

100 100


In [30]:
def build(x):
    return lambda: x * x

In [31]:
build(10)

<function __main__.<lambda>>

In [32]:
build(10)()

100

### 处理大数据中的MR

Map/Reduce 这一概念的最重要的意义从[MapReduce: Simplified Data Processing on Large Clusters](http://research.google.com/archive/mapreduce.html)就能知道；用最简单的方式来说明便是MR可以快速处理数据格式问题以开始数据处理。
#### map

同时map也能够作用于每一个元素上：

我们可以看一下实现 $$ f(x) = x^{2} $$
![](http://www.liaoxuefeng.com/files/attachments/0013879622109990efbf9d781704b02994ba96765595f56000/0)

In [33]:
y = lambda x: x * x
map(y,[1,2,3,4,5,6,7,8,9])

[1, 4, 9, 16, 25, 36, 49, 64, 81]

In [34]:
map(str, [1,2,3,4,5,6,7,88])

['1', '2', '3', '4', '5', '6', '7', '88']

#### reduce
reduce把一个函数作用在一个序列[x1, x2, x3...]上，这个函数必须接收两个参数，reduce把结果继续和序列的下一个元素做累积计算

In [35]:
z = lambda x, y: x + y
reduce(z,[1,3,5,7,9])

25

In [37]:
a = lambda x, y: x * 10 + y
reduce(a, [1,3,5,6,8])

13568

In [41]:
def char2num(s):
    return {'0':0, '1':1, '2':2}[s]
reduce(a, map(char2num,'21221'))

21221

In [43]:
c = lambda x, y: x * y
reduce(c, [1,3,4,5,6,7,8,8,9])

1451520