# Python程序设计介绍

## Python 程序文件

* Python 代码的后缀为"`.py`":

        myprogram.py

* Python 代码的每一行为一条 Python 语句，或者是其中的一部分。

    * 注释行是例外，它以字符`#`开头。注释行会被 Python 解释器忽略。


* 可以从命令行中运行 Python 程序：

        $ python myprogram.py

* 在 UNIX 系统中，经常在在程序的第一行指定解释器的路径：

        #!/usr/bin/env python

  这样，我们可以在命令行中直接运行程序：

        $ myprogram.py

### 例：

In [5]:
ls scripts/hello-world*.py

scripts/hello-world-in-swedish.py  scripts/hello-world.py


In [6]:
cat scripts/hello-world.py

#!/usr/bin/env python

print("Hello world!")


In [7]:
!python scripts/hello-world.py

Hello world!


### 字符编码

标准的字符编码是 ASCII，但也可以使用任何其他的编码，如 `UTF-8`。 为指定`UTF-8`可用，可在`py`文件头部加入特殊行：

    # -*- coding: UTF-8 -*-


In [9]:
cat scripts/hello-world-in-swedish.py

#!/usr/bin/env python
# -*- coding: UTF-8 -*-

print("Hej världen!")


In [10]:
!python scripts/hello-world-in-swedish.py

Hej världen!


除了在Python代码文件开头处使用两种**备选**行，初始化程序不需要额外的代码。

## 模块

Python的大部分功能由**模块**提供。Python 标准库为由很多模块构成的集合，提供了诸如访问操作系统、文件I/O、字符串管理、网络通信等常用功能的**跨平台**实现。

### References

 * The Python Language Reference: http://docs.python.org/2/reference/index.html
 * The Python Standard Library: http://docs.python.org/2/library/

在 Python 程序中使用一个模块，首先需要载入它。可使用命令 `import` 来载入一个模块。
例如，想载入模块 `math` (包含了很多标准的数学函数)，可以这么做：

In [11]:
import math

这包含了整个模块，在后面的程序它变得可用。

In [12]:
import math

x = math.cos(2 * math.pi)

print(x)

1.0


也可将一个模块中的所有符号（函数和变量）全部载入到当前的命名空间（这样就没有必要每次使用相关命令时使用前缀 "`math.`"）。

In [13]:
from math import *

x = cos(2 * pi)

print(x)

1.0


这种风格非常方便，但在大型程序中建议使用`import math` 风格，这样可以消除命名空间冲突的现象。

第三种选择是从一个模块中显式地载入一些符号：

In [14]:
from math import cos, pi

x = cos(2 * pi)

print(x)

1.0


### 查看一个模块中包含的内容以及文档

一旦模块被加载，可以使用函数 `dir` 列出该模块提供的符号：

In [15]:
import math

print(dir(math))

['__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'copysign', 'cos', 'cosh', 'degrees', 'e', 'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'pi', 'pow', 'radians', 'remainder', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'tau', 'trunc']


可使用函数 `help` 来查看每个函数的描述（大部分的... 并不是所有的函数都有 `docstrings`，但大部分的函数都有这样的文档）

In [16]:
help(math.log)

Help on built-in function log in module math:

log(...)
    log(x, [base=math.e])
    Return the logarithm of x to the given base.
    
    If the base not specified, returns the natural logarithm (base e) of x.



In [17]:
log(10)

2.302585092994046

In [19]:
log(10, 2)

3.3219280948873626

也可使用直接对模块使用函数 `help` 。试一下

    help(math) 

构成 Python 标准库的一些常用模块有：

* `os`
* `sys`
* `math`
* `shutil`
* `re`
* `subprocess`
* `multiprocessing`
* `threading`. 

Python3 标准模块的完整列表见 http://docs.python.org/3/library/。

## 变量与类型

### 符号名称

Python 的变量名包含字母 `a-z`, `A-Z`，数字 `0-9`和诸如 `_` 的特殊字符。一般的变量名以字母开头。

按惯例，变量名以小写字母开头，类名以大写字母开头。

另外，一些 Python 关键字不能作为变量名：

    and, as, assert, break, class, continue, def, del, elif, else, except, 
    exec, finally, for, from, global, if, import, in, is, lambda, not, or,
    pass, print, raise, return, try, while, with, yield

### 赋值

Python 的赋值运算符为 `=`。Python为动态类型语言，故我们不需要在创建变量时指定其类型。

给一个变量赋值将创建该变量：

In [21]:
# variable assignments
x = 1.0
my_variable = 12.2

虽然没有显式指定，但变量有相关的数据类型。其类型由所赋的值来确定。

In [22]:
type(x)

float

如果给该变量赋一个新的值，其类型也发生改变：

In [23]:
x = 1

In [24]:
type(x)

int

如果试图去使用一个未被定义的变量，将会报出一个`NameError`:

In [25]:
print(y)

NameError: name 'y' is not defined

### 基本数据类型

In [26]:
# integers
x = 1
type(x)

int

In [27]:
# float
x = 1.0
type(x)

float

In [28]:
# boolean
b1 = True
b2 = False

type(b1)

bool

In [29]:
# complex numbers: note the use of `j` to specify the imaginary part
x = 1.0 - 1.0j
type(x)

complex

In [30]:
print(x)

(1-1j)


In [31]:
print(x.real, x.imag)

1.0 -1.0


### 类型实用函数

模块 `types` 包含一系列类型名的定义，可用于测试某些变量是哪些类型：

In [32]:
import types

# print all types defined in the `types` module
print(dir(types))

['AsyncGeneratorType', 'BuiltinFunctionType', 'BuiltinMethodType', 'ClassMethodDescriptorType', 'CodeType', 'CoroutineType', 'DynamicClassAttribute', 'FrameType', 'FunctionType', 'GeneratorType', 'GetSetDescriptorType', 'LambdaType', 'MappingProxyType', 'MemberDescriptorType', 'MethodDescriptorType', 'MethodType', 'MethodWrapperType', 'ModuleType', 'SimpleNamespace', 'TracebackType', 'WrapperDescriptorType', '_GeneratorWrapper', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', '_ag', '_calculate_meta', 'coroutine', 'new_class', 'prepare_class', 'resolve_bases']


In [33]:
x = 1.0

# check if the variable x is a float
type(x) is float

True

In [34]:
# check if the variable x is an int
type(x) is int

False

也可使用 `isinstance`  方法来测试变量的类型：

In [35]:
isinstance(x, float)

True

### 类型转换 (type casting)

In [36]:
x = 1.5

print(x, type(x))

1.5 <class 'float'>


In [37]:
x = int(x)

print(x, type(x))

1 <class 'int'>


In [38]:
z = complex(x)

print(z, type(z))

(1+0j) <class 'complex'>


In [39]:
x = float(z)

TypeError: can't convert complex to float

复变量不能转换成浮点型或整型。需要使用 `z.real` 或 `z.imag` 来提取复数的实部或虚部：

In [44]:
y = bool(z.real)

print(z.real, " -> ", y, type(y))

y = bool(z.imag)

print(z.imag, " -> ", y, type(y))

1.0  ->  True <class 'bool'>
0.0  ->  False <class 'bool'>


## 运算符和比较



* 算术运算符 `+`, `-`, `*`, `/`, `//` (整数除法), '**' power


In [34]:
1 + 2, 1 - 2, 1 * 2, 1 / 2

(3, -1, 2, 0)

In [35]:
1.0 + 2.0, 1.0 - 2.0, 1.0 * 2.0, 1.0 / 2.0

(3.0, -1.0, 2.0, 0.5)

In [36]:
# Integer division of float numbers
3.0 // 2.0

1.0

In [37]:
# Note! The power operators in python isn't ^, but **
2 ** 2

4

注意：在 Python 3.x 中，`/` 运算符总是执行浮点型除法运算。

* 布尔运算符： `and`, `not`, `or`. 

In [38]:
True and False

False

In [39]:
not False

True

In [40]:
True or False

True

* 比较运算符`>`, `<`, `>=` (greater or equal), `<=` (less or equal), `==` equality, `is` identical.

In [41]:
2 > 1, 2 < 1

(True, False)

In [42]:
2 > 2, 2 < 2

(False, False)

In [43]:
2 >= 2, 2 <= 2

(True, True)

In [44]:
# equality
[1,2] == [1,2]

True

In [45]:
# objects identical?
l1 = l2 = [1,2]

l1 is l2

True

## 复合类型：字符串、列表和字典

### 字符串

字符串为用存储文本信息的变量类型：

In [48]:
s = "Hello world"
type(s)

str

In [49]:
# length of the string: the number of characters
len(s)

11

In [50]:
# replace a substring in a string with something else
s2 = s.replace("world", "test")
print(s2)

Hello test


可使用 `[]` 来访问字符:

In [51]:
s[0]

'H'

**致 MATLAB 用户**：下标从0开始！！！

可使用语法 `[start:stop]` 来提取字符串的一部分，它提取下标位于 `start` 与 `stop` -1之间的字符（不包含下标为 `index` 的字符）。


In [52]:
s[0:5]

'Hello'

In [53]:
s[4:5]

'o'

若缺省 `[start:stop]` 中的 `start` 或 `stop`（或两者），则它们的默认值分别是字符串的首尾。

In [52]:
s[:5]

'Hello'

In [53]:
s[6:]

'world'

In [54]:
s[:]

'Hello world'

可使用语法 `[start:end:step]` 来定义步长（如上，`step`的默认值为1）。

In [54]:
s[::1]

'Hello world'

In [55]:
s[::2]

'Hlowrd'

该技术称为 **切片 (slicing)**。 更多详情参见 http://docs.python.org/release/2.7.3/library/functions.html?highlight=slice#slice

Python有丰富的文本处理函数，参见 http://docs.python.org/2/library/string.html。

#### 字符串格式举例

In [57]:
print("str1", "str2", "str3")  # The print statement concatenates strings with a space

('str1', 'str2', 'str3')


In [58]:
print("str1", 1.0, False, -1j)  # The print statements converts all arguments to strings

('str1', 1.0, False, -1j)


In [59]:
print("str1" + "str2" + "str3") # strings added with + are concatenated without space

str1str2str3


In [60]:
print("value = %f" % 1.0)       # we can use C-style string formatting

value = 1.000000


In [61]:
# this formatting creates a string
s2 = "value1 = %.2f. value2 = %d" % (3.1415, 1.5)

print(s2)

value1 = 3.14. value2 = 1


In [62]:
# alternative, more intuitive way of formatting a string 
s3 = 'value1 = {0}, value2 = {1}'.format(3.1415, 1.5)

print(s3)

value1 = 3.1415, value2 = 1.5


### 列表

列表与字符串非常类似，不同之处在于其元素可以是任意类型。

Python 中创建列表的语法为 `[...]`:

In [58]:
l = [1,2,3,4]

print(type(l))
print(l)

<class 'list'>
[1, 2, 3, 4]


切片操作

In [59]:
print(l)

print(l[1:3])

print(l[::2])

[1, 2, 3, 4]
[2, 3]
[1, 3]


**致 MATLAB 用户：** 下标从0开始

In [60]:
l[0]

1

列表中的元素不必是相同类型：

In [61]:
l = [1, 'a', 1.0, 1-1j]

print(l)

[1, 'a', 1.0, (1-1j)]


Python 列表中的元素可以类型不同且允许任意嵌套：

In [62]:
nested_list = [1, [2, [3, [4, [5]]]]]

nested_list

[1, [2, [3, [4, [5]]]]]

列表在 Python 中骑着非常重要的作用。它们常用于循环和其他一些控制结构中。

有很多方便实用的函数可用于生成不同类型的列表，比如 `range` 函数：

In [66]:
start = 10
stop = 30
step = 2

range(start, stop, step)

range(10, 30, 2)

In [69]:
# in python 3 range generates an iterator, which can be converted to a list using 'list(...)'.
# It has no effect in python 2
list(range(start, stop, step))

[10, 12, 14, 16, 18, 20, 22, 24, 26, 28]

In [70]:
list(range(-10, 10))

[-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [67]:
s

'Hello world'

In [72]:
# convert a string to a list by type casting:
s2 = list(s)

s2

['H', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd']

In [73]:
# sorting lists
s2.sort()

print(s2)

[' ', 'H', 'd', 'e', 'l', 'l', 'l', 'o', 'o', 'r', 'w']


#### 从列表中增加、插入、修改和删除元素

In [80]:
# create a new empty list
l = []

# add an elements using `append`
l.append("A")
l.append("d")
l.append("d")

print(l)

['A', 'd', 'd']


In [4]:
list1 = [1, 2, 3, 4]
list2 =[11,22,33,44]
list1+list2

[1, 2, 3, 4, 11, 22, 33, 44]

对元素赋新值将修改列表。用专业术语来讲的话，列表是**可变（mutable）**的。

In [81]:
l[1] = "p"
l[2] = "p"

print(l)

['A', 'p', 'p']


In [82]:
l[1:3] = ["d", "d"]

print(l)

['A', 'd', 'd']


在指定下标处插入元素请使用  `insert`

In [83]:
l.insert(0, "i")
l.insert(1, "n")
l.insert(2, "s")
l.insert(3, "e")
l.insert(4, "r")
l.insert(5, "t")

print(l)

['i', 'n', 's', 'e', 'r', 't', 'A', 'd', 'd']


删除指定值的第一个元素请使用 `remove`

In [84]:
l.remove("A")

print(l)

['i', 'n', 's', 'e', 'r', 't', 'd', 'd']


删除指定位置的元素请用 `del`:

In [85]:
del l[7]
del l[6]

print(l)

['i', 'n', 's', 'e', 'r', 't']


更多详情请输入 `help(list)` ，或阅读在线文档。

In [13]:
dir(list)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

### 元组（Tuples）

元组非常像列表，不同之处在于元组一旦被创建将不可修改，因此它是**不可变（immutable）**的。

在 Python 中，用 `(..., ..., ...)` 甚至是 `..., ...` 创建元组。

In [86]:
point = (10, 20)

print(point, type(point))

(10, 20) <class 'tuple'>


In [87]:
point = 10, 20

print(point, type(point))

(10, 20) <class 'tuple'>


可将一个元组赋值给逗号分开的变量列表，从而实现元组的解包（unpack）：


In [88]:
x, y = point

print("x =", x)
print("y =", y)

x = 10
y = 20


尝试对元组的元素赋值将报错：

In [89]:
point[0] = 20

TypeError: 'tuple' object does not support item assignment

### 字典（Dictionaries）

字典也像列表，不同之处在于其元素为键值对（`key-value pair`）。

字典的语法为： `{key1 : value1, ...}`

In [92]:
params = {
    "parameter1" : 1.0,
    "parameter2" : 2.0,
    "parameter3" : 3.0,
}

print(type(params))
print(params)

<class 'dict'>
{'parameter1': 1.0, 'parameter2': 2.0, 'parameter3': 3.0}


In [93]:
print("parameter1 = " + str(params["parameter1"]))
print("parameter2 = " + str(params["parameter2"]))
print("parameter3 = " + str(params["parameter3"]))

parameter1 = 1.0
parameter2 = 2.0
parameter3 = 3.0


In [94]:
params["parameter1"] = "A"
params["parameter2"] = "B"

# add a new entry
params["parameter4"] = "D"

print("parameter1 = " + str(params["parameter1"]))
print("parameter2 = " + str(params["parameter2"]))
print("parameter3 = " + str(params["parameter3"]))
print("parameter4 = " + str(params["parameter4"]))

parameter1 = A
parameter2 = B
parameter3 = 3.0
parameter4 = D


## 控制流（control flow）

### 条件语句（conditional statement）： if, elif, else

使用关键字 `if`, `elif` (else if), `else` 来实现分支结构：

In [95]:
statement1 = False
statement2 = False

if statement1:
    print("statement1 is True")
    
elif statement2:
    print("statement2 is True")
    
else:
    print("statement1 and statement2 are False")

statement1 and statement2 are False


Python 的特殊之处：语句块通过缩进来定义。

与 C 代码进行比较：

    if (statement1)
    {
        printf("statement1 is True\n");
    }
    else if (statement2)
    {
        printf("statement2 is True\n");
    }
    else
    {
        printf("statement1 and statement2 are False\n");
    }

在C中，语句块通过花括号 `{` 和 `}`来定义。缩进多少并不重要。

但是在 Python 中，代码块由缩进确定，这意味着我们必须注意正确的缩进，否则程序将会报错。

#### 举例

In [16]:
statement1 = statement2 = True

if statement1:
    if statement2:
        print("both statement1 and statement2 are True")

both statement1 and statement2 are True


In [17]:
# Bad indentation!
if statement1:
    if statement2:
        pass
    print("both statement1 and statement2 are True")  # this line is not properly indented

both statement1 and statement2 are True


In [99]:
statement1 = False 

if statement1:
    print("printed if statement1 is True")
    
    print("still inside the if block")

In [100]:
if statement1:
    print("printed if statement1 is True")
    
print("now outside the if block")

now outside the if block


## 循环（Loops）

在 Python 中，循环有几种不同的方式。最常用的是 `for` 循环，它常与可迭代对象（如列表）一起使用。 

### **`for` 循环**:

In [101]:
for x in [1,2,3]:
    print(x)

1
2
3


`for` 循环遍历列表中的每个元素，且对每个元素都执行一次循环体。任意列表都可使用 `for` 循环。如：

In [20]:
for x in range(1,4,2): # by default range start at 0
    print(x)

1
3


注意： `range(4)` 不包含4 !

In [103]:
for x in range(-3,3):
    print(x)

-3
-2
-1
0
1
2


In [104]:
for word in ["scientific", "computing", "with", "python"]:
    print(word)

scientific
computing
with
python


遍历字典中的键值对：

In [106]:
for key, value in params.items():
    print(key + " = " + str(value))

parameter1 = A
parameter2 = B
parameter3 = 3.0
parameter4 = D


有时候，遍历一个列表时，访问每个元素的下标也非常重要。可使用函数 `enumerate` 来实现：

In [21]:
for index, x in enumerate([1, 2, 3, 4, 5]):
    print(index, x)

0 1
1 2
2 3
3 4
4 5


### 列表生成式（List comprehensions）：使用 `for` 循环创建列表

初始化列表的一种便捷且紧凑的方式：

In [29]:
l1 = [x**2 for x in range(0,10) if x % 2 == 0]

print(l1)

[0, 4, 16, 36, 64]


### `while` 循环:

In [110]:
i = 0

while i < 5:
    print(i)
    
    i = i + 1
    
print("done")

0
1
2
3
4
done


注意：语句 `print("done")` 不是循环的一部分。

## 函数（Functions）

Python 中，使用关键字 `def ` 来定义函数。`def ` 后跟函数名，圆括号`()`，以及冒号`:`，其中圆括号中为函数参数。

以下代码中，缩进的部分为函数体。

In [42]:
def sum(a, b):   
    """
    compute the sum of a and b
    
    Params
    ------
    a, b:  two objects, which can be numbers, lists, strings, ...
    
    Result:
    ------
    output: the sum
    """
    return a + b

In [43]:
help(sum)

Help on function sum in module __main__:

sum(a, b)
    compute the sum of a and b
    
    Params
    ------
    a, b:  two objects, which can be numbers, lists, strings, ...
    
    Result:
    ------
    output: the sum



你可选择（但强烈推荐）定义所谓的 "文档字符串（docstring）"，来描述函数的目的和行为。
文档字符串应位于函数头之后，函数体之前：


In [113]:
def func1(s):
    """
    Print a string 's' and tell how many characters it has    
    """
    
    print(s + " has " + str(len(s)) + " characters")

In [114]:
help(func1)

Help on function func1 in module __main__:

func1(s)
    Print a string 's' and tell how many characters it has



In [115]:
func1("test")

test has 4 characters


函数使用关键字  `return` 返回一个值。

In [116]:
def square(x):
    """
    Return the square of x.
    """
    return x ** 2

In [117]:
square(4)

16

可使用元组从函数中返回多个值：

In [119]:
def powers(x):
    """
    Return a few powers of x.
    """
    return x ** 2, x ** 3, x ** 4

In [120]:
powers(3)

(9, 27, 81)

In [121]:
x2, x3, x4 = powers(3)

print(x3)

27


### 默认参数（Default argument）与关键字参数（keyword arguments）

在函数定义中，可给定参数的默认值：

In [122]:
def myfunc(x, p=2, debug=False):
    if debug:
        print("evaluating myfunc for x = " + str(x) + " using exponent p = " + str(p))
    return x**p

调用函数 `myfunc` 时，如果没有提供参数 `debug` 的值，将会使用函数定义中给定的默认值：

In [123]:
myfunc(5)

25

In [124]:
myfunc(5, debug=True)

evaluating myfunc for x = 5 using exponent p = 2


25

在函数调用时，如果我们显式地给定参数的名称，则它们不必与函数定义中的顺序一致。这称为**关键字**参数，当函数有可选参数时它非常有用。

In [125]:
myfunc(p=3, debug=True, x=7)

evaluating myfunc for x = 7 using exponent p = 3


343

### 匿名函数（Unnamed functions ）- lambda函数(lambda function)

在 Python 中可以使用关键字 `lambda` 创建匿名函数

In [126]:
f1 = lambda x: x**2
    
# is equivalent to 

def f2(x):
    return x**2

In [115]:
f1(2), f2(2)

(4, 4)

如果想传递一个简单函数给另一个函数作为其参数时，该技术很有用。

In [129]:
# map is a built-in python function
map(lambda x: x**2, range(-3,4))

<map at 0x10d22bbe0>

In [130]:
# in python 3 we can use `list(...)` to convert the iterator to an explicit list
list(map(lambda x: x**2, range(-3,4)))

[9, 4, 1, 0, 1, 4, 9]

## 模块（Modules）

在程序开发过程中，随着代码越写越多，在一个文件里代码就会越来越长，越来越不容易维护。

为了编写可维护的代码，我们把很多函数分组，分别放到不同的文件里。
这样，每个文件包含的代码就相对较少，很多编程语言都采用这种组织代码的方式。
在Python中，一个 `.py` 文件就称之为一个模块（Module）。


**使用模块有什么好处?**

* 大大提高了代码的可维护性。


* 编写代码不必从零开始。当一个模块编写完毕，就可以被其他地方引用。
   * 编程时，会经常引用其他模块，包括Python内置的模块和来自第三方的模块。
    
    
* 使用模块还可以避免函数名和变量名冲突。

   * 同名函数和变量可以存在于不同模块中。因此，在编写模块时，不必考虑名字会与其他模块冲突。
   * 但请注意，尽量不要与内置函数名字冲突。 

例：文件 `mymodule.py` 包含一个变量、一个函数和一个类的实现。

In [138]:
"""
Example of a python module. Contains a variable called my_variable,
a function called my_function, and a class called MyClass.
"""

my_variable = 0

def my_function():
    """
    Example function
    """
    return my_variable
    
class MyClass:
    """
    Example class.
    """

    def __init__(self):
        self.variable = my_variable
        
    def set_variable(self, new_value):
        """
        Set self.variable to a new value
        """
        self.variable = new_value
        
    def get_variable(self):
        return self.variable

可使用 `import` 加载模块 `mymodule`：

In [139]:
import mymodule

使用 `help(module)` 来获取该模块的概要：

In [140]:
help(mymodule)

Help on module mymodule:

NAME
    mymodule

DESCRIPTION
    Example of a python module. Contains a variable called my_variable,
    a function called my_function, and a class called MyClass.

CLASSES
    builtins.object
        MyClass
    
    class MyClass(builtins.object)
     |  Example class.
     |  
     |  Methods defined here:
     |  
     |  __init__(self)
     |      Initialize self.  See help(type(self)) for accurate signature.
     |  
     |  get_variable(self)
     |  
     |  set_variable(self, new_value)
     |      Set self.variable to a new value
     |  
     |  ----------------------------------------------------------------------
     |  Data descriptors defined here:
     |  
     |  __dict__
     |      dictionary for instance variables (if defined)
     |  
     |  __weakref__
     |      list of weak references to the object (if defined)

FUNCTIONS
    my_function()
        Example function

DATA
    my_variable = 0

FILE
    /Users/xpzhang/workspace/teach/1

In [141]:
mymodule.my_variable

0

In [142]:
mymodule.my_function() 

0

In [143]:
my_class = mymodule.MyClass() 
my_class.set_variable(10)
my_class.get_variable()

10

## 面向对象编程 

面向对象编程——Object Oriented Programming，简称OOP，是一种程序设计思想。

OOP把对象作为程序的基本单元，一个对象包含了数据和操作数据的函数。

* **面向过程**的程序设计把程序视为一系列的命令集合，即一组函数的顺序执行。为了简化程序设计，面向过程把函数继续切分为子函数，即把大块函数通过切割成小块函数来降低系统的复杂度。


* **面向对象**的程序设计把程序视为一组对象的集合，而每个对象都可以接收其他对象发过来的消息，并处理这些消息，计算机程序的执行就是一系列消息在各个对象之间传递。

以下举例说明面向过程与面向对象在程序设计中的不同之处。


假设要处理学生的成绩表，为了表示一个学生的成绩，面向对象的程序可用一个 `dict` 表示：

In [3]:
std1 = {'name': 'Michael', 'score': 98}
std2 = {'name': 'John', 'score': 90}

而处理学生成绩可通过函数来实现，比如打印学生的成绩：

In [5]:
def print_score(std):
    print('%s: %s' % (std['name'], std['score']))
    
print_score(std1)
print_score(std2)

Michael: 98
John: 90


如果采用面向对象的程序设计思想，首先考虑的不是程序的执行流程，而是定义一个`Student`类来表示学生，它有两个属性：`name` 和 `score`。

如果要打印一个学生的成绩，首先必须先创建这个学生对应的对象，然后给对象发送一个 `print_score`消息，让对象自己把自己的成绩打印出来。

In [10]:
class Student(object):
    
    def __init__(self, name, score):
        self.name = name
        self.score = score
        
    def print_score(self):
        print('%s: %s' % (self.name, self.score))

给定对象发送消息实际上就是调用对象的方法(method)。

In [11]:
std1 = Student('Michael', 98)
std2 = Student('John', 90)
std1.print_score()
std2.print_score()

Michael: 98
John: 90


面向对象的设计思想来源于自然界，因为在自然界中，类(Class)和实例(Instance)的概念是很自然的。

* 类（Class）是一个抽象概念，比如我们定义的 `Student`，是指学生这个概念。


* 实例（Instance）是一个个具体的学生。

因此，面向对象的设计思想是先抽象出`Class`，然后根据它来创建`Instance`。

面向对象的抽象程度高于函数，因为一个Class既包含数据，又包含操作数据的方法。

### 类（Class）和实例（Instance） 

面向对象最重要的概念就是类（Class）和实例（Instance）。必须牢记：

* 类是抽象的模板，比如Student类


* 实例是根据类创建出来的一个个具体的“对象”，每个对象都拥有相同的方法，但各自的数据可能不同。

仍以Student类为例，在Python中，用关键字 `class` 来定义类：

In [12]:
class Student(object):
    pass

`class` 后紧跟类名 `Student`，类名通常以大写字母开头，紧接着是 `(object)`，表示该类是从哪个类继承下来的。

定义好了 `Student` 类，就可以根据它来创建实例：

In [17]:
std1 = Student()
std2 = Student()
print(std1)
print(std2)
print(Student)

<__main__.Student object at 0x7fb32405fba8>
<__main__.Student object at 0x7fb32405fb70>
<class '__main__.Student'>


可以看到，变量 `std1` 指向的是一个 `Student` 的实例，后面的 `0x7fb32405f5c0` 是内存地址，每个 object 的地址都不一样，而 `Student` 本身则是一个类。

可以自由地给一个实例变量绑定一个属性，如：

In [15]:
std1.name = 'Michael'
print(std1.name)

Michael


由于类可以起到模板的作用，在定义类时可用特殊方法 `__init__` 把一些认为必须绑定的属性强制添加进去。

In [19]:
class Student(object):
    
    def __init__(self, name, score):
        self.name = name
        self.score = score

**注意：** `__init__` 方法的第一个参数永远是 `self`，表示创建的实例本身。因此，在 `__init__` 方法内部，可以把各种属性绑定到 `self`。

有了 `__init__` 方法，创建实例时就不能传入空的参数了，必须传入与 `__init__` 方法匹配的参数，但 `self` 不需要传， Python 解释器自己会把实例变量传进去：

In [22]:
std1 = Student('Michael', 91)
print(std1.name, std1.score)

Michael 91


#### 类方法与普通函数的比较

仅有一点不同，即类方法的第一个参数永远是实例变量 `self`，且在调用时不用传递该参数。

#### 数据封装 

面向对象编程的一个重要特点是数据封装。

在上面的 `Student` 类中，每个实例就拥有各自的 `name` 和 `score` 这些数据。我们可以通过函数来访问这些数据，比如打印一个学生的成绩：

In [23]:
def print_score(std):
    print('%s: %s' % (std.name, std.score))
    
print_score(std1)

Michael: 91


但是，既然`Student`实例本身就拥有这些数据，要访问这些数据，就没有必要从外面的函数去访问，可以直接在`Student`类的内部定义访问数据的函数，这样，就把“数据”给封装起来了。

这些封装数据的函数是和`Student`类本身是关联起来的，我们称之为类的方法：

In [26]:
class Student(object):
    
    def __init__(self, name, score):
        self.name = name
        self.score = score
    
    def print_score(self):
        print('%s: %s' % (self.name, self.score))

std1 = Student('Michael', 91)
std1.print_score()

Michael: 91


从外部看`Student`类，只需知道，创建实例需要给出`name`和`score`，而如何打印，都是在`Student`类的内部定义的。
这些数据和逻辑被“封装”起来了，调用很容易，但却不用知道内部实现的细节。

封装的另一个好处是可以给类增加新的方法，比如在`Student`类中增加方法`get_grade`和`print_grade`：

In [29]:
class Student(object):
    
    def __init__(self, name, score):
        self.name = name
        self.score = score
    
    def print_score(self):
        print('%s: %s' % (self.name, self.score))
        
    def get_grade(self):
        if self.score >= 90:
            return 'A'
        elif self.score >= 60:
            return 'B'
        else:
            return 'C'

    def print_grade(self):
        print('%s: %s' % (self.name, self.get_grade()))
        
std1 = Student('Michael', 91)
std2 = Student('John', 80)
std1.print_grade()
std2.print_grade()

Michael: A
John: B


### 访问限制 

在Class内部，可以有属性和方法，而外部代码可以通过直接调用实例变量的方法来操作数据，这样，就隐藏了内部的复杂逻辑。

但是，对于上述定义的`Student`类，外部代码还是可以修改其实例的`name`和`score`属性：

In [31]:
std1 = Student('Michael', 91)
std1.score

91

In [32]:
std1.score = 99
std1.score

99

如果希望内部属性不被外部访问，可在属性名前加上两根下划线`__`。在Python中，**实例的变量名以`__`开头，则它为私有变量，只能在类的内部访问，外部不能访问。**

In [None]:
class Student(object):
    def __init__(self, name, score):
        self.__name = name
        self.__score = score
        
    def print_score(self):
        print('%s: %s' % (self.__name, self.__score))

std1 = Student('Michael', 91)
print(std1.__name)

这就确保了外部代码不能随意修改对象内部的状态，使得代码更健壮。

**如果外部代码想获取`name`和`score`，该怎么办？**

可给`Student`类增加`get_name`和`get_score`等方法：

In [36]:
class Student(object):
    def __init__(self, name, score):
        self.__name = name
        self.__score = score
        
    def print_score(self):
        print('%s: %s' % (self.__name, self.__score))

    def get_name(self):
        return self.__name
    
    def get_score(self):
        return self.__score
        
std1 = Student('Michael', 91)
print(std1.get_name())

Michael


**如果允许外部代码修改`score`，该怎么办？**

可给`Student`类增加`set_score`方法：

In [41]:
class Student(object):
    def __init__(self, name, score):
        self.__name = name
        self.__score = score
        
    def print_score(self):
        print('%s: %s' % (self.__name, self.__score))

    def get_name(self):
        return self.__name
    
    def get_score(self):
        return self.__score
    
    def set_score(self, score):
        if 0 <= score <= 100:
            self.__score = score
        else:
            raise ValueError('bad score')
        
std1 = Student('Michael', 91)
std1.set_score(100)
std1.print_score()

Michael: 100


这种处理方法允许对参数做检查，避免传入无效的参数。

##### 变量名命名方式 

* `__name`：表示私有变量
  * 只能内部访问
     
     
* `_name`：外部可以访问
  * 但是，按照约定俗称的规定，看到这样的变量时，其意思是“虽然我可以被访问，但请把视为私有变量，不要随意访问”


* `__name__`：特殊变量。
  * 特殊变量可以直接访问，不是私有变量。

### 继承 （Inheritance ）

在OPP程序设计中，定义一个class时，可以从某个现有的class继承，新的class成为子类（subclass），而被继承的class称为基类（base class）、父类或超类（superclass）。

例：编写一个名为`Person`的类来表示人，

* 定义属性`name`和`sex`
* 定义方法`print_title`：当`sex`为`male`时，打印`man`；当`sex`为`female`时，打印`woman`。

In [54]:
class Person(object):
    
    def __init__(self, name, sex):
        self._name = name
        self._sex = sex
        
    def print_title(self):
        if self._sex == 'male':
            print('man')
        elif self._sex == 'female':
            print('woman')            

编写`Child`类，它完全可以继承`Person`类：

In [49]:
class Child(Person):
    pass

####  继承有什么好处？

最大的好处是：子类获得了父类的全部属性和功能。

In [50]:
Rose = Child('Rose', 'female')
Rose.print_title()

woman


实例化`Child`时，子类继承了父类的构造函数，需要提供相应的两个参数。

### 多态 （Polymorphism ） 

重写`Child`类中的`print_title()`方法：当`sex`为`male`时，打印`boy`；当`sex`为`female`时，打印`girl`。

In [56]:
class Child(Person):
    
    def print_title(self):
        if self._sex == 'male':
            print('boy')
        elif self._sex == 'female':
            print('girl')

Rose = Child('Rose', 'female')
Rose.print_title()

girl


当子类与父类存在相同的`print_title()`方法时，子类的`print_title()`方法覆盖了父类的`print_title()`方法。代码运行时，会调用子类的`print_title()`方法。

这就获得了继承的另一个好处：**多态**。

多态的好处是，当我们需要传入更多的子类，例如新增`Teenagers`、`Grownups`等时，我们只需继承`Person`类型即可，而`print_title()`方法既可不重写（即使用`Person`的），也可以重写一个特有的。这就是多态的意思。

调用方只管调用，不管细节。而当我们新增一个Person的子类时，只要确保新方法编写正确，而不用管原来的代码。这就是著名的“开闭”原则：

* 对扩展开放（Open for extension）：允许子类重写方法函数
* 对修改封闭（Closed for modification）：不重写，直接继承父类方法函数


#### 子类重写构造函数 

* 子类可以没有构造函数，表示同父类构造一致

* 子类也可重写构造函数

例：在`Child`类中新增两个属性：`mother`和`father`。

方式一：

In [58]:
class Child(Person):
    
    def __init__(self, name, female, mother, father):
        self._name = name
        self._female = female
        self._mother = mother
        self._father = father
        
    def __str__(self):
        return ('%s %s %s %s' %(self._name, self._female, self._mother, self._father))
        
Rose = Child('Rose', 'female', 'Julie', 'John')
print(Rose)

Rose female Julie John


方式二：若父类构造函数包含很多属性，子类仅需增加一两个，会产生不少冗余代码。此时，子类可对父类的构造方法进行调用：

In [59]:
# 方式2

class Child(Person):
    
    def __init__(self, name, sex, mother, father):
        Person.__init__(self, name, sex)
        self._mother = mother
        self._father = father
        
    def __str__(self):
        return ('%s %s %s %s' %(self._name, self._sex, self._mother, self._father))
        
Rose = Child('Rose', 'female', 'Julie', 'John')
print(Rose)

Rose female Julie John



## 异常（Exceptions）

在 Python 中，错误被一种称为“异常”的特殊语言结构所管理。
当错误出现时，异常被抛出，它将中断程序流的正常执行，并回退到代码中离 `try-except` 语句最近的位置。

为产生一个异常，可使用 `raise` 语句：

In [144]:
raise Exception("description of the error")

Exception: description of the error

A typical use of exceptions is to abort functions when some error condition occurs, for example:

    def my_function(arguments):
    
        if not verify(arguments):
            raise Exception("Invalid arguments")
        
        # rest of the code goes here

To gracefully catch errors that are generated by functions and class methods, or by the Python interpreter itself, use the `try` and  `except` statements:

    try:
        # normal code goes here
    except:
        # code for error handling goes here
        # this code is not executed unless the code
        # above generated an error

For example:

In [146]:
try:
    print("test")
    # generate an error: the variable test is not defined
    print(test)
except:
    print("Caught an exception")

test
Caught an exception


To get information about the error, we can access the `Exception` class instance that describes the exception by using for example:

    except Exception as e:

In [147]:
try:
    print("test")
    # generate an error: the variable test is not defined
    print(test)
except Exception as e:
    print("Caught an exception:" + str(e))

test
Caught an exception:name 'test' is not defined


## Further reading

* http://www.python.org - The official web page of the Python programming language.
* http://www.python.org/dev/peps/pep-0008 - Style guide for Python programming. Highly recommended. 
* http://www.greenteapress.com/thinkpython/ - A free book on Python programming.
* [Python Essential Reference](http://www.amazon.com/Python-Essential-Reference-4th-Edition/dp/0672329786) - A good reference book on Python programming.