# 模块和包

## 模块
Python会将所有`.py`结尾的文件认定为Python代码文件，考虑下面的脚本 ex1.py ：

In [1]:
%%writefile ex1.py

PI = 3.1416

def sum(lst):
    tot = lst[0]
    for value in lst[1:]:
        tot = tot + value
    return tot
    
w = [0, 1, 2, 3]
print sum(w), PI

Writing ex1.py


In [2]:
%run ex1.py

6 3.1416


In [3]:
# 可以将这个脚本当作模块导入
import ex1

6 3.1416


In [4]:
ex1

<module 'ex1' from 'ex1.py'>

In [5]:
print ex1.PI

3.1416


In [6]:
# 可以修改变量
ex1.PI = 3.141592653
print ex1.PI

3.141592653


In [7]:
# 调用函数
print ex1.sum([2,3,4])

9


为了提高效率，Python只会载入模块一次，已经载入的模块再次载入时，**Python并不会真正执行载入操作，哪怕模块的内容已经改变**。

In [8]:
# 并不会输出内容
import ex1

In [9]:
# 强制重新载入
reload(ex1)

6 3.1416


<module 'ex1' from 'ex1.pyc'>

In [10]:
# 删除文件
import os
os.remove('ex1.py')

## `__name__`属性

有时候我们想将一个 .py 文件既当作脚本，又能当作模块用，这个时候可以使用 `__name__` 这个属性。

只有当文件被当作脚本执行的时候， `__name__`的值才会是 `__main__`，所以我们可以：

In [11]:
%%writefile ex2.py

PI = 3.1416

def sum(lst):
    """ Sum the values in a list
    """
    tot = 0
    for value in lst:
        tot = tot + value
    return tot

def add(x, y):
    " Add two values."
    a = x + y
    return a

def main():
    w = [0,1,2,3]
    assert(sum(w) == 6)
    print 'test passed.'
    
if __name__ == '__main__':
    main()

Writing ex2.py


In [14]:
# 直接运行会被当作mian执行
%run ex2.py

test passed.


In [15]:
# 当作模块导入的时候，main()不会被执行
# 直接导入，使用函数或者变量的时候要加上模块名
import ex2

In [16]:
# 同样可以使用其中的变量和方法
ex2.PI

3.1416

In [17]:
# 使用别名
import ex2 as e2
e2.PI

3.1416

## 其他导入方法

In [18]:
# 这种导入方式在使用模块的变量或者函数时就不需要加上模块名
from ex2 import add,PI

In [19]:
add(2,3)

5

In [20]:
# 导入所有函数
# 此方法不提倡，这种方式可能会覆盖已有函数
# 一般情况下，你不了解之后使用什么函数时
# 可以直接import ex2这种方式，虽然调用的时候麻烦一点
# 但是更安全，程序的可读性更强
from ex2 import *

In [21]:
import os
os.remove('ex2.py')

## 包

假设我们有这样的一个文件夹：
```
foo/

__init__.py
bar.py (defines func)
baz.py (defines zap)
```
这意味着 foo 是一个包，我们可以这样导入其中的内容：
```python
from foo.bar import func
from foo.baz import zap
```
bar 和 baz 都是 foo 文件夹下的 .py 文件。

导入包要求：
* 文件夹 `foo` 在Python的**搜索路径**中
* `__init__.py` 表示 `foo` 是一个包，它可以是个空文件。

## 常用的标准库

* re 正则表达式
* copy 复制
* math, cmath 数学
* decimal, fraction
* sqlite3 数据库
* os, os.path 文件系统
* gzip, bz2, zipfile, tarfile 压缩文件
* csv, netrc 各种文件格式
* xml
* htmllib
* ftplib, socket
* cmd 命令行
* pdb
* profile, cProfile, timeit
* collections, heapq, bisect 数据结构
* mmap
* threading, Queue 并行
* multiprocessing
* subprocess
* pickle, cPickle
* struct

这个必须熟悉，路还很长呀。。。