# 3. 模块和包

## 3.1 模块

1.一个包含所有你定义的函数和变量的文件，其后缀名是.py

2.一个模块只会被导入一次，不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行

3.导入模块 support时，需要把命令放在脚本的顶端

4.当解释器遇到 import 语句，如果模块在当前的搜索路径就会被导入

5.使用模块名称来访问函数

### 3.1.1 模块搜索路径

1.模块的查找顺序是：内存中已经加载的模块->内置模块->sys.path路径（导入模块的环境变量）中包含的模块

2.当Python执行import语句时，它会在一些路径中搜索Python模块和扩展模块。可以通过sys.path查看这些路径

3.当安装第三方模块的时候，如果不是按照标准方式安装，则为了能够引用（import）这些模块，必须将这些模块的安装路径添加到sys.path中

4.只要模块文件放在sys.path路径中，都可以import使用它

### 3.1.2 导入模块import

1.将整个模块(somemodule)导入，格式为：import somemodule

2.从某个模块中导入某个函数,格式为：from somemodule import somefunction

3.从某个模块中导入多个函数,格式为：from somemodule import firstfunc, secondfunc, thirdfunc

4.将某个模块中的全部函数导入，格式为： from somemodule import *

5.引用模块时使用别名，格式为：import somemodule  as othername

### 3.1.3 实例 `mymodule.py` ：

In [4]:
%%writefile mymodule.py

PI = 3.1416

def sum(lst):
    tot = lst[0]
    for value in lst[1:]:
        tot = tot + value
    return tot
    
w = [0, 1, 2, 3]
print(sum(w), PI)

Writing mymodule.py


可以执行它：

In [5]:
%run mymodule.py

6 3.1416


这个脚本可以当作一个模块，可以使用`import`关键词加载并执行它（这里要求`ex1.py`在当前工作目录）：

In [6]:
import mymodule

6 3.1416


In [8]:
mymodule

<module 'mymodule' from 'C:\\Code\\python\\Python-Course-HK\\day4-函数模块与包\\mymodule.py'>

在导入时，**Python**会执行一遍模块中的所有内容。

`mymoule.py` 中所有的变量都被载入了当前环境中，不过要使用

    mymodule.变量名

的方法来查看或者修改这些变量：

In [9]:
print(mymodule.PI)

3.1416


In [8]:
mymodule.PI = 3.141592653
print(mymodule.PI)

3.141592653


还可以用

    mymodule.函数名

调用模块里面的函数：

In [9]:
print(mymodule.sum([2, 3, 4]))

9


为了提高效率，**Python**只会载入模块一次，已经载入的模块再次载入时，Python并不会真正执行载入操作，哪怕模块的内容已经改变。

例如，这里重新导入 `mymodule` 时，并不会执行 `mymodule.py` 中的 `print` 语句：

In [10]:
import mymodule

需要重新导入模块时，可以使用`reload`强制重新载入它，例如：

In [11]:
from imp import reload
reload(mymodule)  # Python 3.0把reload内置函数移到了imp标准库模块中

6 3.1416


<module 'mymodule' from 'C:\\Code\\python\\Python-Course-HK\\day4-函数模块与包\\mymodule.py'>

删除之前生成的文件：

In [13]:
import os
os.remove('mymodule.py')

**其他导入方法实例**

可以从模块中导入变量：

In [16]:
from mymodule import add, PI

使用 `from` 后，可以直接使用 `add` ， `PI`：

In [17]:
add(2, 3)

5

或者使用 `*` 导入所有变量：

In [20]:
from mymodule import *
add(3, 4.5)

7.5

这种导入方法不是很提倡，因为如果你不确定导入的都有哪些，可能覆盖一些已有的函数。

删除文件：

In [21]:
import os
os.remove('mymodule.py')

### 3.1.4 模块 `__name__` 属性

有时候我们想将一个 `.py` 文件既当作脚本，又能当作模块用，这个时候可以使用 `__name__` 这个属性。

只有当文件被当作脚本执行的时候， `__name__`的值才会是 `'__main__'`，所以我们可以：

In [20]:
%%writefile ex2.py

PI = 3.1416

def sum(lst):
    """ Sum the values in a list
    """
    tot = 0
    for value in lst:
        tot = tot + value
    return tot

def add(x, y):
    " Add two values."
    a = x + y
    return a

def test():
    w = [0,1,2,3]
    assert(sum(w) == 6)
    print('test passed.')
    
if __name__ == '__main__':
    test()

Overwriting ex2.py


运行文件：

In [15]:
%run ex2.py

test passed.


当作模块导入， `test()` 不会执行：

In [16]:
import ex2

但是可以使用其中的变量：

In [17]:
ex2.PI

3.1416

使用别名：

In [19]:
import ex2 as e2
e2.PI

3.1416

## 3.2 包

1.包是一种管理 Python 模块命名空间的形式，采用"点模块名称"

2.在导入一个包的时候，Python 会根据 sys.path 中的目录来寻找这个包中包含的子目录

3.目录只有包含一个叫做 __init__.py 的文件才会被认作是一个包

4.用户可以每次只导入一个包里面的特定模块

5.包的导入和模块导入差不多

### 3.2.1 包实例

假设我们有这样的一个文件夹：

foo/
- `__init__.py` 
- `bar.py` (defines func)
- `baz.py` (defines zap)

这意味着 foo 是一个包，我们可以这样导入其中的内容：

```python    
from foo.bar import func
from foo.baz import zap
```

`bar` 和 `baz` 都是 `foo` 文件夹下的 `.py` 文件。

导入包要求：
- 文件夹 `foo` 在**Python**的搜索路径中
- `__init__.py` 表示 `foo` 是一个包，它可以是个空文件。

请注意，每一个包目录下面都会有一个__init__.py的文件，这个文件是必须存在的，否则，Python就把这个目录当成普通目录，而不是一个包。__init__.py可以是空文件，也可以有Python代码，因为__init__.py本身就是一个模块，而它的模块名就是foo。

类似的，可以有多级目录，组成多级层次的包结构。比如如下的目录结构：

    mycompany
     ├─ web
     │  ├─ __init__.py
     │  ├─ utils.py
     │  └─ www.py
     ├─ __init__.py
     ├─ abc.py
     └─ xyz.py
     
     文件www.py的模块名就是mycompany.web.www

In [None]:
"""
我们可以这样组织一个package:

package1/
    __init__.py
    subPack1/
        __init__.py
        module_11.py
        module_12.py
        module_13.py
    subPack2/
        __init__.py
        module_21.py
        module_22.py
        
"""

In [1]:
from package1.subPack1.module_11 import funcA

funcA()

funcA in module_11


有时在import语句中会出现通配符*，导入某个module中的所有元素，这是怎么实现的呢？

答案就在\__init__.py中。我们在subPack1的\__init__.py文件中写

    __all__ = ['module_13', 'module_12']


In [2]:
from package1.subPack1 import *

In [3]:
module_12.funcB()

funcB in module_12


In [4]:
module_11.funcA()

NameError: name 'module_11' is not defined

也就是说，以*导入时，package内的module是受\__init__.py限制的

最后来看看，如何在package内部互相调用。


如果不在同一个package中，例如我们希望在module_12.py中调用module_22.py中的FuncE，则应该这样：

from module_22包名.module_22 import funcE

In [1]:
from package1.subPack1.module_13 import funcC

funcC()

funcC in module_13
funcB in module_12
funcE in module_22


## 3.3 PYTHONPATH设置

Python的搜索路径可以通过环境变量PYTHONPATH设置，环境变量的设置方法依操作系统的不同而不同，具体方法可以网上搜索。

### 3.3.1 sys.path

模块搜索路径

默认情况下，Python解释器会搜索当前目录、所有已安装的内置模块和第三方模块，搜索路径存放在sys模块的path变量中：

In [22]:
import sys
sys.path  

['',
 'C:\\ProgramData\\Anaconda3\\python36.zip',
 'C:\\ProgramData\\Anaconda3\\DLLs',
 'C:\\ProgramData\\Anaconda3\\lib',
 'C:\\ProgramData\\Anaconda3',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\Babel-2.5.0-py3.6.egg',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\win32',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\win32\\lib',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\Pythonwin',
 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\guojige\\.ipython']

如果我们要添加自己的搜索目录，有两种方法：

一是直接修改sys.path，添加要搜索的目录：

In [None]:
sys.path.append('/Users/Administrator/my_py_scripts')

第二种方法是设置环境变量PYTHONPATH，该环境变量的内容会被自动添加到模块搜索路径中。设置方式与设置Path环境变量类似。

注意只需要添加你自己的搜索路径，Python自己本身的搜索路径不受影响。

### 3.3.2 dir()函数

1.内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回

2.如果没有给定参数，那么 dir() 函数会罗列出当前定义的所有名称

In [26]:
import ex2
print(dir(ex2))# 得到一个指定模块中定义的名称
print("---------------------------------------")
print(dir())     # 得到一个当前模块中定义的属性列表

print("---------------------------------------")
cname=5 # 建立一个新的变量 'a'
print(dir())

print("---------------------------------------")
del cname # 删除变量名a
print(dir())

['PI', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'add', 'sum', 'test']
---------------------------------------
['In', 'Out', 'PI', '_', '_11', '_17', '_8', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__nonzero__', '__package__', '__spec__', '_dh', '_i', '_i1', '_i10', '_i11', '_i12', '_i13', '_i14', '_i15', '_i16', '_i17', '_i18', '_i19', '_i2', '_i20', '_i21', '_i22', '_i23', '_i24', '_i25', '_i26', '_i3', '_i4', '_i5', '_i6', '_i7', '_i8', '_i9', '_ih', '_ii', '_iii', '_oh', 'add', 'ex2', 'exit', 'get_ipython', 'mymodule', 'os', 'quit', 'reload', 'sum', 'test', 'w']
---------------------------------------
['In', 'Out', 'PI', '_', '_11', '_17', '_8', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__nonzero__', '__package__', '__spec__', '_dh', '_i', '_i1', '_i10', '_i11', '_i12', '_i13', '_i14', '_i15', '_i16', '_i17', '_i18', '_i19', '_i2', '_i20', 

## 3.4 常用的标准库

- re 正则表达式
- copy 复制
- math, cmath 数学
- decimal, fraction
- sqlite3 数据库
- os, os.path 文件系统
- gzip, bz2, zipfile, tarfile 压缩文件
- csv, netrc 各种文件格式
- xml
- htmllib
- ftplib, socket
- cmd 命令行
- pdb 
- profile, cProfile, timeit
- collections, heapq, bisect 数据结构
- mmap
- threading, Queue 并行
- multiprocessing
- subprocess
- pickle, cPickle
- struct