# 模块和包

<img src="assets/ModulePackage.jpg" width="50%">

## Python中的模块与包

在Python中，最基本也是最小的可执行单元就是一行语句。Python代码组织还是采用扁平模式，
- 语句
- 模块
- 包

在Python中，一个模块就是一个文件；一个软件包就是一个目录，包含多个文件。软件包可以多层，也就是有多层目录。

根据软件库来源和提供方的不同，软件库可以划分为：
- 标准库
- 第三方库
- 自定义库

### 导入模块

为了使用它们，需要用用`import`导入模块：

In [None]:
import math
import random

In [None]:
type(math), type(random)

In [None]:
print(math.__file__)

### 访问模块中内容

使用`.`来访问模块中的变量，函数、类

In [None]:
math.pi

In [None]:
random.randint(0, 100)

### 模块导入

模块和包有很多，如果出现重名，那么加载的模块会是哪一个呢？Python导入模块时会依赖一个路径列表（`sys.path`），Python就是根据这个列表中的路径去搜索要加载的模块。

In [3]:
import sys
print(sys.path)

['', '/opt/anaconda3/lib/python36.zip', '/opt/anaconda3/lib/python3.6', '/opt/anaconda3/lib/python3.6/lib-dynload', '/home/whwang/.local/lib/python3.6/site-packages', '/home/whwang/.local/lib/python3.6/site-packages/tdxdownload-0.1.0-py3.6.egg', '/home/whwang/.local/lib/python3.6/site-packages/tdxreader-0.1.0-py3.6.egg', '/home/whwang/.local/lib/python3.6/site-packages/tdxfetch-0.1.0-py3.6.egg', '/opt/anaconda3/lib/python3.6/site-packages', '/opt/anaconda3/lib/python3.6/site-packages/Mako-1.0.7-py3.6.egg', '/opt/anaconda3/lib/python3.6/site-packages/pdfminer.six-20170720-py3.6.egg', '/opt/anaconda3/lib/python3.6/site-packages/IPython/extensions', '/home/whwang/.ipython']


在`sys.path`中目录顺序很重要，Python通过遍历这个列表来寻找请求的模块。

> `sys.path`是一个列表，可以进行添加或删除。

还可以通过修改环境变量`PYTHONPATH`，改变搜索路径。

总体而言，模块的搜索顺序如下：
1. 当前目录
2. Python安装目录
3. 第三方库`site-packages`目录。

## 自己写模块(module)

文件就是模块，编写一个Python代码，并用“.py”后缀名进行保存。

模块名字应该尽量用简短全小写的名字，还是一句老话，做到望文生义不容易。

层次分解通常也会采用“高内聚低耦合”的思想原则：
- 内聚，描述模块内各个元素彼此结合的紧密程度，高内聚就是一个模块内各个元素彼此结合的紧密程度高。
- 耦合，不同模块之间互连程度的度量，低耦合是指模块尽可能独立完成某特定功能。
也就是说，一个模块尽量做到代码相关性强、功能独立。

### 创建模块

下面假定来创建自己的一个模块，假定模块包括一些常量、函数和类。

In [4]:
%%writefile simplemodule.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""简单模块

包括:
  - 函数、类、变量
"""
__author__ = 'Wang Weihua'

hello = ['Hi', '您好']

def sayhello(name):
    """Say hello to a person"""
    print('Hi, {}'.format(name))

    
class SimpleClass():
    pass

Writing simplemodule.py


使用import命令导入模块，语法为：
```
import module_name
import module_name as qualname
```

In [5]:
import simplemodule
import simplemodule as sm

### 自省和帮助

使用内置函数`type()`查看对象的类型

In [None]:
print(type(simplemodule), type(sm))

模块是可变对象，也就是说模块的值是可以改变的。

In [7]:
sm.new = 'new'

使用内置函数`help()`函数，或者使用IPython自省功能`?`或`??`获得帮助。

In [8]:
help(sm)

Help on module simplemodule:

NAME
    simplemodule - 简单模块

DESCRIPTION
    包括:
      - 函数、类、变量

CLASSES
    builtins.object
        SimpleClass
    
    class SimpleClass(builtins.object)
     |  Data descriptors defined here:
     |  
     |  __dict__
     |      dictionary for instance variables (if defined)
     |  
     |  __weakref__
     |      list of weak references to the object (if defined)

FUNCTIONS
    sayhello(name)
        Say hello to a person

DATA
    hello = ['Hi', '您好']
    new = 'new'

AUTHOR
    Wang Weihua

FILE
    /home/whwang/training/python-training-basics/module/simplemodule.py




一些魔术属性：
- `__author__`, 作者
- `__doc__`, 文档字符串
- `__file__`, 模块文件路径
- `__name__`, 模块名字

### 程序与模块

一个程序代码文件可以是程序文件，也可以是模块文件。当用Python运行文件时就是主程序，在程序文件使用`import` 命令导入时，就是模块。

我们注意到，代码文件的特殊变量`__name__`在两种场景下其值并不同：
- 使用Python运行文件时，也就是说为主程序时其值被设置为`__main__`。
- 使用`import` 命令导入模块时， 其值为文件名。

In [None]:
print(__name__)

基于此特性，重写刚才的代码文件

In [None]:
%%writefile simplemodule2.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""My Simple Module

This exports:
  - all simple functions and class.
  - sm.sayhello is either posixpath or ntpath
  - sm.SimpleClass is either 'posix' or 'nt'

Programs that import and use 'sm' name 
"""
__author__ = 'Wu Yang'

hello = ['Hi', '您好']

def sayhello(name):
    """Say hello to a person"""
    print('Hi, {}'.format(name))

    
class SimpleClass():
    pass

print(__name__)
if __name__ == '__main__':
    for x in hello:
        print(x)
        
    sayhello('老王')

在命令行下运行程序

In [None]:
%run simplemodule2.py

使用`import`导入模块

In [None]:
import simplemodule2 as sm2

In [None]:
print(sm2.__name__)

注意，多次导入模块时，解释器并没有运行两次，也就是模块不会重复的导入。这样可以节省内存和计算资源。

在开发调试时，经常需要重新导入，可以使用`importlib.reload`实现重复导入。

In [None]:
import importlib

importlib.reload(simplemodule)

## 包（package）

Python的包是模块的集合，是更高一级的封装。在Python中，文件是模块，目录就是包。包可以嵌套包，就像文件目录一样，

### 创建包对象

包就是一个目录。与目录不同的是，包中必须包含一个`__init__.py`文件。包是模块的集合，通常会有多个模块或子包。不过我们知道，一个目录可以没有文件。也就是说，从理论上说，一个包可以没有模块也行。不过，那要问一下，为啥不用模块呢？

下面创建一个最简单的包，只包含`__init__.py`，而且里面啥都没有。

In [None]:
%mkdir simpkg
!touch simpkg/__init__.py

In [None]:
!tree simpkg

使用`import`命令导入，语法包括：
```
import dir1
import dir1.dir2.module
from dir1.dir2 import module
```

In [None]:
import simpkg
import simpkg as sm

### 自省和帮助

使用内置函数`type()`查看对象的类型

In [None]:
print(type(simpkg), type(sm), type(np))

下面在`__init__.py`添加一些内容，再添加一个新的模块，以及一个子包。

In [None]:
%%writefile simpkg/__init__.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""My Simple Package

simple package include a module and a subpackage
"""
__author__ = 'Wang Weihua <whwang@isciencehub.com>'
__status__  = "production"
__version__ = "0.0.1.1"
__date__    = "24 July 2018"

hello = ['Hi', '您好']

def sayhello(name):
    """Say hello to a person"""
    print('Hi, {}'.format(name))

    
class SimpleClass():
    pass

In [None]:
%%writefile simpkg/multilang.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
def loveyou():
    """say love in multi language"""
    print('我爱你')    
    print('I Love You')
    print('私は爱する')             # 日本：
    print('나는 너를 사랑한다')     # 韩国
    print('Я люблю вас')   # 俄罗斯
    print("Je t'aime")              # 法国
    print('Ich liebe dich')         # 德国
    print('∑ας αγαπώ')       # 希腊
    print('Te amo')                 # 西班牙
    print('Ik houd van u')          # 荷兰

In [None]:
%mkdir simpkg/fibo
!touch simpkg/fibo/__init__.py

In [None]:
%%writefile simpkg/fibo/fibo.py
"""Fibonacci numbers module
"""

def fibo_gen(n):
    """Return Fibonacci series uup to n"""
    result = []
    a, b = 0, 1
    while b < n:
        result.append(b)
        a, b = b, a+b
    
    return result

def fibo_print(n):
    """Print a Fibonacci series"""
    print(fibo_gen(n))

使用`tree`命令列出包的内容

In [None]:
!tree simpkg

使用`import`导入需要的软件包

In [None]:
importlib.reload(sm)
import simpkg.multilang as mlang
from simpkg.fibo import fibo

In [None]:
help(sm)

In [None]:
sm.sayhello('老王')
sm.fibo.fibo.fibo_print(5)
sm.multilang.loveyou()

## 问题与异常

如果导入的模块不存在或者没有安装，会引起异常`ImportError`

In [None]:
import nomodule

如果出现异常，检查模块名是否输入错误，异或没有安装。有时会存在多个功能类似的模块，可以使用`try..except`方法导入：
```
try:
    import A
except ImportError as e:
    import B
```    