# python 第六课 By 海贼

## 1、模块的定义与使用

前言：上一章大家学习了一些类和对象的概念并做了一些相关的小试验，今天我们学习Python的模块部分。

**Python 模块(Module)，是一个 Python 文件，以 .py 结尾，包含了Python对象定义和Python语句。**

**Python模块的优点：**
- 模块让你能够有逻辑地组织你的 Python 代码段。
- 把相关的代码分配到一个模块里能让你的代码更好用，更易懂。
- 模块能定义函数，类和变量，模块里也能包含可执行的代码。

### 1.1、模块的简单使用

Python本身就内置了很多非常有用的模块，只要安装完毕，这些模块就可以立刻使用。

In [21]:
#!/usr/bin/evn python
# coding=utf-8

import math

print "PI : %.30f"    % math.pi
print "fabs(-2) : %d" % math.fabs(-2)

PI : 3.141592653589793115997963468544
fabs(-2) : 2


### 1.2、模块的引入

#### 1.2.1 import 语句

可以使用 import 语句来引入模块，语法：`import module1[, module2[,... moduleN]`

比如要引用模块 `math`，就可以在文件最开始的地方用 `import math` 来引入。在调用 math 模块中的函数时，必须这样引用：模块名.函数名(math.fabs)

注意：**不管你执行了多少次import，一个模块只会被导入一次。这样可以防止导入模块被一遍又一遍地执行。**

#### 1.2.2 模块别名

导入模块时，还可以使用别名，这样，可以在运行时根据当前环境选择最合适的模块。比如Python标准库一般会提供StringIO和cStringIO两个库，这两个库的接口和功能是一样的，但是cStringIO是C写的，速度更快，所以，你会经常看到这样的写法：

In [10]:
try:
    import cStringIO as StringIO
except ImportError: # 导入失败会捕获到ImportError
    import StringIO

这样就可以优先导入cStringIO。如果有些平台不提供cStringIO，还可以降级使用StringIO。导入cStringIO时，用import ... as ...指定了别名StringIO，因此，后续代码引用StringIO即可正常工作。

由于Python是动态语言，函数签名一致接口就一样，因此，无论导入哪个模块后续代码都能正常工作。

#### 1.2.3 from…import 语句

Python 的 from 语句让你从模块中导入一个指定的部分到当前命名空间中。语法：`from modname import name1[, name2[, ... nameN]]`

In [5]:
#!/usr/bin/evn python
# coding=utf-8

'''
从math模块中引入 pi,这个声明不会把整个 math 模块导入到当前的命名空间中，
它只会将 math 里的 pi 单个引入到执行这个声明的模块的全局符号表。
'''
from math import pi

print pi

# 没有引入函数fabs，导致错误
print math.fabs(-2)

3.14159265359


NameError: name 'math' is not defined

#### 1.2.4 from…import* 语句

把一个模块的所有内容全都导入到当前的命名空间也是可行的，只需使用如下声明：`from modname import *`，建议这种声明不要过多地使用。 

In [8]:
#!/usr/bin/evn python
# coding=utf-8

from math import *

print pi
print fabs(-2)

3.14159265359
2.0


### 1.3、搜索路径

当解释器遇到 import 语句，如果模块在当前的搜索路径就会被导入。**搜索路径是一个解释器会先进行搜索的所有目录的列表。**

当你导入一个模块，python 解析器对模块位置的搜索顺序是：
- 当前目录
- 如果不在当前目录，python 则搜索在 shell 变量 PYTHONPATH 下的每个目录。
- 如果都找不到，python会察看默认路径。UNIX下，默认路径一般为/usr/local/lib/python/。

模块搜索路径存储在 system 模块的 sys.path 变量中。变量里包含当前目录，PYTHONPATH和由安装过程决定的默认目录。

In [2]:
#!/usr/bin/evn python
# coding=utf-8

import sys

# 请自行运行
print sys.path

# 如果要临时添加搜索路径
# 这种方式在运行时修改，运行结束后失效
sys.path.append("your path");

 


### 1.4、PYTHONPATH 变量

作为环境变量，PYTHONPATH 由装在一个列表里的许多目录组成。PYTHONPATH 的语法和 shell 变量 PATH 的一样。

在 UNIX 系统，典型的 PYTHONPATH 如下：` set PYTHONPATH=/usr/local/lib/pythonX.X`

## 2、模块封装

### 2.1、自定义模块

之前小伙伴们学习了python中类的概念和使用方法，那小伙伴们思考一下**模块和类的联系**又是什么呢？

下面我们将编写一个 myModel 模块。

In [4]:
#!/usr/bin/evn python
# coding=utf-8

# 将文件保存为myModel.py

' HaiZeiTech '

__author__ = 'HZ'

def WhatAboutTheHaiZei():
    print "Excellent！"

第6行是一个字符串，表示模块的文档注释，任何模块代码的第一个字符串都被视为模块的文档注释；
第8行使用\_\_author\_\_变量把作者写进去；

In [2]:
#!/usr/bin/evn python
# coding=utf-8

# 将文件保存为model_test.py
import myModel

myModel.WhatAboutTheHaiZei()

Excellent！


### 2.2、第三方模块

Python中安装第三方模块一般使用`pip`，例如安装科学计算工具Numpy等。我们推荐直接使用Anaconda，这是一个基于Python的数据处理和科学计算平台，它已经内置了许多非常有用的第三方库，我们装上Anaconda，就相当于把数十个第三方模块自动安装好了，非常简单易用。安装Anaconda可以去[清华大学镜像站](https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/)

## 3、Python中的包

包是一个分层次的文件目录结构，它定义了一个由模块及子包，和子包下的子包等组成的 Python 的应用环境。
简单来说，包就是文件夹，但该文件夹下必须存在 \_\_init\_\_.py 文件, 该文件的内容可以为空。\_\_int\_\_.py用于标识当前文件夹是一个包。

**通常\_\_init\_\_.py 文件为空，但是我们还可以为它增加其他的功能。我们在导入一个包时，实际上是导入了它的\_\_init\_\_.py文件。这样我们可以在\_\_init\_\_.py文件中批量导入我们所需要的模块，而不再需要一个一个的导入。**

In [1]:
import packageA
print (packageA.re, packageA.urllib, packageA.sys, packageA.os)

(<module 're' from '/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/re.pyc'>, <module 'urllib' from '/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.pyc'>, <module 'sys' (built-in)>, <module 'os' from '/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/os.pyc'>)


注意这里访问\_\_init\_\_.py文件中的引用文件，需要加上包名。

\_\_init\_\_.py中还有一个重要的变量\_\_all\_\_。\_\_init\_\_可用于模块导入时限制，如：
from module import \* 此时被导入模块若定义了__all__属性，则只有__all__内指定的属性、方法、类可被导入。若没定义，则导入模块内的所有公有属性，方法和类 。

In [41]:
'''
__init__.py文件：

__all__ = ['func','__func','_A']

class _A():  
    def __init__(self,name):  
        self.name = name  
def func():    
    print 'func() is called!'    
     
def func1():    
    print 'func1() is called!'    
    
def _func():    
    print '_func() is called!'    
        
def __func():    
    print '__func() is called!'
'''

from packageB import *
func()
__func()
print _A("HCZ").name
func1()

func() is called!
__func() is called!
HCZ


NameError: name 'func1' is not defined

这时就会把注册在\_\_init\_\_.py文件中\_\_all\_\_列表中的模块和包导入到当前文件中来。**可以了解到，\_\_init\_\_.py主要控制包的导入行为。**

考虑一个在 package\_HaiZeiTools 目录下的 Jupyter.py、Router.py、\_\_init\_\_.py 文件，test.py 为测试调用包的代码，目录结构如下：
```
HaiZeiTools.py
package_HaiZeiTools
|-- __init__.py
|-- Jupyter.py
|-- Router.py

```

**文件：package_HaiZeiTools/Jupyter.py**

In [None]:
#!/usr/bin/env python
# coding=utf-8

class Jupyter:
    def __init__(self):
        pass
    def say(self):
        print "Used Jupyter!"

**文件：package_HaiZeiTools/Router.py**

In [17]:
#!/usr/bin/env python
# coding=utf-8

class Router:
    def __init__(self):
        pass
    def say(self):
        print "Used Router!"

**文件：test.py**

In [18]:
#!/usr/bin/env python
# coding=utf-8

# 导入包
from package_HaiZeiTools.Jupyter import Jupyter 
from package_HaiZeiTools.Router  import Router

Jupyter().say()
Router().say()

Used Jupyter!
Used Router!


## 4、作业

**作业1:**
 - Python中类与模块，模块与包的关系的是什么？
 
**作业2:**
 - python中为什么要使用包？
 
**作业3: 单词统计小项目**

 - 葛底斯堡的演说中单词出现的频率

 - 根据上面统计的频率，按照频率由高到底绘制出柱状图

 - 将按照上面的要求实现的功能封装到自定义模块中

 - 优化代码结构，将功能模块打包成文件

[文本链接](https://baike.baidu.com/item/%E8%91%9B%E5%BA%95%E6%96%AF%E5%A0%A1%E6%BC%94%E8%AF%B4/9524243?fr=aladdin)，参考**新闻誊抄本**部分文字。