# 模块
在前面的几个章节中我们脚本上是用 python 解释器来编程，如果你从 Python 解释器退出再进入，那么你定义的所有的方法和变量就都消失了。

为此 Python 提供了一个办法，把这些定义存放在文件中，为一些脚本或者交互式的解释器实例使用，这个文件被称为模块。

模块是一个包含所有你定义的函数和变量的文件，其后缀名是.py。模块可以被别的程序引入，以使用该模块中的函数等功能。这也是使用 python 标准库的方法。

下面是一个使用 python 标准库中模块的例子

In [None]:
import sys
print('命令行参数如下:')
for i in sys.argv:
    print(i)

print('\n\nPython路径为：', sys.path)

1. import sys 引入 python 标准库中的 sys.py 模块；这是引入某一模块的方法
2. sys.argv 是一个包含命令行参数的列表
3. sys.path 包含了一个 Python 解释器自动查找所需模块的路径的列表

## import语句
想使用 Python 源文件，只需在另一个源文件里执行 import 语句，语法如下
<br>import module1[, module2[,... moduleN]


当解释器遇到 import 语句，如果模块在当前的搜索路径就会被导入。

搜索路径是一个解释器会先进行搜索的所有目录的列表。如想要导入模块 support，需要把命令放在脚本的顶端：

下面示范如何通过Jupyter Notebook load一个已存在的python文件。
1. %load [python文件路径], 如%load ./code/support.py
2. Jupyter会将该文件中所有代码加载进来，并将%load语句注释
3. 之后就可以使用该文件中的方法与成员了。

In [1]:
# %load ./code/support.py
def print_func(par):
    print ("Hello : ", par)
    return

print_func('world')

Hello :  world


In [4]:
import support
support.print_func('good')

Hello :  good


In [6]:
%run ./code/support.py

Hello :  world


In [8]:
# import os
with open('./code/support.py', 'r') as file:
    print(file.read())

def print_func(par):
    print ("Hello : ", par)
    return

print_func('world')


In [9]:
help(os)

Help on module os:

NAME
    os - OS routines for NT or Posix depending on what system we're on.

DESCRIPTION
    This exports:
      - all functions from posix or nt, e.g. unlink, stat, etc.
      - os.path is either posixpath or ntpath
      - os.name is either 'posix' or 'nt'
      - os.curdir is a string representing the current directory (always '.')
      - os.pardir is a string representing the parent directory (always '..')
      - os.sep is the (or a most common) pathname separator ('/' or '\\')
      - os.extsep is the extension separator (always '.')
      - os.altsep is the alternate pathname separator (None or '/')
      - os.pathsep is the component separator used in $PATH etc
      - os.linesep is the line separator in text files ('\r' or '\n' or '\r\n')
      - os.defpath is the default search path for executables
      - os.devnull is the file path of the null device ('/dev/null', etc.)
    
    Programs that import and use 'os' stand a better chance of being
    porta

一个模块只会被导入一次，不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行。

当我们使用import语句的时候，Python解释器是怎样找到对应的文件的呢？

这就涉及到Python的搜索路径，搜索路径是由一系列目录名组成的，Python解释器就依次从这些目录中去寻找所引入的模块。

这看起来很像环境变量，事实上，也可以通过定义环境变量的方式来确定搜索路径。

搜索路径是在Python编译或安装的时候确定的，安装新的库应该也会修改。搜索路径被存储在sys模块中的path变量，做一个简单的实验，在交互式解释器中，输入以下代码：

In [10]:
import sys
print(sys.path)

['', 'd:\\python36\\python36.zip', 'd:\\python36\\DLLs', 'd:\\python36\\lib', 'd:\\python36', 'C:\\Users\\bhe\\AppData\\Roaming\\Python\\Python36\\site-packages', 'd:\\python36\\lib\\site-packages', 'd:\\python36\\lib\\site-packages\\shap-0.27.2-py3.6-win-amd64.egg', 'd:\\python36\\lib\\site-packages\\win32', 'd:\\python36\\lib\\site-packages\\win32\\lib', 'd:\\python36\\lib\\site-packages\\Pythonwin', 'd:\\python36\\lib\\site-packages\\IPython\\extensions', 'C:\\Users\\bhe\\.ipython']


sys.path 输出是一个列表，其中第一项是空串''，代表当前目录（若是从一个脚本中打印出来的话，可以更清楚地看出是哪个目录），亦即我们执行python解释器的目录（对于脚本的话就是运行的脚本所在的目录）。

因此若像我一样在当前目录下存在与要引入模块同名的文件，就会把要引入的模块屏蔽掉。

了解了搜索路径的概念，就可以在脚本中修改sys.path来引入一些不在搜索路径中的模块。

## from … import 语句
Python 的 from 语句让你从模块中导入一个指定的部分到当前命名空间中，语法如下
<br>from modname import name1[, name2[, ... nameN]]

In [12]:
from logutil import logger
logger.info('hello')

INFO:logutil:hello


## 深入模块
模块除了方法定义，还可以包括可执行的代码。这些代码一般用来初始化这个模块。这些代码只有在第一次被导入时才会被执行。

每个模块有各自独立的符号表，在模块内部为所有的函数当作全局符号表来使用。

所以，模块的作者可以放心大胆的在模块内部使用这些全局变量，而不用担心把其他用户的全局变量搞花。

从另一个方面，当你确实知道你在做什么的话，你也可以通过 modname.itemname 这样的表示法来访问模块内的函数。

模块是可以导入其他模块的。在一个模块（或者脚本，或者其他地方）的最前面使用 import 来导入一个模块，当然这只是一个惯例，而不是强制的。被导入的模块的名称将被放入当前操作的模块的符号表中。

还有一种导入的方法，可以使用 import 直接把模块内（函数，变量的）名称导入到当前操作模块

In [None]:
# %load fibo.py
def fib(n):    # 定义到 n 的斐波那契数列，实时打印
    a, b = 0, 1
    while b < n:
        print(b, end=' ')
        a, b = b, a+b
    print()

def fib2(n): # 返回到 n 的斐波那契数列，返回列表
    result = []
    a, b = 0, 1
    while b < n:
        result.append(b)
        a, b = b, a+b
    return result

In [14]:
from fibo import fib, fib2
print(fib2(50))

[1, 1, 2, 3, 5, 8, 13, 21, 34]


这种导入的方法不会把被导入的模块的名称放在当前的字符表中（所以在这个例子里面，fibo 这个名称是没有定义的）。

这还有一种方法，可以一次性的把模块中的所有（函数，变量）名称都导入到当前模块的字符表

In [None]:
from fibo import *
print(fib2(500))

这将把所有的名字都导入进来，但是那些由单一下划线（_）开头的名字不在此例。大多数情况， Python程序员不使用这种方法，因为引入的其它来源的命名，很可能覆盖了已有的定义

## \_\_name\_\_属性
一个模块被另一个程序第一次引入时，其主程序将运行。如果我们想在模块被引入时，模块中的某一程序块不执行，我们可以用\_\_name\_\_属性来使该程序块仅在该模块自身运行时执行

In [15]:
import using_name

我来自另一模块


In [None]:
# %load using_name.py
"""
@version: 0.1
@author: Blade He
@license: Morningstar 
@contact: blade.he@morningstar.com
@site: 
@software: PyCharm
@file: using_name.py
@time: 2018/7/22 16:09
"""


def startjob():
    pass


if __name__ == '__main__':
    print('程序自身在运行')
else:
    print('我来自另一模块')

说明： 每个模块都有一个\_\_name\_\_属性，当其值是'\_\_main\_\_'时，表明该模块自身在运行，否则是被引入。

说明：\_\_name\_\_ 与 \_\_main\_\_ 底下是双下划线

## dir()函数
内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回

In [17]:
import fibo
print(dir(fibo))

['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'fib', 'fib2']


In [18]:
import sys
print(dir(sys))
print('---------This is split line-------------------')
print([member for member in dir(sys) if '_' not in member])

['__displayhook__', '__doc__', '__excepthook__', '__interactivehook__', '__loader__', '__name__', '__package__', '__spec__', '__stderr__', '__stdin__', '__stdout__', '_clear_type_cache', '_current_frames', '_debugmallocstats', '_enablelegacywindowsfsencoding', '_getframe', '_git', '_home', '_xoptions', 'api_version', 'argv', 'base_exec_prefix', 'base_prefix', 'builtin_module_names', 'byteorder', 'call_tracing', 'callstats', 'copyright', 'displayhook', 'dllhandle', 'dont_write_bytecode', 'exc_info', 'excepthook', 'exec_prefix', 'executable', 'exit', 'flags', 'float_info', 'float_repr_style', 'get_asyncgen_hooks', 'get_coroutine_wrapper', 'getallocatedblocks', 'getcheckinterval', 'getdefaultencoding', 'getfilesystemencodeerrors', 'getfilesystemencoding', 'getprofile', 'getrecursionlimit', 'getrefcount', 'getsizeof', 'getswitchinterval', 'gettrace', 'getwindowsversion', 'hash_info', 'hexversion', 'implementation', 'int_info', 'intern', 'is_finalizing', 'maxsize', 'maxunicode', 'meta_path'

如果没有给定参数，那么 dir() 函数会罗列出当前定义的所有名称:

In [21]:
import fibo
fib = fibo.fib
print(fib(10))
"""
print(fib(10))
print(fib(10))
print(fib(10))
"""
print(dir())

1 1 2 3 5 8 
None
['In', 'Out', '_', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__nonzero__', '__package__', '__spec__', '_dh', '_i', '_i1', '_i10', '_i11', '_i12', '_i13', '_i14', '_i15', '_i16', '_i17', '_i18', '_i19', '_i2', '_i20', '_i21', '_i3', '_i4', '_i5', '_i6', '_i7', '_i8', '_i9', '_ih', '_ii', '_iii', '_oh', 'exit', 'fib', 'fib2', 'fibo', 'file', 'get_ipython', 'logger', 'os', 'print_func', 'quit', 'startjob', 'support', 'sys', 'using_name']


## 标准模块
Python 本身带着一些标准的模块库，在 Python 库参考文档中将会介绍到（就是后面的"库参考文档"）。

有些模块直接被构建在解析器里，这些虽然不是一些语言内置的功能，但是他却能很高效的使用，甚至是系统级调用也没问题。

这些组件会根据不同的操作系统进行不同形式的配置，比如 winreg 这个模块就只会提供给 Windows 系统。

应该注意到这有一个特别的模块 sys ，它内置在每一个 Python 解析器中。变量 sys.ps1 和 sys.ps2 定义了主提示符和副提示符所对应的字符串:

In [None]:
import sys
print(sys.ps1)
print(sys.ps2)
sys.ps1 = 'C> '
print(sys.ps1)

## 包
包是一种管理 Python 模块命名空间的形式，采用"点模块名称"。

比如一个模块的名称是 A.B， 那么他表示一个包 A中的子模块 B 。

就好像使用模块的时候，你不用担心不同模块之间的全局变量相互影响一样，采用点模块名称这种形式也不用担心不同库之间的模块重名的情况。

这样不同的作者都可以提供 NumPy 模块，或者是 Python 图形库。

不妨假设你想设计一套统一处理声音文件和数据的模块（或者称之为一个"包"）。

现存很多种不同的音频文件格式（基本上都是通过后缀名区分的，例如： .wav，:file:.aiff，:file:.au，），所以你需要有一组不断增加的模块，用来在不同的格式之间转换。

并且针对这些音频数据，还有很多不同的操作（比如混音，添加回声，增加均衡器功能，创建人造立体声效果），所以你还需要一组怎么也写不完的模块来处理这些操作。

这里给出了一种可能的包结构（在分层的文件系统中）

```
sound/                          顶层包
      __init__.py               初始化 sound 包
      formats/                  文件格式转换子包
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              auread.py
              auwrite.py
              ...
      effects/                  声音效果子包
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
      filters/                  filters 子包
              __init__.py
              equalizer.py
              vocoder.py
              karaoke.py
              ...
```

在导入一个包的时候，Python 会根据 sys.path 中的目录来寻找这个包中包含的子目录。

目录只有包含一个叫做 \_\_init\_\_.py 的文件才会被认作是一个包，主要是为了避免一些滥俗的名字（比如叫做 string）不小心的影响搜索路径中的有效模块。

最简单的情况，放一个空的 :file:\_\_init\_\_.py就可以了。当然这个文件中也可以包含一些初始化代码或者为（将在后面介绍的） \_\_all\_\_变量赋值。

用户可以每次只导入一个包里面的特定模块，比如:

```
import sound.effects.echo
```

这将会导入子模块:sound.effects.echo。 他必须使用全名去访问:

```
sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)
```

还有一种导入子模块的方法是:

```
from sound.effects import echo
```

这同样会导入子模块: echo，并且他不需要那些冗长的前缀，所以他可以这样使用:

```
echo.echofilter(input, output, delay=0.7, atten=4)
```

还有一种变化就是直接导入一个函数或者变量:

```
from sound.effects.echo import echofilter
```

同样的，这种方法会导入子模块: echo，并且可以直接使用他的 echofilter() 函数:

echofilter(input, output, delay=0.7, atten=4)

注意当使用from package import item这种形式的时候，对应的item既可以是包里面的子模块（子包），或者包里面定义的其他名称，比如函数，类或者变量。

import语法会首先把item当作一个包定义的名称，如果没找到，再试图按照一个模块去导入。如果还没找到，恭喜，一个:exc:ImportError 异常被抛出了。

反之，如果使用形如import item.subitem.subsubitem这种导入形式，除了最后一项，都必须是包，而最后一项则可以是模块或者是包，但是不可以是类，函数或者变量的名字。

通常我们并不主张使用\*这种方法来导入模块，因为这种方法经常会导致代码的可读性降低。不过这样倒的确是可以省去不少敲键的功夫，而且一些模块都设计成了只能通过特定的方法导入。

记住，使用from Package import specific_submodule这种方法永远不会有错。事实上，这也是推荐的方法。除非是你要导入的子模块有可能和其他包的子模块重名。

如果在结构中包是一个子包（比如这个例子中对于包sound来说），而你又想导入兄弟包（同级别的包）你就得使用导入绝对的路径来导入。比如，如果模块sound.filters.vocoder 要使用包sound.effects中的模块echo，你就要写成 from sound.effects import echo。

无论是隐式的还是显式的相对导入都是从当前模块开始的。主模块的名字永远是"\_\_main\_\_"，一个Python应用程序的主模块，应当总是使用绝对路径引用。

包还提供一个额外的属性\_\_path\_\_。这是一个目录列表，里面每一个包含的目录都有为这个包服务的\_\_init\_\_.py，你得在其他\_\_init\_\_.py被执行前定义。可以修改这个变量，用来影响包含在包里面的模块和子包。

这个功能并不常用，一般用来扩展包里面的模块

## 安装第三方包

一般来说，通过pip就可以安装大部分所需的python开发包，通过Windows安装的python，一般都会自带pip程序，在linux下，或许需要自行下载及安装pip

Linux，以ubuntu为例，安装pip
```
sudo wget https://pypi.python.org/packages/41/80/268fda78a53c2629128f8174d2952c7f902c93ebaa2062b64f27aa101b07/setuptools-38.2.3.zip#md5=0ae64455d276ff864b40aca9c06ea7c1
sudo unzip setuptools-38.2.3.zip
cd setuptools-38.2.3
sudo python setup.py install

sudo wget https://pypi.python.org/packages/11/b6/abcb525026a4be042b486df43905d6893fb04f05aac21c32c638e939e447/pip-9.0.1.tar.gz#md5=35f01da33009719497f01a4ba69d63c9
sudo tar xf pip-9.0.1.tar.gz
cd pip-9.0.1
sudo python setup.py install
```
之后，输入pip -v，应该会显示pip的版本以及对应的python信息，如：
pip 9.0.1 from /usr/local/lib/python3.6/dist-packages/pip-9.0.1-py3.6.egg (python 3.6)

之后，如果需要使用什么python包，就参照官方说明，直接pip install即可

Windows系统下如果安装一些python包，出现了错误，可以直接去https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载whl文件，不过需要了解是要下载32位还是64位版本的

如：numpy‑1.15.0+mkl‑cp36‑cp36m‑win_amd64.whl，表示是python3.6版本，并且是64位的安装包。