# 模块与包

你想将你的代码组织成由很多分层模块构成的包

封装成包是很简单的。在文件系统上组织你的代码，并确保每个目录都定义了一个
__init__.py 文件

graphics/

    __init__.py
    
    primitive/
    
        __init__.py
        
        line.py
        
        fill.py
        
        text.py
        
    formats/
    
        __init__.py
        
        png.py
        
        jpg.py

In [None]:
"""
import graphics.primitive.line
from graphics.primitive import line
import graphics.formats.jpg as jps

定义模块的层次结构就像在文件系统上建立目录结构一样容易。文件 __init__.py
的目的是要包含不同运行级别的包的可选的初始化代码。举个例子，如果你执行了语句
import graphics，文件 graphics/__init__.py 将被导入, 建立 graphics 命名空间的内容。
像 import graphics.format.jpg 这样导入，文件 graphics/__init__.py 和文件 graphics/
formats/__init__.py 将在文件 graphics/formats/jpg.py 导入之前导入。
绝大部分时候让 __init__.py 空着就好。但是有些情况下可能包含代码。举个例
子，__init__.py 能够用来自动加载子模块:
"""

## 控制模块被全部导入的内容

当使用’from module import *’语句时，希望对从模块或包导出的符号进行精确
控制

在你的模块中定义一个变量 __all__ 来明确地列出需要导出的内容

In [1]:
# somemodule.py

def spam():
    pass

def grok():
    pass

blash = 42

# Only export 'spam' and 'grok'
__all__ = ['spam', 'grok']

尽管强烈反对使用‘from module import *’, 但是在定义了大量变量名的模块中
频繁使用。如果你不做任何事, 这样的导入将会导入所有不以下划线开头的。另一方面,
如果定义了 __all__ , 那么只有被列举出的东西会被导出。

如果你将 __all__ 定义成一个空列表, 没有东西将被导入。如果 __all__ 包含未
定义的名字, 在导入时引起 AttributeError

## 使用相对路径名导入包中子模块

将代码组织成包, 想用 import 语句从另一个包名没有硬编码过的包的中导入子模块

使用包的相对导入，使一个模块导入同一个包的另一个模块举个例子，假设在你的文件系统上有 mypackage 包，组织如下

mypackage/

    __init__.py
    
    A/
            __init__.py
            
            spam.py
            
            grok.py
    B/
            
            __init__.py
            
            bar.py

如果模块mypackage.A.spam要导入同目录下的模块grok，它应该包括的import语句如下

In [2]:
# mypackage/a/spam.py
from . import grok

如果模块 mypackage.A.spamm要导入不同目录下的模块B.bar，它应该使用的import 语句如下

In [None]:
# mypackage/a/spam.py
from ..B import bar

两个 import 语句都没包含顶层包名，而是使用了 spam.py 的相对路径

在包内，既可以使用相对路径也可以使用绝对路径来导入。举个例子

In [None]:
# mypack/A/spam.py
from mypackage.A import grok
from . import grok
import grok # Error -> not found

像 mypackage.A 这样使用绝对路径名的不利之处是这将顶层包名硬编码到你的源码中。如果你想重新组织它，你的代码将更脆，很难工作。举个例子，如果你改变了包名，你就必须检查所有文件来修正源码。同样，硬编码的名称会使移动代码变得困难。

举个例子，也许有人想安装两个不同版本的软件包，只通过名称区分它们。如果使用相
对导入，那一切都 ok，然而使用绝对路径名很可能会出问题。

import 语句的 . 和 .. 看起来很滑稽, 但它指定目录名. 为当前目录，..B 为目录../
B。这种语法只适用于 import。举个例子：

In [None]:
from . import grok # ok
import .grok # error

In [5]:
6 * 9 * 2 + 5

113

In [None]:
$ python3 mypackage/A/spam.py # relative import fail
$ python3 -m mypackage.A.spam # relative import work

## 将模块分割成多个文件

...........

## 利用命名空间导入目录分散的代码

................

## 重新加载模块

你想重新加载已经加载的模块，因为你对其源码进行了修改

使用 imp.reload() 来重新加载先前加载的模块。举个例子

In [None]:
import spam
import imp

imp.reload(spam)

## 运行目录或压缩文件

In [None]:
'''
spam.py
def bar():
    print('bar')
    
def grok():
    print('grok')
    
import spam
from spam import grok
spam.bar()
out:bar
grok()
out:grok

# modify
def grok():
    print('New grok')

import imp
imp.reload(spam)
spam.bar()
out:bar
grok()
out:grok
spam.grok()
out:New grok
'''

在这个例子中，你看到有 2 个版本的 grok() 函数被加载。通常来说，这不是你想要的，而是令人头疼的事。

因此，在生产环境中可能需要避免重新加载模块。在交互环境下调试，解释程序并试图弄懂它

## 运行目录或压缩文件

您有一个已成长为包含多个文件的应用，它已远不再是一个简单的脚本，你想向用
户提供一些简单的方法运行这个程序

如果你的应用程序已经有多个文件，你可以把你的应用程序放进它自己的目录并
添加一个 __main__.py 文件。举个例子，你可以像这样创建目录

In [None]:
myapplication/
    spam.py
    bar.py
    grok.py
    __main__.py

如果 __main__.py 存在，你可以简单地在顶级目录运行 Python 解释器：

bash % python3 myapplication

解释器将执行 __main__.py 文件作为主程序。
如果你将你的代码打包成 zip 文件，这种技术同样也适用，举个例子：

In [None]:
bash % ls
spam.py bar.py grok.py __main__.py
bash % zip -r myapp.zip *.py
bash % python3 myapp.zip
... output from __main__.py ..

In [None]:
创建一个目录或 zip 文件并添加 __main__.py 文件来将一个更大的 Python 应用
打包是可行的。这和作为标准库被安装到 Python 库的代码包是有一点区别的。相反，
这只是让别人执行的代码包。
由于目录和 zip 文件与正常文件有一点不同，你可能还需要增加一个 shell 脚本，
使执行更加容易。例如，如果代码文件名为 myapp.zip，你可以创建这样一个顶级脚本：
#!/usr/bin/env python3 /usr/local/bin/myapp.zip

## 读取位于包中的数据文件

你的包中包含代码需要去读取的数据文件。你需要尽可能地用最便捷的方式来做
这件事

假设你的包中的文件组织成如下

In [None]:
mypackage/
    _init__.py
    somedata.dat
    spam.py

现在假设 spam.py 文件需要读取 somedata.dat 文件中的内容。你可以用以下代码
来完成

In [2]:
#spam.py

import pkgutil
data = pkgutil.get_data(__package__, 'stocks.csv')

AttributeError: 'NoneType' object has no attribute 'startswith'

由此产生的变量是包含该文件的原始内容的字节字符串

要读取数据文件，你可能会倾向于编写使用内置的 I/ O 功能的代码，如 open()。
但是这种方法也有一些问题。

首先，一个包对解释器的当前工作目录几乎没有控制权。因此，编程时任何 I/O 操
作都必须使用绝对文件名。由于每个模块包含有完整路径的 __file__ 变量，这弄清楚
它的路径不是不可能，但它很凌乱。

第二，包通常安装作为.zip 或.egg 文件，这些文件并不像在文件系统上的一个普通
目录里那样被保存。因此，你试图用 open() 对一个包含数据文件的归档文件进行操作，
它根本不会工作。

pkgutil.get_data() 函数是一个读取数据文件的高级工具，不用管包是如何安装以
及安装在哪。它只是工作并将文件内容以字节字符串返回给你get_data() 的第一个参数是包含包名
的字符串。你可以直接使用包名，也可以使
用特殊的变量，比如 __package__。第二个参数是包内文件的相对名称。如果有必要，
可以使用标准的 Unix 命名规范到不同的目录，只有最后的目录仍然位于包中

## 将文件夹加入到 sys.path

..........