# 模块

## 编写模块

在本章之前，Python还没有显示出太突出的优势。本章开始，读者就会越来越感觉到Python的强大了。这种强大体现在“模块自信”上，因为Python不仅有很强大的自有模块（或者包、库，比如为标准库），还有海量的第三方模块（或者包、库），任何人还都能自己开发模块（或者包、库），正是有了这么强大的“模块自信”，才体现了Python的优势所在。并且这种方式也正在不断被更多其它语言所借鉴。

“模块自信”的本质是：开放。

Python不是一个封闭的体系，是一个开放系统。开放系统的最大好处就是避免了“熵增”。

熵的概念是由德国物理学家克劳修斯于1865年（这一年李鸿章建立了江南机械制造总局，美国废除奴隶制，林肯总统遇刺身亡，美国南北战争结束。）所提出，是一种测量在动力学方面不能做功的能量总数，也就是当总体的熵增加，其做功能力也下降，熵的量度正是能量退化的指标。

熵亦被用于计算一个系统中的失序现象，也就是计算该系统混乱的程度。

根据熵的统计学定义， 热力学第二定律说明一个孤立系统的倾向于增加混乱程度。换句话说就是对于封闭系统而言，会越来越趋向于无序化。反过来，开放系统则能避免无序化。


In [2]:
import math
math.pow(3,2)

9.0

这里的math就是一个库，用import引入这个库，然后可以使用库里面的函数，比如这个pow()函数。显然，这里我们是不需要自己动手写具体函数的，我们的任务就是拿过来使用。这就是库的好处：拿过来就用，不用自己重写。

请读者注意，到现在为止，我们看到了模块、库、包这些名词，并且在开发实践中，也会常常遇到。它们有区别吗？有！只不过，现在我们暂时不区分，就笼统地说，阅读下面的内容，就理解它们之间的区分了。

## 模块是程序

模块的本质，它就是一个扩展名为.py的Python程序。我们能够在应该使用它的时候将它引用过来，节省精力，不需要重写雷同的代码。

In [2]:
import sys

sys.path.append("./pm.py")

In [3]:
import pm
pm.lang

'python'

在pm.py文件中，有一个变量lang = "python"，这次它作为模块引入（注意作为模块引入的时候，不带扩展名），就可以通过模块名字来访问变量pm.py，当然，如果不存在的属性这么去访问，肯定是要报错的。

解释器，英文是：interpreter，港台翻译为：直译器。在Python中，它的作用就是将.py的文件转化为.pyc文件，而.pyc文件是由字节码(bytecode)构成的，然后计算机执行.pyc文件。

有了.pyc文件后，每次运行，就不需要从新让解释器来编译.py文件了，除非.py文件修改了。这样，Python运行的就是那个编译好了的.pyc文件。

同样是.py文件，它是怎么知道是被当做程序执行还是被当做模块引入？

In [14]:
import sys
sys.path.append("./pm2.py")

In [15]:
import pm2
pm2.part()

'module'

In [16]:
dir(pm2)

# pm.py中的函数lang()和part是两个属性

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'lang',
 'part']

In [17]:
pm2.lang()

'python'

In [18]:
__name__

'__main__'

In [19]:
pm.__name__

'pm'

如果要作为程序执行，则\__name__ == "\__main__"；如果作为模块引入，则pm.\__name__ == "pm"，即变量\__name__的值是模块名称。

用这种方式就可以区分是执行程序还是作为模块引入了。

在一般情况下，如果仅仅是用作模块引入，可以不写if \__name__ == "\__main__"。

## 模块的位置

为了让我们自己写的模块能够被Python解释器知道，需要用sys.path.append("~/Documents/VBS/StarterLearningPython/2code/pm.py")。其实，在Python中，所有模块都被加入到了sys.path里面了。用下面的方法可以看到模块所在位置：

In [20]:
import sys
import pprint

In [21]:
pprint.pprint(sys.path)

['/home/henry/anaconda3/envs/py36pt04/lib/python36.zip',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6/lib-dynload',
 '',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages/IPython/extensions',
 '/home/henry/.ipython',
 './pm.py',
 './pm1.py',
 './pm1.py',
 './pm1.py',
 './pm2.py']


要将模块文件放到合适的位置——就是sys.path包括位置——就能够直接用import引入了

## PYTHONPATH环境变量

用sys.path.append()就是不管把文件放哪里，都可以把其位置告诉Python解释器。但是，这种方法不是很常用。因为它也有麻烦的地方，比如在交互模式下，如果关闭了，然后再开启，还得从新告知。

比较常用的告知方法是设置PYTHONPATH环境变量。

    环境变量，不同操作系统的设置方法略有差异。读者可以根据自己的操作系统，到网上搜索设置方法。

要用root权限设置环境变量

vim /etc/profile

在打开的文件最后增加export PYTHONPATH = “$PYTHONPATH：/home/qw/python”，然后保存退出即可。

环境变量更改之后，用户下次登录时生效，如果想立刻生效，则要执行下面的语句：

$ source /etc/profile


## 'all'在模块中的作用

In [24]:
import sys
sys.path.append("./pp.py")
import pp
from pp import *

public_variable

'Hello, I am a public variable.'

In [25]:
_private_variable

NameError: name '_private_variable' is not defined

变量public_variable能够被使用，但是另外一个变量_private_variable不能被调用，先观察一下两者的区别，后者是以单下划线开头的，这样的是私有变量。而from pp import *的含义是“希望能访问模块（pp）中有权限访问的全部名称”，那些被视为私有的变量或者函数或者类，没有权限被访问了。

访问具有私有性质的东西

import pp
pp._private_teacher()

In [27]:
pp._private_variable

'Hi, I am a private variable.'

在修改之后的pp1.py中，增加了__all__以它的值，在列表中包含了一个私有变量的名字和一个函数的名字。这是在告诉引用本模块的解释器，这两个东西是有权限被访问的，而且只有这两个东西。

In [32]:
import sys
sys.path.append("./pp1.py")
from pp1 import *
_private_variable

# 果然，曾经不能被访问的私有变量，现在能够访问了。

'Hi, I am a private variable.'

In [34]:
public_variable1

NameError: name 'public_variable1' is not defined

如果以import pp引入模块，再用pp._private_teacher的方式是一样有效的。

## 包或者库

包或者库，应该是比“模块”大的。也的确如此，一般来讲，一个“包”里面会有多个模块，当然，“库”是一个更大的概念了，比如Python标准库中的每个库，都可以看成有好多个包，每个包，都有若干个模块。或许这个概念不是很明确，这么理解不会耽误你使用。

对于一个包，因为它是由多个模块组成，也就是说是多个.py的文件，那么这个所谓“包”也就是我们熟悉的一个目录罢了。现在就需要解决如何引用某个目录中的模块问题了。解决方法就是在该目录中放一个\__init__.py文件。\__init__.py是一个空文件，将它放在某个目录中，就可以将该目录中的其它.py文件作为模块被引用。

例如，我建立了一个目录，名曰：package_qi，里面依次放了pm.py和pp.py两个文件，然后建立一个空文件\__init__.py

接下来，我需要导入这个包（package_qi）中的模块。

## 标准库

“python自带‘电池’”，听说过这种说法吗？

在python被安装的时候，就有不少模块也随着安装到本地的计算机上了。这些东西就如同“能源”、“电力”一样，让python拥有了无限生机，能够非常轻而易举地免费使用很多模块。所以，称之为“自带电池”。

它们被称为“标准库”。

熟悉标准库，是进行编程的必须。

### 引用方式

In [35]:
import pprint
a = {"lang":"python", "book":"www.itdiffer.com", "teacher":"qiwsir", "goal":"from beginner to master"}
pprint.pprint(a)  

# 这种方法能够让dict格式化输出
# 用import pprint样式引入模块，并以.点号的形式引用其方法。

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


In [37]:
from pprint import pprint
pprint(a)

# 从pprint模块中之将pprint()引入

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


In [39]:
# 有时候引入的模块或者方法名称有点长，可以给它重命名
import pprint as pr
pr.pprint(a)

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


In [40]:
from pprint import pprint as pt
pt(a)

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


## 深入研究

In [41]:
import pprint
dir(pprint)

['PrettyPrinter',
 '_StringIO',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_builtin_scalars',
 '_collections',
 '_perfcheck',
 '_recursion',
 '_safe_key',
 '_safe_repr',
 '_safe_tuple',
 '_sys',
 '_types',
 '_wrap_bytes_repr',
 'isreadable',
 'isrecursive',
 'pformat',
 'pprint',
 're',
 'saferepr']

In [42]:
[ m for m in dir(pprint) if not m.startswith('_') ]

['PrettyPrinter',
 'isreadable',
 'isrecursive',
 'pformat',
 'pprint',
 're',
 'saferepr']

In [44]:
help(isreadable)

NameError: name 'isreadable' is not defined

In [45]:
help(pprint.isreadable)

Help on function isreadable in module pprint:

isreadable(object)
    Determine if saferepr(object) is readable by eval().



In [46]:
help(pprint.PrettyPrinter)

Help on class PrettyPrinter in module pprint:

class PrettyPrinter(builtins.object)
 |  Methods defined here:
 |  
 |  __init__(self, indent=1, width=80, depth=None, stream=None, *, compact=False)
 |      Handle pretty printing operations onto a stream using a set of
 |      configured parameters.
 |      
 |      indent
 |          Number of spaces to indent for each level of nesting.
 |      
 |      width
 |          Attempted maximum number of columns in the output.
 |      
 |      depth
 |          The maximum depth to print out nested structures.
 |      
 |      stream
 |          The desired output stream.  If omitted (or false), the standard
 |          output stream available at construction will be used.
 |      
 |      compact
 |          If true, several items will be combined in one line.
 |  
 |  format(self, object, context, maxlevels, level)
 |      Format object for a specific context, returning a string
 |      and flags indicating whether the representation is 're

In [47]:
dir(pprint)

['PrettyPrinter',
 '_StringIO',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_builtin_scalars',
 '_collections',
 '_perfcheck',
 '_recursion',
 '_safe_key',
 '_safe_repr',
 '_safe_tuple',
 '_sys',
 '_types',
 '_wrap_bytes_repr',
 'isreadable',
 'isrecursive',
 'pformat',
 'pprint',
 're',
 'saferepr']

In [49]:
pprint.__all__

# 其实，当我们使用from pprint import *的时候，就是将__all__里面的方法引入，
# 如果没有这个，就会将其它所有属性、方法等引入，包括那些以双划线或者单划线开头的变量、函数，
# 这些东西事实上很少被在引入模块时使用。

['pprint', 'pformat', 'isreadable', 'isrecursive', 'saferepr', 'PrettyPrinter']

## 帮助、文档和源码



In [51]:
print(pprint.__doc__)

# 查看整个类的文档

Support to pretty-print lists, tuples, & dictionaries recursively.

Very simple, but useful, especially in debugging data structures.

Classes
-------

PrettyPrinter()
    Handle pretty-printing operations onto a stream using a configured
    set of formatting parameters.

Functions
---------

pformat()
    Format a Python object into a pretty-printed representation.

pprint()
    Pretty-print a Python object to a stream [default is sys.stdout].

saferepr()
    Generate a 'standard' repr()-like value, but protect against recursive
    data structures.




"""                                          #增加的

This is a document of the python module.     #增加的

"""                                          #增加的

In [62]:
import sys
sys.path.append(".")
import pm3
print(pm3.__doc__)

                                          #增加的
This is a document of the python module.     #增加的



In [63]:
print(pprint.__file__)

# 模块的位置

/home/henry/anaconda3/envs/py36pt04/lib/python3.6/pprint.py


In [64]:
# 查看源码

cat /home/henry/anaconda3/envs/py36pt04/lib/python3.6/pprint.py

#  Author:      Fred L. Drake, Jr.
#               fdrake@acm.org
#
#  This is a simple little module I wrote to make life easier.  I didn't
#  see anything quite like it in the library, though I may have overlooked
#  something.  I wrote this when I was trying to read some heavily nested
#  tuples with fairly non-descriptive content.  This is modeled very much
#  after Lisp/Scheme - style pretty-printing of lists.  If you find it
#  useful, thank small children who sleep at night.

"""Support to pretty-print lists, tuples, & dictionaries recursively.

Very simple, but useful, especially in debugging data structures.

Classes
-------

PrettyPrinter()
    Handle pretty-printing operations onto a stream using a configured
    set of formatting parameters.

Functions
---------

pformat()
    Format a Python object into a pretty-printed representation.

pprint()
    Pretty-print a Python object to a stream [default is sys.stdout].

saferepr()
    Generate a '

## sys

一个跟python解释器关系密切的标准库

In [65]:
import sys
print(sys.__doc__)

This module provides access to some objects used or maintained by the
interpreter and to functions that interact strongly with the interpreter.

Dynamic objects:

argv -- command line arguments; argv[0] is the script pathname if known
path -- module search path; path[0] is the script directory, else ''
modules -- dictionary of loaded modules

displayhook -- called to show results in an interactive session
excepthook -- called to handle any uncaught exception other than SystemExit
  To customize printing in an interactive session or to install a custom
  top-level exception handler, assign other functions to replace these.

stdin -- standard input file object; used by input()
stdout -- standard output file object; used by print()
stderr -- standard error object; used for error messages
  By assigning other file objects (or objects that behave like files)
  to these, it is possible to redirect all of the interpreter's I/O.

last_type -- type of last uncaught exception
last_value -- value

In [67]:
# sys.argv是变量，专门用来向python解释器传递参数，所以名曰“命令行参数”。

#!/usr/bin/env python
# coding=utf-8

import sys

print("The file name: ", sys.argv[0])
print("The number of argument", len(sys.argv))
print("The argument is: ", str(sys.argv))


The file name:  /home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages/ipykernel_launcher.py
The number of argument 3
The argument is:  ['/home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages/ipykernel_launcher.py', '-f', '/home/henry/.local/share/jupyter/runtime/kernel-2f7c19d6-2bbd-4e46-b38c-95ea397c0e0a.json']


In [68]:
#!/usr/bin/env python
# coding=utf-8

import sys

for i in range(10):
    if i == 5:
        sys.exit()
    else:
        print(i)

0
1
2
3
4


SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [69]:
#!/usr/bin/env python
# coding=utf-8

import sys

for i in range(10):
    if i == 5:
        sys.exit("I wet out at here.")
    else:
        print(i)

0
1
2
3
4


SystemExit: I wet out at here.

In [70]:
# sys.stdin, sys.stdout, sys.stderr  
# 类文件流对象，分别表示标准UNIX概念中的标准输入、标准输出和标准错误

for i in range(3):
    print(i)
    
# print本质就是sys.stdout.write(object + '\n')

0
1
2


In [71]:
for i in range(3):
     sys.stdout.write(str(i))

012

关键是通过sys.stdout能够做到将输出内容从“控制台”转到“文件”，称之为重定向。这样也许控制台看不到（很多时候这个不重要），但是文件中已经有了输出内容。

In [None]:
f = open("stdout.md","w")
sys.stdout = f
print("Learn python: From Beginner to Master")
f.close()

In [None]:
cat stdout.md

## copy

块中常用的就是copy和deepcopy

In [1]:
import copy
copy.__all__

['Error', 'copy', 'deepcopy']

In [2]:
#!/usr/bin/env python
# coding=utf-8

import copy

class MyCopy(object):
    def __init__(self, value):
        self.value = value

    def __repr__(self):
        return str(self.value)

foo = MyCopy(7)

a = ["foo", foo]
b = a[:]
c = list(a)
d = copy.copy(a)
e = copy.deepcopy(a)

a.append("abc")
foo.value = 17

print("original: %r\n slice: %r\n list(): %r\n copy(): %r\n deepcopy(): %r\n" % (a,b,c,d,e))


original: ['foo', 17, 'abc']
 slice: ['foo', 17]
 list(): ['foo', 17]
 copy(): ['foo', 17]
 deepcopy(): ['foo', 7]



## OS
os模块提供了访问操作系统服务的功能，它所包含的内容比较多。

In [3]:
import os
os.rename("22201.py", "newtemp.py")

In [4]:
ls

[0m[01;32m130.txt[0m*    [01;32m23503.txt[0m*         [01;32mpm3.py[0m*       [01;32ms3_2.py[0m*         [01;32mSection4.ipynb[0m*
[01;32m131.txt[0m*    [01;32ma.txt[0m*             [01;32mpm.py[0m*        [01;32mSection1.ipynb[0m*  [01;32mSection5.ipynb[0m*
[01;32m208.txt[0m*    [01;32menvironment.yaml[0m*  [01;32mpp1.py[0m*       [01;32mSection2.ipynb[0m*  [01;32mSection6.ipynb[0m*
[01;32m23501.txt[0m*  [01;32mnewtemp.py[0m*        [01;32mpp.py[0m*        [01;32msection2.md[0m*     [01;32mSection7.ipynb[0m*
[01;32m23502.txt[0m*  [01;32mpm2.py[0m*            [34;42m__pycache__[0m/  [01;32mSection3.ipynb[0m*  [01;32mstdout.md[0m*


In [5]:
ls new*

[0m[01;32mnewtemp.py[0m*


In [6]:
cat newtemp.py

#!/usr/bin/env python
# coding=utf-8

print("This is a tmp file.")


In [8]:
os.remove("./tmp/a.py")

In [9]:
files = os.listdir("./tmp")
for f in files:
    print(f)

.ipynb_checkpoints
b.py
c.py


In [10]:
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python


In [11]:
os.chdir(os.pardir)
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode


In [12]:
os.chdir("Python")
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python


In [13]:
os.pardir

'..'

In [14]:
os.removedirs(cwd + '/tmp')

# 要删除某个目录，那个目录必须是空的。

OSError: [Errno 39] Directory not empty: '/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python/tmp'

In [16]:
os.makedirs("newrd")

In [17]:
os.removedirs(cwd + '/newrd')