# 模块

## 编写模块

在本章之前，Python还没有显示出太突出的优势。本章开始，读者就会越来越感觉到Python的强大了。这种强大体现在“模块自信”上，因为Python不仅有很强大的自有模块（或者包、库，比如为标准库），还有海量的第三方模块（或者包、库），任何人还都能自己开发模块（或者包、库），正是有了这么强大的“模块自信”，才体现了Python的优势所在。并且这种方式也正在不断被更多其它语言所借鉴。

“模块自信”的本质是：开放。

Python不是一个封闭的体系，是一个开放系统。开放系统的最大好处就是避免了“熵增”。

熵的概念是由德国物理学家克劳修斯于1865年（这一年李鸿章建立了江南机械制造总局，美国废除奴隶制，林肯总统遇刺身亡，美国南北战争结束。）所提出，是一种测量在动力学方面不能做功的能量总数，也就是当总体的熵增加，其做功能力也下降，熵的量度正是能量退化的指标。

熵亦被用于计算一个系统中的失序现象，也就是计算该系统混乱的程度。

根据熵的统计学定义， 热力学第二定律说明一个孤立系统的倾向于增加混乱程度。换句话说就是对于封闭系统而言，会越来越趋向于无序化。反过来，开放系统则能避免无序化。


In [2]:
import math
math.pow(3,2)

9.0

这里的math就是一个库，用import引入这个库，然后可以使用库里面的函数，比如这个pow()函数。显然，这里我们是不需要自己动手写具体函数的，我们的任务就是拿过来使用。这就是库的好处：拿过来就用，不用自己重写。

请读者注意，到现在为止，我们看到了模块、库、包这些名词，并且在开发实践中，也会常常遇到。它们有区别吗？有！只不过，现在我们暂时不区分，就笼统地说，阅读下面的内容，就理解它们之间的区分了。

## 模块是程序

模块的本质，它就是一个扩展名为.py的Python程序。我们能够在应该使用它的时候将它引用过来，节省精力，不需要重写雷同的代码。

In [2]:
import sys

sys.path.append("./pm.py")

In [3]:
import pm
pm.lang

'python'

在pm.py文件中，有一个变量lang = "python"，这次它作为模块引入（注意作为模块引入的时候，不带扩展名），就可以通过模块名字来访问变量pm.py，当然，如果不存在的属性这么去访问，肯定是要报错的。

解释器，英文是：interpreter，港台翻译为：直译器。在Python中，它的作用就是将.py的文件转化为.pyc文件，而.pyc文件是由字节码(bytecode)构成的，然后计算机执行.pyc文件。

有了.pyc文件后，每次运行，就不需要从新让解释器来编译.py文件了，除非.py文件修改了。这样，Python运行的就是那个编译好了的.pyc文件。

同样是.py文件，它是怎么知道是被当做程序执行还是被当做模块引入？

In [14]:
import sys
sys.path.append("./pm2.py")

In [15]:
import pm2
pm2.part()

'module'

In [16]:
dir(pm2)

# pm.py中的函数lang()和part是两个属性

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'lang',
 'part']

In [17]:
pm2.lang()

'python'

In [18]:
__name__

'__main__'

In [19]:
pm.__name__

'pm'

如果要作为程序执行，则\__name__ == "\__main__"；如果作为模块引入，则pm.\__name__ == "pm"，即变量\__name__的值是模块名称。

用这种方式就可以区分是执行程序还是作为模块引入了。

在一般情况下，如果仅仅是用作模块引入，可以不写if \__name__ == "\__main__"。

## 模块的位置

为了让我们自己写的模块能够被Python解释器知道，需要用sys.path.append("~/Documents/VBS/StarterLearningPython/2code/pm.py")。其实，在Python中，所有模块都被加入到了sys.path里面了。用下面的方法可以看到模块所在位置：

In [20]:
import sys
import pprint

In [21]:
pprint.pprint(sys.path)

['/home/henry/anaconda3/envs/py36pt04/lib/python36.zip',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6/lib-dynload',
 '',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages',
 '/home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages/IPython/extensions',
 '/home/henry/.ipython',
 './pm.py',
 './pm1.py',
 './pm1.py',
 './pm1.py',
 './pm2.py']


要将模块文件放到合适的位置

——就是sys.path包括位置

——就能够直接用import引入了

## PYTHONPATH环境变量

用sys.path.append()就是不管把文件放哪里，都可以把其位置告诉Python解释器。但是，这种方法不是很常用。因为它也有麻烦的地方，比如在交互模式下，如果关闭了，然后再开启，还得从新告知。

比较常用的告知方法是设置PYTHONPATH环境变量。

    环境变量，不同操作系统的设置方法略有差异。读者可以根据自己的操作系统，到网上搜索设置方法。

要用root权限设置环境变量

vim /etc/profile

在打开的文件最后增加export PYTHONPATH = “$PYTHONPATH：/home/qw/python”，然后保存退出即可。

环境变量更改之后，用户下次登录时生效，如果想立刻生效，则要执行下面的语句：

$ source /etc/profile


## 'all'在模块中的作用

In [24]:
import sys
sys.path.append("./pp.py")
import pp
from pp import *

public_variable

'Hello, I am a public variable.'

In [25]:
_private_variable

NameError: name '_private_variable' is not defined

变量public_variable能够被使用，但是另外一个变量_private_variable不能被调用，先观察一下两者的区别，后者是以单下划线开头的，这样的是私有变量。而from pp import *的含义是“希望能访问模块（pp）中有权限访问的全部名称”，那些被视为私有的变量或者函数或者类，没有权限被访问了。

访问具有私有性质的东西

import pp
pp._private_teacher()

In [27]:
pp._private_variable

'Hi, I am a private variable.'

在修改之后的pp1.py中，增加了\__all__以它的值，在列表中包含了一个私有变量的名字和一个函数的名字。这是在告诉引用本模块的解释器，这两个东西是有权限被访问的，而且只有这两个东西。

In [32]:
import sys
sys.path.append("./pp1.py")
from pp1 import *
_private_variable

# 果然，曾经不能被访问的私有变量，现在能够访问了。

'Hi, I am a private variable.'

In [34]:
public_variable1

NameError: name 'public_variable1' is not defined

如果以import pp引入模块，再用pp._private_teacher的方式是一样有效的。

## 包或者库

包或者库，应该是比“模块”大的。也的确如此，一般来讲，一个“包”里面会有多个模块，当然，“库”是一个更大的概念了，比如Python标准库中的每个库，都可以看成有好多个包，每个包，都有若干个模块。或许这个概念不是很明确，这么理解不会耽误你使用。

对于一个包，因为它是由多个模块组成，也就是说是多个.py的文件，那么这个所谓“包”也就是我们熟悉的一个目录罢了。现在就需要解决如何引用某个目录中的模块问题了。解决方法就是在该目录中放一个\__init__.py文件。\__init__.py是一个空文件，将它放在某个目录中，就可以将该目录中的其它.py文件作为模块被引用。

## 标准库

“python自带‘电池’”，听说过这种说法吗？

在python被安装的时候，就有不少模块也随着安装到本地的计算机上了。这些东西就如同“能源”、“电力”一样，让python拥有了无限生机，能够非常轻而易举地免费使用很多模块。所以，称之为“自带电池”。

它们被称为“标准库”。

熟悉标准库，是进行编程的必须。

### 引用方式

In [35]:
import pprint
a = {"lang":"python", "book":"www.itdiffer.com", "teacher":"qiwsir", "goal":"from beginner to master"}
pprint.pprint(a)  

# 这种方法能够让dict格式化输出
# 用import pprint样式引入模块，并以.点号的形式引用其方法。

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


In [37]:
from pprint import pprint
pprint(a)

# 从pprint模块中之将pprint()引入

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


In [39]:
# 有时候引入的模块或者方法名称有点长，可以给它重命名
import pprint as pr
pr.pprint(a)

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


In [40]:
from pprint import pprint as pt
pt(a)

{'book': 'www.itdiffer.com',
 'goal': 'from beginner to master',
 'lang': 'python',
 'teacher': 'qiwsir'}


## 深入研究

In [41]:
import pprint
dir(pprint)

['PrettyPrinter',
 '_StringIO',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_builtin_scalars',
 '_collections',
 '_perfcheck',
 '_recursion',
 '_safe_key',
 '_safe_repr',
 '_safe_tuple',
 '_sys',
 '_types',
 '_wrap_bytes_repr',
 'isreadable',
 'isrecursive',
 'pformat',
 'pprint',
 're',
 'saferepr']

In [42]:
[ m for m in dir(pprint) if not m.startswith('_') ]

['PrettyPrinter',
 'isreadable',
 'isrecursive',
 'pformat',
 'pprint',
 're',
 'saferepr']

In [44]:
help(isreadable)

NameError: name 'isreadable' is not defined

In [45]:
help(pprint.isreadable)

Help on function isreadable in module pprint:

isreadable(object)
    Determine if saferepr(object) is readable by eval().



In [46]:
help(pprint.PrettyPrinter)

Help on class PrettyPrinter in module pprint:

class PrettyPrinter(builtins.object)
 |  Methods defined here:
 |  
 |  __init__(self, indent=1, width=80, depth=None, stream=None, *, compact=False)
 |      Handle pretty printing operations onto a stream using a set of
 |      configured parameters.
 |      
 |      indent
 |          Number of spaces to indent for each level of nesting.
 |      
 |      width
 |          Attempted maximum number of columns in the output.
 |      
 |      depth
 |          The maximum depth to print out nested structures.
 |      
 |      stream
 |          The desired output stream.  If omitted (or false), the standard
 |          output stream available at construction will be used.
 |      
 |      compact
 |          If true, several items will be combined in one line.
 |  
 |  format(self, object, context, maxlevels, level)
 |      Format object for a specific context, returning a string
 |      and flags indicating whether the representation is 're

In [47]:
dir(pprint)

['PrettyPrinter',
 '_StringIO',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_builtin_scalars',
 '_collections',
 '_perfcheck',
 '_recursion',
 '_safe_key',
 '_safe_repr',
 '_safe_tuple',
 '_sys',
 '_types',
 '_wrap_bytes_repr',
 'isreadable',
 'isrecursive',
 'pformat',
 'pprint',
 're',
 'saferepr']

In [49]:
pprint.__all__

# 其实，当我们使用from pprint import *的时候，就是将__all__里面的方法引入，
# 如果没有这个，就会将其它所有属性、方法等引入，包括那些以双划线或者单划线开头的变量、函数，
# 这些东西事实上很少被在引入模块时使用。

['pprint', 'pformat', 'isreadable', 'isrecursive', 'saferepr', 'PrettyPrinter']

## 帮助、文档和源码



In [51]:
print(pprint.__doc__)

# 查看整个类的文档

Support to pretty-print lists, tuples, & dictionaries recursively.

Very simple, but useful, especially in debugging data structures.

Classes
-------

PrettyPrinter()
    Handle pretty-printing operations onto a stream using a configured
    set of formatting parameters.

Functions
---------

pformat()
    Format a Python object into a pretty-printed representation.

pprint()
    Pretty-print a Python object to a stream [default is sys.stdout].

saferepr()
    Generate a 'standard' repr()-like value, but protect against recursive
    data structures.




"""                                          #增加的

This is a document of the python module.     #增加的

"""                                          #增加的

In [62]:
import sys
sys.path.append(".")
import pm3
print(pm3.__doc__)

                                          #增加的
This is a document of the python module.     #增加的



In [63]:
print(pprint.__file__)

# 模块的位置

/home/henry/anaconda3/envs/py36pt04/lib/python3.6/pprint.py


In [64]:
# 查看源码

cat /home/henry/anaconda3/envs/py36pt04/lib/python3.6/pprint.py

#  Author:      Fred L. Drake, Jr.
#               fdrake@acm.org
#
#  This is a simple little module I wrote to make life easier.  I didn't
#  see anything quite like it in the library, though I may have overlooked
#  something.  I wrote this when I was trying to read some heavily nested
#  tuples with fairly non-descriptive content.  This is modeled very much
#  after Lisp/Scheme - style pretty-printing of lists.  If you find it
#  useful, thank small children who sleep at night.

"""Support to pretty-print lists, tuples, & dictionaries recursively.

Very simple, but useful, especially in debugging data structures.

Classes
-------

PrettyPrinter()
    Handle pretty-printing operations onto a stream using a configured
    set of formatting parameters.

Functions
---------

pformat()
    Format a Python object into a pretty-printed representation.

pprint()
    Pretty-print a Python object to a stream [default is sys.stdout].

saferepr()
    Generate a '

## sys

一个跟python解释器关系密切的标准库

In [65]:
import sys
print(sys.__doc__)

This module provides access to some objects used or maintained by the
interpreter and to functions that interact strongly with the interpreter.

Dynamic objects:

argv -- command line arguments; argv[0] is the script pathname if known
path -- module search path; path[0] is the script directory, else ''
modules -- dictionary of loaded modules

displayhook -- called to show results in an interactive session
excepthook -- called to handle any uncaught exception other than SystemExit
  To customize printing in an interactive session or to install a custom
  top-level exception handler, assign other functions to replace these.

stdin -- standard input file object; used by input()
stdout -- standard output file object; used by print()
stderr -- standard error object; used for error messages
  By assigning other file objects (or objects that behave like files)
  to these, it is possible to redirect all of the interpreter's I/O.

last_type -- type of last uncaught exception
last_value -- value

In [1]:
# sys.argv是变量，专门用来向python解释器传递参数，所以名曰“命令行参数”。

#!/usr/bin/env python
# coding=utf-8

import sys

print("The file name: ", sys.argv[0])
print("The number of argument", len(sys.argv))
print("The argument is: ", str(sys.argv))


The file name:  /home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages/ipykernel_launcher.py
The number of argument 3
The argument is:  ['/home/henry/anaconda3/envs/py36pt04/lib/python3.6/site-packages/ipykernel_launcher.py', '-f', '/home/henry/.local/share/jupyter/runtime/kernel-0c3d340d-43ee-4bb1-b77d-c173fcc3b90a.json']


In [2]:
#!/usr/bin/env python
# coding=utf-8

import sys

for i in range(10):
    if i == 5:
        sys.exit()
    else:
        print(i)

0
1
2
3
4


SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [69]:
#!/usr/bin/env python
# coding=utf-8

import sys

for i in range(10):
    if i == 5:
        sys.exit("I wet out at here.")
    else:
        print(i)

0
1
2
3
4


SystemExit: I wet out at here.

In [70]:
# sys.stdin, sys.stdout, sys.stderr  
# 类文件流对象，分别表示标准UNIX概念中的标准输入、标准输出和标准错误

for i in range(3):
    print(i)
    
# print本质就是sys.stdout.write(object + '\n')

0
1
2


In [71]:
for i in range(3):
     sys.stdout.write(str(i))

012

关键是通过sys.stdout能够做到将输出内容从“控制台”转到“文件”，称之为重定向。这样也许控制台看不到（很多时候这个不重要），但是文件中已经有了输出内容。

In [None]:
f = open("stdout.md","w")
sys.stdout = f
print("Learn python: From Beginner to Master")
f.close()

In [None]:
cat stdout.md

## copy

块中常用的就是copy和deepcopy

In [1]:
import copy
copy.__all__

['Error', 'copy', 'deepcopy']

In [2]:
#!/usr/bin/env python
# coding=utf-8

import copy

class MyCopy(object):
    def __init__(self, value):
        self.value = value

    def __repr__(self):
        return str(self.value)

foo = MyCopy(7)

a = ["foo", foo]
b = a[:]
c = list(a)
d = copy.copy(a)
e = copy.deepcopy(a)

a.append("abc")
foo.value = 17

print("original: %r\n slice: %r\n list(): %r\n copy(): %r\n deepcopy(): %r\n" % (a,b,c,d,e))


original: ['foo', 17, 'abc']
 slice: ['foo', 17]
 list(): ['foo', 17]
 copy(): ['foo', 17]
 deepcopy(): ['foo', 7]



## OS
os模块提供了访问操作系统服务的功能，它所包含的内容比较多。

In [4]:
import os
os.rename("22201.py", "newtemp.py")

FileNotFoundError: [Errno 2] No such file or directory: '22201.py' -> 'newtemp.py'

In [4]:
ls

[0m[01;32m130.txt[0m*    [01;32m23503.txt[0m*         [01;32mpm3.py[0m*       [01;32ms3_2.py[0m*         [01;32mSection4.ipynb[0m*
[01;32m131.txt[0m*    [01;32ma.txt[0m*             [01;32mpm.py[0m*        [01;32mSection1.ipynb[0m*  [01;32mSection5.ipynb[0m*
[01;32m208.txt[0m*    [01;32menvironment.yaml[0m*  [01;32mpp1.py[0m*       [01;32mSection2.ipynb[0m*  [01;32mSection6.ipynb[0m*
[01;32m23501.txt[0m*  [01;32mnewtemp.py[0m*        [01;32mpp.py[0m*        [01;32msection2.md[0m*     [01;32mSection7.ipynb[0m*
[01;32m23502.txt[0m*  [01;32mpm2.py[0m*            [34;42m__pycache__[0m/  [01;32mSection3.ipynb[0m*  [01;32mstdout.md[0m*


In [5]:
ls new*

[0m[01;32mnewtemp.py[0m*


In [6]:
cat newtemp.py

#!/usr/bin/env python
# coding=utf-8

print("This is a tmp file.")


In [8]:
os.remove("./tmp/a.py")

In [9]:
files = os.listdir("./tmp")
for f in files:
    print(f)

.ipynb_checkpoints
b.py
c.py


In [10]:
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python


In [11]:
os.chdir(os.pardir)
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode


In [12]:
os.chdir("Python")
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python


In [13]:
os.pardir

'..'

In [14]:
os.removedirs(cwd + '/tmp')

# 要删除某个目录，那个目录必须是空的。

OSError: [Errno 39] Directory not empty: '/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python/tmp'

In [16]:
os.makedirs("newrd")

In [17]:
os.removedirs(cwd + '/newrd')

In [18]:
os.listdir(os.getcwd())

['.ipynb_checkpoints',
 '130.txt',
 '131.txt',
 '208.txt',
 '23501.txt',
 '23502.txt',
 '23503.txt',
 'a.txt',
 'environment.yaml',
 'newtemp.py',
 'pm.py',
 'pm2.py',
 'pm3.py',
 'pp.py',
 'pp1.py',
 's3_2.py',
 'Section1.ipynb',
 'Section2.ipynb',
 'section2.md',
 'Section3.ipynb',
 'Section4.ipynb',
 'Section5.ipynb',
 'Section6.ipynb',
 'Section7.ipynb',
 'stdout.md',
 'tmp',
 '__pycache__']

In [19]:
os.chdir("tmp")

In [21]:
os.listdir(os.getcwd())
newdir = os.getcwd()
os.removedirs(newdir)

OSError: [Errno 39] Directory not empty: '/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python/tmp'

In [23]:
os.chdir(os.pardir)
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode


In [24]:
os.chdir("Python")
cwd = os.getcwd()
print(cwd)

/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python


In [6]:
p = os.getcwd()    #当前目录
os.stat(p)

os.stat_result(st_mode=16895, st_ino=771095, st_dev=2067, st_nlink=1, st_uid=1000, st_gid=1000, st_size=4096, st_atime=1581418045, st_mtime=1581418170, st_ctime=1581418170)

In [8]:
pf = p + "/a.txt"
os.stat(pf)

os.stat_result(st_mode=33279, st_ino=728320, st_dev=2067, st_nlink=1, st_uid=1000, st_gid=1000, st_size=11, st_atime=1581134373, st_mtime=1581134344, st_ctime=1581134344)

In [9]:
import time

fi = os.stat(pf)  # 用os.stat()能够查看文件或者目录的属性。
mt = fi[8]   # fi[8]就是st_mtime的值，它代表最后modified（修改）文件的时间
print(mt)
time.ctime(mt)

1581134344


'Sat Feb  8 11:59:04 2020'

## 操作命令

os模块中提供了这样的方法，许可程序员在python程序中使用操作系统的命令。

In [15]:
path = '/media/henry/000471D8000C54DE/Files/Github/LeetCode/Python'

command = "ls " + p
command

'ls /media/henry/000471D8000C54DE/Files/Github/LeetCode/Python'

In [22]:
os.system(command)

0

In [21]:
os.system('ls')

0

os.system()是在当前进程中执行命令，直到它执行结束。如果需要一个新的进程，可以使用os.exec或者os.execvp。对此有兴趣详细了解的读者，可以查看帮助文档了解。另外，os.system()是通过shell执行命令，执行结束后将控制权返回到原来的进程，但是os.exec()及相关的函数，则在执行后不将控制权返回到原继承，从而使python失去控制。

In [23]:
os.system("/usr/bin/firefox")  # 启动浏览器

0

In [24]:
import webbrowser
webbrowser.open("http://www.itdiffer.com")

# 可以专门用来打开指定网页

True

## heapq

堆（heap），是一种数据结构。用维基百科中的说明：

堆（英语：heap)，是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。

对于这个新的概念，读者不要感觉心慌意乱或者恐惧，因为它本质上不是新东西，而是在我们已经熟知的知识基础上的扩展。

堆的实现是通过构造二叉堆，也就是一种二叉树。

在计算机科学中，二叉樹（英语：Binary tree）是每個節點最多有兩個子樹的樹結構。通常子樹被稱作「左子樹」（left subtree）和「右子樹」（right subtree）。二叉樹常被用於實現二叉查找樹和二叉堆。

在上图的二叉树中，最顶端的那个数字就相当于树根，也就称作“根”。每个数字所在位置成为一个节点，每个节点向下分散出两个“子节点”。就上图的二叉树，在最后一层，并不是所有节点都有两个子节点，这类二叉树又称为完全二叉树（Complete Binary Tree），也有的二叉树，所有的节点都有两个子节点，这类二叉树称作满二叉树（Full Binarry Tree)

实现二叉堆就是通过二叉树实现的。其应该具有如下特点：

节点的值大于等于（或者小于等于）任何子节点的值。

节点左子树和右子树是一个二叉堆。如果父节点的值总大于等于任何一个子节点的值，其为最大堆；若父节点值总小于等于子节点值，为最小堆。上面图示中的完全二叉树，就表示一个最小堆。

堆的类型还有别的，如斐波那契堆等，但很少用。所以，通常就将二叉堆也说成堆。下面所说的堆，就是二叉堆。而二叉堆又是用二叉树实现的。

从图示中可以看出，将逻辑结构中的树的节点数字依次填入到存储结构中。看这个图，似乎是列表中按照顺序进行排列似的。

In [20]:
import heapq
heapq.__all__

['heappush',
 'heappop',
 'heapify',
 'heapreplace',
 'merge',
 'nlargest',
 'nsmallest',
 'heappushpop']

In [21]:
heap = []
heapq.heappush(heap, 3)  # 自动按照二叉树的结构进行存储
heapq.heappush(heap, 9)
heapq.heappush(heap, 2)
heapq.heappush(heap, 4)
heapq.heappush(heap, 0)
heapq.heappush(heap, 8)

heap

[0, 2, 3, 9, 4, 8]

但是，当我查看堆的数据时，显示给我的是一个有一定顺序的数据结构。这种顺序不是按照从小到大，而是按照前面所说的完全二叉树的方式排列。显示的是存储结构，可以把它还原为逻辑结构，看看是不是一颗二叉树。

heappush 顺序
https://www.jb51.net/article/87552.htm

In [22]:
heapq.heappop(heap)  # 删除最小元素
heap

[2, 4, 3, 9, 8]

从heap堆中删除了一个最小元素，并且返回该值。但是，这时候的heap显示顺序，并非简单地将0去除，而是按照完全二叉树的规范重新进行排列。

In [23]:
hl = [2, 4, 6, 8, 9, 0, 1, 5, 3]  
heapq.heapify(hl)  # 将列表转换为堆
hl

[0, 3, 1, 4, 9, 6, 2, 5, 8]

要将树转换为堆，我们将从树的底部向上工作。我们将每个节点与其子节点进行比较并移动节点，以使父节点始终小于其子节点。

https://blog.csdn.net/alzzw/article/details/98087519

In [24]:
heapq.heappop(hl)

0

In [25]:
heapq.heappop(hl)

hl

[2, 3, 5, 4, 9, 6, 8]

In [26]:
heapq.heapreplace(hl, 3.14)
hl

[3, 3.14, 5, 4, 9, 6, 8]

各种算法的Python实现方案（Python and Algorithm）
https://www.bookstack.cn/read/Python-and-Algorithm/README.md

## deque模块

In [32]:
lst = [1, 2, 3]
lst.append(4)
lst

[1, 2, 3, 4]

In [33]:
nl = [7]
nl.extend(lst)
nl

[7, 1, 2, 3, 4]

In [34]:
from collections import deque

qlst = deque(lst)

qlst.append(5)  #从右边增加
qlst

deque([1, 2, 3, 4, 5])

In [35]:
qlst.appendleft(7)  #从左边增加
qlst

deque([7, 1, 2, 3, 4, 5])

In [36]:
qlst.pop()   # 删除右边
qlst

deque([7, 1, 2, 3, 4])

In [37]:
qlst.popleft()  # 删除左边
qlst

deque([1, 2, 3, 4])

In [38]:
qlst.rotate(3)
qlst

# 如果是rotate(3)，表示每个数字按照顺时针方向前进三个位置
# 元素向右前进再返回第一个开始

deque([2, 3, 4, 1])

In [39]:
qlst.rotate(-1)
qlst

# 如果是rotate(-1)，表示每个数字按照逆时针方向前进一个位置
# 元素向左前进再返回第一个开始

deque([3, 4, 1, 2])

## calendar

In [43]:
import calendar
cal = calendar.month(2020,2)
print(cal)

   February 2020
Mo Tu We Th Fr Sa Su
                1  2
 3  4  5  6  7  8  9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29



In [44]:
year = calendar.calendar(2020)
print(year)

                                  2020

      January                   February                   March
Mo Tu We Th Fr Sa Su      Mo Tu We Th Fr Sa Su      Mo Tu We Th Fr Sa Su
       1  2  3  4  5                      1  2                         1
 6  7  8  9 10 11 12       3  4  5  6  7  8  9       2  3  4  5  6  7  8
13 14 15 16 17 18 19      10 11 12 13 14 15 16       9 10 11 12 13 14 15
20 21 22 23 24 25 26      17 18 19 20 21 22 23      16 17 18 19 20 21 22
27 28 29 30 31            24 25 26 27 28 29         23 24 25 26 27 28 29
                                                    30 31

       April                      May                       June
Mo Tu We Th Fr Sa Su      Mo Tu We Th Fr Sa Su      Mo Tu We Th Fr Sa Su
       1  2  3  4  5                   1  2  3       1  2  3  4  5  6  7
 6  7  8  9 10 11 12       4  5  6  7  8  9 10       8  9 10 11 12 13 14
13 14 15 16 17 18 19      11 12 13 14 15 16 17      15 16 17 18 19 20 21
20 21 22 23 24 25 26      18 19 20 21 22 

In [46]:
calendar.isleap(2020)  # 判断一年是闰年

True

In [47]:
calendar.leapdays(2000,2005)

# 返回在Y1，Y2两年之间的闰年总数
# 左开右闭

2

In [50]:
print(calendar.month(2020,2))

   February 2020
Mo Tu We Th Fr Sa Su
                1  2
 3  4  5  6  7  8  9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29



In [53]:
print(calendar.month(2020,2,w=3,l=2))

       February 2020

Mon Tue Wed Thu Fri Sat Sun

                      1   2

  3   4   5   6   7   8   9

 10  11  12  13  14  15  16

 17  18  19  20  21  22  23

 24  25  26  27  28  29




In [55]:
calendar.monthcalendar(2020, 2)

# 返回一个列表，列表内的元素还是列表，这叫做嵌套列表。
# 每个子列表代表一个星期，都是从星期一到星期日，如果没有本月的日期，则为0。

[[0, 0, 0, 0, 0, 1, 2],
 [3, 4, 5, 6, 7, 8, 9],
 [10, 11, 12, 13, 14, 15, 16],
 [17, 18, 19, 20, 21, 22, 23],
 [24, 25, 26, 27, 28, 29, 0]]

In [57]:
calendar.monthrange(2020, 1)

# 第一个整数代表着该月的第一天从星期几是（从0开始，依次为星期一、星期二，直到6代表星期日）。
# 第二个整数是该月一共多少天。

(2, 31)

In [59]:
calendar.weekday(2020, 2, 25)

# 输入年月日，知道该日是星期几（注意，返回值依然按照从0到6依次对应星期一到星期日）

1

## time

In [61]:
import time
time.time()

# time.time()获得的是当前时间（严格说是时间戳），只不过这个时间对人不友好，
# 它是以1970年1月1日0时0分0秒为计时起点，到当前的时间长度（不考虑闰秒）

1582597606.009643

In [62]:
time.localtime()

time.struct_time(tm_year=2020, tm_mon=2, tm_mday=25, tm_hour=10, tm_min=27, tm_sec=37, tm_wday=1, tm_yday=56, tm_isdst=0)

In [67]:
time.gmtime()

# localtime()得到的是本地时间，如果要国际化，就最好使用格林威治时间

time.struct_time(tm_year=2020, tm_mon=2, tm_mday=25, tm_hour=2, tm_min=29, tm_sec=27, tm_wday=1, tm_yday=56, tm_isdst=0)

In [68]:
time.asctime()

'Tue Feb 25 10:29:33 2020'

In [70]:
h = time.localtime(1000000)
h

time.struct_time(tm_year=1970, tm_mon=1, tm_mday=12, tm_hour=21, tm_min=46, tm_sec=40, tm_wday=0, tm_yday=12, tm_isdst=0)

In [71]:
time.asctime(h)

'Mon Jan 12 21:46:40 1970'

In [69]:
time.ctime()

'Tue Feb 25 10:29:48 2020'

In [72]:
time.ctime(1000000)

'Mon Jan 12 21:46:40 1970'

在前述函数中，通过localtime()、gmtime()得到的是时间元组，通过time()得到的是时间戳。有的函数如asctime()是以时间元组为参数，有的如ctime()是以时间戳为函数。这样做的目的是为了满足编程中多样化的需要。

In [73]:
lt = time.localtime()
lt

time.struct_time(tm_year=2020, tm_mon=2, tm_mday=25, tm_hour=10, tm_min=31, tm_sec=21, tm_wday=1, tm_yday=56, tm_isdst=0)

In [74]:
time.strftime("%y,%m,%d")

'20,02,25'

In [76]:
time.strftime("%y/%m/%d")

# 分隔符可以自由指定，已经变成字符串了

'20/02/25'

In [77]:
today = time.strftime("%y/%m/%d")
today

'20/02/25'

In [78]:
time.strptime(today, "%y/%m/%d")

time.struct_time(tm_year=2020, tm_mon=2, tm_mday=25, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=1, tm_yday=56, tm_isdst=-1)

## datetime

datetime模块中有几个类：

* datetime.date：日期类，常用的属性有year/month/day
* datetime.time：时间类，常用的有hour/minute/second/microsecond
* datetime.datetime：日期时间类
* datetime.timedelta：时间间隔，即两个时间点之间的时间长度
* datetime.tzinfo：时区类

In [79]:
import datetime
today = datetime.date.today()
today

datetime.date(2020, 2, 25)

In [80]:
print(today)

2020-02-25


In [81]:
print(today.ctime())

Tue Feb 25 00:00:00 2020


In [82]:
print(today.timetuple())

time.struct_time(tm_year=2020, tm_mon=2, tm_mday=25, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=1, tm_yday=56, tm_isdst=-1)


In [83]:
print(today.toordinal())

737480


In [84]:
print(today.year)

2020


In [86]:
to = today.toordinal()
print(datetime.date.fromordinal(to))

2020-02-25


In [87]:
import time
t = time.time()
print(datetime.date.fromtimestamp(t))

2020-02-25


In [88]:
d1 = datetime.date(2020,2,1)
print(d1)
d2 = d1.replace(year=2020, day=5)
print(d2)

2020-02-01
2020-02-05


In [89]:
t = datetime.time(1,2,3)
print(t)

01:02:03


In [90]:
print(t.hour)

1


In [91]:
print(t.second)

3


In [92]:
now = datetime.datetime.now()
print(now)

2020-02-25 10:37:45.541450


In [94]:
b = now + datetime.timedelta(hours=5)
print(b)

# 对now增加5个小时

2020-02-25 15:37:45.541450


In [95]:
c = now + datetime.timedelta(weeks=2)
print(c)

# 对week增加2周

2020-03-10 10:37:45.541450


In [96]:
d = c -b
print(d)

# 计算时间差

13 days, 19:00:00


## urllib

urllib模块用于读取来自网上（服务器上）的数据，比如不少人用python做爬虫程序，就可以使用这个模块。

In [100]:
import urllib.request

dir(urllib)

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 'error',
 'parse',
 'request',
 'response']

In [102]:
def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html

In [103]:
html = getHtml("http://www.baidu.com")
 
print(html)



## xml

“当 XML（扩展标记语言）于 1998 年 2 月被引入软件工业界时，它给整个行业带来了一场风暴。有史以来第一次，这个世界拥有了一种用来结构化文档和数据的通用且适应性强的格式，它不仅仅可以用于 WEB，而且可以被用于任何地方。”

对于xml如果要做一个定义式的说明，就不得不引用w3school里面简洁而明快的说明：

* XML 指可扩展标记语言（EXtensible Markup Language）
* XML 是一种标记语言，很类似 HTML
* XML 的设计宗旨是传输数据，而非显示数据
* XML 标签没有被预定义。您需要自行定义标签。
* XML 被设计为具有自我描述性。
* XML 是 W3C 的推荐标准

xml的重要，关键在于它是用来传输数据，因为传输数据，特别是在web编程中，经常要用到的。有了这样一种东西，就让数据传输变得简单了。对于这么重要的，python当然有支持。

一般来讲，一个引人关注的东西，总会有很多人从不同侧面去关注。在编程语言中也是如此，所以，对xml这个明星式的东西，python提供了多种模块来处理。

* xml.dom.* 模块：Document Object Model。适合用于处理 DOM API。它能够将xml数据在内存中解析成一个树，然后通过对树的操作来操作xml。但是，这种方式由于将xml数据映射到内存中的树，导致比较慢，且消耗更多内存。
* xml.sax.* 模块：simple API for XML。由于SAX以流式读取xml文件，从而速度较快，切少占用内存，但是操作上稍复杂，需要用户实现回调函数。
* xml.parser.expat：是一个直接的，低级一点的基于 C 的 expat 的语法分析器。 expat接口基于事件反馈，有点像 SAX 但又不太像，因为它的接口并不是完全规范于 expat 库的。
* xml.etree.ElementTree (以下简称 ET)：元素树。它提供了轻量级的python式的API，相对于DOM，ET快了很多 ，而且有很多令人愉悦的API可以使用；相对于SAX，ET也有ET.iterparse提供了 “在空中” 的处理方式，没有必要加载整个文档到内存，节省内存。ET的性能的平均值和SAX差不多，但是API的效率更高一点而且使用起来很方便。

所以，我用xml.etree.ElementTree

ElementTree在标准库中有两种实现。一种是纯Python实现：xml.etree.ElementTree ，另外一种是速度快一点：xml.etree.cElementTree 。

In [111]:
import xml.etree.ElementTree as ET

tree = ET.parse('22601.xml')
tree

<xml.etree.ElementTree.ElementTree at 0x7fcf1c0feb38>

In [113]:
root = tree.getroot()      #获得根
root

<Element 'data' at 0x7fcf1c0fdc28>

In [114]:
root.tag

'data'

In [115]:
root.attrib

{}

In [116]:
for child in root:
    print(child.tag, child.attrib)

country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}


In [117]:
root[0].tag

'country'

In [118]:
root[0][0].tag

'rank'

In [119]:
root[0][0].attrib

{'updated': 'yes'}

In [120]:
root[0][0].text

'2'

In [125]:
for ele in tree.iter(tag="country"):        #遍历名称为country的节点
    print(ele.tag, ele.attrib)

country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}


In [128]:
for ele in tree.iter():
    print(ele.tag, ele.attrib,ele.text)
    
# 不指定元素名称，就是将所有的元素遍历一遍。

data {} 
    
country {'name': 'Liechtenstein'} 
        
rank {'updated': 'yes'} 2
year {} 2008
gdppc {} 141100
neighbor {'name': 'Austria', 'direction': 'E'} None
neighbor {'name': 'Switzerland', 'direction': 'W'} None
country {'name': 'Singapore'} 
        
rank {'updated': 'yes'} 5
year {} 2011
gdppc {} 59900
neighbor {'name': 'Malaysia', 'direction': 'N'} None
country {'name': 'Panama'} 
        
rank {'updated': 'yes'} 69
year {} 2011
gdppc {} 2011
neighbor {'name': 'Costa Rica', 'direction': 'W'} None
neighbor {'name': 'Colombia', 'direction': 'E'} None


In [129]:
root[1].tag

'country'

In [130]:
del root[1]

In [131]:
# 删除了一个节点
for ele in root:
    print(ele.tag)

country
country


## json

就传递数据而言，xml是一种选择，还有另外一种，就是json，它是一种轻量级的数据交换格式，如果读者要做web编程，是会用到它的。

JSON（JavaScript Object Notation）是一種由道格拉斯·克羅克福特構想設計、輕量級的資料交換語言，以文字為基礎，且易於讓人閱讀。儘管JSON是Javascript的一個子集，但JSON是獨立於語言的文本格式，並且採用了類似於C語言家族的一些習慣。


JSON建构于两种结构：

* “名称/值”对的集合（A collection of name/value pairs）。不同的语言中，它被理解为对象（object），纪录（record），结构（struct），字典（dictionary），哈希表（hash table），有键列表（keyed list），或者关联数组 （associative array）。
* 值的有序列表（An ordered list of values）。在大部分语言中，它被理解为数组（array）。

python标准库中有json模块，主要是执行序列化和反序列化功能：

* 序列化：encoding，把一个python对象编码转化成json字符串
* 反序列化：decoding，把json格式字符串解码转换为python数据对象


In [132]:
import json
json.__all__

['dump',
 'dumps',
 'load',
 'loads',
 'JSONDecoder',
 'JSONDecodeError',
 'JSONEncoder']

In [133]:
data = [{"name":"qiwsir", "lang":("python", "english"), "age":40}]
print(data)

[{'name': 'qiwsir', 'lang': ('python', 'english'), 'age': 40}]


In [134]:
data_json = json.dumps(data)
print(data_json)

[{"name": "qiwsir", "lang": ["python", "english"], "age": 40}]


In [135]:
type(data_json)

str

In [136]:
type(data)

list

In [137]:
new_data = json.loads(data_json)
new_data

[{'name': 'qiwsir', 'lang': ['python', 'english'], 'age': 40}]

In [139]:
data_j = json.dumps(data, sort_keys=True, indent=2)
print(data_j)

# sort_keys=True意思是按照键的字典顺序排序，indent=2是让每个键值对显示的时候，
# 以缩进两个字符对齐。这样的视觉效果好多了。

[
  {
    "age": 40,
    "lang": [
      "python",
      "english"
    ],
    "name": "qiwsir"
  }
]


In [140]:
import tempfile    #临时文件模块
data

[{'name': 'qiwsir', 'lang': ('python', 'english'), 'age': 40}]

In [143]:
f = tempfile.NamedTemporaryFile(mode='w+')
json.dump(data, f)
f.flush()

In [144]:
print(open(f.name, "r").read())

[{"name": "qiwsir", "lang": ["python", "english"], "age": 40}]


## 第三方库

标准库的内容已经非常多了，前面仅仅列举几个，但是python给编程者的支持还不仅仅在于标准库，它还有不可胜数的第三方库。因此，如果作为一个python编程者，即使你达到了master的水平，最好的还是要在做某个事情之前，在网上搜一下是否有标准库或者第三方库替你完成那件事。



In [146]:
# 方法一：利用源码安装

python setup.py install

SyntaxError: invalid syntax (<ipython-input-146-863939eec399>, line 3)

In [147]:
# 方法二：pip

sudo apt-get install python-pip

SyntaxError: invalid syntax (<ipython-input-147-2b6d3e8c1aaf>, line 3)