# 10. Python 标准库概览

# 10.1. 操作系统接口 (os)

os 模块提供了很多与操作系统交互的函数:

In [22]:
import os
os.getcwd()

'D:\\study-code\\python-learn'

In [23]:
os.getcwd()

'D:\\study-code\\python-learn'

In [28]:
os.system('ls -la')  # os.system()用于执行系统命令 
                    #  jupyter notebook 下看不到来自系统命令的输出，切换到python交互窗口看

0

应该用 import os 风格而非 from os import *。这样可以保证随操作系统不同而有所变化的 os.open() 不会覆盖内置函数 open()。

在使用一些像 os 这样的大型模块时内置的 dir() 和 help() 函数非常有用:

In [29]:
import os
dir(os)

['DirEntry',
 'F_OK',
 'MutableMapping',
 'O_APPEND',
 'O_BINARY',
 'O_CREAT',
 'O_EXCL',
 'O_NOINHERIT',
 'O_RANDOM',
 'O_RDONLY',
 'O_RDWR',
 'O_SEQUENTIAL',
 'O_SHORT_LIVED',
 'O_TEMPORARY',
 'O_TEXT',
 'O_TRUNC',
 'O_WRONLY',
 'P_DETACH',
 'P_NOWAIT',
 'P_NOWAITO',
 'P_OVERLAY',
 'P_WAIT',
 'PathLike',
 'R_OK',
 'SEEK_CUR',
 'SEEK_END',
 'SEEK_SET',
 'TMP_MAX',
 'W_OK',
 'X_OK',
 '_Environ',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_execvpe',
 '_exists',
 '_exit',
 '_fspath',
 '_get_exports_list',
 '_putenv',
 '_unsetenv',
 '_wrap_close',
 'abc',
 'abort',
 'access',
 'altsep',
 'chdir',
 'chmod',
 'close',
 'closerange',
 'cpu_count',
 'curdir',
 'defpath',
 'device_encoding',
 'devnull',
 'dup',
 'dup2',
 'environ',
 'errno',
 'error',
 'execl',
 'execle',
 'execlp',
 'execlpe',
 'execv',
 'execve',
 'execvp',
 'execvpe',
 'extsep',
 'fdopen',
 'fsdecode',
 'fsencode',
 'fspath',
 'fstat',
 'fs

In [15]:
help(os)

Help on module os:

NAME
    os - OS routines for NT or Posix depending on what system we're on.

DESCRIPTION
    This exports:
      - all functions from posix or nt, e.g. unlink, stat, etc.
      - os.path is either posixpath or ntpath
      - os.name is either 'posix' or 'nt'
      - os.curdir is a string representing the current directory (always '.')
      - os.pardir is a string representing the parent directory (always '..')
      - os.sep is the (or a most common) pathname separator ('/' or '\\')
      - os.extsep is the extension separator (always '.')
      - os.altsep is the alternate pathname separator (None or '/')
      - os.pathsep is the component separator used in $PATH etc
      - os.linesep is the line separator in text files ('\r' or '\n' or '\r\n')
      - os.defpath is the default search path for executables
      - os.devnull is the file path of the null device ('/dev/null', etc.)
    
    Programs that import and use 'os' stand a better chance of being
    porta

针对日常的文件和目录管理任务，shutil 模块提供了一个易于使用的高级接口:

In [34]:
import shutil

shutil.copyfile('python3-tutorial/readme.md', 'python3-tutorial/readme.md.log')

'python3-tutorial/readme.md.log'

In [35]:
shutil.move('python3-tutorial/readme.md.log', 'python3-tutorial/1.log')

'python3-tutorial/1.log'

## 10.2. 文件通配符

glob 模块提供了一个函数用于从目录通配符搜索中生成文件列表:

In [37]:
import glob
glob.glob('*.log')

['1.log']

## 10.3. 命令行参数
通用工具脚本经常调用命令行参数。这些命令行参数以链表形式存储于 sys 模块的 argv 变量。例如在命令行中执行 python demo.py one two three 后可以得到以下输出结果:

In [39]:
import sys
print(sys.argv)

['C:\\Users\\heller\\AppData\\Roaming\\Python\\Python36\\site-packages\\ipykernel_launcher.py', '-f', 'C:\\Users\\heller\\AppData\\Roaming\\jupyter\\runtime\\kernel-5a7149f2-f793-40b0-91ee-ef7ae0823d49.json']


getopt 模块使用 Unix getopt() 函数处理 sys.argv。更多的复杂命令行处理由 argparse 模块提供。

## 10.4. 错误输出重定向和程序终止
sys 还有 stdin， stdout 和 stderr 属性，即使在 stdout 被重定向时，后者也可以用于显示警告和错误信息:

In [40]:
sys.stderr.write('Warning, log file not found starting a new one\n')



大多脚本的直接终止都使用 sys.exit()。

## 10.5. 字符串正则匹配
re 模块为高级字符串处理提供了正则表达式工具。对于复杂的匹配和处理，正则表达式提供了简洁、优化的解决方案:

In [42]:
import re
re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')

['foot', 'fell', 'fastest']

In [43]:
re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')

'cat in the hat'

只需简单的操作时，字符串方法最好用，因为它们易读，又容易调试:

In [44]:
'tea for too'.replace('too', 'two')

'tea for two'

## 10.6. 数学
math 模块为浮点运算提供了对底层C函数库的访问:

In [47]:
import math
math.cos(math.pi / 4.0)

0.7071067811865476

In [48]:
math.log(1024, 2)

10.0

random 提供了生成随机数的工具:

In [54]:
import random
random.choice(['apple', 'pear', 'banana'])

'banana'

In [55]:
random.sample(range(100), 10)   # sampling without replacement

[78, 39, 26, 28, 90, 79, 92, 76, 49, 47]

In [56]:
random.random()    # random float

0.7996465669971206

In [57]:
random.randrange(6)    # random integer chosen from range(6)

2

SciPy <http://scipy.org> 项目提供了许多数值计算的模块。

## 10.7. 互联网访问
有几个模块用于访问互联网以及处理网络通信协议。其中最简单的两个是用于处理从 urls 接收的数据的 urllib.request 以及用于发送电子邮件的 smtplib:

In [69]:
# 本示例需要在命令交互模式下才能正常显示
from urllib.request import urlopen
for line in urlopen('https://www.baidu.com/'):
    line = line.decode('utf-8')
    if 'baidu' in line:
        print(line)

	<noscript><meta http-equiv="refresh" content="0;url=http://www.baidu.com/"></noscript>



In [71]:
# (注意这个例子需要在 localhost 运行一个邮件服务器。)
import smtplib
server = smtplib.SMTP('localhost')
server.sendmail('soothsayer@example.org', 'jcaesar@example.org',
                """To: jcaesar@example.org
                From: soothsayer@example.org
                
                Beware the Ides of March.""")
server.quit()

ConnectionRefusedError: [WinError 10061] 由于目标计算机积极拒绝，无法连接。

## 10.8. 日期和时间 （datetime）
datetime 模块为日期和时间处理同时提供了简单和复杂的方法。支持日期和时间算法的同时，实现的重点放在更有效的处理和格式化输出。该模块还支持时区处理。

In [74]:
from datetime import date
now = date.today()
now

datetime.date(2018, 5, 23)

In [77]:
now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")

'05-23-18. 23 May 2018 is a Wednesday on the 23 day of May.'

In [79]:
birthday = date(1964, 7, 31)  # 生日
age = now - birthday          # 当前日期 - 生日
age.days    # 年龄、活了多少天

19654

## 10.9. 数据压缩
以下模块直接支持通用的数据打包和压缩格式：zlib， gzip， bz2， lzma， zipfile 以及 tarfile。

In [80]:
import zlib
s = b'witch which has which witches wrist watch'
len(s)

41

In [81]:
t = zlib.compress(s)
len(t)

37

In [82]:
zlib.decompress(t)

b'witch which has which witches wrist watch'

In [84]:
zlib.crc32(s)

226805979

## 10.11. 质量控制 
即我们常说的TDD 测试驱动开发 的思想

开发高质量软件的方法之一是为每一个函数开发测试代码，并且在开发过程中经常进行测试。

doctest 模块提供了一个工具，扫描模块并根据程序中内嵌的文档字符串执行测试。测试构造如同简单的将它的输出结果剪切并粘贴到文档字符串中。通过用户提供的例子，它发展了文档，允许 doctest 模块确认代码的结果是否与文档一致:

In [85]:
def average(values):
    """Computes the arithmetic mean of a list of numbers.

    >>> print(average([20, 30, 70]))
    40.0
    """
    return sum(values) / len(values)


import doctest
doctest.testmod()   # automatically validate the embedded tests

TestResults(failed=0, attempted=1)

unittest 模块不像 doctest 模块那么容易使用，不过它可以在一个独立的文件里提供一个更全面的测试集:（类似Java的Junit）

In [91]:
# 本例子需要在python命令交互模式下演示，因为unittest.main()的原因

import unittest

class TestStatisticalFunctions(unittest.TestCase):

    def test_average(self):
        self.assertEqual(average([20, 30, 70]), 40.0)
        self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
        with self.assertRaises(ZeroDivisionError):
            average([])
        with self.assertRaises(TypeError):
            average(20, 30, 70)

unittest.main() # Calling from the command line invokes all tests

In [93]:
my_sum(1,2)

3

## 10.12. “瑞士军刀”
Python 展现了“瑞士军刀”的哲学。这可以通过它更大的包的高级和健壮的功能来得到最好的展现。列如:

xmlrpc.client 和 xmlrpc.server 模块让远程过程调用变得轻而易举。尽管模块有这样的名字，用户无需拥有 XML 的知识或处理 XML。

email 包是一个管理邮件信息的库，包括MIME和其它基于 RFC2822 的信息文档。

不同于实际发送和接收信息的 smtplib 和 poplib 模块，email 包包含一个构造或解析复杂消息结构（包括附件）及实现互联网编码和头协议的完整工具集。

xml.dom 和 xml.sax 包为流行的信息交换格式提供了强大的支持。同样， csv 模块支持在通用数据库格式中直接读写。

综合起来，这些模块和包大大简化了 Python 应用程序和其它工具之间的数据交换。

国际化由 gettext， locale 和 codecs 包支持。