# 标准库简介 第二部分

第二部分介绍更高级的模块，支持专业编程需要，这些模块在较小的脚本中很少出现。

## 11.1 格式化输出

reprlib模块的repr()函数提供了大型或深度嵌套容器的缩略输出形式。

pprint模块给内建和用户自定义对象提供了更复杂的格式控制，并对解释器来说是可读的。当结果超过一行，会自动增加截断和缩进，更好的体现数据的结构。

textwrap模块将在给定的屏幕宽度下，格式化一段文字。

In [1]:
import reprlib
reprlib.repr(set('supercalifragilisticexpialidocious'))

"{'a', 'c', 'd', 'e', 'f', 'g', ...}"

In [6]:
import pprint
t = [[[['black', 'cyan'], 'white', ['green', 'red']], [['magenta',
    'yellow'], 'blue']]]
pprint.pprint(t, width=30)

[[[['black', 'cyan'],
   'white',
   ['green', 'red']],
  [['magenta', 'yellow'],
   'blue']]]


In [7]:
import textwrap

doc = """The wrap() method is just like fill() except that it returns
a list of strings instead of one big string with newlines to separate
the wrapped lines."""
print(textwrap.fill(doc, width=40))

The wrap() method is just like fill()
except that it returns a list of strings
instead of one big string with newlines
to separate the wrapped lines.


## 11.2 模版

string模块包含一个多功能的Template类，这使用户能够自定义他们的应用。

格式采用placeholder名字，用`$`号和有效的python定义符。在占位符的周围使用连符号以便增加更多的数字字母符号。`$$`可以创造单个的`$`。

In [8]:
from string import Template
t = Template('${village}folk send $$10 to $cause.')
t.substitute(village='Nottingham', cause='THe ditch fund')

'Nottinghamfolk send $10 to THe ditch fund.'

substitute()方式抛出KeyError，当占位符没有在参数中找到。对于邮件类型的应用，用户提供的数据可能不完整，采用safe_substitue()方法更好，它能保持占位符不变，如果没有数据输入。

In [10]:
t = Template('Return the $item to $owner.')
d = dict(item='unladen swallow')
t.substitute(d)

KeyError: 'owner'

In [11]:
t.safe_substitute(d)

'Return the unladen swallow to $owner.'

## 11.4 多线程

线程是一种将不相关的任务分为几个任务的技术。多线程能够提高应用的响应，如接受用户输入，而其他任务在后台运行。一个相关的应用是并行I/O操作，计算放在另外一个线程。

多线程应用主要的挑战在于共享数据或者其他资源时需要协同多个线程。因此，threading模块提供许多同步原子操作，如locks，events，condition variables和semaphores。

即使这些工具很强大，小的设计错误能够导致复现困难的错误。因此，较好的方式是将资源的获取放在单个线程中，然后利用queue模块去反馈给线程需要的资源。哪些使用Queue对象去进行线程间通信和协同的应用更容易设计，可靠，可读性更强。

## 11.5 日志

logging模块提供了全能，灵活的日志系统。最简单的，日志消息可以被传送至文件或者sys.stderr。

In [12]:
import logging
logging.debug('Debugging information')
logging.info('Informational message')
logging.warning('Warning:config file %s not found', 'server.conf')
logging.error('Error occurred')
logging.critical('Critical error -- shutting down')

ERROR:root:Error occurred
CRITICAL:root:Critical error -- shutting down


默认地，info和debug级别的信息会被限制，输出定向到标准错误输出。日志系统可以在python代码中配置，也可以从其他配置文件中加载配置信息。

## 11.6 弱引用

python有自动内存管理（对大部分对象有引用计算，垃圾回收减少循环）。消除最后一次引用后，释放内存。

这个方法对发部分应用来说不错，但偶尔有一些需要跟踪对象，只要对象被修改了。不幸的是，跟踪会创造引用，从而使得其一直存在。weakref模块提供跟踪对象但不需要创造引用的工具，当对象不再需要，它会从weakref表中被自动清除，并且会触发回掉函数。

## 11.7 list相关工具

许多数据结构与内建类型list有交集。然而， 有时需要在性能和实现中取得平衡。

array模块提供array()构建对象，这种一种类似与list，但是只存储同类型数据的类型。

In [3]:
from array import array
a = array('H', [4000, 10, 700, 22222])
sum(a)

26932

In [4]:
a[1:3]

array('H', [10, 700])

collections模块提供deque类型，能够快速从队尾增加和从队头删除，但操作中间的数据较慢。

bisect模块用于操作排序的list。

heapq模块提供实现堆的功能。最小的数一直保存在0的位置。

## 11.8 十进制浮点型

decimal模块提供了Decimal数据类型，专门用于十进制浮点型运算。对比于内建的float类型，二进制浮点型，有如下优势：

- 金融应用需要精确的十进制表达
- 控制精度
- 跟踪重要十进制位置
