##### 问题:
我们想在字节串（Byte String）上执行常见的文本操作（例如，拆分、搜索和替换)。

##### 解决方案:
字节串已经支持大多数和文本字符串一样的内建操作。例如:

In [36]:
data = b'Hello World' 
data[0:5]

b'Hello'

In [37]:
data.startswith(b'Hello')

True

In [38]:
data.replace(b'Hello', b'Hello Cruel') 

b'Hello Cruel World'

类似这样的操作在字节数组上也能完成。例如：

In [39]:
data = bytearray(b'Hello World') 
data[0:5]

bytearray(b'Hello')

In [40]:
data.startswith(b'Hello')

True

In [41]:
data.split()

[bytearray(b'Hello'), bytearray(b'World')]

In [42]:
data.replace(b'Hello', b'Hello Cruel') 

bytearray(b'Hello Cruel World')

我们可以在字节串上执行正则表达式的模式匹配操作，但是模式本身需要以字节串的形式来指定。示例如下:

In [43]:
data = b'FOO:BAR,SPAM' 
import re 
re.split(b'[:,]',data) 

[b'FOO', b'BAR', b'SPAM']

就绝大部分情况而言，几乎所有能在文本字符串上执行的操作同样也可以在字节串上进行。但是，还是有几个显著的区别值得大家注意。例如:


In [44]:
a = 'Hello World'      
# Text string 
print(a[0])


b = b'Hello World'     
# Byte string 
print(b[0])

H
72


这种语义上的差异会对试图按照字符的方式处理面向字节流数据的程序带来影响。

其次，字节串并没有提供一个漂亮的字符串表示，因此打印结果并不干净利落，除非首先将其解码为文本字符串。示例如下：

In [45]:
s = b'Hello World' 
print(s)                 # b'Hello World' 
print(s.decode('ascii')) # Hello World

b'Hello World'
Hello World


在字节串上是没有普通字符串那样的格式化操作的。


In [46]:
# b'{} {} {}'.format(b'ACME', 100, 490.1) 
# AttributeError: 'bytes' object has no attribute 'format'

如果想在字节串上做任何形式的格式化操作，应该使用普通的文本字符串然后再做编码。示例如下：

In [47]:
'{:10s} {:10d} {:10.2f}'.format('ACME', 100, 490.1).encode('ascii') 

b'ACME              100     490.10'

最后要说的是，有些程序员可能会因为性能上有可能得到提升而倾向于将字节串作为文本字符串的替代来使用。尽管操纵字节确实要比文本来的略微高效一些（由于同Unicode相关的固有开销较高），但这么做通常会导致非常混乱和不符合语言习惯的代码。我们常会发现字节串和Python中许多其他部分并不能很好地相容，这样为了保证结果的正确性，我们只能手动去执行各种各样的编码/解码操作。坦白地说，如果要同文本打交道，在程序中使用普通的文本字符串就好，不要用字节串