##### 问题
你想在字节字符串上执行普通的文本操作（比如移除，搜索和替换）。

##### 解决方案
字节字符串同样也支持大部分和为基本字符串一样的内置操作。比如：

In [1]:
data = b'Hello World'
data[0:5]

b'Hello'

In [2]:
data.startswith(b'Hello')

True

In [3]:
data.split()

[b'Hello', b'World']

In [4]:
data.replace(b'Hello', b'Hello Cruel')

b'Hello Cruel World'

这些操作同样也适用于字节数组。比如：

In [5]:
data = bytearray(b'Hello World')
data[0:5]

bytearray(b'Hello')

In [6]:
data.startswith(b'Hello')

True

In [7]:
data.split()

[bytearray(b'Hello'), bytearray(b'World')]

In [8]:
data.replace(b'Hello', b'Hello Cruel')

bytearray(b'Hello Cruel World')

你可以使用正则表达式匹配字节字符串，但是正则表达式本身必须也是字节串。比如：

In [11]:
data = b'FOO:BAR,SPAM'
import re
re.split('[:,]', data)

TypeError: cannot use a string pattern on a bytes-like object

In [12]:
re.split(b'[:,]', data)

[b'FOO', b'BAR', b'SPAM']

##### 讨论
大多数情况下，在文本字符串上的操作君可用于字节字符串。然而，这里也有一些需要注意的不同点。首先，字节字符串的索引操作返回整数而不是单独字符。比如：

In [13]:
a = 'Hello World'
a[0]

'H'

In [14]:
a[1]

'e'

In [17]:
b = b'Hello World'
b[0]

72

In [18]:
b[1]

101

这种语义上的区别对于处理面向字节的字符数据有影响。  
第二点，字节字符串不会提供一个美观的字符串表示，也不能很好的打印出来，除非它们先被解码为一个文本字符串。比如：

In [19]:
s = b'Hello World'
print(s)

b'Hello World'


In [20]:
print(s.decode('ascii'))

Hello World


类似的，也不存在任何适用于字节字符串的格式化操作：

In [21]:
b'%10s %10d %10.2f' % (b'ACME', 100, 490.1)

b'      ACME        100     490.10'

In [22]:
b'{} {} {}'.format(b'ACME', 100, 490.1)

AttributeError: 'bytes' object has no attribute 'format'

如果你想格式化字符串，你得先使用标准的文本字符串，然后将其编码为字节字符串。比如：

In [25]:
'{:10s} {:10d} {:10.2f}'.format('ACME', 100, 490.1).encode('ascii')

b'ACME              100     490.10'

最后需要注意的是，使用字节字符串可能会改变一些操作的语义，特别是那些根文件系统有关的操作。比如，如果你使用一个编码为字节的文件名，而不是一个普通的文本字符串，会禁用文件名的编码/解码。比如：

In [None]:
with open('xflo.txt', 'w') as f:
    f.write('spicy')
    
import os
os.listdir('.')
os.listdir(b'.')