# 3 使用字符串

## 3.1 字符串基本操作

&emsp;&emsp;所有标准序列操作（索引、切片、乘法、成员资格检查、长度、最小值和最
大值）都适用于字符串。但字符串是不可变的，因此对字符串进行元素赋值或切片赋值是不合法的：

In [1]:
website = 'https://github.com/gaiusyao'

In [2]:
try:
    website[-3:] = 'rao'
except Exception as e:
    print('Error!\n{0}'.format(e))

Error!
'str' object does not support item assignment


## 3.2 设置字符串的格式：精简版

&emsp;&emsp;Python提供了多种字符串格式设置方法。以前，主要的解决方案是使用字符串格式设置运算符——百分号 `%`：

In [3]:
format = "You don't know the power of the %s %s."

In [4]:
values = ('dark', 'side')

In [5]:
format % values

"You don't know the power of the dark side."

&emsp;&emsp;上述格式字符串中的 `%s` 称为**转换说明符**，指出了要将值插入什么地方。另一种解决方案是所谓的模板字符串：

In [6]:
from string import Template

In [7]:
tmpl = Template("Hello, $who! $what enough for ya?")

In [8]:
tmpl.substitute(who="Mars", what="Dusty")

'Hello, Mars! Dusty enough for ya?'

&emsp;&emsp;编写新代码时，应选择使用字符串方法 `format`：

In [9]:
"{3} {0} {2} {1} {3} {0}".format("be", "not", "or", "to")

'to be or not to be'

In [10]:
from math import pi

In [11]:
"{name} is approximately {value:.2f}.".format(value=pi, name="π")

'π is approximately 3.14.'

&emsp;&emsp;在 Python 3.6 中，如果变量与替换字段同名，还可使用一种简写：

In [12]:
from math import e

In [13]:
f"Euler's constant is roughly {e}."

"Euler's constant is roughly 2.718281828459045."

In [14]:
# 等价于
"Euler's constant is roughly {e}.".format(e=e)

"Euler's constant is roughly 2.718281828459045."

## 3.3 设置字符串的格式：完整版

### 3.3.0 字符串替换字段

&emsp;&emsp;替换字段由如下部分组成，其中每个部分都是可选的：
- **字段名：**索引或标识符，指出要设置哪个值的格式并使用结果来替换该字段。除指定值外，还可指定值的特定部分，如列表的元素。
- **转换标志：**跟在叹号后面的单个字符。当前支持的字符包括 `r` (表示repr）、 `s`（表示str）和 `a`（表示ascii）。如果你指定了转换标志，将不使用对象本身的格式设置机制，而是使用指定的函数将对象转换为字符串，再做进一步的格式设置。
- **格式说明符：**跟在冒号后面的表达式（这种表达式是使用微型格式指定语言表示的）。格式说明符让我们能够详细地指定最终的格式，包括格式类型（如字符串、浮点数或十六进制数），字段宽度和数的精度，如何显示符号和千位分隔符，以及各种对齐和填充方式。

### 3.3.1 替换字段名

&emsp;&emsp;在最简单的情况下，只需向 `format` 提供要设置其格式的未命名参数，并在格式字符串中使用未命名字段。此时，将按顺序将字段和参数配对。还可给参数指定名称，这种参数将被用于相应的替换字段中。可混合使用这两种方法：

In [15]:
"{foo} {} {bar} {}".format(1, 2, bar=4, foo=3)

'3 1 4 2'

&emsp;&emsp;还可通过索引来指定要在哪个字段中使用相应的未命名参数，这样可不按顺序使用未命名参数：

In [16]:
"{foo} {1} {bar} {0}".format(1, 2, bar=4, foo=3)

'3 2 4 1'

&emsp;&emsp;并非只能使用提供的值本身，而是可访问其组成部分：

In [17]:
fullname = ["Gaius", "Yao"]

In [18]:
"Mr {name[1]}".format(name=fullname)

'Mr Yao'

### 3.3.2 基本转换

&emsp;&emsp;提供**转换标志**可以分别使用 str、 repr 和 ascii 进行转换：

In [19]:
print("{pi!s} {pi!r} {pi!a}".format(pi="π"))

π 'π' '\u03c0'


&emsp;&emsp;还可指定要将转换的值视为哪种类型：

In [20]:
"The Answer is {num:f}".format(num=42)

'The Answer is 42.000000'

### 3.3.3 宽度、精度和千位分隔符

&emsp;&emsp;可根据需要在格式说明中指定宽度和精度：

In [21]:
"{num:10}".format(num=3)

'         3'

In [22]:
"Pi day is {pi:.2f}".format(pi=pi)

'Pi day is 3.14'

&emsp;&emsp;可使用逗号来指出需要添加千位分隔符：

In [23]:
'One googol is {:,}'.format(10**100)

'One googol is 10,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000'

### 3.3.4 符号、对齐和用 0 填充

&emsp;&emsp;在指定宽度和精度的数前面，可添加一个标志。这个标志可以是零、加号、减号或空格，其中零表示使用 0 来填充数字：

In [24]:
'{:010.2f}'.format(pi)

'0000003.14'

&emsp;&emsp;要指定左对齐、右对齐和居中，可分别使用 `<`、 `>` 和 `^`：

In [25]:
print('{0:<10.2f}\n{0:^10.2f}\n{0:>10.2f}'.format(pi))

3.14      
   3.14   
      3.14


&emsp;&emsp;可以使用填充字符来扩充对齐说明符，这样将使用指定的字符而不是默认的空格来填：

In [26]:
"{:$^15}".format(" WIN BIG ")

'$$$ WIN BIG $$$'

&emsp;&emsp;还有更具体的说明符 `=`，它指定将填充字符放在符号和数字之间：

In [27]:
print('{0:10.2f}\n{1:=10.2f}'.format(pi, -pi))

      3.14
-     3.14


&emsp;&emsp;如果要给正数加上符号，可使用说明符 `+`：

In [28]:
print('{0:+.2}\n{1:+.2}'.format(pi, -pi))

+3.1
-3.1


&emsp;&emsp;可将 `#` 放在符号说明符和宽度之间，这将触发另一种转换方式：

In [29]:
# 对于二进制、八进制和十六进制转换，将加上一个前缀。
"{:#b}".format(42)

'0b101010'

In [30]:
# 对于各种十进制数，它要求必须包含小数点
"{:#g}".format(42)

'42.0000'

**代码清单3-1**

&emsp;&emsp;字符串格式设置示例

In [31]:
width = int(input('Please enter width: '))

price_width = 10
item_width = width - price_width

header_fmt = '{{:{}}}{{:>{}}}'.format(item_width, price_width)
fmt = '{{:{}}}{{:>{}.2f}}'.format(item_width, price_width)

print('=' * width)

print(header_fmt.format('Item', 'Price'))

print('-' * width)

print(fmt.format('Apples', 0.4))
print(fmt.format('Pears', 0.5))
print(fmt.format('Cantaloupes', 1.92))
print(fmt.format('Dried Apricots (16 oz.)', 8))
print(fmt.format('Prunes (4 lbs.)', 12))

print('=' * width)

Please enter width: 42
Item                                 Price
------------------------------------------
Apples                                0.40
Pears                                 0.50
Cantaloupes                           1.92
Dried Apricots (16 oz.)               8.00
Prunes (4 lbs.)                      12.00


## 3.4 字符串方法

### 3.4.1 center

&emsp;&emsp;方法 `center` 通过在两边添加填充字符（默认为空格）让字符串居中：

In [32]:
"The Middle by Jimmy Eat World".center(42)

'      The Middle by Jimmy Eat World       '

### 3.4.2 find

&emsp;&emsp;方法 `find` 在字符串中查找子串。如果找到，就返回子串的第一个字符的索引，否则返回 -1：

In [33]:
'With a moo-moo here, and a moo-moo there'.find('moo')

7

In [34]:
'Monty Python\'s Flying Circus'.find('Julia')

-1

&emsp;&emsp;还可指定搜索的起点和终点（可选）：

In [35]:
subject = '$$$ Get rich now!!! $$$'

In [36]:
subject.find('$$$', 1)

20

In [37]:
subject.find('$$$', 1,16)

-1

### 3.4.3 join

&emsp;&emsp;`join` 是一个非常重要的字符串方法，其作用与split相反，用于合并序列的元素：

In [38]:
seq = [1, 2, 3, 4, 5]

In [39]:
sep = '+'

In [40]:
try:
    sep.join(seq) # 尝试合并一个数字列表
except Exception as e:
    print('Error!\n{0}'.format(e))

Error!
sequence item 0: expected str instance, int found


In [41]:
seq = ['1', '2', '3', '4', '5']

In [42]:
sep.join(seq) # 合并一个字符串列表

'1+2+3+4+5'

In [43]:
dirs = '', 'usr', 'bin', 'env'

In [44]:
'/'.join(dirs)

'/usr/bin/env'

In [45]:
print('C:' + '\\'.join(dirs))

C:\usr\bin\env


### 3.4.4 lower

&emsp;&emsp;方法 `lower` 返回字符串的小写版本：

In [46]:
'Trondheim Hammer Dance'.lower()

'trondheim hammer dance'

### 3.4.5 replace

&emsp;&emsp;方法 `replace` 将指定子串都替换为另一个字符串，并返回替换后的结果：

In [47]:
'This is a test'.replace('is', 'eez')

'Theez eez a test'

### 3.4.6 split

&emsp;&emsp;`split` 是一个非常重要的字符串方法，其作用与 `join` 相反，用于将字符串拆分为序列：

In [48]:
'1+2+3+4+5'.split('+')

['1', '2', '3', '4', '5']

### 3.4.7 strip

&emsp;&emsp;方法 `strip` 将字符串开头和末尾的空白（但不包括中间的空白）删除，并返回删除后的结果：

In [49]:
'         internal whitespace is kept         '.strip()

'internal whitespace is kept'

### 3.4.8 translate

&emsp;&emsp;方法 `translate` 与 `replace` 一样替换字符串的特定部分，但不同的是它只能进行单字符替换。这个方法的优势在于能够同时替换多个字符，因此效率比 `replace` 高。使用translate前必须创建一个转换表。这个转换表指出了不同Unicode码点之间的转换关系。要创建转换表，可对字符串类型 str 调用方法 `maketran`：

In [50]:
table = str.maketrans('cs', 'kz')

In [51]:
'this is an incredible test'.translate(table)

'thiz iz an inkredible tezt'

&emsp;&emsp;调用方法 `maketrans` 时，还可提供可选的第三个参数，指定要将哪些字母删除：

In [52]:
table = str.maketrans('cs', 'kz', ' ')

In [53]:
'this is an incredible test'.translate(table)

'thizizaninkredibletezt'

### 3.4.9 判断字符串是否满足特定的条件

&emsp;&emsp;很多字符串方法都以 is 打头，如 `isspace`、 `isdigit` 和 `isupper`，它们判断字符串是否具有特定的性质（如包含的字符全为空白、数字或大写）。如果字符串具备特定的性质，这些方法就返回 `True`，否则返回 `False`。