# 字符串基本操作
所有标准序列操作(索引、切片、乘法、成员资格检查、长度、最小值和最大值)都适用于字符串,但字符串是不可变的,因此所有的元素赋值和切片赋值都是非
法的。

In [1]:
text = "hello world!"
text[:3] = "abc"

TypeError: 'str' object does not support item assignment

# 设置字符串的格式
Python提供了多种字符串格式设置方法。以前,主要的解决方案是使用字符串格式设置运算符——百分号。这个运算符的行为类似于C语言中的经典函数printf :在 % 左边指定一个字符串(格式字符串),并在右边指定要设置其格式的值。指定要设置其格式的值时,可使用单个值(如字符串或数字),可使用元组(如果要设置多个值的格式),还可使用字典,其中最常见的是元组。

In [2]:
format = "%s-%s"
words = ('hello','world')
format % words

'hello-world'

&emsp;&emsp;上述格式字符串中的 %s 称为转换说明符,指出了要将值插入什么地方。 s 意味着将值视为字符串进行格式设置。如果指定的值不是字符串,将使用 str() 将其转换为字符串。其他说明符将导致其他形式的转换。例如, %.3f 将值的格式设置为包含3位小数的浮点数。<br>
&emsp;&emsp;另一种解决方案是所谓的**模板字符串**。它使用类似于UNIX shell的语法,旨在简化基本的格式设置机制,如下所示:

In [3]:
from string import Template
text = Template("$a-$b")
text.substitute(a="hello",b="world")

'hello-world'

编写新代码时,应选择使用字符串方法 format ,它融合并强化了早期方法的优点。使用这种方法时,每个替换字段都用花括号括起,其中可能包含名称,还可能包含有关如何对相应的值进行转换和格式设置的信息。

In [4]:
"{}, {} and {}".format("first", "second", "third")      #替换字段没有名称

'first, second and third'

In [5]:
"{2}, {1} and {0}".format("first", "second", "third")   #将索引用作名称

'third, second and first'

In [6]:
from math import pi
"{name}的值大约是{value:.2f}。".format(name='π',value=pi)   #命名字段替换

'π的值大约是3.14。'

在Python 3.6中,如果变量与替换字段同名,还可使用一种简写。在这种情况下,可使用 f 字符串——在字符串前面加上 f 。

In [7]:
x=123
f"x的值为{x}"

'x的值为123'

In [8]:
"{{hello-world!}}".format()   #如果想在最终字段中包含花括号，则使用两个花括号

'{hello-world!}'

在格式字符串中,最重要的部分为替换字段。替换字段由如下部分组成,其中每个部分都是可选的。
<br>**字段名**:索引或标识符,指出要设置哪个值的格式并使用结果来替换该字段。除指定值外,还可指定值的特定部分,如列表的元素。
<br>**转换标志**:跟在叹号后面的单个字符。当前支持的字符包括 r (表示 repr )、s (表示 str )和 a (表示 ascii )。如果你指定了转换标志,将不使用对象本身的格式设置机制,而是使用指定的函数将对象转换为字符串,再做进一步的格式设置。
<br>**格式说明符**:跟在冒号后面的表达式(这种表达式是使用微型格式指定语言表示的)。格式说明符让我们能够详细地指定最终的格式,包括格式类型(如字符串、浮点数或十六进制数),字段宽度和数的精度,如何显示符号和千位分隔符,以及各种对齐和填充方式。
下面详细介绍其中的一些要素。

### 替换字段名
在最简单的情况下,只需向 format 提供要设置其格式的未命名参数,并在格式字符串中使用未命名字段。此时,将按顺序将字段和参数配对。还可给参数指定名称,这种参数将被用于相应的替换字段中。也可混合使用这两种方法。

In [9]:
"{one} {} {three} {}".format(2, 4, one=1, three=3)

'1 2 3 4'

In [10]:
"{one} {1} {three} {0}".format(2, 4, one=1, three=3)  
#通过索引来指定要在哪个字段中使用相应的未命名参数,这样可不按顺序使用未命名参数
#不能同时使用手工编号和自动编号

'1 4 3 2'

In [11]:
text = ["hello","world!"]
"hello {word[1]}".format(word=text)

'hello world!'

### 基本转换
指定要在字段中包含的值后,就可添加有关如何设置其格式的指令了。首先,提供一个**转换标志**。

In [12]:
print("{pi!s} {pi!r} {pi!a}".format(pi="π"))    #( s 、 r 和 a )指定分别使用 str 、 repr 和 ascii 进行转换

π 'π' '\u03c0'


函数 str 通常创建外观普通的字符串版本(这里没有对输入字符串做任何处理)。<br>函数 repr 尝试创建给定值的Python表示(这里是一个字符串字量)。<br>函数 ascii 创建只包含ASCII字符的表示,类似于Python 2中的repr 。

In [13]:
"The number is {num}".format(num=42)

'The number is 42'

In [14]:
"The number is {num:f}".format(num=42)   #作为小数处理

'The number is 42.000000'

In [15]:
"The number is {num:b}".format(num=42)   #作为二进制数处理

'The number is 101010'

<center>**字符串格式设置中的类型说明符**<center/>

| 类型 | <center>含义<center/> |
| ----- | ----- |
|b|<center>将整数表示为二进制数<center/>|
|c|<center>将整数解读为Unicode码点<center/>|
|d|<center>将整数视为十进制数进行处理,这是整数默认使用的说明符<center/>|
|e|<center>使用科学表示法来表示小数(用 e 来表示指数)<center/>|
|E|<center>与 e 相同,但使用 E 来表示指数<center/>|
|f|<center>将小数表示为定点数<center/>|
|F|<center>与 f 相同,但对于特殊值( nan 和 inf ),使用大写表示<center/>|
|g|<center>自动在定点表示法和科学表示法之间做出选择。这是默认用于小数的说明符,但在默认情况下至少有1位小数<center/>|
|G|<center>与 g 相同,但使用大写来表示指数和特殊值<center/>|
|n|<center>与 g 相同,但插入随区域而异的数字分隔符<center/>|
|o|<center>将整数表示为八进制数<center/>|
|s|<center>保持字符串的格式不变,这是默认用于字符串的说明符<center/>|
|x|<center>将整数表示为十六进制数并使用小写字母<center/>|
|X|<center>与 x 相同,但使用大写字母<center/>|
|%|<center>将数表示为百分比值(乘以100,按说明符 f 设置格式,再在后面加上%)<center/>|

### 宽度、精度和千位分隔符
设置浮点数(或其他更具体的小数类型)的格式时,默认在小数点后面显示6位小数,并根据需要设置字段的宽度,而不进行任何形式的填充。这种默认设置可能不是你想要的,在这种情况下,可根据需要在格式说明中指定宽度和精度。宽度和精度使用整数指定。

In [16]:
"{num:10}".format(num=3)

'         3'

In [17]:
"{num:10}".format(num='three')

'three     '

In [18]:
"π的值约为{value:10.2f}".format(value=pi)  #可同时指定宽度和精度

'π的值约为      3.14'

In [19]:
"{value:,}".format(value=2**10)

'1,024'

### 符号、对齐和用 0 填充
有很多用于设置数字格式的机制,比如便于打印整齐的表格。在大多数情况下,只需指定宽度和精度,但包含负数后,原本漂亮的输出可能不再漂亮。另外,正如你已看到的,字符串和数的默认对齐方式不同。在一栏中同时包含字符串和数时,你可能想修改默认对齐方式。在指定宽度和精度的数前面,可添加一个标志。这个标志可以是零、加号、减号或空格,其中零表示使用0来填充数字。

In [20]:
print('{:010.2f}'.format(pi))                            #使用0填充数字
print('{0:<10.2f}\n{0:^10.2f}\n{0:>10.2f}'.format(pi))   #<表示左对齐，^表示居中，>表示右对齐

0000003.14
3.14      
   3.14   
      3.14


In [21]:
"{word:$^20}".format(word="hello world!")   #使用指定字符$而不是空格来填充

'$$$$hello world!$$$$'

In [22]:
print('{0:10.2f}\n{1:=10.2f}'.format(-pi, -pi))   #=号将填充字符放在符号和数字之间

     -3.14
-     3.14


In [23]:
print('{0:+.2}\n{1:+.2}'.format(pi, -pi))    #如果要给正数加上符号,可使用说明符 + (将其放在对齐说明符后面),而不是默认的 -

+3.1
-3.1


In [24]:
print("{:#b}".format(12))#井号(#)选项将其放在符号说明符和宽度之间(如果指定了这两种设置)这个选项将触发另一种转换方式,转换细节随类型而异
print("{:#o}".format(12))
print("{:#g}".format(12))
print("{:#x}".format(12))

0b1100
0o14
12.0000
0xc


# 字符串方法

### center
方法 center 通过在两边添加填充字符(默认为空格)让字符串居中。

In [25]:
"hello world!".center(40)

'              hello world!              '

In [26]:
"hello world!".center(40,"*")

'**************hello world!**************'

### find
方法 find 在字符串中查找子串。如果找到,就返回子串的第一个字符的索引,否则返回 -1 。

In [27]:
"This is a test!".find("is")

2

In [28]:
"This is a test!".find("ttt")

-1

In [29]:
"This is a test!".find("a",0,6)  #指定查找的起点和终点（包含起点不包含终点）

-1

### join
方法join用于合并序列的元素，其作用与 split 相反。

In [30]:
sep = '+'
seq = ['1', '2', '3', '4', '5']
print(sep.join(seq))  #合并字符串列表
se = '\\'
seq = '', 'usr', 'bin', 'env'
print(se.join(seq))     #合并字符元组

1+2+3+4+5
\usr\bin\env


### lower
方法 lower 返回字符串的小写版本。当需要忽略大小写时这很有用。

In [31]:
"ABCDEFGHI".lower()

'abcdefghi'

### replace
方法 replace 将指定子串都替换为另一个字符串,并返回替换后的结果。

In [32]:
'This is a test'.replace('is', 'eez')

'Theez eez a test'

### split
split 是一个非常重要的字符串方法,其作用与 join 相反,用于将字符串拆分为序列。

In [33]:
'1+2+3+4+5'.split('+')

['1', '2', '3', '4', '5']

In [34]:
"this is a test".split()

['this', 'is', 'a', 'test']

### strip
方法 strip 将字符串开头和末尾的空白(但不包括中间的空白)删除,并返回删除后的结果。

In [35]:
"    hello world   ".strip()

'hello world'

In [36]:
"***!@ hello*world* !!!".strip(" *!@") #删除开头和末尾的指定字符

'hello*world'

### translate
方法 translate 与 replace 一样替换字符串的特定部分,但不同的是它只能进行单字符替换。这个方法的优势在于能够同时替换多个字符,因此效率比 replace 高。此方法可用于替换换行符或其他随平台而异的特殊字符。使用 translate 前必须创建一个转换表。这个转换表指出了不同Unicode码点之间的转换关系。要创建转换表,可对字符串类型 str 调用方法 maketrans ,这个方法接受两个参数:两个长度相同的字符串,它们指定要将第一个字符串中的每个字符都替换为第二个字符串中的相应字符。

In [37]:
table = str.maketrans('cs', 'kz')
table    #可查看转换表的内容,看到的是Unicode码点之间的映射

{99: 107, 115: 122}

In [38]:
'this is an incredible test'.translate(table)   #创建转换表后,就可将其用作方法 translate 的参数

'thiz iz an inkredible tezt'

In [39]:
table = str.maketrans('cs', 'kz', ' ')     #第三个参数指定要将哪些字母删除
'this is an incredible test'.translate(table)

'thizizaninkredibletezt'

### 判断字符串是否满足特定的条件
很多字符串方法都以 is 打头,如 isspace 、 isdigit 和 isupper ,它们判断字符串是否具有特定的性质(如包含的字符全为空白、数字或大写)。如果字符串具备特定的性质,这些方法就返回True ,否则返回 False 。

In [40]:
"123456".isalnum()

True

In [41]:
"abcdef".isalpha()

True