# 第7章 字符串

## 字符串常量

- Python以十六进制显示非打印的字符，不管是如何指定它们的

In [1]:
# 这是个不可打印字符
s = '\b'
s

'\x08'

In [2]:
# 这是个八进制编码的数字
s = '\010'
s

'\x08'

In [3]:
# 这个是可打印字符
s = '\x0a'
s

'\n'

- 在字符串前添加'r'或'R'，可以关闭转义机制

In [4]:
S = 's\tp\na\0m'
len(S)

7

In [5]:
S = R's\tp\na\0m'
len(S)

10

- 三重引号（单双引号均可）编写的多行字符串块可以用来当注释

In [6]:
# 换行符会保留
mantra = """Always look
on the bright 
side of lie"""
mantra

'Always look\non the bright \nside of lie'

In [7]:
print mantra

Always look
on the bright 
side of lie


## 索引和分片

- 分片表达式可以增加一个步进参数

In [8]:
S = '0123456789'
S[1:5:2]

'13'

In [9]:
# 负的步进，上边界和下边界应该对调，并且是从右到左抽取元素
S[8:2:-2]

'864'

## 字符串转换

- ord可以将字符转换为对应的ASCII码值，char则相反

In [10]:
ord('a')

97

In [11]:
chr(97)

'a'

## 字符串方法

- split的分隔符可以是多个字符

In [12]:
S = "hello@#world@#I'm@#ok"
S.split("@#")

['hello', 'world', "I'm", 'ok']

## 字符串格式化

- Python中的字符串格式化有两种：字符串格式化表达式和字符串格式化方法调用，前者是基于C语言的printf，后者是Python独有的

- 首先讲一下字符串格式化表达式

In [13]:
'That is %d %s bird!' % (1, 'dead')

'That is 1 dead bird!'

In [14]:
# 每个对象都可以转换为字符串
'%s -- %s -- %s' % (42, 3.14159, [1, 2, 3])

'42 -- 3.14159 -- [1, 2, 3]'

In [15]:
# '+'显示正负号，‘0’补零，‘6’字符串长度为6，‘.2’小数点后精确到2位，‘f’浮点数
'%+06.2f' % -1.2345678

'-01.23'

In [16]:
# 还可以通过字典来格式化
dic = {'name': 'Bob', 'age': 12}
"My name's %(name)s, and I'm %(age)d years old." % dic

"My name's Bob, and I'm 12 years old."

- 字符串格式化调用方法采用的是`format`，使用方式如下

In [17]:
# 参数既可以使用位置也可以使用关键字名称来传递
template = '{motto}, {0}, and {food}'
template.format('ham', motto = 'spam', food = 'eggs')

'spam, ham, and eggs'

In [18]:
# format支持的高级用法：添加键、属性和偏移量
import sys
print 'My {1[spam]} runs {0.platform}'.format(sys, {'spam': 'laptop'}) # 添加键和属性，注意这里的spam没有加引号
somelist = list('SPAM')
print 'first = {0[0]}, third = {0[2]}'.format(somelist) # 添加偏移量

My laptop runs darwin
first = S, third = A


In [19]:
# format还支持添加额外的语法，满足更具体的格式化，这有点类似于‘%’
'{0:10} = {1:10} = {2.platform:<10} = {2.platform:>10}'.format('spam', 123.4567, sys)

'spam       =   123.4567 = darwin     =     darwin'

In [20]:
'{0:e}, {1:.3e}, {2:g}'.format(3.14159, 3.14159, 3.14159)

'3.141590e+00, 3.142e+00, 3.14159'

In [21]:
# format还支持整数进制的转换
'{0:X}, {0:x}, {1:o}, {2:b}'.format(255, 255, 255)

'FF, ff, 377, 11111111'

In [22]:
# 内置的format函数可以用来格式化一个单独的项
format(1.2345, ".2f")

'1.23'

## 通常意义下的类型分类

- 不可变类型：数字、字符串、元组、不可变集合；可变类型：列表、字典、可变集合