## 2.4.1 字符串基础

字符串是不可变的序列，常见的字符串字面量和操作如下

![](.2_images/9703e500.png)

![](.2_images/5f470fab.png)

## 2.4.2 字符串字面量

![](.2_images/ecb6296d.png)

### 2.4.2.1 单引号和双引号

In [2]:
# 单用和双引号是一样的
print('aaa', "aaa")

aaa aaa


In [3]:
# 可以在双引号中使用单引号，反之
print('a"b', "a'b")

a"b a'b


In [4]:
# 可以使用下面这种方式来进行拼接操作
title = "aaa" 'bbb' "ccc"
print(title)

aaabbbccc


### 2.4.2.2 转义序列

In [5]:
# 使用\表示转义符号
print('a\'b')
# \n表示换行\t表示制表符
print('a\nv\tc')
print(len('a\nv\tc'))

a'b
a
v	c
5


常用的转义符号
![](.2_images/6a311ae0.png)

### 2.4.2.3 原始字符串阻止转义

In [None]:
# 为了避免\n被转义，我们可以使用r来表示原始字符串
f = open('c:\new\text.dat')
f = open(r'c:\new\text.dat')
# 当然也可以使用两个\\来消歧
f = open('c:\\new\\text.dat')

### 2.4.2.4 三引号

In [6]:
# 三引号可以用于表示多行字符串
a = """aaa
bbb
ccc
"""
print(a)
# 或者可以使用下面这种方式
a = (
    "aaa\n"
    "bbb\n"
    "ccc\n"
)
print(a)

aaa
bbb
ccc

aaa
bbb
ccc



In [None]:
# 我们可以使用“”“来快速废弃大段代码
"""
a = 1
b = 1
"""
c = 1

## 2.4.3 实际应用

### 2.4.3.1 基本操作

In [7]:
# 字符串长度
print(len('abc'))
# 字符串拼接
print('abc'+'def')
# 字符串重复
print('abc'*4)

3
abcdef
abcabcabcabc


In [8]:
# 字符串迭代
s = 'abc'
for c in s:
    print(c)
# 判断字符串是否存在
print('a' in s)
print('ab' in s)

a
b
c
True
True


### 2.4.3.2 索引和分片

In [9]:
s = 'span'
# 索引操作
print(s[0], s[-2])
# 分片操作 => [)
print(s[1:3], s[1:], s[:-1])

s a
pa pan spa


### 2.4.3.3 分片

可以使用下面这个方式来理解分片
![](.2_images/f8c462c0.png)

In [10]:
# 带步长的分片
a = 'abcd'
print(a[::2])
# 可以使用下面这个方式来快速反转字符串
print(a[::-1])

ac
dcba


### 2.4.3.4 字符串转换工具

In [11]:
# 字符串和数字是不能直接相加的
print("42" + 1 )

TypeError: can only concatenate str (not "int") to str

In [12]:
# 字符串转换为数字
print(int("42"))
# 数字转换为字符串
print(str(42))

42
42


In [13]:
# repr也可以转换为字符串
print(repr(42) == "42")

True


In [14]:
# 我们也可以在浮点数之间相互转换
print(str(3.1415), float('3.1415'))

3.1415 3.1415


In [15]:
# 使用ord可以获取ASCII码值
print(ord('s'))
# 使用chr可以ASCII码对应的字符
print(chr(115))

115
s


### 2.4.3.5 修改字符串

In [16]:
# 字符串是不能修改的
s = '123'
s[0] = '2'

TypeError: 'str' object does not support item assignment

In [17]:
# 但是可以使用下面这样的方式来间接去修改
s = '123'
print('2'+s[1:])
# 也可以使用replace来替换字符串
print(s.replace('1', '2'))

223
223


## 2.4.4 字符串方法

### 2.4.4.1 方法调用语法

In [18]:
# 查找字符串
s = 'span'
print(s.find('pa'))

1


### 2.4.4.2 字符串方法

字符串里面其实是包括很多方法的，这里就不一一介绍了

### 2.4.4.3 修改字符串

In [19]:
# 替换字符串可以指定替换次数
s = 'aabb'
print(s.replace('a', 'c'))
print(s.replace('a', 'c', 1))

# 也可以把变量转换为列表，修改列表值
l = list(s)
l[0] = 'c'
print(''.join(l))

ccbb
cabb
cabb


### 2.4.4.4 解析文本

In [20]:
# 使用split对字符串进行拆分
line1 = 'aa bb cc'
line2 = 'aa,bb,cc'
print(line1.split())
print(line2.split(','))

['aa', 'bb', 'cc']
['aa', 'bb', 'cc']


### 2.4.4.5 其他方法

## 2.4.5 字符串格式化表达式

字符串格式化表达式 '...%s..' % (value)
字符串格式化方法 '...{}..'.format(value)

### 2.4.5.1 格式化基础

In [None]:
print('this is %d %s bird' % (1,'dead'))

### 2.4.5.2 高级格式化语法

![](.2_images/150a7191.png)

### 2.4.5.3 高级格式化举例

In [21]:
x = 1234
# %-6d表示6位左对齐格式化
# %06d表示6位补0格式化
print('%d.\n%-6d.\n%06d.' % (x,x,x))

1234.
1234  .
001234.


In [22]:
x = 1.23456789
# %e使用指数的方式来表示
# %f为一般的情况
# %g表示如果指数小于-4或者不小于精度，那么就使用指数格式e，否则使用f，默认精度为6位数
print('%e | %f | %g' % (x,x,x))

1.234568e+00 | 1.234568 | 1.23457


In [24]:
# 也可以保留小数点和补0操作
print('%-6.2f.\n%06.2f.\n%06.1f' % (x,x,x,))

1.23  .
001.23.
0001.2


### 2.4.5.4 基于字典的格式化

In [25]:
d = {'name': 'xiaoyou', 'age': 40}
print('hello %(name)s, you gae is %(age)d' % d)

hello xiaoyou, you gae is 40


In [26]:
name = 'xiaoyou'
age = 40
# 使用vars可以快速把前面的变量全部转换为字典
print(vars())

{'__name__': '__main__', '__doc__': 'Automatically created module for IPython interactive environment', '__package__': None, '__loader__': None, '__spec__': None, '__builtin__': <module 'builtins' (built-in)>, '__builtins__': <module 'builtins' (built-in)>, '_ih': ['', '# 单用和双引号是一样的\nprint(\'aaa\', "aaa")', '# 单用和双引号是一样的\nprint(\'aaa\', "aaa")', '# 可以在双引号中使用单引号，反之\nprint(\'a"b\', "a\'b")', '# 可以使用下面这种方式来进行拼接操作\ntitle = "aaa" \'bbb\' "ccc"\nprint(title)', "# 使用\\表示转义符号\nprint('a\\'b')\n# \\n表示换行\\t表示制表符\nprint('a\\nv\\tc')\nprint(len('a\\nv\\tc'))", '# 三引号可以用于表示多行字符串\na = """aaa\nbbb\nccc\n"""\nprint(a)\n# 或者可以使用下面这种方式\na = (\n    "aaa\\n"\n    "bbb\\n"\n    "ccc\\n"\n)\nprint(a)', "# 字符串长度\nprint(len('abc'))\n# 字符串拼接\nprint('abc'+'def')\n# 字符串重复\nprint('abc'*4)", "# 字符串迭代\ns = 'abc'\nfor c in s:\n    print(c)\n# 判断字符串是否存在\nprint('a' in s)\nprint('ab' in s)", "s = 'span'\n# 索引操作\nprint(s[0], s[-2])\n# 分片操作 => [)\nprint(s[1:3], s[1:], s[:-1])", "# 带步长的分片\na = 'abcd'\nprint(a[::2])\n# 可以使

## 2.4.6 字符串格式化方法调用

### 2.4.6.1 字符串格式化方法基础

In [27]:
# 可以使用数字来表示顺序
template = '{0},{1} and {2}'
print(template.format('span', 'ham', 'eggs'))

span,ham and eggs


In [28]:
# 或者使用字典的方式来格式化
template = '{motto},{pork} and {food}'
print(template.format(motto = 'span', pork = 'ham', food = 'eggs'))

span,ham and eggs


In [29]:
# 甚至可以混合使用
template = '{motto},{0} and {food}'
print(template.format('ham', motto = 'span', food = 'eggs'))

span,ham and eggs


In [30]:
# 也可以啥也不加，就靠绝对位置进行定位
template = '{},{} and {}'
print(template.format('span', 'ham', 'eggs'))

span,ham and eggs


In [31]:
# format里面的内容是任意的
template = '{},{} and {}'
print(template.format('span', 1, [1,2,3]))

span,1 and [1, 2, 3]


### 2.4.6.2 添加键、属性和偏移量

In [32]:
# format可以取字典里面的某一个值
import sys
print('my {1[kind]} runs {0.platform}'.format(sys, {'kind': 'laptop'}))
print('my {map[kind]} runs {sys.platform}'.format(sys=sys, map = {'kind': 'laptop'}))

my laptop runs win32
my laptop runs win32


### 2.4.6.3 高级格式化方法语法

### 2.4.6.4 高级格式化方法举例

In [34]:
# <表示左对齐，>表示右对齐
print('{0:<10}={1:<10}'.format('span', 123.456))
print('{0:10}={1:10}'.format('span', 123.456))

span      =123.456   
span      =   123.456


In [35]:
# 也可以使用前面使用%的那种效果
x = 3.14159
print('{0:e},{1:.3e},{2:g}'.format(x,x,x))
print('{0:f},{1:.2f},{2:06.2f}'.format(x,x,x))

3.141590e+00,3.142e+00,3.14159
3.141590,3.14,003.14


### 2.4.6.5 为什么使用格式化方法

In [36]:
# format支持二进制的格式
print('{0:b}'.format((2**16)-1))
# 但是%不支持
print('%b' % ((2**16)-1))

1111111111111111


ValueError: unsupported format character 'b' (0x62) at index 1

In [37]:
# format支持格式化方法
print('{:,d}'.format(999999999999))

999,999,999,999


## 2.4.7 通用类型分类

![](.2_images/351b7008.png)