In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# 字符串
## 转义字符
|转义字符|描述|
|-------|----|
|\\（在行尾）|续行符|
|\\\\ |反斜杠自身|
|\\'|单引号|
|\\"|双引号|
|\\0|空格|
|\\b|退格|
|\\n|换行|
|\\r|将光标移到行首，并将该行已经打印的字符逐一替换其后的字符|
|\\t|横向制表符|
|\\v|纵向制表符|
|\\f|换页|
|\\a|主板蜂鸣器|
|\\0oo \\oo|两位八进制数所对应的ASCII表字符（o为0~7）|
|\\ooo|三位八进制数所对应的ASCII表字符（o为0~7）|
|\\xhh|两位八进制数所对应的ASCII表字符（h为0~f）|

In [11]:
print("line1 \
line2\
line3")

line1 line2line3


In [12]:
print("\\")
print("\'")
print("\"")

\
'
"


In [21]:
print("Hello\0world")
print("Hello\00world")  # 两位八进制数
print("Hello\000world")  # 三位八进制数
print("Hello\x00world")  # 两位十六进制数

Hello world
Hello world
Hello world
Hello world


In [None]:
print("Hello\n")  # 本来print默认就会加上一个\n
print("world")

Hello

world


In [16]:
print("Hello\tworld")
print("Hello\vworld")
print("Hello\fworld")

Hello	world
Helloworld
Helloworld


In [18]:
print("Hello\rWorld!")
import time

for i in range(101):
    print("\r{:3}%".format(i),end=' ')
    time.sleep(0.05)

World!
100% 

In [20]:
print("\110\145\154\154\157\40\127\157\162\154\144\041")

Hello World!


In [22]:
print("\x48\x65\x6c\x6c\x6f\x20\x57\x6f\x72\x6c\x64\x21")

Hello World!


## 字符串格式化（NCRE 使用的 Python 3.5 不支持 f-strings 格式化）

**{**`<空/顺序/关键字>`**:**`<填充字符><对齐方式><填充宽度><,><.精度><类型>`**}**

其中：
- 填充字符：默认为空格
- 对齐方式：
  - <：左对齐
  - \>：右对齐
  - ^：居中
- ,：是否显示数字千分位
- 精度：在输出浮点数和科学计数法时为小数精度
- 类型：
  - b：整数二进制
  - c：数字所对应的ASCII码
  - d：整数十进制
  - o：整数八进制
  - x：整数小写十六进制
  - \#x：带x整数小写十六进制
  - X：整数大写十六进制
  - \#X：带X整数大写十六进制
  - e：科学计数法（小写e）
  - E：科学计数法（大写E）
  - f：浮点数
  - %：浮点数对应的百分比

In [52]:
"My name is {} and I am {} years old.".format("Alice", 25)  # 基本用法
"Hello, {1}. My name is {0}.".format("Alice", "Bob")  # 使用数字索引指定参数顺序
"Name: {name}, Age: {age}".format(name="Alice", age=25)  # 使用关键字参数指定
"My name is {0} and I love {thing}.".format("Alice", thing="Python")  # 混合顺序参数和关键字参数

d = {"name": "Alice", "age": 25}
"Name: {name}, Age: {age}".format(**d)  # 使用**解包字典

d = ["Alice", 25]
"Name: {0[0]}, Age: {0[1]}".format(d)  # 使用列表索引设置参数

'My name is Alice and I am 25 years old.'

'Hello, Bob. My name is Alice.'

'Name: Alice, Age: 25'

'My name is Alice and I love Python.'

'Name: Alice, Age: 25'

'Name: Alice, Age: 25'

In [32]:
"{:*^20,.4f}".format(1000003.14159265359)  # 显示数字千分位并保留4位小数，内容居中且用*号补到20长度

'***1,000,003.1416***'

In [53]:
"{0:*^20,.{1}f}".format(1000003.14159265359, 4)  # 大括号允许嵌套

'***1,000,003.1416***'

In [54]:
a = 95
"十进制：{:d}".format(a)
"二进制：{:b}".format(a)
"ASCII转换：{:c}".format(a)
"八进制：{:o}".format(a)
"十六进制小写：{:x}".format(a)
"十六进制大写：{:X}".format(a)
"十六进制带x小写：{:#x}".format(a)
"十六进制带X大写：{:#X}".format(a)
"科学计数法小写：{:e}".format(a)
"科学计数法大写：{:E}".format(a)

'十进制：95'

'二进制：1011111'

'ASCII转换：_'

'八进制：137'

'十六进制小写：5f'

'十六进制大写：5F'

'十六进制带x小写：0x5f'

'十六进制带X大写：0X5F'

'科学计数法小写：9.500000e+01'

'科学计数法大写：9.500000E+01'

In [49]:
a = 0.141592653
"浮点数：{:f}".format(a)
"浮点数保留8位小数：{:.8f}".format(a)
"百分比格式：{:%}".format(a)

'浮点数：0.141593'

'浮点数保留8位小数：0.14159265'

'百分比格式：14.159265%'

In [50]:
"{}{{}}".format("大括号转义")  # 在字符串格式化时，若仍想输出大括号，用双层大括号

'大括号转义{}'

## 字符串类型自带方法
因为字符串是不可变对象，所以以下所有方法都不会在原字符串上进行修改，而是返回一个新字符串对象。

### 大小写转换

In [4]:
"hello".upper()  # 全部转大写
"HELLO".lower()  # 全部转小写
"hello world".capitalize()  # 首字母大写
"hello world".title()  # 标题格式（每个单词首字母大写）
"Hello World".swapcase()  # 大小写互换

'HELLO'

'hello'

'Hello world'

'Hello World'

'hELLO wORLD'

### 判断类型

In [66]:
# 是否全为字母
"abc".isalpha()
"abc ".isalpha()

True

False

In [69]:
# 判断是否为数字
# isdecimal()：仅限阿拉伯数字0~9
# isdigit()：阿拉伯数字 0-9 + 上标/下标数字（²³¹⁰）+ 全角数字（１２３）
# isnumeric()：isdigit() 的范围 + 分数（½⅓） + 罗马数字（ⅧⅩ） + 汉字数字（四、百）
print("123".isdecimal(), "123".isdigit(), "123".isnumeric())  # True  True  True

print("①②③".isdecimal(), "①②③".isdigit(), "①②③".isnumeric())  # False  True  True
print("²³¹⁰".isdecimal(), "²³¹⁰".isdigit(), "²³¹⁰".isnumeric())  # False  True  True

print("ⅧⅩ".isdecimal(), "ⅧⅩ".isdigit(), "ⅧⅩ".isnumeric())  # False  False  True
print("四百".isdecimal(), "四百".isdigit(), "四百".isnumeric())  # False  False  True
print("½".isdecimal(), "½".isdigit(), "½".isnumeric())  # False  False  True

True True True
False True True
False True True
False False True
False False True
False False True


In [68]:
# 是否全为字母或数字
"a123".isalnum()
"123".isalnum()
"a123 ".isalnum()

True

True

False

In [70]:
# 是否只有空格字符（且至少有一个空格）
" ".isspace()
"".isspace()

True

False

In [None]:
# 检查大小写
'hello'.islower()  # 是否全小写
'HELLO'.isupper()  # 是否全大写
'Hello World'.istitle()  # 是否符合标题格式

### 查找与匹配

In [21]:
s = "hello"

In [9]:
s.find("l")  # 查找子串，返回找到的第一个索引，未找到返回-1
s.find("l", 0, 2)  # 可指定查找范围（左闭右开），这里从0到1，即"he"，所以没找到

2

-1

In [11]:
s.rfind("l")  # 从右侧开始查找子串，返回找到的第一个索引，索引依旧是从左侧开始数的
s.rfind("l", 0, 2)  # 指定的查找范围也是从左侧开始数的

3

-1

In [10]:
s.index("l", 0, 2)  # 同find()，但未找到抛出ValueError

ValueError: substring not found

In [22]:
s.count("l")  # 统计子串出现的次数
s.count("l", 0, 2)  # 也可以指定范围

2

0

In [14]:
s.startswith("he")  # 判断是否以指定前缀开头
s.startswith("he", 1, 5)  # 也可以指定范围

True

False

In [15]:
s.endswith("lo")  # 判断是否以指定后缀结尾
s.endswith("lo", 1, -1)  # 也可以指定范围

True

False

### 修改与替换

In [41]:
s = 'hello\tworld'
s.replace('l', '*')  # 将某子字符串替换成另一个
s.replace('l', '*', 2)  # 若指定了第3个参数count，则限制从左到右总共替换多少个

'he**o\twor*d'

'he**o\tworld'

In [44]:
map_table = s.maketrans({'l': '*', 'o': '!'})  # maketrans将依照当前编码创建映射表
s.translate(map_table)  # 按预先定义的映射表替换字符（键要为ASCII码）

'he**!\tw!r*d'

In [25]:
s.expandtabs(4)  # 将制表符替换为n个空格

'hello   world'

### 分割与连接

In [58]:
s = "hello world! hello   python! yes.\nline2\n\nline3\n"

In [59]:
s.split()  # 从左拆分字符串为一个list，默认按空格和换行符拆（连续的空格或换行符视为一个）
s.split(" ")  # 若手动指定分隔符为空格，则不会将连续的空格视为一个
s.split("!")  # 可以指定其他用来拆分的字符
s.split("!", 1)  # 还可以指定从左拆分多少次

['hello', 'world!', 'hello', 'python!', 'yes.', 'line2', 'line3']

['hello', 'world!', 'hello', '', '', 'python!', 'yes.\nline2\n\nline3\n']

['hello world', ' hello   python', ' yes.\nline2\n\nline3\n']

['hello world', ' hello   python! yes.\nline2\n\nline3\n']

In [60]:
# rsplit是split从右向左拆的版本，list顺序仍保持从左向右，只在指定最大拆分数量时与split有区别
s.rsplit()
s.rsplit("!")
s.rsplit("!", 1)

['hello', 'world!', 'hello', 'python!', 'yes.', 'line2', 'line3']

['hello world', ' hello   python', ' yes.\nline2\n\nline3\n']

['hello world! hello   python', ' yes.\nline2\n\nline3\n']

In [61]:
s.partition("!")  # 按分隔符首次出现的位置将字符串拆成一个3元组，包含分隔符之前的部分、分隔符本身，以及分隔符之后的部分

('hello world', '!', ' hello   python! yes.\nline2\n\nline3\n')

In [62]:
s.rpartition("!")  # partition的从右向左拆版本

('hello world! hello   python', '!', ' yes.\nline2\n\nline3\n')

In [63]:
s.splitlines()  # 按换行符来分割成一个list
s.splitlines(keepends=True)  # 拆分结果保留换行符

['hello world! hello   python! yes.', 'line2', '', 'line3']

['hello world! hello   python! yes.\n', 'line2\n', '\n', 'line3\n']

In [65]:
# 以一个字符串来对一个可迭代对象进行首尾连接
"-连接-".join(["a", "b", "c"])

'a-连接-b-连接-c'

### 字符串格式化

In [72]:
"42".zfill(5)  # 左侧补零到指定长度

'00042'

In [74]:
"Hello".center(20)  # 将字符串居中且在两侧补空格到指定长度
"Hello".center(20, "*")  # 可以指定补长所用字符

'       Hello        '

'*******Hello********'

In [76]:
"Hello".ljust(20)  # 将字符串左对齐且在右侧补空格到指定长度
"Hello".ljust(20, "*")  # 可以指定补长所用字符

'Hello               '

'Hello***************'

In [77]:
"Hello".rjust(20)  # 将字符串右对齐且在左侧补空格到指定长度
"Hello".rjust(20, "*")  # 可以指定补长所用字符

'               Hello'

'***************Hello'

### 编码与解码

In [78]:
b = 'hello'.encode(encoding="utf-8")  # 编码字符串为字节
b

b'hello'

In [79]:
s = b.decode(encoding="utf-8")  # 解码字节为字符串
s

'hello'