# 字符串类型

字符串是`序列类型`但非`可变类型`，（`可变类型`和`序列类型`的概念在 [数据类型]('./types.ipynb') 有讲）

先回想一下 `序列类型` 的通用操作有哪些？


## 创建一个字符串


### 通过字面值形式创建


In [32]:
# 单双引号都可以

"this a str"

'this a str'

In [33]:
# 多行字符串，可以实现换行输出，注意：不建议用这种方式作为注释

print(
    """this
is
a
str"""
)

this
is
a
str


In [34]:
# 在字符串当中使用转义符

print("this is a \n str")

this is a 
 str


In [35]:
# \ 在行尾时被用作续行符，可以将一行字符串写成多行

print(
    "this \
is \
a \
str"
)

this is a str


#### 原始字符串


In [36]:
# 原始字符串的 \ 不转义，直接显示
print(r"this is a \n str")

this is a \n str


#### 字面量格式化字符串 f-string


In [37]:
# f-string 可以在字符串中插入表达式

print(f"1+1 = {1+1}")

# 甚至可以这样，f-string 能自动计算结果并补全

print(f"{1+1 = }")

1+1 = 2
1+1 = 2


## 序列类型通用操作 - 字符串实现


In [75]:
a = "this is a sequence type, but"
b = " str"

# 连接、重复
s = a + b * 2  # 字符串 b 重复两次之后和字符串 a 连接
print(s)

# 长
l = len(s)
print(l)

# 元素位置获取
i1 = s.index("sequence")
# 字符串还可以通过 find 方法获取元素位置，区别是找不到元素时返回 -1，而不是报错
i2 = s.find(" type")
print(i1, i2)

# 索引访问
s[i1]  # 正索引，从左向右索引从 0 开始
s[i1 - l]  # 负索引，从右向左索引从 -1 开始
print(s[i1], s[i1 - l])

# 切片
print(s[i1:i2])

# 成员运算
print(b in s, b not in a)

# 最大/最小元素，对比的是元素字典顺序
print(min(s), max(s))

# 元素出现次数，支持指定查找范围
print(s.count("str", 0, len(s)))

# 迭代
for char in b:
    print(char)

this is a sequence type, but str str
36
10 18
s s
sequence
True True
  y
2
 
s
t
r


## 字符串内置方法/标准库操作


In [None]:
# 大写首字母
a.capitalize()

'This a str'

In [None]:
# 传入新字符串长度，将原字符串居中，两侧用占位符补齐，占位符默认为空格
a.center(50, "-")

'--------------------this a str--------------------'

In [None]:
# 传入新字符串长度，将原字符串左对齐，结尾用占位符补齐，占位符默认为空格
a.ljust(50, "-")

'this a str----------------------------------------'

In [None]:
a.rjust(50, "-")

'----------------------------------------this a str'

In [None]:
# 字符串 => 字节串
a.encode()

b'this a str'

In [None]:
# 字节串 => 字符串
a.encode().decode()

'this a str'

In [None]:
# 判断字符串结尾
a.endswith("str")

True

In [None]:
a.startswith("str")

In [None]:
# tab => space
"a  b  c\t".expandtabs()

'a  b  c '

In [None]:
# 检索最后一次出现的索引
print(a.rfind("str"))

a.rindex("str")

7


7

In [None]:
# 判断是否不为空且仅包含数字和字母
print("uuu74".isalnum())

# 判断是否不为空且仅包含数字和中文
print("uuu你好".isalpha())

# 判断是否不为空且仅包含数字（也就是正整数字面值字符串）
print("5557".isdigit())

# 判断是否不为空且不包含大写字母
print("2,2y".islower())

# 判断是否不为空且不包含小写字母
print("2,2Y".isupper())

# 判断是否不为空且仅包含数字字符
print("壹佰万½2²".isnumeric())

# 判断是否不为空且仅包含空格
print(" ".isspace())

# 是否仅包含十进制
"11".isdecimal()

# 字符串标题化
print(a.title())

# 判断是不是标题化字符串
print(a.title().istitle())

# 使用分隔符分隔
print("-".join(a))

True
True
True
True
True
True
True
This A Str
True
t-h-i-s- -a- -s-t-r


In [None]:
" l c r ".strip()

'l c r'

In [None]:
" l c r ".lstrip()

'l c r '

In [None]:
" l c r ".rstrip()

In [None]:
"ww".upper()

'WW'

In [None]:
"WW".lower()

In [None]:
# 大小写互相转换
a.title().swapcase()

'tHIS a sTR'

In [None]:
# 根据映射表进行字符替换或删除
tran = str.maketrans("t", "_", "r")
a.translate(tran)

'_his a s_'

In [None]:
a.replace("str", "rst")

'this a rst'

In [None]:
a.split("a")

['this ', ' str']

In [None]:
"""a
set
set
""".splitlines()

['a', 'set', 'set']

In [None]:
# 右对齐，0填充
a.zfill(50)

'0000000000000000000000000000000000000000this a str'