# 字符串

字符串是 [序列类型]('./types.ipynb')。

先回想一下 `序列类型` 的特性有哪些。


## 字符串创建


使用字面值形式


In [215]:
"this a str"  # 单双引号都可以

'this a str'

In [216]:
# 多行字符串，可实现换行输出
# 注意：不建议用这种方式作为注释

print(
    """this
is
a
str"""
)

this
is
a
str


In [217]:
print("this is a \n str")  # 使用转义符

this is a 
 str


In [218]:
# \ 在行尾时被用作续行符，可以将一行字符串写成多行

print(
    "this \
is \
a \
str"
)

this is a str


使用 `str` 方法

默认创建一个空字符串。


In [219]:
str()

''

## 特殊字符串


### `f-string`


`f-string` 是一种字符串格式化语法，它使用前缀 `f` 来标识。`f-string` 中使用花括号 `{}` 嵌入表达式，`{}` 内部可以包含变量、字面值、函数调用等。


In [220]:
f"1+1 = {1+1}"

'1+1 = 2'

在 `f-string` 中使用 `=` 符号时，`=` 左边是表达式本身，而右边会计算并显示表达式的值。


In [221]:
f"{1+1 = }"

'1+1 = 2'

### `r-string`

`r-string` 表示原始字符串，它使用前缀 `r` 来标识。`r-string` 中的 `\` 不转义，而是以字面形式表示。


In [222]:
print(r"C:\network\tiktok")

C:\network\tiktok


## 字符串转换

字符串的类型转换用的还是 `str` 方法。

> 方法 `str` 通过调用对象内部的魔术方法 `__str__` 或 `__repr__` 完成字符串转换。所有定义了 `__str__` 或 `__repr__` 魔术方法的对象都可以通过 `str` 方法创建字符串。

> [什么是魔术方法？]('./magic_method.ipynb')


- 数字转字符串


In [223]:
str(1)

'1'

- 列表转字符串


In [224]:
str([1, 2, 3])

'[1, 2, 3]'

- 集合转字符串


In [225]:
str({1, 2, 3})

'{1, 2, 3}'

- 字典转字符串


In [226]:
str({"a": 1, "b": 2})

"{'a': 1, 'b': 2}"

- 元组转字符串


In [227]:
str((1, 2, 3))

'(1, 2, 3)'

- 实现了 `__str__` 方法的自定义类对象


In [228]:
class MyStrClass:
    def __init__(self, value):
        self.value = value

    # 注意：__str__ 返回的必须是 str 型
    def __str__(self) -> str:
        return self.value

    def __repr__(self) -> str:
        return self.value


my_str = MyStrClass("foo")
str(my_str)

'foo'

## 序列类型通用操作 - 字符串实现


- 迭代


In [229]:
for char in "bar":
    print(char)

b
a
r


- 索引访问


In [230]:
"bar"[0]

'b'

In [231]:
"bar"[-1]

'r'

- 切片


In [232]:
"bar"[0:2]

'ba'

In [233]:
"bar"[0:3:2]

'br'

- 元素查找


In [245]:
"bar".index("a")

1

> 字符串还有一个用于查找子字符串位置的方法 `find`。它返回子字符串在原字符串中第一次出现的索引，如果未找到，则返回 -1，而不是像 `index` 一样引发 `ValueError` 异常。


In [248]:
"bar".find("f")

-1

- 拼接、重复


In [246]:
"foo" + "bar" * 2

'foobarbar'

- 计数


In [247]:
"foo".count("o")

2

## 字符串内置方法/标准库操作


In [235]:
# 大写首字母
a.capitalize()

'This is a sequence type, but'

In [236]:
# 传入新字符串长度，将原字符串居中，两侧用占位符补齐，占位符默认为空格
a.center(50, "-")

'-----------this is a sequence type, but-----------'

In [237]:
# 传入新字符串长度，将原字符串左对齐，结尾用占位符补齐，占位符默认为空格
a.ljust(50, "-")

'this is a sequence type, but----------------------'

In [238]:
a.rjust(50, "-")

'----------------------this is a sequence type, but'

In [239]:
# 字符串 => 字节串
a.encode()

b'this is a sequence type, but'

In [240]:
# 字节串 => 字符串
a.encode().decode()

'this is a sequence type, but'

In [241]:
# 判断字符串结尾
a.endswith("str")

False

In [242]:
a.startswith("str")

False

In [243]:
# tab => space
"a  b  c\t".expandtabs()

'a  b  c '

In [244]:
# 检索最后一次出现的索引
print(a.rfind("str"))

a.rindex("str")

-1


ValueError: substring not found

In [None]:
# 判断是否不为空且仅包含数字和字母
print("uuu74".isalnum())

# 判断是否不为空且仅包含数字和中文
print("uuu你好".isalpha())

# 判断是否不为空且仅包含数字（也就是正整数字面值字符串）
print("5557".isdigit())

# 判断是否不为空且不包含大写字母
print("2,2y".islower())

# 判断是否不为空且不包含小写字母
print("2,2Y".isupper())

# 判断是否不为空且仅包含数字字符
print("壹佰万½2²".isnumeric())

# 判断是否不为空且仅包含空格
print(" ".isspace())

# 是否仅包含十进制
"11".isdecimal()

# 字符串标题化
print(a.title())

# 判断是不是标题化字符串
print(a.title().istitle())

# 使用分隔符分隔
print("-".join(a))

True
True
True
True
True
True
True
This A Str
True
t-h-i-s- -a- -s-t-r


In [None]:
" l c r ".strip()

'l c r'

In [None]:
" l c r ".lstrip()

'l c r '

In [None]:
" l c r ".rstrip()

In [None]:
"ww".upper()

'WW'

In [None]:
"WW".lower()

In [None]:
# 大小写互相转换
a.title().swapcase()

'tHIS a sTR'

In [None]:
# 根据映射表进行字符替换或删除
tran = str.maketrans("t", "_", "r")
a.translate(tran)

'_his a s_'

In [None]:
a.replace("str", "rst")

'this a rst'

In [None]:
a.split("a")

['this ', ' str']

In [None]:
"""a
set
set
""".splitlines()

['a', 'set', 'set']

In [None]:
# 右对齐，0填充
a.zfill(50)

'0000000000000000000000000000000000000000this a str'