# 字符串

字符串是 [序列类型]('./types.ipynb')。

先回想一下 `序列类型` 的特性有哪些。


## 字符串创建


使用字面值形式


In [396]:
"this a str"  # 单双引号都可以

'this a str'

In [397]:
# 多行字符串，可实现换行输出
# 注意：不建议用这种方式作为注释

print(
    """this
is
a
str"""
)

this
is
a
str


In [398]:
print("this is a \n str")  # 使用转义符

this is a 
 str


In [399]:
# \ 在行尾时被用作续行符，可以将一行字符串写成多行

print(
    "this \
is \
a \
str"
)

this is a str


使用 `str` 方法

默认创建一个空字符串。


In [400]:
str()

''

## 特殊字符串


### `f-string`


`f-string` 是一种字符串格式化语法，它使用前缀 `f` 来标识。`f-string` 中使用花括号 `{}` 嵌入表达式，`{}` 内部可以包含变量、字面值、函数调用等。


In [401]:
f"1+1 = {1+1}"

'1+1 = 2'

在 `f-string` 中使用 `=` 符号时，`=` 左边是表达式本身，而右边会计算并显示表达式的值。


In [402]:
f"{1+1 = }"

'1+1 = 2'

### `r-string`

`r-string` 表示原始字符串，它使用前缀 `r` 来标识。`r-string` 中的 `\` 不转义，而是以字面形式表示。


In [403]:
print(r"C:\network\tiktok")

C:\network\tiktok


## 字符串转换

字符串的类型转换用的还是 `str` 方法。

> 方法 `str` 通过调用对象内部的魔术方法 `__str__` 或 `__repr__` 完成字符串转换。所有定义了 `__str__` 或 `__repr__` 魔术方法的对象都可以通过 `str` 方法创建字符串。

> [什么是魔术方法？]('./magic_method.ipynb')


- 数字转字符串


In [404]:
str(1)

'1'

- 列表转字符串


In [405]:
str([1, 2, 3])

'[1, 2, 3]'

- 集合转字符串


In [406]:
str({1, 2, 3})

'{1, 2, 3}'

- 字典转字符串


In [407]:
str({"a": 1, "b": 2})

"{'a': 1, 'b': 2}"

- 元组转字符串


In [408]:
str((1, 2, 3))

'(1, 2, 3)'

- 实现了 `__str__` 方法的自定义类对象


In [409]:
class MyStrClass:
    def __init__(self, value):
        self.value = value

    # 注意：__str__ 返回的必须是 str 型
    def __str__(self) -> str:
        return self.value

    def __repr__(self) -> str:
        return self.value


my_str = MyStrClass("foo")
str(my_str)

'foo'

## 序列类型通用操作 - 字符串实现


- 迭代


In [410]:
for char in "bar":
    print(char)

b
a
r


- 索引访问


In [411]:
"bar"[0]

'b'

In [412]:
"bar"[-1]

'r'

- 切片


In [413]:
"bar"[0:2]

'ba'

In [414]:
"bar"[0:3:2]

'br'

- 元素查找


In [415]:
"bar".index("a")

1

> 字符串还有一个用于查找子字符串位置的方法 `find`。它返回子字符串在原字符串中第一次出现的索引，如果未找到，则返回 -1，而不是像 `index` 一样引发 `ValueError` 异常。


In [416]:
"bar".find("f")

-1

类似 `find`，字符串对象还有一个 `rfind` 方法，用于检索元素最后一次出现的索引。


In [417]:
"foo".rfind("o")

2

- 拼接、重复


In [418]:
"foo" + "bar" * 2

'foobarbar'

- 计数


In [419]:
"foo".count("o")

2

## 一些常用的字符串操作


**字符串填充**


In [420]:
"foo".center(20, "-")  # 填两边

'--------foo---------'

In [421]:
"foo".ljust(20, "-")  # 填右边

'foo-----------------'

In [422]:
"foo".rjust(20, "-")  # 填左边

'-----------------foo'

In [423]:
"bar".zfill(20)  # 用 0 填左边

'00000000000000000bar'

**去空格**


In [424]:
" b a r ".strip()  # 去两边

'b a r'

In [425]:
" b a r ".lstrip()  # 去左边

'b a r '

In [426]:
" b a r ".rstrip()  # 去右边

' b a r'

**大小写**


In [427]:
"bar".upper()  # 大写

'BAR'

In [428]:
"BAR".lower()  # 小写

'bar'

In [429]:
"bar foo".capitalize()  # 首字母大写，其余小写

'Bar foo'

In [430]:
"bar foo".title()  # 每个单词首字母大写，其余小写

'Bar Foo'

In [431]:
"Bar Foo".swapcase()  # 大小写互换

'bAR fOO'

**替换**


In [432]:
"foo".replace("o", "x")

'fxx'

In [433]:
# 根据映射表进行字符替换或删除
tran = str.maketrans("ba", "fo", "r")  # 映射关系 ba => fo，r 直接删除
"bar".translate(tran)

'fo'

**分割**


In [434]:
"bar".split("a")

['b', 'r']

In [435]:
"""b
a
r

f\
o\
o\
""".splitlines()  # 按行分割

['b', 'a', 'r', '', 'foo']

**组合**


In [436]:
"a".join(["b", "r"])

'bar'

**格式校验**


In [437]:
"Bar Foo".istitle()

True

In [438]:
"bar".endswith("r")  # 检查尾元素

True

In [439]:
"bar".startswith("b")  # 检查首元素

True

In [440]:
# 不为空且仅包含数字和字母

"bar".isalnum()

True

In [441]:
# 不为空且为数字字面值字符串
"5557".isdigit()

True

In [442]:
# 不为空且字母小写
"bar_1".islower()

True

In [443]:
# 不为空且字母大写
"BAR_1".isupper()

True

In [444]:
# 不为空且仅空格
" ".isspace()

True