# 字符串

### 定义

1. 单引号`''`或者双引号`""`引起的都是字符串，如果字符串中有单引号，则必须用双引号引用

2. 多行字符串可以用三个单引号`'''...'''` 或者 或者三个双引号 `"""..."""` 

3. 可以使用 `()` 或者 `\` 连接多行字符串

In [9]:
a = ("hello, world. "
    "it's a nice day. "
    "my name is xxx")
b = "hello, world. " \
    "it's a nice day. " \
    "my name is xxx"
a
b

"hello, world. it's a nice day. my name is xxx"

"hello, world. it's a nice day. my name is xxx"

In [6]:
# Cell可以多行输出
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

## 2. 方法

内容偏简略，可以根据 [官方文档](https://docs.python.org/zh-cn/3/library/stdtypes.html) 补充

### 2.1 修改

#### 大小写

|方法名|作用||
|---|---|---|
|`.upper()` |全部转换为大写|
| `.lower()` |全部转换为小写|
|`.capitalize()`|第一个字符转换为大写|
| `.title()` |每个单词首字母转换为大写| 
| `.swapcase()` |交换大小写|产生新字符串|
|`.casefold()`|全部转换为小写|比`.lower()`更强，使用更多语言|

#### 替换

|方法名|作用||
|---|---|---|
|`.replace(old, new[, count])`|返回字符串的副本，其中出现的所有子字符串 old 都将被替换为 new。 如果给出了可选参数 count，则只替换前 count 次出现|

#### 填充

|方法|作用|
|---|---|
| `.center(w[, c])`| 使用字符`c`将`str`填充至`w`位，且原字符串居中，`c`默认为空格| 
| `.ljust(w[, c])`| 使用字符`c`将`str`填充至`w`位，且原字符串左对齐，`c`默认为空格| 
| `.rjust(w[, c])`| 使用字符`c`将`str`填充至`w`位，且原字符串右对齐，`c`默认为空格| 
|`.zfill(width)`||
返回原字符串的副本，在左边填充 ASCII '0' 数码使其长度变为 width。 正负值前缀 ('+'/'-') 的处理方式是在正负符号 之后 填充而非在之前。 如果 width 小于等于 len(s) 则返回原字符串的副本。

#### 拼接

|方法|作用|
|---|---|
|`s.join(str_seq)`|使用连接符`s`连接字符串序列`str_seq`的元素|
|`+`|使用+号进行拼接，将不同的字符串和空格等符号进行连接|
|`*`|使用+号进行拼接，将不同的字符串和空格等符号进行连接|


#### 拆分

|方法|返回|作用|
|---|---|---|
|`.split(sep=None, maxsplit= -1)`| 列表|用`sep`拆分`str`,最多拆分`maxsplit`次|
|`.rsplit(sep=None, maxsplit= -1)`| 列表| 同上，但从右侧开始 |
|`.splitlines(keepends=False)`| 列表| 行边界处进行拆分 |
|`.partition(sep)`| 元组 | 拆一次返回`(左侧子str,sep,左侧子str)` | 
|`.rpartition(sep)` | 元组 | 同上，但从右侧开始 |

1. 对于`.split()`类方法：

ℹ️ `maxsplit`可省略，默认为 `-1`，即按最多次拆分

ℹ️ `sep`可省略，默认为`None`，即用空格拆分；给定时可以为多个字符

ℹ️ 如果给定 `sep`，则连续的分隔符被视为分隔空字符串, 如果省略或者给定为`None`，则连续的空格会被视为单个分隔符，即不会拆出空字符串

⚠️ 如果指定`.split()`分隔符为`\n`，则末尾会有空字符串

⚠️ `.splitlines()`结果默认不包含行边界符，除非给定`keepends=True`


2. 对于`.partition()`类方法：

⚠️ 如果`str`内不包含`sep`，那么返回`(str, '', '')` 


In [8]:
'abc\n'.split()
'abc\n'.split('\n')

['abc']

['abc', '']

In [7]:
'ab c\n\nde fg\rkl\r\n'.splitlines()
'ab c\n\nde fg\rkl\r\n'.splitlines(keepends=True)

['ab c', '', 'de fg', 'kl']

['ab c\n', '\n', 'de fg\r', 'kl\r\n']

#### 删除

|方法名|作用|
|---|---|
|`.strip([chars])`|删除首尾的：空白、换行符`\n`、制表符`\t`，若指定字符则删除特定字符|
|`.rstrip([chars])`|删除结尾，内容同上|
|`.lstrip([chars])`|删除结尾，内容同上|
|`.expandtabs(tabsize=8)`|把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8|
|`str.removeprefix(pre, /)`|如以 `pre` 字符串开头，返回 `string[len(prefix):]`。 否则，返回`str`的副本|
|`str.removesuffix(suf, /)`|如以 `suf` 字符串结尾，返回 `string[:-len(suffix)]`。 否则，返回`str`的副本|

⚠️ 该类方法不改变原有字符串，生成字符串副本

### 2.2 判断

|方法|作用||
|---|---|---|
| `.isalnum()`|检查所有字符是否只有字母和数字|
| `.isalpha()`|检查字符串之中是否只有字母|
|`.isdecimal()`|`str`只包含十进制数字字符时返回 `True` |正整数 |
| `.isdigit()`|`str`只包含数字字符时返回 `True`| 正整数 |
|`.isnumeric()`|`str`只包含数字字符时返回 `True`| 范围更大的 Unicode 数字，如汉字数字 ½ |
|`.isspace()`|`str`只包含空格` `时返回 `True`|空字符串会返回`False`|
| `.istitle()`|检查字符串是不是只有首字母大写|
| `.islower()`|检查字符串是否全部小写|
| `.isupper()`|检查字符串是否全部大写|
|`.isidentifier()`|`str`为有效标识符时返回 `True`|数字、字母、下划线且不能数字开头|
|`.isprintable()`|是否可打印|不含Unicode库中不可打印的字符|


|方法名|返回|作用|
|---|---|---|
|`.startswith(sub[, start[, end]])`|`True`/`False`|字符串开头是否为`sub`|
|`.endswith(sub[, start[, end]])`|`True`/`False`|字符串结尾是否为`sub`|


In [18]:
' '.isspace()

True

In [24]:
seq = ("r", "u", "nn", "o", "o", "b") # 字符串序列
"-".join( seq )

'r-u-nn-o-o-b'

### 2.4 计数
|方法|作用|
|---|---|
|`.count(subStr,pos1,pos2)`| 统计子字符串出现次数，可以指定位置，默认为全部|

### 2.5 查找

|方法名|返回|作用|
|---|---|---|
|`.find(s[, b[, e]])` |返回`s`在`str`中位置（开始的索引值），未找到则返回`-1` |
|`.rfind(s[, b[, e]])`|返回s在字符串内被找到的最大（最右）索引，未找到则返回 -1|
|`index(s[, b[, e]])` | 跟`find()`方法一样，只不过如果`s`不在`str`中会报一个异常 |
`.rindex(s[, b[, e]])`|类似于`rfind()`，但在`sub`未找到时会引发 `ValueError`|





ℹ️ 多次出现的值，只返回第一个值的位置

In [4]:
a = 'hheelloo'.strip('helo')
a

''

### 转换

|方法|作用|
|---|---|
|`encode(encoding='UTF-8',errors='strict')`|以 encoding 指定的编码格式编码字符串，如果出错默认报一个ValueError 的异常，除非 errors 指定的是'ignore'或者'replace'|
|`.maketrans()`| 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。|
|`.translate(table)`|返回原字符串的副本，其中每个字符按给定的转换表进行映射。 转换表必须是一个通过 __getitem__() 来实现索引操作的对象，通常为 mapping 或 sequence。 当以 Unicode 码位序号（整数）为索引时，转换表对象可以做以下任何一种操作：返回 Unicode 码位序号或字符串，将字符映射为一个或多个其他字符；返回 None，将字符从返回的字符串中删除；或引发 LookupError 异常，将字符映射为其自身。你可以使用 str.maketrans() 基于不同格式的字符到字符映射来创建一个转换映射表。另请参阅 codecs 模块以了解定制字符映射的更灵活方式。|

### 格式化字符串

#### 三种格式化方法：

||格式|优点|缺点|
|---|---|---|---|
|`%-formatting`格式符|`%`占位|经典|可读性和可维护性差|
|`str.format()`方法|`{:}`占位|不依赖位置传参|复杂，效率低，Python 2.6+|
|`f-string`表达式|`f'{}'`|简洁明了，性能优|需要Python 3.6+|


In [24]:
str1 = 'A is %5d, B is %5.2f.' % (10.6, 10.6*2)
str2 = 'A is {:5d}, B is {:5.2f}.'.format(int(10.6), 10.6*2)
str3 = f'A is {int(10.6):5d}, B is {10.6*2:5.2f}.'
str1
str2
str3

'A is    10, B is 21.20.'

'A is    10, B is 21.20.'

'A is    10, B is 21.20.'

#### `f-string`表达式⭐

格式化字符串常量**formatted string literals**是 Python 3.6 新引入的一种字符串格式化方法，使用`f`或`F`引领字符串，`' '`内是整个字符串，`{}`内包含要替换的字符串字段。

`f-string`在本质上并不是字符串常量，`{}`内是一个在运行时运算求值的表达式，其中直接填入替换内容，`{}`中的内容可以为数据、变量、表达式、函数、方法，会将其运行结果替换格式

1. 引号：大括号`{}`内所用的引号不能和大括号外的引号定界符冲突,可根据情况灵活切换`'`和`"`，若`'`和`"`不足以满足要求，还可以使用`'''`和`"""`
2. 括号：大括号外如果需要显示大括号，则应输入连续两个大括号`{{`和`}}` 
3. 转义：大括号外的引号可以使用`\`转义，但**大括号内不能使用**`\`转义，如果确实需要`\`，则应首先将包含`\`的赋给变量，再在大括号内使用变量

**3.12新特性：**

1. 引号：可以使用相同引号
2. 表达式：内部可以使用任何表达式
3. 转义：可以直接使用`\`转义。包括使用`unicode escape`添加Unicode字符
4. 可以多行定义f-string


In [26]:
songs = ['Take me back to Eden', 'Alkaline', 'Ascensionism']
f"This is the playlist: {", ".join(songs)}"
f"{f"{f"{f"{f"{f"{1+1}"}"}"}"}"}"


'This is the playlist: Take me back to Eden, Alkaline, Ascensionism'

'2'

'This is the playlist: Take me back to Eden\nAlkaline\nAscensionism'

'This is the playlist: Take me back to Eden♥Alkaline♥Ascensionism'

In [28]:
print(f"This is the playlist: {"\n".join(songs)}")  #打印回车
print(f"This is the playlist: {"\N{BLACK HEART SUIT}".join(songs)}") #Unicode字符

This is the playlist: Take me back to Eden
Alkaline
Ascensionism
This is the playlist: Take me back to Eden♥Alkaline♥Ascensionism
