# 字符串
字符串也可以根据索引进行切片，其中**字符串的空格也属于字符串的元素**，字符串中插入指定元素的方式与向元组中插入元素的方式相同。

## 一、查看字符串的内置函数及帮助内容

In [1]:
print(dir(str), end = '')

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

In [150]:
string = ''
help(string.capitalize)

Help on built-in function capitalize:

capitalize(...) method of builtins.str instance
    S.capitalize() -> str
    
    Return a capitalized version of S, i.e. make the first character
    have upper case and the rest lower case.



## 二、字符串的内置函数

## 1、capitalize()
**作用**：将字符串中的首字符改为大写，其余仍为小写   
**用法**：string.capitalize()，无参数  
**返回值**：生成一个新的字符串，并未修改原字符串

In [2]:
string = 'abcdefg'
string1 = string.capitalize()
string, string1

('abcdefg', 'Abcdefg')

## 2、casefold()
**作用**：将字符串中所有字符均改为小写  
**用法**：string.casefold()，无参数

In [3]:
string = 'ABcdfdfgdgDSDS'
string.casefold()

'abcdfdfgdgdsds'

## 3、center()、ljust()、rjust()
### 3.1、center()
**作用**：将字符串居中  
**用法**：string.center(width[, fillchar])  
**参数**：width用于指定宽度  
　　　fillchar：填充字符串，若想要居中字符串长度小于指定宽度，则使用该参数指定填充空余位置的字符；反之，则不需要填充。默认使用空格填充
### 3.2、ljust()
**作用**：返回左对齐字符串，并利用fillchar指定填充方式填充为指定长度width的新字符串  
**用法**：string.ljust(width[, fillchar])
### 3.3、rjust()
**作用**：返回右对齐字符串，并利用fillchar指定填充方式填充为指定长度width的新字符串  
**用法**：string.rjust(width[, fillchar])
### 注意
当不指定fillchar时，默认以空格填充

In [4]:
# 居中对齐
string = 'abc'
string.center(7, '-'), string.center(7)

('--abc--', '  abc  ')

In [83]:
# 左对齐
string = 'wzp'
string.ljust(8, '-'), string.ljust(8)

('wzp-----', 'wzp     ')

In [84]:
# 右对齐
string = 'wzp'
string.rjust(8, '-'), string.rjust(8)

('-----wzp', '     wzp')

### 4、count()
**作用**：查看指定子字符串在整个字符串中出现的次数  
**用法**：string.count(sub[,start[, end]])  
**参数**：sub表示指定的子字符串  
　　　start、stop表示将原字符串进行切片，查看在该切片中指定子字符出现的次数

In [34]:
string = 'abcdefabcghiabcklh'
string.count('abc') # 查看指定子字符串“abc”在string中出现的次数
# string.count('abc', 3) # 查看指定子字符串在string[3:]切片中出现的次数
# string.count('abc', 3, -7) # 查看指定子字符串在string[3:-6]中出现的次数

3

### 5、encode()
**作用**：对字符串进行编码  
**用法**：string.encode(encoding = 'utf-8', errors = 'strict')  
**参数**：encoding用于指定字符串的编码格式，默认为“utf-8”编码  
　　　**errors用于设置不同的错误处理方案**，默认为“strict”，当编码错误时返回错误:UnicodeEncodeError；还可以选择其他参数：ignore、replace、xmlcharrefreplace

In [6]:
# strict表示严格执行编码，出现错误即返回错误提示
string = '我要吃鱼'
string.encode(encoding = 'utf-8', errors = 'strict')

b'\xe6\x88\x91\xe8\xa6\x81\xe5\x90\x83\xe9\xb1\xbc'

In [7]:
# ignore表示忽略错误提示
string.encode(encoding = 'ASCII', errors = 'ignore')

b''

In [8]:
# replace表示出现编码错误时，以“????”替换
string.encode(encoding = 'ASCII', errors = 'replace')

b'????'

In [9]:
# xmlcharrefreplace表示出现错误时，利用XML编码格式替换
string.encode(encoding = 'ASCII', errors = 'xmlcharrefreplace')

b'&#25105;&#35201;&#21507;&#40060;'

## 6、endswith()、startswith()
### 6.1、endswith()
**作用**：检查原字符串是否以指定子字符串结束，若是则为True；反之则为False  
**用法**：string.endswith(suffix[, start[, end]])  
**参数**：suffix用于指定判断的子字符串  
　　　start、stop作用与之前类似，对原字符串进行切片，查看该切片是否以指定子字符串结束
### 6.2、startswith()
**作用**：与endswith()用法完全一致，但该方法用于检查是否以指定字符串开头

In [134]:
string = 'ABCdef ghi abc def abc'
string.endswith('abc'), string.startswith('ABC')

(True, True)

In [135]:
string.endswith('abc', 3, 14), string.startswith('def', 3, 14)

(True, True)

## 7、expandtabs()
**作用**：将字符串中**tab(即“\t”)**符号转换为空格  
**用法**：string.expandtabs(tabsize = 8)  
**参数**：tabsize表示将每个**tab(即“\t”)**符号转换为空格，对应的空格数量，默认为8

In [26]:
string = 'ab\tcde\tf\tg'
string.expandtabs(tabsize = 1) # tabsize = 1表示每个tab转换为1个空格

'ab cde f g'

## 8、find()与rfind()、index()与rindex()
### 8.1 find()
**作用**：返回在原字符串中找到的指定子字符串中第一个元素在原字符串中的索引值。**若找到子字符串，则返回索引值；反之则返回-1**   
**用法**：string.find(sub[, start[, end]])  
**参数**：sub表示指定子字符串  
　　　start、stop与之前类似，对原字符串进行切片，在切片中查找指定子字符串，并返回子字符串第一个元素对应的索引值  
### rfind()
**作用**：与find()一致，但该方法查找子字符串是从右边开始查找
### 8.2、index()
**作用**：与**find()**用法一致  
**用法**：string.index(sub[, start[, end]])  
### rindex()
**作用**：与index()用法一致，但该方法查找子字符串是从右边开始查找
### 8.3、index()与find()的区别
**区别**：当指定子字符串在原字符串中时，二者用法完全一致；若指定子字符串不在原字符串中时，find()返回**-1**，而index()返回错误：ValueError，提示子字符串未找到

In [108]:
string = 'abcdefabcghi'
string.find('abc'), string.find('def', 6, -1), string.find('abc', 2, -3)

(0, -1, 6)

In [109]:
string.rfind('abc'), string.rfind('def', 6, -1), string.rfind('abc', 2, -3)

(6, -1, 6)

In [110]:
string.index('1', 2, -3)
# string.index('abc')
# string.index('abc', 2, -3)

ValueError: substring not found

In [111]:
string.rindex('abc')

6

## 9、isalnum()、isalpha()、isnumeric()
### 9.1、isalnum()
**作用**：若字符串中至少有一个字符并且都是字母、数字或者字母与数字的结合，则返回True；反之返回False（即不能包含标点等其他符号）    
**用法**：string.isalnum()，无参数  
### 9.2、isalpha()
**作用**：若字符串中至少有一个字符且所有字符都是字母，则返回True；反之返回False  
**用法**：string.isalpha()，无参数  
### 9.2、isnumeric()
**作用**：若字符串中只包含数字字符，则返回True；反之返回False  
**用法**：string.isnumeric()，无参数
### 9.3、三者关系
isalnum()相当于isalpha()、isnumeric()的结合体

In [54]:
string1, string2= '我123abc', 'abc,. '
string1.isalnum(), string2.isalnum() # 字符串中包含非字母、数字的字符，即标点符号

(True, False)

In [58]:
string3 = 'abc'
string1.isalpha(), string3.isalpha()

(False, True)

In [59]:
string4 = '123'
string1.isnumeric(), string4.isnumeric()

(False, True)

## 10、isdecimal()、isdigit()
### 10.1、isdecimal()
**作用**：若字符串中只包含**十进制数字**，则返回True；反之返回False  
**用法**：string.isdecimal()，无参数  
### 10.2、isdigit()
**作用**：若字符串只包含数字，则返回True；反之返回False  
**用法**：string.isdigit()，无参数  

In [67]:
string1, string2 = '234', '123'
string1.isdecimal(), string2.isdigit()

(True, True)

## 11、islower()、isupper()
### 11.1、islower()
**作用**：若字符串中至少包含一个可区分大小写的字符且所有这些字符均为小写，则返回True；反之返回False  
**用法**：string.islower()，无参数
### 11.2、isupper()
**作用**：与islower()恰好相反，若字符串中至少包含一个可区分大小写的字符且这些字符均为大写，则返回True；反之返回False  
**用法**：string.isupper()，无参数
### 注意：
对于中文，以上两个函数返回值均为False

In [71]:
string1, string2, string3 = '123abc456', '123ABC456', '123aBc456'
string1.islower(), string2.isupper(), string3.islower(), string3.isupper()

(True, True, False, False)

In [72]:
string = '我'
string.islower(), string.isupper()

(False, False)

## 12、isspace()
**作用**：若字符串中只包含空格，则返回True；反之返回False  
**用法**：string.isspace()，无参数

In [74]:
string1, string2 = '  123  ', '  '
string1.isspace(), string2.isspace()

(False, True)

## 13、istitle()
**作用**：若字符串是标题化（即所有单词均已大写开头，其余字母均为小写），则返回True；反之返回False  
**用法**：string.istitle()，无参数

In [77]:
string1, string2, string3 = 'Abc abc', 'ABC CDE', 'Abc, Cde'
string1.istitle(), string2.istitle(), string3.istitle()

(False, False, True)

## 14、join()
**作用**：以字符串作为分割符，将指定符号插入到字符串所有字符之间  
**用法**：S.join(iterable)，“S”表示指定插入字符串之间的符号，“iterable”表示可迭代对象(可理解为序列)

In [79]:
string = 'abc'
','.join(string)

'a,b,c'

## 15、lower()、upper()
### 15.1、lower()
**作用**：将字符串中所有大写字母均转换为小写字母  
**用法**：string.lower()，无参数
### 15.2、upper()
与lower()相反，将字符串所有小写字母均转换为大写字母

In [86]:
string1, string2 = 'abc Abc', 'ABC aBC'
string1.upper(), string2.lower()

('ABC ABC', 'abc abc')

## 16、strip()、lstrip()、rstrip()
### 16.1、strip()
**作用**：去掉字符串两侧指定要删除的元素
**用法**：string.strip([chars])
**参数**：chars用于指定要删除的元素，可选，**若不指定该参数，则默认删除空格**
### 16.2、lstrip()
**作用**：删除字符串左侧指定要删除的元素
### 16.3、rstrip()
**作用**：删除字符串右侧指定要删除的元素

In [94]:
string = ' 123345 '
string.strip(), string.lstrip(' 1'), string.rstrip('5 ')

('123345', '23345 ', ' 12334')

## 17、partition()、rpartition()
**作用**：在原字符串中查找指定子字符串，若找到该子字符串，则将原字符串分为包含三个元素的元组，即(子字符串之前的部分，子字符串，子字符串之后的部分)；若未找打该子字符串，则返回元组，即(原字符串，空字符串， 空字符串)  
**用法**：string.partition(sub)，sub表示指定的子字符串
### 注意：
rpartition()与partition()区别在于：前置查找子字符串时是从右边开始查找

In [112]:
string = 'abcdef123jklopq'
string.partition('123'), string.partition('234')

(('abcdef', '123', 'jklopq'), ('abcdef123jklopq', '', ''))

In [113]:
string.rpartition('123')

('abcdef', '123', 'jklopq')

## 18、repalce()
**作用**：利用指定的新字符串来替换指定的旧字符串  
**用法**：string.replace(old, new[, count])  
**参数**：old表示指定的原字符串中的旧字符串  
　　　new表示指定用于替换的新字符串  
　　　count用于指定替换的次数，可选

In [123]:
string = '123abc456def123dfg123'
string.replace('123', 'jkl'), string.replace('123', 'jkl', 2) # 表示替换两个，即将两个“123”替换为“jkl”

('jklabc456defjkldfgjkl', 'jklabc456defjkldfg123')

## 19、split()与rsplit()、splitlines()
### 19.1、split()
**作用**：按照指定分隔符号将原字符串进行切片操作     
**用法**：string.split(sep = None, maxsplit = -1)  
**参数**：sep用于指定分隔符号，若不指定，则默认使用空格作为分隔符号  
　　　maxsplit用于指定按照指定字符串分隔几次  
**返回值**：返回值为列表形式
### rsplit()
**作用**：与split()用法一致，但该方法分隔是从字符串右边开始
### 19.2、splitlines()
**作用**：按照换行符“\n”进行分隔，返回包含各行作为元素的列表
**用法**：string.splitlines([keywords])

In [129]:
string = '123abc456abc789'
string.split('abc'), string.split('abc', maxsplit = 1), string.split('abc', maxsplit = 2)

(['123', '456', '789'], ['123', '456abc789'], ['123', '456', '789'])

In [130]:
string.rsplit('abc')

['123', '456', '789']

In [133]:
string = '''abc
def
123
456
'''
string.splitlines() # 按照换行符“\n”进行分隔

['abc', 'def', '123', '456']

## 20、swapcase()
**作用**：将字符串中大写字母转换为小写，小写字母转换为大写  
**用法**：string.swapcase()，无参数

In [137]:
string = 'ABCabc'
string.swapcase()

'abcABC'

## 21、title()
**作用**：将字符串中每个单词均以大写字母开头，其余为小写  
**用法**：string.title()，无参数

In [139]:
string = 'abc def ghi'
string.title()

'Abc Def Ghi'

## 22、translate()
**作用**：根据table的规则（可以有str.maketrans('a', 'b')定制）转换字符串中的字符  
**用法**：string.translate(table)

In [143]:
string = 'bsbsbsbs'
string.translate(str.maketrans('s', '-')), str.maketrans('s', '-') # 定制table规则，返回字典形式，其中“115”为“s”的ASCII码，“45”为“-”的ASCII码，进行映射

('b-b-b-b-', {115: 45})

## 23、zfill()
**作用**：返回长度为width的字符串，原字符串右对齐，前边width大于字符串长度的部分用零填充  
**用法**：string.zfill(width)，width指定返回字符串的长度

In [149]:
string = '123'
string.zfill(5) # width大于字符串长度的部分用零填充

'00123'