# Day5:字符串与序列

## Python字符串

Python的字符串可以用`''`单引号，或者`""`双引号来定义，注意Python中并不存在字符类型，所有的字符都被当成了字符串

在访问字符串时，使用`[]`方括号来进行对字符串的索引调用，使用方式与列表和元组相同，也可以使用`+`,`*`这些运算符号实现字符串的拼接

### Python转义字符

需要使用特殊字符时，使用`\`反斜杠作为转义字符

| 转义字符|描述 |
| :-------:|:----:|
|\\(在行尾时)|续行符|
|\\\\|反斜杠符号|
|\\'|单引号|
|\\"|双引号|
|\\a|响铃|
|\\b|退格|
|\\000|空|
|\\n|换行|
|\\v|纵向制表符|
|\\t|横向制表符|
|\\r|回车|
|\\f|换页|
|\otherstring|其他的字符以普通格式输出|

In [1]:
string1 = "Hello\
 World"
print(string1)
string2 = 'I\'m fine'
print(string2)
string3 = "Hello\bWorld"
print(string3)

Hello World
I'm fine
HelloWorld


使用`r`或者`R`加在字符串的前面可以得到原始的字符串

In [2]:
string4 = r'Hello\tworld'
print(string4)
string5 = r'I\'m fine'
print(string5) #这里\'仍然可以使该反斜杠后的单引号不作为字符串结束的标志，但是反斜杠仍被照常输出了出来

Hello\tworld
I\'m fine


### Python字符串的格式化输出

Python支持格式化的字符串输出，格式化字符串与c中的基本一样，但是使用这样的语法：

In [3]:
print("%d + %d = %d" % (2, 3, 2+3)) #后面跟的是一个元组，中间用%符号链接
#值得一提的是，格式化字符串使用%%来输出单一的%

2 + 3 = 5


### Python三引号

python三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符。实例如下

In [4]:
string6 = """这是一个多行字符串的实例
多行字符串可以使用制表符
TAB ( \t )。
也可以使用换行符 [ \n ]。
"""
print (string6, end = "")

这是一个多行字符串的实例
多行字符串可以使用制表符
TAB ( 	 )。
也可以使用换行符 [ 
 ]。


## Python字符串的内置方法

### capitalize方法

将字符串的第一个字母变成大写，其余字母均变成小写，如果开头是非字母，则只是把所有字母变成小写

**注意::** capitalize()方法不会修改原来的字符串，只是会返回一个新的字符串

In [5]:
string7 = 'hello WORLD'
print(string7.capitalize())

Hello world


### center()方法

语法:  `str.center(width[, fillchar])`

center()方法返回一个指定宽度width居中的字符串，并用fillchar填充空白的字符

In [6]:
string8 = 'Hello World'
print(string8.center(20, '*'))
print(string8.center(4, '*')) #当width小于字符串长度时，并不会截断

****Hello World*****
Hello World


### count()方法

count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置

语法： `str.count(sub, start= 0,end=len(string))`

In [7]:
string9 = 'Hello World'
print(string9.count('l', 3))

2


### encode()与decode()方法

encode()方法以指定的编码格式编码字符串,返回一个bytes对象，decode()方法以指定的编码格式解码bytes对象

errors -- 设置不同错误的处理方案。默认为 'strict',意为编码错误引起一个UnicodeError。 其他可能得值有 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 以及通过 codecs.register_error() 注册的任何值

`str.encode(encoding='UTF-8',errors='strict')`

`bytes.decode(encoding="utf-8", errors="strict")`

In [8]:
string10 = "Python学习";
str_utf8 = string10.encode("UTF-8")
str_gbk = string10.encode("GBK")
 
print(string10)
 
print("UTF-8 编码：", str_utf8)
print("GBK 编码：", str_gbk)
 
print("UTF-8 解码：", str_utf8.decode('UTF-8','strict'))
print("GBK 解码：", str_gbk.decode('GBK','strict'))

Python学习
UTF-8 编码： b'Python\xe5\xad\xa6\xe4\xb9\xa0'
GBK 编码： b'Python\xd1\xa7\xcf\xb0'
UTF-8 解码： Python学习
GBK 解码： Python学习


### startwith()方法 与 endswith()方法

startswith() 方法用于检查字符串是否是以指定子字符串开头，如果是则返回 True，否则返回 False。如果参数 beg 和 end 指定值，则在指定范围内检查

`str.startwith(substr, beg=0,end=len(string))`

endswith()方法用于判断字符串是否以指定后缀结尾，如果以指定后缀结尾返回 True，否则返回 False。可选参数 "start" 与 "end" 为检索字符串的开始与结束位置

`str.endswith(suffix[, start[, end]])`

In [9]:
string11 = 'Hi! Python'
print(string11.endswith('Python', 0))
print(string11.endswith('Hi', 0, 2))
print(string11.endswith('Hi', 0, 3))

True
True
False


### expandtabs()方法

expandtabs()方法把字符串中的 tab 符号('\t')转为空格，tab 符号('\t')默认的空格数是 8

语法：`str.expandtabs(tabsize=8)`

In [10]:
string12 = "this is\tstring example....wow!!!"
 
print ("原始字符串: " + string12)
print ("替换 \\t 符号: " +  string12.expandtabs())
print ("使用16个空格替换 \\t 符号: " +  string12.expandtabs(16))

原始字符串: this is	string example....wow!!!
替换 \t 符号: this is string example....wow!!!
使用16个空格替换 \t 符号: this is         string example....wow!!!


### find()方法

find()方法检测字符串中是否包含查找的字符串，可以指定查找范围，如果没有查找的字符串返回-1，找到了则返回第一个匹配字符串第一个字母的索引

语法：`str.find(str, beg=0, end=len(string))`

In [11]:
string13 = 'abcde'
print(string13.find('c'))
print(string13.find('b',1,-2))
print(string13.find('d',1,3))
print(string13.find('bc'))

2
1
-1
1


### rfind()方法

rfind()返回字符串最后一次出现的位置，如果没有匹配项则返回-1

语法：`str.rfind(str, beg=0 end=len(string))`

### index()方法

index()方法与find()方法几乎完全相同，只不过index()方法没有匹配到时会抛出一个异常

### rindex()方法

与rfind()方法类同

### isalnum()方法

isalnum()方法检测字符串是否由字母和数字组成

语法：`string.isalnum()`

如果字符串里有汉字，也返回True

In [12]:
string14 = 'Python123你好'
print(string14.isalnum())
string15 = 'Hello World'
print(string15.isalnum())

True
False


### isalpha()方法

isalpha()方法检测是否只是由字母或文字构成

### isdigit()方法

isdigit()方法检测字符串是否只由数字组成

### islower()方法 与 isupper()方法

islower()方法检测字符串是否由小写字母组成

isupper()方法检测字符串是否由大写字母构成

如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False

### lower()方法 与 upper()方法

语法`str.lower()` `str.upper()`

lower()方法转换字符串中所有大写字符为小写

upper()方法转换字符串中所有大写字符为大写

### isnumeric()方法

isnumeric方法检测字符串是否只由数字组成

### isspace()方法

isspace()方法检测字符串是否只是由空格符组成

空白符包含：空格、制表符(\t)、换行(\n)、回车(\r）等

而空串不属于空格符

### istitle()方法

istitle()方法检测字符串中所有的单词拼写首字母是否为大写，且其他字母为小写

### title()方法

title()方法把字符串转换为title

### join()方法用于将序列中的元素以指定的字符连接生成一个新的字符串

语法：`str.join(seq)`

返回通过指定字符连接序列中元素后生成的新字符串

In [13]:
string16 = " "
string17 = ''
string18 = '-'
seq = ("r", "u", "n", "o", "o", "b")
print(string16.join(seq))
print(string17.join(seq))
print(string18.join(seq))

r u n o o b
runoob
r-u-n-o-o-b


### len()方法

语法：`len(str)`

返回字符串长度

### ljust()方法

语法：`str.ljust(width[, fillchar])`

ljust()方法返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串

如果指定的长度小于原字符串的长度则返回原字符串

In [14]:
string19 = "Python"

print (string19.ljust(10, '!'))

Python!!!!


### rjust()方法

右对齐

### lstrip()方法

语法：`str.lstrip([chars])`

lstrip()方法用于截掉字符串左边的空格或指定字符

返回截掉字符串左边的空格或指定字符后生成的新字符串

In [15]:
string20 = '88888Hello World'
print(string20.lstrip('8'))
string21 = '      creeper?'
print(string21.lstrip(' '))

Hello World
creeper?


### rstrip()方法

截掉字符串右边的字符

### strip()方法

同时执行lstrip()与rstrip()

### maketrans()方法 与 translate()方法

maketrans() 方法用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标

语法：`str.maketrans(intab, outtab)`

translate()方法用于用转换表转换字符串

语法：
`str.translate(table)
bytes.translate(table[, delete])    
bytearray.translate(table[, delete])`

In [16]:
intab = "aeiou"
outtab = "12345"
trantab = str.maketrans(intab, outtab)

str = "this is string example....wow!!!"
print (str.translate(trantab))

th3s 3s str3ng 2x1mpl2....w4w!!!


### max()方法 min()方法

max()方法返回字符串最大的字母，min()方法返回字符串最小的字母

### replace()方法

replace() 方法把字符串中的 old（旧字符串） 替换成 new(新字符串)，如果指定第三个参数max，则替换不超过 max 次

语法：`str.replace(old, new[, max])`

### split()方法

split() 通过指定分隔符对字符串进行切片，如果第二个参数 num 有指定值，则分割为 num+1 个子字符串

`str.split(str="", num=string.count(str))`

返回分割后的字符串列表

In [17]:
string22 = 'Hello World'
print(string22.split(' '))

['Hello', 'World']


### splitlines()方法

splitlines()按照行('\r', '\r\n', \n')分隔，返回一个包含各行作为元素的列表，参数 keepends 默认为 False，不包含换行符，如果为 True，则保留换行符

`str.splitlines([keepends])`