# [文本序列类型 --- str](https://docs.python.org/zh-cn/3/library/stdtypes.html#textseq)

- str是专门用于存储字符地序列数据类型
- str就是我们常说的**字符串**类型
- 它是一个不可变类型
- 它可由一对单引号、一对双引号、或一对三重引号包括的字符构成

本节讲述：
1. 字符串定义
2. 字符串格式化
3. 字符串方法

In [77]:
import decimal
import datetime
import string

## 定义 
### 字面值
- 可由字会串字面值的方式定义一个字符串；
- 在字符串中，字符`\`会将跟在它后面的字母解释为一种格式，这个作为称为`转义`，`\`称为`转义符` ；
- 在字符串前面加上某此字符，构成了对字符串的特定解释。这些字符称为[字面值前缀](https://docs.python.org/zh-cn/3/reference/lexical_analysis.html#strings)。

In [8]:
'这是单引号构成的字符串'

'这是三重号构成的字符串'

In [10]:
"这是双引号构成的字符串"

'这是双引号构成的字符串'

In [72]:
'''这是三重号构成的字符串'''

'这是三重号构成的字符串'

### 转义符

In [50]:
print('你好\t你好\n你好\\ 双引号\" 单引号\' ')

你好	你好
你好\ 双引号" 单引号' 


In [33]:
strlist = [b'adsf', B'adsf', r'no escape \t \r \n', R'no escape \t \r \n']
strlist

[b'adsf', b'adsf', 'no escape \\t \\r \\n', 'no escape \\t \\r \\n']

**注意**: 即使在原始字面值中，引号也可以加上反斜杠转义符，但反斜杠会保留在输出结果中；例如 r"\"" 是一个有效的字符串字面值，包含两个字符: 一个反斜杠和一个双引号；而 r"\" 不是一个有效的字符串字面值 (即便是原始字符串也不能以奇数个反斜杠结束)。特别地，一个原始字面值不能以单个反斜杠结束 (因为此反斜杠会转义其后的引号字符)。还要注意一个反斜杠加一个换行在字面值中会被解释为两个字符，而 不是 一个连续行。

### 格式化字面值

3.6 新版功能：格式化字符串字面值 或称 f-string 是带有 'f' 或 'F' 前缀的字符串字面值。这种字符串可包含替换字段，即以 {} 标示的表达式。而其他字符串字面值总是一个常量，格式化字符串字面值实际上是会在运行时被求值的表达式。

In [54]:
a = '哈尔滨工业'
b = '哈尔滨工程'
print(f'恭喜你考上了{a}大学')
print(f'恭喜你考上了{b}大学')

恭喜你考上了哈尔滨工业大学
恭喜你考上了哈尔滨工程大学


In [56]:
name = 'Fred'
print(f"He said his name is {name!r}.") # 后面的 !r 表示转化之后再次格式化
print(f"He said his name is {repr(name)}." )   # !r作用相当于函数 repr()

He said his name is 'Fred'.
He said his name is 'Fred'.


In [58]:
width = 10
precision = 4
value = decimal.Decimal("12.34567")
f"result: {value:{width}.{precision}}"

'result:      12.35'

In [69]:
today = datetime.datetime(year=2017, month=1, day=27)
print(f"{today:%B %d, %Y}")  # using date format specifier 冒号 ':' 标示的格式说明符
print(f"{today=:%B %d, %Y}") # using date format specifier and debugging  = 输出将包含表达式文本，'=' 以及求值结果。

January 27, 2017
today=January 27, 2017


In [71]:
line = "The mill's closed"
print(f"{line = }")
print(f"{line = :20}",'stop')
print(f"{line = !r:20}")

line = "The mill's closed"
line = The mill's closed    stop
line = "The mill's closed" 


### str()函数定义
- 字符串也可以通过使用 str 构造器从其他对象创建

In [20]:
# 由一个整数和小数初始化成一个字符串
str(1234)
str(1.234)

'123'

In [21]:
str(123+234)

'357'

## 字符串的方法

字符串实现了所有一般序列的操作，还额外提供了以下列出的一些附加方法。

- str.capitalize()/str.lower()/str.upper()/str.title()/str.swapcase() 
- str.center(width[, fillchar])/str.ljust(width[, fillchar])//str.rjust(width[, fillchar])
- str.count(sub[, start[, end]])
- str.encode(encoding="utf-8", errors="strict")
- str.startswith(prefix[, start[, end]])/str.endswith(suffix[, start[, end]])
- str.find(sub[, start[, end]])
- str.format(*args, **kwargs)
- str.format_map(mapping)
- str.index(sub[, start[, end]])
- str.isalnum()/str.isalpha()/str.isascii()/str.isdecimal()/str.isdigit()/str.isidentifier()/str.islower()/str.isnumeric()
  str.isprintable()/str.isspace()/str.istitle()/str.isupper()
- str.join(iterable)
- str.strip([chars])/str.lstrip([chars])/str.rstrip([chars])
- str.split(sep=None, maxsplit=-1)/str.rsplit(sep=None, maxsplit=-1)
- str.partition(sep)/ str.rpartition(sep)
- str.removeprefix(prefix, /)/str.removesuffix(suffix, /)
- str.replace(old, new[, count]) 

In [87]:
a = 'hello world'
print(a.capitalize())
print(a.lower())
print(a.upper())
print(a.title())
print(a.swapcase())

Hello world
hello world
HELLO WORLD
Hello World
HELLO WORLD


In [84]:
b = '  abcde    '
print(len(b))
print(b.center(20,'*'))
print(b.rjust(20,'*'))
print(b.ljust(20,'*'))

11
****  abcde    *****
*********  abcde    
  abcde    *********


In [86]:
c = 'a1a2a3a4'
print(c.count('a'))
print(c.count('a',0,4))

4
2


In [88]:
d = "SD12.png"
print(d.startswith('SD'))
print(d.endswith('.png'))

True
True


In [114]:
e = 'Python'
print(e.find('th'))
print('Py' in e)

2
True


In [121]:
f = str()
print(f.join(['adsf','1234']))
print(str().join(['adsf','1234']))

adsf1234
adsf1234


In [130]:
print('   spacious   adf'.lstrip())
print('   spacious   adf'.rstrip())
print('   spacious   adf   '.strip())

spacious   adf
   spacious   adf
spacious   adf


In [134]:
'1,2,3'.split(',')

['1', '2', '3']

In [135]:
'ab c\n\nde fg\rkl\r\n'.splitlines()

['ab c', '', 'de fg', 'kl']

## 格式化方法

**str.format(*args, **kwargs)**
执行字符串格式化操作。 调用此方法的字符串可以包含字符串字面值或者以花括号 {} 括起来的替换域。 每个替换域可以包含一个位置参数的数字索引，或者一个关键字参数的名称。 返回的字符串副本中每个替换域都会被替换为对应参数的字符串值。

In [92]:
"The sum of 1 + 2 is {0}".format(1+2)

'The sum of 1 + 2 is 3'

在`{}`之中，可以使用[格式规格迷你语言](https://docs.python.org/zh-cn/3/library/string.html#formatspec)对字符串格式化。

- format_spec     ::=  [[fill]align][sign][#][0][width][grouping_option][.precision][type]
- fill            ::=  any character
- align           ::=  "<" | ">" | "=" | "^"
- sign            ::=  "+" | "-" | " "
- width           ::=  digit+
- grouping_option ::=  "_" | ","
- precision       ::=  digit+
- type            ::=  "b" | "c" | "d" | "e" | "E" | "f" | "F" | "g" | "G" | "n" | "o" | "s" | "x" | "X" | "%"

In [104]:
a = 1234.567
b = -1234.567
print("{0} {1}".format(a,b))
print("{1} {0}".format(a,b))
print("{0:20.5}".format(a))
print("{0:^20.5}".format(a))
print("{0:>20.5}".format(a))
print("{0:*<20.5}".format(a))
print("{0:*^20.5}".format(a))
print("{0:*>20.5}".format(a))

1234.567 -1234.567
-1234.567 1234.567
              1234.6
       1234.6       
              1234.6
1234.6**************
*******1234.6*******
**************1234.6


In [107]:
print("{0:+20.5}".format(a))
print("{0:20.5}".format(b))

             +1234.6
             -1234.6


In [108]:
print("{0:+20.5E}".format(a))

        +1.23457E+03


In [109]:
'{:,}'.format(1234567890)

'1,234,567,890'

In [111]:
points = 19
total = 22
'Correct answers: {:.2%}'.format(points/total)

'Correct answers: 86.36%'

In [112]:
d = datetime.datetime(2010, 7, 4, 12, 15, 58)
'{:%Y-%m-%d %H:%M:%S}'.format(d)

'2010-07-04 12:15:58'

## string模块

除了内建的str类型，Python还有一个string模块，提供了一些额外的常量和方法。

In [1]:
import string
print(string.ascii_letters)
print(string.ascii_lowercase)
print(string.ascii_uppercase)
print(string.digits)
print(string.punctuation)

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijklmnopqrstuvwxyz
ABCDEFGHIJKLMNOPQRSTUVWXYZ
0123456789
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
