# 🕮 3: 字符串

🖊本章将介绍如何使用字符串来设置其他值的格式（比如便于打印），并大致了解使用字符串方法可完成的重要任务，如拆分、合并和查找等。

本章内容如下：

+ 3.1 [字符串基本操作](#3.1-字符串基本操作)
+ 3.2 [设置字符串的格式：精简版](#3.2-设置字符串的格式：精简版)
+ 3.3 [设置字符串的格式：完整版](#3.3-设置字符串的格式：完整版)
+ 3.4 [字符串方法](#3.4-字符串方法)

### 3.1 字符串基本操作

所有标准序列操作都适用于字符串，但是字符串是**不可变**的，因此所有的**元素赋值**和**切片赋值**都是非法的。

### 3.2 设置字符串的格式：精简版

+ 格式设置运算符：**`%`**
+ 在**`%`**左边指定一个字符串（_格式字符串_），并在右边指定要设置其格式的值。
+ 指定要设置其格式的值时，可使用**单个值**（如字符串或数字），可使用**元组**（如果要设置多个值的格式），还可使用**字典**（这将在下一章讨论），其中最常见的是**元组**。

In [65]:
format = "Hello, %s. %s enough for ya?"
values = ('world', 'Hot')
values = ('world', 35)
format % values

'Hello, world. 35 enough for ya?'

+ `%s`称为**转换说明符**
+ `s`意味着将值视为**`字符串`**，对于非字符串的值，使用`str()`将其转换为字符串

+ **模板字符串**
+ 类似于shell中的用法，使用`$`作为标识符

In [66]:
from string import Template

tmpl = Template("Hello, $who! $what enough for ya?")
tmpl.substitute(who = "Mars", what = "Dusty")

'Hello, Mars! Dusty enough for ya?'

+ 用字符串方法`format`
+ 替代字段用`{}`括起，其中可能包含**名称**，还可能包含有关如何对相应的值进行**转换**和**格式设置**的信息
+ 字符串中的花括号使用`{{}}`替代

In [67]:
from math import pi

print("{0} {1}, {2} {3} {0} {1}".format("to", "be", "or", "not"))
print("{name} is approximately {value:.2f}".format(name = "π", value = pi))

to be, or not to be
π is approximately 3.14


+ 最后，在Python 3.6中，如果变量与替换字段同名，还可使用一种简写。在这种情况下，可使用`f`字符串——在字符串前面加上`f`

In [68]:
from math import pi
cnt = 0
print(f'π is approximately {pi:.2f}')
print(f'{cnt} times called')

π is approximately 3.14
0 times called


### 3.3 设置字符串的格式：完整版

+ 基本思想是对字符串调用方法`format`，并提供要设置其格式的值
+ 字符串包含**如何设置格式**的信息，这些信息是使用一种**微型格式指定语言（mini-language）**指定的
+ 每个值都被插入字符串中，以替换用`{}`括起的**替换字段**

+ **替换字段**由如下部分组成
    - **字段名**：包括**名称**和**索引**
        + **指定名称**的字段和**未指定字段名**的字段可以混合使用
        + **指定索引**的字段和**未指定字段名**的字段**不可以**混合使用——引起顺序编号混乱
        + 可使用**索引**，还可使用**句点表示法**来**访问**导入的模块中的**方法**、**属性**、**变量**和**函数**
    - **转换标志**
        + 指定要在字段中包含的值后，就可添加有关如何设置其格式的指令
        + **转换标志**：`!` `:`
        
    - **格式说明符**

In [70]:
print("name :")
print("{foo} {} {bar} {}".format(3, 1, foo = 4, bar = 2))
#print("{foo} {} {bar} {}".format(foo = 4, bar = 2, 3, 1))
import math
print("The {mod.__name__} module defines the value {mod.pi} for π".format(mod = math))
print("trans :")
print("{pi!s} {pi!r} {pi!a}".format(pi = "π"))
print("{num:.3f}".format(num = 42))
print("{num:b}".format(num = 42))
print("{num:.2%}".format(num = 0.42))

name :
4 3 2 1
The math module defines the value 3.141592653589793 for π
trans :
π 'π' '\u03c0'
42.000
101010
42.00%


_附表3-1：字符串格式设置中的类型说明符_

|类型 | 含义 |
|:--  | :- |
|b   |将整数表示为二进制数 |
|c   |将整数解读为Unicode码点 |
|d   |将整数视为十进制数进行处理，这是整数默认使用的说明符 |
|e   |使用科学表示法来表示小数（用e来表示指数） |
|E   |与e相同，但使用E来表示指数 |
|f   |将小数表示为定点数 |
|F   |与f相同，但对于特殊值（nan和inf），使用大写表示 |
|g   |自动在定点表示法和科学表示法之间做出选择。这是默认用于小数的说明符，但在默认情况下至少有1位小数 |
|G   |与g相同，但使用大写来表示指数和特殊值 |
|n   |与g相同，但插入随区域而异的数字分隔符 |
|o   |将整数表示为八进制数 |
|s   |保持字符串的格式不变，这是默认用于字符串的说明符 |
|x   |将整数表示为十六进制数并使用小写字母 |
|X   |与x相同，但使用大写字母 |
|%   |将数表示为百分比值（乘以100，按说明符f设置格式，再在后面加上%） |

#### 3.3.3 宽度、精度和千位分隔符

+ **宽度**：使用**`整数`**指定
+ **精度**：使用**`.整数`**指定
+ **千位分隔符**：使用**`,`**指定

In [71]:
print("number {num:5}".format(num = 20181029))
print("number {num:.3f}".format(num = 20181029))
print("number {num:,}".format(num = 20181029))

number 20181029
number 20181029.000
number 20,181,029


#### 3.3.4 符号、对齐和用0填充

+ **符号**与**对齐**：在指定宽度和精度的数前面可添加标志
    - **对齐**包括：左对齐`<`，右对齐`>`和居中`^`
    - 还有更具体的说明符`=`，它指定将填充字符放在**符号**和**数字**之间_(使用`=`后默认右对齐)_
    - 如果要给正数加上符号，可使用说明符`+`（将其放在对齐说明符后面），而不是默认的`-`。如果将符号说明符指定为` `，会在正数前面加上空格而不是+
    - **`#`**：将其放在**符号说明符**和**宽度**之间（如果指定了这两种设置），指定随数据**类型**而定的转换方式

In [74]:
print("number {num:🌟>20,.3f}".format(num = 20181029))
print("number {num:🌟=20,.3f}".format(num = -20181029))
from math import pi
print("{0:.2f}\n{1:.2f}".format(pi, -pi))
print("---------")
print("{0: .2f}\n{1: .2f}".format(pi, -pi))
print("---------")
print("{0:+.2f}\n{1:+.2f}".format(pi, -pi))
print("---------")
print("{:#b} {:#g} {:#x}".format(2018, 10, 29))
print("{:b} {:g} {:x}".format(2018, 10, 29))

number 🌟🌟🌟🌟🌟🌟20,181,029.000
number -🌟🌟🌟🌟🌟20,181,029.000
3.14
-3.14
---------
 3.14
-3.14
---------
+3.14
-3.14
---------
0b11111100010 10.0000 0x1d
11111100010 10 1d


+ [代码清单3-1](../edit/3-1.py)

### 3.4 字符串方法

很多字符串方法都是从模块`string`中**继承**而来的。`string`模块现在仍提供一些特殊用途的方法。

#### 3.4.1 center

+ 方法`center`通过在两边添加填充字符（默认为_空格_）让字符串**居中**
+ 其他控制对齐的方法还有`ljust`，`rjust`和`zfill`

In [3]:
"The Middle by Jimmy Eat World".center(80, "*")

'*************************The Middle by Jimmy Eat World**************************'

#### 3.4.2 find

方法`find`在字符串中查找子串。如果找到，就返回子串的**第一个字符**的**索引**，否则返回`-1`。

+ 🌟语法：`"<str>".find('<substr>', start, end)`

In [4]:
s = "Are we who we are?"
print(s.find("Are"))
print(s.find(" "))
print(s.find("we"))
print(s.find("be"))

print(s.find("we", -7, -1))
print(s.rfind("we"))
print(s.endswith("are?"))

0
3
4
-1
11
11
True


+ 相关方法：`rfind`、`index`、`rindex`、`count`、`startswith`、`endswith`

#### 3.4.3 join

`join`是一个非常重要的字符串方法，其作用与[split](#3.4.6-split)相反，用于**合并**序列的元素。

In [5]:
#seq = [1, 2, 3, 4, 5]
seq = ["1", "2", "3", "4", "5"]
sep = '+'
print(sep.join(seq))
print("------------------------------------------------------------------------------------")
dirs = "jupyter.junyangz.com", "notebooks", "Python基础教程（第三版）", "Python_Ch_3.ipynb"
proxy = "https"
prefix = "://"
slash = "/"
print(proxy + prefix + slash.join(dirs))

1+2+3+4+5
------------------------------------------------------------------------------------
https://jupyter.junyangz.com/notebooks/Python基础教程（第三版）/Python_Ch_3.ipynb


#### 3.4.4 lower

方法`lower`返回字符串的**小写**版本

+ 相关方法：`islower`、`istitle`、`isupper`、`translate`、`capitalize`、`casefold`、`swapcase`、`title`、`upper`

In [7]:
usrname = input("Who am I serving:")
usrlist = ["Alice", "Bob", "Cavin", "David", "Eve", "Sakamoto", "Zhang"]
for name in usrlist:
    usrlist[usrlist.index(name)] = name.lower()
if usrname.lower() in usrlist : print("Welcome, {} San.".format(usrname.title()))

Who am I serving:alice
Welcome, Alice San.


+ 🎁 **首字母大写**
+ `title`方法：所有单词首字母大写：对单词的划分存在问题
+ `capwords()`方法：以标题格式首字母大写

In [39]:
import string

book = "Harry Potter and the Azkaban's Prisoner"
print(book.title())
print(string.capwords(book))

Harry Potter And The Azkaban'S Prisoner
Harry Potter And The Azkaban's Prisoner


#### 3.4.5 replace

方法`replace`将指定子串**都替换**为另一个字符串，并返回替换后的结果。

In [9]:
words = "to be, or not to be"
print(words.replace("to", "TO"))
print(words)

TO be, or not TO be
to be, or not to be


+ 相关方法：[translate](#3.4.8-translate)、`expandtabs`

#### 3.4.6 split

`split`是一个非常重要的字符串方法，其作用与[join](#3.4.3-join)相反，用于将字符串**拆分**为**序列**

In [6]:
url = "https://jupyter.junyangz.com/notebooks/Python基础教程（第三版）/Python_Ch_3.ipynb#3.4.6-split"
url_items = url.split("/")
print(url_items)

['https:', '', 'jupyter.junyangz.com', 'notebooks', 'Python基础教程（第三版）', 'Python_Ch_3.ipynb#3.4.6-split']


+ 相关方法：`partition`、`rpartition`、`rsplit`、`splitlines`

#### 3.4.7 strip

方法`strip`将字符串**开头**和**末尾**的**空白（但不包括中间的空白）**删除，并返回删除后的结果
+ 🌟语法：`'<str>'.strip('<chars>')`

In [None]:
sentence = "    Time: 2018/10/30 15:38    "
print("{:<}".format(sentence.strip()))
print("------------------------------")
sentence_lst = list(sentence)
wrapped_sentence = "🌟".join(sentence_lst)
print("{:>60}".format(wrapped_sentence))
print("{:>60}".format(wrapped_sentence.strip(' 🌟')))

+ 相关方法：`lstrip`、`rstrip`

#### 3.4.8 translate

方法`translate`与[replace](#3.4.5-replace)一样**替换**字符串的特定部分，但不同的是[replace](#3.4.5-replace)只能进行单字符替换。这个方法的优势在于能够同时替换**多个**字符，因此效率比[replace](#3.4.5-replace)高

+ 使用`translate`前必须创建一个**转换表**:

    `str.maketrans('<replaced chars>', '<replacing chars>')`
+ 调用方法`maketrans`时，还可提供可选的**第三个参数**，指定要将哪些字符**删除**
    
    `str.maketrans('<replaced chars>', '<replacing chars>', '<deleted chars>')`

In [10]:
table = str.maketrans('cs', 'kz', ' ')
print(table)
test = 'this is a test'
print("American: {}".format(test))
print("German: {}".format(test.translate(table)))

{99: 107, 115: 122, 32: None}
American: this is a test
German: thizizatezt


+ 相关方法：[replace](#3.4.5-replace)、[lower](#3.4.4)

#### 3.4.9 判断字符串是否满足特定的条件

以`is`开头的很多方法，都用于判断字符串是否符合某条件，返回为**布尔值**

+ 相关函数：`isalnum`、`isalpha`、`isdecimal`、`isdigit`、`isidentifier`、`islower`、`isnumeric`、`isprintable`、`isspace`、`istitle`、`isupper`

# 🞂 つづく