# Chapter 3 Working with Strings

## Basic String Operations

In [2]:
website='http://www.python.org'
website[-3:]='com'

TypeError: 'str' object does not support item assignment

In [3]:
website='http://www.python.org'
website[-3:]='org'

TypeError: 'str' object does not support item assignment

Python 中的字符串（str）是不可变对象（immutable）

In [4]:
website = 'http://www.python.org'
# 截取原字符串除最后3位的部分，再拼接新内容（这里示例拼接的还是'org'，结果不变）
website = website[:-3] + 'com'  
print(website)  # 输出：http://www.python.org

http://www.python.com


## String Formatting: The Short Version

In [6]:
format="Hello,%s.%s enough for ya?"
values=('world','Hot')
format%values

'Hello,world.Hot enough for ya?'

%s转换说明符

%.3f 是一个用于格式化浮点数的转换符，其功能是：将浮点数格式化为保留小数点后 3 位的字符串。

In [7]:
from string import Template
tmpl=Template("Hello,$who!$what enough for ya?")
tmpl.substitute(who="Mars",what="Dusty")

'Hello,Mars!Dusty enough for ya?'

In [9]:
import string
tmpl=string.Template("Wow,$how!$who can have a look!")
tmpl.substitute(how="so amazing",who="You")

'Wow,so amazing!You can have a look!'

In [11]:
"{},{} and {}".format("first","second","third")

'first,second and third'

In [13]:
"{0},{1} and {2}".format("first","second","third")

'first,second and third'

In [14]:
"{},{} and {}".format("first","second","sixth")

'first,second and sixth'

In [15]:
"{1},{2} and {3}".format("first","second","sixth")

IndexError: Replacement index 3 out of range for positional args tuple

In [17]:
"{0},{1},{2} and {3}".format("first","second","sixth","tenth")

'first,second,sixth and tenth'

In [18]:
"{},{1},{} and {3}".format("first","second","sixth","tenth")

ValueError: cannot switch from automatic field numbering to manual field specification

In [19]:
"{},{},{} and {}".format("first","second","sixth","tenth")

'first,second,sixth and tenth'

In [20]:
"{3} {0} {2} {1} {3} {0}".format("be","not","or","to")

'to be or not to be'

In [21]:
"{0} {0} {3} {1} {3} {0}".format("be","not","or","to")

'be be to not to be'

In [24]:
from math import pi
"{name} is approximately {value:.2f}.".format(value=pi,name="π")
# "{name} is approximately {value:.2f}.".format(value=pi, name="π")
## 这是使用字符串的 format() 方法进行格式化，核心逻辑是：
## 字符串中用 {} 标记 “占位符”，占位符可以指定名称（如 {name}、{value:.2f}）；
## format() 方法通过关键字参数（value=pi、name="π"）为这些占位符赋值，最终生成完整字符串。

'π is approximately 3.14.'

pi 常量（π 的近似值，约为 3.1415926535...）。

In [1]:
"{name} is approximately {value}.".format(value=pi,name="π")

NameError: name 'pi' is not defined

In [2]:
from math import pi
"{name} is approximately {value}.".format(value=pi,name="π")

'π is approximately 3.141592653589793.'

In [4]:
from math import e
f"Euler's constant is roughly {e}."

"Euler's constant is roughly 2.718281828459045."

f"Euler's constant is roughly {e}." 是 Python 的 f-string（格式化字符串字面值），通过{e}将导入的常数e的值嵌入字符串中，最终输出时会自动替换为e的实际数值（约 2.718281828459045），从而得到指定的结果字符串。

In [3]:
from math import e
"Euler's constant is roughly{e}.".format(e=e)

"Euler's constant is roughly2.718281828459045."

这句代码是 Python 字符串的 format () 方法格式化，结构拆解如下：
字符串模板："Euler's constant is roughly {e}."
其中 {e} 是 “占位符”，用于后续填充具体值，占位符名称 e 仅为标识，与数学中的 e 无强制关联（但此处变量名恰好对应自然常数 e，易造成混淆）。
格式化调用：.format(e=e)

## String Formatting:The Long Version

通过字符串.format(值)的方式，按字符串内{}（及模板规则）的要求插入值，若要显示真实大括号则用{{}}。

In [5]:
"{{ceci n'est pas une replacement field}}".format()

"{ceci n'est pas une replacement field}"

### Replacement Field Names

In [7]:
"{foo}{}{bar}{}".format(1,2,bar=4,foo=3)

'3142'

In [8]:
"{foo}{1}{bar}{0}".format(1,2,foo=3,bar=4)

'3241'

In [11]:
fullname=["Alfred","Smoketoomuch"]
"Mr{name[1]}".format(name=fullname)

'MrSmoketoomuch'

In [14]:
import math
tmpl="The{mod.__name__}module defines the value {mod.pi} for π"
tmpl.format(mod=math)

'Themathmodule defines the value 3.141592653589793 for π'

包裹name 的是双下划线


tmpl 通常是 template（模板） 的缩写，是一个常用的变量 / 标识符命名，核心作用是指代 “模板文件”“模板数据结构” 或 “模板对象”，用于存储可复用的格式框架，后续可填充动态数据生成最终内容。


这段代码的作用是通过字符串格式化输出数学模块中 π 的值，解析如下：
首先导入了math模块，该模块包含数学相关的功能和常量
定义了一个字符串模板tmpl，其中包含两个占位符：
{mod.__name__}：用于获取模块的名称
{mod.pi}：用于获取模块中的 π 常量值
调用format()方法时传入了参数mod=math，将math模块赋值给mod变量

### Basic Conversions

In [16]:
print("{pi!s} {pi!r} {pi!a}".format(pi="π"))

π 'π' '\u03c0'


三者都是引用 pi 变量，但通过 !s/!r/!a 分别指定了 “转字符串”“原始表示”“ASCII 编码” 的输出规则

In [18]:
"The number is {num}".format(num=42)

'The number is 42'

In [19]:
"The number is {num:f}".format(num=42)

'The number is 42.000000'

“f” 多代表 “float”（浮点型，即带小数的数值）

In [23]:
"The number is {num:b}".format(num=42)

'The number is 101010'

其中{num:b}是 “格式化占位符”：
num：指定要填充的变量名（与后续format(num=42)中的参数对应，明确关联变量）；
:b：是 “格式说明符”，b是 “binary（二进制）” 的缩写，表示将变量num的值转换为二进制字符串（仅适用于整数）。

![capture_20250928172346867.bmp](attachment:be08991c-3f0b-4f25-8b76-8e8725714c64.bmp)

这些是 Python 字符串格式化中常用的格式说明符，用于指定不同类型数据的显示方式：

b：将整数格式化为二进制数字

c：将整数解释为 Unicode 码点（字符）

d：将整数格式化为十进制数字（整数的默认格式）

e：用科学计数法格式化十进制数，使用 e 表示指数

E：与 e 相同，但使用 E 表示指数

f：用固定小数位数格式化十进制数

F：与 f 相同，但将特殊值 (nan 和 inf) 格式化为大写

g：自动在固定和科学计数法之间选择（十进制数的默认格式，但默认版本至少有一位小数）

G：与 g 相同，但将指数指示符和特殊值大写

n：与 g 相同，但插入依赖于区域设置的数字分隔符

o：将整数格式化为八进制数字

s：按原样格式化字符串（字符串的默认格式）

x：将整数格式化为十六进制数字，使用小写字母

X：与 x 相同，但使用大写字母

%：将数字格式化为百分比（乘以 100，用 f 格式化，后跟 %）

这些说明符通常与 f-string、format () 方法或 % 格式化一起使用，以控制输出的格式。

### Width, Precision, and Thousands Separators

In [25]:
"{num:10}".format(num=3)

'         3'

"{num:10}".format(num=3) 表示将变量num（值为 3）格式化为长度为 10 的字符串

In [26]:
"{name:10}".format(name="Bob")

'Bob       '

In [38]:
"Pi day is {pi:.2f}".format(pi=pi)

NameError: name 'pi' is not defined

In [39]:
import math
"Pi day is {pi:.2f}".format(pi=pi)

NameError: name 'pi' is not defined

In [40]:
import math
"Pi day is {pi:.2f}".format(pi=math.pi)

'Pi day is 3.14'

In [42]:
import math
"{pi:10.2f}".format(pi=math.pi)

'      3.14'

In [44]:
"{:5}".format("Guido van Rossum")

'Guido van Rossum'

In [45]:
'One googol is {:,}',format(10**100)

('One googol is {:,}',
 '10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000')

### Signs, Alignment, and Zero-Padding

零表示该数字将进行零填充。

In [47]:
import math
'{:010.2f}'.format(math.pi)

'0000003.14'

In [51]:
import math
print('{0:<10.2f}\n{0:^10.2f}\n{0:>10.2f}'.format(math.pi))

3.14      
   3.14   
      3.14


In [54]:
"{:$^15}".format(" WIN BIG ")

'$$$ WIN BIG $$$'

你可以用填充字符来增强对齐说明符，填充字符会替代空格字符被使用。

\n是换行符，用于在两个格式化结果之间换行。

In [56]:
print('{0:10.2f}\n{1:10.2f}'.format(math.pi,-math.pi))

      3.14
     -3.14


In [57]:
print('{0:10.2f}\n{1:=10.2f}'.format(math.pi,-math.pi))

      3.14
-     3.14


There’s also the more specialized specifier =, which places any fill characters between sign and digits.

In [60]:
print('{0:-.2}\n{1:-.2}'.format(math.pi, -math.pi)) # Default

3.1
-3.1


如果你也想为正数添加符号，可以使用说明符 +（如果有的话，放在对齐说明符之后），而不是默认的 -。如果你使用空格字符，正数将会插入一个空格，而不是 +。

In [62]:
如果你也想为正数添加符号，可以使用说明符 +（如果有的话，放在对齐说明符之后），而不是默认的 -。如果你使用空格字符，正数将会插入一个空格，而不是 +。

+3.1
-3.1


In [63]:
print('{0:+.2}\n{1:+.2}'.format(math.pi, -math.pi))

+3.1
-3.1


In [64]:
print('{0:+.1}\n{1:+.1}'.format(math.pi, -math.pi))

+3e+00
-3e+00


In [65]:
print('{0:+.3}\n{1:+.3}'.format(math.pi, -math.pi))

+3.14
-3.14


In [66]:
print('{0:+.0}\n{1:+.2}'.format(math.pi, -math.pi))

+3e+00
-3e+00


In [67]:
print('{0:+}\n{1:+}'.format(math.pi, -math.pi))

+3.141592653589793
-3.141592653589793


In [68]:
print('{0:+.0f}\n{1:+.0f}'.format(math.pi, -math.pi))

+3
-3


In [71]:
print('{0: .2}\n{1: .2}'.format(math.pi,-math.pi))

 3.1
-3.1


In [72]:
"{:g}".format(42)

'42'

For various types of decimal numbers, it forces the inclusion of the decimal point (and for g, it keeps decimal zeros).

In [74]:
"{:#g}".format(42)

'42.0000'

#是格式修饰符，与 g 配合使用时，会强制为整数添加小数点（即使没有小数部分）

In [75]:
"{:b}".format(42)

'101010'

In [76]:
"{:#b}".format(42)

'0b101010'

最后一个组成部分是井号（#）选项，它被放置在符号和宽度（如果存在的话）之间。这会触发一种替代的转换形式，其细节因类型而异。例如，对于二进制、八进制和十六进制转换，会添加一个前缀。

In [79]:
# Print a formatted price list with a given width
width=int(input('Please enter width: '))
price_width=10
item_width=width - price_width
header_fmt='{{:{}}}{{:>{}}}'.format(item_width,price_width)
# 这行代码是在 Python 中创建一个格式化字符串模板，用于对齐显示内容（通常是项目名称和价格之类的成对信息）。
# 解析如下：
# 外层的{{:{}}}{{:>{}}}是格式化字符串的模板，其中：
# {{:{}}} 会被格式化为左对齐的占位符
# {{:>{}}} 会被格式化为右对齐的占位符
# 双大括号{{和}}是为了在最终字符串中保留单个大括号{和}
# 通过.format(item_width, price_width)进行填充后：
# 第一个占位符会变成{:<item_width}（左对齐，宽度为 item_width）
# 第二个占位符会变成{:>price_width}（右对齐，宽度为 price_width）
# “header_fmt” 通常是 “header format”（头部格式）的缩写
fmt='{{:{}}}{{:>{}.2f}}'.format(item_width,price_width)
print('='*width)
print(header_fmt.format('Item', 'Price'))
print('-'*width)
print(fmt.format('Apples',0.4))
print(fmt.format('Pears',0.5))
print(fmt.format('Cantaloupes',1.92))
print(fmt.format('Prunes(2 lbs.)',12))
print('='*width)

Please enter width:  35


Item                          Price
-----------------------------------
Apples                         0.40
Pears                          0.50
Cantaloupes                    1.92
Prunes(2 lbs.)                12.00


## String Methods

但字符串模块并未过时。尽管字符串方法已经完全取代了字符串模块，但该模块仍然包含一些字符串方法所不具备的常量和函数。以下是 string2 中一些有用的常量：

・string.digits：包含数字 0–9 的字符串

・string.ascii_letters：包含所有 ASCII 字母（大写和小写）的字符串

・string.ascii_lowercase：包含所有小写 ASCII 字母的字符串

・string.printable：包含所有可打印 ASCII 字符的字符串

・string.punctuation：包含所有 ASCII 标点字符的字符串

・string.ascii_uppercase：包含所有大写 ASCII 字母的字符串

尽管明确涉及 ASCII 字符，但这些值实际上是（未编码的）Unicode 字符串。

### center

In [81]:
"The Middle by Jimmy Eat World".center(39)

'     The Middle by Jimmy Eat World     '

In [82]:
"The Middle by Jimmy Eat World".center(39,"*")

'*****The Middle by Jimmy Eat World*****'

### find

In [83]:
'With a moo-moo here, and a moo-moo there'.find('moo')

7

find 方法用于在一个较长的字符串中查找子字符串。它返回子字符串被找到的最左侧索引。如果未找到子字符串，则返回–1。

In [85]:
title="Monty Python's Flying Circus"
title.find("Monty")

0

In [86]:
title.find('Python')

6

In [87]:
title.find('Flying')

15

In [88]:
title.find('Zirquss')

-1

In [89]:
subject='$$$ Get rich now!!! $$$'
subject.find('$$$')

0

In [90]:
subject.find('$$$', 1) # Only supplying the start

20

第二个参数1指定了搜索的起始位置（字符串索引从 0 开始，所以 1 表示从第二个字符开始）

In [91]:
subject.find('!!!')

16

In [92]:
subject.find('!!!', 0, 16) # Supplying start and end

-1

### join

In [97]:
seq=[1,2,3,4,5]
sep= '+'
sep.join(seq) # Trying to join a list of numbers

TypeError: sequence item 0: expected str instance, int found

sep 是作为分隔符的字符串

In [98]:
seq=['1','2','3','4','5']
sep.join(seq) # Joining a list of strings

'1+2+3+4+5'

In [99]:
dirs='','usr','bin','env'
'/'.join(dirs)

'/usr/bin/env'

然后调用'/'.join(dirs)，意思是用'/'作为连接符，将元组dirs中的所有字符串元素连接起来

In [100]:
print('C:' +'\\'.join(dirs))

C:\usr\bin\env


join() 是 Python 字符串的方法，作用是将一个可迭代对象（如列表 dirs）中的所有元素，用调用它的字符串（此处是 '\\'）连接成一个新字符串。
'\\' 是转义字符，表示实际要使用的单个反斜杠 \（因为在 Python 字符串中，\ 本身需要转义才能表示自身，避免被识别为特殊符号，如 \n 代表换行）。

### lower

In [101]:
'Trondheim Hammer Dance'.lower()

'trondheim hammer dance'

In [105]:
if 'Gumby' in ['gumby','smith','jones']: print('Found it!')

In [106]:
name='Gumby'
names=['gumby','smith','jones']
if name.lower() in names:print('Found it!')

Found it!


ower 的一个相关方法是 title 方法（参见附录 B），该方法会将字符串转换为首字母大写格式 —— 也就是说，所有单词都以大写字母开头，其他所有字符都为小写。不过，单词边界的定义方式可能会导致一些不自然的结果。

In [116]:
"that's all folks".title()

"That'S All Folks"

In [118]:
import string
string.capwords("that's all, folks")

"That's All, Folks"

### replace

In [119]:
'This is a test'.replace('is','eez')

'Theez eez a test'

### spilt

In [120]:
'1+2+3+4+5'.split('+')

['1', '2', '3', '4', '5']

In [121]:
'/usr/bin/env'.split('/')

['', 'usr', 'bin', 'env']

In [122]:
'Using the default'.split()

['Using', 'the', 'default']

### strip

In [123]:
'    internal whitespace is kept    '.strip()

'internal whitespace is kept'

In [124]:
names = ['gumby', 'smith', 'jones']
name = 'gumby '
if name in names: print('Found it!')
# strip 方法会返回一个字符串，其中左右两侧（但不是内部）的空白字符已被去除（删除）

In [126]:
 if name.strip() in names: print('Found it!')
# name.strip()：对变量name进行处理，strip()方法会移除字符串前后的空白字符（如空格、换行符等）

Found it!


In [127]:
'*** SPAM * for * everyone!!! ***'.strip(' *!')

'SPAM * for * everyone'

与 replace 类似，translate 也会替换字符串的部分内容，但和 replace 不同的是，translate 仅适用于单个字符。它的优势在于能够同时执行多项替换，而且比 replace 更高效。

In [112]:
table = str.maketrans('cs', 'kz')

In [113]:
 table

{99: 107, 115: 122}

In [108]:
'this is an incredible test'.translate(table)

'thizizaninkredibletezt'

In [107]:
table = str.maketrans('cs', 'kz', ' ')
'this is an incredible test'.translate(table)

'thizizaninkredibletezt'

![image.png](attachment:074fc87c-6aed-4eee-a80a-adc1318812c3.png)