# 查找和替换文本
- 问题：对字符串中的文本做查找和替换
- 解决：str.replace(), re.sub()

简单的文本模式，使用str.replace()即可

In [1]:
text = 'I love python.'

In [2]:
text.replace('python', 'java')

'I love java.'

针对更复杂的模式，可以使用re模块中的sub()函数/方法。

把日期格式从'11/27/2012'改写为'2012-11-27'

In [3]:
text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'

In [4]:
import re
re.sub(r'([01]?\d)/([012]?\d|3[01])/(\d+)', r'\3-\1-\2', text)

'Today is 2012-11-27. PyCon starts 2013-3-13.'

sub()中第一个参数是要匹配的模式，第二个参数是要替换上的模式。类似\3这样反斜杠加数字的代表捕获组的编号

如果相同的模式要进行重复替换，可以考虑先将模式编译，以获得更好的性能

In [5]:
datepat = re.compile(r'([01]?\d)/([012]?\d|3[01])/(\d+)')
datepat.sub(r'\3-\1-\2', text)

'Today is 2012-11-27. PyCon starts 2013-3-13.'

对于更加复杂的情况可以指定一个替换回调函数, 替换回调函数的输入参数是一个匹配对象

In [6]:
from calendar import month_abbr
def change_date(m):
    mon_name = month_abbr[int(m.group(1))]
    return '{} {} {}'.format(m.group(2), mon_name, m.group(3))

In [7]:
datepat.sub(change_date, text)

'Today is 27 Nov 2012. PyCon starts 13 Mar 2013.'

需要知道一共完成了多少次替换，可以使用re.subn()

In [8]:
newtext, n = datepat.subn(r'\3-\1-\2', text)
newtext

'Today is 2012-11-27. PyCon starts 2013-3-13.'

In [9]:
n

2