In [None]:
# 问题： 我们相对字符串中的文本做查找和替换
# 方案： str.replace re模块的sub()函数

In [2]:
text = 'yeah, but no, but yeah, but no, but yeah'
replaced_text= text.replace('yeah', 'yep')
print(replaced_text)

yep, but no, but yep, but no, but yep


In [4]:
# 针对更为复杂的模式， 可以使用re模块中的sub()函数方法。
# 如：把日期格式从 '11/27/2012' 改写为‘2012-11-27’
# sub() 的第一个参数是要匹配的模式，第二个参数是要替换上的模式。
import re
text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
replaced_text = re.sub(r'(\d+)/(\d+)/(\d+)',r'\3-\1-\2',text)
print(replaced_text)

Today is 2012-11-27. PyCon starts 2013-3-13.


In [5]:
# 如果打算用相同的模式执行重复替换，可以考虑将模式编译以获得最好的性能。
import re
datepat = re.compile(r'(\d+)/(\d+)/(\d+)')
replaced_text = datepat.sub(r'\3-\1-\2',text)
print(replaced_text)

Today is 2012-11-27. PyCon starts 2013-3-13.


In [6]:
# 对于更加复杂的情况，可以指定一个替换回调函数。
from calendar import month_abbr


def change_date(m):
    # 将数字转换为Nov.月份简写。
    mon_name = month_abbr[int(m.group(1))]
    return '{} {} {}'.format(m.group(2), mon_name, m.group(3))
text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
datepat = re.compile(r'(\d+)/(\d+)/(\d+)')
dd = datepat.sub(change_date, text)
print(dd)

Today is 27 Nov 2012. PyCon starts 13 Mar 2013.


In [None]:
# 除了得到替换后的文本外，如果想知道一共替换了多少次，可以使用re.subn()。

newtext, n = datepat.subn(r'\3-\1-\2',text)
print(n)