### Поиск на основе регулярных выражений

In [16]:
# переформатирования выводимой строки
fields = ['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']
delimeters = fields[1::2] + ['']
values = fields[::2]
''.join([v+d for v,d in zip(values,delimeters)])

'asdf fjdk;afed,fjek,asdf,foo'

In [17]:
# Вы хотите найти текст, используя те же маски, которые обычно используются в оболочках Unix (например, \*.py, Dat[0-9]\*.csv и т.д.)
from fnmatch import fnmatch, fnmatchcase
print(fnmatch('Dat45.csv', 'Dat[0-9]*'))
print(fnmatch('foo.txt', '?oo.txt'))


True
True


In [18]:
addresses = [
    '5412 N CLARK ST',
    '1060 W ADDISON ST',
    '1039 W GRANVILLE AVE',
    '2122 N CLARK ST',
    '4802 N BROADWAY',
]
[addr for addr in addresses if fnmatchcase(addr, '54[0-9][0-9] *CLARK*')]

['5412 N CLARK ST']

In [19]:
# Если вы собираетесь много раз искать по одному и тому же шаблону, часто окупается предварительная компиляция шаблона регулярного выражения в объект шаблона.
import re
date = '2021-12-03'
form = re.compile(r'\d+-\d+-\d+')
if form.match(date):
    print('yes')
else:
    print('no')


yes


In [34]:
# При составлении регулярных выражений часто нужно использовать захватывающие группы, заключая части шаблона в скобки.
form = re.compile(r'(\d+)-(\d+)-(\d+)')
g = form.match(date)
print(g.groups())
yead, month, day = g.groups()
print(yead, month, day)

# Если вы хотите искать совпадения итеративно, используйте метод *finditer()*
for m in form.finditer(date):
    print('iterated', m.groups())

('2021', '12', '03')
2021 12 03
iterated ('2021', '12', '03')


### Поиск и замена текста

In [35]:
# перезаписать даты, чтобы перевести из их формата “11/27/2012” в “2012-11-27.”
text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
re.sub(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text)

'Today is 2012-11-27. PyCon starts 2013-3-13.'

In [39]:
# более сложных подстановок можно определить подстановочную функцию обратного вызова (коллбэк, callback)
from calendar import month_abbr

form = re.compile(r'(\d+)/(\d+)/(\d+)')

def change_date(m):
    mon_name = month_abbr[int(m.group(1))]
    return '{} {} {}'.format(m.group(2), mon_name, m.group(3))

form.sub(change_date, text)

'Today is 27 Nov 2012. PyCon starts 13 Mar 2013.'

In [42]:
# текст замены не будет совпадать по регистру с заменяемым текстом

text = 'UPPER PYTHON, lower python, Mixed Python'

def matchcase(word):
    def replace(m):
        text = m.group()
        if text.isupper():
            return word.upper()
        elif text.islower():
            return word.lower()
        elif text[0].isupper():
            return word.capitalize()
        else:
            return word
    return replace

re.sub('python', matchcase('snake'), text, flags=re.IGNORECASE)


'UPPER SNAKE, lower snake, Mixed Snake'