# Логика регулярных выражений (и зачем они нужны)

регулярное выражение — это последовательность символов, используемая для поиска и(или) замены некоторого паттерна в строке (тексте или файле)

регулярные выражения хороши, когда нам нужно вытащить из текста повторяющийся паттерн: номер телефона, конкретную фразу, адреса и тд.

[онлайн-редактор для регулярных выражений](https://regex101.com/r/F8dY80/3)

<table width="100%"><tbody><tr><th style="text-align: center;" width="90"><strong>Оператор</strong></th><th style="text-align: center;" width="680"><strong>Описание</strong></th></tr><tr><td width="90"><tt>.</tt></td><td width="680">Один любой символ, кроме новой строки <tt>\n</tt>.</td></tr><tr><td width="90"><tt>?</tt></td><td width="680">0 или 1 вхождение шаблона слева</td></tr><tr><td width="90"><tt>+</tt></td><td width="680">1 и более вхождений шаблона слева</td></tr><tr><td width="90"><tt>*</tt></td><td width="680">0 и более вхождений шаблона слева</td></tr><tr><td width="90"><tt>\w</tt></td><td width="680">Любая цифра или буква (<tt>\W</tt> —&nbsp;все, кроме буквы или цифры)</td></tr><tr><td width="90"><tt>\d</tt></td><td width="680">Любая цифра [0-9] (<tt>\D</tt> —&nbsp;все, кроме цифры)</td></tr><tr><td width="90"><tt>\s</tt></td><td width="680">Любой пробельный символ (<tt>\S</tt> —&nbsp;любой непробельный символ)</td></tr><tr><td width="90"><tt>\b</tt></td><td width="680">Граница слова</td></tr><tr><td width="90"><tt>[..]</tt></td><td width="680">Один из символов в скобках (<tt>[^..]</tt> —&nbsp;любой символ, кроме тех, что в скобках)</td></tr><tr><td width="90"><tt>\</tt></td><td width="680">Экранирование специальных символов (<tt>\.</tt> означает точку или <tt>\+</tt> —&nbsp;знак «плюс»)</td></tr><tr><td width="90"><tt>^</tt> и <tt>$</tt></td><td width="680">Начало и конец строки соответственно</td></tr><tr><td width="90"><tt>{n,m}</tt></td><td width="680">От <tt>n</tt> до <tt>m</tt> вхождений (<tt>{,m}</tt> —&nbsp;от 0 до <tt>m</tt>)</td></tr><tr><td width="90"><tt>a|b</tt></td><td width="680">Соответствует <tt>a</tt> или <tt>b</tt></td></tr><tr><td width="90"><tt>()</tt></td><td width="680">Группирует выражение и возвращает найденный текст</td></tr><tr><td width="90"><tt>\t</tt>, <tt>\n</tt>, <tt>\r</tt></td><td width="680">Символ табуляции, новой строки и возврата каретки соответственно</td></tr></tbody></table>


[здесь](https://www.rexegg.com/regex-quickstart.html) развернутая таблица синтаксиса

#Регулярные выражения в питоне

чтобы начать работать с регулярными выражениями в питоне, нам нужно импортировать модуль ``re`` или установить библиотеку regex: pip install regex

* здесь [ссылка](https://docs.python.org/3/library/re.html) на его документацию и [ссылка на тьюториал](https://docs.python.org/3/howto/regex.html#regex-howto) 

а так выглядят основные функции модуля re 

<div class="table"><table>
<thead>
<tr>
<th>Функция</th>
<th>Что делает</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>re.match(pattern, string)</code></td>
<td>Найти по заданному шаблону <code>pattern</code> первое совпадение в начале строки<code>string</code></td>
</tr>
<tr>
<td><code>re.search(pattern, string)</code></td>
<td>Найти в строке <code>string</code> первую строчку, подходящую под шаблон <code>pattern</code> <br>ищет по всей строке, но возвращает только первое найденное совпадение</br></td>
</tr>
<tr>
<td><code>re.fullmatch(pattern, string)</code></td>
<td>Проверить, подходит ли строка <code>string</code> под шаблон <code>pattern</code></td>
</tr>
<tr>
<td><code>re.split(pattern, string, maxsplit=0)</code></td>
<td>Аналог <code>str.split()</code>, только разделение происходит по подстрокам, подходящим под шаблон <code>pattern</code></td>
</tr>
<tr>
<td><code>re.findall(pattern, string)</code></td>
<td>Найти в строке <code>string</code> все непересекающиеся шаблоны <code>pattern</code></td>
</tr>
<tr>
<td><code>re.sub(pattern, replace, string)</code></td>
<td>Заменить в строке <code>string</code> все непересекающиеся шаблоны <code>pattern</code> на <code>replace</code></td>
</tr>
</tbody>
</table></div>


Давайте попробуем!

In [None]:
!pip install regex
#pip3 install regex

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [None]:
import re 
# для PyCharm - оставьте эту строку в исполняемом файле

In [None]:
text =  "Hello my dear friend Amy.\nHello again!"

print(text)

Hello my dear friend Amy.
Hello again!


##.match(pattern, string)

метод ищет подстроку по заданному шаблону в начале строки

In [None]:
result = re.match(r'Hello', text)
# «r» перед строкой шаблона показывает, что это «сырая» строка в Python
# не рассматривай \ как экранирующий символ

print(result)
# попробуйте найти hello вместо Hello

<re.Match object; span=(0, 5), match='Hello'>


Строка найдена, но не показывается. По умолчанию, print покажет сам объект (найденный паттерн) и его мета-данные.

Чтобы вывести содержимое, используем метод .group() Он показывает вхождения искомого паттерна

In [None]:
print(result.group())

Hello


In [None]:
# попробуйте найти hello вместо Hello
result = re.match(r'hello', text)
print(result) # такая подстрока не начинает наш текст
print(result.group())

None


AttributeError: ignored

##.fullmatch(pattern, string)
проверяет, является ли паттерн полным совпадением со строкой

In [None]:
result = re.fullmatch(r'Hello my dear friend Amy', 'Hello my dear friend Amy')

print(result)

print(result.group())

<re.Match object; span=(0, 24), match='Hello my dear friend Amy'>
Hello my dear friend Amy


In [None]:
res2 = re.fullmatch(r'Hello my dear friend Amy.\nHello again!', text) # сравниваем текст и переменную text

print(res2)

print(res2.group())

<re.Match object; span=(0, 38), match='Hello my dear friend Amy.\nHello again!'>
Hello my dear friend Amy.
Hello again!


In [None]:
res3 = re.fullmatch(r'Hello my dear friend Amy.', text) # сравниваем текст и переменную text

print(res3) # они не (полностью) совпадают

print(res3.group())

None


AttributeError: ignored

##.search(pattern, string)
ищет паттерн по всей длине строки

Внимание! search ищет не только в начале строки, в отличие от match

! Вернется первое совпадение

Примеры: [разница search и match](https://docs.python.org/3/library/re.html#search-vs-match)

In [None]:
result = re.search(r'Hello', text)
# print(result)

print(result)

print(result.group())

<re.Match object; span=(0, 5), match='Hello'>
Hello


In [None]:
# попробуйте найти второе вхождение слова Hello
# 'Hello my dear friend Amy.\nHello again!'
result = re.search(r'\sHello', text) # любой пробельный символ
result = re.search(r'\nHello', text)
# по умолчанию возвращает только первое совпадение 

print(result)

print(result.group())

<re.Match object; span=(25, 31), match='\nHello'>

Hello


## .split(pattern, string, maxsplit=0)

Похож на знакомый нам ```.split()```. Метод разделяет строку по заданному шаблону

In [None]:
result = re.split(r'\s',text) # любой пробельный символ

print(result)
# обратите внимание: здесь результат можно сразу напечатать без метода .group()

['Hello', 'my', 'dear', 'friend', 'Amy.', 'Hello', 'again!']


In [None]:
res2 = re.split("\.\s", text) # \s - любой пробельный символ, включая перенос строки, табуляцию и т.д.

print(res2)

['Hello my dear friend Amy', 'Hello again!']


In [None]:
res3 = re.split("[\.!]\s", text + '\nHow are you?')

print(text + '\nHow are you?')

print(res3)

Hello my dear friend Amy.
Hello again!
How are you?
['Hello my dear friend Amy', 'Hello again', 'How are you?']


In [None]:
res3 = re.split("[\.!\?]", text + '\nHow are you?')

print(res3)

res3 = re.split("[\.!\?]\s", text + '\nHow are you?')

print(res3)

res3 = re.split("[\.!]\s|\?", text + '\nHow are you?')


# . + ? *
#res3 = re.split("[\.!?]\s|?$", text + '\nHow are you?')
# . - любой символ
# \. - точка, экранируем
# ? - 0 или 1 любой символ
# \? - воспросительный знак
#print(text + '\nHow are you?')

# сложно придумать, как убрать ?

s = ''.join(res3)
print(s.strip('?'))

for i in range(len(res3)):
  res3[i] = res3[i].strip('?')
print(res3)

['Hello my dear friend Amy', '\nHello again', '\nHow are you', '']
['Hello my dear friend Amy', 'Hello again', 'How are you?']
Hello my dear friend AmyHello againHow are you
['Hello my dear friend Amy', 'Hello again', 'How are you', '']


maxsplit - опциональный аргумент.
Если его указать, то разделение будет произведено не более указанного количества раз

In [None]:
result = re.split(r' ', text, maxsplit=4)

print(result)

['Hello', 'my', 'dear', 'friend', 'Amy.\nHello again!']


##.findall(pattern, string)

In [None]:
result = re.findall(r'my', text)
print(result)

# вопрос: чем отличается от match и search?

[]


In [None]:
# попробуйте с буквой e  или r
result = re.findall(r'\w*my', text)
print(result)

# вопрос: чем отличается от match и search?

[]


In [None]:
res2 = re.findall(r"m.*", text) # добавляем квантификатор *

print(res2)

[]


In [None]:
res3 = re.findall(r"m.*", text + "I'm glad to see you!")

print(res3)

##Бонус для .findall 
разные примеры

In [None]:
import re

In [None]:
twister = "Two toads, terribly tired, trotted along the road.\nSaid toad number 1 12 to the toad number Two:\n'I'm tired, and I'm carrying the load."
print(re.findall(r'.+', twister))
print(re.findall(r'\d+', twister))
print(re.findall(r'[0-9]+', twister))
print(re.findall(r'[0-9]', twister))
print(re.findall(r'\D+', twister))
print(re.findall(r'\w+', twister))
print(re.findall(r'\W+', twister))
print(re.findall(r'\w', twister))
print(re.findall(r'\s+', twister))
print(re.findall(r'\S+', twister))

['Two toads, terribly tired, trotted along the road.', 'Said toad number 1 12 to the toad number Two:', "'I'm tired, and I'm carrying the load."]
['1', '12']
['1', '12']
['1', '1', '2']
['Two toads, terribly tired, trotted along the road.\nSaid toad number ', ' ', " to the toad number Two:\n'I'm tired, and I'm carrying the load."]
['Two', 'toads', 'terribly', 'tired', 'trotted', 'along', 'the', 'road', 'Said', 'toad', 'number', '1', '12', 'to', 'the', 'toad', 'number', 'Two', 'I', 'm', 'tired', 'and', 'I', 'm', 'carrying', 'the', 'load']
[' ', ', ', ' ', ', ', ' ', ' ', ' ', '.\n', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ":\n'", "'", ' ', ', ', ' ', "'", ' ', ' ', ' ', '.']
['T', 'w', 'o', 't', 'o', 'a', 'd', 's', 't', 'e', 'r', 'r', 'i', 'b', 'l', 'y', 't', 'i', 'r', 'e', 'd', 't', 'r', 'o', 't', 't', 'e', 'd', 'a', 'l', 'o', 'n', 'g', 't', 'h', 'e', 'r', 'o', 'a', 'd', 'S', 'a', 'i', 'd', 't', 'o', 'a', 'd', 'n', 'u', 'm', 'b', 'e', 'r', '1', '1', '2', 't', 'o', 't', 'h', 'e', '

In [None]:
twister = "Two toads, terribly tired, trotted along the road.\nSaid toad number 1 12 to the toad number Two:\n'I'm tired, and I'm carrying the load."
print(re.findall(r'[trl]oad', twister))
print(re.findall(r'[trl]oad\b', twister))
print(re.findall(r'[^s]oad\b', twister))
print(re.findall(r'[rl]oad\b', twister))
print(re.findall(r'[A-Za-z]+', twister))

['toad', 'road', 'toad', 'toad', 'load']
['road', 'toad', 'toad', 'load']
['road', 'toad', 'toad', 'load']
['road', 'load']
['Two', 'toads', 'terribly', 'tired', 'trotted', 'along', 'the', 'road', 'Said', 'toad', 'number', 'to', 'the', 'toad', 'number', 'Two', 'I', 'm', 'tired', 'and', 'I', 'm', 'carrying', 'the', 'load']


In [None]:
s = 'Кошка и ёжик играют с мячом, but dog does not play with ball'
print(re.findall(r'[A-Za-z]+', s))
print(re.findall(r'[а-яА-ЯЁё]+', s))
print(re.findall(r'[а-яА-ЯЁёA-Za-z]+', s))

['but', 'dog', 'does', 'not', 'play', 'with', 'ball']
['Кошка', 'и', 'ёжик', 'играют', 'с', 'мячом']
['Кошка', 'и', 'ёжик', 'играют', 'с', 'мячом', 'but', 'dog', 'does', 'not', 'play', 'with', 'ball']


In [None]:
# извлечь дату: день месяц год
text = "12 ноября 2011 года произошло удивительное событие. А 13 ноября 2012 - еще удивительнее. Даже не будем \nговорить, что произошло 2 декабря 2011 года и 25 декабря 2012 года."
print(re.findall(r'\d+', text))
print(re.findall(r'\d{1,2}\s\w+\s\d{4}', text))
print(re.findall(r'\d{1,2} \w+ \d{4}', text))

['12', '2011', '13', '2012', '2', '2011', '25', '2012']
['12 ноября 2011', '13 ноября 2012', '2 декабря 2011', '25 декабря 2012']
['12 ноября 2011', '13 ноября 2012', '2 декабря 2011', '25 декабря 2012']


In [None]:
# найти приглагательное с основой 'удивительн'
text = "12 ноября 2011 года произошло удивительное событие, удивительного. А 13 ноября 2012 - еще удивительнее. Даже не будем \nговорить, что произошло 2 декабря 2011 года и 25 декабря 2012 года."
print(re.findall(r'удивительн..', text))
print(re.findall(r'удивительн.{2,3}', text))

['удивительное', 'удивительног', 'удивительнее']
['удивительное ', 'удивительного', 'удивительнее.']


In [None]:
# найти все годы
text2 = "По имеющимся данным, в Екатеринбургской губернии на май 1916 года было занято 50611 военнопленных,\nиз них 34194 на фабричных и заводских работах, 5731 на «казённых», 5060 на сельскохозяйственных,\n4145 на железнодорожных, 913 на городских и земских, 568 на прочих."
print(re.findall(r'\d{4}', text2)) # не годы!
print(re.findall(r'19\d{2}', text2)) 
print(re.findall(r'\d{4} г', text2))
print(re.findall(r'\d{1,4} г', text2)) # даже до 10 века
print(re.findall(r'\d{1,4}\sг', text2)) # даже до 10 века, аналогично
print(re.findall(r'(\d{1,4})\sг', text2)) # () - позволяют включить в список только нужную часть найденного выражения

['1916', '5061', '3419', '5731', '5060', '4145']
['1916']
['1916 г']
['1916 г']
['1916 г']
['1916']


In [None]:
# найти все пары имен
names = "1NoahEmma2LiamOlivia3MasonSophia4JacobIsabella5WilliamAva6EthanMia7MichaelEmily"
print(re.findall(r'\d[A-Z][a-z]+[A-Z][a-z]+', names))
print(re.findall(r'\d([A-Z][a-z]+)([A-Z][a-z]+)', names))

['1NoahEmma', '2LiamOlivia', '3MasonSophia', '4JacobIsabella', '5WilliamAva', '6EthanMia', '7MichaelEmily']
[('Noah', 'Emma'), ('Liam', 'Olivia'), ('Mason', 'Sophia'), ('Jacob', 'Isabella'), ('William', 'Ava'), ('Ethan', 'Mia'), ('Michael', 'Emily')]


In [None]:
# найти #я не могу...
tweets = "#я не могу молчать #я не могу кричать #я не могу #я справлюсь я не могу молчать #я не могу жить #я все могу #с кем ни бывает"
print(re.findall(r'#я не могу \w*', tweets))

['#я не могу молчать', '#я не могу кричать', '#я не могу ', '#я не могу жить']


In [None]:
# найти даты, написанные в формате дд.мм.гггг через точку
data = '20.05.1963, 55, 12.12.2000, 17, 15/15/1111'
print(re.findall(r'\d+.\d+.\d+', data)) # . - любой символ
print(re.findall(r'\d+\.\d+\.\d+', data)) # \. экранирование (обычная точка, а не любой символ)

['20.05.1963', '12.12.2000', '15/15/1111']
['20.05.1963', '12.12.2000']


In [None]:
import random
import re

hse_prediction = [
    ['Слушайте каждого. Идеи приходят отовсюду.'],
    ['Скоро контрольная точка по нелюбимому предмету('],
    ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'],
    ['Угостите преподавателя конфеткой!'],
    ['Хорошие новости придут к вам по  Яндекс почте.'],
    ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'],
    ['Делайте то, чего просит душа и тело - не идите на пары!'],
    ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'],
    ['Пришло время сдать все долги.'],
    ['Вы не получите автомат по физре в следующем полугодии.'],
    ['В новом году обещаю себе спать'],
    ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'],
    ['Вам повысят стипендию на 1000 рублей в этом году.'],
    ['Ураааааааааааа! Завтра одни только  лекции!'],
    ['Все лучшее происходит,когда Вас нет на паре!'],
    ['На мобильность только в Питер'],
    ['В новом году обещаю себе защитить диссертацию'],
    ['В новом году обещаю себе запомнить имена одногруппников'],
    ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.']
        ]

# ваш код здесь
cor_prediction = []
for i in hse_prediction:
  try:
    if re.match(r'В новом году', i[0]).group() == 'В новом году': # срез строки, startswith....
      pass
  except:
    cor_prediction.append(i[0])

print(cor_prediction)
print(random.choice(cor_prediction))
# match, search

['Слушайте каждого. Идеи приходят отовсюду.', 'Скоро контрольная точка по нелюбимому предмету(', 'Угостите преподавателя конфеткой!', 'Хорошие новости придут к вам по  Яндекс почте.', 'Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.', 'Делайте то, чего просит душа и тело - не идите на пары!', 'Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!', 'Пришло время сдать все долги.', 'Вы не получите автомат по физре в следующем полугодии.', 'Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!', 'Вам повысят стипендию на 1000 рублей в этом году.', 'Ураааааааааааа! Завтра одни только  лекции!', 'Все лучшее происходит,когда Вас нет на паре!', 'На мобильность только в Питер', 'Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.']
Ураааааааааааа! Завтра одни только  лекции!


In [None]:
import random
import re

hse_prediction = [
    ['Слушайте каждого. Идеи приходят отовсюду.'],
    ['Скоро контрольная точка по нелюбимому предмету('],
    ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'],
    ['Угостите преподавателя конфеткой!'],
    ['Хорошие новости придут к вам по  Яндекс почте.'],
    ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'],
    ['Делайте то, чего просит душа и тело - не идите на пары!'],
    ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'],
    ['Пришло время сдать все долги.'],
    ['Вы не получите автомат по физре в следующем полугодии.'],
    ['В новом году обещаю себе спать'],
    ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'],
    ['Вам повысят стипендию на 1000 рублей в новом году.'],
    ['Ураааааааааааа! Завтра одни только  лекции!'],
    ['Все лучшее происходит,когда Вас нет на паре!'],
    ['На мобильность только в Питер'],
    ['В новом году обещаю себе защитить диссертацию'],
    ['В новом году обещаю себе запомнить имена одногруппников'],
    ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.']
        ]

# ваш код здесь
cor_prediction = []
for i in hse_prediction:
  try:
    if re.search(r'[Вв] новом году', i[0]).group() == 'В новом году': # срез строки, startswith....
      pass
  except:
    cor_prediction.append(i[0])

print(cor_prediction)
print(random.choice(cor_prediction))
# match, search
print('Вам повысят стипендию на 1000 рублей в новом году.' in cor_prediction)
print(['Вам повысят стипендию на 1000 рублей в новом году.'] in hse_prediction)

['Слушайте каждого. Идеи приходят отовсюду.', 'Скоро контрольная точка по нелюбимому предмету(', 'Угостите преподавателя конфеткой!', 'Хорошие новости придут к вам по  Яндекс почте.', 'Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.', 'Делайте то, чего просит душа и тело - не идите на пары!', 'Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!', 'Пришло время сдать все долги.', 'Вы не получите автомат по физре в следующем полугодии.', 'Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!', 'Ураааааааааааа! Завтра одни только  лекции!', 'Все лучшее происходит,когда Вас нет на паре!', 'На мобильность только в Питер', 'Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.']
Слушайте каждого. Идеи приходят отовсюду.
False
True


In [None]:
import random
import re

hse_prediction = [
    ['Слушайте каждого. Идеи приходят отовсюду.'],
    ['Скоро контрольная точка по нелюбимому предмету('],
    ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'],
    ['Угостите преподавателя конфеткой!'],
    ['Хорошие новости придут к вам по  Яндекс почте.'],
    ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'],
    ['Делайте то, чего просит душа и тело - не идите на пары!'],
    ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'],
    ['Пришло время сдать все долги.'],
    ['Вы не получите автомат по физре в следующем полугодии.'],
    ['В новом году обещаю себе спать'],
    ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'],
    ['Вам повысят стипендию на 1000 рублей в этом году.'],
    ['Ураааааааааааа! Завтра одни только  лекции!'],
    ['Все лучшее происходит,когда Вас нет на паре!'],
    ['На мобильность только в Питер'],
    ['В новом году обещаю себе защитить диссертацию'],
    ['В новом году обещаю себе запомнить имена одногруппников'],
    ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.'],
        ]


# разделить поиск и удаление
indexes = []
for i in hse_prediction:
  try:
    if re.match(r'В новом году', i[0]).group() == 'В новом году': # срез строки, startswith...
      ind = hse_prediction.index(i) # исходный список меняется, меняются индексы
      indexes.append(ind)
  except:
    pass

indexes.reverse()

for i in indexes:
  del hse_prediction[i]
print(indexes)

print(hse_prediction)
print(*random.choice(hse_prediction))

#del hse_prediction[17]
#del hse_prediction[16] вручную

[17, 16, 10, 2]
[['Слушайте каждого. Идеи приходят отовсюду.'], ['Скоро контрольная точка по нелюбимому предмету('], ['Угостите преподавателя конфеткой!'], ['Хорошие новости придут к вам по  Яндекс почте.'], ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'], ['Делайте то, чего просит душа и тело - не идите на пары!'], ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'], ['Пришло время сдать все долги.'], ['Вы не получите автомат по физре в следующем полугодии.'], ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'], ['Вам повысят стипендию на 1000 рублей в этом году.'], ['Ураааааааааааа! Завтра одни только  лекции!'], ['Все лучшее происходит,когда Вас нет на паре!'], ['На мобильность только в Питер'], ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.']]
Пришло время сдать все долги.


In [None]:
import random

hse_prediction = [
    ['Слушайте каждого. Идеи приходят отовсюду.'],
    ['Скоро контрольная точка по нелюбимому предмету('],
    ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'],
    ['Угостите преподавателя конфеткой!'],
    ['Хорошие новости придут к вам по  Яндекс почте.'],
    ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'],
    ['Делайте то, чего просит душа и тело - не идите на пары!'],
    ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'],
    ['Пришло время сдать все долги.'],
    ['Вы не получите автомат по физре в следующем полугодии.'],
    ['В новом году обещаю себе спать'],
    ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'],
    ['Вам повысят стипендию на 1000 рублей в этом году.'],
    ['Ураааааааааааа! Завтра одни только  лекции!'],
    ['Все лучшее происходит,когда Вас нет на паре!'],
    ['На мобильность только в Питер'],
    ['В новом году обещаю себе защитить диссертацию'],
    ['В новом году обещаю себе запомнить имена одногруппников'],
    ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.'],
        ]

hse_prediction.sort()
print(hse_prediction)

[['В новом году обещаю себе запомнить имена одногруппников'], ['В новом году обещаю себе защитить диссертацию'], ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'], ['В новом году обещаю себе спать'], ['Вам повысят стипендию на 1000 рублей в этом году.'], ['Все лучшее происходит,когда Вас нет на паре!'], ['Вы не получите автомат по физре в следующем полугодии.'], ['Делайте то, чего просит душа и тело - не идите на пары!'], ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'], ['На мобильность только в Питер'], ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'], ['Пришло время сдать все долги.'], ['Скоро контрольная точка по нелюбимому предмету('], ['Слушайте каждого. Идеи приходят отовсюду.'], ['Угостите преподавателя конфеткой!'], ['Ураааааааааааа! Завтра одни только  лекции!'], ['Хорошие новости придут к вам по  Яндекс почте.'], ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.'], ['Что ни делается - все к

In [None]:
hse_prediction = [
    ['Слушайте каждого. Идеи приходят отовсюду.'],
    ['Скоро контрольная точка по нелюбимому предмету('],
    ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'],
    ['Угостите преподавателя конфеткой!'],
    ['Хорошие новости придут к вам по  Яндекс почте.'],
    ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'],
    ['Делайте то, чего просит душа и тело - не идите на пары!'],
    ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'],
    ['Пришло время сдать все долги.'],
    ['Вы не получите автомат по физре в следующем полугодии.'],
    ['В новом году обещаю себе спать'],
    ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'],
    ['Вам повысят стипендию на 1000 рублей в этом году.'],
    ['Ураааааааааааа! Завтра одни только  лекции!'],
    ['Все лучшее происходит,когда Вас нет на паре!'],
    ['На мобильность только в Питер'],
    ['В новом году обещаю себе защитить диссертацию'],
    ['В новом году обещаю себе запомнить имена одногруппников'],
    ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.'],
        ]

#for i in hse_prediction:
  #print(i)
  #print(i[0]) - обращаемся к строке

print(hse_prediction[0], hse_prediction[1])
print(hse_prediction[0][0])
print(len(hse_prediction))
print(len(hse_prediction[0]))
print(['В новом году'] in [['В новом году'], ['обещаю себе запомнить имена одногруппников']])

['Слушайте каждого. Идеи приходят отовсюду.'] ['Скоро контрольная точка по нелюбимому предмету(']
Слушайте каждого. Идеи приходят отовсюду.
19
1
True


In [None]:
print(*random.choice(hse_prediction[3:]))

Скоро контрольная точка по нелюбимому предмету(


In [None]:
hse_prediction = [
    ['Слушайте каждого. Идеи приходят отовсюду.'],
    ['Скоро контрольная точка по нелюбимому предмету('],
    ['В новом году обещаю себе смотреть не больше трех серий сериала за раз'],
    ['Угостите преподавателя конфеткой!'],
    ['Хорошие новости придут к вам по  Яндекс почте.'],
    ['Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.'],
    ['Делайте то, чего просит душа и тело - не идите на пары!'],
    ['Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!'],
    ['Пришло время сдать все долги.'],
    ['Вы не получите автомат по физре в следующем полугодии.'],
    ['В новом году обещаю себе спать'],
    ['Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!'],
    ['Вам повысят стипендию на 1000 рублей в этом году.'],
    ['Ураааааааааааа! Завтра одни только  лекции!'],
    ['Все лучшее происходит,когда Вас нет на паре!'],
    ['На мобильность только в Питер'],
    ['В новом году обещаю себе защитить диссертацию'],
    ['В новом году обещаю себе запомнить имена одногруппников'],
    ['Через час  Вы снова проголодаетесь. Шоколад можно найти в магазине.'],
        ]

for i in range(len(hse_prediction)):
  a = hse_prediction[i][0]
  hse_prediction[i] = a

print(hse_prediction) # список строк
hse_prediction

['Слушайте каждого. Идеи приходят отовсюду.', 'Скоро контрольная точка по нелюбимому предмету(', 'В новом году обещаю себе смотреть не больше трех серий сериала за раз', 'Угостите преподавателя конфеткой!', 'Хорошие новости придут к вам по  Яндекс почте.', 'Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.', 'Делайте то, чего просит душа и тело - не идите на пары!', 'Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!', 'Пришло время сдать все долги.', 'Вы не получите автомат по физре в следующем полугодии.', 'В новом году обещаю себе спать', 'Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!', 'Вам повысят стипендию на 1000 рублей в этом году.', 'Ураааааааааааа! Завтра одни только  лекции!', 'Все лучшее происходит,когда Вас нет на паре!', 'На мобильность только в Питер', 'В новом году обещаю себе защитить диссертацию', 'В новом году обещаю себе запомнить имена одногруппников', 'Через час  Вы снова проголодаетесь.

['Слушайте каждого. Идеи приходят отовсюду.',
 'Скоро контрольная точка по нелюбимому предмету(',
 'В новом году обещаю себе смотреть не больше трех серий сериала за раз',
 'Угостите преподавателя конфеткой!',
 'Хорошие новости придут к вам по  Яндекс почте.',
 'Что ни делается - все к лучшему, и даже первая пара, ожидающая Вас в обновлённом расписании.',
 'Делайте то, чего просит душа и тело - не идите на пары!',
 'Пора собирать чемоданы: Вас ждет экспедиция на Сахалин!',
 'Пришло время сдать все долги.',
 'Вы не получите автомат по физре в следующем полугодии.',
 'В новом году обещаю себе спать',
 'Если вы ждали знака - то ВОТ ОН! Срочно участвуйте в ближайшей конференции!',
 'Вам повысят стипендию на 1000 рублей в этом году.',
 'Ураааааааааааа! Завтра одни только  лекции!',
 'Все лучшее происходит,когда Вас нет на паре!',
 'На мобильность только в Питер',
 'В новом году обещаю себе защитить диссертацию',
 'В новом году обещаю себе запомнить имена одногруппников',
 'Через час  Вы сно

##.sub(pattern, repl, string)
метод ищет шаблон в строке и заменяет его на указанную подстроку.

Если шаблон не найден, строка остается неизменной.

In [None]:
import re

In [None]:
text = 'Hello my dear friend Amy. Amy smiled.'

result = re.sub(r'Amy','Jack', text ) # что ищем, на что заменяем, где заменить (текст)

print(result)

Hello my dear friend Jack. Jack smiled.


In [None]:
res2 = re.sub(r"Amy", "Alice", text)

print(res2)

Hello my dear friend Alice. Alice smiled.


In [None]:
res3 = re.sub(r"Alice", "Jack", text)

print(res3)

Hello my dear friend Amy. Amy smiled.


In [None]:
text = 'Hello my dear friend Jack. Jackson smiled.'

res3 = re.sub(r"Jack\b", "Bob", text) # добавяем в паттерн \b - конец слова

print(res3)

Hello my dear friend Bob. Jackson smiled.


# Задания

* (re.findall) Напишите регулярное выражение, которое вытаскивало бы все адреса из документа addresses.txt
* (re.sub) Из текта в файле "морж-корж.txt" возьмите текст и замените все вхождения слова "морж" на слово "корж"

In [None]:
with open("addresses.txt", "r", encoding="utf-8") as file: 
  print(*re.findall(r"\w*[@]\w*[\.].*", file.read()), sep=", ")

Contact@nordstrom.com, Breen@HauteLook.com, nordstrom@nordstrom.com, Thomas@nordstrom.com, nordstrom@nordstrom.com, Nordstrom@nordstrom.com


In [None]:
with open("морж-корж.txt", "r", encoding = "utf-8") as f:
    #print(f.read())
    r = re.sub(r"Морж", "Корж", f.read())
    e = re.sub(r"морж", "корж", r)
    print(e)

Корж[1] (кильд. mоršа, норв. morššâ, лат. Odobenus rosmarus) — морское млекопитающее, единственный современный вид семейства коржовых клады ластоногих отряда хищных.

Взрослый корж легко узнаваем по своим видным бивням. Корж — один из крупнейших представителей ластоногих, по размерам тела среди ластоногих уступает лишь морским слонам[2]. Ареалы этих видов не пересекаются, то есть корж является крупнейшим из ластоногих в своей среде обитания.

Зимнее плавание в России называется «коржеванием».

В 2008 году, по инициативе Всемирного фонда дикой природы (WWF), утверждён День коржа, который отмечается ежегодно 24 ноября.

Корж — крупный морской зверь с очень толстой кожей. Верхние клыки чрезвычайно развиты, удлинённы и направлены вниз. Очень широкая морда усажена многочисленными толстыми, жёсткими, сплющенными щетинами-усами (вибриссами), их у коржа на верхней губе может быть от 400 до 700, расположены они в 13—18 рядов[4]. Наружных ушей нет, глаза маленькие.

Кожа покрыта короткими прилег