# Строки в Python

### Строковая величина в Python — это неизменяемый набор символов в формате Unicode.



Мы уже рассматривали строки как простой тип данных наряду с целыми и вещественными числами и знаем, что строка – это последовательность символов, заключенных в одинарные или двойные кавычки.

В Python нет символьного типа, т. е. типа данных, объектами которого являются одиночные символы. Однако язык позволяет рассматривать строки как объекты, состоящие из подстрок длинной в один и более символов. При этом, в отличие от списков, строки не принято относить к структурам данных. Видимо потому, что структуры данных состоят из более простых типов данных, а для строк в Python нет более простого (символьного) типа.

С другой стороны, строка, как и список, – это упорядоченная последовательность элементов. Следовательно, из нее можно извлекать отдельные символы и срезы.

### Как создать строку

Строки всегда создаются одним из трех способов. Вы можете использовать одинарные, двойные и тройные кавычки. Давайте посмотрим

In [1]:
my_string = "Добро пожаловать в Python!"
another_string = 'Я новый текст тут...'
 
a_long_string = '''А это у нас
новая строка
в троичных скобках'''

In [2]:
a_long_string

'А это у нас\nновая строка\nв троичных скобках'

In [3]:
my_string = "I'm a Python programmer!"
otherString = 'Слово "Python" обычно подразумевает змею'
tripleString = """В такой "строке" мы можем 'использовать' все."""
strInt = str(123)


In [4]:
strInt

'123'

#### В Python, начиная с версии 3, все строки являются юникодом.

Строки являются **итерируемыми объектами**. 

Следовательно, по ним можно проходиться циклами:

In [7]:
iter_string = 'Проитерируй меня!'
print(type(iter_string))

for symbol in iter_string:
    print(symbol, end = ' ')

<class 'str'>
П р о и т е р и р у й   м е н я ! 

А также у строк можно брать срезы 

In [8]:
print(iter_string[0])
print(iter_string[7:])
print(iter_string[::2])


П
ируй меня!
Потррймн!


#### Важным отличием от списков является неизменяемость строк в Python. Нельзя перезаписать какой-то отдельный символ или срез в строке

In [9]:
iter_string[-1] = '.'

TypeError: 'str' object does not support item assignment

Поэтому такой код нам ничего не даст:

In [11]:
for symbol in iter_string:
    symbol = symbol.upper() # upper() - это метод, который приводит строку в верхнему регистру
    
iter_string

'Проитерируй меня!'

In [12]:
iter_string.upper()

'ПРОИТЕРИРУЙ МЕНЯ!'

А такой выдаст ошибку!

In [10]:
for symbol in range(len(iter_string)):
    iter_string[symbol] = iter_string[symbol].upper()
    
iter_string

TypeError: 'str' object does not support item assignment

Строка является неизменяемым объектом. 
Мы не можем её изменять, мы можем только создавать новую строку "на месте"

In [16]:
print(id(iter_string))

140696279431072


In [18]:
iter_string = iter_string[0:-1] + '.'
print(id(iter_string))
print(iter_string)


140696279430288
Проитерируй меня.


### Методы строк

In [19]:
# вывод помощи по методам строки 
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

In [22]:
#конкатенация
S1 = 'spam'
S2 = ' eggs'
print(S1 + S2)

spam eggs


In [23]:
#Дублирование
print('Info number 1')
print('*****' * 5)
print('Info number 2')


Info number 1
*************************
Info number 2


In [24]:
#наличие подстроки в строке
print('hello' in 'hello world')
print('hello' in 'fasfasdfsf')

True
False


In [54]:
#длина строки
len('spam')

4

### Превращение строки в список

In [24]:
phrase = 'ягоды, желуди, носорог'
phraseList = phrase.split(',')
phraseList

['ягоды', ' желуди', ' носорог']

In [26]:
phrase = 'разделитель может быть любым'.split('может') # функция split принимает в качестве аргумента разделитель
phrase

['разделитель ', ' быть любым']

In [27]:
'может'.join(phrase)

'разделитель может быть любым'

In [28]:
A = ['ягоды', ' желуди', ' носорог']
'?'.join(A)

'ягоды? желуди? носорог'

### Список методов строк
https://pythonworld.ru/tipy-dannyx-v-python/stroki-funkcii-i-metody-strok.html

Или help(str)

### Методы find() и replace()
Метод find() ищет подстроку в строке и возвращает индекс первого элемента найденной подстроки. Если подстрока не найдена, то возвращает -1.
Метод replace() заменяет одну подстроку на другую

In [29]:
s = 'red blue orange white blue'
s.find('grey')

-1

In [76]:
s.find('green')

-1

In [30]:
a = 'DA KTO ETOT VASH REPLACE? DA'.replace('DA', 'NET')
b = a.lower()
b.capitalize()


'Net kto etot vash replace? net'

### Метод format 
Метод позволяет подставлять значения в строку. Причем можно дополнительно указывать порядок подстановки а также использовать передачу по слову-ключу

In [32]:
print("This is a {}. It's {}.".format("ball", 12))

This is a ball. It's 12.


Новая альтернатива "f-string"

In [33]:
a = 234234
phr = f'{a} is a number'
phr

'234234 is a number'

In [41]:
size2 = "height - {2}, length - {0}, width - {1}"
size2.format(3, 6, 2.3)

'height - 2.3, length - 3, width - 6'

In [80]:
info = "This is a {subj}. It's {prop}."
info.format(subj="table", prop="small")
"This is a table. It's small."

"This is a table. It's small."

In [34]:
phrase = 'желуди грибы ветки'
for i in phrase.split():
    print('Динамически создаем фразу со словом {}'.format(i))

Динамически создаем фразу со словом желуди
Динамически создаем фразу со словом грибы
Динамически создаем фразу со словом ветки


Напишите программу, которая "зашифровывает" текст, хранящийся в переменной proverb, меняя местами символы, стоящие на нечётных и чётных позициях. Результат шифрования нужно вывести на экран с помощью функции print

In [36]:
proverb = 'Программисты - это устройства, преобразующие кофеин в код.'

In [None]:
#Попробуем по простому

In [40]:
A = list(proverb)
for i in range(0, len(A)-1, 2):
    A[i], A[i+1] = A[i+1], A[i]
 

In [41]:
print(A)

['р', 'П', 'г', 'о', 'а', 'р', 'м', 'м', 'с', 'и', 'ы', 'т', '-', ' ', 'э', ' ', 'о', 'т', 'у', ' ', 'т', 'с', 'о', 'р', 'с', 'й', 'в', 'т', ',', 'а', 'п', ' ', 'е', 'р', 'б', 'о', 'а', 'р', 'у', 'з', 'щ', 'ю', 'е', 'и', 'к', ' ', 'ф', 'о', 'и', 'е', ' ', 'н', ' ', 'в', 'о', 'к', '.', 'д']


In [43]:
even = proverb[::2]

In [44]:
odd = proverb[1::2]

In [45]:
shifred = ''
for i, k in zip(odd, even):
    shifred += i
    shifred += k

print(shifred)

рПгоарммсиыт- э оту тсорсйвт,ап ербоарузщюеик фоие н вок.д


In [None]:
list(zip(odd, even))

Дано вещественное число. Напишите программу, которая считает сумму цифр дробной части числа. Результат вычислений нужно вывести на экран с помощью функции print

Используйте переменную number = 56.257 для хранения заданного числа и не меняйте её в процессе выполнения кода.


In [28]:
number = 56.257

In [29]:
str_num = str(number)
sum_ = 0
if '.' in str_num:
    str_num = str_num.split('.')[-1]
    for i in str_num:
        sum_ += int(i)
    print(sum_)
else:
    print('Это не дробное число')

14


### Регулярные выражения

Регулярные выражения - язык описания шаблонов (patterns) для извлечения информации из текста.
Так что по смыслу  правильнее было бы говорить «шаблонные выражения». Регулярное выражение, или коротко «регулярка», состоит из обычных символов и специальных командных последовательностей.

In [48]:
def isPhoneNumber(text):
    if len(text) != 9:
        return False  # not phone number-sized
    for i in range(0, 3):
        if not text[i].isdecimal():
            return False  # not an area code
    if text[3] != '-':
        return False  # does not have first hyphen
    for i in range(4, 6):
        if not text[i].isdecimal():
            return False  # does not have first 3 digits
    if text[6] != '-':
        return False  # does not have second hyphen
    for i in range(7, 8):
        if not text[i].isdecimal():
            return False  # does not have last 4 digits
    return True  # "text" is a phone number!

print('321-66-13 is a phone number:')
print(isPhoneNumber('321-66-13'))
print('Moshi moshi is a phone number:')
print(isPhoneNumber('23234234234^^&5454'))

321-66-13 is a phone number:
True
Moshi moshi is a phone number:
False


In [6]:
import re
phoneNumRegex = re.compile(r'\d{3}-\d{2}-\d{2}')
mo = phoneNumRegex.search('321-66-13 is a phone number:')
xo = phoneNumRegex.search('Moshi moshi is a phone number:')
print(mo.group())


321-66-13


* Импортируем модуль regex с помощью инструкции **import re**
* Создаем объект regex с помощью функции re.compile(). При этом используем сырую строку, чтобы избежать экранирования символов 
* Передаем строку, в которой хотим произвести поиск методу re.search объекта Regex. В случае успеха этот метод вернет объект Мatch 
* Вызовите метод group() объекта Match, который вернет строку, содержащую фактически найденный текст, соответствующий данному регулярному выражению 



Основы синтаксиса (воспринимать аккуратно, чтобы не запутаться)


Любая строка сама по себе является регулярным выражением. 

Так, выражению Хаха будет соответствовать строка “Хаха” и только она.
Регулярные выражения являются регистрозависимыми, поэтому строка “хаха” (с маленькой буквы) уже не будет соответствовать выражению выше. 

Подобно строкам в языке Python, регулярные выражения имеют спецсимволы .^$*+?{}[]\|(), которые в регулярках являются управляющими конструкциями. 
Для написания их просто как символов требуется их экранировать, для чего нужно поставить перед ними знак \. Так же, как и в питоне, в регулярных выражениях выражение \n соответствует концу строки, а \t — табуляции. 

<table>
<tbody>
<tr>
<td width="10%"><b>Символ</b></td>
<td width="50%"><b>Пояснение</b></td>
<td width="20%"><b>Пример выражения</b></td>
<td width="20%"><b>Пример строки</b></td>
</tr>
<tr>
<td>.</td>
<td>Любой символ</td>
<td>...</td>
<td>A!#</td>
</tr>
<tr>
<td>*</td>
<td>Ноль и более&nbsp;совпадений с выражением, заданным в качестве образца&nbsp;</td>
<td>123*</td>
<td>123123123</td>
</tr>
<tr>
<td>+</td>
<td>Одно и более&nbsp;совпадений с выражением, заданным в качестве образца&nbsp;</td>
<td>Ура!+</td>
<td>Ура!Ура!</td>
</tr>
<tr>
<td>?</td>
<td>Ноль или одно&nbsp;совпадение с выражением, заданным в качестве образца&nbsp;</td>
<td>один?</td>
<td>один</td>
</tr>
<tr>
<td>[ ]</td>
<td>Совпадение с любым из символов, заключённым в скобки</td>
<td>[a-z]</td>
<td>b</td>
</tr>
<tr>
<td>[^ ]</td>
<td>Совпадение с любым из символов, отсутствующим в скобках</td>
<td>[^a-z]</td>
<td>5</td>
</tr>
<tr>
<td>\</td>
<td>Обозначает начало специальной последовательности (см. далее) или экранирует специальные символы (т.е. позволяет использовать символы типа '.', '*', '?' в роли обычных элементов строки)</td>
<td>\*</td>
<td>*</td>
</tr>
</tbody>
</table>

Одна из любопытных особенностей регулярных выражений в их универсальности, стоит вам выучить синтаксис, и вы сможете применять их в любом (почти) языке программирования (JavaScript, Java, VB, C #, C / C++, Python, Perl, Ruby, Delphi, R, Tcl, и многих других). Небольшие отличия касаются только наиболее продвинутых функций и версий синтаксиса, поддерживаемых движком.

<table>
<tbody>
<tr>
<td width="20%"><b>Последовательность</b></td>
<td width="60%"><b>Описание</b></td>
<td width="20%"><b>Аналог с []</b></td>
</tr>
<tr>
<td>\d</td>
<td>Любая цифра</td>
<td>[0-9]</td>
</tr>
<tr>
<td>\D</td>
<td>Всё что угодно, кроме цифры</td>
<td>[^0-9]</td>
</tr>
<tr>
<td>\s</td>
<td>Любой пробельный символ</td>
<td>[ \t\n\r\f\v]</td>
</tr>
<tr>
<td>\S</td>
<td>Любой непробельный символ</td>
<td>[^ \t\n\r\f\v]</td>
</tr>
<tr>
<td>\w</td>
<td>Любая буква, цифра, знак подчёркивания</td>
<td>[a-zA-Z0-9_]</td>
</tr>
<tr>
<td>\W</td>
<td>Всё что угодно, кроме букв, цифр и знака подчёркивания</td>
<td>[^a-zA-Z0-9_]</td>
</tr>
</tbody>
</table>

https://regex101.com/r/cO8lqs/2

### Якоря — ^ и $

**^Привет**        соответствует строке, начинающейся с **Привет**

**пока$**          соответствует строке, заканчивающейся на **пока**

### Квантификаторы 
    * + ? и {}

abc*       соответствует строке, в которой после ab следует 0 или более символов c

abc+       соответствует строке, в которой после ab следует один или более символов c

abc?       соответствует строке, в которой после ab следует 0 или один символ c

abc{2}     соответствует строке, в которой после ab следует 2 символа c

abc{2,}    соответствует строке, в которой после ab следует 2 или более символов c

abc{2,5}   соответствует строке, в которой после ab следует от 2 до 5 символов c

a(bc)*     соответствует строке, в которой после ab следует 0 или более последовательностей символов bc

a(bc){2,5} соответствует строке, в которой после ab следует от 2 до 5 последовательностей символов bc

### Оператор ИЛИ — | или []

a(b|c) соответствует строке, в которой после a следует b или c 

a[bc]  как и в предыдущем примере

## Квантификация
    Квантификатор после символа или группы определяет, сколько раз предшествующее выражение может встречаться.

    {n,m}        общее выражение, повторений может быть от n до m включительно.
    {n,}        общее выражение, n и более повторений.
    {,m}        общее выражение, не более m повторений.
    {n}        общее выражение, ровно n повторений
     ?        Знак вопроса означает 0 или 1 раз, то же самое, что и {0,1}. Например, «colou?r» соответствует и color, и colour.
    *        Звёздочка означает 0, 1 или любое число раз ({0,}). Например, «go*gle» соответствует gogle, google, gooogle, ggle, и др.
    +        Плюс означает хотя бы 1 раз ({1,}). Например, «go+gle» соответствует gogle, google и т. д. (но не ggle).

Экранирование строк в python

In [1]:
s = 'C:\newt.txt'
print(s)
S = r'C:\newt.txt'
print(S)

C:
ewt.txt
C:\newt.txt


In [7]:
russian_num = re.compile(r'\(\d{3}\)\s?\d{3}-\d{2}-\d{2}')
mo = russian_num.search('(812) 321-66-13 is a phone number:')
xo = russian_num.search('Moshi moshi is a phone number:')
print(mo.group())

(812) 321-66-13


### Наборы в регулярных выражениях
набор задается внутри квадратных скобок

In [32]:
import re
pattern = r'^а' # запись означает, что вторым символов может быть a b c 
string = 'арбитраж'
match_obj = re.search(pattern, string)
print(match_obj.group())



а


In [10]:
string = 'abracadabra'
string.endswith('ok')


False

In [11]:
#ignorecase - и регистр нас уже не волнует
pattern = r'р[еу]ка' # запись означает, что вторым символов может быть е у 
string = 'Рука'
match_obj = re.search(pattern, string, re.IGNORECASE)
print(match_obj.group())


Рука


### Условия в регулярных выражениях 

оператор | (канал) позволяет создавать условные конструкции в регулярных выражениях

In [13]:
phrase = 'Миша кинул Мише мяч, Миша его отбил'
reg = re.compile(r'Володя|Миша')
mo = reg.search(phrase)
mo.group()

'Миша'

### Нахождение всех совпадений

In [14]:
import re
fa = reg.findall(phrase)
fa

['Миша', 'Миша']

### Указание необязательной группы символов с помощью вопросительного знака

In [15]:
russian_num = re.compile(r'(\(\d{3}\))?(\d{3}-\d{2}-\d{2})')
mo = russian_num.search('(812)321-66-13 is a phone number:')
xo = russian_num.search('321-66-13 is a phone number:')
print(mo)

<re.Match object; span=(0, 14), match='(812)321-66-13'>


### Разделение по паттерну

In [17]:
result = re.split(r'\d+', 'Analytics 222 Vidhya')
result

['Analytics ', ' Vidhya']

Подробнее о регулярных выажениях
https://habr.com/ru/post/349860/

Подробнее о регулярных выражениях https://ru.wikibooks.org/wiki/%D0%A0%D0%B5%D0%B3%D1%83%D0%BB%D1%8F%D1%80%D0%BD%D1%8B%D0%B5_%D0%B2%D1%8B%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F

*Некоторые люди, когда сталкиваются с проблемой, думают «Я знаю, я решу её с помощью регулярных выражений.» Теперь у них две проблемы.*

In [19]:
text = 'Разработка языка Python была начата в конце 1980-х годов сотрудником голландского института CWI Гвидо ван Россумом. Для распределённой ОС Amoeba требовался расширяемый скриптовый язык, и Гвидо начал писать Python на досуге, позаимствовав некоторые наработки для языка ABC (Гвидо участвовал в разработке этого языка, ориентированного на обучение программированию). В феврале 1991 года Гвидо опубликовал исходный текст в группе новостей alt.sources. Название языка произошло вовсе не от вида пресмыкающихся. Автор назвал язык в честь популярного британского комедийного телешоу 1970-х "Летающий цирк Монти Пайтона".'
text

'Разработка языка Python была начата в конце 1980-х годов сотрудником голландского института CWI Гвидо ван Россумом. Для распределённой ОС Amoeba требовался расширяемый скриптовый язык, и Гвидо начал писать Python на досуге, позаимствовав некоторые наработки для языка ABC (Гвидо участвовал в разработке этого языка, ориентированного на обучение программированию). В феврале 1991 года Гвидо опубликовал исходный текст в группе новостей alt.sources. Название языка произошло вовсе не от вида пресмыкающихся. Автор назвал язык в честь популярного британского комедийного телешоу 1970-х "Летающий цирк Монти Пайтона".'

Используя возможности модуля re, определите количество пар слов, в которых первое слово заканчивается на гласную русскую букву, второе — начинается на согласную (также русскую). Введите количество найденных пар слов в поле для ответа.

Во время подсчёта не учитывайте регистр букв (т.е. при подсчёте должны учитываться как вариант: "...а П..." , так и вариант: "...а п..." ). Предлоги и союзы считайте полноправными словами, даже если они состоят из одной буквы.

Если между словами имеется знак препинания, считайте, что эти два слова НЕ удовлетворяют критерию поиска (т.е. вариант: "...а, П..." НЕ должен учитываться при подсчёте).

In [20]:
import re
pattern = re.compile(r'[аеёиоуыэюя]\s[бвгджзйклмнпрстфхцчшщ]', re.IGNORECASE)
pattern.findall(text)

['а н',
 'а в',
 'о в',
 'я р',
 'я р',
 'и Г',
 'о н',
 'а д',
 'е н',
 'и д',
 'о н',
 'е п',
 'а Г',
 'е н',
 'а п',
 'о в',
 'е н',
 'а п',
 'о б',
 'о к',
 'о т',
 'и П']

### Файлы 

Файл — именованная область данных на носителе информации.


Python поддерживает множество различных типов файлов, но условно их можно разделить на два виде: текстовые и бинарные.

Текстовые файлы - это к примеру файлы с расширением csv, txt, html, в общем любые файлы, которые сохраняют информацию в текстовом виде.

Бинарные файлы - это изображения, аудио и видеофайлы и т.д. В зависимости от типа файла работа с ним может немного отличаться.

<code> with open(file, mode) as file_obj:
    инструкции </code>
    
Эта конструкция определяет для открытого файла переменную file_obj и выполняет набор инструкций. После их выполнения файл автоматически закрывается. Даже если при выполнении инструкций в блоке with возникнут какие-либо исключения, то файл все равно закрывается.

In [21]:
#Запись в файл
with open("hello.txt", "w") as f:
    f.write("hello world")

In [22]:
#добавим ещё одну строку
with open("hello.txt", "a") as file:
    file.write("\ngood bye, world")

In [23]:
#читаем файл построчно
with open("hello.txt", "r") as file:
    for line in file:
        print(line, end="")

hello world
good bye, world

In [24]:
#читаем файл целиком
with open("hello.txt", "r") as file:
    content = file.read()
    print(content)

hello world
good bye, world


In [25]:
# имя файла
FILENAME = "messages.txt"
# определяем пустой список
messages = list()
 
for i in range(4):
    message = input("Введите строку " + str(i+1) + ": ") # заменить на format или на f'string
    messages.append(message + "\n")
 
# запись списка в файл
with open(FILENAME, "a") as file:
    for message in messages:
        file.write(message)
        
 
# считываем сообщения из файла
print("Считанные сообщения")
with open(FILENAME, "r") as file:
    for message in file:
        print(message, end="")

Введите строку 1: 123123
Введите строку 2: 123123213
Введите строку 3: цуцу
Введите строку 4: вв
Считанные сообщения
ываываы
ываываыва
ваываыва
уукук
dsfsdfsdf
sdfsdfsdf
eferer
ffff
123123
123123213
цуцу
вв


Для того чтобы работать с файлами в Питоне следует также понимать принципы работы path
Рабочая библиотека **os**

In [26]:
import os
os.getcwd()

'/home/politlen/Documents'

In [None]:
os.listdir()

In [91]:
[i for i in os.listdir() if i.endswith('txt')]

['3три.txt',
 'keys.txt',
 'result.txt',
 '1раз.txt',
 'hello.txt',
 '2два.txt',
 'messages.txt',
 'token.txt']

In [100]:
os.chdir('../')
os.getcwd()

'/home/politlen'

Подробнее про модуль os https://python-scripts.com/import-os-example

In [148]:
#Задача на файлы и строки
var = """ЭтОТ текст ИМЕЕЕТ явнЫе проБЛЕМы с РЕГИСТРОМ. ЕГО писал нездоровый коллега, 
КОТОРЫЙ то ли УШЕЛ в отпуск то ли на больничный, и теперь он недоступен.Однако в этом тексте содержится ключевая информация по поставкам, 
которая срочно должна оказаться на столе у начальника. 
Дальше идет долгое и подробное описание деталей поставок, характеристик товаров и прочее прочее. Страниц на 100
Нам нужно вычленить оТсюда ключевую информацию  записать её в файл:
Ford Focus, colour: grey, transmission: automate, price: 1,1 kk rub,  tel: 8(880)456-65-78
Ford Mondeo, colour: blue; transmission: automate, price: 1,6 kk rub, tel: 8(880)546-55-79
"""

#Хотим чтобы каждое предложение начиналось  с большой буквы, а остальные были с маленькой


In [149]:
#Запись в файл. В жизни этот этап был бы пропущен
with open("hello.txt", "w") as file:
    file.write(var)
    
with open("hello.txt", "r") as file:
    data = file.read()
    

text, info = data.split('файл:')
textLower = text.lower() + 'файл: '
textUpdated =  print(". ".join(i.capitalize() for i in  re.split(r'\.\s+', textLower)))
textUpdated

Этот текст имееет явные проблемы с регистром. Его писал нездоровый коллега, 
который то ли ушел в отпуск то ли на больничный, и теперь он недоступен.однако в этом тексте содержится ключевая информация по поставкам, 
которая срочно должна оказаться на столе у начальника. Дальше идет долгое и подробное описание деталей поставок, характеристик товаров и прочее прочее. Страниц на 100
нам нужно вычленить отсюда ключевую информацию  записать её в файл: 


Как видите, "нам" не вернулось обратно в исходную форму, потому что не подходит по паттерну. 

Мы можем изменить наше регулярное выражение, но все человеческие ошибки предугатать невозможно.