### Escape-последовательности

`\n` &mdash; новая строка  
`\r` &mdash; возврат каретки  
`\t` &mdash; табуляция  

Вместе с пробелом (`' '`) они составляют пробельные символы.

`\\` &mdash; обратный слэш

In [1]:
print("a\nb\tc")

a
b	c


### Методы для работы со строками

Python поддерживает ряд методов для работы со строками. Так как строки неизменяемы, методы возвращают новые строки, а старые остаются без изменений.

Вспомним, что чтобы вызвать метод, нужно после переменной, указывающей на строку, поставить точку (без пробелов) и написать имя нужного метода с круглыми скобками, в которых нужно перечислтить аргументы, если они есть.

Метод `.split()` позволяет разбить строку на подстроки по какому-нибудь символу-разделителю. Он возвращает список строк. По умолчанию разделитель &mdash; любая последовательность пробельных символов.

In [2]:
a = "1, 2, 3\t4"
a = a.split()
print(a)

['1,', '2,', '3', '4']


In [3]:
a = "1, 2, 3\t   4"
a = a.split()
print(a)

['1,', '2,', '3', '4']


In [4]:
a = "1, 2, 3"
a = a.split(", ")
print(a)

['1', '2', '3']


In [1]:
a = "1-2-3"
a = a.split("-")
print(a)

['1', '2', '3']


Параметр `maxsplit` позволяет указать максимальное количество разбиений.

In [5]:
a = "1, 2, 3"
a = a.split(", ", maxsplit=1)
print(a)

['1', '2, 3']


Если мы хотим отсчитывать разбиения справа, используем метод `.rsplit()`.

In [6]:
a = "1, 2, 3"
a = a.rsplit(", ", maxsplit=1)
print(a)

['1, 2', '3']


Метод `.strip()` позволяет обрезать пробельные символы по краям строки. `.lstrip()` делает это только слева, `.rstrip()` &ndash; только справа.

In [7]:
a = "   a\t"
print([a.strip(), a.rstrip(), a.lstrip()])

['a', '   a', 'a\t']


#### Контрольный вопрос

Дан список строк, в каждой из которых содержится следующая информация: имя студента, курс и тема курсовой через запятую. При этом тема курсовой может содержать запятые. Постройте список, в котором каждый элемент &ndash; список из этих трёх элементов: `["Имя", "Курс", "Тема"]`. Используйте `.split()`.

In [2]:
data = [
    "Петр Иванов, 2, Культура, литература и религия Британских островов",
    "Василий Сидоров, 3, Популярная культура как измерение постпостмодернизма: феноменология, теория, критика",
    "Анна Петрова, 3, Выражение иронии в речи, жестах и мимике",
    "Валерия Смирнова, 2, Региональные варианты русской интонации",
]

<details>
<summary>Ответ</summary>
<pre>
data_split = []
for row in data:
    row = row.split(", ", maxsplit=2)
    data_split.append(row)
print(data_split)
</pre>
</details>

Метод `.join()` позволяет объединить список строк (или любой другой итерируемый объект, например, строку) с некоторой строкой как разделителем.

In [8]:
a = ["1", "2", "3"]
print("-".join(a))

1-2-3


In [None]:
a = "123"
print("-".join(a))

1-2-3


Если разделитель не нужен, укажем в качестве него пустую строку.

In [None]:
a = ["1", "2", "3"]
print("".join(a))

1 2 3


Помните, что `.join()` &mdash; метод строк, а не списков! До точки пишется разделитель, в скобках &mdash; последовательность для объединения (список, строка), а не наоборот!

#### Контрольный вопрос

Дан список слов. Напечатайте каждое слово так, чтобы между буквами слов были знаки `+`. Используйте метод `.join()`.

In [3]:
words = ["собака", "арба", "карандаш", "мама", "стол"]

<details>
<summary>Ответ:</summary>
<pre>
for w in words:
    print("+".join(w))
</pre>
</details>

Метод `.replace()` позволяет заменить заданные подстроки в строке на что-то другое.

In [10]:
a = "1_2_3_4_5"
print(a.replace("_", "+"))

1+2+3+4+5


In [11]:
a = "1_2_3_4_5"
print(a.replace("_", ""))

12345


#### Контрольный вопрос

Дан список слов. Замените в каждом слове все гласные буквы на нижнее подчёркивание `_`.

In [4]:
words = [
    "собака", "арба", "карандаш", "мама", "стол",
    "парашют", "ананас", "табурет", "старатель"
]


<details>
<summary>Ответ:</summary>
<pre>
newwords = []
vowels = "аяоёуюыиэе"
for word in words:
    for v in vowels:
        word = word.replace(v, "_")
        # обратите внимание, что внутренний цикл нужен!
        # мы перебираем все гласные и по очереди каждую заменяем на _
    newwords.append(word)
print(newwords)
</pre>
</details>

Метод `.startswith()` позволяет определить, начинается ли строка с заданной подстроки (`True`) или нет (`False`). `.endswith()` &ndash; то же самое для конца строки.

In [12]:
a = "this is a test"
print(a.endswith("est"))

True


#### Контрольный вопрос

Дан список слов. Постройте новый список слов, где будут только слова, начинающиеся на "аб". Выведите на экран все эти слова через дефис.

In [5]:
words = ["абрикос", "арба", "алтын", "абак", "аббатство", "аркан"]


<details>
<summary>Ответ:</summary>
<pre>
ab_words = []
for w in words:
    if w.startswith("аб"):
        ab_words.append(w)
print("-".join(ab_words))
</pre>
</details>

Методы `.upper()`, `.lower()` и `.capitalize()` управляют регистром строки.

In [13]:
a = "tHiS iS a TeSt"
print(a.upper())
print(a.lower())
print(a.capitalize())

THIS IS A TEST
this is a test
This is a test


С полным списком строковых методов можно ознакомиться в [документации](https://docs.python.org/3/library/stdtypes.html#string-methods).

### Особые типы строк

"Сырые" строки (r-строки) не учитывают escape-последовательности.

In [14]:
a = "a\tb"
b = r"a\tb"
print(a)
print(b)

a	b
a\tb


Форматные строки (f-строки) позволяют вставлять в строку значения переменных.

In [15]:
a = 4
b = "1"
c = f"some value: {a},  another value: {b}"
print(c)

some value: 4,  another value: 1


С названиями переменных:

In [16]:
c = f"some value: {a=},  another value: {b=}"
print(c)

some value: a=4,  another value: b='1'


Если хотим "добить" нулями до определённой длины:

In [17]:
x = 11
print(f"{x:04d}")

0011


#### Контрольный вопрос

Напишите программу, которая принимает на вход два целых числа (от 0 до 23 и от 0 до 59) и выводит на экран время в формате `HH:mm`.

<details>
<summary>Ответ:</summary>
<pre>
h = int(input())
m = int(input())
if not (0 <= h <= 23 or 0 <= m <= 59):
    print("Invalid time!")
else:
    print(f"{h:02d}:{m:02d}")
</pre>

</details>

Если нужна определённая точность:

In [18]:
y = 11.123123123123
print(f"{y:.4f}")

11.1231


Полную спецификацию можно посмотреть в [документации](https://docs.python.org/3/library/string.html#format-specification-mini-language).

Многострочные строки:

In [19]:
text = """Line 1
Line 2
Line 3
Line 4"""
print(text)

Line 1
Line 2
Line 3
Line 4


В таких строках часто оформляют документацию (т.н. doc-строки). Обратите внимание, что это не комментарии!

### Практические задания

#### Задание 1

а) Дан список слов. Создайте новый список, где все буквы "а" будут заменены на "ы".

In [7]:
words = ["абрикос", "арба", "алтын", "абак", "аббатство", "аркан"]


б) Измените программу так, чтобы на "ы" заменялись только буквы "а" из первой половины слова. Используйте срезы.

<details>
<summary>Подсказка:</summary>
Заведите две переменные: в одну положите первую половину слова, в другую &mdash; вторую. Проведите замену в первой переменной, а потом сложите их обратно.
</details>

в) Дан текст. Сделайте так, чтобы после каждой точки был перевод строки.

In [6]:
text = "Text text.Text text text.Text.Text text text"


#### Задание 2

Дан текст с числами, разделёнными дефисами и пробелами. Написать код, который выводит все числа в возрастающем порядке. Используйте сортировку.

In [None]:
text = [
    "8-32 4-535-6 10-3 3 30-31-8 32-2 3 5\n",
    "342-12 13789 43 234 04-34 2-1-1-0\n",
    "32-5-31-45-1 34 36 54-123-62-998\n",
]

#### Задание 3

Дан результат распознавания рукописных чисел. Не все цифры распознались корректно:
* Цифра 1 могла распознаться как символы `I`, `l`, `|`.
* Цифра 0 могла распознаться как буква `O`.

Определите сумму чисел. Используйте метод `.replace()`.

In [None]:
text = "I23 lO 671 9O4 56| 8I2 348 5IO"

#### Задание 4 (домашнее задание на 21.02)

Дан текст на латинском алфавите. Провести с ним следующие изменения (каждое изменение производится с изначальным текстом):

а) привести весь текст к нижнему регистру, убрать точки и запятые, заменить все буквы "o" на цифры "0".  
б) привести весь текст к верхнему регистру, заменить все буквы "A", "I" и "E" на цифры "4", "1" и "3" соответственно.  
в) сделать так, чтобы каждое слово начиналось с заглавной буквы (используйте `.split()`)  
г) удвоить каждую гласную букву (используйте цикл).  

In [1]:
text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."



#### Задание 5

Дан текст. Разбейте текст на слова (убрав точки и запятые), найдите пять самых длинных слов и выведите на экран. Используйте срезы и сортировку.

In [None]:
text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."

#### Задание 6

Напишите программу, которая принимает на вход слово на русском языке и заменяет в нём каждую букву на её номер в алфавите. Номера нужно вывести на экран, соединённые дефисом. Например: "мама" -> "14-1-14-1"

Подсказка: создайте строку с алфавитом и используйте метод .index().

#### Задание 7 (*)

Напишите программу, которая принимает на вход две строки и определяет, можно ли вторую составить из букв первой (необязательно всех). Используйте метод `.count()`.

<details>
<summary>Подсказка:</summary>
Идея: перебираем в цикле все буквы второго слова. Для каждой считаем, сколько раз она встретилась в первом и во втором слове. Если в первом слове меньше, то `break`: значит, нельзя. После цикла блок `else`: если ни разу не вызвали `break`, значит, всё хорошо.
</details>

### Домашнее задание

Дан текст на русском языке. Определите количество слогов в каждом предложении (количество слогов определите по количеству гласных).

1. Разбить текст на предложения по точкам
2. В каждом предложении в цикле подсчитать гласные звуки
3. Выведите текст:

```
Предложение 1: X
Предложение 2: Y
...
```

In [None]:
text = "Был тихий серый вечер. Дул ветер, слабый и теплый. Небо было покрыто тучами, сквозь которые иногда прорывались лучи заходящего солнца."