### Escape-последовательности

`\n` &ndash; новая строка  
`\r` &ndash; возврат каретки  
`\t` &ndash; табуляция  
`\\` &ndash; обратный слэш

Вместе с пробелом (`' '`) они составляют пробельные символы.

In [1]:
print("a\nb\tc")

a
b	c


### Методы для работы со строками

Так как строки неизменяемы, методы возвращают новые строки, а старые остаются без изменений.

Метод `.split()` позволяет разбить строку на подстроки по какому-нибудь символу-разделителю. Он возвращает список строк. По умолчанию разделитель &ndash; любая последовательность пробельных символов.

In [2]:
a = "1, 2, 3\t4"
a = a.split()
print(a)

['1,', '2,', '3', '4']


In [3]:
a = "1, 2, 3\t   4"
a = a.split()
print(a)

['1,', '2,', '3', '4']


In [4]:
a = "1, 2, 3"
a = a.split(", ")
print(a)

['1', '2', '3']


Параметр `maxsplit` позволяет указать максимальное количество разбиений.

In [5]:
a = "1, 2, 3"
a = a.split(", ", maxsplit=1)
print(a)

['1', '2, 3']


Если мы хотим отсчитывать разбиения справа, используем метод `.rsplit()`.

In [6]:
a = "1, 2, 3"
a = a.rsplit(", ", maxsplit=1)
print(a)

['1, 2', '3']


Метод `.strip()` позволяет обрезать пробельные символы по краям строки. `.lstrip()` делает это только слева, `.rstrip()` &ndash; только справа.

In [7]:
a = "   a\t"
print([a.strip(), a.rstrip(), a.lstrip()])

['a', '   a', 'a\t']


**Задание:** дан список строк, в каждой из которых содержится следующая информация: имя студента, курс и тема курсовой через запятую. При этом тема курсовой может содержать запятые. Постройте список, в котором каждый элемент &ndash; список из этих трёх элементов: `["Имя", "Курс", "Тема"]`. Используйте `.split()`.

In [1]:
data = [
    "Петр Иванов, 2, Культура, литература и религия Британских островов",
    "Василий Сидоров, 3, Популярная культура как измерение постпостмодернизма: феноменология, теория, критика",
    "Анна Петрова, 3, Выражение иронии в речи, жестах и мимике",
    "Валерия Смирнова, 2, Региональные варианты русской интонации",
]

data_split = []
for row in data:
    row = row.split(", ", maxsplit=2)
    data_split.append(row)
print(data_split)

[['Петр Иванов', '2', 'Культура, литература и религия Британских островов'], ['Василий Сидоров', '3', 'Популярная культура как измерение постпостмодернизма: феноменология, теория, критика'], ['Анна Петрова', '3', 'Выражение иронии в речи, жестах и мимике'], ['Валерия Смирнова', '2', 'Региональные варианты русской интонации']]


Метод `.join()` позволяет объединить список строк (или любой другой итерируемый объект, например, строку) с некоторой строкой как разделителем.

In [8]:
a = ["1", "2", "3"]
print("-".join(a))

1-2-3


In [None]:
a = "123"
print("-".join(a))

1-2-3


Если разделитель не нужен, укажем в качестве него пустую строку.

In [None]:
a = ["1", "2", "3"]
print("".join(a))

1 2 3


**Задание:** дан список слов. Постройте новый список, где между буквами слов будут знаки `+`.

In [10]:
words = ["собака", "арба", "карандаш", "мама", "стол"]
newwords = ["+".join(w) for w in words]
print(newwords)

['с+о+б+а+к+а', 'а+р+б+а', 'к+а+р+а+н+д+а+ш', 'м+а+м+а', 'с+т+о+л']


**Задание**: дан список слов. Постройте новый список, где во всех словах гласные буквы будут заменены на нижние подчёркивания.

Подсказка: используйте list comprehension с тернарным оператором, а потом используйте `.join()`.

In [3]:
words = [
    "собака", "арба", "карандаш", "мама", "стол",
    "парашют", "ананас", "табурет", "старатель"
]

newwords = []
vowels = "аяоёуюыиэе"
for word in words:
    wordsplit = ["_" if c in vowels else c for c in word]
    word = "".join(wordsplit)
    newwords.append(word)
print(newwords)

['с_б_к_', '_рб_', 'к_р_нд_ш', 'м_м_', 'ст_л', 'п_р_ш_т', '_н_н_с', 'т_б_р_т', 'ст_р_т_ль']


Метод `.replace()` позволяет заменить заданные подстроки в строке на что-то другое.

In [10]:
a = "1_2_3_4_5"
print(a.replace("_", "+"))

1+2+3+4+5


In [11]:
a = "1_2_3_4_5"
print(a.replace("_", ""))

12345


Перепишем задание про гласные с помощью `.replace()`.

In [1]:
words = [
    "собака", "арба", "карандаш", "мама", "стол",
    "парашют", "ананас", "табурет", "старатель"
]

newwords = []
vowels = "аяоёуюыиэе"
for word in words:
    for v in vowels:
        word = word.replace(v, "_")
        # обратите внимание, что внутренний цикл нужен!
        # мы перебираем все гласные и по очереди каждую заменяем на _
    newwords.append(word)
print(newwords)

['с_б_к_', '_рб_', 'к_р_нд_ш', 'м_м_', 'ст_л', 'п_р_ш_т', '_н_н_с', 'т_б_р_т', 'ст_р_т_ль']


**Задание**: дан список слов. Создайте новый список, где все буквы "а" будут заменены на "ы".

In [11]:
words = ["абрикос", "арба", "алтын", "абак", "аббатство", "аркан"]
y_words = [w.replace("а", "ы") for w in words]
print(y_words)

['ыбрикос', 'ырбы', 'ылтын', 'ыбык', 'ыббытство', 'ыркын']


**Задание**: дан текст. Сделайте так, чтобы после каждой точки был перевод строки.

In [4]:
text = "Text text.Text text text.Text.Text text text"
print(text.replace(".", ".\n"))

Text text.
Text text text.
Text.
Text text text


Метод `.startswith()` позволяет определить, начинается ли строка с заданной подстроки (`True`) или нет (`False`). `.endswith()` &ndash; то же самое для конца строки.

In [12]:
a = "this is a test"
print(a.endswith("est"))

True


**Задание:** дан список слов. Постройте новый список слов, где будут только слова, начинающиеся на "аб". Выведите на экран все эти слова через дефис.

In [5]:
words = ["абрикос", "арба", "алтын", "абак", "аббатство", "аркан"]
ab_words = [w for w in words if w.startswith("аб")]
print(ab_words)

['абрикос', 'абак', 'аббатство']


Методы `.upper()`, `.lower()` и `.capitalize()` управляют регистром строки.

In [13]:
a = "tHiS iS a TeSt"
print(a.upper())
print(a.lower())
print(a.capitalize())

THIS IS A TEST
this is a test
This is a test


С полным списком строковых методов можно ознакомиться в [документации](https://docs.python.org/3/library/stdtypes.html#string-methods).

**Задание:** дан список слов. Постройте новый список слов, где все слова будут написаны маленькими буквами.

In [7]:
words = ["pYThon", "VARiaBlE", "sTrING"]
lowerwords = [w.lower() for w in words]
print(lowerwords)

['python', 'variable', 'string']


**Задание**: дан текст. Уберите из него запятые и точки с помощью `.replace()`, приведите к нижнему регистру и создайте список всех слов, которые начинаются на букву "т". Выведите на экран все эти слова через нижнее подчёркнивание.

In [2]:
text = (
    "Был тихий серый вечер. Дул ветер, слабый и тёплый. "
    "Небо было покрыто тучами, сквозь которые едва пробивались лучи "
    "заходящего солнца."
)
# решение
text = text.lower()
text = text.replace(".", "")
text = text.replace(",", "")
words = text.split()
t_words = [w for w in words if w.startswith("т")]
print("_".join(t_words))

тихий_тёплый_тучами


Можно заменять нужные нам символы в цикле: это актуально, когда их много.

In [3]:
text = text.lower()
for c in ",.":
    text = text.replace(c, "")
words = text.split()
t_words = [w for w in words if w.startswith("т")]
print("_".join(t_words))

тихий_тёплый_тучами


### Особые типы строк

"Сырые" строки (r-строки) не учитывают escape-последовательности.

In [14]:
a = "a\tb"
b = r"a\tb"
print(a)
print(b)

a	b
a\tb


Форматные строки (f-строки) позволяют вставлять в строку значения переменных.

In [15]:
a = 4
b = "1"
c = f"some value: {a},  another value: {b}"
print(c)

some value: 4,  another value: 1


С названиями переменных:

In [16]:
c = f"some value: {a=},  another value: {b=}"
print(c)

some value: a=4,  another value: b='1'


Если хотим "добить" нулями до определённой длины:

In [17]:
x = 11
print(f"{x:04d}")

0011


**Задание:** напишите программу, которая принимает на вход два целых числа (от 0 до 23 и от 0 до 59) и выводит на экран время в формате `HH:mm`.

In [9]:
h = int(input())
m = int(input())
if not (0 <= h <= 23 or 0 <= m <= 59):
    print("Invalid time!")
else:
    print(f"{h:02d}:{m:02d}")

01:04


Если нужна определённая точность:

In [18]:
y = 11.123123123123
print(f"{y:.4f}")

11.1231


Полную спецификацию можно посмотреть в [документации](https://docs.python.org/3/library/string.html#format-specification-mini-language).

Многострочные строки:

In [19]:
text = """Line 1
Line 2
Line 3
Line 4"""
print(text)

Line 1
Line 2
Line 3
Line 4


В таких строках часто оформляют документацию (т.н. doc-строки). Обратите внимание, что это не комментарии!