# Типы данных: Строки

## Определение строк

На прошлой [лекции](../lesson3/conspect.md) мы начали изучать последовательность: обсудили определение последовательности в Python, обсудили методы, общие для последовательностей, а также рассмотрели таких представителей последовательностей, как список (tuple) и (list). Сегодня мы закончим изучение последовательностей рассмотрением строк. 

Строки - еще один встроенные тип данных. Строки - это неизменяемые последовательности, состоящие из символов, и используемые для предоставления текстовой информации. Строки предоставляют широкий функционал и большой набор методов, именно поэтому целесообразно обсуждать их отдельно.

Начнем с определения строк в коде. В самом простом случае строки - это последовательность символов (в частности пустая), заключенная в одинарные или двойные кавычки:

In [1]:
string1 = 'this is string literal'
string2 = "this is string literal too"

Поддержка нескольких вариантов создания строкового литерала позволяет использовать неиспользованные( :) ) кавычки в самом литерале. Ну, или если вы убежденный фанат одного типа кавычек, вы все равно можете использовать из в самом литерале с помощью экранирования:

In [4]:
string1 = "I'm iron man"
string2 = 'I\'m iron man'

print(string1, string2, sep='\n')
print(string1 == string2)

I'm iron man
I'm iron man
True


*Интересный факт*: более предпочтительным считается использование одинарных кавычек. Однако, на работе вы все равно будете использовать те кавычки, которые прописаны в конфигурации форматтера.

Вы также можете создавать многострочные строки (как бы странно это не звучало):

In [23]:
string1 = "this is long multi string string\n\
and this line is its part"

string2 = (
    "this is long multi string string\n"
    "and this line is its part"
)

print(string1, string2, sep='\n\n')

this is long multi string string
and this line is its part

this is long multi string string
and this line is its part


Однако, данный подход к создание многострочных строк не приветствуется. Обычно для этих целей используются тройные кавычки:

In [24]:
string = """\
This is very very long line
Or not
But I just wanted to demonstrate \
this kind of strings
"""

print(string)

This is very very long line
Or not
But I just wanted to demonstrate this kind of strings



Вы часто можете увидеть подобные литералы в качестве многострочных комментариев:

```Python
def my_func(arg1, *args, kwarg1='word'):
    """
    This function do usefull staff
    
    :arg1: is a number or None
    :kwarg1: is a string, equals 'word' by default

    :return: None
    """
    ...
```

Необходимо обратить внимание на следующее обстоятельство: при создании многострочного строкового литерала с использованием тройных кавычек или с использованием реверс слеша, написание комментариев допустимо только после закрытия кавычек.

Также обратите внимание, что в этом варианте у нас нет необходимости в добавлении специального символа перехода но новую строку '\n', переход осуществляется автоматически при переходе на новую строку. Однако, если мы хотим перейти на новую физическую строку, но при этом продолжить писать на предыдущей физической строке, мы вынуждены использовать реверс-слеш.

Помимо символа '\n' существует ряд символов специального назначения (в англоязычной литературе они называются *escape sequences*). Вот некоторые из них, которые вы будете использовать чаще всего:

|Символ|Описание|
|--|--|
|\\<newline>|продолжение написания на текуще физической строке, несмотря на фактическое наличие символа перехода на новую строку|
|\\\\ |реверс слеш|
|\\'|одинарная кавычка|
|\\"|двойная кавычка|
|\\n|переход на новую строку|
|\\t|таб|

В обычных строках использование реверс-слеша без экранирования невозможно. Однако вы можете создать так называемую *сырую* строку, в которой все специальные символы теряют свое значение:

In [33]:
raw_string = r'C:\Users\User\Desktop\teaching'

print(raw_string)

C:\Users\User\Desktop\teaching


Создание сырых строк аналогично созданию обычных строк, единственное - необходимо написать букву r или R перед самим литералом. Обычно данный тип строк используется для определения путей к файлам. Однако, подобная практика не рекомендуется. Для данной цели используйте или модуль pathlib, или модуль os.path. 

## Строки как последовательности

Как упоминалось ранее, строки являются последовательностями. Из этого следует, что мы можем конкатенировать и повторять строки:

In [34]:
addition = " add this part"
string = input('Enter some string: ')

repeated = string * 5
concatenated = string + addition

print(repeated, concatenated, sep='\n')

some stringsome stringsome stringsome stringsome string
some string add this part


Т.к. строки неизменяемы, любые операции со строками приводят к созданию нового объекта строки. Даже такие операции, как составное присваивание, не изменяют текущий объект, а создают новый и перепривязывают старую ссылку к новому объекту:

In [35]:
string = 'this is old string '
id_old = id(string)

string *= 5
id_new = id(string)

print(id_old == id_new)

False


Также из того факта, что строки - последовательности, следует, что мы можем использовать оператор `in`, для проверки вхождения того или инога символа в строку:

In [36]:
string = 'what a wonderful world'
print('a' in string)

True


Но, что гораздо интереснее, с помощью оператора `in` мы также можем не просто проверить наличие одного символа в строке, но и наличие целой подстроки: 

In [37]:
string = 'what a wonderful world'
print('world' in string)

True


Ну и наконец, поскольку строки - последовательности, мы можем их индексировать. Два важных момента: первое - поскольку строки неизменяемы, мы не можем изменять как значения отдельно взятых символов, так и значения подстрок; второе - индексирование строк аналогично индексированию списков и кортежей, т.е. мы можем использовать положительные и отрицательные целые числа и срезы. 

In [43]:
string = 'what a wonderful world'

print(
    string[1],
    string[-1],
    string[::-1],
    string[2:8],
    sep='\n',
    end='\n\n'
)

try:
    string[0] = 'W'

except TypeError:
    print(
        'String is immutable type so you '
        "can't change its value"
    )

h
d
dlrow lufrednow a tahw
at a w

String is immutable type so you can't change its value
