# Строки

Попробуем поработать со сроками и вспомним, как работать со списками.

In [14]:
s = 'строки можно указывать с помощью одинарной кавычки'
p = "или с помощью двойной кавычки"

print(s)
print(p)

строки можно указывать с помощью одинарной кавычки
или с помощью двойной кавычки


In [15]:
print('Очевидно, что внутри строк с "одинарными" кавычками, можно ставить и с "двойными" и наоборот')

Очевидно, что внутри строк с "одинарными" кавычками, можно ставить и с "двойными" и наоборот


In [11]:
s = """внутри тройных кавычек можно использовать любые символы " '
            и даже переход на новую строку"""
print(s)

внутри тройных кавычек можно использовать любые символы " '
            и даже переход на новую строку


### Экранирование символов

Обратный слэш **`\`** экранирует символы, указывая интерпретатору, что это не конец строки, а просто символ кавычки.

Слеш (или слэш, slash) ещё используется в ряде случаев для того, чтобы указать интерпретатору
специальные символы. Например:

In [9]:
print('hello\nworld')

hello
world


В данном случае **`\n`** означает перевод строки, _new line_.

Под windows новую строку обозначают как **`\r\n`**, двумя символами. Подробнее об этом прочитать можно [здесь](https://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4_%D1%81%D1%82%D1%80%D0%BE%D0%BA%D0%B8) (это домашнее задание на общее развитие). Обрати внимание на `ASCII`-таблицу, коды `10 13`, `CR LF`.

Есть ещё символ **`\t`**, который означает _tab_, пробельный символ шириной в 8 (или 4) пробелов.

In [17]:
print('hello\tworld')

hello	world


### Внезапная проблема с экранированием символов

Пусть мы хотим вывести путь к файлу:

In [18]:
print('C:\some\name.txt')

C:\some
ame.txt


И получилось так, что **`\n`** равен новой строке, а не символу **`n`**. Чтобы справить с этой проблемой, мы можем все слеши тоже экранировать, чтобы они потеряли своё свойство создания спец. символов:

In [19]:
print('C:\\some\\name.txt')

C:\some\name.txt


Но это может быть немного неудобно, постоянно экранировать слеши. Поэтому в python ввели конструкцию, в которой внутри __все__ слеши не имеют свойства создания спец. символов.

In [20]:
print(r'C:\some\name.txt')

C:\some\name.txt


То есть все слеши внутри такой строки `r'…'` являются обычными слешами.

In [21]:
print("""
Допустим здесь я пишу какую-нибудь справку по использованию программы.
Но в начале этой справки будет находиться переход на новую строку.
""")


Допустим здесь я пишу какую-нибудь справку по использованию программы.
Но в начале этой справки будет находиться переход на новую строку.



In [23]:
print("""\
Чтобы его убрать, можно поставить \\ перед новой строкой.
""")

Чтобы его убрать, можно поставить \ перед новой строкой.



## Операции со строками

Строки можно конкатенировать с помощью `+` плюса, и повторять с помощью `*` знака умножения.

In [26]:
3 * 'мяу' + '!'

'мяумяумяу!'

Ещё, если написать два литерала (т.е. две константы) вместе, то они сошьются.

In [27]:
'кот' 'ейка'

'котейка'

Но это работает _только_ с литералами, а не с выражениями или с переменными:

In [29]:
a = 'кот'

In [30]:
a 'ейка'

SyntaxError: invalid syntax (<ipython-input-30-ebcabb1d92d0>, line 1)

In [31]:
(3 * 'мяу') '!'

SyntaxError: invalid syntax (<ipython-input-31-e6f0ad95ada4>, line 1)

Нужно использовать `+`

In [32]:
a + 'ейка'

'котейка'

In [33]:
(3 * 'мяу') + '!'

'мяумяумяу!'

Ещё одно полезное применение, многострочный текст:

In [34]:
print('Какой-то очень'
      ' длинный текст')

Какой-то очень длинный текст


## Строки как списки, строки как слайсы (slice — кусок)

In [37]:
word = 'Python'

In [43]:
word[0]  # Строки как и списки нумеруются с нуля

'P'

In [40]:
word[5]

'n'

In [42]:
word[-1]  # Последний символ

'n'

In [44]:
word[-2]  # Предпоследний символ

'o'

In [45]:
word

'Python'

In [46]:
word[0:2]

'Py'

In [47]:
word[2:5]

'tho'

Кстати, можно убедиться, что `s[:i] + s[i:]` == `s` всегда:

In [48]:
word[:2] + word[2:]

'Python'

In [51]:
word[:4] + word[4:]

'Python'

In [50]:
word[-3:]  # От третьего с конца, до конца

'hon'

Индексация будет следующей:

```
 +---+---+---+---+---+---+
 | P | y | t | h | o | n |
 +---+---+---+---+---+---+
 0   1   2   3   4   5   6
-6  -5  -4  -3  -2  -1
```

Длина слайса есть разница между индексами, то есть `len( word[1:3] )` == 2.

In [55]:
word[1:3]

'yt'

In [53]:
len(word[1:3]) == 3 - 1

True

In [56]:
word[0:6]

'Python'

In [54]:
len(word[0:6]) == 6

True

Слайсинг хорошо работает, даже если указаны слишком большие индексы:

In [57]:
word[3:100]

'hon'

In [58]:
word[50:]

''

In [59]:
word[:50]

'Python'

Но обращение по индексу (не слайсинг) даст ошибку:

In [60]:
word[50]

IndexError: string index out of range

### Иммутабельность строк

Работая со списками, мы могли изменить его часть или отдельный элемент:

In [61]:
xs = [1, 2, 3]

xs[2] = 7
xs

[1, 2, 7]

Но со строками такое не пройдёт, пробуем:

In [63]:
s = "балалайка"

s[2] = 'Я'

TypeError: 'str' object does not support item assignment

In [72]:
s = 'abcd'

# s[:2] = 'aa'

s   # == 'aacd'

'abcd'

Так тоже не работает. Нужен другой способ, как изменить часть строки. Сможешь придумать? (ДЗ)

Достаточно использовать то, что было рассказано в этой книге.

In [65]:
s[2:] = 'ЯЯ'

TypeError: 'str' object does not support item assignment

Это связано с тем, что строки в python неизменяемы (иммутабельны).

Мутация — это изменение организма или ДНК. Мутабельный — изменяемый. Иммутабельный — неизменяемый.