# Строки
## Индексация
Cтрока - это упорядоченный набор символов. Потому к отдельному символу в строке можно обратиться по его индексу, если указать индекс в квадратных скобках после строки   

`<строка>[<индекс>]`

Индесация символов в строке идет слева направо, начиная с 0

![%D0%A1%D0%BA%D1%80%D0%B8%D0%BD%D1%88%D0%BE%D1%82%2020-04-2021%2000.48.11.png](attachment:%D0%A1%D0%BA%D1%80%D0%B8%D0%BD%D1%88%D0%BE%D1%82%2020-04-2021%2000.48.11.png)

In [1]:
stroka = 'Это строка'
stroka[6]

'р'

Также можно использовать отрицательную (обратную) индексацию справа налево, начиная с -1

![2.png](attachment:2.png)

In [2]:
stroka[-6]

'с'

**Важно**:  строковый тип является неизменяемым - нельзя напрямую изменить символ в строке (в этом случае будет выдано сообщение об ошибке)

In [3]:
stroka[3]='-'

TypeError: 'str' object does not support item assignment

При попытке использовать несуществующий индекс будет выдано сообщение об ошибке

In [4]:
stroka[10]

IndexError: string index out of range

## Срезы
Срез (slice) извлекает из данной строки ее некоторый фрагмент (подстроку). Любые операции среза со строкой создают новые строки и никогда не меняют исходную строку. 
* Срез с двумя параметрами   
`<строка>[a:b]`    
возвращает подстроку, начиная с символа c индексом `a` до символа с индексом `b`, **не включая его**. Можно использовать как положительные, так и отрицательные индексы, в том числе в одном срезе. При использовании отрицательных индексов первый параметр среза должен быть меньше второго, либо должен быть пропущен.

In [5]:
stroka = 'Это строка'
# символы с 4 по 7 невключительно (то есть 4, 5 и 6 символы)
stroka[4:7]

'стр'

In [6]:
# строка без первого и последнего символа
stroka[1:-1]

'то строк'

При использовании такой формы среза ошибки index out of range не возникает

In [7]:
stroka[4:100]

'строка'

Если опустить второй параметр (двоеточие остается), то срез берется до конца строки. Аналогично, если опустиить первый параметр, то срез берется от начала строки. 

In [8]:
# строка без первого символа (то есть с 1 символа до конца строки)
stroka[1:]

'то строка'

In [9]:
# строка без последнего символа
stroka[:-1]

'Это строк'

* Срез с тремя параметрами   
`<строка>[a:b:h]`    
возвращает подстроку, начиная с символа c индексом `a` до символа с индексом `b`, **не включая его**, с шагом `h` (аналогично функции range). То есть будут взяты символы с индексами $a, a+h, a+2h$ и т.д. Шаг может быть в том числе и отрицательным, в этом случае символы будут идти в обратном порядке. 

In [10]:
# символы начиная с 1 и до предпоследнего с шагом 2, то есть каждый второй символ
stroka[1:-1:2]

'т то'

In [11]:
# все символы в обратном порядке
stroka[::-1]

'акортс отЭ'

## Функции и методы строк
Метод - это функция, применяемая к объекту, в данном случае к строке. Метод вызывается в виде 

`<имя объекта>.<имя метода>(<параметры>)`

Например, `s.find('e')` это применение к строке `s` метода `find` с одним параметром `'e'`

При применении всех методов сама строка остается **неизменной** (нужно работать с результатом применения этих методов)

### Длина строки `len`
Функция `len` определяет длину строки

`len(<строка>)`

In [12]:
len(stroka)

10

### Разбиение строки `split`
Метод `split` позволяет разбить строку на список строк меньшего размера с использованием разделителя

`<строка>.split(<разделитель>)`

In [13]:
# если разделитель не указан, то разбивение ведется по пробелам (одиночным или группам)
stroka.split()

['Это', 'строка']

In [14]:
S = 'раз,123,два,345'
S.split(',')

['раз', '123', 'два', '345']

### Объединение строк `join`
Метод `join` объединяет список строк в одну строку через разделитель

`<разделитель>.join(<список строк>)`

In [15]:
s = ['раз', '123', 'два', '345']
' + '.join(s)

'раз + 123 + два + 345'

### Замена подстроки `replace`
Функция `replace` предназначена для замены одной подстроки другой

`<строка>.replace(<заменяемая подстрока>, <подстрока-замена>)` 

In [16]:
stroka.replace('о', '0')

'Эт0 стр0ка'

Если методу `replace` задать еще один параметр

`<строка>.replace(<заменяемая подстрока>, <подстрока-замена>, n)`

то заменены будут не все вхождения, а только не больше, чем первые `n` из них

### Удаление служебных символов  `strip`
Метод `strip` предназначен для удаления служебных символов-пробелов (пробел, `'\t'`, `'\n'` и т.д.) в начале строки и в конце строки

`<строка>.strip()` 

In [17]:
S = '\t abc \n'
S.strip()

'abc'

Также можно указать, какие именно символов следует удалить

`<строка>.strip(<символы>)` 

In [18]:
Stroka = 'Это строка...!!?'
Stroka.strip('.?!')

'Это строка'

Аналогичные методы: `lstrip()` удаляет только в начале, а `rstrip()` — только в конце строки

### Оператор принадлежности `in`
Используется для проверки, находится ли подстрока в данной строке  
`if <подстрока> in <имя строки>:`

### Поиск подстроки  `find`
Метод `find` ищет первое вхождение подстроки в строке. Метод возвращает номер первого вхождения подстроки в строку или -1, если такой подстроки нет.

`<строка>.find(<подстрока>)` 

Поиск можно осуществляться только в части строки, дополнительно указав начало и конец (оба параметры необзательны)

`<строка>.find(<подстрока>, [начало], [конец])` 

In [19]:
stroka = 'Это строка'
stroka.find('о')

2

In [20]:
stroka.find('О')

-1

Аналогичный метод: `rfind()` — ищет, начиная с конца строки.

### Поиск подстроки  `index`
Метод `index` ищет первое вхождение подстроки в строке. Метод возвращает номер первого вхождения подстроки в строку или ошибку `ValueError`, если такой подстроки нет.

`<строка>.index(<подстрока>)` 

Поиск можно осуществляться только в части строки, дополнительно указав начало и конец (оба параметры необзательны)

`<строка>.index(<подстрока>, [начало], [конец])` 

In [21]:
stroka.index('о')

2

In [22]:
stroka.index('O')

ValueError: substring not found

Аналогичный метод: `rindex()` — ищет, начиная с конца строки.

### Начало и конец строки `startswith` и `endswith`
Метод `startswith` определяет начинается ли строка c подстроки   
`<строка>.startswith(<подстрока>)` 
    
Метод `endswith` определяет оканчивается ли строка подстрокой     
`<строка>.endswith(<подстрока>)`
    
Оба метода возвращают значение `True` (если да) или `False` (если нет). Аналогично методам `find` и `index`, можно дополнительно указать начало и конец для поиска только в части строки
    
### Количество вхождений подстроки  `count`
Метод `count` cчитает количество вхождений подстроки в строку. При этом учитываются только не пересекающиеся вхождения.

`<строка>.сount(<подстрока>)` 

Подсчет можно осуществляться только в части строки, дополнительно указав начало и конец (оба параметры необзательны)

`<строка>.count(<подстрока>, [начало], [конец])` 

In [23]:
stroka.count('о')

2

### Работа с регистром  `lower` и `upper`, `swapcase`, `capitalize` и  `title`

Метод `upper`заменяет строчные буквы в строке заглавными
`<строка>.upper()`

Метод `lower` заменяет заглавные буквы в строке строчными
`<строка>.lower()`   

Метод `swapcase` меняет регистр букв в строке на противоположный   
`<строка>.swapcase()`  

Метод `capitalize` меняет регистр первого символа строки на верхний, а все остальных - на нижний
`<строка>.capitalize()`  


Метод `title` меняет регистр первого символа каждого слова в строке на верхний, а все остальных - на нижний (включая предлоги, аббревиатуры, апострофы и т.д.)
`<строка>.title()` 

In [24]:
stroka.upper()

'ЭТО СТРОКА'

In [25]:
stroka.lower()

'это строка'

In [26]:
stroka.swapcase()

'эТО СТРОКА'

In [27]:
stroka = 'эТо СтРоКа'
stroka.capitalize()

'Это строка'

In [28]:
stroka = "The Top 50 CEO's in The World"
stroka.title()

"The Top 50 Ceo'S In The World"

### Работа с cимволами  
Язык программирования Python — современный язык, поэтому он работает исключительно с Unicode-символами.

Функция `ord` переводит символ в его код UTF-8
`ord(<cимвол>)`

Функция `chr` переводит код UTF-8 в символ
`chr(<число>)`  

In [29]:
ord('А')

1040

In [30]:
chr(1103)

'я'

### Классификация символов
Метод `isalpha`проверяет состоит ли строка только из букв
`<строка>.isalpha()`

Метод `isdigit`проверяет состоит ли строка только из цифр
`<строка>.isdigit()`

Метод `isalnum` проверяет состоит ли строка только из букв и цифр
`<строка>.isalnum()`

Метод `islower`проверяет, являются ли все буквенные символы строки строчными
`<строка>.islower()`

Метод `isupper`проверяет, являются ли все буквенные символы строки заглавными
`<строка>.islower()`

Метод `isspace`проверяет, состоит ли строка только из служеюных символов-пробелов
`<строка>.isspace()`

In [31]:
s='123'
s.isalpha()

False

In [32]:
s='123'
s.isdigit()

True

In [33]:
s='\t    \n    '
s.isspace()

True

## `f`-строки  (новейший стиль)
На данный момент для форматирования строк рекомендуется использовать f-строки, которые появились в версии Python 3.6.
Чтобы создать f-строку, нужно сделать следующее
* ввести букву `f` или `F` перед первой кавычкой
* поместить имена переменной или выражения в фигурные скобки `{}`, чтобы их значения попали в строку

In [34]:
import math
x = 3.14
y = 2.7
z = math.log(x)+math.atan(y)**-1
print(f'При x = {x} и y = {y} значение функции равно {z}')

При x = 3.14 и y = 2.7 значение функции равно 1.9665299031118333


Для f-строк используется такой же язык форматирования (ширина, заполнитель, выравнивание), как и у метода format (подробнее в документации языка https://docs.python.org/3/library/string.html#custom-string-formatting)

In [35]:
x = 3.14
y = 2.7
z = math.log(x)+math.atan(y)**-1
print(f'При x = {x} и y = {y} значение функции равно {z:.3f}')

При x = 3.14 и y = 2.7 значение функции равно 1.967


Начиная с версии Python 3.8, f-строки позволяют выводить не только значения переменных, но и их имена. Для этого нужно поставить знак = после имени переменной, размещенного в фигурных скобках

In [36]:
x = 3.14
y = 2.7
z = math.log(x)+math.atan(y)**-1
print(f'При {x = } и {y = } значение функции равно {z = :.3f}')

При x = 3.14 и y = 2.7 значение функции равно z = 1.967
