# **Строки**

**Оглавление:**

* Перебор строк по индексам и элементам
* Срезы
* Методы строк
* Примеры задач на работу со строками
* Домашнее задание

***Это служебный блок, не редактируйте его и не забудьте запустить перед выполнением остальных блоков!***

In [8]:
from string import ascii_uppercase
from random import randint

def random_string(n: int) -> str:
    s = ''
    for i in range(n):
        s += ascii_uppercase[randint(0, 25)]
    return s

example = ''.join([ascii_uppercase[randint(0, 25)] for i in range(5)])
dz_1 = random_string(10)
dz_2 = random_string(10)
dz_3 = random_string(10)

print(example, dz_1, dz_2, dz_3, sep='\n')

OUHKW
OQXDWNLWOP
MWUIRTNKSC
MVBVMBLYCF


# **1. Перебор строк по индексам и элементам**

Любая строка в python является объектом итерируемым ```(iterable)```, то есть каждый элемент строки имеет свой определенный порядковый номер ```(индекс)```, причем нумерация идет от крайнего левого элемента, начиная с ```0```.

In [9]:
s = "abcdef"
#    012345 - индексы

Именно это свойство и позволяет производить перебор строк как по индексам, так и по отдельным элементам с использованием цикла ```for```. Так же, мы можем обращаться к отдельным элементам строки по индексу, но НЕ можем изменять их, так как строка является **неизменяемым** объектом.

Чтобы перебирать строку по индексам, нам необходимо запустить цикл в промежутке от 0 до индекса последнего элемента, который можно узнать с помощью функции ```len()```, которая возвращает длину итерируемого объекта, при этом, индекс последнего символа в строке расчитывается по формуле ```len(строки) - 1```.

Напоминаю, что функция ```range(a, b)``` задает промежуток вида ```[a, b)``` или ```[a, b - 1]```, то есть последний элемент не включен в перебор, а как следствие, в случае работы с строками, мы как раз можем использовать функцию ```len()```.


In [10]:
print(example, type(example))
for i in range(0, len(example)):
    print(example[i])

OUHKW <class 'str'>
O
U
H
K
W


При этом, чтобы вывести определенных элемент из строки, сначала мы обращаемся к переменной, которая содержит необходимую нам строку, после названия переменной в **квадратных** скобках мы указываем индекс того элемента, который нам нужен.

In [11]:
print(example)
print(''.join([str(i) for i in range(len(example))]))
print(example[0])
print(example[4])

OUHKW
01234
O
W


Также, индекс может быть указан и отрицательным, при этом, нумерация идет с конца строки, начиная с ```-1```

In [12]:
print(example, type(example))
for i in range(1, len(example) + 1):
    print(f'Под индексом {i * (-1)} находится элемент - {example[i * (-1)]}')

OUHKW <class 'str'>
Под индексом -1 находится элемент - W
Под индексом -2 находится элемент - K
Под индексом -3 находится элемент - H
Под индексом -4 находится элемент - U
Под индексом -5 находится элемент - O


Так же, мы можем запустить перебор непосредственно по элементам строки:

In [14]:
print(example, type(example))
for i in example:
    print(i)

OQTWV <class 'str'>
O
Q
T
W
V


В данном случае ```i``` выступает не в качестве индекса, а в качестве элемента строки.

# **2. Срезы**

Срезом называется подстрока, которая характиризуется индексом начала, индексом конца и шагом, с которым берутся элементы из начальной строки.
```S[START:END:STEP]```, где ```START``` - индекс, с которого начинается подстрока, ```END``` - индекс, которым кончается подстрока, причем он в подстроку не включен в нее, ф ```STEP``` - шаг чтения.

In [17]:
print(example, type(example))
s = example[1:4:1]
print(s)
s = example[1:4:2]
print(s)

ASYOW <class 'str'>
SYO
SO


При этом, каждый из параметров ```START```, ```END``` или ```STEP``` имеют дефолтное значение, которое используется, в случае, если параметр не указан.

```START_default``` - самое начало строки

```END_default``` - конец строки

```STEP_default``` - шаг величиной в 1


In [20]:
print(example, type(example))
s = example[::] # В данном случае ни один из параметров не указан, а значит берутся дефолтные значения для каждого из параметров
print(s, "- Срез - [::]")
s = example[1::2]
print(s, "- Срез - [1::2]")
s = example[-3:-1:]
print(s, "- Срез - [-3:-1:]")

ASYOW <class 'str'>
ASYOW - Срез - [::]
SO - Срез - [1::2]
YO - Срез - [-3:-1:]


В срезе так же можно использовать отрицательные индексы, главное не нарушать логику! Если параметр ```START``` указывает на элемент правее, чем ```END```, это вызовет ошибку, если шаг указан не отрицательным!

In [23]:
print(example, type(example))
s = example[-1:-3:]
print(s, "Тут ошибка!")
s = example[-1:-3:-1]
print(s, "А тут ошибки нет")
# В данном случае ошибки не возникает, так как шаг указан отрицательным,
# а значит, переменная START не увеличивается, а уменьшается и в итоге приходит к значению END

ASYOW <class 'str'>
 Тут ошибка!
WO А тут ошибки нет


# **3. Методы строк**

S.split()

S.upper()

S.lower()

S.capitalize()

S.find()

S.rfind()

S.replace()

S.strip()

S.lstrip()

S.rstrip()

S.count()


# Метод ```S.split(arg[, [max]])```
Метод split позволяет разделить строку по указанному в атрибуте символу/последовательности символов, при этом создается массив, состоящий из оставшихся строк. При этом, если мы указали атрибут arg, мы можем указать и значение для атрибута max, который отвечает за то, сколько разделений будет сделано.
Разберем на примере: 

In [11]:
from string import ascii_uppercase
from random import randint

# Здесь просто создается строка для примера, не обращайте на эти 2 строки внимания
example = ''.join([ascii_uppercase[randint(0, len(ascii_uppercase) - 1)] for i in range(10)])
example = ''.join([example[i:i + 2] + ' ' for i in range(0, len(example) - 1)]).strip()


print(f'{example} - Строка приведенная для примера, в ней слоги разделяются пробелами\nЕсли применить на такую строку метод .split(), то мы получим список, состоящий из слогов')
example_1 = example.split(" ") # В качестве аргумента метода split мы указали пробел, так как именно он является разделителем в нашем примере
print(f"\n{example_1} - Результат выполнения метода split с аргументом == ''\nПри этом, у атрибута arg есть и дефолтное значение, которое так же равно пробелу")
example_2 = example.split()
print(f"\n{example_2} - Результат без явного указания атрибута arg")
example_3 = example.split(' ', 2)
print(f"\n{example_3} - В данном случае мы так же указали значение и для атрибута max, чему равен атрибут max, столько разделений и производится, в данном случае их - 2")

BY YZ ZH HL LT TZ ZC CA AQ - Строка приведенная для примера, в ней слоги разделяются пробелами
Если применить на такую строку метод .split(), то мы получим список, состоящий из слогов

['BY', 'YZ', 'ZH', 'HL', 'LT', 'TZ', 'ZC', 'CA', 'AQ'] - Результат выполнения метода split с аргументом == ''
При этом, у атрибута arg есть и дефолтное значение, которое так же равно пробелу

['BY', 'YZ', 'ZH', 'HL', 'LT', 'TZ', 'ZC', 'CA', 'AQ'] - Результат без явного указания атрибута arg

['BY', 'YZ', 'ZH HL LT TZ ZC CA AQ'] - В данном случае мы так же указали значение и для атрибута max, чему равен атрибут max, столько разделений и производится, в данном случае их - 2


# Методы S.upper(), S.lower() и S.capitalize()
***Каждый из данных методов отвечает за регистр букв (строчные или заглавные буквы).***

Метод ```.upper()``` переводит все строчные буквы в строке в заглавный регистр, при этом не меняя те символы, которые уже находились в соответствующем регистре.

Метод ```.lower()``` позволяет сделать обратное действие, то есть он переводит все заглавные буквы в строке в строчный регистр.

Метод ```.capitalize()``` начинает строку с заглавной буквы.

**Примеры использования методов:**


In [1]:
s = 'hello world'
s = s.upper()
print(s)
s = s.lower()
print(s)
s = s.capitalize()
print(s)

HELLO WORLD
hello world
Hello world


# Метод S.find(sub[, start[, end]]) и S.rfind(sub[, start[, end]])

Метод ```.find()``` позволяет найти индекс ПЕРВОГО вхождения подстроки ***sub*** в строку ***S***. При этом, могут быть указаны параметры ```start``` и ```end```, которые отвечают за область поиска. 

Параметр ***start*** индекс начала поиска, а ***end*** - индекс конца области поиска.

Каждый из этих параметров является необязательным, их можно не указывать. Но тогда поиск будет происходить по всей строке.

In [2]:
s = 'Example'
print(s.find('xam')) # Получен результат - 1, так как первая слева подстрока 'xam' в s начинается с элемента под индексом 1
print(s.find('xam', 2, 6)) # Здесь поиск происходит с элемента под индексом 2 по элемент под индексом 6
# При этом результат вывода - -1, так как такой подстроки в промежутке [2, 6] нет

1
-1


Метод ```.rfind()``` позволяет найти индекс ПОСЛЕДНЕГО вхождения подстроки ***sub*** в строку ***S***. При этом, могут быть указаны параметры ```start``` и ```end```, которые отвечают за область поиска. 

Параметр ***start*** индекс начала поиска, а ***end*** - индекс конца области поиска.

Каждый из этих параметров является необязательным, их можно не указывать. Но тогда поиск будет происходить по всей строке.

In [3]:
s = 'ExampleExample'
#    0123456789...
print(s.rfind('xam')) # Получен результат 1, так как последняя подстрока 'xam' в s начинается с элемента под индексом 8
print(s.rfind('xam', 2, 5)) # Здесь поиск происходит с элемента под индексом 2 по элемент под индексом 6
# При этом результат вывода -1, так как такой подстроки в промежутке [2, 5] нет

8
-1


# Метод S.replace(old, new[, count])

Метод ```.replace()``` заменяет все вхождения подстроки ***old*** в строке ***S*** на значение равное подстроке ***new***.

Параметр ***old*** отвечает за то, какие подстроки мы заменяем.

Параметр ***new*** отвечает за то, на какие подстроки мы заменяем ***old***.

Параметр ***count*** отвечает за то, сколько замен должно быть произведено при счете слева-направо.

**Пример использования:**

In [7]:
s = 'ab ab ab'
s_1 = s.replace('ab', 'c') # Все подстроки ab мы заменяем на c
print(s_1)
s_2 = s.replace('ab', 'cd', 2) # Дваждый заменяем первые две подстроки ab на с
print(s_2)

c c c
cd cd ab


# Методы S.strip([chars]), S.lstrip([chars]) и S.rstrip([chars])

Метод ```.strip()``` убирает все пробелы из начала и конца строки, если не передан атрибут ***chars***. 

При этом, атрибут ***chars*** задает символ/последовательности символов, которые будут удалены из начала строки 

Параметр ***old*** отвечает за то, какие подстроки мы заменяем.

Параметр ***new*** отвечает за то, на какие подстроки мы заменяем ***old***.

Параметр ***count*** отвечает за то, сколько замен должно быть произведено при счете слева-направо.

**Пример использования:**