# Срезы

<div class="alert alert-info alertinfo">

<b><span style="color: black; font-style: italic">Если вы нашли опечатку или другую проблему в этом материале, пожалуйста, расскажите нам об этом на <a href="https://edu.hse.ru/mod/forum/discuss.php?d=22869" style="color: blue; font-style: italic">форуме курса</a>. Спасибо, что помогаете нам стать лучше!</span></b>

</div>

Иногда нам нужно работать с частями строк. Например, часто нужно работать с началом или концом строки.

Проверим, входит ли сайт в зону российского интернета. Для этого нам достаточно посмотреть, заканчивается ли его домен на *.ru*. (Подробнее о доменах можно прочитать в [базе знаний](https://cctld.ru/domains/about/) Координационного центра доменов .ru и .рф)

Чтобы проверить, как заканчивается строка, мы можем воспользоваться методом строк ``.endswith()``:

In [None]:
domain = 'hse.ru'
print(url.endswith('.ru'))

True


Мы можем написать программу, которая по введённому адресу сайта будет говорить, относится ли он к русскоязычному сегменту Сети:

In [None]:
domain = input('Укажите домен сайта (вида hse.ru): ')
if domain.endswith('.ru'):
    print(f'Сайт {domain} относится к русскоязычному сегменту Сети.')
else:
    print(f'Сайт {domain} не относится к русскоязычному сегменту Сети.')

Укажите адрес сайта (вида hse.ru): yandex.ru
Сайт yandex.ru относится к русскоязычному сегменту Сети.


Однако, к русскоязычному сегменту относится не только зона *.ru*, но и зоны *.рф* и *.дети*.

Чтобы проверить сразу несколько условий:
* оканчивается ли адрес сайта на .ru?
* оканчивается ли адрес сайта на .рф?
* оканчивается ли адрес сайта на .дети?

мы можем создать из этих трёх окончаний кортеж и передать его в метод `.endwith()`:

In [None]:
domain = input('Укажите адрес сайта (вида hse.ru): ')
russian_zones = ('.ru', '.рф', '.дети')

if domain.endswith(russian_zones):  # Если адрес заканчивается хотя бы одной из зон
    print(f'Сайт {domain} относится к русскоязычному сегменту Сети.')
else:
    print(f'Сайт {domain} не относится к русскоязычному сегменту Сети.')

Укажите адрес сайта (вида hse.ru): кремль.рф
Сайт кремль.рф относится к русскоязычному сегменту Сети.


Аналогично мы можем проверить, с чего начинается строка, с помощью метода строк `.startswith()` 

Например, адреса страниц защищённых сайтов, вроде банков или портала Госуслуг, начинаются с *https://*, а незащищённых — с *http://*. (Подробнее о защищённых страницах и слове HTTPS можно прочитать в [блоге Яндекса](https://yandex.ru/blog/company/77455))

In [None]:
print('https://www.hse.ru'.startswith('https://'))

True


Напишем программу, которая по введённому адресу страницы укажет, защищена ли эта страница:

In [None]:
url = input('Укажите адрес страницы: ')
if url.startswith('https://'):
    print(f'Страница {url} защищена с помощью HTTPS.')
else:
    print(f'Страница {url} не защищена с помощью HTTPS.')

Укажите адрес страницы: https://www.gosuslugi.ru/
Страница https://www.gosuslugi.ru/ защищена с помощью HTTPS.


Иногда нам нужно оборатиться к последовательности букв не в начале или конце строки, а внутри. Такая возможность называется **срезом строки**. Срезы похожи на обращение к символу строки по его индексу, только теперь будет не один индекс в квадратных скобках, а два — индекс символа, с которого нужно начать срез, и перед символом с каким индексом будет нужно остановиться.

In [None]:
# Напечатай символы, начиная с первого символа в строке "Hello", и остановись перед третьим
print('Hello'[0:2]) 

# Напечатай символы, начиная со второй буквы в слове "Hello", и остановись перед четвёртым
print('Hello'[1:3]) 

He
el


Если мы хотим сделать срез "от начала строки" или "до конца строки", мы можем не писать соответствующие индексы:

In [None]:
# Напечатай символы, начиная с начала слова "Hello" и остановись перед четвёртой буквой
print('Hello'[:3]) 

# Напечатай символы, начиная с четвёртого символа слова "Hello"
print('Hello'[3:]) 

# Наконец, мы можем вообще не указать границы среза — тогда компьютер попробует угадать сам,
# что нам нужно вывести; например, сейчас он выведет всю строку от начала и до конца
print('Hello'[:])  

Hel
lo
Hello


Срезы есть не только у строк. Например, мы можем вывести второй и третий элементы списка (кортежа):

In [None]:
shopping_list = ['молоко', 'хлеб', 'колбаса']

# Выведи элементы списка, со второго и до конца списка
print(shopping_list[1:])  

students = ('Аня', 'Дима', 'Миша', 'Алёна')

# Выведи имена студентов, начав со второго и остановившись перед четвёртым
print(students[1:3])    

['хлеб', 'колбаса']
('Дима', 'Миша')


## Пример
Давайте попробуем на примере достать разную интересную информацию из разных мест строки. Например, большое количество информации вложено в [номер банковской карты](https://en.wikipedia.org/wiki/Payment_card_number#Issuer_identification_number_(IIN)).

Попробуем разобрать номер банковской карты и извлечь из него всю возможную информацию: выпустившую платёжную систему, номер карты внутри банка и контрольную цифру.

**Пожалуйста, не вводите в этом блокноте никаких настоящих номеров карт в примеры!**

Попробуем определить платёжную систему, выпустившую карту:
Например, карты МИР начинаются с 2200, 2201, 2202, 2203 или 2204

In [None]:
card_number = input('Введите номер проверяемой карты (без пробелов): ')

if not card_number.isdigit():                   # Проверим, что нам ввели только цифры карты
    print('Пожалуйста, введите только цифры!')
if card_number.startswith('2200'):              # Проверим, что строка начинается с нужного нам текста
    print(f'Карта {card_number} выпущена российской системой МИР')

Введите номер проверяемой карты (без пробелов): 2200123456789090
Эта карта выпущена российской системой МИР


In [None]:
# Мы можем проверить, что строка начинается с одной из нужных нам строк, составив из этих строк кортеж
if card_number.startswith(('2200','2201', '2202', '2203', '2204')):         
    print(f'Карта {card_number} выпущена российской системой МИР')  
                                                                    
# Eсли появилась ошибка NameError — выполните предыдущую ячейку перед выполнением этой

Введите номер проверяемой карты (без пробелов): 2203123456789090
Эта карта выпущена российской системой МИР


Карты VISA начинаются с 4, и мы можем проверить, выпущена ли карта системой VISA, просто посмотрев на начальный символ строки. Не так важно, как именно мы проверим первый символ — можно просто к нему обратиться по индексу, можно проверить через `card_number.startswith('4')`:

In [None]:
# В этом примере мы заново запрашиваем номер карты и перезаписываем переменную card_number
card_number = input('Введите номер проверяемой карты (без пробелов): ') 

if card_number[0] == '4':                                               
    print(f'Карта {card_number} выпущена международной системой Visa')                  

Введите номер проверяемой карты (без пробелов): 4200123456789090
Карта 4200123456789090 выпущена международной системой Visa


Карты MasterCard проверить сложней: они начинаются либо с цифр 51, 52, ... 55, либо с цифр 2221, 2222, ... 2720. Воспользуемся уже знакомыми нам срезами.

Попробуем определить карту, выпущенную платёжной системой MasterCard:


*   Сделаем срез из первых двух символов номера карты и превратим эти два символа в число, запомнив его как ``first_two``
* Сделаем срез из первых четырёх символов номера карты и превратим эти четыре символа в число, запомнив его как ``first_four``
*   Если ``first_two`` больше (или равно) 51 и меньше (или равно) 55:
 - Напишем, что это MasterCard
* Иначе попробуем с проверить, что ``first_four`` больше 2220 и меньше 2721:
 - Если ``first_four`` попал в диапазон, то напишем, что это MasterCard
* Иначе напишем, что карта выпущена другой системой



In [None]:
card_number = input('Введите номер проверяемой карты (без пробелов): ')
first_two = card_number[:2]         # Сделаем новую строку, скопировав первые два символа из номера карты
first_two = int(first_two)          # Обновим переменную firt_two, превратив её из строки в целое число

first_four = int(card_number[:4])   # Получим строку из первых четырёх цифр строки, 
                                    # сразу после выполнения среза превратив её в целое число

if first_two >= 51 and first_two <= 55:
    print(f'Карта {card_number} выпущена международной системой MasterCard')
elif first_four > 2220 and first_four < 2721:
    print(f'Карта {card_number} выпущена международной системой MasterCard')
else:
    print(f'Карта {card_number} выпущена другой системой')

Введите номер проверяемой карты (без пробелов): 2229123456789090
Карта 2229123456789090 выпущена международной системой MasterCard


Хоть срезы и называются *срезами*, они не изменяют исходную строку, ничего из неё не вырезают и не отрезают: в последней строке наша программа выводит тот же номер карты, который и был введён человеком.

В указанных системах количество цифр в номере карты всегда равно 16. Чтобы узнать количество символов в строке, мы можем воспользоваться уже знакомой нам по спискам и кортежам функцией `len()`:

In [None]:
count = len(card_number)
print(f'Во введённом номере карты {card_number} ровно {count} символов')

Во введённом номере карты 2229123456789090 ровно 16 символов


Слово ``count`` не было воспринято как метод строки, так как было написано без скобок и не было прикреплено ни к какой строке. Сейчас это просто переменная. Впрочем, без неё можно обойтись, сразу подставив функцию `len()` внутрь команды `print()`:

In [None]:
# В этих примерах используется переменная card_number из вышестоящих ячеек
print(f'Во введённом номере карты {card_number} ровно {len(card_number)} символов') 
        
# Если программа выдала ошибку NameError — запустите верхние ячейки, и только потом — ещё раз эти две

Во введённом номере карты 2229123456789090 ровно 16 символов


Первые 6 цифр банковской карты указывают на выдавший карту банк и систему, с помощью которой работает карта. Следующие 9 цифр — номер карты внутри банка. Давайте его узнаем.
Нам снова помогут срезы. Так как компьютер нумерует символы в текстах с 0, то нам нужно взять символы, начиная с 6 закончив на 15

In [None]:
print(f'Номер карты {card_number} внутри банка: {card_number[6:15]}')

Номер карты 2229123456789090 внутри банка: 345678909


Последняя цифра номера карты нужна для того, чтобы банк [защитил вас от опечаток](https://ru.wikipedia.org/wiki/Алгоритм_Луна). Давайте выведем последнюю цифру с конца номера карты

In [None]:
print(f'Контрольная цифра, защищающая нас от опечаток (спасибо ей за это): {card_number[-1]}')

Контрольная цифра, защищающая нас от опечаток (спасибо ей за это): 0


Программа целиком:

In [None]:
card_number = input('Введите номер проверяемой карты (без пробелов): ')

# Сделаем новую строку, скопировав первые два символа из номера карты
first_two = card_number[:2]       

# Обновим переменную firt_two, превратив её из строки в целое число
first_two = int(first_two)        

# Получим строку из первых четырёх цифр строки, сразу после выполнения среза превратив её в целое число
first_four = int(card_number[:4]) 
                                  
# Функция len() позволяет узнать, сколько символов в строке
print(f'Во введённом номере карты {card_number} ровно {len(card_number)} символов') 

# Мы можем проверить, что строка начинается с одного из нужных нам текстов, составив из этих текстов кортеж
if card_number.startswith(('2200','2201', '2202', '2203', '2204')):  
    print(f'Карта {card_number} выпущена российской системой МИР')

elif card_number[0] == '4':                                          
    print(f'Карта {card_number} выпущена международной системой Visa')

elif first_two >= 51 and first_two <= 55 or first_four > 2220 and first_four < 2721:
    print(f'Карта {card_number} выпущена международной системой MasterCard')

else:
    print(f'Карта {card_number} выпущена другой системой')

# Мы можем подставлять срезы внутрь выводимых строк
print(f'Номер карты {card_number} внутри банка: {card_number[6:15]}') 

# Мы можем подставять обращение к символу по его индексу — даже если это индекс 
# с конца строки — внутрь выводимых строк
print(f'Контрольная цифра, защищающая нас от опечаток (спасибо ей за это): {card_number[-1]}') 

Введите номер проверяемой карты (без пробелов): 5200123456789090
Во введённом номере карты 5200123456789090 ровно 16 символов
Карта 5200123456789090 выпущена международной системой MasterCard
Номер карты 5200123456789090 внутри банка: 345678909
Контрольная цифра, защищающая нас от опечаток (спасибо ей за это): 0


## Повторим изученные методы и работу со срезами
* `.startswith()` проверяет, начинается ли строка с нужной нам последовательностью символов (или одной из нужных нам последовательностей символов);
* `.endswith()`, аналогично, проверяет, кончается ли строка нужной нам последовательностью символов (или одной из нужных нам последовательностей символов);
* срезы позволяют обратиться сразу к нескольким символам внутри строки:
    1. `'Hello'[2:4]` позволяет обратиться к символам слова Hello с индексами 2 и 3: `ll`;
    2. `'Hello'[:3]` позволяет обратиться ко всем символам от символа с индексом 0 до символа с индексом 2: `Hel`;
    3. `'Hello'[2:]` позволяет обратиться ко всем символам от символа с индексом 2 до конца строки: `llo`;
    4. `'Hello'[:]` позволяет обратиться ко всем символам строки: `Hello`;
    5. `'Hello'[-4:-1]` позволяет обратиться к символам с 4 до 1 (при нумерации с конца строки): `ell`

In [None]:
print(f'Оканчивается ли "hse.ru" на ".ru"? {"hse.ru".endswith("ru")}')
print(f'Оканчивается ли "hse.ru" на ".ru" или ".рф"? {"hse.ru".endswith(("ru", ".рф"))}')
print(f'Начинается  ли строка "https://cbr.ru" с "https"? {"https://cbr.ru".startswith("https")}')

print(f'Срез строки "Hello"[2:4]: {"Hello"[2:4]}')
print(f'Срез строки "Hello"[:3]: {"Hello"[:3]}')
print(f'Срез строки "Hello"[2:]: {"Hello"[2:]}')
print(f'Срез строки "Hello"[:]: {"Hello"[:]}')
print(f'Срез строки "Hello"[-4:-1]: {"Hello"[-4:-1]}')

Оканчивается ли "hse.ru" на ".ru"? True
Оканчивается ли "hse.ru" на ".ru" или ".рф"? True
Начинается  ли строка "https://cbr.ru" с "https"? True
Срез строки "Hello"[2:4]: ll
Срез строки "Hello"[:3]: Hel
Срез строки "Hello"[2:]: llo
Срез строки "Hello"[:]: Hello
Срез строки "Hello"[-4:-1]: ell
