# Занятие 3:
## Строки и операции с ними.

Строковый тип в Python называется `str`. 
Строки это контейнеры подобные `list`, но имеющие свои особенности.
Python версии 3+ поддерживает юникод, поэтому в строках можно использовать все символы юникода (другие алфавиты, эмодзи и прочее).

Определение строк: строка-константа начинается и заканчивается одной или тремя одинарными `'` или двойными `"` кавычками.

In [None]:
# обычная строка состоящая из нескольких символов
# все эти определения эквивалентны:
s1 = 'qased😀fsfw'  
s1 = '''qased😀fsfw'''
s1 = "qased😀fsfw"
s1 = """qased😀fsfw""" 
# Разница между использованием кавычек следующая:
# в двойных кавычках можно использовать одинарные в качестве символа
s1 = "sdfdf 'ddfd"
# в трёх кавычках можно делать многострочные записи
s1 = '''asdf
ssdf
sd'''

In [None]:
# в строковых переменных можно использовать специальные символы
# наиболее часто встречающиеся: \t - табуляция, \n - переход на новую строку
# 
s2 = 'a\tb\tc\n\td\te\tf'
print(s2)

a	b	c
	d	e	f


### Операции со строками
#### Доступ по индексу, срезы — как у списков `list`
#### Проверки
- `startswith()`, `endswith()` - начинается / заканчивается ли строка заданным набором символов
- `find()`, `rfind()` поиск подстроки в строке слева / справа
- `isalnum()`, `isalpha()`, `isascii()`, `isdigit()`, `islower()`, `isprintable()`, `isspace()`, `isupper()` - проверяет, состоит ли вся строка из букв и цифр / только букв / ASCII-символов / цифр / строчных букв / печатных символов / пробелов / заглавных букв

#### Преобразования
- `join()` - объединяет переданные строки в одну с заданным разделителем
- `lower()`,  `upper()` - приводит все буквы к нижнему / верхнему регистру
- `replace()` - заменяет в строке все встреченные подстроки заданными значениями
- `split()` - разделяет строку по выбранному символу, представляет результат в виде списка
    - `splitlines()` - разделяет строку по символам '\n'



In [None]:
s3 = '01_image.png'
# startswith, endswith
print(s3, s3.startswith('01'), s3.endswith('.png'))  # возвращает True / False
#
s4 = 'On the Origin of Species'
ii = s4.find('the')  # возвращает индекс элемента с которого начинается искомая подстрока
print(ii, s4[ii:])  # печатаем срез начинающийся с этого индекса

01_image.png True True
3 the Origin of Species


In [None]:
# join
print(' and '.join(['A', 'B', 'C']))
# lower, upper
s4 = 'On the Origin of Species'
print(s4)
print(s4.lower())
print(s4.upper())

A and B and C
On the Origin of Species
on the origin of species
ON THE ORIGIN OF SPECIES


In [None]:
# replace
s4 = 'On the Origin of Species'
print(s4)
print(s4.replace('Species', 'Space!'))  # заменяет строку подстрокой

On the Origin of Species
On the Origin of Space!


In [None]:
# split
s4 = 'On the Origin of Species'
print(s4)
print(s4.split(' '))

On the Origin of Species
['On', 'the', 'Origin', 'of', 'Species']


### Формат-строки и их использование
Для того чтобы программно заполнять строковые переменные данными часто используются формат-строки. Формат-строки бывают двух типов: "старого" и "нового" стиля. Несмотря на название оба стиля активно используются.

#### Старый стиль, через оператор `%`:
```Python
s = '%d %s' % (5, 'Apples')
```
В старом стиле для каждого типа в формат-строке есть определенный спецификатор. 
- `%s`, `%d`, `%f` - подстановка строки, целого числа, числа с плавающей точкой соответственно.

#### Новый стиль через метод `format`
```Python
s = '{num} {what}'.format(num=5, what='Apples')
```
В новом стиле подстановки делаются по именам переменных, тип указывать не обязательно

В обоих стилях сначала задаётся формат-строка, описывающая сообщение, а потом операция форматирования подставляет в неё конкретные значения.

In [None]:
# задаём значения переменных
a = 'Hello'
b = 3
c = 2e-2
# задаём формат-строку в старом стиле
fs = '%s - %d - %f'
# подставляем, печатаем - старый стиль
print(fs % (a, b, c))
# задаём формат-строку в новом стиле
fs_n = '{v1} - {v2} - {v3}'
# подставляем, печатаем - новый стиль
print(fs_n.format(v1=a, v2=b, v3=c))

Hello - 3 - 0.020000
Hello - 3 - 0.02


В формат-строках можно задавать параметры представления тех или иных типов. В частности, для чисел можно указывать количество ведущих нулей (0001 вместо 1), знаков после запятой, представление в научном формате 

In [None]:
# между % и d вставлено 03, что означает "довести число до минимальной длины 3 надставив спереди нули"
print('%03d' % 1)  
print('%03d' % 100)  
print('%03d' % 10000)  

001
100
10000


In [None]:
# для чисел с плавающей точкой можно указать полную минимальную длину (07) и число знаков после запятой (.02)
print('%07.02f' % 100) # кстати, здесь мы передаём целое число в формат-строку ожидающую число с плавающей точкой и происходит автоматическое приведение типов

0100.00
