# Часть II. Типы и операции. 

## Индексы и их перемещение 

> S[—1] # Последний элемент с конца в S ’т'
> S [—2] # Второй элемент с конца в S ’а’

Формально отрицательный индекс добавляется к длине строки, так что следующие две операции эквивалентны (хотя первую проще записывать и менее легко допустить ошибку):

> S[-1] # Последний элемент в S 'т'
> S[len(S) - l] # Отрицательная индексация, сложный путь ’т’

## Срезы

> S[1:]
‘pam’
> S
’Spam’
> S[0:3]
’Spa’
> S[:3]
‘Spa’
> S[:-1]
‘Spa’
> S[:]
’Spam’

По умолчанию левая граница среза принимается равной нулю, а правая - длине нарезаемой последовательности. 

## Конкатенация

Конкатенация - объединение двух строк в новую строку. 

> S
‘Spam’
> S + ‘xyz’ # Конкатенация
‘Spamxyz’
> S # S не изменяется
’Spam’
> S * 8 # Повторение
‘SpamSpamSpamSpamSpamSpamSpamSpam’

## Неизменяемость 

> S
‘Spam’
> S[0] = ‘z’ # Неизменяемые объекты модифицировать нельзя ...текст сообщения об ошибке не показан...
TypeError: ’str’ object does not support item assignment
Ошибка типа: объект str не поддерживает присваивание в отношении элементов
> S = ‘z’ + S[1:]
> S
‘zpam’

## Bytearray

Строго говоря, текстовые данные можно изменять на месте, если развернуть их в спи­сок индивидуальных символов и объединить вместе с пустым разделителем или приме­нить более новый тип bytearray, доступный в Python 2.6, 3.0 и последующих версиях:

> S = ‘shrubbery’ 
> L = list(S) # Развернуть в список […]
> L 
[’s’, ‘h’, ‘r’, ‘u’, ‘b’, ‘b’, ‘e’, ‘r’, ‘y’]
> L[1] = ‘c’ # Изменить на месте
> ‘’.join(L) # Объединить с пустым разделителем
‘scrubbery’

> B = bytearray(b’spam’) # Гибрид байтов/списка
> B.extend(b’eggs’) # b необходимо в Python 3.X, но не в Python 2.X
> B # B[i] = ord(x) тоже здесь работает
bytearray(b’spameggs’)
> B.decode() # Преобразовать в обычную строку 
‘spameggs’

## Методы, специфичные для типа

## Методы find и replace

> S = ’Spam’
> S.find(‘pa’) # Найти смещение подстроки в S
1
> S
‘Spam’
> S.replace(‘pa’, ‘XYZ’) # Заменить вхождения подстроки в S другой подстрокой 
’SXYZm’
> S
‘Spam’

## split, upper, isalpha, rstrip

> line = ‘aaa,bbb,ccccc,dd’
> line.split(‘,’) # Разбить по разделителю в список подстрок
[‘aaa’, ‘bbb’, ‘ccccc’, ‘dd’]
> S = ‘spam’
> S.upper() # Преобразовать в верхний и нижний регистры
‘SPAM’
> S.isalpha() # Проверить содержимое: isalpha, isdigit, etc.
True
> line = ‘aaa,bbb,ccccc,dd\n’
> line.rstrip() # Удалить пробельные символы с правой стороны
‘aaa,bbb,ccccc,dd’
> line.rstrip().split(‘,’) # Скомбинировать две операции
[‘aaa’, ‘bbb’, ‘ccccc’, ‘dd’]

## Форматирование

> ‘%s, eggs, and %s’ % (‘spam’, ‘SPAM!’) # Выражение форматирования
‘spam, eggs, and SPAM!’

> ‘{0}, eggs, and {1}’.format(‘spam’, ‘SPAM!’) # Метод форматирования
’spam, eggs, and SPAM!

> ‘{}, eggs, and {}’.format(‘spam’, ‘SPAM!’)
‘spam, eggs, and SPAM!’

## Генерация числовых отсчетов: 

> ‘{:,.2f}.format(296999.2567) # Разделители, десятичные цифры
‘296,999.26’
> ‘%2f | %+05d’ % (3,14159, -42) # Цифры, дополнение, знаки
3.14 | -0042’


## Справка 

dir - вызывает список переменных, присвоенных в области видимости вызывающего объекта. Показывает список доступных атрибутов для выбранного объекта. 

> dir(S)

help помогает понять, что делает тот или иной метод. 

> help(S.replace)

## Другие способы написания строк

> S = ‘A\nB\tC’ # \n - конец строки, \t - табуляция
> len(S) # Как \n, так и \t является только одним символом 
5
> ord(‘\n’) # \n - один символ, кодируемый как десятичное значение 10
10
> S = ‘A\0B\0C’ # \0, байт с двоичными нулями, не завершает строку
> len(S)
5
> S # Непечатаемые символы отображаются как шестнадцетиричиные управляющие последовательности \xNN
‘A\x00B\x00C’

## Сопоставление с образцом

### Модуль re
Имеет похожие вызовы для поиска, разбиения и замены

> import re
> match = re.match(‘Hello[ \t]*(.*)world’, ‘Hello Python world’) 
> match.group(1)
‘Python ‘

> match = re.match(‘[/:](.*)[/:](.*)[/:](.*)’, ‘/usr/home:lumberjack’)
> match.groups()
(‘usr’, ‘home’, ‘lumberjack’)
> re.split(‘[/:]’, ‘/usr/home/lumberjack’)
[‘’, ‘usr’, ‘home’, ‘lumberjack’]

## Операции над последовательностями

> L = [123, ‘spam’, 1.23] # Список из трех объектов разных типов
> len(L) # Количество элементов в списке 
3
> L[0] # Индексация по позиции
123
> L[:-1] # Нарезание списка возвращает новый список
[123, ‘spam’]
> L + [4, 5, 6] # Конкатенация и повторение также создают новые списки
[123, ‘spam’, 1.23, 4, 5, 6]
> L * 2
[123, ‘spam’, 1.23, 123, ‘spam’, 1.23]
> L # Исходный список не изменился
[123, ‘spam’, 1.23]

## Операции, специфичные для типа 

> L.append(‘NI’) # Увеличение: добавление объекта в конец списка 
> L
[123, ‘spam’, 1.23, ‘NI’]
> L.pop(2) # Уменьшение: удаление элемента из середины
1.23
> L # del L[2] также выполняет удаление из списка
[123, ‘spam’, ‘NI’]

## Вложение
*Матрица 3 х 3 чисел*

> M = [[1, 2, 3],
>>>>   [4, 5, 6],
>>>>   [7, 8, 9]]

> M
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

> M[1] # Получить строку 2
[4, 5, 6]
> M[1][2] # Получить строку 2, затем элемент 3 внутри этой строки
6

## Списковые включения

- Выражение спискового включения - list comprehension

> col2 = [row[1] for row in M] # Собрать элементы в столбце 2
> col2
[2, 5, 8]
> M
[[1, 2, 3], [4, 5, 6], [7, 8, 9]] # Матрица не изменилась

“Предоставить row[1] из каждой строки матрицы М в новом списке”. Результатом будет новый список, содержащий столбец 2 матрицы. 

> [row[1] + 1 for row in M] # Добавить 1 каждому элементу в столбце 2
[3, 6, 9]
> [row[1] for row in M if row[1] % 2 == 0] # Отфильтровать нечетные элементы [2, 8]

Списковые включения применяются для прохода по жестко закодированному списку координат по строке: 

> diag = [M[i][i] for i in [0, 1, 2]] # Собрать диагональ из матрицы 
> diag
[1, 5, 9]
> doubles = [c * 2 for c in ‘spam’] # Повторить символы в строке 
> doubles
[‘ss’, ‘pp’, ‘aa’, ‘mm’] 