# N10 Последовательности

Автор: Шабанов Павел Александрович

Email: pa.shabanov@gmail.com

URL: [Заметки по программированию в науках о Земле](http://progeoru.blogspot.ru/)

Дата последнего обновления: 08.03.2017

### План

1. Последовательности
    + упорядоченность;
    + неизменяемость;

2. Индексация
    + обратная индексация;
    + срезы;
    
3. Методы последовательностей
    + Стандартные функции для работы с контейнерами.
   
### Цель: 

+ изучить базовые структуры хранения данных - последовательности - в python.

## Последовательности

Последовательности - одна из ключевых структур для хранения данных. В отличие от чисел и булевых переменных, последовательности позволяют хранить множество данных разного типа. 
**Последовательности** - это контейнеры для хранения других типов данных (любых), поддерживающие механизм итераций, т.е. перебора составных элеметов. Это могут быть и числа, и другие последовательности и классы и др.

В python представлены следующие последовательности:

0. **строка (str)** - 'strinrg 123';

1. **список (list)** - [1, -2, 0, -4, 56];

2. **кортеж (tuple)** - (24, 44, 85) ;

3. **множество (set)** - {1, 3, 5, 7};

4. **словарь (dict)** - {'A' : 1, 'B' : 11, 'C' : 111}

**Словари (dictionaries)** также именуются **отображениями** или **неупорядоченными коллекциями**.

Все последовательности имеют признаки, по которым они могут быть классифицированы.

### Упорядоченность

Последовательности могут быть разделены по характеру упорядоченности на:

+ **упорядоченные (список, кортеж, строка)**;

+ **неупорядоченные (множество, словарь)**.

В упорядоченных последовательностях расположение элементов имеет значение. Такие последовательности являются индексированными, т.е. каждому элементу последовательности присвоен свой порядковый номер. Индексация в python начинается от нуля, поэтому первый элемент будет иметь индекс 0, второй элемент - индекс 1 и т.д.

Зная индекс элемента, можно обратиться напрямую к соответствующему значению элемента последовательности.

Для неупорядоченных последовательностей порядок расположения элементов неважен. Отличительной особенностью таких последовательностей является свойство уникальности элемента (ключа для словаря и значения для множества).

### Неизменяемость

Другим важным признаком, по которому можно разделить последовательности в python, является изменяемость:

+ **изменяемые** (список, множество, словарь);

+ **неизменяемые** (кортеж, строка, неизменяемое множество (frozenset)).

В неизменяемых последовательностях (строки и кортежи прежде всего) нельзя изменять значения элементов, добавлять новые элементы и удалять старые. Они нужны для сохранности данных при передаче и обработке.

Изменяемые последовательности, наоборот, созданы для добавления/удаления данных и их преобразования.

In [15]:
# Изменяемые последовательности
a = [1, 2, 3, 4, 5]   # список
c = set(b)   # множество
e = {'boy':'XY', 'girl':'XX'}

# Неизменяемые последовательности (порядок хранения элементов неважен)
s = 'dice'   # строка
b = (1, 1, -1, -1, 0)   # кортеж 
d = frozenset(d)   # особый вид множеств - неизменяемое множество 

NameError: name 'b' is not defined

In [None]:
# Упорядоченные последовательности
s = 'dice'   # строка
a = [1, 2, 3, 4, 5]   # список
b = (1, 1, -1, -1, 0)   # кортеж 

# Неупорядоченные последовательности (порядок хранения элементов неважен)
c = set(b)   # множество
d = frozenset(b)   # особый вид множеств - неизменяемое множество 
e = {'fire_station':'101', 'police':'102', 'medicine':103}   # словарь

print type(a), a, len(a)
print type(b), b, len(b)
print type(c), c, len(c)
print type(d), d, len(d)
print type(e), e, len(e)

## Индексация

Свойство упорядоченности позволяет обращаться к элементам последовательности через их порядоковый номер - индекс. 

**Индекс** - это целое число, которое посредством квадратных скобок вызывает значение элемента последовательности. Так для списка A обращение по индексу выглядит так: **A[i]**. При этом будет возвращён тот объект, который расположен на соответствующем месте последовательности (это может быть как число или булева переменная, так и другой список). Таким образом упорядоченны

### Обратная индексация

Python поддерживает индексацию последовательностей в обратную сторону, т.е. от последнего элемента к первому. Последний элемент в последовательности с индексом N вызывается по индексу **-1**. Предпоследний с индексом N-1 - по индексу -2 и т.д.

При этом индекс элемента(например, вызываемый методом **index()** у списков и кортежей) остаётся положительным целым числом. Но обратная индексация позволяет обратиться к конечным элементам в более удобной форме, без предварительного вычисления длины последовательности.

### Срезы

Для стандартных типов данных, поддерживающих индексацию (списки, кортежи, строки), можно осуществлять процедуру взятия **среза (slice)**.

Срез (slice) - это часть последовательности, заключенная между двумя индексами. Срез также как и обращение по индексу берётся с помощью квадратных скобок и имеет следующий вид:

> slice[старт : конец : шаг]

Срез начинается элементом с индексом "старт", заканчивается элементом с индексом ("конец"-1), т.е. не включая правую границу. По умолчанию старт равен 0, конец - длине последовательности, а шаг единице.

Срез можно брать и с помощью отрицательного шага: **sequence[::-1]**

Если тип данных позволяет изменять элементы последовательности, то через срез можно присвоить новые значения соответствующим срезу элементам последовательности.

![Схема среза и индексации в python](files/pics/L10/rabota-so-strokami.jpg)

In [None]:
import random

N = 24
y = range(N)
s = 'abcdef'
tup = (-4, -66, -3, True, 9.6, 0.002)
random.shuffle(y)

print y

# Срезы
islice = s[1:4]
islice2 = y[10:14]
islice3 = tup[0:4]

print 'Slices:'
print islice
print islice2
print islice3

# Перевёртыши

print 'Reversed:'
print s[::-1]
print islice[::-1]
print tup[::-1]

## Методы последовательностей

Для последовательностей в широком смысле слова доступен ряд методов, т.е. классовых функций, для работы с ними. Ниже представлена практически полная сводная таблица доступных методов для *cписков, кортежей, множеств и словарей*. 

Так как *строки* имеют большое число специфических методов, а также являются неизменяемыми последовательностями, то они в таблице не представлены. 

| Методы  | Список  | Кортеж | Множество | Словарь |
| --------|:-------:|:------:|:---------:|:-------:|
| append()| +       |        |           |         |
| extend()| +       |        |           |         |
| insert()| +       |        |           |         |
| clear() |         |        | +         | +       |
| pop()   | +       |        | +         | +       |
| remove()| +       |        | +         |         |
| count() | +       | +      |           |         |
| index() | +       | +      |           |         | 
| reverse | +       |        |           |         | 
| sort()  | +       |        |           |         | 
| update()|         |        | +         | +       |
| copy()  |         |        | +         | +       |

In [None]:
import random 

N = 12
con = range(N)
random.shuffle(con)

print 'Origin:', con

for i, val in enumerate(con):
    if val%2 == 0:
        con.pop(i)

print 'After reduction:', con

con.insert(5, -9)
print 'After insertion:', con

abc = range(-10, -1, 2)
con.extend(abc)
print 'After extend:', con

con.append(55)
print 'After append:', con

con.remove(0)
print 'After 0 remove:', con

### Стандартные функции для работы с контейнерами

Для базовых операций со структурами, хранящими другие данные (контейнерами) в Python существует набор встроенных функций:

+ **len(con)** - возвращает количество элементов (верхнего уровня для вложенных структур); 

+ **min(con), max(con), sum(con)** - возвращает минимальное, максимальное значения и сумму значений;

+ **sorted(con)** - возвращает отсортированную копию контейнера con;

+ **enumerate(con)** - итератор по парам "индекс элемента - значение элемента".

> N.B. Обратите внимание, что для словарей и множеств как особых коллекций операции работают с ключами!

In [None]:
s = 'Monthy Python'
lst = range(5)
tup = tuple(lst)
tes = set([20, 40, 60, 80])
dic = {'one' : 1, 'two' : 2, 'three' : 3}

cons = [s, lst, tup, tes, dic]

for i, con in enumerate(cons):
    print '*'*20
    print i
    print '1', len(con)
    try:
        print '2', min(con), max(con), sum(con)
    except:
        print '2.1', min(con), max(con)
    finally:
        print '2.2'
        
    print '2.3', sorted(con)