# Последовательности

Основное, что характерно последовательностям в Python: элементы последовательности пронумерованы (имеют индекс). Например, список является последовательностью, а множество -- нет (нельзя обратиться к элементам по индексу).

In [2]:
a = [4, 2, 5, 6] # список, является последовательностью
b = {4, 2, 5, 6} # множество, не является последовательностью
print(a, b)

[4, 2, 5, 6] {2, 4, 5, 6}


In [None]:
print(a[0]) # обращение к элементам по индексу допустимо

In [None]:
# отрицательные индексы нужны, чтобы взять какой-то элемент с конца
print(a[-1]) # вывести первый элемент с конца
print(a[-2]) # вывести второй элемент с конца

In [5]:
# в случае с множествами получим ошибку
b[0]

TypeError: 'set' object is not subscriptable

#### Встроенные последовательности:
* изменяемые (lists, bytearrays)
* неизменяемые (strings, tuples, range, bytes)
#### Дополнительные стандартные последовательности:
* namedtuple, deque (модуль collections)
* array (модуль array)
#### Последовательности:
* Гомогенные (все элементы последовательности принадлежат одному типу)
* Гетерогенные (найдётся хотя бы одна пара элементов с различными типами)
С гомогенным относятся строки (каждый элемент является символом). К гетерогенным относятся списки и кортежи.


### Итерирование по последовательностям
Последовательности поддерживают возможность проитерироваться (выполнить перебор) по элементам последовательности:

In [6]:
a = [5, 3, 7, 6]
for el in a:
    print(el, end=" ")

5 3 7 6 

Хотя возможность "проитерироваться" принадлежит не только последовательностям, а, например, множествам:

In [7]:
x = {4, 6, 2, 1}
for el in x:
    print(el, end=" ")
# с другой стороны, нельзя обратиться к элементу по индексу

1 2 4 6 

### Проверка на вхождение (`in`, `not in`):

Используя операцию `in` и `not in` можно узнать, входит или не входит некоторый элемент в заданную последовательность:

In [8]:
a = [5, 3, 6]
x = int(input())
if x in a:
    print(f"Элемент {x} находится в последовательности {a}")
else:
    print(f"Элемент {x} не находится в последовательности {a}")

Элемент 5 находится в последовательности [5, 3, 6]


In [9]:
a = [5, 3, 6]
x = int(input())
if x not in a:
    print(f"Элемент {x} не находится в последовательности {a}")
else:
    print(f"Элемент {x} находится в последовательности {a}")

Элемент 5 находится в последовательности [5, 3, 6]


### Конкатенация и повторение последовательностей

Последовательности могут быть повторены необходимое количество раз:

In [10]:
a = [1, 2, 3]
b = a * 3
print(b)

[1, 2, 3, 1, 2, 3, 1, 2, 3]


In [63]:
a = [1, 2, 3]
b = a * 3
print(b)

[1, 2, 3, 1, 2, 3, 1, 2, 3]


Последовательности можно конкатенировать (склеивать), если они принадлежат одному типу:

In [11]:
a = [1, 2, 3]
b = [4, 5]
c = a + b
print(c)

[1, 2, 3, 4, 5]


In [12]:
# в данном случае будет получена ошибка
a = [1, 2, 3]
b = (4, 5)
c = a + b

TypeError: can only concatenate list (not "tuple") to list

### Поиск минимума и максимума в последовательности

Если элементы можно упорядочить, тогда доступны функции `min` и `max`:

In [13]:
a = [5, 3, 7]
print(min(a), max(a))

3 7


In [14]:
# ошибка, не поддерживается сравнение между строками и целым
a = [5, '3']
print(min(a))

TypeError: '<' not supported between instances of 'str' and 'int'

In [15]:
# но это не означает, что все переменные коллекции должны иметь один тип;
# важно чтобы поддерживалось сравнение между элементами последовательности
from fractions import Fraction
from decimal import Decimal

a = [1, Decimal("1.54"), -4.45, Fraction(-19/4)]
print(min(a), max(a))

-19/4 1.54


### Метод `.index`

Метод `seq.index(x)` возвращает позицию первого вхождения `x` в некоторой последовательности `seq`:

In [16]:
a = [5, 3, 6, 7, 1, 2, 7]
a.index(7) # возвращает позицию первой семёрки: помните, что нумерация ведётся с нуля

3

Можно указать второй индекс, который будет обозначать, с какой позиции требуется выполнить поиск:

In [17]:
print(a.index(7, 4)) # поиск значения 7 в списке a с 4 позиции
print(a.index(7, 2)) # поиск значения 7 в списке a с 3 позиции

6
3


Третий параметр функции отвечает за конечную позицию, до которой будет производиться поиск (не включая её):

In [18]:
s = "Hello"
print(s.index('l', 0, 3)) # поиск символа 'l' в строке s с 0 позиции по 2 включительно
print(s.index('l', 3, 5)) # поиск символа 'l' в строке s с 3 позиции по 4 включительно

2
3


In [19]:
# Можно искать не только одиночный символ, но и подстроку:
s.index('ll') # выполняется поиск двух 'll' в строке s

2

In [20]:
# Если элемент не будет найден, на экран будет отображена ошибка:
s.index('o', 0, 3)

ValueError: substring not found

### Изменяемые и неизменяемые последовательности

Элементы изменяемых последовательностей можно изменить, например, выполняя присваивание. Над неизменяемыми последовательностями такое действие невозможно:

In [21]:
a = [0, 1, 2]
b = (0, 1, 2)
print(a, b)

[0, 1, 2] (0, 1, 2)


In [22]:
a[0] = 100
print(a)

[100, 1, 2]


In [23]:
b[0] = 100

TypeError: 'tuple' object does not support item assignment

In [24]:
s = "Hello, world!"
s[1] = "!"

TypeError: 'str' object does not support item assignment

### Enumerate

К элементам последовательности можно применить `enumerate`. Он возвращает пары, где первый элемент пары -- значение индекса, второй элемент пары -- взятое значение из последовательности:

In [25]:
a = [5, 3, 7, 5]
print(enumerate(a)) # -> ((0, 5), (1, 3), (2, 7), (3, 5))

<enumerate object at 0x000001506E7D2B40>


In [26]:
# чтобы визуально увидеть элементы этой последовательности придется выполнить приведение типов данных к списку или кортежу
print(tuple(enumerate(a)))

((0, 5), (1, 3), (2, 7), (3, 5))


### Срезы

Для все последовательностей можно брать срезы. Срез -- копия элементов последовательности, полученная по определенным правилам. Легче рассмотреть на примерах:ф

In [27]:
a = [0, 1, 2, 3, 4, 5]
print(a[:])            # срез без указания каких-либо индексов, вернёт полную копию списка a
print(id(a), id(a[:])) # запросив id объекта понимаем, это разные объекты

[0, 1, 2, 3, 4, 5]
1444962075008 1444961889408


In [28]:
# Посмотрим на это с точки зрения разделяемых ссылок
a = [1, 2, 3]
b = a
b.append(4)
print(a, b) # так как a и b указывают на один и тот же объект в памяти, получаем такой результат

[1, 2, 3, 4] [1, 2, 3, 4]


In [40]:
a = [1, 2, 3, 4, 5, 6]
b = a[:]
b.append(7)
print(a, b) # теперь a и b указывают на различные объекты

[1, 2, 3, 4, 5, 6] [1, 2, 3, 4, 5, 6, 7]


In [52]:
a = [0, 1, 2, 3, 4, 5, 6]
print(a[2:]) # первый индекс означает, с какого элемента требуется выполнить срез

[2, 3, 4, 5, 6]


In [53]:
print(a[-2:]) # отрицательный индекс несет смысл "с конца"
              # начать со второго элемента с конца и до конца последовательности

[5, 6]


In [54]:
# Если индекс окажется больше, чем длина последовательности, ошибка не произойдёт
print(a[1000:])

[]


In [55]:
print(a[:2]) # второй индекс означает, до какого элемента требуется выполнить срез (не считая элемент с данным индексом

[0, 1]


In [56]:
print(a[:-2]) # вывести элементы с начала последовательности до второго с конца последовательности не считая его

[0, 1, 2, 3, 4]


In [57]:
# Если индекс окажется больше, чем длина последовательности, ошибка не произойдёт
print(a[:1000])

[0, 1, 2, 3, 4, 5, 6]


In [58]:
print(a[1:4]) # Можно использовать два индекса одновременно

[1, 2, 3]


In [59]:
print(a[::2]) # Последний индекс задаёт шаг; в данном случае мы хотим получить все элементы последовательности с шагом 2

[0, 2, 4, 6]


In [60]:
print(a[::-1]) # Шаг может быть отрицательным. Такой приём часто используется для получения элементов в обратном порядке

[6, 5, 4, 3, 2, 1, 0]


In [61]:
# Несколько более сложных примеров
print(a[1:4:2])  # вывести с 1 элемента по 3 включительно с шагом 2
print(a[1:4:-1]) # вывести с 1 элемента по 3 включительно с шагом -1 (пустая последовательность)
print(a[4:1:-1]) # вывести с 4 элемента по 2 включительно

[1, 3]
[]
[4, 3, 2]


### Изменение списков

Метод `.append` позволяет выполнить добавление элемента в конец списка:

In [68]:
a = []
a.append(1)
a.append(10)
print(a)

[1, 10]


Метод `.pop` -- удаление с конца списка:

In [70]:
a = [1, 5, 4, 6]
a.pop()
print(a)

[1, 5, 4]


В силу того, что списки могут быть конкатенированы (склеены), допустимо такое добавление элементов:

In [78]:
a = [1, 2, 3, 4, 5, 6]
b = a + [100]
print(b)

[1, 2, 3, 4, 5, 6, 100]


Однако если нужно добавить несколько элементов в конец большого списка, такой синтаксис не рекомендуется. Каждый раз, когда вызывается
```
b = a + [100]
```
В памяти создаётся копия списка `a`, к которому добавляется элемент со значением `100`. Создание копий не происходит бесплатно. Рассмотрим два случая, в первом добавление будем производить через `.append`, во втором - через операцию `+`:

In [74]:
a = []
for i in range(10000):
    a.append(i)

In [75]:
a = []
for i in range(10000):
    a = a + [i] # каждый раз создаётся новый объект, это занимает много времени

In [109]:
from timeit import timeit

timeit(
"""
a = []
for i in range(10000):
    a.append(i)
""", number=10)

0.0037963000004310743

In [110]:
from timeit import timeit

timeit(
"""
a = []
for i in range(10000):
    a = a + [i]
""", number=10)

0.8303859999996348

Таким образом, для добавления одного элемента стоит использовать метод `.append`.

Изменять списки можно как с использованием индексов, так и срезов:
```
s[i] = x           # заменить элемент в индексом i на x
s[i:j] = iterable  # заменить срез i:j на iterable
del s[i]           # удалить s[i]
del s[i:j]         # удалить срез s[i:j]
```

In [88]:
x = [5, 3, 6, 7, 8, 3]
x[2] = 100
print(x)

[5, 3, 100, 7, 8, 3]


In [89]:
print(x)
x[1:3] = [2] # элементы с 1 по 2 заменяются на 2
print(x)

[5, 3, 100, 7, 8, 3]
[5, 2, 7, 8, 3]


In [90]:
print(x)
x[1:2] = [0, 0, 0] # элементы с 1 по 2 заменяются на 2
print(x)

[5, 2, 7, 8, 3]
[5, 0, 0, 0, 7, 8, 3]


In [91]:
# данный приём может выступать аналогом вставки последовательности в последовательность
print(x)
x[1:1] = [6, 6, 6]
print(x)

[5, 0, 0, 0, 7, 8, 3]
[5, 6, 6, 6, 0, 0, 0, 7, 8, 3]


Для удаления всех элементов последовательности используется метод `.clear()`

In [96]:
a = [1, 2, 3]
a.clear()
print(a)

[]


```
s.insert(i, x)      # вставить значение x по индексу i
s.extend(iterable)  # расширить последовательность из элементов объекта, по которому можно проитетироваться (iterable)
s.reverse()         # изменить порядок следования объектов на обратный
s.copy()            # возвращает копию последовательности s
```

In [97]:
x = [1, 2, 3]
x.insert(0, 0)
print(x)

[0, 1, 2, 3]


In [98]:
x.extend([9, 8, 7])
print(x)

[0, 1, 2, 3, 9, 8, 7]


In [99]:
print(x)
x.reverse()
print(x)

[0, 1, 2, 3, 9, 8, 7]
[7, 8, 9, 3, 2, 1, 0]


In [104]:
a = [[5, 6], 1, 2, 3]
b = a.copy()
b.append(4)
print(a, b) # a не изменилось, так как a и b не являются разделяемыми ссылками
print(id(a), id(b))
print(id(a[0]), id(b[0])) # списки после копирования разделяют ссылки на изменяемые объекты

[[5, 6], 1, 2, 3] [[5, 6], 1, 2, 3, 4]
1444962388928 1444962314304
1444962515968 1444962515968


### Списки и кортежи в контексте изменяемости и времени
**Списки** -- изменяемые последовательности, **кортежи** -- неизменяемые. Для создания списка элементов требуется больше времени, чем на создание кортежа.

In [122]:
from timeit import timeit
from dis import dis

dis(compile("(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)", 'string', 'eval'))

  1           0 LOAD_CONST               0 ((1, 2, 3, 4, 5, 6, 7, 8, 9, 10))
              2 RETURN_VALUE


In [123]:
dis(compile("[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]", 'string', 'eval'))

  1           0 BUILD_LIST               0
              2 LOAD_CONST               0 ((1, 2, 3, 4, 5, 6, 7, 8, 9, 10))
              4 LIST_EXTEND              1
              6 RETURN_VALUE


In [126]:
timeit("(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)", number=10_000_000)

0.06684920000043348

In [127]:
timeit("[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]", number=10_000_000)

0.48642070000005333

Можно сделать вывод, что если вам нужна коллекция неизменяемых объектов, используйте кортеж, если требуется изменение -- списки.

### Способы копирования последовательностей

При помощи цикла:

In [130]:
a = [6, 3, 7]
b = []
for x in a:
    b.append(x)

print(a, b)

[6, 3, 7] [6, 3, 7]


С использованием генератора списков:

In [131]:
a = [6, 3, 7]
b = [x for x in a]

print(a, b)

[6, 3, 7] [6, 3, 7]


Используя метод `.copy()`:

In [132]:
a = [6, 3, 7]
b = a.copy()

print(a, b)

[6, 3, 7] [6, 3, 7]


Используя срезы:

In [133]:
a = [6, 3, 7]
b = a[:]

print(a, b)

[6, 3, 7] [6, 3, 7]


Используя конструктор `list`:

In [136]:
a = [6, 3, 7]
b = list(a)

print(a, b)

[6, 3, 7] [6, 3, 7]


Тонкости с кортежами:

In [138]:
a = (6, 3, 7)
b = a[:] # копия не создаётся, возвращается ссылка на кортеж a
print(id(a), id(b))

1444962090880 1444962090880


In [149]:
# так как возвращается ссылка, копирование происходит заметно быстрее
print(timeit("""
a = tuple(range(200000))
for i in range(1000):
    b = a[:]
""", number=1))
print(timeit("""
a = list(range(200000))
for i in range(1000):
    b = a[:]
""", number=1))

0.002555800001573516
1.0776843999992707


Любая из указанных выше техник возвращает такую копию, что если последовательность содержала изменяемые объекты, будут созданы на них разделяемые ссылки, если будет изменен какой-то изменяемый объект в одной последовательности, это заденет и другие переменные.

In [153]:
a = [1, 2, [1, 2]]
b = a[:]
a[2].append(3)
print(a, b)
print(id(a[2]), id(b[2]))

[1, 2, [1, 2, 3]] [1, 2, [1, 2, 3]]
1444962159936 1444962159936


Чтобы сделать глубокую копию, нужно из `copy` импортировать `deepcopy`:

In [154]:
from copy import deepcopy

a = [1, 2, [1, 2]]
b = deepcopy(a)
a[2].append(3)
print(a, b)
print(id(a[2]), id(b[2]))

[1, 2, [1, 2, 3]] [1, 2, [1, 2]]
1444961545856 1444962652416


## Создание пользовательских последовательностей **

In [164]:
class Text:

    def __init__(self):
        self.words = []

    def __getitem__(self, item):
        return self.words[item]

    def __len__(self):
        return len(self.words)

    def add_words(self, string: str):
        string = "".join((ch for ch in string if ch.isalpha() or ch.isspace()))
        self.words += string.lower().split()


text = Text()
text.add_words("Hello world!")
text.add_words("how are you?")

for word in text:
    print(word)

hello
world
how
are
you


In [166]:
print(text[-1])
print(text[::2])

you
['hello', 'how', 'you']


In [214]:
from functools import cache

class Fib:
    """
    Класс для работы с числами Фибоначчи
    """
    def __init__(self, n):
        self.n = n

    def __getitem__(self, index):
        if isinstance(index, int):
            if index < 0:
                index += self.n + 1

            if index < 0 or index > len(self):
                raise IndexError
            else:
                return Fib.fib(index)
        elif isinstance(index, slice):
            start, stop, step = index.indices(self.n)
            rng = range(start, stop, step)
            return [Fib.fib(i) for i in rng]
        else:
            raise NotImplemented

    def __len__(self):
        return self.n

    @staticmethod
    @cache
    def fib(n):
        if n < 2:
            return 1
        else:
            return Fib.fib(n - 1) + Fib.fib(n - 2)


In [217]:
f = Fib(20)
print(f[1], f[3], f[-1])
print(f[::2])

1 3 10946
[1, 2, 5, 13, 34, 89, 233, 610, 1597, 4181]


In [216]:
for x in f:
    print(x, end=" ")

1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597 2584 4181 6765 10946 

## Срезы и присваивание

Присваивание срезам не меняет расположение объекта:

In [228]:
# Длина среза и итерируемой последовательности должны совпадать, если замена происходит некоторой центральной части среза
l = [5, 2, 4, 3]
l[1:3] = [1, 1]
print(l)

[5, 1, 1, 3]


In [229]:
l = [1, 2, 3, 4, 5]
print(id(l))
l[::2] = [5, 3, 1]
print(id(l))

1444961826112
1444961826112


In [230]:
# Отсортируем элементы на чётных позициях по неубыванию, элементы на нечетных позициях по невозрастанию
l = [5, 6, 3, 8, 5, 7, 9, 3, 1]
l[::2] = sorted(l[::2])
l[1::2] = sorted(l[1::2], key=lambda x: -x)
print(l)

[1, 8, 3, 7, 5, 6, 5, 3, 9]


In [235]:
# Если срез пустой, длина последовательности справа от знака присваивания может быть любой
a = [1, 2, 3]
a[2:2] = [0, 0, 0]
print(a)

[1, 2, 0, 0, 0, 3]


In [239]:
# Длина среза и итерируемой последовательности не обязана совпадать, если замена происходит некоторой начальной или конечной части списка
a = [1, 2, 3, 4, 5]
a[:3] = [1]
print(a)

[1, 4, 5]


In [240]:
a = [1, 2, 3, 4, 5]
a[3:] = [4, 3, 2, 1]
print(a)

[1, 2, 3, 4, 3, 2, 1]


## Создание пользовательских последовательностей (часть 2) **

In [252]:
from copy import copy


class Text:

    def __init__(self):
        self.words = []

    def __getitem__(self, item):
        return self.words[item]

    def __len__(self):
        return len(self.words)

    def __contains__(self, item):
        return item in self.words

    def __delitem__(self, key):
        del self.words[key]

    def __add__(self, other):
        if isinstance(other, Text):
            t = deepcopy(self)
            t.words += other.words
            return t
        else:
            raise NotImplemented

    def __iadd__(self, other):
        self.words += other.words
        return self

    def __mul__(self, other):
        t = Text()
        t.words = self.words * other
        return t

    def __imul__(self, other):
        self.words = self.words * other
        return self.words

    def __str__(self):
        return ", ".join(self.words)

    def add_words(self, string: str):
        string = "".join((ch for ch in string if ch.isalpha() or ch.isspace()))
        self.words += string.lower().split()


text1 = Text()
text1.add_words("Hello world!")
print(text1)

text2 = Text()
text2.add_words("how are you?")
print(text2)

text3 = text1 + text2
print(text3)

text1 += text2
print(text1)

hello, world
how, are, you
hello, world, how, are, you
hello, world, how, are, you


In [254]:
text = Text()
text.add_words("Hello, it is me!")
print(text * 2)

hello, it, is, me, hello, it, is, me


In [255]:
"it" in text

True

## Сортировка последовательностей

Сортировка последовательностей возможно, если элементы последовательности можно сравнивать.

In [260]:
a = ['a', 'c', 'b']
a.sort() # .sort() - сортировка на месте; будет изменён список a

# Как работает сортировка? Каждому элементу последовательности в соответствие ставится число -- код символа
# Элемент размещается раньше, если код одного символа, меньше, чем код другого символа
# a -> 97
# c -> 99
# b -> 98
# Будет в дальнейшем производиться сортировка ключей. Всё сведётся к тому, чтобы ключи были упорядочены
# 97 -> a
# 98 -> b
# 99 -> c
# коды символов располагаются в таблице ascii
print(a)

['a', 'b', 'c']


In [261]:
a = ['a', 'c', 'b']
a.sort(reverse=True) # Сортировка в обратном порядке
print(a)

['c', 'b', 'a']


Предположим, задан список пар. И требуется отсортировать список по возрастанию последнего элемента в списке. Возможное решение:

In [264]:
l = [(1, 2), (5, 3), (4, 2), (2, 4)]
l.sort(key=lambda item : item[1]) # item -- один элемент последовательности
                                  # в данном примере в качестве ключа используется значение, которое располагается по индексу 1 для каждого элемента последовательности
print(l)

[(1, 2), (4, 2), (5, 3), (2, 4)]


In [267]:
l = ["hi", "hello", "abc", "qa", "programming"]
l.sort(key=lambda item : item[-1]) # сортировка по последней букве
print(l)

['qa', 'abc', 'programming', 'hi', 'hello']


In [268]:
l = ["hi", "hello", "abc", "qa", "programming"]
l.sort(key=lambda item : item[-1], reverse=True) # сортировка по последней букве по невозрастанию
print(l)

['hello', 'hi', 'programming', 'abc', 'qa']


In [271]:
l = ["hi", "H", "Abc", "qA", "programminG"]
l.sort(key=lambda item : item.lower()) # отсортировать при условии, что все элементы будут приведены к одному регистру
print(l)

['Abc', 'H', 'hi', 'programminG', 'qA']


In [272]:
l = ["hi", "H", "Abc", "qA", "programminG"]
l.sort(key=lambda item : len(item)) # отсортировать по длине слова
print(l)

['H', 'hi', 'qA', 'Abc', 'programminG']


## List comprehension

Данная конструкция состоит из трёх частей:
* преобразование
* итерация
* фильтрация

Первые две компоненты обязательны, последняя опциональна

In [273]:
a = [1, 2, 3]
b = [x * 2 for x in a] # преобразование x * 2
                       # элементы берутся из a
print(b)

[2, 4, 6]


In [275]:
a = [1, 2, 3, 4, 5]
b = [x * 2 for x in a if x % 2 == 0]  # преобразование x * 2
                                      # элементы берутся из a
                                      # при условии, что элемент чётный
print(b)

[4, 8]


In [280]:
a = [x for x in range(1, 101) if x % 2 != 0 and x % 7 != 1] # получить числа, которые не делятся на 2
                                                            # и не делятся на 7
print(a)

[3, 5, 7, 9, 11, 13, 17, 19, 21, 23, 25, 27, 31, 33, 35, 37, 39, 41, 45, 47, 49, 51, 53, 55, 59, 61, 63, 65, 67, 69, 73, 75, 77, 79, 81, 83, 87, 89, 91, 93, 95, 97]


Выражения могут быть вложенными:

In [281]:
a = [[i * j for i in range(5)] for j in range(5)]
print(a)

[[0, 0, 0, 0, 0], [0, 1, 2, 3, 4], [0, 2, 4, 6, 8], [0, 3, 6, 9, 12], [0, 4, 8, 12, 16]]


In [282]:
points = [(1, 2), (0, 0), (1, 0), (0, 1), (1, 1)]
points_with_zero = [point for point in points if 0 in point]
print(points_with_zero)

[(0, 0), (1, 0), (0, 1)]
