# Коллекции

В этой лекции мы познакомимся с **коллекциями** (также называемыми **контейнерами**) - специальными классами, предназначенными для хранения множества объектов и предоставляющими доступ к ним. В Python существует несколько разновидностей коллекций - часть из них относится к встроенным типам данных, другие реализованы в отдельных модулях. Это многообразие связано с тем, что невозможно создать один тип, оптимально подходящий для всех возможных классов задач. Поэтому в данной лекции мы особо обращаем внимание читателя на то, когда применять тот или иной тип коллекции.

Все коллекции относятся к итерируемым типам данных, то есть предоставляют доступ к отдельным элементам в некотором порядке. Это означает, что коллекции могут использоваться в цикле `for ... in` для прохода (итерации) по их элементам. Еще одной функцией, общей для всех коллекций, является `len`, которая возвращает количество элементов.

Все разновидности коллекций объединены в иерархию наследования. Следствием этого является тот факт, что один и тот же код зачастую способен работать с разными типами коллекций, ведь все они реализуют общие интерфейсы, наследуемые от базовых классов. Помимо этого, каждый отдельно взятый тип коллекции может добавлять специфичные для себя методы.

## Содержание лекции

* [Последовательности](#Последовательности)
  * [Кортеж](#Кортеж)
  * [Именованный кортеж](#Именованный-кортеж)
  * [Список](#Список)
  * [Строкa](#Строкa)
* [Вопросы для самоконтроля](#Вопросы-для-самоконтроля)
* [Задание](#Задание)

## Последовательности

**Последовательностью** (англ. *sequence*) в Python называют коллекцию, представляющую собой набор пронумерованных элементов. Номер элемента определяет его позицию в последовательности и по другому еще называется **индексом**. Нумерация начинается с нуля, то есть в последовательности размера $N$ содержатся элементы с индексами $0$, $1$, ... ,  $N-1$.

Один из типов коллекций, относящийся к последовательностям, нам уже известен - это `str` (элементами, которые он хранит, являются символы). Последовательности поддерживают операции конкатенации `+` и дублирования `*`, про которые мы рассказывали в контексте типа `str` [здесь](05_Operations.ipynb#Строковые-операции). Еще для них можно выполнять операцию взятия среза `[]`, рассмотренную там же, и операцию проверки на вхождение `in`, которая определяет, содержится ли определенный элемент в последовательности.

Кроме уже перечисленных операций, стоит упомянуть о двух методах, также реализованных всеми последовательностями (необязательные параметры методов здесь и далее выделяются курсивом):

| <p align="left">Метод</p> | Описание |
|---------------------------|----------|
| <p align="left"><samp>seq.count(elem)</samp></p>                                                                              | Возвращает количество элементов, равных elem, в последовательности                                                          |
| <p align="left"><samp>index(elem, *start*=0, *end*=len(seq))</samp></p>                                                       | Возвращает индекс первого элемента, равного elem, из среза \[start, end)                                                    |

Важно отметить, что любые операции, связанные с поиском элементов в последовательности (`in`, методы `count` и `index`)  в общем случае выполняются **неэффективно**, потому что требуют прохода по всем ее элементам. Если такие операции планируется использовать часто, лучше применить другой тип коллекции (забегая вперед, скажем, что речь идет о словаре, который рассматривается далее). Последовательности в основном предназначены для хранения элементов в определенном порядке и извлечении их по индексу.

### Кортеж

### Именованный кортеж

### Список

### Строка

Некоторые операции со строками, представляемыми типом `str`, мы уже рассматривали в [лекции 5](#05_Operations.ipynb), поэтому будет нелишним освежить их в памяти перед тем, как продолжать изучение материала данного раздела.

Операция `in` для строк позволяет искать в ней не только отдельные символы, но и целые подстроки, например:

In [34]:
s = 'abcdef'

if 'a' in s:
    print('\'a\' is found')
if 'cd' in s:
    print('\'cd\' is found')
if 'abcdef' in s:
    print('\'abcdef\' is found')
if 'dc' in s:
    print('\'dc\' is found')

'a' is found
'cd' is found
'abcdef' is found


In [50]:
s = 'asgsfhgsfasaaa'
s.count('as')

2

Поскольку тип `str` является классом, он предоставляет различные полезные методы. Мы перечислим лишь наиболее часто используемые:

|<p align="left">Название</p>               | Синтаксис                             | Описание                               |
|-------------------------------------------|---------------------------------------|----------------------------------------|
|<p align="left">count</p>               |<p align="left"><samp>x + y</samp></p> |Складывает число x и число y            |
|<p align="left">Вычитание</p>              |<p align="left"><samp>x - y</samp></p> |Вычитает из числа x число y             |
|<p align="left">Умножение</p>              |<p align="left"><samp>x * y</samp></p> |Умножает число x на число y             |
|<p align="left">Деление</p>                |<p align="left"><samp>x / y</samp></p> |Делит число x на число y                |
|<p align="left">Целочисленное деление</p>  |<p align="left"><samp>x // y</samp></p>|Делит число x на число y, отбрасывая дробную часть                               |
|<p align="left">Получение остатка (mod)</p>|<p align="left"><samp>x % y</samp></p> |Возвращает остаток от деления числа x на число y                                     |
|<p align="left">Возведение в степень</p>   |<p align="left"><samp>x ** y</samp></p>|Возводит число x в степень y            |
|<p align="left">Минус</p>                  |<p align="left"><samp>-x</samp></p>    |Изменяет знак числа x                   |

## Вопросы для самоконтроля

1. Что такое коллекция? Что такое итерируемый тип?
2. Какие типичные операции предоставляют последовательности? Когда их стоит использовать, а когда нет?

## Задание

In [100]:
%%time
l = list()
for i in range(10000000):
    l.append(i)

Wall time: 3.44 s


In [80]:
%%time
d = dict()
for i in range(10000000):
    d[i] = i

Wall time: 3.52 s


In [81]:
%%time
result = 0
for i in l:
    result += i
print(result)

49999995000000
Wall time: 2 s


In [82]:
%%time
result = 0
for key, value in d.items():
    result += value
print(result)

49999995000000
Wall time: 2.77 s


In [102]:
%%time
find = 5000000
l.index(find)
#if find in l:
#    print('ok')

Wall time: 135 ms


In [96]:
%%time
find = 5000000000
d.index(find)

AttributeError: 'dict' object has no attribute 'index'

- - -
[Предыдущая: Классы и исключения](08_Classes_And_Exceptions.ipynb) |
[Содержание](00_Overview.ipynb#Содержание) |
[Следующая: Коллекции](09_Collections.ipynb)