# Глава 8. Списки и словари

**Списки**  - изменяемые упорядоченные коллекции объектов произвольных типов

Списки - это:

* **Упорядоченные коллекции объектов произвольных типов**

С функциональной точки зрения, списки  – это лишь место, в  котором собраны другие объекты, поэтому их можно также рассматривать как группы. Кроме того, списки обеспечивают позиционное упорядочение элементов слева направо (то есть они являются последовательностями)

* **Доступ к элементам по смещению**

Можно использовать операцию индексирования для извлечения отдельных объектов из списка по их смещению, а также извлекать срезы и производить конкатенацию

* **Переменная длина, гетерогенность и произвольное число уровней вложенности**

В отличие от строк, списки могут увеличиваться и уменьшаться непосредственно (их длина может изменяться) и могут содержать не только односимвольные строки, но и любые другие объекты (списки гетерогенны). Списки могут содержать другие сложные объекты и поддерживают возможность создания произвольного числа уровней вложенности, поэтому имеется возможность создавать списки списков из списков и так далее.

* **Относятся к категории изменямых объектов**

Могут изменяться непосредственно и поддерживают все операции над последовательностями.

* **Массивы ссылок на объекты**

Могут содержать ноль или более ссылок на другие объекты. Списки чем-то напоминают массивы указателей.

## Списки в действии

### Базовые операции над списками

Оператор `+` работает со списками так же, как со строками, но важно помнить, что **с обеих сторон оператора должны находиться последовательности одного и того же типа**

In [1]:
[1, 2] + [5, 6]

[1, 2, 5, 6]

In [2]:
'1, 2' + [5, 6]

TypeError: must be str, not list

In [3]:
'1, 2' + str([5, 6])

'1, 2[5, 6]'

### Итерации по спискам и генераторы списков

In [4]:
for x in [1, 2, 3]:
    print(x, end=' ')

1 2 3 

**Генераторы списков** – это способ построить новый список, применяя выражение к каждому элементу последовательности

In [5]:
[c * 4 for c in 'SPAM']

['SSSS', 'PPPP', 'AAAA', 'MMMM']

### Индексы, срезы и матрицы

В результате **обращения к элементу по индексу** возвращается **объект**, который расположен по указанному смещению,

а в результате операции **извлечения среза** всегда возвращается **новый список**

In [6]:
L = ['spam', 'Spam', 'SPAM!']
L[2]  # элемент, расположенный на третьей позиции

'SPAM!'

In [7]:
L[1:]  # новый список

['Spam', 'SPAM!']

In [8]:
matrix = [[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9]]

matrix[1][1]

5

### Изменение списка

#### Присваивание по индексам и срезам

In [9]:
L = ['spam', 'Spam', 'SPAM!']
L[1] = 'eggs'
print(L)

L[:2] = ['eat', 'more']
print(L)

['spam', 'eggs', 'SPAM!']
['eat', 'more', 'SPAM!']


**Присваивание срезу** замещает целый раздел списка за один прием. Поскольку это довольно сложная операция, проще будет представить ее, как последовательное выполнение двух действий:
1. *Удаление*. Раздел списка, определяемый слева от оператора `=`, удаляется.
2. *Вставка*. Новые элементы, содержащиеся в объекте, расположенном справа от оператора `=`, вставляются в список, начиная с левого края, где находился прежний удаленный срез.

Здесь требуется дополнительное уточнение, описывающее случай, когда при присваивании происходит перекрытие срезов, например: выражение `L[2:5] = L[3:6]`, будет выполнено безошибочно, потому что перед тем, как срез слева будет удален, сначала будет произведено извлечение среза справа.

> В действительности это не совсем то, что происходит на самом деле, но это достаточно точно объясняет, почему **число вставляемых элементов не должно соответствовать числу удаляемых элементов**

In [10]:
L = list(range(0, 10))
L

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [11]:
L[2:5] = L[3:6]
L

[0, 1, 3, 4, 5, 5, 6, 7, 8, 9]

In [12]:
L = list(range(0, 10))
L

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [13]:
L[:3] = L[3:]
L

[3, 4, 5, 6, 7, 8, 9, 3, 4, 5, 6, 7, 8, 9]

In [14]:
L[:7] = []  # по сути это является операцией удаления
L

[3, 4, 5, 6, 7, 8, 9]

#### Методы списков

* `append`
* `extend`
* `insert`
* `index`
* `count`
* `sort`
* `reverse`
* `pop`
* `remove`

**`append`**

In [15]:
L = ['eat', 'more', 'SPAM!']
L.append('please')
L

['eat', 'more', 'SPAM!', 'please']

В отличие от операции конкатенации (`+`), метод `append` не создает новый объект, поэтому обычно он выполняется быстрее. Существует возможность имитировать работу метода `append` с помощью операции присваивания срезу:

выражение `L[len(L):]=[X]` соответствует вызову `L.append(X)`,

а выражение `L[:0]=[X]` соответствует операции добавления в начало списка. В обоих случаях удаляется пустой сегмент списка и вставляется элемент `X`, при этом изменяется сам список `L`, так же быстро, как при использовании метода `append`.

**`sort`**

Именованный аргумент `key` в вызове метода `sort` позволяет определить собственную функцию сравнения, принимающую единственный аргумент и  возвращающую значение, которое будет использовано в операции сравнения, а именованный аргумент `reverse` позволяет выполнить сортировку не в порядке возрастания, а в порядке убывания

In [16]:
L = ['abc', 'ABD', 'aBe']
L.sort()  # сортировка с учетом регистра
L

['ABD', 'aBe', 'abc']

In [17]:
L.sort(key=str.lower)  # приведение к нижнему регистру
L

['abc', 'ABD', 'aBe']

In [18]:
L.sort(key=str.lower, reverse=True)  # Изменяет направление сортировки
L

['aBe', 'ABD', 'abc']

> В Python 3 **нельзя сравнивать объекты разных типов**

In [19]:
L = [1, 3, 2, 'spam']
L.sort()

TypeError: '<' not supported between instances of 'str' and 'int'

`sort` и `append` изменяют сам список, возращают `None`

Встроенная функция **`sorted`** возвращает новый отсортированный список

In [20]:
L = ['abc', 'ABD', 'aBe']
sorted(L, key=str.lower, reverse=True)

['aBe', 'ABD', 'abc']

In [21]:
L = ['abc', 'ABD', 'aBe']
sorted(L, key=lambda x: x.lower(), reverse=True)

['aBe', 'ABD', 'abc']

In [22]:
# здесь элементы списка сначала приводятся к нижнему регистру
# с помощью генератора списков (т.е. сортируется временный список),
# поэтому возвращается список элементов в нижнем регистре
L = ['abc', 'ABD', 'aBe']
sorted([x.lower() for x in L], reverse=True)

['abe', 'abd', 'abc']

**Другие методы**

In [23]:
L = list(range(10))
L

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [24]:
L.reverse()
L

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [25]:
L.extend([7, 7, 7])
L

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0, 7, 7, 7]

In [26]:
L.pop()

7

In [27]:
L

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0, 7, 7]

In [28]:
# необходимо обертывать в list, т.к. возвращает генератор
list(reversed(L))

[7, 7, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [29]:
L.insert(4, 'SPAM')
L

[9, 8, 7, 6, 'SPAM', 5, 4, 3, 2, 1, 0, 7, 7]

In [30]:
L.index('SPAM')

4

In [31]:
L.index('eggs')

ValueError: 'eggs' is not in list

In [32]:
L.remove(7)  # удаляет первый элемент с этим значением
L

[9, 8, 6, 'SPAM', 5, 4, 3, 2, 1, 0, 7, 7]

In [33]:
L.pop(3)  # удаляет и возвращает элемент в указанной позиции

'SPAM'

In [34]:
L

[9, 8, 6, 5, 4, 3, 2, 1, 0, 7, 7]

In [35]:
del L[-1]
L

[9, 8, 6, 5, 4, 3, 2, 1, 0, 7]

## Словари

Основные характеристики словарей:

* **Доступ к элементам по ключу**

Словари - хэш-таблицы. Они определяют взаимосвязь между значениями и ключами. Для получения элементов словаря используется та же самая операция доступа по индексу, как в списке, только индекс приобретает форму ключа, а не смещения относительно начала

* **Неупорядоченные коллекции произвольных объектов**

Элементы словарей хранятся в неопределенном порядке (интерпретатор вносит элемент случайности в порядок следования элементов для обеспечения более быстрого поиска). Ключи описывают символическое (не физическое) местоположение элементов в словаре.

* **Переменная длина, гетерогенность и произвольное число уровней вложенности**

Словари могут увеличиваться и уменьшаться непосредственно (без создания новых копий). Могут содержать объекты любых типов и поддерживают возможность создания произвольного числа уровней вложенности.

* **Относятся к категории изменяемых отображений**

Могут изменяться непосредственно с использованием операции индексирования, но не поддерживают операции над последовательностями, которые поддерживаются строками и списками. Словари представляют собой неупорядоченные коллекции, поэтому операции, которые основаны на использовании фиксированного порядка следования элементов (конкатенация, извлечение среза) не имеют смысла для словарей. Словари - единственный встроенный представитель объектов-отображений (отображает ключи на значения)

* **Таблицы ссылок на объекты (хэш-таблицы)**

Если списки - массивы ссылок на объекты, которые поддерживают возможность доступа к элементам по их позициям, то **словари - это неупорядоченные таблицы ссылок на объекты, которые поддерживают доступ к элементам по ключу**. Внутри словари реализованы как хэш-таблицы (структуры данных, которые обеспечивают очень высокую скорость поиска).

In [36]:
D = {}  # пустой словарь
type(D)

dict

In [37]:
D = {'spam': 2, 'eggs': 3}
D = {'food': {'ham': 1, 'egg': 2}}  # Вложение

Альтернативные способы создания словарей

In [38]:
D = dict(name='Bob', age=40)
D

{'name': 'Bob', 'age': 40}

In [39]:
keylist = ['name', 'age']
valslist = ['Bob', 40]

D = dict(zip(keylist, valslist))
D

{'name': 'Bob', 'age': 40}

In [40]:
D = dict.fromkeys(['a', 'b'])
D

{'a': None, 'b': None}

## Словари в действии

### Базовые операции над словарями

`len` - число элементов в словаре (длина списка ключей)

In [41]:
D = {'spam': 2, 'ham': 1, 'eggs': 3}
len(D)

3

`in` - проверка наличия ключа в словаре, возможно благодаря тому, что **словари определяют итераторы, которые обеспечивают пошаговый обход списков ключей**.

In [42]:
'spam' in D

True

`keys` - метод, возвращающей список ключей в виде объекта `dict_keys`

In [43]:
type(D.keys())

dict_keys

In [44]:
D.keys()

dict_keys(['spam', 'ham', 'eggs'])

In [45]:
D.keys()[0]

TypeError: 'dict_keys' object does not support indexing

In [46]:
list(D.keys())[0]

'spam'

### Изменение словарей

In [47]:
D = {'spam': 2, 'ham': 1, 'eggs': 3}

D['ham'] = ['grill', 'bake', 'fry'] # Изменение элемента
D

{'spam': 2, 'ham': ['grill', 'bake', 'fry'], 'eggs': 3}

In [48]:
del D['eggs']  # Удаление элемента
D

{'spam': 2, 'ham': ['grill', 'bake', 'fry']}

In [49]:
D['brunch'] = 'Bacon'  # Добавление нового элемента
D

{'spam': 2, 'ham': ['grill', 'bake', 'fry'], 'brunch': 'Bacon'}

### Дополнительные методы словарей

Методы словарей обеспечивают выполнение различных операций.

Например, методы словарей `values` и `items` возвращают список значений элементов словаря и кортежи пар `(key, value)` соответственно

In [50]:
D = {'spam': 2, 'ham': 1, 'eggs': 3}

In [51]:
list(D.values())

[2, 1, 3]

In [52]:
list(D.items())

[('spam', 2), ('ham', 1), ('eggs', 3)]

**`get`** - возвращает значение по ключу, `None` (по умолчанию) - если ключ отсуствует

In [53]:
D.get('spam')

2

In [54]:
print(D.get('toast'))

None


In [55]:
print(D.get('toast', -1))

-1


**`update`** - своего рода операция конкатенации для словарей - объединяет ключи и значения одного словаря с ключами и значениями другого, просто перезаписывая значения с одинаковыми ключами

In [56]:
D = {'spam': 2, 'ham': 1, 'eggs': 3}
D2 = {'toast': 4, 'muffin': 5, 'eggs': 66}

D.update(D2)
D

{'spam': 2, 'ham': 1, 'eggs': 66, 'toast': 4, 'muffin': 5}

**`pop`** - удаляет ключ из словаря и возвращает его значение

In [57]:
D = {'spam': 2, 'ham': 1, 'eggs': 3}

D.pop('ham')

1

In [58]:
D

{'spam': 2, 'eggs': 3}

### Замечания по использованию словарей

* **Операции над последовательностями неприменимы к словарям**

Словари – это отображения, а не последовательности. Вследствие того, что словари не предусматривают никакого упорядочения элементов, такие операции, как конкатенация (упорядоченное объединение) и извлечение среза (извлечение непрерывного блока элементов), просто неприменимы. В действительности, когда в программном коде во время выполнения производится попытка сделать нечто подобное, интерпретатор выдает сообщение об ошибке.

* **Присваивание по несуществующему индексу приводит к созданию нового элемента**

Ключи можно создавать при определении словаря в  виде литерала (в этом случае они встраиваются непосредственно в литерал) или при присваивании значения новому ключу существующего объекта словаря. Результат получается тот же самый.

* **Ключи не обязательно должны быть строками**

В наших примерах в качестве ключей использовались строки, но могут использоваться любые другие неизменяемые объекты (то есть не списки). Например, в  качестве ключей допустимо использовать целые числа, что превращает словарь в  подобие списка (как минимум, в смысле индексирования). В качестве ключей можно также использовать кортежи, что позволяет создавать составные ключи.

Экземпляры классов также могут играть роль ключей при условии, что они поддерживают определенные методы, которые сообщат интерпретатору, что он имеет дело с неизменяемым объектом, в  противном случае они будут бесполезны, если рассматривать их как фиксированные ключи.

### Использование словарей для имитации гибких списков

Списки не допускают возможность присваивания по индексам, находящимся за пределами списков

In [59]:
L = []
L[99] = 'spam'

IndexError: list assignment index out of range

При использовании целочисленных ключей словари могут имитировать списки, которые увеличиваются при выполнении операции присваивания по смещению

In [60]:
D = {}
D[99] = 'spam'
D

{99: 'spam'}

В  такой структуре можно обращаться по смещениям, как в списке, но при этом не требуется выделять пространство для всех позиций, которые могут когда-либо потребоваться при выполнении программы. При использовании подобным образом словари представляют собой более гибкие эквиваленты списков. **Но при этом нельзя использовать срезы**

### Использование словарей для структур разреженных данных

Похожим образом словари могут использоваться для реализации структур разреженных данных, таких как многомерные массивы, где всего несколько элементов имеют определенные значения

In [61]:
Matrix = {}
Matrix[(2, 3, 4)] = 88
Matrix[(7, 8, 9)] = 99

x, y, z = 2, 3, 4
Matrix[(x, y, z)]

88

Ключами словаря являются кортежи, определяющие координаты непустых элементов. Попытка доступа к пустым элементам будет приводить к возбуждению исключения, так как эти элементы физически отсутствуют.

Решение - возвращать значение с помощью метода `get`

In [62]:
Matrix[(4, 5, 6)]

KeyError: (4, 5, 6)

In [63]:
Matrix.get((4, 5, 6), 0)

0

### Использование словарей в качестве «записей»

Встроенные типы языка Python позволяют легко представлять структурированную информацию; это особенно заметно, когда появляются уровни вложенности.

В следующем примере снова используется словарь для хранения свойств объекта

In [65]:
mel = {
    'name': 'Mark',
    'jobs': ['trainer', 'writer'], 
    'web': 'www.rmi.net/~lutz',
    'home': {'state': 'CO', 'zip':80513},
}

mel

{'name': 'Mark',
 'jobs': ['trainer', 'writer'],
 'web': 'www.rmi.net/~lutz',
 'home': {'state': 'CO', 'zip': 80513}}

### Другие способы создания словарей

> **Форма именованных аргументов** - требует, чтобы все ключи были строками

In [66]:
dict(name='mel', age=45)

{'name': 'mel', 'age': 45}

**Кортежи ключ/значение**

In [67]:
dict([('name', 'mel'), ('age', 45)])

{'name': 'mel', 'age': 45}

**`fromkeys`**

Если значения всех ключей словаря остаются все время одними и  теми же, можно использовать специализированную форму инициализации словаря, при использовании которой достаточно просто передать список ключей и  начальное значение (по умолчанию используется значение `None`):

In [68]:
dict.fromkeys(['a', 'b'], 0)

{'a': 0, 'b': 0}

## Изменения в словарях в Python 3.0

* Поддерживают новые выражения генераторов словарей, близко напоминающие генераторы списков и множеств.

* Методы `D.keys`, `D.values` и  `D.items` возвращают итерируемые представления вместо списков.

* Вследствие особенности, описанной в предыдущем пункте, требуют по иному выполнять обход ключей в отсортированном порядке.

* Больше не поддерживают возможность непосредственного сравнивания между собой – теперь сравнивание должно выполняться вручную.

* Больше не поддерживают метод `D.has_key`  – вместо него следует использовать оператор `in` проверки на вхождение.

### Генераторы словарей

In [69]:
D = {k: v for (k, v) in zip(['a', 'b', 'c'], [1, 2, 3])}
D

{'a': 1, 'b': 2, 'c': 3}

In [70]:
D = {c.lower(): c + '!' for c in ['SPAM', 'EGGS', 'HAM']}
D

{'spam': 'SPAM!', 'eggs': 'EGGS!', 'ham': 'HAM!'}

Генераторы словарей удобно использовать для инициализации словарей из
списков ключей, почти так же, как это делает метод `fromkeys`

In [71]:
D = dict.fromkeys(['a', 'b', 'c'], 0)  # Инициализация списком ключей
D

{'a': 0, 'b': 0, 'c': 0}

In [72]:
D = {k:0 for k in ['a', 'b', 'c']}  # То же с помощью генератора
D

{'a': 0, 'b': 0, 'c': 0}

In [73]:
# из другого итерируемого объекта, значения по умолчанию
D = dict.fromkeys('spam')
D

{'s': None, 'p': None, 'a': None, 'm': None}

In [74]:
D = {k: None for k in 'spam'}
D

{'s': None, 'p': None, 'a': None, 'm': None}

### Представления словарей

`keys`, `values` и  `items` - **объекты представлений** - это итерируемые объекты, т.е. объекты, которые вместо всего списка значений возвращают по одному значению за одно обращение

Кроме того, что они являются итерируемыми объектами, представления словарей также сохраняют оригинальный порядок следования компонентов словаря, отражают результаты операций, которые выполняются над словарем, и поддерживают операции над множествами.

С другой стороны, они не являются списками и не поддерживают такие операции, как обращение к элементам по индексам или метод `sort` списков, а также не отображают значения своих элементов при выводе.

> Результаты этих трех методов `keys`, `values` и  `items` необходимо обертывать вызовом встроенной функции `list`,  – если появится
необходимость применить операции над списками или отобразить значения
элементов

In [75]:
D = dict(a=1, b=2, c=3)
D

{'a': 1, 'b': 2, 'c': 3}

In [76]:
K = D.keys()
K

dict_keys(['a', 'b', 'c'])

In [77]:
K[0]

TypeError: 'dict_keys' object does not support indexing

In [78]:
list(K)[0]

'a'

> В отличие от списков, возвращаемых в  виде результатов в  версии  2.x
, представления словарей в версии 3.0 способны динамически отражать все последующие изменения в словарях, выполненные уже после создания объекта отображения

In [79]:
del D['b']

In [80]:
D

{'a': 1, 'c': 3}

In [81]:
K

dict_keys(['a', 'c'])

### Представления словарей и множества

Кроме того, в отличие от списков результатов, возвращаемых в версии 2.X, объекты представлений в версии 3.0, возвращаемые методом `keys`, похожи на множества и поддерживают операции над множествами, такие как пересечение и объединение.

Объекты представлений, возвращаемые методом `values`, такой особенностью не обладают, потому что они не являются уникальными, тогда как объекты представлений, возвращаемые методом `items`, такой особенностью обладают, если пары `(key, value)` являются уникальными и хешируемыми.

Учитывая, что множества достаточно сильно похожи на словари, ключи которых не имеют значений (и даже литералы множеств в версии 3.0 заключаются в фигурные скобки, как словари), это обстоятельство выглядит вполне логичным. Подобно ключам словарей, элементы множеств неупорядочены, уникальны и относятся к разряду неизменяемых объектов.

In [82]:
D = dict(a=1, b=2, c=3)
K = D.keys()
V = D.values()

In [83]:
K | {'x': 4}

{'a', 'b', 'c', 'x'}

In [84]:
V | {'x': 4}

TypeError: unsupported operand type(s) for |: 'dict_values' and 'dict'

In [85]:
V | {'x': 4}.values()

TypeError: unsupported operand type(s) for |: 'dict_values' and 'dict_values'

In [86]:
{'a': 1, 'b': 2, 'c': 3}.keys() & {'c': 5, 'd': 6}.keys()

{'c'}

Представления элементов словарей также могут обладать свойствами множеств, если они допускают возможность хеширования, – то есть, если они содержат только неизменяемые объекты

In [87]:
D = {'a': 1}
list(D.items())

[('a', 1)]

In [88]:
D.items() | D.keys()  # Объединение представлений

{('a', 1), 'a'}

In [89]:
D.items() | D  # Словари интерпретируются как представление ключей

{('a', 1), 'a'}

In [90]:
D.items() | {('c', 3), ('d', 4)} # Множество пар ключ/значение

{('a', 1), ('c', 3), ('d', 4)}

In [91]:
# Функция dict принимает также итерируемые объекты множеств
dict(D.items() | {('c', 3), ('d', 4)})

{'d': 4, 'a': 1, 'c': 3}

### Сортировка ключей словаря

In [92]:
D = {'a': 1, 'b': 2, 'c': 3}
D

{'a': 1, 'b': 2, 'c': 3}

In [93]:
sorted(D.keys())

['a', 'b', 'c']

In [94]:
sorted(D)

['a', 'b', 'c']