# Списки. Кортежи. Множества. Словари.

###  Списки и методы списков

Списки - это сложные, составные объекты. Списки обозначаются в квадратных скобочках:

    [1, 2, 3] - список чисел
    ['1', '2', '3'] - список строк
    
Внутри списка могут находиться совершенно любые объекты. Необязательно даже одного типа. Могут быть списки списков, списки списков списков, списки списков... ну вы поняли. Кстати, такие вот списки списков списков... используются для работы с матрицами и прочими многомерными жуткостями. Ну, или могут использоваться (с матрицами в питоне работает библиотека numpy, до которой мы с вами, надеюсь, когда-нибудь доживем).

Списки - итерируемые изменяемые объекты. 

Изменяемые означает то, что они могут изменяться по частям. 

Списки тоже индексируются, а значит, к спискам можно применять все те же срезы, точно так же, как к строкам. С единственной разницей: один элемент строки изменить нельзя, а в списке пожалуйста. 

Индексы и срезы в списках работают еще изощреннее, и с ними можно делать всякие разные вещи. 

Можно изменять отдельный элемент в списке:

    A[0] = 4
    
Можно перезаписывать какую-то часть списка:

    A[2:4] = [3, 4, 5]
    
Заметьте, что длина части списка и длина нового списка, который вставляем вместо этой части, не обязана совпадать. 

Из последнего проистекают следующие хитрости:

    A[3:4] = []  # удалит элемент с индексом 3 из списка
    A[3:3] = [2, 3]  # вставит элементы 2, 3 перед элементом с индексом 3

In [6]:
A = [1, 2, 3, 4, 5]
print(f'A[3:5]: {A[3:5]}')
A[3:5] = [9, 8, 7]
print(A)
print(f'A[2:3]: {A[2:3]}')
A[2:3] = []
print(A)
print(f'A[0:0]: {A[:0]}')
A[:0] = ['!']
print(A)

A[3:5]: [4, 5]
[1, 2, 3, 9, 8, 7]
A[2:3]: [3]
[1, 2, 9, 8, 7]
A[0:0]: []
['!', 1, 2, 9, 8, 7]


Как завести список?

- явно задать в коде:

        lst = [1, 2, 3]
        
- превратить из другого итерируемого объекта:

        lst = list(range(10))
        lst = list('qwerty')
        
- использовать list comprehension + генераторное выражение:

        lst = [func(x) for x in <iterable> if <cond>]
        
- завести пустой список и понадобавлять туда элементов методом append():

        lst = []
        for char in s:
            lst.append(char)
            

Самое интересное из этого всего - представление списка / списковое включение (list comprehension) и генераторное выражение. 

Генератор - такой особый объект в питоне; он итерируемый, но в момент, когда вы его создаете, он не вычисляется. Что это значит? если у нас в генераторном выражении написано 

    (x ** 2 for x in lst),
    
оно не кинется сразу же вычислять все квадраты для всех иксов в списке lst, а будет их выдавать по одному, если его попросить. Генератор - птица гордая, пока не пнешь, не полетит! (зато летает быстро)

list comprehension - это что-то вроде list(), только в квадратных скобочках: все, что стоит внутри квадратных скобочек, превращается в список. Просто если это какие-то готовые объекты, то там особенно нечему превращаться, а если внутри квадратных скобок стоит генератор, скобки заставят его выдать все его элементы и превратят их в список. 

In [26]:
A = list(range(1, 11))
B = [x ** 2 for x in A]
C = [x for x in A if x % 2]
print(B, C)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] [1, 3, 5, 7, 9]


Взглянем на сравнение скорости работы генератора и цикла из семинара:

In [24]:
string = 'abc' * 1000
%timeit [char for char in string if char != 'a']

90.4 µs ± 287 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [25]:
%%timeit
L = []
for char in string:
    if char != 'a':
        L.append(char)

134 µs ± 2.78 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


Заодно познакомимся с чудесными магическими функциями IPython, которых нет в CPython (там есть свои методы, не настолько удобные). Функция %timeit заставляет питон гонять команду, которая идет после этой функции, тысяч десять раз и оценивает, с какой в среднем скоростью выполняется эта команда. То же, но с двумя %, гоняет всю ячейку. 

Цифры на каждом новом запуске будут меняться (потому что скорость работы зависит от того, насколько в конкретную секунду загружен процессор, и все такое прочее), но одно будет совершенно точно: генератор отрабатывает быстрее цикла, иногда почти в два раза. 

Как, кстати, читать эти обозначения, которые выводит timeit: µs - микросекунды, ns - наносекунды. То есть, среднее значение скорости равно скольки-то микросекундам с отклонением в сколько-то наносекунд (или микросекунд) на прогон (loop): а прогнано было 10000 раз за 7 циклов (число прогонов и циклов может меняться). Это означает, что питон погонял нашу строчку кода 7 * 10000 раз. 

Со списками можно выполнять следующие вещи:

- Сложение (список А + список Б = новый список, состоящий из элементов обоих списков)
- Умножение (список А * целое число n = новый список с элементами, которые повторяются n раз)
- Сравнение (точно так же, как строки: списки сравниваются поэлементно)
- Все, что можно делать с помощью индексов и срезов
- функция len вернет количество элементов в списке
- функция max вернет самый большой из элементов в списке (если их можно сравнить друг с другом)
- функция min - наоборот
- функция sum сложит все элементы списка и вернет число, если в списке - числа

Со списками (и с изменяемыми объектами вообще) связана главная сложность питона, пожалуй. Дело в том, что списки (и другие сложные структуры вроде множеств и словарей) - обычно большие объекты; средняя лингвистическая программа обрабатывает списки, каждый из которых может занимать до парочки гигабайт: например, у вас есть дамп Википедии весом в шесть гигабайт, вы взяли и загрузили его весь в оперативу в виде списка текстов (я однажды так сделала...). Хотите создать копию? А если у вас оперативы 8 гигабайт?

Поэтому питон всеми силами стремится избежать напрасного копирования списков. Из этого вытекает: ни один метод списков (кроме copy) не создает нового списка! Все изменения производятся в текущем списке. Вот операторы (сложение, умножение) могут создавать новые объекты (и обычно это делают).

Следовательно, методы списков производят изменения в существующем списке и **ничего не возвращают**.

Вторая вещь, которая тоже связана с изменяемостью списков и избеганием копирования их:

    A = [...]
    B = A
    A is B = True!
    
Когда у вас есть в одной переменной список и вы заводите вторую переменную (B = A), у вас обе переменные начинают ссылаться на один и тот же объект. Оператор проверки идентичности is нужен как раз для этого: он возвращает True, если две переменные ссылаются на один и тот же объект, и False иначе. Что это все значит? Если вы производите изменения с объектом, обращаясь к нему по адресу B, в А эти изменения тоже будут. 

In [7]:
A = [1, 2, 3]
B = A
print(A is B)
B[0] = 5
print(f'A: {A}\nB: {B}')

True
A: [5, 2, 3]
B: [5, 2, 3]


С этим же связаны многие подвохи питона, на которые регулярно напарываются и опытные программисты. Например, список заранее известной длины можно создать так:

    A = [0] * 10  # создаем список из десяти нулей
    
Это еще называется "проинициализировать список". То есть, когда у вас есть такой список, вы можете заполнять его объектами в цикле for:

    for i in range(len(A)):
        A[i] = ...
    
Если бы вы просто завели новый пустой список, так бы не сработало из-за ошибки IndexError, которая возникает, когда вы обращаетесь к элементу с несуществующим индексом. Примерно так:

In [8]:
n = 10
Initialized = [0] * n
for i in range(n):
    Initialized[i] = i ** 2
print(f'Наш заполненный список: {Initialized}')
Empty = []
for i in range(n):
    Empty[i] = i ** 2  # не получилось...

Наш заполненный список: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


IndexError: list assignment index out of range

Ошибка list index out of range - очень часто встречаемая ошибка даже не у новичков, так что знайте, почему она возникает (обычно если в списке n элементов, а вы обратились по индексу, который больше n)

Возвращаясь к тонкостям и подводным камням: можно создать список списков с помощью умножения. 

    ListofLists = [[1, 2]] * 3
    
Все получится, у нас будет список из трех элементов. Списки списков обычно используются для представления матриц (вложенные списки - это как бы строки матрицы). Ну, это если мы не умеем пользоваться numpy. 

Беда в том, что когда мы берем список \[1, 2\] и умножаем его на три, то на самом деле внутри списка списков возникает три переменных с индексами 0, 1 и 2, которые ссылаются на один и тот же объект...

Список ListofLists можно представить как \[ListofLists[0\], ListofLists\[1\], ListofLists]\[2\]\]. То есть, внутри этого списка хранятся три адреса, и все три указывают на один объект. 

In [15]:
ListofLists = [[1, 2]] * 3
print(ListofLists)
# Можно вывести похожим на матрицу:
print(*ListofLists, sep='\n')
ListofLists[0][0] = 5  # Решили первое число в первом внутреннем списке перезаписать
print('Oops...', *ListofLists, sep='\n')

[[1, 2], [1, 2], [1, 2]]
[1, 2]
[1, 2]
[1, 2]
Oops...
[5, 2]
[5, 2]
[5, 2]


Итак, как в список добавить новый элемент?

    list.append(elem)

In [16]:
A = []
A.append(4)
print(A)

[4]


Как элемент удалить?

    1. del A[0]
    2. A[0:1] = []
    3. A.pop(0)
    4. A.remove(4)
    
Первый вариант - это использование оператора del. Оператор del удаляет любой объект из программы. Для любопытных - он вызывает деструктор класса (магический метод \_\_del\_\_, о чем, надеюсь, успеем поговорить, когда будем изучать классы). 

Второй вариант мы уже рассматривали, когда обсуждали срезы. 

Третий вариант не просто удаляет элемент с индексом 0, но и возвращает его: то есть, мы можем удалить этот элемент из списка и одновременно сохранить в переменную. 

Четвертый вариант удаляет первый встретившийся в списке элемент с таким значением. 

In [17]:
A = list(range(1, 11))
print(f'Исходный список: {A}')
del A[0]
print(f'Удалили первый элемент: {A}')
A[0:1] = []
print(f'Опять удалили первый элемент: {A}')
last = A.pop() # по умолчанию удаляет последний элемент
print(f'Удалили последний элемент: {A}')
print(f'Вот он: {last}')
A.pop(0)
print(f'Опять удалили первый элемент: {A}')
A.remove(7)
print(f'Удалили семерку: {A}')

Исходный список: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Удалили первый элемент: [2, 3, 4, 5, 6, 7, 8, 9, 10]
Опять удалили первый элемент: [3, 4, 5, 6, 7, 8, 9, 10]
Удалили последний элемент: [3, 4, 5, 6, 7, 8, 9]
Вот он: 10
Опять удалили первый элемент: [4, 5, 6, 7, 8, 9]
Удалили семерку: [4, 5, 6, 8, 9]


Как вставить элемент?

    A[3:3] = ['new']
    A.insert(3, 'new')

In [18]:
A = input().split()
A[1:1] = ['вставка']
A.insert(4, 'вставка insert')
print(A)

 мороз и солнце день чудесный еще ты дремлешь друг прелестный


['мороз', 'вставка', 'и', 'солнце', 'вставка insert', 'день', 'чудесный', 'еще', 'ты', 'дремлешь', 'друг', 'прелестный']


Как найти элемент в списке?

    A.index(elem)
    
Вернет индекс первого встретившегося элемента. 

Как посчитать количество элементов в списке?

    A.count(elem)

Как добавить элементы второго списка в первый?

    lst1.extend(lst2)
    
Работает похоже на +, но + возвращает новый список, а extend - нет. 

Сортировка и переворачивание списков:

    1. Функция sorted(iterable, key=..., reverse=...)
    2. Метод lst.sort(key=..., reverse=...)
    
Функция sorted принимает на вход любой итерируемый объект (строку, список, множество...), превращает его в список, сортирует и возвращает новый объект типа "список". Прежний объект остается неизменным! Параметры key и reverse необязательные. 

Метод sort сортирует список на месте. Изменяет исходный список, умеет сортировать только списки. 

Что делают параметры?

reverse=True означает сортировку от большего к меньшему. 

key=function: умеет принимать в качестве значения любое имя функции (не ее саму! скобочки не нужны) и сортировать объекты в списке по результатам работы этой функции. 

In [19]:
A = input().split()
A.sort(key=len)
print(A)

 сижу за решеткой в темнице сырой


['в', 'за', 'сижу', 'сырой', 'темнице', 'решеткой']


Что делает такая сортировка? по очереди ко всем объектам списка применяет функцию len. Функция возвращает длину для каждого слова. По этой длине сортировка сортирует объекты. 

Параметры одинаково устроены и для метода, и для функции. 

С переворачиванием похожая история:

    1. Функция reversed(iterable)
    2. Метод lst.reverse()
    3. lst[::-1]
    
Функция принимает любой итерируемый объект (список, строчку) и возвращает новый объект своего собственного типа (итератор, на самом деле), который можно явным образом превратить в список или использовать в штуке типа генератора для создания списка или в цикле for. 

Метод просто переворачивает элементы внутри самого списка. 

Срез вернет новый объект - список. 

In [21]:
A = [1, 2, 3, 4, 5]
for elem in reversed(A):
    print(elem, end='\t')
print()
print(f'Исходный список не поменялся: {A}')

5	4	3	2	1	
Исходный список не поменялся: [1, 2, 3, 4, 5]


In [23]:
B = [x ** 2 for x in reversed(A)]
print(f'Новый список В на основе перевернутого старого А: {B}')

Новый список В на основе перевернутого старого А: [25, 16, 9, 4, 1]


### Вложенные списки

Списки могут вкладываться один в другой. Чтобы обратиться к элементу вложенного списка, нужно использовать двойной индекс:

In [4]:
M = [[1, 2, 3], [4, 5, 6]]
print('M', *M, sep='\n')
print(f'Нулевой элемент М: {M[0]}')
print(f'Первый элемент М: {M[1]}')
print(f'Нулевой элемент первого элемента М: {M[1][0]}')

M
[1, 2, 3]
[4, 5, 6]
Нулевой элемент М: [1, 2, 3]
Первый элемент М: [4, 5, 6]
Нулевой элемент первого элемента М: 4


Вложенные списки могут использоваться для работы с матрицами. Матрица - это табличка чисел. Обычная двумерная матрица выглядит как-то так:

    1    2    3
    4    5    6
    
Говорят, что это матрица размера два на три (2, 3), то есть, у нее две строки и три столбца. Матрица, у которой m и n (количество строк и столбцов) совпадают, называется квадратной. Матрица, состоящая из нулей, называется нулевой. Матрица, у которой все элементы - нули, кроме тех, которые стоят по диагонали, называется диагональной. Диагональная матрица, у которой все числа по диагонали - единицы, называется единичной. Вообще всем, кто планирует заниматься машинным обучением и NLP, следует сконцентрироваться на матрицах и постараться освоить их. 

Матрицы на самом деле могут быть многомерными. Представить это мы можем с трудом (наше воображение справляется только с трехмерной матрицей), а вот создать n-мерную матрицу в питоне - легко: достаточно сделать n вложений. 

Вообще говоря, с точки зрения нейронных сетей это как выглядит:

    0D - скаляр (одиночное число). 
    1D - вектор ([1, 2, 3, 4])
    2D - матрица
    3D и выше - тензор. 

На самом деле в высшей математике тензор - это немножко особенная штука, но в том же pytorch тензор - это просто многомерная матрица. Нам с вами доведется много иметь с ними дела, поэтому постарайтесь хорошенько с ними разобраться. 

Пока, впрочем, будем упражняться только с двумерными (пока не доберемся до numpy). 

Обычно с матрицами работают в модуле numpy, но для их понимания и вложенные списки сойдут (по существу, массивы numpy - те же вложенные списки, только обрабатываемые особым образом и не в питоне, а на языке С). 

До сих пор мы задавали матрицы только явным образом. Как задать матрицу с помощью генератора?

In [5]:
M1 = [[n for n in range(5)] for m in range(5)]
print('Матрица М1 - квадратная, состоит из повторяющихся строк:', *M1, sep='\n')
M2 = [[m * n for n in range(5)] for m in range(4)]
print('Матрица Ь2 - не квадратная, в каждой строке разные элементы:', *M2, sep='\n')

Матрица М1 - квадратная, состоит из повторяющихся строк:
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
Матрица Ь2 - не квадратная, в каждой строке разные элементы:
[0, 0, 0, 0, 0]
[0, 1, 2, 3, 4]
[0, 2, 4, 6, 8]
[0, 3, 6, 9, 12]


In [6]:
from random import randrange

M3 = [[randrange(1, 101) for n in range(5)] for m in range(5)]
print('Матрица М3 содержит случайные числа:', *M3, sep='\n')

Матрица М3 содержит случайные числа:
[42, 88, 92, 40, 31]
[56, 22, 32, 39, 57]
[56, 89, 66, 75, 70]
[11, 82, 89, 27, 55]
[93, 74, 82, 98, 84]


In [8]:
n = 3
M4 = [[2] * m + [1] + [0] * (n - m - 1) for m in range(n)]
print('Также можно использовать сложение списков, чтобы собирать строки:', *M4, sep='\n')

Также можно использовать сложение списков, чтобы собирать строки:
[1, 0, 0]
[2, 1, 0]
[2, 2, 1]


## Кортежи

Кортежи - это такой тип данных в питоне, который очень похож на списки, ну очень, за тем исключением, что неизменяемый. 

    t = tuple([1, 2, 3])  # можно список превратить в кортеж
    t = (1, 2, 3)  # можно явно задать кортеж: кортежи обозначаются круглыми скобочками
    t = 1, 2, 3  # но на самом деле скобочки можно опустить. Питонисты так любят все опускать и сокращать...

### Множества

Множество - это тоже итерируемый изменяемый объект, как и список, но у него есть свои очень важные отличия. Множество имплементирует в питоне те самые множества из логики. 

Какие у него особенности:

1. Множество может содержать только неизменяемые (hashable) объекты. =>
2. Поэтому у элементов множества порядок не определен: нет индексов. 
3. Поэтому элементы множества содержатся только в одном экземпляре. 
4. Поэтому поиск элемента в множестве x in S работает за константное время О(с). 

Как это так? дело в том, что хешируемые объекты мы умеем почти мгновенно находить в памяти с помощью хеш-таблицы и их хеша: нам достаточно только знать про сам объект (литерал). Следовательно, множеству достаточно знать, что такой-то объект в него входит. Потому же объекты могут быть только уникальными - у них же нет индексов, чтобы мы еще могли разместить два одинаковых элемента с разными номерами. 

Из этого следует, что список множеств мы составить можем вполне, а вот множество списков - никак. Множество строк или кортежей, однако, вполне возможно. 

Как выглядит множество в питоне:

In [None]:
s = {1, 2, 3}

Как создать множество?

- Явно в коде:
  
        s = {1, 2, 3}
      
- Превратить в него что-нибудь:

        s = set([1, 2, 3])
        
- Использовать генераторное выражение:

        s = {x ** 2 for x in range(1, 4)}
        
- Создать пустое множество, а потом добавлять элементы:

        s = set()
        s.add(1)
        
**Обратите внимание: пустое множество можно задать только командой set(), потому что пустые фигурные скобки задают словарь. **

Какие операции можно делать с множествами:

In [19]:
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

In [20]:
print(f'union: A | B = {A | B}')
print(f'intersection: A & B = {A & B}')
print(f'difference: A - B = {A - B}, B - A = {B - A}')
print(f'symmetric difference: A ^ B = {A ^ B}')

union: A | B = {1, 2, 3, 4, 5, 6, 7, 8}
intersection: A & B = {4, 5}
difference: A - B = {1, 2, 3}, B - A = {8, 6, 7}
symmetric difference: A ^ B = {1, 2, 3, 6, 7, 8}


К любому из этих операторов можно приписать = и получить примерно то же, что +=, -= и так далее. 

Также у всех них есть свои альтернативные методы:

In [None]:
A.union(B)  # A | B
A.intersection(B)  # A & B
A.difference(B)  # A - B
A.symmetric_difference(B)   # A ^ B
A.update(B)  # A |= B
A.intersection_update(B) # A &= B
A.difference_update(B) # A -= B
A.symmetric_difference_update(B)  # A ^= B

In [None]:
A.add(elem) # добавляет элемент
A.discard(elem) # удаляет элемент
A.clear() # удаляет все элементы
A.copy() # создает копию множества

Наконец, у множеств есть свои методы, связанные с логическими операциями:

In [None]:
A.issubset(B) # A является подмножеством B? В том смысле, что все элементы А входят в B
A.issuperset(B) # A является надмножеством B?
A.isdisjoint(B) # A и B не пересекаются?

### Словари

Словари - итерируемые изменяемые объекты, которые в питоне еще относятся к типу mapping type. По сути, словарь состоит  из двух частей: ключей и значений. С одной стороны, словарь похож на список: с той только разницей, что у списка индексы, а у словаря вместо индексов ключи. С другой стороны, словарь похож на множество: его ключи устроены именно таким образом. 

Итак, словарь - это нечто вроде списка пар ключ-значение. Ключами словаря могут быть только неизменяемые объекты, как во множестве. В версиях питона старше 3.7 порядок ключей в словаре не определен, в более поздних - зависит от времени добавления ключа в словарь. Значениями словаря могут быть абсолютно любые объекты. 

Соответственно, повторяющихся ключей в словаре быть не может, а повторящиеся значения - вполне. 

Как выглядит словарь:

In [None]:
dct = {1: 4, 2: 8, 3: 'qwerty'}

Пары ключ: значение обязательно идут через двоеточие. 

Как можно задавать словарь:

1. Прямо в коде
2. Завести пустой словарь и записывать значения в ключи
3. Использовать метод класса dict.fromkeys()
4. Использовать представление словаря и генератор
5. Превратить в словарь другой объект (но не всякий...)

In [None]:
# 1
d = {1: 1, 2: 4}
# 2
d = dict() # d = {}
d[1] = 1
d[2] = 4
# 3
keys = [1, 2]
d = dict.fromkeys(keys, 0) # 0 - значение по дефолту. Если не передать этот аргумент, то по умолчанию будет значение None
# 4
d = {x: x ** 2 for x in range(1, 3)}
# 5
lstoftuples = [(1, 1), (2, 4)]
d = dict(lstoftuples)

Какие здесь есть особенности?

Обратите внимание, что метод dict.fromkeys на самом деле создает один объект (который мы указали по дефолту) и для всех ключей делает примерно это: key1 = default, key2 = default...

Соответственно, если у нас в дефолте изменяемый объект (список, множество, другой словарь), то **все** ключи будут в итоге ссылаться на один объект. Поэтому таким образом список с пустыми словарями вместо значений создать не удастся.

Какие объекты можно превращать в словари?

1. Список кортежей, в каждом кортеже 2 элемента
2. Результат работы функции enumerate
3. Результат работы функции zip

Enumerate:

    enumerate(iterable, 1) 
    
Первый аргумент функции - любой итерируемый объект, второй (необязательный) - число, с которого начинать нумерацию. Возвращает пары вида (0, elem1), (1, elem2).... Удобно использовать для итерации в цикле for:

    for num, elem in enumerate(lst):
        ....
        
Zip:

    zip(iterable1, iterable2...)
    
Работает, как застежка-молния на одежде: сопоставляет по группам элементы нескольких итерируемых объектов (первый с первым, второй со вторым...). На выходе получается список кортежей (только он оформлен как zip object, но его можно и в список превратить), причем в кортеже столько элементов, сколько было итерируемых аргументов. Для словаря нужно иметь два, очевидно. 

Если у итерируемых объектов, которые объединяет zip, разные длины, на выходе получается список наименьшей длины, хвосты отрезаются. Заполнять хвосты дефолтными значениями умеет функция zip_longest:

    from itertools import zip_longest
    
    zip_longest(*iterables, fillvalue=...)
    
Не забывайте, что если в кортежах есть первые повторяющиеся элементы, н-р, (1, 2), (1, 4), то в словаре окажется все равно только один ключ 1, и его значение будет таким, которое позднее всех попалось (4). 

Поскольку словарь - сложная двусоставная структура, можно обращаться к его частям отдельно. При этом части сами по себе не существуют, но мы можем их посмотреть друг без друга. Это называется view objects: изменять их мы не можем, но можем по ним итерироваться или создавать какие-то новые объекты на их базе. Всего их три:

1. dict.keys()
2. dict.values()
3. dict.items()

Соответственно, итерироваться мы можем по любому из трех. Обратите внимание, что цикл for умеет итерироваться по нескольким переменным сразу, тогда они указываются через запятую:

    for k, v in dct.items()
    
При этом, если мы пишем просто dct, то по умолчанию питон считает, что имелось в виду dct.keys(), поэтому list(dct) вернет список из ключей, а for будет итерироваться по key. 

Когда мы обращаемся к несуществующему ключу словаря, питон вываливает ошибку KeyError. Если ключа еще нет в словаре, все, что мы можем сделать - это присвоить в него какое-то значение:

    dct[key] = value
    
Любые другие операции вызовут ошибку. Чтобы ее избежать, можно проверять ключ на наличие: key in dct. (== key in dct.keys()).

Существуют еще некоторые методы, которые позволяют это обходить.

Какие функции можно использовать со словарями?

    len()
    list()
    set()
    reversed()
    sorted()
    ...

Методы словарей

clear() - очистит словарь
copy() - создаст явную копию
pop(key) - удалит ключ и значение key и вернет этот ключ
popitem() - удалит и вернет последний добавленный элемент (в версиях старше 3.7 - рандомный)
update() - добавит один словарь в другой, если в первом словаре были ключи, которые есть во втором, значения ключей второго перезапишут первые. 
setdefault(k, v) - если ключ уже есть, просто вернет его значение, а если нет, то заведет такой ключ и запишет значение v.
get(key) - вернет значение ключа, а если ключа нет, вернет None.

Ключи со значениями также можно удалять с помощью del:

    del dct[key]

В библиотеке collections (идет вместе с питоном) также есть два класса, созданных на основе класса словаря: defaultdict и Counter.

defaultdict(type) - принимает в качестве аргумента имя класса (list, str, int, float...). Работает точно так же, как обычный словарь, за единственным исключением: если мы обращаемся по несуществующему ключу, не выдает KeyError, а считает, что в значении должен быть пустой объект указанного класса. 

In [1]:
from collections import defaultdict

d = defaultdict(list)
print(d)
print(d[1], d[2])
print(d)

defaultdict(<class 'list'>, {})
[] []
defaultdict(<class 'list'>, {1: [], 2: []})


При этом, если указать изменяемый объект в качестве дефолтного, то для ключей будут создаваться индивидуальные объекты: два пустых списка в коде выше - это разные списки. 

Counter заточен под то, чтобы считать элементы в других объектах. В него можно напрямую аргументом передать итерируемый объект, элементы которого хотим посчитать:

In [2]:
from collections import Counter

lst1 = [1, 2, 3, 4, 1, 2, 3, 1, 2, 1]
lst2 = [1, 2, 3, 4, 1, 2, 3, 1, 1, 1]
c1 = Counter(lst1)
print(c1)
c2 = Counter(lst2)
print(c2)
total = c2 + c1
print(total)
print(total - c2)

Counter({1: 4, 2: 3, 3: 2, 4: 1})
Counter({1: 5, 2: 2, 3: 2, 4: 1})
Counter({1: 9, 2: 5, 3: 4, 4: 2})
Counter({1: 4, 2: 3, 3: 2, 4: 1})


У Counter еще есть метод most_common(), который возвращает n самых частотных объектов, по умолчанию - 100. 