https://docs.python.org/3/tutorial/index.html

# 5.4. Наборы

Python также включает тип данных для наборов. Набор - это неупорядоченная коллекция без повторяющихся элементов. Основные области применения включают проверку принадлежности и устранение повторяющихся записей. Объекты Set также поддерживают математические операции, такие как объединение, пересечение, разность и симметричная разность.


Для создания наборов можно использовать фигурные скобки или функцию set(). Примечание: чтобы создать пустой набор, вы должны использовать set(), а не {}; последний создает пустой словарь, структуру данных, которую мы обсудим в следующем разделе.

Вот краткая демонстрация:

In [11]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)                      # show that duplicates have been removed
{'orange', 'banana', 'pear', 'apple'}
'orange' in basket                 # fast membership testing
True
'crabgrass' in basket
False

# Demonstrate set operations on unique letters from two words

a = set('abracadabra')
b = set('alacazam')
a                                  # unique letters in a
{'a', 'r', 'b', 'c', 'd'}
a - b                              # letters in a but not in b
{'r', 'd', 'b'}
a | b                              # letters in a or b or both
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
a & b                              # letters in both a and b
{'a', 'c'}
a ^ b                              # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}

{'banana', 'pear', 'orange', 'apple'}


{'b', 'd', 'l', 'm', 'r', 'z'}

Аналогично понятиям списка, также поддерживаются определения набора:


In [12]:
a = {x for x in 'abracadabra' if x not in 'abc'}
a
{'r', 'd'}

{'d', 'r'}

# 5.5. Словари¶

Другим полезным типом данных, встроенным в Python, является словарь (см. Отображение типов — dict). Словари иногда встречаются в других языках как “ассоциативная память” или “ассоциативные массивы”. В отличие от последовательностей, которые индексируются диапазоном чисел, словари индексируются ключами, которые могут быть любого неизменяемого типа; строки и числа всегда могут быть ключами. Кортежи можно использовать в качестве ключей, если они содержат только строки, числа или кортежи кортежей; если кортеж содержит какой-либо изменяемый объект прямо или косвенно, он не может использоваться в качестве ключа. Вы не можете использовать списки в качестве ключей, поскольку списки могут быть изменены на месте с помощью назначений индексов, назначений фрагментов или таких методов, как append() и extend().


Лучше всего представлять словарь как набор пар ключ: значение с требованием, чтобы ключи были уникальными (в пределах одного словаря). Пара фигурных скобок создает пустой словарь: {}. Помещение списка пар ключ:значение, разделенных запятыми, в фигурные скобки добавляет начальные пары ключ:значение в словарь; это также способ записи словарей на выходе.


Основными операциями со словарем являются сохранение значения с некоторым ключом и извлечение значения, заданного ключом. Также возможно удалить пару ключ:значение с помощью del. Если вы сохраняете, используя ключ, который уже используется, старое значение, связанное с этим ключом, забывается. Извлечение значения с использованием несуществующего ключа является ошибкой.


Выполнение list(d) в словаре возвращает список всех ключей, используемых в словаре, в порядке вставки (если вы хотите, чтобы он был отсортирован, просто используйте вместо этого sorted(d)). Чтобы проверить, есть ли в словаре один ключ, используйте ключевое слово in.


Вот небольшой пример использования словаря:

In [15]:
tel = {'jack': 4098, 'sape': 4139}
tel['guido'] = 4127
tel
{'jack': 4098, 'sape': 4139, 'guido': 4127}
tel['jack']
4098
del tel['sape']
tel['irv'] = 4127
tel
{'jack': 4098, 'guido': 4127, 'irv': 4127}
list(tel)
['jack', 'guido', 'irv']
sorted(tel)
['guido', 'irv', 'jack']
'guido' in tel
True
'jack' not in tel
False

False

Конструктор dict() создает словари непосредственно из последовательностей пар ключ-значение:

In [16]:
dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'guido': 4127, 'jack': 4098}

{'sape': 4139, 'guido': 4127, 'jack': 4098}

Кроме того, понимание dict может использоваться для создания словарей из произвольных выражений ключей и значений:

In [17]:
{x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}

{2: 4, 4: 16, 6: 36}

Когда ключи представляют собой простые строки, иногда проще указать пары, используя аргументы ключевых слов:

In [19]:
dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'guido': 4127, 'jack': 4098}

{'sape': 4139, 'guido': 4127, 'jack': 4098}

# 5.6. Методы создания циклов

При циклическом просмотре словарей ключ и соответствующее значение могут быть извлечены одновременно с помощью метода items().

In [1]:
knights = {'gallahad': 'the pure', 'robin': 'the brave'}
for k, v in knights.items():
    print(k, v)

gallahad the pure
robin the brave

SyntaxError: invalid syntax (2118017273.py, line 5)

При циклическом просмотре последовательности индекс позиции и соответствующее значение могут быть получены одновременно с помощью функции enumerate().

In [2]:
for i, v in enumerate(['tic', 'tac', 'toe']):
    print(i, v)

0 tic
1 tac
2 toe

SyntaxError: invalid syntax (3734447555.py, line 4)

Чтобы выполнить цикл по двум или более последовательностям одновременно, записи могут быть соединены с помощью функции zip().

In [3]:
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']
for q, a in zip(questions, answers):
    print('What is your {0}?  It is {1}.'.format(q, a))

What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.

SyntaxError: invalid syntax (2754036754.py, line 6)

Чтобы выполнить цикл по последовательности в обратном направлении, сначала укажите последовательность в прямом направлении, а затем вызовите функцию reversed().

In [4]:
for i in reversed(range(1, 10, 2)):
    print(i)

9
7
5
3
1

9
7
5
3
1


1

Чтобы выполнить цикл по последовательности в отсортированном порядке, используйте функцию sorted(), которая возвращает новый отсортированный список, оставляя исходный без изменений.

In [5]:
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for i in sorted(basket):
    print(i)

apple
apple
banana
orange
orange
pear

apple
apple
banana
orange
orange
pear


NameError: name 'apple' is not defined

Использование set() для последовательности устраняет повторяющиеся элементы. Использование sorted() в сочетании с set() для последовательности - это идиоматический способ перебора уникальных элементов последовательности в отсортированном порядке.

In [6]:
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
    print(f)

apple
banana
orange
pear

apple
banana
orange
pear


NameError: name 'apple' is not defined

Иногда возникает соблазн изменить список во время циклического просмотра; однако часто проще и безопаснее вместо этого создать новый список.

In [7]:
import math
raw_data = [56.2, float('NaN'), 51.7, 55.3, 52.5, float('NaN'), 47.8]
filtered_data = []
for value in raw_data:
    if not math.isnan(value):
        filtered_data.append(value)

filtered_data
[56.2, 51.7, 55.3, 52.5, 47.8]

[56.2, 51.7, 55.3, 52.5, 47.8]

# 5.7. Подробнее об условиях¶

Условия, используемые в операторах while и if, могут содержать любые операторы, а не только сравнения.


Операторы сравнения in и not in являются тестами на принадлежность, которые определяют, находится ли значение в контейнере (или нет). Операторы is и is not сравнивают, действительно ли два объекта являются одним и тем же объектом. Все операторы сравнения имеют одинаковый приоритет, который ниже, чем у всех числовых операторов.

Сравнения могут быть цепными. Например, a < b == c проверяет, меньше ли a, чем b, и, более того, b равно c.


Сравнения могут быть объединены с использованием логических операторов and и or, и результат сравнения (или любого другого логического выражения) может быть отменен с помощью not. Они имеют более низкие приоритеты, чем операторы сравнения; между ними not имеет наивысший приоритет и / или наименьший, так что A, а не B или C эквивалентно (A и (не B)) или C. Как всегда, круглые скобки можно использовать для выражения желаемой композиции.


Логические операторы and и or являются так называемыми операторами короткого замыкания: их аргументы вычисляются слева направо, и вычисление прекращается, как только определен результат. Например, если A и C равны true, но B равно false, A, B и C не вычисляют выражение C. При использовании в качестве общего значения, а не логического, возвращаемое значение оператора короткого замыкания является последним вычисленным аргументом.


Переменной можно присвоить результат сравнения или другое логическое выражение. Например,


In [2]:
string1, string2, string3 = '', 'Trondheim', 'Hammer Dance'
non_null = string1 or string2 or string3
non_null
'Trondheim'

'Trondheim'

Обратите внимание, что в Python, в отличие от C, присваивание внутри выражений должно выполняться явно с помощью оператора walrus :=. Это позволяет избежать общего класса проблем, встречающихся в программах на C: ввод = в выражении, когда предполагалось ==.


# 5.8. Сравнение последовательностей и других типов

Объекты последовательности обычно можно сравнивать с другими объектами с тем же типом последовательности. При сравнении используется лексикографический порядок: сначала сравниваются первые два элемента, и если они различаются, это определяет результат сравнения; если они равны, сравниваются следующие два элемента, и так далее, пока не будет исчерпана любая последовательность. Если два сравниваемых элемента сами по себе являются последовательностями одного типа, лексикографическое сравнение выполняется рекурсивно. Если все элементы двух последовательностей сравниваются одинаково, последовательности считаются равными. Если одна последовательность является начальной подпоследовательностью другой, то более короткая последовательность является меньшей (lesser). Лексикографический порядок строк использует номер кодовой точки Unicode для упорядочивания отдельных символов. Некоторые примеры сравнений между последовательностями одного типа:



In [3]:
(1, 2, 3)              < (1, 2, 4)
[1, 2, 3]              < [1, 2, 4]
'ABC' < 'C' < 'Pascal' < 'Python'
(1, 2, 3, 4)           < (1, 2, 4)
(1, 2)                 < (1, 2, -1)
(1, 2, 3)             == (1.0, 2.0, 3.0)
(1, 2, ('aa', 'ab'))   < (1, 2, ('abc', 'a'), 4)

True

Обратите внимание, что сравнение объектов разных типов с помощью < или > допустимо при условии, что объекты имеют соответствующие методы сравнения. Например, смешанные числовые типы сравниваются в соответствии с их числовым значением, поэтому 0 равно 0.0 и т.д. В противном случае, вместо предоставления произвольного порядка, интерпретатор вызовет исключение TypeError.



Примечания

[1]
Другие языки могут возвращать измененный объект, который позволяет связывать методы, такие как d->insert("a")->remove("b")->sort();.