![logo](img/attract_attention_picture.jpeg)

# Типы данных в `Python`

## Содержание

* Встроенные типы данных
* Числовые типы данных
* Строковый тип данных
* Списки и кортежи
* Словари и множества

**Определение.** *Объект* &ndash; некоторая сущность, служащая контейнером для данных (атрибутов) и программного кода управляющего доступом к этим данным (методов). Атрибуты и методы называют *членами объекта*.

**Определение.** *Тип данных* &ndash; класс данных, характеризуемый членами объектов класса и операциями, которые могут быть к этим объектам применены. Объекты будем называть *экземплярами классов*.

Тип данных определяет:
- внутреннее представление данных $\Rightarrow$ множество их возможных значений;
- допустимые действия над данными $\Rightarrow$ операции и методы

Объект &ndash; это не какая-то замысловатая сущность. Это набор данных и функций &ndash; таких же, как в императивном программировании. Можно представить, что просто взяли кусок программы и положили его в ящик и закрыли крышку. Вот этот закрытый ящик (называемый черным ящиком) &ndash; это объект.

Программисты договорились, что данные внутри объекта будут называться атрибутами, а функции &ndash; методами. Но это просто слова, по сути это те же переменные и функции.

Объект можно представить как независимый электроприбор у вас на кухне. Чайник кипятит воду, плита греет, блендер взбивает, мясорубка делает фарш. Внутри каждого устройства куча всего: моторы, контроллеры, кнопки, пружины, предохранители &ndash; но вы о них не думаете. Вы нажимаете кнопки на панели каждого прибора, и он делает то, что от него ожидается. И благодаря совместной работе этих приборов можно приготовить пищу.

Класс &ndash; это шаблон кода, по которому создаётся какой-то объект. Это как рецепт приготовления блюда или инструкция по сборке мебели: сам по себе класс ничего не делает, но с его помощью можно создать новый объект и уже его использовать в работе.

Далее будем использовать понятия класс и тип данных, как синонимы.

**Определение.** Литерал &ndash; выражение специального вида, синтаксис которого генерирует объект.
**Определение.** Переменная &ndash; именованная область памяти, для которой может быть установлено значение, связывающее ее с объектом.
**Определение** Идентификатор &ndash; имя, присваиваемое методу, переменной или любому иному определяемому пользователем элементу программы.

Литерал &ndash; это запись в программе, которая соответствует некоторому фиксированному значению некоторого фиксированного типа. Например, если в программе написано 42, это объект-число 42 типа int.

Литерал также называют константой, по причине того, что один и тот же литерал всегда генерирует одинаковые объекты

**Определение.** Переменная &ndash; именованная область памяти, для которой может быть установлено значение.

Переменную называют так потому, что ее значение может быть изменено по ходу выполнения программы

## Встроенные типы данных

- Встроенные типы данных облегчают разработку программного обеспечения;
- Встроенные типы &ndash; это компоненты расширений;
- Встроенные типы эффективны;
- Встроенные объекты &ndash; это стандартная часть языка.

Давайте пройдемся по этим пунктам
1. Встроенные типы облегчают написание программ. При решении простых задач встроенные типы часто являются всем необходимым для представления структуры предметной области. Поскольку вы без дополнительных трудозатрат получаете мощные инструменты вроде коллекций (списков) и поисковых таблиц (словарей), которые сразу же можно использовать. В результате, исключительно с помощью встроенных типов Python, можно разрабатывать достаточно сложные программные продукты.
2. Встроенные типы данных являются компонентами расширений. Для более сложных задач может понадобиться предоставить собственные типы. Однако, реализуемые вручную объекты, строятся на основе встроенных типов. Например, тип данных *Stack* может быть реализован в виде класса, который управляет внутренним список.
3. Встроенные типы зачастую эффективнее пользовательских типов данных. Встроенные типы Python задействуют уже оптимизированные алгоритмы для работы со структурами данных, которые реализованы на **C**, чтобы обеспечивать высокое быстродействие. По этой причине, объектам, аналогичных пользовательских классов, трудно достичь уровня производительности встроенных.
4. Встроенные типы данных **Python** стандартизированны и сохраняют свою спецификацию. С другой стороны, сторонние классы имеют тенденцию к отличиям в реализациях, относящихся к разным версиям.

### Основные встроенные типы данных:
 - Числа (7382, 3.14, 3+4j, Decimal, Fraction)
 - Строки ('net', "your's")
 - Списки ([1, [2, 'three'], 4])
 - Словари ({'Alex': 2, 'Brian': 4})
 - Кортежи ('Leo', 21.7, 'single')
 - Множества (set(1,2,3), {'a', 'b', 'c'})
 - Логический тип (**False**, **True**)
 - Файлы (open('myfile', 'r'))

Проведем краткий обзор основных типов данных, их литералов и способов создания их объектов.

- Числовые литералы могут 5 числовым типам: **Integer** (целые), **Float** (вещественные), **Complex** (комплексные), десятичные дроби фиксированной точночти (обеспечивают поддержку правильного округления десятичной арифметики с плавающей точкой) и рациональные.
- Строковые литералы представлют собой упорядоченные последовательности символов, обрамляемыми одинарными или двойными кавычками.
- Литералами списков являются последовательности объектов в квадратных скобках, отделяющихся друг от друга запятыми.
- Литералы словаря обрамляются фигурными скобками. Элементами словаря являются пары объектов (ключ и значение), отделяющиеся друг от друга двоеточием. Разные элементы словаря разделены запятыми.
- Литералы кортежей идентичны списковым литералам и отличаются только заменой квадратных скобок на круглые.
- Логические литералы кодируются ключевыми словами **False** и **True**, ложь и истина, соотвтетственно.
- Литералы множества могут быть представлены в двух различных видах. Это специальное слово set c перечисленными в круглых скобках элементами множества или перечисление элементов в фигурных скобках.
- Файлы создаются при помощи вызова функции **open**.
- Прочие встроенные типы (**None**, конструкторы соотвектствующих классов).

### Динамическая типизация

Типы данных в языке Python определяются автоматически во время выполнения, а не в результате
объявлений в программном коде. Переменные создаются при выполнении операции присваивания,
могут ссылаться на объекты любых типов и им должны быть присвоены некоторые значения, прежде
чем к ним можно будет обратиться.

### Пример

In [None]:
a = 3

<center>
    <img src="img/link.png" height="240" width="860">
</center>

Рассмотрим приведенный пример. В памяти создается целочисленный объект число $3$ и создается ссылка на адрес этого объекта в памяти. После чего в системной таблице создается переменная `a`, в которую и записывается значение ссылки.

Физически ссылка представляет собой адрес, по которому можно найти переменную в памяти.



### Уточнение терминов

- Ссылки &ndash; это указатели на объекты.
- Переменные &ndash; это записи в системной таблице, где предусмотрено место для хранения ссылок на объекты.
- Объекты &ndash; это области памяти с объемом, достаточным для представления значений этих объектов. Каждый объект имеет стандартные атрибуты: **\_\_class\_\_** для хранения информации о типе объекта, и счетчик ссылок **ob\_refcnt**, используемый для определения момента, когда память, занимаемая объектом, может быть освобождена.

## Числовые типы данных

 - Целые числа (int): $122$, $-4$, $99999999999$, $0{\rm o}177$, $0{\rm x}9{\rm ff}$, $0{\rm b}101010$;
 - Вещественные числа (float): $1.0$, $3.14$, $.5$, $4{\rm E}21$, $4.0{\rm e}21$;
 - Комплексные числа (complex): $3 + 4{\rm j}$, $3.0 + 4.0{\rm j}$;
 - Десятичные числа decimal.Decimal('$0.1$');
 - Рациональные числа: fractions.Fraction($3$, $4$).

Представление чисел в *Python* довольно-таки естественное. Набор основных объектов Python включает ожидаемые типы: целые числа, не имеющие дробной части, числа с плавающей точкой, которые имеют дробную часть, и более экзотические типы — комплексные числа с мнимой частью, десятичные числа с фиксированной точностью, рациональные числа с числителем и знаменателем. Встроенных чисел вполне достаточно для представления большинства числовых величин (от вашего возраста до сальдо вашего банковского счета).

Несмотря на предложение некоторых причудливых вариантов, основные числовые типы Python, в общем-то стандартны.
 
 - Целочисленные значения кодируются целочисленными литералами ($122$, $-4$, $99999999999$), а также восьмеричными ($0{\rm o}177$), шестнадцатиричными ($0x9{\rm ff}$) и двоичными ($0{\rm b}101010$).
 - Кроме стандартных вещественных литералов: ($1.0$, $3.14$, $.5$) используется экспоненциальная форма записи $4{\rm E}21$, $4.0{\rm e}21$.
 - Комплексные числа кодируются следующими записями: 3 + 4j, 3.0 + 4.0j, где символ $j$ означает мнимую единицу. Здесь Python следует инженерным обозначениям, а не классической математической нотацией, в которой мнимую единицу обозначают символом $i$;
 - Десятичные числа decimal.Decimal('0.1')
 - При записи рациональных чисел, первое число отвечает за числитель, а второе за знаменатель.
 
Числа в Python поддерживают обычные математические операции. Например, плюс $+$ выполняет сложение, звездочка $*$ используется для умножения, а две звездочки $**$ применяются для возведения в степень. Далее мы рассмотрим их использование на примерах

### Примеры арифметических операций над целыми числами

Целые числа в *Python 3* ничем не отличаются от обычных чисел. Они поддерживают набор самых обычных математических операций. Здесь следует обратить внимание на целочисленное деление и вычисление остатка

In [None]:
3+4

In [None]:
2*2

In [None]:
2**8

In [None]:
5//2

In [None]:
5%2

### Примеры арифметических операций над вещественными числами

Здесь приведены примеры арифметических операций над вещественными числами. Следует обратить внимание на особенности реализации арифметических операций связанные с ограничением объема памяти, выделяемой для записи вещественных чисел в первом случае. А во втором примере результатом деления двух целых чисел будет вещественое число, в отличие от таких языков, как Java, C\# или Python 2

In [None]:
.1+.2

В *Python 3* результатом деления двух целых чисел будет вещественное число

In [None]:
5/2

### Примеры арифметических операций над комплексными числами

Здесь все очевидно. Арифметические операции над комплексными числами возвращают нам комплексные числа

In [None]:
2+3j+4+5j

In [None]:
(2+3j)*(4+5j)

In [None]:
(2+3j)/(4+5j)

### Примеры арифметических операций над числами фиксированной точности

Появлению чисел с фиксированной точностью (Decimal) способствовали особенности представления вещественных чисел, которые обусловлены ограничением объема памяти, выделяемого для хранения вещественных чисел. Например, строго, следующая сумма должна быть равной $0$, однако это не так. В этом случае и приходят на помощь числа с фиксированной точностью. Данные числа синтаксически создаются из вызываемого модуля Decimal и литерального представления не имеют. Функционально числа с фиксированной точностью напоминают вещественные, но с фиксированным количеством знаков после запятой, отсюда и название. Итак, используя числа с фиксированной точностью для решения предыдущего примера получаем точный результат.

In [None]:
0.3 + 0.3 + 0.3 - 0.9

In [None]:
from decimal import Decimal
Decimal('0.3') + Decimal('0.3') + Decimal('0.3') - Decimal('0.9')

In [None]:
print(1/3)
from decimal import Decimal
from decimal import getcontext
getcontext().prec = 3
print(Decimal('1') / Decimal('3'))
Decimal('1') / 3 == Decimal('0.333')

Также имеется возможнось переопределять точность с помощью менеджера контекста

### Рациональные числа

Рациональное число –- это число, которое можно представить в виде рациональной дроби числитель и знаменатель которой имеет целочисленное значение. В языке программирования Python для работы с рациональными числами предлагается класс Fraction. Для создания объекта задаются его числитель и знаменатель.

In [None]:
from fractions import Fraction

a = Fraction(5, 6) # a = 5/6
b = Fraction(8, 12) # b = 2/3

c = a + b

print(c)

### Операции с числовыми типами данных

Давайте теперь обобщим набор операций с числовыми типами данных и представим их на следующей таблице

<center>
    <img src="img/operations.png">
</center>

### Приоритет арифметических операций

*Python* оперирует со стандартным порядком выполнения арифметичечских операций, но его можно изменить с помощью скобок.

In [None]:
default_order = 2 + 3*4
print(default_order)
user_order = (2 + 3)*4
print(user_order)

<img src="img/operations_priority.png">

В общем случае, приоритет операций в Python можно представить в таблице

## Строковый тип данных

**Определение.** Строкой в *Python* называется последовательность символов и управляющих последовательностей заключенная в двойные или одинарные кавычки.

In [None]:
my_string = "This is a double-quoted string."
my_string = 'This is a single-quoted string.'

При совместном использовании внутренние кавычки воспринимаются как символ, а внешние ограничивают строковый литерал

In [None]:
quote = "Лао Цзы однажды сказал, 'Лучшее знание — это незнание о том, что ты что-то знаешь.'"

print(quote)

### Разные регистры

Теперь рассмотрим пример преобразования символов строки к различным регистрам. Сначала используются методы приведения первого символа и всей строки к верхнему регистру. А следующий пример демонстрирует приведение всей строки к нижнему регистру.

In [None]:
first_name = 'john'

print(first_name)
print(first_name.title())
print(first_name.upper())

first_name = 'John'
print(first_name.lower())

Небольшое разъяснение:

upper(), lower() и title() &ndash; это методы объекта-строки *first_name*

Синтаксис вызова метода: variable_name.action()

action - это идентификатор метода, который можно вызвать для объекта, на который ссылается *variable_name*. В скобках могут указываться *аргументы* метода.


### Конкатенация строк

Конкатекнация или склеивание строк осуществляется с помощью оператора сложения. Он возвращает строку, состоящую из других строк, как показано в данном примере:

Что такое символы и кавычки понятно, про управляющие последовательности поговорим чуть позже

In [None]:
first_name = 'ada'
last_name = 'lovelace'
full_name = first_name + ' ' + last_name

message = full_name.title() + ' ' + "was considered the world's first computer programmer."

print(message)

### Некоторые управляющие последовательности

**Определение.** Управляющая последовательность &ndash; начинающаяся с обратной косой черты последовательность символов, которая встраивается в текст, для управления форматом, цветом и другими опциями вывода.

- "\t" &ndash; табуляция;
- "\n" &ndash; перенос строки;
- "\\\\" &ndash; обратный слеш (\\);
- "\\'" &ndash; апостроф;
- "\\"" &ndash; кавычка

Приведем пример использования управляющих последовательностей при формировании строки

In [None]:
s = "There is a tab \t and here \ncomes the new line!"
print(s)

### Операторы ввода и вывода

Для вывода в *Python* применяется функция функция *print*(). Внутри круглых скобок, через запятую, указывается произвольное количество строк

Для печати значений в *Python* применяется функция функция *print*(). Внутри круглых скобок, через запятую, указывается произвольное количество строк. И несмотря на то, что функция *print* может принимать любые объекты, по факту, перед выводом, осуществляется преобразование данных объектов в строковые 

In [None]:
print("Hello world!")
print(1,2,3)
print(2**8)

Для ввода *Python* использует функцию *input*(). Данная функция считывает одну строку

In [None]:
print('Как вас зовут?')
name = input()
print('Здравствуйте, ' + name + '!')
print(type(name))

Кроме того, *input*() может принимать в качестве параметра строку-приглашение, которая выводится при вызове функции. Заметим, что функция *input*() возвращает строку

In [None]:
age_str = input("Введите ваш возраст: ")
age_int = int(age_str)
print(age_int)
print(type(age_str))
print(type(age_int))

### Форматирование строк

Рассмотрим следующий практический пример. Предположим, что мы формируем электронную анкету, которую заполняет пользователь, а программа выводит на экран введенные данные, чтобы пользователь мог их проверить. Вначале пользователь вводит имя и возраст.

 на то, как подставлять значения в уже имеющийся текстовый шаблон, то есть форматировать строки.

In [None]:
name = input("Введите Ваше имя: ")
age = int(input("Введите Ваш возраст: "))

In [None]:
result = "Ваше имя: "+ name+". Ваш возраст: "+str(age)+"."
print(result)

Данную задачу можно решить при помощи конкатенации строк. Однако решение получается громоздким и не наглядным. Более удачным представляется использование форматирования строк

In [None]:
result = "Ваше имя: %s. Ваш возраст: %i." % (name, age)
print(result)

Здесь оператор `%` в строке указывает позицию, в которую будет осуществлена вставка значения, а буквы после процента &ndash; спецификаторы типов данных (s – от **str** и i – от **int**); оператор `%` после строки отделяет строку от кортежа объектов, строковые представления которых подставляются на указанные позиции в строке в порядке следования

In [None]:
result = "Ваше имя: %s. Ваш возраст: %s." % (name, age)
print(result)

In [None]:
result = "Ваше имя: %i. Ваш возраст: %s." % (name, age)
print(result)

Создавая такие текстовые шаблоны, нужно обращать внимание на типы объектов, значения которых мы подставляются. И это мы продемонстрируем на двух примерах. В первом примере код сработал: поскольку интерпретатор неявно преобразовал целочисленный возраст в строку. Во втором примере возникло исключение. Неявно преобразовать строку `name` в целое число не получается, поэтому интерпретатор отказался выполнять данный код.

In [None]:
height = float(input("Введите Ваш рост (в метрах): "))
result = "Ваш рост: %f м." % height
print(result)

Рассмотрим еще один спецификатор для типа *float*. По умолчанию при подстановке значений типа *float* выводится число с шестью знаками после запятой. Но это можно скорректировать. Перед `f` нужно поставить точку и указать число знаков после запятой, которое мы хотим получить. В случае, если указанное число знаков после запятой меньше, чем есть на самом деле (как в примере), происходит округление отбрасывание разрядов.

In [None]:
result = "Ваш рост: %.2f м." % height
print(result)

### f-strings
При использовании *f-strings*, вместо `%` и неочевидного спецификатора типа просто указывается объект в фигурных скобках, чье строковое представление подставляется в шаблон, а перед всей строкой добавляетя спецификатор `f`, обозначающий *f-string*.

Приведенный способ форматирования строк считается стандартным, но устаревшим. В Python 3 есть применяется альтернативный способ: форматирование с помощью метода .*format*(). А в Python 3.6 и более поздних версиях появился более совершенный способ форматирования строк &ndash; *f-strings* *(formatted string literals)*.

In [None]:
result = f"Ваше имя: {name}. Ваш возраст: {age}. Рост: {height} м"

print(result)

## Списки (`lists`)

**Определение.** Список &ndash; упорядоченная изменяемая последовательность объектов произвольных классов.

Элементы списка перечисляются в квадратных скобках через запятую. Создадим два списка: пользователей некоторого сайта и их возрастов.

In [None]:
users = ["cotique", "miptgirl", "yorko", "vradchenko"]
ages = [18, 25, 32, 30]
print(users)
print(ages)

В списке могут совместно размещаться элементы разных типов. Допустим, неряшливый программист поместил в один список возраст пользователей и город-локацию вместе

In [None]:
mix = [18, "Oslo", 25, "New York", 32, "London", 30, "Havana"]
print(mix)

У всех списков есть атрибут, хранящий количество элементов в нем. Получить значение этого атрибута можно с помощью функции *len*()

In [None]:
len(mix)

In [None]:
ages[0]

Порядковый номер элемента в списке называется индексом. Далее, чтобы не путаться, будем разделять термины: порядковые числительные останутся для обозначения номера элемента в нашем обычном понимании, а индексы – для обозначения номера элемента в Python. Например, если нас будет интересовать элемент 25 из списка `age`, мы можем сказать, что нас интересует второй элемент или элемент с индексом 1.

In [None]:
print(ages[0], ages[2])

Если элемент с интересующим индексом отсутствует в списке, то интерпретатор *Python* генерирует исключение `IndexError`

In [None]:
ages[8]

Для обращения к последнему элементу списка, таким образом, чтобы код работал при изменении длины списка используется конструкция: 

In [None]:
ages[len(ages) - 1]

Также в *Python* поддержвается отрицательная индексация. При задании отрицательного индекса последний элемент имеет индекс $-1$, предпоследний $-2$ и т.д., до первого элемента списка. Таким образом, при отрицательной индексации выполняется обратная индексация элементов

In [None]:
print(ages)

In [None]:
ages[-2]

## Кортежи (`tuples`)

**Определение.** Кортеж &ndash; упорядоченная неизменяемая последовательность объектов произвольных классов.

Кортежи встречаются не только в программировании, но и в математике. В математике под кортежем понимают упорядоченное множество. В *Python* кортеж относится к не изменяемым последовательностям.

Внешне кортежи не сильно отличаются от списков. Единственное внешнее отличие ‒ элементы кортежа заключаются в круглые, а не в квадратные скобочки.

In [None]:
sequence = (2, 4, 8, 16, 32)

In [None]:
sequence[0]

К элементам кортежа можно обращаться точно так же, как к элементам списка

In [None]:
sequence[2] = 27

Но, несмотря на кажущееся сходство, кортежи и списки – принципиально разные объекты. Главное отличие кортежей от списков заключается в том, что кортежи – неизменяемые структуры данных. Другими словами, изменять элементы кортежа нельзя.

In [None]:
l_sequence=list(sequence)
print(l_sequence)

In [None]:
t_sequence = tuple(l_sequence)
print(t_sequence)

 В *Python* можно выполнять преобразования из кортежа в список и в обратную сторону

## Словари

**Определение.** Словарь &ndash; неупорядоченная последовательность пар (ключ: значение)

Словарь - это способ хранения информации, которая каким-то образом связана. Словари хранят информацию в виде пары *ключ - значение*, то есть, каждая часть информации соединена как минимум с одним значением.

Словари не хранят информацию в каком-то определенном порядке, поэтому не факт, что вы получите информацию в том порядке, в котором вы ее добавили.

#### Общий синтаксис

dictionary_name = {key_1: value_1, key_2: value_2, key_3: value_3}

dictionary_name = {key_1: value_1,
                   key_2: value_2,
                   key_3: value_3,
                   }

В общем виде словарь в Python выглядит так. Поскольку пара *ключ-значение* может занимать довольно большое место на экране зачастую используют 2-ю форму

### Пример

In [None]:
python_words = {'list': 'A collection of values that are not connected, but have an order.',
                'dictionary': 'A collection of key-value pairs.',
                'function': 'A named set of instructions that defines a set of actions in Python.',
                }

print(python_words)

In [None]:
print("\nWord: %s" % 'list')
print("Meaning: %s" % python_words['list'])
      
print("\nWord: %s" % 'dictionary')
print("Meaning: %s" % python_words['dictionary'])

print("\nWord: %s" % 'function')
print("Meaning: %s" % python_words['function'])

Для обращения к элементу достаточно указать имя словаря и значения ключа в квадратных скобках.

### Стандартные операции со словарями

Есть ряд стандартных операций: добавление, изменение и удаление

#### Добавление новой пары

In [None]:
python_words = {}

python_words['list'] = 'A collection of values that are not connected, but have an order.'
python_words['dictionary'] = 'A collection of key-value pairs.'
python_words['function'] = 'A named set of instructions that defines a set of actions in Python.'

print(python_words)

Для добавления новой пары необходимо к имени словаря в квадратных скобках вписать новый ключ и присвоить величину, с которой хотите связать ключ. Начнем с пустого словаря.

#### Изменение значения

In [None]:
python_words = {'list': 'A collection of values that are not connected, but have an order.',
                'dictionary': 'A collection of key-value pairs.',
                'function': 'A named set of instructions that defines a set of actions in Python.',
                }
print('dictionary: ' + python_words['dictionary'])

python_words['dictionary'] = 'A collection of key-value pairs. Each key can be used to access its corresponding value.'

print('\ndictionary: ' + python_words['dictionary'])

В какой-то момент приходится изменять значения в словаре. Изменение значения очень похоже на изменени элемента списка. Имя словаря[ключ] и присваиваем новое значение

#### Удаление

In [None]:
python_words = {'list': 'A collection of values that are not connected, but have an order.',
                'dictionary': 'A collection of key-value pairs.',
                'function': 'A named set of instructions that defines a set of actions in Python.',
                }
del python_words['list']

print(python_words)

Для удаления можно использовать `del`

#### Изменение ключей

Изменение ключа делается следующим способом:
- Создать новый ключ и скопировать значение к новому ключу.
- Удалить старую пару (ключ: значение).

Посмотрим как это выглядит на примере. 

Для изменения ключа не предусмотрено специальных средств, поэтому это изменение выполняется следующим образом
1. Создается новый ключ и копируется значение к новому ключу.
2. Удаляется старый ключ, который удалит и значение.
Посмотрим как это выглядит на примере. 

In [None]:
python_words = {'dict': 'A collection of values that are not connected, but have an order.'}

python_words['list'] = python_words['dict']
del python_words['dict']

print(python_words)

## Множества

В ряде случаев бывает удобно полтзоваться таким объектом, как множество (`sets`) и выполнять операции, которые определены для множеств в математике: пересечение, объединение, разность и так далее.

In [None]:
set()  # пустое множество
set([1, 2, 6])  # множество, полученное из списка

In [None]:
set([1, 2, 6, 6, 1, 2])  # исключили повторы

Важно иметь в виду, что в множествах (как в программировании, так и в математике) не может быть повторяющихся элементов. Поэтому, если в списке есть повторяющиеся значения, и они важны, превращать спискок в множество не стоит, так как можно потерять элементы.

#### Операции над множествами

А теперь превратим два числовых списка в множества A и B и попробуем произвести некоторые операции.

In [None]:
A = set([1, 2, 4, 6])
B = set([2, 3, 6, 8])

Пересечение множеств A и B – общие элементы этих двух множеств ($A \cap B$):

In [None]:
A.intersection(B)

Объединение множеств A и B – все элементы множества A и множества B, конечно, без повторений ($A \cup B$):

In [None]:
A.union(B)

Разность множеств A и B – все элементы множества A, которых нет в B ($A\text{\\}B$).

In [None]:
A.difference(B)

Разность множеств B и A – все элементы множества B, которых нет в A ($B\text{\\}A$).

In [None]:
B.difference(A)

Симметрическая разность множеств A и B – все элементы А и B, которые не входят в пересечение этих множеств:

In [None]:
A.symmetric_difference(B)

На множествах определены особые методы, которые облегчают сравнение наборов элементов. Например, можно проверить, являются ли множества A и B непересекающимися (не имеющими общих элементов):

In [None]:
A.isdisjoint(B)  # joint - пересекающиеся, disjoint - непересекающиеся

Или проверить, является ли множество A подмножеством B (все элементы A входят в B):

In [None]:
A.issubset(B)

Множество в Python, наверное, не такой распространенный объект как список, кортеж или словарь, но знать о них полезно, потому что в некоторых задачах использовать методы для множеств гораздо эффективнее, чем писать какие-то циклы с разными условиями.