# Python-1, Лекция 3

Лекторы: Петров Тимур, Фролов Андрей

## Множества

Скорее всего вы знаете, что такое множества, исходя из математики. Множество - это набор уникальных элементов.

Ну и что же в этом уникального, спросите вы? Можно же просто просто хранить список. А вот нет, тогда мы будем сильно проигрывать по времени. Давайте попробуем что-нибудь:

In [None]:
a = [i for i in range(100000)]
b = set(a) #создать множество можно из чего угодно

In [None]:
%%time

## Вот так можно замерить время

c = 10000
if c not in a:
    a.append(c)

CPU times: user 184 µs, sys: 0 ns, total: 184 µs
Wall time: 189 µs


In [None]:
%%time

## Вот так можно замерить время

c = 10000
if c not in b:
    b.add(c)

CPU times: user 6 µs, sys: 1 µs, total: 7 µs
Wall time: 11.4 µs


Опа и пожалуйста, экономия времени! Как это получается? На самом деле ответ кроется в том, как хранит элементы множество и список (список хранит просто в раличных ячейках памяти элементы, множество же занимается хэшированием, но про это вам расскажут на курсе алгоритмов)

А наша задача, в первую очередь, это вообще понять, как с ними работать. Итак, поехали:

* s.add(elem) - добавить элемент во множество (если элемент уже есть, то ничего не изменится)

* clear() - очистить множество

* copy() - скопировать множество

* s.discard(elem) / s.remove(elem) / s.pop() - разные методы удаления (первое - не ругнется, если попробовать убрать элемент не из множества, второй - ругнется, третий - просто вытаскивает рандомный элемент и возвращает его)

* difference / difference_update() / - - разность

* union() / | - объединение множеств

* intersection() / & - пересечение множеств

* issubset() / isdisjoint() / issuperset() - проверка на подмножество, наличие пересечений и проверка на супермножество (один находится в другом)

* symmetric_difference / ^ - симметричная разность

* len(s) - узнать число элементов во множестве

* ==, <=, >= - проверки на равенство (поэлементно), является ли одно множество под(над)множеством другого

Как можно заметить, можно использовать и операторы)

![](https://i.pinimg.com/originals/d3/59/3a/d3593ae3a7dbdccf9513d3aa5b608230.png)

In [None]:
a = {1,2,3,5} #а еще множества можно объявлять вот так
b = {4,5,6}

print(a.union(b), a | b)
print(a.intersection(b), a & b)
print(a.difference(b), a - b)
print(a.symmetric_difference(b), a ^ b)

{1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6}
{5} {5}
{1, 2, 3} {1, 2, 3}
{1, 2, 3, 4, 6} {1, 2, 3, 4, 6}


Есть такая штука, как difference_update. Как думаете, в чем разница?

In [None]:
print(a.difference(b), a)
print(a.difference_update(b), a)

{1, 2, 3} {1, 2, 3, 5}
None {1, 2, 3}


Поиграемся с удалениями элементов:

In [None]:
a.discard(5)
a.discard(5)
a.remove(3)
a.remove(3)

KeyError: ignored

In [None]:
while a:
    print(a.pop())

1
2


In [None]:
a.add([15,20]) #упс, а почему так нельзя?

TypeError: ignored

Как раз здесь нам значимо, что есть mutable и immutable типы данных. Как мы упоминали на первой лекции, отличие кортежа от списка в том, что одно - изменяемое, а другое - нет

Это играет большую роль в случае с хэшированием. Изменяемые объекты не хешируемы! А это значит, что их нельзя хранить в множествах и словарях (в словарях - в качестве ключей). Почему? А потому что принцип их работы зависит от того условия, что объекты нельзя изменить (только таким образом это работает быстро и так, как надо).

Ну хорошо, как же тогда быть? Использовать кортеж!

In [None]:
a.add((15, 20))
a

{(15, 20)}

Славно! А какие типы изменяемые, а какие нет? Давайте поделим:

1. Изменяемые:

* Списки

* Множества

* Словари

2. Неизменяемые:

* Строки

* Кортежи

* Числа

* Логические значения

Так что в целом не так все и плохо!

### FrozenSet

А теперь то же самое, но только сделаем так, чтобы set был неизменяемым (иногда это нужно)

In [None]:
a.add(frozenset({15, 20})) #жесть, так можно!
a

{(15, 20), frozenset({15, 20})}

Подерживает все те же операции, что и set, но которые его не меняют (нельзя изменить frozenset, на то он и нужен). Вы спросите: круто, а зачем? Ответ прост: использовать там, где нужны именно immutable объекты, например, в словарях!

## Словари

Ну хорошо, у нас есть множества, давайте пойдем чуть дальше. Допустим, что мы хотим иметь не просто множество, а еще уметь и считать, сколько раз тот или иной элемент встретился!

Можно ответить про Counter, конечно, но про это мы позже поговорим тоже, а сейчас давайте про уже встроенные методы. То есть что бы нам хотелось? Хранить некоторую пару "value" - "значение" (в нашем случае сколько раз встретилось)

Вот для этого и подходят словари! (почему словарь - аналогия с переводом)
Давайте создавать!

In [None]:
d = {1:5, 2:6, 3:7} #явно объявить можно вот таким образом, так же существует просто вызов dict()
d

{1: 5, 2: 6, 3: 7}

Все, что находится слева (до двоеточия) - это ключи (или же keys), все, что после - это значения (или же values)

In [None]:
print(d.keys(), d.values(), d.items())

dict_keys([1, 2, 3]) dict_values([5, 6, 7]) dict_items([(1, 5), (2, 6), (3, 7)])


Как обращаться по ключу? Абсолютно точно также, как и в списке (можно считать, будто это индексы):

In [None]:
d[3]

7

Но потом мы попробовали вот так:

In [None]:
d[4]

KeyError: ignored

И получили ошибку, что же делать? Для этого есть более "безопасный" вариант: get()

In [None]:
print(d.get(4)) #он выведет ничего, так как ничего и нет

None


Что можео быть в качестве значения? На самом деле что угодно!

Что может быть в качестве ключей? Только НЕизменяемые объекты

In [None]:
a = {"abc": set([1,2,3])}
a

{'abc': {1, 2, 3}}

Ну хорошо, создавать от руки мы умеем. А как теперь добавлять/удалять и так далее, что мы вообще можем делать со словарем?



In [None]:
d[4] = 100
d[1] += 1
print(d)

{1: 6, 2: 6, 3: 7, 4: 100}


* d.pop(elem) - удалить ключ и вернуть по нему значение

* d.popitem() - удали рандомный элемент и верни ключ-значение удаленного

* d.clear() - очистить словарь

* len(d) - число элементов

* d.setdefault(key, value) - поставь значение по ключу, если его нет, то поставь value

In [None]:
d.pop(4)
print(d.popitem())
print(len(d))
print(d.setdefault(4, 10000))
print(d)

(3, 7)
2
10000


In [None]:
d.clear()
d

{}

Ну хорошо, вроде как понятно, как работать со словарем. Но, допустим, к нам приходит отдел маркетинга и такой: хотим автоматизировать подсчет переходов по рекламе. У нас есть ЭКСЕЛЬКА, в которой есть список с рекламными компаниями и текущие значения, которые посчитали, а как добавить эту информацию и дальше считать по-новому?

Мы призадумались...

In [None]:
c = ["c_1", "c_2", "c_3", "c_4", "c_5"]
n = [1, 2, 3, 4, 100]

## Что-то надо сделать

Можно было бы сделать вот так:

In [None]:
d = dict()
for i in range(len(c)):
    d[c[i]] = n[i]
print(d)

{'c_1': 1, 'c_2': 2, 'c_3': 3, 'c_4': 4, 'c_5': 100}


Но можно ли не использовать циклы и сделать это более кратко?...

А вот можно!

In [None]:
d = dict(zip(c, n))
print(d)

{'c_1': 1, 'c_2': 2, 'c_3': 3, 'c_4': 4, 'c_5': 100}


Вау! А что случилось?

Функция zip позволяет объединить данные в кортежи (аналогия с застежкой)

In [None]:
list(zip(c, n)) ## приходится делать list, потому что zip создает итератор (но про это позже)

[('c_1', 1), ('c_2', 2), ('c_3', 3), ('c_4', 4), ('c_5', 100)]

## DefaultDict

Итак, в чем самая главная проблема словарей? Ну банально в том, что нужно каждый раз проверять, а есть ли ключ в словаре, а то если его нет, то наш скрипт, само собой, упадет. А что, если бы мы прям с самого начал уже задавали какое-то базовое (дефолтное) значение? Вот для этого существует такая вещь, как defaultdict, которая лежит в отдельном модуле collections

Итак, сегодня мы в первый раз поговорим про библиотеки и модули. Что это такое?

По сути библиотека - это набор дополнительных функций, которые позволяют вам использовать их с помощью вызова всего лишь одной строчки кода!

In [None]:
import math # когда делаем вот так, то можно вызывать функции через название модуля.функция
from numpy import * # импортим все и можем обращаться напрямую
import matplotlib.pyplot as plt # даем сокращение названию модулю

Давайте попробуем импортировать [collections](https://docs.python.org/3/library/collections.html):

In [2]:
from collections import defaultdict

d = defaultdict(int)
print(d[10])

0


Опа, мы вызвали значение от несуществующего ключа и вдруг ничего не выдало ошибку. Как же так? Давайте разбираться:

* defaultdict(factory) - создай словарь вот с такой функцией по дефолту

В данном случае мы вызвали int, который при вызове сам по себе дает 0:

In [None]:
int()

0

Можно использовать несколько других вариантов, например, string, list, или в целом любую функцию (когда будем говорить про функции мы ощутим полную мощь данного инструмента)

Давайте еще вот такой пример:

In [None]:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
    d[k].append(v)

d.items()

dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])

Что здесь случилось? Мы задали в качестве изначальной функции list(). Что это значит? По дефолту создается пустой лист, внутри которого мы далее делаем append, то есть таким образом собираем все значения

## Животное дня

![](https://animaljournal.ru/articles/wild/primati/koshachiy_lemur/detenish_lemura1.jpg)

Это кошачий лемур. Их все так или иначе видели (по крайней мере вот в таком виде):

![](https://www.meme-arsenal.com/memes/819abc6f23381d803a640e91092ea4a1.jpg)

На Мадагаскаре (где они и обитают) их зовут маки! По размерам как кошка (действительно), при этом хвост может весить примерно половину от всего веса лемура, и это неудивительно - хвост лемура играют важную роль в его жизни.

Помимо самых понятных прикладных функций (с помощью хвоста лемуры удерживают равновесие, будучи на ветках, а также балансируют с его помощью при прыжке), хвост также выполняет социальные функции

С его помощью он более заметен своим сородичам, а также показывают, кто здесь главный (через секрет, которым они этот самый хвост обмазывают)

А еще посмотрите, как они сидят)

![](https://upload.wikimedia.org/wikipedia/commons/thumb/9/93/Ring.tailed.lemur.situp.arp.jpg/1024px-Ring.tailed.lemur.situp.arp.jpg)

Лемуры - социальные животные, живут группой по 30 особей (причем у них матриархат), причем у них максимально яркая социальность: будучи одни, они просто с ума сходят, поэтому нормально изучить их когнитивные способности достаточно сложно