# Структуры данных

Мы рассмотрим для начала структуры данных, доступные "из коробки"

In [None]:
# built-in структуры данных
list, tuple, dict, set, frozenset

## Список: list

Позволяет хранить последовательность элементов одного или разных типов с Сохранением порядка добавления элементов в список.

Изменяемые
Не хешируемые

## Создание списков

In [None]:
# создаем list используя квадратные скобки или ф-ю list
empty_list = []
empty_list = list()
not_empty_list = list([1,2,3])
not_empty_list = [1, 2, 3]
item = [None] * 100

In [None]:
# list может содержать любые объекты, внутри Python они хранятся как массив указателей
example_list = [1, True, "a"]
for element in example_list:
    print(element)

In [None]:
# добавляем элемент в конец списка O(1)
example_list.append("foo")
print(example_list)

# добавляем элемент в начало O(n)
example_list.insert(0, "bar")
print(example_list)

In [None]:
example_list.append(example_list)
print(example_list)

In [None]:
benchmark_list = []
%timeit -n10000 benchmark_list.append("foo")

In [None]:
benchmark_list = []
%timeit -n10000 benchmark_list.insert(0, "bar")

In [None]:
example_list = [0, 1, 2, 3, 4, 5, 6]

# доступ к элементу O(1)
print(example_list[0])
print(example_list[-1])

# Изменение по индексу O(1)
example_list[6] = 10

In [None]:
# Удаление элемента O(n)
print(example_list)
del example_list[-1]
print(example_list)

In [None]:
example_list.remove(5)
print(example_list)

In [None]:
example_list.remove(5)

In [None]:
del example_list[5]

In [None]:
# Обращение к несуществующему индексу.
example_list[100]

In [None]:
# срезы
print(example_list)
print(example_list[2:-1])
print(example_list[2:])
print(example_list[2:4])
print(example_list[::2])
print(example_list[-1])
print(example_list[::-1])

In [None]:
# при простом присваивании новая переменная ссылается на тот же список
example_list = [1, 2, 3, 4, 5]
another_list = example_list
another_list[0] = 100
print(example_list)

In [None]:
# копирование списка
example_list = [0, 1, 2, 3, 4, 5]
another_list = example_list[:]
# import copy
# another_list = copy.copy(example_list)
# another_list = list(example_list)
another_list[0] = 100
print(example_list)

In [None]:
# но вложенные объекты не копируются (shallow copy)
nested_list = [1, 2, 3]
example_list = [nested_list, 1, 2, 3, 4, 5]
another_list = example_list[:]
nested_list.append(4)
print(another_list)

In [None]:
# используем ф-ю deepcopy из пакета copy
from copy import deepcopy
nested_list = [1, 2, 3]
example_list = [nested_list, 1, 2, 3, 4, 5]
another_list = deepcopy(example_list)
nested_list.append(4)
print(another_list)

### Немного о сортировке

In [None]:
# Сортировка списка
unsorted_list = [2, 1, 5, 4, 3]
unsorted_list.sort()
print(unsorted_list)

In [None]:
# сортировка in-place
unsorted_list = [2, 1, 5, 4, 3]
print(sorted(unsorted_list))
print(unsorted_list)

## Кортеж: tuple

Так же как и список позволяет хранить последовательность элементов одного или разного типа

* Неизменяемые (Immutable) => защищают данные
* Быстрее списка
* Хешируемые (Hashable)

In [None]:
# создадим пустой tuple используя круглые скобки или ф-ю tuple
empty_tuple = ()
empty_tuple = tuple()

In [None]:
len(empty_tuple)

In [None]:
hash(empty_tuple)

In [None]:
example_tuple = (1, "a", True)
for element in example_tuple:
    print(element)

In [None]:
len(example_tuple)

In [None]:
example_tuple = (1, 2, 3)
print(example_tuple[0])
print(example_tuple[1:])

In [None]:
example_tuple[0] = 2017

In [None]:
example_list[200]

In [None]:
a = (123)
a
print(type(a))
a = (123, ) # в кортеже с одним элементом запятая обязательна!
print(type(a))
a = 1,2,3
print (type(a))

Важно понимать, что **неизменяемым является сам tuple, но не объекты, которые он содержит!**. Например:

In [None]:
first_list = [1, 2]
second_list = [3, 4]
example_tuple = (first_list, second_list)
print(example_tuple)
first_list.append(5)
print(example_tuple)

## Написать в одну строку все цифры от 0 до 100


In [None]:
long_arr = [1] * 101
result = ""
current_item = 0
for index, item in enumerate(long_arr):
    result += str(current_item)
    current_item += item

print(result)

In [None]:
print("".join([str(item) for item in range(0, 101)]))

## Словарь: dict

Позволяет хранить пары ключ-значение, для быстрого доступа к значению по ключу. 

In [None]:
# создаем словарь используя фигурные скобки или ф-ю dict
empty_dict = dict()
empty_dict = {}

In [None]:
dict(a=4, b=True)

In [None]:
example_dict = {
    "a": 1,
    "b": True,
    (1, 2, 3): True
}

# Добавляем ключ и соответствующее ему значение в словарь O(1)
example_dict["c"] = 4
print(example_dict)

# Поиск значения по ключу O(1)
print(example_dict["c"])

In [None]:
# Доступ к несуществующему ключу:
print(example_dict["x"])

In [None]:
# ключом словаря может быть только hashable объект
example_dict[example_list] = True

Объект является hashable объектом, если он имеет hash-значение, неизменное в процессе его жизни (т.е. у объекта должен быть определен **______hash______()** метод) и объект можно сравнить с другими объектами (**________eq________()** или **________cmp________()** методы). Одинаковые объекты должны иметь одинаковое знаение hash.

Если объект hashable, то он может быть использован как ключ в словаре или член множества (так как эти структуры используют значение hash внутри своей имплементации).

Все immutable встроенные объекты в Python - hashable, mutable контейнеры - нет (списки, словари). Инстансы классов - hashable (их hash значение - их id, то есть адрес в памяти).

In [None]:
hash([1,2,3])

In [None]:
hash((1,2,3))

In [None]:
# если мы не уверены, что ключ есть в словаре - можно воспользоваться методом get
print(example_dict.get("x"))
print(example_dict.get("x", "default value"))

In [None]:
# итерируемся по ключам и значениям - внимание, порядок недетерминирован (до Python 3.6)!
for key, value in example_dict.items():
    print("{}: {}".format(key, value))

In [None]:
# посмотрим на разницу поиска значения в словаре и списке
search_list = list(range(100000)) 
search_dict = dict.fromkeys(list(range(100000)))

In [None]:
%timeit -n10000 0 in search_list

In [None]:
%timeit -n10000 0 in search_dict

In [None]:
%timeit -n1000 99999 in search_list

In [None]:
%timeit -n10000 99999 in search_dict

In [None]:
# объединение словарей
d1 = {"a": 1, "c": 3}
d2 = {"b": 2}
d1.update(d2)
print(d1)

In [None]:
# копирование
d1 = {"a": 1, "c": 3}
d2 = d1.copy()
d2["a"] = 100
print(d1)
print(d2)
print()

# вложенные не копируются
nested = [1, 2, 3]
d1 = {"a": nested}
d2 = d1.copy()
nested.append(4)
print(d1)
print(d2)
print()

# поэтому опять используем deepcopy
from copy import deepcopy
nested = [1, 2, 3]
d1 = {"a": nested}
d2 = deepcopy(d1)
nested.append(4)
print(d1)
print(d2)

**Задача - есть список элементов. Известно, что у большинства элементов в списке есть пары, то есть их по 2. Но есть некоторое количество элементов, у которых пары нет - их по 1 в списке. Цель - найти эти одиночные элементы.**

Вот решение с помощью словаря:

In [None]:
elements = [2, 1, 5, 2, 4, 3, 1, 4]

solution_dict = {}

#TODO by hand

for item in elements:
    if item in solution_dict:
        solution_dict[item] = solution_dict.get(item, 0) + 1
for key, value in solution_dict.items():
    if value is 1:
        print(key)

В python3.6 dict сохранет порядок добавления элементов

In [None]:
example = dict()
for item in range(0, 10):
    example[item] = item
print(example)
for key, value in example.items():
    print(key, value)

## Равенство и идентичность

In [None]:
first_list = [1,2,3]
from copy import deepcopy
second_list = deepcopy(first_list)
print(first_list == second_list)
print(first_list is second_list)

In [None]:
apple_count = "one"
orange_count = "one"
print(apple_count == orange_count)
print(apple_count is orange_count)

In [None]:
apple_count = "more then one"
orange_count = "more then one"
print(apple_count == orange_count)
print(apple_count is orange_count)

## Введение в генераторы

In [None]:
first_list = [0, 1,2,3,4,5,6]
second_list = [item + 1 for item in first_list]
print(first_list is second_list)
print(second_list)

In [None]:
new_dict = {item: item + 1 for item in first_list }
print(new_dict)

In [None]:
print(list(range(0, 10)))
even_list = [num for num in range(10) if num % 2 == 0]
print(even_list)

## Множество: set

Неупорядоченная коллекция, содержащая только уникальные хешируемые элементы.

Изменяемые
Не хешируемые

In [None]:
# создадим пустой set c помощью ф-ии set()
empty_set = set()

In [None]:
# непустое множество можно также задать фигурными скобками
example_set = {1, 2, 3}
print('id is ', id(example_set))
# добавляем элемент в set
example_set.add(4)
print(example_set)
print('id is ', id(example_set))

# добавляем уже присутствующий элемент в set - ничего не меняется
example_set.add(1)
print(example_set)

In [None]:
# Проверяем наличие значения в множестве O(1)
2 in example_set

In [None]:
another_set = {4, 5, 6}

In [None]:
print(example_set.difference(another_set)) # различие
print(example_set.union(another_set)) # объединение
print(example_set.intersection(another_set)) # пересечение

In [None]:
# например, вызов какой-либо ф-ии чат сервиса вернул нам список активных в данный момент пользователей в комнате
active_users = ["Александр", "Михаил", "Ольга"]
# вызов другой ф-ии вернул список администраторов чата
admins = ["Ольга", "Мария"]
# нам нужно найти список активных администраторов и послать им какое-либо уведомление
active_admins = set(active_users).intersection(set(admins))
active_admins

In [None]:
# сеты могут содержать только hashable объекты.
example_set = set()
example_set.add([1, 2, 3])

**Основная задача, очень часто возникающая на практике. Есть список элементов, нужно оставить только уникальные. Это одна строка с использованием сета:**

In [None]:
elements = ["yellow", "yellow", "green", "red", "blue", "blue", "magenta", "orange", "red"]
set(elements)

## frozenset

Так как set может содержать только hashable объекты, а иногда нужен сет сетов - существует frozenset

In [None]:
example_set = set()
example_set.add(frozenset([1,2,3]))
print(example_set)

## collections

In [None]:
import collections
print([x for x in collections.__dict__.keys() if not x.startswith("_")])

In [None]:
# counter
counter = collections.Counter([1,2,3,4,1,2,1,1,1])
for elem, count in counter.most_common(3):
    print("{}: {} times".format(elem, count))

In [None]:
# defaultdict
default_dict = collections.defaultdict(int)
default_dict["not_exists"]

In [None]:
# namedtuple
import math
Point = collections.namedtuple('Point', ['x', 'y'])
point1 = Point(0, 0)
point2 = Point(3, 4)
distance = math.sqrt((point2.x - point1.x)**2 + (point2.y - point1.y)**2)
distance

## queue

In [1]:
import queue

print("Queue:", queue.Queue.__doc__)
print()
print("PriorityQueue:", queue.PriorityQueue.__doc__)
print()
print("LifoQueue:", queue.LifoQueue.__doc__)

Queue: Create a queue object with a given maximum size.

    If maxsize is <= 0, the queue size is infinite.
    

PriorityQueue: Variant of Queue that retrieves open entries in priority order (lowest first).

    Entries are typically tuples of the form:  (priority number, data).
    

LifoQueue: Variant of Queue that retrieves most recently added entries first.


* Queue
* PriorityQueue
* LifoQueue

Разберем позже, когда будем говорить о многопоточности, так как доступ к этим структурам синхронизирован.

### Другие структуры данных

* Связанные списки
* Деревья
* Графы
* ...

Если вам нужна реализация какой-то конкретно структуры данных - скорее всего вы найдете готовую open-source реализацию.

# Функции

In [None]:
from datetime import datetime


def get_seconds():
    """Return current seconds"""
    return datetime.now().second


get_seconds()

In [None]:
help(get_seconds)

In [None]:
get_seconds.__doc__

In [None]:
get_seconds.__name__

In [None]:
def split_tags(tag_string):
    tag_list = []
    for tag in tag_string.split(','):
        tag_list.append(tag.strip())
        
    return tag_list


split_tags('functions, classes, OOP, inheritance, methods')

In [None]:
split_tags()

In [None]:
def add(x: int, y: int) -> int:
    return x + y


print(add(10, 11))
print(add('still ', 'works'))

## Напишите функцию, которая находит медиану переданного списка

In [None]:
def nlogn_median(l):
    l = sorted(l)
    if len(l) % 2 == 1:
        return l[len(l) / 2]
    else:
        return (l[len(l) // 2 - 1] + l[len(l) // 2])/2
    
nlogn_median([4,2,3,1])

### По ссылке или по значению?

In [None]:
def extender(source_list, extend_list):
    source_list.extend(extend_list)
    

values = [1, 2, 3]
extender(values, [4, 5, 6])

print(values)

In [None]:
def replacer(source_tuple, replace_with):
    source_tuple = replace_with
    

user_info = ('Guido', '31/01')
replacer(user_info, ('Larry', '27/09'))

print(user_info)

In [None]:
# mutable vs immutable

### Именованные аргументы

In [None]:
def say(greeting, name):
    print('{} {}!'.format(greeting, name))
    

say('Hello', 'Kitty')
say(name='Kitty', greeting='Hello')

In [None]:
say(name='Kitty', 'Hello')

### Область видимости

In [None]:
result = 0

def increment():
    return result

result = increment()
print(result)

In [None]:
result = 0

def increment():
    result = 1
    return result

result = increment()

In [None]:
result = 0

def increment():
    print(result)
    result = 1
    return result

result = increment()

In [None]:
# global & nonlocal

### Аргументы по умолчанию

In [None]:
def greeting(name='it\'s me...'):
    print('Hello, {}'.format(name))
    
greeting()    
greeting('Kitty')

print(greeting.__defaults__)

In [None]:
def append_one(iterable=[]):
    print('iterable', iterable)
    iterable.append(1)
    
    return iterable

print('defaults', append_one.__defaults__)
print(append_one([1]))

In [None]:
print(append_one())
print(append_one())

In [None]:
print(append_one.__defaults__)

In [None]:
def function(iterable=None):
    if iterable is None:
        iterable = []
    return iterable

def function(iterable=None):
    iterable = iterable or []
    return iterable

function()

### Распаковка

In [None]:
def printer(*args):
    print(type(args))
    
    for argument in args:
        print(argument)


printer(1, 2, 3, 4, 5)

In [None]:
name_list = ['John', 'Bill', 'Amy', 'Jane']
printer(*name_list)
a = [1,2,3]
printer(*a)

In [None]:
def printer(**kwargs):
    print(type(kwargs))
    
    print(kwargs.keys())
        
        
printer(a=10, b=11)


In [None]:
printer("asd")

In [None]:
payload = {
    'user_id': 117,
    'feedback': {
        'subject': 'Registration fields',
        'message': 'There is no country for old men'
    }
}
printer(**payload)
# printer(user_id=117, feedback={
#     'subject':. ...
# })

In [None]:
def printer(*args, **kwargs):
    print(type(args), args)
    print(type(kwargs), kwargs)
    
printer(1, 2, 3, a=1, b=2)

## lambda

In [None]:
need_sorted = [(0, 1), (1, 0), (2, 3)]

In [None]:
def sort_key(item):
    return item[1]

In [None]:
print(need_sorted)
need_sorted.sort(key=sort_key)
print(need_sorted)

In [None]:
l = lambda x: x[1]
print(type(l))

In [None]:
print(need_sorted)
need_sorted.sort(key=lambda x: x[0])
print(need_sorted)

## Исключения

In [None]:
def average(num_list):
    return sum(num_list) / len(num_list)

In [None]:
average([])

In [None]:
try:
    average([])
except ZeroDivisionError:
    print('Error occurred')

In [None]:
try:
    average([])
except ZeroDivisionError as e:
    print(e)

In [None]:
try:
    average([])
except Exception:
    print('Avoid this')

In [None]:
try:
    average([])
except (ValueError, TypeError, ZeroDivisionError):
    pass

In [None]:
try:
    average([])
except ValueError:
    print('Value!')
except ZeroDivisionError:
    print('Zero!')

In [None]:
class ParkException(ZeroDivisionError):
    pass

In [None]:
raise ParkException('Wrong value')

In [None]:
try:
    1 / 0
except ZeroDivisionError as e:
    raise ValueError from e


In [None]:
try:
    1 / 0
except ZeroDivisionError as e:
    raise


## Генераторы часть 2

In [None]:
a = (item for item in range(3))
for item in a:
    print(item)

print(a)

for item in a:
    print(item)


In [None]:
def simple_gen():
    yield 1
    yield 2

gen = simple_gen()
print(next(gen))
print(next(gen))
print(next(gen))

In [None]:
gen = simple_gen()
for i in gen:
    print(i)