# Домашнее задание 

Для следующих простых задач нужно привести 2-3 способа решения на python, сравнить между собой эти способы по затрачиваемым времени и памяти и объяснить с чем это может быть связано. 

1. Чтение/запись в словарь. При попытке чтения несуществующего ключа возвращается None. 
2. К каждому элементу списка применить какуе-либо преобразование (например, для числового списка - возвести в кавдрат, для строкового - привести к верхнему регистру, отфильтровать определенные символы, и т.д.). 
3. Отсортировать список. 
4. Распаковать вложенный список. 

## 1. Чтение/запись в словарь. При попытке чтения несуществующего ключа возвращается None. 

In [1]:
# Для начала создадим список ключей для нашего словаря, размером 1000 элементов.
# Он будет состоять из случайных чисел от 0 до 100.

import random
list_key = [random.randint(0, 100) for i in range(1000)]

# Далее создадим список значений для нашего словаря, размером 1000 элементов.
# Он будет состоять из случайных чисел от 200 до 300.

list_value = [random.randint(200, 300) for i in range(1000)]
list_value_copy = list_value.copy()

# Создадим словарь. Словарь из списков можно создать разными способами.
# Давайте попробуем несколько из них и сравним время создания.

In [2]:
# Создание словаря через конвертирование списков в словарь
%timeit {list_key[i]: list_value[i] for i in range(len(list_key))}

474 µs ± 10.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [3]:
# Создание словаря используя перебор элементов в списках:

def create_dict(list_key, list_value):
    res = {}

    for key in list_key:

        for value in list_value:

            res[key] = value

            list_value.remove(value)

            break  

%timeit create_dict(list_key, list_value_copy)

204 µs ± 11.2 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [4]:
# Создание словаря используя zip():

%timeit dict(zip(list_key, list_value))

155 µs ± 8.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


Результаты показывают, что реализованный на С метод zip() в Python, работает быстрее чем наши алгоритмы.

#### Далее сравним разные методы чтения из словаря.
Пройдемся по словарю по ключам, разными методами, и создадим новый словарь на основе полученных значений.
Так же добавим проверку при которой, при попытке чтения несуществующего ключа возвращается None.

In [5]:
# Чтение из словаря, используя цикл for по словарю
new_dict = dict(zip(list_key, list_value))

def get_by_dict(my_dict, list_key, default=None):
    res = {}
    
    try:
        for key in list_key:
            value = my_dict[key]
            res[key] = value
        
    except KeyError:
        return default
        
    return res
    
%timeit get_by_dict(new_dict, list_key)

328 µs ± 56.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [6]:
# Чтение из словаря, используя метод items()

def get_by_dict2(my_dict, list_key, default=None):
    res = {}
    
    try:
        for key,value in my_dict.items():
            res[key] = value
        
    except KeyError:
        return default

    return res
    
%timeit get_by_dict2(new_dict, list_key)

35.9 µs ± 6.42 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


И снова убеждаемся, что встроенные методы в Python, написанные на С, работают намного быстрее.

## 2. К каждому элементу списка применить какое-либо преобразование 
## (например, для числового списка - возвести в квадрат, для строкового
## - привести к верхнему регистру, отфильтровать определенные символы, и т.д.). 

In [7]:
# Создадим список случайных чисел от 0 до 100, размером 1000:

long_list = [random.randint(0, 100) for i in range(1000)]

In [8]:
# Создадим функцию, которая будет проходить по всему списку,
# и каждый его элемент будет возводить в квадрат используя оператор **

def item_squared(my_list):
    for i in my_list:
        i**2

%timeit item_squared(long_list)

761 µs ± 55.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [9]:
# Создадим функцию, которая будет проходить по всему списку,
# и каждый его элемент будет возводить в квадрат, умножая его на самого себя

def item_squared2(my_list):
    for i in my_list:
        i*i

%timeit item_squared2(long_list)

187 µs ± 6.41 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [10]:
# Создадим функцию, которая будет проходить по всему списку,
# и каждый его элемент будет возводить в квадрат, используя sqrt() из модуля math

import math

def item_squared3(my_list):
    for i in my_list:
        math.sqrt(i)

%timeit item_squared3(long_list)

738 µs ± 44.1 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


В результате получаем, что наивное умножение "i * i" работает быстрее чем возведение в квадрат "i * * 2". Это связано с тем, что реализация возведения в степень имеет некоторые издержки, которых нет при умножении. Однако наивное умножение будет становиться все медленнее и медленнее с ростом степени возведения.

## 3. Отсортировать список.

In [11]:
# Создадим список случайных чисел от 0 до 100, размером 1000:

long_list = [random.randint(0, 100) for i in range(1000)]

# Сделаем копии этого списка, для "чистоты" эксеперимента:
long_list_copy_1 = long_list.copy()
long_list_copy_2 = long_list.copy()
long_list_copy_3 = long_list.copy()
long_list_copy_4 = long_list.copy()

In [12]:
# Отсортируем список методом "пузырька":

def bubble(array):
    N = len(array)
    for i in range(N - 1):
        for j in range(N-i-1):
            if array[j] > array[j+1]:
                buff = array[j]
                array[j] = array[j+1]
                array[j+1] = buff

# и посмотрим сколько уйдет времени на сортировку нашего списка
# пузырьковым методом:

%timeit bubble(long_list_copy_1)            

203 ms ± 6.94 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


Попробуем изменить алгоритм сортировки, и реализуем метод быстрая сортировка.

In [13]:
def quicksort(array):
    if len(array) <= 1:
        return array
    else:
        q = random.choice(array)
        s_array = []
        m_array = []
        e_array = []
        for n in array:
            if n < q:
                s_array.append(n)
            elif n > q:
                m_array.append(n)
            else:
                e_array.append(n)
        return quicksort(s_array) + e_array + quicksort(m_array)

%timeit quicksort(long_list_copy_2)

4.26 ms ± 182 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


 Как показывает результат, быстрая сортировка для данного кейса оказалась намного раз быстрее.
 Сравним наши функции по производительности с дефолтными функциями sorted() и sort()

In [14]:
# Сортировка с использованием sorted()

%timeit sorted(long_list_copy_3)

252 µs ± 30.8 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [15]:
# Сортировка с использованием sort()

%timeit long_list_copy_4.sort()

24.9 µs ± 968 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


Результаты показывают, что реализованные в Python на C встроенные функции гораздо быстрее наших реализованных алгоритмов, и не стоит изобретать "неуклюжие велосипеды", а брать надёжное стандартное решение.
Самым быстрым оказался метод sort(). Это потому, что метод sort() изменяет список прямо на месте, в то время как sorted() создает новый отсортированный список, сохраняя исходный нетронутым. 

## 4. Распаковать вложенный список.

In [16]:
# Создадим список, состоящий из 100 списоков случайных чисел от 0 до 100, размером 1000.

nested_lists = [[random.randint(0, 100) * 3 for i in range(10000)] for j in range (100)]

In [17]:
# Распакуем вложенные списки, используя генератор списков

%timeit [item for sublist in nested_lists for item in sublist]

123 ms ± 1.51 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [18]:
# Распакуем вложенные списки, используя цикл for

def get_from_list(my_list):
    new_list = []
    for y in nested_lists:
        for x in y:
            new_list.append(x) 
    return new_list

%timeit get_from_list(nested_lists)

297 ms ± 14.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [19]:
# Распакуем вложенные списки, используя цикл for

new_list = lambda nested_lists: [item for sublist in nested_lists for item in sublist]
%timeit new_list(nested_lists)

127 ms ± 3.94 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [20]:
# Распакуем вложенные списки, используя библиотеку numpy

import numpy as np
%timeit np.concatenate(nested_lists)

267 ms ± 5.82 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


На наших данных, самое максимально быстродействие показало использование генератора списков. Достигаеся это за счет того, что они намного эффективнее используют память.