# Лекция 1: Введение в алгоритмы

## 1.1: Пример алгоритмической проблемы

Алгоритмическая задача задается путем описания полного набора входных данных, с которыми должна работать ее реализация, и соответствующим набором выходным данных. Примером алгоритмической задачи является задача сортировки, и определяется она следующим образом:

* Задача: Сортировка
* Входные данные: Последовательность элементов длины n: `{a_1, a_2, ..., a_n}`
* Результат: Выходная последовательность из того же набора элементов, но с измененным порядком следования: `{a'_1 <= a'_2 <= ... <= a'_{n-1} <= a'_n}`


Элементами последовательности могут быть как строки, например `{ Haskell, Emacs }`, так и числа, например `{ 154, 245, 1337 }`.

Пример:

**ВСТАВИТЬ ПРИМЕР ИЗ КОНТЕСТА ЯНДЕКСА**

## 1.2: Простой алгоритм Fizz Buzz

**Fizz Buzz**

Суть задачки FizzBuzz в следующем:

Напишите программу, которая выводит на экран числа от 1 до N. При этом вместо чисел, кратных трем, программа должна выводить слово «Fizz», а вместо чисел, кратных пяти — слово «Buzz». Если число кратно и 3, и 5, то программа должна выводить слово «FizzBuzz»

Начнем с создания массива чисел:

```py
# Начнем с последовательности от 1 до 5
numbers = [1, 2, 3, 4, 5]
# Здесь 3 - fizz, 5 - buzz
```

Чтобы найти все fizz и buzz, мы должны поэлементно пройтись по всей последовательности и проверить, под какую категорию подпадает число в текущей итерации (fizz, buzz, fizzbuzz или ни под одну из них). Для этого создадим цикл, проходящийся по всем значениям массива, который мы создали на предыдущем этапе:

```py
for num in numbers:
    # Здесь будет тело цикла и необходимые манипуляции
```

Для того чтобы найти fizz'ы и buzz'ы нам достаточно будет применить конструкцию условного перехода `if else` и оператор получения остатка от деления `%`:

In [14]:
numbers = [1, 2, 3, 4 , 5]

for num in numbers:
    if num % 3 == 0:
        print('fizz')
    elif num % 5 == 0:
        print('buzz')
    else:
        print(num)

1
2
fizz
4
buzz


Замечательно! 

Теперь увеличим размер последовательности до 15 чисел:

```py
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
```

Мы увеличили диапазон чисел с 1-5 до 1-15 для того чтобы продемонстрировать ситуацию, когда число кратно и 3, и 5. Самое простейшее решение выглядит следующим образом:

In [15]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

for num in numbers:
    if num % 3 == 0 and num % 5 == 0:
        print('fizz buzz')
    elif num % 3 == 0:
        print('fizz')
    elif num % 5 == 0:
        print('buzz')
    else:
        print(num)

1
2
fizz
4
buzz
fizz
7
8
fizz
buzz
11
fizz
13
14
fizz buzz


Но подождите, это не все. Вернемся к примеру. В алгоритмических задачах в условии, помимо наборов входных данных и соответствующим им наборам выходных, добавляется ограничение на время исполнения программы () и ограничение на объем потребляемой программой памяти. Увеличим размер массива до одного миллиона и замерим время исполнения программы (для того, чтобы наше рабочее место не засорялось выводом миллиона строк, вместо вывода на экран будем добавлять нужные нам значения в результирующий список `result`):

In [16]:
import time

numbers = list(range(1, 10**6 + 1))

result = []  

start_time = time.process_time()

for num in numbers:
    if num % 3 == 0 and num % 5 == 0:
        result.append('fizz buzz')
    elif num % 3 == 0:
        result.append('fizz')
    elif num % 5 == 0:
        result.append('buzz')
    else:
        result.append(num)

end_time = time.process_time()
print(f"Duration: {end_time - start_time}")

Duration: 0.11906700000000026


Нам известно, что если число делится и на 3, и на 5 - значит оно делится на 15. Это знание позволит нам слегка ускорить нашу программу. 

Заменим условие вывода варианта `'fizz buzz'` с 
```py
if num % 3 == 0 and num % 5 == 0
``` 
на
```py
if num % 15 == 0
```
Это позволит процессору выполнять одну операцию вычисления остатка от деления и одну операцию сравнения вместо двух (к тому же в предыдущем случае к этому добавляется операция логического И). Важно понимать, что, хоть в данном примере эти манипуляции и не принесут значительного выигрыша (потому что в целом используемые операторы быстро выполняются процессором), приведенный пример позволит понять общие принципы решения логических задач. К тому же при экстраполяции (увеличении размера входных данных) разница во времени выполнении двух реализаций будет увеличиваться.

Перепишем наш алгоритм и замерим время исполнения программы:

In [17]:
import time

numbers = list(range(1, 10**6 + 1))

result = []  

start_time = time.process_time()

for num in numbers:
    if num % 15 == 0:
        result.append('fizz buzz')
    elif num % 3 == 0:
        result.append('fizz')
    elif num % 5 == 0:
        result.append('buzz')
    else:
        result.append(num)

end_time = time.process_time()
print(f"Duration: {end_time - start_time}")

Duration: 0.10830799999999918


А теперь выполним несколько итераций для получения двух серий экспериментальных данных:

In [18]:
import time

numbers = list(range(1, 10**6 + 1))

result = []
time_stamps_slower = []
time_stamps_faster = []
repeats = 5


for count in range(repeats + 1):

    start_time_slower = time.time()

    for num in numbers:
        if num % 3 == 0 and num % 5 == 0:
            result.append('fizz buzz')
        elif num % 3 == 0:
            result.append('fizz')
        elif num % 5 == 0:
            result.append('buzz')
        else:
            result.append(num)
    
    end_time_slower = time.time()
    time_stamps_slower.append(end_time_slower - start_time_slower)


for count in range(repeats + 1):
    
    start_time_faster = time.time()

    for num in numbers:
        if num % 15 == 0:
            result.append('fizz buzz')
        elif num % 3 == 0:
            result.append('fizz')
        elif num % 5 == 0:
            result.append('buzz')
        else:
            result.append(num)

    end_time_faster = time.time()
    time_stamps_faster.append(end_time_faster - start_time_faster)

print(f"""
Slower time:
{time_stamps_slower}

Faster time:
{time_stamps_faster}
""")


Slower time:
[0.1187448501586914, 0.11569881439208984, 0.11696910858154297, 0.11600828170776367, 0.11694216728210449, 0.11664199829101562]

Faster time:
[0.10657596588134766, 0.10606169700622559, 0.10730433464050293, 0.10757303237915039, 0.10896015167236328, 0.10778999328613281]



## 1.3: Измерение времени исполнения программы

В предыдущих примерах мы замеряли время исполнения программы (runtime) при помощи метода стандартной библиотеки `time`. Рассмотрим пару основных способов измерения времени исполнения программы. 

В процессе проведения измерений показателей производительности программы, а в частности - при измерении времени исполнения программы, мы сталкиваемся с двумя показателями этого измерения: Wall clock time и CPU time.

Поэтому с самого начала определить и понять различие этих двух показателей.

Wall time (aka clock time, wall-clock time) - это просто общее количество времени, прошедшее за время проведения замера. Это время, которое вы можете замерить даже при помощи секундомера. Это разница между временем, в которое программа завершила свое выполнение, и временем, в которое программа запустилась. Wall time также включает в себя время ожидания ресурсов.

CPU time, с другой стороны, относится к времени, в течение которого процессор был занят обработкой инструкций программы. Время, затраченное на ожидание завершения другой задачи (например, операций ввода-вывода), не включается в процессорное время. CPU time не включает время ожидания ресурсов.

Разница между Wall time и CPU time может быть обусловлена архитектурой или runtime'ом, например, заданными разработчиком задержками или ожиданием доступа системных ресурсов.

Например, программа сообщает, что она использовала “СPU time 0m0.2s, Wall time 2m4s”. Это означает, что программа была активна в течение 2 минут и четырех секунд. Тем не менее, процессор компьютера потратил всего 0,2 секунды на выполнение вычислений. Возможно, программа ожидала, когда станут доступны некоторые ресурсы (например память).

### Time module

[Библиотека time](https://docs.python.org/3/library/time.html) предоставляет разработчикам различные функции для работы со временем, такие как получение текущего времени и приостановка выполнения вызывающего потока на заданное количество секунд. Приведенные ниже шаги показывают, как использовать модуль time для расчета времени выполнения программы. 

1. **Модуль времени импорта**
Модуль `time` поставляется со стандартной библиотекой Python. Сначала импортируйте его с помощью инструкции `import`.

2. **Сохраняем время начала программы**
Теперь нам нужно получить время запуска перед выполнением первой строки программы. Чтобы сделать это, мы будем использовать функцию `time()`, чтобы получить текущее время и сохранить его в переменной `start_time` перед первой строкой программы.
Функция `time()` - Wall time
Функция `process_time()` - CPU time

3. **Сохраните время окончания**
Далее нам нужно получить время окончания перед выполнением последней строки.
Опять же, мы будем использовать функцию `time()` (`process_time()`), чтобы получить текущее время и сохранить его в переменной `end_time` перед последней строкой программы.

4. **Рассчитайте время выполнения**
Разница между временем окончания и временем начала - это время выполнения. Получите время выполнения - `runtime = end_time - start_time`.

In [19]:
import time

numbers = list(range(1, 10**6 + 1))

result = []  

start_time = time.time()

time.sleep(3)

for num in numbers:
    if num % 15 == 0:
        result.append('fizz buzz')
    elif num % 3 == 0:
        result.append('fizz')
    elif num % 5 == 0:
        result.append('buzz')
    else:
        result.append(num)

end_time = time.time()
print(f"Duration: {end_time - start_time}")

Duration: 3.1504640579223633


In [20]:
import time

numbers = list(range(1, 10**6 + 1))

result = []  

start_time = time.process_time()

time.sleep(3)

for num in numbers:
    if num % 15 == 0:
        result.append('fizz buzz')
    elif num % 3 == 0:
        result.append('fizz')
    elif num % 5 == 0:
        result.append('buzz')
    else:
        result.append(num)

end_time = time.process_time()
print(f"Duration: {end_time - start_time}")

Duration: 0.14827800000000035


## 1.3: Измерение затраченной памяти во время исполнения программы

Memory Profiler - это модуль Python с открытым исходным кодом, который внутренне использует модуль psutil для мониторинга потребления памяти функциями Python. Он выполняет построчный анализ потребления памяти функцией.

Установка:

```sh
pip install -U memory_profiler
```

```py
# importing the library
from memory_profiler import profile
 
# instantiating the decorator
@profile
# code for which memory has to
# be monitored
def my_func():
    x = [x for x in range(0, 1000)]
    y = [y*100 for y in range(0, 1500)]
    del x
    return y
 
if __name__ == '__main__':
    my_func()
```

![result](./pics/01_memory_profiler.png)