Сгенерируем коллекцию `data`, в ней будет 10 000 случайных чисел в диапазоне от 1 до 10 000 000. Это будет коллекция записей о прошлых молниях.

Значения «новых ударов молний» случайным образом будем генерировать в цикле; эти значения будем искать в коллекции `data`. Предположим, что ровер попал в очень большую грозу, и в него попало 10 000 молний; значит, цикл должен сгенерировать 10 000 случайных чисел и проверить наличие каждого из них в массиве `data`.

В этом коде коллекция `data` будет **списком**.

При выполнении кода измерим время, за которое он выполняется. В стандартной библиотеке Python в модуле `time` есть функция `time()`, она получает текущее время. С её помощью засечём время выполнения кода. 

Чтобы увидеть, сколько времени занимают разные этапы программы — расставим в коде `print()`.

In [21]:
import time
# Импортируем функцию randint - с её помощью сгенерируем набор случайных чисел.
from random import randint

# Засекаем время начала работы.
start_time = time.time()

# Количество элементов в коллекции data:
DATA_SIZE = 500000
# Максимальное значение случайного числа при генерации коллекции data:
MAX_RAND_NUMBER = 10000000

# В цикле генерируем список случайных чисел в диапазоне от 1 до 10 млн.
# Вместо имени переменной цикла ставим символ "_",
# ведь в теле цикла эта переменная не применяется.
data = [randint(1, MAX_RAND_NUMBER) for _ in range(DATA_SIZE)]

# Печатаем, сколько времени генерировался список data:
print(f'Коллекция data сгенерирована за {time.time() - start_time} сек.')

# Счётчик совпадающих элементов.
match_counter = 0

# Генерируем в цикле "новые удары молний" - случайные значения.
# Таких значений будет 10 000:
for _ in range(10000):
    # Генерируем случайное значение:
    new_item = randint(1, MAX_RAND_NUMBER)
    # Ищем полученное значение в массиве data...
    if new_item in data:
        # ...и если нашли - увеличиваем счётчик совпадающих элементов.
        match_counter += 1

# Печатаем результаты поиска:
print(f'Найдено совпадений: {match_counter}')
# Для наглядности печатаем число элементов в коллекции data:
print(f'Объектов в data: {len(data)}')
# Печатаем, сколько времени работала программа.
print(f'Программа отработала за {time.time() - start_time} сек.')

Коллекция data сгенерирована за 0.19978809356689453 сек.
Найдено совпадений: 502
Объектов в data: 500000
Программа отработала за 32.820204734802246 сек.


Список `data` генерируется заметно дольше, но всё равно быстро. Совпадающих элементов стало больше — ведь список `data` увеличился. Общее время выполнения программы выросло в 12 раз — при десятикратном увеличении списка.

Ещё увеличим длину входного списка (константу `DATA_SIZE`) — до 500 000:

Программу оставим без изменений, но вместо списка `data` создадим множество `data`. Для красоты эксперимента установим длину `data` сразу в 500 тысяч, чтобы можно было сравнить с предыдущими результатами.

In [22]:
import time
from random import randint


start_time = time.time()

# Количество элементов установим равным 500 000.
DATA_SIZE = 500000
MAX_RAND_NUMBER = 10000000

# Теперь data - это не список, а множество. Скобки-то фигурные!
data = {randint(1, MAX_RAND_NUMBER) for _ in range(DATA_SIZE)}
print(f'Коллекция data сгенерирована за {time.time() - start_time} сек.')

match_counter = 0

# Будет выполнено 10 000 итераций цикла.
for _ in range(10000):
    new_item = randint(1, MAX_RAND_NUMBER)
    if new_item in data:
        match_counter += 1

print(f'Найдено совпадений: {match_counter}')
print(f'Объектов в data: {len(data)}')
print(f'Программа отработала за {time.time() - start_time} сек.')

Коллекция data сгенерирована за 0.2634449005126953 сек.
Найдено совпадений: 496
Объектов в data: 487733
Программа отработала за 0.27040815353393555 сек.


Итак, алгоритм всё тот же, операций цикла столько же. Когда на вход подавался **список** из 500 тысяч элементов — программа выполнилась за 44 секунды. Но теперь структура данных изменилась. В результате…