Задача «найти элемент в массиве» довольно распространена, но на практике за такой формулировкой могут скрываться две различные цели:

1. Проверить, есть ли в массиве заданный элемент.

2. Определить индекс (порядковый номер) заданного элемента в массиве. А если точнее — определить индекс первого найденного в массиве элемента с нужным значением: это называют «первое вхождение элемента». Ведь в некоторых случаях одно и то же значение может встречаться в массиве несколько раз.

In [5]:
wins = [7495938, 1223125, 2128437, 4567890, 2128500, 2741001, 9314543, 4567687]
my_ticket = 2128506

def check_element_in_unordered_list(desired_element, unordered_list):
    """Проверяет наличие заданного элемента в неотсортированном списке."""
    # Итерируемся по списку.
    for item in unordered_list:
        # Каждый элемент сверяем с искомым.
        if item == desired_element:
            # Если элемент найден, то возвращаем значение True.
            return True
    # Если цикл прошёл, а элемент не найден, возвращаем False.
    return False

# Если функция вернула True...
if check_element_in_unordered_list(my_ticket, wins):
    # ...печатаем сообщение:
    print(f'Элемент {my_ticket} найден в списке!')
else:
    # Если функция вернула False - тоже сообщаем об этом.
    print(f'Элемент {my_ticket} не найден в списке.')

Элемент 2128506 не найден в списке.


Чтобы определить, есть ли искомое значение в списке, можно применить оператор `in`, проверяющий вхождение элемента в коллекцию. Выходит, можно одним выражением определить, есть ли нужный номер билета в списке: `desired_element in unordered_list`.

Однако «под капотом» Python выполнит примерно те же операции, что и в приведённом коде, а значит, алгоритмически никакого выигрыша не будет: код станет короче, но на его выполнение потребуется примерно столько же ресурсов. 

«Примерно столько же» — потому что накладные расходы на вызов встроенной функции всегда несколько меньше, чем у решений, написанных разработчиком самостоятельно.

Практический вывод прост: если есть возможность заменить цикл на встроенную функцию или операцию — лучше применить встроенные инструменты.

***
## Функция enumerate()

Расширенный вариант той же задачи — отыскать элемент в массиве и узнать его индекс. Решить её поможет встроенная функция `enumerate()`. Она получает на вход коллекцию и возвращает `итерируемый объект` `enumerate`, который может быть представлен как коллекция кортежей, где каждый кортеж состоит из двух элементов: индекса элемента и его значения. По этому объекту можно проитерироваться только один раз.

Чтобы лучше понять, как себя ведёт объект enumerate, проведём несколько экспериментов в коде:

In [8]:
# Исходный список:
wins = [7495938, 1223125, 2128437, 4567890, 2128500, 2741001, 9314543, 4567687]
# Применяем функцию enumerate:
indexed_nums = enumerate(wins)
# Распечатаем результат:
print('Печатаем объект:', indexed_nums)
# Это указание на место объекта в памяти.

# По объекту indexed_nums можно проитерироваться (перебрать его элементы в цикле):
print('Итерируемся по index_num:')
for index_num in indexed_nums:
    # Распечатаем содержимое каждого элемента объекта.
    print(index_num)

# На печать будет выведен набор кортежей, 
# в каждом кортеже - индекс элемента и его значение.

# Повторная попытка ничего не выведет: 
# проитерироваться по объекту enumerate можно только один раз.
print('Второй раз итерируемся по index_num:')
for index_num in indexed_nums:
    print(index_num)
# Пусто!

# Создаём объект enumerate заново.
indexed_nums = enumerate(wins)

# Объект enumerate можно преобразовать в список:
print('Преобразовали enumerate в список:', list(indexed_nums))
# Получим список кортежей.

# Если попробовать повторно распечатать список, он будет пустым:
# в момент преобразования объекта enumerate в список
# "под капотом" тоже происходит итерация по объекту.
print('Повторно печатаем список, полученный из enumerate:', list(indexed_nums))
# Пустой список!

Печатаем объект: <enumerate object at 0x0000026D43858040>
Итерируемся по index_num:
(0, 7495938)
(1, 1223125)
(2, 2128437)
(3, 4567890)
(4, 2128500)
(5, 2741001)
(6, 9314543)
(7, 4567687)
Второй раз итерируемся по index_num:
Преобразовали enumerate в список: [(0, 7495938), (1, 1223125), (2, 2128437), (3, 4567890), (4, 2128500), (5, 2741001), (6, 9314543), (7, 4567687)]
Повторно печатаем список, полученный из enumerate: []


Теперь напишем код для поиска индекса элемента при помощи `enumerate()`.

In [10]:
def find_element_index_in_unordered_list(desired_element, unordered_list):
    """
    Находит индекс первого вхождения искомого элемента 
    в неотсортированном списке.
    """
    # Применяем к списку функцию enumerate(), итерируемся
    # по полученному объекту enumerate и распаковываем его кортежи:
    # в переменную index сохраняем индекс элемента, в item - его значение.
    for index, item in enumerate(unordered_list):
        # Если значение текущего элемента равно искомому...
        if item == desired_element:
            # ...возвращаем его индекс:
            return index
    # Если цикл пройден, но нужное значение не найдено,
    # то возвращаем None. 
    # Явно возвращать None не обязательно, эту строку можно вообще не писать:
    # если в функции нет оператора return, она возвращает None.
    return None


wins = [7495938, 1223125, 2128437, 4567890, 2128500, 2741001, 9314543, 4567687]
my_ticket = 4567890
result = find_element_index_in_unordered_list(my_ticket, wins)
if result is not None:
    print(f'Индекс элемента {my_ticket} в массиве: {result}')
else:
    print(f'Элемент {my_ticket} не найден в массиве.')

Индекс элемента 4567890 в массиве: 3


***
## Эту же задачу можно решить и без enumerate():

Но с `enumerate()` код выглядит лаконичнее и работает чуть более эффективно за счёт того, что не получает элемент списка по индексу.

In [11]:
def find_element_index_in_unordered_list(desired_element, unordered_list):
    """
    Находит индекс первого вхождения искомого элемента 
    в неотсортированном списке.
    """
    # Формируем цикл с количеством шагов, равным длине списка.
    for index in range(len(unordered_list)):
        # Берём элемент из списка по его индексу.
        if unordered_list[index] == desired_element:
            return index
    return None

***
Эффективность алгоритмов принято определять для худших случаев. Показать причины лучше на примере «от противного»: рассмотрим лучший случай при выполнении алгоритма.

Если в несортированном массиве из миллиона элементов нужное значение оказалось первым, то алгоритм полного перебора отработает очень быстро: на первом же шаге он вернёт искомый элемент. 

Однако нельзя ожидать, что этот алгоритм всегда будет работать так быстро: ведь если нужного элемента нет или он стоит в конце массива, то программе придётся выполнить миллион проверок. 

Как правило, нельзя предсказать, где будет расположен нужный элемент. Чтобы программа работала предсказуемо в любых ситуациях, следует ориентироваться именно на худший случай.

***
## Линейный поиск

Последовательный перебор всех элементов называется «линейный проход по массиву», а поиск, выполняемый путём линейного прохода, — «линейный поиск».

При линейном поиске время выполнения программы напрямую зависит от длины массива, по которому проводится поиск. Чем больше элементов в массиве, тем больше операций в худшем случае надо выполнить и тем больше будет время работы алгоритма. Такая зависимость времени выполнения от размера массива называется линейной, а на графике выглядит как прямая линия.


In [14]:
def check_element_in_list(desired_element, ordered_list):
    """Проверяет наличие искомого элемента в отсортированном списке."""
    for item in ordered_list:
        if item < desired_element:
            continue
        elif item > desired_element:
            return f'Элемент {desired_element} не найден в массиве.'
        elif item == desired_element:
            return f'Элемент {desired_element} найден в массиве!'
    return f'Элемент {desired_element} не найден в массиве.'


# Вызываем функцию с тестовыми данными.
# Первый аргумент - целое число.
# Второй аргумент - отсортированный по возрастанию список целых чисел.
result = check_element_in_list(5, [1, 3, 5, 7, 10])
# Распечатываем результат.
print(result)

Элемент 5 найден в массиве!
