# Разбор алгоритмических задач

Добро пожаловать! Если вы готовитесь к собеседованиям на роль дата сайентиста, этот ноутбук может быть для вас полезным. Он разработан как инструмент для быстрого возвращения в форму по решению алгоритмических задач перед собеседованием. Задача ноутбука не в том, чтобы изучить алгоритмы с нуля, а чтобы освежить в памяти и усовершенствовать уже имеющиеся навыки. Если у вас нет опыта, это также будет полезно, чтобы подготовиться к предстоящим испытаниям, так как здесь собраны основные и часто встречающиеся задачи.

## Что вы найдете в этом ноутбуке:

1. **Реальные задачи с алгоритмических секций:** Все задачи, представленные здесь, были собраны из различных источников и отражают типы вопросов, с которыми вы можете столкнуться на собеседованиях.
2. **Описание и разбор задач:** Здесь вы найдете подробные описания каждой задачи, а также шаги их решения. Я стараюсь разобрать каждую задачу так, чтобы она была понятна даже тем, кто встречается с ней впервые. При использовании алгоритмов с остоявшимися в отрасли названиями указываю их.
3. **Варианты решений:** Для каждой задачи стараюсь предлагать несколько способов решения, включая эффективные алгоритмические подходы.
4. **Тесты производительности:** Также в ноутбуке проводятся тесты производительности различных решений, чтобы вы могли сравнить их эффективность.

Цель этого ноутбука - не только помочь вам лучше подготовиться к собеседованиям, но и предоставить удобный инструмент для быстрого возвращения в форму по алгоритмическим задачам, дать понимание типов задач, которые могут быть заданы, и предложить эффективные методы их решения. Идеально для утреннего кофе и освежения знаний.  
Удачи в подготовке!


In [1]:
import time
import random
import os

import numpy as np
import math

# import itertools
# from collections import Counter

# import matplotlib.pyplot as plt

# from typing import List

In [2]:
RANDOM_SEED = 42
random.seed(RANDOM_SEED)
np.random.seed(RANDOM_SEED)

TEST_FOLDER = './tests/'

### Задача 1. Не минимум на отрезке

Ограничение времени:	1 секунда  
Ограничение памяти:	64Mb  
Ввод:	стандартный ввод или input.txt  
Вывод:	стандартный вывод или output.txt  

Задана последовательность целых чисел a1, a2, …, an. Задаются запросы: сказать любой элемент последовательности на отрезке от L до R включительно, не равный минимуму на этом отрезке.  

**Формат ввода**
В первой строке содержатся два целых числа N, 1 ≤ N ≤ 100 и M, 1 ≤ M ≤ 1000 — длина последовательности и количество запросов соответственно.  
Во второй строке — сама последовательность, 0 ≤ $a_i$ ≤ 1000.  
Начиная с третьей строки перечисляются M запросов, состоящих из границ отрезка L и R, где L, R - индексы массива, нумеруются с нуля.  

**Формат вывода**
На каждый запрос выведите в отдельной строке ответ — любой элемент на [L, R], кроме минимального. В случае, если такого элемента нет, выведите "NOT FOUND".  

**Пример 1:**  
| Ввод | Вывод |
|------|-------|
| 10 5<br>1 1 1 2 2 2 3 3 3 10<br>0 1<br>0 3<br>3 4<br>7 9<br>3 7 | <br><br>NOT FOUND<br>2<br>NOT FOUND<br>10<br>3 |


**Пример 2:**  
| Ввод | Вывод |
|------|-------|
| 4 2<br>1 1 1 2<br>0 2<br>0 3 | <br><br>NOT FOUND<br>2 |

***задача с разминки ML тренировок Яндекса по алгоритмам ([A. Не минимум на отрезке](https://contest.yandex.ru/contest/53027/problems/A/))***

**Решение задачи 1 вариант 1** через генератор:  

Будем решать задачу так:
- сначала в заданном интервале найдем минимальный элемент (сложность $O(N)$) 
- потом пройдем по интервалу и будем искать элемент не равный минимальному, если найдем его вернем, если нет тогда вернем 'NOT FOUND' (сложность $O(N)$)  
Таким образом, для каждого запроса сложность составляет $O(N)+O(N)=O(N)$

In [3]:
def process_queries(data, queries):
    for left, right in queries:
        min_value = min(data[left:right+1])
        first_not_min = next((x for x in data[left:right+1] if x != min_value), 'NOT FOUND')
        print(first_not_min)

def main(input_txt):
    with open(input_txt, 'r') as file:
        n, m = map(int, file.readline().split())
        data = list(map(int, file.readline().split()))

        queries = [tuple(map(int, file.readline().split())) for _ in range(m)]

    process_queries(data, queries)

# main('input.txt')  # Код для контекста закомментирован

In [4]:
main(TEST_FOLDER + 'test_01_01.txt')

NOT FOUND
2
NOT FOUND
10
3


In [5]:
main(TEST_FOLDER + 'test_01_02.txt')

NOT FOUND
2


In [6]:
def process_queries2(data, queries):
    for left, right in queries:
        min_value = min(data[left:right+1])
        first_not_min = 'NOT FOUND'
        for i in range(left, right + 1):
            if data[i] != min_value:
                first_not_min = data[i]
                break
        print(first_not_min)

def main2(input_txt):
    with open(input_txt, 'r') as file:
        n, m = map(int, file.readline().split())
        data = list(map(int, file.readline().split()))

        queries = [tuple(map(int, file.readline().split())) for _ in range(m)]

    process_queries2(data, queries)

# main2('input.txt')  # Код для контекста закомментирован

In [7]:
main2(TEST_FOLDER + 'test_01_01.txt')

NOT FOUND
2
NOT FOUND
10
3


In [8]:
main2(TEST_FOLDER + 'test_01_02.txt')

NOT FOUND
2


**Тест производительности - Задача 1**:

In [9]:
N = 10000
M = 1000
# Генерация случайных тестовых данных
random_data = [random.randint(0, 10) for _ in range(N)]  # Случайные данные
random_queries = [(np.random.randint(0, N), random.randint(0, N)) for _ in range(M)]  # Случайные запросы

# Убедимся, что правая граница всегда больше или равна левой
random_queries = [(min(l, r), max(l, r)) for l, r in random_queries]

len(random_data), len(random_queries)


(10000, 1000)

In [10]:
print(random_data[:20])
print(random_queries[:10])

[10, 1, 0, 4, 3, 3, 2, 1, 10, 8, 1, 9, 6, 0, 0, 1, 3, 3, 8, 9]
[(2903, 7270), (138, 860), (2044, 5390), (5191, 7580), (5734, 6069), (3161, 6265), (466, 7283), (153, 4426), (3629, 5578), (324, 8322)]


In [11]:
def process_queries(data, queries):
    for left, right in queries:
        min_value = min(data[left:right+1])
        first_not_min = next((x for x in data[left:right+1] if x != min_value), 'NOT FOUND')
        # print(first_not_min)

def process_queries2(data, queries):
    for left, right in queries:
        min_value = min(data[left:right+1])
        first_not_min = 'NOT FOUND'
        for i in range(left, right + 1):
            if data[i] != min_value:
                first_not_min = data[i]
                break
        # print(first_not_min)

In [12]:
%timeit -n 100  process_queries(random_data, random_queries)

65.2 ms ± 2.91 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [13]:
%timeit -n 100  process_queries2(random_data, random_queries)

56.3 ms ± 2.87 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)


Вывод по тесту производительности - Задача 1:  
код без генератора работает немного быстрее

Ниже скорость и использование памяти с контекста:  
process_queries2 - 238ms - 28.10Mb  
process_queries  - 239ms - 28.10Mb  

### Задача 2. Сложить две дроби

Ограничение времени: 1 секунда  
Ограничение памяти: 64Mb  
Ввод: стандартный ввод или input.txt  
Вывод: стандартный вывод или output.txt  

Даны две рациональные дроби: a/b и c/d. Сложите их и результат представьте в виде несократимой дроби m/n.

**Формат ввода**  
Программа получает на вход 4 натуральных числа a, b, c, d, каждое из которых не больше 100.

**Формат вывода**  
Программа должна вывести два натуральных числа m и n такие, что m/n=a/b+c/d и дробь m/n – несократима.

**Пример**  
| Ввод       | Вывод |
|------------|-------|
| 1 2 1 2    | 1 1   |

***задача с разминки ML тренировок Яндекса по алгоритмам ([B. Сложить две дроби](https://contest.yandex.ru/contest/53027/problems/B/))***


**Решение задачи 2 вариант 1**:  

Будем решать задачу так:
- сначала нахождим наименьшее общее кратное (НОК) знаменателей:
   - НОК знаменателей `b` и `d` необходим для приведения дробей к общему знаменателю
   - НОК двух чисел - это наименьшее число, которое делится на оба числа без остатка
   - НОК(`b`, `d`) = `(b * d) / НОД(b, d)`, где НОД - наибольший общий делитель

- приводим дроби к общему знаменателю:
   - Умножаем числитель и знаменатель первой дроби `a/b` на `(НОК / b)`
   - Умножаем числитель и знаменатель второй дроби `c/d` на `(НОК / d)`
   - Теперь обе дроби имеют одинаковый знаменатель, который равен НОК

- складываем дроби:
   - Складываем числители приведенных дробей: `новый числитель = a * (НОК / b) + c * (НОК / d)`

- приводим результат к несократимой форме:
   - Находим НОД нового числителя и НОК (который теперь является общим знаменателем)
   - Делим числитель и знаменатель на их НОД, чтобы получить несократимую дробь

- выводим результат:
   - В результате получаем дробь в форме `m/n`, где `m` и `n` - несократимый числитель и знаменатель соответственно


In [14]:
def gcd(num1, num2):
    """ GCD (Greatest Common Divisor): Наибольший общий делитель (НОД) """
    while num2 != 0:
        num1 = num2
        num2 = num1 % num2
    return num1

def lcm(num1, num2):
    """ LCM (Least Common Multiple) Наименьшее общее кратное (НОК) """
    return (num1 * num2) // gcd(num1, num2)

def add_fractions(a, b, c, d):
    """ Сложение двух дробей a/b и c/d """
    # Находим НОК знаменателей
    lcm_denominator = lcm(b, d)

    # Вычисляем числитель новой дроби
    numerator = a * (lcm_denominator // b) + c * (lcm_denominator // d)
    
    # Находим НОД числителя и знаменателя для несократимой дроби
    gcd_fraction = gcd(numerator, lcm_denominator)

    # Выводим числитель и знаменатель несократимой дроби
    print(numerator // gcd_fraction, lcm_denominator // gcd_fraction)


def main(input_txt):
    with open(input_txt, 'r') as file:
        a, b, c, d = map(int, file.readline().split())

    add_fractions(a, b, c, d)

# main('input.txt')  # Код для контекста закомментирован

In [15]:
main(TEST_FOLDER + 'test_02_01.txt')

1 1


Ниже скорость и использование памяти с контекста:  
195ms - 28.32Mb  

### Задача 3. Путешествие по Москве

Ограничение времени: 2 секунды  
Ограничение памяти: 256Mb  
Ввод: стандартный ввод или input.txt  
Вывод: стандартный вывод или output.txt  

Мэрия Москвы основательно подготовилась к празднованию тысячелетия города в 2147 году, построив под столицей бесконечную асфальтированную площадку, чтобы заменить все существующие в городе автомобильные дороги. В память о кольцевых и радиальных дорогах разрешили двигаться по площадке только двумя способами:

1. В сторону точки начала координат или от неё. При этом из точки начала координат разрешено двигаться в любом направлении.
2. Вдоль окружности с центром в начале координат и радиусом, который равен текущему расстоянию до начала координат. Двигаться вдоль такой окружности разрешается в любом направлении (по или против часовой стрелки).

Вам, как ведущему программисту ответственной инстанции, поручено разработать модуль, который будет определять кратчайший путь из точки A с координатами (xA, yA) в точку B с координатами (xB, yB). Считайте, что менять направление движения можно произвольное количество раз, но оно должно всегда соответствовать одному из двух описанных выше вариантов.

**Формат ввода**  
В первой строке ввода заданы четыре целых числа xA, yA, xB и yB, по модулю не превосходящие 10^6.

**Формат вывода**  
Выведите одно число — минимальное расстояние, которое придётся преодолеть по пути из точки A в точку B, если не нарушать правил дорожного движения. Ваш ответ будет принят, если его абсолютная или относительная погрешность не превосходит 10^-6.

**Пример 1:**  
| Ввод     | Вывод             |
|----------|-------------------|
| 0 5 4 3  | 4.636476090008    |

**Пример 2:**  
| Ввод      | Вывод             |
|-----------|-------------------|
| 0 5 4 -3  | 10.000000000000   |


In [16]:
import math

def solution1(input_file):
    def calculate_radius(x, y):
        """ Вычисление расстояния до точки от центра координат """
        return math.sqrt(x**2 + y**2)

    def calculate_angle(x1, y1, x2, y2):
        """ Вычисление угла между лучами из центра координат, проходящими через две точки """
        angle1 = math.atan2(y1, x1)
        angle2 = math.atan2(y2, x2)

        angle = abs(math.degrees(angle1 - angle2))
        return min(angle, 360. - angle)

    def calculate_arc_length(radius, angle):
        """ Вычисление длины дуги (2 * π * r * θ) / 360, где r - радиус, θ - угол в градусах """
        return (2 * math.pi * radius * angle) / 360.0

    def read_input_file(input_file):
        with open(input_file, 'r') as file:
            return list(map(int, file.readline().split()))

    def calculate_shortest_path(xA, yA, xB, yB):
        """ 
        Вычисление кратчайшего пути между двумя точками на плоскости с учетом правил движения.
        Рассчитывает как прямой путь, так и путь по дуге окружности, и выбирает наименьший.

        Args:
        xA, yA - координаты первой точки
        xB, yB - координаты второй точки

        Returns:
        Строка с минимальным расстоянием, форматированная с двенадцатью знаками после запятой.
        """
        r1 = calculate_radius(xA, yA)
        r2 = calculate_radius(xB, yB)

        angle = calculate_angle(xA, yA, xB, yB)
        arc = calculate_arc_length(min(r1, r2), angle)
        dif = abs(r1 - r2)

        res = min(r1 + r2, arc + dif)

        return f"{res:.12f}"

    def main(input_file):
        xA, yA, xB, yB = read_input_file(input_file)

        return calculate_shortest_path(xA, yA, xB, yB)

    return main(input_file)

# print(solution1('input.txt'))  # Код для контекста закомментирован

**!!!Обратите внимание!!!** начиная с этого примера и далее для удобства тестирования разных решений:  
- решения реализованы в функциях Solution
- в решениях опереаторы вывода print для контекста заменены на return 

In [17]:
solution1(TEST_FOLDER + 'test_03_01.txt')

'4.636476090008'

In [18]:
solution1(TEST_FOLDER + 'test_03_02.txt')

'10.000000000000'

In [19]:
solution1(TEST_FOLDER + 'test_03_my.txt')

'1.414213562319'

Ниже скорость и использование памяти с контекста для решения 1:  
189ms - 28.30Mb  

In [20]:
def solution2(input_file):

    def calculate_angle(ax, ay, bx, by):
        """Вычисление угла между двумя векторами."""
        angle = math.atan2(ax * by - ay * bx, ax * bx + ay * by)
        return abs(math.degrees(angle))

    def calculate_radius(x, y):
        """Вычисление расстояния до точки от центра координат."""
        return math.sqrt(x**2 + y**2)

    def calculate_arc_length(radius, angle):
        """Вычисление длины дуги (2 * π * r * θ) / 360, где r - радиус, θ - угол в градусах."""
        return (2 * math.pi * radius * angle) / 360.0
    
    def read_input_file(input_file):
        with open(input_file, 'r') as file:
            return list(map(int, file.readline().split()))

    def calculate_shortest_path(xA, yA, xB, yB):
        rA = calculate_radius(xA, yA)
        rB = calculate_radius(xB, yB)

        angle = calculate_angle(xA, yA, xB, yB)

        # Вычисление длины дуги с учётом меньшего радиуса
        arc_length = calculate_arc_length(min(rA, rB), abs(angle))

        # Выбор кратчайшего пути: по прямой или через дугу
        path_via_arc = arc_length + abs(rA - rB)  # Путь через дугу

        shortest_path = min(rA + rB, path_via_arc)

        return f"{shortest_path:.12f}"

    def main(input_file):
        xA, yA, xB, yB = read_input_file(input_file)

        return calculate_shortest_path(xA, yA, xB, yB)

    return main(input_file)

# print(solution2('input.txt'))  # Код для контекста закомментирован


In [21]:
solution2(TEST_FOLDER + 'test_03_01.txt')

'4.636476090008'

In [22]:
solution2(TEST_FOLDER + 'test_03_02.txt')

'10.000000000000'

In [23]:
solution2(TEST_FOLDER + 'test_03_my.txt')

'1.414213562373'

In [24]:
def solution3(input_file):

    def calculate_radius(x, y):
        """Вычисление расстояния до точки от центра координат."""
        return math.sqrt(x**2 + y**2)

    def read_input_file(input_file):
        with open(input_file, 'r') as file:
            return list(map(int, file.readline().split()))

    def calculate_shortest_path(xA, yA, xB, yB):
            rA = calculate_radius(xA, yA)
            rB = calculate_radius(xB, yB)

            # Вычисление угла между двумя векторами
            angle = abs(math.degrees(math.atan2(xA * yB - yA * xB, xA * xB + yA * yB)))

            # Вычисление длины дуги с учётом меньшего радиуса
            arc_length = (2 * math.pi * (min(rA, rB)) * angle) / 360.0

            return f'{min(rA + rB, arc_length + abs(rA - rB)):.12f}'

    def main(input_file):
        xA, yA, xB, yB = read_input_file(input_file)

        return calculate_shortest_path(xA, yA, xB, yB)

    return main(input_file)

# print(solution3('input.txt'))  # Код для контекста закомментирован

In [25]:
solution3(TEST_FOLDER + 'test_03_01.txt')

'4.636476090008'

In [26]:
solution3(TEST_FOLDER + 'test_03_02.txt')

'10.000000000000'

In [27]:
solution3(TEST_FOLDER + 'test_03_my.txt')

'1.414213562373'

**Тест производительности - Задача 3**:

In [28]:
N  = 10000

In [29]:
# Создание тестовых файлов с координатами
tests = []
    
for i in range(N):
    xA, yA, xB, yB = [random.randint(-10_000_000, 10_000_000) for _ in range(4)]
    tests.append((xA, yA, xB, yB))

In [30]:
tests[:5]

[(3482451, -5340530, -9138308, -5876344),
 (7804966, -622626, -1660461, 2362455),
 (5163854, 5945046, 7277646, 3862228),
 (-3693950, -9895005, 810686, -9441980),
 (2086494, -8464742, 922813, 4908440)]

In [31]:
%timeit -n 1000 (solution1.calculate_shortest_path(xA, yA, xB, yB) for xA, yA, xB, yB in tests)

415 ns ± 109 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [32]:
%timeit -n 1000 (solution2.calculate_shortest_path(xA, yA, xB, yB) for xA, yA, xB, yB in tests)

471 ns ± 90.3 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [33]:
%timeit -n 1000 (solution3.calculate_shortest_path(xA, yA, xB, yB) for xA, yA, xB, yB in tests)

372 ns ± 101 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


Выводы по тесту производительности: все три решения практически одинаковые по скорости. Небольшие расходения нельзя принимать в расчет изза достаточно большой дисперсии в разных циклах.

Далее я буду проводить тесты для всех решений, и если расхождения будут незначительными буду оставлять одно решение без тестов чтобы не перегружать вас. А если разница будет существенной, тогда буду оставлять ее вам чтобы вы могли ее учитывать