# 1. Underflow error

Физик Леонид придумал, как решить все проблемы современной физики. Он придумал новую формулу, но для того, чтобы воспользоваться ей, ему нужно сложить число порядка $(1e^{-12})$ и число порядка $(1e^{-55})$.

($(1e^{-12}$) - это $(10^{-12})$, $(1e^{-55})$ - это $(10^{-55})$).

Попробовав сделать это, удивленный Леонид обнаружил, что его программа выдает ему какой-то неправильный результат:

$[1e^{-12} + 1e^{-55} = 1e^{-12}]$

(проверьте на Python).

Леонид спросил совета у своего друга-программиста, и тот рассказал ему, что все дело в том, что вещественные числа в представлении ЭВМ – очень большое, но все же дискретное множество, и что пытаясь сложить два очень маленьких числа, Леонид вызывает т. н. underflow problem. Расстроенный Леонид решил, что может пренебречь точностью вычислений, но ему нужно знать, какой минимальный порядок числа он может прибавить к числу \(1e^{-12}\), чтобы программа смогла исполниться корректно, то есть нужно найти такое число \(n\), что:

$[1e^{-12} + 1e^{-n}]$ вычисляется корректно, то есть $(1e^{-12} + 1e^{-n} \neq 1e^{-12})$,

а $(1e^{-12} + 1e^{-m} = 1e^{-12})$, где $(m = n+1)$.

Помогите Леониду найти такое число.

## Формат вывода

Напишите число (вручную) $(n)$, где $(n)$ — это показатель степени в числе $(1e^{-n})$, являющимся ответом к задаче.

In [1]:
value1 = 1e-12
n = 13

while True:
    value2 = 10**-n
    if value1 + value2 != value1:
        break
    n += 1

print(n)

13


# 2. Битва при Азенкуре 2.0

В процессе археологических раскопок было найдено много документов. Откапывая все новые и новые рукописи, археологи датировали их и складывали в одну стопку. У одного из археологов родилась новая гипотеза о причинах поражения Французов в битве 1415 года при Азенкуре. Однако, для проверки гипотезы необходимо найти документ 1415 года. Вам дан список дат, которые приписаны к каждому документу. Даты упорядочены строго по возрастанию. При помощи бинарного поиска найдите индекс соответствующего документа. Гарантируется, что документ 1415 года есть в списке.

Вам нужно реализовать функцию с именем `bin_search(lst)` со следующими требованиями:

1. Имя функции - строго фиксировано (`bin_search`).
2. В функцию подаётся на вход список `lst`
    - список строк, каждая из которых является строковым представлением соответствующей даты. Например: `['1000', '1280', '1415']`
3. Функция возвращает число
    - искомый индекс 1415 года во входном списке.
4. В качестве отступов в функции используется 4 пробела.
5. Функция реализует алгоритм бинарного поиска.

Приведём пример функции, которую следует сдавать в тестовую систему (в данном случае реализован не бинарный поиск, а обычный, поэтому такое решение засчитано не будет):

```python
def bin_search(lst):
    for i in range(len(lst)):
        if int(lst[i])==1415:
            return i
```

In [2]:
def bin_search(lst):
    left, right = 0, len(lst) - 1
    target = 1415

    while left <= right:
        mid = (left + right) // 2
        mid_value = int(lst[mid])  
        if mid_value == target:
            return mid
        elif mid_value < target:
            left = mid + 1
        else:
            right = mid - 1

    return -1 

6


In [None]:
# Для проверки

# Пример вызова функции:
dates = ['1000', '1200', '1300', '1400', '1410', '1414', '1415', '1420', '1500']
index = bin_search(dates)
print(index)  # Ожидаемый вывод: 6

# 3. Задача: Железная логика

| Ограничение времени | 1 секунда   |
|---------------------|-------------|
| Ограничение памяти  | 64.0 МБ     |
| Ввод                | -           |
| Вывод               | стандартный вывод или output.txt |

Какие различные наборы логических переменных \( x1, x2, x3 \) приводят к ИСТИННОМУ значению приведенное ниже логическое высказывание?

$[ (\neg x1 \land x2 \land \neg x3) \lor (\neg x1 \land x2 \land x3) \lor (x1 \land \neg x2 \land \neg x3) ]$

## Формат ввода

Обратите внимание, что на вход программе ничего не подается.

## Формат вывода

На стандартный поток вывода или в файл `output.txt` выведите все наборы. Каждый набор выводится на отдельной строке. Каждый набор состоит из последовательности значений `True` или `False`, разделенных одним пробелом между собой.

Для пояснения, представим, что во всех наборах `False` заменили на `0`, `True` на `1`. Тогда каждый набор можно рассматривать как бинарный вектор $( (x1, x2, x3) )$, где $( x_i \in \{0, 1\} )$. Все наборы можно отсортировать по возрастанию, если рассматривать их как числа в двоичной системе:
- (0, 0, 1)
- (0, 1, 0)
- (0, 1, 1)
...
- (1, 1, 0)
- (1, 1, 1)

Если теперь сделать обратную замену `0` и `1` на `False` и `True` соответственно, то получим упорядоченные наборы.

In [4]:
import itertools

# Определение логического выражения
def evaluate_expression(x1, x2, x3):
    return (not x1 and x2 and not x3) or (not x1 and x2 and x3) or (x1 and not x2 and not x3)

# Возможные значения логических переменных
values = [False, True]

# Генерация всех возможных комбинаций значений
combinations = list(itertools.product(values, repeat=3))

# Список для хранения подходящих наборов
results = []

for combination in combinations:
    x1, x2, x3 = combination
    if evaluate_expression(x1, x2, x3):
        results.append(combination)

# Сортировка результатов по возрастанию соответствующих двоичных чисел
results.sort(key=lambda comb: (comb[0], comb[1], comb[2]))

# Запись результатов в файл и вывод на экран
with open('output.txt', 'w') as file:
    for result in results:
        result_str = ' '.join(map(str, result))
        print(result_str)
        file.write(result_str + "\n")

False True False
False True True
True False False


# 4. Задача: Фильтрация данных

Имеется таблица с данными, которая считывается с помощью инструментов библиотеки Pandas.

```python
import pandas as pd
data = pd.read_csv("demodata.csv")
```

Вы хотите отфильтровать данные по дням недели и цене так, чтобы в столбце weekdays были только значения Thu, а в столбце prices значения больше, чем 2 млн.

Каким образом вы можете это сделать?

Примечания
Обратите внимание на расстановку круглых скобок и приоритеты логических операций.

In [2]:
import pandas as pd

# Чтение данных из CSV файла
data = pd.read_csv("demodata.csv")

# Фильтрация данных
filtered_data = data.query('weekdays == "Thu" and prices > 2000000')

# Вывод отфильтрованных данных
filtered_data

Unnamed: 0,clientid,date,weekdays,gains,prices,up
1,1,2008-05-01,Thu,0.076192,3167181.0,True


## Варианты ответа:

`1. [(data.weekdays == 'Thu') & (data.prices > 2000000)]`

`2. data[data.weekdays == 'Thu' & data.prices > 2000000]`

`3. data[(weekdays == 'Thu') & (prices > 2000000)]`

`4. data.query('weekdays == "Thu" and prices > 2000000')`

Корректные варианты `1` и `4`, но если нужно выбрать только один вариант ответа, а `1` не верно, то тогда выбираем `4`

### Ответ: или 1 и 4 (т.к. судя по вариантам у вас множественный выбор ответов); или только 4, если все же ответ должен быть один


# 5. Задача: Предобработка данных

| Ограничение времени | 1 секунда   |
|---------------------|-------------|
| Ограничение памяти  | 64.0 МБ     |
| Ввод                | input.csv   |
| Вывод               | output.csv  |

В исходной таблице два столбца с названиями `name` и `score`.

Напишите программный код, который преобразует исходную таблицу следующим образом:

1. Необходимо удалить те строки, у которых отсутствуют данные в первом столбце (`name`).
2. Отсутствующие значения во втором столбце (`score`) необходимо заменить средним по данному столбцу.

Результат необходимо сохранить в файл `output.csv`.

## Формат ввода

На вход подается файл `input.csv`, в первой строке названия столбцов: `name` и `score`, данные в строках разделены с помощью запятых. Данные в колонке `score` - числовые.

## Формат вывода

Результат необходимо сохранить в файл `output.csv`, разделитель - запятая. Обратите внимание на формат вывода в примере.

In [4]:
import pandas as pd
 
df = pd.read_csv('input.csv')
 
df = df.dropna(subset=['name'])
df['score'] = df['score'].fillna(df['score'].mean())
 
df.to_csv('output.csv')

FileNotFoundError: [Errno 2] No such file or directory: 'input.csv'

# 6. Задача: Температура

| Ограничение времени | 1 секунда   |
|---------------------|-------------|
| Ограничение памяти  | 64.0 МБ     |
| Ввод                | input.csv   |
| Вывод               | output.csv  |

В файле `input.csv` хранится информация о температуре на определенную дату. Первый столбец называется `date`, в данном столбце хранится дата. Второй столбец называется `temperature_c`, здесь хранится информация о температуре по шкале Цельсия. Необходимо добавить новый столбец с названием `temperature_f`, в котором будет храниться информация о температуре по Фаренгейту в соответствующий день. Результат округлите до целого с помощью `round()`.

## Формат ввода

На вход подается файл `input.csv`, в первой строке названия столбцов: `date` и `temperature_c`, данные в строках разделены с помощью запятых. Данные в колонке `temperature_c` - числовые.

## Формат вывода

Результат необходимо сохранить в файл `output.csv`, разделитель - запятая. Обратите внимание на формат вывода в примере.

In [None]:
import pandas as pd

# Чтение данных из файла input.csv
df = pd.read_csv('input.csv')

# Функция для конвертации температуры из Цельсия в Фаренгейт
def celsius_to_fahrenheit(celsius):
    return round((9/5) * celsius + 32)

# Добавление нового столбца temperature_f с температурой по Фаренгейту
df['temperature_f'] = df['temperature_c'].apply(celsius_to_fahrenheit)

# Сохранение результата в файл output.csv с названием индекса 'id'
df.to_csv('output.csv')

# 7. Задача: Метод `loc`

Определите результат применения метода `loc[2:3]` к следующему датафрейму:

|   | login  | score4 | score5 | score6 |
|---|--------|--------|--------|--------|
| 1 | login3 | 2      | 5      | 5      |
| 2 | login1 | 0      | 3      | 3      |
| 3 | login4 | 5      | 5      | 5      |
| 4 | login5 | 4      | 4      | 4      |

## Варианты ответа:

1. `login4, login5`
2. `login1, login4, login5`
3. `login1, login4`

In [3]:
import pandas as pd

# Создание датафрейма
data = {
    'login': ['login3', 'login1', 'login4', 'login5'],
    'score4': [2, 0, 5, 4],
    'score5': [5, 3, 5, 4],
    'score6': [5, 3, 5, 4]
}

df = pd.DataFrame(data)

# Установка индексов с 1 до 4
df.index = [1, 2, 3, 4]

# Применение метода loc[2:3]
result = df.loc[2:3]

result

Unnamed: 0,login,score4,score5,score6
2,login1,0,3,3
3,login4,5,5,5


### Ответ: вариант 3

# 8. Задача: Водители склада

| Ограничение времени | 1 секунда   |
|---------------------|-------------|
| Ограничение памяти  | 64.0 МБ     |
| Ввод                | input.csv   |
| Вывод               | output.csv  |

В файле `input.csv` дана таблица с информацией о работе водителей склада №7:

| ID | Фамилия водителя | Объем груза | Тип операции |
|----|-------------------|-------------|--------------|
| 1  | Уточкин           | 2726        | Вывоз        |
| 2  | Петров            | 3581        | Привоз       |
| 3  | Сидоров           | 3724        | Привоз       |
| 4  | Петров            | 2683        | Привоз       |
| 5  | Иванов            | 1637        | Вывоз        |
| 6  | Уточкин           | 3836        | Вывоз        |
| 7  | Ёжкин             | 3055        | Привоз       |
| 8  | Иванов            | 3220        | Привоз       |
| 9  | Сидоров           | 2584        | Вывоз        |

Необходимо вычислить, сколько килограмм суммарно груза каждый водитель привёз за вычетом суммарного веса вывезенного груза. Итоговую таблицу отсортировать по убыванию этой суммы, а при равенстве её для двух водителей — по возрастанию фамилий водителей (в лексикографическом порядке). Сохранить в формате CSV в файл `output.csv`.

## Пример 1

### Ввод
ID,Фамилия водителя,Объем груза,Тип операции

1,Уточкин,2726,Вывоз

2,Петров,3581,Привоз

3,Сидоров,3724,Привоз

4,Петров,2683,Привоз

5,Иванов,1637,Вывоз

6,Уточкин,3836,Вывоз

7,Ёжкин,3055,Привоз

8,Иванов,3220,Привоз

9,Сидоров,2584,Вывоз

### Вывод
Фамилия водителя,Объем груза

Петров,6264

Ёжкин,3055

Иванов,1583

Сидоров,1140

Уточкин,-6562

In [None]:
import pandas as pd

data = pd.read_csv('input.csv')

if data.empty:
    result = pd.DataFrame(columns=['Фамилия водителя', 'Объем груза'])
else:
    data['Объем груза'] = data.apply(lambda row: row['Объем груза'] if row['Тип операции'] == 'Привоз' else -row['Объем груза'], axis=1)
    grouped_data = data.groupby('Фамилия водителя')['Объем груза'].sum().reset_index()

    result = grouped_data.sort_values(by=['Объем груза', 'Фамилия водителя'], ascending=[False, True])

result.to_csv('output.csv', index=False, encoding='utf-8')

# 4. Менеджмент
Ограничение времени	1 секунда
Ограничение памяти	64.0 Мб
Ввод	input.txt
Вывод	output.txt
Обратите внимание, что перед отправкой решения данной задачи нужно в качестве языка выбрать Python.

Это можно сделать в нижней части данной страницы, как показано на рисунке:

image

Менеджер крупной столичной фирмы Алексей готовит отчет о прибыльности проекта. Для отчета о прибыли фирмы Алексей проанализировал много данных и построил графики дневной прибыли.

По плану, который был составлен до старта проекта, прибыль должна была увеличиваться линейно каждый день. Если за первый день работы проекта прибыль была 5 у.е., за последний — 15 у.е., между ними прошло 10 дней, то прибыль за второй день составит 6 у.е., за третий — 7 у.е. и так далее.

На деле оказалось, что участники проекта очень не любят понедельники, и их продуктивность по понедельникам (то есть каждый 7-ой день) снижается в 3 раза по сравнению с ожидаемой, а в пятницу — наоборот: участники проекта чувствуют душевный подъем и работают в 2 раза активнее. Из-за этого прибыль по этим дням изменяется пропорционально продуктивности.

Пример: ожидаемая прибыль проекта (план)

-пн: 6 у.е.
-вт: 8 у.е.
-ср: 10 у.е.
-чт: 12 у.е.
-пт: 14 у.е.
-сб: 16 у.е.
-вс: 18 у.е.
-пн: 20 у.е.
-вт: ... и т.д.

Фактическая прибыль проекта (с поправкой на продуктивность):

-пн: 2 у.е.
-вт: 8 у.е.
-ср: 10 у.е.
-чт: 12 у.е.
-пт: 28 у.е.
-сб: 16 у.е.
-вс: 18 у.е.
-пн: 6.666 у.е.
-вт: ... и т.д.

Вам дана информация об ожидаемой по плану прибыли в первый день запуска проекта, об ожидаемой по плану прибыли в последний день запуска проекта и количестве дней работы проекта. Считаем, что понедельник — всегда первый день запуска проекта. При помощи np.linspace и присваиваний в срез, найдите фактическую прибыль проекта с поправкой на продуктивность участников за каждый день работы проекта.

Формат ввода
В файле input.txt Вам даны три числа: прибыль (по плану) проекта в первый день (в понедельник), прибыль (по плану) проекта в последний день и количество дней.

Формат вывода
Выведите в файл output.txt массив, содержащий данные по ежедневной фактической прибыли. Прибыль за каждый день представляет собой вещественное число c точностью 2 знака после запятой, каждое число записывается в отдельной строке.

In [None]:
import numpy as np

# Чтение данных из файла input.txt
with open('input.txt', 'r') as file:
    start_profit = float(file.readline().strip())
    end_profit = float(file.readline().strip())
    num_days = int(file.readline().strip())

# Создание линейной последовательности ожидаемой прибыли
expected_profits = np.linspace(start_profit, end_profit, num_days)

# Применение коррекции продуктивности
actual_profits = expected_profits.copy()
for i in range(num_days):
    if (i + 1) % 7 == 1:  # Понедельник
        actual_profits[i] /= 3
    elif (i + 1) % 7 == 5:  # Пятница
        actual_profits[i] *= 2

# Сохранение результата в файл output.txt с точностью до двух знаков после запятой
with open('output.txt', 'w') as file:
    for profit in actual_profits:
        file.write(f'{profit:.2f}\n')