In [220]:
from IPython.core.display import HTML
table_css = 'table {align:left;display:block} '
HTML('<style>{}</style>'.format(table_css))

### D. Анализ логов

|   |   |
|:--|:--|
| Ограничение времени |	1 секунда |
| Ограничение памяти |	64 Мб |
| Ввод |	стандартный ввод или input.txt |
| Вывод	| стандартный вывод или output.txt |

Поисковая выдача — это упорядоченный список документов, показанных поисковой системой по текстовому запросу. Документы размечаются по релевантности и по максимальному количеству денег, которое документ может принести.

Вставьте минимальное количество документов на выдачу, чтобы максимизировать деньги и не ухудшить качество. Размер выдачи по запросу тоже не должен измениться: новые документы вклиниваются в выдачу, а низ удаляется. Порядок изначальных документов нельзя менять. Выведите максимальную суммарную выручку по всем запросам.

Ответ округлите до сотых.

#### Формат ввода

Вам дан текстовый файл со следующими данными:
1. serpset — список размеченных поисковых выдач.
2. new_documents — размеченные документы.

#### Формат вывода

Суммарная выручка по всем запросам.

#### Пример

##### Ввод

```json 
{
	"serpset": [
		{
			"query": "okna",
		 	"results": [
				{"position": 0, "url": "okna-msk.ru", "relevance": 0.95, "cost": 77}, 
				{"position": 1, "url": "okna-pvh.ru", "relevance": 0.95, "cost": 70}, 
				{"position": 2, "url": "ne-okna.ru", "relevance": 0.3, "cost": 100}, 
				{"position": 3, "url": "best-okna.ru", "relevance": 0.1, "cost": 0}
    		]
        }, 
		{
			"query": "lego",
			"results": [
				{"position": 0, "url": "lego.ru", "relevance": 0.95, "cost": 15}, 
				{"position": 1, "url": "lego-mir.ru", "relevance": 0.7, "cost": 30}, 
				{"position": 2, "url": "disney.ru", "relevance": 0.3, "cost": 100}
            ]
		}
    ], 
	"new_documents": [
		{"query": "weather", "url": "yandex.ru/pogoda", "relevance": 1, "cost": 0}, 
		{"query": "okna", "url": "yandex.ru/okna", "relevance": 1, "cost": 100}, 
		{"query": "lego", "url": "yandex.ru/lego", "relevance": 0.4, "cost": 10}
	]
}
```

##### Вывод

```python
338.81
```

#### Примечания

Качество мерим метрикой $RelDCG = \sum_{i}\frac{relevance_{i}}{i}$.

Деньги мерим метрикой $Revenue = \sum_{i}\frac{cost_{i}}{\sqrt{i}}$.

In [217]:
import json
import math

with open('input.txt', 'r') as file:
    data = json.load(file)

def get_relevance(results_list):
    relevance = 0
    for idx in range(0, len(results_list)):
        relevance += (results_list[idx]['relevance'] / (idx+1))
    return relevance

def get_revenue(results_list):
    revenue = 0
    for idx in range(0, len(results_list)):
        revenue += (results_list[idx]['cost'] / math.sqrt(idx+1))
    return revenue

all_revenues = []
for doc in data['new_documents']:
    for serp in data['serpset']:
        if doc['query'] == serp['query']:
            original_results = serp['results']
            original_relevance = get_relevance(original_results)
            original_revenue = get_revenue(original_results)
            best_revenue = original_revenue
            for idx in range(0, len(serp['results'])):
                modified_results = serp['results'].copy()
                modified_results.insert(idx, doc)
                modified_results.pop()
                modified_relevance = get_relevance(modified_results)
                modified_revenue = get_revenue(modified_results)
                if modified_relevance >= original_relevance:
                    if modified_revenue > best_revenue:
                        best_revenue = modified_revenue
            all_revenues.append(best_revenue)

print(f'{sum(all_revenues):.2f}')

338.81
