# Топ 20 не уникальных событий 
Пример выгрузки топ 20 программ по рейтингу (не уникальных, то есть в результате может быть несколько выходов одной программы)

## Описание задачи и условий расчета
- Период: 03.10.2022 - 09.10.2022
- ЦА: Все 18+, города 100+
- Место просмотра: Все места (Дом+Дача)
- Каналы: все каналы проекта TV Index
- Программы: категория - все, кроме Телемагазин; Заставка, служебная передача; Спектакль, литературное чтение, длительность 5+ минут
- Статистики: Rtg%, Share

## Инициализация

При построении отчета первый шаг в любом ноутбуке - загрузка библиотек, которые помогут обращаться к TVI API и работать с данными.

Выполните следующую ячейку, для этого перейдите в нее и нажмите Ctrl+Enter

In [None]:
%reload_ext autoreload
%autoreload 2

import sys
import os
import re
import json
import datetime
import time
import pandas as pd
#import matplotlib.pyplot as plt
from IPython.display import JSON

from mediascope_api.core import net as mscore
from mediascope_api.mediavortex import tasks as cwt
from mediascope_api.mediavortex import catalogs as cwc

# Настраиваем отображение

# Включаем отображение всех колонок
pd.set_option('display.max_columns', None)
# Задаем максимальное количество выводимых строк. Раскомментируйте нужную строку
# 200 строк
# pd.set_option("display.max_rows", 200)
# Отображаем все строки. ВАЖНО! Отображение большого DataFrame требует много ресурсов
# pd.set_option("display.max_rows", None)

# Cоздаем объекты для работы с TVI API
mnet = mscore.MediascopeApiNetwork()
mtask = cwt.MediaVortexTask()
cats = cwc.MediaVortexCats()

## Справочники
Получим идентификаторы, которые будут использоваться для формирования условий расчета

In [None]:
#Получим id категорий, которые должны быть исключены из расчета
cats.get_tv_program_category(name=['Телемагазин', 
                                   'Заставка, служебная передача', 
                                   'Спектакль, литературное чтение'])
#Это 47, 63 и 3

In [None]:
# В словаре демографических атрибутов найдем переменную Население 100+
cats.find_tv_property('100+')

# В условия расчета передадим cube100Plus100Minus

## Формирование задания
Зададим условия расчета

In [None]:
# Задаем период
# Период указывается в виде списка ('Начало', 'Конец'). Можно указать несколько периодов
date_filter = [('2022-10-03', '2022-10-09')]

# Задаем дни недели
weekday_filter = None

# Задаем тип дня
daytype_filter = None

# Задаем ЦА - Все 18+, 100+
basedemo_filter = 'age >= 18 and cube100Plus100Minus = 1'

# Доп фильтр ЦА, нужен только в случае расчета отношения между ЦА, например, при расчете Affinity Index
targetdemo_filter = None

# Задаем место просмотра
location_filter=None

# Задаем каналы
company_filter = None

# Указываем фильтр программ: категория - все, кроме телемагазин, заставка и служебная передача, спектакль и лит чтение
# Продолжительность 5+ минут
program_filter = 'programCategoryId NIN (47, 63, 3) and programDuration >= 300'

# Фильтр блоков
break_filter = None

# Фильтр роликов
ad_filter = None

# Указываем список срезов
slices = ['programSpotId', #Программа ID выхода, обязательный атрибут! 
          'programName', #Программа
          'researchDate', #Дата, обязательный атрибут!
          'programStartTime', #Программа время начала
          'programFinishTime', #Программа время окончания
          'programCategoryName', #Категория
          'tvCompanyName', #Телекомпания
         ]
# Указываем список статистик для расчета
statistics = ['RtgPer', 'Share']

# Задаем опции расчета
options = {
    "kitId": 1
}

## Расчет задания

In [None]:
# Формируем задание для API TV Index в формате JSON
task_json = mtask.build_simple_task(date_filter=date_filter, weekday_filter=weekday_filter, 
                                        daytype_filter=daytype_filter, company_filter=company_filter, 
                                        location_filter=location_filter, basedemo_filter=basedemo_filter, 
                                        targetdemo_filter=targetdemo_filter,program_filter=program_filter, 
                                        break_filter=break_filter, ad_filter=ad_filter, 
                                        slices=slices, statistics=statistics, options=options)

# Отправляем задание на расчет и ждем выполнения
task = mtask.wait_task(mtask.send_simple_task(task_json))

# Получаем результат
df = mtask.result2table(mtask.get_result(task))
df

Для программ, выходивших несколько раз за период оставляем только выходы с наибольшим рейтингом

In [None]:
# Сортируем программы по убыванию значения рейтинга
df.sort_values(by=['RtgPer'], ascending = False, inplace=True)

In [None]:
# Выводим первые 20 строк
df = df.head(20).reset_index().drop('index', axis=1)
df

In [None]:
#ОПЦИОНАЛЬНО
#Задаем порядок столбцов
df = df[['programSpotId','researchDate','programStartTime','programFinishTime','programName','tvCompanyName',
        'programCategoryName','RtgPer','Share']]

In [None]:
df

## Сохраняем в Excel
По умолчанию файл сохраняется в папку `excel`

In [None]:
df_info = mtask.task_builder.get_report_info()

with pd.ExcelWriter(mtask.task_builder.get_excel_filename('03_top20_nonunique')) as writer:
    df.to_excel(writer, 'Report', index=True)
    df_info.to_excel(writer, 'Info', index=False)