# Справка

TV Index API осуществляет расчет данных проекта TV Index, в рамках которого проводится измерение телевизионной аудитории.

Обращаться к TV Index API мы будем с помощью Jupyter Notebook.

Ниже описана информация, необходимая для начала работы. 

* [Логин и пароль пользователя](#Логин-и-пароль-пользователя)
* [Библиотека Mediascope API](#Библиотека-Mediascope-API)
    * [Установка](#Установка)
    * [Обновление](#Обновление)
    * [Работа через прокси-сервер](#Работа-через-прокси-сервер)
* [Работа с Mediascope Jupyter Notebook](#Работа-с-Mediascope-Jupyter-Notebook)
    * [Работа со справочниками](#Работа-со-справочниками)
    * [Расчет заданий](#Расчет-заданий)
    * [Формирование задания](#Формирование-задания)
        * [Фильтры](#Фильтры)
        * [Срезы](#Срезы)
        * [Статистики](#Статистики)
        * [Условия охватов](#Условия-охватов)
        * [Условия сортировки](#Условия-сортировки)
        * [Опции расчета](#Опции-расчета)
        * [Опции Consumption Target](#Опции-Consumption-Target)
        * [Идентификатор переменной Consumption Target](#Идентификатор-переменной-Consumption-Target)
    * [Особенности работы с городским набором данных](#Особенности-работы-с-городским-набором-данных)
    * [Экспорт](#Экспорт)
    * [Вывод справки](#Вывод-справки)

## Логин и пароль пользователя
Для работы с TV Index API у вас должен быть логин и пароль.

_Хранить пароль непосредственно в ноутбуке небезопасно, мы будем хранить его в отдельном файле настроек, рядом с ноутбуками._

Откройте файл __"settings.json"__ и укажите ваш логин и пароль:
```json
{
	"username": "your login",
	"passw": "your password"
}
```

## Библиотека Mediascope API
Библиотека Mediascope содержит набор классов и методов, которые позволяют упростить работу с API.

### Установка
Устанавливается библиотека однократно.

Для этого выполните следующую ячейку: перейдите в нее и нажмите Ctrl+Enter

In [None]:
!pip install mediascope-api-lib

Если необходимо проверить, установлена ли библиотека Mediascope-api-lib, выполните ячейку ниже

In [None]:
!pip show mediascope-api-lib

### Обновление

Если у вас уже установлена библиотека Mediascope-api-lib для работы с другими продуктами, обновите ее для возможности работы с TV Index API

Для этого выполните следующую ячейку

In [None]:
!pip install --upgrade mediascope-api-lib

Мы периодически выпускаем обновления библиотеки mediascope-api-lib. Проверить ее актуальность можно по адресу:
```
https://pypi.org/project/mediascope-api-lib/
```

### Работа через прокси-сервер
Библиотека Mediascope имеет возможность работы через прокси-сервер. Для этого нужно в файле __"settings.json"__ указать параметр:
```json
"proxy_server": "https://superproxy.com:8080" 
```
Если доступ к прокси осуществляется через пароль, то нужно использовать следующую конструкцию:
```json
"proxy_server": "https://имя_пользователя:пароль@superproxy.com:8080"
```
В случае работы через прокси-сервер, после этапа инициализации появится сообщение "Подключено через прокси" и будет выведен адрес прокси.

## Работа с Mediascope Jupyter Notebook

Импортируем устанновленную библиотеку Mediascope-api-lib, а также другие библиотеки, которые понадобятся нам для работы:

In [None]:
%reload_ext autoreload
%autoreload 2

import sys
import os
import re
import json
import datetime
import time
import pandas as pd
from IPython.display import JSON

from mediascope_api.core import net as mscore
from mediascope_api.mediavortex import tasks as cwt
from mediascope_api.mediavortex import catalogs as cwc

# Включаем отображение всех колонок
pd.set_option('display.max_columns', None)

# Cоздаем объекты для работы с TVI API
mnet = mscore.MediascopeApiNetwork()
mtask = cwt.MediaVortexTask()
cats = cwc.MediaVortexCats()

В работе с Mediascope Jupyter Notebook можно выделить два основных действия:

- работа со справочниками.
- расчет заданий (создание задания, расчет, получение результата);

### Работа со справочниками

Для работы со справочниками в библиотеке Mediascope содержатся методы в модуле `mediascope_api.mediavortex.catalogs`.

В ноутбуке [catalogs](catalogs.ipynb) приведены примеры получения данных из всех доступных справочников.

### Расчет заданий

Стандартный сценарий работы с заданиями:

- инициализация - импорт библиотеки и создание объектов для работы с TVI API;
- формирование задания;
- отправление задания на расчет и ожидание результата;
- получение результата и его преобразование в pandas.DataFrame;
- при необходимости экспорт результата в Excel.

При формировании задания можно указать параметры, приведенные ниже. 

- **filters** - фильтры нескольких типов:
    - **date_filter** - фильтр по периодам
    - **weekday_filter** - фильтр по типам дней недели
    - **daytype_filter** - фильтр по типам дней
    - **company_filter** - фильтр по каналам
    - **time_filter** - фильтр по временным интервалам (таймбендам)
    - **location_filter** - фильтр по месту просмотра
    - **basedemo_filter** - фильтр по демографии
    - **targetdemo_filter** - дополнительный фильтр по демографии (для статистик, рассчитывающих отношение между целевыми группами)
    - **program_filter** - фильтр по программам
    - **break_filter** - фильтр по блокам
    - **ad_filter** - фильтр по роликам
- **slices** - срезы
- **statistics** - статистики
- **sortings** - условия сортировки
- **options** - опции расчета
- **consumption_target_options** - дополнительные опции расчета Consumption Target
- **custom_respondent_variable_id** - идентификатор переменной Consumption Target

Для расчета заданий существуют методы в модуле mediascope_api.crossweb.tasks: 

- **build_task** - формирует задание: принимает указанные параметры, проверяет их и создает JSON для TVI API. 
- **send_task** - отправляет задание на расчет;
- **wait_task** - ожидает расчет;
- **get_result** - получает результат;
- **result2table** - преобразует результат из JSON в pandas.DataFrame.

### Формирование задания
Рассмотрим подробнее особенности формирования условий расчета

**При формировании задания необходимо корректно задавать атрибуты для параметров.** 

Справку по параметрам и их атрибутам можно посмотреть по [ссылке](https://docs.mediascope.net/pages/viewpage.action?pageId=78807053)

Также список всех доступных атрибутов можно получить при помощи метода

- для отчета **Периоды** (Timeband): `get_timeband_unit()`
- для отчета **События** (Simple): `get_simple_unit()`
- для отчета **Кросс-таблица** (Crosstab): `get_crosstab_unit()`
- для отчета **Consumption Target**: `get_consumption_target_unit()`

Для разных наборов данных списки атрибутов могут отличаться. Для получения списка атрибутов для конкретного набора, передайте его id в параметр `kit_id`

In [None]:
#Список доступных атрибутов отчета Периоды для набора TV Index All Russia
cats.get_timeband_unit(kit_id=1)

In [None]:
#Список доступных атрибутов отчета События для набора TV Index All Russia
cats.get_simple_unit(kit_id=1)

In [None]:
#Список доступных атрибутов отчета Кросс-таблица для набора TV Index All Russia
cats.get_crosstab_unit(kit_id=1)

In [None]:
#Список доступных атрибутов отчета Consumption Target для набора TV Index All Russia
cats.get_consumption_target_unit(kit_id=1)

#### Фильтры

Создавать выражения для фильтров **weekday_filter**, **daytype_filter**, **company_filter**, **time_filter**, **location_filter**, **basedemo_filter** можно с помощью следующих операторов:

    = (равно)
    != (не равно)
    > (больше)
    < (меньше)
    >= (больше или равно) 
    <= (меньше или равно)
    AND (И)
    OR (ИЛИ)
    IN() (вхождение в список значений)
    NIN() (невхождние в список значений)

**Если фильтр не используется в задании, ему необходимо передать значение None:** 

In [None]:
weekday_filter = None

Не удаляйте и не "комментируйте" ненужный фильтр, это может привести к неожиданным расчетам или ошибкам.

Рассмотрим подробно каждый доступный фильтр

##### date_filter

Период указывается в виде списка ('Начало', 'Конец') в формате 'YYYY-MM-DD'. Можно указать несколько периодов

In [None]:
date_filter = [('2022-01-01', '2022-01-01')] # 1 января 2022
date_filter = [('2022-07-01', '2022-07-31')] # июль 2022
date_filter = [('2022-01-03', '2022-01-09'),('2022-01-17', '2022-01-23')] # Первая и третья неделя января 2022

##### weekday_filter
фильтр по типам дней недели (пн-вс).

Задается в виде логического выражения

In [None]:
weekday_filter = 'researchWeekDay = 1' # только понедельники
weekday_filter = 'researchWeekDay IN (1,3,5)' # понедельники, среды и пятницы
weekday_filter = 'researchWeekDay IN (5,6,7)' # пятница-воскресенье

К справочнику дней недели можно обратиться при помощи метода `get_tv_day_week()`

##### daytype_filter
фильтр по типам дней (рабочий/выходной/праздничный/траурный)

Задается в виде логического выражения

In [None]:
daytype_filter = 'researchDayType = W' # будние
daytype_filter = 'researchDayType IN (E, H)' # выходные и праздники

К справочнику типов дней можно обратиться при помощи метода `get_tv_research_day_type()`

##### company_filter
фильтр по каналам

Задается в виде логического выражения

Можно фильтровать по сетям, телекомпаниям, холдингам, медиахолдингам, жанрам тематических каналов

In [None]:
company_filter = 'tvNetId = 1' # сеть ПЕРВЫЙ КАНАЛ
company_filter = 'tvCompanyId = 1858' # телекомпания ПЕРВЫЙ КАНАЛ (СЕТЕВОЕ ВЕЩАНИЕ)

# группа из трех телекомпаний: ПЕРВЫЙ КАНАЛ (СЕТЕВОЕ ВЕЩАНИЕ), РОССИЯ 1 (СЕТЕВОЕ ВЕЩАНИЕ), НТВ (СЕТЕВОЕ ВЕЩАНИЕ) 
company_filter = 'tvCompanyId IN (1858, 1859, 1862)'

company_filter = 'tvCompanyHoldingID = 6' # холдинг ВГТРК
company_filter = 'tvCompanyMediaHoldingID = 1000017' # медиахолдинг ГАЗПРОМ-МЕДИА РАЗВЛЕКАТЕЛЬНОЕ ТЕЛЕВИДЕНИЕ

company_filter = 'tvThematicId IN (1,3,4)' #ДЕТСКИЕ, КИНО И СЕРИАЛЫ, МУЗЫКАЛЬНЫЕ жанры тематических каналов

При работе с [Набором городских данных](#Особенности-работы-с-городским-набором-данных) в этот фильтр также передается регион:

In [None]:
company_filter = 'regionId = 2' # Регион Санкт-Петербург
company_filter = 'regionId = 2 and tvNetId = 1' # сеть ПЕРВЫЙ КАНАЛ в регионе Санкт-Петербург

id сетей можно уточнить при помощи метода `get_tv_net()`

id телекомпаний можно уточнить при помощи метода `get_tv_company()`

К справочнику холдингов можно обратиться при помощи метода `get_tv_company_holding()`

К справочнику медиахолдингов можно обратиться при помощи метода `get_tv_company_media_holding()`

К справочнику жанров тематических каналов можно обратиться при помощи метода `get_tv_thematic()`

К справочнику регионов можно обратиться при помощи метода `get_tv_region()`

##### time_filter
фильтр по временным интервалам (таймбендам)

Задается в виде логического выражения

In [None]:
# Время передается в фильтр в формате HHMMSS
# обратите внимание, что правая граница исключающая
time_filter = 'timeBand1 >= 70000 AND timeBand1 < 110000' # 7:00 - 11:00
time_filter = 'timeBand1 >= 190000 AND timeBand1 < 230000' # 19:00 - 23:00
time_filter = 'timeBand1 >= 143300 AND timeBand1 < 155900' # 14:33 - 15:59

##### location_filter

фильтр по месту просмотра (дом/дача)

Задается в виде логического выражения

In [None]:
location_filter = 'locationId = 1' # дом
location_filter = 'locationId = 2' # дача
location_filter = None # дом+дача

К справочнику мест просмотра можно обратиться при помощи метода `get_tv_location()`

##### basedemo_filter
фильтр по демографии

Задается в виде логического выражения

In [None]:
basedemo_filter = 'sex = 2' # женщины
basedemo_filter = 'sex = 2 AND wghSuburbAgeGroup IN (4,5,6)' # женщины 25-54
basedemo_filter = 'sex = 2 AND wghSuburbAgeGroup IN (4,5,6) AND status = 1' # женщины 25-54 руководители

Демографические переменные, которые используются в заданиях, должны быть прописаны строго в следующем формате: __demoVariable__. То есть первая буква всегда строчная, например: __wghSuburbAgeGroup__

Названия переменных и их категории можно уточнить при помощи метода:

`get_tv_demo_attribute()`

Имена переменных, которые передаются в задания содержатся в поле __entityName__:

In [None]:
cats.get_tv_demo_attribute(names='Группа дохода по России')

##### targetdemo_filter
дополнительный фильтр по демографии; используется в случае расчета отношения между двумя целевыми группами, как, например, при расчете Аффинити индекса.

Задается в виде логического выражения

##### program_filter
_только для отчета События (Simple) и Кросс-таблица (Crosstab)_

фильтр по программам

Задается в виде логического выражения

In [None]:
program_filter = 'programDuration >= 300' #Длительность программы 5+ минут
program_filter = 'programStartTime >= 175000 and programStartTime <= 181000' #Начало программы с 17:50 до 18:10 включительно
program_filter = 'programTypeId IN (1,11,12)' #Жанр программы телесериал, кинофильм, анимация

##### break_filter
_только для отчета События (Simple) и Кросс-таблица (Crosstab)_

фильтр по блокам

Задается в виде логического выражения

In [None]:
break_filter = 'breaksContentType IN (C,S)' #Блок содержание: коммерческий, спонсорский
break_filter = 'breaksPositionType = I' #Блок тип: внутренний

##### ad_filter
_только для отчета События (Simple) и Кросс-таблица (Crosstab)_

фильтр по роликам

Задается в виде логического выражения

In [None]:
ad_filter = 'brandId = 420' #бренд COCA-COLA
ad_filter = 'adTypeId IN (1,23,25)' #ролик тип: ролик, Спонсорская заставка, Анонс: спонсорская заставка
ad_filter = 'articleLevel2Id = 2272 and adDistributionType = N and adIssueStatusId = R' #Товарная категория 2 - УСЛУГИ ФИНАНСОВЫЕ; Ролик распространение - Сетевой; Статус события - Реальный

#### Срезы
Позволяют разбить отчет на составляющие

В срезы передаются те же параметры, что и для фильтров. Задаются в виде списка:

In [None]:
slices = ['researchDate'] # Разбить по дням
slices = ['timeBand1'] # Разбить по минутам
slices = ['researchDate', 'timeBand1'] # Разбить сначала по дням, потом каждый день по минутам
slices = ['locationName'] # Разбить по месту просмотра
slices = ['tvCompanyName'] # Разбить по телекомпаниям

# Разбить по телекомпаниям, потом каждую компанию на место просмотра, потом каждую компанию-место на месяца
slices = ['tvCompanyName','locationName','researchMonth'] 

slices = [] #Чтобы не делать в отчете разбивок, список нужно оставить пустым

#### Статистики

##### Отчет Периоды (Timeband)

- `Reach000` - накопленный охват в тыс. человек. Количество человек, смотревших временной интервал не менее 1 минуты за анализируемый период, выраженное в тысячах человек


- `ReachPer` - накопленный охват в %. Количество человек, смотревших временной интервал не менее 1 минуты за анализируемый период, выраженное в % от общей численности исследуемой аудитории


- `AvWkReach000` - cредненедельный охват в тыс. человек. Среднее количество человек, смотревших временной интервал не менее 1 минуты за неделю, выраженное в тысячах человек


- `AvWkReachPer` - cредненедельный охват в %. Среднее количество человек, смотревших временной интервал не менее 1 минуты за неделю, выраженное в % от общей численности исследуемой аудитории


- `AvMReach000` - cреднемесячный охват в тыс. человек. Среднее количество человек, смотревших временной интервал не менее 1 минуты за месяц, выраженное в тысячах человек


- `AvMReachPer` - cреднемесячный охват в %. Среднее количество человек, смотревших временной интервал не менее 1 минуты за месяц, выраженное в % от общей численности исследуемой аудитории


- `AvReach000` - среднесуточный охват в тыс. человек. Среднее количество человек, смотревших временной интервал не менее 1 минуты в сутки, выраженное в тысячах человек


- `AvReachPer` - среднесуточный охват в %. Среднее количество человек, смотревших временной интервал не менее 1 минуты в сутки, выраженное в % от общей численности исследуемой аудитории


- `Rtg000` - рейтинг в тыс. человек. Среднее количество человек в целевой аудитории, смотревших эфирное событие или временной интервал на протяжении всей его длительности


- `RtgPer` - рейтинг %. Среднее количество человек, смотревших эфирное событие или временной интервал на протяжении всей его длительности, выраженное в % от общей численности исследуемой аудитории


- `TgAffinPer` - индекс соответствия. Используется для определения эффективности временного интервала для анализируемой демографической группы. Рассчитывается как отношение рейтинг % временного интервала для выбранной целевой аудитории и рейтинг % этого временного интервала, посчитанного для выбранной базовой группы


- `TgSatPer` - демографический профиль. Рассчитывается как отношение среднего рейтинга в тыс. чел. временного интервала / эфирного события для выбранной целевой аудитории к среднему рейтингу в тыс. чел. этого временного интервала /события, посчитанного для выбранной базовой группы


- `TgAffinReachPer` - индекс соответствия. Используется для определения эффективности временного интервала / эфирного события для анализируемой демографической группы. Рассчитывается как отношение охвата временного интервала / эфирного события, выраженного в процентах от выбранной целевой аудитории и охвата этого временного интервала / события выраженного в процентах от базовой группы


- `TgSatReachPer` - демографический профиль. Рассчитывается как отношение охвата временного интервала / эфирного события в тыс. чел. для выбранной целевой аудитории к охвату этого временного интервала /события в тыс. чел. в выбранной базовой группе.


- `TAud` - суммарное время просмотра в минутах по всем зрителям за весь период


- `ATV` - среднесуточное время просмотра в минутах среди населения


- `ATVReach` - среднесуточное время просмотра в минутах среди зрителей


- `Share` - доля аудитории в %. Процент телезрителей, смотревших временной интервал. Рассчитывается как отношение зрителей временного интервала к общему количеству телезрителей (общему количеству человек, входящих в анализируемую целевую группу, смотрящих ТВ во время анализируемого временного интервала)


- `WAgeAverage` - Средневзвешенный возраст аудитории


- `Universe000` - размер общей численности исследуемой аудитории в тыс. человек


- `Sample` - количество респондентов за средние исследовательские сутки в указанной ЦА


- `TTVRtg000` - Тотал ТВ рейтинг в тыс. человек


- `TTVRtgPer` - Тотал ТВ рейтинг %


- `TTVReach000` - Тотал ТВ накопленный охват в тыс. человек


- `TTVReachPer` - Тотал ТВ накопленный охват в %


- `TTVAvReach000` - Тотал ТВ среднесуточный охват в тыс. человек


- `TTVAvReachPer` - Тотал ТВ среднесуточный охват в %


- `TTVATV` - Тотал ТВ среднесуточное время просмотра в минутах среди населения


- `TTVATVReach` - Тотал ТВ среднесуточное время просмотра в минутах среди зрителей

##### Отчет События (Simple)

- `Reach000` - охват в тыс. человек. Количество человек в тыс, у которых был контакт 1+ минут с событием
- `SpotByBreaksReach000` - охват в тыс. человек, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramReach000` - охват в тыс. человек, рассчитанный по значимому времени расчета программы


- `ReachPer` - охват в %. Количество человек в %, у которых был контакт 1+ минут с событием
- `SpotByBreaksReachPer` - охват в %, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramReachPer` - охват в %, рассчитанный по значимому времени расчета программы


- `Rtg000` - аудитория в тыс. человек. Среднее количество человек в целевой аудитории, смотревших эфирное событие на протяжении всей его длительности
- `SpotByBreaksRtg000` - аудитория в тыс. человек, рассчитаннаая по значимому времени расчета рекламного блока
- `SpotByProgramRtg000` - аудитория в тыс. человек, рассчитанная по значимому времени расчета программы
- `SalesRtg000` - cреднее количество человек в баинговой аудитории канала, смотревших эфирное событие на протяжении всей его длительности


- `RtgPer` - рейтинг %. Среднее количество человек, смотревших эфирное событие на протяжении всей его длительности, выраженное в % от общей численности исследуемой аудитории
- `SpotByBreaksRtgPer` - рейтинг %, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramRtgPer` - рейтинг %, рассчитанный по значимому времени расчета программы
- `SalesRtgPer` - рейтинг %, рассчитанный по баинговой аудитории канала
- `StandRtgPer` - рейтинг %, рассчитанный с учетом стандартной длительности ролика. Рассчитывается как Rtg% * ожидаемая длительность ролика / 20 (стандартная длительность ролика). В options задания (см. раздел [Опции расчета](#Опции-расчета)) есть возможность выбрать реальную длительность вместо ожидаемой, а также задать значение стандартной длительности ролика. 


- `Share` - доля аудитории в %. Процент телезрителей, смотревших эфирное событие. Рассчитывается как отношение зрителей эфирного события к общему количеству телезрителей (общему количеству человек, входящих в анализируемую целевую группу, смотрящих ТВ во время анализируемого эфирного события). Считается от Total channels


- `TgAffinPer` - индекс соответствия. Используется для определения эффективности эфирного события для анализируемой демографической группы. Рассчитывается как отношение рейтинга эфирного события для выбранной целевой аудитории и рейтинга этого события, посчитанного для выбранной базовой группы
- `SalesAffinPer` - индекс соответствия баинговой аудитории канала. Рассчитывается как отношение рейтинга эфирного события для выбранной целевой аудитории и рейтинга этого события, посчитанного для баинговой аудитории канала
- `TgSatPer` - демографический профиль. Рассчитывается как отношение среднего рейтинга в тыс. чел. эфирного события для выбранной целевой аудитории к среднему рейтингу в тыс. чел. этого события, посчитанного для выбранной базовой группы
- `TgAffinReachPer` - индекс соответствия. Используется для определения эффективности эфирного события для анализируемой демографической группы. Рассчитывается как отношение охвата эфирного события, выраженного в процентах от выбранной целевой аудитории и охвата этого события выраженного в процентах от базовой группы
- `TgSatReachPer` - демографический профиль. Рассчитывается как отношение охвата эфирного события в тыс. чел. для выбранной целевой аудитории к охвату этого события в тыс. чел. в выбранной базовой группе


- `TAud` - суммарное время просмотра в минутах по всем зрителям для одного события
- `ATV` - среднее время просмотра в минутах среди населения
- `ATVReach` - среднее время просмотра в минутах среди зрителей


- `Universe000` - размер генеральной совокупности в тыс. человек
- `Sample` - размер выборки (количество респондентов в целевой группе)


- `TTVRtg000` - рейтинг всего ТВ на протяжении длительности эфирного события (в тыс чел). Считается для Total channels
- `TTVRtgPer` - рейтинг всего ТВ на протяжении длительности эфирного события (в % от целевой аудитории). Считается для Total channels


- `Duration` - фактическая неокругленная длительность события. Длительность выхода программы/блока/ролика в секундах
- `Quantity` - количество эфирных событий


- `CostByMinRUB` - стоимость размещения из протокола реклам - по минутным прайс листам (Rate Card) в рублях
- `CostByMinUSD` - стоимость размещения из протокола реклам - по минутным прайс листам (Rate Card) в USD
- `CostByGRPRUB` - стоимость размещения из протокола реклам - по GRP прайс листам в рублях
- `CostByGRPUSD` - стоимость размещения из протокола реклам - по GRP прайс листам в USD
- `ConsolidatedCostRUB` - приведенная стоимость размещения из протокола реклам - в зависимости от типа оценки рекламного блока в рублях
- `ConsolidatedCostUSD` - приведенная стоимость размещения из протокола реклам - в зависимости от типа оценки рекламного блока в USD

##### Отчет Кросс-таблица (Crosstab)

Суммарные (тотал) статистики:

- `CumReach000` - накопленный охват в тыс. человек. Количество человек, смотревших какое-либо событие группы не менее 1 минуты, выраженное в тысячах человек
- `SpotByBreaksCumReach000` - накопленный охват в тыс. человек, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramCumReach000` - накопленный охват в тыс. человек, рассчитанный по значимому времени расчета программы


- `CumReachPer` - накопленный охват в %. Количество человек, смотревших какое-либо событие группы не менее 1 минуты, выраженное в % от общей численности исследуемой аудитории
- `SpotByBreaksCumReachPer` - накопленный охват в %, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramCumReachPer` - накопленный охват в %, рассчитанный по значимому времени расчета программы


- `Rtg000Sum` - суммарный рейтинг группы событий в тыс. человек
- `SalesRtg000Sum` - суммарный рейтинг группы событий в тыс. человек, рассчитанный по баинговой аудитории канала
- `SpotByBreaksRtg000Sum` - суммарный рейтинг группы событий в тыс. человек, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramRtg000Sum` - суммарный рейтинг группы событий в тыс. человек, рассчитанный по значимому времени расчета программы


- `RtgPerSum` - суммарный рейтинг группы событий в %
- `SalesRtgPerSum` - суммарный рейтинг группы событий в %, рассчитанный по баинговой аудитории канала
- `StandRtgPerSum` - суммарный рейтинг группы событий в %, рассчитанный с учетом стандартной длительности ролика. В options задания (см. раздел [Опции расчета](#Опции-расчета)) есть возможность выбрать реальную длительность вместо ожидаемой, а также задать значение стандартной длительности ролика. 
- `SpotByBreaksRtgPerSum` - суммарный рейтинг группы событий в %, рассчитанный по значимому времени расчета рекламного блока
- `SpotByBreaksSalesRtgPerSum` - суммарный рейтинг группы событий в %, рассчитанный по баинговой аудитории канала и значимому времени расчета рекламного блока
- `SpotByProgramRtgPerSum` - суммарный рейтинг группы событий в %, рассчитанный по значимому времени расчета программы


- `TAudSum` - cуммарное время просмотра в минутах по всем зрителям для всех событий в группе
- `ATVSum` - суммарное время просмотра группы событий среди населения
- `ATVReachSum` - суммарное время просмотра группы событий среди зрителей


- `SpotByBreaksOTS000` - сумма охватов эфирных событий, входящих в группу, рассчитанная по значимому времени расчета рекламного блока


- `DurationSum` - суммарная длительность событий, входящих в группу
- `QuantitySum` - количество эфирных событий в группе


- `CostByMinSumRUB` - суммарная стоимость размещения рекламных сообщений по минутным прайс листам (Rate Card) в рублях
- `CostByMinSumUSD` - суммарная стоимость размещения рекламных сообщений по минутным прайс листам (Rate Card) в USD
- `CostByGRPSumRUB` - суммарная стоимость размещения рекламных сообщений по GRP прайс листам в рублях
- `CostByGRPSumUSD` - суммарная стоимость размещения рекламных сообщений по GRP прайс листам в USD
- `ConsolidatedCostSumRUB` - суммарная приведенная  стоимость размещения рекламных сообщений в зависимости от типа оценки рекламного блока в рублях
- `ConsolidatedCostSumUSD` - суммарная приведенная  стоимость размещения рекламных сообщений в зависимости от типа оценки рекламного блока в USD

Средние статистики:

- `AvReach000` - охват среднего события в тыс. человек
- `SpotByBreaksAvReach000` - охват среднего события в тыс. человек, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramAvReach000` - охват среднего события в тыс. человек, рассчитанный по значимому времени расчета программы


- `AvReachPer` - охват среднего события в % от общей численности исследуемой аудитории
- `SpotByBreaksAvReachPer` - охват среднего события в % от общей численности исследуемой аудитории, рассчитанный по значимому времени расчета рекламного блока
- `SpotByProgramAvReachPer` - охват среднего события в % от общей численности исследуемой аудитории, рассчитанный по значимому времени расчета программы


- `Rtg000Avg` - рейтинг среднего события в группе в тыс. человек
- `SalesRtg000Avg` - рейтинг среднего события в группе в тыс. человек, рассчитанный по баинговой аудитории канала
- `SpotByBreaksRtg000Avg` - рейтинг среднего события в группе в тыс. человек, рассчитанный по значимому времени расчета рекламного блока
- `SpotByBreaksSalesRtg000Avg` - рейтинг среднего события в группе в тыс. человек, рассчитанный по баинговой аудитории канала и значимому времени расчета рекламного блока
- `SpotByProgramRtg000Avg` - рейтинг среднего события в группе в тыс. человек, рассчитанный по значимому времени расчета программы


- `RtgPerAvg` - рейтинг среднего события в группе в % от общей численности исследуемой аудитории
- `SalesRtgPerAvg` - рейтинг среднего события в группе в % от общей численности исследуемой аудитории, рассчитанный по баинговой аудитории канала
- `StandRtgPerAvg` - рейтинг %, рассчитанный с учетом стандартной длительности ролика. В options задания (см. раздел [Опции расчета](#Опции-расчета)) есть возможность выбрать реальную длительность вместо ожидаемой, а также задать значение стандартной длительности ролика. 
- `SpotByBreaksRtgPerAvg` - рейтинг среднего события в группе в % от общей численности исследуемой аудитории, рассчитанный по значимому времени расчета рекламного блока
- `SpotByBreaksSalesRtgPerAvg` - рейтинг среднего события в группе в % от общей численности исследуемой аудитории, рассчитанный по баинговой аудитории канала и значимому времени расчета рекламного блока
- `SpotByProgramRtgPerAvg` - рейтинг среднего события в группе в % от общей численности исследуемой аудитории, рассчитанный по значимому времени расчета программы


- `ShareAvg` - доля аудитории среднего события в группе


- `TgAffinPerAvg` - индекс соответствия. Используется для определения эффективности группы событий для анализируемой демографической группы. Рассчитывается как отношение среднего рейтинга группы событий для выбранной целевой аудитории и среднего рейтинга группы событий, посчитанного для выбранной базовой группы


- `ATVAvg` - среднее время просмотра группы событий среди населения
- `ATVReachAvg` - среднее время просмотра группы событий среди зрителей 


- `Universe000Avg` - усредненный размер генеральной совокупности в тыс. человек за дни, в которые выходили события из группы
- `SampleAvg` - усредненный размер выборки (количество респондентов в целевой группе) за дни, в которые выходили события из группы


- `TTVRtg000Avg` - средний рейтинг всего ТВ на протяжении длительности группы событий (в тыс чел). Считается для Total channels
- `TTVRtgPerAvg` -  рейтинг всего ТВ на протяжении длительности группы событий (в % от целевой аудитории). Считается для Total channels


- `DurationAvg` - средняя длительность событий, входящих в группу 

##### Отчет Consumption Target

- `CommonWatchers` - зрители (смотрели телеканал хотя бы 1 минуту за отчетный период)


- `CommonNotWatchers` - не зрители (не смотрели телеканал за отчетный период)


- `NGroupResp` - зрители сортируются по длительности просмотра и разбиваются на n равных по количеству респондентов групп. Количество групп задается в параметре `groupsCount` в `consumption_target_options`


- `NGroupDur` - зрители сортируются по длительности просмотра и разбиваются на n групп. Количество групп задается в параметре `groupsCount` в `consumption_target_options`

Статистики задаются в виде списка

In [None]:
statistics = ['Rtg000', 'RtgPer', 'Share']

#### Условия охватов
Настройка параметров условий контакта при расчете охватов. Передаются в виде словаря в параметр `reach_conditions`
Пример расчета охватов с условиями см. в ноутбуке [Условия охватов (Reach conditions)](timeband_periods&intervals_08_TTVReach_with_condition_by_date.ipynb)

In [None]:
reach_conditions = {
    "filterType": "MINUTES",
    "viewingType": "NONCONSECUTIVE",
    "intervals": [
        {
            "from": 5,
            "to": 9
        },
        {
            "from": 10
        }
    ]
}

- **filterType** - тип условия
    - "MINUTES" - в минутах
    - "PERCENT" - процент от заданного временного интервала
- **viewingType** - тип просмотра
    - "NONCONSECUTIVE" - непоследовательный просмотр (с переключениями)
    - "CONSECUTIVE" - последовательный просмотр (без переключений)
- **intervals** - интервал просмотра. Можно указывать без конечной или начальной границы. Можно задать несколько непересекающихся интервалов

> ⚠️ В одной задаче можно рассчитать только непересекающиеся интервалы. Пересекающиеся интервалы необходимо считать отдельными задачами.

#### Условия сортировки
Задаются в виде словаря, где ключ - название столбца, значение - направление сортировки

In [None]:
sortings = {'tvCompanyName':'ASC'} #сортировка по названию телекомпании (от а до я)
sortings = {'researchDate':'ASC', 'RtgPer':'DESC'} #сортировка по дате (по возрастанию), затем по рейтингу (по убыванию)

#### Опции расчета
Передаются в виде словаря в параметр `options`

In [None]:
options = {
    "kitId": 1,
    "useNbd": True,
    "baseDate": '2022-07-10',
    "totalType": "TotalChannels",
    "minSmp": 50,
    "standRtg" : {
      "useRealDuration" : True,
      "standardDuration" : 20
    },
    "issueType": "PROGRAM"
}

- **kitId** - id набора данных:
    1. TV Index All Russia 
    2. TV Index Russia 100+
    3. TV Index Cities
    4. TV Index Plus All Russia
    5. TV Index Plus Russia 100+


- **useNbd** - использовать nbd коррекцию (standard) при расчете накопленных охватов: True/False. По умолчанию True
- **baseDate** - базовый день для расчета накопленного охвата. По умолчанию None (в расчете будет использоваться серединный день периода)
- **totalType** - основание расчета Share и TTV статистик: TotalChannels / TotalTVSet / TotalChannelsThem. По умолчанию TotalChannels
- **minSmp** - настройка минимального значения выборки для отображения значений. Ячейки, посчитанные по выборке ниже указанного значения закрываются звездочкой. По умолчанию 5
- **standRtg** - настройка расчета standard Rtg:
    - useRealDuration - расчет по реальной длительности ролика. По умолчанию False (то есть по каталожной длительности)
    - standardDuration - значение стандартной длительности ролика. По умолчанию 20
- **issueType** - тип события для расчета отчета Кросс-таблица (Crosstab): PROGRAM, BREAKS, AD   

#### Опции Consumption Target
Дополнительные опции отчета Consumption Target. Передаются в виде словаря в параметр `consumption_target_options`

In [None]:
consumption_target_options = {
    "groupsCount": "5",
    "intervalConditions": {
        "intervals": [
            {
                "from":"5",
                "to": "100"
            }
        ],
    "viewingType": "CONSECUTIVE"
    }
}

- **groupsCount** - количество групп, на которое необходимо поделить отобранных респондентов. Работает в связке со статистиками NGroupResp и NGroupDur
- **intervalConditions** - длительность просмотра (в минутах). Можно указывать без конечной или начальной границы.
- **viewingType** - тип просмотра
    - "NONCONSECUTIVE" - непоследовательный просмотр (с переключениями)
    - "CONSECUTIVE" - последовательный просмотр (без переключений)

#### Идентификатор переменной Consumption Target
Передается в формате строки в параметр `custom_respondent_variable_id`. Подробнее см., например, [Отбор зрителей канала](consumption_target_01_simple_viewers.ipynb)

In [None]:
custom_respondent_variable_id = 'd2f99f6c-06ca-462e-b7dd-cce9d1037b1e'

Идентификаторы переменных можно получить в каталоге `get_custom_respondent_variable()`

### Особенности работы с городским набором данных
При работе с набором TV Index Cities ("kitId": 3) город должен задаваться в двух фильтрах:
- в company_filter, как регион (regionId)
- в basedemo_filter и targetdemo_filter, как город (city)

Например, для рассчета показателей по **Москве**, необходимо задать фильтры следующим образом:

`company_filter = 'regionId = 1'`

`basedemo_filter = 'city = 12'`

Соответствие региона и города можно уточнить при помощи метода `get_tv_monitoring_cities()`:

In [None]:
cats.get_tv_monitoring_cities(region_name=['Москва'])

Для упрощения работы в метод формирования задания `build_task` добавлены параметры `add_city_to_basedemo_from_region` и `add_city_to_targetdemo_from_region`

Если они активированы, то достаточно задать только регион в company_filter. Демо фильтры заполнятся автоматически соответствующими id.   

> ⚠️ В одной задаче можно рассчитать данные только по одному городу. Расчеты по нескольким городам необходимо делать отдельными задачами в цикле, см, например, [Города: основные показатели каналов](timeband_overall_figures_cities_01_basic_channels_figures.ipynb)

### Экспорт

В Excel

Файл сохраняется в папку `excel`

In [None]:
df_info = mtask.task_builder.get_report_info() #формируем таблицу с условиями расчета

with pd.ExcelWriter(mtask.task_builder.get_excel_filename('file_name')) as writer: #вместо 'file_name' прописать название файла
    df.to_excel(writer, 'Report', index=True)
    df_info.to_excel(writer, 'Info', index=False) #записываем условия расчета на отдельную вкладку

Пример изменения формата даты из `2024-04-12` в `12.04.2024` при экспорте. Дата находится в столбце `researchDate`. Описание настроек формата даты доступно [по ссылке](https://docs.python.org/3/library/datetime.html#strftime-and-strptime-format-codes)

In [None]:
df['researchDate'] = pd.to_datetime(df['researchDate']) # преобразуем строку в тип данных даты
df['researchDate'] = df['researchDate'].dt.strftime('%d.%m.%Y') # собираем строку в нужном нам формате из компонентов даты
# и затем сохраняем в excel, используя пример кода выше

Пример изменения формата времени при экспорте. По умолчанию время экспортируется в excel в виде строки, но возможно указание формата времени (обратите внимание, у нас используется нестандартный формат 5-29, т.е. сутки начинаются в 5 часов и заканчиваются в 29 часов). Пример изменения формата времени (время находится в столбцах `programStartTime` и `programFinishTime`) ниже.

In [None]:
import mediascope_api.core.utils as utils

# преобразуем формат столбцов со временем в формат timedelta
df['programStartTime'] = pd.to_timedelta(df['programStartTime'])
df['programFinishTime'] = pd.to_timedelta(df['programFinishTime'])

# сохраняем в excel, используя код выше, но с изменением формата столбцов
df_info = mtask.task_builder.get_report_info()

with pd.ExcelWriter(mtask.task_builder.get_excel_filename('file_name')) as writer:
    df.to_excel(writer, 'Report', index=False)
    # изменяем формат столбцов со временем
    utils.format_time_column(dataframe=df,
                       writer=writer,
                       column_names=['programStartTime', 'programFinishTime'],
                       sheet_name='Report',
                       index=True)
    df_info.to_excel(writer, 'Info', index=False)

В CSV

Файл сохраняется в ту же директорию, в которой находится ноутбук

In [None]:
df.to_csv('file_name', sep='\t') #вместо 'file_name' прописать название файла, в sep передать необходимый разделитель

### Вывод справки

Все методы библиотеки Mediascope имеют справку.

Для вывода справки нужно установить курсор на имя метода и нажать комбинацию клавиш __Shift+Tab__
```
mtask.build_task()
```
или воспользоваться командой __help__

In [None]:
help(mtask.result2table)