# Справка

TV Index API осуществляет расчет данных проекта TV Index, в рамках которого проводится измерение телевизионной аудитории.

Обращаться к TV Index API мы будем с помощью Jupyter Notebook.

Ниже описана информация, необходимая для начала работы. 

* [Логин и пароль пользователя](#Логин-и-пароль-пользователя)
* [Библиотека Mediascope API](#Библиотека-Mediascope-API)
* [Работа через прокси-сервер](#Работа-через-прокси-сервер)
    * [Обновление библиотеки](#Обновление-библиотеки)
* [Работа с Mediascope Jupyter Notebook](#Работа-с-Mediascope-Jupyter-Notebook)
    * [Работа со справочниками](#Работа-со-справочниками)
    * [Расчет заданий](#Расчет-заданий)
    * [Формирование задания](#Формирование-задания)
        * [Фильтры](#Фильтры)
        * [Срезы](#Срезы)
        * [Статистики](#Статистики)
        * [Опции расчета](#Опции-расчета)
* [Вывод справки](#Вывод-справки)


## Логин и пароль пользователя
Для работы с TV Index API у вас должен быть логин и пароль.

_Хранить пароль непосредственно в ноутбуке небезопасно, мы будем хранить его в отдельном файле настроек, рядом с ноутбуками._

Откройте файл __"settings.json"__ и укажите ваш логин и пароль:
```json
{
	"username": "your login",
	"passw": "your password"
}
```

## Работа через прокси-сервер
Библиотека Mediascope имеет возможность работы через прокси-сервер. Для этого нужно в файле __"settings.json"__ указать параметр:
```json
"proxy_server": "https://superproxy.com:8080" 
```
Если доступ к прокси осуществляется через пароль, то нужно использовать следующую конструкцию:
```json
"proxy_server": "https://имя_пользователя:пароль@superproxy.com:8080"
```
В случае работы через прокси-сервер, после этапа инициализации появится сообщение "Подключено через прокси" и будет выведен адрес прокси.

## Установка библиотеки Mediascope API
Библиотека Mediascope содержит набор классов и методов, которые позволяют упростить работу с API.

Устанавливается библиотека однократно.

Для этого выполните следующую ячейку: перейдите в нее и нажмите Ctrl+Enter

In [None]:
!pip install mediascope-api-lib

Если необходимо проверить, установлена ли библиотека Mediascope-api-lib, выполните ячейку ниже

In [None]:
!pip show mediascope-api-lib

### Обновление библиотеки

Если у вас уже установлена библиотека Mediascope-api-lib для работы с другими продуктами, обновите ее для возможности работы с TV Index API

Для этого выполните следующую ячейку

In [None]:
!pip install --upgrade mediascope-api-lib

Мы периодически выпускаем обновления библиотеки mediascope-api-lib. Проверить ее актуальность можно по адресу:
```
https://pypi.org/project/mediascope-api-lib/
```

Импортируем устанновленную библиотеку Mediascope-api-lib, а также другие библиотеки, которые понадобятся нам для работы:

In [4]:
%reload_ext autoreload
%autoreload 2

import sys
import os
import re
import json
import datetime
import time
import pandas as pd
from IPython.display import JSON

from mediascope_api.core import net as mscore
from mediascope_api.mediavortex import tasks as cwt
from mediascope_api.mediavortex import catalogs as cwc

# Включаем отображение всех колонок
pd.set_option('display.max_columns', None)

# Cоздаем объекты для работы с TVI API
mnet = mscore.MediascopeApiNetwork()
mtask = cwt.MediaVortexTask()
cats = cwc.MediaVortexCats()

Запрошены записи: 0 - 257
Всего найдено записей: 257

Запрошены записи: 0 - 257
Всего найдено записей: 257



## Работа с Mediascope Jupyter Notebook

В работе с Mediascope Jupyter Notebook можно выделить два основных действия:

- работа со справочниками.
- расчет заданий (создание задания, расчет, получение результата);

### Работа со справочниками

Для работы со справочниками в библиотеке Mediascope содержатся методы в модуле `mediascope_api.mediavortex.catalogs`.

В ноутбуке [catalogs](catalogs.ipynb) приведены примеры получения данных из всех доступных справочников.

### Расчет заданий

Стандартный сценарий работы с заданиями:

- инициализация - импорт библиотеки и создание объектов для работы с TVI API;
- формирование задания;
- отправление задания на расчет и ожидание результата;
- получение результата и его преобразование в pandas.DataFrame;
- при необходимости экспорт результата в Excel.

При формировании задания можно указать параметры, приведенные ниже. 

- **filters** - фильтры нескольких типов:
    - **date_filter** - фильтр по периодам
    - **weekday_filter** - фильтр по типам дней недели
    - **daytype_filter** - фильтр по типам дней
    - **company_filter** - фильтр по каналам
    - **time_filter** - фильтр по временным интервалам (таймбендам)
    - **location_filter** - фильтр по месту просмотра
    - **basedemo_filter** - фильтр по демографии
    - **targetdemo_filter** - дополнительный фильтр по демографии (для статистик, рассчитывающих отношение между целевыми группами)
- **slices** - срезы
- **statistics** - статистики
- **options** - опции расчета

Для расчета заданий существуют методы в модуле mediascope_api.crossweb.tasks: 

- **build_task** - формирует задание: принимает указанные параметры, проверяет их и создает JSON для TVI API. 
- **send_task** - отправляет задание на расчет;
- **wait_task** - ожидает расчет;
- **get_result** - получает результат;
- **result2table** - преобразует результат из JSON в pandas.DataFrame.

### Формирование задания
Рассмотрим подробнее особенности формирования условий расчета

**При формировании задания необходимо корректно задавать атрибуты для параметров.** 

Справку по параметрам и их атрибутам можно посмотреть по [ссылке](https://docs.mediascope.net/pages/viewpage.action?pageId=70647824)

Также список всех доступных атрибутов можно получить при помощи метода

Для отчета **Timeband**, это `get_timeband_unit()`:

In [5]:
cats.get_timeband_unit()

{'statistics': ['Reach000',
  'ReachPer',
  'AvReach000',
  'AvReachPer',
  'Rtg000',
  'RtgPer',
  'TgAffinPer',
  'TAud',
  'ATV',
  'ATVReach',
  'Share',
  'Universe000',
  'Sample',
  'TTVRtg000',
  'TTVRtgPer',
  'TTVReach000',
  'TTVReachPer',
  'TTVAvReach000',
  'TTVAvReachPer',
  'TTVATV',
  'TTVATVReach'],
 'slices': ['researchDate',
  'researchWeek',
  'researchMonth',
  'researchQuarter',
  'researchYear',
  'researchHalfYear',
  'researchWeekDay',
  'researchDayType',
  'locationId',
  'locationName',
  'locationEName',
  'timeBand1',
  'timeBand5',
  'timeBand10',
  'timeBand15',
  'timeBand30',
  'timeBand60',
  'tvCompanyId',
  'tvCompanyName',
  'tvCompanyEName',
  'tvCompanyHoldingId',
  'tvCompanyHoldingName',
  'tvCompanyHoldingEName',
  'tvCompanyMediaHoldingId',
  'tvCompanyMediaHoldingName',
  'tvCompanyMediaHoldingEName',
  'tvNetId',
  'tvNetName',
  'tvNetEName',
  'sex',
  'age',
  'education',
  'work',
  'persNum',
  'spendingsOnFood',
  'tvNum',
  'ageGro

#### Фильтры

Создавать выражения для фильтров **weekday_filter**, **daytype_filter**, **company_filter**, **time_filter**, **location_filter**, **basedemo_filter** можно с помощью следующих операторов:

    = (равно)
    != (не равно)
    > (больше)
    < (меньше)
    >= (больше или равно) 
    <= (меньше или равно)
    AND (И)
    OR (ИЛИ)
    IN() (вхождение в список значений)

**Если фильтр не используется в задании, ему необходимо передать значение None. Не удаляйте и не "комментируйте" ненужный фильтр, это может привести к неожиданным расчетам или ошибкам.**

In [4]:
weekday_filter = None

Рассмотрим подробно каждый доступный фильтр

##### date_filter

Период указывается в виде списка ('Начало', 'Конец'). Можно указать несколько периодов

In [1]:
date_filter = [('2022-01-01', '2022-01-01')] # 1 января 2022
date_filter = [('2022-07-01', '2022-07-31')] # июль 2022
date_filter = [('2022-01-03', '2022-01-09'),('2022-01-17', '2022-01-23')] # Первая и третья неделя января 2022

##### weekday_filter
фильтр по типам дней недели (пн-вс).

Задается в виде логического выражения

In [6]:
weekday_filter = 'researchWeekDay = 1' # только понедельники
weekday_filter = 'researchWeekDay IN (1,3,5)' # понедельники, среды и пятницы
weekday_filter = 'researchWeekDay IN (5,6,7)' # пятница-воскресенье

К справочнику дней недели можно обратиться при помощи метода `get_tv_day_week()`

##### daytype_filter
фильтр по типам дней (рабочий/выходной/праздничный/траурный)

Задается в виде логического выражения

In [7]:
daytype_filter = 'researchDayType = W' # будние
daytype_filter = 'researchDayType IN (E, H)' # выходные и праздники

К справочнику типов дней можно обратиться при помощи метода `get_tv_research_day_type()`

##### company_filter
фильтр по каналам

Задается в виде логического выражения

Можно фильтровать по сетям, телекомпаниям, холдингам, медиахолдингам

In [8]:
company_filter = 'tvNetId = 1' # сеть ПЕРВЫЙ КАНАЛ
company_filter = 'tvCompanyId = 1858' # телекомпания ПЕРВЫЙ КАНАЛ (СЕТЕВОЕ ВЕЩАНИЕ)

# группа из трех телекомпаний: ПЕРВЫЙ КАНАЛ (СЕТЕВОЕ ВЕЩАНИЕ), РОССИЯ 1 (СЕТЕВОЕ ВЕЩАНИЕ), НТВ (СЕТЕВОЕ ВЕЩАНИЕ) 
company_filter = 'tvCompanyId IN (1858, 1859, 1862)'

company_filter = 'tvCompanyHoldingID = 6' # холинг ВГТРК
company_filter = 'tvCompanyMediaHoldingID = 1000017' # медиахолдинг ГАЗПРОМ-МЕДИА РАЗВЛЕКАТЕЛЬНОЕ ТЕЛЕВИДЕНИЕ

id сетей можно уточнить при помощи метода `get_tv_net()`

id телекомпаний можно уточнить при помощи метода `get_tv_company()`

К справочнику холдингов можно обратиться при помощи метода `get_tv_company_holding()`

К справочнику медиахолдингов можно обратиться при помощи метода `get_tv_company_media_holding()`

##### time_filter
фильтр по временным интервалам (таймбендам)

Задается в виде логического выражения

In [9]:
# Время передается в фильтр в формате HHMMSS
# обратите внимание, что правая граница исключающая
time_filter = 'timeband1 >= 70000 AND timeband1 < 110000' # 7:00 - 11:00
time_filter = 'timeband1 >= 190000 AND timeband1 < 230000' # 19:00 - 23:00
time_filter = 'timeband1 >= 143300 AND timeband1 < 155900' # 14:33 - 15:59

##### location_filter

фильтр по месту просмотра (дом/дача)

Задается в виде логического выражения

In [10]:
location_filter = 'locationId = 1' # дом
location_filter = 'locationId = 2' # дача
location_filter = None # дом+дача

К справочнику мест просмотра можно обратиться при помощи метода `get_tv_location()`

##### basedemo_filter
фильтр по демографии

Задается в виде логического выражения

Демографические переменные, которые используются в заданиях, должны быть прописаны строго в следующем формате: 

__demoVariable__

То есть первая буква всегда строчная. Пример: __wghSuburbAgeGroup__

In [11]:
basedemo_filter = 'sex = 2' # женщины
basedemo_filter = 'sex = 2 AND wghSuburbAgeGroup IN (4,5,6)' # женщины 25-54
basedemo_filter = 'sex = 2 AND wghSuburbAgeGroup IN (4,5,6) AND status = 1' # женщины 25-54 руководители

Демографические переменные и их категории можно уточнить при помощи метода `get_tv_demo_attribute()`

##### targetdemo_filter
дополнительный фильтр по демографии; используется в случае расчета отношения между двумя целевыми группами, как, например, при расчете Аффинити индекса.

Задается в виде логического выражения

#### Срезы
Позволяют разбить отчет на составляющие

Задаются в виде списка

In [1]:
slices = ['researchDate'] # Разбить по дням
slices = ['timeBand1'] # Разбить по минутам
slices = ['researchDate', 'timeBand1'] # Разбить сначала по дням, потом каждый день по минутам
slices = ['locationName'] # Разбить по месту просмотра
slices = ['tvCompanyName'] # Разбить по телекомпаниям

# Разбить по телекомпаниям, потом каждую компанию на место просмотра, потом каждую компанию-место на месяца
slices = ['tvCompanyName','locationName','researchMonth'] 

slices = [] #Чтобы не делать в отчете разбивок, список нужно оставить пустым

#### Статистики

- `Reach000` - Накопленный охват в тыс. человек
- `ReachPer` - Накопленный охват в %
- `AvReach000` - Среднесуточный охват в тыс. человек
- `AvReachPer` - Среднесуточный охват в %
- `Rtg000` - Рейтинг в тыс. человек
- `RtgPer` - Рейтинг %
- `TgAffinPer` - Аффинити индекс (индекс соответствия)
- `TAud` - Суммарное время просмотра в минутах по всем зрителям за весь период
- `ATV` - Среднесуточное время просмотра в минутах среди населения
- `ATVReach` - Среднесуточное время просмотра в минутах среди зрителей
- `Share` - Доля аудитории в %
- `Universe000` - Генеральная совокупность - размер общей численности исследуемой аудитории в тыс. человек
- `Sample` - Выборка - количество респондентов за средние исследовательские сутки в указанной ЦА
- `TTVRtg000` - Тотал ТВ рейтинг в тыс. человек
- `TTVRtgPer` - Тотал ТВ рейтинг %
- `TTVReach000` - Тотал ТВ накопленный охват в тыс. человек
- `TTVReachPer` - Тотал ТВ накопленный охват в %
- `TTVAvReach000` - Тотал ТВ среднесуточный охват в тыс. человек
- `TTVAvReachPer` - Тотал ТВ среднесуточный охват в %
- `TTVATV` - Тотал ТВ среднесуточное время просмотра в минутах среди населения
- `TTVATVReach` - Тотал ТВ среднесуточное время просмотра в минутах среди зрителей

Статистики задаются в виде списка

In [13]:
statistics = ['Rtg000', 'RtgPer', 'Share']

#### Опции расчета
Передаются в виде словаря в параметр `options`

In [5]:
options = {
    #id набора данных (1-Russia all, 2-Russia 100+, 3-Cities, # 4-TVI+ Russia all, 5-TVI+ Russia 100+, 6-Moscow)
    #Возможно указать только одно значение
    "kitId": 1,
    
    #Использовать nbd коррекцию (standard) при расчете накопленных охватов: True/False. По умолчанию True
    "useNbd": True,
    
    #Базовый день для расчета накопленного охвата. По умолчанию None (в расчете будет использоваться серединный день периода)
    "baseDate": '2022-07-10',
    
    #Основание расчета Share и TTV статистик: TotalChannels/TotalTVSet/TotalChannelsThem. По умолчанию TotalChannels
    "totalType": "TotalChannels" 
}

## Вывод справки

Все методы библиотеки Mediascope имеют справку.

Для вывода справки нужно установить курсор на имя метода и нажать комбинацию клавиш __Shift+Tab__
```
mtask.build_task()
```
или воспользоваться командой __help__

In [6]:
help(mtask.build_task)

Help on method build_task in module mediascope_api.mediavortex.tasks:

build_task(task_type, task_name='', date_filter=None, weekday_filter=None, daytype_filter=None, company_filter=None, region_filter=None, time_filter=None, location_filter=None, basedemo_filter=None, targetdemo_filter=None, program_filter=None, break_filter=None, ad_filter=None, subject_filter=None, duration_filter=None, slices=None, statistics=None, scales=None, options=None, reach_conditions=None) method of mediascope_api.mediavortex.tasks.MediaVortexTask instance
    Формирует текст задания для расчета статистик
    
    Parameters
    ----------
    
    task_type : str
        Тип задания, возможные варианты:
        - media
    
    task_name : str
        Название задания, если не задано - формируется как: пользователь + типа задания + дата/время
    
    date_filter : str
        Фильтр дат
    
    weekday_filter : str
        Фильтр дней недели
    
    daytype_filter : str
        Фильтр типов дней
    
  