# Недельная динамика времени просмотра по жанрам
Пример расчета времени просмотра и длительности событий в группировке по жанрам и неделям

## Описание задачи и условий расчета
- Период: сентябрь 2023, разбивка по неделям
- ЦА: Население 100+
- Место просмотра: Все места (Дом+Дача)
- Каналы: все каналы проекта TV Index
- Программы: группировка по жанрам
- Статистики: ATV (тотал), Duration (тотал)

## Инициализация

При построении отчета первый шаг в любом ноутбуке - загрузка библиотек, которые помогут обращаться к TVI API и работать с данными.

Выполните следующую ячейку, для этого перейдите в нее и нажмите Ctrl+Enter

In [None]:
%reload_ext autoreload
%autoreload 2

import sys
import os
import re
import json
import datetime
import time
import pandas as pd
#import matplotlib.pyplot as plt
from IPython.display import JSON

from mediascope_api.core import net as mscore
from mediascope_api.mediavortex import tasks as cwt
from mediascope_api.mediavortex import catalogs as cwc

# Настраиваем отображение

# Включаем отображение всех колонок
pd.set_option('display.max_columns', None)
# Задаем максимальное количество выводимых строк. Раскомментируйте нужную строку
# 200 строк
# pd.set_option("display.max_rows", 200)
# Отображаем все строки. ВАЖНО! Отображение большого DataFrame требует много ресурсов
# pd.set_option("display.max_rows", None)

# Cоздаем объекты для работы с TVI API
mnet = mscore.MediascopeApiNetwork()
mtask = cwt.MediaVortexTask()
cats = cwc.MediaVortexCats()

## Справочники

Получим идентификаторы, которые будут использоваться для формирования условий расчета

In [None]:
# В справочнике демографических атрибутов найдем переменную Население 100+
cats.get_tv_demo_attribute(names=['100+'])

# Далее в отчете будем использовать cube100Plus100Minus = 1

## Формирование задания
Зададим условия расчета

In [None]:
# Задаем период
# Период указывается в виде списка ('Начало', 'Конец') в формате 'YYYY-MM-DD'. Можно указать несколько периодов
date_filter = [('2023-09-01', '2023-09-30')]

# Задаем дни недели
weekday_filter = None

# Задаем тип дня
daytype_filter = None

# Задаем ЦА: Население 100+
basedemo_filter = 'cube100Plus100Minus = 1'

# Доп фильтр ЦА, нужен только в случае расчета отношения между ЦА, например, при расчете Affinity Index
targetdemo_filter = None

# Задаем место просмотра
location_filter=None

# Задаем каналы
company_filter = None

# Указываем фильтр программ
program_filter = None

# Фильтр блоков
break_filter = None

# Фильтр роликов
ad_filter = None

# Указываем список срезов (группировок)
slices = [
    'programTypeName', #Программа жанр
    'researchWeek' #недели
]

# Указываем список статистик для расчета
statistics = ['ATVSum','DurationSum']

# Задаем условия сортировки
sortings = None

# Задаем опции расчета
options = {
    "kitId": 1, #TV Index Russia all
    "issueType": "PROGRAM", #Тип события - Программы
}

## Расчет задания

In [None]:
# Формируем задание для API TV Index в формате JSON
task_json = mtask.build_crosstab_task(date_filter=date_filter, weekday_filter=weekday_filter, 
                                        daytype_filter=daytype_filter, company_filter=company_filter, 
                                        location_filter=location_filter, basedemo_filter=basedemo_filter, 
                                        targetdemo_filter=targetdemo_filter,program_filter=program_filter, 
                                        break_filter=break_filter, ad_filter=ad_filter, 
                                        slices=slices, statistics=statistics, sortings=sortings, options=options)

# Отправляем задание на расчет и ждем выполнения
task_crosstab = mtask.wait_task(mtask.send_crosstab_task(task_json))

# Получаем результат
df = mtask.result2table(mtask.get_result(task_crosstab))

In [None]:
# Приводим порядок столбцов в соответствие с условиями расчета
df = df[slices+statistics]
df

## Расчет процентов

### Тотал по неделям
Посчитаем тотал показатели по неделям для расчета процентов

In [None]:
# Указываем список срезов (группировок)
slices = [
    'researchWeek' #недели
]

# Задаем условия сортировки
sortings = {'researchWeek':'ASC'}

In [None]:
# Формируем задание для API TV Index в формате JSON
task_json = mtask.build_crosstab_task(date_filter=date_filter, weekday_filter=weekday_filter, 
                                        daytype_filter=daytype_filter, company_filter=company_filter, 
                                        location_filter=location_filter, basedemo_filter=basedemo_filter, 
                                        targetdemo_filter=targetdemo_filter,program_filter=program_filter, 
                                        break_filter=break_filter, ad_filter=ad_filter, 
                                        slices=slices, statistics=statistics, sortings=sortings, options=options)

# Отправляем задание на расчет и ждем выполнения
task_crosstab = mtask.wait_task(mtask.send_crosstab_task(task_json))

# Получаем результат
df_totals = mtask.result2table(mtask.get_result(task_crosstab))

In [None]:
# Приводим порядок столбцов в соответствие с условиями расчета
df_totals = df_totals[slices+statistics]
df_totals

### Расчет процентов
Рассчитаем проценты от тотал показателей

In [None]:
# Объединяем таблицы жанров и тоталов
df = pd.merge(df,df_totals, how='left', on='researchWeek',suffixes=["","_total"])

# Считаем проценты по жанрам от тотал
df['ATVSumPer'] = df['ATVSum']/df['ATVSum_total']*100
df['DurationSumPer'] = df['DurationSum']/df['DurationSum_total']*100

df = df[['programTypeName','researchWeek','ATVSumPer','DurationSumPer']]

df

## Настройка внешнего вида таблицы
Пропустите этот шаг, если хотите экспортировать таблицу в ее текущем виде

In [None]:
# Формируем сводную таблицу: строки - срезы, столбцы - ЦА, значения - статистики
df = pd.pivot_table(df, values=['ATVSumPer','DurationSumPer'],
                        index=['programTypeName'], 
                        columns=['researchWeek'])
df

In [None]:
# Опционально: поменять местами уровни в столбцах
df = df.swaplevel(0,1, axis=1).sort_index(axis=1)

df

## Сохраняем в Excel
По умолчанию файл сохраняется в папку `excel`

In [None]:
df_info = mtask.task_builder.get_report_info()

with pd.ExcelWriter(mtask.task_builder.get_excel_filename('03_time_by_weeks')) as writer:
    df.to_excel(writer, 'Report', index=True)
    df_info.to_excel(writer, 'Info', index=False)