# 2

## Discounted Cumulative Gain

In [9]:
from typing import List

import numpy as np


def cumulative_gain(relevance: List[float], k: int) -> float:
    """Score is cumulative gain at k (CG@k)

    Parameters
    ----------
    relevance:  `List[float]`
        Relevance labels (Ranks)
    k : `int`
        Number of elements to be counted

    Returns
    -------
    score : float
    """
    score = np.sum(relevance[:k])
    return score


In [10]:
>>> relevance = [0.99, 0.94, 0.88, 0.74, 0.71, 0.68]
>>> k = 5
>>> print(cumulative_gain(relevance, k))

4.26

4.26


4.26

# 3

## Normalized Discounted Cumulative Gain
DCG@k - не нормированная метрика, что усложняют задачу сравнения. 

Допустим релевантности запроса `Собеседование System design` близки к 1, а запроса `Как красиво писать тексты?` наоборот к 0 (В первом случае такое происходит потому что на канале есть точно подходящие видео под запрос, а в случае второго запроса на нашем канале нет ничего похожего, несмотря на это мы тоже должны их учитывать).

Теперь, что бы получить nDCG (Normalized Discounted Cumulative Gain) достаточно поделить DCG на IDCG, а метрика станет нормированной от 0 до 1.  

In [45]:
from typing import List

import numpy as np


def discounted_cumulative_gain(relevance: List[float], k: int, method: str = "standard") -> float:
    """Discounted Cumulative Gain

    Parameters
    ----------
    relevance : `List[float]`
        Video relevance list
    k : `int`
        Count relevance to compute
    method : `str`, optional
        Metric implementation method, takes the values​​
        `standard` - adds weight to the denominator
        `industry` - adds weights to the numerator and denominator
        `raise ValueError` - for any value

    Returns
    -------
    score : `float`
        Metric score
    """
    relevance = np.array(relevance[:k])
    logs = np.log2(np.arange(2, k+2))
    if method == 'industry':
        score = np.sum((2 ** relevance - 1) / logs)
    elif method == 'standard':       
        score = np.sum(relevance / logs)
    else:
        raise ValueError("Invalid method provided. Please use 'standard' or 'industry'.")     
        
    return score


In [46]:
>>> relevance = [0.99, 0.94, 0.88, 0.74, 0.71, 0.68]
>>> k = 5
>>> method = 'standard'
>>> print(discounted_cumulative_gain(relevance, k, method))

2.6164

2.6164401144680056


2.6164

# 4

## Average Normalized Discounted Cumulative Gain
Замечательно! Вы уже умеете сравнивать модели по определенному запросу, и CyberTolya-T800 работает прекрасно.

 Наш проект растет, как и количество запросов и новых видео, смотреть на какие-то конкретные запросы уже почти не имеет смысл.

Вы сталкиваетесь с проблемой, что смотреть нужно на большое количество запросов и поведение модели в целом. Как же все таки посчитать метрику для множества запросов?

Average nDCG - усредненное значение метрики nDCG по каждому запросу из множества. 

In [78]:
from typing import List

import numpy as np


def normalized_dcg(relevance: List[float], k: int, method: str = "standard") -> float:
    """Normalized Discounted Cumulative Gain.

    Parameters
    ----------
    relevance : `List[float]`
        Video relevance list
    k : `int`
        Count relevance to compute
    method : `str`, optional
        Metric implementation method, takes the values
        `standard` - adds weight to the denominator
        `industry` - adds weights to the numerator and denominator
        `raise ValueError` - for any value

    Returns
    -------
    score : `float`
        Metric score
    """
    sorted_relevance_k = np.sort(relevance)[::-1][:k]
    relevance = np.array(relevance[:k])
    logs = np.log2(np.arange(2, k+2))
    if method == 'industry':
        dcg = np.sum((2 ** relevance - 1) / logs)
        idcg = np.sum((2 ** sorted_relevance_k - 1) / logs)
    elif method == 'standard':       
        dcg = np.sum(relevance / logs)
        idcg = np.sum(sorted_relevance_k / logs)
    else:
        raise ValueError("Invalid method provided. Please use 'standard' or 'industry'.")     
    if idcg == 0:
        return 0
    else:
        ndcg = dcg / idcg
    
    return ndcg

In [79]:
>>> relevance = [0.99, 0.94, 0.74, 0.88, 0.71, 0.68]
>>> k = 5
>>> method = 'standard'
>>> print(normalized_dcg(relevance, k, method))

0.9962

0.9962906539247512


0.9962

# 5
# Average Normalized Discounted Cumulative Gain

In [80]:
from typing import List

import numpy as np

def avg_ndcg(list_relevances: List[List[float]], k: int, method: str = 'standard') -> float:
    """average nDCG

    Parameters
    ----------
    list_relevances : `List[List[float]]`
        Video relevance matrix for various queries
    k : `int`
        Count relevance to compute
    method : `str`, optional
        Metric implementation method, takes the values ​​\
        `standard` - adds weight to the denominator\
        `industry` - adds weights to the numerator and denominator\
        `raise ValueError` - for any value

    Returns
    -------
    score : `float`
        Metric score
    """
    n = len(list_relevances)
    score = np.sum([normalized_dcg(l, k, method)for l in list_relevances]) / n
    return score

In [82]:
>>> list_relevances = [
        [0.99, 0.94, 0.88, 0.89, 0.72, 0.65],
        [0.99, 0.92, 0.93, 0.74, 0.61, 0.68], 
        [0.99, 0.96, 0.81, 0.73, 0.76, 0.69]
    ]  
>>> k = 5
>>> method = 'standard'
>>> print(avg_ndcg(list_relevances, k, method))

0.99613

0.9961322104432755


0.99613