# Анализ погрешностей при интеграционном тестировании

В задании нужно было реализовать вычисление "примитивных" математических функций ($\sin(x),\ln(x)$), которые потом
используются для вычисления других функций с целью вычисления сложной функции:

$$
y = 
\begin{cases}
   (((\cos(x) - \csc(x)) ^ 2) + \cos(x)), & \text{ при } x \leq 0 \\
   (
      \cfrac{  
         \cfrac { ( (\log_3(x) - \log_3(x)) \cdot \log_10(x) ) ^ 3 }
                { \ln(x) }
      }
      { \cfrac{
               (\log_2(x) - (\ln(x) + \log_10(x))) - \log_10(x)
            }
            {\log_5(x) + \log_5(x)}
      }
   ), & \text{ при } x > 0
\end{cases}
$$


## Подготовка зависимостей

In [43]:
%useLatestDescriptors
%use dataframe
%use kandy

Достанем сохраненные логи и проанализируем эталонную реализацию сложной функции.

In [44]:
val dg = DataFrame.read("../../../../resources/GeneralFunction_golden.csv")
dg

x,generalFunction(x)
-6282185,998002333997
-6182185,80613756
-6082185,17212028
-5982185,6801381
-5882185,3614219
-5782185,2328927
-5682185,1715298
-5582185,1382360
-5482185,1181334
-5382185,1049548


In [45]:
dg.plot {
    line {
        x("x")
        y("generalFunction(x)")
    }
}

Как можно видеть, почти во всех точках значение функции нулевое. Посмотрим теперь на ряд реализаций функций полученных
при интеграционном тестировании. Для удобства были использованы значения не сами функций, а значение их отклонения от
значения эталонной функции (DataFrame пока не умеет в математические операции над колонками).

In [None]:
val dfs = List(1.shl(8) - 1) {
    val mask = it + 1 // 1..256
    val maskStr = mask.toString(radix = 2).padStart(8, '0')
    DataFrame.read("../../../../resources/integrated/GeneralFunction_integration_diff=${maskStr}.csv")
}
dfs

Возьмем интересующие нас значения, а именно: статистики значений функций, выкинем лишние строки и колонки.

In [47]:
val diffdf = dfs
    .map { it.describe() }
    .map { it.rows().drop(1).first() }
    .toDataFrame()
    .run { get(name, mean, std, min, median, max) }
diffdf

name,mean,std,min,median,max
diff_00000001(x),34039631,374638989,-53279398,0,3997998669
diff_00000010(x),-17507299877,131602237225,-998001333999,0,206743026
diff_00000011(x),0,0,0,0,0
diff_00000100(x),-17508783911,131602440530,-998003333997,0,202743026
diff_00000101(x),34039631,374638989,-53279398,0,3997998669
diff_00000110(x),-17507299877,131602237225,-998001333999,0,206743026
diff_00000111(x),0,0,0,0,0
diff_00001000(x),-17508783911,131602440530,-998003333997,0,202743026
diff_00001001(x),34039631,374638989,-53279398,0,3997998669
diff_00001010(x),-17507299877,131602237225,-998001333999,0,206743026


Построим график среднего отклонения для каждой функции, чтобы понять насколько хорошо каждая из них апроксимирует эталонную.

In [52]:
diffdf.plot {
    points {
        x(name)
        y(mean)
    }
    layout.size = 1500 to 450
}

Как можно видеть, функции в целом имеют похожее значение отклонения: сильнее всего отклонение у тех функций, которые
используют собственную реализацию $csc(x)$ (маска оканчивается на 0).