Skip to content

EPDE:regression

SuperSashka edited this page Mar 4, 2020 · 4 revisions

Для поиска вектора коэффициентов, соответствующего каждой структуре уравнения, в алгоритме используется разреженная регрессия (LASSO). Среди слагаемых выбирается "целевое" для использования в регрессии в качестве зависимой переменной, в то время как оставшиеся рассматриваются как "признаки", из которых строится матрица независимых переменных. Использование этого метода позволяет не только определить промежуточные коэффициенты уравнения, но и фильтровать слагаемые, вносящие вклад в целевое слагаемое, от незначимых.

Минимизируемый функционал включает в себя сумму L2-нормы разности произведения матрицы признаков и вектора коэффициентов и вектора зависимой переменной c L1-нормой вектора коэффициентов, умноженной на регуляризационную величину :

Особым свойством LASSO-регрессии является требование у входным данным, чтобы они были стандартизированы, т.е. для каждого признака дисперсия должна быть 1, а среднее - 0. Подобное ограничение не позволяет использовать LASSO для поиска истинных значений коэффициентов для итогового уравнения, что ведёт к необходимость выполнить дополнительную линейную регрессию на нестандартизированных данных.

Анимация