You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Данная формула описывает модель линейной регрессии в скалярном виде: $$f(\mathbf{x}_i\mid\boldsymbol{\beta})=\beta_{0}+\sum_{j=1}^{d}\beta_{j}x_{ij}.$$ Давайте напишем то же, но используя скалярное произведение, чтобы считался сразу вектор $\mathbf{y}$. Соглашение такое: в матрице данных $\mathbf{X}$ по строкам стоят $\mathbf{x}_i^{\intercal}$; соответственно, номер столбца соответствует номеру признака.
Реализуем функцию f, реализующую модель линейной регрессии.
Сгенерируем данные большей размерности: пусть $n = 1000$, $d = 5$, $x_{\min} = -5, x_{\max} = 5$, $\beta_{\min} = -5$, $\beta_{\max} = 5$. Выберем случайные значения для вектора параметров $\boldsymbol{\beta}$, посчитаем наблюдения и зашумим.
Исследуем распределения полученных данных. Для визуализации хорошо подходит тип графиков "pairs plot". Он позволяет смотреть, как соотносятся признаки друг с другом и с наблюдениями. Рекомендация: GGally::ggpairs.
Как можно было заметить по pairs, $\mathbf{y}$ распределен вовсе не равномерно. А как? Фактически, результирующее распределение есть сумма равномерно распределенных случайных величин, однако их сумма не есть равномерное распределение. Вывести результат сложно даже со знанием теории вероятностей. Для ознакомления можно почитать вот эту статью https://arxiv.org/pdf/math/0411298v1.pdf
make_X
, генерирующуюf
, реализующую модель линейной регрессии.GGally::ggpairs
.Как можно было заметить по pairs,$\mathbf{y}$ распределен вовсе не равномерно. А как? Фактически, результирующее распределение есть сумма равномерно распределенных случайных величин, однако их сумма не есть равномерное распределение. Вывести результат сложно даже со знанием теории вероятностей. Для ознакомления можно почитать вот эту статью https://arxiv.org/pdf/math/0411298v1.pdf
См. также #3.
The text was updated successfully, but these errors were encountered: