# Условие

Дан числовой сет. Таргет-функция $f:R^{100}\rightarrow R$ линейна, зависит от всех признаков. Требуется найти эту функцию.

# Решение

Нам явно обозначили, что функция зависит линейно от всех признаков, значит решение можно выполнить без градиентных методов, а просто аналитически. Пусть $X$ - матрица $[n, 100]$, набор из $n$ данных, а $y$ - вектор-столбец $[n, 1]$, таргеты.
$$f(x)=xw$$
$$Xw=y$$
найти функцию линейную $f$ таким образом значит найти $w$. Решаем методом наименьших квадратов.
$$L(w)=||Xw-y||^2=<Xw-y, Xw-y>$$
Хотим минимизировать сумму квадратов разности функции $Xw$ и таргета $y$. Для этого просто ищем в какой точке $w$ производная $L$ равна нулю. Ищем через дифференциал.
$$[D_{w_0}L](h)=<[D_{w_0}(Xw-y)](h), Xw-y>+<Xw-y, [D_{w_0}(Xw-y)](h)>=(*)$$
$$[D_{w_0}(Xw-y)](h)=X(w_0+h)-y-(Xw_0-y)=Xh$$
$$(*)=<Xh, Xw-y>+<Xw-y, Xh>=<2(Xw-y), Xh>=(**)$$
Чтобы найти дифференциал, стандартная форма которого в скалярном произведении $[D_{x_0}f](h)=<\nabla_{x_0} f, h>$, всомним, что $<u, v>=u^Tv$.
$$(**)=2(Xw-y)^TXh=2(((Xw-y)^TX)^T)^Th=<2((Xw-y)^TX)^T, h>=(***)$$
По свойству транспонирования $(AB)^T=B^TA^T$.
$$(***)=<2X^T(Xw-y), h>$$
Значит производная $\nabla_{w}L=2X^T(Xw-y)$.

Вообще, если знать заранее свойство $<A, BC>=<B^TA, C>$, то уже после $(**)$ можно сразу получить ответ.

Теперь приравняем производную к нулю и выразим $w$.
$$2X^T(Xw-y)=0$$
$$X^T(Xw-y)=X^TXw-X^Ty$$
$$X^TXw=X^Ty$$
$$w=(X^TX)^{-1}X^Ty$$
Как нашли $w$, просто считаем предсказания на тесте.

**Важно** заметить, что в условии сказано, что функция $f$ является линейным отображением из $R^{100}$, и это значит, что она не зависит от свободного члена, поэтому мы не рассматриваем $f=xw+b$.

**Важно 2.** Вообще в numpy есть встроенный метод наименьших квадратов lstsq (least square). Он работает точнее.

# Код

In [31]:
import numpy as np
import pandas as pd

df_train = pd.read_csv('200train.tsv', delimiter='\t', header=None)
X = np.array(df_train.iloc[:, :-1])
#X = np.hstack((np.ones((X.shape[0], 1)), X)) # Не добавляем столбец из 1, означающий своодный член b
y = np.array(df_train.iloc[:, -1])

w = np.linalg.pinv(X.T @ X) @ X.T @ y

df_test = pd.read_csv('200test.tsv', delimiter='\t', header=None)
X_test = np.array(df_test)
#X_test = np.hstack((np.ones((X_test.shape[0], 1)), X_test))
y_pred = X_test @ w
with open('200answer.tsv', 'w') as f:
    f.write('\n'.join(map(str, y_pred)))