# Разбор примера из A.7.3 Проекции векторов.

В это блоке мы создаем 2 вектора, компоненты одного больше другого в *real_koef* раз и к каждому компоненту вектора добавлены случайные величины

r - вектор инвистиций в рекламу

p - вектор профитов

In [1]:
import random
import numpy as np

# коэффициент на который отличаются вектора - это то что по сути мы и ищем
real_koef = 3
init_random_range = 30
random_range = init_random_range / 10 # случайные отклонения составляют +/- 10%

# изначальный вектор от которого отталкиваемся
init = np.array([random.uniform(-init_random_range, init_random_range) for i in range(10000)])

# добавляем векторам некоторые случайные значения
r = np.array([(k + random.uniform(-random_range, random_range)) for k in init])
p = np.array([(k + random.uniform(-random_range, random_range)) * real_koef for k in init])
# print(init)
# print(r)
# print(p)

### Коэффициент k3 (среднее двух проекций) ближе к коэффициенту real_koef

В данном блоке вычисляем коэффиценты проекций одного вектора на другой и так же среднее обоих коэффициентов

$\displaystyle{k_1 = \frac{\langle \overrightarrow{r}, \overrightarrow{p} \rangle}{\langle \overrightarrow{r}, \overrightarrow{r} \rangle}}$

$\displaystyle{k_2 = \frac{\langle \overrightarrow{r}, \overrightarrow{p} \rangle}{\langle \overrightarrow{p}, \overrightarrow{p} \rangle}}$

$\displaystyle{k_3 = \frac{k_1 + \frac{1}{k_2}}{2}}$ - формула Жуковского в действительной области;)

In [2]:
k1 = np.dot(r, p) / np.dot(r, r)
k2 = np.dot(r, p) / np.dot(p, p)
k3 = (k1 + (1 / k2)) / 2
print(k1, abs(real_koef - k1))
print(1 / k2, abs(real_koef - 1 / k2), k2)
print(k3, abs(real_koef - k3)) # в среднем k3 ближе к изначально заложенному коэффициенту

2.968392945378817 0.03160705462118285
3.029571158741208 0.02957115874120797 0.3300797200668829
2.9989820520600126 0.0010179479399874403


Модельные профиты $\hat{p}$

In [3]:
p_1 = r * k1
p_2 = r / k2
p_3 = r * k3
# print(p_1)
# print(p_2)
# print(p_3)

### Не смотря на то что k3 ближе к изначальному коэффициенту, k1 описывает зависимость лучше

$\displaystyle{d = 1 - \frac{\sum_i (p_i - \hat{p}_i)^2}{\sum_i p_i^2}}$

In [4]:
deltaP_1 = p_1 - p
deltaP_2 = p_2 - p
deltaP_3 = p_3 - p
d_1 = 1 - (np.dot(deltaP_1, deltaP_1) / np.dot(p, p))
d_2 = 1 - (np.dot(deltaP_2, deltaP_2) / np.dot(p, p))
d_3 = 1 - (np.dot(deltaP_3, deltaP_3) / np.dot(p, p))

print(d_1)
print(d_2)
print(d_3) # d_3 менее точен, чем d_1

0.9798063124591496
0.9793901230436375
0.9797022651052716


### Если сравнить длины векторов, то длина с коэффициентом k3 ближе к длине реального вектора профитов

$\displaystyle{d = \frac{\sqrt{\sum_i \hat{p}_i^2}}{\sqrt{\sum_i p_i^2}}}$

In [5]:
d_1 = (np.dot(p_1, p_1) ** 0.5 / np.dot(p, p) ** 0.5)
d_2 = (np.dot(p_2, p_2) ** 0.5 / np.dot(p, p) ** 0.5)
d_3 = (np.dot(p_3, p_3) ** 0.5 / np.dot(p, p) ** 0.5)

print(d_1)
print(d_2)
print(d_3)

0.9898516618459304
1.0102523828016257
1.000052022323778
