In [2]:
#рассмотрение потребности в пед. кадрах как признака
#кадровой обеспеченности педагогами как свойства образования, влияющего на социальную ситуацию
#импорты модулей
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score

In [3]:
#считаем, что данные уже нормированы по диапазону [0;1]
# 1 - отптимум, смотрим насколько имеющиеся данные отстают от идеала. подчиняются нормальному распределению.
df = pd.DataFrame({
    'Месяц года': ['январь', 'февраль', "март", "апрель", "май"],
    'Удаленность образовательной организации от ближайшего города': [0.1, 0.3, 0.5, 0.7, 0.4],
    'Количество вакантных пед. специальностей': [0.6, 0.7, 0.4, 0.3,0.3],
    'Количество обучающихся сейчас': [0.7, 0.4, 0.3, 0.8, 0.7],
    'Ожидаемое количество обучающихся через 5 лет': [0.7, 0.4, 0.3, 0.5, 0.1]
})
df.head() 

Unnamed: 0,Месяц года,Удаленность образовательной организации от ближайшего города,Количество вакантных пед. специальностей,Количество обучающихся сейчас,Ожидаемое количество обучающихся через 5 лет
0,январь,0.1,0.6,0.7,0.7
1,февраль,0.3,0.7,0.4,0.4
2,март,0.5,0.4,0.3,0.3
3,апрель,0.7,0.3,0.8,0.5
4,май,0.4,0.3,0.7,0.1


In [4]:
#удаляем номинальный столбец месяца года
dfeature = df.drop(['Месяц года'], axis=1)
dfeature

Unnamed: 0,Удаленность образовательной организации от ближайшего города,Количество вакантных пед. специальностей,Количество обучающихся сейчас,Ожидаемое количество обучающихся через 5 лет
0,0.1,0.6,0.7,0.7
1,0.3,0.7,0.4,0.4
2,0.5,0.4,0.3,0.3
3,0.7,0.3,0.8,0.5
4,0.4,0.3,0.7,0.1


In [5]:
X = dfeature
X

Unnamed: 0,Удаленность образовательной организации от ближайшего города,Количество вакантных пед. специальностей,Количество обучающихся сейчас,Ожидаемое количество обучающихся через 5 лет
0,0.1,0.6,0.7,0.7
1,0.3,0.7,0.4,0.4
2,0.5,0.4,0.3,0.3
3,0.7,0.3,0.8,0.5
4,0.4,0.3,0.7,0.1


In [6]:
#допустим, что нам известено 3 вектора ответа
y0 = pd.DataFrame({
    'y1': [0.3,0.5,0.7,0.4,0.9],
    'y2': [0.5,0.4,0.1,0.7,0.9],
    'y3': [0.2,0.9,0.1,0.2,0.9]
})
for j in range(1,4): 
    y = y0.drop(['y1','y2'], axis=1)
    continue 
y

Unnamed: 0,y3
0,0.2
1,0.9
2,0.1
3,0.2
4,0.9


In [7]:
#определение функции активации - сигмоиды 
def nonlin(x,deriv=False):
    if(deriv==True):
        return x*(1-x)
    return 1/(1+np.exp(-x))

# сделаем случайные числа более определёнными
np.random.seed(1)

# инициализируем веса случайным образом со средним 0
syn0 = 2*np.random.random((4,1)) - 1
    
for iter in range(10000):

    # прямое распространение
    l0 = X
    l1 = nonlin(np.dot(l0,syn0))

    # насколько мы ошиблись?
    l1_error = y - l1

    # перемножим это с наклоном сигмоиды 
    # на основе значений в l1
    l1_delta = l1_error * nonlin(l1,True) # !!!

    # обновим веса
    syn0 += np.dot(l0.T,l1_delta) # !!!

k = 0
for i in l1_error: 
    k += abs(round(l1_error* 100, 2))
k = k/5
z = k.sum()

print("Выходные данные после тренировки:", l1)
print('Ошибка каждого признака:', abs(round(l1_error* 100, 2))) 
print('Ошибка модели:', z,'%')

Выходные данные после тренировки: [[0.20388927]
 [0.88663205]
 [0.11461886]
 [0.00262627]
 [0.90078308]]
Ошибка каждого признака:       y3
0   0.39
1   1.34
2   1.46
3  19.74
4   0.08
Ошибка модели: y3    4.602
dtype: float64 %


In [8]:
#допустим имеем следующие векторы обучения для кадровой обеспеченности при разных векторах y1, y2, y3: 
x1 = 0
x2 = 0 
x3 = 0
        
    

In [9]:
y1 = [0.3,0.5,0.7,0.4,0.9] #истинные факт.данные
x1 = [[0.22678437], # ошибка 8,8%
 [0.60292919],
 [0.57383273],
 [0.47473748],
 [0.83301143]]
y2 = [0.5,0.4,0.1,0.7,0.9] #соц опрос
x2 = [[0.51399137], #ошибка 4,3%
 [0.3716918 ],
 [0.16245588],
 [0.68260339],
 [0.99591605]] 
y3 = [0.2,0.9,0.1,0.2,0.9] #эксперты
x3 = [[0.20388927], #ошибка 4,6%
 [0.88663205],
 [0.11461886],
 [0.00262627],
 [0.90078308]]
list_m = [x1,x2,x3] #получаем общий вектор кадровой обеспеченности только по признаку потребности в кадрах, другие 2 -произв.
d = []
for k in list_m:
    for i in k:
        for j in i:
            d.append(j)
z = []
for f in d:
    z.append(f/15) #фактически домножаем на выбранный коэффициент - тут мы выбрали равномерное распределение m/n

print('Средневзвешенное значение компонентов:',z) #показывает вклад в кадровую обеспеченность каждого показателя признака потребности в кадрах
print(sum(z)) #общий вклад потребности в кадрах, если учитывать только его, а другие два отбрость
#показывает насколько можно улучшить фактор - при выбранном коэффициенте

Средневзвешенное значение компонентов: [0.015118958, 0.040195279333333334, 0.03825551533333334, 0.03164916533333333, 0.05553409533333333, 0.03426609133333333, 0.024779453333333333, 0.010830392, 0.045506892666666666, 0.06639440333333334, 0.013592618, 0.059108803333333335, 0.007641257333333333, 0.00017508466666666666, 0.06005220533333333]
0.5031002146666668


In [10]:
# пусть известны еще два вектора: 
l = []
v = []
for x in np.random.sample((1, 15)):
    l.append(x)
for x1 in np.random.sample((1, 15)):
    v.append(x1)

In [11]:
l

[array([0.14675589, 0.09233859, 0.18626021, 0.34556073, 0.39676747,
        0.53881673, 0.41919451, 0.6852195 , 0.20445225, 0.87811744,
        0.02738759, 0.67046751, 0.4173048 , 0.55868983, 0.14038694])]

In [12]:
v

[array([0.19810149, 0.80074457, 0.96826158, 0.31342418, 0.69232262,
        0.87638915, 0.89460666, 0.08504421, 0.03905478, 0.16983042,
        0.8781425 , 0.09834683, 0.42110763, 0.95788953, 0.53316528])]

In [13]:
m = []
for f1 in l:
    m.append(f1/15)
for x2 in m:
    x2.tolist()
print('Средневзвешенное значение компонентов:',x2)
print(sum(x2))

Средневзвешенное значение компонентов: [0.00978373 0.00615591 0.01241735 0.02303738 0.02645116 0.03592112
 0.0279463  0.0456813  0.01363015 0.05854116 0.00182584 0.04469783
 0.02782032 0.03724599 0.00935913]
0.38051466706317427


In [14]:
a = []
for f2 in v:
    a.append(f2/15)

for x3 in a:
    x3.tolist()
print('Средневзвешенное значение компонентов:',x3)
print(sum(x3))

Средневзвешенное значение компонентов: [0.01320677 0.05338297 0.06455077 0.02089495 0.04615484 0.05842594
 0.05964044 0.00566961 0.00260365 0.01132203 0.05854283 0.00655646
 0.02807384 0.0638593  0.03554435]
0.5284287623111014


In [15]:
g = []
for i1 in x2:
    g.append(i1)
for i2 in x3:
    g.append(i2)
for i3 in z:
    g.append(i3)
g

[0.009783726054474202,
 0.006155906317919854,
 0.01241734742517806,
 0.02303738180286985,
 0.026451164948711327,
 0.0359211156002238,
 0.027946300960219654,
 0.045681300026450634,
 0.013630149982101162,
 0.058541162426063026,
 0.001825839546528411,
 0.044697834011893485,
 0.027820320157808463,
 0.03724598856305011,
 0.00935912923968225,
 0.01320676593899192,
 0.05338297124503578,
 0.0645507717146265,
 0.02089494521061619,
 0.04615484104462094,
 0.05842594348640255,
 0.05964044423358982,
 0.005669614091318527,
 0.002603652215525491,
 0.01132202797097126,
 0.058542833561960876,
 0.006556455588870007,
 0.02807384166700348,
 0.06385930201003347,
 0.035544352331534475,
 0.015118958,
 0.040195279333333334,
 0.03825551533333334,
 0.03164916533333333,
 0.05553409533333333,
 0.03426609133333333,
 0.024779453333333333,
 0.010830392,
 0.045506892666666666,
 0.06639440333333334,
 0.013592618,
 0.059108803333333335,
 0.007641257333333333,
 0.00017508466666666666,
 0.06005220533333333]

In [16]:
#обратная операция для возвращения векторов х1 х2 х3
g1 = []
for i4 in g: 
    h = i4*15
    g1.append(h)
g1

[0.14675589081711304,
 0.0923385947687978,
 0.1862602113776709,
 0.34556072704304774,
 0.39676747423066994,
 0.538816734003357,
 0.4191945144032948,
 0.6852195003967595,
 0.20445224973151743,
 0.8781174363909454,
 0.027387593197926163,
 0.6704675101784022,
 0.41730480236712697,
 0.5586898284457517,
 0.14038693859523377,
 0.1981014890848788,
 0.8007445686755367,
 0.9682615757193975,
 0.31342417815924284,
 0.6923226156693141,
 0.8763891522960383,
 0.8946066635038473,
 0.08504421136977791,
 0.03905478323288236,
 0.1698304195645689,
 0.8781425034294131,
 0.0983468338330501,
 0.42110762500505217,
 0.957889530150502,
 0.5331652849730171,
 0.22678437,
 0.60292919,
 0.57383273,
 0.47473748,
 0.83301143,
 0.51399137,
 0.3716918,
 0.16245588,
 0.68260339,
 0.99591605,
 0.20388927,
 0.88663205,
 0.11461886,
 0.00262627,
 0.90078308]

In [21]:
g2 = []
for h2 in g1:
    h3 = h2/45
    g2.append(h3)
print(g2)
print('Реализация кадровой обеспеченности:',sum(g2))

[0.0032612420181580676, 0.002051968772639951, 0.004139115808392687, 0.007679127267623283, 0.008817054982903777, 0.011973705200074599, 0.00931543365340655, 0.015227100008816878, 0.004543383327367054, 0.019513720808687678, 0.000608613182176137, 0.014899278003964494, 0.009273440052602822, 0.012415329521016703, 0.0031197097465607503, 0.004402255312997307, 0.017794323748345258, 0.0215169239048755, 0.006964981736872063, 0.015384947014873647, 0.019475314495467518, 0.019880148077863275, 0.0018898713637728426, 0.0008678840718418303, 0.003774009323657087, 0.019514277853986958, 0.002185485196290002, 0.009357947222334493, 0.02128643400334449, 0.011848117443844824, 0.005039652666666667, 0.013398426444444445, 0.012751838444444445, 0.010549721777777778, 0.018511365111111112, 0.011422030444444443, 0.008259817777777779, 0.0036101306666666668, 0.015168964222222223, 0.022131467777777778, 0.004530872666666667, 0.019702934444444445, 0.0025470857777777777, 5.836155555555556e-05, 0.020017401777777777]
Реализ

In [None]:
#Аналогично - образование, далее социальная ситуация и наконец индекс
#Пока выбирать можем только коэффициенты. Возможно стоит рассматреть матрицу для свойства ситуации, 
#где фичами будут векторы (у нас их 9), а сэмплами по-прежнему единица времени