In [1]:
from sklearn.datasets import make_blobs, make_moons
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline



In [2]:
from sklearn.datasets import load_breast_cancer

In [3]:
from sklearn.preprocessing import MinMaxScaler

In [4]:

breast_cancer_data = load_breast_cancer()

In [5]:
print(breast_cancer_data['DESCR'])

.. _breast_cancer_dataset:

Breast cancer wisconsin (diagnostic) dataset
--------------------------------------------

**Data Set Characteristics:**

    :Number of Instances: 569

    :Number of Attributes: 30 numeric, predictive attributes and the class

    :Attribute Information:
        - radius (mean of distances from center to points on the perimeter)
        - texture (standard deviation of gray-scale values)
        - perimeter
        - area
        - smoothness (local variation in radius lengths)
        - compactness (perimeter^2 / area - 1.0)
        - concavity (severity of concave portions of the contour)
        - concave points (number of concave portions of the contour)
        - symmetry 
        - fractal dimension ("coastline approximation" - 1)

        The mean, standard error, and "worst" or largest (mean of the three
        largest values) of these features were computed for each image,
        resulting in 30 features.  For instance, field 3 is Mean Radius, f

In [6]:
breast_cancer_Y = breast_cancer_data['target']
breast_cancer_X = breast_cancer_data['data']


In [7]:
Scaler = MinMaxScaler()

In [8]:
norm_breast_cancer_X = Scaler.fit_transform(breast_cancer_X)
norm_breast_cancer_X

array([[0.52103744, 0.0226581 , 0.54598853, ..., 0.91202749, 0.59846245,
        0.41886396],
       [0.64314449, 0.27257355, 0.61578329, ..., 0.63917526, 0.23358959,
        0.22287813],
       [0.60149557, 0.3902604 , 0.59574321, ..., 0.83505155, 0.40370589,
        0.21343303],
       ...,
       [0.45525108, 0.62123774, 0.44578813, ..., 0.48728522, 0.12872068,
        0.1519087 ],
       [0.64456434, 0.66351031, 0.66553797, ..., 0.91065292, 0.49714173,
        0.45231536],
       [0.03686876, 0.50152181, 0.02853984, ..., 0.        , 0.25744136,
        0.10068215]])

In [9]:
import pandas as pd 
breast_cancer_X.shape



(569, 30)

In [10]:
def nonlin(x,deriv=False): #создание сигмоиды; в соответств от 0 до 1; преобр в вероятности;   deriv = True - производная
    if(deriv==True):
        return x*(1-(x))

    return 1/(1+np.exp(-x))
    
#X входной набор данных 
                
#y выходной набор данных
#l0 первый слой сети
#l1 -l2 - скрытые слои сети 
# l3 -финальный выходной слой - гипотеза
#syn - слои весов
# l2_error – промах сети в количественном выражении
# l2_delta – ошибка сети, в зависимости от уверенности предсказания. Почти совпадает с ошибкой, за исключением уверенных предсказаний
# l1_error – взвешивая l2_delta весами из syn1, мы подсчитываем ошибку в среднем/скрытом слое
# l1_delta – ошибки сети из l1, масштабируемые по увеернности предсказаний. Почти совпадает с l1_error, за исключением уверенных предсказаний
np.random.seed(1) #каждый раз одно и то же случайное распределение
# случайно инициализируем веса, в среднем - 0; «synapse zero» 
syn0 = 2*np.random.random((30,10)) - 1 #задаем веса и размер слоёв случайно;  матрица весов сети
syn1 = 2*np.random.random((10,3)) - 1 
syn2 = 2*np.random.random((3,1)) - 1
lr = 0.1
def suit(X, y, kolvo_epox):
    global syn0, syn1, syn2
    for i in range(kolvo_epox):
        #прямое распространение
        l0 = X
        l1 = nonlin(np.dot(l0,syn0)) 
        l2 = nonlin(np.dot(l1,syn1))
        l3 = nonlin(np.dot(l2,syn2))
        #обтратное распространение
        l3_error = y - l3 # в l1  догадки, сравниваем с реальностью, . l_error – вектор из положительных и отрицательных чисел, характеризующий «промах» сети.
        l3_delta = l3_error*nonlin(l3,deriv=True) #производная, взвешенная по ошибкам; уменьшаем ошибки предсказаний, сделанных с высокой уверенностью
        l2_error = l3_delta.dot(syn2.T)
        l2_delta = l2_error*nonlin(l2,deriv=True)
        l1_error = l2_delta.dot(syn1.T) #Использует ошибки, взвешенные по уверенности предсказаний из l2, чтобы подсчитать ошибку для l1; обратное распространение ошибок
        l1_delta = l1_error * nonlin(l1,deriv=True)
        #обновляем веса
        syn0 += lr*l0.T.dot(l1_delta) 
        syn1 += lr*l1.T.dot(l2_delta) 
        syn2 += lr*l2.T.dot(l3_delta)
        print('Значение ошибки: ', np.mean(np.abs(l3_error)))
    return l3
    


In [11]:
breast_cancer_Y_reshaped = breast_cancer_Y.reshape(-1,1)


In [12]:
predict_breast_cancer_Y = suit(norm_breast_cancer_X, breast_cancer_Y_reshaped,1000)

Значение ошибки:  0.5185850123327455
Значение ошибки:  0.41199301742905997
Значение ошибки:  0.4812774550713533
Значение ошибки:  0.4618306774532082
Значение ошибки:  0.43740453643044463
Значение ошибки:  0.4406889233398519
Значение ошибки:  0.4108076116550508
Значение ошибки:  0.446004220131922
Значение ошибки:  0.37850142840788864
Значение ошибки:  0.4802751993212109
Значение ошибки:  0.4612925029525833
Значение ошибки:  0.40817731268923063
Значение ошибки:  0.3538903817608704
Значение ошибки:  0.45826240884638697
Значение ошибки:  0.38147127640571415
Значение ошибки:  0.32900024908977094
Значение ошибки:  0.46658367851537697
Значение ошибки:  0.4155640185955748
Значение ошибки:  0.31567142957296607
Значение ошибки:  0.4319621981050124
Значение ошибки:  0.3154315211942641
Значение ошибки:  0.3606884474014755
Значение ошибки:  0.29500742680075037
Значение ошибки:  0.46559906657835365
Значение ошибки:  0.42042108752508994
Значение ошибки:  0.3196326588562052
Значение ошибки:  0.3029194

Значение ошибки:  0.21182366184549556
Значение ошибки:  0.24462562359398585
Значение ошибки:  0.2116761815514119
Значение ошибки:  0.24439009070882514
Значение ошибки:  0.21153147635156697
Значение ошибки:  0.24415876201539327
Значение ошибки:  0.21138947471889982
Значение ошибки:  0.24393146207666405
Значение ошибки:  0.21125010673988756
Значение ошибки:  0.2437080189382594
Значение ошибки:  0.21111330409963322
Значение ошибки:  0.24348826504955348
Значение ошибки:  0.21097900006211046
Значение ошибки:  0.24327203812143275
Значение ошибки:  0.21084712944652534
Значение ошибки:  0.24305918192375983
Значение ошибки:  0.2107176286007995
Значение ошибки:  0.2428495470237131
Значение ошибки:  0.21059043537320432
Значение ошибки:  0.24264299146395948
Значение ошибки:  0.21046548908318996
Значение ошибки:  0.24243938137722257
Значение ошибки:  0.21034273049244104
Значение ошибки:  0.24223859153139224
Значение ошибки:  0.21022210177715506
Значение ошибки:  0.24204050579708417
Значение ошибки:

Значение ошибки:  0.20338047933926817
Значение ошибки:  0.22820819483460061
Значение ошибки:  0.2033391980641089
Значение ошибки:  0.22809199006450578
Значение ошибки:  0.20329818056200852
Значение ошибки:  0.2279775789832853
Значение ошибки:  0.20325742718424095
Значение ошибки:  0.2278651316478143
Значение ошибки:  0.20321693810421562
Значение ошибки:  0.2277548307590324
Значение ошибки:  0.20317671323288383
Значение ошибки:  0.2276468731712821
Значение ошибки:  0.20313675211458318
Значение ошибки:  0.22754147149433393
Значение ошибки:  0.20309705379778023
Значение ошибки:  0.22743885574536124
Значение ошибки:  0.2030576166736565
Значение ошибки:  0.22733927498058032
Значение ошибки:  0.2030184382735984
Значение ошибки:  0.22724299879591411
Значение ошибки:  0.20297951501432857
Значение ошибки:  0.2271503185274568
Значение ошибки:  0.20294084187660444
Значение ошибки:  0.22706154789827923
Значение ошибки:  0.20290241200010384
Значение ошибки:  0.22697702273819131
Значение ошибки:  0.

Значение ошибки:  0.2134259255786618
Значение ошибки:  0.1993953857980761
Значение ошибки:  0.21334078082462057
Значение ошибки:  0.19937579462581645
Значение ошибки:  0.21325657702730308
Значение ошибки:  0.19935645012030082
Значение ошибки:  0.21317334290210666
Значение ошибки:  0.19933734368249828
Значение ошибки:  0.2130911224067606
Значение ошибки:  0.19931846563542815
Значение ошибки:  0.2130099682055688
Значение ошибки:  0.19929980565629588
Значение ошибки:  0.2129299356068875
Значение ошибки:  0.19928135320387602
Значение ошибки:  0.21285107724520597
Значение ошибки:  0.19926309791721053
Значение ошибки:  0.21277343870784632
Значение ошибки:  0.19924502996480023
Значение ошибки:  0.2126970552303274
Значение ошибки:  0.1992271403278031
Значение ошибки:  0.212621949508981
Значение ошибки:  0.19920942100601632
Значение ошибки:  0.21254813060909805
Значение ошибки:  0.19919186514121007
Значение ошибки:  0.21247559388555354
Значение ошибки:  0.199174467058218
Значение ошибки:  0.212

Значение ошибки:  0.0974744961382133
Значение ошибки:  0.10278877423018946
Значение ошибки:  0.06126015531722431
Значение ошибки:  0.06191382458645061
Значение ошибки:  0.07040225561026625
Значение ошибки:  0.08803885601579119
Значение ошибки:  0.06610481334473323
Значение ошибки:  0.07950061935511248
Значение ошибки:  0.0759277879076021
Значение ошибки:  0.1104555503609763
Значение ошибки:  0.08276988984574991
Значение ошибки:  0.11396625915199243
Значение ошибки:  0.08238842561457924
Значение ошибки:  0.11266532336846831
Значение ошибки:  0.07075688109426574
Значение ошибки:  0.08576947901602461
Значение ошибки:  0.0598074124471706
Значение ошибки:  0.05917121689240573
Значение ошибки:  0.06263118178754494
Значение ошибки:  0.06631914715779821
Значение ошибки:  0.07252299711919091
Значение ошибки:  0.09389553130248807
Значение ошибки:  0.06482600007548983
Значение ошибки:  0.07023118904985916
Значение ошибки:  0.07263869982703824
Значение ошибки:  0.09211260648713598
Значение ошибки:

In [13]:
from sklearn.metrics import accuracy_score, precision_recall_fscore_support

In [18]:
accuracy = accuracy_score(breast_cancer_Y,np.squeeze(np.round(predict_breast_cancer_Y)))
precision, recall, f1_score, _ = precision_recall_fscore_support(breast_cancer_Y, np.squeeze(np.round(predict_breast_cancer_Y)), average='binary')

In [19]:
print("Accuracy: ", accuracy)
print("Precision: ", precision)
print("Recall: ", recall)
print("F1 score: ", f1_score)
 

Accuracy:  0.984182776801406
Precision:  0.9887640449438202
Recall:  0.9859943977591037
F1 score:  0.9873772791023843


# ВЫВОДЫ:
    Таким образом, вес первого входа по отношению к выходу будет постоянно увеличиваться или оставаться постоянным, а два других веса будут увеличиваться и уменьшаться в зависимости от примеров. Этот эффект и способствует обучению сети на основе корреляций входных и выходных данных.