# Простые нейронные сети

In [1]:
import numpy as np
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

In [2]:
cancer_info = load_breast_cancer()
cancer_data = cancer_info.data
cancer_target = cancer_info.target
X_train, X_test, y_train, y_test = train_test_split(cancer_data,cancer_target)

**MLP (Multi-Layer Perceptron)** классификатор представляет собой тип нейронной сети, который состоит из нескольких слоев нейронов, включая входной слой, скрытые слои и выходной слой. MLP широко используется для решения задач классификации и регрессии. Вот основные аспекты MLP классификатора:

Основные характеристики MLP классификатора:

**Структура нейронной сети:**

- Входной слой: Принимает входные признаки.
- Скрытые слои: Выполняют вычисления с использованием весов и функций активации.
- Выходной слой: Возвращает прогнозы.

**Функции активации**:

- Скрытые слои и выходной слой могут использовать различные функции активации, такие как ReLU (Rectified Linear Unit) для скрытых слоев и Softmax для выходного слоя в задачах классификации.

**Обучение и оптимизация**:
- Обучение MLP происходит с использованием алгоритмов оптимизации, таких как стохастический градиентный спуск (SGD) или его варианты.
- Функции потерь, такие как кросс-энтропия, обычно используются для задач классификации.

**Количество слоев и нейронов:**
- Количество слоев и нейронов в слоях может быть настроено в зависимости от сложности задачи и объема данных.

![image.png](attachment:image.png)

Функции активации в нейронных сетях являются неотъемлемой частью обучения и функционирования сетей. Они вводят нелинейность в модель, позволяя сети аппроксимировать сложные нелинейные отображения между входными и выходными данными. Без функций активации нейронная сеть не отличалась бы от линейной регрессии или линейного классификатора.

In [3]:
from sklearn.neural_network import MLPClassifier
mlp_clf = MLPClassifier().fit(X_train, y_train)

print(f'Правильность на обучающем наборе: {mlp_clf.score(X_train, y_train):.2f}')
print(f'Правильность на тестовом наборе: {mlp_clf.score(X_test, y_test):.2f}')
print('\n ТЕМ НЕ МЕНЕЕ ВАЖНО МАСШТАБИРОВАТЬ ВХОДЯЩИЕ ПРИЗНАКИ!')

Правильность на обучающем наборе: 0.83
Правильность на тестовом наборе: 0.78

 ТЕМ НЕ МЕНЕЕ ВАЖНО МАСШТАБИРОВАТЬ ВХОДЯЩИЕ ПРИЗНАКИ!


## Основные параметры 

**MLPClassifier в библиотеке scikit-learn предоставляет несколько важных параметров, которые могут быть настроены для оптимизации производительности нейронной сети. Вот несколько ключевых параметров MLPClassifier и их краткое описание:**

- **hidden_layer_sizes**:
Определяет количество нейронов в каждом скрытом слое.
Пример: hidden_layer_sizes=(100, 50) задает два скрытых слоя, первый с 100 нейронами, второй с 50.

- **activation**:
Определяет функцию активации для скрытых слоев.
Возможные значения: 'identity', 'logistic', 'tanh', 'relu'.
Пример: activation='relu' использует ReLU в качестве функции активации.

- **solver**:
Определяет алгоритм оптимизации.
Возможные значения: 'lbfgs', 'sgd', 'adam'.
Пример: solver='adam' использует метод оптимизации Adam.

- **alpha**:
Параметр регуляризации, контролирующий величину штрафа за большие веса.
Пример: alpha=0.0001.

- **learning_rate:**
Определяет скорость обучения в методе оптимизации 'sgd'.
Возможные значения: 'constant', 'invscaling', 'adaptive'.
Пример: learning_rate='constant'.

- **max_iter:**
Максимальное количество итераций при обучении.
Пример: max_iter=200 задает максимальное количество итераций обучения.

- **random_state:**
Задает начальное значение для случайной инициализации весов и других случайных параметров.
Пример: random_state=42 для воспроизводимости результатов.

-------------------------
Несмотря на то что для наболее распространенных архитектур 
нейронных сетей MLPClassifier и MLPRegressor предлагают легкий в 
использовании интерфейс, они представляют лишь небольшой набор 
возможных средств, позволяющих строить нейронные сети. Если вас
интересует работа с более гибкими или более масштабными моделями, 
мы рекомендуем вам не ограничиваться возможностями библиотеки
scikit-learn и обратиться к фантастическим по своими возможностями
библиотекам глубокого обучения. Для пользователей Python наиболее 
устоявшимися являются keras, lasagna и tenzor-flow. lasagna построена
на основе библиотеки theano, тогда как keras может использовать либо 
tensor-flow, либо theano. Эти библиотеки предлагают гораздо более 
гибкий интерфейс для построения нейронных сетей и обновляются в 
соответствии с последними достижениями в области глубокого обучения. 
Кроме того, все популярные библиотеки глубокого обучения позволяют 
использовать высокопроизводительные графические процессоры (GPU), 
которые в scikit-learn не поддерживаются. Использование графических 
процессоров позволяет ускорить вычисления от 10 до 100 раз, и они 
имеют важное значение для применения методов глубого обучения для 
крупномасштабных наборов данных

---------------------------

![image.png](attachment:image.png)

![image.png](attachment:image.png)