# Feature/Representation learning

Обучение признакам или обучение представлениям (**feature/representation learning**) — это набор техник, которые позволяют системе **автоматически обнаружить** представления (representation), необходимые для выявления признаков или классификации исходных (сырых) данных. Это заменяет ручное конструирование признаков и позволяет машине как изучать признаки, так и использовать их для решения специфичных задач.

**Feature/representation learning** вызвано фактом, что в задачах машинного обучения, таких как классификация, часто **требуется вход, который удобно обрабатывать математически и вычислительно**. 
Однако **реальные данные**, такие как изображения, видео и данные датчиков, **не поддаются алгоритмическому определению специфичных признаков**. 
Альтернативой является обнаружение таких признаков или представлений путём исследования без опоры на определённые алгоритмы.

Глубокое обучение (**Deep learning**) — совокупность **методов машинного обучения (ML)**, основанных на **feature/representation learning**, а не специализированных алгоритмах под конкретные задачи.

<img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/diagrams/ai_vs_ml_vs_nn_vs_dl_vs_ds_vs_big_data.drawio.svg"/>

Первоначальная цель нейросетевого подхода состояла в том, чтобы решать задачи так же, как это делает человеческий мозг. 
Со временем внимание сосредоточилось на подборе определённых интеллектуальных способностей, что привело к отклонениям от биологии, таким как обратное распространение, или передаче информации в обратном направлении и настройке сети для отражения этой информации.

# Biological neural network (BNN)

**Биологический нейрон (Biological Neuron)** — это клетка, которая находится в головном мозге. 

**Мозг** — главный орган управления, который позволяет живым существам иметь способность адаптироваться к изменяющейся среде и способность к обучению — **состоит из очень большого количества нейронов**. 

В биологии **нейрон — это клетка, передающая сообщения (импульсы) в нервной системе**.

## Структура BNN

- **Дендриты (dendrites) получают импульсы** от других клеток.
- **Аксоны (axons) передают** их другим клеткам или другим дендритам. 
- **Когда импульс достигает синаптических окончаний (synaptic terminals)**, иногда называемых аксонными окончаниями (axon terminals), **аксон (axon) высвобождает нейротрансмиттер (neurotransmitter)** — химическое вещество, связывающее дендритную мембрану принимающего нейрона. 
- **Синаптические окончания (synaptic terminals) не прикрепляются непосредственно** к другому дендриту. Существует щель, называемая **синаптической щелью (synaptic cleft)**, и благодаря нейротрансмиттеру (neurotransmitter) импульс может передаваться от одного нейрона к другим.
- **Каждый нейрон соединен с тысячами других нейронов** — образуют нейронную сеть. Эта нейронная сеть, известная как **биологические нейронные сети (BNNs)**, по-видимому, имеет организованные последовательные слои нейронов во внешнем слое мозга.

<center><img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/images/biological_neuron_ru.jpg" width="600"/></center>

<center><img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/images/biological_neuron_en.png" width="600"/></center>

# Artificial neural network (ANN)

**Искусственная нейронная сеть применяет концепцию BNN**. 

Искусственные нейронные сети (**Artificial neural networks**)  — это вычислительные системы, основанные на принципах биологических нейронных сетей, составляющих мозг животных. Такие системы учатся (постепенно улучшают свои способности) выполнять задачи, как правило, без программирования для решения конкретных задач. 

Наибольшее применение ANNs нашли в программных приложениях, которые трудно выразить традиционным компьютерным алгоритмом, использующим программирование на основе правил.

Можно рассматривать **импульс, полученный дендритом, как вход**, а **переданный импульс как выход**.

## Структура ANN

- ANN основаны на наборе **связанных** единиц, называемых **искусственными нейронами** (аналог биологических нейронов в биологическом мозге, НО со значительными различиями между реальными биологическими нейронами).

- Глубинная нейронная сеть (DNN — **Deep neural network**) — это искусственная нейронная сеть (ИНС) с несколькими слоями между входным и выходным слоями.

- Каждое **соединение (синапс) между нейронами** может передавать сигнал другому нейрону. 

- **Принимающий (постсинаптический) нейрон может обрабатывать** сигнал (сигналы) и затем сигнализировать о подключенных к нему нейронах. 

- **Нейроны могут иметь состояние**, обычно представляемое действительными числами, обычно между 0 и 1. 

- **Нейроны и синапсы могут иметь вес**, который изменяется в процессе обучения, что может увеличивать или уменьшать силу сигнала, который он посылает далее.

- Как правило, **нейроны организованы в слои**. 

- Разные **слои** могут выполнять **различные виды преобразований**. 

- **Сигналы проходят от первого (входного) до последнего (выходного) слоя**, возможно, после многократного прохождения слоев.

- Глубокая нейронная сеть (DNN — Deep neural network) — это искусственная нейронная сеть (ИНС) с несколькими слоями между входным и выходным слоями (больше 1).
- DNN могут моделировать сложные нелинейные отношения. 

Начиная с 2017 года нейронные сети обычно имеют **от нескольких тысяч до нескольких миллионов единиц и миллионы соединений**.

## Using artificial neural networks requires an understanding of their characteristics

- **Choice of model**: This depends on the data representation and the application. Overly complex models are slow learning.
- **Learning algorithm**: Numerous trade-offs exist between learning algorithms. Almost any algorithm will work well with the correct hyperparameters for training on a particular data set. However, selecting and tuning an algorithm for training on unseen data requires significant experimentation.
- **Robustness**: If the model, cost function and learning algorithm are selected appropriately, the resulting ANN can become robust.

## ANN capabilities fall within the following broad categories

- **Function approximation**, or regression analysis, including time series prediction, fitness approximation and modeling.
- **Classification**, including pattern and sequence recognition, novelty detection and sequential decision making.
- **Data processing**, including filtering, clustering, blind source separation and compression.
- **Robotics**, including directing manipulators and prostheses.

## Классификация по характеру настройки синапсов

- Сети с фиксированными связями (весовые коэффициенты нейронной сети выбираются сразу, исходя из условий задачи, при этом: 
$\boldsymbol{d}W/dt=0$, где $W$ — весовые коэффициенты сети
- Сети с динамическими связями (для них в процессе обучения происходит настройка синаптических связей, то есть 
$\boldsymbol{d}W/dt\not =0$, где $W$ — весовые коэффициенты сети.

## Классификация по характеру связей / Базовые архитектуры

- **Нейронные сети прямого распространения (feedforward neural network)** - все связи направлены строго от входных нейронов к выходным. 
    - Перцептрон Розенблатта (P)
    - Многослойный перцептрон (MPL)
    - Сети Ворда
    
    <img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/diagrams/ffnn_example.svg"/>

- **Рекуррентные нейронные сети  (recurrent neural network, RNN)** - сигнал с выходных нейронов или нейронов скрытого слоя частично передаётся обратно на входы нейронов входного слоя (обратная связь). 
    - Рекуррентная сеть Хопфилда "фильтрует" входные данные, возвращаясь к устойчивому состоянию и, таким образом, позволяет решать задачи компрессии данных и построения ассоциативной памяти. 
    - Частным случаем рекуррентных сетей являются двунаправленные сети. В таких сетях между слоями существуют связи как в направлении от входного слоя к выходному, так и в обратном. 
    - Классическим примером является нейронная сеть Коско.
    
    <img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/diagrams/rnn_example.drawio.svg"/>
    
- **Сеть радиально-базисных функций (Radial basis function network, RBF)** — сети, содержащие единственны скрытый слой нейроны которого используют радиально-симметричную активационную функцию, применяются для решения задач классификации и прогнозирования.

- **Самоорганизующиеся карты** - такие сети представляют собой соревновательную нейронную сеть с обучением без учителя, выполняющую задачу визуализации и кластеризации. 
    - Является методом проецирования многомерного пространства в пространство с более низкой размерностью (чаще всего, двумерное), применяется также для решения задач моделирования, прогнозирования и др. 
    - Является одной из версий нейронных сетей Кохонена. Самоорганизующиеся карты Кохонена служат, в первую очередь, для визуализации и первоначального ("разведывательного") анализа данных.

- ...

# References

[Tools for Advancing the World's AI](https://ai.facebook.com/tools/#libraries-models-and-datasets)

[Нейросети и глубокое обучение, глава 5: почему глубокие нейросети так сложно обучать?](https://habr.com/ru/post/462381/)

[Функции активации нейросети: сигмоида, линейная, ступенчатая, ReLu, tahn](https://neurohive.io/ru/osnovy-data-science/activation-functions/)

[Исключение (нейронные сети)](https://ru.wikipedia.org/wiki/%D0%98%D1%81%D0%BA%D0%BB%D1%8E%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_(%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D0%B5%D1%82%D0%B8))

[Глубокое обучение](https://ru.wikipedia.org/wiki/%D0%93%D0%BB%D1%83%D0%B1%D0%BE%D0%BA%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5)

[]()

[]()

[]()

[]()