# Добро пожаловать в глубокое обучение! #

Добро пожаловать на курс Kaggle *Введение в глубокое обучение*! Вы вот-вот узнаете всё, что нужно, чтобы начать строить собственные глубокие нейронные сети. Используя Keras и TensorFlow, вы научитесь:
- создавать **полносвязную** архитектуру нейронной сети
- применять нейронные сети к двум классическим задачам машинного обучения: **регрессии** и **классификации**
- обучать нейронные сети с помощью **стохастического градиентного спуска**, и
- улучшать качество с помощью **дропаута**, **пакетной нормализации** и других техник

В учебниках вы познакомитесь с этими темами на полностью разобранных примерах, а затем в упражнениях изучите их глубже и примените к реальным наборам данных.

Давайте начнём!

# Что такое глубокое обучение? #

Некоторые из самых впечатляющих достижений искусственного интеллекта за последние годы связаны с *глубоким обучением*. Перевод естественного языка, распознавание изображений и игры — всё это задачи, в которых модели глубокого обучения приблизились или даже превзошли уровень человека.

Так что же такое глубокое обучение? **Глубокое обучение** — это подход к машинному обучению, характеризующийся глубокими стеками вычислений. Именно эта глубина вычислений позволила моделям глубокого обучения распутывать сложные и иерархические закономерности, встречающиеся в самых трудных реальных наборах данных.

Благодаря своей мощности и масштабируемости **нейронные сети** стали определяющей моделью глубокого обучения. Нейронные сети состоят из нейронов, каждый из которых по отдельности выполняет лишь простое вычисление. Сила нейронной сети возникает из сложности связей, которые эти нейроны могут формировать.

# Линейный элемент #

Итак, начнём с фундаментального компонента нейронной сети: отдельного нейрона. В виде диаграммы **нейрон** (или **элемент**) с одним входом выглядит так:

<figure style="padding: 1em;">
<img src="https://storage.googleapis.com/kaggle-media/learn/images/mfOlDR6.png" width="250" alt="Diagram of a linear unit.">
<figcaption style="textalign: center; font-style: italic"><center>Линейный элемент: $y = w x + b$
</center></figcaption>
</figure>

Вход — это `x`. Связь с нейроном имеет **вес** `w`. Каждый раз, когда значение проходит через связь, оно умножается на вес связи. Для входа `x` к нейрону приходит `w * x`. Нейронная сеть «учится», изменяя свои веса.

`b` — это особый вид веса, который мы называем **смещением** (bias). У смещения нет связанного входного значения; вместо этого мы ставим в диаграмме `1`, так что значение, приходящее к нейрону, просто равно `b` (поскольку `1 * b = b`). Смещение позволяет нейрону изменять выход независимо от его входов.

`y` — это значение, которое нейрон в итоге выдаёт. Чтобы получить выход, нейрон суммирует все значения, полученные по своим связям. Активация этого нейрона равна `y = w * x + b`, или в виде формулы $y = w x + b$.

<blockquote style="margin-right:auto; margin-left:auto; background-color: #ebf9ff; padding: 1em; margin:24px;">
    <strong>Знакома ли формула $y=w x + b$?</strong><br>
Это уравнение прямой! Это уравнение в форме угла наклона и пересечения с осью, где $w$ — наклон, а $b$ — пересечение с осью y. 
</blockquote>

# Пример — линейный элемент как модель #

Хотя отдельные нейроны обычно работают как часть более крупной сети, часто полезно начать с модели одного нейрона как базовой. Модели одного нейрона — *линейные* модели.

Давайте подумаем, как это могло бы работать на наборе данных [80 Cereals](https://www.kaggle.com/crawford/80-cereals). Обучая модель с входом `'sugars'` (граммы сахара на порцию) и выходом `'calories'` (калории на порцию), мы могли бы получить смещение `b=90` и вес `w=2.5`. Тогда мы могли бы оценить калорийность хлопьев с 5 граммами сахара на порцию так:

<figure style="padding: 1em;">
<img src="https://storage.googleapis.com/kaggle-media/learn/images/yjsfFvY.png" width="1000" alt="Computing with the linear unit.">
<figcaption style="textalign: center; font-style: italic"><center>Вычисления с линейным элементом.
</center></figcaption>
</figure>

И, сверяясь с нашей формулой, получаем $calories = 2.5 	imes 5 + 90 = 102.5$, как и ожидаем.

# Несколько входов #

Набор данных *80 Cereals* содержит гораздо больше признаков, чем только `'sugars'`. Что если мы захотим расширить модель и включить, например, содержание клетчатки или белка? Это достаточно просто. Мы можем добавить к нейрону больше входных связей — по одной для каждого дополнительного признака. Чтобы найти выход, мы умножим каждый вход на вес его связи и затем сложим всё вместе.

<figure style="padding: 1em;">
<img src="https://storage.googleapis.com/kaggle-media/learn/images/vyXSnlZ.png" width="300" alt="Three input connections: x0, x1, and x2, along with the bias.">
<figcaption style="textalign: center; font-style: italic"><center>Линейный элемент с тремя входами.
</center></figcaption>
</figure>

Формула для этого нейрона будет $y = w_0 x_0 + w_1 x_1 + w_2 x_2 + b$. Линейный элемент с двумя входами аппроксимирует плоскость, а элемент с большим числом входов — гиперплоскость.

# Линейные элементы в Keras #

Самый простой способ создать модель в Keras — это `keras.Sequential`, который строит нейронную сеть как стек *слоёв*. Мы можем создать модели, подобные показанным выше, используя *dense*-слой (о котором мы подробнее узнаем в следующем уроке).

Мы могли бы определить линейную модель, принимающую три входных признака (`'sugars'`, `'fiber'` и `'protein'`) и выдающую один выход (`'calories'`), так:

In [None]:
from tensorflow import keras
from tensorflow.keras import layers

# Create a network with 1 linear unit
model = keras.Sequential([
    layers.Dense(units=1, input_shape=[3])
])

С первым аргументом, `units`, мы задаём, сколько выходов хотим получить. В данном случае мы просто предсказываем `'calories'`, поэтому используем `units=1`.

Со вторым аргументом, `input_shape`, мы сообщаем Keras размерность входов. Указание `input_shape=[3]` гарантирует, что модель будет принимать три признака на вход (`'sugars'`, `'fiber'` и `'protein'`).

Теперь эта модель готова к обучению на тренировочных данных!

<blockquote style="margin-right:auto; margin-left:auto; background-color: #ebf9ff; padding: 1em; margin:24px;">
    <strong>Почему <code>input_shape</code> — это список Python?</strong><br>
Данные, которые мы будем использовать в этом курсе, — табличные, как в датафрейме Pandas. У нас будет по одному входу для каждого признака в наборе данных. Признаки расположены по столбцам, поэтому у нас всегда будет <code>input_shape=[num_columns]</code>.

Причина, по которой Keras использует здесь список, в том, чтобы позволить использование более сложных наборов данных. Например, для изображений могут понадобиться три измерения: <code>[height, width, channels]</code>.
</blockquote>

# Ваш ход #

[**Определите линейную модель**](https://www.kaggle.com/kernels/fork/11887334) для набора данных *Red Wine Quality*.

---




*Есть вопросы или комментарии? Посетите [форум обсуждения курса](https://www.kaggle.com/learn/intro-to-deep-learning/discussion), чтобы пообщаться с другими учащимися.*