# Моделирование данных 2

## Построение модели

Напомним, что в блокноте 3 мы видели, что мы можем использовать математическую функцию для классификации изображения как яблока или банана, основываясь на среднем количестве зеленого цвета в изображении:

<img src="data/data_flow.png" alt="Drawing" style="width: 500px;"/>


<img src="data/what_is_model.png" alt="Drawing" style="width: 300px;"/>

Обычной функцией для выполнения такого рода **классификации** является сигмоид, который мы видели в предыдущем блокноте, и который мы теперь расширим, добавив два **параметра**, $ w $ и $ b $:

$$\sigma(x; w, b) := \frac{1}{1 + \exp(-wx + b)}$$

$$ x = \mathrm{data} $$

\begin{align}
\sigma(x;w,b) &\approx 0 \implies \mathrm{apple} \\
\sigma(x;w,b) &\approx 1 \implies \mathrm{banana}
\end{align}

В нашей математической записи выше `;` в функции разделяет **данные** и **параметры**. `x` - это данные, которые определяются по изображению. Параметры, `w` и` b`, являются числами, которые мы выбираем, чтобы наша функция соответствовала результатам, которые она должна моделировать. Обратите внимание, что в приведенном ниже коде мы не различаем данные и параметры - оба являются просто входами для нашей функции, σ!

In [None]:
using Images, Statistics

apple = load("data/10_100.jpg")
banana = load("data/104_100.jpg")

apple_green_amount = mean(Float64.(green.(apple)))
banana_green_amount = mean(Float64.(green.(banana)))

"Average green for apple = $apple_green_amount; " *
"Average green for banana = $banana_green_amount; "

In [None]:
σ(x, w, b) = 1 / (1 + exp(-w * x + b))

Мы хотим, чтобы, когда мы вводили σ в качестве входного значения среднего зеленого цвета для яблока, примерно `x = 0.3385`, оно должно возвращать в качестве выходных данных что-то близкое к 0, что означает« яблоко ». И когда мы даем σ входное значение `x = 0.8807`, оно должно вывести что-то близкое к 1, что означает« банан ». 

Изменяя параметры функции, мы можем изменить форму функции и, следовательно, сделать так, чтобы она лучше представляла или **соответствовала** данным!

## Подгонка данных по различным параметрам

Мы можем понять, как наш выбор `w` и` b` влияет на нашу модель, увидев, как наши значения для `w` и` b` изменяют график функции $ \sigma $. 

Для этого мы будем использовать пакет Julia `Interact.jl`, который предоставляет« виджеты »для интерактивного управления параметрами с помощью ползунков:

In [None]:
using Plots 
gr()   # GR works better for interactive manipulations - это мы ещё посмотрим
using Interact      # package for interactive manipulation

Запустите код в следующей ячейке. Вы должны увидеть два «ползунка», один для `w` и один для` b`. 

**Игра**:  
 Перемещайте оба этих ползунка до тех пор, пока синяя кривая, обозначенная как «модель», которая является графиком функции `σ`, не пройдет через *обе* точки данных одновременно ,

In [None]:
@manipulate for w in -10:0.01:30, b in 0:0.1:20
    
    plot(x -> σ(x, w, b), xlim=(-0,1), ylim=(-0.1,1.1), label="model", legend=:topleft, lw=3)
    
    scatter!([apple_green_amount],  [0.0], label="apple", ms=5)   # marker size = 5
    scatter!([banana_green_amount], [1.0], label="banana", ms=5)
    
end

Обратите внимание, что два параметра делают две разные вещи. **вес**, `w`, определяет *как быстро* происходит переход между 0 и 1. Он кодирует то, насколько достоверными мы считаем наши данные, и в каком диапазоне мы должны ставить точки между 0 и 1 и, таким образом, называть их «неуверенными». 

**Смещение**, `b`, кодирует , *где* на оси $ x $ переключение должно иметь место. Это можно рассматривать как смещение функции влево-вправо. Мы разберемся с этими *параметрами* подробнее в блокноте 6. Вот несколько вариантов параметров, которые хорошо работают:

In [None]:
w = 25.58; b = 15.6

plot(x -> σ(x, w, b), xlim=(0,1), ylim=(-0.1,1.1), label="model", legend=:topleft, lw=3)

scatter!([apple_green_amount], [0.0], label="apple")
scatter!([banana_green_amount],[1.0], label="banana")

(Обратите внимание, что в этой задаче есть много комбинаций `w` и` b`, которые хорошо соответствуют данным.)

Когда у нас есть модель, у нас есть вычислительное представление о том, как выбирать между «яблоком» и «бананом». Итак, давайте добавим несколько новых изображений и посмотрим, что наша модель говорит о них!

In [None]:
apple2 = load("data/107_100.jpg")

In [None]:
green_amount = mean(Float64.(green.(apple2)))
@show green_amount

scatter!([green_amount], [σ(green_amount, w, b)], label="new apple")

Наша модель успешно говорит, что наш новый образ - это яблоко! Погладьте себя по головушке: вы на самом деле только что обучили свою первую нейронную сеть!

#### Упражнение 1

Загрузите изображение банана в `data / 8_100.jpg` как` mybanana`. Отредактируйте приведенный ниже код, чтобы вычислить количество зеленого в mybanana и наложить данные для этого изображения на существующую модель и точки данных.

# Чтобы получить желаемое наложение, нам нужен код

```julia
mybanana = load("data/8_100.jpg")
mybanana_green_amount = mean(Float64.(green.(banana)))
scatter!([mybanana_green_amount], [σ(mybanana_green_amount, w, b)], label="my banana")
```

## Заключительные замечания: большие модели, больше данных, больше точности

Последнее яблоко должно заставить вас задуматься: не все яблоки красные - бывают и желтые. «Краснота» - это один из признаков яблока, но это еще не все. Что нам нужно сделать, так это включить больше идей в нашу модель, предоставив больше информации. Тем не менее, больше входных данных будет означать больше параметров для игры. Кроме того, мы бы хотели, чтобы компьютер начал «учиться» самостоятельно, вместо того, чтобы самим изменять параметры, пока мы не поймем, что он «выглядит правильно». Как мы сделаем следующий шаг? 

Первое, о чем стоит подумать, если бы вы хотели включить больше данных в модель, как бы вы изменили сигмовидную функцию? Поиграйте с некоторыми идеями. Но также начните думать о том, как вы выбрали параметры. Какой процесс вы сделали, чтобы в итоге получить хорошие параметры? Эти две проблемы (работа с моделями с большим количеством данных и автоматический выбор параметров) являются последним оставшимся шагом к пониманию глубокого обучения.