# Распознование рукописных чисел с помощью Tensorflow, Keras, и готового датасета MNIST

In [10]:
import tensorflow as tf
import numpy as np

Подготовка данных и нормализация ($x \in{[0, 1]}$)

In [11]:
mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

Преобразование массива из матрицы в вектор - `Flatten`

Полносвязный слой, состоящий из 128 нейронов с функцией активации `ReLU`

Слой `Dropout` случайным образом "выключает" определенное количество нейронов в предыдущем слое с заданной вероятностью. Это помогает предотвратить переобучение и делает модель более устойчивой к шуму в данных.

В данном случае `Dense` - будет выходным слоем, и количество нейронов соответствует количеству классов, которые модель должна предсказывать.

In [16]:
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])

Для каждого примера модель возвращает вектор оценок [логитов](https://developers.google.com/machine-learning/glossary?authuser=2&hl=ru#logits) или логарифмических шансов , по одному для каждого класса.

In [None]:
predictions = model(x_train[:1]).numpy()
predictions

Функция `tf.nn.softmax` преобразует эти логиты в вероятности для каждого класса, где:

_Логит - это логарифм отношения вероятности события к вероятности его отсутствия. Логит используется в статистике и машинном обучении для моделирования бинарных или категориальных данных, таких как прогнозирование вероятности успеха или неудачи в определенной задаче._

$$ \operatorname{logit}(p) = \ln\left(\frac{p}{1-p}\right) $$

Здесь $\ln$ обозначает натуральный логарифм, 

$p$ - вероятность наступления события, 

а $\operatorname{logit}(p)$ - логит вероятности $p$.


_Batch (пакет) - это группа примеров из набора данных, которые обрабатываются одновременно в процессе обучения нейронной сети._

_Batch size (размер пакета) - это количество примеров из набора данных, которые обрабатываются одновременно в каждом пакете в процессе обучения нейронной сети._

При обучении нейронной сети, данные разбиваются на пакеты определенного размера, и каждый пакет обрабатывается последовательно. Обработка пакетов позволяет нейронной сети обучаться на больших наборах данных, не требуя слишком большого объема памяти.

Размер пакета может быть выбран в зависимости от доступных ресурсов, таких как объем доступной памяти и производительность оборудования, а также от требований конкретной задачи и оптимального размера пакета для этой задачи.

Использование пакетов и настройка размера пакета является важным параметром при обучении нейронных сетей и может значительно повлиять на скорость обучения и качество модели.

```python
import numpy as np

# Представляем данные в виде тензора размерности (1000, ширина, высота, количество каналов)
data = np.zeros((1000, 32, 32, 3))

# Размер пакета
batch_size = 64

# Цикл по пакетам
for i in range(0, len(data), batch_size):
    batch = data[i:i+batch_size]
    # Обработка пакета, вычисление градиентов, обновление весов

```

In [19]:
tf.nn.softmax(predictions).numpy()

array([[0.07885265, 0.10636128, 0.15836163, 0.03822355, 0.13412826,
        0.13133492, 0.13352184, 0.12330534, 0.06116224, 0.03474824]],
      dtype=float32)