Skip to content

Commit

Permalink
minor fixes
Browse files Browse the repository at this point in the history
  • Loading branch information
0101011 committed Jul 12, 2019
1 parent 0bc2638 commit 6e5cef9
Showing 1 changed file with 8 additions and 8 deletions.
Expand Up @@ -91,13 +91,13 @@
},
"source": [
"\n",
"Этот ноутбук (noteboook) классифицирует обзоры фильмов как *позитивные* или *негативные* используя текст обзора. Это пример *бинарной* или двуклассовой классификации, важный и широко применяющийся тип задач машинного обучения.\n",
"В этом уроке мы будем классифицировать обзоры фильмов как *позитивные* или *негативные*, используя текст обзора. Это пример *бинарной* или двуклассовой классификации, важный и широко применяющийся тип задач машинного обучения.\n",
"\n",
"Учебное руководство демонстрирует применение переноса обучения (transfer learning) с использованием TensorFlow Hub и Keras.\n",
"\n",
"Мы будем использовать [набор данных IMDB](https://www.tensorflow.org/api_docs/python/tf/keras/datasets/imdb) содержащий тексты 50,000 обзоров фильмов из [Internet Movie Database](https://www.imdb.com/). Они разделены на 25,000 обзоров для обучения, и 25,000 обзоров для проверки модели. Обучающая и тестовая выборка *сбалансированы*, т.е. содержат одинаковое количество позитивных и негативных обзоров. \n",
"\n",
"Этот ноутбук использует [tf.keras](https://www.tensorflow.org/guide/keras), высокоуровневый API для построения и обучения моделей в TensorFlow и [TensorFlow Hub](https://www.tensorflow.org/hub), библиотека и платформа для переноса обучения. Для более продвинутого руководства по классификации текстов с использованием `tf.keras`, см. [Руководство по классификации текстов MLCC](https://developers.google.com/machine-learning/guides/text-classification/)."
"Здесь мы будем использовать [tf.keras](https://www.tensorflow.org/guide/keras), высокоуровневый API для построения и обучения моделей в TensorFlow и [TensorFlow Hub](https://www.tensorflow.org/hub), библиотека и платформа для переноса обучения. Для более продвинутого руководства по классификации текстов с использованием `tf.keras`, см. [Руководство по классификации текстов MLCC](https://developers.google.com/machine-learning/guides/text-classification/)."
]
},
{
Expand Down Expand Up @@ -135,7 +135,7 @@
"source": [
"## Скачайте датасет IMDB\n",
"\n",
"Набор данных IMDB доступен в [датасетах TensorFlow](https://github.com/tensorflow/datasets). Следующий код скачивает датасет IMDB в ваш компьютер (или в среду выполнения colab):"
"Датасет IMDB доступен в [датасетах TensorFlow](https://github.com/tensorflow/datasets). Следующий код скачивает датасет IMDB на ваш компьютер (или в среду выполнения Colab):"
]
},
{
Expand Down Expand Up @@ -169,7 +169,7 @@
"\n",
"Давайте уделим немного времени, чтобы разобраться в формате данных. Каждый пример представляет собой предложение являющееся обзором фильма и соответствующую метку. Предложение никак не предобработано. Метка является целым числом, 0 или 1, где 0 - это отрицательный отзыв, а 1 - положительный.\n",
"\n",
"Напечатаем первые 10 примеров."
"Выведем первые 10 примеров."
]
},
{
Expand Down Expand Up @@ -304,7 +304,7 @@
"source": [
"Для построения классификатора зададим слои последовательно:\n",
"\n",
"1. Первый слой это слой TensorFlow Hub. Этот слой использует предобученную Saved Model отображающую предложения в векторные представления. Предобученная модель векторного представления слов которую мы используем ([google/tf2-preview/gnews-swivel-20dim/1](https://tfhub.dev/google/tf2-preview/gnews-swivel-20dim/1)) разбивает предложение в токены, встраивает каждый токен и затем объединяет вложения. В результате получаются размерности: `(num_examples, embedding_dimension)`.\n",
"1. Первый слой это слой TensorFlow Hub. Этот слой использует предобученную Saved Model, отображающую предложения в векторные представления. Предобученная модель векторного представления слов которую мы используем ([google/tf2-preview/gnews-swivel-20dim/1](https://tfhub.dev/google/tf2-preview/gnews-swivel-20dim/1)) разбивает предложение на токены, встраивает каждый токен и затем объединяет вложения. В результате получаются размерности: `(num_examples, embedding_dimension)`.\n",
"2. Получившийся в результате вектор фиксированной длины пропускается сквозь полносвязный (`Dense`) слой состоящий из 16 скрытых нейронов.\n",
"3. Последний слой плотно связан с единственным выходным нейроном. С использованием функции активации `сигмоида`, значение получается между 0 и 1, представляя вероятность или уровень доверия.\n",
"\n",
Expand Down Expand Up @@ -381,7 +381,7 @@
"source": [
"## Оцените модель\n",
"\n",
"Давайте посмотрим как работает модель. Она будет возвращать два значения. Потери (число показывающее нашу ошибку, меньшие значения лучше), и точность (accuracy)."
"Давайте посмотрим как работает модель. Она будет возвращать два значения. Потери (число, показывающее нашу ошибку, меньшие значения - лучше) и точность (accuracy)."
]
},
{
Expand All @@ -406,7 +406,7 @@
"id": "z1iEXVTR0Z2t"
},
"source": [
"Этот достаточно наивный подход достиг точности около 87%. С более продвинутыми методами модель бы приблизилась к 95%."
"Этот довольно наивный подход достиг точности около 87%. С более продвинутыми методами модель бы приблизилась к 95%."
]
},
{
Expand All @@ -422,4 +422,4 @@
]
}
]
}
}

0 comments on commit 6e5cef9

Please sign in to comment.