From d9a000ea69ab6b7c8fa08607c38094bfc13c231e Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Sat, 16 Mar 2019 15:42:59 +0900 Subject: [PATCH 01/19] Start a traslation --- .../eager/automatic_differentiation.ipynb | 323 ++++++++++++++++++ 1 file changed, 323 insertions(+) create mode 100644 site/ko/tutorials/eager/automatic_differentiation.ipynb diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb new file mode 100644 index 00000000000..ad6746c6de8 --- /dev/null +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -0,0 +1,323 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "t09eeeR5prIJ" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "form", + "colab": {}, + "colab_type": "code", + "id": "GCCk8_dHpuNf" + }, + "outputs": [], + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "xh8WkEwWpnm7" + }, + "source": [ + "# Automatic differentiation and gradient tape" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "idv0bPeCp325" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " View on TensorFlow.org\n", + " \n", + " Run in Google Colab\n", + " \n", + " View source on GitHub\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vDJ4XzMqodTy" + }, + "source": [ + "이전 튜토리얼에서 우리는 Tensor와 연산자들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "GQJysDM__Qb0" + }, + "source": [ + "## 설정\n" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "OiMPZStlibBv" + }, + "outputs": [], + "source": [ + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "1CLWJl0QliB0" + }, + "source": [ + "## 그래디언트 테이프(Gradient Tape)\n", + "\n", + "텐서플로우는 자동미분(주어진 입력 변수에 따른 기울기 계산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape` 내에서 실행된 모든 연산자들을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 기록된 계산의 그래디언트를 계산하기 위해 각각의 기록된 연산자들과 관련된 테이프와 그래디언트들을 사용합니다. \n", + "\n", + "예를 들면:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "bAFeIE8EuVIq" + }, + "outputs": [], + "source": [ + "x = tf.ones((2, 2))\n", + " \n", + "with tf.GradientTape() as t:\n", + " t.watch(x)\n", + " y = tf.reduce_sum(x)\n", + " z = tf.multiply(y, y)\n", + "\n", + "# 입력 tensor x에 관한 z의 도함수\n", + "dz_dx = t.gradient(z, x)\n", + "for i in [0, 1]:\n", + " for j in [0, 1]:\n", + " assert dz_dx[i][j].numpy() == 8.0" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "N4VlqKFzzGaC" + }, + "source": [ + "또한 `tf.GradientTape` 컨텍스트에 기록되는 동안 계산된 중간 출력값의 그래디언트를 계산할 수 있습니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "7XaPRAwUyYms" + }, + "outputs": [], + "source": [ + "x = tf.ones((2, 2))\n", + " \n", + "with tf.GradientTape() as t:\n", + " t.watch(x)\n", + " y = tf.reduce_sum(x)\n", + " z = tf.multiply(y, y)\n", + "\n", + "# 중간값 y에 관한 z의 도함수 계산을 위한 테이프 사용\n", + "# intermediate value y.\n", + "dz_dy = t.gradient(z, y)\n", + "assert dz_dy.numpy() == 8.0" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "ISkXuY7YzIcS" + }, + "source": [ + "초기값으로 GradientTape.gradient() 메소드가 호출되면 GradientTape에 포함된 리소스가 해체되게 설정돼있습니다. 동일한 계산을 통해서 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. `persistent`는 `gradient()` 메소드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "zZaCm3-9zVCi" + }, + "outputs": [], + "source": [ + "x = tf.constant(3.0)\n", + "with tf.GradientTape(persistent=True) as t:\n", + " t.watch(x)\n", + " y = x * x\n", + " z = y * y\n", + "dz_dx = t.gradient(z, x) # 108.0 (4*x^3 at x = 3)\n", + "dy_dx = t.gradient(y, x) # 6.0\n", + "del t # 리소스가 해체됩니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "6kADybtQzYj4" + }, + "source": [ + "### 제어흐름(Control Flow) 기록\n", + "\n", + "테이프가 실행되는데로 연산자를 기록하기 때문에, 파이썬 제어흐름(예를 들어 `if` `while`, `for`문 같은)은 자연스럽게 처리됩니다. " + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "9FViq92UX7P8" + }, + "outputs": [], + "source": [ + "def f(x, y):\n", + " output = 1.0\n", + " for i in range(y):\n", + " if i > 1 and i < 5:\n", + " output = tf.multiply(output, x)\n", + " return output\n", + "\n", + "def grad(x, y):\n", + " with tf.GradientTape() as t:\n", + " t.watch(x)\n", + " out = f(x, y)\n", + " return t.gradient(out, x) \n", + "\n", + "x = tf.convert_to_tensor(2.0)\n", + "\n", + "assert grad(x, 6).numpy() == 12.0\n", + "assert grad(x, 5).numpy() == 12.0\n", + "assert grad(x, 4).numpy() == 4.0\n" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "DK05KXrAAld3" + }, + "source": [ + "### 고차원(Higher-order) 그래디언트\n", + "\n", + "`GradientTape` 컨텍스트 매니저안에 있는 연산자들은 자동미분을 이해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되어지면 그래디언트 계산 또한 기록되어집니다. 그 결과 똑같은 API가 고차원 그래디언트에서 잘 작동합니다. 예를 들면:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "cPQgthZ7ugRJ" + }, + "outputs": [], + "source": [ + "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로우 변수 생성\n", + "\n", + "with tf.GradientTape() as t:\n", + " with tf.GradientTape() as t2:\n", + " y = x * x * x\n", + " # t 컨텍스트 매니저 안의 그래디언트 계산\n", + " # 이것은 또한 그래디언트 계산이 미분가능하다는것을 의미합니다. \n", + " dy_dx = t2.gradient(y, x)\n", + "d2y_dx2 = t.gradient(dy_dx, x)\n", + "\n", + "assert dy_dx.numpy() == 3.0\n", + "assert d2y_dx2.numpy() == 6.0" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "4U1KKzUpNl58" + }, + "source": [ + "## 다음 단계\n", + "\n", + "이번 튜토리얼에서는 텐서플로우에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보 할 수 있습니다." + ] + } + ], + "metadata": { + "colab": { + "collapsed_sections": [], + "name": "automatic_differentiation.ipynb", + "private_outputs": true, + "provenance": [], + "toc_visible": true, + "version": "0.3.2" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} From fd3887924b9fb3b46952cfca86ab3fd5016ff292 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Sat, 23 Mar 2019 17:44:47 +0900 Subject: [PATCH 02/19] Start translation of other files 1. automatic_differentiation 2. custom_layers 3. custom_training 4. custom_training_walkthrough 5. eager_basisc 6. index.md --- .../eager/automatic_differentiation.ipynb | 2 +- site/ko/tutorials/eager/custom_layers.ipynb | 371 ++++++ site/ko/tutorials/eager/custom_training.ipynb | 466 +++++++ .../eager/custom_training_walkthrough.ipynb | 1106 +++++++++++++++++ site/ko/tutorials/eager/eager_basics.ipynb | 467 +++++++ site/ko/tutorials/eager/index.md | 13 + 6 files changed, 2424 insertions(+), 1 deletion(-) create mode 100644 site/ko/tutorials/eager/custom_layers.ipynb create mode 100644 site/ko/tutorials/eager/custom_training.ipynb create mode 100644 site/ko/tutorials/eager/custom_training_walkthrough.ipynb create mode 100644 site/ko/tutorials/eager/eager_basics.ipynb create mode 100644 site/ko/tutorials/eager/index.md diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index ad6746c6de8..e835160ebd7 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -251,7 +251,7 @@ "source": [ "### 고차원(Higher-order) 그래디언트\n", "\n", - "`GradientTape` 컨텍스트 매니저안에 있는 연산자들은 자동미분을 이해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되어지면 그래디언트 계산 또한 기록되어집니다. 그 결과 똑같은 API가 고차원 그래디언트에서 잘 작동합니다. 예를 들면:" + "`GradientTape` 컨텍스트 매니저안에 있는 연산자들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되면 그래디언트 계산 또한 기록되어집니다. 그 결과 똑같은 API가 고차원 그래디언트에서도 잘 작동합니다. 예를 들면:" ] }, { diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb new file mode 100644 index 00000000000..cb1a6022b24 --- /dev/null +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -0,0 +1,371 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "tDnwEv8FtJm7" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "form", + "colab": {}, + "colab_type": "code", + "id": "JlknJBWQtKkI" + }, + "outputs": [], + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "60RdWsg1tETW" + }, + "source": [ + "# Custom layers" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "BcJg7Enms86w" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " View on TensorFlow.org\n", + " \n", + " Run in Google Colab\n", + " \n", + " View source on GitHub\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "UEu3q4jmpKVT" + }, + "source": [ + "We recommend using `tf.keras` as a high-level API for building neural networks. That said, most TensorFlow APIs are usable with eager execution.\n" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "pwX7Fii1rwsJ" + }, + "outputs": [], + "source": [ + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "zSFfVVjkrrsI" + }, + "source": [ + "## Layers: common sets of useful operations\n", + "\n", + "Most of the time when writing code for machine learning models you want to operate at a higher level of abstraction than individual operations and manipulation of individual variables.\n", + "\n", + "Many machine learning models are expressible as the composition and stacking of relatively simple layers, and TensorFlow provides both a set of many common layers as a well as easy ways for you to write your own application-specific layers either from scratch or as the composition of existing layers.\n", + "\n", + "TensorFlow includes the full [Keras](https://keras.io) API in the tf.keras package, and the Keras layers are very useful when building your own models.\n" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "8PyXlPl-4TzQ" + }, + "outputs": [], + "source": [ + "# In the tf.keras.layers package, layers are objects. To construct a layer,\n", + "# simply construct the object. Most layers take as a first argument the number\n", + "# of output dimensions / channels.\n", + "layer = tf.keras.layers.Dense(100)\n", + "# The number of input dimensions is often unnecessary, as it can be inferred\n", + "# the first time the layer is used, but it can be provided if you want to \n", + "# specify it manually, which is useful in some complex models.\n", + "layer = tf.keras.layers.Dense(10, input_shape=(None, 5))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Fn69xxPO5Psr" + }, + "source": [ + "The full list of pre-existing layers can be seen in [the documentation](https://www.tensorflow.org/api_docs/python/tf/keras/layers). It includes Dense (a fully-connected layer),\n", + "Conv2D, LSTM, BatchNormalization, Dropout, and many others." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "E3XKNknP5Mhb" + }, + "outputs": [], + "source": [ + "# To use a layer, simply call it.\n", + "layer(tf.zeros([10, 5]))" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "Wt_Nsv-L5t2s" + }, + "outputs": [], + "source": [ + "# Layers have many useful methods. For example, you can inspect all variables\n", + "# in a layer using `layer.variables` and trainable variables using \n", + "# `layer.trainable_variables`. In this case a fully-connected layer\n", + "# will have variables for weights and biases.\n", + "layer.variables" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "6ilvKjz8_4MQ" + }, + "outputs": [], + "source": [ + "# The variables are also accessible through nice accessors\n", + "layer.kernel, layer.bias" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "O0kDbE54-5VS" + }, + "source": [ + "## Implementing custom layers\n", + "The best way to implement your own layer is extending the tf.keras.Layer class and implementing:\n", + " * `__init__` , where you can do all input-independent initialization\n", + " * `build`, where you know the shapes of the input tensors and can do the rest of the initialization\n", + " * `call`, where you do the forward computation\n", + "\n", + "Note that you don't have to wait until `build` is called to create your variables, you can also create them in `__init__`. However, the advantage of creating them in `build` is that it enables late variable creation based on the shape of the inputs the layer will operate on. On the other hand, creating variables in `__init__` would mean that shapes required to create the variables will need to be explicitly specified." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "5Byl3n1k5kIy" + }, + "outputs": [], + "source": [ + "class MyDenseLayer(tf.keras.layers.Layer):\n", + " def __init__(self, num_outputs):\n", + " super(MyDenseLayer, self).__init__()\n", + " self.num_outputs = num_outputs\n", + " \n", + " def build(self, input_shape):\n", + " self.kernel = self.add_variable(\"kernel\", \n", + " shape=[int(input_shape[-1]), \n", + " self.num_outputs])\n", + " \n", + " def call(self, input):\n", + " return tf.matmul(input, self.kernel)\n", + " \n", + "layer = MyDenseLayer(10)\n", + "print(layer(tf.zeros([10, 5])))\n", + "print(layer.trainable_variables)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "tk8E2vY0-z4Z" + }, + "source": [ + "Note that you don't have to wait until `build` is called to create your variables, you can also create them in `__init__`.\n", + "\n", + "Overall code is easier to read and maintain if it uses standard layers whenever possible, as other readers will be familiar with the behavior of standard layers. If you want to use a layer which is not present in tf.keras.layers or tf.contrib.layers, consider filing a [github issue](http://github.com/tensorflow/tensorflow/issues/new) or, even better, sending us a pull request!" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Qhg4KlbKrs3G" + }, + "source": [ + "## Models: composing layers\n", + "\n", + "Many interesting layer-like things in machine learning models are implemented by composing existing layers. For example, each residual block in a resnet is a composition of convolutions, batch normalizations, and a shortcut.\n", + "\n", + "The main class used when creating a layer-like thing which contains other layers is tf.keras.Model. Implementing one is done by inheriting from tf.keras.Model." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "N30DTXiRASlb" + }, + "outputs": [], + "source": [ + "class ResnetIdentityBlock(tf.keras.Model):\n", + " def __init__(self, kernel_size, filters):\n", + " super(ResnetIdentityBlock, self).__init__(name='')\n", + " filters1, filters2, filters3 = filters\n", + "\n", + " self.conv2a = tf.keras.layers.Conv2D(filters1, (1, 1))\n", + " self.bn2a = tf.keras.layers.BatchNormalization()\n", + "\n", + " self.conv2b = tf.keras.layers.Conv2D(filters2, kernel_size, padding='same')\n", + " self.bn2b = tf.keras.layers.BatchNormalization()\n", + "\n", + " self.conv2c = tf.keras.layers.Conv2D(filters3, (1, 1))\n", + " self.bn2c = tf.keras.layers.BatchNormalization()\n", + "\n", + " def call(self, input_tensor, training=False):\n", + " x = self.conv2a(input_tensor)\n", + " x = self.bn2a(x, training=training)\n", + " x = tf.nn.relu(x)\n", + "\n", + " x = self.conv2b(x)\n", + " x = self.bn2b(x, training=training)\n", + " x = tf.nn.relu(x)\n", + "\n", + " x = self.conv2c(x)\n", + " x = self.bn2c(x, training=training)\n", + "\n", + " x += input_tensor\n", + " return tf.nn.relu(x)\n", + "\n", + " \n", + "block = ResnetIdentityBlock(1, [1, 2, 3])\n", + "print(block(tf.zeros([1, 2, 3, 3])))\n", + "print([x.name for x in block.trainable_variables])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "wYfucVw65PMj" + }, + "source": [ + "Much of the time, however, models which compose many layers simply call one layer after the other. This can be done in very little code using tf.keras.Sequential" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "L9frk7Ur4uvJ" + }, + "outputs": [], + "source": [ + " my_seq = tf.keras.Sequential([tf.keras.layers.Conv2D(1, (1, 1)),\n", + " tf.keras.layers.BatchNormalization(),\n", + " tf.keras.layers.Conv2D(2, 1, \n", + " padding='same'),\n", + " tf.keras.layers.BatchNormalization(),\n", + " tf.keras.layers.Conv2D(3, (1, 1)),\n", + " tf.keras.layers.BatchNormalization()])\n", + "my_seq(tf.zeros([1, 2, 3, 3]))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "c5YwYcnuK-wc" + }, + "source": [ + "# Next steps\n", + "\n", + "Now you can go back to the previous notebook and adapt the linear regression example to use layers and models to be better structured." + ] + } + ], + "metadata": { + "colab": { + "collapsed_sections": [], + "name": "custom_layers.ipynb", + "private_outputs": true, + "provenance": [], + "toc_visible": true, + "version": "0.3.2" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb new file mode 100644 index 00000000000..56c0ab00fa9 --- /dev/null +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -0,0 +1,466 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "5rmpybwysXGV" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "form", + "colab": {}, + "colab_type": "code", + "id": "m8y3rGtQsYP2" + }, + "outputs": [], + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "hrXv0rU9sIma" + }, + "source": [ + "# 사용자 지정 학습: 기초" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "7S0BwJ_8sLu7" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " View on TensorFlow.org\n", + " \n", + " Run in Google Colab\n", + " \n", + " View source on GitHub\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "k2o3TTG4TFpt" + }, + "source": [ + "이전 튜토리얼에서 우리는 머신러닝을 위한 기초 빌딩 블록인 자동미분(automatic differentiation)을 위한 텐서플로우 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로우를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", + "\n", + "텐서플로우는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망 API인 (`tf.keras`)를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "3LXMVuV0VhDr" + }, + "source": [ + "## 설정" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "PJ64L90aVir3" + }, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "C:\\Users\\82108\\Anaconda3\\lib\\site-packages\\h5py\\__init__.py:36: FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is deprecated. In future, it will be treated as `np.float64 == np.dtype(float).type`.\n", + " from ._conv import register_converters as _register_converters\n" + ] + } + ], + "source": [ + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "eMAWbDJFVmMk" + }, + "source": [ + "## 변수\n", + "\n", + "텐서플로우 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될 필요가 있습니다(stateful). 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 계산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "VkJwtLS_Jbn8" + }, + "outputs": [], + "source": [ + "# 파이썬 state 사용\n", + "x = tf.zeros([10, 10])\n", + "x += 2 # 이것은 x = x + 2 같으며, 초기값 x를 변경하지 않습니다.\n", + "print(x)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "wfneTXy7JcUz" + }, + "source": [ + "그러나 텐서플로우는 상태가 변경 가능한 연산자들이 내장되어 있으며, 이 연산자들은 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로우 변수를 사용하는것이 편하고 효율적입니다. \n", + "\n", + "텐서플로우 변수는 값을 저장하고 텐서플로우 계산에 사용될 때 묵시적으로 저장된 값을 읽어오는 객체입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로우 변수에 저장되있는 값을 조작하는 연산자들입니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "itxmrMil6DQi" + }, + "outputs": [], + "source": [ + "v = tf.Variable(1.0)\n", + "assert v.numpy() == 1.0\n", + "\n", + "# 값 재배열\n", + "v.assign(3.0)\n", + "assert v.numpy() == 3.0\n", + "\n", + "# 텐서플로우 연산자 내에서 `v` 사용 \n", + "v.assign(tf.square(v))\n", + "assert v.numpy() == 9.0" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "-paSaeq1JzwC" + }, + "source": [ + "변수들을 사용한 계산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기값으로부터 드물게 업데이트됩니다. 이는 계산과 메모리에 있어 더욱 효율적입니다. \n", + "\n", + "또한 변수를 사용하는 것은 코드를 읽는 과정에서 변경 가능한 상태(state mutable)의 조각을 빠르게 인식하는 방법입니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "BMiFcDzE7Qu3" + }, + "source": [ + "## 예: 선형모델 피팅\n", + "\n", + "몇가지 개념들을 설명해보겠습니다. 우리는 지금까지 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였습니다. 이것은 전형적으로 다음의 과정을 포함합니다.\n", + "\n", + "1. 모델 정의\n", + "2. 손실함수 정의\n", + "3. 훈련 데이터 가져오기\n", + "4. 훈련 데이터를 통한 실행, 데이터에 최적화하기 위한 \"옵티마이저(optimizer)\" 사용한 변수 조정\n", + "\n", + "이번 튜토리얼에서는 선형모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, `W` and `b` 두 변수를 가지고 있는 선형모델입니다. 더욱이 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 데이터를 합성할 것입니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "gFzH64Jn9PIm" + }, + "source": [ + "### 모델 정의\n", + "\n", + "변수들과 계산을 요약하기 위한 간단한 클래스를 정의해봅시다." + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "_WRu7Pze7wk8" + }, + "outputs": [], + "source": [ + "class Model(object):\n", + " def __init__(self):\n", + " # 변수 초기화 (5.0, 0.0)\n", + " # 실제로는 임의의 값으로 초기화 되어야합니다.\n", + " self.W = tf.Variable(5.0)\n", + " self.b = tf.Variable(0.0)\n", + " \n", + " def __call__(self, x):\n", + " return self.W * x + self.b\n", + " \n", + "model = Model()\n", + "\n", + "assert model(3.0).numpy() == 15.0" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "xa6j_yXa-j79" + }, + "source": [ + "### 손실 함수 정의\n", + "\n", + "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지 측정합니다. L2 규제항(regularization)을 적용한 손실 함수를 사용하겠습니다." + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "Y0ysUFGY924U" + }, + "outputs": [], + "source": [ + "def loss(predicted_y, desired_y):\n", + " return tf.reduce_mean(tf.square(predicted_y - desired_y))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "qutT_fkl_CBc" + }, + "source": [ + "### 훈련 데이터 얻기\n", + "\n", + "약간의 잡음과 훈련 데이터를 합칩니다." + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "gxPTb-kt_N5m" + }, + "outputs": [], + "source": [ + "TRUE_W = 3.0\n", + "TRUE_b = 2.0\n", + "NUM_EXAMPLES = 1000\n", + "\n", + "inputs = tf.random_normal(shape=[NUM_EXAMPLES])\n", + "noise = tf.random_normal(shape=[NUM_EXAMPLES])\n", + "outputs = inputs * TRUE_W + TRUE_b + noise" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "-50nq-wPBsAW" + }, + "source": [ + "모델을 훈련시키기 전에, 모델의 현재 상태를 시각화합시다. 모델의 예측을 빨간색으로, 훈련데이터를 파란색으로 구성합니다." + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "_eb83LtrB4nt" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Current loss: \n", + "9.401943\n" + ] + } + ], + "source": [ + "import matplotlib.pyplot as plt\n", + "\n", + "plt.scatter(inputs, outputs, c='b')\n", + "plt.scatter(inputs, model(inputs), c='r')\n", + "plt.show()\n", + "\n", + "print('Current loss: '),\n", + "print(loss(model(inputs), outputs).numpy())" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "sSDP-yeq_4jE" + }, + "source": [ + "### 훈련 루프 정의\n", + "\n", + "현재 우리는 네트워크와 훈련 데이터를 가지고 있습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시킵니다. 그리고 [gradient descent](https://en.wikipedia.org/wiki/Gradient_descent)를 사용하여 손실을 감소시킵니다. 경사하강에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "MBIACgdnA55X" + }, + "outputs": [], + "source": [ + "def train(model, inputs, outputs, learning_rate):\n", + " with tf.GradientTape() as t:\n", + " current_loss = loss(model(inputs), outputs)\n", + " dW, db = t.gradient(current_loss, [model.W, model.b])\n", + " model.W.assign_sub(learning_rate * dW)\n", + " model.b.assign_sub(learning_rate * db)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "RwWPaJryD2aN" + }, + "source": [ + "마지막으로, 훈련 데이터를 반복적으로 실행하고, `W` 와 `b`의 변화과정을 확인합니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "XdfkR223D9dW" + }, + "outputs": [], + "source": [ + "model = Model()\n", + "\n", + "# Collect the history of W-values and b-values to plot later\n", + "Ws, bs = [], []\n", + "epochs = range(10)\n", + "for epoch in epochs:\n", + " Ws.append(model.W.numpy())\n", + " bs.append(model.b.numpy())\n", + " current_loss = loss(model(inputs), outputs)\n", + "\n", + " train(model, inputs, outputs, learning_rate=0.1)\n", + " print('Epoch %2d: W=%1.2f b=%1.2f, loss=%2.5f' %\n", + " (epoch, Ws[-1], bs[-1], current_loss))\n", + "\n", + "# Let's plot it all\n", + "plt.plot(epochs, Ws, 'r',\n", + " epochs, bs, 'b')\n", + "plt.plot([TRUE_W] * len(epochs), 'r--',\n", + " [TRUE_b] * len(epochs), 'b--')\n", + "plt.legend(['W', 'b', 'true W', 'true_b'])\n", + "plt.show()\n", + " " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vPnIVuaSJwWz" + }, + "source": [ + "## 다음 단계\n", + "\n", + "이번 튜토리얼에서는 `Variable`를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로우를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", + "\n", + "이론적으로, 이것은 머신러닝 연구에 텐서플로우를 사용하는데 필요한 대부분입니다. 실제로, 신경망에 있어 `tf.keras`와 고수준 API들은 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + ] + } + ], + "metadata": { + "colab": { + "collapsed_sections": [], + "name": "Custom training: basics", + "private_outputs": true, + "provenance": [], + "toc_visible": true, + "version": "0.3.2" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb new file mode 100644 index 00000000000..055fab9b058 --- /dev/null +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -0,0 +1,1106 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "rwxGnsA92emp" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "form", + "colab": {}, + "colab_type": "code", + "id": "CPII1rGR2rF9" + }, + "outputs": [], + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "JtEZ1pCPn--z" + }, + "source": [ + "# 사용자 지정 학습: walkthrough" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "GV1F7tVTN3Dn" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " View on TensorFlow.org\n", + " \n", + " Run in Google Colab\n", + " \n", + " View source on GitHub\n", + "
" + ] + }, + { + "cell_type": "raw", + "metadata": { + "colab_type": "text", + "id": "LDrzLFXE8T1l" + }, + "source": [ + "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시실행[eager execution](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", + "1. 모델 구축\n", + "2. 모델 훈련\n", + "3. 예측을 위한 모델 사용\n", + "\n", + "## 텐서플로우 프로그래밍\n", + "\n", + "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로우의 개념들을 사용합니다.\n", + "\n", + "* 즉시실행[eager execution](https://www.tensorflow.org/guide/eager) 개발환경,\n", + "* [Datasets API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", + "* [Keras API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 레이어(layer) 구축 .\n", + "\n", + "이번 튜토리얼은 다른 텐서플로우 프로그램과 유사하게 구성되어있습니다.\n", + "\n", + "1. 데이터 불러오기 및 분석.\n", + "2. 모델 타입 선정.\n", + "3. 모델 학습.\n", + "4. 모델 효과 검증.\n", + "5. 예측을 위한 학습된 모델 사용." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "yNr7H-AIoLOR" + }, + "source": [ + "## 프로그램 설정" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "1J3AuPBT9gyR" + }, + "source": [ + "### 임포트 및 즉시실행 구성\n", + "\n", + "텐서플로우를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로우가 나중에 실행되는 [computational graph](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산자를 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "\n", + "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [eager execution guide](https://www.tensorflow.org/guide/eager)을 참조하세요." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "g4Wzg69bnwK2" + }, + "outputs": [], + "source": [ + "from __future__ import absolute_import, division, print_function\n", + "\n", + "import os\n", + "import matplotlib.pyplot as plt\n", + "\n", + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()\n", + "\n", + "print(\"TensorFlow version: {}\".format(tf.__version__))\n", + "print(\"Eager execution: {}\".format(tf.executing_eagerly()))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Zx7wc0LuuxaJ" + }, + "source": [ + "## 붓꽃 분류 문제\n", + "\n", + "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 우리의 목적은 좀 더 겸손하게 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는것입니다.\n", + "\n", + "이 붓꽃은 약 300종 입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", + "\n", + "* Iris setosa\n", + "* Iris virginica\n", + "* Iris versicolor\n", + "\n", + "\n", + " \n", + " \n", + "
\n", + " \"Petal\n", + "
\n", + " Figure 1. Iris setosa (by Radomil, CC BY-SA 3.0), Iris versicolor, (by Dlanglois, CC BY-SA 3.0), and Iris virginica (by Frank Mayfield, CC BY-SA 2.0).
 \n", + "
\n", + "\n", + "다행이도 다른사람들이 먼저 꽃받침과 꽃임이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "3Px6KAg0Jowz" + }, + "source": [ + "## 훈련 데이터 불러오기 및 분석\n", + "\n", + "데이터를 불러오고 파이썬 프로그램이 사용할 수 있는 구조로 전환합니다.\n", + "\n", + "### 데이터셋 다운로드\n", + "\n", + "[tf.keras.utils.get_file](https://www.tensorflow.org/api_docs/python/tf/keras/utils/get_file)함수를 사용하여 데이터셋을 다운로드합니다. 이 함수는 다운로드된 파일의 경로를 반환합니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "J6c7uEU9rjRM" + }, + "outputs": [], + "source": [ + "train_dataset_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\"\n", + "\n", + "train_dataset_fp = tf.keras.utils.get_file(fname=os.path.basename(train_dataset_url),\n", + " origin=train_dataset_url)\n", + "\n", + "print(\"Local copy of the dataset file: {}\".format(train_dataset_fp))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "qnX1-aLors4S" + }, + "source": [ + "### 데이터 관찰\n", + "\n", + "이 데이터셋(`iris_training.csv`)은 ','로 구분된 CSV 파일입니다. `head -n5` 명령을 사용하여 처음 5개 항목을 확인합니다. " + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "FQvb_JYdrpPm" + }, + "outputs": [], + "source": [ + "!head -n5 {train_dataset_fp}" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "kQhzD6P-uBoq" + }, + "source": [ + "From this view of the dataset, notice the following:\n", + "\n", + "1. 첫번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", + " * 총 120개의 예가 있다. 각 예들은 4가지의 특성(feature)을 가지고 3가지 가능한 레이블(label)을 가지고 있습니다.\n", + "2. 후속행은 데이터 레코드입니다. one *[example](https://developers.google.com/machine-learning/glossary/#example)* per line, where:\n", + " * The first four fields are *[features](https://developers.google.com/machine-learning/glossary/#feature)*: these are characteristics of an example. Here, the fields hold float numbers representing flower measurements.\n", + " * The last column is the *[label](https://developers.google.com/machine-learning/glossary/#label)*: this is the value we want to predict. For this dataset, it's an integer value of 0, 1, or 2 that corresponds to a flower name.\n", + "\n", + "Let's write that out in code:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "9Edhevw7exl6" + }, + "outputs": [], + "source": [ + "# column order in CSV file\n", + "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", + "\n", + "feature_names = column_names[:-1]\n", + "label_name = column_names[-1]\n", + "\n", + "print(\"Features: {}\".format(feature_names))\n", + "print(\"Label: {}\".format(label_name))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "CCtwLoJhhDNc" + }, + "source": [ + "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적이로 숫자형값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", + "\n", + "* `0`: Iris setosa\n", + "* `1`: Iris versicolor\n", + "* `2`: Iris virginica\n", + "\n", + "특성과 레이블에 관한 더 많은 정보를 위해서 다음을 참조하세요.[ML Terminology section of the Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "sVNlJlUOhkoX" + }, + "outputs": [], + "source": [ + "class_names = ['Iris setosa', 'Iris versicolor', 'Iris virginica']" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "dqPkQExM2Pwt" + }, + "source": [ + "### `tf.data.Dataset` 생성\n", + "\n", + "TensorFlow's [Dataset API](https://www.tensorflow.org/guide/datasets) handles many common cases for loading data into a model. This is a high-level API for reading data and transforming it into a form used for training. See the [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) for more information.\n", + "\n", + "\n", + "Since the dataset is a CSV-formatted text file, use the [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) function to parse the data into a suitable format. Since this function generates data for training models, the default behavior is to shuffle the data (`shuffle=True, shuffle_buffer_size=10000`), and repeat the dataset forever (`num_epochs=None`). We also set the [batch_size](https://developers.google.com/machine-learning/glossary/#batch_size) parameter." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "WsxHnz1ebJ2S" + }, + "outputs": [], + "source": [ + "batch_size = 32\n", + "\n", + "train_dataset = tf.contrib.data.make_csv_dataset(\n", + " train_dataset_fp,\n", + " batch_size, \n", + " column_names=column_names,\n", + " label_name=label_name,\n", + " num_epochs=1)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "gB_RSn62c-3G" + }, + "source": [ + "The `make_csv_dataset` function returns a `tf.data.Dataset` of `(features, label)` pairs, where `features` is a dictionary: `{'feature_name': value}`\n", + "\n", + "With eager execution enabled, these `Dataset` objects are iterable. Let's look at a batch of features:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "iDuG94H-C122" + }, + "outputs": [], + "source": [ + "features, labels = next(iter(train_dataset))\n", + "\n", + "features" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "E63mArnQaAGz" + }, + "source": [ + "Notice that like-features are grouped together, or *batched*. Each example row's fields are appended to the corresponding feature array. Change the `batch_size` to set the number of examples stored in these feature arrays.\n", + "\n", + "You can start to see some clusters by plotting a few features from the batch:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "me5Wn-9FcyyO" + }, + "outputs": [], + "source": [ + "plt.scatter(features['petal_length'].numpy(),\n", + " features['sepal_length'].numpy(),\n", + " c=labels.numpy(),\n", + " cmap='viridis')\n", + "\n", + "plt.xlabel(\"Petal length\")\n", + "plt.ylabel(\"Sepal length\");" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "YlxpSyHlhT6M" + }, + "source": [ + "To simplify the model building step, create a function to repackage the features dictionary into a single array with shape: `(batch_size, num_features)`.\n", + "\n", + "This function uses the [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) method which takes values from a list of tensors and creates a combined tensor at the specified dimension." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "jm932WINcaGU" + }, + "outputs": [], + "source": [ + "def pack_features_vector(features, labels):\n", + " \"\"\"Pack the features into a single array.\"\"\"\n", + " features = tf.stack(list(features.values()), axis=1)\n", + " return features, labels" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "V1Vuph_eDl8x" + }, + "source": [ + "Then use the [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) method to pack the `features` of each `(features,label)` pair into the training dataset:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "ZbDkzGZIkpXf" + }, + "outputs": [], + "source": [ + "train_dataset = train_dataset.map(pack_features_vector)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "NLy0Q1xCldVO" + }, + "source": [ + "The features element of the `Dataset` are now arrays with shape `(batch_size, num_features)`. Let's look at the first few examples:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "kex9ibEek6Tr" + }, + "outputs": [], + "source": [ + "features, labels = next(iter(train_dataset))\n", + "\n", + "print(features[:5])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "LsaVrtNM3Tx5" + }, + "source": [ + "## Select the type of model\n", + "\n", + "### Why model?\n", + "\n", + "A *[model](https://developers.google.com/machine-learning/crash-course/glossary#model)* is a relationship between features and the label. For the Iris classification problem, the model defines the relationship between the sepal and petal measurements and the predicted Iris species. Some simple models can be described with a few lines of algebra, but complex machine learning models have a large number of parameters that are difficult to summarize.\n", + "\n", + "Could you determine the relationship between the four features and the Iris species *without* using machine learning? That is, could you use traditional programming techniques (for example, a lot of conditional statements) to create a model? Perhaps—if you analyzed the dataset long enough to determine the relationships between petal and sepal measurements to a particular species. And this becomes difficult—maybe impossible—on more complicated datasets. A good machine learning approach *determines the model for you*. If you feed enough representative examples into the right machine learning model type, the program will figure out the relationships for you.\n", + "\n", + "### Select the model\n", + "\n", + "We need to select the kind of model to train. There are many types of models and picking a good one takes experience. This tutorial uses a neural network to solve the Iris classification problem. *[Neural networks](https://developers.google.com/machine-learning/glossary/#neural_network)* can find complex relationships between features and the label. It is a highly-structured graph, organized into one or more *[hidden layers](https://developers.google.com/machine-learning/glossary/#hidden_layer)*. Each hidden layer consists of one or more *[neurons](https://developers.google.com/machine-learning/glossary/#neuron)*. There are several categories of neural networks and this program uses a dense, or *[fully-connected neural network](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*: the neurons in one layer receive input connections from *every* neuron in the previous layer. For example, Figure 2 illustrates a dense neural network consisting of an input layer, two hidden layers, and an output layer:\n", + "\n", + "\n", + " \n", + " \n", + "
\n", + " \n", + "
\n", + " Figure 2. A neural network with features, hidden layers, and predictions.
 \n", + "
\n", + "\n", + "When the model from Figure 2 is trained and fed an unlabeled example, it yields three predictions: the likelihood that this flower is the given Iris species. This prediction is called *[inference](https://developers.google.com/machine-learning/crash-course/glossary#inference)*. For this example, the sum of the output predictions is 1.0. In Figure 2, this prediction breaks down as: `0.02` for *Iris setosa*, `0.95` for *Iris versicolor*, and `0.03` for *Iris virginica*. This means that the model predicts—with 95% probability—that an unlabeled example flower is an *Iris versicolor*." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "W23DIMVPQEBt" + }, + "source": [ + "### Create a model using Keras\n", + "\n", + "The TensorFlow [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API is the preferred way to create models and layers. This makes it easy to build models and experiment while Keras handles the complexity of connecting everything together.\n", + "\n", + "The [tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential) model is a linear stack of layers. Its constructor takes a list of layer instances, in this case, two [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense) layers with 10 nodes each, and an output layer with 3 nodes representing our label predictions. The first layer's `input_shape` parameter corresponds to the number of features from the dataset, and is required." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "2fZ6oL2ig3ZK" + }, + "outputs": [], + "source": [ + "model = tf.keras.Sequential([\n", + " tf.keras.layers.Dense(10, activation=tf.nn.relu, input_shape=(4,)), # input shape required\n", + " tf.keras.layers.Dense(10, activation=tf.nn.relu),\n", + " tf.keras.layers.Dense(3)\n", + "])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "FHcbEzMpxbHL" + }, + "source": [ + "The *[activation function](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)* determines the output shape of each node in the layer. These non-linearities are important—without them the model would be equivalent to a single layer. There are many [available activations](https://www.tensorflow.org/api_docs/python/tf/keras/activations), but [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU) is common for hidden layers.\n", + "\n", + "The ideal number of hidden layers and neurons depends on the problem and the dataset. Like many aspects of machine learning, picking the best shape of the neural network requires a mixture of knowledge and experimentation. As a rule of thumb, increasing the number of hidden layers and neurons typically creates a more powerful model, which requires more data to train effectively." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "2wFKnhWCpDSS" + }, + "source": [ + "### Using the model\n", + "\n", + "Let's have a quick look at what this model does to a batch of features:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "xe6SQ5NrpB-I" + }, + "outputs": [], + "source": [ + "predictions = model(features)\n", + "predictions[:5]" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "wxyXOhwVr5S3" + }, + "source": [ + "Here, each example returns a [logit](https://developers.google.com/machine-learning/crash-course/glossary#logits) for each class. \n", + "\n", + "To convert these logits to a probability for each class, use the [softmax](https://developers.google.com/machine-learning/crash-course/glossary#softmax) function:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "_tRwHZmTNTX2" + }, + "outputs": [], + "source": [ + "tf.nn.softmax(predictions[:5])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "uRZmchElo481" + }, + "source": [ + "Taking the `tf.argmax` across classes gives us the predicted class index. But, the model hasn't been trained yet, so these aren't good predictions." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "-Jzm_GoErz8B" + }, + "outputs": [], + "source": [ + "print(\"Prediction: {}\".format(tf.argmax(predictions, axis=1)))\n", + "print(\" Labels: {}\".format(labels))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Vzq2E5J2QMtw" + }, + "source": [ + "## Train the model\n", + "\n", + "*[Training](https://developers.google.com/machine-learning/crash-course/glossary#training)* is the stage of machine learning when the model is gradually optimized, or the model *learns* the dataset. The goal is to learn enough about the structure of the training dataset to make predictions about unseen data. If you learn *too much* about the training dataset, then the predictions only work for the data it has seen and will not be generalizable. This problem is called *[overfitting](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)*—it's like memorizing the answers instead of understanding how to solve a problem.\n", + "\n", + "The Iris classification problem is an example of *[supervised machine learning](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*: the model is trained from examples that contain labels. In *[unsupervised machine learning](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*, the examples don't contain labels. Instead, the model typically finds patterns among the features." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "RaKp8aEjKX6B" + }, + "source": [ + "### Define the loss and gradient function\n", + "\n", + "Both training and evaluation stages need to calculate the model's *[loss](https://developers.google.com/machine-learning/crash-course/glossary#loss)*. This measures how off a model's predictions are from the desired label, in other words, how bad the model is performing. We want to minimize, or optimize, this value.\n", + "\n", + "Our model will calculate its loss using the [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) function which takes the model's class probability predictions and the desired label, and returns the average loss across the examples." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "tMAT4DcMPwI-" + }, + "outputs": [], + "source": [ + "def loss(model, x, y):\n", + " y_ = model(x)\n", + " return tf.losses.sparse_softmax_cross_entropy(labels=y, logits=y_)\n", + "\n", + "\n", + "l = loss(model, features, labels)\n", + "print(\"Loss test: {}\".format(l))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "3IcPqA24QM6B" + }, + "source": [ + "Use the [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) context to calculate the *[gradients](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* used to optimize our model. For more examples of this, see the [eager execution guide](https://www.tensorflow.org/guide/eager)." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "x57HcKWhKkei" + }, + "outputs": [], + "source": [ + "def grad(model, inputs, targets):\n", + " with tf.GradientTape() as tape:\n", + " loss_value = loss(model, inputs, targets)\n", + " return loss_value, tape.gradient(loss_value, model.trainable_variables)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "lOxFimtlKruu" + }, + "source": [ + "### Create an optimizer\n", + "\n", + "An *[optimizer](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)* applies the computed gradients to the model's variables to minimize the `loss` function. You can think of the loss function as a curved surface (see Figure 3) and we want to find its lowest point by walking around. The gradients point in the direction of steepest ascent—so we'll travel the opposite way and move down the hill. By iteratively calculating the loss and gradient for each batch, we'll adjust the model during training. Gradually, the model will find the best combination of weights and bias to minimize loss. And the lower the loss, the better the model's predictions.\n", + "\n", + "\n", + " \n", + " \n", + "
\n", + " \"Optimization\n", + "
\n", + " Figure 3. Optimization algorithms visualized over time in 3D space.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", + "
\n", + "\n", + "TensorFlow has many [optimization algorithms](https://www.tensorflow.org/api_guides/python/train) available for training. This model uses the [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer) that implements the *[stochastic gradient descent](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* (SGD) algorithm. The `learning_rate` sets the step size to take for each iteration down the hill. This is a *hyperparameter* that you'll commonly adjust to achieve better results." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "XkUd6UiZa_dF" + }, + "source": [ + "Let's setup the optimizer and the `global_step` counter:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "8xxi2NNGKwG_" + }, + "outputs": [], + "source": [ + "optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)\n", + "\n", + "global_step = tf.Variable(0)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "pJVRZ0hP52ZB" + }, + "source": [ + "We'll use this to calculate a single optimization step:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "rxRNTFVe56RG" + }, + "outputs": [], + "source": [ + "loss_value, grads = grad(model, features, labels)\n", + "\n", + "print(\"Step: {}, Initial Loss: {}\".format(global_step.numpy(),\n", + " loss_value.numpy()))\n", + "\n", + "optimizer.apply_gradients(zip(grads, model.trainable_variables), global_step)\n", + "\n", + "print(\"Step: {}, Loss: {}\".format(global_step.numpy(),\n", + " loss(model, features, labels).numpy()))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "7Y2VSELvwAvW" + }, + "source": [ + "### Training loop\n", + "\n", + "With all the pieces in place, the model is ready for training! A training loop feeds the dataset examples into the model to help it make better predictions. The following code block sets up these training steps:\n", + "\n", + "1. Iterate each *epoch*. An epoch is one pass through the dataset.\n", + "2. Within an epoch, iterate over each example in the training `Dataset` grabbing its *features* (`x`) and *label* (`y`).\n", + "3. Using the example's features, make a prediction and compare it with the label. Measure the inaccuracy of the prediction and use that to calculate the model's loss and gradients.\n", + "4. Use an `optimizer` to update the model's variables.\n", + "5. Keep track of some stats for visualization.\n", + "6. Repeat for each epoch.\n", + "\n", + "The `num_epochs` variable is the number of times to loop over the dataset collection. Counter-intuitively, training a model longer does not guarantee a better model. `num_epochs` is a *[hyperparameter](https://developers.google.com/machine-learning/glossary/#hyperparameter)* that you can tune. Choosing the right number usually requires both experience and experimentation." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "AIgulGRUhpto" + }, + "outputs": [], + "source": [ + "## Note: Rerunning this cell uses the same model variables\n", + "\n", + "from tensorflow import contrib\n", + "tfe = contrib.eager\n", + "\n", + "# keep results for plotting\n", + "train_loss_results = []\n", + "train_accuracy_results = []\n", + "\n", + "num_epochs = 201\n", + "\n", + "for epoch in range(num_epochs):\n", + " epoch_loss_avg = tfe.metrics.Mean()\n", + " epoch_accuracy = tfe.metrics.Accuracy()\n", + "\n", + " # Training loop - using batches of 32\n", + " for x, y in train_dataset:\n", + " # Optimize the model\n", + " loss_value, grads = grad(model, x, y)\n", + " optimizer.apply_gradients(zip(grads, model.trainable_variables),\n", + " global_step)\n", + "\n", + " # Track progress\n", + " epoch_loss_avg(loss_value) # add current batch loss\n", + " # compare predicted label to actual label\n", + " epoch_accuracy(tf.argmax(model(x), axis=1, output_type=tf.int32), y)\n", + "\n", + " # end epoch\n", + " train_loss_results.append(epoch_loss_avg.result())\n", + " train_accuracy_results.append(epoch_accuracy.result())\n", + " \n", + " if epoch % 50 == 0:\n", + " print(\"Epoch {:03d}: Loss: {:.3f}, Accuracy: {:.3%}\".format(epoch,\n", + " epoch_loss_avg.result(),\n", + " epoch_accuracy.result()))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "2FQHVUnm_rjw" + }, + "source": [ + "### Visualize the loss function over time" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "j3wdbmtLVTyr" + }, + "source": [ + "While it's helpful to print out the model's training progress, it's often *more* helpful to see this progress. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard) is a nice visualization tool that is packaged with TensorFlow, but we can create basic charts using the `matplotlib` module.\n", + "\n", + "Interpreting these charts takes some experience, but you really want to see the *loss* go down and the *accuracy* go up." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "agjvNd2iUGFn" + }, + "outputs": [], + "source": [ + "fig, axes = plt.subplots(2, sharex=True, figsize=(12, 8))\n", + "fig.suptitle('Training Metrics')\n", + "\n", + "axes[0].set_ylabel(\"Loss\", fontsize=14)\n", + "axes[0].plot(train_loss_results)\n", + "\n", + "axes[1].set_ylabel(\"Accuracy\", fontsize=14)\n", + "axes[1].set_xlabel(\"Epoch\", fontsize=14)\n", + "axes[1].plot(train_accuracy_results);" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Zg8GoMZhLpGH" + }, + "source": [ + "## Evaluate the model's effectiveness\n", + "\n", + "Now that the model is trained, we can get some statistics on its performance.\n", + "\n", + "*Evaluating* means determining how effectively the model makes predictions. To determine the model's effectiveness at Iris classification, pass some sepal and petal measurements to the model and ask the model to predict what Iris species they represent. Then compare the model's prediction against the actual label. For example, a model that picked the correct species on half the input examples has an *[accuracy](https://developers.google.com/machine-learning/glossary/#accuracy)* of `0.5`. Figure 4 shows a slightly more effective model, getting 4 out of 5 predictions correct at 80% accuracy:\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
Example featuresLabelModel prediction
5.93.04.31.511
6.93.15.42.122
5.13.31.70.500
6.0 3.4 4.5 1.6 12
5.52.54.01.311
\n", + " Figure 4. An Iris classifier that is 80% accurate.
 \n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "z-EvK7hGL0d8" + }, + "source": [ + "### Setup the test dataset\n", + "\n", + "Evaluating the model is similar to training the model. The biggest difference is the examples come from a separate *[test set](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* rather than the training set. To fairly assess a model's effectiveness, the examples used to evaluate a model must be different from the examples used to train the model.\n", + "\n", + "The setup for the test `Dataset` is similar to the setup for training `Dataset`. Download the CSV text file and parse that values, then give it a little shuffle:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "Ps3_9dJ3Lodk" + }, + "outputs": [], + "source": [ + "test_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_test.csv\"\n", + "\n", + "test_fp = tf.keras.utils.get_file(fname=os.path.basename(test_url),\n", + " origin=test_url)" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "SRMWCu30bnxH" + }, + "outputs": [], + "source": [ + "test_dataset = tf.contrib.data.make_csv_dataset(\n", + " test_fp,\n", + " batch_size, \n", + " column_names=column_names,\n", + " label_name='species',\n", + " num_epochs=1,\n", + " shuffle=False)\n", + "\n", + "test_dataset = test_dataset.map(pack_features_vector)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "HFuOKXJdMAdm" + }, + "source": [ + "### Evaluate the model on the test dataset\n", + "\n", + "Unlike the training stage, the model only evaluates a single [epoch](https://developers.google.com/machine-learning/glossary/#epoch) of the test data. In the following code cell, we iterate over each example in the test set and compare the model's prediction against the actual label. This is used to measure the model's accuracy across the entire test set." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "Tw03-MK1cYId" + }, + "outputs": [], + "source": [ + "test_accuracy = tfe.metrics.Accuracy()\n", + "\n", + "for (x, y) in test_dataset:\n", + " logits = model(x)\n", + " prediction = tf.argmax(logits, axis=1, output_type=tf.int32)\n", + " test_accuracy(prediction, y)\n", + "\n", + "print(\"Test set accuracy: {:.3%}\".format(test_accuracy.result()))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "HcKEZMtCOeK-" + }, + "source": [ + "We can see on the last batch, for example, the model is usually correct:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "uNwt2eMeOane" + }, + "outputs": [], + "source": [ + "tf.stack([y,prediction],axis=1)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "7Li2r1tYvW7S" + }, + "source": [ + "## Use the trained model to make predictions\n", + "\n", + "We've trained a model and \"proven\" that it's good—but not perfect—at classifying Iris species. Now let's use the trained model to make some predictions on [unlabeled examples](https://developers.google.com/machine-learning/glossary/#unlabeled_example); that is, on examples that contain features but not a label.\n", + "\n", + "In real-life, the unlabeled examples could come from lots of different sources including apps, CSV files, and data feeds. For now, we're going to manually provide three unlabeled examples to predict their labels. Recall, the label numbers are mapped to a named representation as:\n", + "\n", + "* `0`: Iris setosa\n", + "* `1`: Iris versicolor\n", + "* `2`: Iris virginica" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "kesTS5Lzv-M2" + }, + "outputs": [], + "source": [ + "predict_dataset = tf.convert_to_tensor([\n", + " [5.1, 3.3, 1.7, 0.5,],\n", + " [5.9, 3.0, 4.2, 1.5,],\n", + " [6.9, 3.1, 5.4, 2.1]\n", + "])\n", + "\n", + "predictions = model(predict_dataset)\n", + "\n", + "for i, logits in enumerate(predictions):\n", + " class_idx = tf.argmax(logits).numpy()\n", + " p = tf.nn.softmax(logits)[class_idx]\n", + " name = class_names[class_idx]\n", + " print(\"Example {} prediction: {} ({:4.1f}%)\".format(i, name, 100*p))" + ] + } + ], + "metadata": { + "colab": { + "collapsed_sections": [], + "name": "custom_training_walkthrough", + "private_outputs": true, + "provenance": [], + "toc_visible": true, + "version": "0.3.2" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb new file mode 100644 index 00000000000..89f6487d193 --- /dev/null +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -0,0 +1,467 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "iPpI7RaYoZuE" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "form", + "colab": {}, + "colab_type": "code", + "id": "hro2InpHobKk" + }, + "outputs": [], + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "U9i2Dsh-ziXr" + }, + "source": [ + "# 즉시실행(eager execution) 기초" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Hndw-YcxoOJK" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " View on TensorFlow.org\n", + " \n", + " Run in Google Colab\n", + " \n", + " View source on GitHub\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "6sILUVbHoSgH" + }, + "source": [ + "이것은 텐서플로우를 사용하기위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", + "\n", + "* 필요한 패키지 임포트\n", + "* 텐서(Tensor) 생성 및 사용\n", + "* GPU 가속기 사용\n", + "* 데이터 세트" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "z1JcS5iBXMRO" + }, + "source": [ + "## 텐서플로우 임포트\n", + "\n", + "시작하기 위해서 텐서플로우 모듈을 임포트하고 즉시실행을 활성화합니다. 즉시실행으로 텐서플로우에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "code", + "colab": {}, + "colab_type": "code", + "id": "RlIWhyeLoYnG" + }, + "outputs": [], + "source": [ + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ] + }, + { + "cell_type": "raw", + "metadata": { + "colab_type": "text", + "id": "H9UySOPLXdaw" + }, + "source": [ + "## 텐서\n", + "\n", + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로우는 텐서를 생성하고 계산하는 풍부한 연산자 라이브러리를 제공합니다. ([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.). 이러한 연산자들은 자동적으로 파이썬 타입을 전환합니다. 예를 들어:\n" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "code", + "colab": {}, + "colab_type": "code", + "id": "ngUe237Wt48W" + }, + "outputs": [], + "source": [ + "print(tf.add(1, 2))\n", + "print(tf.add([1, 2], [3, 4]))\n", + "print(tf.square(5))\n", + "print(tf.reduce_sum([1, 2, 3]))\n", + "print(tf.encode_base64(\"hello world\"))\n", + "\n", + "# Operator overloading is also supported\n", + "print(tf.square(2) + tf.square(3))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "IDY4WsYRhP81" + }, + "source": [ + "각각의 텐서는 형태와 데이터 타입을 가지고 있습니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "srYWH1MdJNG7" + }, + "outputs": [], + "source": [ + "x = tf.matmul([[1]], [[2, 3]])\n", + "print(x.shape)\n", + "print(x.dtype)" + ] + }, + { + "cell_type": "raw", + "metadata": { + "colab_type": "text", + "id": "eBPw8e8vrsom" + }, + "source": [ + "넘파이 배열과 텐서의 가장 확실한 차이는 다음과 같습니다:\n", + "\n", + "1. 가속기 메모리(GPU, TPU와 같은)로 텐서를 뒷받침할 수 있습니다. \n", + "2. 텐서는 불변성(immutable)을 가집니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Dwi1tdW3JBw6" + }, + "source": [ + "### NumPy 적합성\n", + "\n", + "Tensor와 ndarray사이의 전환은 다소 간단합니다.\n", + "\n", + "* 텐서플로우 연산자는 자동적으로 Numpy ndarray를 Tensor로 전환합니다.\n", + "* 넘파이 연산자는 자동적으로 텐서플로우 텐서를 넘이파 ndarray로 전환합니다.\n", + "\n", + "텐서는 `.numpy()` 메소드(method)를 호출하여 Numpy ndarray로 전환할 수 있습니다.\n", + "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "lCUWzso6mbqR" + }, + "outputs": [], + "source": [ + "import numpy as np\n", + "\n", + "ndarray = np.ones([3, 3])\n", + "\n", + "print(\"TensorFlow operations convert numpy arrays to Tensors automatically\")\n", + "tensor = tf.multiply(ndarray, 42)\n", + "print(tensor)\n", + "\n", + "\n", + "print(\"And NumPy operations convert Tensors to numpy arrays automatically\")\n", + "print(np.add(tensor, 1))\n", + "\n", + "print(\"The .numpy() method explicitly converts a Tensor to a numpy array\")\n", + "print(tensor.numpy())" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "PBNP8yTRfu_X" + }, + "source": [ + "## GPU acceleration\n", + "\n", + "Many TensorFlow operations can be accelerated by using the GPU for computation. Without any annotations, TensorFlow automatically decides whether to use the GPU or CPU for an operation (and copies the tensor between CPU and GPU memory if necessary). Tensors produced by an operation are typically backed by the memory of the device on which the operation executed. For example:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "code", + "colab": {}, + "colab_type": "code", + "id": "3Twf_Rw-gQFM" + }, + "outputs": [], + "source": [ + "x = tf.random_uniform([3, 3])\n", + "\n", + "print(\"Is there a GPU available: \"),\n", + "print(tf.test.is_gpu_available())\n", + "\n", + "print(\"Is the Tensor on GPU #0: \"),\n", + "print(x.device.endswith('GPU:0'))" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vpgYzgVXW2Ud" + }, + "source": [ + "### Device Names\n", + "\n", + "The `Tensor.device` property provides a fully qualified string name of the device hosting the contents of the tensor. This name encodes many details, such as an identifier of the network address of the host on which this program is executing and the device within that host. This is required for distributed execution of a TensorFlow program. The string ends with `GPU:` if the tensor is placed on the `N`-th GPU on the host." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "ZWZQCimzuqyP" + }, + "source": [ + "\n", + "\n", + "### Explicit Device Placement\n", + "\n", + "The term \"placement\" in TensorFlow refers to how individual operations are assigned (placed on) a device for execution. As mentioned above, when there is no explicit guidance provided, TensorFlow automatically decides which device to execute an operation, and copies Tensors to that device if needed. However, TensorFlow operations can be explicitly placed on specific devices using the `tf.device` context manager. For example:" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "RjkNZTuauy-Q" + }, + "outputs": [], + "source": [ + "import time\n", + "\n", + "def time_matmul(x):\n", + " start = time.time()\n", + " for loop in range(10):\n", + " tf.matmul(x, x)\n", + "\n", + " result = time.time()-start\n", + " \n", + " print(\"10 loops: {:0.2f}ms\".format(1000*result))\n", + "\n", + "\n", + "# Force execution on CPU\n", + "print(\"On CPU:\")\n", + "with tf.device(\"CPU:0\"):\n", + " x = tf.random_uniform([1000, 1000])\n", + " assert x.device.endswith(\"CPU:0\")\n", + " time_matmul(x)\n", + "\n", + "# Force execution on GPU #0 if available\n", + "if tf.test.is_gpu_available():\n", + " with tf.device(\"GPU:0\"): # Or GPU:1 for the 2nd GPU, GPU:2 for the 3rd etc.\n", + " x = tf.random_uniform([1000, 1000])\n", + " assert x.device.endswith(\"GPU:0\")\n", + " time_matmul(x)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "o1K4dlhhHtQj" + }, + "source": [ + "## Datasets\n", + "\n", + "This section demonstrates the use of the [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets) to build pipelines to feed data to your model. It covers:\n", + "\n", + "* Creating a `Dataset`.\n", + "* Iteration over a `Dataset` with eager execution enabled.\n", + "\n", + "We recommend using the `Dataset`s API for building performant, complex input pipelines from simple, re-usable pieces that will feed your model's training or evaluation loops.\n", + "\n", + "If you're familiar with TensorFlow graphs, the API for constructing the `Dataset` object remains exactly the same when eager execution is enabled, but the process of iterating over elements of the dataset is slightly simpler.\n", + "You can use Python iteration over the `tf.data.Dataset` object and do not need to explicitly create an `tf.data.Iterator` object.\n", + "As a result, the discussion on iterators in the [TensorFlow Guide](https://www.tensorflow.org/guide/datasets) is not relevant when eager execution is enabled." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "zI0fmOynH-Ne" + }, + "source": [ + "### Create a source `Dataset`\n", + "\n", + "Create a _source_ dataset using one of the factory functions like [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices) or using objects that read from files like [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) or [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset). See the [TensorFlow Guide](https://www.tensorflow.org/guide/datasets#reading_input_data) for more information." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "F04fVOHQIBiG" + }, + "outputs": [], + "source": [ + "ds_tensors = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6])\n", + "\n", + "# Create a CSV file\n", + "import tempfile\n", + "_, filename = tempfile.mkstemp()\n", + "\n", + "with open(filename, 'w') as f:\n", + " f.write(\"\"\"Line 1\n", + "Line 2\n", + "Line 3\n", + " \"\"\")\n", + "\n", + "ds_file = tf.data.TextLineDataset(filename)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vbxIhC-5IPdf" + }, + "source": [ + "### Apply transformations\n", + "\n", + "Use the transformations functions like [`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle) etc. to apply transformations to the records of the dataset. See the [API documentation for `tf.data.Dataset`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset) for details." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "uXSDZWE-ISsd" + }, + "outputs": [], + "source": [ + "ds_tensors = ds_tensors.map(tf.square).shuffle(2).batch(2)\n", + "\n", + "ds_file = ds_file.batch(2)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "A8X1GNfoIZKJ" + }, + "source": [ + "### Iterate\n", + "\n", + "When eager execution is enabled `Dataset` objects support iteration.\n", + "If you're familiar with the use of `Dataset`s in TensorFlow graphs, note that there is no need for calls to `Dataset.make_one_shot_iterator()` or `get_next()` calls." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "colab": {}, + "colab_type": "code", + "id": "ws-WKRk5Ic6-" + }, + "outputs": [], + "source": [ + "print('Elements of ds_tensors:')\n", + "for x in ds_tensors:\n", + " print(x)\n", + "\n", + "print('\\nElements in ds_file:')\n", + "for x in ds_file:\n", + " print(x)" + ] + } + ], + "metadata": { + "colab": { + "collapsed_sections": [], + "name": "eager_basics.ipynb", + "private_outputs": true, + "provenance": [], + "toc_visible": true, + "version": "0.3.2" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md new file mode 100644 index 00000000000..9c28180b352 --- /dev/null +++ b/site/ko/tutorials/eager/index.md @@ -0,0 +1,13 @@ +# Research and experimentation + +Eager execution provides an imperative, define-by-run interface for advanced +operations. Write custom layers, forward passes, and training loops with +auto differentiation. Start with these notebooks, then read the +[eager execution guide](../../guide/eager). + +1. [Eager execution](eager_basics.ipynb) +2. [Automatic differentiation and gradient tape](automatic_differentiation.ipynb) +3. [Custom training: basics](custom_training.ipynb) +4. [Custom layers](custom_layers.ipynb) +5. [Custom training: walkthrough](custom_training_walkthrough.ipynb) + From 340fcffaf7a389a0f5a6a3a76163bce446c8315e Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Tue, 26 Mar 2019 01:10:30 +0900 Subject: [PATCH 03/19] Update from bd099118 --- .../eager/automatic_differentiation.ipynb | 14 +- site/ko/tutorials/eager/custom_layers.ipynb | 74 +++----- .../eager/custom_training_walkthrough.ipynb | 179 +++++++++--------- site/ko/tutorials/eager/eager_basics.ipynb | 65 ++++--- site/ko/tutorials/eager/index.md | 24 ++- 5 files changed, 174 insertions(+), 182 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index e835160ebd7..de7ea83a46b 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -41,7 +41,7 @@ "id": "xh8WkEwWpnm7" }, "source": [ - "# Automatic differentiation and gradient tape" + "# 자동미분(Automatic differentiation) 과 그래디언트 테이프" ] }, { @@ -71,7 +71,7 @@ "id": "vDJ4XzMqodTy" }, "source": [ - "이전 튜토리얼에서 우리는 Tensor와 연산자들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + "이전 튜토리얼에서 우리는 Tensor와 Tensor의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." ] }, { @@ -108,7 +108,7 @@ "source": [ "## 그래디언트 테이프(Gradient Tape)\n", "\n", - "텐서플로우는 자동미분(주어진 입력 변수에 따른 기울기 계산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape` 내에서 실행된 모든 연산자들을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 기록된 계산의 그래디언트를 계산하기 위해 각각의 기록된 연산자들과 관련된 테이프와 그래디언트들을 사용합니다. \n", + "텐서플로우는 자동미분(주어진 입력 변수에 따른 기울기 연산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 기록된 연산의 그래디언트를 계산하기 위해 각각의 기록된 연산들과 관련된 테이프와 그래디언트들을 사용합니다. \n", "\n", "예를 들면:" ] @@ -177,7 +177,7 @@ "id": "ISkXuY7YzIcS" }, "source": [ - "초기값으로 GradientTape.gradient() 메소드가 호출되면 GradientTape에 포함된 리소스가 해체되게 설정돼있습니다. 동일한 계산을 통해서 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. `persistent`는 `gradient()` 메소드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다." + "초기값으로 GradientTape.gradient() 메소드가 호출되면 GradientTape에 포함된 리소스가 해체되게 설정돼있습니다. 동일한 연산을 통해서 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. `persistent`는 `gradient()` 메소드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다." ] }, { @@ -209,7 +209,7 @@ "source": [ "### 제어흐름(Control Flow) 기록\n", "\n", - "테이프가 실행되는데로 연산자를 기록하기 때문에, 파이썬 제어흐름(예를 들어 `if` `while`, `for`문 같은)은 자연스럽게 처리됩니다. " + "테이프가 실행되는데로 연산을 기록하기 때문에, 파이썬 제어흐름(예를 들어 `if` `while`, `for`문 같은)은 자연스럽게 처리됩니다. " ] }, { @@ -251,7 +251,7 @@ "source": [ "### 고차원(Higher-order) 그래디언트\n", "\n", - "`GradientTape` 컨텍스트 매니저안에 있는 연산자들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되면 그래디언트 계산 또한 기록되어집니다. 그 결과 똑같은 API가 고차원 그래디언트에서도 잘 작동합니다. 예를 들면:" + "`GradientTape` 컨텍스트 매니저안에 있는 연산들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 연산되면 그래디언트 연산 또한 기록되어집니다. 그 결과 똑같은 API가 고차원 그래디언트에서도 잘 작동합니다. 예를 들면:" ] }, { @@ -269,7 +269,7 @@ "with tf.GradientTape() as t:\n", " with tf.GradientTape() as t2:\n", " y = x * x * x\n", - " # t 컨텍스트 매니저 안의 그래디언트 계산\n", + " # t 컨텍스트 매니저 안의 그래디언트 연산\n", " # 이것은 또한 그래디언트 계산이 미분가능하다는것을 의미합니다. \n", " dy_dx = t2.gradient(y, x)\n", "d2y_dx2 = t.gradient(dy_dx, x)\n", diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index cb1a6022b24..97091da1efb 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -41,7 +41,7 @@ "id": "60RdWsg1tETW" }, "source": [ - "# Custom layers" + "# 사용자 정의 레이어" ] }, { @@ -71,7 +71,7 @@ "id": "UEu3q4jmpKVT" }, "source": [ - "We recommend using `tf.keras` as a high-level API for building neural networks. That said, most TensorFlow APIs are usable with eager execution.\n" + "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로우 API는 즉시실행(eager execution)을 활성화할 수 있습니다." ] }, { @@ -96,13 +96,13 @@ "id": "zSFfVVjkrrsI" }, "source": [ - "## Layers: common sets of useful operations\n", + "## 레이어(layer): 유용한 연산자 집합\n", "\n", - "Most of the time when writing code for machine learning models you want to operate at a higher level of abstraction than individual operations and manipulation of individual variables.\n", + "머신러닝을 위한 코드를 작성하는 대부분의 시간에 우리는, 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", "\n", - "Many machine learning models are expressible as the composition and stacking of relatively simple layers, and TensorFlow provides both a set of many common layers as a well as easy ways for you to write your own application-specific layers either from scratch or as the composition of existing layers.\n", + "많은 머신러닝 모델은 비교적 단순한 레이어의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로우는 여러 표준 레이어 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 레이어를 처음부터 작성하거나, 기존 레이어의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", - "TensorFlow includes the full [Keras](https://keras.io) API in the tf.keras package, and the Keras layers are very useful when building your own models.\n" + "텐서플로우는 [Keras](https://keras.io) API 의 풀페키지를 tf.keras package에 포함하고 있습니다. Keras 레이어는 모델을 구축하는데 매우 유용합니다." ] }, { @@ -115,13 +115,11 @@ }, "outputs": [], "source": [ - "# In the tf.keras.layers package, layers are objects. To construct a layer,\n", - "# simply construct the object. Most layers take as a first argument the number\n", - "# of output dimensions / channels.\n", + "# tf.keras.layers 패키지에서 레이어는 객체입니다. 레이어를 구성하려면 간단히 객체를 생성하십시오.\n", + "# 대부분의 레이어는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", "layer = tf.keras.layers.Dense(100)\n", - "# The number of input dimensions is often unnecessary, as it can be inferred\n", - "# the first time the layer is used, but it can be provided if you want to \n", - "# specify it manually, which is useful in some complex models.\n", + "# 입력 차원의 수는 유추될 수 있기 때문에 종종 불필요합니다. \n", + "# 일부 복잡한 모델에서는 수동으로 입력 차원의 수를 제공하는것이 유용할 수 있습니다.\n", "layer = tf.keras.layers.Dense(10, input_shape=(None, 5))" ] }, @@ -132,8 +130,7 @@ "id": "Fn69xxPO5Psr" }, "source": [ - "The full list of pre-existing layers can be seen in [the documentation](https://www.tensorflow.org/api_docs/python/tf/keras/layers). It includes Dense (a fully-connected layer),\n", - "Conv2D, LSTM, BatchNormalization, Dropout, and many others." + "미리 구성되어있는 레이어는 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense, Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." ] }, { @@ -146,7 +143,7 @@ }, "outputs": [], "source": [ - "# To use a layer, simply call it.\n", + "# 레이어를 사용하기 위해서 간단하게 호출합니다.\n", "layer(tf.zeros([10, 5]))" ] }, @@ -160,10 +157,9 @@ }, "outputs": [], "source": [ - "# Layers have many useful methods. For example, you can inspect all variables\n", - "# in a layer using `layer.variables` and trainable variables using \n", - "# `layer.trainable_variables`. In this case a fully-connected layer\n", - "# will have variables for weights and biases.\n", + "# 레이어는 유용한 메소드들을 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 레이어안에 있는 모든 변수들을 확인할 수 있으며, \n", + "# `layer.trainable_variables`를 사용하여 학습가능한 변수들을 확인할 수 있습니다. \n", + "# 이번 케이스에서 완전 연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" ] }, @@ -177,7 +173,7 @@ }, "outputs": [], "source": [ - "# The variables are also accessible through nice accessors\n", + "# 또한 변수는 여러 accessors를 통해 접근가능합니다. \n", "layer.kernel, layer.bias" ] }, @@ -188,13 +184,13 @@ "id": "O0kDbE54-5VS" }, "source": [ - "## Implementing custom layers\n", - "The best way to implement your own layer is extending the tf.keras.Layer class and implementing:\n", - " * `__init__` , where you can do all input-independent initialization\n", - " * `build`, where you know the shapes of the input tensors and can do the rest of the initialization\n", - " * `call`, where you do the forward computation\n", + "## 사용자 정의 레이어 구현\n", + "사용자 정의 레이어를 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", + " * `__init__` , 여기서 모든 입력 독립적인 초기화를 할 수 있습니다.\n", + " * `build`, 입력 텐서의 형태를 알고 나머지를 초기화 할 수 있습니다.\n", + " * `call`, 정방향 계산을 진행 할 수 있습니다.\n", "\n", - "Note that you don't have to wait until `build` is called to create your variables, you can also create them in `__init__`. However, the advantage of creating them in `build` is that it enables late variable creation based on the shape of the inputs the layer will operate on. On the other hand, creating variables in `__init__` would mean that shapes required to create the variables will need to be explicitly specified." + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 레이어가 작동할 입력의 형태를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 형태가 명시적으로 지정되어야 함을 의미합니다.변수를 생성하는 데 필요한 모양이 명시적으로 지정되어야 함을 의미합니다." ] }, { @@ -232,9 +228,9 @@ "id": "tk8E2vY0-z4Z" }, "source": [ - "Note that you don't have to wait until `build` is called to create your variables, you can also create them in `__init__`.\n", + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. \n", "\n", - "Overall code is easier to read and maintain if it uses standard layers whenever possible, as other readers will be familiar with the behavior of standard layers. If you want to use a layer which is not present in tf.keras.layers or tf.contrib.layers, consider filing a [github issue](http://github.com/tensorflow/tensorflow/issues/new) or, even better, sending us a pull request!" + "다른 독자가 표준 레이어의 동작을 잘 알고 있기 때문에, 가능한 경우 표준 레이어를 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers, tf.keras.layers 또는 tf.contrib.layers에 없는 레이어를 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." ] }, { @@ -244,11 +240,11 @@ "id": "Qhg4KlbKrs3G" }, "source": [ - "## Models: composing layers\n", + "## 모델: 레이어 구성\n", "\n", - "Many interesting layer-like things in machine learning models are implemented by composing existing layers. For example, each residual block in a resnet is a composition of convolutions, batch normalizations, and a shortcut.\n", + "머신러닝 모델에서 많은 흥미로운 유사 레이어(layer-likely)는 레이어들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 residual block은 합성곱(convolution), 배치정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", "\n", - "The main class used when creating a layer-like thing which contains other layers is tf.keras.Model. Implementing one is done by inheriting from tf.keras.Model." + "레이어 집합을 포함한 유사 레이어를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(Inheritance)하여 구현합니다." ] }, { @@ -296,16 +292,6 @@ "print([x.name for x in block.trainable_variables])" ] }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "wYfucVw65PMj" - }, - "source": [ - "Much of the time, however, models which compose many layers simply call one layer after the other. This can be done in very little code using tf.keras.Sequential" - ] - }, { "cell_type": "code", "execution_count": null, @@ -327,15 +313,15 @@ ] }, { - "cell_type": "markdown", + "cell_type": "raw", "metadata": { "colab_type": "text", "id": "c5YwYcnuK-wc" }, "source": [ - "# Next steps\n", + "# 다음 단계\n", "\n", - "Now you can go back to the previous notebook and adapt the linear regression example to use layers and models to be better structured." + "이제 여러분들은 이전 노트북으로 돌아가서 선형 회귀 예제에 레이어와 모델을 적용하여 좀 더 나은 구조를 만들 수 있습니다." ] } ], diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 055fab9b058..cc5f9e4f43a 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -41,7 +41,7 @@ "id": "JtEZ1pCPn--z" }, "source": [ - "# 사용자 지정 학습: walkthrough" + "# 사용자 정의 학습: walkthrough" ] }, { @@ -65,13 +65,13 @@ ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "LDrzLFXE8T1l" }, "source": [ - "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시실행[eager execution](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", + "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시실행[(eager execution)](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", "1. 모델 구축\n", "2. 모델 훈련\n", "3. 예측을 위한 모델 사용\n", @@ -80,7 +80,7 @@ "\n", "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로우의 개념들을 사용합니다.\n", "\n", - "* 즉시실행[eager execution](https://www.tensorflow.org/guide/eager) 개발환경,\n", + "* 즉시실행([eager execution])(https://www.tensorflow.org/guide/eager) 개발환경,\n", "* [Datasets API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", "* [Keras API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 레이어(layer) 구축 .\n", "\n", @@ -112,7 +112,7 @@ "source": [ "### 임포트 및 즉시실행 구성\n", "\n", - "텐서플로우를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로우가 나중에 실행되는 [computational graph](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산자를 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로우를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로우가 나중에 실행되는 [computational graph](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", "\n", "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [eager execution guide](https://www.tensorflow.org/guide/eager)을 참조하세요." ] @@ -183,7 +183,7 @@ "\n", "### 데이터셋 다운로드\n", "\n", - "[tf.keras.utils.get_file](https://www.tensorflow.org/api_docs/python/tf/keras/utils/get_file)함수를 사용하여 데이터셋을 다운로드합니다. 이 함수는 다운로드된 파일의 경로를 반환합니다." + "[tf.keras.utils.get_file](https://www.tensorflow.org/api_docs/python/tf/keras/utils/get_file) 함수를 사용하여 데이터셋을 다운로드합니다. 이 함수는 다운로드된 파일의 경로를 반환합니다." ] }, { @@ -211,7 +211,7 @@ "id": "qnX1-aLors4S" }, "source": [ - "### 데이터 관찰\n", + "### 데이터 탐색\n", "\n", "이 데이터셋(`iris_training.csv`)은 ','로 구분된 CSV 파일입니다. `head -n5` 명령을 사용하여 처음 5개 항목을 확인합니다. " ] @@ -236,15 +236,15 @@ "id": "kQhzD6P-uBoq" }, "source": [ - "From this view of the dataset, notice the following:\n", + "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", "1. 첫번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 예가 있다. 각 예들은 4가지의 특성(feature)을 가지고 3가지 가능한 레이블(label)을 가지고 있습니다.\n", - "2. 후속행은 데이터 레코드입니다. one *[example](https://developers.google.com/machine-learning/glossary/#example)* per line, where:\n", - " * The first four fields are *[features](https://developers.google.com/machine-learning/glossary/#feature)*: these are characteristics of an example. Here, the fields hold float numbers representing flower measurements.\n", - " * The last column is the *[label](https://developers.google.com/machine-learning/glossary/#label)*: this is the value we want to predict. For this dataset, it's an integer value of 0, 1, or 2 that corresponds to a flower name.\n", + " * 총 120개의 예가 있다. 각 예들은 4가지의 특성(feature)을 가지며 3가지 가능한 레이블(label)을 가지고 있습니다.\n", + "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", + " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드는 붓꽃의 측정값을 나타내는 부동소수점을 나타냅니다.\n", + " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 우리가 에측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", "\n", - "Let's write that out in code:" + "코드로 표현하면 다음과 같습니다.:" ] }, { @@ -274,13 +274,13 @@ "id": "CCtwLoJhhDNc" }, "source": [ - "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적이로 숫자형값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", + "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적으로 숫자형값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", "\n", "* `0`: Iris setosa\n", "* `1`: Iris versicolor\n", "* `2`: Iris virginica\n", "\n", - "특성과 레이블에 관한 더 많은 정보를 위해서 다음을 참조하세요.[ML Terminology section of the Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)." + "특성과 레이블에 관한 더 많은 정보를 위해서 다음을 참조하세요. [ML Terminology section of the Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)." ] }, { @@ -305,10 +305,10 @@ "source": [ "### `tf.data.Dataset` 생성\n", "\n", - "TensorFlow's [Dataset API](https://www.tensorflow.org/guide/datasets) handles many common cases for loading data into a model. This is a high-level API for reading data and transforming it into a form used for training. See the [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) for more information.\n", + "텐서플로우의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", "\n", "\n", - "Since the dataset is a CSV-formatted text file, use the [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) function to parse the data into a suitable format. Since this function generates data for training models, the default behavior is to shuffle the data (`shuffle=True, shuffle_buffer_size=10000`), and repeat the dataset forever (`num_epochs=None`). We also set the [batch_size](https://developers.google.com/machine-learning/glossary/#batch_size) parameter." + "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 배치 사이즈[batch_size](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." ] }, { @@ -338,9 +338,9 @@ "id": "gB_RSn62c-3G" }, "source": [ - "The `make_csv_dataset` function returns a `tf.data.Dataset` of `(features, label)` pairs, where `features` is a dictionary: `{'feature_name': value}`\n", - "\n", - "With eager execution enabled, these `Dataset` objects are iterable. Let's look at a batch of features:" + "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍을 반환합니다., where \n", + "`features` 가 사전형 객체인: `{'feature_name': value}`로 주어집니다.\n", + "즉시실행 활성화로 이 `Dataset`은 반복가능합니다. 특성(feature)을 살펴봅시다." ] }, { @@ -365,9 +365,9 @@ "id": "E63mArnQaAGz" }, "source": [ - "Notice that like-features are grouped together, or *batched*. Each example row's fields are appended to the corresponding feature array. Change the `batch_size` to set the number of examples stored in these feature arrays.\n", + "유사한 특성의 값들은 같이 그룹되어있거나, *배치* 되있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size` 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", "\n", - "You can start to see some clusters by plotting a few features from the batch:" + "또한 여러분들은 배치(batch)로부터 약간의 특성을 도식화하여 군집되있는 데이터를 확인할 수 있습니다. " ] }, { @@ -396,9 +396,9 @@ "id": "YlxpSyHlhT6M" }, "source": [ - "To simplify the model building step, create a function to repackage the features dictionary into a single array with shape: `(batch_size, num_features)`.\n", + "모델 구축단계를 단순화하기 위해서, 특성 사전 객체를 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", - "This function uses the [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) method which takes values from a list of tensors and creates a combined tensor at the specified dimension." + "이 함수는 `Tensor`의 list로부터 값을 취하고 특정한 차원으로 결합된 `Tensor`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메소드(method)를 사용합니다." ] }, { @@ -424,7 +424,7 @@ "id": "V1Vuph_eDl8x" }, "source": [ - "Then use the [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) method to pack the `features` of each `(features,label)` pair into the training dataset:" + "그 후 각 `(features,label)`쌍의 `features`을 훈련 데이터셋에 적재하기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메소드를 사용합니다. " ] }, { @@ -447,7 +447,7 @@ "id": "NLy0Q1xCldVO" }, "source": [ - "The features element of the `Dataset` are now arrays with shape `(batch_size, num_features)`. Let's look at the first few examples:" + "데이터셋의 특성 요소들은 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5행의 예제를 살펴봅시다." ] }, { @@ -472,17 +472,17 @@ "id": "LsaVrtNM3Tx5" }, "source": [ - "## Select the type of model\n", + "## 모델 타입 선정\n", "\n", - "### Why model?\n", + "### 왜 모델을 사용해야하는가?\n", "\n", - "A *[model](https://developers.google.com/machine-learning/crash-course/glossary#model)* is a relationship between features and the label. For the Iris classification problem, the model defines the relationship between the sepal and petal measurements and the predicted Iris species. Some simple models can be described with a few lines of algebra, but complex machine learning models have a large number of parameters that are difficult to summarize.\n", + " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)들과 레이블(label)과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", "\n", - "Could you determine the relationship between the four features and the Iris species *without* using machine learning? That is, could you use traditional programming techniques (for example, a lot of conditional statements) to create a model? Perhaps—if you analyzed the dataset long enough to determine the relationships between petal and sepal measurements to a particular species. And this becomes difficult—maybe impossible—on more complicated datasets. A good machine learning approach *determines the model for you*. If you feed enough representative examples into the right machine learning model type, the program will figure out the relationships for you.\n", + "머신러닝을 사용하지 않고 4가지의 특성사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 아마 여러분들이 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문들)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 여러분들을 위한 모델을 결정합니다. 만약 여러분들이 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 여러분들을 위한 특성들간의 관계를 이해합니다. \n", "\n", - "### Select the model\n", + "### 모델 선정\n", "\n", - "We need to select the kind of model to train. There are many types of models and picking a good one takes experience. This tutorial uses a neural network to solve the Iris classification problem. *[Neural networks](https://developers.google.com/machine-learning/glossary/#neural_network)* can find complex relationships between features and the label. It is a highly-structured graph, organized into one or more *[hidden layers](https://developers.google.com/machine-learning/glossary/#hidden_layer)*. Each hidden layer consists of one or more *[neurons](https://developers.google.com/machine-learning/glossary/#neuron)*. There are several categories of neural networks and this program uses a dense, or *[fully-connected neural network](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*: the neurons in one layer receive input connections from *every* neuron in the previous layer. For example, Figure 2 illustrates a dense neural network consisting of an input layer, two hidden layers, and an output layer:\n", + "우리는 학습을 위한 모델의 종류를 선정해야합니다. 여러정류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡환 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*들로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전연결 신경망(fully-connected neural network)는 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전연결 신경망입니다. \n", "\n", "\n", " \n", " \n", "
\n", @@ -490,11 +490,11 @@ " alt=\"A diagram of the network architecture: Inputs, 2 hidden layers, and outputs\">\n", "
\n", - " Figure 2. A neural network with features, hidden layers, and predictions.
 \n", + " 그림 2. A neural network with features, hidden layers, and predictions.
 \n", "
\n", "\n", - "When the model from Figure 2 is trained and fed an unlabeled example, it yields three predictions: the likelihood that this flower is the given Iris species. This prediction is called *[inference](https://developers.google.com/machine-learning/crash-course/glossary#inference)*. For this example, the sum of the output predictions is 1.0. In Figure 2, this prediction breaks down as: `0.02` for *Iris setosa*, `0.95` for *Iris versicolor*, and `0.03` for *Iris virginica*. This means that the model predicts—with 95% probability—that an unlabeled example flower is an *Iris versicolor*." + "그림 2의 모델이 훈련되고 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지 예측을 출력(주어진 레이블의 개수)합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 정의합니다. 이 예제에서 출력의 합은 1.0입니다. 그림 2에서 예측은 `0.02` for *Iris setosa*, `0.95` for *Iris versicolor*, `0.03` for *Iris virginica*로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " ] }, { @@ -504,11 +504,11 @@ "id": "W23DIMVPQEBt" }, "source": [ - "### Create a model using Keras\n", + "### Keras를 사용한 모델 생성\n", "\n", - "The TensorFlow [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API is the preferred way to create models and layers. This makes it easy to build models and experiment while Keras handles the complexity of connecting everything together.\n", + "텐서플로우의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 레이어를 생성하기위한 풍부한 라이브러리를 가지고있습니다. 이는 연결되있는 모든것들을 케라스가 처리하여 모델의 구축하기 쉽게 만듭니다.\n", "\n", - "The [tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential) model is a linear stack of layers. Its constructor takes a list of layer instances, in this case, two [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense) layers with 10 nodes each, and an output layer with 3 nodes representing our label predictions. The first layer's `input_shape` parameter corresponds to the number of features from the dataset, and is required." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 레이어의 선형 적층 모델입니다. 이 구조는 레이어의 인스턴스를 취하며, 아래의 케이스의 경우 각 레이어당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense) 레이어와 3개의 예측(레이블의 개수)노드를 가지는 출력 레이어로 구성되어있습니다. 첫번째 레이어의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { @@ -535,9 +535,9 @@ "id": "FHcbEzMpxbHL" }, "source": [ - "The *[activation function](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)* determines the output shape of each node in the layer. These non-linearities are important—without them the model would be equivalent to a single layer. There are many [available activations](https://www.tensorflow.org/api_docs/python/tf/keras/activations), but [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU) is common for hidden layers.\n", + "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 레이어의 출력의 형태를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 단일 레이어와 동일하다고 생각할 수 있습니다. 사용가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", "\n", - "The ideal number of hidden layers and neurons depends on the problem and the dataset. Like many aspects of machine learning, picking the best shape of the neural network requires a mixture of knowledge and experimentation. As a rule of thumb, increasing the number of hidden layers and neurons typically creates a more powerful model, which requires more data to train effectively." + "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러측면과 마찬가지로, 신경망의 최적의 형태를 결정하는것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." ] }, { @@ -547,9 +547,9 @@ "id": "2wFKnhWCpDSS" }, "source": [ - "### Using the model\n", + "### 모델 사용\n", "\n", - "Let's have a quick look at what this model does to a batch of features:" + "이 모델이 배치 특성에 대해 수행하는 작업을 간단히 살펴보겠습니다. " ] }, { @@ -573,9 +573,9 @@ "id": "wxyXOhwVr5S3" }, "source": [ - "Here, each example returns a [logit](https://developers.google.com/machine-learning/crash-course/glossary#logits) for each class. \n", + "각 예제는 각 클래스에 대한 [로짓(logit)](https://developers.google.com/machine-learning/crash-course/glossary#logits)을 반환합니다. \n", "\n", - "To convert these logits to a probability for each class, use the [softmax](https://developers.google.com/machine-learning/crash-course/glossary#softmax) function:" + "이 로짓(logit)을 각 클래스에 대한 확률로 변환하기 위하서 [소프트맥스(softmax)](https://developers.google.com/machine-learning/crash-course/glossary#softmax) 함수를 사용하겠습니다." ] }, { @@ -598,7 +598,7 @@ "id": "uRZmchElo481" }, "source": [ - "Taking the `tf.argmax` across classes gives us the predicted class index. But, the model hasn't been trained yet, so these aren't good predictions." + "`tf.argmax`는 예측된 값들 중 가장 큰 확률(우리가 원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." ] }, { @@ -622,11 +622,11 @@ "id": "Vzq2E5J2QMtw" }, "source": [ - "## Train the model\n", + "## 모델 훈련하기\n", "\n", - "*[Training](https://developers.google.com/machine-learning/crash-course/glossary#training)* is the stage of machine learning when the model is gradually optimized, or the model *learns* the dataset. The goal is to learn enough about the structure of the training dataset to make predictions about unseen data. If you learn *too much* about the training dataset, then the predictions only work for the data it has seen and will not be generalizable. This problem is called *[overfitting](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)*—it's like memorizing the answers instead of understanding how to solve a problem.\n", + "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는것 입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면, 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들것입니다. 이러한 문제를 *[overfitting](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기 보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", "\n", - "The Iris classification problem is an example of *[supervised machine learning](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*: the model is trained from examples that contain labels. In *[unsupervised machine learning](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*, the examples don't contain labels. Instead, the model typically finds patterns among the features." + "붓꽃 분류 문제는 지도학습 *[지도학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고있지않습니다. 대신에 모델은 특성들의 패턴을 찾습니다. " ] }, { @@ -636,11 +636,11 @@ "id": "RaKp8aEjKX6B" }, "source": [ - "### Define the loss and gradient function\n", + "### 손실 함수와 그래디언트 함수 정의하기\n", "\n", - "Both training and evaluation stages need to calculate the model's *[loss](https://developers.google.com/machine-learning/crash-course/glossary#loss)*. This measures how off a model's predictions are from the desired label, in other words, how bad the model is performing. We want to minimize, or optimize, this value.\n", + "훈련과 평가단계는 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)* 계산할 필요가 있습니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 우리는 이 값은 최소화하고, 최적화하기를 원합니다. \n", "\n", - "Our model will calculate its loss using the [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) function which takes the model's class probability predictions and the desired label, and returns the average loss across the examples." + "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용하여 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(logit)을 입력받아 예제를 통한 평균 손실을 반환합니다." ] }, { @@ -669,7 +669,7 @@ "id": "3IcPqA24QM6B" }, "source": [ - "Use the [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) context to calculate the *[gradients](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* used to optimize our model. For more examples of this, see the [eager execution guide](https://www.tensorflow.org/guide/eager)." + "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 다음을 확인하세요. [eager execution guide](https://www.tensorflow.org/guide/eager)." ] }, { @@ -695,9 +695,9 @@ "id": "lOxFimtlKruu" }, "source": [ - "### Create an optimizer\n", + "### Optimizer 생성 \n", "\n", - "An *[optimizer](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)* applies the computed gradients to the model's variables to minimize the `loss` function. You can think of the loss function as a curved surface (see Figure 3) and we want to find its lowest point by walking around. The gradients point in the direction of steepest ascent—so we'll travel the opposite way and move down the hill. By iteratively calculating the loss and gradient for each batch, we'll adjust the model during training. Gradually, the model will find the best combination of weights and bias to minimize loss. And the lower the loss, the better the model's predictions.\n", + "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실`함수를 최소화하기위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 우리는 이 함수의 최저점을 찾고자합니다. The gradients point in the direction of steepest ascent—so we'll travel the opposite way and move down the hill. By iteratively calculating the loss and gradient for each batch, we'll adjust the model during training. Gradually, the model will find the best combination of weights and bias to minimize loss. And the lower the loss, the better the model's predictions.\n", "\n", "\n", " \n", "
\n", @@ -709,7 +709,7 @@ "
\n", "\n", - "TensorFlow has many [optimization algorithms](https://www.tensorflow.org/api_guides/python/train) available for training. This model uses the [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer) that implements the *[stochastic gradient descent](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* (SGD) algorithm. The `learning_rate` sets the step size to take for each iteration down the hill. This is a *hyperparameter* that you'll commonly adjust to achieve better results." + "텐서플로우는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 그래디언트 하강(stochastic gradient descent)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " ] }, { @@ -719,7 +719,7 @@ "id": "XkUd6UiZa_dF" }, "source": [ - "Let's setup the optimizer and the `global_step` counter:" + "옵티마이저(optimizer)와 `global_step`을 설정합니다." ] }, { @@ -738,13 +738,13 @@ ] }, { - "cell_type": "markdown", + "cell_type": "raw", "metadata": { "colab_type": "text", "id": "pJVRZ0hP52ZB" }, "source": [ - "We'll use this to calculate a single optimization step:" + "이 값들을 단일 최적화 단계를 계산하기위해 사용합니다. " ] }, { @@ -775,18 +775,18 @@ "id": "7Y2VSELvwAvW" }, "source": [ - "### Training loop\n", + "### 훈련 루프\n", "\n", - "With all the pieces in place, the model is ready for training! A training loop feeds the dataset examples into the model to help it make better predictions. The following code block sets up these training steps:\n", + "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 나은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 다음의 훈련 단계를 작성한 것입니다. \n", "\n", - "1. Iterate each *epoch*. An epoch is one pass through the dataset.\n", - "2. Within an epoch, iterate over each example in the training `Dataset` grabbing its *features* (`x`) and *label* (`y`).\n", - "3. Using the example's features, make a prediction and compare it with the label. Measure the inaccuracy of the prediction and use that to calculate the model's loss and gradients.\n", - "4. Use an `optimizer` to update the model's variables.\n", - "5. Keep track of some stats for visualization.\n", - "6. Repeat for each epoch.\n", + "1. 각 *에포크(epoch)* 반복. 에포크(epoch)는 데이터셋을 통과시키는 횟수입니다. \n", + "2. epoch내에서, `Dataset`의 *features* (`x`)와 *label* (`y`)를 가져오는 예제를 반복합니다.\n", + "3. 예제의 특성을 사용하여 결과를 예측을 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기위해 사용합니다. \n", + "4. 모델의 변수를 업데이트하기위해 `옵티마이저(optimizer)`를 사용합니다. \n", + "5. 시각화를 위해 몇가지 값을 추적합니다.\n", + "6. 각 epoch를 반복합니다.\n", "\n", - "The `num_epochs` variable is the number of times to loop over the dataset collection. Counter-intuitively, training a model longer does not guarantee a better model. `num_epochs` is a *[hyperparameter](https://developers.google.com/machine-learning/glossary/#hyperparameter)* that you can tune. Choosing the right number usually requires both experience and experimentation." + "`num_epochs` 변수는 데이터셋 반복 회수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 여러분들이 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 회수를 선택하는것은 경험과 직관을 필요로 합니다. " ] }, { @@ -799,12 +799,12 @@ }, "outputs": [], "source": [ - "## Note: Rerunning this cell uses the same model variables\n", + "## Note: 이 셀을 다시 실행하면 동일한 모델의 변수가 사용됩니다.\n", "\n", "from tensorflow import contrib\n", "tfe = contrib.eager\n", "\n", - "# keep results for plotting\n", + "# 도식화를 위해 결과 저장\n", "train_loss_results = []\n", "train_accuracy_results = []\n", "\n", @@ -814,19 +814,19 @@ " epoch_loss_avg = tfe.metrics.Mean()\n", " epoch_accuracy = tfe.metrics.Accuracy()\n", "\n", - " # Training loop - using batches of 32\n", + " # 훈련 루프 - 32번의 배치 실행\n", " for x, y in train_dataset:\n", " # Optimize the model\n", " loss_value, grads = grad(model, x, y)\n", " optimizer.apply_gradients(zip(grads, model.trainable_variables),\n", " global_step)\n", "\n", - " # Track progress\n", - " epoch_loss_avg(loss_value) # add current batch loss\n", - " # compare predicted label to actual label\n", + " # 진행 상황 추적\n", + " epoch_loss_avg(loss_value) # 현재 배치의 손실 추가\n", + " # 예측된 레이블과 실제 레이블 비교\n", " epoch_accuracy(tf.argmax(model(x), axis=1, output_type=tf.int32), y)\n", "\n", - " # end epoch\n", + " # epoch 종료\n", " train_loss_results.append(epoch_loss_avg.result())\n", " train_accuracy_results.append(epoch_accuracy.result())\n", " \n", @@ -843,7 +843,7 @@ "id": "2FQHVUnm_rjw" }, "source": [ - "### Visualize the loss function over time" + "### 시간에 따른 손실함수 시각화" ] }, { @@ -853,9 +853,9 @@ "id": "j3wdbmtLVTyr" }, "source": [ - "While it's helpful to print out the model's training progress, it's often *more* helpful to see this progress. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard) is a nice visualization tool that is packaged with TensorFlow, but we can create basic charts using the `matplotlib` module.\n", + "모델의 훈련 과정을 출력하는 것은 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로우에 패키지되어있는 굉장히 유용한 시각화 툴입니다. 하지만 우리는 `matplotlib` 모듈을 사용하여 일반적인 차트를 출력할 수 있습니다.\n", "\n", - "Interpreting these charts takes some experience, but you really want to see the *loss* go down and the *accuracy* go up." + "이 차트를 해석하는것은 여러 경험이 필요하지만, 우리는 *손실*이 내려가고 *정확도*가 올라가는 것을 보고싶습니다." ] }, { @@ -886,11 +886,11 @@ "id": "Zg8GoMZhLpGH" }, "source": [ - "## Evaluate the model's effectiveness\n", + "## 모델 유효성 검증\n", "\n", - "Now that the model is trained, we can get some statistics on its performance.\n", + "이제 모델은 학습되었습니다. 우리는 모델의 성능을 검증하기위해 몇가지 통계를 얻을 수 있습니다. \n", "\n", - "*Evaluating* means determining how effectively the model makes predictions. To determine the model's effectiveness at Iris classification, pass some sepal and petal measurements to the model and ask the model to predict what Iris species they represent. Then compare the model's prediction against the actual label. For example, a model that picked the correct species on half the input examples has an *[accuracy](https://developers.google.com/machine-learning/glossary/#accuracy)* of `0.5`. Figure 4 shows a slightly more effective model, getting 4 out of 5 predictions correct at 80% accuracy:\n", + "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해서, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적인 보여줍니다. 5개의 예측 중 4개를 올바르게 예측한 80% 정확도의 모델입니다.\n", "\n", "\n", " \n", @@ -919,7 +919,7 @@ " \n", " \n", " \n", "
5.52.54.01.311
\n", - " Figure 4. An Iris classifier that is 80% accurate.
 \n", + " 그림 4. An Iris classifier that is 80% accurate.
 \n", "
" ] @@ -931,11 +931,11 @@ "id": "z-EvK7hGL0d8" }, "source": [ - "### Setup the test dataset\n", + "### 테스트 데이터셋 설정\n", "\n", - "Evaluating the model is similar to training the model. The biggest difference is the examples come from a separate *[test set](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* rather than the training set. To fairly assess a model's effectiveness, the examples used to evaluate a model must be different from the examples used to train the model.\n", + "모델을 평가하는것은 모델을 학습하는것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터셋](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 을 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기위해, 모델을 평가하기위한 예제는 반드시 훈련 데이터와 달라야합니다. \n", "\n", - "The setup for the test `Dataset` is similar to the setup for training `Dataset`. Download the CSV text file and parse that values, then give it a little shuffle:" + "테스트 데이터셋을 설정하는것은 훈련 데이터셋을 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 구분합니다. 그 후 약간의 셔플을 적용합니다." ] }, { @@ -982,9 +982,9 @@ "id": "HFuOKXJdMAdm" }, "source": [ - "### Evaluate the model on the test dataset\n", + "### 테스트 데이터셋을 사용한 모델 평가\n", "\n", - "Unlike the training stage, the model only evaluates a single [epoch](https://developers.google.com/machine-learning/glossary/#epoch) of the test data. In the following code cell, we iterate over each example in the test set and compare the model's prediction against the actual label. This is used to measure the model's accuracy across the entire test set." + "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한번의 [epoch](https://developers.google.com/machine-learning/glossary/#epoch)을 진행합니다. 다음의 코드셀은 테스트 셋을 반복하여 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터셋에 대한 정확도를 측정하는데 사용됩니다." ] }, { @@ -1014,7 +1014,7 @@ "id": "HcKEZMtCOeK-" }, "source": [ - "We can see on the last batch, for example, the model is usually correct:" + "예를들어, 마지막 배치에서 모델이 일반적으로 정확하다는 것을 확인할 수 있습니다. " ] }, { @@ -1037,12 +1037,11 @@ "id": "7Li2r1tYvW7S" }, "source": [ - "## Use the trained model to make predictions\n", - "\n", - "We've trained a model and \"proven\" that it's good—but not perfect—at classifying Iris species. Now let's use the trained model to make some predictions on [unlabeled examples](https://developers.google.com/machine-learning/glossary/#unlabeled_example); that is, on examples that contain features but not a label.\n", + "## 예측을 위해 훈련 된 모델 사용하기\n", "\n", - "In real-life, the unlabeled examples could come from lots of different sources including apps, CSV files, and data feeds. For now, we're going to manually provide three unlabeled examples to predict their labels. Recall, the label numbers are mapped to a named representation as:\n", + "우리는 이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)들을 예측해봅시다.\n", "\n", + "실제로는 레이블되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접제공 등)로 부터 제공될 수 있습니다. 지금은 레이블을 예측하기위해 수동으로 3개의 레이블되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃이름으로 맵핑되어있습니다.\n", "* `0`: Iris setosa\n", "* `1`: Iris versicolor\n", "* `2`: Iris virginica" diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 89f6487d193..707b4f180c8 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -88,7 +88,7 @@ "source": [ "## 텐서플로우 임포트\n", "\n", - "시작하기 위해서 텐서플로우 모듈을 임포트하고 즉시실행을 활성화합니다. 즉시실행으로 텐서플로우에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." + "시작하기 위해서 텐서플로우 모듈을 임포트하고 즉시실행(eager execution)을 활성화합니다. 즉시실행 활성화로 텐서플로우에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." ] }, { @@ -108,7 +108,7 @@ ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "H9UySOPLXdaw" @@ -116,7 +116,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로우는 텐서를 생성하고 계산하는 풍부한 연산자 라이브러리를 제공합니다. ([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.). 이러한 연산자들은 자동적으로 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로우는 텐서를 생성하고 계산하는 풍부한 연산 라이브러리를 제공합니다. ([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.). 이러한 연산자들은 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" ] }, { @@ -166,7 +166,7 @@ ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "eBPw8e8vrsom" @@ -174,26 +174,26 @@ "source": [ "넘파이 배열과 텐서의 가장 확실한 차이는 다음과 같습니다:\n", "\n", - "1. 가속기 메모리(GPU, TPU와 같은)로 텐서를 뒷받침할 수 있습니다. \n", + "1. 텐서는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", "2. 텐서는 불변성(immutable)을 가집니다." ] }, { - "cell_type": "markdown", + "cell_type": "raw", "metadata": { "colab_type": "text", "id": "Dwi1tdW3JBw6" }, "source": [ - "### NumPy 적합성\n", + "### 넘파이 적합성\n", "\n", "Tensor와 ndarray사이의 전환은 다소 간단합니다.\n", "\n", - "* 텐서플로우 연산자는 자동적으로 Numpy ndarray를 Tensor로 전환합니다.\n", - "* 넘파이 연산자는 자동적으로 텐서플로우 텐서를 넘이파 ndarray로 전환합니다.\n", + "* 텐서플로우 연산는 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", + "* 넘파이 연산는 자동적으로 텐서플로우 Tensor를 넘파이 ndarray로 전환합니다.\n", "\n", - "텐서는 `.numpy()` 메소드(method)를 호출하여 Numpy ndarray로 전환할 수 있습니다.\n", - "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." + "Tensor는 `.numpy()` 메소드(method)를 호출하여 넘파이 ndarray로 전환할 수 있습니다.\n", + "가능한 경우, Tensor와 ndarray은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 Tensor는 GPU 메모리에 저장될 수 있고, 넘파이 ndarray은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." ] }, { @@ -223,15 +223,15 @@ ] }, { - "cell_type": "markdown", + "cell_type": "raw", "metadata": { "colab_type": "text", "id": "PBNP8yTRfu_X" }, "source": [ - "## GPU acceleration\n", + "## GPU 가속기\n", "\n", - "Many TensorFlow operations can be accelerated by using the GPU for computation. Without any annotations, TensorFlow automatically decides whether to use the GPU or CPU for an operation (and copies the tensor between CPU and GPU memory if necessary). Tensors produced by an operation are typically backed by the memory of the device on which the operation executed. For example:" + "많은 텐서플로우 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로우는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 Tensor를 복사합니다.) 명령에 의해 생성된 Tensor는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를들어:" ] }, { @@ -261,9 +261,9 @@ "id": "vpgYzgVXW2Ud" }, "source": [ - "### Device Names\n", + "### 장치 이름\n", "\n", - "The `Tensor.device` property provides a fully qualified string name of the device hosting the contents of the tensor. This name encodes many details, such as an identifier of the network address of the host on which this program is executing and the device within that host. This is required for distributed execution of a TensorFlow program. The string ends with `GPU:` if the tensor is placed on the `N`-th GPU on the host." + "`Tensor.device`는 Tensor를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로우 프로그램의 분산 실행에 필요합니다. Tensor가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:` 끝납니다." ] }, { @@ -275,9 +275,9 @@ "source": [ "\n", "\n", - "### Explicit Device Placement\n", + "### 명시적 장치 배치\n", "\n", - "The term \"placement\" in TensorFlow refers to how individual operations are assigned (placed on) a device for execution. As mentioned above, when there is no explicit guidance provided, TensorFlow automatically decides which device to execute an operation, and copies Tensors to that device if needed. However, TensorFlow operations can be explicitly placed on specific devices using the `tf.device` context manager. For example:" + "텐서플로우에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로우는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 Tensor를 장치에 복사합니다. 그러나 텐서플로우 명령은 `tf.device`을 사용하여 명시적으로 배치할 수 있습니다. 예를 들어:" ] }, { @@ -324,18 +324,18 @@ "id": "o1K4dlhhHtQj" }, "source": [ - "## Datasets\n", + "## 데이터셋\n", "\n", - "This section demonstrates the use of the [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets) to build pipelines to feed data to your model. It covers:\n", + "이번 섹션에서는 모델에 데이터를 제공하기위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", "\n", - "* Creating a `Dataset`.\n", - "* Iteration over a `Dataset` with eager execution enabled.\n", + "* `Dataset` 생성.\n", + "* 즉시실행(eager execution) 활성화와 `Dataset`을 통한 반복\n", "\n", - "We recommend using the `Dataset`s API for building performant, complex input pipelines from simple, re-usable pieces that will feed your model's training or evaluation loops.\n", + "모델을 학습시키고, 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터 복잡한 입력 파이프라인을 구축하기위해 `Dataset`s API를 사용하기를 권장합니다. \n", "\n", - "If you're familiar with TensorFlow graphs, the API for constructing the `Dataset` object remains exactly the same when eager execution is enabled, but the process of iterating over elements of the dataset is slightly simpler.\n", - "You can use Python iteration over the `tf.data.Dataset` object and do not need to explicitly create an `tf.data.Iterator` object.\n", - "As a result, the discussion on iterators in the [TensorFlow Guide](https://www.tensorflow.org/guide/datasets) is not relevant when eager execution is enabled." + "만약 텐서플로우 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", + "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", + "그 결과, [TensorFlow Guide](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시실행이 활성화될 때에는 관계없습니다. " ] }, { @@ -345,9 +345,9 @@ "id": "zI0fmOynH-Ne" }, "source": [ - "### Create a source `Dataset`\n", + "### `Dataset`소스 생성\n", "\n", - "Create a _source_ dataset using one of the factory functions like [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices) or using objects that read from files like [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) or [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset). See the [TensorFlow Guide](https://www.tensorflow.org/guide/datasets#reading_input_data) for more information." + "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 or 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하십시오. 더 많은 정보는 [TensorFlow Guide](https://www.tensorflow.org/guide/datasets#reading_input_data) 를 참조하세요." ] }, { @@ -382,9 +382,9 @@ "id": "vbxIhC-5IPdf" }, "source": [ - "### Apply transformations\n", + "### 변환 적용\n", "\n", - "Use the transformations functions like [`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle) etc. to apply transformations to the records of the dataset. See the [API documentation for `tf.data.Dataset`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset) for details." + "[`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)와 같은 변환 함수를 사용하세요. 또한 데이터셋의 레코드에 변환을 적용하세요. 세부사항은 [API documentation for `tf.data.Dataset`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." ] }, { @@ -409,10 +409,9 @@ "id": "A8X1GNfoIZKJ" }, "source": [ - "### Iterate\n", + "### 반복\n", "\n", - "When eager execution is enabled `Dataset` objects support iteration.\n", - "If you're familiar with the use of `Dataset`s in TensorFlow graphs, note that there is no need for calls to `Dataset.make_one_shot_iterator()` or `get_next()` calls." + "즉시실행이 활성화되면 `Dataset` 객체는 반복을 지원합니다. 만약 텐서플로우 그래프에서 `Dataset`을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." ] }, { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 9c28180b352..d78212b1af4 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -1,13 +1,21 @@ -# Research and experimentation +# 연구 및 실험 -Eager execution provides an imperative, define-by-run interface for advanced -operations. Write custom layers, forward passes, and training loops with -auto differentiation. Start with these notebooks, then read the +이 문서들은 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도 +불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다. +이 번역에 개선할 부분이 있다면 +[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다. +문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을 +작성하거나 +[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로 +메일을 보내주시기 바랍니다. + +즉시실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. +사용자 정의 레이어, 정방향 전파, 자동미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. [eager execution guide](../../guide/eager). -1. [Eager execution](eager_basics.ipynb) +1. [즉시실행(Eager execution)](eager_basics.ipynb) 2. [Automatic differentiation and gradient tape](automatic_differentiation.ipynb) -3. [Custom training: basics](custom_training.ipynb) -4. [Custom layers](custom_layers.ipynb) -5. [Custom training: walkthrough](custom_training_walkthrough.ipynb) +3. [사용자 정의 학습 : 기본(Custom training: basics)](custom_training.ipynb) +4. [사용자 정의 레이어(Custom layers)](custom_layers.ipynb) +5. [사용자 정의 학습 : walkthrough(Custom training: walkthrough)](custom_training_walkthrough.ipynb) From 36b87943cde0a01140da25ce208d22daf6bf93c1 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Mon, 1 Apr 2019 14:16:24 +0900 Subject: [PATCH 04/19] Update from 9cdb7f90 --- .../eager/automatic_differentiation.ipynb | 13 ++-- site/ko/tutorials/eager/custom_layers.ipynb | 20 +++--- site/ko/tutorials/eager/custom_training.ipynb | 12 ++-- .../eager/custom_training_walkthrough.ipynb | 61 +++++++++---------- site/ko/tutorials/eager/eager_basics.ipynb | 32 +++++----- 5 files changed, 67 insertions(+), 71 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index de7ea83a46b..857cbc3d65d 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -41,7 +41,7 @@ "id": "xh8WkEwWpnm7" }, "source": [ - "# 자동미분(Automatic differentiation) 과 그래디언트 테이프" + "# 자동미분(Automatic Differentiation)과 그래디언트 테이프(Gradient Tape)" ] }, { @@ -71,7 +71,7 @@ "id": "vDJ4XzMqodTy" }, "source": [ - "이전 튜토리얼에서 우리는 Tensor와 Tensor의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + "이전 튜토리얼에서 우리는 Tensor와 Tensor의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." ] }, { @@ -108,7 +108,7 @@ "source": [ "## 그래디언트 테이프(Gradient Tape)\n", "\n", - "텐서플로우는 자동미분(주어진 입력 변수에 따른 기울기 연산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 기록된 연산의 그래디언트를 계산하기 위해 각각의 기록된 연산들과 관련된 테이프와 그래디언트들을 사용합니다. \n", + "텐서플로우는 자동미분(주어진 입력 변수에 따른 그래디언트 연산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산들과 관련된 테이프와 그래디언트들을 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", "\n", "예를 들면:" ] @@ -165,7 +165,6 @@ " z = tf.multiply(y, y)\n", "\n", "# 중간값 y에 관한 z의 도함수 계산을 위한 테이프 사용\n", - "# intermediate value y.\n", "dz_dy = t.gradient(z, y)\n", "assert dz_dy.numpy() == 8.0" ] @@ -209,7 +208,7 @@ "source": [ "### 제어흐름(Control Flow) 기록\n", "\n", - "테이프가 실행되는데로 연산을 기록하기 때문에, 파이썬 제어흐름(예를 들어 `if` `while`, `for`문 같은)은 자연스럽게 처리됩니다. " + "테이프를 실행하는 순간부터 연산을 기록하기 때문에, 파이썬 제어흐름(예를 들어 `if` `while`, `for`문 같은)은 자연스럽게 처리됩니다. " ] }, { @@ -287,7 +286,7 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 텐서플로우에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보 할 수 있습니다." + "이번 튜토리얼에서는 텐서플로우에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보할 수 있습니다." ] } ], @@ -315,7 +314,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.5" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index 97091da1efb..e57583018b7 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -102,7 +102,7 @@ "\n", "많은 머신러닝 모델은 비교적 단순한 레이어의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로우는 여러 표준 레이어 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 레이어를 처음부터 작성하거나, 기존 레이어의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", - "텐서플로우는 [Keras](https://keras.io) API 의 풀페키지를 tf.keras package에 포함하고 있습니다. Keras 레이어는 모델을 구축하는데 매우 유용합니다." + "텐서플로우는 [Keras](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. Keras 레이어는 모델을 구축하는데 매우 유용합니다." ] }, { @@ -186,11 +186,11 @@ "source": [ "## 사용자 정의 레이어 구현\n", "사용자 정의 레이어를 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", - " * `__init__` , 여기서 모든 입력 독립적인 초기화를 할 수 있습니다.\n", - " * `build`, 입력 텐서의 형태를 알고 나머지를 초기화 할 수 있습니다.\n", + " * `__init__` , 모든 독립적인 입력값을 초기화를 할 수 있습니다.\n", + " * `build`, 입력 Tensor의 형태를 알고 나머지를 초기화 할 수 있습니다.\n", " * `call`, 정방향 계산을 진행 할 수 있습니다.\n", "\n", - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 레이어가 작동할 입력의 형태를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 형태가 명시적으로 지정되어야 함을 의미합니다.변수를 생성하는 데 필요한 모양이 명시적으로 지정되어야 함을 의미합니다." + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 레이어가 작동할 입력의 형태를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 형태가 명시적으로 지정되어야 함을 의미합니다." ] }, { @@ -230,7 +230,7 @@ "source": [ "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. \n", "\n", - "다른 독자가 표준 레이어의 동작을 잘 알고 있기 때문에, 가능한 경우 표준 레이어를 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers, tf.keras.layers 또는 tf.contrib.layers에 없는 레이어를 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." + "다른 독자가 표준 레이어의 동작을 잘 알고 있기 때문에, 가능한 경우 표준 레이어를 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 레이어를 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." ] }, { @@ -242,9 +242,9 @@ "source": [ "## 모델: 레이어 구성\n", "\n", - "머신러닝 모델에서 많은 흥미로운 유사 레이어(layer-likely)는 레이어들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 residual block은 합성곱(convolution), 배치정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", + "머신러닝 모델에서 대부분의 흥미로운 유사 레이어(layer-likely)는 레이어들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여블록(residual block)은 합성곱(convolution), 배치정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", "\n", - "레이어 집합을 포함한 유사 레이어를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(Inheritance)하여 구현합니다." + "레이어 집합을 포함한 유사 레이어를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." ] }, { @@ -313,7 +313,7 @@ ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "c5YwYcnuK-wc" @@ -321,7 +321,7 @@ "source": [ "# 다음 단계\n", "\n", - "이제 여러분들은 이전 노트북으로 돌아가서 선형 회귀 예제에 레이어와 모델을 적용하여 좀 더 나은 구조를 만들 수 있습니다." + "이제 여러분들은 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 레이어와 모델을 적용할 수 있습니다." ] } ], @@ -349,7 +349,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.5" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index 56c0ab00fa9..05b1c35e536 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -41,7 +41,7 @@ "id": "hrXv0rU9sIma" }, "source": [ - "# 사용자 지정 학습: 기초" + "# 사용자 정의 학습: 기초" ] }, { @@ -200,7 +200,7 @@ "3. 훈련 데이터 가져오기\n", "4. 훈련 데이터를 통한 실행, 데이터에 최적화하기 위한 \"옵티마이저(optimizer)\" 사용한 변수 조정\n", "\n", - "이번 튜토리얼에서는 선형모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, `W` and `b` 두 변수를 가지고 있는 선형모델입니다. 더욱이 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 데이터를 합성할 것입니다." + "이번 튜토리얼에서는 선형모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, 위 모델은 `W` 와 `b` 두 변수를 가지고 있는 선형모델이며, 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 데이터를 합성할 것입니다." ] }, { @@ -249,7 +249,7 @@ "source": [ "### 손실 함수 정의\n", "\n", - "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지 측정합니다. L2 규제항(regularization)을 적용한 손실 함수를 사용하겠습니다." + "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지를 측정합니다. L2 규제항(regularization)을 적용한 손실 함수를 사용하겠습니다." ] }, { @@ -354,7 +354,7 @@ "source": [ "### 훈련 루프 정의\n", "\n", - "현재 우리는 네트워크와 훈련 데이터를 가지고 있습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시킵니다. 그리고 [gradient descent](https://en.wikipedia.org/wiki/Gradient_descent)를 사용하여 손실을 감소시킵니다. 경사하강에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." + "현재 우리는 네트워크와 훈련 데이터를 가지고 있습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시킵니다. 그리고 [경사하강(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)를 사용하여 손실을 감소시킵니다. 경사하강에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." ] }, { @@ -397,7 +397,7 @@ "source": [ "model = Model()\n", "\n", - "# Collect the history of W-values and b-values to plot later\n", + "# 도식화를 위해 W값과 b값들의 변화를 저장합니다.\n", "Ws, bs = [], []\n", "epochs = range(10)\n", "for epoch in epochs:\n", @@ -458,7 +458,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.5" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index cc5f9e4f43a..7f2e6e9ae25 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -80,7 +80,7 @@ "\n", "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로우의 개념들을 사용합니다.\n", "\n", - "* 즉시실행([eager execution])(https://www.tensorflow.org/guide/eager) 개발환경,\n", + "* [즉시실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발환경,\n", "* [Datasets API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", "* [Keras API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 레이어(layer) 구축 .\n", "\n", @@ -112,7 +112,7 @@ "source": [ "### 임포트 및 즉시실행 구성\n", "\n", - "텐서플로우를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로우가 나중에 실행되는 [computational graph](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로우를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로우가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", "\n", "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [eager execution guide](https://www.tensorflow.org/guide/eager)을 참조하세요." ] @@ -149,7 +149,7 @@ "source": [ "## 붓꽃 분류 문제\n", "\n", - "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 우리의 목적은 좀 더 겸손하게 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는것입니다.\n", + "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 우리의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는것입니다.\n", "\n", "이 붓꽃은 약 300종 입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", "\n", @@ -163,11 +163,11 @@ " alt=\"Petal geometry compared for three iris species: Iris setosa, Iris virginica, and Iris versicolor\">\n", " \n", " \n", - " Figure 1. Iris setosa (by Radomil, CC BY-SA 3.0), Iris versicolor, (by Dlanglois, CC BY-SA 3.0), and Iris virginica (by Frank Mayfield, CC BY-SA 2.0).
 \n", + " 그림 1. Iris setosa (by Radomil, CC BY-SA 3.0), Iris versicolor, (by Dlanglois, CC BY-SA 3.0), and Iris virginica (by Frank Mayfield, CC BY-SA 2.0).
 \n", " \n", "\n", "\n", - "다행이도 다른사람들이 먼저 꽃받침과 꽃임이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " + "다행히도 다른사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류문제에 있어 초보자들에게 유명한 고전 데이터셋입니다. " ] }, { @@ -239,9 +239,9 @@ "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", "1. 첫번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 예가 있다. 각 예들은 4가지의 특성(feature)을 가지며 3가지 가능한 레이블(label)을 가지고 있습니다.\n", + " * 총 120개의 예가 있으며, 각 예들은 4가지의 특성(feature), 3가지 가능한 레이블(label)을 가지고 있다.\n", "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", - " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드는 붓꽃의 측정값을 나타내는 부동소수점을 나타냅니다.\n", + " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 우리가 에측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", "\n", "코드로 표현하면 다음과 같습니다.:" @@ -257,7 +257,7 @@ }, "outputs": [], "source": [ - "# column order in CSV file\n", + "# CSV파일내에서 컬럼의 순서\n", "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", "\n", "feature_names = column_names[:-1]\n", @@ -280,7 +280,7 @@ "* `1`: Iris versicolor\n", "* `2`: Iris virginica\n", "\n", - "특성과 레이블에 관한 더 많은 정보를 위해서 다음을 참조하세요. [ML Terminology section of the Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)." + "특성과 레이블에 관한 더 많은 정보를 위해서는 다음을 참조하세요. [ML Terminology section of the Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)." ] }, { @@ -308,7 +308,7 @@ "텐서플로우의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", "\n", "\n", - "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 배치 사이즈[batch_size](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." + "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." ] }, { @@ -338,9 +338,8 @@ "id": "gB_RSn62c-3G" }, "source": [ - "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍을 반환합니다., where \n", - "`features` 가 사전형 객체인: `{'feature_name': value}`로 주어집니다.\n", - "즉시실행 활성화로 이 `Dataset`은 반복가능합니다. 특성(feature)을 살펴봅시다." + "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍을 반환합니다. `features`는 사전형 객체인: `{'feature_name': value}`로 주어집니다.\n", + "또한 즉시실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)들을 살펴봅시다." ] }, { @@ -396,7 +395,7 @@ "id": "YlxpSyHlhT6M" }, "source": [ - "모델 구축단계를 단순화하기 위해서, 특성 사전 객체를 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", + "모델 구축단계를 단순화하기 위해서, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", "이 함수는 `Tensor`의 list로부터 값을 취하고 특정한 차원으로 결합된 `Tensor`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메소드(method)를 사용합니다." ] @@ -478,11 +477,11 @@ "\n", " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)들과 레이블(label)과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", "\n", - "머신러닝을 사용하지 않고 4가지의 특성사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 아마 여러분들이 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문들)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 여러분들을 위한 모델을 결정합니다. 만약 여러분들이 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 여러분들을 위한 특성들간의 관계를 이해합니다. \n", + "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 여러분들이 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문들)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 여러분들을 위한 모델을 결정합니다. 만약 여러분들이 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 여러분들을 위한 특성들 사이의 관계를 이해하고 제공합니다. \n", "\n", "### 모델 선정\n", "\n", - "우리는 학습을 위한 모델의 종류를 선정해야합니다. 여러정류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡환 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*들로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전연결 신경망(fully-connected neural network)는 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전연결 신경망입니다. \n", + "우리는 학습을 위한 모델의 종류를 선정해야합니다. 여러정류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*들로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전연결 신경망입니다. \n", "\n", "\n", " \n", "
\n", @@ -494,7 +493,7 @@ "
\n", "\n", - "그림 2의 모델이 훈련되고 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지 예측을 출력(주어진 레이블의 개수)합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 정의합니다. 이 예제에서 출력의 합은 1.0입니다. 그림 2에서 예측은 `0.02` for *Iris setosa*, `0.95` for *Iris versicolor*, `0.03` for *Iris virginica*로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " + "그림 2의 모델이 훈련되고 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지 예측을 출력(주어진 레이블의 개수)합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 정의합니다. 이 예제에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " ] }, { @@ -506,7 +505,7 @@ "source": [ "### Keras를 사용한 모델 생성\n", "\n", - "텐서플로우의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 레이어를 생성하기위한 풍부한 라이브러리를 가지고있습니다. 이는 연결되있는 모든것들을 케라스가 처리하여 모델의 구축하기 쉽게 만듭니다.\n", + "텐서플로우의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 레이어를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것들을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", "\n", "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 레이어의 선형 적층 모델입니다. 이 구조는 레이어의 인스턴스를 취하며, 아래의 케이스의 경우 각 레이어당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense) 레이어와 3개의 예측(레이블의 개수)노드를 가지는 출력 레이어로 구성되어있습니다. 첫번째 레이어의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] @@ -624,9 +623,9 @@ "source": [ "## 모델 훈련하기\n", "\n", - "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는것 입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면, 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들것입니다. 이러한 문제를 *[overfitting](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기 보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", + "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면, 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", "\n", - "붓꽃 분류 문제는 지도학습 *[지도학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고있지않습니다. 대신에 모델은 특성들의 패턴을 찾습니다. " + "붓꽃 분류 문제는 지도학습 *[지도학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지않습니다. 대신에 모델은 특성들의 패턴을 찾습니다. " ] }, { @@ -640,7 +639,7 @@ "\n", "훈련과 평가단계는 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)* 계산할 필요가 있습니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 우리는 이 값은 최소화하고, 최적화하기를 원합니다. \n", "\n", - "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용하여 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(logit)을 입력받아 예제를 통한 평균 손실을 반환합니다." + "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용하여 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 예제를 통한 평균 손실을 반환합니다." ] }, { @@ -695,9 +694,9 @@ "id": "lOxFimtlKruu" }, "source": [ - "### Optimizer 생성 \n", + "### 옵티마이저(Optimizer) 생성 \n", "\n", - "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실`함수를 최소화하기위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 우리는 이 함수의 최저점을 찾고자합니다. The gradients point in the direction of steepest ascent—so we'll travel the opposite way and move down the hill. By iteratively calculating the loss and gradient for each batch, we'll adjust the model during training. Gradually, the model will find the best combination of weights and bias to minimize loss. And the lower the loss, the better the model's predictions.\n", + "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실`함수를 최소화하기위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 우리는 이 함수의 최저점을 찾고자합니다. 그래디언트는 가장 가파른 상승방향을 가르키며 따라서 우리는 반대방향으로 이동하는 여행을 합니다.각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련 중에 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 더 적은 손실을 통해 더 좋은 모델의 예측을 기대할 수 있습니다. \n", "\n", "\n", " \n", " \n", "
\n", @@ -705,7 +704,7 @@ " alt=\"Optimization algorithms visualized over time in 3D space.\">\n", "
\n", - " Figure 3. Optimization algorithms visualized over time in 3D space.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", + " 그림 3. Optimization algorithms visualized over time in 3D space.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", "
\n", "\n", @@ -777,16 +776,16 @@ "source": [ "### 훈련 루프\n", "\n", - "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 나은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 다음의 훈련 단계를 작성한 것입니다. \n", + "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 나은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", "\n", - "1. 각 *에포크(epoch)* 반복. 에포크(epoch)는 데이터셋을 통과시키는 횟수입니다. \n", - "2. epoch내에서, `Dataset`의 *features* (`x`)와 *label* (`y`)를 가져오는 예제를 반복합니다.\n", + "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", + "2. 에포크내에서, `Dataset`의 *features* (`x`)와 *label* (`y`)를 가져오는 예제를 반복합니다.\n", "3. 예제의 특성을 사용하여 결과를 예측을 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기위해 사용합니다. \n", "4. 모델의 변수를 업데이트하기위해 `옵티마이저(optimizer)`를 사용합니다. \n", "5. 시각화를 위해 몇가지 값을 추적합니다.\n", - "6. 각 epoch를 반복합니다.\n", + "6. 각 에포크를 반복합니다.\n", "\n", - "`num_epochs` 변수는 데이터셋 반복 회수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 여러분들이 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 회수를 선택하는것은 경험과 직관을 필요로 합니다. " + "`num_epochs` 변수는 데이터셋 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 여러분들이 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 경험과 직관을 필요로 합니다. " ] }, { @@ -1037,7 +1036,7 @@ "id": "7Li2r1tYvW7S" }, "source": [ - "## 예측을 위해 훈련 된 모델 사용하기\n", + "## 예측을 위해 훈련된 모델 사용하기\n", "\n", "우리는 이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)들을 예측해봅시다.\n", "\n", @@ -1097,7 +1096,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.5" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 707b4f180c8..5ad8297237a 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -71,7 +71,7 @@ "id": "6sILUVbHoSgH" }, "source": [ - "이것은 텐서플로우를 사용하기위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", + "이 노트북은 텐서플로우를 사용하기 위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", "\n", "* 필요한 패키지 임포트\n", "* 텐서(Tensor) 생성 및 사용\n", @@ -172,14 +172,14 @@ "id": "eBPw8e8vrsom" }, "source": [ - "넘파이 배열과 텐서의 가장 확실한 차이는 다음과 같습니다:\n", + "넘파이 `ndarray`와 `Tensor`의 가장 확실한 차이는 다음과 같습니다:\n", "\n", - "1. 텐서는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", - "2. 텐서는 불변성(immutable)을 가집니다." + "1. `Tensor`는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", + "2. `Tensor`는 불변성(immutable)을 가집니다." ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "Dwi1tdW3JBw6" @@ -187,7 +187,7 @@ "source": [ "### 넘파이 적합성\n", "\n", - "Tensor와 ndarray사이의 전환은 다소 간단합니다.\n", + "`Tensor`와 `ndarray`사이의 전환은 다소 간단합니다.\n", "\n", "* 텐서플로우 연산는 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", "* 넘파이 연산는 자동적으로 텐서플로우 Tensor를 넘파이 ndarray로 전환합니다.\n", @@ -223,7 +223,7 @@ ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "PBNP8yTRfu_X" @@ -231,7 +231,7 @@ "source": [ "## GPU 가속기\n", "\n", - "많은 텐서플로우 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로우는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 Tensor를 복사합니다.) 명령에 의해 생성된 Tensor는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를들어:" + "대부분의 텐서플로우 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로우는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 Tensor를 복사합니다.) 명령에 의해 생성된 Tensor는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를들어:" ] }, { @@ -273,11 +273,9 @@ "id": "ZWZQCimzuqyP" }, "source": [ - "\n", - "\n", "### 명시적 장치 배치\n", "\n", - "텐서플로우에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로우는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 Tensor를 장치에 복사합니다. 그러나 텐서플로우 명령은 `tf.device`을 사용하여 명시적으로 배치할 수 있습니다. 예를 들어:" + "텐서플로우에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로우는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 Tensor를 장치에 복사합니다. 그러나 텐서플로우 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" ] }, { @@ -302,16 +300,16 @@ " print(\"10 loops: {:0.2f}ms\".format(1000*result))\n", "\n", "\n", - "# Force execution on CPU\n", + "# CPU에 강제실행\n", "print(\"On CPU:\")\n", "with tf.device(\"CPU:0\"):\n", " x = tf.random_uniform([1000, 1000])\n", " assert x.device.endswith(\"CPU:0\")\n", " time_matmul(x)\n", "\n", - "# Force execution on GPU #0 if available\n", + "# 이용가능시 GPU #0에 강제실행\n", "if tf.test.is_gpu_available():\n", - " with tf.device(\"GPU:0\"): # Or GPU:1 for the 2nd GPU, GPU:2 for the 3rd etc.\n", + " with tf.device(\"GPU:0\"): # 또는 GPU:1, GPU:2\n", " x = tf.random_uniform([1000, 1000])\n", " assert x.device.endswith(\"GPU:0\")\n", " time_matmul(x)" @@ -326,7 +324,7 @@ "source": [ "## 데이터셋\n", "\n", - "이번 섹션에서는 모델에 데이터를 제공하기위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", + "이번 섹션에서는 모델에 데이터를 제공하기 위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", "\n", "* `Dataset` 생성.\n", "* 즉시실행(eager execution) 활성화와 `Dataset`을 통한 반복\n", @@ -347,7 +345,7 @@ "source": [ "### `Dataset`소스 생성\n", "\n", - "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 or 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하십시오. 더 많은 정보는 [TensorFlow Guide](https://www.tensorflow.org/guide/datasets#reading_input_data) 를 참조하세요." + "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 or 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하세요. 더 많은 정보는 [TensorFlow Guide](https://www.tensorflow.org/guide/datasets#reading_input_data) 를 참조하세요." ] }, { @@ -458,7 +456,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.5" + "version": "3.7.1" } }, "nbformat": 4, From bdfcfeb1c1cec491ce016b71f3043ceda0718343 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Tue, 2 Apr 2019 00:48:26 +0900 Subject: [PATCH 05/19] Update from 09ecc41b --- .../eager/automatic_differentiation.ipynb | 8 ++--- site/ko/tutorials/eager/custom_layers.ipynb | 36 +++++++++---------- site/ko/tutorials/eager/custom_training.ipynb | 16 ++++----- .../eager/custom_training_walkthrough.ipynb | 28 +++++++-------- site/ko/tutorials/eager/eager_basics.ipynb | 24 ++++++------- site/ko/tutorials/eager/index.md | 4 +-- 6 files changed, 58 insertions(+), 58 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index 857cbc3d65d..6a089c90f27 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -108,7 +108,7 @@ "source": [ "## 그래디언트 테이프(Gradient Tape)\n", "\n", - "텐서플로우는 자동미분(주어진 입력 변수에 따른 그래디언트 연산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산들과 관련된 테이프와 그래디언트들을 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", + "텐서플로는 자동미분(주어진 입력 변수에 따른 그래디언트 연산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산들과 관련된 테이프와 그래디언트들을 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", "\n", "예를 들면:" ] @@ -176,7 +176,7 @@ "id": "ISkXuY7YzIcS" }, "source": [ - "초기값으로 GradientTape.gradient() 메소드가 호출되면 GradientTape에 포함된 리소스가 해체되게 설정돼있습니다. 동일한 연산을 통해서 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. `persistent`는 `gradient()` 메소드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다." + "초기값으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해체되게 설정돼있습니다. 동일한 연산을 통해서 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. `persistent`는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다." ] }, { @@ -263,7 +263,7 @@ }, "outputs": [], "source": [ - "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로우 변수 생성\n", + "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로 변수 생성\n", "\n", "with tf.GradientTape() as t:\n", " with tf.GradientTape() as t2:\n", @@ -286,7 +286,7 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 텐서플로우에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보할 수 있습니다." + "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보할 수 있습니다." ] } ], diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index e57583018b7..ed568418a66 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -41,7 +41,7 @@ "id": "60RdWsg1tETW" }, "source": [ - "# 사용자 정의 레이어" + "# 사용자 정의 layer" ] }, { @@ -71,7 +71,7 @@ "id": "UEu3q4jmpKVT" }, "source": [ - "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로우 API는 즉시실행(eager execution)을 활성화할 수 있습니다." + "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시실행(eager execution)을 활성화할 수 있습니다." ] }, { @@ -96,13 +96,13 @@ "id": "zSFfVVjkrrsI" }, "source": [ - "## 레이어(layer): 유용한 연산자 집합\n", + "## layer: 유용한 연산자 집합\n", "\n", "머신러닝을 위한 코드를 작성하는 대부분의 시간에 우리는, 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", "\n", - "많은 머신러닝 모델은 비교적 단순한 레이어의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로우는 여러 표준 레이어 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 레이어를 처음부터 작성하거나, 기존 레이어의 구성으로 쉽게 작성할 수 있습니다.\n", + "많은 머신러닝 모델은 비교적 단순한 layer의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준 레이어 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 레이어를 처음부터 작성하거나, 기존 레이어의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", - "텐서플로우는 [Keras](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. Keras 레이어는 모델을 구축하는데 매우 유용합니다." + "텐서플로는 [Keras](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. Keras layer는 모델을 구축하는데 매우 유용합니다." ] }, { @@ -115,8 +115,8 @@ }, "outputs": [], "source": [ - "# tf.keras.layers 패키지에서 레이어는 객체입니다. 레이어를 구성하려면 간단히 객체를 생성하십시오.\n", - "# 대부분의 레이어는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", + "# tf.keras.layers 패키지에서 layer는 객체입니다. layer를 구성하려면 간단히 객체를 생성하십시오.\n", + "# 대부분의 layer는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", "layer = tf.keras.layers.Dense(100)\n", "# 입력 차원의 수는 유추될 수 있기 때문에 종종 불필요합니다. \n", "# 일부 복잡한 모델에서는 수동으로 입력 차원의 수를 제공하는것이 유용할 수 있습니다.\n", @@ -130,7 +130,7 @@ "id": "Fn69xxPO5Psr" }, "source": [ - "미리 구성되어있는 레이어는 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense, Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." + "미리 구성되어있는 layer는 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense, Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." ] }, { @@ -143,7 +143,7 @@ }, "outputs": [], "source": [ - "# 레이어를 사용하기 위해서 간단하게 호출합니다.\n", + "# layer를 사용하기 위해서 간단하게 호출합니다.\n", "layer(tf.zeros([10, 5]))" ] }, @@ -157,7 +157,7 @@ }, "outputs": [], "source": [ - "# 레이어는 유용한 메소드들을 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 레이어안에 있는 모든 변수들을 확인할 수 있으며, \n", + "# layer는 유용한 메서드들을 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 layer안에 있는 모든 변수들을 확인할 수 있으며, \n", "# `layer.trainable_variables`를 사용하여 학습가능한 변수들을 확인할 수 있습니다. \n", "# 이번 케이스에서 완전 연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" @@ -184,13 +184,13 @@ "id": "O0kDbE54-5VS" }, "source": [ - "## 사용자 정의 레이어 구현\n", - "사용자 정의 레이어를 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", + "## 사용자 정의 layer 구현\n", + "사용자 정의 layer를 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", " * `__init__` , 모든 독립적인 입력값을 초기화를 할 수 있습니다.\n", " * `build`, 입력 Tensor의 형태를 알고 나머지를 초기화 할 수 있습니다.\n", " * `call`, 정방향 계산을 진행 할 수 있습니다.\n", "\n", - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 레이어가 작동할 입력의 형태를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 형태가 명시적으로 지정되어야 함을 의미합니다." + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 layer가 작동할 입력의 형태를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 형태가 명시적으로 지정되어야 함을 의미합니다." ] }, { @@ -230,7 +230,7 @@ "source": [ "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. \n", "\n", - "다른 독자가 표준 레이어의 동작을 잘 알고 있기 때문에, 가능한 경우 표준 레이어를 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 레이어를 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." + "다른 독자가 표준 layer의 동작을 잘 알고 있기 때문에, 가능한 경우 표준 layer를 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 layer를 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." ] }, { @@ -240,11 +240,11 @@ "id": "Qhg4KlbKrs3G" }, "source": [ - "## 모델: 레이어 구성\n", + "## 모델: layer 구성\n", "\n", - "머신러닝 모델에서 대부분의 흥미로운 유사 레이어(layer-likely)는 레이어들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여블록(residual block)은 합성곱(convolution), 배치정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", + "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 layer들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여블록(residual block)은 합성곱(convolution), 배치정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", "\n", - "레이어 집합을 포함한 유사 레이어를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." + "layer 집합을 포함한 유사 layer를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." ] }, { @@ -321,7 +321,7 @@ "source": [ "# 다음 단계\n", "\n", - "이제 여러분들은 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 레이어와 모델을 적용할 수 있습니다." + "이제 여러분들은 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 layer와 모델을 적용할 수 있습니다." ] } ], diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index 05b1c35e536..bdd634433a4 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -71,9 +71,9 @@ "id": "k2o3TTG4TFpt" }, "source": [ - "이전 튜토리얼에서 우리는 머신러닝을 위한 기초 빌딩 블록인 자동미분(automatic differentiation)을 위한 텐서플로우 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로우를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", + "이전 튜토리얼에서 우리는 머신러닝을 위한 기초 빌딩 블록인 자동미분(automatic differentiation)을 위한 텐서플로 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", "\n", - "텐서플로우는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망 API인 (`tf.keras`)를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " + "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망 API인 (`tf.keras`)를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " ] }, { @@ -119,7 +119,7 @@ "source": [ "## 변수\n", "\n", - "텐서플로우 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될 필요가 있습니다(stateful). 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 계산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " + "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될 필요가 있습니다(stateful). 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 계산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " ] }, { @@ -145,9 +145,9 @@ "id": "wfneTXy7JcUz" }, "source": [ - "그러나 텐서플로우는 상태가 변경 가능한 연산자들이 내장되어 있으며, 이 연산자들은 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로우 변수를 사용하는것이 편하고 효율적입니다. \n", + "그러나 텐서플로는 상태가 변경 가능한 연산자들이 내장되어 있으며, 이 연산자들은 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는것이 편하고 효율적입니다. \n", "\n", - "텐서플로우 변수는 값을 저장하고 텐서플로우 계산에 사용될 때 묵시적으로 저장된 값을 읽어오는 객체입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로우 변수에 저장되있는 값을 조작하는 연산자들입니다." + "텐서플로 변수는 값을 저장하고 텐서플로 계산에 사용될 때 묵시적으로 저장된 값을 읽어오는 객체입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자들입니다." ] }, { @@ -167,7 +167,7 @@ "v.assign(3.0)\n", "assert v.numpy() == 3.0\n", "\n", - "# 텐서플로우 연산자 내에서 `v` 사용 \n", + "# 텐서플로 연산자 내에서 `v` 사용 \n", "v.assign(tf.square(v))\n", "assert v.numpy() == 9.0" ] @@ -428,9 +428,9 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 `Variable`를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로우를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", + "이번 튜토리얼에서는 `Variable`를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", "\n", - "이론적으로, 이것은 머신러닝 연구에 텐서플로우를 사용하는데 필요한 대부분입니다. 실제로, 신경망에 있어 `tf.keras`와 고수준 API들은 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + "이론적으로, 이것은 머신러닝 연구에 텐서플로를 사용하는데 필요한 대부분입니다. 실제로, 신경망에 있어 `tf.keras`와 고수준 API들은 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " ] } ], diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 7f2e6e9ae25..ebfde665b95 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -76,15 +76,15 @@ "2. 모델 훈련\n", "3. 예측을 위한 모델 사용\n", "\n", - "## 텐서플로우 프로그래밍\n", + "## 텐서플로 프로그래밍\n", "\n", - "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로우의 개념들을 사용합니다.\n", + "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념들을 사용합니다.\n", "\n", "* [즉시실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발환경,\n", "* [Datasets API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", - "* [Keras API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 레이어(layer) 구축 .\n", + "* [Keras API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 layer 구축 .\n", "\n", - "이번 튜토리얼은 다른 텐서플로우 프로그램과 유사하게 구성되어있습니다.\n", + "이번 튜토리얼은 다른 텐서플로 프로그램과 유사하게 구성되어있습니다.\n", "\n", "1. 데이터 불러오기 및 분석.\n", "2. 모델 타입 선정.\n", @@ -112,7 +112,7 @@ "source": [ "### 임포트 및 즉시실행 구성\n", "\n", - "텐서플로우를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로우가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", "\n", "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [eager execution guide](https://www.tensorflow.org/guide/eager)을 참조하세요." ] @@ -305,7 +305,7 @@ "source": [ "### `tf.data.Dataset` 생성\n", "\n", - "텐서플로우의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", + "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", "\n", "\n", "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." @@ -397,7 +397,7 @@ "source": [ "모델 구축단계를 단순화하기 위해서, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", - "이 함수는 `Tensor`의 list로부터 값을 취하고 특정한 차원으로 결합된 `Tensor`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메소드(method)를 사용합니다." + "이 함수는 `Tensor`의 list로부터 값을 취하고 특정한 차원으로 결합된 `Tensor`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." ] }, { @@ -423,7 +423,7 @@ "id": "V1Vuph_eDl8x" }, "source": [ - "그 후 각 `(features,label)`쌍의 `features`을 훈련 데이터셋에 적재하기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메소드를 사용합니다. " + "그 후 각 `(features,label)`쌍의 `features`을 훈련 데이터셋에 적재하기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메서드를 사용합니다. " ] }, { @@ -505,9 +505,9 @@ "source": [ "### Keras를 사용한 모델 생성\n", "\n", - "텐서플로우의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 레이어를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것들을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", + "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 layer를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것들을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 레이어의 선형 적층 모델입니다. 이 구조는 레이어의 인스턴스를 취하며, 아래의 케이스의 경우 각 레이어당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense) 레이어와 3개의 예측(레이블의 개수)노드를 가지는 출력 레이어로 구성되어있습니다. 첫번째 레이어의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 layer의 선형 적층 모델입니다. 이 구조는 layer의 인스턴스를 취하며, 아래의 케이스의 경우 각 layer당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)층과 3개의 예측(레이블의 개수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 layer의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { @@ -534,7 +534,7 @@ "id": "FHcbEzMpxbHL" }, "source": [ - "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 레이어의 출력의 형태를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 단일 레이어와 동일하다고 생각할 수 있습니다. 사용가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", + "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층들의 출력의 형태를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 단일층과 동일하다고 생각할 수 있습니다. 사용가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", "\n", "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러측면과 마찬가지로, 신경망의 최적의 형태를 결정하는것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." ] @@ -708,7 +708,7 @@ " \n", "\n", "\n", - "텐서플로우는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 그래디언트 하강(stochastic gradient descent)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " + "텐서플로는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 그래디언트 하강(stochastic gradient descent)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " ] }, { @@ -737,7 +737,7 @@ ] }, { - "cell_type": "raw", + "cell_type": "markdown", "metadata": { "colab_type": "text", "id": "pJVRZ0hP52ZB" @@ -852,7 +852,7 @@ "id": "j3wdbmtLVTyr" }, "source": [ - "모델의 훈련 과정을 출력하는 것은 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로우에 패키지되어있는 굉장히 유용한 시각화 툴입니다. 하지만 우리는 `matplotlib` 모듈을 사용하여 일반적인 차트를 출력할 수 있습니다.\n", + "모델의 훈련 과정을 출력하는 것은 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지되어있는 굉장히 유용한 시각화 툴입니다. 하지만 우리는 `matplotlib` 모듈을 사용하여 일반적인 차트를 출력할 수 있습니다.\n", "\n", "이 차트를 해석하는것은 여러 경험이 필요하지만, 우리는 *손실*이 내려가고 *정확도*가 올라가는 것을 보고싶습니다." ] diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 5ad8297237a..87c95fe4d1c 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -71,7 +71,7 @@ "id": "6sILUVbHoSgH" }, "source": [ - "이 노트북은 텐서플로우를 사용하기 위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", + "이 노트북은 텐서플로를 사용하기 위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", "\n", "* 필요한 패키지 임포트\n", "* 텐서(Tensor) 생성 및 사용\n", @@ -86,9 +86,9 @@ "id": "z1JcS5iBXMRO" }, "source": [ - "## 텐서플로우 임포트\n", + "## 텐서플로 임포트\n", "\n", - "시작하기 위해서 텐서플로우 모듈을 임포트하고 즉시실행(eager execution)을 활성화합니다. 즉시실행 활성화로 텐서플로우에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." + "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시실행(eager execution)을 활성화합니다. 즉시실행 활성화로 텐서플로에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." ] }, { @@ -116,7 +116,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로우는 텐서를 생성하고 계산하는 풍부한 연산 라이브러리를 제공합니다. ([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.). 이러한 연산자들은 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 계산하는 풍부한 연산 라이브러리를 제공합니다. ([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.). 이러한 연산자들은 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" ] }, { @@ -189,10 +189,10 @@ "\n", "`Tensor`와 `ndarray`사이의 전환은 다소 간단합니다.\n", "\n", - "* 텐서플로우 연산는 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", - "* 넘파이 연산는 자동적으로 텐서플로우 Tensor를 넘파이 ndarray로 전환합니다.\n", + "* 텐서플로 연산는 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", + "* 넘파이 연산는 자동적으로 텐서플로 Tensor를 넘파이 ndarray로 전환합니다.\n", "\n", - "Tensor는 `.numpy()` 메소드(method)를 호출하여 넘파이 ndarray로 전환할 수 있습니다.\n", + "Tensor는 `.numpy()` 메서드(method)를 호출하여 넘파이 ndarray로 전환할 수 있습니다.\n", "가능한 경우, Tensor와 ndarray은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 Tensor는 GPU 메모리에 저장될 수 있고, 넘파이 ndarray은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." ] }, @@ -231,7 +231,7 @@ "source": [ "## GPU 가속기\n", "\n", - "대부분의 텐서플로우 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로우는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 Tensor를 복사합니다.) 명령에 의해 생성된 Tensor는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를들어:" + "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 Tensor를 복사합니다.) 명령에 의해 생성된 Tensor는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를들어:" ] }, { @@ -263,7 +263,7 @@ "source": [ "### 장치 이름\n", "\n", - "`Tensor.device`는 Tensor를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로우 프로그램의 분산 실행에 필요합니다. Tensor가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:` 끝납니다." + "`Tensor.device`는 Tensor를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. Tensor가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:` 끝납니다." ] }, { @@ -275,7 +275,7 @@ "source": [ "### 명시적 장치 배치\n", "\n", - "텐서플로우에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로우는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 Tensor를 장치에 복사합니다. 그러나 텐서플로우 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" + "텐서플로에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 Tensor를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" ] }, { @@ -331,7 +331,7 @@ "\n", "모델을 학습시키고, 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터 복잡한 입력 파이프라인을 구축하기위해 `Dataset`s API를 사용하기를 권장합니다. \n", "\n", - "만약 텐서플로우 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", + "만약 텐서플로 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", "그 결과, [TensorFlow Guide](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시실행이 활성화될 때에는 관계없습니다. " ] @@ -409,7 +409,7 @@ "source": [ "### 반복\n", "\n", - "즉시실행이 활성화되면 `Dataset` 객체는 반복을 지원합니다. 만약 텐서플로우 그래프에서 `Dataset`을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." + "즉시실행이 활성화되면 `Dataset` 객체는 반복을 지원합니다. 만약 텐서플로 그래프에서 `Dataset`을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." ] }, { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index d78212b1af4..3f275517e37 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -10,12 +10,12 @@ 메일을 보내주시기 바랍니다. 즉시실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. -사용자 정의 레이어, 정방향 전파, 자동미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. +사용자 정의 layer, 정방향 전파, 자동미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. [eager execution guide](../../guide/eager). 1. [즉시실행(Eager execution)](eager_basics.ipynb) 2. [Automatic differentiation and gradient tape](automatic_differentiation.ipynb) 3. [사용자 정의 학습 : 기본(Custom training: basics)](custom_training.ipynb) -4. [사용자 정의 레이어(Custom layers)](custom_layers.ipynb) +4. [사용자 정의 layer(Custom layers)](custom_layers.ipynb) 5. [사용자 정의 학습 : walkthrough(Custom training: walkthrough)](custom_training_walkthrough.ipynb) From 5f2c72a95ad8b480734a7db7915f5474c78c8a56 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Tue, 2 Apr 2019 13:41:36 +0900 Subject: [PATCH 06/19] Update from 4e28c14a Edit a typing error --- .../eager/automatic_differentiation.ipynb | 6 +- site/ko/tutorials/eager/custom_layers.ipynb | 4 +- site/ko/tutorials/eager/custom_training.ipynb | 14 +- .../eager/custom_training_walkthrough.ipynb | 285 ++++++++++++++---- site/ko/tutorials/eager/eager_basics.ipynb | 55 ++-- site/ko/tutorials/eager/index.md | 4 +- 6 files changed, 273 insertions(+), 95 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index 6a089c90f27..59dcf5dc7ed 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -71,7 +71,7 @@ "id": "vDJ4XzMqodTy" }, "source": [ - "이전 튜토리얼에서 우리는 Tensor와 Tensor의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + "이전 튜토리얼에서 우리는 텐서(tensor)와 텐서의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." ] }, { @@ -286,7 +286,7 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보할 수 있습니다." + "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망(neural network)을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보할 수 있습니다." ] } ], @@ -314,7 +314,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.7.1" + "version": "3.6.7" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index ed568418a66..29fc33e0c31 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -100,7 +100,7 @@ "\n", "머신러닝을 위한 코드를 작성하는 대부분의 시간에 우리는, 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", "\n", - "많은 머신러닝 모델은 비교적 단순한 layer의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준 레이어 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 레이어를 처음부터 작성하거나, 기존 레이어의 구성으로 쉽게 작성할 수 있습니다.\n", + "많은 머신러닝 모델은 비교적 단순한 layer의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준 layer 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 layer를 처음부터 작성하거나, 기존 layer의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", "텐서플로는 [Keras](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. Keras layer는 모델을 구축하는데 매우 유용합니다." ] @@ -349,7 +349,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.7.1" + "version": "3.6.7" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index bdd634433a4..58c48d95445 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -73,7 +73,7 @@ "source": [ "이전 튜토리얼에서 우리는 머신러닝을 위한 기초 빌딩 블록인 자동미분(automatic differentiation)을 위한 텐서플로 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", "\n", - "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망 API인 (`tf.keras`)를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " + "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " ] }, { @@ -119,7 +119,7 @@ "source": [ "## 변수\n", "\n", - "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될 필요가 있습니다(stateful). 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 계산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " + "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 계산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " ] }, { @@ -167,7 +167,7 @@ "v.assign(3.0)\n", "assert v.numpy() == 3.0\n", "\n", - "# 텐서플로 연산자 내에서 `v` 사용 \n", + "# 텐서플로 연산내에서 `v` 사용 \n", "v.assign(tf.square(v))\n", "assert v.numpy() == 9.0" ] @@ -181,7 +181,7 @@ "source": [ "변수들을 사용한 계산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기값으로부터 드물게 업데이트됩니다. 이는 계산과 메모리에 있어 더욱 효율적입니다. \n", "\n", - "또한 변수를 사용하는 것은 코드를 읽는 과정에서 변경 가능한 상태(state mutable)의 조각을 빠르게 인식하는 방법입니다." + "또한 변수를 사용하는 것은 코드를 읽는 과정에서 상태가 변경 가능한 상태(state mutable)의 조각을 빠르게 인식하는 방법입니다." ] }, { @@ -341,7 +341,7 @@ "plt.scatter(inputs, model(inputs), c='r')\n", "plt.show()\n", "\n", - "print('Current loss: '),\n", + "print('현재 손실: '),\n", "print(loss(model(inputs), outputs).numpy())" ] }, @@ -406,7 +406,7 @@ " current_loss = loss(model(inputs), outputs)\n", "\n", " train(model, inputs, outputs, learning_rate=0.1)\n", - " print('Epoch %2d: W=%1.2f b=%1.2f, loss=%2.5f' %\n", + " print('에포크 %2d: W=%1.2f b=%1.2f, 손실=%2.5f' %\n", " (epoch, Ws[-1], bs[-1], current_loss))\n", "\n", "# Let's plot it all\n", @@ -458,7 +458,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.7.1" + "version": "3.6.7" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index ebfde665b95..bcd0765d937 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -112,20 +112,29 @@ "source": [ "### 임포트 및 즉시실행 구성\n", "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는데신, 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", "\n", - "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [eager execution guide](https://www.tensorflow.org/guide/eager)을 참조하세요." + "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [즉시실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." ] }, { "cell_type": "code", - "execution_count": null, + "execution_count": 1, "metadata": { "colab": {}, "colab_type": "code", "id": "g4Wzg69bnwK2" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "텐서플로 버전: 1.10.0\n", + "즉시실행: True\n" + ] + } + ], "source": [ "from __future__ import absolute_import, division, print_function\n", "\n", @@ -136,8 +145,8 @@ "\n", "tf.enable_eager_execution()\n", "\n", - "print(\"TensorFlow version: {}\".format(tf.__version__))\n", - "print(\"Eager execution: {}\".format(tf.executing_eagerly()))" + "print(\"텐서플로 버전: {}\".format(tf.__version__))\n", + "print(\"즉시실행: {}\".format(tf.executing_eagerly()))" ] }, { @@ -188,13 +197,23 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 2, "metadata": { "colab": {}, "colab_type": "code", "id": "J6c7uEU9rjRM" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Downloading data from https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\n", + "8192/2194 [================================================================================================================] - 0s 0us/step\n", + "Local copy of the dataset file: C:\\Users\\82108\\.keras\\datasets\\iris_training.csv\n" + ] + } + ], "source": [ "train_dataset_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\"\n", "\n", @@ -239,7 +258,7 @@ "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", "1. 첫번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 예가 있으며, 각 예들은 4가지의 특성(feature), 3가지 가능한 레이블(label)을 가지고 있다.\n", + " * 총 120개의 예가 있으며, 각 예들은 4가지의 특성(feature), 3가지 가능한 레이블(label)을 가지고 있습니다.\n", "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 우리가 에측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", @@ -249,22 +268,31 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 3, "metadata": { "colab": {}, "colab_type": "code", "id": "9Edhevw7exl6" }, - "outputs": [], - "source": [ - "# CSV파일내에서 컬럼의 순서\n", + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "특성: ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']\n", + "레이블: species\n" + ] + } + ], + "source": [ + "# CSV 파일내에서 컬럼의 순서\n", "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", "\n", "feature_names = column_names[:-1]\n", "label_name = column_names[-1]\n", "\n", - "print(\"Features: {}\".format(feature_names))\n", - "print(\"Label: {}\".format(label_name))" + "print(\"특성: {}\".format(feature_names))\n", + "print(\"레이블: {}\".format(label_name))" ] }, { @@ -285,7 +313,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 4, "metadata": { "colab": {}, "colab_type": "code", @@ -313,7 +341,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 5, "metadata": { "colab": {}, "colab_type": "code", @@ -344,13 +372,43 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 6, "metadata": { "colab": {}, "colab_type": "code", "id": "iDuG94H-C122" }, - "outputs": [], + "outputs": [ + { + "data": { + "text/plain": [ + "OrderedDict([('sepal_length',\n", + " ),\n", + " ('sepal_width',\n", + " ),\n", + " ('petal_length',\n", + " ),\n", + " ('petal_width',\n", + " )])" + ] + }, + "execution_count": 6, + "metadata": {}, + "output_type": "execute_result" + } + ], "source": [ "features, labels = next(iter(train_dataset))\n", "\n", @@ -371,21 +429,34 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 10, "metadata": { "colab": {}, "colab_type": "code", "id": "me5Wn-9FcyyO" }, - "outputs": [], + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "
" + ] + }, + "metadata": { + "needs_background": "light" + }, + "output_type": "display_data" + } + ], "source": [ "plt.scatter(features['petal_length'].numpy(),\n", " features['sepal_length'].numpy(),\n", " c=labels.numpy(),\n", " cmap='viridis')\n", "\n", - "plt.xlabel(\"Petal length\")\n", - "plt.ylabel(\"Sepal length\");" + "plt.xlabel(\"petal length\")\n", + "plt.ylabel(\"sepal length\");" ] }, { @@ -402,7 +473,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 11, "metadata": { "colab": {}, "colab_type": "code", @@ -428,7 +499,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 12, "metadata": { "colab": {}, "colab_type": "code", @@ -451,13 +522,26 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 13, "metadata": { "colab": {}, "colab_type": "code", "id": "kex9ibEek6Tr" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "tf.Tensor(\n", + "[[4.9 3. 1.4 0.2]\n", + " [6.6 2.9 4.6 1.3]\n", + " [6.8 3.2 5.9 2.3]\n", + " [5. 3.5 1.3 0.3]\n", + " [7.7 2.8 6.7 2. ]], shape=(5, 4), dtype=float32)\n" + ] + } + ], "source": [ "features, labels = next(iter(train_dataset))\n", "\n", @@ -512,7 +596,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 15, "metadata": { "colab": {}, "colab_type": "code", @@ -553,13 +637,29 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 16, "metadata": { "colab": {}, "colab_type": "code", "id": "xe6SQ5NrpB-I" }, - "outputs": [], + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 16, + "metadata": {}, + "output_type": "execute_result" + } + ], "source": [ "predictions = model(features)\n", "predictions[:5]" @@ -579,13 +679,29 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 17, "metadata": { "colab": {}, "colab_type": "code", "id": "_tRwHZmTNTX2" }, - "outputs": [], + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 17, + "metadata": {}, + "output_type": "execute_result" + } + ], "source": [ "tf.nn.softmax(predictions[:5])" ] @@ -602,16 +718,25 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 18, "metadata": { "colab": {}, "colab_type": "code", "id": "-Jzm_GoErz8B" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "예측: [2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2]\n", + " 레이블: [0 1 2 0 2 1 0 0 2 1 1 2 2 2 0 2 0 2 0 2 0 0 1 0 0 1 2 2 2 1 0 2]\n" + ] + } + ], "source": [ - "print(\"Prediction: {}\".format(tf.argmax(predictions, axis=1)))\n", - "print(\" Labels: {}\".format(labels))" + "print(\"예측: {}\".format(tf.argmax(predictions, axis=1)))\n", + "print(\" 레이블: {}\".format(labels))" ] }, { @@ -623,7 +748,7 @@ "source": [ "## 모델 훈련하기\n", "\n", - "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면, 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", + "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", "\n", "붓꽃 분류 문제는 지도학습 *[지도학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지않습니다. 대신에 모델은 특성들의 패턴을 찾습니다. " ] @@ -644,13 +769,21 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 21, "metadata": { "colab": {}, "colab_type": "code", "id": "tMAT4DcMPwI-" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "손실 테스트: 1.5565308332443237\n" + ] + } + ], "source": [ "def loss(model, x, y):\n", " y_ = model(x)\n", @@ -658,7 +791,7 @@ "\n", "\n", "l = loss(model, features, labels)\n", - "print(\"Loss test: {}\".format(l))" + "print(\"손실 테스트: {}\".format(l))" ] }, { @@ -668,12 +801,12 @@ "id": "3IcPqA24QM6B" }, "source": [ - "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 다음을 확인하세요. [eager execution guide](https://www.tensorflow.org/guide/eager)." + "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " ] }, { "cell_type": "code", - "execution_count": null, + "execution_count": 22, "metadata": { "colab": {}, "colab_type": "code", @@ -708,7 +841,7 @@ " \n", "\n", "\n", - "텐서플로는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 그래디언트 하강(stochastic gradient descent)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " + "텐서플로는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 그래디언트 하강(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " ] }, { @@ -723,7 +856,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 25, "metadata": { "colab": {}, "colab_type": "code", @@ -733,7 +866,7 @@ "source": [ "optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)\n", "\n", - "global_step = tf.Variable(0)" + "global_step = tf.contrib.eager.Variable(0)" ] }, { @@ -748,22 +881,31 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 26, "metadata": { "colab": {}, "colab_type": "code", "id": "rxRNTFVe56RG" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "단계: 0, 초기 손실: 1.5565308332443237\n", + "단계: 1, 손실: 1.4113397598266602\n" + ] + } + ], "source": [ "loss_value, grads = grad(model, features, labels)\n", "\n", - "print(\"Step: {}, Initial Loss: {}\".format(global_step.numpy(),\n", + "print(\"단계: {}, 초기 손실: {}\".format(global_step.numpy(),\n", " loss_value.numpy()))\n", "\n", "optimizer.apply_gradients(zip(grads, model.trainable_variables), global_step)\n", "\n", - "print(\"Step: {}, Loss: {}\".format(global_step.numpy(),\n", + "print(\"단계: {}, 손실: {}\".format(global_step.numpy(),\n", " loss(model, features, labels).numpy()))" ] }, @@ -790,13 +932,25 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 27, "metadata": { "colab": {}, "colab_type": "code", "id": "AIgulGRUhpto" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "에포크 000: 손실: 1.364, 정확도: 35.000%\n", + "에포크 050: 손실: 0.732, 정확도: 70.833%\n", + "에포크 100: 손실: 0.434, 정확도: 95.000%\n", + "에포크 150: 손실: 0.273, 정확도: 98.333%\n", + "에포크 200: 손실: 0.231, 정확도: 99.167%\n" + ] + } + ], "source": [ "## Note: 이 셀을 다시 실행하면 동일한 모델의 변수가 사용됩니다.\n", "\n", @@ -830,7 +984,7 @@ " train_accuracy_results.append(epoch_accuracy.result())\n", " \n", " if epoch % 50 == 0:\n", - " print(\"Epoch {:03d}: Loss: {:.3f}, Accuracy: {:.3%}\".format(epoch,\n", + " print(\"에포크 {:03d}: 손실: {:.3f}, 정확도: {:.3%}\".format(epoch,\n", " epoch_loss_avg.result(),\n", " epoch_accuracy.result()))" ] @@ -859,22 +1013,35 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 29, "metadata": { "colab": {}, "colab_type": "code", "id": "agjvNd2iUGFn" }, - "outputs": [], + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "
" + ] + }, + "metadata": { + "needs_background": "light" + }, + "output_type": "display_data" + } + ], "source": [ "fig, axes = plt.subplots(2, sharex=True, figsize=(12, 8))\n", "fig.suptitle('Training Metrics')\n", "\n", - "axes[0].set_ylabel(\"Loss\", fontsize=14)\n", + "axes[0].set_ylabel(\"loss\", fontsize=14)\n", "axes[0].plot(train_loss_results)\n", "\n", "axes[1].set_ylabel(\"Accuracy\", fontsize=14)\n", - "axes[1].set_xlabel(\"Epoch\", fontsize=14)\n", + "axes[1].set_xlabel(\"epoch\", fontsize=14)\n", "axes[1].plot(train_accuracy_results);" ] }, @@ -1003,7 +1170,7 @@ " prediction = tf.argmax(logits, axis=1, output_type=tf.int32)\n", " test_accuracy(prediction, y)\n", "\n", - "print(\"Test set accuracy: {:.3%}\".format(test_accuracy.result()))" + "print(\"테스트셋 정확도: {:.3%}\".format(test_accuracy.result()))" ] }, { @@ -1068,7 +1235,7 @@ " class_idx = tf.argmax(logits).numpy()\n", " p = tf.nn.softmax(logits)[class_idx]\n", " name = class_names[class_idx]\n", - " print(\"Example {} prediction: {} ({:4.1f}%)\".format(i, name, 100*p))" + " print(\"예 {} 예측: {} ({:4.1f}%)\".format(i, name, 100*p))" ] } ], @@ -1096,7 +1263,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.7.1" + "version": "3.6.7" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 87c95fe4d1c..680d7fc1558 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -93,7 +93,7 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 2, "metadata": { "cellView": "code", "colab": {}, @@ -116,7 +116,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 계산하는 풍부한 연산 라이브러리를 제공합니다. ([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.). 이러한 연산자들은 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 계산하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자들은 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" ] }, { @@ -136,7 +136,7 @@ "print(tf.reduce_sum([1, 2, 3]))\n", "print(tf.encode_base64(\"hello world\"))\n", "\n", - "# Operator overloading is also supported\n", + "# 연산자의 오버로딩 또한 지원합니다.\n", "print(tf.square(2) + tf.square(3))" ] }, @@ -172,7 +172,7 @@ "id": "eBPw8e8vrsom" }, "source": [ - "넘파이 `ndarray`와 `Tensor`의 가장 확실한 차이는 다음과 같습니다:\n", + "넘파이 `ndarray`와 텐서플로 `Tensor`의 가장 확연한 차이는 다음과 같습니다:\n", "\n", "1. `Tensor`는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", "2. `Tensor`는 불변성(immutable)을 가집니다." @@ -189,8 +189,8 @@ "\n", "`Tensor`와 `ndarray`사이의 전환은 다소 간단합니다.\n", "\n", - "* 텐서플로 연산는 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", - "* 넘파이 연산는 자동적으로 텐서플로 Tensor를 넘파이 ndarray로 전환합니다.\n", + "* 텐서플로 연산은 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", + "* 넘파이 연산은 자동적으로 텐서플로 Tensor를 넘파이 ndarray로 전환합니다.\n", "\n", "Tensor는 `.numpy()` 메서드(method)를 호출하여 넘파이 ndarray로 전환할 수 있습니다.\n", "가능한 경우, Tensor와 ndarray은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 Tensor는 GPU 메모리에 저장될 수 있고, 넘파이 ndarray은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." @@ -210,15 +210,15 @@ "\n", "ndarray = np.ones([3, 3])\n", "\n", - "print(\"TensorFlow operations convert numpy arrays to Tensors automatically\")\n", + "print(\"텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 전환합니다.\")\n", "tensor = tf.multiply(ndarray, 42)\n", "print(tensor)\n", "\n", "\n", - "print(\"And NumPy operations convert Tensors to numpy arrays automatically\")\n", + "print(\"그리고 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\")\n", "print(np.add(tensor, 1))\n", "\n", - "print(\"The .numpy() method explicitly converts a Tensor to a numpy array\")\n", + "print(\".numpy() 메서드는 텐서를 넘파이 배열로 전환시킵니다.\")\n", "print(tensor.numpy())" ] }, @@ -236,21 +236,32 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 3, "metadata": { "cellView": "code", "colab": {}, "colab_type": "code", "id": "3Twf_Rw-gQFM" }, - "outputs": [], + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "GPU를 사용가능한가 : \n", + "False\n", + "텐서가 GPU #0에 있는가 : \n", + "False\n" + ] + } + ], "source": [ "x = tf.random_uniform([3, 3])\n", "\n", - "print(\"Is there a GPU available: \"),\n", + "print(\"GPU 사용이 가능한가 : \"),\n", "print(tf.test.is_gpu_available())\n", "\n", - "print(\"Is the Tensor on GPU #0: \"),\n", + "print(\"텐서가 GPU #0에 있는가 : \"),\n", "print(x.device.endswith('GPU:0'))" ] }, @@ -263,7 +274,7 @@ "source": [ "### 장치 이름\n", "\n", - "`Tensor.device`는 Tensor를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. Tensor가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:` 끝납니다." + "`Tensor.device`는 Tensor를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. Tensor가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:`으로 끝납니다." ] }, { @@ -333,7 +344,7 @@ "\n", "만약 텐서플로 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", - "그 결과, [TensorFlow Guide](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시실행이 활성화될 때에는 관계없습니다. " + "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시실행이 활성화될 때에는 관계없습니다. " ] }, { @@ -343,9 +354,9 @@ "id": "zI0fmOynH-Ne" }, "source": [ - "### `Dataset`소스 생성\n", + "### `Dataset` 소스 생성\n", "\n", - "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 or 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하세요. 더 많은 정보는 [TensorFlow Guide](https://www.tensorflow.org/guide/datasets#reading_input_data) 를 참조하세요." + "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하세요. 더 많은 정보를 위해서 [텐서플로 가이드](https://www.tensorflow.org/guide/datasets#reading_input_data)를 참조하세요." ] }, { @@ -360,7 +371,7 @@ "source": [ "ds_tensors = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6])\n", "\n", - "# Create a CSV file\n", + "# CSV 파일 생성\n", "import tempfile\n", "_, filename = tempfile.mkstemp()\n", "\n", @@ -382,7 +393,7 @@ "source": [ "### 변환 적용\n", "\n", - "[`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)와 같은 변환 함수를 사용하세요. 또한 데이터셋의 레코드에 변환을 적용하세요. 세부사항은 [API documentation for `tf.data.Dataset`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." + "[`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하세요. 또한 데이터셋의 레코드에 변환을 적용하세요. 세부사항은 [`tf.data.Dataset`을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." ] }, { @@ -422,11 +433,11 @@ }, "outputs": [], "source": [ - "print('Elements of ds_tensors:')\n", + "print('ds_tensors 요소:')\n", "for x in ds_tensors:\n", " print(x)\n", "\n", - "print('\\nElements in ds_file:')\n", + "print('\\nds_file 요소:')\n", "for x in ds_file:\n", " print(x)" ] @@ -456,7 +467,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.7.1" + "version": "3.6.7" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 3f275517e37..e75df364cb0 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -14,8 +14,8 @@ [eager execution guide](../../guide/eager). 1. [즉시실행(Eager execution)](eager_basics.ipynb) -2. [Automatic differentiation and gradient tape](automatic_differentiation.ipynb) -3. [사용자 정의 학습 : 기본(Custom training: basics)](custom_training.ipynb) +2. [자동미분과 그래디언트 테이프(Automatic differentiation and gradient tape)](automatic_differentiation.ipynb) +3. [사용자 정의 학습 : 기초(Custom training: basics)](custom_training.ipynb) 4. [사용자 정의 layer(Custom layers)](custom_layers.ipynb) 5. [사용자 정의 학습 : walkthrough(Custom training: walkthrough)](custom_training_walkthrough.ipynb) From c2ef77e7384b083b74af784849e19c202d003f0d Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Tue, 2 Apr 2019 17:48:34 +0900 Subject: [PATCH 07/19] Update from 61caa152 edit common mistakes --- .../eager/automatic_differentiation.ipynb | 39 ++++++++-------- site/ko/tutorials/eager/custom_layers.ipynb | 16 +++---- site/ko/tutorials/eager/custom_training.ipynb | 8 ++-- .../eager/custom_training_walkthrough.ipynb | 44 +++++++++---------- site/ko/tutorials/eager/eager_basics.ipynb | 30 ++++++------- 5 files changed, 69 insertions(+), 68 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index 59dcf5dc7ed..6d927d99ecc 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -41,7 +41,7 @@ "id": "xh8WkEwWpnm7" }, "source": [ - "# 자동미분(Automatic Differentiation)과 그래디언트 테이프(Gradient Tape)" + "# 자동 미분과 그래디언트 테이프" ] }, { @@ -56,10 +56,10 @@ " View on TensorFlow.org\n", " \n", " \n", - " Run in Google Colab\n", + " Run in Google Colab\n", " \n", " \n", - " View source on GitHub\n", + " View source on GitHub\n", " \n", "" ] @@ -71,7 +71,7 @@ "id": "vDJ4XzMqodTy" }, "source": [ - "이전 튜토리얼에서 우리는 텐서(tensor)와 텐서의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + "이전 튜토리얼에서는 텐서(tensor)와 텐서의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동 미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." ] }, { @@ -106,9 +106,9 @@ "id": "1CLWJl0QliB0" }, "source": [ - "## 그래디언트 테이프(Gradient Tape)\n", + "## 그래디언트 테이프\n", "\n", - "텐서플로는 자동미분(주어진 입력 변수에 따른 그래디언트 연산)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 tape에 \"기록\"합니다. 그리고 [역방향 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산들과 관련된 테이프와 그래디언트들을 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", + "텐서플로는 자동 미분(주어진 입력 변수에 대한 연산의 그래디언트(gradient)를 계산하는 것)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 테이프(tape)에 \"기록\"합니다. 그리고 [후진 방식 자동 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산과 관련된 그래디언트와 테이프를 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", "\n", "예를 들면:" ] @@ -130,7 +130,7 @@ " y = tf.reduce_sum(x)\n", " z = tf.multiply(y, y)\n", "\n", - "# 입력 tensor x에 관한 z의 도함수\n", + "# 입력 텐서 x에 대한 z의 도함수\n", "dz_dx = t.gradient(z, x)\n", "for i in [0, 1]:\n", " for j in [0, 1]:\n", @@ -144,7 +144,7 @@ "id": "N4VlqKFzzGaC" }, "source": [ - "또한 `tf.GradientTape` 컨텍스트에 기록되는 동안 계산된 중간 출력값의 그래디언트를 계산할 수 있습니다." + "또한 `tf.GradientTape` 컨텍스트 안에서 기록되는 동안 계산된 중간 값에 대한 그래디언트도 구할 수 있습니다." ] }, { @@ -164,7 +164,7 @@ " y = tf.reduce_sum(x)\n", " z = tf.multiply(y, y)\n", "\n", - "# 중간값 y에 관한 z의 도함수 계산을 위한 테이프 사용\n", + "# 테이프 사용하여 중간 값 y에 대한 도함수를 계산합니다. \n", "dz_dy = t.gradient(z, y)\n", "assert dz_dy.numpy() == 8.0" ] @@ -176,7 +176,8 @@ "id": "ISkXuY7YzIcS" }, "source": [ - "초기값으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해체되게 설정돼있습니다. 동일한 연산을 통해서 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. `persistent`는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다." + "기본적으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해제됩니다. 동일한 연산을 대해 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. 이 그래디언트 테이프는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다.\n", + "예를 들면 다음과 같습니다:" ] }, { @@ -196,7 +197,7 @@ " z = y * y\n", "dz_dx = t.gradient(z, x) # 108.0 (4*x^3 at x = 3)\n", "dy_dx = t.gradient(y, x) # 6.0\n", - "del t # 리소스가 해체됩니다." + "del t # 테이프에 대한 참조를 삭제합니다." ] }, { @@ -206,9 +207,9 @@ "id": "6kADybtQzYj4" }, "source": [ - "### 제어흐름(Control Flow) 기록\n", + "### 제어 흐름 기록\n", "\n", - "테이프를 실행하는 순간부터 연산을 기록하기 때문에, 파이썬 제어흐름(예를 들어 `if` `while`, `for`문 같은)은 자연스럽게 처리됩니다. " + "연산이 실행되는 순서대로 테이프에 기록되기 때문에, 파이썬 제어 흐름(예를 들어 `if` `while`, `for`문 같은)이 자연스럽게 처리됩니다. " ] }, { @@ -248,9 +249,9 @@ "id": "DK05KXrAAld3" }, "source": [ - "### 고차원(Higher-order) 그래디언트\n", + "### 고계도(Higher-order) 그래디언트\n", "\n", - "`GradientTape` 컨텍스트 매니저안에 있는 연산들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 연산되면 그래디언트 연산 또한 기록되어집니다. 그 결과 똑같은 API가 고차원 그래디언트에서도 잘 작동합니다. 예를 들면:" + "`GradientTape` 컨텍스트 매니저안에 있는 연산들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되면 그 그래디언트 연산 또한 기록되어집니다. 그 결과 똑같은 API가 고계도 그래디언트에서도 잘 작동합니다. 예를 들면:" ] }, { @@ -263,13 +264,13 @@ }, "outputs": [], "source": [ - "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로 변수 생성\n", + "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로 변수를 생성합니다.\n", "\n", "with tf.GradientTape() as t:\n", " with tf.GradientTape() as t2:\n", " y = x * x * x\n", - " # t 컨텍스트 매니저 안의 그래디언트 연산\n", - " # 이것은 또한 그래디언트 계산이 미분가능하다는것을 의미합니다. \n", + " # t 컨텍스트 매니저 안의 그래디언트를 계산합니다.\n", + " # 이것은 또한 그래디언트 연산 자체도 미분가능하다는것을 의미합니다. \n", " dy_dx = t2.gradient(y, x)\n", "d2y_dx2 = t.gradient(dy_dx, x)\n", "\n", @@ -286,7 +287,7 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 배웠습니다. 이를 통해 우리는 신경망(neural network)을 구축하고 훈련시키는 데 필요한 기본 요소를 충분히 확보할 수 있습니다." + "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 다루었습니다. 이를 통해 신경망(neural network)을 구축하고 훈련시키는데 필요한 많은 기본 요소를 배웠습니다." ] } ], diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index 29fc33e0c31..f85d0e46f34 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -56,10 +56,10 @@ " View on TensorFlow.org\n", " \n", " \n", - " Run in Google Colab\n", + " Run in Google Colab\n", " \n", " \n", - " View source on GitHub\n", + " View source on GitHub\n", " \n", "" ] @@ -71,7 +71,7 @@ "id": "UEu3q4jmpKVT" }, "source": [ - "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시실행(eager execution)을 활성화할 수 있습니다." + "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시 실행(eager execution)을 활성화할 수 있습니다." ] }, { @@ -98,7 +98,7 @@ "source": [ "## layer: 유용한 연산자 집합\n", "\n", - "머신러닝을 위한 코드를 작성하는 대부분의 시간에 우리는, 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", + "머신러닝을 위한 코드를 작성하는 대부분의 시간동안 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", "\n", "많은 머신러닝 모델은 비교적 단순한 layer의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준 layer 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 layer를 처음부터 작성하거나, 기존 layer의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", @@ -118,7 +118,7 @@ "# tf.keras.layers 패키지에서 layer는 객체입니다. layer를 구성하려면 간단히 객체를 생성하십시오.\n", "# 대부분의 layer는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", "layer = tf.keras.layers.Dense(100)\n", - "# 입력 차원의 수는 유추될 수 있기 때문에 종종 불필요합니다. \n", + "# 입력 차원의 수는 유추할 수 있기 때문에 종종 불필요합니다. \n", "# 일부 복잡한 모델에서는 수동으로 입력 차원의 수를 제공하는것이 유용할 수 있습니다.\n", "layer = tf.keras.layers.Dense(10, input_shape=(None, 5))" ] @@ -159,7 +159,7 @@ "source": [ "# layer는 유용한 메서드들을 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 layer안에 있는 모든 변수들을 확인할 수 있으며, \n", "# `layer.trainable_variables`를 사용하여 학습가능한 변수들을 확인할 수 있습니다. \n", - "# 이번 케이스에서 완전 연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", + "# 이번 케이스에서 완전연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" ] }, @@ -242,7 +242,7 @@ "source": [ "## 모델: layer 구성\n", "\n", - "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 layer들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여블록(residual block)은 합성곱(convolution), 배치정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", + "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 layer들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", "\n", "layer 집합을 포함한 유사 layer를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." ] @@ -321,7 +321,7 @@ "source": [ "# 다음 단계\n", "\n", - "이제 여러분들은 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 layer와 모델을 적용할 수 있습니다." + "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 layer와 모델을 적용할 수 있습니다." ] } ], diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index 58c48d95445..1385cb3736a 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -56,10 +56,10 @@ " View on TensorFlow.org\n", " \n", " \n", - " Run in Google Colab\n", + " Run in Google Colab\n", " \n", " \n", - " View source on GitHub\n", + " View source on GitHub\n", " \n", "" ] @@ -71,7 +71,7 @@ "id": "k2o3TTG4TFpt" }, "source": [ - "이전 튜토리얼에서 우리는 머신러닝을 위한 기초 빌딩 블록인 자동미분(automatic differentiation)을 위한 텐서플로 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", + "이전 튜토리얼에서는 머신러닝을 위한 기초 빌딩 블록인 자동 미분(automatic differentiation)을 위한 텐서플로 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", "\n", "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " ] @@ -134,7 +134,7 @@ "source": [ "# 파이썬 state 사용\n", "x = tf.zeros([10, 10])\n", - "x += 2 # 이것은 x = x + 2 같으며, 초기값 x를 변경하지 않습니다.\n", + "x += 2 # 이것은 x = x + 2와 같으며, 초기값 x를 변경하지 않습니다.\n", "print(x)" ] }, diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index bcd0765d937..99b8486f785 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -56,10 +56,10 @@ " View on TensorFlow.org\n", " \n", " \n", - " Run in Google Colab\n", + " Run in Google Colab\n", " \n", " \n", - " View source on GitHub\n", + " View source on GitHub\n", " \n", "" ] @@ -71,7 +71,7 @@ "id": "LDrzLFXE8T1l" }, "source": [ - "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시실행[(eager execution)](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", + "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시 실행[(eager execution)](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", "1. 모델 구축\n", "2. 모델 훈련\n", "3. 예측을 위한 모델 사용\n", @@ -80,9 +80,9 @@ "\n", "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념들을 사용합니다.\n", "\n", - "* [즉시실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발환경,\n", - "* [Datasets API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", - "* [Keras API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 layer 구축 .\n", + "* [즉시 실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발환경,\n", + "* [데이터셋 API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", + "* [케라스 API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 layer 구축 .\n", "\n", "이번 튜토리얼은 다른 텐서플로 프로그램과 유사하게 구성되어있습니다.\n", "\n", @@ -110,11 +110,11 @@ "id": "1J3AuPBT9gyR" }, "source": [ - "### 임포트 및 즉시실행 구성\n", + "### 임포트 및 즉시 실행 구성\n", "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시실행을 활성화할 것입니다. 즉시실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화할 것입니다. 즉시 실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", "\n", - "즉시실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [즉시실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." + "즉시 실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." ] }, { @@ -146,7 +146,7 @@ "tf.enable_eager_execution()\n", "\n", "print(\"텐서플로 버전: {}\".format(tf.__version__))\n", - "print(\"즉시실행: {}\".format(tf.executing_eagerly()))" + "print(\"즉시 실행: {}\".format(tf.executing_eagerly()))" ] }, { @@ -158,7 +158,7 @@ "source": [ "## 붓꽃 분류 문제\n", "\n", - "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 우리의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는것입니다.\n", + "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 이번 튜토리얼의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는것입니다.\n", "\n", "이 붓꽃은 약 300종 입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", "\n", @@ -261,7 +261,7 @@ " * 총 120개의 예가 있으며, 각 예들은 4가지의 특성(feature), 3가지 가능한 레이블(label)을 가지고 있습니다.\n", "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", - " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 우리가 에측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", + " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 예측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", "\n", "코드로 표현하면 다음과 같습니다.:" ] @@ -367,7 +367,7 @@ }, "source": [ "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍을 반환합니다. `features`는 사전형 객체인: `{'feature_name': value}`로 주어집니다.\n", - "또한 즉시실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)들을 살펴봅시다." + "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)들을 살펴봅시다." ] }, { @@ -565,7 +565,7 @@ "\n", "### 모델 선정\n", "\n", - "우리는 학습을 위한 모델의 종류를 선정해야합니다. 여러정류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*들로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전연결 신경망입니다. \n", + "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*들로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전연결 신경망입니다. \n", "\n", "\n", " \n", "
\n", @@ -713,7 +713,7 @@ "id": "uRZmchElo481" }, "source": [ - "`tf.argmax`는 예측된 값들 중 가장 큰 확률(우리가 원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." + "`tf.argmax`는 예측된 값들 중 가장 큰 확률(원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." ] }, { @@ -762,7 +762,7 @@ "source": [ "### 손실 함수와 그래디언트 함수 정의하기\n", "\n", - "훈련과 평가단계는 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)* 계산할 필요가 있습니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 우리는 이 값은 최소화하고, 최적화하기를 원합니다. \n", + "훈련과 평가단계는 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)* 계산할 필요가 있습니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 이 값은 최소화하고, 최적화하기를 원합니다. \n", "\n", "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용하여 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 예제를 통한 평균 손실을 반환합니다." ] @@ -801,7 +801,7 @@ "id": "3IcPqA24QM6B" }, "source": [ - "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " + "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " ] }, { @@ -829,7 +829,7 @@ "source": [ "### 옵티마이저(Optimizer) 생성 \n", "\n", - "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실`함수를 최소화하기위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 우리는 이 함수의 최저점을 찾고자합니다. 그래디언트는 가장 가파른 상승방향을 가르키며 따라서 우리는 반대방향으로 이동하는 여행을 합니다.각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련 중에 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 더 적은 손실을 통해 더 좋은 모델의 예측을 기대할 수 있습니다. \n", + "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실`함수를 최소화하기위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자합니다. 그래디언트는 가장 가파른 상승방향을 가르키며 따라서 반대방향으로 이동하는 여행을 합니다.각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련 중에 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 더 적은 손실을 통해 더 좋은 모델의 예측을 기대할 수 있습니다. \n", "\n", "\n", " \n", " \n", " \n", "
\n", @@ -1006,9 +1006,9 @@ "id": "j3wdbmtLVTyr" }, "source": [ - "모델의 훈련 과정을 출력하는 것은 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지되어있는 굉장히 유용한 시각화 툴입니다. 하지만 우리는 `matplotlib` 모듈을 사용하여 일반적인 차트를 출력할 수 있습니다.\n", + "모델의 훈련 과정을 출력하는 것은 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지되어있는 굉장히 유용한 시각화 툴입니다. 하지만 `matplotlib` 모듈을 사용하여 일반적인 차트를 출력할 수 있습니다.\n", "\n", - "이 차트를 해석하는것은 여러 경험이 필요하지만, 우리는 *손실*이 내려가고 *정확도*가 올라가는 것을 보고싶습니다." + "이 차트를 해석하는것은 여러 경험이 필요하지만, 모델을 최적화하기위해 *손실*이 내려가고 *정확도*가 올라가는 것을 보고싶습니다." ] }, { @@ -1054,7 +1054,7 @@ "source": [ "## 모델 유효성 검증\n", "\n", - "이제 모델은 학습되었습니다. 우리는 모델의 성능을 검증하기위해 몇가지 통계를 얻을 수 있습니다. \n", + "이제 모델은 학습되었습니다. 모델의 성능을 검증하기위해 몇가지 통계를 얻을 수 있습니다. \n", "\n", "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해서, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적인 보여줍니다. 5개의 예측 중 4개를 올바르게 예측한 80% 정확도의 모델입니다.\n", "\n", @@ -1205,7 +1205,7 @@ "source": [ "## 예측을 위해 훈련된 모델 사용하기\n", "\n", - "우리는 이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)들을 예측해봅시다.\n", + "이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)들을 예측해봅시다.\n", "\n", "실제로는 레이블되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접제공 등)로 부터 제공될 수 있습니다. 지금은 레이블을 예측하기위해 수동으로 3개의 레이블되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃이름으로 맵핑되어있습니다.\n", "* `0`: Iris setosa\n", diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 680d7fc1558..1d8a1522cd1 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -41,7 +41,7 @@ "id": "U9i2Dsh-ziXr" }, "source": [ - "# 즉시실행(eager execution) 기초" + "# 즉시 실행 기초" ] }, { @@ -56,10 +56,10 @@ " View on TensorFlow.org\n", " \n", - " Run in Google Colab\n", + " Run in Google Colab\n", " \n", - " View source on GitHub\n", + " View source on GitHub\n", "
" ] @@ -88,7 +88,7 @@ "source": [ "## 텐서플로 임포트\n", "\n", - "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시실행(eager execution)을 활성화합니다. 즉시실행 활성화로 텐서플로에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." + "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시 실행(eager execution)을 활성화합니다. 즉시 실행 활성화로 텐서플로에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." ] }, { @@ -189,11 +189,11 @@ "\n", "`Tensor`와 `ndarray`사이의 전환은 다소 간단합니다.\n", "\n", - "* 텐서플로 연산은 자동적으로 넘파이 ndarray를 Tensor로 전환합니다.\n", - "* 넘파이 연산은 자동적으로 텐서플로 Tensor를 넘파이 ndarray로 전환합니다.\n", + "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 전환합니다.\n", + "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\n", "\n", - "Tensor는 `.numpy()` 메서드(method)를 호출하여 넘파이 ndarray로 전환할 수 있습니다.\n", - "가능한 경우, Tensor와 ndarray은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 Tensor는 GPU 메모리에 저장될 수 있고, 넘파이 ndarray은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." + "텐서는 `.numpy()` 메서드(method)를 호출하여 넘파이 배열로 전환할 수 있습니다.\n", + "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." ] }, { @@ -231,7 +231,7 @@ "source": [ "## GPU 가속기\n", "\n", - "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 Tensor를 복사합니다.) 명령에 의해 생성된 Tensor는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를들어:" + "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 텐서를 복사합니다.) 명령에 의해 생성된 텐서는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를 들어:" ] }, { @@ -274,7 +274,7 @@ "source": [ "### 장치 이름\n", "\n", - "`Tensor.device`는 Tensor를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. Tensor가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:`으로 끝납니다." + "`Tensor.device`는 텐서를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. 텐서가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:`으로 끝납니다." ] }, { @@ -286,7 +286,7 @@ "source": [ "### 명시적 장치 배치\n", "\n", - "텐서플로에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 Tensor를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" + "텐서플로에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" ] }, { @@ -338,13 +338,13 @@ "이번 섹션에서는 모델에 데이터를 제공하기 위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", "\n", "* `Dataset` 생성.\n", - "* 즉시실행(eager execution) 활성화와 `Dataset`을 통한 반복\n", + "* 즉시 실행 활성화와 `Dataset`을 통한 반복\n", "\n", "모델을 학습시키고, 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터 복잡한 입력 파이프라인을 구축하기위해 `Dataset`s API를 사용하기를 권장합니다. \n", "\n", - "만약 텐서플로 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", + "만약 텐서플로 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", - "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시실행이 활성화될 때에는 관계없습니다. " + "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시 실행이 활성화될 때에는 관계없습니다. " ] }, { @@ -420,7 +420,7 @@ "source": [ "### 반복\n", "\n", - "즉시실행이 활성화되면 `Dataset` 객체는 반복을 지원합니다. 만약 텐서플로 그래프에서 `Dataset`을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." + "즉시 실행이 활성화되면 `Dataset` 객체는 반복을 지원합니다. 만약 텐서플로 그래프에서 `Dataset`을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." ] }, { From e3798d3453e7f3e0aaf0fef73aba9004a56b1ae2 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Wed, 3 Apr 2019 00:53:53 +0900 Subject: [PATCH 08/19] Update from db5446ea --- .../eager/automatic_differentiation.ipynb | 4 +- site/ko/tutorials/eager/custom_layers.ipynb | 14 ++--- site/ko/tutorials/eager/custom_training.ipynb | 22 +++---- .../eager/custom_training_walkthrough.ipynb | 60 +++++++++---------- site/ko/tutorials/eager/eager_basics.ipynb | 12 ++-- site/ko/tutorials/eager/index.md | 8 +-- 6 files changed, 60 insertions(+), 60 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index 6d927d99ecc..611488b4a2d 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -71,7 +71,7 @@ "id": "vDJ4XzMqodTy" }, "source": [ - "이전 튜토리얼에서는 텐서(tensor)와 텐서의 연산들에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동 미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + "이전 튜토리얼에서는 텐서(tensor)와 텐서의 연산에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동 미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." ] }, { @@ -315,7 +315,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.7" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index f85d0e46f34..7222bc1990f 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -157,8 +157,8 @@ }, "outputs": [], "source": [ - "# layer는 유용한 메서드들을 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 layer안에 있는 모든 변수들을 확인할 수 있으며, \n", - "# `layer.trainable_variables`를 사용하여 학습가능한 변수들을 확인할 수 있습니다. \n", + "# layer는 유용한 메서드를 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 layer안에 있는 모든 변수를 확인할 수 있으며, \n", + "# `layer.trainable_variables`를 사용하여 학습가능한 변수를 확인할 수 있습니다. \n", "# 이번 케이스에서 완전연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" ] @@ -187,10 +187,10 @@ "## 사용자 정의 layer 구현\n", "사용자 정의 layer를 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", " * `__init__` , 모든 독립적인 입력값을 초기화를 할 수 있습니다.\n", - " * `build`, 입력 Tensor의 형태를 알고 나머지를 초기화 할 수 있습니다.\n", - " * `call`, 정방향 계산을 진행 할 수 있습니다.\n", + " * `build`, 입력 텐서의 크기를 알고 나머지를 초기화 할 수 있습니다.\n", + " * `call`, 정방향 연산(forward computation)을 진행 할 수 있습니다.\n", "\n", - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 layer가 작동할 입력의 형태를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 형태가 명시적으로 지정되어야 함을 의미합니다." + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 layer가 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." ] }, { @@ -242,7 +242,7 @@ "source": [ "## 모델: layer 구성\n", "\n", - "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 layer들의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", + "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 layer의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", "\n", "layer 집합을 포함한 유사 layer를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." ] @@ -349,7 +349,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.7" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index 1385cb3736a..5b1a8e93108 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -71,9 +71,9 @@ "id": "k2o3TTG4TFpt" }, "source": [ - "이전 튜토리얼에서는 머신러닝을 위한 기초 빌딩 블록인 자동 미분(automatic differentiation)을 위한 텐서플로 API들을 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", + "이전 튜토리얼에서는 머신러닝을 위한 기초 빌딩 블록인 자동 미분(automatic differentiation)을 위한 텐서플로 API를 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", "\n", - "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람들에게는 이러한 고수준의 API들을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " + "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람에게는 이러한 고수준의 API을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " ] }, { @@ -119,7 +119,7 @@ "source": [ "## 변수\n", "\n", - "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 계산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " + "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " ] }, { @@ -145,9 +145,9 @@ "id": "wfneTXy7JcUz" }, "source": [ - "그러나 텐서플로는 상태가 변경 가능한 연산자들이 내장되어 있으며, 이 연산자들은 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는것이 편하고 효율적입니다. \n", + "그러나 텐서플로는 상태가 변경 가능한 연산자가 내장되어 있으며, 이러한 연산자는 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는것이 편하고 효율적입니다. \n", "\n", - "텐서플로 변수는 값을 저장하고 텐서플로 계산에 사용될 때 묵시적으로 저장된 값을 읽어오는 객체입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자들입니다." + "텐서플로 변수는 값을 저장하고 텐서플로 연산에 사용될 때 묵시적으로 저장된 값을 읽어오는 객체입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자입니다." ] }, { @@ -179,7 +179,7 @@ "id": "-paSaeq1JzwC" }, "source": [ - "변수들을 사용한 계산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기값으로부터 드물게 업데이트됩니다. 이는 계산과 메모리에 있어 더욱 효율적입니다. \n", + "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기로부터 드물게 업데이트됩니다. 이는 연산과 메모리에 있어 더욱 효율적입니다. \n", "\n", "또한 변수를 사용하는 것은 코드를 읽는 과정에서 상태가 변경 가능한 상태(state mutable)의 조각을 빠르게 인식하는 방법입니다." ] @@ -193,7 +193,7 @@ "source": [ "## 예: 선형모델 피팅\n", "\n", - "몇가지 개념들을 설명해보겠습니다. 우리는 지금까지 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였습니다. 이것은 전형적으로 다음의 과정을 포함합니다.\n", + "몇가지 개념을 설명해보겠습니다. 우리는 지금까지 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였습니다. 이것은 전형적으로 다음의 과정을 포함합니다.\n", "\n", "1. 모델 정의\n", "2. 손실함수 정의\n", @@ -212,7 +212,7 @@ "source": [ "### 모델 정의\n", "\n", - "변수들과 계산을 요약하기 위한 간단한 클래스를 정의해봅시다." + "변수와 연산을 요약하기 위한 간단한 클래스를 정의해봅시다." ] }, { @@ -397,7 +397,7 @@ "source": [ "model = Model()\n", "\n", - "# 도식화를 위해 W값과 b값들의 변화를 저장합니다.\n", + "# 도식화를 위해 W값과 b값의 변화를 저장합니다.\n", "Ws, bs = [], []\n", "epochs = range(10)\n", "for epoch in epochs:\n", @@ -430,7 +430,7 @@ "\n", "이번 튜토리얼에서는 `Variable`를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", "\n", - "이론적으로, 이것은 머신러닝 연구에 텐서플로를 사용하는데 필요한 대부분입니다. 실제로, 신경망에 있어 `tf.keras`와 고수준 API들은 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + "이론적으로, 이것은 머신러닝 연구에 텐서플로를 사용하는데 필요한 대부분입니다. 실제로, 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " ] } ], @@ -458,7 +458,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.7" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 99b8486f785..4f99b339195 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -41,7 +41,7 @@ "id": "JtEZ1pCPn--z" }, "source": [ - "# 사용자 정의 학습: walkthrough" + "# 사용자 정의 학습: 둘러보기" ] }, { @@ -78,7 +78,7 @@ "\n", "## 텐서플로 프로그래밍\n", "\n", - "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념들을 사용합니다.\n", + "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념을 사용합니다.\n", "\n", "* [즉시 실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발환경,\n", "* [데이터셋 API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", @@ -112,7 +112,7 @@ "source": [ "### 임포트 및 즉시 실행 구성\n", "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화할 것입니다. 즉시 실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 여러분들이 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화할 것입니다. 즉시 실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", "\n", "즉시 실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." ] @@ -176,7 +176,7 @@ "
\n", "\n", - "다행히도 다른사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류문제에 있어 초보자들에게 유명한 고전 데이터셋입니다. " + "다행히도 다른사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " ] }, { @@ -333,7 +333,7 @@ "source": [ "### `tf.data.Dataset` 생성\n", "\n", - "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", + "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형식으로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", "\n", "\n", "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." @@ -367,7 +367,7 @@ }, "source": [ "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍을 반환합니다. `features`는 사전형 객체인: `{'feature_name': value}`로 주어집니다.\n", - "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)들을 살펴봅시다." + "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)을 살펴봅시다." ] }, { @@ -422,9 +422,9 @@ "id": "E63mArnQaAGz" }, "source": [ - "유사한 특성의 값들은 같이 그룹되어있거나, *배치* 되있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size` 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", + "유사한 특성의 값은 같이 그룹되어있거나, *배치* 되있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size` 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", "\n", - "또한 여러분들은 배치(batch)로부터 약간의 특성을 도식화하여 군집되있는 데이터를 확인할 수 있습니다. " + "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집되있는 데이터를 확인할 수 있습니다. " ] }, { @@ -468,7 +468,7 @@ "source": [ "모델 구축단계를 단순화하기 위해서, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", - "이 함수는 `Tensor`의 list로부터 값을 취하고 특정한 차원으로 결합된 `Tensor`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." + "이 함수는 `텐서`의 list로부터 값을 취하고 특정한 차원으로 결합된 `텐서`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." ] }, { @@ -517,7 +517,7 @@ "id": "NLy0Q1xCldVO" }, "source": [ - "데이터셋의 특성 요소들은 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5행의 예제를 살펴봅시다." + "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5행의 예제를 살펴봅시다." ] }, { @@ -559,13 +559,13 @@ "\n", "### 왜 모델을 사용해야하는가?\n", "\n", - " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)들과 레이블(label)과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", + " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)과 레이블(label)과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", "\n", - "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 여러분들이 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문들)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 여러분들을 위한 모델을 결정합니다. 만약 여러분들이 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 여러분들을 위한 특성들 사이의 관계를 이해하고 제공합니다. \n", + "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성간의 관계를 이해하고 제공합니다. \n", "\n", "### 모델 선정\n", "\n", - "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*들로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전연결 신경망입니다. \n", + "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", "\n", "\n", " \n", "
\n", @@ -589,7 +589,7 @@ "source": [ "### Keras를 사용한 모델 생성\n", "\n", - "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 layer를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것들을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", + "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 layer를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", "\n", "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 layer의 선형 적층 모델입니다. 이 구조는 layer의 인스턴스를 취하며, 아래의 케이스의 경우 각 layer당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)층과 3개의 예측(레이블의 개수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 layer의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] @@ -618,9 +618,9 @@ "id": "FHcbEzMpxbHL" }, "source": [ - "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층들의 출력의 형태를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 단일층과 동일하다고 생각할 수 있습니다. 사용가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", + "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층의 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 단일층과 동일하다고 생각할 수 있습니다. 사용가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", "\n", - "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러측면과 마찬가지로, 신경망의 최적의 형태를 결정하는것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." + "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러측면과 마찬가지로, 최적의 신경망 타입을 결정하는것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." ] }, { @@ -713,7 +713,7 @@ "id": "uRZmchElo481" }, "source": [ - "`tf.argmax`는 예측된 값들 중 가장 큰 확률(원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." + "`tf.argmax`는 예측된 값 중 가장 큰 확률(원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." ] }, { @@ -750,7 +750,7 @@ "\n", "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", "\n", - "붓꽃 분류 문제는 지도학습 *[지도학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지않습니다. 대신에 모델은 특성들의 패턴을 찾습니다. " + "붓꽃 분류 문제는 지도학습 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지않습니다. 대신에 모델은 특성간의 패턴을 찾습니다. " ] }, { @@ -921,13 +921,13 @@ "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 나은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", "\n", "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", - "2. 에포크내에서, `Dataset`의 *features* (`x`)와 *label* (`y`)를 가져오는 예제를 반복합니다.\n", + "2. 에포크내에서, `데이터셋`의 *특성* (`x`)와 *레이블* (`y`)를 가져오는 예제를 반복합니다.\n", "3. 예제의 특성을 사용하여 결과를 예측을 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기위해 사용합니다. \n", - "4. 모델의 변수를 업데이트하기위해 `옵티마이저(optimizer)`를 사용합니다. \n", + "4. 모델의 변수를 업데이트하기위해 `옵티마이저`를 사용합니다. \n", "5. 시각화를 위해 몇가지 값을 추적합니다.\n", "6. 각 에포크를 반복합니다.\n", "\n", - "`num_epochs` 변수는 데이터셋 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 여러분들이 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 경험과 직관을 필요로 합니다. " + "`num_epochs` 변수는 데이터셋 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 경험과 직관을 필요로 합니다. " ] }, { @@ -957,7 +957,7 @@ "from tensorflow import contrib\n", "tfe = contrib.eager\n", "\n", - "# 도식화를 위해 결과 저장\n", + "# 도식화를 위해 결과를 저장합니다.\n", "train_loss_results = []\n", "train_accuracy_results = []\n", "\n", @@ -967,16 +967,16 @@ " epoch_loss_avg = tfe.metrics.Mean()\n", " epoch_accuracy = tfe.metrics.Accuracy()\n", "\n", - " # 훈련 루프 - 32번의 배치 실행\n", + " # 훈련 루프 - 32개의 배치를 사용합니다.\n", " for x, y in train_dataset:\n", - " # Optimize the model\n", + " # 모델을 최적화합니다.\n", " loss_value, grads = grad(model, x, y)\n", " optimizer.apply_gradients(zip(grads, model.trainable_variables),\n", " global_step)\n", "\n", - " # 진행 상황 추적\n", - " epoch_loss_avg(loss_value) # 현재 배치의 손실 추가\n", - " # 예측된 레이블과 실제 레이블 비교\n", + " # 진행 상황을 추적합니다.\n", + " epoch_loss_avg(loss_value) # 현재 배치 손실을 추가합니다.\n", + " # 예측된 레이블과 실제 레이블 비교합니다.\n", " epoch_accuracy(tf.argmax(model(x), axis=1, output_type=tf.int32), y)\n", "\n", " # epoch 종료\n", @@ -1180,7 +1180,7 @@ "id": "HcKEZMtCOeK-" }, "source": [ - "예를들어, 마지막 배치에서 모델이 일반적으로 정확하다는 것을 확인할 수 있습니다. " + "예를 들어, 마지막 배치에서 모델이 일반적으로 정확하다는 것을 확인할 수 있습니다. " ] }, { @@ -1205,7 +1205,7 @@ "source": [ "## 예측을 위해 훈련된 모델 사용하기\n", "\n", - "이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)들을 예측해봅시다.\n", + "이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", "\n", "실제로는 레이블되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접제공 등)로 부터 제공될 수 있습니다. 지금은 레이블을 예측하기위해 수동으로 3개의 레이블되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃이름으로 맵핑되어있습니다.\n", "* `0`: Iris setosa\n", @@ -1263,7 +1263,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.7" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 1d8a1522cd1..9f43f37cb82 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -116,7 +116,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 형태를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 계산하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자들은 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 소비하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" ] }, { @@ -136,7 +136,7 @@ "print(tf.reduce_sum([1, 2, 3]))\n", "print(tf.encode_base64(\"hello world\"))\n", "\n", - "# 연산자의 오버로딩 또한 지원합니다.\n", + "# 연산자의 오버로딩(overloding) 또한 지원합니다.\n", "print(tf.square(2) + tf.square(3))" ] }, @@ -147,7 +147,7 @@ "id": "IDY4WsYRhP81" }, "source": [ - "각각의 텐서는 형태와 데이터 타입을 가지고 있습니다." + "각각의 텐서는 데이터 타입과 크기를 가지고 있습니다." ] }, { @@ -174,8 +174,8 @@ "source": [ "넘파이 `ndarray`와 텐서플로 `Tensor`의 가장 확연한 차이는 다음과 같습니다:\n", "\n", - "1. `Tensor`는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", - "2. `Tensor`는 불변성(immutable)을 가집니다." + "1. `텐서`는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", + "2. `텐서`는 불변성(immutable)을 가집니다." ] }, { @@ -467,7 +467,7 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.6.7" + "version": "3.7.1" } }, "nbformat": 4, diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index e75df364cb0..65c9547aced 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -11,11 +11,11 @@ 즉시실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. 사용자 정의 layer, 정방향 전파, 자동미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. -[eager execution guide](../../guide/eager). +[즉시 실행 가이드](../../guide/eager). -1. [즉시실행(Eager execution)](eager_basics.ipynb) -2. [자동미분과 그래디언트 테이프(Automatic differentiation and gradient tape)](automatic_differentiation.ipynb) +1. [즉시 실행(Eager execution)](eager_basics.ipynb) +2. [자동 미분과 그래디언트 테이프(Automatic differentiation and gradient tape)](automatic_differentiation.ipynb) 3. [사용자 정의 학습 : 기초(Custom training: basics)](custom_training.ipynb) 4. [사용자 정의 layer(Custom layers)](custom_layers.ipynb) -5. [사용자 정의 학습 : walkthrough(Custom training: walkthrough)](custom_training_walkthrough.ipynb) +5. [사용자 정의 학습 : 둘러보기(Custom training: walkthrough)](custom_training_walkthrough.ipynb) From c6658190b8a05386ab728cdbcae5fd4d57eb04ab Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Wed, 3 Apr 2019 23:35:32 +0900 Subject: [PATCH 09/19] Update from b5b0882a --- .../eager/automatic_differentiation.ipynb | 2 +- site/ko/tutorials/eager/custom_layers.ipynb | 6 ++-- site/ko/tutorials/eager/custom_training.ipynb | 33 +++++++++++-------- .../eager/custom_training_walkthrough.ipynb | 22 ++++++------- site/ko/tutorials/eager/eager_basics.ipynb | 30 ++++++++--------- site/ko/tutorials/eager/index.md | 6 ++-- 6 files changed, 53 insertions(+), 46 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index 611488b4a2d..27866a090d4 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -176,7 +176,7 @@ "id": "ISkXuY7YzIcS" }, "source": [ - "기본적으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해제됩니다. 동일한 연산을 대해 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. 이 그래디언트 테이프는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다.\n", + "기본적으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해제됩니다. 동일한 연산 대해 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. 이 그래디언트 테이프는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다.\n", "예를 들면 다음과 같습니다:" ] }, diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index 7222bc1990f..e87e0d1fa0b 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -102,7 +102,7 @@ "\n", "많은 머신러닝 모델은 비교적 단순한 layer의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준 layer 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 layer를 처음부터 작성하거나, 기존 layer의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", - "텐서플로는 [Keras](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. Keras layer는 모델을 구축하는데 매우 유용합니다." + "텐서플로는 [케라스](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. 케라스 layer는 모델을 구축하는데 매우 유용합니다." ] }, { @@ -159,7 +159,7 @@ "source": [ "# layer는 유용한 메서드를 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 layer안에 있는 모든 변수를 확인할 수 있으며, \n", "# `layer.trainable_variables`를 사용하여 학습가능한 변수를 확인할 수 있습니다. \n", - "# 이번 케이스에서 완전연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", + "# 이번 케이스에서 완전 연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" ] }, @@ -173,7 +173,7 @@ }, "outputs": [], "source": [ - "# 또한 변수는 여러 accessors를 통해 접근가능합니다. \n", + "# 또한 변수는 여러 접근자(accessors)를 통해 접근가능합니다. \n", "layer.kernel, layer.bias" ] }, diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index 5b1a8e93108..f83e416b129 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -73,7 +73,7 @@ "source": [ "이전 튜토리얼에서는 머신러닝을 위한 기초 빌딩 블록인 자동 미분(automatic differentiation)을 위한 텐서플로 API를 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", "\n", - "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련하여 일을 하고 있는 사람에게는 이러한 고수준의 API을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " + "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련된 일을 하고 있는 사람에게는 이러한 고수준의 API을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " ] }, { @@ -119,7 +119,7 @@ "source": [ "## 변수\n", "\n", - "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로, 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " + "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " ] }, { @@ -163,11 +163,11 @@ "v = tf.Variable(1.0)\n", "assert v.numpy() == 1.0\n", "\n", - "# 값 재배열\n", + "# 값을 재배열합니다.\n", "v.assign(3.0)\n", "assert v.numpy() == 3.0\n", "\n", - "# 텐서플로 연산내에서 `v` 사용 \n", + "# 텐서플로 연산내에서 `v` 사용합니다. \n", "v.assign(tf.square(v))\n", "assert v.numpy() == 9.0" ] @@ -179,9 +179,9 @@ "id": "-paSaeq1JzwC" }, "source": [ - "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기로부터 드물게 업데이트됩니다. 이는 연산과 메모리에 있어 더욱 효율적입니다. \n", + "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기로부터 드물게 업데이트됩니다. 이는 연산과 메모리에 더욱 효율적입니다. \n", "\n", - "또한 변수를 사용하는 것은 코드를 읽는 과정에서 상태가 변경 가능한 상태(state mutable)의 조각을 빠르게 인식하는 방법입니다." + "또한 변수를 사용하는 것은 코드를 읽는 독자가 이 상태가 변경 가능하다는 것을 빠르게 인식하는 방법입니다." ] }, { @@ -193,7 +193,7 @@ "source": [ "## 예: 선형모델 피팅\n", "\n", - "몇가지 개념을 설명해보겠습니다. 우리는 지금까지 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였습니다. 이것은 전형적으로 다음의 과정을 포함합니다.\n", + "몇가지 개념을 설명해보겠습니다. 우리는 지금까지 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였습니다. 이것은 일반적으로 다음의 과정을 포함합니다.\n", "\n", "1. 모델 정의\n", "2. 손실함수 정의\n", @@ -227,7 +227,7 @@ "source": [ "class Model(object):\n", " def __init__(self):\n", - " # 변수 초기화 (5.0, 0.0)\n", + " # 변수를 (5.0, 0.0)으로 초기화 합니다.\n", " # 실제로는 임의의 값으로 초기화 되어야합니다.\n", " self.W = tf.Variable(5.0)\n", " self.b = tf.Variable(0.0)\n", @@ -304,7 +304,7 @@ "id": "-50nq-wPBsAW" }, "source": [ - "모델을 훈련시키기 전에, 모델의 현재 상태를 시각화합시다. 모델의 예측을 빨간색으로, 훈련데이터를 파란색으로 구성합니다." + "모델을 훈련시키기 전에, 모델의 현재 상태를 시각화합시다. 모델의 예측을 빨간색으로, 훈련 데이터를 파란색으로 구성합니다." ] }, { @@ -354,7 +354,7 @@ "source": [ "### 훈련 루프 정의\n", "\n", - "현재 우리는 네트워크와 훈련 데이터를 가지고 있습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시킵니다. 그리고 [경사하강(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)를 사용하여 손실을 감소시킵니다. 경사하강에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." + "현재 우리는 네트워크와 훈련 데이터를 가지고 있습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시킵니다. 그리고 [경사 하강(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)을 사용하여 손실을 감소시킵니다. 경사 하강에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." ] }, { @@ -409,7 +409,7 @@ " print('에포크 %2d: W=%1.2f b=%1.2f, 손실=%2.5f' %\n", " (epoch, Ws[-1], bs[-1], current_loss))\n", "\n", - "# Let's plot it all\n", + "# 저장된 값들을 도식화합니다.\n", "plt.plot(epochs, Ws, 'r',\n", " epochs, bs, 'b')\n", "plt.plot([TRUE_W] * len(epochs), 'r--',\n", @@ -428,10 +428,17 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 `Variable`를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", + "이번 튜토리얼에서는 변수를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", "\n", - "이론적으로, 이것은 머신러닝 연구에 텐서플로를 사용하는데 필요한 대부분입니다. 실제로, 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + "이론적으로, 이것은 텐서플로를 머신러닝 연구에 사용하는데 필요한 대부분입니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] } ], "metadata": { diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 4f99b339195..ccd4cf0586c 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -220,7 +220,7 @@ "train_dataset_fp = tf.keras.utils.get_file(fname=os.path.basename(train_dataset_url),\n", " origin=train_dataset_url)\n", "\n", - "print(\"Local copy of the dataset file: {}\".format(train_dataset_fp))" + "print(\"데이터셋이 복사된 위치: {}\".format(train_dataset_fp))" ] }, { @@ -232,7 +232,7 @@ "source": [ "### 데이터 탐색\n", "\n", - "이 데이터셋(`iris_training.csv`)은 ','로 구분된 CSV 파일입니다. `head -n5` 명령을 사용하여 처음 5개 항목을 확인합니다. " + "이 데이터셋(`iris_training.csv`)은 콤마 ','로 구분된 CSV 파일입니다. `head -n5` 명령을 사용하여 처음 5개 항목을 확인합니다. " ] }, { @@ -565,7 +565,7 @@ "\n", "### 모델 선정\n", "\n", - "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", + "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 완전 연결 신경망(fully-connected neural network))](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", "\n", "\n", " \n", "
\n", @@ -587,11 +587,11 @@ "id": "W23DIMVPQEBt" }, "source": [ - "### Keras를 사용한 모델 생성\n", + "### 케라스를 사용한 모델 생성\n", "\n", "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 layer를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 layer의 선형 적층 모델입니다. 이 구조는 layer의 인스턴스를 취하며, 아래의 케이스의 경우 각 layer당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)층과 3개의 예측(레이블의 개수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 layer의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 layer의 선형 적층 모델입니다. 이 구조는 layer의 인스턴스를 취하며, 아래의 케이스의 경우 각 layer당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)층과 3개의 예측(레이블의 수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 layer의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { @@ -1097,11 +1097,11 @@ "id": "z-EvK7hGL0d8" }, "source": [ - "### 테스트 데이터셋 설정\n", + "### 테스트 데이터 세트 설정\n", "\n", - "모델을 평가하는것은 모델을 학습하는것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터셋](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 을 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기위해, 모델을 평가하기위한 예제는 반드시 훈련 데이터와 달라야합니다. \n", + "모델을 평가하는것은 모델을 학습하는것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기위해, 모델을 평가하기위한 예제는 반드시 훈련 데이터와 달라야합니다. \n", "\n", - "테스트 데이터셋을 설정하는것은 훈련 데이터셋을 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 구분합니다. 그 후 약간의 셔플을 적용합니다." + "테스트 데이터 세트를 설정하는것은 훈련 데이터 세트를 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 구분합니다. 그 후 약간의 셔플을 적용합니다." ] }, { @@ -1148,9 +1148,9 @@ "id": "HFuOKXJdMAdm" }, "source": [ - "### 테스트 데이터셋을 사용한 모델 평가\n", + "### 테스트 데이터 세트를 사용한 모델 평가\n", "\n", - "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한번의 [epoch](https://developers.google.com/machine-learning/glossary/#epoch)을 진행합니다. 다음의 코드셀은 테스트 셋을 반복하여 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터셋에 대한 정확도를 측정하는데 사용됩니다." + "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)을 진행합니다. 다음의 코드셀은 테스트 셋을 반복하여 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." ] }, { @@ -1170,7 +1170,7 @@ " prediction = tf.argmax(logits, axis=1, output_type=tf.int32)\n", " test_accuracy(prediction, y)\n", "\n", - "print(\"테스트셋 정확도: {:.3%}\".format(test_accuracy.result()))" + "print(\"테스트 세트 정확도: {:.3%}\".format(test_accuracy.result()))" ] }, { diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 9f43f37cb82..afafd614e23 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -116,7 +116,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 소비하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" ] }, { @@ -147,7 +147,7 @@ "id": "IDY4WsYRhP81" }, "source": [ - "각각의 텐서는 데이터 타입과 크기를 가지고 있습니다." + "각각의 텐서는 크기와 데이터 타입을 가지고 있습니다." ] }, { @@ -218,7 +218,7 @@ "print(\"그리고 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\")\n", "print(np.add(tensor, 1))\n", "\n", - "print(\".numpy() 메서드는 텐서를 넘파이 배열로 전환시킵니다.\")\n", + "print(\".numpy() 메서드는 텐서를 넘파이 배열로 전환합니다.\")\n", "print(tensor.numpy())" ] }, @@ -231,7 +231,7 @@ "source": [ "## GPU 가속기\n", "\n", - "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 CPU 와 GPU에 텐서를 복사합니다.) 명령에 의해 생성된 텐서는 전형적으로 명령이 실행된 장치의 메모리에 의해 실행됩니다. 예를 들어:" + "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 텐서를 CPU 와 GPU에 복사합니다.) 연산에 의해 생성된 텐서는 전형적으로 연산이 실행된 장치의 메모리에 의해 실행됩니다. 예를 들어:" ] }, { @@ -286,7 +286,7 @@ "source": [ "### 명시적 장치 배치\n", "\n", - "텐서플로에서 \"배치\"라는 용어는 개별 명령이 실행을 위해 장치를 할당(배치)하는 방법을 나타냅니다. 앞서 언급되었듯이, 명시적 지침이 없을경우 텐서플로는 명령을 실행하기위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" + "텐서플로에서 \"배치\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치)하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을경우 텐서플로는 연산을 실행하기위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" ] }, { @@ -311,14 +311,14 @@ " print(\"10 loops: {:0.2f}ms\".format(1000*result))\n", "\n", "\n", - "# CPU에 강제실행\n", + "# CPU에서 강제실행합니다.\n", "print(\"On CPU:\")\n", "with tf.device(\"CPU:0\"):\n", " x = tf.random_uniform([1000, 1000])\n", " assert x.device.endswith(\"CPU:0\")\n", " time_matmul(x)\n", "\n", - "# 이용가능시 GPU #0에 강제실행\n", + "# GPU #0가 이용가능시 GPU #0에서 강제실행합니다.\n", "if tf.test.is_gpu_available():\n", " with tf.device(\"GPU:0\"): # 또는 GPU:1, GPU:2\n", " x = tf.random_uniform([1000, 1000])\n", @@ -337,12 +337,12 @@ "\n", "이번 섹션에서는 모델에 데이터를 제공하기 위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", "\n", - "* `Dataset` 생성.\n", - "* 즉시 실행 활성화와 `Dataset`을 통한 반복\n", + "* 데이터셋 생성.\n", + "* 즉시 실행 활성화를 통한 데이터셋 반복\n", "\n", - "모델을 학습시키고, 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터 복잡한 입력 파이프라인을 구축하기위해 `Dataset`s API를 사용하기를 권장합니다. \n", + "모델을 학습시키고 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", "\n", - "만약 텐서플로 그래프에 익숙하다면, `Dataset` 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 그러나 데이터셋의 요소를 반복하는 프로세스는 약간 더 간단합니다.\n", + "만약 텐서플로 그래프에 익숙하다면, 데이터셋 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 데이터셋의 요소를 반복하는 프로세스가 약간 더 간단해집니다.\n", "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시 실행이 활성화될 때에는 관계없습니다. " ] @@ -354,7 +354,7 @@ "id": "zI0fmOynH-Ne" }, "source": [ - "### `Dataset` 소스 생성\n", + "### 데이터셋 소스 생성\n", "\n", "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하세요. 더 많은 정보를 위해서 [텐서플로 가이드](https://www.tensorflow.org/guide/datasets#reading_input_data)를 참조하세요." ] @@ -371,7 +371,7 @@ "source": [ "ds_tensors = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6])\n", "\n", - "# CSV 파일 생성\n", + "# CSV 파일을 생성합니다.\n", "import tempfile\n", "_, filename = tempfile.mkstemp()\n", "\n", @@ -393,7 +393,7 @@ "source": [ "### 변환 적용\n", "\n", - "[`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하세요. 또한 데이터셋의 레코드에 변환을 적용하세요. 세부사항은 [`tf.data.Dataset`을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." + "[`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하여 데이터셋의 레코드에 적용하세요. 세부사항은 [tf.data.Dataset을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." ] }, { @@ -420,7 +420,7 @@ "source": [ "### 반복\n", "\n", - "즉시 실행이 활성화되면 `Dataset` 객체는 반복을 지원합니다. 만약 텐서플로 그래프에서 `Dataset`을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." + "즉시 실행이 활성화되면 `Dataset` 객체는 반복이 가능합니다. 만약 텐서플로 그래프에서 데이터셋을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." ] }, { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 65c9547aced..5f0a17f5956 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -15,7 +15,7 @@ 1. [즉시 실행(Eager execution)](eager_basics.ipynb) 2. [자동 미분과 그래디언트 테이프(Automatic differentiation and gradient tape)](automatic_differentiation.ipynb) -3. [사용자 정의 학습 : 기초(Custom training: basics)](custom_training.ipynb) -4. [사용자 정의 layer(Custom layers)](custom_layers.ipynb) -5. [사용자 정의 학습 : 둘러보기(Custom training: walkthrough)](custom_training_walkthrough.ipynb) +3. [사용자 정의 학습 : 기초](custom_training.ipynb) +4. [사용자 정의 layer](custom_layers.ipynb) +5. [사용자 정의 학습 : 둘러보기](custom_training_walkthrough.ipynb) From 26d9447747c86cb8e7e12fac042ec964475447c5 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Thu, 4 Apr 2019 01:18:47 +0900 Subject: [PATCH 10/19] Update from 2e78c664 MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Change some word layer → 층 --- site/ko/tutorials/eager/custom_layers.ipynb | 43 ++++++++++++--------- site/ko/tutorials/eager/index.md | 4 +- 2 files changed, 27 insertions(+), 20 deletions(-) diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index e87e0d1fa0b..ad547086db7 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -41,7 +41,7 @@ "id": "60RdWsg1tETW" }, "source": [ - "# 사용자 정의 layer" + "# 사용자 정의 층" ] }, { @@ -96,13 +96,13 @@ "id": "zSFfVVjkrrsI" }, "source": [ - "## layer: 유용한 연산자 집합\n", + "## 층: 유용한 연산자 집합\n", "\n", "머신러닝을 위한 코드를 작성하는 대부분의 시간동안 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", "\n", - "많은 머신러닝 모델은 비교적 단순한 layer의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준 layer 세트를 제공하므로 사용자 고유의 응용 프로그램에 관련된 layer를 처음부터 작성하거나, 기존 layer의 구성으로 쉽게 작성할 수 있습니다.\n", + "많은 머신러닝 모델은 비교적 단순한 층(layer)의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준형 층을 제공하므로 사용자 고유의 응용 프로그램에 관련된 층을 처음부터 작성하거나, 기존 층의 구성으로 쉽게 작성할 수 있습니다.\n", "\n", - "텐서플로는 [케라스](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. 케라스 layer는 모델을 구축하는데 매우 유용합니다." + "텐서플로는 [케라스](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. 케라스 층은 모델을 구축하는데 매우 유용합니다." ] }, { @@ -115,7 +115,7 @@ }, "outputs": [], "source": [ - "# tf.keras.layers 패키지에서 layer는 객체입니다. layer를 구성하려면 간단히 객체를 생성하십시오.\n", + "# tf.keras.layers 패키지에서 층은 객체입니다. 층을 구성하려면 간단히 객체를 생성하십시오.\n", "# 대부분의 layer는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", "layer = tf.keras.layers.Dense(100)\n", "# 입력 차원의 수는 유추할 수 있기 때문에 종종 불필요합니다. \n", @@ -130,7 +130,7 @@ "id": "Fn69xxPO5Psr" }, "source": [ - "미리 구성되어있는 layer는 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense, Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." + "미리 구성되어있는 층은 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense, Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." ] }, { @@ -143,7 +143,7 @@ }, "outputs": [], "source": [ - "# layer를 사용하기 위해서 간단하게 호출합니다.\n", + "# 층을 사용하기 위해서 간단하게 호출합니다.\n", "layer(tf.zeros([10, 5]))" ] }, @@ -157,9 +157,9 @@ }, "outputs": [], "source": [ - "# layer는 유용한 메서드를 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 layer안에 있는 모든 변수를 확인할 수 있으며, \n", + "# layer는 유용한 메서드를 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 층안에 있는 모든 변수를 확인할 수 있으며, \n", "# `layer.trainable_variables`를 사용하여 학습가능한 변수를 확인할 수 있습니다. \n", - "# 이번 케이스에서 완전 연결(fully-connected) 레이어는 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", + "# 이번 케이스에서 완전 연결(fully-connected)층은 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" ] }, @@ -184,13 +184,13 @@ "id": "O0kDbE54-5VS" }, "source": [ - "## 사용자 정의 layer 구현\n", - "사용자 정의 layer를 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", - " * `__init__` , 모든 독립적인 입력값을 초기화를 할 수 있습니다.\n", + "## 사용자 정의 층 구현\n", + "사용자 정의 층을 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", + " * `__init__` 에서 층에 필요한 매개변수를 입력 받습니다..\n", " * `build`, 입력 텐서의 크기를 알고 나머지를 초기화 할 수 있습니다.\n", " * `call`, 정방향 연산(forward computation)을 진행 할 수 있습니다.\n", "\n", - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 layer가 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 층이 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." ] }, { @@ -230,7 +230,7 @@ "source": [ "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. \n", "\n", - "다른 독자가 표준 layer의 동작을 잘 알고 있기 때문에, 가능한 경우 표준 layer를 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 layer를 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." + "다른 독자가 표준형 층의 동작을 잘 알고 있기 때문에, 가능한 경우 표준형 층을 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 층을 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." ] }, { @@ -240,11 +240,11 @@ "id": "Qhg4KlbKrs3G" }, "source": [ - "## 모델: layer 구성\n", + "## 모델: 층 구성\n", "\n", - "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 layer의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", + "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 여러 층의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", "\n", - "layer 집합을 포함한 유사 layer를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." + "여러 층의 집합을 포함한 유사 layer를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." ] }, { @@ -321,8 +321,15 @@ "source": [ "# 다음 단계\n", "\n", - "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 layer와 모델을 적용할 수 있습니다." + "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 층과 모델을 적용할 수 있습니다." ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] } ], "metadata": { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 5f0a17f5956..5966fe1e419 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -10,12 +10,12 @@ 메일을 보내주시기 바랍니다. 즉시실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. -사용자 정의 layer, 정방향 전파, 자동미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. +사용자 정의 층, 정방향 전파, 자동 미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. [즉시 실행 가이드](../../guide/eager). 1. [즉시 실행(Eager execution)](eager_basics.ipynb) 2. [자동 미분과 그래디언트 테이프(Automatic differentiation and gradient tape)](automatic_differentiation.ipynb) 3. [사용자 정의 학습 : 기초](custom_training.ipynb) -4. [사용자 정의 layer](custom_layers.ipynb) +4. [사용자 정의 층](custom_layers.ipynb) 5. [사용자 정의 학습 : 둘러보기](custom_training_walkthrough.ipynb) From bbdbecb1c9748153243dd2b86e6777d67d94dd39 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Thu, 4 Apr 2019 16:47:57 +0900 Subject: [PATCH 11/19] Update from f50c18c4 Second review with @rickiepark --- .../eager/automatic_differentiation.ipynb | 20 +++++- site/ko/tutorials/eager/custom_layers.ipynb | 68 ++++++++++-------- site/ko/tutorials/eager/custom_training.ipynb | 24 +++++-- .../eager/custom_training_walkthrough.ipynb | 72 +++++++++++-------- site/ko/tutorials/eager/eager_basics.ipynb | 20 +++++- site/ko/tutorials/eager/index.md | 4 +- 6 files changed, 138 insertions(+), 70 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index 27866a090d4..e0649886ffc 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -53,17 +53,31 @@ "source": [ "\n", " \n", " \n", " \n", "
\n", - " View on TensorFlow.org\n", + " TensorFlow.org에서 보기\n", " \n", - " Run in Google Colab\n", + " 구글 코랩(Colab)에서 실행하기\n", " \n", - " View source on GitHub\n", + " 깃허브(GitHub) 소스 보기\n", "
" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", + "작성하거나\n", + "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", + "메일을 보내주시기 바랍니다." + ] + }, { "cell_type": "markdown", "metadata": { diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index ad547086db7..c716311304c 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -53,17 +53,31 @@ "source": [ "\n", " \n", " \n", " \n", "
\n", - " View on TensorFlow.org\n", + " TensorFlow.org에서 보기\n", " \n", - " Run in Google Colab\n", + " 구글 코랩(Colab)에서 실행하기\n", " \n", - " View source on GitHub\n", + " 깃허브(GitHub) 소스 보기\n", "
" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", + "작성하거나\n", + "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", + "메일을 보내주시기 바랍니다." + ] + }, { "cell_type": "markdown", "metadata": { @@ -71,7 +85,7 @@ "id": "UEu3q4jmpKVT" }, "source": [ - "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시 실행(eager execution)을 활성화할 수 있습니다." + "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시 실행(eager execution)과 함께 사용할 수 있습니다." ] }, { @@ -98,11 +112,11 @@ "source": [ "## 층: 유용한 연산자 집합\n", "\n", - "머신러닝을 위한 코드를 작성하는 대부분의 시간동안 개별적인 연산과 변수를 조작하는 것보다는 고수준의 추상화 수준에서 작업하기를 원합니다.\n", + "머신러닝을 위한 코드를 작성하는 대부분의 경우에 개별적인 연산과 변수를 조작하는 것보다는 높은 수준의 추상화에서 작업할 것입니다.\n", "\n", - "많은 머신러닝 모델은 비교적 단순한 층(layer)의 구성과 적층(stacking)으로 표현가능합니다. 또한 텐서플로는 여러 표준형 층을 제공하므로 사용자 고유의 응용 프로그램에 관련된 층을 처음부터 작성하거나, 기존 층의 구성으로 쉽게 작성할 수 있습니다.\n", + "많은 머신러닝 모델은 비교적 단순한 층(layer)을 조합하고 쌓아서 표현가능합니다. 또한 텐서플로는 여러 표준형 층을 제공하므로 사용자 고유의 응용 프로그램에 관련된 층을 처음부터 작성하거나, 기존 층의 조합으로 쉽게 만들 수 있습니다.\n", "\n", - "텐서플로는 [케라스](https://keras.io) API 의 풀패키지를 tf.keras package에 포함하고 있습니다. 케라스 층은 모델을 구축하는데 매우 유용합니다." + "텐서플로는 [전체 케라스](https://keras.io) API를 tf.keras 패키지에 포함하고 있습니다. 케라스 층은 모델을 구축하는데 매우 유용합니다." ] }, { @@ -118,7 +132,7 @@ "# tf.keras.layers 패키지에서 층은 객체입니다. 층을 구성하려면 간단히 객체를 생성하십시오.\n", "# 대부분의 layer는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", "layer = tf.keras.layers.Dense(100)\n", - "# 입력 차원의 수는 유추할 수 있기 때문에 종종 불필요합니다. \n", + "# 입력 차원의 수는 층을 처음 실행할 때 유추할 수 있기 때문에 종종 불필요합니다. \n", "# 일부 복잡한 모델에서는 수동으로 입력 차원의 수를 제공하는것이 유용할 수 있습니다.\n", "layer = tf.keras.layers.Dense(10, input_shape=(None, 5))" ] @@ -130,7 +144,7 @@ "id": "Fn69xxPO5Psr" }, "source": [ - "미리 구성되어있는 층은 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense, Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." + "미리 구성되어있는 층은 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense(완전 연결 층), Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." ] }, { @@ -143,7 +157,7 @@ }, "outputs": [], "source": [ - "# 층을 사용하기 위해서 간단하게 호출합니다.\n", + "# 층을 사용하려면, 간단하게 호출합니다.\n", "layer(tf.zeros([10, 5]))" ] }, @@ -157,9 +171,9 @@ }, "outputs": [], "source": [ - "# layer는 유용한 메서드를 내재하고있습니다. 예를 들어, `layer.variables`를 사용하여 층안에 있는 모든 변수를 확인할 수 있으며, \n", - "# `layer.trainable_variables`를 사용하여 학습가능한 변수를 확인할 수 있습니다. \n", - "# 이번 케이스에서 완전 연결(fully-connected)층은 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", + "# layer는 유용한 메서드를 많이 가지고 있습니다. 예를 들어, `layer.variables`를 사용하여 층안에 있는 모든 변수를 확인할 수 있으며, \n", + "# `layer.trainable_variables`를 사용하여 훈련가능한 변수를 확인할 수 있습니다. \n", + "# 완전 연결(fully-connected)층은 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", "layer.variables" ] }, @@ -173,7 +187,7 @@ }, "outputs": [], "source": [ - "# 또한 변수는 여러 접근자(accessors)를 통해 접근가능합니다. \n", + "# 또한 변수는 객체의 속성을 통해 편리하게 접근가능합니다. \n", "layer.kernel, layer.bias" ] }, @@ -190,7 +204,7 @@ " * `build`, 입력 텐서의 크기를 알고 나머지를 초기화 할 수 있습니다.\n", " * `call`, 정방향 연산(forward computation)을 진행 할 수 있습니다.\n", "\n", - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 층이 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있습니다. 반면에, `__init__`에 변수를 생성하는것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도 있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 층이 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있다는 것입니다. 반면에, `__init__`에 변수를 생성하는 것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." ] }, { @@ -228,9 +242,7 @@ "id": "tk8E2vY0-z4Z" }, "source": [ - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도있습니다. \n", - "\n", - "다른 독자가 표준형 층의 동작을 잘 알고 있기 때문에, 가능한 경우 표준형 층을 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 층을 사용하기 원하면 [github issue](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀리퀘스트를 요청하세요." + "다른 독자가 표준형 층의 동작을 잘 알고 있기 때문에, 가능한 경우 표준형 층을 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 층을 사용하기 원하면 [깃허브](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀 리퀘스트(pull request)를 보내세요." ] }, { @@ -242,9 +254,9 @@ "source": [ "## 모델: 층 구성\n", "\n", - "머신러닝 모델에서 대부분의 흥미로운 유사 layer(layer-likely)는 여러 층의 집합으로 구현되어집니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어있습니다. \n", + "머신러닝 모델에서 대부분의 재미있는 많은 것들은 기존의 층을 조합하여 구현됩니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어 있습니다. \n", "\n", - "여러 층의 집합을 포함한 유사 layer를 생성하기위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현합니다." + "다른층을 포함한 모델을 만들기 위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현한 코드입니다." ] }, { @@ -292,6 +304,13 @@ "print([x.name for x in block.trainable_variables])" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "그러나 대부분의 경우에, 많은 층으로 구성된 모델은 간단하게 연이어 하나의 층으로 호출할 수 있습니다. 이는 tf.keras.Sequential 사용하여 간단한 코드로 구현 가능합니다." + ] + }, { "cell_type": "code", "execution_count": null, @@ -321,15 +340,8 @@ "source": [ "# 다음 단계\n", "\n", - "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 좀 더 나은 구조를 만들기 위해 층과 모델을 적용할 수 있습니다." + "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 층과 모델을 사용하여 좀 더 나은 구조를 적용할 수 있습니다." ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] } ], "metadata": { diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index f83e416b129..ee45fd16603 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -53,17 +53,31 @@ "source": [ "\n", " \n", " \n", " \n", "
\n", - " View on TensorFlow.org\n", + " TensorFlow.org에서 보기\n", " \n", - " Run in Google Colab\n", + " 구글 코랩(Colab)에서 실행하기\n", " \n", - " View source on GitHub\n", + " 깃허브(GitHub) 소스 보기\n", "
" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", + "작성하거나\n", + "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", + "메일을 보내주시기 바랍니다." + ] + }, { "cell_type": "markdown", "metadata": { @@ -119,7 +133,7 @@ "source": [ "## 변수\n", "\n", - "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어에 의존한 선택이 가능합니다. " + "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어를 사용 할 수 있습니다. " ] }, { @@ -430,7 +444,7 @@ "\n", "이번 튜토리얼에서는 변수를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", "\n", - "이론적으로, 이것은 텐서플로를 머신러닝 연구에 사용하는데 필요한 대부분입니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 빌딩 블록(\"layer\"로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + "이론적으로, 이것은 텐서플로를 머신러닝 연구에 사용하는데 필요한 대부분입니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 빌딩 블록(\"층\"으로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " ] }, { diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index ccd4cf0586c..46b3469ab9a 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -53,17 +53,31 @@ "source": [ "\n", " \n", " \n", " \n", "
\n", - " View on TensorFlow.org\n", + " TensorFlow.org에서 보기\n", " \n", - " Run in Google Colab\n", + " 구글 코랩(Colab)에서 실행하기\n", " \n", - " View source on GitHub\n", + " 깃허브(GitHub) 소스 보기\n", "
" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", + "작성하거나\n", + "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", + "메일을 보내주시기 바랍니다." + ] + }, { "cell_type": "markdown", "metadata": { @@ -112,9 +126,9 @@ "source": [ "### 임포트 및 즉시 실행 구성\n", "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화할 것입니다. 즉시 실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게합니다. 만약 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙하실겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화할 것입니다. 즉시 실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", "\n", - "즉시 실행이 활성화 될때, 동일한 프로그램내에서는 비활성화를 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." + "즉시 실행이 활성화될 때, 동일한 프로그램내에서 비활성화 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." ] }, { @@ -257,7 +271,7 @@ "source": [ "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", - "1. 첫번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", + "1. 첫 번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", " * 총 120개의 예가 있으며, 각 예들은 4가지의 특성(feature), 3가지 가능한 레이블(label)을 가지고 있습니다.\n", "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", @@ -285,7 +299,7 @@ } ], "source": [ - "# CSV 파일내에서 컬럼의 순서\n", + "# CSV 파일안에서 컬럼의 순서\n", "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", "\n", "feature_names = column_names[:-1]\n", @@ -302,13 +316,13 @@ "id": "CCtwLoJhhDNc" }, "source": [ - "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적으로 숫자형값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", + "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적으로 숫자형 값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", "\n", "* `0`: Iris setosa\n", "* `1`: Iris versicolor\n", "* `2`: Iris virginica\n", "\n", - "특성과 레이블에 관한 더 많은 정보를 위해서는 다음을 참조하세요. [ML Terminology section of the Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)." + "특성과 레이블에 관한 더 많은 정보를 위해서는 [머신러닝 특강의 전문용어 부분](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)을 참조하세요." ] }, { @@ -333,7 +347,7 @@ "source": [ "### `tf.data.Dataset` 생성\n", "\n", - "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형식으로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 다음을 참조하세요. [Datasets Quick Start guide](https://www.tensorflow.org/get_started/datasets_quickstart) \n", + "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형식으로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", "\n", "\n", "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." @@ -422,7 +436,7 @@ "id": "E63mArnQaAGz" }, "source": [ - "유사한 특성의 값은 같이 그룹되어있거나, *배치* 되있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size` 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", + "유사한 특성의 값은 같이 그룹되어있거나, *배치* 되있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", "\n", "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집되있는 데이터를 확인할 수 있습니다. " ] @@ -468,7 +482,7 @@ "source": [ "모델 구축단계를 단순화하기 위해서, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", - "이 함수는 `텐서`의 list로부터 값을 취하고 특정한 차원으로 결합된 `텐서`를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." + "이 함수는 텐서의 list로부터 값을 취하고 특정한 차원으로 결합된 텐서를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." ] }, { @@ -494,7 +508,7 @@ "id": "V1Vuph_eDl8x" }, "source": [ - "그 후 각 `(features,label)`쌍의 `features`을 훈련 데이터셋에 적재하기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메서드를 사용합니다. " + "그 후 각 `(features,label)`쌍의 특성을 훈련 데이터셋에 쌓기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메서드를 사용합니다. " ] }, { @@ -577,7 +591,7 @@ "
\n", "\n", - "그림 2의 모델이 훈련되고 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지 예측을 출력(주어진 레이블의 개수)합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 정의합니다. 이 예제에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " + "그림 2의 모델이 훈련되고 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지 예측을 출력(주어진 레이블의 개수)합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 불립니다. 이 예제에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " ] }, { @@ -591,7 +605,7 @@ "\n", "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 layer를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 layer의 선형 적층 모델입니다. 이 구조는 layer의 인스턴스를 취하며, 아래의 케이스의 경우 각 layer당 10개의 노드(node)를 가지는 2개의 [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)층과 3개의 예측(레이블의 수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 layer의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 케이스의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)와 3개의 예측(레이블의 수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { @@ -618,9 +632,9 @@ "id": "FHcbEzMpxbHL" }, "source": [ - "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층의 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 단일층과 동일하다고 생각할 수 있습니다. 사용가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", + "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층의 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 하나의 층과 동일하다고 생각할 수 있습니다. 사용 가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", "\n", - "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러측면과 마찬가지로, 최적의 신경망 타입을 결정하는것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." + "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." ] }, { @@ -750,7 +764,7 @@ "\n", "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", "\n", - "붓꽃 분류 문제는 지도학습 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지않습니다. 대신에 모델은 특성간의 패턴을 찾습니다. " + "붓꽃 분류 문제는 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지 않습니다. 대신에 모델은 특성간의 패턴을 찾습니다. " ] }, { @@ -827,9 +841,9 @@ "id": "lOxFimtlKruu" }, "source": [ - "### 옵티마이저(Optimizer) 생성 \n", + "### 옵티마이저 생성 \n", "\n", - "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실`함수를 최소화하기위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자합니다. 그래디언트는 가장 가파른 상승방향을 가르키며 따라서 반대방향으로 이동하는 여행을 합니다.각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련 중에 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 더 적은 손실을 통해 더 좋은 모델의 예측을 기대할 수 있습니다. \n", + "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실` 함수를 최소화하기 위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실 함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자 합니다. 그래디언트는 가장 가파른 상승 방향을 가리키며 따라서 반대 방향으로 이동하는 여행을 합니다. 각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련 중에 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기 위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 더 적은 손실을 통해 더 좋은 모델의 예측을 기대할 수 있습니다. \n", "\n", "\n", " \n", "
\n", @@ -841,7 +855,7 @@ "
\n", "\n", - "텐서플로는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 그래디언트 하강(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " + "텐서플로는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " ] }, { @@ -876,7 +890,7 @@ "id": "pJVRZ0hP52ZB" }, "source": [ - "이 값들을 단일 최적화 단계를 계산하기위해 사용합니다. " + "이 값들을 단일 최적화 단계를 계산하기 위해 사용합니다. " ] }, { @@ -905,7 +919,7 @@ "\n", "optimizer.apply_gradients(zip(grads, model.trainable_variables), global_step)\n", "\n", - "print(\"단계: {}, 손실: {}\".format(global_step.numpy(),\n", + "print(\"단계: {}, 손실: {}\".format(global_step.numpy(),\n", " loss(model, features, labels).numpy()))" ] }, @@ -918,16 +932,16 @@ "source": [ "### 훈련 루프\n", "\n", - "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 나은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", + "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", "\n", "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", - "2. 에포크내에서, `데이터셋`의 *특성* (`x`)와 *레이블* (`y`)를 가져오는 예제를 반복합니다.\n", - "3. 예제의 특성을 사용하여 결과를 예측을 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기위해 사용합니다. \n", - "4. 모델의 변수를 업데이트하기위해 `옵티마이저`를 사용합니다. \n", + "2. 에포크 내에서, `데이터셋`의 *특성* (`x`)와 *레이블* (`y`)를 가져오는 예제를 반복합니다.\n", + "3. 예제의 특성을 사용하여 결과를 예측을 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", + "4. 모델의 변수를 업데이트하기 위해 `옵티마이저`를 사용합니다. \n", "5. 시각화를 위해 몇가지 값을 추적합니다.\n", "6. 각 에포크를 반복합니다.\n", "\n", - "`num_epochs` 변수는 데이터셋 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 경험과 직관을 필요로 합니다. " + "`num_epochs` 변수는 데이터셋 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 많은 경험과 직관을 필요로 합니다. " ] }, { @@ -1207,7 +1221,7 @@ "\n", "이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", "\n", - "실제로는 레이블되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접제공 등)로 부터 제공될 수 있습니다. 지금은 레이블을 예측하기위해 수동으로 3개의 레이블되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃이름으로 맵핑되어있습니다.\n", + "실제로는 레이블 되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃 이름으로 매핑되어있습니다.\n", "* `0`: Iris setosa\n", "* `1`: Iris versicolor\n", "* `2`: Iris virginica" diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index afafd614e23..95f18839886 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -53,17 +53,31 @@ "source": [ "\n", " \n", " \n", " \n", "
\n", - " View on TensorFlow.org\n", + " TensorFlow.org에서 보기\n", " \n", - " Run in Google Colab\n", + " 구글 코랩(Colab)에서 실행하기\n", " \n", - " View source on GitHub\n", + " 깃허브(GitHub) 소스 보기\n", "
" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", + "작성하거나\n", + "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", + "메일을 보내주시기 바랍니다." + ] + }, { "cell_type": "markdown", "metadata": { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 5966fe1e419..cdb89aeae1c 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -13,8 +13,8 @@ 사용자 정의 층, 정방향 전파, 자동 미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. [즉시 실행 가이드](../../guide/eager). -1. [즉시 실행(Eager execution)](eager_basics.ipynb) -2. [자동 미분과 그래디언트 테이프(Automatic differentiation and gradient tape)](automatic_differentiation.ipynb) +1. [즉시 실행](eager_basics.ipynb) +2. [자동 미분과 그래디언트 테이프](automatic_differentiation.ipynb) 3. [사용자 정의 학습 : 기초](custom_training.ipynb) 4. [사용자 정의 층](custom_layers.ipynb) 5. [사용자 정의 학습 : 둘러보기](custom_training_walkthrough.ipynb) From d14335d2de650ad36b207c06728a81544a3bc9b7 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Tue, 9 Apr 2019 15:33:46 +0900 Subject: [PATCH 12/19] Update from 61d453b5 --- site/ko/tutorials/eager/custom_training.ipynb | 87 ++--- .../eager/custom_training_walkthrough.ipynb | 325 +++++------------- site/ko/tutorials/eager/eager_basics.ipynb | 17 +- site/ko/tutorials/eager/index.md | 2 +- 4 files changed, 120 insertions(+), 311 deletions(-) diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index ee45fd16603..8431c372bcf 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -85,9 +85,9 @@ "id": "k2o3TTG4TFpt" }, "source": [ - "이전 튜토리얼에서는 머신러닝을 위한 기초 빌딩 블록인 자동 미분(automatic differentiation)을 위한 텐서플로 API를 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 초기 타입의 텐서플로를 사용하여 간단한 머신러닝을 구축해보겠습니다. \n", + "이전 튜토리얼에서는 머신러닝을 위한 기본 구성 요소인 자동 미분(automatic differentiation)을 위한 텐서플로 API를 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 텐서플로의 기본 요소를 사용하여 간단한 머신러닝을 수행해보겠습니다. \n", "\n", - "텐서플로는 상용구를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망에 관련된 일을 하고 있는 사람에게는 이러한 고수준의 API을 강하게 추천합니다. 그러나 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위한 신경망 학습을 다루겠습니다. " + "텐서플로는 반복되는 코드를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망을 다룰 때 이러한 고수준의 API을 강하게 추천합니다. 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위해 기본적인 요소만으로 신경망 훈련시켜 보겠습니다." ] }, { @@ -102,23 +102,16 @@ }, { "cell_type": "code", - "execution_count": 2, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "PJ64L90aVir3" }, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "C:\\Users\\82108\\Anaconda3\\lib\\site-packages\\h5py\\__init__.py:36: FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is deprecated. In future, it will be treated as `np.float64 == np.dtype(float).type`.\n", - " from ._conv import register_converters as _register_converters\n" - ] - } - ], + "outputs": [], "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", "import tensorflow as tf\n", "\n", "tf.enable_eager_execution()" @@ -133,7 +126,7 @@ "source": [ "## 변수\n", "\n", - "텐서플로 안에서 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다른 양상(희망적으로 더 낮은 손실로 가는 방향으로)을 보여야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 상태가 변경 가능한 파이썬 언어를 사용 할 수 있습니다. " + "텐서플로의 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다르게(희망하건대 더 낮은 손실로 가는 방향으로)동작해야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 명령형 프로그래밍 언어인 파이썬을 사용 할 수 있습니다. " ] }, { @@ -146,9 +139,9 @@ }, "outputs": [], "source": [ - "# 파이썬 state 사용\n", + "# 파이썬 구문 사용\n", "x = tf.zeros([10, 10])\n", - "x += 2 # 이것은 x = x + 2와 같으며, 초기값 x를 변경하지 않습니다.\n", + "x += 2 # 이것은 x = x + 2와 같으며, x의 초기값을 변경하지 않습니다.\n", "print(x)" ] }, @@ -159,9 +152,9 @@ "id": "wfneTXy7JcUz" }, "source": [ - "그러나 텐서플로는 상태가 변경 가능한 연산자가 내장되어 있으며, 이러한 연산자는 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는것이 편하고 효율적입니다. \n", + "텐서플로는 상태를 변경할 수 있는 연산자가 내장되어 있으며, 이러한 연산자는 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는 것이 편하고 효율적입니다. \n", "\n", - "텐서플로 변수는 값을 저장하고 텐서플로 연산에 사용될 때 묵시적으로 저장된 값을 읽어오는 객체입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자입니다." + "텐서플로 변수는 값을 저장하는 객체로 텐서플로 연산에 사용될 때 저장된 이 값을 읽어올 것입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자입니다." ] }, { @@ -181,7 +174,7 @@ "v.assign(3.0)\n", "assert v.numpy() == 3.0\n", "\n", - "# 텐서플로 연산내에서 `v` 사용합니다. \n", + "# tf.square()와 같은 텐서플로 연산에 `v`를 사용하고 재할당합니다. \n", "v.assign(tf.square(v))\n", "assert v.numpy() == 9.0" ] @@ -193,9 +186,9 @@ "id": "-paSaeq1JzwC" }, "source": [ - "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 초기로부터 드물게 업데이트됩니다. 이는 연산과 메모리에 더욱 효율적입니다. \n", + "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 기본적으로 희소 텐서(sparse tensor)를 사용하여 업데이트됩니다. 이는 연산과 메모리에 더욱 효율적입니다. \n", "\n", - "또한 변수를 사용하는 것은 코드를 읽는 독자가 이 상태가 변경 가능하다는 것을 빠르게 인식하는 방법입니다." + "또한 변수를 사용하는 것은 코드를 읽는 독자에게 상태가 변경될 수 있다는 것을 알려주는 손쉬운 방법입니다." ] }, { @@ -205,16 +198,16 @@ "id": "BMiFcDzE7Qu3" }, "source": [ - "## 예: 선형모델 피팅\n", + "## 예: 선형 모델 훈련\n", "\n", - "몇가지 개념을 설명해보겠습니다. 우리는 지금까지 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였습니다. 이것은 일반적으로 다음의 과정을 포함합니다.\n", + "지금까지 몇 가지 개념을 설명했습니다. 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였고, 이는 일반적으로 다음의 과정을 포함합니다.\n", "\n", "1. 모델 정의\n", - "2. 손실함수 정의\n", + "2. 손실 함수 정의\n", "3. 훈련 데이터 가져오기\n", - "4. 훈련 데이터를 통한 실행, 데이터에 최적화하기 위한 \"옵티마이저(optimizer)\" 사용한 변수 조정\n", + "4. 훈련 데이터에서 실행, 데이터에 최적화하기 위해 \"옵티마이저(optimizer)\"를 사용한 변수 조정\n", "\n", - "이번 튜토리얼에서는 선형모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, 위 모델은 `W` 와 `b` 두 변수를 가지고 있는 선형모델이며, 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 데이터를 합성할 것입니다." + "이번 튜토리얼에서는 선형 모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, 모델은 `W` 와 `b` 두 변수를 가지고 있는 선형모델이며, 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 합성 데이터를 만들겠습니다." ] }, { @@ -226,12 +219,12 @@ "source": [ "### 모델 정의\n", "\n", - "변수와 연산을 요약하기 위한 간단한 클래스를 정의해봅시다." + "변수와 연산을 캡슐화하기 위한 간단한 클래스를 정의해봅시다." ] }, { "cell_type": "code", - "execution_count": 3, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -263,12 +256,12 @@ "source": [ "### 손실 함수 정의\n", "\n", - "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지를 측정합니다. L2 규제항(regularization)을 적용한 손실 함수를 사용하겠습니다." + "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지를 측정합니다. 평균 제곱 오차(mean square error)를 적용한 손실 함수를 사용하겠습니다." ] }, { "cell_type": "code", - "execution_count": 4, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -287,14 +280,14 @@ "id": "qutT_fkl_CBc" }, "source": [ - "### 훈련 데이터 얻기\n", + "### 훈련 데이터 가져오기\n", "\n", "약간의 잡음과 훈련 데이터를 합칩니다." ] }, { "cell_type": "code", - "execution_count": 5, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -323,31 +316,13 @@ }, { "cell_type": "code", - "execution_count": 6, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "_eb83LtrB4nt" }, - "outputs": [ - { - "data": { - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - }, - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Current loss: \n", - "9.401943\n" - ] - } - ], + "outputs": [], "source": [ "import matplotlib.pyplot as plt\n", "\n", @@ -368,7 +343,7 @@ "source": [ "### 훈련 루프 정의\n", "\n", - "현재 우리는 네트워크와 훈련 데이터를 가지고 있습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시킵니다. 그리고 [경사 하강(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)을 사용하여 손실을 감소시킵니다. 경사 하강에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." + "이제 네트워크와 훈련 데이터가 준비되었습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시켜 보죠. 그리고 [경사 하강법(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)을 사용하여 손실을 감소시킵니다. 경사 하강법에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." ] }, { @@ -396,7 +371,7 @@ "id": "RwWPaJryD2aN" }, "source": [ - "마지막으로, 훈련 데이터를 반복적으로 실행하고, `W` 와 `b`의 변화과정을 확인합니다." + "마지막으로, 훈련 데이터를 반복적으로 실행하고, `W` 와 `b`의 변화 과정을 확인합니다." ] }, { @@ -442,9 +417,9 @@ "source": [ "## 다음 단계\n", "\n", - "이번 튜토리얼에서는 변수를 다루었으며, 지금까지 논의된 초기 타입의 텐서플로를 사용하여 간단한 선형모델을 구축하고 훈련시켰습니다.\n", + "이번 튜토리얼에서는 변수를 다루었으며, 지금까지 논의된 텐서플로의 기본 요소를 사용하여 간단한 선형 모델을 구축하고 훈련시켰습니다.\n", "\n", - "이론적으로, 이것은 텐서플로를 머신러닝 연구에 사용하는데 필요한 대부분입니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 빌딩 블록(\"층\"으로 불리는)을 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + "이론적으로, 텐서플로를 머신러닝 연구에 사용하기 위해 알아야 할 것이 매우 많습니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 구성 요소(\"층\"으로 불리는)를 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " ] }, { diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 46b3469ab9a..159af60744c 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -94,17 +94,17 @@ "\n", "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념을 사용합니다.\n", "\n", - "* [즉시 실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발환경,\n", - "* [데이터셋 API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 불러오기,\n", - "* [케라스 API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 layer 구축 .\n", + "* [즉시 실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발 환경,\n", + "* [데이터셋 API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 가져오기,\n", + "* [케라스 API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 층(layer) 구축 .\n", "\n", "이번 튜토리얼은 다른 텐서플로 프로그램과 유사하게 구성되어있습니다.\n", "\n", - "1. 데이터 불러오기 및 분석.\n", + "1. 데이터 가져오기 및 분석.\n", "2. 모델 타입 선정.\n", - "3. 모델 학습.\n", + "3. 모델 훈련.\n", "4. 모델 효과 검증.\n", - "5. 예측을 위한 학습된 모델 사용." + "5. 예측을 위한 훈련된 모델 사용." ] }, { @@ -126,31 +126,22 @@ "source": [ "### 임포트 및 즉시 실행 구성\n", "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화할 것입니다. 즉시 실행은 텐서플로가 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 인터렉티브 콘솔을 사용하시면, 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화합니다. 즉시 실행은 텐서플로가 연산이 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 상호작용 콘솔을 사용하시면 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", "\n", - "즉시 실행이 활성화될 때, 동일한 프로그램내에서 비활성화 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)을 참조하세요." + "즉시 실행이 활성화될 때, 동일한 프로그램내에서 비활성화 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 참조하세요." ] }, { "cell_type": "code", - "execution_count": 1, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "g4Wzg69bnwK2" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "텐서플로 버전: 1.10.0\n", - "즉시실행: True\n" - ] - } - ], + "outputs": [], "source": [ - "from __future__ import absolute_import, division, print_function\n", + "from __future__ import absolute_import, division, print_function, unicode_literals\n", "\n", "import os\n", "import matplotlib.pyplot as plt\n", @@ -172,9 +163,9 @@ "source": [ "## 붓꽃 분류 문제\n", "\n", - "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 이번 튜토리얼의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는것입니다.\n", + "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고 있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 이번 튜토리얼의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는 것입니다.\n", "\n", - "이 붓꽃은 약 300종 입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", + "이 붓꽃은 약 300종입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", "\n", "* Iris setosa\n", "* Iris virginica\n", @@ -200,7 +191,7 @@ "id": "3Px6KAg0Jowz" }, "source": [ - "## 훈련 데이터 불러오기 및 분석\n", + "## 훈련 데이터 가져오기 및 분석\n", "\n", "데이터를 불러오고 파이썬 프로그램이 사용할 수 있는 구조로 전환합니다.\n", "\n", @@ -211,23 +202,13 @@ }, { "cell_type": "code", - "execution_count": 2, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "J6c7uEU9rjRM" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Downloading data from https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\n", - "8192/2194 [================================================================================================================] - 0s 0us/step\n", - "Local copy of the dataset file: C:\\Users\\82108\\.keras\\datasets\\iris_training.csv\n" - ] - } - ], + "outputs": [], "source": [ "train_dataset_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\"\n", "\n", @@ -272,7 +253,7 @@ "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", "1. 첫 번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 예가 있으며, 각 예들은 4가지의 특성(feature), 3가지 가능한 레이블(label)을 가지고 있습니다.\n", + " * 총 120개의 예가 있으며, 각 예들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 예측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", @@ -282,22 +263,13 @@ }, { "cell_type": "code", - "execution_count": 3, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "9Edhevw7exl6" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "특성: ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']\n", - "레이블: species\n" - ] - } - ], + "outputs": [], "source": [ "# CSV 파일안에서 컬럼의 순서\n", "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", @@ -327,7 +299,7 @@ }, { "cell_type": "code", - "execution_count": 4, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -347,15 +319,15 @@ "source": [ "### `tf.data.Dataset` 생성\n", "\n", - "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위한 많은 케이스를 다룹니다. 이는 훈련을 위한 형식으로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", + "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위해 많은 케이스를 다룹니다. 이는 훈련을 위해 형식으로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", "\n", "\n", - "데이터셋이 CSV 형태의 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." + "데이터셋이 CSV 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련 모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." ] }, { "cell_type": "code", - "execution_count": 5, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -386,43 +358,13 @@ }, { "cell_type": "code", - "execution_count": 6, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "iDuG94H-C122" }, - "outputs": [ - { - "data": { - "text/plain": [ - "OrderedDict([('sepal_length',\n", - " ),\n", - " ('sepal_width',\n", - " ),\n", - " ('petal_length',\n", - " ),\n", - " ('petal_width',\n", - " )])" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], + "outputs": [], "source": [ "features, labels = next(iter(train_dataset))\n", "\n", @@ -436,33 +378,20 @@ "id": "E63mArnQaAGz" }, "source": [ - "유사한 특성의 값은 같이 그룹되어있거나, *배치* 되있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", + "유사한 특성의 값은 같이 그룹 되어있거나, *배치* 돼있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", "\n", - "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집되있는 데이터를 확인할 수 있습니다. " + "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집돼있는 데이터를 확인할 수 있습니다. " ] }, { "cell_type": "code", - "execution_count": 10, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "me5Wn-9FcyyO" }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], + "outputs": [], "source": [ "plt.scatter(features['petal_length'].numpy(),\n", " features['sepal_length'].numpy(),\n", @@ -480,14 +409,14 @@ "id": "YlxpSyHlhT6M" }, "source": [ - "모델 구축단계를 단순화하기 위해서, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", + "모델 구축 단계를 단순화하기 위해, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", - "이 함수는 텐서의 list로부터 값을 취하고 특정한 차원으로 결합된 텐서를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." + "이 함수는 텐서의 리스트(list)로부터 값을 취하고 특정한 차원으로 결합된 텐서를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." ] }, { "cell_type": "code", - "execution_count": 11, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -531,31 +460,18 @@ "id": "NLy0Q1xCldVO" }, "source": [ - "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5행의 예제를 살펴봅시다." + "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5개행의 예제를 살펴봅시다." ] }, { "cell_type": "code", - "execution_count": 13, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "kex9ibEek6Tr" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "tf.Tensor(\n", - "[[4.9 3. 1.4 0.2]\n", - " [6.6 2.9 4.6 1.3]\n", - " [6.8 3.2 5.9 2.3]\n", - " [5. 3.5 1.3 0.3]\n", - " [7.7 2.8 6.7 2. ]], shape=(5, 4), dtype=float32)\n" - ] - } - ], + "outputs": [], "source": [ "features, labels = next(iter(train_dataset))\n", "\n", @@ -573,9 +489,9 @@ "\n", "### 왜 모델을 사용해야하는가?\n", "\n", - " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)과 레이블(label)과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", + " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)과 레이블(label) 과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇 가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", "\n", - "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성간의 관계를 이해하고 제공합니다. \n", + "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을 정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성 간의 관계를 이해하고 제공합니다. \n", "\n", "### 모델 선정\n", "\n", @@ -603,14 +519,14 @@ "source": [ "### 케라스를 사용한 모델 생성\n", "\n", - "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 layer를 생성하기위한 풍부한 라이브러리를 제공합니다. 이는 연결되있는 모든것을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", + "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 층을 생성하기 위한 풍부한 라이브러리를 제공합니다. 이는 파이프라인의 모든 것을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 케이스의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)와 3개의 예측(레이블의 수)노드를 가지는 출력 층으로 구성되어있습니다. 첫번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 케이스의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)와 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { "cell_type": "code", - "execution_count": 15, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -632,9 +548,9 @@ "id": "FHcbEzMpxbHL" }, "source": [ - "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층의 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 하나의 층과 동일하다고 생각할 수 있습니다. 사용 가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", + "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층에서 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 하나의 층과 동일하다고 생각할 수 있습니다. 사용 가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", "\n", - "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로, 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." + "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 의해 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." ] }, { @@ -646,34 +562,18 @@ "source": [ "### 모델 사용\n", "\n", - "이 모델이 배치 특성에 대해 수행하는 작업을 간단히 살펴보겠습니다. " + "이 모델이 특성의 배치에 대해 수행하는 작업을 간단히 살펴봅시다. " ] }, { "cell_type": "code", - "execution_count": 16, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "xe6SQ5NrpB-I" }, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 16, - "metadata": {}, - "output_type": "execute_result" - } - ], + "outputs": [], "source": [ "predictions = model(features)\n", "predictions[:5]" @@ -693,29 +593,13 @@ }, { "cell_type": "code", - "execution_count": 17, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "_tRwHZmTNTX2" }, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 17, - "metadata": {}, - "output_type": "execute_result" - } - ], + "outputs": [], "source": [ "tf.nn.softmax(predictions[:5])" ] @@ -732,22 +616,13 @@ }, { "cell_type": "code", - "execution_count": 18, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "-Jzm_GoErz8B" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "예측: [2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2]\n", - " 레이블: [0 1 2 0 2 1 0 0 2 1 1 2 2 2 0 2 0 2 0 2 0 0 1 0 0 1 2 2 2 1 0 2]\n" - ] - } - ], + "outputs": [], "source": [ "print(\"예측: {}\".format(tf.argmax(predictions, axis=1)))\n", "print(\" 레이블: {}\".format(labels))" @@ -764,7 +639,7 @@ "\n", "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", "\n", - "붓꽃 분류 문제는 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지 않습니다. 대신에 모델은 특성간의 패턴을 찾습니다. " + "붓꽃 분류 문제는 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지 않습니다. 대신에 모델은 특성 간의 패턴을 찾습니다. " ] }, { @@ -776,28 +651,20 @@ "source": [ "### 손실 함수와 그래디언트 함수 정의하기\n", "\n", - "훈련과 평가단계는 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)* 계산할 필요가 있습니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 이 값은 최소화하고, 최적화하기를 원합니다. \n", + "훈련과 평가단계에서 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)*을 계산해야 합니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 이 값을 최소화하고, 최적화 해야합니다.\n", "\n", - "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용하여 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 예제를 통한 평균 손실을 반환합니다." + "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용해 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 예제를 통한 평균 손실을 반환합니다." ] }, { "cell_type": "code", - "execution_count": 21, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "tMAT4DcMPwI-" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "손실 테스트: 1.5565308332443237\n" - ] - } - ], + "outputs": [], "source": [ "def loss(model, x, y):\n", " y_ = model(x)\n", @@ -820,7 +687,7 @@ }, { "cell_type": "code", - "execution_count": 22, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -843,7 +710,7 @@ "source": [ "### 옵티마이저 생성 \n", "\n", - "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 `손실` 함수를 최소화하기 위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실 함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자 합니다. 그래디언트는 가장 가파른 상승 방향을 가리키며 따라서 반대 방향으로 이동하는 여행을 합니다. 각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련 중에 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기 위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 더 적은 손실을 통해 더 좋은 모델의 예측을 기대할 수 있습니다. \n", + "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 손실 함수를 최소화하기 위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실 함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자 합니다. 그래디언트는 가장 가파른 상승 방향을 가리키며 따라서 반대 방향으로 이동하는 여행을 합니다. 각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련과정 동안 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기 위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 손실이 낮을수록 더 좋은 모델의 예측을 기대할 수 있습니다.\n", "\n", "\n", " \n", " \n", "
\n", @@ -851,11 +718,11 @@ " alt=\"Optimization algorithms visualized over time in 3D space.\">\n", "
\n", - " 그림 3. Optimization algorithms visualized over time in 3D space.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", + " 그림 3. 3차원 공간에 대한 최적화 알고리즘 시각화.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", "
\n", "\n", - "텐서플로는 학습을 위해 이용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. 매개변수 `learning_rate`은 경사하강 과정의 크기를 나타내는 척도이며, 더 나은 결과를 위해 공동적으로 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " + "텐서플로는 훈련을 위해 사용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강법(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. `learning_rate`은 경사하강 과정의 크기를 나타내는 매개변수이며, 더 나은 결과를 위해 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " ] }, { @@ -870,7 +737,7 @@ }, { "cell_type": "code", - "execution_count": 25, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", @@ -895,22 +762,13 @@ }, { "cell_type": "code", - "execution_count": 26, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "rxRNTFVe56RG" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "단계: 0, 초기 손실: 1.5565308332443237\n", - "단계: 1, 손실: 1.4113397598266602\n" - ] - } - ], + "outputs": [], "source": [ "loss_value, grads = grad(model, features, labels)\n", "\n", @@ -932,39 +790,27 @@ "source": [ "### 훈련 루프\n", "\n", - "모든 조각을 가지고, 모델은 학습할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", + "모든 조각을 가지고 모델을 훈련할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", "\n", "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", "2. 에포크 내에서, `데이터셋`의 *특성* (`x`)와 *레이블* (`y`)를 가져오는 예제를 반복합니다.\n", - "3. 예제의 특성을 사용하여 결과를 예측을 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", + "3. 예제의 특성을 사용하여 결과를 예측 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", "4. 모델의 변수를 업데이트하기 위해 `옵티마이저`를 사용합니다. \n", - "5. 시각화를 위해 몇가지 값을 추적합니다.\n", + "5. 시각화를 위해 몇가지 값들을 저장합니다.\n", "6. 각 에포크를 반복합니다.\n", "\n", - "`num_epochs` 변수는 데이터셋 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 많은 경험과 직관을 필요로 합니다. " + "`num_epochs` 변수는 데이터셋의 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 많은 경험과 직관을 필요로 합니다. " ] }, { "cell_type": "code", - "execution_count": 27, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "AIgulGRUhpto" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "에포크 000: 손실: 1.364, 정확도: 35.000%\n", - "에포크 050: 손실: 0.732, 정확도: 70.833%\n", - "에포크 100: 손실: 0.434, 정확도: 95.000%\n", - "에포크 150: 손실: 0.273, 정확도: 98.333%\n", - "에포크 200: 손실: 0.231, 정확도: 99.167%\n" - ] - } - ], + "outputs": [], "source": [ "## Note: 이 셀을 다시 실행하면 동일한 모델의 변수가 사용됩니다.\n", "\n", @@ -1020,33 +866,20 @@ "id": "j3wdbmtLVTyr" }, "source": [ - "모델의 훈련 과정을 출력하는 것은 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [TensorBoard](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지되어있는 굉장히 유용한 시각화 툴입니다. 하지만 `matplotlib` 모듈을 사용하여 일반적인 차트를 출력할 수 있습니다.\n", + "모델의 훈련 과정을 출력하는 것도 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [텐서보드(tensorboard)](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지 되어있는 굉장히 유용한 시각화 툴입니다. 하지만 `matplotlib` 모듈을 사용하여 일반적인 도표를 출력할 수 있습니다.\n", "\n", - "이 차트를 해석하는것은 여러 경험이 필요하지만, 모델을 최적화하기위해 *손실*이 내려가고 *정확도*가 올라가는 것을 보고싶습니다." + "이 도표를 해석하는 것은 여러 경험이 필요하지만, 결국 모델을 최적화하기 위해 *손실*이 내려가고 *정확도*가 올라가는 것을 원합니다." ] }, { "cell_type": "code", - "execution_count": 29, + "execution_count": null, "metadata": { "colab": {}, "colab_type": "code", "id": "agjvNd2iUGFn" }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], + "outputs": [], "source": [ "fig, axes = plt.subplots(2, sharex=True, figsize=(12, 8))\n", "fig.suptitle('Training Metrics')\n", @@ -1068,9 +901,9 @@ "source": [ "## 모델 유효성 검증\n", "\n", - "이제 모델은 학습되었습니다. 모델의 성능을 검증하기위해 몇가지 통계를 얻을 수 있습니다. \n", + "이제 모델은 훈련되었습니다. 모델의 성능을 검증하기위해 몇가지 통계를 얻을 수 있습니다. \n", "\n", - "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해서, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적인 보여줍니다. 5개의 예측 중 4개를 올바르게 예측한 80% 정확도의 모델입니다.\n", + "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적으로 보여줍니다. 5개의 예측 중 4개를 올바르게 예측한 80% 정확도의 모델입니다.\n", "\n", "\n", " \n", @@ -1099,7 +932,7 @@ " \n", " \n", " \n", "
5.52.54.01.311
\n", - " 그림 4. An Iris classifier that is 80% accurate.
 \n", + " 그림 4. 80% 정확도 붓꽃 분류기.
 \n", "
" ] @@ -1113,7 +946,7 @@ "source": [ "### 테스트 데이터 세트 설정\n", "\n", - "모델을 평가하는것은 모델을 학습하는것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기위해, 모델을 평가하기위한 예제는 반드시 훈련 데이터와 달라야합니다. \n", + "모델을 평가하는것은 모델을 훈련하는것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기위해, 모델을 평가하기위한 예제는 반드시 훈련 데이터와 달라야합니다. \n", "\n", "테스트 데이터 세트를 설정하는것은 훈련 데이터 세트를 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 구분합니다. 그 후 약간의 셔플을 적용합니다." ] @@ -1164,7 +997,7 @@ "source": [ "### 테스트 데이터 세트를 사용한 모델 평가\n", "\n", - "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)을 진행합니다. 다음의 코드셀은 테스트 셋을 반복하여 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." + "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한 번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)를 진행합니다. 다음의 코드 셀은 테스트 셋을 반복하여 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." ] }, { @@ -1194,7 +1027,7 @@ "id": "HcKEZMtCOeK-" }, "source": [ - "예를 들어, 마지막 배치에서 모델이 일반적으로 정확하다는 것을 확인할 수 있습니다. " + "마지막 배치에서 모델이 일반적으로 정확하다는 것을 확인할 수 있습니다. " ] }, { @@ -1219,9 +1052,9 @@ "source": [ "## 예측을 위해 훈련된 모델 사용하기\n", "\n", - "이제 붓꽃을 분류하기위해 완벽하지는 않지만 어느정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", + "이제 붓꽃을 분류하기 위해 완벽하지는 않지만 어느 정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", "\n", - "실제로는 레이블 되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃 이름으로 매핑되어있습니다.\n", + "실제로는 레이블 되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블 되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃 이름으로 매핑되어있습니다.\n", "* `0`: Iris setosa\n", "* `1`: Iris versicolor\n", "* `2`: Iris virginica" diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 95f18839886..3c25dcb5d6d 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -107,7 +107,7 @@ }, { "cell_type": "code", - "execution_count": 2, + "execution_count": null, "metadata": { "cellView": "code", "colab": {}, @@ -116,7 +116,7 @@ }, "outputs": [], "source": [ - "import tensorflow as tf\n", + "from __future__ import absolute_import, division, print_function\n", "\n", "tf.enable_eager_execution()" ] @@ -130,7 +130,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기내에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기 내에서 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" ] }, { @@ -186,7 +186,7 @@ "id": "eBPw8e8vrsom" }, "source": [ - "넘파이 `ndarray`와 텐서플로 `Tensor`의 가장 확연한 차이는 다음과 같습니다:\n", + "넘파이 배열과 텐서플로 텐서의 가장 확연한 차이는 다음과 같습니다:\n", "\n", "1. `텐서`는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", "2. `텐서`는 불변성(immutable)을 가집니다." @@ -201,7 +201,7 @@ "source": [ "### 넘파이 적합성\n", "\n", - "`Tensor`와 `ndarray`사이의 전환은 다소 간단합니다.\n", + "텐서와 넘파이 배열 사이의 전환은 다소 간단합니다.\n", "\n", "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 전환합니다.\n", "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\n", @@ -300,7 +300,8 @@ "source": [ "### 명시적 장치 배치\n", "\n", - "텐서플로에서 \"배치\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치)하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을경우 텐서플로는 연산을 실행하기위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. 예를 들어:" + "텐서플로에서 \"배치\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치) 하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을 경우 텐서플로는 연산을 실행하기 위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. \n", + "예를 들어:" ] }, { @@ -354,7 +355,7 @@ "* 데이터셋 생성.\n", "* 즉시 실행 활성화를 통한 데이터셋 반복\n", "\n", - "모델을 학습시키고 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", + "모델을 훈련시키고 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", "\n", "만약 텐서플로 그래프에 익숙하다면, 데이터셋 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 데이터셋의 요소를 반복하는 프로세스가 약간 더 간단해집니다.\n", "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", @@ -407,7 +408,7 @@ "source": [ "### 변환 적용\n", "\n", - "[`map`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`batch`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`shuffle`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하여 데이터셋의 레코드에 적용하세요. 세부사항은 [tf.data.Dataset을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." + "[`맵(map)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`배치(batch)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`셔플(shuffle)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하여 데이터셋의 레코드에 적용하세요. 세부사항은 [tf.data.Dataset을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." ] }, { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index cdb89aeae1c..4721c470bae 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -9,7 +9,7 @@ [docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로 메일을 보내주시기 바랍니다. -즉시실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. +즉시 실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. 사용자 정의 층, 정방향 전파, 자동 미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. [즉시 실행 가이드](../../guide/eager). From e817a00a48c50c3493fe745c7f3eeb355425ec74 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Thu, 2 May 2019 12:37:12 +0900 Subject: [PATCH 13/19] Update_from 61d453b5 --- .../eager/custom_training_walkthrough.ipynb | 84 +++++++++---------- site/ko/tutorials/eager/eager_basics.ipynb | 22 ++--- site/ko/tutorials/eager/index.md | 6 +- 3 files changed, 56 insertions(+), 56 deletions(-) diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 159af60744c..29e403cbc33 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -41,7 +41,7 @@ "id": "JtEZ1pCPn--z" }, "source": [ - "# 사용자 정의 학습: 둘러보기" + "# 사용자 정의 학습: 자세히 둘러보기" ] }, { @@ -103,7 +103,7 @@ "1. 데이터 가져오기 및 분석.\n", "2. 모델 타입 선정.\n", "3. 모델 훈련.\n", - "4. 모델 효과 검증.\n", + "4. 모델 효과 평가.\n", "5. 예측을 위한 훈련된 모델 사용." ] }, @@ -126,7 +126,7 @@ "source": [ "### 임포트 및 즉시 실행 구성\n", "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화합니다. 즉시 실행은 텐서플로가 연산이 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 상호작용 콘솔을 사용하시면 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화합니다. 즉시 실행은 텐서플로 연산이 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 상호작용 콘솔을 사용하시면 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", "\n", "즉시 실행이 활성화될 때, 동일한 프로그램내에서 비활성화 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 참조하세요." ] @@ -181,7 +181,7 @@ "
\n", "\n", - "다행히도 다른사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " + "다행히도 다른 사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류 문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " ] }, { @@ -191,7 +191,7 @@ "id": "3Px6KAg0Jowz" }, "source": [ - "## 훈련 데이터 가져오기 및 분석\n", + "## 훈련 데이터 가져오기 및 파싱\n", "\n", "데이터를 불러오고 파이썬 프로그램이 사용할 수 있는 구조로 전환합니다.\n", "\n", @@ -253,9 +253,9 @@ "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", "1. 첫 번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 예가 있으며, 각 예들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", - "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[예](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", - " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 예제의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", + " * 총 120개의 샘플가 있으며, 각 샘플들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", + "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[샘플](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", + " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 샘플의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 예측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", "\n", "코드로 표현하면 다음과 같습니다.:" @@ -319,7 +319,7 @@ "source": [ "### `tf.data.Dataset` 생성\n", "\n", - "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 모델에 적재하기 위해 많은 케이스를 다룹니다. 이는 훈련을 위해 형식으로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", + "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 적재할 때 발생하는 다양한 경우를 다룰 수 있습니다. 이는 훈련에 필요한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", "\n", "\n", "데이터셋이 CSV 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련 모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." @@ -352,7 +352,7 @@ "id": "gB_RSn62c-3G" }, "source": [ - "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍을 반환합니다. `features`는 사전형 객체인: `{'feature_name': value}`로 주어집니다.\n", + "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍으로 구성된 `tf.data.Dataset`을 반환합니다. `features`는 딕셔너리 객체인: `{'feature_name': value}`로 주어집니다.\n", "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)을 살펴봅시다." ] }, @@ -378,7 +378,7 @@ "id": "E63mArnQaAGz" }, "source": [ - "유사한 특성의 값은 같이 그룹 되어있거나, *배치* 돼있다는 사실에 주목하세요. 각 예제행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 예제의 수를 설정하세요.\n", + "유사한 특성의 값은 같이 그룹 되어있거나, *배치* 돼있다는 사실에 주목하세요. 각 샘플 행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 샘플의 수를 설정하세요.\n", "\n", "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집돼있는 데이터를 확인할 수 있습니다. " ] @@ -409,7 +409,7 @@ "id": "YlxpSyHlhT6M" }, "source": [ - "모델 구축 단계를 단순화하기 위해, 특성(사전형 객체)을 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", + "모델 구축 단계를 단순화하기 위해, 특성 딕셔너리를 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", "\n", "이 함수는 텐서의 리스트(list)로부터 값을 취하고 특정한 차원으로 결합된 텐서를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." ] @@ -460,7 +460,7 @@ "id": "NLy0Q1xCldVO" }, "source": [ - "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5개행의 예제를 살펴봅시다." + "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5개행의 샘플을 살펴봅시다." ] }, { @@ -491,11 +491,11 @@ "\n", " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)과 레이블(label) 과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇 가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", "\n", - "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을 정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분한 예제를 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성 간의 관계를 이해하고 제공합니다. \n", + "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을 정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분히 좋은 샘플을 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성 간의 관계를 이해하고 제공합니다. \n", "\n", "### 모델 선정\n", "\n", - "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[dense(또는 완전 연결 신경망(fully-connected neural network))](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", + "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[밀집(dense) 또는 완전 연결 신경망(fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", "\n", "\n", " \n", "
\n", @@ -507,7 +507,7 @@ "
\n", "\n", - "그림 2의 모델이 훈련되고 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지 예측을 출력(주어진 레이블의 개수)합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 불립니다. 이 예제에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " + "그림 2의 모델이 훈련된 다음 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지(주어진 레이블의 개수) 예측을 출력합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 불립니다. 이 샘플에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " ] }, { @@ -519,9 +519,9 @@ "source": [ "### 케라스를 사용한 모델 생성\n", "\n", - "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 층을 생성하기 위한 풍부한 라이브러리를 제공합니다. 이는 파이프라인의 모든 것을 케라스가 처리하여 모델을 구축하기 쉽게 만듭니다.\n", + "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 층을 생성하기 위한 풍부한 라이브러리를 제공합니다. 케라스가 구성 요소를 연결하기 위한 복잡함을 모두 처리해 주기 때문에 모델을 구축하고 실험하는 것이 쉽습니다.\n", "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 케이스의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)와 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [밀집(dense)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)과 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { @@ -550,7 +550,7 @@ "source": [ "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층에서 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 하나의 층과 동일하다고 생각할 수 있습니다. 사용 가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", "\n", - "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 의해 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." + "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 의해 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로 보면 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." ] }, { @@ -586,7 +586,7 @@ "id": "wxyXOhwVr5S3" }, "source": [ - "각 예제는 각 클래스에 대한 [로짓(logit)](https://developers.google.com/machine-learning/crash-course/glossary#logits)을 반환합니다. \n", + "각 샘플은 각 클래스에 대한 [로짓(logit)](https://developers.google.com/machine-learning/crash-course/glossary#logits)을 반환합니다. \n", "\n", "이 로짓(logit)을 각 클래스에 대한 확률로 변환하기 위하서 [소프트맥스(softmax)](https://developers.google.com/machine-learning/crash-course/glossary#softmax) 함수를 사용하겠습니다." ] @@ -653,7 +653,7 @@ "\n", "훈련과 평가단계에서 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)*을 계산해야 합니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 이 값을 최소화하고, 최적화 해야합니다.\n", "\n", - "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용해 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 예제를 통한 평균 손실을 반환합니다." + "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용해 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 샘플의 평균 손실을 반환합니다." ] }, { @@ -682,7 +682,7 @@ "id": "3IcPqA24QM6B" }, "source": [ - "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " + "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기 위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " ] }, { @@ -722,7 +722,7 @@ " \n", "\n", "\n", - "텐서플로는 훈련을 위해 사용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강법(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현하는 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. `learning_rate`은 경사하강 과정의 크기를 나타내는 매개변수이며, 더 나은 결과를 위해 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " + "텐서플로는 훈련을 위해 사용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강법(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현한 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. `learning_rate`은 경사하강 과정의 크기를 나타내는 매개변수이며, 더 나은 결과를 위해 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " ] }, { @@ -790,16 +790,16 @@ "source": [ "### 훈련 루프\n", "\n", - "모든 조각을 가지고 모델을 훈련할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", + "모든 사항이 갖춰졌으므로 모델을 훈련할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", "\n", "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", - "2. 에포크 내에서, `데이터셋`의 *특성* (`x`)와 *레이블* (`y`)를 가져오는 예제를 반복합니다.\n", - "3. 예제의 특성을 사용하여 결과를 예측 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", + "2. 에포크 내에서, *특성* (`x`)와 *레이블* (`y`)가 포함된 훈련 `데이터셋`에 있는 샘플을 반복합니다.\n", + "3. 샘플의 특성을 사용하여 결과를 예측 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", "4. 모델의 변수를 업데이트하기 위해 `옵티마이저`를 사용합니다. \n", "5. 시각화를 위해 몇가지 값들을 저장합니다.\n", "6. 각 에포크를 반복합니다.\n", "\n", - "`num_epochs` 변수는 데이터셋의 반복 횟수입니다. 반직관적으로, 모델을 길게 학습하는것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는것은 많은 경험과 직관을 필요로 합니다. " + "`num_epochs` 변수는 데이터셋의 반복 횟수입니다. 직관과는 반대로, 모델을 길게 학습하는 것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는 것은 많은 경험과 직관을 필요로 합니다. " ] }, { @@ -844,9 +844,9 @@ " train_accuracy_results.append(epoch_accuracy.result())\n", " \n", " if epoch % 50 == 0:\n", - " print(\"에포크 {:03d}: 손실: {:.3f}, 정확도: {:.3%}\".format(epoch,\n", - " epoch_loss_avg.result(),\n", - " epoch_accuracy.result()))" + " print(\"에포크 {:03d}: 손실: {:.3f}, 정확도: {:.3%}\".format(epoch, \n", + " epoch_loss_avg.result(), \n", + " epoch_accuracy.result()))" ] }, { @@ -899,11 +899,11 @@ "id": "Zg8GoMZhLpGH" }, "source": [ - "## 모델 유효성 검증\n", + "## 모델 유효성 평가\n", "\n", - "이제 모델은 훈련되었습니다. 모델의 성능을 검증하기위해 몇가지 통계를 얻을 수 있습니다. \n", + "이제 모델은 훈련되었습니다. 모델의 성능에 대한 몇가지 통계를 얻을 수 있습니다. \n", "\n", - "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적으로 보여줍니다. 5개의 예측 중 4개를 올바르게 예측한 80% 정확도의 모델입니다.\n", + "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는 것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적인 모델입니다. 5개의 예측 중 4개를 올바르게 예측하여 80% 정확도를 냅니다.\n", "\n", "\n", " \n", @@ -912,9 +912,9 @@ " \n", " \n", " \n", - " \n", - " \n", - " \n", + " \n", + " \n", + " \n", " \n", " \n", " \n", @@ -946,9 +946,9 @@ "source": [ "### 테스트 데이터 세트 설정\n", "\n", - "모델을 평가하는것은 모델을 훈련하는것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기위해, 모델을 평가하기위한 예제는 반드시 훈련 데이터와 달라야합니다. \n", + "모델을 평가하는 것은 모델을 훈련하는 것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기 위해, 모델을 평가하기 위한 샘플은 반드시 훈련 데이터와 달라야합니다. \n", "\n", - "테스트 데이터 세트를 설정하는것은 훈련 데이터 세트를 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 구분합니다. 그 후 약간의 셔플을 적용합니다." + "테스트 데이터 세트를 설정하는 것은 훈련 데이터 세트를 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 파싱합니다. 그 후 셔플은 적용하지 않습니다." ] }, { @@ -997,7 +997,7 @@ "source": [ "### 테스트 데이터 세트를 사용한 모델 평가\n", "\n", - "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한 번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)를 진행합니다. 다음의 코드 셀은 테스트 셋을 반복하여 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." + "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한 번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)를 진행합니다. 다음의 코드 셀은 테스트 셋에 있는 샘플에 대해 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." ] }, { @@ -1027,7 +1027,7 @@ "id": "HcKEZMtCOeK-" }, "source": [ - "마지막 배치에서 모델이 일반적으로 정확하다는 것을 확인할 수 있습니다. " + "마지막 배치에서 모델이 올바르게 예측한 것을 확인할 수 있습니다. " ] }, { @@ -1050,11 +1050,11 @@ "id": "7Li2r1tYvW7S" }, "source": [ - "## 예측을 위해 훈련된 모델 사용하기\n", + "## 훈련된 모델로 예측하기\n", "\n", "이제 붓꽃을 분류하기 위해 완벽하지는 않지만 어느 정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", "\n", - "실제로는 레이블 되지 않은 예제들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블 되지 않은 예제를 제공하겠습니다. 레이블은 다음과 붓꽃 이름으로 매핑되어있습니다.\n", + "실제로는 레이블 되지 않은 샘플들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블 되지 않은 샘플을 제공하겠습니다. 레이블은 다음과 같은 붓꽃 이름으로 매핑되어있습니다.\n", "* `0`: Iris setosa\n", "* `1`: Iris versicolor\n", "* `2`: Iris virginica" diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 3c25dcb5d6d..374d8938a6a 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -102,7 +102,7 @@ "source": [ "## 텐서플로 임포트\n", "\n", - "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시 실행(eager execution)을 활성화합니다. 즉시 실행 활성화로 텐서플로에 대한 대화형 프론트엔드(frontend)가 가능합니다. 세부사항은 나중에 이야기할 것입니다." + "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시 실행(eager execution)을 활성화합니다. 즉시 실행 활성화로 텐서플로를 조금 더 대화형 프론트엔드(frontend)에 가깝게 만들어 줍니다. 세부사항은 나중에 이야기할 것입니다." ] }, { @@ -130,7 +130,7 @@ "source": [ "## 텐서\n", "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기 내에서 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 전환합니다. 예를 들어:\n" + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기 메모리에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 변환합니다. 예를 들어:\n" ] }, { @@ -188,7 +188,7 @@ "source": [ "넘파이 배열과 텐서플로 텐서의 가장 확연한 차이는 다음과 같습니다:\n", "\n", - "1. `텐서`는 가속기 메모리(GPU, TPU와 같은)의 사용이 가능합니다.\n", + "1. `텐서`는 가속기 메모리(GPU, TPU와 같은)에서 사용할 수 있습니다.\n", "2. `텐서`는 불변성(immutable)을 가집니다." ] }, @@ -199,7 +199,7 @@ "id": "Dwi1tdW3JBw6" }, "source": [ - "### 넘파이 적합성\n", + "### 넘파이 호환성\n", "\n", "텐서와 넘파이 배열 사이의 전환은 다소 간단합니다.\n", "\n", @@ -207,7 +207,7 @@ "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\n", "\n", "텐서는 `.numpy()` 메서드(method)를 호출하여 넘파이 배열로 전환할 수 있습니다.\n", - "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 백업이 되므로, 이러한 전환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 포함됩니다." + "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 저장되므로, 이러한 변환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 필요합니다." ] }, { @@ -300,7 +300,7 @@ "source": [ "### 명시적 장치 배치\n", "\n", - "텐서플로에서 \"배치\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치) 하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을 경우 텐서플로는 연산을 실행하기 위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. \n", + "텐서플로에서 \"배치(replacement)\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치) 하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을 경우 텐서플로는 연산을 실행하기 위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. \n", "예를 들어:" ] }, @@ -355,11 +355,11 @@ "* 데이터셋 생성.\n", "* 즉시 실행 활성화를 통한 데이터셋 반복\n", "\n", - "모델을 훈련시키고 평가 루프를 제공할 간단하고 재사용 가능한 조각으로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", + "모델을 훈련시키고 평가 루프를 제공할 간단하고 재사용 가능한 모듈로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", "\n", - "만약 텐서플로 그래프에 익숙하다면, 데이터셋 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 데이터셋의 요소를 반복하는 프로세스가 약간 더 간단해집니다.\n", + "만약 텐서플로 그래프에 익숙하다면 알겠지만, 데이터셋 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 데이터셋의 요소를 반복하는 프로세스가 약간 더 간단해집니다.\n", "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", - "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시 실행이 활성화될 때에는 관계없습니다. " + "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시 실행이 활성화될 때에는 신경 쓰지 않아도 됩니다. " ] }, { @@ -369,9 +369,9 @@ "id": "zI0fmOynH-Ne" }, "source": [ - "### 데이터셋 소스 생성\n", + "### 소스 Dataset 생성\n", "\n", - "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)를 사용하여 데이터셋 소스를 생성하거나 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 데이터셋 소스를 생성하세요. 더 많은 정보를 위해서 [텐서플로 가이드](https://www.tensorflow.org/guide/datasets#reading_input_data)를 참조하세요." + "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)와 같은 팩토리(factory) 함수 중 하나를 사용하거나 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 소스 dataset을 생성하세요. 더 많은 정보를 위해서 [텐서플로 가이드](https://www.tensorflow.org/guide/datasets#reading_input_data)를 참조하세요." ] }, { diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 4721c470bae..114fc16091b 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -9,13 +9,13 @@ [docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로 메일을 보내주시기 바랍니다. -즉시 실행(Eager execution)은 더 나은 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. -사용자 정의 층, 정방향 전파, 자동 미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 시작한 다음 순서대로 진행하세요. +즉시 실행(Eager execution)은 고급 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. +사용자 정의 층, 정방향 전파, 자동 미분을 사용한 훈련 루프를 작성하세요. 이 노트북으로 보고 난 후에 다음 문서를 읽어보세요. [즉시 실행 가이드](../../guide/eager). 1. [즉시 실행](eager_basics.ipynb) 2. [자동 미분과 그래디언트 테이프](automatic_differentiation.ipynb) 3. [사용자 정의 학습 : 기초](custom_training.ipynb) 4. [사용자 정의 층](custom_layers.ipynb) -5. [사용자 정의 학습 : 둘러보기](custom_training_walkthrough.ipynb) +5. [사용자 정의 학습 : 자세히 둘러보기](custom_training_walkthrough.ipynb) From 8aa79ae3bfe139a6004d391480ed744cc1370de6 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Fri, 3 May 2019 00:42:22 +0900 Subject: [PATCH 14/19] Update custom_training_walkthrough.ipynb --- site/ko/tutorials/eager/custom_training_walkthrough.ipynb | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 29e403cbc33..ecd75f39655 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -253,7 +253,7 @@ "처음 5개의 데이터로부터 다음을 주목하세요.\n", "\n", "1. 첫 번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 샘플가 있으며, 각 샘플들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", + " * 총 120개의 샘플이 있으며, 각 샘플들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[샘플](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 샘플의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 예측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", @@ -352,7 +352,7 @@ "id": "gB_RSn62c-3G" }, "source": [ - "`make_csv_dataset` 함수는 `tf.data.Dataset` 의 `(features, label)` 쌍으로 구성된 `tf.data.Dataset`을 반환합니다. `features`는 딕셔너리 객체인: `{'feature_name': value}`로 주어집니다.\n", + "`make_csv_dataset` 함수는 `(features, label)` 쌍으로 구성된 `tf.data.Dataset`을 반환합니다. `features`는 딕셔너리 객체인: `{'feature_name': value}`로 주어집니다.\n", "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)을 살펴봅시다." ] }, @@ -521,7 +521,7 @@ "\n", "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 층을 생성하기 위한 풍부한 라이브러리를 제공합니다. 케라스가 구성 요소를 연결하기 위한 복잡함을 모두 처리해 주기 때문에 모델을 구축하고 실험하는 것이 쉽습니다.\n", "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [밀집(dense)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)과 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)과 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." ] }, { From c5848ee0ca3b8a905daabd0eb644f2621ce2bdca Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Fri, 3 May 2019 00:46:06 +0900 Subject: [PATCH 15/19] Update from 338fbdd3 --- site/ko/tutorials/eager/custom_training_walkthrough.ipynb | 2 +- site/ko/tutorials/eager/eager_basics.ipynb | 2 +- 2 files changed, 2 insertions(+), 2 deletions(-) diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index ecd75f39655..8f42dd20700 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -682,7 +682,7 @@ "id": "3IcPqA24QM6B" }, "source": [ - "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)* 계산하기 위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " + "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)*를 계산하기 위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " ] }, { diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 374d8938a6a..8fc5ff858b2 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -201,7 +201,7 @@ "source": [ "### 넘파이 호환성\n", "\n", - "텐서와 넘파이 배열 사이의 전환은 다소 간단합니다.\n", + "텐서와 넘파이 배열 사이의 변환은 다소 간단합니다.\n", "\n", "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 전환합니다.\n", "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\n", From d8663a87245255fd9514c450a3365bf1c5406fac Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Fri, 3 May 2019 00:53:36 +0900 Subject: [PATCH 16/19] Update eager_basics.ipynb --- site/ko/tutorials/eager/eager_basics.ipynb | 14 +++++++------- 1 file changed, 7 insertions(+), 7 deletions(-) diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 8fc5ff858b2..81749da2aa4 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -203,11 +203,11 @@ "\n", "텐서와 넘파이 배열 사이의 변환은 다소 간단합니다.\n", "\n", - "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 전환합니다.\n", - "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\n", + "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 변환합니다.\n", + "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 변환합니다.\n", "\n", - "텐서는 `.numpy()` 메서드(method)를 호출하여 넘파이 배열로 전환할 수 있습니다.\n", - "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 전환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 저장되므로, 이러한 변환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 필요합니다." + "텐서는 `.numpy()` 메서드(method)를 호출하여 넘파이 배열로 변환할 수 있습니다.\n", + "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 변환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 저장되므로, 이러한 변환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 필요합니다." ] }, { @@ -224,15 +224,15 @@ "\n", "ndarray = np.ones([3, 3])\n", "\n", - "print(\"텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 전환합니다.\")\n", + "print(\"텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 변환합니다.\")\n", "tensor = tf.multiply(ndarray, 42)\n", "print(tensor)\n", "\n", "\n", - "print(\"그리고 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 전환합니다.\")\n", + "print(\"그리고 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 변환합니다.\")\n", "print(np.add(tensor, 1))\n", "\n", - "print(\".numpy() 메서드는 텐서를 넘파이 배열로 전환합니다.\")\n", + "print(\".numpy() 메서드는 텐서를 넘파이 배열로 변환합니다.\")\n", "print(tensor.numpy())" ] }, From 058b8ba3f81d3076b7d7052d443791892f7ef539 Mon Sep 17 00:00:00 2001 From: Choiuijin1125 Date: Fri, 3 May 2019 21:11:21 +0900 Subject: [PATCH 17/19] Update from 9ed23d5c --- site/ko/tutorials/eager/automatic_differentiation.ipynb | 2 ++ site/ko/tutorials/eager/custom_layers.ipynb | 2 ++ site/ko/tutorials/eager/eager_basics.ipynb | 2 ++ 3 files changed, 6 insertions(+) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index e0649886ffc..e0ce93b6e18 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -108,6 +108,8 @@ }, "outputs": [], "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", "import tensorflow as tf\n", "\n", "tf.enable_eager_execution()" diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index c716311304c..5060a0dafe7 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -98,6 +98,8 @@ }, "outputs": [], "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", "import tensorflow as tf\n", "\n", "tf.enable_eager_execution()" diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index 81749da2aa4..f70825fafd5 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -118,6 +118,8 @@ "source": [ "from __future__ import absolute_import, division, print_function\n", "\n", + "import tensorflow as tf\n", + "\n", "tf.enable_eager_execution()" ] }, From ae0e9400405dd86bdb75aff6a01034605b9556fd Mon Sep 17 00:00:00 2001 From: Billy Lamberta Date: Fri, 3 May 2019 10:43:16 -0700 Subject: [PATCH 18/19] Update translation note. Colab formatting --- .../eager/automatic_differentiation.ipynb | 676 ++--- site/ko/tutorials/eager/custom_layers.ipynb | 757 +++--- site/ko/tutorials/eager/custom_training.ipynb | 928 +++---- .../eager/custom_training_walkthrough.ipynb | 2236 +++++++++-------- site/ko/tutorials/eager/eager_basics.ipynb | 967 ++++--- site/ko/tutorials/eager/index.md | 13 +- 6 files changed, 2791 insertions(+), 2786 deletions(-) diff --git a/site/ko/tutorials/eager/automatic_differentiation.ipynb b/site/ko/tutorials/eager/automatic_differentiation.ipynb index e0ce93b6e18..cdb4c100205 100644 --- a/site/ko/tutorials/eager/automatic_differentiation.ipynb +++ b/site/ko/tutorials/eager/automatic_differentiation.ipynb @@ -1,339 +1,341 @@ { - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "t09eeeR5prIJ" - }, - "source": [ - "##### Copyright 2018 The TensorFlow Authors." - ] + "nbformat": 4, + "nbformat_minor": 0, + "metadata": { + "colab": { + "name": "automatic_differentiation.ipynb", + "version": "0.3.2", + "provenance": [], + "private_outputs": true, + "collapsed_sections": [], + "toc_visible": true + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.7.1" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + } }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "form", - "colab": {}, - "colab_type": "code", - "id": "GCCk8_dHpuNf" - }, - "outputs": [], - "source": [ - "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", - "# you may not use this file except in compliance with the License.\n", - "# You may obtain a copy of the License at\n", - "#\n", - "# https://www.apache.org/licenses/LICENSE-2.0\n", - "#\n", - "# Unless required by applicable law or agreed to in writing, software\n", - "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", - "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", - "# See the License for the specific language governing permissions and\n", - "# limitations under the License." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "xh8WkEwWpnm7" - }, - "source": [ - "# 자동 미분과 그래디언트 테이프" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "idv0bPeCp325" - }, - "source": [ - "
Example featuresLabelModel prediction샘플 특성레이블모델 예측
5.93.04.31.511
\n", - " \n", - " \n", - " \n", - "
\n", - " TensorFlow.org에서 보기\n", - " \n", - " 구글 코랩(Colab)에서 실행하기\n", - " \n", - " 깃허브(GitHub) 소스 보기\n", - "
" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", - "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", - "이 번역에 개선할 부분이 있다면\n", - "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", - "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", - "작성하거나\n", - "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", - "메일을 보내주시기 바랍니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "vDJ4XzMqodTy" - }, - "source": [ - "이전 튜토리얼에서는 텐서(tensor)와 텐서의 연산에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동 미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "GQJysDM__Qb0" - }, - "source": [ - "## 설정\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "OiMPZStlibBv" - }, - "outputs": [], - "source": [ - "from __future__ import absolute_import, division, print_function, unicode_literals\n", - "\n", - "import tensorflow as tf\n", - "\n", - "tf.enable_eager_execution()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "1CLWJl0QliB0" - }, - "source": [ - "## 그래디언트 테이프\n", - "\n", - "텐서플로는 자동 미분(주어진 입력 변수에 대한 연산의 그래디언트(gradient)를 계산하는 것)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 테이프(tape)에 \"기록\"합니다. 그리고 [후진 방식 자동 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산과 관련된 그래디언트와 테이프를 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", - "\n", - "예를 들면:" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "bAFeIE8EuVIq" - }, - "outputs": [], - "source": [ - "x = tf.ones((2, 2))\n", - " \n", - "with tf.GradientTape() as t:\n", - " t.watch(x)\n", - " y = tf.reduce_sum(x)\n", - " z = tf.multiply(y, y)\n", - "\n", - "# 입력 텐서 x에 대한 z의 도함수\n", - "dz_dx = t.gradient(z, x)\n", - "for i in [0, 1]:\n", - " for j in [0, 1]:\n", - " assert dz_dx[i][j].numpy() == 8.0" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "N4VlqKFzzGaC" - }, - "source": [ - "또한 `tf.GradientTape` 컨텍스트 안에서 기록되는 동안 계산된 중간 값에 대한 그래디언트도 구할 수 있습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "7XaPRAwUyYms" - }, - "outputs": [], - "source": [ - "x = tf.ones((2, 2))\n", - " \n", - "with tf.GradientTape() as t:\n", - " t.watch(x)\n", - " y = tf.reduce_sum(x)\n", - " z = tf.multiply(y, y)\n", - "\n", - "# 테이프 사용하여 중간 값 y에 대한 도함수를 계산합니다. \n", - "dz_dy = t.gradient(z, y)\n", - "assert dz_dy.numpy() == 8.0" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "ISkXuY7YzIcS" - }, - "source": [ - "기본적으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해제됩니다. 동일한 연산 대해 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. 이 그래디언트 테이프는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다.\n", - "예를 들면 다음과 같습니다:" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "zZaCm3-9zVCi" - }, - "outputs": [], - "source": [ - "x = tf.constant(3.0)\n", - "with tf.GradientTape(persistent=True) as t:\n", - " t.watch(x)\n", - " y = x * x\n", - " z = y * y\n", - "dz_dx = t.gradient(z, x) # 108.0 (4*x^3 at x = 3)\n", - "dy_dx = t.gradient(y, x) # 6.0\n", - "del t # 테이프에 대한 참조를 삭제합니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "6kADybtQzYj4" - }, - "source": [ - "### 제어 흐름 기록\n", - "\n", - "연산이 실행되는 순서대로 테이프에 기록되기 때문에, 파이썬 제어 흐름(예를 들어 `if` `while`, `for`문 같은)이 자연스럽게 처리됩니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "9FViq92UX7P8" - }, - "outputs": [], - "source": [ - "def f(x, y):\n", - " output = 1.0\n", - " for i in range(y):\n", - " if i > 1 and i < 5:\n", - " output = tf.multiply(output, x)\n", - " return output\n", - "\n", - "def grad(x, y):\n", - " with tf.GradientTape() as t:\n", - " t.watch(x)\n", - " out = f(x, y)\n", - " return t.gradient(out, x) \n", - "\n", - "x = tf.convert_to_tensor(2.0)\n", - "\n", - "assert grad(x, 6).numpy() == 12.0\n", - "assert grad(x, 5).numpy() == 12.0\n", - "assert grad(x, 4).numpy() == 4.0\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "DK05KXrAAld3" - }, - "source": [ - "### 고계도(Higher-order) 그래디언트\n", - "\n", - "`GradientTape` 컨텍스트 매니저안에 있는 연산들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되면 그 그래디언트 연산 또한 기록되어집니다. 그 결과 똑같은 API가 고계도 그래디언트에서도 잘 작동합니다. 예를 들면:" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "cPQgthZ7ugRJ" - }, - "outputs": [], - "source": [ - "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로 변수를 생성합니다.\n", - "\n", - "with tf.GradientTape() as t:\n", - " with tf.GradientTape() as t2:\n", - " y = x * x * x\n", - " # t 컨텍스트 매니저 안의 그래디언트를 계산합니다.\n", - " # 이것은 또한 그래디언트 연산 자체도 미분가능하다는것을 의미합니다. \n", - " dy_dx = t2.gradient(y, x)\n", - "d2y_dx2 = t.gradient(dy_dx, x)\n", - "\n", - "assert dy_dx.numpy() == 3.0\n", - "assert d2y_dx2.numpy() == 6.0" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "4U1KKzUpNl58" - }, - "source": [ - "## 다음 단계\n", - "\n", - "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 다루었습니다. 이를 통해 신경망(neural network)을 구축하고 훈련시키는데 필요한 많은 기본 요소를 배웠습니다." - ] - } - ], - "metadata": { - "colab": { - "collapsed_sections": [], - "name": "automatic_differentiation.ipynb", - "private_outputs": true, - "provenance": [], - "toc_visible": true, - "version": "0.3.2" - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "t09eeeR5prIJ" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "form", + "colab_type": "code", + "id": "GCCk8_dHpuNf", + "colab": {} + }, + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "xh8WkEwWpnm7" + }, + "source": [ + "# 자동 미분과 그래디언트 테이프" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "idv0bPeCp325" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " TensorFlow.org에서 보기\n", + " \n", + " 구글 코랩(Colab)에서 실행하기\n", + " \n", + " 깃허브(GitHub) 소스 보기\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Q9_NaXPWxEd8", + "colab_type": "text" + }, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 참여하려면\n", + "[docs-ko@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs-ko)로\n", + "메일을 보내주시기 바랍니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vDJ4XzMqodTy" + }, + "source": [ + "이전 튜토리얼에서는 텐서(tensor)와 텐서의 연산에 대해서 알아보았습니다. 이번 튜토리얼에서는 머신러닝 모델을 최적화할 수 있는 주요 기술 중 하나인 [자동 미분(automatic differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)에 대해 알아보겠습니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "GQJysDM__Qb0" + }, + "source": [ + "## 설정\n" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "OiMPZStlibBv", + "colab": {} + }, + "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "1CLWJl0QliB0" + }, + "source": [ + "## 그래디언트 테이프\n", + "\n", + "텐서플로는 자동 미분(주어진 입력 변수에 대한 연산의 그래디언트(gradient)를 계산하는 것)을 위한 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) API를 제공합니다. `tf.GradientTape`는 안에서 실행된 모든 연산을 테이프(tape)에 \"기록\"합니다. 그리고 [후진 방식 자동 미분(reverse mode differentiation)](https://en.wikipedia.org/wiki/Automatic_differentiation)을 사용하여 각각의 기록된 연산과 관련된 그래디언트와 테이프를 사용하여 기록된 연산의 그래디언트를 계산합니다. \n", + "\n", + "예를 들면:" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "bAFeIE8EuVIq", + "colab": {} + }, + "source": [ + "x = tf.ones((2, 2))\n", + " \n", + "with tf.GradientTape() as t:\n", + " t.watch(x)\n", + " y = tf.reduce_sum(x)\n", + " z = tf.multiply(y, y)\n", + "\n", + "# 입력 텐서 x에 대한 z의 도함수\n", + "dz_dx = t.gradient(z, x)\n", + "for i in [0, 1]:\n", + " for j in [0, 1]:\n", + " assert dz_dx[i][j].numpy() == 8.0" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "N4VlqKFzzGaC" + }, + "source": [ + "또한 `tf.GradientTape` 컨텍스트 안에서 기록되는 동안 계산된 중간 값에 대한 그래디언트도 구할 수 있습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "7XaPRAwUyYms", + "colab": {} + }, + "source": [ + "x = tf.ones((2, 2))\n", + " \n", + "with tf.GradientTape() as t:\n", + " t.watch(x)\n", + " y = tf.reduce_sum(x)\n", + " z = tf.multiply(y, y)\n", + "\n", + "# 테이프 사용하여 중간 값 y에 대한 도함수를 계산합니다. \n", + "dz_dy = t.gradient(z, y)\n", + "assert dz_dy.numpy() == 8.0" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "ISkXuY7YzIcS" + }, + "source": [ + "기본적으로 GradientTape.gradient() 메서드가 호출되면 GradientTape에 포함된 리소스가 해제됩니다. 동일한 연산 대해 여러 그래디언트를 계산하려면, `지속성있는(persistent)` 그래디언트 테이프를 생성하면 됩니다. 이 그래디언트 테이프는 `gradient()` 메서드의 다중 호출을 허용합니다. 테이프 객체가 쓰레기 수집(garbage collection)될때 리소스는 해체됩니다.\n", + "예를 들면 다음과 같습니다:" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "zZaCm3-9zVCi", + "colab": {} + }, + "source": [ + "x = tf.constant(3.0)\n", + "with tf.GradientTape(persistent=True) as t:\n", + " t.watch(x)\n", + " y = x * x\n", + " z = y * y\n", + "dz_dx = t.gradient(z, x) # 108.0 (4*x^3 at x = 3)\n", + "dy_dx = t.gradient(y, x) # 6.0\n", + "del t # 테이프에 대한 참조를 삭제합니다." + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "6kADybtQzYj4" + }, + "source": [ + "### 제어 흐름 기록\n", + "\n", + "연산이 실행되는 순서대로 테이프에 기록되기 때문에, 파이썬 제어 흐름(예를 들어 `if` `while`, `for`문 같은)이 자연스럽게 처리됩니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "9FViq92UX7P8", + "colab": {} + }, + "source": [ + "def f(x, y):\n", + " output = 1.0\n", + " for i in range(y):\n", + " if i > 1 and i < 5:\n", + " output = tf.multiply(output, x)\n", + " return output\n", + "\n", + "def grad(x, y):\n", + " with tf.GradientTape() as t:\n", + " t.watch(x)\n", + " out = f(x, y)\n", + " return t.gradient(out, x) \n", + "\n", + "x = tf.convert_to_tensor(2.0)\n", + "\n", + "assert grad(x, 6).numpy() == 12.0\n", + "assert grad(x, 5).numpy() == 12.0\n", + "assert grad(x, 4).numpy() == 4.0\n" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "DK05KXrAAld3" + }, + "source": [ + "### 고계도(Higher-order) 그래디언트\n", + "\n", + "`GradientTape` 컨텍스트 매니저안에 있는 연산들은 자동미분을 위해 기록됩니다. 만약 그래디언트가 컨텍스트 안에서 계산되면 그 그래디언트 연산 또한 기록되어집니다. 그 결과 똑같은 API가 고계도 그래디언트에서도 잘 작동합니다. 예를 들면:" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "cPQgthZ7ugRJ", + "colab": {} + }, + "source": [ + "x = tf.Variable(1.0) # 1.0으로 초기화된 텐서플로 변수를 생성합니다.\n", + "\n", + "with tf.GradientTape() as t:\n", + " with tf.GradientTape() as t2:\n", + " y = x * x * x\n", + " # t 컨텍스트 매니저 안의 그래디언트를 계산합니다.\n", + " # 이것은 또한 그래디언트 연산 자체도 미분가능하다는것을 의미합니다. \n", + " dy_dx = t2.gradient(y, x)\n", + "d2y_dx2 = t.gradient(dy_dx, x)\n", + "\n", + "assert dy_dx.numpy() == 3.0\n", + "assert d2y_dx2.numpy() == 6.0" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "4U1KKzUpNl58" + }, + "source": [ + "## 다음 단계\n", + "\n", + "이번 튜토리얼에서는 텐서플로에서 그래디언트 계산법을 다루었습니다. 이를 통해 신경망(neural network)을 구축하고 훈련시키는데 필요한 많은 기본 요소를 배웠습니다." + ] + } + ] +} \ No newline at end of file diff --git a/site/ko/tutorials/eager/custom_layers.ipynb b/site/ko/tutorials/eager/custom_layers.ipynb index 5060a0dafe7..98614aacbfa 100644 --- a/site/ko/tutorials/eager/custom_layers.ipynb +++ b/site/ko/tutorials/eager/custom_layers.ipynb @@ -1,378 +1,383 @@ { - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "tDnwEv8FtJm7" - }, - "source": [ - "##### Copyright 2018 The TensorFlow Authors." - ] + "nbformat": 4, + "nbformat_minor": 0, + "metadata": { + "colab": { + "name": "custom_layers.ipynb", + "version": "0.3.2", + "provenance": [], + "private_outputs": true, + "collapsed_sections": [], + "toc_visible": true + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.7.1" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + } }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "form", - "colab": {}, - "colab_type": "code", - "id": "JlknJBWQtKkI" - }, - "outputs": [], - "source": [ - "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", - "# you may not use this file except in compliance with the License.\n", - "# You may obtain a copy of the License at\n", - "#\n", - "# https://www.apache.org/licenses/LICENSE-2.0\n", - "#\n", - "# Unless required by applicable law or agreed to in writing, software\n", - "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", - "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", - "# See the License for the specific language governing permissions and\n", - "# limitations under the License." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "60RdWsg1tETW" - }, - "source": [ - "# 사용자 정의 층" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "BcJg7Enms86w" - }, - "source": [ - "\n", - " \n", - " \n", - " \n", - "
\n", - " TensorFlow.org에서 보기\n", - " \n", - " 구글 코랩(Colab)에서 실행하기\n", - " \n", - " 깃허브(GitHub) 소스 보기\n", - "
" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", - "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", - "이 번역에 개선할 부분이 있다면\n", - "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", - "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", - "작성하거나\n", - "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", - "메일을 보내주시기 바랍니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "UEu3q4jmpKVT" - }, - "source": [ - "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시 실행(eager execution)과 함께 사용할 수 있습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "pwX7Fii1rwsJ" - }, - "outputs": [], - "source": [ - "from __future__ import absolute_import, division, print_function, unicode_literals\n", - "\n", - "import tensorflow as tf\n", - "\n", - "tf.enable_eager_execution()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "zSFfVVjkrrsI" - }, - "source": [ - "## 층: 유용한 연산자 집합\n", - "\n", - "머신러닝을 위한 코드를 작성하는 대부분의 경우에 개별적인 연산과 변수를 조작하는 것보다는 높은 수준의 추상화에서 작업할 것입니다.\n", - "\n", - "많은 머신러닝 모델은 비교적 단순한 층(layer)을 조합하고 쌓아서 표현가능합니다. 또한 텐서플로는 여러 표준형 층을 제공하므로 사용자 고유의 응용 프로그램에 관련된 층을 처음부터 작성하거나, 기존 층의 조합으로 쉽게 만들 수 있습니다.\n", - "\n", - "텐서플로는 [전체 케라스](https://keras.io) API를 tf.keras 패키지에 포함하고 있습니다. 케라스 층은 모델을 구축하는데 매우 유용합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "8PyXlPl-4TzQ" - }, - "outputs": [], - "source": [ - "# tf.keras.layers 패키지에서 층은 객체입니다. 층을 구성하려면 간단히 객체를 생성하십시오.\n", - "# 대부분의 layer는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", - "layer = tf.keras.layers.Dense(100)\n", - "# 입력 차원의 수는 층을 처음 실행할 때 유추할 수 있기 때문에 종종 불필요합니다. \n", - "# 일부 복잡한 모델에서는 수동으로 입력 차원의 수를 제공하는것이 유용할 수 있습니다.\n", - "layer = tf.keras.layers.Dense(10, input_shape=(None, 5))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Fn69xxPO5Psr" - }, - "source": [ - "미리 구성되어있는 층은 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense(완전 연결 층), Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "E3XKNknP5Mhb" - }, - "outputs": [], - "source": [ - "# 층을 사용하려면, 간단하게 호출합니다.\n", - "layer(tf.zeros([10, 5]))" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "Wt_Nsv-L5t2s" - }, - "outputs": [], - "source": [ - "# layer는 유용한 메서드를 많이 가지고 있습니다. 예를 들어, `layer.variables`를 사용하여 층안에 있는 모든 변수를 확인할 수 있으며, \n", - "# `layer.trainable_variables`를 사용하여 훈련가능한 변수를 확인할 수 있습니다. \n", - "# 완전 연결(fully-connected)층은 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", - "layer.variables" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "6ilvKjz8_4MQ" - }, - "outputs": [], - "source": [ - "# 또한 변수는 객체의 속성을 통해 편리하게 접근가능합니다. \n", - "layer.kernel, layer.bias" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "O0kDbE54-5VS" - }, - "source": [ - "## 사용자 정의 층 구현\n", - "사용자 정의 층을 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", - " * `__init__` 에서 층에 필요한 매개변수를 입력 받습니다..\n", - " * `build`, 입력 텐서의 크기를 알고 나머지를 초기화 할 수 있습니다.\n", - " * `call`, 정방향 연산(forward computation)을 진행 할 수 있습니다.\n", - "\n", - "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도 있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 층이 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있다는 것입니다. 반면에, `__init__`에 변수를 생성하는 것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "5Byl3n1k5kIy" - }, - "outputs": [], - "source": [ - "class MyDenseLayer(tf.keras.layers.Layer):\n", - " def __init__(self, num_outputs):\n", - " super(MyDenseLayer, self).__init__()\n", - " self.num_outputs = num_outputs\n", - " \n", - " def build(self, input_shape):\n", - " self.kernel = self.add_variable(\"kernel\", \n", - " shape=[int(input_shape[-1]), \n", - " self.num_outputs])\n", - " \n", - " def call(self, input):\n", - " return tf.matmul(input, self.kernel)\n", - " \n", - "layer = MyDenseLayer(10)\n", - "print(layer(tf.zeros([10, 5])))\n", - "print(layer.trainable_variables)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "tk8E2vY0-z4Z" - }, - "source": [ - "다른 독자가 표준형 층의 동작을 잘 알고 있기 때문에, 가능한 경우 표준형 층을 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 층을 사용하기 원하면 [깃허브](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀 리퀘스트(pull request)를 보내세요." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Qhg4KlbKrs3G" - }, - "source": [ - "## 모델: 층 구성\n", - "\n", - "머신러닝 모델에서 대부분의 재미있는 많은 것들은 기존의 층을 조합하여 구현됩니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어 있습니다. \n", - "\n", - "다른층을 포함한 모델을 만들기 위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현한 코드입니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "N30DTXiRASlb" - }, - "outputs": [], - "source": [ - "class ResnetIdentityBlock(tf.keras.Model):\n", - " def __init__(self, kernel_size, filters):\n", - " super(ResnetIdentityBlock, self).__init__(name='')\n", - " filters1, filters2, filters3 = filters\n", - "\n", - " self.conv2a = tf.keras.layers.Conv2D(filters1, (1, 1))\n", - " self.bn2a = tf.keras.layers.BatchNormalization()\n", - "\n", - " self.conv2b = tf.keras.layers.Conv2D(filters2, kernel_size, padding='same')\n", - " self.bn2b = tf.keras.layers.BatchNormalization()\n", - "\n", - " self.conv2c = tf.keras.layers.Conv2D(filters3, (1, 1))\n", - " self.bn2c = tf.keras.layers.BatchNormalization()\n", - "\n", - " def call(self, input_tensor, training=False):\n", - " x = self.conv2a(input_tensor)\n", - " x = self.bn2a(x, training=training)\n", - " x = tf.nn.relu(x)\n", - "\n", - " x = self.conv2b(x)\n", - " x = self.bn2b(x, training=training)\n", - " x = tf.nn.relu(x)\n", - "\n", - " x = self.conv2c(x)\n", - " x = self.bn2c(x, training=training)\n", - "\n", - " x += input_tensor\n", - " return tf.nn.relu(x)\n", - "\n", - " \n", - "block = ResnetIdentityBlock(1, [1, 2, 3])\n", - "print(block(tf.zeros([1, 2, 3, 3])))\n", - "print([x.name for x in block.trainable_variables])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "그러나 대부분의 경우에, 많은 층으로 구성된 모델은 간단하게 연이어 하나의 층으로 호출할 수 있습니다. 이는 tf.keras.Sequential 사용하여 간단한 코드로 구현 가능합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "L9frk7Ur4uvJ" - }, - "outputs": [], - "source": [ - " my_seq = tf.keras.Sequential([tf.keras.layers.Conv2D(1, (1, 1)),\n", - " tf.keras.layers.BatchNormalization(),\n", - " tf.keras.layers.Conv2D(2, 1, \n", - " padding='same'),\n", - " tf.keras.layers.BatchNormalization(),\n", - " tf.keras.layers.Conv2D(3, (1, 1)),\n", - " tf.keras.layers.BatchNormalization()])\n", - "my_seq(tf.zeros([1, 2, 3, 3]))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "c5YwYcnuK-wc" - }, - "source": [ - "# 다음 단계\n", - "\n", - "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 층과 모델을 사용하여 좀 더 나은 구조를 적용할 수 있습니다." - ] - } - ], - "metadata": { - "colab": { - "collapsed_sections": [], - "name": "custom_layers.ipynb", - "private_outputs": true, - "provenance": [], - "toc_visible": true, - "version": "0.3.2" - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "tDnwEv8FtJm7" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "form", + "colab_type": "code", + "id": "JlknJBWQtKkI", + "colab": {} + }, + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "60RdWsg1tETW" + }, + "source": [ + "# 사용자 정의 층" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "BcJg7Enms86w" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " TensorFlow.org에서 보기\n", + " \n", + " 구글 코랩(Colab)에서 실행하기\n", + " \n", + " 깃허브(GitHub) 소스 보기\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "asCKfd--yH-6", + "colab_type": "text" + }, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 참여하려면\n", + "[docs-ko@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs-ko)로\n", + "메일을 보내주시기 바랍니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "UEu3q4jmpKVT" + }, + "source": [ + "신경망을 구축하기 위해서 고수준 API인 `tf.keras`를 사용하길 권합니다. 대부분의 텐서플로 API는 즉시 실행(eager execution)과 함께 사용할 수 있습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "pwX7Fii1rwsJ", + "colab": {} + }, + "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "zSFfVVjkrrsI" + }, + "source": [ + "## 층: 유용한 연산자 집합\n", + "\n", + "머신러닝을 위한 코드를 작성하는 대부분의 경우에 개별적인 연산과 변수를 조작하는 것보다는 높은 수준의 추상화에서 작업할 것입니다.\n", + "\n", + "많은 머신러닝 모델은 비교적 단순한 층(layer)을 조합하고 쌓아서 표현가능합니다. 또한 텐서플로는 여러 표준형 층을 제공하므로 사용자 고유의 응용 프로그램에 관련된 층을 처음부터 작성하거나, 기존 층의 조합으로 쉽게 만들 수 있습니다.\n", + "\n", + "텐서플로는 [전체 케라스](https://keras.io) API를 tf.keras 패키지에 포함하고 있습니다. 케라스 층은 모델을 구축하는데 매우 유용합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "8PyXlPl-4TzQ", + "colab": {} + }, + "source": [ + "# tf.keras.layers 패키지에서 층은 객체입니다. 층을 구성하려면 간단히 객체를 생성하십시오.\n", + "# 대부분의 layer는 첫번째 인수로 출력 차원(크기) 또는 채널을 취합니다.\n", + "layer = tf.keras.layers.Dense(100)\n", + "# 입력 차원의 수는 층을 처음 실행할 때 유추할 수 있기 때문에 종종 불필요합니다. \n", + "# 일부 복잡한 모델에서는 수동으로 입력 차원의 수를 제공하는것이 유용할 수 있습니다.\n", + "layer = tf.keras.layers.Dense(10, input_shape=(None, 5))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Fn69xxPO5Psr" + }, + "source": [ + "미리 구성되어있는 층은 다음 [문서](https://www.tensorflow.org/api_docs/python/tf/keras/layers)에서 확인할 수 있습니다. Dense(완전 연결 층), Conv2D, LSTM, BatchNormalization, Dropout, 등을 포함하고 있습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "E3XKNknP5Mhb", + "colab": {} + }, + "source": [ + "# 층을 사용하려면, 간단하게 호출합니다.\n", + "layer(tf.zeros([10, 5]))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "Wt_Nsv-L5t2s", + "colab": {} + }, + "source": [ + "# layer는 유용한 메서드를 많이 가지고 있습니다. 예를 들어, `layer.variables`를 사용하여 층안에 있는 모든 변수를 확인할 수 있으며, \n", + "# `layer.trainable_variables`를 사용하여 훈련가능한 변수를 확인할 수 있습니다. \n", + "# 완전 연결(fully-connected)층은 가중치(weight)와 편향(biases)을 위한 변수를 가집니다. \n", + "layer.variables" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "6ilvKjz8_4MQ", + "colab": {} + }, + "source": [ + "# 또한 변수는 객체의 속성을 통해 편리하게 접근가능합니다. \n", + "layer.kernel, layer.bias" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "O0kDbE54-5VS" + }, + "source": [ + "## 사용자 정의 층 구현\n", + "사용자 정의 층을 구현하는 가장 좋은 방법은 tf.keras.Layer 클래스를 상속하고 다음과 같이 구현하는 것입니다.\n", + " * `__init__` 에서 층에 필요한 매개변수를 입력 받습니다..\n", + " * `build`, 입력 텐서의 크기를 알고 나머지를 초기화 할 수 있습니다.\n", + " * `call`, 정방향 연산(forward computation)을 진행 할 수 있습니다.\n", + "\n", + "변수를 생성하기 위해 `build`가 호출되길 기다릴 필요가 없다는 것에 주목하세요. 또한 변수를 `__init__`에 생성할 수도 있습니다. 그러나 `build`에 변수를 생성하는 유리한 점은 층이 작동할 입력의 크기를 기준으로 나중에 변수를 만들 수 있다는 것입니다. 반면에, `__init__`에 변수를 생성하는 것은 변수 생성에 필요한 크기가 명시적으로 지정되어야 함을 의미합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "5Byl3n1k5kIy", + "colab": {} + }, + "source": [ + "class MyDenseLayer(tf.keras.layers.Layer):\n", + " def __init__(self, num_outputs):\n", + " super(MyDenseLayer, self).__init__()\n", + " self.num_outputs = num_outputs\n", + " \n", + " def build(self, input_shape):\n", + " self.kernel = self.add_variable(\"kernel\", \n", + " shape=[int(input_shape[-1]), \n", + " self.num_outputs])\n", + " \n", + " def call(self, input):\n", + " return tf.matmul(input, self.kernel)\n", + " \n", + "layer = MyDenseLayer(10)\n", + "print(layer(tf.zeros([10, 5])))\n", + "print(layer.trainable_variables)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "tk8E2vY0-z4Z" + }, + "source": [ + "다른 독자가 표준형 층의 동작을 잘 알고 있기 때문에, 가능한 경우 표준형 층을 사용하는것이 전체 코드를 읽고 유지하는데 더 쉽습니다. 만약 tf.keras.layers 또는 tf.contrib.layers에 없는 층을 사용하기 원하면 [깃허브](http://github.com/tensorflow/tensorflow/issues/new)에 이슈화하거나, 풀 리퀘스트(pull request)를 보내세요." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Qhg4KlbKrs3G" + }, + "source": [ + "## 모델: 층 구성\n", + "\n", + "머신러닝 모델에서 대부분의 재미있는 많은 것들은 기존의 층을 조합하여 구현됩니다. 예를 들어, 레스넷(resnet)의 각 잔여 블록(residual block)은 합성곱(convolution), 배치 정규화(batch normalization), 쇼트컷(shortcut) 등으로 구성되어 있습니다. \n", + "\n", + "다른층을 포함한 모델을 만들기 위해 사용하는 메인 클래스는 tf.keras.Model입니다. 다음은 tf.keras.Model을 상속(inheritance)하여 구현한 코드입니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "N30DTXiRASlb", + "colab": {} + }, + "source": [ + "class ResnetIdentityBlock(tf.keras.Model):\n", + " def __init__(self, kernel_size, filters):\n", + " super(ResnetIdentityBlock, self).__init__(name='')\n", + " filters1, filters2, filters3 = filters\n", + "\n", + " self.conv2a = tf.keras.layers.Conv2D(filters1, (1, 1))\n", + " self.bn2a = tf.keras.layers.BatchNormalization()\n", + "\n", + " self.conv2b = tf.keras.layers.Conv2D(filters2, kernel_size, padding='same')\n", + " self.bn2b = tf.keras.layers.BatchNormalization()\n", + "\n", + " self.conv2c = tf.keras.layers.Conv2D(filters3, (1, 1))\n", + " self.bn2c = tf.keras.layers.BatchNormalization()\n", + "\n", + " def call(self, input_tensor, training=False):\n", + " x = self.conv2a(input_tensor)\n", + " x = self.bn2a(x, training=training)\n", + " x = tf.nn.relu(x)\n", + "\n", + " x = self.conv2b(x)\n", + " x = self.bn2b(x, training=training)\n", + " x = tf.nn.relu(x)\n", + "\n", + " x = self.conv2c(x)\n", + " x = self.bn2c(x, training=training)\n", + "\n", + " x += input_tensor\n", + " return tf.nn.relu(x)\n", + "\n", + " \n", + "block = ResnetIdentityBlock(1, [1, 2, 3])\n", + "print(block(tf.zeros([1, 2, 3, 3])))\n", + "print([x.name for x in block.trainable_variables])" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "yIbK5EiJyH_W", + "colab_type": "text" + }, + "source": [ + "그러나 대부분의 경우에, 많은 층으로 구성된 모델은 간단하게 연이어 하나의 층으로 호출할 수 있습니다. 이는 tf.keras.Sequential 사용하여 간단한 코드로 구현 가능합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "L9frk7Ur4uvJ", + "colab": {} + }, + "source": [ + " my_seq = tf.keras.Sequential([tf.keras.layers.Conv2D(1, (1, 1)),\n", + " tf.keras.layers.BatchNormalization(),\n", + " tf.keras.layers.Conv2D(2, 1, \n", + " padding='same'),\n", + " tf.keras.layers.BatchNormalization(),\n", + " tf.keras.layers.Conv2D(3, (1, 1)),\n", + " tf.keras.layers.BatchNormalization()])\n", + "my_seq(tf.zeros([1, 2, 3, 3]))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "c5YwYcnuK-wc" + }, + "source": [ + "# 다음 단계\n", + "\n", + "이제 이전 노트북으로 돌아가서 선형 회귀 예제에 층과 모델을 사용하여 좀 더 나은 구조를 적용할 수 있습니다." + ] + } + ] +} \ No newline at end of file diff --git a/site/ko/tutorials/eager/custom_training.ipynb b/site/ko/tutorials/eager/custom_training.ipynb index 8431c372bcf..9fe7243b2f5 100644 --- a/site/ko/tutorials/eager/custom_training.ipynb +++ b/site/ko/tutorials/eager/custom_training.ipynb @@ -1,462 +1,470 @@ { - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "5rmpybwysXGV" - }, - "source": [ - "##### Copyright 2018 The TensorFlow Authors." - ] + "nbformat": 4, + "nbformat_minor": 0, + "metadata": { + "colab": { + "name": "custom_training.ipynb", + "version": "0.3.2", + "provenance": [], + "private_outputs": true, + "collapsed_sections": [], + "toc_visible": true + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.7.1" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + } }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "form", - "colab": {}, - "colab_type": "code", - "id": "m8y3rGtQsYP2" - }, - "outputs": [], - "source": [ - "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", - "# you may not use this file except in compliance with the License.\n", - "# You may obtain a copy of the License at\n", - "#\n", - "# https://www.apache.org/licenses/LICENSE-2.0\n", - "#\n", - "# Unless required by applicable law or agreed to in writing, software\n", - "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", - "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", - "# See the License for the specific language governing permissions and\n", - "# limitations under the License." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "hrXv0rU9sIma" - }, - "source": [ - "# 사용자 정의 학습: 기초" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "7S0BwJ_8sLu7" - }, - "source": [ - "\n", - " \n", - " \n", - " \n", - "
\n", - " TensorFlow.org에서 보기\n", - " \n", - " 구글 코랩(Colab)에서 실행하기\n", - " \n", - " 깃허브(GitHub) 소스 보기\n", - "
" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", - "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", - "이 번역에 개선할 부분이 있다면\n", - "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", - "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", - "작성하거나\n", - "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", - "메일을 보내주시기 바랍니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "k2o3TTG4TFpt" - }, - "source": [ - "이전 튜토리얼에서는 머신러닝을 위한 기본 구성 요소인 자동 미분(automatic differentiation)을 위한 텐서플로 API를 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 텐서플로의 기본 요소를 사용하여 간단한 머신러닝을 수행해보겠습니다. \n", - "\n", - "텐서플로는 반복되는 코드를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망을 다룰 때 이러한 고수준의 API을 강하게 추천합니다. 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위해 기본적인 요소만으로 신경망 훈련시켜 보겠습니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "3LXMVuV0VhDr" - }, - "source": [ - "## 설정" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "PJ64L90aVir3" - }, - "outputs": [], - "source": [ - "from __future__ import absolute_import, division, print_function, unicode_literals\n", - "\n", - "import tensorflow as tf\n", - "\n", - "tf.enable_eager_execution()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "eMAWbDJFVmMk" - }, - "source": [ - "## 변수\n", - "\n", - "텐서플로의 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다르게(희망하건대 더 낮은 손실로 가는 방향으로)동작해야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 명령형 프로그래밍 언어인 파이썬을 사용 할 수 있습니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "VkJwtLS_Jbn8" - }, - "outputs": [], - "source": [ - "# 파이썬 구문 사용\n", - "x = tf.zeros([10, 10])\n", - "x += 2 # 이것은 x = x + 2와 같으며, x의 초기값을 변경하지 않습니다.\n", - "print(x)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "wfneTXy7JcUz" - }, - "source": [ - "텐서플로는 상태를 변경할 수 있는 연산자가 내장되어 있으며, 이러한 연산자는 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는 것이 편하고 효율적입니다. \n", - "\n", - "텐서플로 변수는 값을 저장하는 객체로 텐서플로 연산에 사용될 때 저장된 이 값을 읽어올 것입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자입니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "itxmrMil6DQi" - }, - "outputs": [], - "source": [ - "v = tf.Variable(1.0)\n", - "assert v.numpy() == 1.0\n", - "\n", - "# 값을 재배열합니다.\n", - "v.assign(3.0)\n", - "assert v.numpy() == 3.0\n", - "\n", - "# tf.square()와 같은 텐서플로 연산에 `v`를 사용하고 재할당합니다. \n", - "v.assign(tf.square(v))\n", - "assert v.numpy() == 9.0" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "-paSaeq1JzwC" - }, - "source": [ - "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 기본적으로 희소 텐서(sparse tensor)를 사용하여 업데이트됩니다. 이는 연산과 메모리에 더욱 효율적입니다. \n", - "\n", - "또한 변수를 사용하는 것은 코드를 읽는 독자에게 상태가 변경될 수 있다는 것을 알려주는 손쉬운 방법입니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "BMiFcDzE7Qu3" - }, - "source": [ - "## 예: 선형 모델 훈련\n", - "\n", - "지금까지 몇 가지 개념을 설명했습니다. 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였고, 이는 일반적으로 다음의 과정을 포함합니다.\n", - "\n", - "1. 모델 정의\n", - "2. 손실 함수 정의\n", - "3. 훈련 데이터 가져오기\n", - "4. 훈련 데이터에서 실행, 데이터에 최적화하기 위해 \"옵티마이저(optimizer)\"를 사용한 변수 조정\n", - "\n", - "이번 튜토리얼에서는 선형 모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, 모델은 `W` 와 `b` 두 변수를 가지고 있는 선형모델이며, 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 합성 데이터를 만들겠습니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "gFzH64Jn9PIm" - }, - "source": [ - "### 모델 정의\n", - "\n", - "변수와 연산을 캡슐화하기 위한 간단한 클래스를 정의해봅시다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "_WRu7Pze7wk8" - }, - "outputs": [], - "source": [ - "class Model(object):\n", - " def __init__(self):\n", - " # 변수를 (5.0, 0.0)으로 초기화 합니다.\n", - " # 실제로는 임의의 값으로 초기화 되어야합니다.\n", - " self.W = tf.Variable(5.0)\n", - " self.b = tf.Variable(0.0)\n", - " \n", - " def __call__(self, x):\n", - " return self.W * x + self.b\n", - " \n", - "model = Model()\n", - "\n", - "assert model(3.0).numpy() == 15.0" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "xa6j_yXa-j79" - }, - "source": [ - "### 손실 함수 정의\n", - "\n", - "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지를 측정합니다. 평균 제곱 오차(mean square error)를 적용한 손실 함수를 사용하겠습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "Y0ysUFGY924U" - }, - "outputs": [], - "source": [ - "def loss(predicted_y, desired_y):\n", - " return tf.reduce_mean(tf.square(predicted_y - desired_y))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "qutT_fkl_CBc" - }, - "source": [ - "### 훈련 데이터 가져오기\n", - "\n", - "약간의 잡음과 훈련 데이터를 합칩니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "gxPTb-kt_N5m" - }, - "outputs": [], - "source": [ - "TRUE_W = 3.0\n", - "TRUE_b = 2.0\n", - "NUM_EXAMPLES = 1000\n", - "\n", - "inputs = tf.random_normal(shape=[NUM_EXAMPLES])\n", - "noise = tf.random_normal(shape=[NUM_EXAMPLES])\n", - "outputs = inputs * TRUE_W + TRUE_b + noise" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "-50nq-wPBsAW" - }, - "source": [ - "모델을 훈련시키기 전에, 모델의 현재 상태를 시각화합시다. 모델의 예측을 빨간색으로, 훈련 데이터를 파란색으로 구성합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "_eb83LtrB4nt" - }, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "\n", - "plt.scatter(inputs, outputs, c='b')\n", - "plt.scatter(inputs, model(inputs), c='r')\n", - "plt.show()\n", - "\n", - "print('현재 손실: '),\n", - "print(loss(model(inputs), outputs).numpy())" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "sSDP-yeq_4jE" - }, - "source": [ - "### 훈련 루프 정의\n", - "\n", - "이제 네트워크와 훈련 데이터가 준비되었습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시켜 보죠. 그리고 [경사 하강법(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)을 사용하여 손실을 감소시킵니다. 경사 하강법에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "MBIACgdnA55X" - }, - "outputs": [], - "source": [ - "def train(model, inputs, outputs, learning_rate):\n", - " with tf.GradientTape() as t:\n", - " current_loss = loss(model(inputs), outputs)\n", - " dW, db = t.gradient(current_loss, [model.W, model.b])\n", - " model.W.assign_sub(learning_rate * dW)\n", - " model.b.assign_sub(learning_rate * db)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "RwWPaJryD2aN" - }, - "source": [ - "마지막으로, 훈련 데이터를 반복적으로 실행하고, `W` 와 `b`의 변화 과정을 확인합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "XdfkR223D9dW" - }, - "outputs": [], - "source": [ - "model = Model()\n", - "\n", - "# 도식화를 위해 W값과 b값의 변화를 저장합니다.\n", - "Ws, bs = [], []\n", - "epochs = range(10)\n", - "for epoch in epochs:\n", - " Ws.append(model.W.numpy())\n", - " bs.append(model.b.numpy())\n", - " current_loss = loss(model(inputs), outputs)\n", - "\n", - " train(model, inputs, outputs, learning_rate=0.1)\n", - " print('에포크 %2d: W=%1.2f b=%1.2f, 손실=%2.5f' %\n", - " (epoch, Ws[-1], bs[-1], current_loss))\n", - "\n", - "# 저장된 값들을 도식화합니다.\n", - "plt.plot(epochs, Ws, 'r',\n", - " epochs, bs, 'b')\n", - "plt.plot([TRUE_W] * len(epochs), 'r--',\n", - " [TRUE_b] * len(epochs), 'b--')\n", - "plt.legend(['W', 'b', 'true W', 'true_b'])\n", - "plt.show()\n", - " " - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "vPnIVuaSJwWz" - }, - "source": [ - "## 다음 단계\n", - "\n", - "이번 튜토리얼에서는 변수를 다루었으며, 지금까지 논의된 텐서플로의 기본 요소를 사용하여 간단한 선형 모델을 구축하고 훈련시켰습니다.\n", - "\n", - "이론적으로, 텐서플로를 머신러닝 연구에 사용하기 위해 알아야 할 것이 매우 많습니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 구성 요소(\"층\"으로 불리는)를 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - } - ], - "metadata": { - "colab": { - "collapsed_sections": [], - "name": "Custom training: basics", - "private_outputs": true, - "provenance": [], - "toc_visible": true, - "version": "0.3.2" - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "5rmpybwysXGV" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "form", + "colab_type": "code", + "id": "m8y3rGtQsYP2", + "colab": {} + }, + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "hrXv0rU9sIma" + }, + "source": [ + "# 사용자 정의 학습: 기초" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "7S0BwJ_8sLu7" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " TensorFlow.org에서 보기\n", + " \n", + " 구글 코랩(Colab)에서 실행하기\n", + " \n", + " 깃허브(GitHub) 소스 보기\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Tt0udTybxxwG", + "colab_type": "text" + }, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 참여하려면\n", + "[docs-ko@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs-ko)로\n", + "메일을 보내주시기 바랍니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "k2o3TTG4TFpt" + }, + "source": [ + "이전 튜토리얼에서는 머신러닝을 위한 기본 구성 요소인 자동 미분(automatic differentiation)을 위한 텐서플로 API를 알아보았습니다. 이번 튜토리얼에서는 이전 튜토리얼에서 소개되었던 텐서플로의 기본 요소를 사용하여 간단한 머신러닝을 수행해보겠습니다. \n", + "\n", + "텐서플로는 반복되는 코드를 줄이기 위해 유용한 추상화를 제공하는 고수준 신경망(neural network) API인 `tf.keras`를 포함하고 있습니다. 신경망을 다룰 때 이러한 고수준의 API을 강하게 추천합니다. 이번 짧은 튜토리얼에서는 탄탄한 기초를 기르기 위해 기본적인 요소만으로 신경망 훈련시켜 보겠습니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "3LXMVuV0VhDr" + }, + "source": [ + "## 설정" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "PJ64L90aVir3", + "colab": {} + }, + "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "eMAWbDJFVmMk" + }, + "source": [ + "## 변수\n", + "\n", + "텐서플로의 텐서(Tensor)는 상태가 없고, 변경이 불가능한(immutable stateless) 객체입니다. 그러나 머신러닝 모델은 상태가 변경될(stateful) 필요가 있습니다. 예를 들어, 모델 학습에서 예측을 계산하기 위한 동일한 코드는 시간이 지남에 따라 다르게(희망하건대 더 낮은 손실로 가는 방향으로)동작해야 합니다. 이 연산 과정을 통해 변화되어야 하는 상태를 표현하기 위해 명령형 프로그래밍 언어인 파이썬을 사용 할 수 있습니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "VkJwtLS_Jbn8", + "colab": {} + }, + "source": [ + "# 파이썬 구문 사용\n", + "x = tf.zeros([10, 10])\n", + "x += 2 # 이것은 x = x + 2와 같으며, x의 초기값을 변경하지 않습니다.\n", + "print(x)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "wfneTXy7JcUz" + }, + "source": [ + "텐서플로는 상태를 변경할 수 있는 연산자가 내장되어 있으며, 이러한 연산자는 상태를 표현하기 위한 저수준 파이썬 표현보다 사용하기가 더 좋습니다. 예를 들어, 모델에서 가중치를 나타내기 위해서 텐서플로 변수를 사용하는 것이 편하고 효율적입니다. \n", + "\n", + "텐서플로 변수는 값을 저장하는 객체로 텐서플로 연산에 사용될 때 저장된 이 값을 읽어올 것입니다. `tf.assign_sub`, `tf.scatter_update` 등은 텐서플로 변수에 저장되있는 값을 조작하는 연산자입니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "itxmrMil6DQi", + "colab": {} + }, + "source": [ + "v = tf.Variable(1.0)\n", + "assert v.numpy() == 1.0\n", + "\n", + "# 값을 재배열합니다.\n", + "v.assign(3.0)\n", + "assert v.numpy() == 3.0\n", + "\n", + "# tf.square()와 같은 텐서플로 연산에 `v`를 사용하고 재할당합니다. \n", + "v.assign(tf.square(v))\n", + "assert v.numpy() == 9.0" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "-paSaeq1JzwC" + }, + "source": [ + "변수를 사용한 연산은 그래디언트가 계산될 때 자동적으로 추적됩니다. 임베딩(embedding)을 나타내는 변수의 경우 기본적으로 희소 텐서(sparse tensor)를 사용하여 업데이트됩니다. 이는 연산과 메모리에 더욱 효율적입니다. \n", + "\n", + "또한 변수를 사용하는 것은 코드를 읽는 독자에게 상태가 변경될 수 있다는 것을 알려주는 손쉬운 방법입니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "BMiFcDzE7Qu3" + }, + "source": [ + "## 예: 선형 모델 훈련\n", + "\n", + "지금까지 몇 가지 개념을 설명했습니다. 간단한 모델을 구축하고 학습시키기 위해 ---`Tensor`, `GradientTape`, `Variable` --- 등을 사용하였고, 이는 일반적으로 다음의 과정을 포함합니다.\n", + "\n", + "1. 모델 정의\n", + "2. 손실 함수 정의\n", + "3. 훈련 데이터 가져오기\n", + "4. 훈련 데이터에서 실행, 데이터에 최적화하기 위해 \"옵티마이저(optimizer)\"를 사용한 변수 조정\n", + "\n", + "이번 튜토리얼에서는 선형 모델의 간단한 예제를 살펴보겠습니다. `f(x) = x * W + b`, 모델은 `W` 와 `b` 두 변수를 가지고 있는 선형모델이며, 잘 학습된 모델이 `W = 3.0` and `b = 2.0`의 값을 갖도록 합성 데이터를 만들겠습니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "gFzH64Jn9PIm" + }, + "source": [ + "### 모델 정의\n", + "\n", + "변수와 연산을 캡슐화하기 위한 간단한 클래스를 정의해봅시다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "_WRu7Pze7wk8", + "colab": {} + }, + "source": [ + "class Model(object):\n", + " def __init__(self):\n", + " # 변수를 (5.0, 0.0)으로 초기화 합니다.\n", + " # 실제로는 임의의 값으로 초기화 되어야합니다.\n", + " self.W = tf.Variable(5.0)\n", + " self.b = tf.Variable(0.0)\n", + " \n", + " def __call__(self, x):\n", + " return self.W * x + self.b\n", + " \n", + "model = Model()\n", + "\n", + "assert model(3.0).numpy() == 15.0" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "xa6j_yXa-j79" + }, + "source": [ + "### 손실 함수 정의\n", + "\n", + "손실 함수는 주어진 입력에 대한 모델의 출력이 원하는 출력과 얼마나 잘 일치하는지를 측정합니다. 평균 제곱 오차(mean square error)를 적용한 손실 함수를 사용하겠습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "Y0ysUFGY924U", + "colab": {} + }, + "source": [ + "def loss(predicted_y, desired_y):\n", + " return tf.reduce_mean(tf.square(predicted_y - desired_y))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "qutT_fkl_CBc" + }, + "source": [ + "### 훈련 데이터 가져오기\n", + "\n", + "약간의 잡음과 훈련 데이터를 합칩니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "gxPTb-kt_N5m", + "colab": {} + }, + "source": [ + "TRUE_W = 3.0\n", + "TRUE_b = 2.0\n", + "NUM_EXAMPLES = 1000\n", + "\n", + "inputs = tf.random_normal(shape=[NUM_EXAMPLES])\n", + "noise = tf.random_normal(shape=[NUM_EXAMPLES])\n", + "outputs = inputs * TRUE_W + TRUE_b + noise" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "-50nq-wPBsAW" + }, + "source": [ + "모델을 훈련시키기 전에, 모델의 현재 상태를 시각화합시다. 모델의 예측을 빨간색으로, 훈련 데이터를 파란색으로 구성합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "_eb83LtrB4nt", + "colab": {} + }, + "source": [ + "import matplotlib.pyplot as plt\n", + "\n", + "plt.scatter(inputs, outputs, c='b')\n", + "plt.scatter(inputs, model(inputs), c='r')\n", + "plt.show()\n", + "\n", + "print('현재 손실: '),\n", + "print(loss(model(inputs), outputs).numpy())" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "sSDP-yeq_4jE" + }, + "source": [ + "### 훈련 루프 정의\n", + "\n", + "이제 네트워크와 훈련 데이터가 준비되었습니다. 모델의 변수(`W` 와 `b`)를 업데이트하기 위해 훈련 데이터를 사용하여 훈련시켜 보죠. 그리고 [경사 하강법(gradient descent)](https://en.wikipedia.org/wiki/Gradient_descent)을 사용하여 손실을 감소시킵니다. 경사 하강법에는 여러가지 방법이 있으며, `tf.train.Optimizer` 에 구현되어있습니다. 이러한 구현을 사용하는것을 강력히 추천드립니다. 그러나 이번 튜토리얼에서는 기본적인 방법을 사용하겠습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "MBIACgdnA55X", + "colab": {} + }, + "source": [ + "def train(model, inputs, outputs, learning_rate):\n", + " with tf.GradientTape() as t:\n", + " current_loss = loss(model(inputs), outputs)\n", + " dW, db = t.gradient(current_loss, [model.W, model.b])\n", + " model.W.assign_sub(learning_rate * dW)\n", + " model.b.assign_sub(learning_rate * db)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "RwWPaJryD2aN" + }, + "source": [ + "마지막으로, 훈련 데이터를 반복적으로 실행하고, `W` 와 `b`의 변화 과정을 확인합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "XdfkR223D9dW", + "colab": {} + }, + "source": [ + "model = Model()\n", + "\n", + "# 도식화를 위해 W값과 b값의 변화를 저장합니다.\n", + "Ws, bs = [], []\n", + "epochs = range(10)\n", + "for epoch in epochs:\n", + " Ws.append(model.W.numpy())\n", + " bs.append(model.b.numpy())\n", + " current_loss = loss(model(inputs), outputs)\n", + "\n", + " train(model, inputs, outputs, learning_rate=0.1)\n", + " print('에포크 %2d: W=%1.2f b=%1.2f, 손실=%2.5f' %\n", + " (epoch, Ws[-1], bs[-1], current_loss))\n", + "\n", + "# 저장된 값들을 도식화합니다.\n", + "plt.plot(epochs, Ws, 'r',\n", + " epochs, bs, 'b')\n", + "plt.plot([TRUE_W] * len(epochs), 'r--',\n", + " [TRUE_b] * len(epochs), 'b--')\n", + "plt.legend(['W', 'b', 'true W', 'true_b'])\n", + "plt.show()\n", + " " + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vPnIVuaSJwWz" + }, + "source": [ + "## 다음 단계\n", + "\n", + "이번 튜토리얼에서는 변수를 다루었으며, 지금까지 논의된 텐서플로의 기본 요소를 사용하여 간단한 선형 모델을 구축하고 훈련시켰습니다.\n", + "\n", + "이론적으로, 텐서플로를 머신러닝 연구에 사용하기 위해 알아야 할 것이 매우 많습니다. 실제로 신경망에 있어 `tf.keras`와 같은 고수준 API는 고수준 구성 요소(\"층\"으로 불리는)를 제공하고, 저장 및 복원을 위한 유틸리티, 손실 함수 모음, 최적화 전략 모음 등을 제공하기 때문에 더욱 편리합니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "id": "6uk4j3tSxxwq", + "colab_type": "code", + "colab": {} + }, + "source": [ + "" + ], + "execution_count": 0, + "outputs": [] + } + ] +} \ No newline at end of file diff --git a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb index 8f42dd20700..a92ea88a33d 100644 --- a/site/ko/tutorials/eager/custom_training_walkthrough.ipynb +++ b/site/ko/tutorials/eager/custom_training_walkthrough.ipynb @@ -1,1118 +1,1120 @@ { - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "rwxGnsA92emp" - }, - "source": [ - "##### Copyright 2018 The TensorFlow Authors." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "form", - "colab": {}, - "colab_type": "code", - "id": "CPII1rGR2rF9" - }, - "outputs": [], - "source": [ - "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", - "# you may not use this file except in compliance with the License.\n", - "# You may obtain a copy of the License at\n", - "#\n", - "# https://www.apache.org/licenses/LICENSE-2.0\n", - "#\n", - "# Unless required by applicable law or agreed to in writing, software\n", - "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", - "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", - "# See the License for the specific language governing permissions and\n", - "# limitations under the License." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "JtEZ1pCPn--z" - }, - "source": [ - "# 사용자 정의 학습: 자세히 둘러보기" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "GV1F7tVTN3Dn" - }, - "source": [ - "\n", - " \n", - " \n", - " \n", - "
\n", - " TensorFlow.org에서 보기\n", - " \n", - " 구글 코랩(Colab)에서 실행하기\n", - " \n", - " 깃허브(GitHub) 소스 보기\n", - "
" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", - "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", - "이 번역에 개선할 부분이 있다면\n", - "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", - "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", - "작성하거나\n", - "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", - "메일을 보내주시기 바랍니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "LDrzLFXE8T1l" - }, - "source": [ - "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시 실행[(eager execution)](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", - "1. 모델 구축\n", - "2. 모델 훈련\n", - "3. 예측을 위한 모델 사용\n", - "\n", - "## 텐서플로 프로그래밍\n", - "\n", - "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념을 사용합니다.\n", - "\n", - "* [즉시 실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발 환경,\n", - "* [데이터셋 API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 가져오기,\n", - "* [케라스 API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 층(layer) 구축 .\n", - "\n", - "이번 튜토리얼은 다른 텐서플로 프로그램과 유사하게 구성되어있습니다.\n", - "\n", - "1. 데이터 가져오기 및 분석.\n", - "2. 모델 타입 선정.\n", - "3. 모델 훈련.\n", - "4. 모델 효과 평가.\n", - "5. 예측을 위한 훈련된 모델 사용." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "yNr7H-AIoLOR" - }, - "source": [ - "## 프로그램 설정" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "1J3AuPBT9gyR" - }, - "source": [ - "### 임포트 및 즉시 실행 구성\n", - "\n", - "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화합니다. 즉시 실행은 텐서플로 연산이 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 상호작용 콘솔을 사용하시면 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", - "\n", - "즉시 실행이 활성화될 때, 동일한 프로그램내에서 비활성화 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 참조하세요." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "g4Wzg69bnwK2" - }, - "outputs": [], - "source": [ - "from __future__ import absolute_import, division, print_function, unicode_literals\n", - "\n", - "import os\n", - "import matplotlib.pyplot as plt\n", - "\n", - "import tensorflow as tf\n", - "\n", - "tf.enable_eager_execution()\n", - "\n", - "print(\"텐서플로 버전: {}\".format(tf.__version__))\n", - "print(\"즉시 실행: {}\".format(tf.executing_eagerly()))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Zx7wc0LuuxaJ" - }, - "source": [ - "## 붓꽃 분류 문제\n", - "\n", - "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고 있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 이번 튜토리얼의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는 것입니다.\n", - "\n", - "이 붓꽃은 약 300종입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", - "\n", - "* Iris setosa\n", - "* Iris virginica\n", - "* Iris versicolor\n", - "\n", - "\n", - " \n", - " \n", - "
\n", - " \"Petal\n", - "
\n", - " 그림 1. Iris setosa (by Radomil, CC BY-SA 3.0), Iris versicolor, (by Dlanglois, CC BY-SA 3.0), and Iris virginica (by Frank Mayfield, CC BY-SA 2.0).
 \n", - "
\n", - "\n", - "다행히도 다른 사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류 문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "3Px6KAg0Jowz" - }, - "source": [ - "## 훈련 데이터 가져오기 및 파싱\n", - "\n", - "데이터를 불러오고 파이썬 프로그램이 사용할 수 있는 구조로 전환합니다.\n", - "\n", - "### 데이터셋 다운로드\n", - "\n", - "[tf.keras.utils.get_file](https://www.tensorflow.org/api_docs/python/tf/keras/utils/get_file) 함수를 사용하여 데이터셋을 다운로드합니다. 이 함수는 다운로드된 파일의 경로를 반환합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "J6c7uEU9rjRM" - }, - "outputs": [], - "source": [ - "train_dataset_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\"\n", - "\n", - "train_dataset_fp = tf.keras.utils.get_file(fname=os.path.basename(train_dataset_url),\n", - " origin=train_dataset_url)\n", - "\n", - "print(\"데이터셋이 복사된 위치: {}\".format(train_dataset_fp))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "qnX1-aLors4S" - }, - "source": [ - "### 데이터 탐색\n", - "\n", - "이 데이터셋(`iris_training.csv`)은 콤마 ','로 구분된 CSV 파일입니다. `head -n5` 명령을 사용하여 처음 5개 항목을 확인합니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "FQvb_JYdrpPm" - }, - "outputs": [], - "source": [ - "!head -n5 {train_dataset_fp}" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "kQhzD6P-uBoq" - }, - "source": [ - "처음 5개의 데이터로부터 다음을 주목하세요.\n", - "\n", - "1. 첫 번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", - " * 총 120개의 샘플이 있으며, 각 샘플들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", - "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[샘플](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", - " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 샘플의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", - " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 예측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", - "\n", - "코드로 표현하면 다음과 같습니다.:" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "9Edhevw7exl6" - }, - "outputs": [], - "source": [ - "# CSV 파일안에서 컬럼의 순서\n", - "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", - "\n", - "feature_names = column_names[:-1]\n", - "label_name = column_names[-1]\n", - "\n", - "print(\"특성: {}\".format(feature_names))\n", - "print(\"레이블: {}\".format(label_name))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "CCtwLoJhhDNc" - }, - "source": [ - "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적으로 숫자형 값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", - "\n", - "* `0`: Iris setosa\n", - "* `1`: Iris versicolor\n", - "* `2`: Iris virginica\n", - "\n", - "특성과 레이블에 관한 더 많은 정보를 위해서는 [머신러닝 특강의 전문용어 부분](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)을 참조하세요." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "sVNlJlUOhkoX" - }, - "outputs": [], - "source": [ - "class_names = ['Iris setosa', 'Iris versicolor', 'Iris virginica']" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "dqPkQExM2Pwt" - }, - "source": [ - "### `tf.data.Dataset` 생성\n", - "\n", - "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 적재할 때 발생하는 다양한 경우를 다룰 수 있습니다. 이는 훈련에 필요한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", - "\n", - "\n", - "데이터셋이 CSV 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련 모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "WsxHnz1ebJ2S" - }, - "outputs": [], - "source": [ - "batch_size = 32\n", - "\n", - "train_dataset = tf.contrib.data.make_csv_dataset(\n", - " train_dataset_fp,\n", - " batch_size, \n", - " column_names=column_names,\n", - " label_name=label_name,\n", - " num_epochs=1)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "gB_RSn62c-3G" - }, - "source": [ - "`make_csv_dataset` 함수는 `(features, label)` 쌍으로 구성된 `tf.data.Dataset`을 반환합니다. `features`는 딕셔너리 객체인: `{'feature_name': value}`로 주어집니다.\n", - "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)을 살펴봅시다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "iDuG94H-C122" - }, - "outputs": [], - "source": [ - "features, labels = next(iter(train_dataset))\n", - "\n", - "features" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "E63mArnQaAGz" - }, - "source": [ - "유사한 특성의 값은 같이 그룹 되어있거나, *배치* 돼있다는 사실에 주목하세요. 각 샘플 행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 샘플의 수를 설정하세요.\n", - "\n", - "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집돼있는 데이터를 확인할 수 있습니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "me5Wn-9FcyyO" - }, - "outputs": [], - "source": [ - "plt.scatter(features['petal_length'].numpy(),\n", - " features['sepal_length'].numpy(),\n", - " c=labels.numpy(),\n", - " cmap='viridis')\n", - "\n", - "plt.xlabel(\"petal length\")\n", - "plt.ylabel(\"sepal length\");" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "YlxpSyHlhT6M" - }, - "source": [ - "모델 구축 단계를 단순화하기 위해, 특성 딕셔너리를 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", - "\n", - "이 함수는 텐서의 리스트(list)로부터 값을 취하고 특정한 차원으로 결합된 텐서를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "jm932WINcaGU" - }, - "outputs": [], - "source": [ - "def pack_features_vector(features, labels):\n", - " \"\"\"Pack the features into a single array.\"\"\"\n", - " features = tf.stack(list(features.values()), axis=1)\n", - " return features, labels" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "V1Vuph_eDl8x" - }, - "source": [ - "그 후 각 `(features,label)`쌍의 특성을 훈련 데이터셋에 쌓기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메서드를 사용합니다. " - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "ZbDkzGZIkpXf" - }, - "outputs": [], - "source": [ - "train_dataset = train_dataset.map(pack_features_vector)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "NLy0Q1xCldVO" - }, - "source": [ - "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5개행의 샘플을 살펴봅시다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "kex9ibEek6Tr" - }, - "outputs": [], - "source": [ - "features, labels = next(iter(train_dataset))\n", - "\n", - "print(features[:5])" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "LsaVrtNM3Tx5" - }, - "source": [ - "## 모델 타입 선정\n", - "\n", - "### 왜 모델을 사용해야하는가?\n", - "\n", - " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)과 레이블(label) 과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇 가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", - "\n", - "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을 정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분히 좋은 샘플을 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성 간의 관계를 이해하고 제공합니다. \n", - "\n", - "### 모델 선정\n", - "\n", - "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[밀집(dense) 또는 완전 연결 신경망(fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", - "\n", - "\n", - " \n", - " \n", - "
\n", - " \n", - "
\n", - " 그림 2. A neural network with features, hidden layers, and predictions.
 \n", - "
\n", - "\n", - "그림 2의 모델이 훈련된 다음 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지(주어진 레이블의 개수) 예측을 출력합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 불립니다. 이 샘플에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "W23DIMVPQEBt" - }, - "source": [ - "### 케라스를 사용한 모델 생성\n", - "\n", - "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 층을 생성하기 위한 풍부한 라이브러리를 제공합니다. 케라스가 구성 요소를 연결하기 위한 복잡함을 모두 처리해 주기 때문에 모델을 구축하고 실험하는 것이 쉽습니다.\n", - "\n", - "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)과 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "2fZ6oL2ig3ZK" - }, - "outputs": [], - "source": [ - "model = tf.keras.Sequential([\n", - " tf.keras.layers.Dense(10, activation=tf.nn.relu, input_shape=(4,)), # input shape required\n", - " tf.keras.layers.Dense(10, activation=tf.nn.relu),\n", - " tf.keras.layers.Dense(3)\n", - "])" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "FHcbEzMpxbHL" - }, - "source": [ - "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층에서 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 하나의 층과 동일하다고 생각할 수 있습니다. 사용 가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", - "\n", - "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 의해 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로 보면 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "2wFKnhWCpDSS" - }, - "source": [ - "### 모델 사용\n", - "\n", - "이 모델이 특성의 배치에 대해 수행하는 작업을 간단히 살펴봅시다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "xe6SQ5NrpB-I" - }, - "outputs": [], - "source": [ - "predictions = model(features)\n", - "predictions[:5]" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "wxyXOhwVr5S3" - }, - "source": [ - "각 샘플은 각 클래스에 대한 [로짓(logit)](https://developers.google.com/machine-learning/crash-course/glossary#logits)을 반환합니다. \n", - "\n", - "이 로짓(logit)을 각 클래스에 대한 확률로 변환하기 위하서 [소프트맥스(softmax)](https://developers.google.com/machine-learning/crash-course/glossary#softmax) 함수를 사용하겠습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "_tRwHZmTNTX2" - }, - "outputs": [], - "source": [ - "tf.nn.softmax(predictions[:5])" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "uRZmchElo481" - }, - "source": [ - "`tf.argmax`는 예측된 값 중 가장 큰 확률(원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "-Jzm_GoErz8B" - }, - "outputs": [], - "source": [ - "print(\"예측: {}\".format(tf.argmax(predictions, axis=1)))\n", - "print(\" 레이블: {}\".format(labels))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Vzq2E5J2QMtw" - }, - "source": [ - "## 모델 훈련하기\n", - "\n", - "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", - "\n", - "붓꽃 분류 문제는 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지 않습니다. 대신에 모델은 특성 간의 패턴을 찾습니다. " - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "RaKp8aEjKX6B" - }, - "source": [ - "### 손실 함수와 그래디언트 함수 정의하기\n", - "\n", - "훈련과 평가단계에서 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)*을 계산해야 합니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 이 값을 최소화하고, 최적화 해야합니다.\n", - "\n", - "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용해 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 샘플의 평균 손실을 반환합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "tMAT4DcMPwI-" - }, - "outputs": [], - "source": [ - "def loss(model, x, y):\n", - " y_ = model(x)\n", - " return tf.losses.sparse_softmax_cross_entropy(labels=y, logits=y_)\n", - "\n", - "\n", - "l = loss(model, features, labels)\n", - "print(\"손실 테스트: {}\".format(l))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "3IcPqA24QM6B" - }, - "source": [ - "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)*를 계산하기 위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "x57HcKWhKkei" - }, - "outputs": [], - "source": [ - "def grad(model, inputs, targets):\n", - " with tf.GradientTape() as tape:\n", - " loss_value = loss(model, inputs, targets)\n", - " return loss_value, tape.gradient(loss_value, model.trainable_variables)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "lOxFimtlKruu" - }, - "source": [ - "### 옵티마이저 생성 \n", - "\n", - "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 손실 함수를 최소화하기 위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실 함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자 합니다. 그래디언트는 가장 가파른 상승 방향을 가리키며 따라서 반대 방향으로 이동하는 여행을 합니다. 각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련과정 동안 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기 위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 손실이 낮을수록 더 좋은 모델의 예측을 기대할 수 있습니다.\n", - "\n", - "\n", - " \n", - " \n", - "
\n", - " \"Optimization\n", - "
\n", - " 그림 3. 3차원 공간에 대한 최적화 알고리즘 시각화.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", - "
\n", - "\n", - "텐서플로는 훈련을 위해 사용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강법(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현한 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. `learning_rate`은 경사하강 과정의 크기를 나타내는 매개변수이며, 더 나은 결과를 위해 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "XkUd6UiZa_dF" - }, - "source": [ - "옵티마이저(optimizer)와 `global_step`을 설정합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "8xxi2NNGKwG_" - }, - "outputs": [], - "source": [ - "optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)\n", - "\n", - "global_step = tf.contrib.eager.Variable(0)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "pJVRZ0hP52ZB" - }, - "source": [ - "이 값들을 단일 최적화 단계를 계산하기 위해 사용합니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "rxRNTFVe56RG" - }, - "outputs": [], - "source": [ - "loss_value, grads = grad(model, features, labels)\n", - "\n", - "print(\"단계: {}, 초기 손실: {}\".format(global_step.numpy(),\n", - " loss_value.numpy()))\n", - "\n", - "optimizer.apply_gradients(zip(grads, model.trainable_variables), global_step)\n", - "\n", - "print(\"단계: {}, 손실: {}\".format(global_step.numpy(),\n", - " loss(model, features, labels).numpy()))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "7Y2VSELvwAvW" - }, - "source": [ - "### 훈련 루프\n", - "\n", - "모든 사항이 갖춰졌으므로 모델을 훈련할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", - "\n", - "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", - "2. 에포크 내에서, *특성* (`x`)와 *레이블* (`y`)가 포함된 훈련 `데이터셋`에 있는 샘플을 반복합니다.\n", - "3. 샘플의 특성을 사용하여 결과를 예측 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", - "4. 모델의 변수를 업데이트하기 위해 `옵티마이저`를 사용합니다. \n", - "5. 시각화를 위해 몇가지 값들을 저장합니다.\n", - "6. 각 에포크를 반복합니다.\n", - "\n", - "`num_epochs` 변수는 데이터셋의 반복 횟수입니다. 직관과는 반대로, 모델을 길게 학습하는 것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는 것은 많은 경험과 직관을 필요로 합니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "AIgulGRUhpto" - }, - "outputs": [], - "source": [ - "## Note: 이 셀을 다시 실행하면 동일한 모델의 변수가 사용됩니다.\n", - "\n", - "from tensorflow import contrib\n", - "tfe = contrib.eager\n", - "\n", - "# 도식화를 위해 결과를 저장합니다.\n", - "train_loss_results = []\n", - "train_accuracy_results = []\n", - "\n", - "num_epochs = 201\n", - "\n", - "for epoch in range(num_epochs):\n", - " epoch_loss_avg = tfe.metrics.Mean()\n", - " epoch_accuracy = tfe.metrics.Accuracy()\n", - "\n", - " # 훈련 루프 - 32개의 배치를 사용합니다.\n", - " for x, y in train_dataset:\n", - " # 모델을 최적화합니다.\n", - " loss_value, grads = grad(model, x, y)\n", - " optimizer.apply_gradients(zip(grads, model.trainable_variables),\n", - " global_step)\n", - "\n", - " # 진행 상황을 추적합니다.\n", - " epoch_loss_avg(loss_value) # 현재 배치 손실을 추가합니다.\n", - " # 예측된 레이블과 실제 레이블 비교합니다.\n", - " epoch_accuracy(tf.argmax(model(x), axis=1, output_type=tf.int32), y)\n", - "\n", - " # epoch 종료\n", - " train_loss_results.append(epoch_loss_avg.result())\n", - " train_accuracy_results.append(epoch_accuracy.result())\n", - " \n", - " if epoch % 50 == 0:\n", - " print(\"에포크 {:03d}: 손실: {:.3f}, 정확도: {:.3%}\".format(epoch, \n", - " epoch_loss_avg.result(), \n", - " epoch_accuracy.result()))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "2FQHVUnm_rjw" - }, - "source": [ - "### 시간에 따른 손실함수 시각화" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "j3wdbmtLVTyr" - }, - "source": [ - "모델의 훈련 과정을 출력하는 것도 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [텐서보드(tensorboard)](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지 되어있는 굉장히 유용한 시각화 툴입니다. 하지만 `matplotlib` 모듈을 사용하여 일반적인 도표를 출력할 수 있습니다.\n", - "\n", - "이 도표를 해석하는 것은 여러 경험이 필요하지만, 결국 모델을 최적화하기 위해 *손실*이 내려가고 *정확도*가 올라가는 것을 원합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "agjvNd2iUGFn" - }, - "outputs": [], - "source": [ - "fig, axes = plt.subplots(2, sharex=True, figsize=(12, 8))\n", - "fig.suptitle('Training Metrics')\n", - "\n", - "axes[0].set_ylabel(\"loss\", fontsize=14)\n", - "axes[0].plot(train_loss_results)\n", - "\n", - "axes[1].set_ylabel(\"Accuracy\", fontsize=14)\n", - "axes[1].set_xlabel(\"epoch\", fontsize=14)\n", - "axes[1].plot(train_accuracy_results);" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Zg8GoMZhLpGH" - }, - "source": [ - "## 모델 유효성 평가\n", - "\n", - "이제 모델은 훈련되었습니다. 모델의 성능에 대한 몇가지 통계를 얻을 수 있습니다. \n", - "\n", - "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는 것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적인 모델입니다. 5개의 예측 중 4개를 올바르게 예측하여 80% 정확도를 냅니다.\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
샘플 특성레이블모델 예측
5.93.04.31.511
6.93.15.42.122
5.13.31.70.500
6.0 3.4 4.5 1.6 12
5.52.54.01.311
\n", - " 그림 4. 80% 정확도 붓꽃 분류기.
 \n", - "
" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "z-EvK7hGL0d8" - }, - "source": [ - "### 테스트 데이터 세트 설정\n", - "\n", - "모델을 평가하는 것은 모델을 훈련하는 것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기 위해, 모델을 평가하기 위한 샘플은 반드시 훈련 데이터와 달라야합니다. \n", - "\n", - "테스트 데이터 세트를 설정하는 것은 훈련 데이터 세트를 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 파싱합니다. 그 후 셔플은 적용하지 않습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "Ps3_9dJ3Lodk" - }, - "outputs": [], - "source": [ - "test_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_test.csv\"\n", - "\n", - "test_fp = tf.keras.utils.get_file(fname=os.path.basename(test_url),\n", - " origin=test_url)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "SRMWCu30bnxH" - }, - "outputs": [], - "source": [ - "test_dataset = tf.contrib.data.make_csv_dataset(\n", - " test_fp,\n", - " batch_size, \n", - " column_names=column_names,\n", - " label_name='species',\n", - " num_epochs=1,\n", - " shuffle=False)\n", - "\n", - "test_dataset = test_dataset.map(pack_features_vector)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "HFuOKXJdMAdm" - }, - "source": [ - "### 테스트 데이터 세트를 사용한 모델 평가\n", - "\n", - "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한 번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)를 진행합니다. 다음의 코드 셀은 테스트 셋에 있는 샘플에 대해 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "Tw03-MK1cYId" - }, - "outputs": [], - "source": [ - "test_accuracy = tfe.metrics.Accuracy()\n", - "\n", - "for (x, y) in test_dataset:\n", - " logits = model(x)\n", - " prediction = tf.argmax(logits, axis=1, output_type=tf.int32)\n", - " test_accuracy(prediction, y)\n", - "\n", - "print(\"테스트 세트 정확도: {:.3%}\".format(test_accuracy.result()))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "HcKEZMtCOeK-" - }, - "source": [ - "마지막 배치에서 모델이 올바르게 예측한 것을 확인할 수 있습니다. " - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "uNwt2eMeOane" - }, - "outputs": [], - "source": [ - "tf.stack([y,prediction],axis=1)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "7Li2r1tYvW7S" - }, - "source": [ - "## 훈련된 모델로 예측하기\n", - "\n", - "이제 붓꽃을 분류하기 위해 완벽하지는 않지만 어느 정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", - "\n", - "실제로는 레이블 되지 않은 샘플들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블 되지 않은 샘플을 제공하겠습니다. 레이블은 다음과 같은 붓꽃 이름으로 매핑되어있습니다.\n", - "* `0`: Iris setosa\n", - "* `1`: Iris versicolor\n", - "* `2`: Iris virginica" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "kesTS5Lzv-M2" - }, - "outputs": [], - "source": [ - "predict_dataset = tf.convert_to_tensor([\n", - " [5.1, 3.3, 1.7, 0.5,],\n", - " [5.9, 3.0, 4.2, 1.5,],\n", - " [6.9, 3.1, 5.4, 2.1]\n", - "])\n", - "\n", - "predictions = model(predict_dataset)\n", - "\n", - "for i, logits in enumerate(predictions):\n", - " class_idx = tf.argmax(logits).numpy()\n", - " p = tf.nn.softmax(logits)[class_idx]\n", - " name = class_names[class_idx]\n", - " print(\"예 {} 예측: {} ({:4.1f}%)\".format(i, name, 100*p))" - ] - } - ], - "metadata": { - "colab": { - "collapsed_sections": [], - "name": "custom_training_walkthrough", - "private_outputs": true, - "provenance": [], - "toc_visible": true, - "version": "0.3.2" - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} + "nbformat": 4, + "nbformat_minor": 0, + "metadata": { + "colab": { + "name": "custom_training_walkthrough", + "version": "0.3.2", + "provenance": [], + "private_outputs": true, + "collapsed_sections": [], + "toc_visible": true + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.7.1" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + } + }, + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "rwxGnsA92emp" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "form", + "colab_type": "code", + "id": "CPII1rGR2rF9", + "colab": {} + }, + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "JtEZ1pCPn--z" + }, + "source": [ + "# 사용자 정의 학습: 자세히 둘러보기" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "GV1F7tVTN3Dn" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " TensorFlow.org에서 보기\n", + " \n", + " 구글 코랩(Colab)에서 실행하기\n", + " \n", + " 깃허브(GitHub) 소스 보기\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "64VL9OukxoUc", + "colab_type": "text" + }, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 참여하려면\n", + "[docs-ko@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs-ko)로\n", + "메일을 보내주시기 바랍니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "LDrzLFXE8T1l" + }, + "source": [ + "이번 튜토리얼은 붓꽃의 품종을 분류하기 위한 머신러닝 모델을 구축할 것입니다. 다음을 위해 즉시 실행[(eager execution)](https://www.tensorflow.org/guide/eager)을 사용합니다.\n", + "1. 모델 구축\n", + "2. 모델 훈련\n", + "3. 예측을 위한 모델 사용\n", + "\n", + "## 텐서플로 프로그래밍\n", + "\n", + "이번 튜토리얼에서는 다음과 같은 고수준 텐서플로의 개념을 사용합니다.\n", + "\n", + "* [즉시 실행(eager execution)](https://www.tensorflow.org/guide/eager) 개발 환경,\n", + "* [데이터셋 API](https://www.tensorflow.org/guide/datasets)를 활용한 데이터 가져오기,\n", + "* [케라스 API](https://keras.io/getting-started/sequential-model-guide/)를 활용한 모델과 층(layer) 구축 .\n", + "\n", + "이번 튜토리얼은 다른 텐서플로 프로그램과 유사하게 구성되어있습니다.\n", + "\n", + "1. 데이터 가져오기 및 분석.\n", + "2. 모델 타입 선정.\n", + "3. 모델 훈련.\n", + "4. 모델 효과 평가.\n", + "5. 예측을 위한 훈련된 모델 사용." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "yNr7H-AIoLOR" + }, + "source": [ + "## 프로그램 설정" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "1J3AuPBT9gyR" + }, + "source": [ + "### 임포트 및 즉시 실행 구성\n", + "\n", + "텐서플로를 포함하여 필요한 파이썬 모듈을 임포트하고, 즉시 실행을 활성화합니다. 즉시 실행은 텐서플로 연산이 나중에 실행되는 [계산 그래프(computational graph)](https://www.tensorflow.org/guide/graphs)를 만드는 대신에 연산을 즉시 평가하고 구체적인 값을 반환하게 합니다. 만약 파이썬 대화형 창이나 상호작용 콘솔을 사용하시면 더욱 익숙할 겁니다. 즉시 실행은 [Tensorlow >=1.8](https://www.tensorflow.org/install/) 부터 사용 가능합니다.\n", + "\n", + "즉시 실행이 활성화될 때, 동일한 프로그램내에서 비활성화 할 수 없습니다. 더 많은 세부사항은 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 참조하세요." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "g4Wzg69bnwK2", + "colab": {} + }, + "source": [ + "from __future__ import absolute_import, division, print_function, unicode_literals\n", + "\n", + "import os\n", + "import matplotlib.pyplot as plt\n", + "\n", + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()\n", + "\n", + "print(\"텐서플로 버전: {}\".format(tf.__version__))\n", + "print(\"즉시 실행: {}\".format(tf.executing_eagerly()))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Zx7wc0LuuxaJ" + }, + "source": [ + "## 붓꽃 분류 문제\n", + "\n", + "당신이 식물학자라고 상상하고, 주어진 붓꽃을 자동적으로 분류하는 방법을 찾고 있다고 가정합시다. 머신러닝은 통계적으로 꽃을 분류할 수 있는 다양한 알고리즘을 제공합니다. 예를 들어, 정교한 머신러닝 프로그램은 사진을 통해 꽃을 분류할 수 있습니다. 이번 튜토리얼의 목적은 좀 더 겸손하게, 측정된 [꽃받침](https://en.wikipedia.org/wiki/Sepal)과 [꽃잎](https://en.wikipedia.org/wiki/Petal)의 길이와 폭을 토대로 붓꽃을 분류하는 것입니다.\n", + "\n", + "이 붓꽃은 약 300종입니다. 하지만 이번 튜토리얼에서는 오직 3가지 품종을 기준으로 분류할 것입니다. \n", + "\n", + "* Iris setosa\n", + "* Iris virginica\n", + "* Iris versicolor\n", + "\n", + "\n", + " \n", + " \n", + "
\n", + " \"Petal\n", + "
\n", + " 그림 1. Iris setosa (by Radomil, CC BY-SA 3.0), Iris versicolor, (by Dlanglois, CC BY-SA 3.0), and Iris virginica (by Frank Mayfield, CC BY-SA 2.0).
 \n", + "
\n", + "\n", + "다행히도 다른 사람들이 먼저 꽃받침과 꽃잎의 길이와 폭이 측정된 [120개의 붓꽃 데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)를 만들어 놓았습니다. 이것은 머신러닝 분류 문제에 있어 초보자에게 유명한 고전 데이터셋입니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "3Px6KAg0Jowz" + }, + "source": [ + "## 훈련 데이터 가져오기 및 파싱\n", + "\n", + "데이터를 불러오고 파이썬 프로그램이 사용할 수 있는 구조로 전환합니다.\n", + "\n", + "### 데이터셋 다운로드\n", + "\n", + "[tf.keras.utils.get_file](https://www.tensorflow.org/api_docs/python/tf/keras/utils/get_file) 함수를 사용하여 데이터셋을 다운로드합니다. 이 함수는 다운로드된 파일의 경로를 반환합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "J6c7uEU9rjRM", + "colab": {} + }, + "source": [ + "train_dataset_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv\"\n", + "\n", + "train_dataset_fp = tf.keras.utils.get_file(fname=os.path.basename(train_dataset_url),\n", + " origin=train_dataset_url)\n", + "\n", + "print(\"데이터셋이 복사된 위치: {}\".format(train_dataset_fp))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "qnX1-aLors4S" + }, + "source": [ + "### 데이터 탐색\n", + "\n", + "이 데이터셋(`iris_training.csv`)은 콤마 ','로 구분된 CSV 파일입니다. `head -n5` 명령을 사용하여 처음 5개 항목을 확인합니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "FQvb_JYdrpPm", + "colab": {} + }, + "source": [ + "!head -n5 {train_dataset_fp}" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "kQhzD6P-uBoq" + }, + "source": [ + "처음 5개의 데이터로부터 다음을 주목하세요.\n", + "\n", + "1. 첫 번째 줄은 다음과 같은 정보를 포함하고 있는 헤더(header)입니다. \n", + " * 총 120개의 샘플이 있으며, 각 샘플들은 4개의 특성(feature), 3개의 레이블(label)을 가지고 있습니다.\n", + "2. 후속행은 데이터 레코드입니다. 한 줄당 한가지 *[샘플](https://developers.google.com/machine-learning/glossary/#example)*입니다.\n", + " * 처음 4개의 필드는 *[특성](https://developers.google.com/machine-learning/glossary/#feature)*입니다.: 이것들은 샘플의 특징을 나타냅니다. 이 필드들는 붓꽃의 측정값을 부동소수점으로 나타냅니다.\n", + " * 마지막 컬럼(column)은 *[레이블(label)](https://developers.google.com/machine-learning/glossary/#label)*입니다.: 레이블은 예측하고자 하는 값을 나타냅니다. 이 데이터셋에서는 꽃의 이름과 관련된 정수값 0, 1, 2를 나타냅니다.\n", + "\n", + "코드로 표현하면 다음과 같습니다.:" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "9Edhevw7exl6", + "colab": {} + }, + "source": [ + "# CSV 파일안에서 컬럼의 순서\n", + "column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']\n", + "\n", + "feature_names = column_names[:-1]\n", + "label_name = column_names[-1]\n", + "\n", + "print(\"특성: {}\".format(feature_names))\n", + "print(\"레이블: {}\".format(label_name))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "CCtwLoJhhDNc" + }, + "source": [ + "각각의 레이블은 \"setosa\"와 같은 문자형 이름과 연관되어있습니다. 하지만 머신러닝은 전형적으로 숫자형 값에 의존합니다. 레이블을 다음과 같이 맵핑(mapping) 합니다. \n", + "\n", + "* `0`: Iris setosa\n", + "* `1`: Iris versicolor\n", + "* `2`: Iris virginica\n", + "\n", + "특성과 레이블에 관한 더 많은 정보를 위해서는 [머신러닝 특강의 전문용어 부분](https://developers.google.com/machine-learning/crash-course/framing/ml-terminology)을 참조하세요." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "sVNlJlUOhkoX", + "colab": {} + }, + "source": [ + "class_names = ['Iris setosa', 'Iris versicolor', 'Iris virginica']" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "dqPkQExM2Pwt" + }, + "source": [ + "### `tf.data.Dataset` 생성\n", + "\n", + "텐서플로의 [Dataset API](https://www.tensorflow.org/guide/datasets)는 데이터를 적재할 때 발생하는 다양한 경우를 다룰 수 있습니다. 이는 훈련에 필요한 형태로 데이터를 읽고 변환하는 고수준 API입니다. 더 많은 정보를 위해서는 [데이터셋 빠른 실행 가이드](https://www.tensorflow.org/get_started/datasets_quickstart)를 참조하세요. \n", + "\n", + "\n", + "데이터셋이 CSV 파일이므로, 적절한 형태로 데이터를 구분하기위해 [make_csv_dataset](https://www.tensorflow.org/api_docs/python/tf/contrib/data/make_csv_dataset) 함수를 사용하겠습니다. 이 함수는 훈련 모델을 위한 데이터를 생성하므로, 초기값은 셔플(`shuffle=True, shuffle_buffer_size=10000`)과 무한반복(`num_epochs=None`)으로 설정되어있습니다. 또한 [배치 사이즈(batch_size)](https://developers.google.com/machine-learning/glossary/#batch_size)를 설정해줍니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "WsxHnz1ebJ2S", + "colab": {} + }, + "source": [ + "batch_size = 32\n", + "\n", + "train_dataset = tf.contrib.data.make_csv_dataset(\n", + " train_dataset_fp,\n", + " batch_size, \n", + " column_names=column_names,\n", + " label_name=label_name,\n", + " num_epochs=1)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "gB_RSn62c-3G" + }, + "source": [ + "`make_csv_dataset` 함수는 `(features, label)` 쌍으로 구성된 `tf.data.Dataset`을 반환합니다. `features`는 딕셔너리 객체인: `{'feature_name': value}`로 주어집니다.\n", + "또한 즉시 실행 활성화로 이 `Dataset`은 반복가능합니다. 다음은 특성(feature)을 살펴봅시다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "iDuG94H-C122", + "colab": {} + }, + "source": [ + "features, labels = next(iter(train_dataset))\n", + "\n", + "features" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "E63mArnQaAGz" + }, + "source": [ + "유사한 특성의 값은 같이 그룹 되어있거나, *배치* 돼있다는 사실에 주목하세요. 각 샘플 행의 필드는 해당 특성 배열에 추가됩니다. `batch_size`를 조절하여 이 특성 배열에 저장된 샘플의 수를 설정하세요.\n", + "\n", + "또한 배치(batch)로부터 약간의 특성을 도식화하여 군집돼있는 데이터를 확인할 수 있습니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "me5Wn-9FcyyO", + "colab": {} + }, + "source": [ + "plt.scatter(features['petal_length'].numpy(),\n", + " features['sepal_length'].numpy(),\n", + " c=labels.numpy(),\n", + " cmap='viridis')\n", + "\n", + "plt.xlabel(\"petal length\")\n", + "plt.ylabel(\"sepal length\");" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "YlxpSyHlhT6M" + }, + "source": [ + "모델 구축 단계를 단순화하기 위해, 특성 딕셔너리를 `(batch_size, num_features)`의 형태를 가지는 단일 배열로 다시 구성하는 함수를 생성합니다.\n", + "\n", + "이 함수는 텐서의 리스트(list)로부터 값을 취하고 특정한 차원으로 결합된 텐서를 생성하는 [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack) 메서드(method)를 사용합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "jm932WINcaGU", + "colab": {} + }, + "source": [ + "def pack_features_vector(features, labels):\n", + " \"\"\"Pack the features into a single array.\"\"\"\n", + " features = tf.stack(list(features.values()), axis=1)\n", + " return features, labels" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "V1Vuph_eDl8x" + }, + "source": [ + "그 후 각 `(features,label)`쌍의 특성을 훈련 데이터셋에 쌓기위해 [tf.data.Dataset.map](https://www.tensorflow.org/api_docs/python/tf/data/dataset/map) 메서드를 사용합니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "ZbDkzGZIkpXf", + "colab": {} + }, + "source": [ + "train_dataset = train_dataset.map(pack_features_vector)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "NLy0Q1xCldVO" + }, + "source": [ + "데이터셋의 특성 요소는 이제 형태가 `(batch_size, num_features)`인 배열입니다. 첫 5개행의 샘플을 살펴봅시다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "kex9ibEek6Tr", + "colab": {} + }, + "source": [ + "features, labels = next(iter(train_dataset))\n", + "\n", + "print(features[:5])" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "LsaVrtNM3Tx5" + }, + "source": [ + "## 모델 타입 선정\n", + "\n", + "### 왜 모델을 사용해야하는가?\n", + "\n", + " *[모델](https://developers.google.com/machine-learning/crash-course/glossary#model)*은 특성(feature)과 레이블(label) 과의 관계입니다. 붓꽃 분류 문제에서 모델은 측정된 꽃받침과 꽃잎 사이의 관계를 정의하고 붓꽃의 품종을 예측합니다. 몇 가지 간단한 모델은 몇 줄의 대수학으로 표현할 수 있으나, 복잡한 머신러닝 모델은 요약하기 힘든 굉장히 많은 수의 매개변수를 가지고 있습니다.\n", + "\n", + "머신러닝을 사용하지 않고 4가지의 특성 사이의 관계를 결정하고 붓꽃을 품종을 예측하실 수 있으신가요? 즉, 특정 품종의 꽃받침과 꽃잎과의 관계를 정의할 수 있을 정도로 데이터셋을 분석했다면, 전통적인 프로그래밍 기술(예를 들어 굉장히 많은 조건문)을 사용하여 모델은 만들 수 있으신가요? 더 복잡한 데이터셋에서 이는 불가능에 가까울 수 있습니다. 잘 구성된 머신러닝은 사용자를 위한 모델을 결정합니다. 만약 충분히 좋은 샘플을 잘 구성된 머신러닝 모델에 제공한다면, 프로그램은 사용자를 위한 특성 간의 관계를 이해하고 제공합니다. \n", + "\n", + "### 모델 선정\n", + "\n", + "이제 학습을 위한 모델의 종류를 선정해야합니다. 여러 종류의 모델이 있고, 이를 선택하는 것은 많은 경험이 필요합니다. 이번 튜토리얼에서는 붓꽃 분류 문제를 해결하기위해 *[신경망(neural network)](https://developers.google.com/machine-learning/glossary/#neural_network)* 모델을 사용하겠습니다. 신경망 모델은 특성과 레이블 사이의 복잡한 관계를 찾을 수 있습니다. 신경망은 하나 또는 그 이상의 *[은닉층(hidden layer)](https://developers.google.com/machine-learning/glossary/#hidden_layer)*으로 구성된 그래프입니다. 각각의 은닉층은 하나 이상의 *[뉴런(neuron)](https://developers.google.com/machine-learning/glossary/#neuron)*으로 구성되어있습니다. 몇가지 신경망의 범주가 있으며, 이번 튜토리얼에서는 *[밀집(dense) 또는 완전 연결 신경망(fully-connected neural network)](https://developers.google.com/machine-learning/glossary/#fully_connected_layer)*를 사용합니다: 완전 연결 신경망(fully-connected neural network)은 하나의 뉴런에 이전층의 모든 뉴런의 입력을 받는 신경망입니다. 예를 들어, `그림 2`는 입력층, 2개의 은닉층, 그리고 출력층으로 구성된 완전 연결 신경망입니다. \n", + "\n", + "\n", + " \n", + " \n", + "
\n", + " \n", + "
\n", + " 그림 2. A neural network with features, hidden layers, and predictions.
 \n", + "
\n", + "\n", + "그림 2의 모델이 훈련된 다음 레이블 되어있지 않은 데이터를 제공했을때, 모델은 주어진 데이터의 3가지(주어진 레이블의 개수) 예측을 출력합니다. 이러한 예측은 *[추론(inference)](https://developers.google.com/machine-learning/crash-course/glossary#inference)*이라고 불립니다. 이 샘플에서 출력의 합은 1.0입니다. 그림 2에서 예측은 *Iris setosa* `0.02`, *Iris versicolor* `0.95`, *Iris virginica*에 `0.03`로 주어집니다. 이는 모델이 95%의 확률로 주어진 데이터를 *Iris versicolor*로 예측한다는 것을 의미합니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "W23DIMVPQEBt" + }, + "source": [ + "### 케라스를 사용한 모델 생성\n", + "\n", + "텐서플로의 [tf.keras](https://www.tensorflow.org/api_docs/python/tf/keras) API는 모델과 층을 생성하기 위한 풍부한 라이브러리를 제공합니다. 케라스가 구성 요소를 연결하기 위한 복잡함을 모두 처리해 주기 때문에 모델을 구축하고 실험하는 것이 쉽습니다.\n", + "\n", + "[tf.keras.Sequential](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential)은 여러 층을 연이어 쌓은 모델입니다. 이 구조는 층의 인스턴스를 취하며, 아래의 경우 각 층당 10개의 노드(node)를 가지는 2개의 [Dense(완전 연결 층)](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)과 3개의 예측(레이블의 수) 노드를 가지는 출력 층으로 구성되어있습니다. 첫 번째 층의 `input_shape` 매개변수는 데이터셋의 특성의 수와 관계있습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "2fZ6oL2ig3ZK", + "colab": {} + }, + "source": [ + "model = tf.keras.Sequential([\n", + " tf.keras.layers.Dense(10, activation=tf.nn.relu, input_shape=(4,)), # input shape required\n", + " tf.keras.layers.Dense(10, activation=tf.nn.relu),\n", + " tf.keras.layers.Dense(3)\n", + "])" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "FHcbEzMpxbHL" + }, + "source": [ + "*[활성화 함수(activation function)](https://developers.google.com/machine-learning/crash-course/glossary#activation_function)*는 각 층에서 출력의 크기를 결정합니다. 이러한 비선형성은 중요하며, 활성화 함수가 없는 모델은 하나의 층과 동일하다고 생각할 수 있습니다. 사용 가능한 [활성화 함수](https://www.tensorflow.org/api_docs/python/tf/keras/activations)는 많지만, [ReLU](https://developers.google.com/machine-learning/crash-course/glossary#ReLU)가 은닉층에 주로 사용됩니다. \n", + "\n", + "이상적인 은닉층과 뉴런의 개수는 문제와 데이터셋에 의해 좌우됩니다. 머신러닝의 여러 측면과 마찬가지로, 최적의 신경망 타입을 결정하는 것은 많은 경험과 지식이 필요합니다. 경험을 토대로 보면 은닉층과 뉴런의 증가는 전형적으로 강력한 모델을 생성하므로, 모델을 효과적으로 훈련시키기 위해서 더 많은 데이터를 필요로 합니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "2wFKnhWCpDSS" + }, + "source": [ + "### 모델 사용\n", + "\n", + "이 모델이 특성의 배치에 대해 수행하는 작업을 간단히 살펴봅시다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "xe6SQ5NrpB-I", + "colab": {} + }, + "source": [ + "predictions = model(features)\n", + "predictions[:5]" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "wxyXOhwVr5S3" + }, + "source": [ + "각 샘플은 각 클래스에 대한 [로짓(logit)](https://developers.google.com/machine-learning/crash-course/glossary#logits)을 반환합니다. \n", + "\n", + "이 로짓(logit)을 각 클래스에 대한 확률로 변환하기 위하서 [소프트맥스(softmax)](https://developers.google.com/machine-learning/crash-course/glossary#softmax) 함수를 사용하겠습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "_tRwHZmTNTX2", + "colab": {} + }, + "source": [ + "tf.nn.softmax(predictions[:5])" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "uRZmchElo481" + }, + "source": [ + "`tf.argmax`는 예측된 값 중 가장 큰 확률(원하는 클래스)을 반환합니다. 하지만 모델이 아직 훈련되지 않았으므로 이는 좋은 예측이 아닙니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "-Jzm_GoErz8B", + "colab": {} + }, + "source": [ + "print(\"예측: {}\".format(tf.argmax(predictions, axis=1)))\n", + "print(\" 레이블: {}\".format(labels))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Vzq2E5J2QMtw" + }, + "source": [ + "## 모델 훈련하기\n", + "\n", + "*[훈련 단계](https://developers.google.com/machine-learning/crash-course/glossary#training)*는 모델이 점진적으로 최적화되거나 데이터셋을 학습하는 머신러닝의 과정입니다. 훈련의 목적은 미지의 데이터를 예측하기 위해, 훈련 데이터셋의 구조에 대해서 충분히 학습하는 것입니다. 만약 모델이 훈련 데이터셋에 대해서 과하게 학습된다면 오직 훈련 데이터셋에 대해서 작동할 것이며, 일반화되기 힘들 것입니다. 이러한 문제를 *[과대적합(overfitting)](https://developers.google.com/machine-learning/crash-course/glossary#overfitting)* 이라고 합니다. 이는 마치 문제를 이해하고 해결한다기보다는 답을 기억하는 것이라고 생각할 수 있습니다. \n", + "\n", + "붓꽃 분류 문제는 *[지도 학습(supervised machine learning)](https://developers.google.com/machine-learning/glossary/#supervised_machine_learning)*의 예시 중 하나입니다.: 지도학습은 모델이 레이블을 포함한 훈련 데이터로부터 학습됩니다. *[비지도 학습(unsupervised machine learning)](https://developers.google.com/machine-learning/glossary/#unsupervised_machine_learning)*에서는 훈련 데이터가 레이블을 포함하고 있지 않습니다. 대신에 모델은 특성 간의 패턴을 찾습니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "RaKp8aEjKX6B" + }, + "source": [ + "### 손실 함수와 그래디언트 함수 정의하기\n", + "\n", + "훈련과 평가단계에서 모델의 *[손실(loss)](https://developers.google.com/machine-learning/crash-course/glossary#loss)*을 계산해야 합니다. 손실은 모델의 예측이 원하는 레이블과 얼마나 일치하는지, 또한 모델이 잘 작동하는지에 대한 척도로 사용됩니다. 이 값을 최소화하고, 최적화 해야합니다.\n", + "\n", + "모델의 손실은 [tf.keras.losses.categorical_crossentropy](https://www.tensorflow.org/api_docs/python/tf/losses/sparse_softmax_cross_entropy) 함수를 사용해 계산할 것입니다. 이 함수는 모델의 클래스(레이블)과 예측된 값(로짓)을 입력받아 샘플의 평균 손실을 반환합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "tMAT4DcMPwI-", + "colab": {} + }, + "source": [ + "def loss(model, x, y):\n", + " y_ = model(x)\n", + " return tf.losses.sparse_softmax_cross_entropy(labels=y, logits=y_)\n", + "\n", + "\n", + "l = loss(model, features, labels)\n", + "print(\"손실 테스트: {}\".format(l))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "3IcPqA24QM6B" + }, + "source": [ + "모델을 최적화하기 위해 사용되는 *[그래디언트(gradient)](https://developers.google.com/machine-learning/crash-course/glossary#gradient)*를 계산하기 위해 [tf.GradientTape](https://www.tensorflow.org/api_docs/python/tf/GradientTape) 컨텍스트를 사용합니다. 더 자세한 정보는 [즉시 실행 가이드](https://www.tensorflow.org/guide/eager)를 확인하세요. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "x57HcKWhKkei", + "colab": {} + }, + "source": [ + "def grad(model, inputs, targets):\n", + " with tf.GradientTape() as tape:\n", + " loss_value = loss(model, inputs, targets)\n", + " return loss_value, tape.gradient(loss_value, model.trainable_variables)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "lOxFimtlKruu" + }, + "source": [ + "### 옵티마이저 생성 \n", + "\n", + "*[옵티마이저(optimizer)](https://developers.google.com/machine-learning/crash-course/glossary#optimizer)*는 손실 함수를 최소화하기 위해 계산된 그래디언트를 모델의 변수에 적용합니다. 손실 함수를 구부러진 곡선의 표면(그림 3)으로 생각할 수 있으며, 이 함수의 최저점을 찾고자 합니다. 그래디언트는 가장 가파른 상승 방향을 가리키며 따라서 반대 방향으로 이동하는 여행을 합니다. 각 배치마다의 손실과 기울기를 반복적으로 계산하여 훈련과정 동안 모델을 조정합니다. 점진적으로, 모델은 손실을 최소화하기 위해 가중치(weight)와 편향(bias)의 최적의 조합을 찾아냅니다. 손실이 낮을수록 더 좋은 모델의 예측을 기대할 수 있습니다.\n", + "\n", + "\n", + " \n", + " \n", + "
\n", + " \"Optimization\n", + "
\n", + " 그림 3. 3차원 공간에 대한 최적화 알고리즘 시각화.
(Source: Stanford class CS231n, MIT License, Image credit: Alec Radford)\n", + "
\n", + "\n", + "텐서플로는 훈련을 위해 사용 가능한 여러종류의 [최적화 알고리즘](https://www.tensorflow.org/api_guides/python/train)을 가지고 있습니다. 이번 모델에서는 *[확률적 경사 하강법(stochastic gradient descent, SGD)](https://developers.google.com/machine-learning/crash-course/glossary#gradient_descent)* 을 구현한 [tf.train.GradientDescentOptimizer](https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer)를 사용하겠습니다. `learning_rate`은 경사하강 과정의 크기를 나타내는 매개변수이며, 더 나은 결과를 위해 조절가능한 *하이퍼파라미터(hyperparameter)* 입니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "XkUd6UiZa_dF" + }, + "source": [ + "옵티마이저(optimizer)와 `global_step`을 설정합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "8xxi2NNGKwG_", + "colab": {} + }, + "source": [ + "optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)\n", + "\n", + "global_step = tf.contrib.eager.Variable(0)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "pJVRZ0hP52ZB" + }, + "source": [ + "이 값들을 단일 최적화 단계를 계산하기 위해 사용합니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "rxRNTFVe56RG", + "colab": {} + }, + "source": [ + "loss_value, grads = grad(model, features, labels)\n", + "\n", + "print(\"단계: {}, 초기 손실: {}\".format(global_step.numpy(),\n", + " loss_value.numpy()))\n", + "\n", + "optimizer.apply_gradients(zip(grads, model.trainable_variables), global_step)\n", + "\n", + "print(\"단계: {}, 손실: {}\".format(global_step.numpy(),\n", + " loss(model, features, labels).numpy()))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "7Y2VSELvwAvW" + }, + "source": [ + "### 훈련 루프\n", + "\n", + "모든 사항이 갖춰졌으므로 모델을 훈련할 준비가 되었습니다! 훈련 루프는 더 좋은 예측을 위해 데이터셋을 모델로 제공합니다. 다음의 코드 블럭은 아래의 훈련 단계를 작성한 것입니다. \n", + "\n", + "1. 각 *에포크(epoch)* 반복. 에포크는 데이터셋을 통과시키는 횟수입니다. \n", + "2. 에포크 내에서, *특성* (`x`)와 *레이블* (`y`)가 포함된 훈련 `데이터셋`에 있는 샘플을 반복합니다.\n", + "3. 샘플의 특성을 사용하여 결과를 예측 하고 레이블과 비교합니다. 예측의 부정확도를 측정하고 모델의 손실과 그래디언트를 계산하기 위해 사용합니다. \n", + "4. 모델의 변수를 업데이트하기 위해 `옵티마이저`를 사용합니다. \n", + "5. 시각화를 위해 몇가지 값들을 저장합니다.\n", + "6. 각 에포크를 반복합니다.\n", + "\n", + "`num_epochs` 변수는 데이터셋의 반복 횟수입니다. 직관과는 반대로, 모델을 길게 학습하는 것이 더 나은 모델이 될 것이라고 보장하지 못합니다. `num_epochs`는 조정가능한 *[하이퍼파라미터(hyperparameter)](https://developers.google.com/machine-learning/glossary/#hyperparameter)* 입니다. 적절한 횟수를 선택하는 것은 많은 경험과 직관을 필요로 합니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "AIgulGRUhpto", + "colab": {} + }, + "source": [ + "## Note: 이 셀을 다시 실행하면 동일한 모델의 변수가 사용됩니다.\n", + "\n", + "from tensorflow import contrib\n", + "tfe = contrib.eager\n", + "\n", + "# 도식화를 위해 결과를 저장합니다.\n", + "train_loss_results = []\n", + "train_accuracy_results = []\n", + "\n", + "num_epochs = 201\n", + "\n", + "for epoch in range(num_epochs):\n", + " epoch_loss_avg = tfe.metrics.Mean()\n", + " epoch_accuracy = tfe.metrics.Accuracy()\n", + "\n", + " # 훈련 루프 - 32개의 배치를 사용합니다.\n", + " for x, y in train_dataset:\n", + " # 모델을 최적화합니다.\n", + " loss_value, grads = grad(model, x, y)\n", + " optimizer.apply_gradients(zip(grads, model.trainable_variables),\n", + " global_step)\n", + "\n", + " # 진행 상황을 추적합니다.\n", + " epoch_loss_avg(loss_value) # 현재 배치 손실을 추가합니다.\n", + " # 예측된 레이블과 실제 레이블 비교합니다.\n", + " epoch_accuracy(tf.argmax(model(x), axis=1, output_type=tf.int32), y)\n", + "\n", + " # epoch 종료\n", + " train_loss_results.append(epoch_loss_avg.result())\n", + " train_accuracy_results.append(epoch_accuracy.result())\n", + " \n", + " if epoch % 50 == 0:\n", + " print(\"에포크 {:03d}: 손실: {:.3f}, 정확도: {:.3%}\".format(epoch, \n", + " epoch_loss_avg.result(), \n", + " epoch_accuracy.result()))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "2FQHVUnm_rjw" + }, + "source": [ + "### 시간에 따른 손실함수 시각화" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "j3wdbmtLVTyr" + }, + "source": [ + "모델의 훈련 과정을 출력하는 것도 도움이 되지만, 훈련 과정을 직접 보는 것이 더 도움이 되곤합니다. [텐서보드(tensorboard)](https://www.tensorflow.org/guide/summaries_and_tensorboard)는 텐서플로에 패키지 되어있는 굉장히 유용한 시각화 툴입니다. 하지만 `matplotlib` 모듈을 사용하여 일반적인 도표를 출력할 수 있습니다.\n", + "\n", + "이 도표를 해석하는 것은 여러 경험이 필요하지만, 결국 모델을 최적화하기 위해 *손실*이 내려가고 *정확도*가 올라가는 것을 원합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "agjvNd2iUGFn", + "colab": {} + }, + "source": [ + "fig, axes = plt.subplots(2, sharex=True, figsize=(12, 8))\n", + "fig.suptitle('Training Metrics')\n", + "\n", + "axes[0].set_ylabel(\"loss\", fontsize=14)\n", + "axes[0].plot(train_loss_results)\n", + "\n", + "axes[1].set_ylabel(\"Accuracy\", fontsize=14)\n", + "axes[1].set_xlabel(\"epoch\", fontsize=14)\n", + "axes[1].plot(train_accuracy_results);" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Zg8GoMZhLpGH" + }, + "source": [ + "## 모델 유효성 평가\n", + "\n", + "이제 모델은 훈련되었습니다. 모델의 성능에 대한 몇가지 통계를 얻을 수 있습니다. \n", + "\n", + "*평가(Evaluating)*는 모델이 예측을 얼마나 효과적으로 수행하는지 결정하는 것을 의미합니다. 붓꽃 분류 모델의 유효성을 결정하기 위해, 몇가지 꽃잎과 꽃받침 데이터를 통과시키고 어떠한 품종을 예측하는지 확인합니다. 그 후 실제 품종과 비교합니다. 예를 들어, 절반의 데이터를 올바르게 예측한 모델의 *[정확도](https://developers.google.com/machine-learning/glossary/#accuracy)* 는 `0.5`입니다. 그림 4는 조금 더 효과적인 모델입니다. 5개의 예측 중 4개를 올바르게 예측하여 80% 정확도를 냅니다.\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
샘플 특성레이블모델 예측
5.93.04.31.511
6.93.15.42.122
5.13.31.70.500
6.0 3.4 4.5 1.6 12
5.52.54.01.311
\n", + " 그림 4. 80% 정확도 붓꽃 분류기.
 \n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "z-EvK7hGL0d8" + }, + "source": [ + "### 테스트 데이터 세트 설정\n", + "\n", + "모델을 평가하는 것은 모델을 훈련하는 것과 유사합니다. 가장 큰 차이는 훈련 데이터가 아닌 *[테스트 데이터 세트](https://developers.google.com/machine-learning/crash-course/glossary#test_set)* 를 사용했다는 것입니다. 공정하게 모델의 유효성을 평가하기 위해, 모델을 평가하기 위한 샘플은 반드시 훈련 데이터와 달라야합니다. \n", + "\n", + "테스트 데이터 세트를 설정하는 것은 훈련 데이터 세트를 설정하는 것과 유사합니다. CSV 파일을 다운로드하고 값을 파싱합니다. 그 후 셔플은 적용하지 않습니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "Ps3_9dJ3Lodk", + "colab": {} + }, + "source": [ + "test_url = \"https://storage.googleapis.com/download.tensorflow.org/data/iris_test.csv\"\n", + "\n", + "test_fp = tf.keras.utils.get_file(fname=os.path.basename(test_url),\n", + " origin=test_url)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "SRMWCu30bnxH", + "colab": {} + }, + "source": [ + "test_dataset = tf.contrib.data.make_csv_dataset(\n", + " test_fp,\n", + " batch_size, \n", + " column_names=column_names,\n", + " label_name='species',\n", + " num_epochs=1,\n", + " shuffle=False)\n", + "\n", + "test_dataset = test_dataset.map(pack_features_vector)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "HFuOKXJdMAdm" + }, + "source": [ + "### 테스트 데이터 세트를 사용한 모델 평가\n", + "\n", + "훈련 단계와는 다르게 모델은 테스트 데이터에 대해서 오직 한 번의 [에포크](https://developers.google.com/machine-learning/glossary/#epoch)를 진행합니다. 다음의 코드 셀은 테스트 셋에 있는 샘플에 대해 실행하고 실제 레이블과 비교합니다. 이는 전체 테스트 데이터 세트에 대한 정확도를 측정하는데 사용됩니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "Tw03-MK1cYId", + "colab": {} + }, + "source": [ + "test_accuracy = tfe.metrics.Accuracy()\n", + "\n", + "for (x, y) in test_dataset:\n", + " logits = model(x)\n", + " prediction = tf.argmax(logits, axis=1, output_type=tf.int32)\n", + " test_accuracy(prediction, y)\n", + "\n", + "print(\"테스트 세트 정확도: {:.3%}\".format(test_accuracy.result()))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "HcKEZMtCOeK-" + }, + "source": [ + "마지막 배치에서 모델이 올바르게 예측한 것을 확인할 수 있습니다. " + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "uNwt2eMeOane", + "colab": {} + }, + "source": [ + "tf.stack([y,prediction],axis=1)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "7Li2r1tYvW7S" + }, + "source": [ + "## 훈련된 모델로 예측하기\n", + "\n", + "이제 붓꽃을 분류하기 위해 완벽하지는 않지만 어느 정도 검증된 모델을 가지고 있습니다. 훈련된 모델을 사용하여 [레이블 되지 않은 데이터](https://developers.google.com/machine-learning/glossary/#unlabeled_example)를 예측해봅시다.\n", + "\n", + "실제로는 레이블 되지 않은 샘플들은 여러 소스(앱, CSV 파일, 직접 제공 등)로부터 제공될 수 있습니다. 지금은 레이블을 예측하기 위해 수동으로 3개의 레이블 되지 않은 샘플을 제공하겠습니다. 레이블은 다음과 같은 붓꽃 이름으로 매핑되어있습니다.\n", + "* `0`: Iris setosa\n", + "* `1`: Iris versicolor\n", + "* `2`: Iris virginica" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "kesTS5Lzv-M2", + "colab": {} + }, + "source": [ + "predict_dataset = tf.convert_to_tensor([\n", + " [5.1, 3.3, 1.7, 0.5,],\n", + " [5.9, 3.0, 4.2, 1.5,],\n", + " [6.9, 3.1, 5.4, 2.1]\n", + "])\n", + "\n", + "predictions = model(predict_dataset)\n", + "\n", + "for i, logits in enumerate(predictions):\n", + " class_idx = tf.argmax(logits).numpy()\n", + " p = tf.nn.softmax(logits)[class_idx]\n", + " name = class_names[class_idx]\n", + " print(\"예 {} 예측: {} ({:4.1f}%)\".format(i, name, 100*p))" + ], + "execution_count": 0, + "outputs": [] + } + ] +} \ No newline at end of file diff --git a/site/ko/tutorials/eager/eager_basics.ipynb b/site/ko/tutorials/eager/eager_basics.ipynb index f70825fafd5..cdac5909049 100644 --- a/site/ko/tutorials/eager/eager_basics.ipynb +++ b/site/ko/tutorials/eager/eager_basics.ipynb @@ -1,492 +1,483 @@ { - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "iPpI7RaYoZuE" - }, - "source": [ - "##### Copyright 2018 The TensorFlow Authors." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "form", - "colab": {}, - "colab_type": "code", - "id": "hro2InpHobKk" - }, - "outputs": [], - "source": [ - "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", - "# you may not use this file except in compliance with the License.\n", - "# You may obtain a copy of the License at\n", - "#\n", - "# https://www.apache.org/licenses/LICENSE-2.0\n", - "#\n", - "# Unless required by applicable law or agreed to in writing, software\n", - "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", - "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", - "# See the License for the specific language governing permissions and\n", - "# limitations under the License." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "U9i2Dsh-ziXr" - }, - "source": [ - "# 즉시 실행 기초" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Hndw-YcxoOJK" - }, - "source": [ - "\n", - " \n", - " \n", - " \n", - "
\n", - " TensorFlow.org에서 보기\n", - " \n", - " 구글 코랩(Colab)에서 실행하기\n", - " \n", - " 깃허브(GitHub) 소스 보기\n", - "
" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", - "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", - "이 번역에 개선할 부분이 있다면\n", - "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", - "문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을\n", - "작성하거나\n", - "[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로\n", - "메일을 보내주시기 바랍니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "6sILUVbHoSgH" - }, - "source": [ - "이 노트북은 텐서플로를 사용하기 위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", - "\n", - "* 필요한 패키지 임포트\n", - "* 텐서(Tensor) 생성 및 사용\n", - "* GPU 가속기 사용\n", - "* 데이터 세트" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "z1JcS5iBXMRO" - }, - "source": [ - "## 텐서플로 임포트\n", - "\n", - "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시 실행(eager execution)을 활성화합니다. 즉시 실행 활성화로 텐서플로를 조금 더 대화형 프론트엔드(frontend)에 가깝게 만들어 줍니다. 세부사항은 나중에 이야기할 것입니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "code", - "colab": {}, - "colab_type": "code", - "id": "RlIWhyeLoYnG" - }, - "outputs": [], - "source": [ - "from __future__ import absolute_import, division, print_function\n", - "\n", - "import tensorflow as tf\n", - "\n", - "tf.enable_eager_execution()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "H9UySOPLXdaw" - }, - "source": [ - "## 텐서\n", - "\n", - "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기 메모리에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 변환합니다. 예를 들어:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "cellView": "code", - "colab": {}, - "colab_type": "code", - "id": "ngUe237Wt48W" - }, - "outputs": [], - "source": [ - "print(tf.add(1, 2))\n", - "print(tf.add([1, 2], [3, 4]))\n", - "print(tf.square(5))\n", - "print(tf.reduce_sum([1, 2, 3]))\n", - "print(tf.encode_base64(\"hello world\"))\n", - "\n", - "# 연산자의 오버로딩(overloding) 또한 지원합니다.\n", - "print(tf.square(2) + tf.square(3))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "IDY4WsYRhP81" - }, - "source": [ - "각각의 텐서는 크기와 데이터 타입을 가지고 있습니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "srYWH1MdJNG7" - }, - "outputs": [], - "source": [ - "x = tf.matmul([[1]], [[2, 3]])\n", - "print(x.shape)\n", - "print(x.dtype)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "eBPw8e8vrsom" - }, - "source": [ - "넘파이 배열과 텐서플로 텐서의 가장 확연한 차이는 다음과 같습니다:\n", - "\n", - "1. `텐서`는 가속기 메모리(GPU, TPU와 같은)에서 사용할 수 있습니다.\n", - "2. `텐서`는 불변성(immutable)을 가집니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "Dwi1tdW3JBw6" - }, - "source": [ - "### 넘파이 호환성\n", - "\n", - "텐서와 넘파이 배열 사이의 변환은 다소 간단합니다.\n", - "\n", - "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 변환합니다.\n", - "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 변환합니다.\n", - "\n", - "텐서는 `.numpy()` 메서드(method)를 호출하여 넘파이 배열로 변환할 수 있습니다.\n", - "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 변환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 저장되므로, 이러한 변환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 필요합니다." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "lCUWzso6mbqR" - }, - "outputs": [], - "source": [ - "import numpy as np\n", - "\n", - "ndarray = np.ones([3, 3])\n", - "\n", - "print(\"텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 변환합니다.\")\n", - "tensor = tf.multiply(ndarray, 42)\n", - "print(tensor)\n", - "\n", - "\n", - "print(\"그리고 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 변환합니다.\")\n", - "print(np.add(tensor, 1))\n", - "\n", - "print(\".numpy() 메서드는 텐서를 넘파이 배열로 변환합니다.\")\n", - "print(tensor.numpy())" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "PBNP8yTRfu_X" - }, - "source": [ - "## GPU 가속기\n", - "\n", - "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 텐서를 CPU 와 GPU에 복사합니다.) 연산에 의해 생성된 텐서는 전형적으로 연산이 실행된 장치의 메모리에 의해 실행됩니다. 예를 들어:" - ] + "nbformat": 4, + "nbformat_minor": 0, + "metadata": { + "colab": { + "name": "eager_basics.ipynb", + "version": "0.3.2", + "provenance": [], + "private_outputs": true, + "collapsed_sections": [], + "toc_visible": true + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.7.1" + }, + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + } }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": { - "cellView": "code", - "colab": {}, - "colab_type": "code", - "id": "3Twf_Rw-gQFM" - }, - "outputs": [ + "cells": [ + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "iPpI7RaYoZuE" + }, + "source": [ + "##### Copyright 2018 The TensorFlow Authors." + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "form", + "colab_type": "code", + "id": "hro2InpHobKk", + "colab": {} + }, + "source": [ + "#@title Licensed under the Apache License, Version 2.0 (the \"License\");\n", + "# you may not use this file except in compliance with the License.\n", + "# You may obtain a copy of the License at\n", + "#\n", + "# https://www.apache.org/licenses/LICENSE-2.0\n", + "#\n", + "# Unless required by applicable law or agreed to in writing, software\n", + "# distributed under the License is distributed on an \"AS IS\" BASIS,\n", + "# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n", + "# See the License for the specific language governing permissions and\n", + "# limitations under the License." + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "U9i2Dsh-ziXr" + }, + "source": [ + "# 즉시 실행 기초" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Hndw-YcxoOJK" + }, + "source": [ + "\n", + " \n", + " \n", + " \n", + "
\n", + " TensorFlow.org에서 보기\n", + " \n", + " 구글 코랩(Colab)에서 실행하기\n", + " \n", + " 깃허브(GitHub) 소스 보기\n", + "
" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "D3iRBJ-xxfU3", + "colab_type": "text" + }, + "source": [ + "Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도\n", + "불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다.\n", + "이 번역에 개선할 부분이 있다면\n", + "[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다.\n", + "문서 번역이나 리뷰에 참여하려면\n", + "[docs-ko@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs-ko)로\n", + "메일을 보내주시기 바랍니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "6sILUVbHoSgH" + }, + "source": [ + "이 노트북은 텐서플로를 사용하기 위한 입문 튜토리얼입니다. 다음 내용을 다룹니다 : \n", + "\n", + "* 필요한 패키지 임포트\n", + "* 텐서(Tensor) 생성 및 사용\n", + "* GPU 가속기 사용\n", + "* 데이터 세트" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "z1JcS5iBXMRO" + }, + "source": [ + "## 텐서플로 임포트\n", + "\n", + "시작하기 위해서 텐서플로 모듈을 임포트하고 즉시 실행(eager execution)을 활성화합니다. 즉시 실행 활성화로 텐서플로를 조금 더 대화형 프론트엔드(frontend)에 가깝게 만들어 줍니다. 세부사항은 나중에 이야기할 것입니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "code", + "colab_type": "code", + "id": "RlIWhyeLoYnG", + "colab": {} + }, + "source": [ + "from __future__ import absolute_import, division, print_function\n", + "\n", + "import tensorflow as tf\n", + "\n", + "tf.enable_eager_execution()" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "H9UySOPLXdaw" + }, + "source": [ + "## 텐서\n", + "\n", + "텐서는 다차원 배열입니다. 넘파이(NumPy) `ndarray` 객체와 비슷하며, `Tensor` 객체는 데이터 타입과 크기를 가지고 있습니다. 또한 텐서는 GPU 같은 가속기 메모리에 상주할 수 있습니다. 텐서플로는 텐서를 생성하고 이용하는 풍부한 연산 라이브러리([tf.add](https://www.tensorflow.org/api_docs/python/tf/add), [tf.matmul](https://www.tensorflow.org/api_docs/python/tf/matmul), [tf.linalg.inv](https://www.tensorflow.org/api_docs/python/tf/linalg/inv) etc.)를 제공합니다. 이러한 연산자는 자동적으로 순수 파이썬 타입을 변환합니다. 예를 들어:\n" + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "code", + "colab_type": "code", + "id": "ngUe237Wt48W", + "colab": {} + }, + "source": [ + "print(tf.add(1, 2))\n", + "print(tf.add([1, 2], [3, 4]))\n", + "print(tf.square(5))\n", + "print(tf.reduce_sum([1, 2, 3]))\n", + "print(tf.encode_base64(\"hello world\"))\n", + "\n", + "# 연산자의 오버로딩(overloding) 또한 지원합니다.\n", + "print(tf.square(2) + tf.square(3))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "IDY4WsYRhP81" + }, + "source": [ + "각각의 텐서는 크기와 데이터 타입을 가지고 있습니다." + ] + }, { - "name": "stdout", - "output_type": "stream", - "text": [ - "GPU를 사용가능한가 : \n", - "False\n", - "텐서가 GPU #0에 있는가 : \n", - "False\n" - ] + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "srYWH1MdJNG7", + "colab": {} + }, + "source": [ + "x = tf.matmul([[1]], [[2, 3]])\n", + "print(x.shape)\n", + "print(x.dtype)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "eBPw8e8vrsom" + }, + "source": [ + "넘파이 배열과 텐서플로 텐서의 가장 확연한 차이는 다음과 같습니다:\n", + "\n", + "1. `텐서`는 가속기 메모리(GPU, TPU와 같은)에서 사용할 수 있습니다.\n", + "2. `텐서`는 불변성(immutable)을 가집니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "Dwi1tdW3JBw6" + }, + "source": [ + "### 넘파이 호환성\n", + "\n", + "텐서와 넘파이 배열 사이의 변환은 다소 간단합니다.\n", + "\n", + "* 텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 변환합니다.\n", + "* 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 변환합니다.\n", + "\n", + "텐서는 `.numpy()` 메서드(method)를 호출하여 넘파이 배열로 변환할 수 있습니다.\n", + "가능한 경우, 텐서와 배열은 메모리 표현을 공유하기 때문에 이러한 변환은 일반적으로 간단(저렴)합니다. 그러나 텐서는 GPU 메모리에 저장될 수 있고, 넘파이 배열은 항상 호스트 메모리에 저장되므로, 이러한 변환이 항상 가능한 것은 아닙니다. 따라서 GPU에서 호스트 메모리로의 복사가 필요합니다." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "lCUWzso6mbqR", + "colab": {} + }, + "source": [ + "import numpy as np\n", + "\n", + "ndarray = np.ones([3, 3])\n", + "\n", + "print(\"텐서플로 연산은 자동적으로 넘파이 배열을 텐서로 변환합니다.\")\n", + "tensor = tf.multiply(ndarray, 42)\n", + "print(tensor)\n", + "\n", + "\n", + "print(\"그리고 넘파이 연산은 자동적으로 텐서를 넘파이 배열로 변환합니다.\")\n", + "print(np.add(tensor, 1))\n", + "\n", + "print(\".numpy() 메서드는 텐서를 넘파이 배열로 변환합니다.\")\n", + "print(tensor.numpy())" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "PBNP8yTRfu_X" + }, + "source": [ + "## GPU 가속기\n", + "\n", + "대부분의 텐서플로 연산은 GPU를 사용하여 가속화할 수 있습니다. 어떠한 주석(annotation)도 없이, 텐서플로는 연산을 위해 자동적으로 CPU 또는 GPU를 사용할 것인지를 정합니다(그리고 필요시 텐서를 CPU 와 GPU에 복사합니다.) 연산에 의해 생성된 텐서는 전형적으로 연산이 실행된 장치의 메모리에 의해 실행됩니다. 예를 들어:" + ] + }, + { + "cell_type": "code", + "metadata": { + "cellView": "code", + "colab_type": "code", + "id": "3Twf_Rw-gQFM", + "colab": {} + }, + "source": [ + "x = tf.random_uniform([3, 3])\n", + "\n", + "print(\"GPU 사용이 가능한가 : \"),\n", + "print(tf.test.is_gpu_available())\n", + "\n", + "print(\"텐서가 GPU #0에 있는가 : \"),\n", + "print(x.device.endswith('GPU:0'))" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vpgYzgVXW2Ud" + }, + "source": [ + "### 장치 이름\n", + "\n", + "`Tensor.device`는 텐서를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. 텐서가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:`으로 끝납니다." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "ZWZQCimzuqyP" + }, + "source": [ + "### 명시적 장치 배치\n", + "\n", + "텐서플로에서 \"배치(replacement)\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치) 하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을 경우 텐서플로는 연산을 실행하기 위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. \n", + "예를 들어:" + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "RjkNZTuauy-Q", + "colab": {} + }, + "source": [ + "import time\n", + "\n", + "def time_matmul(x):\n", + " start = time.time()\n", + " for loop in range(10):\n", + " tf.matmul(x, x)\n", + "\n", + " result = time.time()-start\n", + " \n", + " print(\"10 loops: {:0.2f}ms\".format(1000*result))\n", + "\n", + "\n", + "# CPU에서 강제실행합니다.\n", + "print(\"On CPU:\")\n", + "with tf.device(\"CPU:0\"):\n", + " x = tf.random_uniform([1000, 1000])\n", + " assert x.device.endswith(\"CPU:0\")\n", + " time_matmul(x)\n", + "\n", + "# GPU #0가 이용가능시 GPU #0에서 강제실행합니다.\n", + "if tf.test.is_gpu_available():\n", + " with tf.device(\"GPU:0\"): # 또는 GPU:1, GPU:2\n", + " x = tf.random_uniform([1000, 1000])\n", + " assert x.device.endswith(\"GPU:0\")\n", + " time_matmul(x)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "o1K4dlhhHtQj" + }, + "source": [ + "## 데이터셋\n", + "\n", + "이번 섹션에서는 모델에 데이터를 제공하기 위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", + "\n", + "* 데이터셋 생성.\n", + "* 즉시 실행 활성화를 통한 데이터셋 반복\n", + "\n", + "모델을 훈련시키고 평가 루프를 제공할 간단하고 재사용 가능한 모듈로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", + "\n", + "만약 텐서플로 그래프에 익숙하다면 알겠지만, 데이터셋 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 데이터셋의 요소를 반복하는 프로세스가 약간 더 간단해집니다.\n", + "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", + "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시 실행이 활성화될 때에는 신경 쓰지 않아도 됩니다. " + ] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "zI0fmOynH-Ne" + }, + "source": [ + "### 소스 Dataset 생성\n", + "\n", + "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)와 같은 팩토리(factory) 함수 중 하나를 사용하거나 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 소스 dataset을 생성하세요. 더 많은 정보를 위해서 [텐서플로 가이드](https://www.tensorflow.org/guide/datasets#reading_input_data)를 참조하세요." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "F04fVOHQIBiG", + "colab": {} + }, + "source": [ + "ds_tensors = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6])\n", + "\n", + "# CSV 파일을 생성합니다.\n", + "import tempfile\n", + "_, filename = tempfile.mkstemp()\n", + "\n", + "with open(filename, 'w') as f:\n", + " f.write(\"\"\"Line 1\n", + "Line 2\n", + "Line 3\n", + " \"\"\")\n", + "\n", + "ds_file = tf.data.TextLineDataset(filename)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "vbxIhC-5IPdf" + }, + "source": [ + "### 변환 적용\n", + "\n", + "[`맵(map)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`배치(batch)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`셔플(shuffle)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하여 데이터셋의 레코드에 적용하세요. 세부사항은 [tf.data.Dataset을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "uXSDZWE-ISsd", + "colab": {} + }, + "source": [ + "ds_tensors = ds_tensors.map(tf.square).shuffle(2).batch(2)\n", + "\n", + "ds_file = ds_file.batch(2)" + ], + "execution_count": 0, + "outputs": [] + }, + { + "cell_type": "markdown", + "metadata": { + "colab_type": "text", + "id": "A8X1GNfoIZKJ" + }, + "source": [ + "### 반복\n", + "\n", + "즉시 실행이 활성화되면 `Dataset` 객체는 반복이 가능합니다. 만약 텐서플로 그래프에서 데이터셋을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." + ] + }, + { + "cell_type": "code", + "metadata": { + "colab_type": "code", + "id": "ws-WKRk5Ic6-", + "colab": {} + }, + "source": [ + "print('ds_tensors 요소:')\n", + "for x in ds_tensors:\n", + " print(x)\n", + "\n", + "print('\\nds_file 요소:')\n", + "for x in ds_file:\n", + " print(x)" + ], + "execution_count": 0, + "outputs": [] } - ], - "source": [ - "x = tf.random_uniform([3, 3])\n", - "\n", - "print(\"GPU 사용이 가능한가 : \"),\n", - "print(tf.test.is_gpu_available())\n", - "\n", - "print(\"텐서가 GPU #0에 있는가 : \"),\n", - "print(x.device.endswith('GPU:0'))" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "vpgYzgVXW2Ud" - }, - "source": [ - "### 장치 이름\n", - "\n", - "`Tensor.device`는 텐서를 구성하고 있는 호스트 장치의 풀네임을 제공합니다. 이러한 이름은 프로그램이 실행중인 호스트의 네트워크 주소 및 해당 호스트 내의 장치와 같은 많은 세부 정보를 인코딩하며, 이것은 텐서플로 프로그램의 분산 실행에 필요합니다. 텐서가 호스트의 `N`번째 GPU에 놓여지면 문자열은 `GPU:`으로 끝납니다." - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "ZWZQCimzuqyP" - }, - "source": [ - "### 명시적 장치 배치\n", - "\n", - "텐서플로에서 \"배치(replacement)\"라는 용어는 개별 연산을 실행하기 위해 장치에 할당(배치) 하는 것입니다. 앞서 언급했듯이, 명시적 지침이 없을 경우 텐서플로는 연산을 실행하기 위한 장치를 자동으로 결정하고, 필요시 텐서를 장치에 복사합니다. 그러나 텐서플로 연산은 `tf.device`을 사용하여 특정한 장치에 명시적으로 배치할 수 있습니다. \n", - "예를 들어:" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "RjkNZTuauy-Q" - }, - "outputs": [], - "source": [ - "import time\n", - "\n", - "def time_matmul(x):\n", - " start = time.time()\n", - " for loop in range(10):\n", - " tf.matmul(x, x)\n", - "\n", - " result = time.time()-start\n", - " \n", - " print(\"10 loops: {:0.2f}ms\".format(1000*result))\n", - "\n", - "\n", - "# CPU에서 강제실행합니다.\n", - "print(\"On CPU:\")\n", - "with tf.device(\"CPU:0\"):\n", - " x = tf.random_uniform([1000, 1000])\n", - " assert x.device.endswith(\"CPU:0\")\n", - " time_matmul(x)\n", - "\n", - "# GPU #0가 이용가능시 GPU #0에서 강제실행합니다.\n", - "if tf.test.is_gpu_available():\n", - " with tf.device(\"GPU:0\"): # 또는 GPU:1, GPU:2\n", - " x = tf.random_uniform([1000, 1000])\n", - " assert x.device.endswith(\"GPU:0\")\n", - " time_matmul(x)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "o1K4dlhhHtQj" - }, - "source": [ - "## 데이터셋\n", - "\n", - "이번 섹션에서는 모델에 데이터를 제공하기 위한 파이프라인을 구축하기 위해 [`tf.data.Dataset` API](https://www.tensorflow.org/guide/datasets)를 시연해볼 것입니다. 이는 다음을 포함합니다.\n", - "\n", - "* 데이터셋 생성.\n", - "* 즉시 실행 활성화를 통한 데이터셋 반복\n", - "\n", - "모델을 훈련시키고 평가 루프를 제공할 간단하고 재사용 가능한 모듈로부터, 복잡한 입력 파이프라인을 구축하기위해 데이터셋 API를 사용하기를 권장합니다. \n", - "\n", - "만약 텐서플로 그래프에 익숙하다면 알겠지만, 데이터셋 객체를 생성하기 위한 API는 즉시 실행이 활성화 되어도 동일하게 유지됩니다. 하지만 데이터셋의 요소를 반복하는 프로세스가 약간 더 간단해집니다.\n", - "또한 `tf.data.Dataset` 객체를 통하여 파이썬 반복문을 사용할 수 있으며, 명시적으로 `tf.data.Iterator` 객체를 생성할 필요가 없습니다.\n", - "그 결과, [텐서플로 가이드](https://www.tensorflow.org/guide/datasets)의 반복자(iterator)에 관한 논의는 즉시 실행이 활성화될 때에는 신경 쓰지 않아도 됩니다. " - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "zI0fmOynH-Ne" - }, - "source": [ - "### 소스 Dataset 생성\n", - "\n", - "굉장히 유용한 함수중 하나인 [`Dataset.from_tensors`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensors), [`Dataset.from_tensor_slices`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_tensor_slices)와 같은 팩토리(factory) 함수 중 하나를 사용하거나 파일로부터 읽어들이는 객체인 [`TextLineDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TextLineDataset) 또는 [`TFRecordDataset`](https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset)를 사용하여 소스 dataset을 생성하세요. 더 많은 정보를 위해서 [텐서플로 가이드](https://www.tensorflow.org/guide/datasets#reading_input_data)를 참조하세요." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "F04fVOHQIBiG" - }, - "outputs": [], - "source": [ - "ds_tensors = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6])\n", - "\n", - "# CSV 파일을 생성합니다.\n", - "import tempfile\n", - "_, filename = tempfile.mkstemp()\n", - "\n", - "with open(filename, 'w') as f:\n", - " f.write(\"\"\"Line 1\n", - "Line 2\n", - "Line 3\n", - " \"\"\")\n", - "\n", - "ds_file = tf.data.TextLineDataset(filename)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "vbxIhC-5IPdf" - }, - "source": [ - "### 변환 적용\n", - "\n", - "[`맵(map)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#map), [`배치(batch)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch), [`셔플(shuffle)`](https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle)과 같은 변환 함수를 사용하여 데이터셋의 레코드에 적용하세요. 세부사항은 [tf.data.Dataset을 위한 API 문서](https://www.tensorflow.org/api_docs/python/tf/data/Dataset)을 참조하세요." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "uXSDZWE-ISsd" - }, - "outputs": [], - "source": [ - "ds_tensors = ds_tensors.map(tf.square).shuffle(2).batch(2)\n", - "\n", - "ds_file = ds_file.batch(2)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "colab_type": "text", - "id": "A8X1GNfoIZKJ" - }, - "source": [ - "### 반복\n", - "\n", - "즉시 실행이 활성화되면 `Dataset` 객체는 반복이 가능합니다. 만약 텐서플로 그래프에서 데이터셋을 사용하는게 익숙하다면, `Dataset.make_one_shot_iterator()` 또는 `get_next()`와 같은 객체를 호출할 필요가 없는다는 것에 주목하세요." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": {}, - "colab_type": "code", - "id": "ws-WKRk5Ic6-" - }, - "outputs": [], - "source": [ - "print('ds_tensors 요소:')\n", - "for x in ds_tensors:\n", - " print(x)\n", - "\n", - "print('\\nds_file 요소:')\n", - "for x in ds_file:\n", - " print(x)" - ] - } - ], - "metadata": { - "colab": { - "collapsed_sections": [], - "name": "eager_basics.ipynb", - "private_outputs": true, - "provenance": [], - "toc_visible": true, - "version": "0.3.2" - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} + ] +} \ No newline at end of file diff --git a/site/ko/tutorials/eager/index.md b/site/ko/tutorials/eager/index.md index 114fc16091b..6ed0038c81a 100644 --- a/site/ko/tutorials/eager/index.md +++ b/site/ko/tutorials/eager/index.md @@ -1,12 +1,10 @@ # 연구 및 실험 -이 문서들은 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도 -불구하고 [공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다. -이 번역에 개선할 부분이 있다면 -[tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 바랍니다. -문서 번역이나 리뷰에 지원하려면 [이 양식](https://bit.ly/tf-translate)을 -작성하거나 -[docs@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs)로 +Note: 이 문서들은 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도 불구하고 +[공식 영문 문서](https://www.tensorflow.org/?hl=en)의 내용과 일치하지 않을 수 있습니다. 이 번역에 개선할 부분이 +있다면 [tensorflow/docs](https://github.com/tensorflow/docs) 깃헙 저장소로 풀 리퀘스트를 보내주시기 +바랍니다. 문서 번역이나 리뷰에 참여하려면 +[docs-ko@tensorflow.org](https://groups.google.com/a/tensorflow.org/forum/#!forum/docs-ko)로 메일을 보내주시기 바랍니다. 즉시 실행(Eager execution)은 고급 연산을 위한 실행에 의해 정의되는 명령형 인터페이스를 제공합니다. @@ -18,4 +16,3 @@ 3. [사용자 정의 학습 : 기초](custom_training.ipynb) 4. [사용자 정의 층](custom_layers.ipynb) 5. [사용자 정의 학습 : 자세히 둘러보기](custom_training_walkthrough.ipynb) - From fd3ba6a879f73831b2ccee8aa0f10f3cedcd6b2d Mon Sep 17 00:00:00 2001 From: Billy Lamberta Date: Fri, 3 May 2019 10:48:27 -0700 Subject: [PATCH 19/19] Update en custom_trainging filename --- site/en/tutorials/eager/custom_training.ipynb | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/site/en/tutorials/eager/custom_training.ipynb b/site/en/tutorials/eager/custom_training.ipynb index 805ae3b2dcb..d47a426140a 100644 --- a/site/en/tutorials/eager/custom_training.ipynb +++ b/site/en/tutorials/eager/custom_training.ipynb @@ -415,7 +415,7 @@ "metadata": { "colab": { "collapsed_sections": [], - "name": "Custom training: basics", + "name": "custom_training.ipynb", "private_outputs": true, "provenance": [], "toc_visible": true,