출처 1 : http://pythonkim.tistory.com/7?category=573319
출처 2 : http://pythonkim.tistory.com/9?category=573319

# Linear Regression

#### 회귀분석
점들이 퍼져있는 형태에서 패턴을 찾아내고, 이 패턴을 활용해서 무언가를 예측하는 분석.
새로운 표본을 뽑을 때 평균으로 돌아가려는 특징이 있기 때문에 이러한 이름이 붙었다고 한다.

### Linear Regression
2차원 좌표에 분포된 데이터를 1차원 직선 방정식을 통해 표현되지 않은 데이터를 예측하기 위한 분석 모델.

### Hypothesis
Linear Regression에서 사용하는 1차원 방정식을 가리키는 용어로, 우리말로는 가설이라고 한다. 수식에는 h(x), H(x)로 표현된다.
H(x) = Wx + b 에서 Wx + b는 x에 대한 1차 방정식을 직선으로 표현한다는 것이고, 기울기에 해당하는 W(Weight)와 절편에 해당하는 b(bias)가 반복되는 과정에서 계속 바뀌고, 마지막 루프에서 바뀐 최종 값을 사용해서 데이터 예측(prediction)에 사용하게 된다. 최종 결과로 나온 가설을 모델(model)이라고 부르고, '학습되었다' 라고 한다. 학습된 모델은 배포되어서 새로운 학습을 통해 수정되기 전까지 지속적으로 활용된다.

### Cost
Hypothesis 방정식에 대한 비용(cost)으로 방정식의 결과가 크게 나오면 좋지 않다고 얘기하고, 루프를 돌 때마다 W와 b를 비용이 적게 발생하는 방향으로 수정하게 된다.
* 미분을 사용하여 최저 비용을 찾아간다고 함.

### Cost 함수
Hypothesis 방정식을 포함하는 계산식으로, 현재의 기울기(W)와 절편(b)에 대해 비용을 계산해 주는 함수다. 매번 호출할 때마다 반환값으로 표현되는 비용이 줄어들도록 코딩되어야 한다. 여기에서는 Linear Regression에서 최소 비용을 검색하기 위한 역할을 담당한다.

#### 왜 제곱?
1. 뺄셈을 하게 되면 직선 위치에 따라 음수와 양수가 섞여서 나오게 된다.
2. 절대값을 취하는 것이 가장 쉽지만, 제곱을 하는 것도 방법이다.
3. 제곱을 하면 가까운 데이터는 작은 값이 나오고, 멀리 있는 데이터는 큰 값이 나오기 때문에 멀리 있는 데이터에 벌점(penalty)을 부과할 수 있다.

In [3]:
import tensorflow as tf

# 1x3
x_data = [1., 2., 3.]
y_data = [1., 2., 3.]

# try to find values for w and b that compute y_data = W * x_data + b
# random_uniform 함수는 정규분포 난수를 생성해준다.
# 배열의 shape, 최소값, 최대값을 파라미터로 사용한다.
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.random_uniform([1], -1.0, 1.0))

# my hypothesis
# 벡터(vector) 연산. 1x3의 행렬이 나온다.
hypothesis = W * x_data + b

# Simplified cost function
# 기울기(W)와 y절편(b)에 대한 적합성을 판단한다.
cost = tf.reduce_mean(tf.square(hypothesis - y_data))

# minimize
# learning rate, alpha. 자동으로 값을 알아낼 수는 없고, 여러 번에 걸쳐 테스트하면서 적절한 값을 찾아야 한다.
rate = tf.Variable(0.1)
# gradient descent 알고리즘을 구현한 함수 - 미분을 통해 최저 비용을 향해 진행하도록 만드는 핵심 함수
optimizer = tf.train.GradientDescentOptimizer(rate)
# 최소 비용을 찾아주는 함수.
# gradient descent 알고리즘에서 gradients를 계산해서 변수에 적용하는 일을 동시에 하는 함수
# train 텐서에는 optimizer가 직접 연결되어있고, optiomizer에는 cost와 rate가 연결되어있따.
# cost에는 reduce_mean과 square 함수를 통해 (hypothesis - y_data)의 결과가 걸쳐있다.
# hypothesis는 W, x_data, b와 연결되었으므로 세 다리 걸쳐 연결된 상태다.
# tran을 구현한다는 것은 이 모든 연결된 객체들을 계산한다는 것과 같은 뜻이 된다.
train = optimizer.minimize(cost)

# before starting, initialize the variables. We will 'run' this first.
# 텐서플로우를 구동하기 위해서 그래프에 연결된 모든 변수를 초기화 하는 과정.
# 전달된 변수들을 초기화하는 연산(op)을 반환하는 함수로, init 변수가 초기화 operations에 해당한다.

init = tf.initialize_all_variables()

# launch the graph
sess = tf.Session()
# 초기화 한 변수들을 넣고 구동
# init에 포함된 모든 텐서를 평가한다.
sess.run(init)

# fit the line
for step in range(2001):
    sess.run(train)
    if step % 20 == 0:
        print('{:4} {} {} {}'.format(step, sess.run(cost), sess.run(W), sess.run(b)))

Instructions for updating:
Use `tf.global_variables_initializer` instead.
   0 0.23911499977111816 [ 1.08082128] [ 0.32287818]
  20 0.0031412590760737658 [ 0.93490499] [ 0.14797629]
  40 0.0011868505971506238 [ 0.95998764] [ 0.09095752]
  60 0.00044842646457254887 [ 0.9754054] [ 0.05590948]
  80 0.00016942729416768998 [ 0.98488224] [ 0.03436616]
 100 6.401334394467995e-05 [ 0.99070746] [ 0.02112404]
 120 2.4185472284443676e-05 [ 0.99428809] [ 0.01298445]
 140 9.138195309787989e-06 [ 0.99648899] [ 0.0079813]
 160 3.452756573096849e-06 [ 0.99784184] [ 0.00490591]
 180 1.304507009081135e-06 [ 0.99867344] [ 0.00301555]
 200 4.929124202135426e-07 [ 0.99918461] [ 0.00185358]
 220 1.8621737751800538e-07 [ 0.99949878] [ 0.00113934]
 240 7.037658633635147e-08 [ 0.9996919] [ 0.00070031]
 260 2.6586619128465827e-08 [ 0.99981064] [ 0.0004305]
 280 1.0041887321676768e-08 [ 0.99988359] [ 0.00026457]
 300 3.790778801970873e-09 [ 0.99992841] [ 0.0001626]
 320 1.4390858504853554e-09 [ 0.99995601] [  9.

In [4]:
import tensorflow as tf

x_data = [1., 2., 3., 4.]
x_data = [2., 4., 6., 8.]

# range is -100 ~ 100
W = tf.Variable(tf.random_uniform([1], -100., 100.))
b = tf.Variable(tf.random_uniform([1], -100., 100.))

X = tf.placeholder(tf.float32)
Y = tf.placeholder(tf.float32)

hypothesis = W * Y + b

cost = tf.reduce_mean(tf.square(hypothesis - Y))

rate = tf.Variable(0.1)
optimizer = tf.train.GradientDescentOptimizer(rate)
train = optimizer.minimize(cost)

init = tf.initialize_all_variables()

sess = tf.Session()
sess.run(init)

for step in range(2001):
    sess.run(train, feed_dict={X: x_data, Y: y_data})
    if step % 20 == 0:
        print(step, sess.run(cost, feed_dict={X: x_data, Y: y_data}), sess.run(W), sess.run(b))
        
print(sess.run(hypothesis, feed_dict={X: 5}))
print(sess.run(hypothesis, feed_dict={X: 2.5}))
print(sess.run(hypothesis, fedd_dict={x: [2.5, 5]}))

Instructions for updating:
Use `tf.global_variables_initializer` instead.
0 1183.6 [-36.17838287] [ 90.54662323]
20 434.836 [-23.21912766] [ 55.05577087]
40 164.293 [-13.88692379] [ 33.84147644]
60 62.0742 [-8.15063953] [ 20.80155373]
80 23.4533 [-4.62468052] [ 12.78622055]
100 8.86128 [-2.45735741] [ 7.85938597]
120 3.34803 [-1.12515557] [ 4.83097839]
140 1.26498 [-0.30628297] [ 2.96948814]
160 0.477942 [ 0.19705886] [ 1.82527387]
180 0.180579 [ 0.50645119] [ 1.12195241]
200 0.0682277 [ 0.69662726] [ 0.6896376]
220 0.0257783 [ 0.81352395] [ 0.42390391]
240 0.00973974 [ 0.88537759] [ 0.26056367]
260 0.00367994 [ 0.92954433] [ 0.16016228]
280 0.00139038 [ 0.95669252] [ 0.09844795]
300 0.000525323 [ 0.97337997] [ 0.06051365]
320 0.000198481 [ 0.98363727] [ 0.03719632]
340 7.49921e-05 [ 0.98994225] [ 0.0228637]
360 2.83337e-05 [ 0.99381775] [ 0.01405381]
380 1.07051e-05 [ 0.99619991] [ 0.00863857]
400 4.0449e-06 [ 0.99766415] [ 0.00530988]
420 1.52813e-06 [ 0.99856424] [ 0.00326384]
440 5

InvalidArgumentError: You must feed a value for placeholder tensor 'Placeholder_1' with dtype float
	 [[Node: Placeholder_1 = Placeholder[dtype=DT_FLOAT, shape=<unknown>, _device="/job:localhost/replica:0/task:0/cpu:0"]()]]

Caused by op 'Placeholder_1', defined at:
  File "/opt/conda/lib/python3.6/runpy.py", line 193, in _run_module_as_main
    "__main__", mod_spec)
  File "/opt/conda/lib/python3.6/runpy.py", line 85, in _run_code
    exec(code, run_globals)
  File "/opt/conda/lib/python3.6/site-packages/ipykernel_launcher.py", line 16, in <module>
    app.launch_new_instance()
  File "/opt/conda/lib/python3.6/site-packages/traitlets/config/application.py", line 658, in launch_instance
    app.start()
  File "/opt/conda/lib/python3.6/site-packages/ipykernel/kernelapp.py", line 478, in start
    self.io_loop.start()
  File "/opt/conda/lib/python3.6/site-packages/zmq/eventloop/ioloop.py", line 177, in start
    super(ZMQIOLoop, self).start()
  File "/opt/conda/lib/python3.6/site-packages/tornado/ioloop.py", line 888, in start
    handler_func(fd_obj, events)
  File "/opt/conda/lib/python3.6/site-packages/tornado/stack_context.py", line 277, in null_wrapper
    return fn(*args, **kwargs)
  File "/opt/conda/lib/python3.6/site-packages/zmq/eventloop/zmqstream.py", line 440, in _handle_events
    self._handle_recv()
  File "/opt/conda/lib/python3.6/site-packages/zmq/eventloop/zmqstream.py", line 472, in _handle_recv
    self._run_callback(callback, msg)
  File "/opt/conda/lib/python3.6/site-packages/zmq/eventloop/zmqstream.py", line 414, in _run_callback
    callback(*args, **kwargs)
  File "/opt/conda/lib/python3.6/site-packages/tornado/stack_context.py", line 277, in null_wrapper
    return fn(*args, **kwargs)
  File "/opt/conda/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 281, in dispatcher
    return self.dispatch_shell(stream, msg)
  File "/opt/conda/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 232, in dispatch_shell
    handler(stream, idents, msg)
  File "/opt/conda/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 397, in execute_request
    user_expressions, allow_stdin)
  File "/opt/conda/lib/python3.6/site-packages/ipykernel/ipkernel.py", line 208, in do_execute
    res = shell.run_cell(code, store_history=store_history, silent=silent)
  File "/opt/conda/lib/python3.6/site-packages/ipykernel/zmqshell.py", line 533, in run_cell
    return super(ZMQInteractiveShell, self).run_cell(*args, **kwargs)
  File "/opt/conda/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2728, in run_cell
    interactivity=interactivity, compiler=compiler, result=result)
  File "/opt/conda/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2850, in run_ast_nodes
    if self.run_code(code, result):
  File "/opt/conda/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2910, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-4-32ad264de0f2>", line 11, in <module>
    Y = tf.placeholder(tf.float32)
  File "/opt/conda/lib/python3.6/site-packages/tensorflow/python/ops/array_ops.py", line 1548, in placeholder
    return gen_array_ops._placeholder(dtype=dtype, shape=shape, name=name)
  File "/opt/conda/lib/python3.6/site-packages/tensorflow/python/ops/gen_array_ops.py", line 2094, in _placeholder
    name=name)
  File "/opt/conda/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py", line 767, in apply_op
    op_def=op_def)
  File "/opt/conda/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 2630, in create_op
    original_op=self._default_original_op, op_def=op_def)
  File "/opt/conda/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 1204, in __init__
    self._traceback = self._graph._extract_stack()  # pylint: disable=protected-access

InvalidArgumentError (see above for traceback): You must feed a value for placeholder tensor 'Placeholder_1' with dtype float
	 [[Node: Placeholder_1 = Placeholder[dtype=DT_FLOAT, shape=<unknown>, _device="/job:localhost/replica:0/task:0/cpu:0"]()]]
