# Lecture Note: Tensorflow

## Anaconda를 설치한 후, Tensorflow 설치하기 

관리자 권한으로 Windows cmd 혹은 powershell을 시작합니다. Mac에서는 terminal을 시작합니다. 

1. 다음 명령어로 파이썬 버전을 확인합니다. 

```
   python --version 
   
   (Python 3.7.1 출력된다면, Python 3.7 버전입니다)
```
   

2. pip를 upgrade합니다. 

```
    python -m pip install --upgrade pip
```    
    
3. conda를 이용하여 tensorflow라는 가상환경(virtual environment)를 만듭니다. 

```
    conda create -n tensorflow python=3.7
```    
    
4. 위에서 만든 tensorflow 가상환경을 활성화합니다. 

```
    activate tensorflow
```    
    
5. 활성화된 tensorflow 가상환경에 tensorflow를 설치합니다. 

```
    pip install tensorflow
```    

6. 이제 콘솔 창에서 tensorflow 설치를 확인합니다. Python을 시작하여, tensorflow를 import 하고, 버전을 확인하면 됩니다. 

```
   python
   import tensorflow as tf
   print(tf.__version__)
   exit()
```   

참고로, keras도 pip를 이용하여 다음과 같이 설치할 수 있습니다. 

    pip install keras
    

In [None]:
mathScore = [85, 80, 84, 97, 92]
englScore = [90, 77, 86, 92, 90]

a = tf.placeholder(dtype=tf.float32)
b = tf.placeholder(dtype=tf.float32)
y = (a + b) / 2

In [None]:
sess = tf.Session()
sess.run(y, feed_dict={a: mathScore, b:englScore})

# Tensorflow Functions

- tf.add
- tf.subtract
- tf.multiply
- tf.truediv
- tf.mod
- tf.abs
- tf.negative
- tf.sign
- tf.square
- tf.sqrt
- tf.pow
- tf.maximum
- tf.minimum
- tf.exp
- tf.log

In [None]:
a = tf.constant(7)
b = tf.constant(5)

In [None]:
sess = tf.Session()

c =  tf.add(a, b)
sess.run(c)

c = tf.subtract(a, b)
sess.run(c)

In [None]:
c =  tf.add(a, b)
print(sess.run(c))

c = tf.subtract(a, b)
print(sess.run(c))

# Tensorflow Session()

아래 예제에서 c는 a 와 b를 더하는 연산을 정의한 tensor 그 자체라는 것이다. 이렇게 정의된 연산을 수행하기 위해, a와 b에 데이터를 넣고, 흐름이 일어나도록 하는 동작이 Session이다. 

In [None]:
import tensorflow as tf

a = tf.constant(11.5)
b = tf.constant(7.2)
c = tf.add(a, b)     # c is a tensor type

print(c)

In [None]:
sess = tf.Session()
sess.run(c)

# K-means Clustering (군집화) Algorithm

0. 무작위 중심(Centroid)값을 선택합니다. 
1. 중심에 가까운 데이터를 클러스터에 포함시킵니다.
2. 중심을 클러스터 중앙으로 이동시킵니다.

마지막 두 과정을 반복하면서 더 이상 중심의 위치가 변하지 않을 때까지 반복합니다. 

In [None]:
from sklearn.cluster import KMeans
import numpy as np
import pandas as pd
import seaborn as sb
import matplotlib.pyplot as plt
%matplotlib inline


In [None]:
df = pd.DataFrame(columns=['x', 'y'])
df.loc[0] = [2, 3]
df.loc[1] = [2, 11]
df.loc[2] = [2, 18]
df.loc[3] = [4, 5]
df.loc[4] = [4, 7]
df.loc[5] = [5, 3]
df.loc[6] = [5, 15]
df.loc[7] = [6, 6]
df.loc[8] = [6, 8]
df.loc[9] = [6, 9]
df.loc[10] = [7, 3]
df.loc[11] = [7, 4]
df.loc[12] = [7, 5]
df.loc[13] = [7, 15]
df.loc[14] = [7, 17]
df.loc[15] = [8, 5]
df.loc[16] = [8, 4]
df.loc[17] = [9, 10]
df.loc[18] = [9, 11]
df.loc[19] = [9, 15]
df.loc[20] = [9, 19]
df.loc[21] = [10, 4]
df.loc[22] = [10, 8]
df.loc[23] = [10, 15]
df.loc[24] = [12, 6]
df.loc[25] = [13, 15]
df.loc[26] = [14, 11]
df.loc[27] = [15, 6]
df.loc[28] = [15, 18]
df.loc[29] = [19, 15]

In [None]:
df.head(30)

In [None]:
sb.lmplot('x', 'y', data=df, fit_reg=False, scatter_kws={"s": 100})
plt.title('K-means Example')
plt.xlabel('x')
plt.ylabel('y')

In [None]:
points = df.values
kmeans = KMeans(n_clusters = 4).fit(points)
kmeans.cluster_centers_

In [None]:
kmeans.labels_

In [None]:
df['cluster'] = kmeans.labels_
df.head(30)

In [None]:
sb.lmplot('x', 'y', data=df, fit_reg=False, scatter_kws={"s": 150}, hue="cluster")
plt.title('K-means Example')
plt.xlabel('x')
plt.ylabel('y')

# 프로젝 예제

## 프로젝트 개요


In [1]:
import tensorflow as tf
import numpy as np
from pandas.io.parsers import read_csv

model = tf.global_variables_initializer();

data = read_csv('../dataset/price data.csv', sep=',')

xy = np.array(data, dtype=np.float32)

In [2]:
print(xy)

[[ 2.0100100e+07 -4.9000001e+00 -1.1000000e+01  8.9999998e-01
   0.0000000e+00  2.1230000e+03]
 [ 2.0100102e+07 -3.0999999e+00 -5.5000000e+00  5.5000000e+00
   8.0000001e-01  2.1230000e+03]
 [ 2.0100104e+07 -2.9000001e+00 -6.9000001e+00  1.4000000e+00
   0.0000000e+00  2.1230000e+03]
 ...
 [ 2.0171228e+07  2.9000001e+00 -2.0999999e+00  8.0000000e+00
   0.0000000e+00  2.9010000e+03]
 [ 2.0171230e+07  2.9000001e+00 -1.6000000e+00  7.0999999e+00
   6.0000002e-01  2.9010000e+03]
 [ 2.0171232e+07  2.0999999e+00 -2.0000000e+00  5.8000002e+00
   4.0000001e-01  2.9010000e+03]]


In [3]:
x_data = xy[:, 1:-1]        # 4개의 변인을 입력을 받습니다.
y_data = xy[:, [-1]]        # 가격 값을 입력 받습니다.


In [4]:
X = tf.placeholder(tf.float32, shape=[None, 4])   # setting placeholder
Y = tf.placeholder(tf.float32, shape=[None, 1])
W = tf.Variable(tf.random_normal([4, 1]), name="weight")
b = tf.Variable(tf.random_normal([1]), name="bias")

Instructions for updating:
Colocations handled automatically by placer.


In [5]:
hypothesis = tf.matmul(X, W) + b                   # 가설을 설정합니다.

cost = tf.reduce_mean(tf.square(hypothesis - Y))   # 비용 함수를 설정합니다.

optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.000005) # 최적화 함수 설정

In [6]:
train = optimizer.minimize(cost)

sess = tf.Session()                            # 세션을 생성합니다.
sess.run(tf.global_variables_initializer())    # 글로벌 변수를 초기화합니다.

# 학습을 수행합니다.
for step in range(100001):
    cost_, hypo_, _ = sess.run([cost, hypothesis, train], feed_dict={X: x_data, Y: y_data})
    if step % 500 == 0:
        print("#", step, " 손실 비용: ", cost_)
        print("- 배추 가격: ", hypo_[0])

# 0  손실 비용:  12808135.0
- 배추 가격:  [3.8152833]
# 500  손실 비용:  4199597.0
- 배추 가격:  [-281.2415]
# 1000  손실 비용:  3792055.2
- 배추 가격:  [29.072697]
# 1500  손실 비용:  3473658.5
- 배추 가격:  [311.8733]
# 2000  손실 비용:  3223181.0
- 배추 가격:  [563.1376]
# 2500  손실 비용:  3025672.0
- 배추 가격:  [786.37524]
# 3000  손실 비용:  2869694.0
- 배추 가격:  [984.76483]
# 3500  손실 비용:  2746387.0
- 배추 가격:  [1161.1111]
# 4000  손실 비용:  2648838.2
- 배추 가격:  [1317.89]
# 4500  손실 비용:  2571625.8
- 배추 가격:  [1457.2919]
# 5000  손실 비용:  2510482.0
- 배추 가격:  [1581.2568]
# 5500  손실 비용:  2462044.2
- 배추 가격:  [1691.5033]
# 6000  손실 비용:  2423655.5
- 배추 가격:  [1789.5577]
# 6500  손실 비용:  2393217.2
- 배추 가격:  [1876.773]
# 7000  손실 비용:  2369068.8
- 배추 가격:  [1954.351]
# 7500  손실 비용:  2349898.2
- 배추 가격:  [2023.3594]
# 8000  손실 비용:  2334666.0
- 배추 가격:  [2084.7476]
# 8500  손실 비용:  2322551.8
- 배추 가격:  [2139.3572]
# 9000  손실 비용:  2312904.2
- 배추 가격:  [2187.9387]
# 9500  손실 비용:  2305209.5
- 배추 가격:  [2231.1582]
# 10000  손실 비용:  2299059.2
- 배추 가격:  [2269.6084]


# 84500  손실 비용:  2236261.0
- 배추 가격:  [2583.5815]
# 85000  손실 비용:  2236002.8
- 배추 가격:  [2583.5928]
# 85500  손실 비용:  2235743.8
- 배추 가격:  [2583.5994]
# 86000  손실 비용:  2235485.8
- 배추 가격:  [2583.6057]
# 86500  손실 비용:  2235227.5
- 배추 가격:  [2583.6118]
# 87000  손실 비용:  2234970.0
- 배추 가격:  [2583.6177]
# 87500  손실 비용:  2234712.2
- 배추 가격:  [2583.624]
# 88000  손실 비용:  2234454.5
- 배추 가격:  [2583.657]
# 88500  손실 비용:  2234197.0
- 배추 가격:  [2583.691]
# 89000  손실 비용:  2233939.2
- 배추 가격:  [2583.725]
# 89500  손실 비용:  2233682.2
- 배추 가격:  [2583.7595]
# 90000  손실 비용:  2233425.2
- 배추 가격:  [2583.794]
# 90500  손실 비용:  2233170.5
- 배추 가격:  [2583.8274]
# 91000  손실 비용:  2232915.5
- 배추 가격:  [2583.861]
# 91500  손실 비용:  2232661.2
- 배추 가격:  [2583.8953]
# 92000  손실 비용:  2232407.2
- 배추 가격:  [2583.929]
# 92500  손실 비용:  2232152.8
- 배추 가격:  [2583.963]
# 93000  손실 비용:  2231899.2
- 배추 가격:  [2583.9968]
# 93500  손실 비용:  2231645.2
- 배추 가격:  [2584.0308]
# 94000  손실 비용:  2231392.0
- 배추 가격:  [2584.065]
# 94500  손실 비용:  2231137.0
- 

In [7]:
# 학습된 모델을 저장합니다.
saver = tf.train.Saver()
save_path = saver.save(sess, "./saved.cpkt")
print('학습된 모델을 저장했습니다.')

학습된 모델을 저장했습니다.


## 경사하강법 적용하기 (모두의 딥러닝)

In [None]:
import matplotlib.pyplot as plt  
%matplotlib inline

def plot_hour2grade(x, y, xline, yline):
    """ x, y의 값들을 그래프로 출력 """
    plt.figure()  
    plt.plot(x, y, '^r')  
    plt.plot(xline, yline)
    plt.title('Hours vs. Grade')
    plt.xlabel('hours')
    plt.ylabel('grades')
    plt.show()

In [None]:
# %load 03_Gradient_Descent.py
import tensorflow as tf

# x, y의 데이터 값
data = [[2, 81], [4, 93], [6, 91], [8, 97]]
x_data = [x_row[0] for x_row in data]
y_data = [y_row[1] for y_row in data]

# 기울기 a와 y 절편 b의 값을 임의로 정한다.
# 단, 기울기의 범위는 0 ~ 10 사이이며 y 절편은 0 ~ 100 사이에서 변하게 한다.
a = tf.Variable(tf.random_uniform([1], 0, 10, dtype = tf.float64, seed = 0))
b = tf.Variable(tf.random_uniform([1], 0, 100, dtype = tf.float64, seed = 0))

# y에 대한 일차 방정식 ax+b의 식을 세운다.
y = a * x_data + b

# 텐서플로 RMSE 함수
rmse = tf.sqrt(tf.reduce_mean(tf.square( y - y_data )))

# 학습률 값
learning_rate = 0.1

# RMSE 값을 최소로 하는 값 찾기
gradient_decent = tf.train.GradientDescentOptimizer(learning_rate).minimize(rmse)

# 텐서플로를 이용한 학습
with tf.Session() as sess:
    # 변수 초기화
    sess.run(tf.global_variables_initializer())
    # 2001번 실행(0번 째를 포함하므로)
    for step in range(2001):
        sess.run(gradient_decent)
        # 100번마다 결과 출력
        if step % 100 == 0:
            print("Epoch: %.f, RMSE = %.04f, 기울기 a = %.4f, y 절편 b = %.4f" % (step,sess.run(rmse),sess.run(a),sess.run(b)))


In [None]:
# RMSE = 2.8810, 기울기 a = 2.3000, y 절편 b = 79.0000
x=[2, 4, 6, 8]
y=[81, 93, 91, 97]

a = 2.3000
b = 79.0000
# code to plot the line y = a x + b
xline = np.arange(1, 10, .5)
yline = a * xline + b
plot_hour2grade(x, y, xline, yline)

## 다중 선형 회귀 (모두의 딥러닝)

In [None]:
# %load 04_Multi-Linear-Regression.py
import tensorflow as tf

# x1, x2, y의 데이터 값

data = [[2, 0, 81], [4, 4, 93], [6, 2, 91], [8, 3, 97]]
x1 = [x_row1[0] for x_row1 in data]
x2 = [x_row2[1] for x_row2 in data] # 새로 추가되는 값
y_data = [y_row[2] for y_row in data]

# 기울기 a와 y절편 b의 값을 임의로 정함. 단 기울기의 범위는 0-10 사이, y 절편은 0-100사이에서 변하게 함
a1 = tf.Variable(tf.random_uniform([1], 0, 10, dtype=tf.float64, seed=0))
a2 = tf.Variable(tf.random_uniform([1], 0, 10, dtype=tf.float64, seed=0))
b = tf.Variable(tf.random_uniform([1], 0, 100, dtype=tf.float64, seed=0))

# 새로운 방정식
y = a1 * x1 + a2 * x2+ b

# 텐서플로 RMSE 함수
rmse = tf.sqrt(tf.reduce_mean(tf.square( y - y_data )))

# 학습률 값
learning_rate = 0.1

# RMSE 값을 최소로 하는 값 찾기
gradient_decent = tf.train.GradientDescentOptimizer(learning_rate).minimize(rmse)

# 학습이 진행되는 부분
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    for step in range(2001):
        sess.run(gradient_decent)
        if step % 100 == 0:
            print("Epoch: %.f, RMSE = %.04f, 기울기 a1 = %.4f, 기울기 a2 = %.4f, y절편 b = %.4f" % (step,sess.run(rmse),sess.run(a1),sess.run(a2),sess.run(b)))



## 다중 선형 회귀 그래프

In [None]:
# %load 05_3D_Graph.py
import numpy as np
import statsmodels.api as statm
import statsmodels.formula.api as statfa
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

data = [[2, 0, 81], [4, 4, 93], [6, 2, 91], [8, 3, 97]]
X = [i[0:2] for i in data]
Y = [i[2] for i in data]

X_1=statm.add_constant(X)
results=statm.OLS(Y,X_1).fit()

hour_class=pd.DataFrame(X,columns=['study_hours','private_class'])
hour_class['Score']=pd.Series(Y)

model = statfa.ols(formula='Score ~ study_hours + private_class', data=hour_class)

results_formula = model.fit()

a, b = np.meshgrid(np.linspace(hour_class.study_hours.min(),hour_class.study_hours.max(),100),
                   np.linspace(hour_class.private_class.min(),hour_class.private_class.max(),100))

X_ax = pd.DataFrame({'study_hours': a.ravel(), 'private_class': b.ravel()})
fittedY=results_formula.predict(exog=X_ax)
fig = plt.figure()

graph = fig.add_subplot(111, projection='3d')

graph.scatter(hour_class['study_hours'],hour_class['private_class'],hour_class['Score'],
              c='blue',marker='o', alpha=1)
graph.plot_surface(a,b,fittedY.values.reshape(a.shape),
                   rstride=1, cstride=1, color='none', alpha=0.4)
graph.set_xlabel('study_hours')
graph.set_ylabel('private_class')
graph.set_zlabel('Score')

plt.show()

## Linear Regression & Gradient Descent Example (동빈나)

In [None]:
import tensorflow as tf

xData = [1, 2, 3, 4, 5, 6, 7]
yData = [25000, 55000, 75000, 110000, 128000, 155000, 180000]
W = tf.Variable(tf.random_uniform([1], -100, 100))
b = tf.Variable(tf.random_uniform([1], -100, 100))
X = tf.placeholder(tf.float32)
Y = tf.placeholder(tf.float32)
H = W * X + b
cost = tf.reduce_mean(tf.square(H - Y))
a = tf.Variable(0.01)   # set learning rate
optimizer = tf.train.GradientDescentOptimizer(a)
train = optimizer.minimize(cost)

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for i in  range(5001):
    sess.run(train, feed_dict={X:xData, Y:yData})
    if i % 500 == 0:
        print(i, sess.run(cost, feed_dict={X:xData, Y:yData}), sess.run(W), sess.run(b))

print(sess.run(H, feed_dict={X: [8]}))
