# 텐서플로우 실행하기

In [1]:
import tensorflow as tf

In [2]:
hello = tf.constant('Hello TensorFlow!')
print(hello)

sess = tf.Session()
result = sess.run(hello)
print(result)
sess.close()

Tensor("Const:0", shape=(), dtype=string)
b'Hello TensorFlow!'


# 계산그래프 만들기

In [3]:
import tensorflow as tf

node1 = tf.constant(3, tf.float32) # explicitly dtype=tf.float32
node2 = tf.constant(4.0) # implicitly  tf.float32
node3 = tf.add(node1, node2)

In [4]:
# node1, node2, node3는 텐서 - 노드일뿐
print("node1: ", node1)
print("node2: ", node2)
print("node3: ", node3)

node1:  Tensor("Const_1:0", shape=(), dtype=float32)
node2:  Tensor("Const_2:0", shape=(), dtype=float32)
node3:  Tensor("Add:0", shape=(), dtype=float32)


In [5]:
session = tf.Session()
print("session.run([node1, node2]): ", session.run([node1, node2]))
print("session.run(node3): ", session.run(node3))

session.close() # session을 열었으면 닫아줘야함.(파일과 똑같이)


session.run([node1, node2]):  [3.0, 4.0]
session.run(node3):  7.0


# TensorFlow 자료형

### Constant

In [6]:
# 다른 type으로
a = tf.constant(1, dtype=tf.float32)
print(a)
print(a.shape)
with tf.Session() as session:
    print(session.run(a))

Tensor("Const_3:0", shape=(), dtype=float32)
()
1.0


In [7]:
# 다른 Shape으로
a = tf.constant(1, dtype=tf.float32, shape=(1,))
print(a)
print(a.shape)
with tf.Session() as session:
    print(session.run(a))

Tensor("Const_4:0", shape=(1,), dtype=float32)
(1,)
[1.]


In [8]:
# 2차원으로 설정
a = tf.constant(1, dtype=tf.float32, shape=(1,1))
print(a)
print(a.shape)
with tf.Session() as session:
    print(session.run(a))

Tensor("Const_5:0", shape=(1, 1), dtype=float32)
(1, 1)
[[1.]]


### Placeholder

In [9]:
import tensorflow as tf

input_data = [1, 2, 3]
x = tf.placeholder(dtype=tf.float32)

y = x * 2
print("x: ", x)
print("y: ", y)


session = tf.Session()

# feed_dict를 통해 값을 전달합니다.
result = session.run(y, feed_dict={x:input_data})
print(result)
session.close()

x:  Tensor("Placeholder:0", dtype=float32)
y:  Tensor("mul:0", dtype=float32)
[2. 4. 6.]


### Variable

In [11]:
x = tf.placeholder(dtype=tf.float32)
x_data = [1, 2, 4]

# 초기값: tf.random_normal([1, 3], stddev=0.35)
weights = tf.Variable([3], dtype=tf.float32)
biases = tf.Variable([4], dtype=tf.float32)

y = weights*x + biases

print("x: ", x)
print('weights: ', weights)
print('biases:', biases)


x:  Tensor("Placeholder_2:0", dtype=float32)
weights:  <tf.Variable 'Variable_2:0' shape=(1,) dtype=float32_ref>
biases: <tf.Variable 'Variable_3:0' shape=(1,) dtype=float32_ref>


### 개별 initializer

In [None]:
with tf.Session() as session:
    # 초기화 오퍼레이션을 실행
    session.run([weights.initializer, biases.initializer])
    
    result = session.run(y, feed_dict={x:x_data})
    print(result)
    
    # 변수 변경 // 변수 재 할당
    session.run(tf.assign(weights, [2]))
    
    # 다시 실행
    result = session.run(y, feed_dict={x:x_data})
    print(result)

### 전체 변수 한번에 초기화 - global_variables_initializer

In [None]:
x = tf.placeholder(dtype=tf.float32)
x_data = [1, 2, 4]

# 초기값: tf.random_normal([1, 3], stddev=0.35)
weights = tf.Variable([3], dtype=tf.float32)
biases = tf.Variable([4], dtype=tf.float32)

y = weights*x + biases

print("x: ", x)
print('weights: ', weights)
print('biases:', biases)


In [None]:
# 변수 초기화 작업
init_op = tf.global_variables_initializer()

with tf.Session() as session:
    # 초기화 오퍼레이션을 실행
    session.run(init_op)
    
    result = session.run(y, feed_dict={x:x_data})
    print(result)
    
    # 변수 변경 // 변수 재 할당
    session.run(tf.assign(weights, [2]))
    
    # 다시 실행
    result = session.run(y, feed_dict={x:x_data})
    print(result)

# Tensor의 속성

In [None]:
a = tf.constant(1) # 0차원
b = tf.constant([1, 2], dtype=tf.float32) # 1차원
c = tf.constant([[1, 2], [3,4]], dtype=tf.int32) # 2차원, = 행렬
d = tf.constant(
    [
        [[1.0,2.0],[3, 4]],
        [[5,6],[7, 8]]
    ]
) # 3차원
# ...
print('a: ', a)
print('b: ', b)
print('c: ', c)
print('d: ', d)

## rank

In [None]:
print("a's rank: ", a._rank())
print("b's rank: ", b._rank())
print("c's rank: ", c._rank())
print("d's rank: ", d._rank())

print("-"*50)
# 아래는  텐서로 반환
print("a's rank: ", tf.rank(a))
print("b's rank: ", tf.rank(b))
print("c's rank: ", tf.rank(c))
print("d's rank: ", tf.rank(d))

## Shape

In [None]:
print("a's shape: ", a.get_shape())
# print("a's shape: ", a.shape)# 같은 결과
print("b's shape: ", b.get_shape())
print("c's shape: ", c.get_shape())
print("d's shape: ", d.get_shape())

print("-"*50)

# 아래는  텐서로 반환
print("a's shape: ", tf.shape(a))
print("b's shape: ", tf.shape(b))
print("c's shape: ", tf.shape(c))
print("d's shape: ", tf.shape(d))

## dtype

In [None]:
print("a's type: ", a.dtype)
print("b's type: ", b.dtype)
print("c's type: ", c.dtype)
print("d's type: ", d.dtype)

# Session 관리

### tf.get_default_session()

In [None]:
session = tf.get_default_session()
print(session)

In [None]:
with tf.Session() as sess:
    print(tf.get_default_session())

### eval(), initializer.run()

In [None]:
a = tf.constant(2, dtype=tf.float32)
b = tf.Variable(3, dtype=tf.float32)
c = a * b


In [None]:
with tf.Session() as sess:
    print(sess.run(b.initializer))
    print(sess.run(a))
    print(sess.run(c))

    print('-'*10)
    #### 똑같은 결과
    print(b.initializer.run())
    print(a.eval())
    print(c.eval())

### tf.InteractiveSesison

In [None]:
sess = tf.InteractiveSession()
sess.run(b.initializer)
print(a.eval())
print(c.eval())
sess.close()

# Graph 관리하기

### get_default_graph()

In [None]:
tf.get_default_graph()

In [None]:
a = tf.Variable(3)
a.graph is tf.get_default_graph()

### Graph객체

In [None]:
graph = tf.Graph()
with graph.as_default():
    b = tf.Variable(2)
    

In [None]:
b.graph is graph

In [None]:
tf.get_default_graph().get_operations()

In [None]:
tf.reset_default_graph()
tf.get_default_graph().get_operations()

# 자주 쓰이는 함수들

## 상수만드는 함수

### zeros

In [None]:
a = tf.zeros((3,3), tf.float32)
print(a)
print('-'*30)
with tf.Session() as sess:
    print(sess.run(a))

### zeros_like

In [None]:
a = tf.constant([[1,2,3],[4,5,6]])
print(a.get_shape())

print('-'*30)

b = tf.zeros_like(a, tf.float32)
print(b.get_shape())
with tf.Session() as sess:
    print(sess.run(b))

### ones

In [None]:
a = tf.ones((3,3), tf.float32)
print(a)
print('-'*30)
with tf.Session() as sess:
    print(sess.run(a))

### ones_like

In [None]:
a = tf.constant([[1,2,3],[4,5,6]])
print(a.get_shape())

print('-'*30)

b = tf.ones_like(a, tf.float32)
print(b.get_shape())
with tf.Session() as sess:
    print(sess.run(b))

## 시퀀스 만드는 함수

### linspace

In [None]:
a = tf.linspace(1.0, 3.0, 10)
print(a)
print('-'*30)
with tf.Session() as sess:
    print(sess.run(a))

### range

In [None]:
# start: 3, limit: 18, delta: 3
a = tf.range(3, 18, 3)

# limit:5
b = tf.range(5)

print(a)
print(b)
print('-'*30)
with tf.Session() as sess:
    print("a: ", sess.run(a))
    print("b: ", sess.run(b))

## 난수 추출 함수

### random_normal

In [None]:
a = tf.random_normal((3,3), dtype=tf.float32)
print(a)
print('-'*30)
with tf.Session() as sess:
    print(sess.run(a))

### ranom_uniform

In [None]:
a = tf.random_uniform((3,3), dtype=tf.float32)
print(a)
print('-'*30)
with tf.Session() as sess:
    print(sess.run(a))

### random_shuffle

In [None]:
a = tf.range(1, 20, 3)
b = tf.random_shuffle(a, seed=42)

print(b)
print('-'*30)
with tf.Session() as sess:
    print(sess.run(b))

## 텐서변환

### tf.cast

In [None]:
a = tf.constant(2.2, dtype=tf.float32)
print(a)
b = tf.cast(a, tf.int32)
print(b)

### tf.reshape

In [None]:
a = tf.linspace(1.0, 10, 100)
tf.reshape(a, (10, -1))

## 수학함수

### tf.abs

In [None]:
a = tf.range(-10.0, 10, dtype=tf.float32)
b = tf.abs(a)

with tf.Session() as sess:
    print(sess.run(a))
    print('-'*30)
    print(sess.run(b))

### tf.sqrt

In [None]:
a = tf.range(0, 20, dtype=tf.float32)
b = tf.sqrt(a)

with tf.Session() as sess:
    print(sess.run(a))
    print('-'*30)
    print(sess.run(b))

### tf.exp

In [None]:
a = tf.range(0, 20, dtype=tf.float32)
b = tf.exp(a)

with tf.Session() as sess:
    print(sess.run(a))
    print('-'*30)
    print(sess.run(b))

### tf.log

In [None]:
a = tf.range(1, 20, dtype=tf.float32)
b = tf.log(a)

with tf.Session() as sess:
    print(sess.run(a))
    print('-'*30)
    print(sess.run(b))

### matrix  

In [None]:
X = tf.range(20, dtype=tf.float32)
X = tf.reshape(X, (4,5))


Y = tf.ones((4,5), dtype=tf.float32)
print(X.shape, Y.shape)

In [None]:
# XY = tf.matmul(X, Y) # 오류 발생
Y = tf.transpose(Y)
print(X.shape, Y.shape)

In [None]:
XY = tf.matmul(X,Y)
print(XY)

with tf.Session() as sess:
    print('-'*30)
    print(sess.run(XY))

## Reduce --- (sum, prod, min, max, mean, ...)

차원을 줄이면서 ~~~ 한다.

In [None]:
X = [[1, 2],
     [3, 4]]

r_sum0 = tf.reduce_sum(X) # 첫번째 배열 (바깥쪽)
r_sum1 = tf.reduce_sum(X, axis=0) # 첫번째 배열 (바깥쪽)
r_sum2 = tf.reduce_sum(X, axis=1) # 두번째 배열 (안쪽)

with tf.Session() as sess:
    print(sess.run(r_sum0))
    print('-'*30)
    
    print(sess.run(r_sum1))
    print('-'*30)
    print(sess.run(r_sum2))

In [None]:
X = [[1, 2],
     [3, 4]]

r_prod0 = tf.reduce_prod(X) # 첫번째 배열 (바깥쪽)
r_prod1 = tf.reduce_prod(X, axis=0) # 첫번째 배열 (바깥쪽)
r_prod2 = tf.reduce_prod(X, axis=1) # 두번째 배열 (안쪽)

with tf.Session() as sess:
    print(sess.run(r_prod0))
    print('-'*30)
    
    print(sess.run(r_prod1))
    print('-'*30)
    print(sess.run(r_prod2))

# 연습문제1.
덧셈 프로그램 작성  
상수 두개인 텐서(5, 8)를 작성하고 덧셈을 연산하는 그래프를 작성하시오.  
그리고 해당 결과를 출력하고 확인하시오.  


# 연습문제2.
tf.linspace를 이용해 0부터 10까지 숫자 100개를 만들고 node1에 Tensor를 선언하고  
node2에는 node1에 3을 곱하고  
node3에는 float32타입의 placeholder를 선언하시오.  
node4에는 node2와 node3를 더하시오.  
실행시 node3에 값을 1부터 10까지 하여 node4를 반복 출력하시오.(for문)  

# 모범답안

### 연습문제1

In [None]:
# node1 = tf.constant(5) # 오류 발생
node1 = tf.constant(5, dtype=tf.float32) # node1 = tf.constant(5.0)
node2 = tf.constant(8.3)
node3 = tf.add(node1,node2)
# node3 = node1 + node2

with tf.Session() as sess:
    print(node3.eval())

### 연습문제2

In [None]:
node1 = tf.linspace(0.0,10,100)
node2 = node1*3
node3 = tf.placeholder(tf.float32)
node4 = node2 + node3

with tf.Session() as session:
    for i in range(1, 11):
        result = session.run(node4, feed_dict={node3:i})
        print(result)
        print('-'*50)

# 실습으로 구현하는 TensorFlow

## Califonia Dataset으로 Linear Regression 구현하기

### 실행순서
1. Data Load (Califonia Data)
2. Data 전처리
3. Graph 정의( Linear Regression)
4. 실행

In [None]:
import numpy as np
import tensorflow as tf
from sklearn.datasets import fetch_california_housing

def reset_all(seed=0):
    # 왜 할까요? 생각해봅시다.
    tf.reset_default_graph() # graph 초기화
    tf.set_random_seed(seed) # tf.random_seed 초기화
    np.random.seed(seed) # np.random_seed 초기화

In [None]:
reset_all()

## 1.Data 로드

In [None]:
housing = fetch_california_housing()

In [None]:
housing.keys()

In [None]:
housing_data = housing.data # X
housing_label = housing.target # Y

m, n = housing_data.shape # shape 저장 (m X n)행렬
# bias 추가. (1)

#### data 탐색하기

In [None]:
import pandas as pd
housing_df = pd.DataFrame(housing.data, columns=housing.feature_names)
housing_df.head()

In [None]:
# 결측치는 없네요.
# 모든 데이터는 float 형이구요.
housing_df.info()

In [None]:
housing_df.describe()
# 확인해보니.. 표준편차 차이가 크네요. 
# 그리고 값의 범위도 다 달라요.
# Feature Scaling이 필요하겠군요.

## 2. 전처리하기

In [None]:
# 전처리가 필요하다.
# 데이터간 스케일이 크면 학습이 잘 안된다. (속도가 더디거나 발산함.(lr을 줄여야함))
print("mean: ", housing_data.mean(axis=0)) 
print("shape: ", housing_data.shape)

### 표준화

In [None]:
from sklearn.preprocessing import StandardScaler, MinMaxScaler # sklearn의 StandardScaler 사용
scaler = StandardScaler() # 표준화
scaled_housing_data = scaler.fit_transform(housing_data) 

In [None]:
# 평균이 0이고 표준편차가 1.
pd.DataFrame(scaled_housing_data, columns=housing.feature_names).describe()

In [None]:
# 정규화 예)
scaler2 = MinMaxScaler()
scaled_housing_data2 = scaler2.fit_transform(housing_data)

In [None]:
scaled_housing_data2
# 평균이 0이고 표준편차가 1.
pd.DataFrame(scaled_housing_data2, columns=housing.feature_names).describe()

### 결측치 처리

In [None]:
# 결측치가 없어요. --> 처리할 게 없어요.
pd.DataFrame(scaled_housing_data, columns=housing.feature_names).info()

### bias 데이터에 추가

In [None]:
# np.c_ 함수는 concatenate 함수 (연결한다!)
# bias에 행렬 추가
scaled_housing_data_plus_bias = np.c_[np.ones((m, 1)), scaled_housing_data] ## bias 추가

print("mean(항목간): ", scaled_housing_data_plus_bias.mean(axis=0))
print("mean(전체): ", scaled_housing_data_plus_bias.mean())
print("shape: ",scaled_housing_data_plus_bias.shape)

## 3. Graph 정의

#### 0. epoch, learning_rate 정의
#### 1. X와 y정의  (Placeholder)
#### 2. Hypothesis&Cost 함수 정의
#### 3. Optimizer정의

In [None]:
# 그래프 초기화
tf.reset_default_graph()

In [None]:
n_epochs = 1000 # epoch --> 학습횟수(반복횟수)
lr = 0.01 # learning rate

#### 1. X와 y정의

In [None]:
scaled_housing_data_plus_bias.shape

In [None]:
X = tf.placeholder(dtype=tf.float32, shape=(None, 9), name="X")
y = tf.placeholder(dtype=tf.float32, shape=(None, 1), name='y')

#### Hypothesis&Cost 정의

In [None]:
m,n

In [None]:
# M: 데이터의 개수, N: Feature의 개수
# n(feature의 개수) +1 --> bias
W = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name='Weight')  # N+1 X 1 행렬
y_pred = tf.matmul(X, W, name='predictions') # hypothesis  --> M X 1행렬  = M X N+1 * N+1 X 1 

In [None]:
# ==> y값은 MX1 로 넣어줘야함 행렬연산 위해
error = y_pred - y # MX1행렬 (데이터의 개수 만큼 error가 나옴.) --> Data 1개당 에러 (오차)  

# Mean Sqaure Error
mse = tf.reduce_mean(tf.square(error), name='mse') # Cost Function

#### optimizer 방법1. 직접 미분

In [None]:
# Optimizer = Gradient Descent

# (N+1) X M  *  M X 1 = (N+1) X 1 행렬 --> (Feature+1)의 개수만큼 나오지요.
gradients = 2/m * tf.matmul(tf.transpose(X), error) # feature 하나당 기울기 계산. (편미분)

training_op = tf.assign(W, W - (lr * gradients)) # optimizer 역할 (gradient 업데이트)

#### optimizer 방법2. 자동 미분

In [None]:
# tensorflow의 자동 미분 기능 (기울기 미분 자동)
gradients = tf.gradients(mse, [W])[0]  # W에 대한 mse 함수
training_op = tf.assign(W, W - (lr * gradients)) # optimizer 역할 (gradient 업데이트)

#### optimizer 방법3. 옵티마이저 사용

In [None]:
optimizer = tf.train.GradientDescentOptimizer(learning_rate=lr)
# mse를 최소화하는게 목적!
traing_op = optimizer.minimize(mse) 

### label reshape

In [None]:
housing_label.shape
# 행렬간 연산을 위해선 2차원 행렬로 만들어줘야함.
housing_label = housing_label.reshape(-1, 1)
housing_label.shape

In [None]:
init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            # placeholder 추가
            print("Epoch", epoch, "MSE =", 
                  mse.eval(feed_dict={
                      X:scaled_housing_data_plus_bias, 
                      y:housing_label})
                 )
        
        # weight 업데이트
        sess.run(training_op, feed_dict={X:scaled_housing_data_plus_bias, y:housing_label})
    
    best_weight = W.eval()

best_weight

# 연습문제3. Boston Data LinearRegression

### 1. DataLoad

In [None]:
reset_all()

In [None]:
import tensorflow as tf
from sklearn import datasets
from sklearn import model_selection
from sklearn.preprocessing import StandardScaler
import pandas as pd

In [None]:
# boston 집값 예측
boston = datasets.load_boston()
boston.keys()

In [None]:
# boston data 설명
"""
CRIM	자치시(town) 별 1인당 범죄율
ZN	25,000 평방피트를 초과하는 거주지역의 비율
INDUS	비소매상업지역이 점유하고 있는 토지의 비율
CHAS	찰스강에 대한 더미변수(강의 경계에 위치한 경우는 1, 아니면 0)
NOX	10ppm 당 농축 일산화질소
RM	주택 1가구당 평균 방의 개수
AGE	1940년 이전에 건축된 소유주택의 비율
DIS	5개의 보스턴 직업센터까지의 접근성 지수
RAD	방사형 도로까지의 접근성 지수
TAX	10,000 달러 당 재산세율
PTRATIO	자치시(town)별 학생/교사 비율
B	1000(Bk-0.63)^2, 여기서 Bk는 자치시별 흑인의 비율을 말함.
LSTAT	모집단의 하위계층의 비율(%)
MEDV	본인 소유의 주택가격(중앙값) (단위: $1,000)
"""
# boston의 범죄율 등으로 집값 예측
boston_housing = boston.data
boston_label = boston.target
m, n = boston_housing.shape # shape 저장 (m X n)행렬

In [None]:
## code 시작!

### 2. 전처리

## 3. Graph 정의

In [None]:
## 3. Graph 정의

## 4. 수행

# 모범 답안

### 2. 전처리

In [None]:
boston_df = pd.DataFrame(boston_housing, columns=boston.feature_names)

In [None]:
boston_df.describe()

In [None]:
# 결측치 없음
boston_df.info()

In [None]:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaled_boston_housing = scaler.fit_transform(boston_housing) 

### bias 데이터에 추가

In [None]:
# np.c_ 함수는 concatenate 함수 (연결한다!)
# bias에 행렬 추가
scaled_boston_housing_plus_bias = np.c_[np.ones((m, 1)), scaled_boston_housing] ## bias 추가

print("mean(항목간): ", scaled_boston_housing_plus_bias.mean(axis=0))
print("mean(전체): ", scaled_boston_housing_plus_bias.mean())
print("shape: ",scaled_boston_housing_plus_bias.shape)

## 3. Graph 정의

In [None]:
# 그래프 초기화
tf.reset_default_graph()

In [None]:
n_epochs = 1000 # epoch --> 학습횟수(반복횟수)
lr = 0.01 # learning rate

#### 1. X와 y정의

In [None]:
scaled_boston_housing_plus_bias.shape

In [None]:
X = tf.placeholder(dtype=tf.float32, shape=(None, n+1), name="X")
y = tf.placeholder(dtype=tf.float32, shape=(None, 1), name='y')

#### Hypothesis&Cost 정의

In [None]:
m,n

In [None]:
# M: 데이터의 개수, N: Feature의 개수
# n(feature의 개수) +1 --> bias
W = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name='Weight')  # N+1 X 1 행렬
y_pred = tf.matmul(X, W, name='predictions') # hypothesis  --> M X 1행렬  = M X N+1 * N+1 X 1 

In [None]:
# ==> y값은 MX1 로 넣어줘야함 행렬연산 위해
error = y_pred - y # MX1행렬 (데이터의 개수 만큼 error가 나옴.) --> Data 1개당 에러 (오차)  

# Mean Sqaure Error
mse = tf.reduce_mean(tf.square(error), name='mse') # Cost Function

#### 옵티마이저

In [None]:
optimizer = tf.train.GradientDescentOptimizer(learning_rate=lr)
# mse를 최소화하는게 목적!
training_op = optimizer.minimize(mse) 

### label reshape

In [None]:
print(boston_label.shape)
# 행렬간 연산을 위해선 2차원 행렬로 만들어줘야함.
boston_label = boston_label.reshape(-1, 1)
boston_label.shape

## 4. 실행

In [None]:
init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            # feed_dict 추가
            print("Epoch", epoch, "MSE =", 
                  mse.eval(feed_dict={
                      X:scaled_boston_housing_plus_bias, 
                      y:boston_label})
                 )
        
        # weight 업데이트
        sess.run(training_op, feed_dict={X:scaled_boston_housing_plus_bias, y:boston_label})
    
    best_weight = W.eval()

best_weight

# 텐서보드 사용하기

In [None]:
from datetime import datetime

In [None]:
now = datetime.now().strftime("%Y%m%d%H%M%S")
root_logdir = './tf_logs'
logdir = "{}/{}".format(root_logdir, now)

In [None]:
mse_summary = tf.summary.scalar('MSE', mse)   # scalar에 대한 summary 기록 ==> 이것도 tensor
file_writer = tf.summary.FileWriter(logdir, tf.get_default_graph()) # 현재 그래프에 대한 내용. (filewriter를 통해 기록할 수 있음)

#### 보스턴 학습 데이터 입니다.

In [None]:
init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            # feed_dict 추가
            # summary 만들기
            summary_str = mse_summary.eval(feed_dict={X: scaled_boston_housing_plus_bias, y: boston_label})
            step = epoch
            # summary 추가.
            file_writer.add_summary(summary_str, step)
        
        # weight 업데이트
        sess.run(training_op, feed_dict={X:scaled_boston_housing_plus_bias, y:boston_label})
    
    best_weight = W.eval()

best_weight



In [None]:
file_writer.close()

In [None]:
# 파일 추가
!ls {root_logdir}/*
# !dir {root_logdir}/*

In [None]:
import sys
!tensorboard --logdir {root_logdir}

# 이름 범위 - 관련 노드를 묶기

##### boston_data로

In [None]:
reset_all()

In [None]:
now = datetime.now().strftime("%Y%m%d%H%M%S")
root_logdir = "tf_logs/boston"
logdir = "{}/{}/".format(root_logdir, now)

n_epochs = 1000
learning_rate = 0.01

X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")
W = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="Weight")
y_pred = tf.matmul(X, W, name="predictions")

#### Hypothesis&Cost 정의

In [None]:
m,n

In [None]:
# M: 데이터의 개수, N: Feature의 개수
# n(feature의 개수) +1 --> bias
W = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name='Weight')  # N+1 X 1 행렬
y_pred = tf.matmul(X, W, name='predictions') # hypothesis  --> M X 1행렬  = M X N+1 * N+1 X 1 

# 이름 범위로 묶기! (중요)

In [None]:
# 이름 범위로 묶기
# ==> y값은 MX1 로 넣어줘야함 행렬연산 위해
with tf.name_scope("loss") as scope: 
    error = y_pred - y  # MX1행렬 (데이터의 개수 만큼 error가 나옴.) --> Data 1개당 에러 (오차)  
    mse = tf.reduce_mean(tf.square(error), name="mse")

#### 옵티마이저

In [None]:
optimizer = tf.train.GradientDescentOptimizer(learning_rate=lr)
# mse를 최소화하는게 목적!
training_op = optimizer.minimize(mse) 

print(boston_label.shape)
# 행렬간 연산을 위해선 2차원 행렬로 만들어줘야함.
boston_label = boston_label.reshape(-1, 1)
boston_label.shape

## 4. 실행

In [None]:
init = tf.global_variables_initializer()

mse_summary = tf.summary.scalar('MSE', mse)
file_writer = tf.summary.FileWriter(logdir, tf.get_default_graph())

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            # feed_dict 추가
            print("Epoch", epoch, "MSE =", 
                  mse.eval(feed_dict={
                      X:scaled_boston_housing_plus_bias, 
                      y:boston_label})
                 )
        
        # weight 업데이트
        sess.run(training_op, feed_dict={X:scaled_boston_housing_plus_bias, y:boston_label})
    
    best_weight = W.eval()

best_weight

In [None]:
file_writer.close()
import sys
!tensorboard --logdir {root_logdir}

# 1장 끝 - 종료

# 모범 답안

### 2. graph 정의

In [None]:
# Weight와 bias 정의
W = tf.Variable(tf.random_normal([train_X.shape[1], 1])) # 13길이의 열벡터를 랜덤하게 만듬 
b = tf.Variable(tf.random_normal([1]))

# X data와, Y data 정의
X = tf.placeholder(tf.float32, shape=(None, train_X.shape[1]))
Y = tf.placeholder(tf.float32)

In [None]:
# hypothesis와 Cost함수 정의
hypothesis = tf.matmul(X, W) + b

# 오차 제곱의 평균
cost = tf.reduce_mean(tf.square(hypothesis - Y))
print(cost)

In [None]:
# Optimizer
learning_rate = 1.0e-6
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
train_op = optimizer.minimize(cost)

### 3. 훈련 (session.run)

In [None]:
import numpy as np
tf.set_random_seed(0)

with tf.Session() as session:
    # W와 b를 초기화
    session.run(tf.global_variables_initializer())
    
    for step in range(1000000):
        # 우리가 알고 싶은 값
        _, cost_val, W_val, b_val = session.run([train_op, cost, W, b], feed_dict={X:train_X, Y:train_Y})
        # 끝났지만 진행 상황을 알고 싶다.
        if step%100000==0:
            # 20번에 한번씩 진행하기
            print(" step: {}\n cost:{}\n Weight: {} \n bias:{}".format(step, cost_val, W_val, b_val))
            print("-"*50)
            
    # 최적화가 완료된 모델에 테스트 값을 넣고 결과가 잘 나오는지 확인해봅니다.
    print("\n=== Test ===")
    pred_test = session.run(hypothesis, feed_dict={X: test_X})
    pred_train = session.run(hypothesis, feed_dict={X: train_X})
    print("pred: ", pred)
    print("Weight와 bias: ", session.run([W, b]))
    
    print("="*50)
print(np.array(zip(pred_test.flatten(), test_Y.flatten())))

### 4. Test

# Linear Regression 실습하기

In [None]:
import tensorflow as tf
import matplotlib.pyplot as plt

### 1. dataLoad

In [None]:
# y = 2*x + 1
# w[1] = 2, w[0]= 1
x_data = [1, 2, 3]
y_data = [3, 5, 7]

### 2. Graph 정의

In [None]:
# W1과 W0을 구하는게 우리의 목표!
# 일단 하나 정하고 조정하기. ==> Variable을 쓰고, 초기값 설정
W = tf.Variable(tf.random_uniform([1], -100, 100)) # W1 - Weight
b = tf.Variable(tf.random_uniform([1], -100, 100)) # W0 - bias

# name: 나중에 텐서보드등으로 값의 변화를 추적하거나 살펴보기 쉽게 하기 위해 이름을 붙여준다.
# 왜 tf.placeholder를 사용하는가? 생각해보자!
# 
# 새로운 데이터를 예측하기 위해서 훈련을 합니다.
# --> 기존데이터로 훈련을 하고, 훈련된 모델을 새로운 데이터로 바꿀 수 있어야 합니다.
X = tf.placeholder(tf.float32, name="X") # 훈련 데이터
Y = tf.placeholder(tf.float32, name="Y") # 정답 데이터

In [None]:
# hypothesis 정의
# W 와 X 가 행렬이 아니므로 tf.matmul 이 아니라 기본 곱셈 기호를 사용한다.
hypothesis = W * X + b

# Cost Function을 작성한다. (손실 함수)
# mean(h - Y)^2 : 예측값과 실제값의 차이의 제곱의 평균
err = tf.square(hypothesis - Y)
cost = tf.reduce_mean(err)


In [None]:
# 훈련률: 0.1: optimizer가 Variable을(Weight를) 자동으로 조정한다.
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.1) 

# 비용을 최소화 하는 것이 최종 목표
train_op = optimizer.minimize(cost)  # compute_gradients, apply_gradients가 실행됩니다.

### 3. 학습

In [None]:
# 세션 생성 및 초기화.
with tf.Session() as sess:
    writer = tf.summary.FileWriter('./summary', session.graph)
    sess.run(tf.global_variables_initializer()) # 변수 초기화

    # 최적화를 300번 수행합니다.
    for step in range(300):
        # sess.run 을 통해 train_op 와 cost 그래프를 계산한다.
        # 이 때, Hypothesis에 넣어야 할 실제값을 feed_dict 을 통해 전달합니다.
        _, cost_val, weight, bias = sess.run([train_op, cost, W, b], feed_dict={X: x_data, Y: y_data})
        
        # _는 None값. --> compute_gradients, apply_gradients가 실행됩니다.
        # --> W값 자동으로 조정합니다.
        
        if step%20==0:
            # 20번에 한번씩 진행하기
            print(_)
            print(" step: {}\n cost:{}\n Weight: {} \n bias:{}".format(step, cost_val, weight, bias))
            print("-"*50)
            h = sess.run(hypothesis, feed_dict={X: x_data})
            
            plt.plot(x_data, h)
            plt.scatter(x_data, y_data)
            plt.show()

    # 최적화가 완료된 모델에 테스트 값을 넣고 결과가 잘 나오는지 확인해봅니다.
    print("\n=== Test ===")
    print("X: 5, Y:", sess.run(hypothesis, feed_dict={X: 5}))
    print("X: 2.5, Y:", sess.run(hypothesis, feed_dict={X: 2.5}))
    print("Weight와 bias")
    print(sess.run([W, b]))


In [None]:
# optimizer 선택 with data

# TensorFlow Graph Final

In [None]:
import tensorflow as tf
node1 = tf.constant(2, dtype=tf.float32)
node2 = tf.constant(3, dtype=tf.float32)
node3 = tf.placeholder(tf.float32)
node4 = tf.placeholder(tf.float32)

node5 = node1*node2 + (node3/node4)
# 동일합니다.
# node4 = tf.add(tf.multiply(node1, node2), node3)

In [None]:
# with절 사용시 close 안해줘도 됨.
with tf.Session() as session:
    writer = tf.summary.FileWriter('./summary', session.graph)
    print(writer)
    result = session.run(node4, feed_dict={node3: 8, node4:2})
    print(result)

In [None]:
# tensorboard
!tensorboard --logdir="./summary"