In [1]:
import tensorflow as tf

In [4]:
print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))

Num GPUs Available:  1


In [5]:
tf.config.list_physical_devices('GPU')

[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

In [6]:
print(tf.reduce_sum(tf.random.normal([1000,1000])))

tf.Tensor(401.05988, shape=(), dtype=float32)


#### Tensorflow 2.10.0 시작하기

In [7]:
# Hello world 
# 텐서플로는  C++와 python을 기반으로 한다. Google Colab도 python을 기본적으로 지원하고 있다.
print("Hello, world!")

Hello, world!


 텐서플로는 GitHub에 공개된 open source library로서 약 75,000개의 fork가 만들어지고 2,100여명의 코드 기여자가 있으며, 거의 매 주마다 마이너 버전이 업데이트된다. Library의 version정보가 다르면 잘 돌아가야 할 코드에서 에러가 발생할 수도 있다. 설치한 텐서플로의 버전을 확인해 보자.

In [9]:
print(tf.__version__)

2.10.0


##### perceptron의 한계를 지적하는데 사용됐던 AND, OR, XOR 연산을 할 수 있는 신경망 네트워크를 만들어보자

In [29]:
# [0,1] 구간의 uniform distribution에서 shape=(1,)인 난수 생성
rand = tf.random.uniform([1], 0, 1)
print(rand)

tf.Tensor([0.17867386], shape=(1,), dtype=float32)


In [32]:
# [0,1] 구간의 uniform distribution에서 shape=(4,)인 난수 생성
rand = tf.random.uniform(shape=[4], minval=0, maxval=1)
print(rand)

tf.Tensor([0.20703745 0.8988174  0.37414896 0.82971346], shape=(4,), dtype=float32)


In [31]:
# 평균이 0, 표준편차가 1 인 정규분포에서 shape=(3,2)인 난수 행렬 생성
rand = tf.random.normal(shape=[3,2], mean=0, stddev=1)
print(rand)

tf.Tensor(
[[-0.81094915  0.4870714 ]
 [-1.6467528  -1.3862404 ]
 [-1.4208333  -2.8433623 ]], shape=(3, 2), dtype=float32)


##### 신경망의 가장 기본적인 구성요소인 뉴런을 만들어 보자.<br>뉴런이 여러개 모여 layer를 구성한 후 이 layer들이 모여서 신경망을 구성한다.<br>뉴런은 입력, 가중치, 활성화함수, 출력으로 구성된다.<br>가장 간단한 형태의 뉴런은 입력에 가중치를 곱한 뒤(행렬의 곱셈) 활성화함수를 취하면 출력을 얻을 수 있다.<br>뉴런에서 학습할 때 변하는 것은 가중치이다. 가중치는 처음에는 초기화를 통해 랜덤한 값을 넣고, 학습 과정에서 점차 일정한 값으로 수렴한다. 학습이 잘 된다는 것은 좋은 가중치를 얻어서 원하는 출력에 점점 가까운 값을 얻는 것이라고 할 수 있다.

##### $$sigmoid : \sigma(z) = \frac{{1}}{{1}+{exp(-z)}}$$     $$ReLU : (z) = max(0, z)$$

##### 신경망 초기에는 sigmoid가 주로 사용되었지만, 은닉층을 다수 사용하는 딥러닝 시대가 되면서 ReLU가 더 많이 사용되고 있습니다. 딥러닝에서 오류를 역전파(backpropagation)할 때 sigmoid함수가 값을 점점 작아지게 하는 문제를 toronto대학의  Vinod Nair와 Geoffrey Hinton교수가 지적하며, ReLU를 대안으로 제시한 2010년 논문에 이에 대한 자세한 내용이 나와 있다. 그래프를 그려보면 sigmoid는 출력값을 0~1 사이로만 제한하게 되지만, ReLU는 양수를 그대로 반환하기 때문에 값의 왜곡이 적어진다.

In [35]:
# Sigmoid함수를 활성화함수로 해서(출력을 0~1사이로 제한) AND, OR, XOR연산을 실행해보자
# 먼저 Sigmoid함수를 구현한다

import math
def sigmoid(x):
    return 1 / (1 + math.exp(-x))

In [39]:
# 입력이 1일 때 기대출력이 0이 되는 뉴런을 만들어 보자
# error = y - output --> error가 0에 가까워지게 하는 출력으로 기댓값에 가까운 값을 얻는 것이다.

x = 1
y = 0
w = tf.random.normal([1], 0, 1)
output = sigmoid(w * x)
print(output)

0.37668917897651105


In [56]:
# 뉴런이란 결국 w값이다. 이제 이 w를 변화시켜야 하는데, 경사하강법(Gradient Descent)을 이용한다.
# w = w + x * a * error, where a = learning rate(학습률) --> 경사하강법의 가중치 update식
x = 1
y = 0

for i in range(1000):
    output = sigmoid(x * w)
    error = y - output
    w = w + x * 0.1 * error  ## a = 0.1
    
    if i % 100 == 99:
        print(f"시행횟수 : {i:3d},  error : {error:8f},  output : {output:8f}")

시행횟수 :  99,  error : -0.101993,  output : 0.101993
시행횟수 : 199,  error : -0.052311,  output : 0.052311
시행횟수 : 299,  error : -0.034829,  output : 0.034829
시행횟수 : 399,  error : -0.026024,  output : 0.026024
시행횟수 : 499,  error : -0.020745,  output : 0.020745
시행횟수 : 599,  error : -0.017234,  output : 0.017234
시행횟수 : 699,  error : -0.014733,  output : 0.014733
시행횟수 : 799,  error : -0.012863,  output : 0.012863
시행횟수 : 899,  error : -0.011412,  output : 0.011412
시행횟수 : 999,  error : -0.010254,  output : 0.010254


In [58]:
# 만약 x=0로 하고 실행하면 error값은 변하지 않고 이에 따라 w, output값들 역시 변하지 않게 된다.
# 이런 경우를 방지하기 위해 bias(편향)을 뉴런에 넣어준다. 편향값으로 보통 1을 사용한다.
x = 0
y = 1
w = tf.random.normal([1], 0, 1)
b = tf.random.normal([1], 0, 1)

for i in range(1000):
    output = sigmoid(x * w + 1 * b)
    error = y - output
    w = w + x * 0.1 * error
    b = b + 1 * 0.1 * error
    
    if i % 100 == 99:
        print(f"시행횟수 : {i:3d},  error : {error:8f},  output : {output:8f}")

시행횟수 :  99,  error : 0.068064,  output : 0.931936
시행횟수 : 199,  error : 0.041339,  output : 0.958661
시행횟수 : 299,  error : 0.029535,  output : 0.970465
시행횟수 : 399,  error : 0.022930,  output : 0.977070
시행횟수 : 499,  error : 0.018722,  output : 0.981278
시행횟수 : 599,  error : 0.015810,  output : 0.984190
시행횟수 : 699,  error : 0.013678,  output : 0.986322
시행횟수 : 799,  error : 0.012050,  output : 0.987950
시행횟수 : 899,  error : 0.010766,  output : 0.989234
시행횟수 : 999,  error : 0.009729,  output : 0.990271


In [6]:
import tensorflow as tf
import math
print(f"tensorflow's version : {tf.__version__}")

tensorflow's version : 2.10.0


In [7]:
def new_sigmoid(x):
    return 1 / (1 + math.exp(-x))

In [8]:
def ReLU(x):
    return max(0, x)

In [None]:
# 만약 x=0로 하고 실행하면 error값은 변하지 않고 이에 따라 w, output값들 역시 변하지 않게 된다.
# 이런 경우를 방지하기 위해 bias(편향)을 뉴런에 넣어준다. 편향값으로 보통 1을 사용한다.
x = 0
y = 1
w = tf.random.normal([1], 0, 1)
b = tf.random.normal([1], 0, 1)

for i in range(1000):
    output = sigmoid(x * w + 1 * b)
    error = y - output
    w = w + x * 0.1 * error
    b = b + 1 * 0.1 * error
    
    if i % 100 == 99:
        print(f"시행횟수 : {i:3d},  error : {error:8f},  output : {output:8f}")

In [14]:
x = 1
y = 0

w = tf.random.normal([1], 0, 1)
b = tf.random.normal([1], 0, 1)

for i in range(10000):
    output = new_sigmoid(x * w + 1 * b)
    error = y - output
    w = w + x * error * 0.1         # eLoss/ew = x * error * learning_rate
    b = b + 1 * error * 0.1         # eLoss/eb = 1 * error * learning_rate
    
    if i % 1000 == 999:
        print(f"시행횟수 : {i:4d},  error : {error:8f},  output : {output:8f}")

시행횟수 :  999,  error : -0.005103,  output : 0.005103
시행횟수 : 1999,  error : -0.002530,  output : 0.002530
시행횟수 : 2999,  error : -0.001681,  output : 0.001681
시행횟수 : 3999,  error : -0.001258,  output : 0.001258
시행횟수 : 4999,  error : -0.001006,  output : 0.001006
시행횟수 : 5999,  error : -0.000837,  output : 0.000837
시행횟수 : 6999,  error : -0.000717,  output : 0.000717
시행횟수 : 7999,  error : -0.000627,  output : 0.000627
시행횟수 : 8999,  error : -0.000557,  output : 0.000557
시행횟수 : 9999,  error : -0.000502,  output : 0.000502


In [21]:
x = 1
y = 0

w = tf.random.normal([1], 0, 1)
b = tf.random.normal([1], 0, 1)

for i in range(10000):
    output = ReLU(x * w + 1 * b)
    error = y - output
    w = w + x * error * 0.1         # eLoss/ew = x * error * learning_rate
    b = b + 1 * error * 0.1         # eLoss/eb = 1 * error * learning_rate
    
    if i % 1000 == 999:
        print(f"시행횟수 : {i},  error : {error},  output : {output}")

시행횟수 : 999,  error : 0,  output : 0
시행횟수 : 1999,  error : 0,  output : 0
시행횟수 : 2999,  error : 0,  output : 0
시행횟수 : 3999,  error : 0,  output : 0
시행횟수 : 4999,  error : 0,  output : 0
시행횟수 : 5999,  error : 0,  output : 0
시행횟수 : 6999,  error : 0,  output : 0
시행횟수 : 7999,  error : 0,  output : 0
시행횟수 : 8999,  error : 0,  output : 0
시행횟수 : 9999,  error : 0,  output : 0
