In [1]:
import numpy as np
import tensorflow as tf

## 2.1 การถดถอยเชิงเส้น

อาจกล่าวได้ว่าการถดถอยเชิงเส้น (linear regression) คือปัญหาขั้นพื้นฐานที่สุดสำหรับการเรียนรู้เชิงลึก 
เป็นแนวทางเชิงเส้นในการโมเดลความสัมพันธ์ระหว่างผลตอบสนองสเกลาร์ (เอาต์พุต) กับตัวแปรอิสระที่อาจมีมากกว่าหนึ่งตัว 
ในกรณีที่เอาต์พุตมีมากกว่าหนึ่งจะเรียกว่า การถดถอยเชิงเส้นหลายตัวแปร (multivariable linear regression) 
ซึ่งจะไม่กล่าวถึงในหัวข้อนี้

ปัญหาการถดถอยเชิงเส้นพื้นฐานที่ประกอบด้วยอินพุตสเกลาร์ $x$ เอาต์พุตสเกลาร์ $y$ สามารถโมเดลได้โดยสมการสัมพรรค 
$y = wx+b$ โดยค่าสเกลาร์ $w, b$ คือพารามิเตอร์ของโมเดล การหาค่าที่เหมาะที่สุดของ $w, b$ อาจทำได้โดยวิธีการทางสถิติ 
หรือวิธีกำลังสองน้อยสุด แต่สำหรับการศึกษาในบทนี้ต้องการต่อยอดไปยังการเรียนรู้เชิงลึก ดังนั้นจะใช้การฝึกโมเดลจากชุดข้อมูล

เราสามารถใช้ขั้นตอนวิธีการถดถอยเชิงเส้นในการพยากรณ์ปัญหาพื้นฐานในชีวิตจริง เช่นราคาบ้าน การแพร่ระบาดของโรคติดต่อ 
แต่เพื่อความเข้าใจหลักการและสามารถต่อยอดไปยังโครงข่ายที่ซับซ้อนขึ้น จะยกตัวอย่างปัญหาจากข้อมูลสังเคราะห์ 

**ตัวอย่าง 2.1**

สมมุติว่ามีระบบเชิงเส้นที่มีค่าพารามิเตอร์ดังนี้

$$
y = -1.2x + 2.4
$$

กำเนิดข้อมูล $(x,y)$ จำนวน 10 ตัวอย่างสำหรับใช้ในการฝึก 


In [2]:
xs = np.arange(1, 11, dtype=float)
ys = -1.2*xs + 2.4
print("xs = ", xs)
print("ys = ", ys)

xs =  [ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
ys =  [ 1.2  0.  -1.2 -2.4 -3.6 -4.8 -6.  -7.2 -8.4 -9.6]


สร้างโครงข่ายประสาทเทียมอย่างง่ายสุดที่มีเพียงชั้นเดียวและเซลล์ประสาทเดียว และรูปร่างของอินพุตมีเพียง 1 ค่า

In [3]:
model = tf.keras.Sequential([tf.keras.layers.Dense(units=1, input_shape=[1])])

ในการคอมไพล์โมเดล จะต้องกำหนดฟังก์ชันการสูญเสีย (loss function) และตัวหาค่าเหมาะที่สุด (optimizer) ที่ต้องการใช้ สำหรับปัญหาการถดถอยเชิงเส้น เหมาะสมที่จะใช้ฟังก์ชันการสูญเสียแบบ ค่าผิดพลาดกำลังสองเฉลี่ย (mean squared error) และตัวหาค่าเหมาะที่สุดแบบลดค่าเกรเดียนต์สโทแคสติก (stochastic gradient descent) ซึ่งจะได้อธิบายเพิ่มเติมภายหลัง ในขั้นนี้เราเพียงใส่อาร์กิวเมนต์ตามรูปแบบที่ไลบรารีกำหนด

In [4]:
model.compile(optimizer='sgd', loss='mean_squared_error')

หลังจากคอมไพล์แล้ว ขั้นตอนต่อไปคือการฝึกโมเดลโดยเรียก model.fit() ใส่อาร์กิวเมนต์เป็นแอเรย์อินพุต เอาต์พุต จำนวนรอบที่ต้องการฝึก เราจะลองแสดงเอาต์พุดจากการฝึก 10 รอบ

In [5]:
model.fit(xs, ys, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x28f6a8cbfd0>

จากเอาต์พุตจะเห็นว่าค่าการสูญเสียลดลง หมายความว่าตัวหาค่าเหมาะที่สุดทำงานอย่างถูกต้องเพื่อทำให้การพยากรณ์มีค่าเข้าใกล้ค่าจริงมากขึ้น กล่าวคือโมเดลกำลังเรียนรู้จากชุดข้อมูลที่ใช้ในการฝึก

ต้องการฝึกโมเดลต่ออีก 1000 รอบ หากไม่ต้องการดูเอาต์พุตสามารถกำหนด verbose = 0

In [6]:
model.fit(xs, ys, epochs=1000,verbose=0)

<keras.callbacks.History at 0x28f6ac91460>

เมื่อฝึกจำนวนรอบตามต้องการแล้ว หากต้องการพยากรณ์เอาต์พุตสำหรับค่าอินพุตค่าหนึ่ง ใช่คำสั่ง model.predict() 
ตัวอย่างเช่นพยากรณ์ค่า $y$ สำหรับ $x = 20$

In [7]:
y_hat = model.predict([20.0])
print("ค่า y จากการพยากรณ์ = ",y_hat)

ค่า y จากการพยากรณ์ =  [[-21.538969]]


เปรียบเทียบกับค่าจริงจาก $y = -1.2x + 2.4$ 

In [8]:
y_true = -1.2*20.0 + 2.4
print("ค่า y จากสมการจริง = ",y_true)

ค่า y จากสมการจริง =  -21.6


จะเห็นว่าค่าที่พยากรณ์มีค่าใกล้เคียงกับค่าจริง แต่ไม่เท่ากันโดยสมบูรณ์ หากต้องการแสดงค่าพารามิเตอร์ของโมเดลหลังจากการฝึกใช้คำสั่ง

In [9]:
model.get_weights()

[array([[-1.1953189]], dtype=float32), array([2.3674111], dtype=float32)]

ซึ่งมีความแตกต่างเล็กน้อยจากพารามิเตอร์จริงคือ $w = -1.2, b = 2.4$

<p align="center">
<img src="https://drive.google.com/thumbnail?id=13bzT7Rmy3bzvE7TiS0yfQo94kpxMuipF" alt="dewninja"/>
</p>
<div align="center">dew.ninja 2022</div>