<a href="https://colab.research.google.com/github/aekanun2020/AdvancedStat/blob/main/prove_one_neuronRNN_part1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import torch
from torch.nn import Parameter
from torch.autograd import Variable
import torch.nn.functional as F
import math

# กำหนด seed เพื่อให้ผลลัพธ์คงที่
torch.manual_seed(9)

# สร้าง RNN Cell โดยมี input_size=1, hidden_size=1, และไม่มี bias
rnn_a = torch.nn.RNNCell(input_size=1, hidden_size=1, bias=False)

# แสดงค่า parameters ทั้งหมดใน RNN Cell พร้อมคำอธิบาย
print("Parameters ของ RNN Cell:")
weights = list(rnn_a.parameters())
w_ih = weights[0]  # Input-to-Hidden (Weight W)
w_hh = weights[1]  # Hidden-to-Hidden (Weight U)
print(f"Weight W (input-to-hidden): {w_ih.item():.4f} - ใช้คำนวณอิทธิพลของ input ปัจจุบัน")
print(f"Weight U (hidden-to-hidden): {w_hh.item():.4f} - ใช้คำนวณอิทธิพลของ hidden state ก่อนหน้า")
print("\nสมการของ RNN Cell: h_t = tanh(W·x_t + U·h_{t-1})")
print("  โดย:")
print("    - h_t คือ hidden state ณ เวลา t")
print("    - x_t คือ input ณ เวลา t")
print("    - h_{t-1} คือ hidden state ก่อนหน้า")
print("    - W และ U คือ weight matrices ที่ใช้ในทุก time step (weight sharing)")

# สร้าง input sequence และ hidden state เริ่มต้น
# ค่า input ที่ time step ที่ 1, 2, และ 3
random_input = Variable(torch.FloatTensor(1, 3, 1).normal_(), requires_grad=False)
random_input[0, 0, 0] = 1
random_input[0, 1, 0] = -0.7775
random_input[0, 2, 0] = 0.2588
print("\nInput sequence:")
print(f"X_1 = {random_input[0, 0, 0].item()}")
print(f"X_2 = {random_input[0, 1, 0].item()}")
print(f"X_3 = {random_input[0, 2, 0].item()}")

# ค่า hidden state เริ่มต้น
h0 = Variable(torch.zeros(1, 1), requires_grad=False)
print("\nInitial hidden state (h_0):", h0.item())

# คำนวณ hidden state ที่แต่ละ time step
print("\nการคำนวณ hidden state ที่แต่ละ time step:")

# Time step 1
h1 = rnn_a(random_input[0, 0], h0)
w_x1 = w_ih.item() * random_input[0, 0, 0].item()
u_h0 = w_hh.item() * h0.item()
print("Time step 1:")
print(f"  W·x_1 = {w_ih.item():.4f} × {random_input[0, 0, 0].item()} = {w_x1:.4f}")
print(f"  U·h_0 = {w_hh.item():.4f} × {h0.item()} = {u_h0:.4f}")
print(f"  h_1 = tanh(W·x_1 + U·h_0) = tanh({w_x1:.4f} + {u_h0:.4f}) = tanh({w_x1 + u_h0:.4f}) = {h1.item():.4f}")

# Time step 2
h2 = rnn_a(random_input[0, 1], h1)
w_x2 = w_ih.item() * random_input[0, 1, 0].item()
u_h1 = w_hh.item() * h1.item()
print("\nTime step 2:")
print(f"  W·x_2 = {w_ih.item():.4f} × {random_input[0, 1, 0].item()} = {w_x2:.4f}")
print(f"  U·h_1 = {w_hh.item():.4f} × {h1.item()} = {u_h1:.4f}")
print(f"  h_2 = tanh(W·x_2 + U·h_1) = tanh({w_x2:.4f} + {u_h1:.4f}) = tanh({w_x2 + u_h1:.4f}) = {h2.item():.4f}")

# Time step 3
h3 = rnn_a(random_input[0, 2], h2)
w_x3 = w_ih.item() * random_input[0, 2, 0].item()
u_h2 = w_hh.item() * h2.item()
print("\nTime step 3:")
print(f"  W·x_3 = {w_ih.item():.4f} × {random_input[0, 2, 0].item()} = {w_x3:.4f}")
print(f"  U·h_2 = {w_hh.item():.4f} × {h2.item()} = {u_h2:.4f}")
print(f"  h_3 = tanh(W·x_3 + U·h_2) = tanh({w_x3:.4f} + {u_h2:.4f}) = tanh({w_x3 + u_h2:.4f}) = {h3.item():.4f}")

print("\n=== สรุปผลการทดลอง ===")
print("1. เราพบว่า RNN Cell ประกอบด้วย weights 2 ชุด:")
print(f"   - Weight W (input-to-hidden): {w_ih.item():.4f} - ใช้คำนวณผลกระทบของ input ปัจจุบัน")
print(f"   - Weight U (hidden-to-hidden): {w_hh.item():.4f} - ใช้คำนวณผลกระทบของ hidden state ก่อนหน้า")
print("\n2. RNN ใช้ weights เดียวกันในทุก time step (weight sharing)")
print("   - พิสูจน์ได้จากการคำนวณ h_1, h_2, และ h_3 โดยใช้ W และ U ค่าเดียวกัน")
print("   - นี่เป็นคุณสมบัติสำคัญที่ทำให้ RNN สามารถรับข้อมูลที่มีความยาวไม่แน่นอนได้")
print("\n3. ข้อมูลจากอดีตมีผลต่อการทำนายในปัจจุบัน")
print("   - h_0 มีผลต่อ h_1 ผ่านการคูณกับ U")
print("   - h_1 มีผลต่อ h_2 ผ่านการคูณกับ U")
print("   - h_2 มีผลต่อ h_3 ผ่านการคูณกับ U")
print("   - นี่คือกลไกที่ทำให้ RNN มี 'ความจำ' และเหมาะกับข้อมูลแบบลำดับ (sequence data)")

Parameters ของ RNN Cell:
Weight W (input-to-hidden): 0.3116 - ใช้คำนวณอิทธิพลของ input ปัจจุบัน
Weight U (hidden-to-hidden): -0.3960 - ใช้คำนวณอิทธิพลของ hidden state ก่อนหน้า

สมการของ RNN Cell: h_t = tanh(W·x_t + U·h_{t-1})
  โดย:
    - h_t คือ hidden state ณ เวลา t
    - x_t คือ input ณ เวลา t
    - h_{t-1} คือ hidden state ก่อนหน้า
    - W และ U คือ weight matrices ที่ใช้ในทุก time step (weight sharing)

Input sequence:
X_1 = 1.0
X_2 = -0.7774999737739563
X_3 = 0.2587999999523163

Initial hidden state (h_0): 0.0

การคำนวณ hidden state ที่แต่ละ time step:
Time step 1:
  W·x_1 = 0.3116 × 1.0 = 0.3116
  U·h_0 = -0.3960 × 0.0 = -0.0000
  h_1 = tanh(W·x_1 + U·h_0) = tanh(0.3116 + -0.0000) = tanh(0.3116) = 0.3019

Time step 2:
  W·x_2 = 0.3116 × -0.7774999737739563 = -0.2422
  U·h_1 = -0.3960 × 0.30186378955841064 = -0.1195
  h_2 = tanh(W·x_2 + U·h_1) = tanh(-0.2422 + -0.1195) = tanh(-0.3618) = -0.3468

Time step 3:
  W·x_3 = 0.3116 × 0.2587999999523163 = 0.0806
  U·h_2 = -0.3960 × -0.34