<a href="https://colab.research.google.com/github/KhanhPham248/underactuated_robotics/blob/main/chapters/%20lectures%202/lectures%202.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
%%writefile utils_ve_hinh.py
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches

# --- HÀM 1: VẼ MÔ HÌNH CON LẮC (SCHEMATIC) ---
def ve_mo_hinh_con_lac():
    fig, ax = plt.subplots(figsize=(6, 6))
    L = 1.0; theta_deg = 30; theta_rad = np.radians(theta_deg)
    pivot = (0, 0); bob_x = L * np.sin(theta_rad); bob_y = -L * np.cos(theta_rad)

    # Trần và trục
    ax.plot([-0.5, 0.5], [0, 0], color='black', linewidth=2)
    for i in np.linspace(-0.5, 0.5, 12): ax.plot([i, i + 0.1], [0, 0.1], color='black', linewidth=1)
    ax.add_patch(patches.Arc((0, 0), 0.1, 0.1, theta1=180, theta2=360, color='black', linewidth=2))
    ax.plot([0, 0], [0, -L * 1.3], color='black', linestyle='--', linewidth=1)
    ax.plot([0, bob_x], [0, bob_y], color='black', linewidth=2.5) # Dây

    # Quả nặng
    circle = patches.Circle((bob_x, bob_y), radius=0.08, facecolor='#A52A2A', edgecolor='black', zorder=5)
    ax.add_patch(circle)

    # Ký hiệu
    ax.add_patch(patches.Arc((0, 0), 0.5, 0.5, theta1=270, theta2=270+theta_deg, color='black'))
    ax.annotate('', xy=(0.12, -0.22), xytext=(0.02, -0.25), arrowprops=dict(arrowstyle="->", connectionstyle="arc3,rad=0.2", color='black'))
    ax.text(0.1, -0.2, r'$\theta$', fontsize=16, va='center')
    ax.text(bob_x / 2 + 0.05, bob_y / 2, r'$l$', fontsize=16)
    ax.text(bob_x, bob_y - 0.15, r'$m$', fontsize=16, ha='center')
    
    # Trọng trường g
    ax.arrow(-0.3, -0.5, 0, -0.2, head_width=0.03, head_length=0.05, fc='black', ec='black')
    ax.text(-0.38, -0.6, r'$g$', fontsize=16)

    ax.set_aspect('equal'); ax.axis('off')
    plt.figtext(0.5, 0.05, 'Figure 2.1 - The simple pendulum', ha='center', fontsize=12, fontname='serif')
    plt.show()

# --- HÀM 2: VẼ ĐỒ THỊ PHA OVERDAMPED ---
def ve_do_thi_overdamped():
    x = np.linspace(-2.5 * np.pi, 2.5 * np.pi, 1000)
    A = 1.5; y = -A * np.sin(x)
    fig, ax = plt.subplots(figsize=(10, 5))

    # Trục
    ax.axhline(0, color='black', linewidth=1)
    ax.arrow(2.5 * np.pi + 0.3, 0, 0.2, 0, head_width=0.2, fc='black', ec='black', clip_on=False)
    ax.text(2.5 * np.pi + 0.6, 0.2, r'$x$', fontsize=16, va='center')
    ax.axvline(0, color='black', linestyle='-', linewidth=1)
    ax.arrow(0, A + 0.5, 0, 0.2, head_width=0.15, fc='black', ec='black', clip_on=False)
    ax.text(0.3, A + 0.8, r'$\dot{x}$', fontsize=18, ha='left', fontweight='bold')

    # Đồ thị và điểm cân bằng
    ax.plot(x, y, color='black', linewidth=2.5)
    ax.plot([-2*np.pi, 0, 2*np.pi], [0, 0, 0], 'o', color='black', markersize=10, zorder=10) # Stable
    ax.plot([-np.pi, np.pi], [0, 0], 'o', mfc='white', mec='black', mew=2, markersize=10, zorder=10) # Unstable

    # Mũi tên dòng chảy
    arrow_pos = [(-2.25*np.pi, '>'), (-1.5*np.pi, '<'), (-0.5*np.pi, '>'), (0.5*np.pi, '<'), (1.5*np.pi, '>'), (2.25*np.pi, '<')]
    for pos, marker in arrow_pos: ax.plot(pos, 0, marker=marker, color='black', markersize=8)

    # Chú thích biên độ
    ax.plot([-0.1, 0.1], [A, A], color='black', linewidth=1)
    ax.text(0.2, A, r'$\frac{mgl}{b}$', fontsize=16, va='center')
    
    ax.axis('off'); ax.set_xlim(-2.5*np.pi - 0.5, 2.5*np.pi + 1.0); ax.set_ylim(-A - 1, A + 1.5)
    plt.tight_layout(); plt.show()

# --- HÀM 3: VẼ ĐỒ THỊ NEURON DYNAMICS ---
def ve_do_thi_neuron_dynamics():
    x = np.linspace(-3, 3, 600)
    w_values = [0, 0.75, 3]
    colors = ['#1f77b4', '#2ca02c', '#d62728']
    linestyles = ['-.', '--', '-']
    labels = [r'$w=0$', r'$w=3/4$', r'$w=3$']

    fig, ax = plt.subplots(figsize=(10, 6))
    for i, w in enumerate(w_values):
        x_dot = -x + np.tanh(w * x)
        ax.plot(x, x_dot, label=labels[i], color=colors[i], linestyle=linestyles[i], linewidth=2.5)

    ax.axhline(0, color='black', linewidth=1.2); ax.axvline(0, color='black', linewidth=1.2)
    ax.grid(True, linestyle=':', alpha=0.6)
    ax.set_title(r'Đồ thị pha: $\dot{x} = -x + \tanh(wx)$', fontsize=16, pad=15)
    ax.set_xlabel(r'$x$', fontsize=14); ax.set_ylabel(r'$\dot{x}$', fontsize=14, rotation=0, labelpad=15)
    ax.legend(title="Tham số $w$", fontsize=12, loc='best', shadow=True)
    ax.set_xlim(-2.5, 2.5); ax.set_ylim(-1.5, 1.5)
    plt.tight_layout(); plt.show()

# --- HÀM 4: VẼ ĐỒ THỊ MEMORY LATCHING ---
def ve_do_thi_memory_latching():
    dt = 0.01; t = np.arange(0, 30.1, dt); n = len(t)
    x = np.zeros(n); u = np.zeros(n)
    x[0] = 0.1; w = 2.0
    u[(t >= 10) & (t < 20)] = -5.0
    
    for i in range(n - 1):
        dxdt = -x[i] + np.tanh(w * x[i]) + u[i]
        x[i+1] = x[i] + dxdt * dt

    fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(8, 6), sharex=True)
    ax1.plot(t, u, label='u(t)', color='#1f77b4'); ax1.set_ylabel('u(t)'); ax1.set_yticks([0, -5]); ax1.legend(loc='lower left'); ax1.grid(True, linestyle=':', alpha=0.6)
    ax2.plot(t, x, label='x(t)', color='#1f77b4'); ax2.set_ylabel('x(t)'); ax2.set_xlabel('time (s)'); ax2.set_yticks([-1, 0, 1]); ax2.legend(loc='upper right'); ax2.grid(True, linestyle=':', alpha=0.6)
    plt.tight_layout(); plt.show()

# 2.1 Giới thiệu con lắc đơn


## 2.1.1. Phương trình chuyển động



**Phương trình chuyển động (Equation of Motion - EoM) của con lắc đơn được viết như sau:**
$$ml^{2}\ddot{\theta} + b\dot{\theta} + mgl \sin \theta = u$$

Phương trình này thực chất là sự cân bằng Mô-men:
**Mô-men Quán tính + Mô-men Cản + Mô-men Trọng trường = Mô-men Điều khiển**

 **Các thành phần chính:**
* **Không gian cấu hình (Configuration Space - $q$):** Ở đây $q=\theta$. Chúng ta dùng một tọa độ suy rộng duy nhất là góc $\theta$.
* **Biến trạng thái (State Vector - $x$):** Để mô tả trọn vẹn hệ thống tại một thời điểm, ta cần biết "nó đang ở đâu" và "nó đang đi nhanh thế nào".
    $$x=[\theta, \dot{\theta}]^{T} \text{ hay } [q, \dot{q}]$$
* **Input ($u$):**
    * Đây là Mô-men xoắn điều khiển (control torque) tác động vào trục quay.
    * Vai trò: Là tác nhân bên ngoài can thiệp vào hệ thống để thay đổi hành vi tự nhiên của nó.
* **Kernel (Cấu trúc động lực học):** Đây là "bộ xử lý" tự nhiên của hệ thống, chuyển đổi trạng thái hiện tại và đầu vào thành gia tốc tiếp theo. Nó bao gồm 3 khối:
    1.  **Khối Quán tính (Inertial Term - $ml^{2}\ddot{\theta}$):**
        * $ml^{2}$ là Moment quán tính (I). Nó đóng vai trò như "khối lượng" trong chuyển động quay.
        * Nó kháng lại sự thay đổi vận tốc. Hệ số càng lớn, hệ càng "ì".
    2.  **Khối Tiêu tán (Damping Term - $b\dot{\theta}$):**
        * Tuyến tính theo vận tốc.
        * Vai trò: Rút năng lượng khỏi hệ thống, làm hệ thống ổn định dần về trạng thái nghỉ nếu không có $u$.
    3.  **Khối Hồi quy Phi tuyến (Gravitational Term - $mgl \sin \theta$):**
        * Đây là "kẻ gây rối" chính. Hàm $\sin \theta$ làm cho hệ thống trở nên Phi tuyến (Non-linear).
        * Nếu $\theta$ nhỏ, $\sin \theta \approx \theta$ (hệ tuyến tính hóa). Nhưng khi $\theta$ lớn (như khi ta muốn vung con lắc lên đỉnh), tính chất phi tuyến này quyết định tất cả.

 **Output (Phản ứng của hệ thống):**

Về mặt toán học, phương trình trên cho ta tìm được $\ddot{\theta}$ (gia tốc góc).
Từ gia tốc $\ddot{\theta}$ qua phép tích phân theo thời gian, ta cập nhật được vận tốc $\dot{\theta}$ và vị trí $\theta$ cho bước tiếp theo.

In [None]:
import utils_ve_hinh as ve

ve.ve_mo_hinh_con_lac()

## 2.1.2. Bài toán động học thuận


Việc cố tìm ra một công thức toán học $x(t)=...$ cho con lắc đơn là vô cùng khó khăn và không cần thiết.
Lời giải giải tích (Analytical Solution) tồn tại, nhưng nó vô dụng về mặt trực giác kỹ thuật.
Tác giả đề xuất chuyển sang **Phương pháp Đồ thị (Graphical Solution Methods)**.

### Phương pháp Đồ thị
Thay vì hỏi: "Tại thời điểm $t=5s,$ con lắc ở góc nào?" (Khó).
Máy tính sẽ hỏi: "Tại góc $\theta$ và vận tốc $\dot{\theta}$ hiện tại, con lắc sẽ trôi về hướng nào?" (Dễ).

1.  **Vẽ Trường Vector (Vector Field):** Tại mỗi điểm $(x, y)$ trên mặt phẳng toạ độ, vẽ một mũi tên chỉ hướng chuyển động dựa trên phương trình vi phân $\dot{x}=f(x)$.

2.  **Quan sát Dòng chảy (Flow):**
    Nhìn tập hợp các mũi tên, ta thấy được "dòng chảy" của hệ thống.
    * Chỗ nào dòng chảy cuộn tròn? $\rightarrow$ Dao động.
    * Chỗ nào dòng chảy toà ra? $\rightarrow$ Mất ổn định.
    * Chỗ nào dòng chảy tụ lại? $\rightarrow$ Ổn định.

$\rightarrow$ Đây là tư duy định tính (Qualitative), không phải định lượng (Quantitative). Nó cho ta cái nhìn tổng quan (Global view) mà không cần giải phương trình.


# 2.2 Overdamped pendulum



## 2.2.1 Điều kiện của overdamped


Ta có hai loại lực cản trở chuyển động:
1. Lực Ma sát: $F_{damping} \sim b \cdot \dot{\theta}$ (Tỉ lệ với vận tốc).
2. Lực Quán tính: $F_{inertia} \sim ml^{2} \cdot \ddot{\theta}$ (Tỉ lệ với gia tốc).

Ta lựa chọn $b \cdot \dot{\theta} \gg ml^{2} \cdot \ddot{\theta}$ để lực ma sát hoàn toàn áp đảo lực quán tính.
Giả sử con lắc đang dao động với tần số tự nhiên $\omega_{n}=\sqrt{g/l}$.
* Vận tốc đặc trưng $\dot{\theta} \approx \omega_{n}$
* Gia tốc đặc trưng $\ddot{\theta} \approx \omega_{n}^{2}$

Từ đây suy ra điều kiện:
$$b \ge ml^{2}\sqrt{\frac{g}{l}}$$

Khi đó $ml^{2}\ddot{\theta}+b\dot{\theta} \approx b\dot{\theta}$, trải phẳng không gian, đặt biến $\theta=x$ từ đó phương trình động lực học được viết lại là:
$$ml^{2}\ddot{x}+b\dot{x} \approx b\dot{x} = u_{0}-mgl \sin x$$

Với $u_0 = 0$ ta có đồ thị:

In [None]:
import utils_ve_hinh as ve

ve.ve_do_thi_overdamped()

## 2.2.2 Tính ổn định của hệ thống



### 2.2.1. Lý thuyết
* **Fixed point:** là các điểm $x^{*}$ mà tại đó $\dot{x}=0$.
* **Unstable (Mất ổn định):** Giống như đặt hòn bi trên đỉnh quả núi (hoặc cái bát úp ngược).
    * Đẩy nhẹ sang phải $(\delta>0)$: Bi lăn tuột xuống dốc bên phải $(\dot{x}>0 \rightarrow$ xa dần).
    * Đẩy nhẹ sang trái $(\delta<0)$: Bi lăn tuột xuống dốc bên trái $(\dot{x}<0 \rightarrow$ xa dần).
    * Kết luận: Chỉ cần một cú hích nhỏ, nó sẽ bỏ đi mãi mãi.
* **Locally Stable (Ổn định địa phương):** Giống như đặt hòn bi dưới đáy cái bát. Đẩy nhẹ sang phải/trái: Hòn bi sẽ xu hướng lăn quay trở lại đáy.

### 2.2.2. Công thức toán
1. **Lyapunov Stable (Ổn định i.s.L.) - "Không đi lạc"**
   * Định nghĩa: Với mọi $\epsilon>0$ (sân chơi), tồn tại $\delta>0$ (lồng khởi tạo) sao cho: $|x(0)|<\delta \Rightarrow |x(t)|<\epsilon, \forall t \ge 0$.
   * Dịch nghĩa: "Nếu xuất phát đủ gần, nó sẽ mãi mãi ở gần".

2. **Attractive (Hấp dẫn) - "Có quay về"**
   * Định nghĩa: Nếu $|x(0)|<\delta$ thì $\lim_{t\rightarrow\infty}x(t)=0$.
   * Nghịch lý: Một hệ thống có thể Attractive nhưng KHÔNG Stable.

3. **Asymptotically Stable (Ổn định tiệm cận) - "Chuẩn mực"**
   * Công thức: = Lyapunov Stable + Attractive.
   * Dịch nghĩa: "Nó không đi quá xa (Stable) VÀ nó từ từ chui về đích (Attractive)".

4. **Exponentially Stable (Ổn định mũ) - "Về đích thần tốc"**
   * Công thức: $|x(t)| \le C \cdot |x(0)| \cdot e^{-\alpha t}$ (với $\alpha>0$).
   * Vai trò: Đây là "tiêu chuẩn vàng" của kỹ sư điều khiển.

### 2.2.3. Cách thức xác định tính ổn định
1. **Kiểm tra bằng Đạo hàm (Linearization)**
   Với hệ 1 chiều $\dot{x}=f(x)$. Tại điểm cân bằng $x^{*}$ thì $f(x^{*})=0$. Tính đạo hàm $A=\frac{df}{dx}(x^{*})$.
   * if $A>0$: Unstable (Đẩy ra xa).
   * if $A<0$: Locally Asymptotically Stable (Hút về).
   * if $A==0$: Chưa kết luận được.

2. **Kiểm tra bằng Hàm Lyapunov**
   Nếu $V(x)$ dương và đạo hàm $\dot{V}(x)$ âm (năng lượng luôn giảm) $\rightarrow$ Asymptotically Stable.

### 2.2.4. Ví dụ neuron
Phương trình mô tả hệ thống Neuron tự kích thích (Autapse) - mô hình Working Memory:
$$\dot{x}=-x+\tanh(w \cdot x)$$

**Cơ chế lưu trữ (Bifurcation)**:
Điểm mấu chốt nằm ở giá trị của trọng số w (Synaptic Weight):
* **Trường hợp 1: $w<1$ (Quên):**
    Lực rò rỉ $(-x)$ mạnh hơn lực hồi tiếp. Hệ thống chỉ có 1 điểm cân bằng duy nhất tại $x^{*}=0$.
* **Trường hợp 2: $w>1$ (Nhớ):**
    Lực hồi tiếp (tanh) đủ mạnh để thắng lực rò rỉ. Xuất hiện 3 điểm cân bằng:
    1. $x^{*}=0$ (Mất ổn định - Unstable).
    2. $x^{*} \approx +A$ (Ổn định - Stable): Trạng thái "ON".
    3. $x^{*} \approx -A$ (Ổn định - Stable): Trạng thái "OFF".
    $\rightarrow$ Hệ thống trở thành Bistable (Lưỡng ổn định).


In [None]:
import utils_ve_hinh as ve

ve.ve_do_thi_neuron_dynamics()

### **Mô phỏng cơ chế Ghi nhớ (Memory Latching)**

**Phương trình động lực học:**
Hệ thống được mô tả bởi phương trình vi phân sau:

$$\dot{x} = -x + \tanh(w \cdot x) + u(t)$$

**Trong đó:**
* $w > 1$ (Ví dụ chọn $w = 2$): Điều kiện cần để hệ thống có tính chất lưỡng ổn định (bistability), tạo ra 2 điểm cân bằng bền.
* $u(t)$: Tín hiệu đầu vào (xung kích thích điều khiển).

In [None]:
import utils_ve_hinh as ve

ve.ve_do_thi_memory_latching()

**Giải thích hiện tượng trong đồ thị:**

1.  **Giai đoạn $t = 0 \to 10s$ ($u = 0$):**
    Hệ thống xuất phát từ $x_0 = 0.1$. Do $w = 2$ (hệ có tính nhớ), trạng thái $x$ tự động bị hút về điểm cân bằng bền dương ($x \approx +1$, trạng thái "ON").

2.  **Giai đoạn $t = 10 \to 20s$ ($u = -5$):**
    Một lực cưỡng bức âm rất mạnh tác động vào hệ thống. Nó ép trạng thái $x$ chuyển từ mức cao $+1$ xuống vùng âm và tiến về gần $-1$.

3.  **Giai đoạn $t = 20 \to 30s$ ($u = 0$):**
    Ngắt tín hiệu điều khiển. Tuy nhiên, thay vì quay trở về trạng thái ban đầu ($+1$), hệ thống bị "bẫy" (latched) lại ở trạng thái cân bằng bền âm mới ($x \approx -1$, trạng thái "OFF").

$\rightarrow$ **Kết luận:** Đây chính là cơ chế hoạt động của một bit bộ nhớ: Nó lưu giữ trạng thái cuối cùng (ON hoặc OFF) ngay cả khi tín hiệu điều khiển đã biến mất.

# 2.3. Energy-shaping control



## 2.3.1. Ý tưởng


Thay vì tư duy theo kiểu cưỡng bức "tôi muốn tay máy đến điểm A ngay lập tức" (điều khiển vị trí), ta tư duy: "Tôi muốn hệ thống có đủ năng lượng để tự nó văng đến điểm A".

* **Năng lượng tổng (E):** Gồm Động năng + Thế năng.
  $$E(q,\dot{q}) = \frac{1}{2}ml^{2}\dot{\theta}^{2} - mgl \cos \theta$$

* **Mục tiêu ($E_{desired}$):** Ta muốn con lắc có vừa đủ năng lượng để đứng im tại đỉnh. Tại đó, vận tốc bằng 0 và thế năng là cực đại ($mgl$). Vậy $E_{desired}=mgl$.

* **Sai số năng lượng ($\tilde{E}$):**
  $$\tilde{E} = E_{hien\_tai} - E_{desired}$$



## 2.3.2. Implementation



### 3.2.1. Chọn dấu
Đi theo chuỗi logic sau:
1. Quan sát ($\tilde{E}$): Hệ thống đang thừa hay thiếu năng lượng?
2. Ra chiến lược ($\dot{E}$): Cần tăng (bơm) hay giảm (xả) năng lượng?

Đạo hàm của năng lượng theo thời gian (Power – công suất): $\dot{E} = u \cdot \dot{\theta}$.
* Để tăng năng lượng ($\dot{E}>0$): Cần tác dụng lực $u$ cùng dấu với vận tốc $\dot{\theta}$ (đẩy xuôi chiều).
* Để giảm năng lượng ($\dot{E}<0$): Cần tác dụng lực $u$ ngược dấu với vận tốc $\dot{\theta}$ (hãm lại).

### 3.2.2. The Controller
Đề xuất công thức điều khiển phi tuyến sau:
$$u = -k \cdot \dot{\theta} \cdot \tilde{E}$$
(Với k là một hằng số dương).

**Phân tích tại sao công thức hoạt động:**
Thế $u$ vào phương trình biến thiên sai số năng lượng $\tilde{E}$:
$$\dot{\tilde{E}} = \dot{E} = u \cdot \dot{\theta} = (-k \cdot \dot{\theta} \cdot \tilde{E}) \cdot \dot{\theta} = -k \cdot \dot{\theta}^{2} \cdot \tilde{E}$$

Vì $k>0$ và $\dot{\theta}^{2} \ge 0$ nên dấu của $\dot{\tilde{E}}$ luôn ngược dấu với $\tilde{E}$.
* Nếu năng lượng thừa ($\tilde{E}>0$) $\rightarrow$ $\dot{\tilde{E}}<0$ (Năng lượng giảm).
* Nếu năng lượng thiếu ($\tilde{E}<0$) $\rightarrow$ $\dot{\tilde{E}}>0$ (Năng lượng tăng).
$\rightarrow$ Hệ thống tự động hội tụ về mức năng lượng mong muốn theo hàm mũ.



## 2.3.3. Đánh giá

Bộ điều khiển này chỉ quan tâm Năng lượng, không quan tâm Vị trí.
Khi con lắc lên đến đỉnh, $u$ sẽ về 0. Nhưng nếu gió thổi nhẹ làm lệch đi một chút mà vẫn giữ nguyên năng lượng, bộ điều khiển sẽ không can thiệp. Con lắc có thể bị rơi xuống.

**Kết luận:** Nó giỏi việc đưa lên (Swing-up), nhưng dở việc giữ thăng bằng (Balancing).

**Chiến thuật "2 giai đoạn"**:
1. **Giai đoạn 1 (Swing-up):** Dùng Energy Shaping để bơm con lắc từ dưới lên vùng lân cận đỉnh.
2. **Giai đoạn 2 (Balancing):** Khi sai số góc đủ nhỏ (ví dụ $\pm10$ độ), ngắt bộ điều khiển năng lượng, bật bộ điều khiển tuyến tính (như LQR hoặc PD) để khóa cứng vị trí tại đỉnh.