> # $ \textbf{Recall some concepts}$
- $\textcolor{orange}{\large{\text{Transfer Learning}}}$: is an ML technique, in which a model trained on a certain task is used as a starting point for a distinct but similar task. The knowledge gained by a model from solving one problem, can be leveraged to help solve another problem.

- $\textcolor{orange}{\large{\text{Fine Tuning}}}$: is one of the most popular methods used in transfer learning. It involves adapting a pre-trained model to a particular task by training it on a smaller set of task-specific labeled data.

- $\textcolor{orange}{\large{\text{Parameter-efficient Fine-tuning (PEFT)}}}$: aims to fine-tune only a small subset of the model’s parameters, achieving comparable performance to full fine-tuning, while significantly reducing computational requirements, less prone to overfitting

- $\textcolor{orange}{\large{\text{Pre-trained models}}}$: are machine learning models that have been trained on large amounts of data to facilitate a specific task, such as image classification, speech recognition, NLP,...

- $\textcolor{red}{{\text{Difference between fine-tuning and PEFT:}}}$

    ![image.png](attachment:image.png)

$\textcolor{orange}{\large{\text{1. Lợi ích của PEFT}}}$ 

- Decreased computational and storage costs

- Overcoming catastrophic forgetting: During full fine-tuning of LLMs, catastrophic forgetting can occur where the model forgets the knowledge it learned during pretraining 

- Better performance in low-data regimes

- Performance comparable to full fine-tuning

- Portability: The trained weights from PEFT approaches easy to deploy and use for multiple tasks without replacing the entire model.


$\textcolor{orange}{\large{\text{2. Bản chất}}}$

- Về bản chất, fine-tuning là quá trình sửa đổi các hidden representations của pre-trained model, để làm cho nó phù hợp hơn với các tasks tiếp theo:

    + Trước khi fine-tuning, transformer model tính toán hidden representations (h) của mỗi token trong sentence. 

    + Sau khi fine-tuning, các tham số dc cập nhật, và chúng sẽ tạo ra tập các hidden representations khác (h')

    + Chỉ fine-tuning 1 phần nhỏ các tham số thường là đủ để thay đổi h -> h'


> # $\textbf{PEFT Techniques}$

$\textcolor{orange}{\large{\text{1. Adapter}}}$

- Thêm adapters sau multi-head attention và feed-forward layers trong transformer architecture, ta có thể update chỉ các tham số trong adapters trong quá trình fine-tuning, trong khi vẫn giữ cố định các params còn lại của mô hình.

- Ta thêm adapters vào từng transformer layer, và đặt 1 classifier layer ở đầu pre-trained model. Bằng cách update params của adapters và classifier trên, ta có thể cải thiện performance của pre-trained model

- Adapter bao gồm: 
    + 2 feed-forward layers, kết nối với 1 non-linear activation layer
    + 1 skip-connection

- Input của adapter: hidden representation h. Ở đây h có 2 đường dẫn khác nhau trong adapter layer:
    + Một là skip-connection: giữ nguyên h
    + Hai là liên quan đến feed-forward layers
    
    ![image-2.png](attachment:image-2.png)


$\textcolor{orange}{\large{\text{2. LoRA (Low-Rank Adaption)}}}$
- LoRA liên quan đến việc giảm kích thước của ma trận params cần train = cách chia thanh các ma trận nhỏ, sao cho nhân lại = ma trận ban đầu; giảm đáng kể params cần sửa đổi 
    + ![image-4.png](attachment:image-4.png)
- LoRA được thêm vào song song với với các feed-forward layers trong pre-trained transformer model
    + Một feed-forward layer có 2 projection layers (chiếu input vào ko gian có số chiều khác), và 1 non-linear activation func
    + Các LoRA layers đc thêm bên cạnh mỗi projection layers
    + Tương tự với Adapter, thêm các LoRA modules và 1 classifier layer ở đầu pre-trained model, update params của chúng, sẽ giúp cải thiện performance

        ![image.png](attachment:image.png)
    
    ![image-3.png](attachment:image-3.png)

$\textcolor{orange}{\large{\text{3. Prefix tuning}}}$
- Prefix-tuning giữ hầu hết các params của model cố định, và tối ưu hóa prefix, từ đó thay đổi hidden representations. Ở đây, prefix là 1 tập nhỏ các params, và chỉ prefix đc cập nhật

    ![image.png](attachment:image.png)

$\textcolor{orange}{\large{\text{4. Prompt tuning}}}$
- Prompt tuning bao gồm việc học soft prompts thông qua backpropagation, và có thể fine-tuning cho các tasks cụ thể
- Nó yêu cầu lưu trữ một small task-specific prompt cho từng tasks. Đây là biến thể đơn giản hơn của Prefix tuning.
    + Một số vector đc thêm vào sequence ở input layer
    + Tiếp theo, làm tương tự như transformer model thông thường
    + Chỉ phần thêm vào đc tinh chỉnh trong quá trình fine-tuning, trong khi phần còn lại giữ nguyên

    + ![image-2.png](attachment:image-2.png)

$\textcolor{orange}{\large{\text{5. P-tuning}}}$

$\textcolor{orange}{\large{\text{6. IA3 (Infused Adapter by Inhibiting and Amplifying Inner Activatiosn)}}}$

