## Install

In [None]:
%%capture

# VQDA
!pip install git+https://github.com/sangcamap/vqda.git

# Model
!git clone https://huggingface.co/SCM-LAB/vietnamese_word_embedding_5000
!git clone https://huggingface.co/SCM-LAB/vietnamese_question_paraphrasing_ViT5_base

In [None]:
from vqda import vqda
from pprint import pprint

## Configure

In [None]:
nlp = vqda(
    # word_embedding_model = './vietnamese_word_embedding_5000', 
    # question_paraphrasing_model = './vietnamese_question_paraphrasing_ViT5_base',
)

## Usage

In [None]:
question = "Tại sao người ta dùng giun đất làm mồi câu cá?"

### RD (Random Deletion)

In [None]:
pprint(nlp.RD(question, n_aug = 5))

['Tại sao người ta dùng cá làm giun đất câu mồi?',
 'Tại sao người ta giun đất dùng làm câu mồi cá?',
 'Tại sao người ta giun đất dùng câu mồi làm cá?',
 'Cá Tại sao dùng giun đất làm mồi câu người ta?',
 'Tại sao người ta làm giun đất dùng mồi cá câu?']


### RS (Random Swap)

In [None]:
pprint(nlp.RS(question, n_aug = 5))

['Nhím biển Tại sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta nhím biển dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi cá đuối câu cá?',
 'Chúng Tại sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng Làm giun đất làm mồi câu cá?']


### RI (Random Insertion) 

In [None]:
pprint(nlp.RI(question, n_aug = 5))

['Người ta thường dùng cụm từ gì để biểu đạt?',
 'Người ta thường dùng từ ngữ biểu đạt là gì?',
 'Người ta thường dùng cụm từ gì để gọi?',
 'Người ta thường dùng cụm từ gì để biểu diễn?',
 'Người ta thường dùng từ ngữ biểu đạt gì để nói?']


### SR (Synonym Replacement)

In [None]:
pprint(nlp.SR(question, n_aug = 5))

['Vì sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao Người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta Dùng giun đất làm mồi câu cá?',
 'Tại sao người ta áp dụng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng nhím biển làm mồi câu cá?']


### QP (Question Paraphrasing)

In [None]:
pprint(nlp.QP(question, n_aug = 5))

['Vì sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu cá?',
 'Lý do người ta dùng giun đất làm mồi câu cá?',
 'Vì sao người ta sử dụng giun đất làm mồi câu cá?',
 'Vì sao người ta dùng giun đất để câu cá?']


### BT (Back Translation)

In [None]:
pprint(nlp.BT(question))

['Tại sao mọi người sử dụng giun đất làm mồi câu cá?']
