## Install

In [11]:
%%capture

# VQDA
!pip install git+https://github.com/sangcamap/vqda.git

# Model
!git clone https://huggingface.co/SCM-LAB/vietnamese_word_embedding_5000
!git clone https://huggingface.co/SCM-LAB/vietnamese_question_paraphrasing_ViT5_base

In [12]:
from vqda import vqda
from pprint import pprint

## Configure

In [13]:
nlp = vqda(
    # word_embedding_model = './vietnamese_word_embedding_5000', 
    # question_paraphrasing_model = './vietnamese_question_paraphrasing_ViT5_base',
)

## Usage

In [14]:
question = "Tại sao người ta dùng giun đất làm mồi câu cá?"

### RD (Random Deletion)

In [15]:
pprint(nlp.RD(question, n_aug = 5))

['Tại sao người ta dùng giun đất làm mồi câu?',
 'Người ta dùng làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta giun đất câu cá?']


### RS (Random Swap)

In [16]:
pprint(nlp.RS(question, n_aug = 5))

['Tại sao dùng người ta giun đất mồi làm câu cá?',
 'Tại sao người ta dùng làm câu mồi giun đất cá?',
 'Người ta Tại sao làm giun đất dùng mồi câu cá?',
 'Tại sao cá dùng người ta làm mồi câu giun đất?',
 'Tại sao làm dùng người ta giun đất mồi câu cá?']


### RI (Random Insertion) 

In [17]:
pprint(nlp.RI(question, n_aug = 5))

['Tại sao chúng người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi chúng câu cá?',
 'Tại sao người ta dùng giun đất làm mồi Người ta câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu câu văn cá?',
 'Chúng Tại sao người ta dùng giun đất làm mồi câu cá?']


### SR (Synonym Replacement)

In [18]:
pprint(nlp.SR(question, n_aug = 5))

['Tại sao người ta dùng giun đất làm cá đuối câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu cá bống?',
 'Tại sao chúng dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu cá đuối?',
 'Tại sao người ta dùng giun đất làm linh cẩu câu cá?']


### QP (Question Paraphrasing)

In [19]:
pprint(nlp.QP(question, n_aug = 5))

['Vì sao người ta dùng giun đất làm mồi câu cá?',
 'Tại sao người ta dùng giun đất làm mồi câu cá?',
 'Lý do người ta dùng giun đất làm mồi câu cá?',
 'Vì sao người ta sử dụng giun đất làm mồi câu cá?',
 'Vì sao người ta dùng giun đất để câu cá?']


### BT (Back Translation)

In [20]:
pprint(nlp.BT(question))

['Tại sao mọi người sử dụng giun đất làm mồi câu cá?']
