Modelling

Repo Training Model

List PreProcessing Inside Repository

Tokenizer

Tokenizer menggunakan python dengan lib nltk dan pandas
Tokenizer menggunakan Golang

Stemming

Stemming data menggunakan PortStemmer py
Stemming menggunakan Sastrawi Untuk bahasa indonesia
Stemming Go-Sastrawi Menggunakan golang
Normalisasi Imbuhan kata mu (seperti: dirimu menjadi diri kamu)

Struktur cleaning folder

--- cleaning
    --- jaro
    --- bagWords
    --- sastrawi

Questionable Directory

Jaro Winkler
- Jaro Winkler digunakan untuk mengukur ketepatan atau kesamaan antara kata yang diberikan user dengan kata yang ada pada kalimat dataset
Bag Of Words
- Bag-of-words digunakan untuk menghitung kata dalam kalimat
Sastrawi
- Biasa digunakan untuk melakukan stemming kalimat dalam data (khususnya bahasa indonesia)

Model yang digunakan

Indo-Bert
Stacked-LSTM
Regexp Queries (golang) (Low Cost Modelling)

Documentation

Untuk Regexp Queries :

   primitive.Regex{pattern: "string", options:"i"}

sertakan primitve.regex ke dalam bson.M atau bson.D maka string yang dimasukan baik itu lowercase atau UpperCase akan otomatis menyesuaikan sesuai urutan hurufnya . Pada kasus ini kami menggunakan multiple filter pada fungsi query kami sehingga menjadi:

	queries = Stemmer(queries)
	splits := strings.Split(queries, " ")
	if len(splits) >= 5 {
		queries = splits[len(splits)-3] + " " + splits[len(splits)-2] + " " + splits[len(splits)-1]
		filter := bson.M{"questions": primitive.Regex{Pattern: queries, Options: "i"}}

dengan melakukan split dari setiap kata yang ada dan mengambil secara bertahap urutan kata dari setiap kalimat yang dimasukan (full code can be accessed on : kimseokgis/backend-ai/helper/mongo.go)

Why Using regexp?

Keterbatasan GPU dan device mendorong kami menggunakan regex untuk mempermudah ketersediaan chatbot yang kami buat

How to Use the Python?

Untuk merunning stacked-LSTM bisa dilakukan dengan cara:

 $ cd Stacked-LSTM
 $ python lstm.py

pastikan requirement library sudah diisi, dengan isi sebagai berikut :

numpy
pandas
requests
Sastrawi
keras
keras_preprocessing

Kemudian jalankan perintah

   $ pip install -r requirements.txt

Untuk bert bisa masuk ke folder bert dengan cara:

 $ cd bert
 $ python model.py

untuk menjalankan script python lainnya bisa menggunakan :

 $ cd <folder>
 $ python <namafile.py>

Name		Name	Last commit message	Last commit date
Latest commit History 403 Commits
.idea		.idea
Stacked-LSTM		Stacked-LSTM
bert		bert
cleaning		cleaning
modelling		modelling
random		random
stemming		stemming
tokenizer		tokenizer
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Modelling

List PreProcessing Inside Repository

Questionable Directory

Model yang digunakan

Documentation

Why Using regexp?

How to Use the Python?

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Modelling

List PreProcessing Inside Repository

Questionable Directory

Model yang digunakan

Documentation

Why Using regexp?

How to Use the Python?

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages