Language Classification

Dil tespiti için modelleme.

Geliştirme Aşamaları

1. Konuyla ilgili bir web crawler geliştirildi ve ilgili veriler YouTube üzerinden toplandı.

2. Toplanan veriler uzerinde yapılan pre-processing işlemleri:

Ses dosyasi mp3 formatindan wav formatina cevrildi.
44.1kHz’den 16kHz’ e resample edildi.
Sessiz olan kisimlar filtrelendi.
Gurultu azaltildi.
Ses normalizasyonu yapildi.
10 saniyelik parcalara bolundu.

3. Modelleme aşamasında 4 farkli transformator modeli kullanildi.

4. Her model için loss-epoch graph, confusion matrix, training time, inference time, accuracy, precision, recall, sensitivity, specificity, f1 score ve roc curve cikarildi.

Sınıflar

Sınıf	Veri Sayısı
Arabic	3614
Chinese	4270
English	5132
French	4339
Hindi	5515

Modeller

Kullanilan Modeller	Overall Accuracy
Hubert	99.9%
Wav2Vec2	99.8%
SEW	99.8%
UniSpeech	99.8%
AST	99.8%

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
211307020_Rapor.pdf		211307020_Rapor.pdf
README.md		README.md
ast_language_classification.ipynb		ast_language_classification.ipynb
cleaner.py		cleaner.py
crawler.py		crawler.py
hubert_language_classification.ipynb		hubert_language_classification.ipynb
sew_language_classification.ipynb		sew_language_classification.ipynb
split-audio.py		split-audio.py
unispeech_language_classification.ipynb		unispeech_language_classification.ipynb
wav2vec2_language_classification.ipynb		wav2vec2_language_classification.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Language Classification

Geliştirme Aşamaları

Sınıflar

Modeller

Linkler

About

Uh oh!

Releases

Packages

Languages

x-x00/language-classification

Folders and files

Latest commit

History

Repository files navigation

Language Classification

Geliştirme Aşamaları

Sınıflar

Modeller

Linkler

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages