Skip to content

mfakca/Python-Automatically-Data-Preprocessing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

Python-Automatically-Data-Preprocessing

Automatically data preprocessing with Python tkinter.

!!! Lemmatization işlemini yapmak için bilgisayarınızda JAVA Development Kit kurulu ve PATH eklenmesi lazım.

Metin Madenciliği projelerinde genellikle yapısal olmayan veriler üzerinde işlem yapmamız gerekir. Yapısal olmayan verilerden anlam çıkartmak için verileri işlenebilir hale getirmemiz gerekmektedir.Bu uygulama bu işlemleri otomatik bir şekilde yapmanızı sağlıyor.Bu işlemleri kısaca şu şekilde açıklayabilirim.

1-)Tokenization: Metni istenilen şekilde (genellikle kelime kelime) parçalayarak dizilere (array) kaydetmek.

2-)Removing Stop Words: Metin içerisinde geçen, alamda herhangi bir değişiklik yapmayan kelimelerin atılması.(bazı,ya,da gibi kelimeler)

3-)Removing punctuation and digits: Metin içerisindeki noktalama işaretleri ve sayıların çıkartılması.

4-)Normalization: Metindeki büyük küçük harf ayrımının ortadan kaldırması.

5-)Stemming: Metinde geçen kelimelerdeki eklerin atılarak kelime köklerinin kaydedilmesi.

About

Automatically data preprocessing with Python tkinter.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages