- Proje Hakkında
- Gerçekleştirilen Algoritmalar
- Veri Seti Filtreleri
- Uygulamadan görseller
- Lisans
- Geliştiriciler
Kullanıcıların Yazılım, Makine Öğrenmesi gibi teknolojiler bilmesine gerek kalmaksızın hizmet sağlanabilmesini konu alan UTMA Otomatik Makine Öğrenmesi Platformu, Makine Öğrenmesi algoritmalarının Web Sitesinde otomatik olarak sunulması olarak tanımlanmaktadır. Bu sistem sayesinde veri bilimi algoritmaları web sitesinde sunulur. Bu algoritmaların optimizasyonları yapılır ve hangi modelin seçileceği otomatik olarak belirlenir Bu çalışma ile Weka ve BigMl benzeri bir uygulama geliştirilmiştir. Burada kullanıcının işlemleri rahatça yapabilmesi ve yaptığı işlemi anlayabilmesi için görselleştirme tekniklerinden faydalanılmıştır.
- Angular
- Angular Material
- Django
- Django Rest Framework
- Django JWT Validator
- Numpy
- Pandas
- Scikit-learn
- Hyperopt
- Hyperopt-sklearn
- Supervised Learning
- Classification Models
- AdaBoost Classifier
- Decision Tree
- Gaussian Naive Bayes
- Gradient Boosting Classifier
- KNN
- Logistic Regression
- Random Forest Classifier
- SVM Classification
- Regression Models
- AdaBoost Regressor
- Bayesian Rigde Regression
- Gradient Boosting Regressor
- Lasso Regression
- Linear Regression
- Random Forest Regressor
- SGD Regression
- Classification Models
- Unsupervised Learning
- DBSCAN
- Hierarchical Clustering
- K-Means
- Univariate Time Series
- Auto Arima Univariate Forecasting
- Auto Ets Univariate Forecasting
- Double Exponential Smoothing
- Exponenial Univariate Forecasting
- Load And Visualize Time Data
- Simple Exponental Smoothing
- Triple Exponential Smoothing
Kullanıcıların veri seti oluştururken, veri setindeki alanları hızlı bir şekilde manipüle etmesine olanak sağlarlar.
Etiket kodlama filtresi ile kategorik özelliklerimizin algoritma tarafından anlaşılabilecek şekilde sayısal biçime dönüştürmeye yarar. Kategorik değerler ve oluşturulacak sayısal değerler arasında ilişki bulunmaz. Bu yüzden rastgele bir sırayla her farklı kategoriye denk, tekrar etmeyecek şekilde sayısal değerler oluşturur.
Etiket kodlama gibi bu kodlamada da kategorik sayısala dönüştürülür. Bu filtre her bir kategorik değerin kaç kere tekrar ettiği bulur. Diğer tüm kategorilerle yüzdelik olarak dağılımları hesaplanır ve o kategorik değerler yerine bu dağılımdan ortaya çıkan 0-1 aralığında değerler yazılır.
One-hot kodlama filtresi ile kategorik değerlerden oluşan sütunları ikili değerler olarak temsil edilebilir hale getirir. Öncelikle her kategorik değeri tamsayı değerleriyle eşleştirir. Daha sonra her bir tamsayı değeri 1 ile işaretler ve işaretlenmiş tamsayı indeksi dışındaki tüm değerleri sıfır olan bir vektör olarak temsil edilir hale getirir.
One-hot kodlama filtresi kategorik değer sayısı yüksek olan sütunlarda kullanıldığında çok fazla yeni sütun oluşturacağından binary kodlama filtresi kullanılabilir. Bu filtre tüm kategorik değerleri 1’den başlayarak artan tamsayılar ile eşleştirir. Daha sonra tamsayı değerler ikili sayı sistemi karşılığına çevrilir. Ortaya çıkan ikili sayıların hane sayısı kadar yeni sütun oluşturulur. İkili sayıların değerlerini bu sütunlara yazan hale çevirir.
Tarih değerleri içeren bir sütun seçilerek bu filtre kullanılabilir. Filtre bir sütun için kullanıldığında o sütundaki tarihi değerleri 1 Ocak 1970’ten, o tarihe kadar geçen saniye karşılıklarına çevirir.
Bu filtre veri setinde seçilen bir sütundaki eksik alanları doldurmayı sağlar. Üç farklı yöntem ile bu filtre kullanılabilir.
Filtre rastgele seçeneği ile kullanıldığında seçilen sütundaki tüm boş alanları rastgele değerler ile doldurmayı sağlar.
Seçilen sütun bir sayısal sütun ise eksik olan alanları o sütunun ortalama değerine göre doldurur. Kategorik verilerden oluşan bir sütün ise kategorik değerlerin frekans oranları optimum düzeyde sabit tutmaya çalışarak doldurur.
Bu filtre seçilen sütundaki değerleri kullanıcının girdiği sabit bir değer ile doldurmaya yarar.
Bu filtre kullanılarak bir sütundaki tekrar eden yani eşsiz olmayan değerlere sahip satırlar silinebilir.
Bu filtre kullanılarak bir sütundaki tekrar eden yani eşsiz olmayan değerlere sahip satırlar silinebilir.
Bu filtre sayısal verilerden oluşan sütunlar veri silmeyi ve veri setini küçültmeyi sağlar. Kullanıcıdan alınan aralık değerlerinin içinde kalan tüm satırları silmeye yarar.
.csv veya .xslx formatında olan verisetinizi isimlendirerek ekleyin.
Bu aşamada oluşturduğunuz veri setindeki kategorik alanları görüntüleyebilir veya seçtiğiniz kategori üzerinde filtreleri uygulayabilirsiniz.
Bu aşamada oluşturduğunuz veri setindeki nümerik alanları görüntüleyebilir veya seçtiğiniz nümerik veri sütunu üzerinde eksik alan doldurma filtrelerini uygulayabilirsiniz.
Veri seti ekleme sürecinin son kısmında tüm veri setinizi görüntüleyebilir, aynı zamanda ekleme, filtreleme, düzenleme veya silme işlemlerini yapabilirsiniz.
Oluşturduğunuz tüm veri setlerini görüntüleyebilir veya düzenleyebilirsiniz.
Daha önceden ayarladığınız herhangi bir veri setini, istediğiniz bir makina öğrenmesi algoritması ile çalıştırmak üzere sıraya alır.
Beklemede olan, aktif halde veya tamamlanmış olan görevleri listeler.
Tamamlanan görevin sonuçlarını, görselleştirmelerini, raporlarını veya optimize edilmiş halini görüntüler.
Tamamlanan görev sonucunun varsayılan ve optimize edilmiş halinin sınıf görselleştirmesi.
Tamamlanan görev sonucunun varsayılan ve optimize edilmiş halinin sınıflandırma raporu.
Tamamlanan görev sonucunun olarak optimum verim için kullanılması gereken parametreleri listeler.
Distributed under the MIT License. See LICENSE for more information.
Hakan Eryücel - hakanerycl@gmail.com
Muhammet Çepi - muhammettarikcepi@gmail.com
Rayan Alheraki - rayyanalhiraki3@gmail.com
Mahsun Akay - akaymuxin.ma@gmail.com