Skip to content
/ utma Public

Programlama bilgisi gerektirmeden online bir şekilde makine öğrenmesi uygulamaları yapmaya olanak sağlayan bir platform.

License

Notifications You must be signed in to change notification settings

eryucel/utma

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Logo

UTMA Machine Learning Platform

İçerik

  1. Proje Hakkında
  2. Gerçekleştirilen Algoritmalar
  3. Veri Seti Filtreleri
  4. Uygulamadan görseller
  5. Lisans
  6. Geliştiriciler


Proje Hakkında

Özet

Kullanıcıların Yazılım, Makine Öğrenmesi gibi teknolojiler bilmesine gerek kalmaksızın hizmet sağlanabilmesini konu alan UTMA Otomatik Makine Öğrenmesi Platformu, Makine Öğrenmesi algoritmalarının Web Sitesinde otomatik olarak sunulması olarak tanımlanmaktadır. Bu sistem sayesinde veri bilimi algoritmaları web sitesinde sunulur. Bu algoritmaların optimizasyonları yapılır ve hangi modelin seçileceği otomatik olarak belirlenir Bu çalışma ile Weka ve BigMl benzeri bir uygulama geliştirilmiştir. Burada kullanıcının işlemleri rahatça yapabilmesi ve yaptığı işlemi anlayabilmesi için görselleştirme tekniklerinden faydalanılmıştır.



Kullanılan Teknolojiler



Gerçekleştirilen Algoritmalar

  1. Supervised Learning
    1. Classification Models
      • AdaBoost Classifier
      • Decision Tree
      • Gaussian Naive Bayes
      • Gradient Boosting Classifier
      • KNN
      • Logistic Regression
      • Random Forest Classifier
      • SVM Classification
    2. Regression Models
      • AdaBoost Regressor
      • Bayesian Rigde Regression
      • Gradient Boosting Regressor
      • Lasso Regression
      • Linear Regression
      • Random Forest Regressor
      • SGD Regression
  2. Unsupervised Learning
    • DBSCAN
    • Hierarchical Clustering
    • K-Means
  3. Univariate Time Series
    • Auto Arima Univariate Forecasting
    • Auto Ets Univariate Forecasting
    • Double Exponential Smoothing
    • Exponenial Univariate Forecasting
    • Load And Visualize Time Data
    • Simple Exponental Smoothing
    • Triple Exponential Smoothing


Veri Seti Filtreleri

Kullanıcıların veri seti oluştururken, veri setindeki alanları hızlı bir şekilde manipüle etmesine olanak sağlarlar.

Etiket Kodlama

Etiket kodlama filtresi ile kategorik özelliklerimizin algoritma tarafından anlaşılabilecek şekilde sayısal biçime dönüştürmeye yarar. Kategorik değerler ve oluşturulacak sayısal değerler arasında ilişki bulunmaz. Bu yüzden rastgele bir sırayla her farklı kategoriye denk, tekrar etmeyecek şekilde sayısal değerler oluşturur.

Frekans Kodlama

Etiket kodlama gibi bu kodlamada da kategorik sayısala dönüştürülür. Bu filtre her bir kategorik değerin kaç kere tekrar ettiği bulur. Diğer tüm kategorilerle yüzdelik olarak dağılımları hesaplanır ve o kategorik değerler yerine bu dağılımdan ortaya çıkan 0-1 aralığında değerler yazılır.

One-hot Kodlama

One-hot kodlama filtresi ile kategorik değerlerden oluşan sütunları ikili değerler olarak temsil edilebilir hale getirir. Öncelikle her kategorik değeri tamsayı değerleriyle eşleştirir. Daha sonra her bir tamsayı değeri 1 ile işaretler ve işaretlenmiş tamsayı indeksi dışındaki tüm değerleri sıfır olan bir vektör olarak temsil edilir hale getirir.

Binary Kodlama

One-hot kodlama filtresi kategorik değer sayısı yüksek olan sütunlarda kullanıldığında çok fazla yeni sütun oluşturacağından binary kodlama filtresi kullanılabilir. Bu filtre tüm kategorik değerleri 1’den başlayarak artan tamsayılar ile eşleştirir. Daha sonra tamsayı değerler ikili sayı sistemi karşılığına çevrilir. Ortaya çıkan ikili sayıların hane sayısı kadar yeni sütun oluşturulur. İkili sayıların değerlerini bu sütunlara yazan hale çevirir.

Tarih Nümerik Çevirici

Tarih değerleri içeren bir sütun seçilerek bu filtre kullanılabilir. Filtre bir sütun için kullanıldığında o sütundaki tarihi değerleri 1 Ocak 1970’ten, o tarihe kadar geçen saniye karşılıklarına çevirir.

Eksik Alan Doldurma

Bu filtre veri setinde seçilen bir sütundaki eksik alanları doldurmayı sağlar. Üç farklı yöntem ile bu filtre kullanılabilir.

Rastgele

Filtre rastgele seçeneği ile kullanıldığında seçilen sütundaki tüm boş alanları rastgele değerler ile doldurmayı sağlar.

Ortalamaya Göre

Seçilen sütun bir sayısal sütun ise eksik olan alanları o sütunun ortalama değerine göre doldurur. Kategorik verilerden oluşan bir sütün ise kategorik değerlerin frekans oranları optimum düzeyde sabit tutmaya çalışarak doldurur.

Sabit

Bu filtre seçilen sütundaki değerleri kullanıcının girdiği sabit bir değer ile doldurmaya yarar.

Ortalama Düzenleme

Bu filtre kullanılarak bir sütundaki tekrar eden yani eşsiz olmayan değerlere sahip satırlar silinebilir.

Tekrarları Kaldırma

Bu filtre kullanılarak bir sütundaki tekrar eden yani eşsiz olmayan değerlere sahip satırlar silinebilir.

Aralığa Göre Veri Silme

Bu filtre sayısal verilerden oluşan sütunlar veri silmeyi ve veri setini küçültmeyi sağlar. Kullanıcıdan alınan aralık değerlerinin içinde kalan tüm satırları silmeye yarar.


Uygulamadan Görseller

Veri Seti Ekleme

.csv veya .xslx formatında olan verisetinizi isimlendirerek ekleyin. Veri Seti Ekleme

Kategorik Veri Düzenleme

Bu aşamada oluşturduğunuz veri setindeki kategorik alanları görüntüleyebilir veya seçtiğiniz kategori üzerinde filtreleri uygulayabilirsiniz. Kategorik Veri Düzenleme

Nümerik Veri Düzenleme

Bu aşamada oluşturduğunuz veri setindeki nümerik alanları görüntüleyebilir veya seçtiğiniz nümerik veri sütunu üzerinde eksik alan doldurma filtrelerini uygulayabilirsiniz. Nümerik Veri Düzenleme

Veri Satırı Düzenleme

Veri seti ekleme sürecinin son kısmında tüm veri setinizi görüntüleyebilir, aynı zamanda ekleme, filtreleme, düzenleme veya silme işlemlerini yapabilirsiniz. Veri Satırı Düzenleme

Veri Setlerini Görüntüleme

Oluşturduğunuz tüm veri setlerini görüntüleyebilir veya düzenleyebilirsiniz. Veri Setlerini Görüntüleme

Görev Ekleme

Daha önceden ayarladığınız herhangi bir veri setini, istediğiniz bir makina öğrenmesi algoritması ile çalıştırmak üzere sıraya alır. Görev Ekleme

Görevleri Görüntüleme

Beklemede olan, aktif halde veya tamamlanmış olan görevleri listeler. Görevleri Görüntüleme

Sonuç Görüntüleme

Tamamlanan görevin sonuçlarını, görselleştirmelerini, raporlarını veya optimize edilmiş halini görüntüler. Sonuç Görüntüleme

Sınıf Görselleştirmesi Sonucu

Tamamlanan görev sonucunun varsayılan ve optimize edilmiş halinin sınıf görselleştirmesi. Sınıf Görselleştirmesi Sonucu

Sınıflandırma Raporu Sonucu

Tamamlanan görev sonucunun varsayılan ve optimize edilmiş halinin sınıflandırma raporu. Sınıflandırma Raporu Sonucu

Optimum Parametreler Sonucu

Tamamlanan görev sonucunun olarak optimum verim için kullanılması gereken parametreleri listeler. Optimum Parametreler Sonucu


Lisans

Distributed under the MIT License. See LICENSE for more information.

Geliştiriciler

Hakan Eryücel - hakanerycl@gmail.com LinkedIn

Muhammet Çepi - muhammettarikcepi@gmail.com LinkedIn

Rayan Alheraki - rayyanalhiraki3@gmail.com LinkedIn

Mahsun Akay - akaymuxin.ma@gmail.com LinkedIn

About

Programlama bilgisi gerektirmeden online bir şekilde makine öğrenmesi uygulamaları yapmaya olanak sağlayan bir platform.

Topics

Resources

License

Stars

Watchers

Forks

Contributors 4

  •  
  •  
  •  
  •