Bu proje, bir hava yolu şirketinin müşteri memnuniyetini analiz etmek için gerçekleştirilmiştir. İki aşamalı bir süreci kapsar: veri analizi ve makine öğrenimi algoritmalarının uygulanması. İlk aşamada, hava yolu şirketinin yolcu verileri incelenir ve temizlenir. İkinci aşamada ise, temizlenmiş veri üzerinde çeşitli makine öğrenimi algoritmaları kullanılarak müşteri memnuniyeti tahmini yapılır.
- Eksik Veri Doldurma: Eksik veriler, ilgili sütunların ortalamasıyla doldurulmuştur.
- Gereksiz Sütunların Silinmesi: Analiz için gereksiz olduğu belirlenen sütunlar veri setinden çıkarılmıştır.
- Kategorik Değişkenlerin Etiketlenmesi: Makine öğrenimi algoritmaları için gerekli olan kategorik değişkenler sayısal değerlere dönüştürülmüştür.
- Korelasyon Matrisi Çıkarılması: Veri setindeki değişkenler arasındaki ilişkileri görselleştirmek için bir korelasyon matrisi oluşturulmuştur.
- Tekrar Eden Satırların Bulunması: Veri setindeki tekrar eden satırlar tespit edilmiş ve raporlanmıştır.
- Keman Grafiği Çizimi: Müşteri memnuniyeti ile yaş, cinsiyet gibi değişkenler arasındaki ilişkiyi gösteren keman grafiği çizilmiştir.
- Histogramlar: Veri setindeki değişkenlerin dağılımını gösteren histogramlar oluşturulmuştur.
- Neural Network (Yapay Sinir Ağı): Yapay Sinir Ağı modeli, veri seti üzerinde eğitilmiş ve müşteri memnuniyeti tahmini için kullanılmıştır.
- Rastgele Orman (Random Forest): Veri seti üzerinde rastgele orman algoritması uygulanmıştır.
- Lojistik Regresyon: Temel bir sınıflandırma modeli olan lojistik regresyon kullanılarak müşteri memnuniyeti tahmini yapılmıştır.
- Karar Ağacı (Decision Tree): Karar ağacı algoritması ile model eğitilmiş ve sonuçlar değerlendirilmiştir.
- K-En Yakın Komşu (KNN): KNN algoritması ile model eğitilmiş ve performansı ölçülmüştür.
- XGBoost: Güçlü bir sınıflandırma algoritması olan XGBoost kullanılarak model eğitilmiştir.
- Gradient Boosting (Gradyan Artırma): Gradyan Artırma yöntemi, zayıf öğrenicilerin (genellikle karar ağaçları) bir araya getirilerek güçlü bir öğrenici oluşturulmasını sağlar. Bu çalışmada, Gradyan Artırma sınıflandırma algoritması, müşteri memnuniyetini tahmin etmek için kullanılmış ve modelin performansını artırmak için veri setindeki karmaşıklığı ele almak için etkili bir yöntem olarak benimsenmiştir.
- Gaussian Naive Bayes (Gauss Naif Bayes): Gauss Naif Bayes sınıflandırma algoritması, sınıflandırma problemlerinde sıkça kullanılan basit ancak etkili bir olasılık tabanlı yöntemdir. Bu çalışmada, Gauss Naif Bayes algoritması kullanılarak müşteri memnuniyeti tahmini gerçekleştirilmiştir. Naif Bayes'in temel varsayımları nedeniyle, veri setindeki özellikler arasındaki bağımsızlık varsayımı gereği bu algoritmanın performansı bazı durumlarda diğer karmaşık modellere kıyasla daha düşük olabilir. Ancak, bazı uygulamalarda hızlı eğitim ve tahmin avantajları sağlayabilir.
-
Gerekli Kütüphanelerin Kurulumu: Projeyi çalıştırmak için gerekli olan kütüphaneleri
requirements.txt
dosyasını kullanarak kurun.pip install -r requirements.txt
-
Veri Setlerinin İndirilmesi: Projeyi çalıştırmak için gerekli olan eğitim ve test veri setlerini sağlayan bağlantılardan indirin ve uygun bir dizine kaydedin.
-
Ana Kodun Çalıştırılması:
proje.py
dosyasını çalıştırarak projeyi başlatın.python proje.py
Projeden elde edilen ayrıntılı sonuçları içeren çıktıyı rapor
'da bulabilirsiniz.
- GitHub'dan projeyi klonlayın veya çatallayın.
- Yeni bir dal oluşturun ve değişikliklerinizi yapın.
- Değişikliklerinizi kaydedin ve ana depoya gönderin.
- Bir çekme isteği oluşturun ve proje sahibine gönderin.
- Çekme isteğinin incelenmesini bekleyin ve kabul edilmesini bekleyin.
Bu projenin hazırlanmasında aşağıdaki kaynaklar kullanılmıştır: