In [11]:
import pandas as pd

# Verileri yükleyelim
train = pd.read_csv('train.csv')
test = pd.read_csv('test_x.csv')

# 1. Basvuru Yili
print("Basvuru Yili eksik veri sayısı:", train['Basvuru Yili'].isnull().sum())
print("Basvuru Yili eşsiz değerler:", train['Basvuru Yili'].unique())

# 2. Degerlendirme Puani (hedef değişken - sadece eğitim verisinde var)
print("Degerlendirme Puani eksik veri sayısı:", train['Degerlendirme Puani'].isnull().sum())

# 3. Cinsiyet
print("Cinsiyet eksik veri sayısı:", train['Cinsiyet'].isnull().sum())
print("Cinsiyet eşsiz değerler:", train['Cinsiyet'].unique())

# Test verileri için 'Cinsiyet' sütununu da kontrol edelim
print("Test verisindeki Cinsiyet eksik veri sayısı:", test['Cinsiyet'].isnull().sum())
print("Test verisindeki Cinsiyet eşsiz değerler:", test['Cinsiyet'].unique())


Basvuru Yili eksik veri sayısı: 0
Basvuru Yili eşsiz değerler: [2014 2015 2016 2017 2018 2019 2020 2021 2022]
Degerlendirme Puani eksik veri sayısı: 1
Cinsiyet eksik veri sayısı: 169
Cinsiyet eşsiz değerler: ['Erkek' 'Kadın' 'ERKEK' 'Belirtmek istemiyorum' nan]
Test verisindeki Cinsiyet eksik veri sayısı: 0
Test verisindeki Cinsiyet eşsiz değerler: ['Kadın' 'Erkek' 'Belirtmek istemiyorum']


  train = pd.read_csv('train.csv')


In [12]:
# 2. Degerlendirme Puani: Eksik değeri kontrol edip satırı silelim
train = train.dropna(subset=['Degerlendirme Puani'])
print("Degerlendirme Puani eksik veri sayısı (düzeltme sonrası):", train['Degerlendirme Puani'].isnull().sum())

# 3. Cinsiyet: Büyük/küçük harf farklılıklarını düzeltelim ve eksik verileri dolduralım
# Büyük/küçük harfleri düzeltme
train['Cinsiyet'] = train['Cinsiyet'].str.lower()
test['Cinsiyet'] = test['Cinsiyet'].str.lower()

# Eksik verileri dolduralım
# En çok görülen değeri (mode) bulalım
mode_cinsiyet = train['Cinsiyet'].mode()[0]
print("Cinsiyet sütununun en sık tekrarlanan değeri (mode):", mode_cinsiyet)

# Eksik olan değerleri dolduralım
train['Cinsiyet'] = train['Cinsiyet'].fillna(mode_cinsiyet)

# Düzeltilmiş verileri tekrar kontrol edelim
print("Cinsiyet eksik veri sayısı (düzeltme sonrası):", train['Cinsiyet'].isnull().sum())
print("Cinsiyet eşsiz değerler (düzeltme sonrası):", train['Cinsiyet'].unique())


Degerlendirme Puani eksik veri sayısı (düzeltme sonrası): 0
Cinsiyet sütununun en sık tekrarlanan değeri (mode): erkek
Cinsiyet eksik veri sayısı (düzeltme sonrası): 0
Cinsiyet eşsiz değerler (düzeltme sonrası): ['erkek' 'kadın' 'belirtmek istemiyorum']


In [13]:
# 4. Dogum Tarihi: Eksik veri kontrolü ve yaş hesaplama
print("Dogum Tarihi eksik veri sayısı:", train['Dogum Tarihi'].isnull().sum())
print("Dogum Tarihi örnek veriler:", train['Dogum Tarihi'].head())

# 5. Dogum Yeri: Eksik veri kontrolü
print("Dogum Yeri eksik veri sayısı:", train['Dogum Yeri'].isnull().sum())
print("Dogum Yeri eşsiz değerler:", train['Dogum Yeri'].unique())

# 6. Ikametgah Sehri: Eksik veri kontrolü
print("Ikametgah Sehri eksik veri sayısı:", train['Ikametgah Sehri'].isnull().sum())
print("Ikametgah Sehri eşsiz değerler:", train['Ikametgah Sehri'].unique())


Dogum Tarihi eksik veri sayısı: 177
Dogum Tarihi örnek veriler: 0        4/6/1994
1       6/11/1993
2       1/15/1986
3        6/4/1991
4    2 Kasim 1992
Name: Dogum Tarihi, dtype: object
Dogum Yeri eksik veri sayısı: 791
Dogum Yeri eşsiz değerler: ['Altindag, Ankara' 'Üsküdar' 'Samsun' ... 'bergama/ izmir' 'Tacikistan'
 'Ankara keçiören']
Ikametgah Sehri eksik veri sayısı: 2037
Ikametgah Sehri eşsiz değerler: ['Ankara' 'İstanbul' 'Esenler/İstanbul' 'Kayseri' 'Bahçelievler/Ankara'
 'İSTANBUL' 'İzmir' 'Kahramanmaraş' 'Üsküdar/İstanbul' 'İZMİR' 'Trabzon'
 'Kars' 'Kırşehir' 'Gebze/Kocaeli' 'Buca/İzmir' 'Sarıyer/İstanbul' 'Ordu'
 'Osmaniye' nan 'Maltepe/İstanbul' 'Antalya' 'Florya/İstanbul'
 'Gaziosmanpaşa/İstanbul' 'Istanbul' 'Etimesgut/Ankara' 'Konya' 'ANKARA'
 'Bartın' 'Girne' 'Bingöl' 'Mersin' 'KAYSERİ' 'BURSA' 'Manisa' 'Samsun'
 'GÖLCÜK' 'Diyarbakır' 'istanbul' 'Kırklareli' 'KOCAELİ' 'AYDIN' 'Muğla'
 'Zonguldak' 'Erzurum' 'GAZİMAĞUSA' 'Bursa' 'DENİZLİ' 'Batman' 'Gaziantep'
 'Aydın' 'K

In [14]:
import pandas as pd

# 4. Dogum Tarihi: Tarih formatlarını düzeltme ve yaş hesaplama
def fix_date_format(date_str):
    try:
        return pd.to_datetime(date_str, errors='coerce', dayfirst=True)
    except:
        return pd.NaT

# Tarih formatını düzelt
train['Dogum Tarihi'] = train['Dogum Tarihi'].apply(fix_date_format)
test['Dogum Tarihi'] = test['Dogum Tarihi'].apply(fix_date_format)

# Yaş hesaplama (Basvuru Yili ve Dogum Tarihi'ni kullanarak)
train['Yas'] = train['Basvuru Yili'] - train['Dogum Tarihi'].dt.year
test['Yas'] = test['Basvuru Yili'] - test['Dogum Tarihi'].dt.year

# Eksik olan yaşları ortalama yaşla dolduralım
average_age_train = train['Yas'].mean()
train['Yas'] = train['Yas'].fillna(average_age_train)

average_age_test = test['Yas'].mean()
test['Yas'] = test['Yas'].fillna(average_age_test)

# 5. Dogum Yeri: Eksik verileri dolduralım
mode_dogum_yeri = train['Dogum Yeri'].mode()[0]
train['Dogum Yeri'] = train['Dogum Yeri'].fillna(mode_dogum_yeri)
test['Dogum Yeri'] = test['Dogum Yeri'].fillna(mode_dogum_yeri)

# 6. Ikametgah Sehri: Büyük/küçük harf düzeltme ve eksik verileri doldurma
train['Ikametgah Sehri'] = train['Ikametgah Sehri'].str.lower()
test['Ikametgah Sehri'] = test['Ikametgah Sehri'].str.lower()

mode_ikametgah_sehri = train['Ikametgah Sehri'].mode()[0]
train['Ikametgah Sehri'] = train['Ikametgah Sehri'].fillna(mode_ikametgah_sehri)
test['Ikametgah Sehri'] = test['Ikametgah Sehri'].fillna(mode_ikametgah_sehri)

# Düzeltmelerden sonra verileri kontrol edelim
print("Dogum Tarihi örnek veriler (düzeltme sonrası):", train['Dogum Tarihi'].head())
print("Yas sütunu örnek veriler:", train['Yas'].head())
print("Dogum Yeri eksik veri sayısı (düzeltme sonrası):", train['Dogum Yeri'].isnull().sum())
print("Ikametgah Sehri eksik veri sayısı (düzeltme sonrası):", train['Ikametgah Sehri'].isnull().sum())


  return pd.to_datetime(date_str, errors='coerce', dayfirst=True)
  return pd.to_datetime(date_str, errors='coerce', dayfirst=True)
  return pd.to_datetime(date_str, errors='coerce', dayfirst=True)


Dogum Tarihi örnek veriler (düzeltme sonrası): 0   1994-06-04
1   1993-11-06
2   1986-01-15
3   1991-04-06
4          NaT
Name: Dogum Tarihi, dtype: datetime64[ns]
Yas sütunu örnek veriler: 0    20.000000
1    21.000000
2    28.000000
3    23.000000
4    19.238066
Name: Yas, dtype: float64
Dogum Yeri eksik veri sayısı (düzeltme sonrası): 0
Ikametgah Sehri eksik veri sayısı (düzeltme sonrası): 0


In [15]:
train.columns

Index(['Basvuru Yili', 'Degerlendirme Puani', 'Cinsiyet', 'Dogum Tarihi',
       'Dogum Yeri', 'Ikametgah Sehri', 'Universite Adi', 'Universite Turu',
       'Burslu ise Burs Yuzdesi', 'Burs Aliyor mu?', 'Bölüm',
       'Universite Kacinci Sinif', 'Universite Not Ortalamasi',
       'Daha Once Baska Bir Universiteden Mezun Olmus', 'Lise Adi',
       'Lise Adi Diger', 'Lise Sehir', 'Lise Turu', 'Lise Bolumu',
       'Lise Bolum Diger', 'Lise Mezuniyet Notu',
       'Baska Bir Kurumdan Burs Aliyor mu?', 'Burs Aldigi Baska Kurum',
       'Baska Kurumdan Aldigi Burs Miktari', 'Anne Egitim Durumu',
       'Anne Calisma Durumu', 'Anne Sektor', 'Baba Egitim Durumu',
       'Baba Calisma Durumu', 'Baba Sektor', 'Kardes Sayisi',
       'Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?',
       'Uye Oldugunuz Kulubun Ismi',
       'Profesyonel Bir Spor Daliyla Mesgul musunuz?',
       'Spor Dalindaki Rolunuz Nedir?', 'Aktif olarak bir STK üyesi misiniz?',
       'Hangi STK'nin Uyesisiniz?', 

In [16]:
# 7. Universite Adi: Eksik verileri dolduralım
print("Universite Adi eksik veri sayısı:", train['Universite Adi'].isnull().sum())
mode_universite_adi = train['Universite Adi'].mode()[0]
train['Universite Adi'] = train['Universite Adi'].fillna(mode_universite_adi)
test['Universite Adi'] = test['Universite Adi'].fillna(mode_universite_adi)

# 8. Universite Turu: Eksik verileri dolduralım
print("Universite Turu eksik veri sayısı:", train['Universite Turu'].isnull().sum())
mode_universite_turu = train['Universite Turu'].mode()[0]
train['Universite Turu'] = train['Universite Turu'].fillna(mode_universite_turu)
test['Universite Turu'] = test['Universite Turu'].fillna(mode_universite_turu)

# Düzeltmelerden sonra verileri kontrol edelim
print("Universite Adi eşsiz değerler:", train['Universite Adi'].unique())
print("Universite Adi eksik veri sayısı (düzeltme sonrası):", train['Universite Adi'].isnull().sum())
print("Universite Turu eşsiz değerler:", train['Universite Turu'].unique())
print("Universite Turu eksik veri sayısı (düzeltme sonrası):", train['Universite Turu'].isnull().sum())


Universite Adi eksik veri sayısı: 132
Universite Turu eksik veri sayısı: 255
Universite Adi eşsiz değerler: ['İHSAN DOĞRAMACI BİLKENT' 'ULUSLARARASI KIBRIS ÜNİVERSİTESİ'
 'İSTANBUL ŞEHİR ÜNİVERSİTESİ' 'TURGUT ÖZAL ÜNİVERSİTESİ'
 'İSTANBUL TİCARET ÜNİVERSİTESİ' 'İSTANBUL MEDİPOL ÜNİVERSİTESİ'
 'FATİH SULTAN MEHMET VAKIF' 'BAHÇEŞEHİR ÜNİVERSİTESİ'
 'NUH NACİ YAZGAN ÜNİVERSİTESİ' 'FATİH ÜNİVERSİTESİ'
 'BAŞKENT ÜNİVERSİTESİ' 'ÇAĞ ÜNİVERSİTESİ' 'İZMİR ÜNİVERSİTESİ'
 'ZİRVE ÜNİVERSİTESİ' 'YAŞAR ÜNİVERSİTESİ' 'İSTANBUL AREL ÜNİVERSİTESİ'
 'TED ÜNİVERSİTESİ' 'YENİ YÜZYIL ÜNİVERSİTESİ'
 'İZMİR EKONOMİ ÜNİVERSİTESİ' 'İSTANBUL BİLGİ ÜNİVERSİTESİ'
 'İSTANBUL GELİŞİM ÜNİVERSİTESİ' 'BEYKENT ÜNİVERSİTESİ'
 'AVRASYA ÜNİVERSİTESİ' 'OKAN ÜNİVERSİTESİ' 'KOÇ ÜNİVERSİTESİ'
 'HALİÇ ÜNİVERSİTESİ' 'IŞIK ÜNİVERSİTESİ' 'ATILIM ÜNİVERSİTESİ'
 'NİŞANTAŞI ÜNİVERSİTESİ' 'İSTANBUL AYDIN ÜNİVERSİTESİ'
 'UFUK ÜNİVERSİTESİ' 'SABANCI ÜNİVERSİTESİ'
 'İSTANBUL 29 MAYIS ÜNİVERSİTESİ' 'MALTEPE ÜNİVERSİTESİ'
 'ULUSLARARASI A

In [25]:

# Üniversite Adı için dönüşüm
train['Universite Adi'] = train['Universite Adi'].str.lower()  # Hepsini küçük harfe çeviriyoruz
train['Universite Adi'] = train['Universite Adi'].fillna('Bilinmiyor')  # Eksik değerleri dolduruyoruz


# Üniversite Türü için eksik değerleri doldurma
train['Universite Turu'] = train['Universite Turu'].fillna('Belirtilmemiş')




In [31]:
train.columns

Index(['Basvuru Yili', 'Degerlendirme Puani', 'Cinsiyet', 'Dogum Tarihi',
       'Dogum Yeri', 'Ikametgah Sehri', 'Universite Adi', 'Universite Turu',
       'Burslu ise Burs Yuzdesi', 'Burs Aliyor mu?', 'Bölüm',
       'Universite Kacinci Sinif', 'Universite Not Ortalamasi',
       'Daha Once Baska Bir Universiteden Mezun Olmus', 'Lise Adi',
       'Lise Adi Diger', 'Lise Sehir', 'Lise Turu', 'Lise Bolumu',
       'Lise Bolum Diger', 'Lise Mezuniyet Notu',
       'Baska Bir Kurumdan Burs Aliyor mu?', 'Burs Aldigi Baska Kurum',
       'Baska Kurumdan Aldigi Burs Miktari', 'Anne Egitim Durumu',
       'Anne Calisma Durumu', 'Anne Sektor', 'Baba Egitim Durumu',
       'Baba Calisma Durumu', 'Baba Sektor', 'Kardes Sayisi',
       'Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?',
       'Uye Oldugunuz Kulubun Ismi',
       'Profesyonel Bir Spor Daliyla Mesgul musunuz?',
       'Spor Dalindaki Rolunuz Nedir?', 'Aktif olarak bir STK üyesi misiniz?',
       'Hangi STK'nin Uyesisiniz?', 

In [32]:
train['Burslu ise Burs Yuzdesi'] = train['Burslu ise Burs Yuzdesi'].fillna(0)


In [37]:
train['Burs Aliyor mu?'].isnull().sum()

0

In [38]:
train['Bölüm'].isnull().sum()

231

In [39]:
train['Bölüm'] = train['Bölüm'].fillna('Diğer')

In [40]:
train['Bölüm'].isnull().sum()

0

In [42]:
#Universite Kacinci Sinif
train['Universite Kacinci Sinif'].isnull().sum()

374

In [44]:
train['Universite Kacinci Sinif'].sum

<bound method Series.sum of 0          3
1          3
2          1
3          3
4        NaN
        ... 
65119      2
65120      2
65121      1
65122      4
65123      3
Name: Universite Kacinci Sinif, Length: 65124, dtype: object>

In [45]:
train['Universite Kacinci Sinif'] = train['Universite Kacinci Sinif'].fillna(1)

In [49]:
#Universite Not Ortalamasi
train['Universite Not Ortalamasi'].isnull().sum()
train['Universite Not Ortalamasi'] = train['Universite Not Ortalamasi'].fillna(0)

In [50]:
train['Universite Not Ortalamasi'].isnull().sum()

0

In [53]:
columns = [
    'Basvuru Yili', 'Degerlendirme Puani', 'Cinsiyet', 'Dogum Tarihi',
       'Dogum Yeri', 'Ikametgah Sehri', 'Universite Adi', 'Universite Turu',
       'Burslu ise Burs Yuzdesi', 'Burs Aliyor mu?', 'Bölüm',
       'Universite Kacinci Sinif', 'Universite Not Ortalamasi',
       'Daha Once Baska Bir Universiteden Mezun Olmus', 'Lise Adi',
       'Lise Adi Diger', 'Lise Sehir', 'Lise Turu', 'Lise Bolumu',
       'Lise Bolum Diger', 'Lise Mezuniyet Notu',
       'Baska Bir Kurumdan Burs Aliyor mu?', 'Burs Aldigi Baska Kurum',
       'Baska Kurumdan Aldigi Burs Miktari', 'Anne Egitim Durumu',
       'Anne Calisma Durumu', 'Anne Sektor', 'Baba Egitim Durumu',
       'Baba Calisma Durumu', 'Baba Sektor', 'Kardes Sayisi',
       'Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?',
       'Uye Oldugunuz Kulubun Ismi',
       'Profesyonel Bir Spor Daliyla Mesgul musunuz?',
       'Spor Dalindaki Rolunuz Nedir?', 'Aktif olarak bir STK üyesi misiniz?',
       'Hangi STK\'nin Uyesisiniz?', 'Stk Projesine Katildiniz Mi?',
       'Girisimcilikle Ilgili Deneyiminiz Var Mi?',
       'Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?',
       'Ingilizce Biliyor musunuz?', 'Ingilizce Seviyeniz?',
       'Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite', 'id', 'Yas'
]

for column in columns:
    print(f"{column}: {train[column].isnull().sum()}")


Basvuru Yili: 0
Degerlendirme Puani: 0
Cinsiyet: 0
Dogum Tarihi: 3116
Dogum Yeri: 0
Ikametgah Sehri: 0
Universite Adi: 0
Universite Turu: 0
Burslu ise Burs Yuzdesi: 0
Burs Aliyor mu?: 0
Bölüm: 0
Universite Kacinci Sinif: 0
Universite Not Ortalamasi: 0
Daha Once Baska Bir Universiteden Mezun Olmus: 37344
Lise Adi: 384
Lise Adi Diger: 60391
Lise Sehir: 1054
Lise Turu: 847
Lise Bolumu: 1009
Lise Bolum Diger: 63598
Lise Mezuniyet Notu: 5917
Baska Bir Kurumdan Burs Aliyor mu?: 231
Burs Aldigi Baska Kurum: 43977
Baska Kurumdan Aldigi Burs Miktari: 44162
Anne Egitim Durumu: 406
Anne Calisma Durumu: 11896
Anne Sektor: 34537
Baba Egitim Durumu: 1007
Baba Calisma Durumu: 12618
Baba Sektor: 20378
Kardes Sayisi: 1132
Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?: 1829
Uye Oldugunuz Kulubun Ismi: 48690
Profesyonel Bir Spor Daliyla Mesgul musunuz?: 1115
Spor Dalindaki Rolunuz Nedir?: 32275
Aktif olarak bir STK üyesi misiniz?: 12842
Hangi STK'nin Uyesisiniz?: 49518
Stk Projesine Katildiniz Mi?

In [55]:
train['Daha Once Baska Bir Universiteden Mezun Olmus'].sum
train['Daha Once Baska Bir Universiteden Mezun Olmus'] = train['Daha Once Baska Bir Universiteden Mezun Olmus'].fillna('Hayır')

In [56]:
train['Lise Adi'] = train['Lise Adi'].fillna('Diğer')
train['Lise Adi Diger'] = train['Lise Adi Diger'].fillna('Bilinmiyor')

In [61]:
#Lise Sehir
train['Lise Adi'] = train['Lise Adi'].fillna('Diğer')
#Lise Turu
train['Lise Turu'] = train['Lise Turu'].fillna('Diğer')
#Lise Bolumu
train['Lise Bolumu'] = train['Lise Bolumu'].fillna('Diğer')
#Lise Bolum Diger
train['Lise Bolum Diger'] = train['Lise Bolum Diger'].fillna('Diğer')
#Lise Mezuniyet Notu
train['Lise Mezuniyet Notu'] = train['Lise Mezuniyet Notu'].fillna(0)
#

In [63]:
## Baska Bir Kurumdan Burs Aliyor mu?
train['Baska Bir Kurumdan Burs Aliyor mu?'].sum
train['Baska Bir Kurumdan Burs Aliyor mu?'] = train['Baska Bir Kurumdan Burs Aliyor mu?'].fillna('Hayır')

In [64]:
# Burs Aldigi Baska Kurum
train['Burs Aldigi Baska Kurum'] = train['Burs Aldigi Baska Kurum'].fillna('Yok')

In [65]:
# Baska Kurumdan Aldigi Burs Miktari:
train['Baska Kurumdan Aldigi Burs Miktari'] = train['Baska Kurumdan Aldigi Burs Miktari'].fillna(0)

In [66]:
# Anne Egitim Durumu
train['Anne Egitim Durumu'].sum

<bound method Series.sum of 0            Üniversite
1            Üniversite
2        İlkokul Mezunu
3        İlkokul Mezunu
4        İlkokul Mezunu
              ...      
65119           İlkokul
65120           İlkokul
65121              Lise
65122              Lise
65123           İlkokul
Name: Anne Egitim Durumu, Length: 65124, dtype: object>

In [67]:
train['Anne Egitim Durumu'] = train['Anne Egitim Durumu'].fillna('İlkokul')

In [69]:
train['Anne Calisma Durumu'].sum

<bound method Series.sum of 0        Hayır
1         Evet
2        Hayır
3        Hayır
4        Hayır
         ...  
65119    Hayır
65120    Hayır
65121    Hayır
65122    Hayır
65123     Evet
Name: Anne Calisma Durumu, Length: 65124, dtype: object>

In [70]:
train['Anne Calisma Durumu'] = train['Anne Calisma Durumu'].fillna('Hayır')

In [71]:
train['Anne Sektor'].sum

<bound method Series.sum of 0                  0
1               Kamu
2                  0
3                  0
4                  0
            ...     
65119              -
65120              -
65121              -
65122              -
65123    Özel Sektör
Name: Anne Sektor, Length: 65124, dtype: object>

In [72]:
train['Anne Sektor'] = train['Anne Sektor'].fillna(0)

In [73]:
train['Anne Sektor'].sum

<bound method Series.sum of 0                  0
1               Kamu
2                  0
3                  0
4                  0
            ...     
65119              -
65120              -
65121              -
65122              -
65123    Özel Sektör
Name: Anne Sektor, Length: 65124, dtype: object>

In [74]:
columns = [
    'Basvuru Yili', 'Degerlendirme Puani', 'Cinsiyet', 'Dogum Tarihi',
       'Dogum Yeri', 'Ikametgah Sehri', 'Universite Adi', 'Universite Turu',
       'Burslu ise Burs Yuzdesi', 'Burs Aliyor mu?', 'Bölüm',
       'Universite Kacinci Sinif', 'Universite Not Ortalamasi',
       'Daha Once Baska Bir Universiteden Mezun Olmus', 'Lise Adi',
       'Lise Adi Diger', 'Lise Sehir', 'Lise Turu', 'Lise Bolumu',
       'Lise Bolum Diger', 'Lise Mezuniyet Notu',
       'Baska Bir Kurumdan Burs Aliyor mu?', 'Burs Aldigi Baska Kurum',
       'Baska Kurumdan Aldigi Burs Miktari', 'Anne Egitim Durumu',
       'Anne Calisma Durumu', 'Anne Sektor', 'Baba Egitim Durumu',
       'Baba Calisma Durumu', 'Baba Sektor', 'Kardes Sayisi',
       'Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?',
       'Uye Oldugunuz Kulubun Ismi',
       'Profesyonel Bir Spor Daliyla Mesgul musunuz?',
       'Spor Dalindaki Rolunuz Nedir?', 'Aktif olarak bir STK üyesi misiniz?',
       'Hangi STK\'nin Uyesisiniz?', 'Stk Projesine Katildiniz Mi?',
       'Girisimcilikle Ilgili Deneyiminiz Var Mi?',
       'Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?',
       'Ingilizce Biliyor musunuz?', 'Ingilizce Seviyeniz?',
       'Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite', 'id', 'Yas'
]

for column in columns:
    print(f"{column}: {train[column].isnull().sum()}")


Basvuru Yili: 0
Degerlendirme Puani: 0
Cinsiyet: 0
Dogum Tarihi: 3116
Dogum Yeri: 0
Ikametgah Sehri: 0
Universite Adi: 0
Universite Turu: 0
Burslu ise Burs Yuzdesi: 0
Burs Aliyor mu?: 0
Bölüm: 0
Universite Kacinci Sinif: 0
Universite Not Ortalamasi: 0
Daha Once Baska Bir Universiteden Mezun Olmus: 0
Lise Adi: 0
Lise Adi Diger: 0
Lise Sehir: 1054
Lise Turu: 0
Lise Bolumu: 0
Lise Bolum Diger: 0
Lise Mezuniyet Notu: 0
Baska Bir Kurumdan Burs Aliyor mu?: 0
Burs Aldigi Baska Kurum: 0
Baska Kurumdan Aldigi Burs Miktari: 0
Anne Egitim Durumu: 0
Anne Calisma Durumu: 0
Anne Sektor: 0
Baba Egitim Durumu: 1007
Baba Calisma Durumu: 12618
Baba Sektor: 20378
Kardes Sayisi: 1132
Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?: 1829
Uye Oldugunuz Kulubun Ismi: 48690
Profesyonel Bir Spor Daliyla Mesgul musunuz?: 1115
Spor Dalindaki Rolunuz Nedir?: 32275
Aktif olarak bir STK üyesi misiniz?: 12842
Hangi STK'nin Uyesisiniz?: 49518
Stk Projesine Katildiniz Mi?: 28307
Girisimcilikle Ilgili Deneyiminiz 

In [77]:
# Baba Egitim Durumu
train['Baba Egitim Durumu'].sum
train['Baba Egitim Durumu'] = train['Baba Egitim Durumu'].fillna('İlkokul')

In [79]:
# Baba Calisma Durumu
train['Baba Calisma Durumu'].sum
train['Baba Calisma Durumu'] = train['Baba Calisma Durumu'].fillna('Evet')

In [82]:
# Baba Sektor:
train['Baba Sektor'].sum
train['Baba Sektor'] = train['Baba Sektor'].fillna('Özel Sektör')

In [84]:
# Kardes Sayisi
train['Kardes Sayisi'].sum
train['Kardes Sayisi'] = train['Kardes Sayisi'].fillna(0)

In [86]:
# Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?:
train['Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?'].sum
train['Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?'] = train['Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?'].fillna('Hayır')

In [89]:
# Uye Oldugunuz Kulubun Ismi
train['Uye Oldugunuz Kulubun Ismi'].sum
train['Uye Oldugunuz Kulubun Ismi'] = train['Uye Oldugunuz Kulubun Ismi'].fillna(0)
train['Uye Oldugunuz Kulubun Ismi'].sum

<bound method Series.sum of 0        Bilkent IEEE Bilgisayar Toplulugu 2013-2014 Ba...
1                                                        0
2                                                     Tema
3                            Güzel Konuşma ve yazma kulübü
4                                                        0
                               ...                        
65119                                                    0
65120                                                    0
65121                                                    0
65122                                                    0
65123                                                    0
Name: Uye Oldugunuz Kulubun Ismi, Length: 65124, dtype: object>

In [92]:
# Profesyonel Bir Spor Daliyla Mesgul musunuz?
train['Profesyonel Bir Spor Daliyla Mesgul musunuz?'].sum
train['Profesyonel Bir Spor Daliyla Mesgul musunuz?'] = train['Profesyonel Bir Spor Daliyla Mesgul musunuz?'].fillna('Hayır')

In [94]:
# Spor Dalindaki Rolunuz Nedir?
train['Spor Dalindaki Rolunuz Nedir?'].sum
train['Spor Dalindaki Rolunuz Nedir?'] = train['Spor Dalindaki Rolunuz Nedir?'].fillna(0)

In [95]:
columns = [
    'Basvuru Yili', 'Degerlendirme Puani', 'Cinsiyet', 'Dogum Tarihi',
       'Dogum Yeri', 'Ikametgah Sehri', 'Universite Adi', 'Universite Turu',
       'Burslu ise Burs Yuzdesi', 'Burs Aliyor mu?', 'Bölüm',
       'Universite Kacinci Sinif', 'Universite Not Ortalamasi',
       'Daha Once Baska Bir Universiteden Mezun Olmus', 'Lise Adi',
       'Lise Adi Diger', 'Lise Sehir', 'Lise Turu', 'Lise Bolumu',
       'Lise Bolum Diger', 'Lise Mezuniyet Notu',
       'Baska Bir Kurumdan Burs Aliyor mu?', 'Burs Aldigi Baska Kurum',
       'Baska Kurumdan Aldigi Burs Miktari', 'Anne Egitim Durumu',
       'Anne Calisma Durumu', 'Anne Sektor', 'Baba Egitim Durumu',
       'Baba Calisma Durumu', 'Baba Sektor', 'Kardes Sayisi',
       'Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?',
       'Uye Oldugunuz Kulubun Ismi',
       'Profesyonel Bir Spor Daliyla Mesgul musunuz?',
       'Spor Dalindaki Rolunuz Nedir?', 'Aktif olarak bir STK üyesi misiniz?',
       'Hangi STK\'nin Uyesisiniz?', 'Stk Projesine Katildiniz Mi?',
       'Girisimcilikle Ilgili Deneyiminiz Var Mi?',
       'Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?',
       'Ingilizce Biliyor musunuz?', 'Ingilizce Seviyeniz?',
       'Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite', 'id', 'Yas'
]

for column in columns:
    print(f"{column}: {train[column].isnull().sum()}")


Basvuru Yili: 0
Degerlendirme Puani: 0
Cinsiyet: 0
Dogum Tarihi: 3116
Dogum Yeri: 0
Ikametgah Sehri: 0
Universite Adi: 0
Universite Turu: 0
Burslu ise Burs Yuzdesi: 0
Burs Aliyor mu?: 0
Bölüm: 0
Universite Kacinci Sinif: 0
Universite Not Ortalamasi: 0
Daha Once Baska Bir Universiteden Mezun Olmus: 0
Lise Adi: 0
Lise Adi Diger: 0
Lise Sehir: 1054
Lise Turu: 0
Lise Bolumu: 0
Lise Bolum Diger: 0
Lise Mezuniyet Notu: 0
Baska Bir Kurumdan Burs Aliyor mu?: 0
Burs Aldigi Baska Kurum: 0
Baska Kurumdan Aldigi Burs Miktari: 0
Anne Egitim Durumu: 0
Anne Calisma Durumu: 0
Anne Sektor: 0
Baba Egitim Durumu: 0
Baba Calisma Durumu: 0
Baba Sektor: 0
Kardes Sayisi: 0
Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?: 0
Uye Oldugunuz Kulubun Ismi: 0
Profesyonel Bir Spor Daliyla Mesgul musunuz?: 0
Spor Dalindaki Rolunuz Nedir?: 0
Aktif olarak bir STK üyesi misiniz?: 12842
Hangi STK'nin Uyesisiniz?: 49518
Stk Projesine Katildiniz Mi?: 28307
Girisimcilikle Ilgili Deneyiminiz Var Mi?: 12840
Girisimcilikl

In [97]:
# Lise Sehir (İstanbula ata)
train['Lise Sehir'].sum
train['Lise Sehir'] = train['Lise Sehir'].fillna('İstanbul')


In [99]:
# Aktif olarak bir STK üyesi misiniz?
train['Aktif olarak bir STK üyesi misiniz?'].sum
train['Aktif olarak bir STK üyesi misiniz?'] = train['Aktif olarak bir STK üyesi misiniz?'].fillna('Hayır')

In [101]:
# Hangi STK'nin Uyesisiniz?
train['Hangi STK\'nin Uyesisiniz?'].sum
train['Hangi STK\'nin Uyesisiniz?'] = train['Hangi STK\'nin Uyesisiniz?'].fillna(0)


In [103]:
# Stk Projesine Katildiniz Mi?:
train['Stk Projesine Katildiniz Mi?'].sum
train['Stk Projesine Katildiniz Mi?'] = train['Stk Projesine Katildiniz Mi?'].fillna('Hayır')

In [105]:
# Girisimcilikle Ilgili Deneyiminiz Var Mi?
train['Girisimcilikle Ilgili Deneyiminiz Var Mi?'].sum
train['Girisimcilikle Ilgili Deneyiminiz Var Mi?'] = train['Girisimcilikle Ilgili Deneyiminiz Var Mi?'].fillna('Hayır')

In [107]:
# Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?
train['Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?'].sum
train['Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?'] = train['Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?'].fillna('Hayır')

In [109]:
# Ingilizce Biliyor musunuz?
train['Ingilizce Biliyor musunuz?'].sum
train['Ingilizce Biliyor musunuz?'] = train['Ingilizce Biliyor musunuz?'].fillna('Hayır')


In [113]:
# Ingilizce Seviyeniz?
train['Ingilizce Seviyeniz?'] = train['Ingilizce Seviyeniz?'].fillna('Başlangıç')

In [115]:
# Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite
train['Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite'] = train['Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite'].fillna(0)


In [116]:
columns = [
    'Basvuru Yili', 'Degerlendirme Puani', 'Cinsiyet', 'Dogum Tarihi',
       'Dogum Yeri', 'Ikametgah Sehri', 'Universite Adi', 'Universite Turu',
       'Burslu ise Burs Yuzdesi', 'Burs Aliyor mu?', 'Bölüm',
       'Universite Kacinci Sinif', 'Universite Not Ortalamasi',
       'Daha Once Baska Bir Universiteden Mezun Olmus', 'Lise Adi',
       'Lise Adi Diger', 'Lise Sehir', 'Lise Turu', 'Lise Bolumu',
       'Lise Bolum Diger', 'Lise Mezuniyet Notu',
       'Baska Bir Kurumdan Burs Aliyor mu?', 'Burs Aldigi Baska Kurum',
       'Baska Kurumdan Aldigi Burs Miktari', 'Anne Egitim Durumu',
       'Anne Calisma Durumu', 'Anne Sektor', 'Baba Egitim Durumu',
       'Baba Calisma Durumu', 'Baba Sektor', 'Kardes Sayisi',
       'Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?',
       'Uye Oldugunuz Kulubun Ismi',
       'Profesyonel Bir Spor Daliyla Mesgul musunuz?',
       'Spor Dalindaki Rolunuz Nedir?', 'Aktif olarak bir STK üyesi misiniz?',
       'Hangi STK\'nin Uyesisiniz?', 'Stk Projesine Katildiniz Mi?',
       'Girisimcilikle Ilgili Deneyiminiz Var Mi?',
       'Girisimcilikle Ilgili Deneyiminizi Aciklayabilir misiniz?',
       'Ingilizce Biliyor musunuz?', 'Ingilizce Seviyeniz?',
       'Daha Önceden Mezun Olunduysa, Mezun Olunan Üniversite', 'id', 'Yas'
]

for column in columns:
    print(f"{column}: {train[column].isnull().sum()}")


Basvuru Yili: 0
Degerlendirme Puani: 0
Cinsiyet: 0
Dogum Tarihi: 3116
Dogum Yeri: 0
Ikametgah Sehri: 0
Universite Adi: 0
Universite Turu: 0
Burslu ise Burs Yuzdesi: 0
Burs Aliyor mu?: 0
Bölüm: 0
Universite Kacinci Sinif: 0
Universite Not Ortalamasi: 0
Daha Once Baska Bir Universiteden Mezun Olmus: 0
Lise Adi: 0
Lise Adi Diger: 0
Lise Sehir: 0
Lise Turu: 0
Lise Bolumu: 0
Lise Bolum Diger: 0
Lise Mezuniyet Notu: 0
Baska Bir Kurumdan Burs Aliyor mu?: 0
Burs Aldigi Baska Kurum: 0
Baska Kurumdan Aldigi Burs Miktari: 0
Anne Egitim Durumu: 0
Anne Calisma Durumu: 0
Anne Sektor: 0
Baba Egitim Durumu: 0
Baba Calisma Durumu: 0
Baba Sektor: 0
Kardes Sayisi: 0
Girisimcilik Kulupleri Tarzi Bir Kulube Uye misiniz?: 0
Uye Oldugunuz Kulubun Ismi: 0
Profesyonel Bir Spor Daliyla Mesgul musunuz?: 0
Spor Dalindaki Rolunuz Nedir?: 0
Aktif olarak bir STK üyesi misiniz?: 0
Hangi STK'nin Uyesisiniz?: 0
Stk Projesine Katildiniz Mi?: 0
Girisimcilikle Ilgili Deneyiminiz Var Mi?: 0
Girisimcilikle Ilgili Deneyimini

In [117]:
train_son = train.drop('Dogum Tarihi', axis=1)

In [118]:
train_son.to_csv('train_temiz.csv')