# Eksik Veri Analizi - Hızlı Çözüm

In [1]:
import numpy as np
import pandas as pd

In [2]:
V1 = np.array([1,3,6,np.NaN,7,1,np.NaN,9,15])
V2 = np.array([7,np.NaN,5,8,12,np.NaN,np.NaN,2,3])
V3 = np.array([np.NaN,12,5,6,14,7,np.NaN,2,31])

df = pd.DataFrame({
    'V1': V1,
    'V2': V2,
    'V3': V3
})
df

Unnamed: 0,V1,V2,V3
0,1.0,7.0,
1,3.0,,12.0
2,6.0,5.0,5.0
3,,8.0,6.0
4,7.0,12.0,14.0
5,1.0,,7.0
6,,,
7,9.0,2.0,2.0
8,15.0,3.0,31.0


In [4]:
df.isnull().sum()
# her bir değişkende ki eksik sayısına eriştik.

V1    2
V2    3
V3    2
dtype: int64

In [5]:
df.notnull().sum()
# her bir değişkendeki eksik olmayan gözlem sayısına eriştik.

V1    7
V2    6
V3    7
dtype: int64

In [7]:
df.isnull().sum().sum()
# veri setindeki toplam eksik sayısına eriştik.

7

In [8]:
df[df.isnull().any(axis=1)]
# gözlemlerde en az 1 eksik değer varsa yazdır.

Unnamed: 0,V1,V2,V3
0,1.0,7.0,
1,3.0,,12.0
3,,8.0,6.0
5,1.0,,7.0
6,,,


In [9]:
df[df.notnull().all(axis=1)]
# sütunlara göre tüm değerleri dolu olan gözlemleri getir.

Unnamed: 0,V1,V2,V3
2,6.0,5.0,5.0
4,7.0,12.0,14.0
7,9.0,2.0,2.0
8,15.0,3.0,31.0


In [11]:
df[df['V1'].notnull() & df['V2'].notnull() & df['V3'].notnull()]
# yukarıdaki işlemin manuel yazımı

Unnamed: 0,V1,V2,V3
2,6.0,5.0,5.0
4,7.0,12.0,14.0
7,9.0,2.0,2.0
8,15.0,3.0,31.0


# Eksik Değerlerin Silinmesi

In [13]:
df.dropna()
# kalıcı olarak silmek için inplace=True parametresini verebiliriz.

Unnamed: 0,V1,V2,V3
2,6.0,5.0,5.0
4,7.0,12.0,14.0
7,9.0,2.0,2.0
8,15.0,3.0,31.0


# Basit Değer Atama

In [14]:
df['V1']

0     1.0
1     3.0
2     6.0
3     NaN
4     7.0
5     1.0
6     NaN
7     9.0
8    15.0
Name: V1, dtype: float64

In [15]:
df['V1'].mean()

6.0

In [16]:
df['V1'].fillna(df['V1'].mean())

0     1.0
1     3.0
2     6.0
3     6.0
4     7.0
5     1.0
6     6.0
7     9.0
8    15.0
Name: V1, dtype: float64

In [17]:
df['V2'].fillna(0)

0     7.0
1     0.0
2     5.0
3     8.0
4    12.0
5     0.0
6     0.0
7     2.0
8     3.0
Name: V2, dtype: float64

In [19]:
df.apply(lambda x: x.fillna(x.mean()), axis=0)

Unnamed: 0,V1,V2,V3
0,1.0,7.0,11.0
1,3.0,6.166667,12.0
2,6.0,5.0,5.0
3,6.0,8.0,6.0
4,7.0,12.0,14.0
5,1.0,6.166667,7.0
6,6.0,6.166667,11.0
7,9.0,2.0,2.0
8,15.0,3.0,31.0
