# NumPy Arama ve Filtreleme İşlemleri

Bu notebook, NumPy kütüphanesinde array'lerde arama (search) ve filtreleme (filter) işlemleri ve teknikleri göstermektedir.


## 1. NumPy Kütüphanesini İçe Aktarma


In [None]:
import numpy as np


## 2. Koşullu Filtreleme (Boolean Indexing)


In [None]:
# Temel boolean filtreleme
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Orijinal array:", arr)

# 5'den büyük elemanları filtreleme
mask = arr > 5
print("Koşul maskeleri (arr > 5):", mask)
filtered = arr[mask]
print("Filtrelenmiş array (5'den büyük):", filtered)

# Kısa yol
filtered_short = arr[arr > 5]
print("Kısa yol filtreleme:", filtered_short)

# Çift sayıları filtreleme
even_nums = arr[arr % 2 == 0]
print("Çift sayılar:", even_nums)

# Tek sayıları filtreleme
odd_nums = arr[arr % 2 != 0]
print("Tek sayılar:", odd_nums)


In [None]:
# 2D array'lerde boolean filtreleme
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("2D array:")
print(arr_2d)

# 5'den büyük elemanları filtreleme
mask_2d = arr_2d > 5
print("\nKoşul maskeleri (arr_2d > 5):")
print(mask_2d)

# 5'den büyük tüm elemanları alma (1D array elde edilir)
filtered_2d = arr_2d[mask_2d]
print("\nFiltrelenmiş array (5'den büyük):", filtered_2d)

# 5'den büyük değerlerin olduğu satırları alma
row_mask = np.any(arr_2d > 5, axis=1)
print("\nHerhangi bir elemanı 5'ten büyük olan satırlar (any):")
print(arr_2d[row_mask])

# Tüm elemanları 5'den büyük olan satırları alma
all_row_mask = np.all(arr_2d > 5, axis=1)
print("\nTüm elemanları 5'ten büyük olan satırlar (all):")
print(arr_2d[all_row_mask])


In [None]:
# Çoklu koşul filtreleme
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Orijinal array:", arr)

# 3'ten büyük VE 8'den küçük
mask1 = (arr > 3) & (arr < 8)
print("\n3'ten büyük VE 8'den küçük:", arr[mask1])

# 3'ten küçük VEYA 8'den büyük
mask2 = (arr < 3) | (arr > 8)
print("3'ten küçük VEYA 8'den büyük:", arr[mask2])

# NOT: Parantezleri kullanmayı unutmayın - & ve | operatörleri 
# karşılaştırma operatörlerinden (>, <, ==) önce işlenir



## 3. where() - Koşullu Değer Atama


In [None]:
# np.where() - koşula göre farklı değerler seçme
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Orijinal array:", arr)

# 5'ten büyük değerleri 1, diğerlerini 0 yap
result = np.where(arr > 5, 1, 0)
print("\n5'ten büyükse 1, değilse 0:", result)

# Çift sayıları kendisiyle, tek sayıları kareleriyle değiştir
result = np.where(arr % 2 == 0, arr, arr**2)
print("\nÇift sayılar aynı, tek sayılar kare:", result)


In [None]:
# 2D array'lerde where kullanımı
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("2D array:")
print(arr_2d)

# 5'ten büyük değerleri 10 yap, diğerlerini olduğu gibi bırak
result_2d = np.where(arr_2d > 5, 10, arr_2d)
print("\n5'ten büyükse 10, değilse aynı kalsın:")
print(result_2d)

# Çift sayıları -1, tek sayıları 1 yap
result_2d = np.where(arr_2d % 2 == 0, -1, 1)
print("\nÇift sayıları -1, tek sayıları 1 yap:")
print(result_2d)


## 4. select() - Çoklu Koşullu Değer Atama


In [None]:
# np.select() - birden fazla koşula göre değer atama
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Orijinal array:", arr)

# Koşullar listesi
conditions = [
    arr < 3,    # 3'ten küçük
    (arr >= 3) & (arr < 7),  # 3 ile 6 arasında
    arr >= 7    # 7 ve üzeri
]

# Her koşula uygun değerler
choices = [
    0,  # 3'ten küçükse 0
    10,  # 3 ile 6 arasındaysa 10
    20  # 7 ve üzeriyse 20
]

# select() ile koşullu atama
result = np.select(conditions, choices)
print("\nFarklı koşullara göre değer atama:")
print(result)

# Varsayılan değer ekleme (hiçbir koşul sağlanmazsa)
result = np.select(conditions, choices, default=-1)
print("\nVarsayılan değerli select() sonucu:")
print(result)


## 5. searchsorted() - Sıralı Dizide Arama


In [None]:
# searchsorted() - sıralı bir dizide değerlerin yerleştirileceği indeksleri bulma
sorted_arr = np.array([1, 3, 5, 7, 9, 11, 13, 15])
print("Sıralı array:", sorted_arr)

# Tek bir değer ekleme pozisyonu
idx = np.searchsorted(sorted_arr, 6)
print("\n6 değeri için ekleme pozisyonu:", idx)

# Birden fazla değer için arama
values = np.array([2, 6, 10, 14])
indices = np.searchsorted(sorted_arr, values)
print(f"\n{values} değerleri için ekleme pozisyonları:", indices)

# 'right' seçeneği ile sağ taraftan arama
indices_right = np.searchsorted(sorted_arr, values, side='right')
print(f"\n{values} değerleri için sağ taraftan arama (side='right'):", indices_right)


In [None]:
# searchsorted() uygulaması - histogram benzeri işlem
data = np.random.randint(0, 100, 20)  # 0-100 arası 20 rastgele sayı
print("Veri:", data)

# Histogram için özel sınır değerleri
bins = np.array([0, 25, 50, 75, 100])
print("\nSınır değerleri:", bins)

# Her verinin hangi gruba ait olduğunu bulma
bin_indices = np.searchsorted(bins, data)
print("\nGrup indeksleri:", bin_indices)

# Grupları sayma (histogram)
unique, counts = np.unique(bin_indices, return_counts=True)
print("\nGruplara göre sayım:")
for i, count in zip(unique, counts):
    if i > 0 and i < len(bins):
        print(f"{bins[i-1]}-{bins[i]} arası: {count}")


## 6. argmax(), argmin() - En Büyük ve En Küçük Değerlerin İndeksleri


In [None]:
# argmax(), argmin() - en büyük ve en küçük değerlerin indekslerini bulma
arr = np.array([3, 1, 4, 1, 5, 9, 2, 6])
print("Array:", arr)

# En büyük değerin indeksi
max_idx = np.argmax(arr)
print(f"\nEn büyük değer {arr[max_idx]} ve indeksi: {max_idx}")

# En küçük değerin indeksi
min_idx = np.argmin(arr)
print(f"En küçük değer {arr[min_idx]} ve indeksi: {min_idx}")

# 2D array'lerde argmax() ve argmin()
arr_2d = np.array([[3, 1, 4], [1, 5, 9], [2, 6, 5]])
print("\n2D array:")
print(arr_2d)

# Tüm array üzerinde en büyük/küçük elemanın düzleştirilmiş indeksi
max_idx_flat = np.argmax(arr_2d)
min_idx_flat = np.argmin(arr_2d)
print(f"\nTüm array'deki en büyük değerin düzleştirilmiş indeksi: {max_idx_flat}")
print(f"Tüm array'deki en küçük değerin düzleştirilmiş indeksi: {min_idx_flat}")

# Düzleştirilmiş indeksi 2D indekse dönüştürme
max_2d_idx = np.unravel_index(max_idx_flat, arr_2d.shape)
min_2d_idx = np.unravel_index(min_idx_flat, arr_2d.shape)
print(f"En büyük değerin 2D indeksi: {max_2d_idx}")
print(f"En küçük değerin 2D indeksi: {min_2d_idx}")

# Her satır için en büyük/küçük değerin indeksi
row_max_idx = np.argmax(arr_2d, axis=1)
row_min_idx = np.argmin(arr_2d, axis=1)
print(f"\nHer satırdaki en büyük değerlerin indeksleri: {row_max_idx}")
print(f"Her satırdaki en küçük değerlerin indeksleri: {row_min_idx}")

# Her sütun için en büyük/küçük değerin indeksi
col_max_idx = np.argmax(arr_2d, axis=0)
col_min_idx = np.argmin(arr_2d, axis=0)
print(f"\nHer sütundaki en büyük değerlerin indeksleri: {col_max_idx}")
print(f"Her sütundaki en küçük değerlerin indeksleri: {col_min_idx}")


## 7. nonzero() - Sıfır Olmayan Değerlerin İndeksleri


In [None]:
# nonzero() - sıfır olmayan elemanların indekslerini bulma
arr = np.array([0, 1, 0, 0, 4, 0, 5, 0])
print("Array:", arr)

# Sıfır olmayan değerlerin indeksleri
non_zero_idx = np.nonzero(arr)
print("\nSıfır olmayan değerlerin indeksleri:", non_zero_idx[0])
print("Bu indekslerdeki değerler:", arr[non_zero_idx])

# Boolean koşullarla nonzero() kullanımı
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("\nArray:", arr)

# 5'ten büyük değerlerin indeksleri
gt_5_idx = np.nonzero(arr > 5)
print("5'ten büyük değerlerin indeksleri:", gt_5_idx[0])
print("Bu indekslerdeki değerler:", arr[gt_5_idx])

# Çift sayıların indeksleri
even_idx = np.nonzero(arr % 2 == 0)
print("\nÇift sayıların indeksleri:", even_idx[0])
print("Bu indekslerdeki değerler:", arr[even_idx])


In [None]:
# 2D array'lerde nonzero()
arr_2d = np.array([[0, 1, 0], [2, 0, 3], [0, 0, 4]])
print("2D array:")
print(arr_2d)

# Sıfır olmayan değerlerin indeksleri (satır ve sütun indeksleri ayrı dizilerde)
nz_rows, nz_cols = np.nonzero(arr_2d)
print("\nSıfır olmayan değerlerin satır indeksleri:", nz_rows)
print("Sıfır olmayan değerlerin sütun indeksleri:", nz_cols)

print("\nSıfır olmayan değerler ve konumları:")
for i in range(len(nz_rows)):
    print(f"Değer {arr_2d[nz_rows[i], nz_cols[i]]} konumu: ({nz_rows[i]}, {nz_cols[i]})")

# Koşul ile filtreleme ve nonzero() birleşimi
gt_2_rows, gt_2_cols = np.nonzero(arr_2d > 2)
print("\n2'den büyük değerlerin konumları:")
for i in range(len(gt_2_rows)):
    print(f"Değer {arr_2d[gt_2_rows[i], gt_2_cols[i]]} konumu: ({gt_2_rows[i]}, {gt_2_cols[i]})")


## 8. extract() - Koşulu Sağlayan Elemanları Çıkarma


In [None]:
# extract() - koşula göre elemanları çıkarma
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Array:", arr)

# 3'ün katı olan elemanları çıkar
condition = (arr % 3 == 0)
extracted = np.extract(condition, arr)
print("\n3'ün katı olan elemanlar:", extracted)

# Hem 2'ye hem de 3'e bölünebilen sayıları çıkar
condition = (arr % 2 == 0) & (arr % 3 == 0)
extracted = np.extract(condition, arr)
print("\nHem 2'ye hem de 3'e bölünebilen sayılar:", extracted)


In [None]:
# 2D array ile extract()
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("2D array:")
print(arr_2d)

# 5'ten büyük elemanları çıkar
condition = arr_2d > 5
extracted = np.extract(condition, arr_2d)
print("\n5'ten büyük elemanlar:", extracted)

# Çift sayıları çıkar
condition = arr_2d % 2 == 0
extracted = np.extract(condition, arr_2d)
print("\nÇift sayılar:", extracted)

# Not: extract() her zaman 1D sonuç döndürür, orijinal array yapısını korumaz


## 9. Maskeleme İşlemleri ve Gelişmiş Filtreleme


In [None]:
# Maskeleme işlemleri - maskelenmiş array oluşturma
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Array:", arr)

# numpy.ma modülünü import edelim
import numpy.ma as ma

# 5'ten büyük değerleri maskele
mask = arr > 5
masked_arr = ma.masked_array(arr, mask)
print("\n5'ten büyük değerler maskelenmiş:", masked_arr)

# Çift sayıları maskele
mask = arr % 2 == 0
masked_arr = ma.masked_array(arr, mask)
print("Çift sayılar maskelenmiş:", masked_arr)

# Maskelenmiş değerleri özel bir değerle dolduralım
filled_arr = masked_arr.filled(-999)
print("Maskelenmiş değerler -999 ile doldurulmuş:", filled_arr)


In [None]:
# Gelişmiş filtreleme örnekleri
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("Array:", arr)

# İşlev tabanlı filtreleme (fonksiyon ile)
def is_prime(x):
    if x < 2:
        return False
    for i in range(2, int(np.sqrt(x)) + 1):
        if x % i == 0:
            return False
    return True

# NumPy'ın vectorize() fonksiyonu ile özel bir fonksiyonu vektörel hale getirme
vfunc = np.vectorize(is_prime)
prime_mask = vfunc(arr)
prime_numbers = arr[prime_mask]
print("\nAsal sayılar:", prime_numbers)

# İlk ve son elemanları filtreleme
n = 3  # İlk ve son 3 eleman
first_n = arr[:n]
last_n = arr[-n:]
print(f"\nİlk {n} eleman:", first_n)
print(f"Son {n} eleman:", last_n)

# En büyük/küçük N elemanı bulma
n = 3
# En büyük n eleman
largest_n = arr[np.argsort(arr)[-n:]]
print(f"\nEn büyük {n} eleman:", largest_n)

# En küçük n eleman
smallest_n = arr[np.argsort(arr)[:n]]
print(f"En küçük {n} eleman:", smallest_n)


## 10. isnan(), isinf() - Sayısal Kontroller


In [None]:
# NaN ve Infinity değerlerini bulma ve filtreleme
# NaN (Not a Number) ve Infinity değerlerini içeren bir array oluşturalım
arr = np.array([1.0, 2.0, np.nan, 4.0, np.inf, 6.0, -np.inf])
print("Array:", arr)

# NaN değerlerini bulma
nan_mask = np.isnan(arr)
print("\nNaN maskeleri:", nan_mask)
print("NaN değerlerin indeksleri:", np.nonzero(nan_mask)[0])

# Infinity değerlerini bulma
inf_mask = np.isinf(arr)
print("\nInfinity maskeleri:", inf_mask)
print("Infinity değerlerin indeksleri:", np.nonzero(inf_mask)[0])

# Geçerli sayıları filtreleme (NaN ve Infinity olmayan)
valid_mask = ~(np.isnan(arr) | np.isinf(arr))  # ~ operatörü ile boolean değeri tersine çeviriyoruz
valid_values = arr[valid_mask]
print("\nGeçerli sayılar:", valid_values)

# NaN veya Infinity değerleri yerine başka bir değer koyma
fixed_arr = np.copy(arr)
fixed_arr[np.isnan(fixed_arr)] = 0  # NaN yerine 0
fixed_arr[np.isinf(fixed_arr)] = 999  # Infinity yerine 999
print("\nDüzeltilmiş array:", fixed_arr)


## 11. isclose() - Yaklaşık Eşitlik Kontrolü


In [None]:
# Yaklaşık eşitlik kontrolü
# Ondalık sayılarla çalışırken tam eşitlik kontrolü yerine yaklaşık eşitlik daha kullanışlıdır
a = np.array([1.0, 1.0001, 1.001, 1.01, 1.1])
b = np.ones(5)  # [1.0, 1.0, 1.0, 1.0, 1.0]

print("A:", a)
print("B:", b)

# Tam eşitlik kontrolü
exact_equal = (a == b)
print("\nTam eşitlik:", exact_equal)

# Yaklaşık eşitlik kontrolü
close_default = np.isclose(a, b)
print("\nVarsayılan yaklaşık eşitlik:", close_default)

# Tolerans değerlerini ayarlama
close_custom = np.isclose(a, b, rtol=0.01, atol=0.01)  # Daha yüksek tolerans
print("\nÖzel toleransla yaklaşık eşitlik:", close_custom)

# Yaklaşık eşit olan değerleri filtreleme
filtered = a[close_default]
print("\nYaklaşık 1.0'a eşit değerler:", filtered)


## 12. unique() ve İlgili Fonksiyonlar - Benzersiz Değerler


In [None]:
# unique() - benzersiz değerleri bulma
arr = np.array([1, 2, 2, 3, 1, 4, 2, 5, 5, 6, 4])
print("Array:", arr)

# Benzersiz değerleri bulma
unique_vals = np.unique(arr)
print("\nBenzersiz değerler:", unique_vals)

# Benzersiz değerleri ve frekanslarını bulma
unique_vals, counts = np.unique(arr, return_counts=True)
print("\nBenzersiz değerler ve frekansları:")
for val, count in zip(unique_vals, counts):
    print(f"{val}: {count} kez")

# En çok tekrar eden değeri bulma
most_frequent_index = np.argmax(counts)
most_frequent_val = unique_vals[most_frequent_index]
most_frequent_count = counts[most_frequent_index]
print(f"\nEn çok tekrar eden değer: {most_frequent_val} ({most_frequent_count} kez)")

# Benzersiz değerlerin orijinal konumlarını bulma
unique_vals, indices = np.unique(arr, return_index=True)
print("\nBenzersiz değerler ve ilk görüldükleri konumlar:")
for val, idx in zip(unique_vals, indices):
    print(f"{val}: {idx}. indekste ilk görülme")


In [None]:
# 2D array'lerde unique
arr_2d = np.array([[1, 2, 3], [2, 3, 4], [3, 4, 5]])
print("2D array:")
print(arr_2d)

# Tüm benzersiz değerleri bulma (düzleştirilmiş array'de)
unique_flat = np.unique(arr_2d)
print("\nTüm benzersiz değerler:", unique_flat)

# Satır bazında benzersiz değerler
unique_rows = np.unique(arr_2d, axis=0)
print("\nBenzersiz satırlar:")
print(unique_rows)

# Sütun bazında benzersiz değerler
unique_cols = np.unique(arr_2d, axis=1)
print("\nBenzersiz sütunlar:")
print(unique_cols)


In [None]:
# in1d() - Bir array'in elemanlarının başka bir array'de olup olmadığını kontrol etme
arr1 = np.array([1, 2, 3, 4, 5])
arr2 = np.array([2, 4, 6])
print("Array 1:", arr1)
print("Array 2:", arr2)

# arr1'in elemanlarının arr2'de olup olmadığını kontrol etme
mask = np.in1d(arr1, arr2)
print("\narr1'in elemanları arr2'de var mı:", mask)
print("arr2'de bulunan arr1 elemanları:", arr1[mask])
print("arr2'de bulunmayan arr1 elemanları:", arr1[~mask])

# intersect1d() - İki array'in kesişimi
intersection = np.intersect1d(arr1, arr2)
print("\nKesişim (intersect1d):", intersection)

# setdiff1d() - İki array'in farkı (arr1'de olup arr2'de olmayanlar)
difference = np.setdiff1d(arr1, arr2)
print("Fark (setdiff1d):", difference)

# union1d() - İki array'in birleşimi (benzersiz değerler)
union = np.union1d(arr1, arr2)
print("Birleşim (union1d):", union)
