Numpy'da bir dizi tek çeşit veri alabilir. Şimdiye kadar bunu gördük. Bu bölümdeyse farklı tipten veri türlerini aynı dizi üzerine koyup efektif bir biçimde işlemeye yarayan yapısal dizileri (structured arrays) ve record arrays göreceğiz.

## Yapısal Dizi Üretme

Üç kişinin adını, yaşını ve boyunu (metre cinsinden) kaydedeceğimizi düşünelim.

In [1]:
import numpy as np

In [2]:
ad = ['Mehmet', 'Hakan', 'Beyza', 'Selin', 'Vedat']
yas = [25, 45, 37, 19, 53]
boy = [1.83, 1.69, 1.63, 1.72, 1.75]

Ama ortada dizilerin birbirleriyle bağlantılı olduğunu gösteren bir ifade yok. Bu verileri tablo gibi birlikte tutan bir yapı olsa daha güzel olurdu.

Yapısal diziler, verilerin tablo şeklinde saklanmasına olanak sağlar. Oluşturmak için `dtype` parametresine `names` ile sütun adlarını, `formats` ile veri türlerini tanımlayabilirsiniz.

In [3]:
veri = np.zeros(5, dtype={
                          'names'  :('ad', 'yas', 'boy'),
                          'formats':('U10', np.int8 , float)})
veri

array([('', 0, 0.), ('', 0, 0.), ('', 0, 0.), ('', 0, 0.), ('', 0, 0.)],
      dtype=[('ad', '<U10'), ('yas', 'i1'), ('boy', '<f8')])

> U10 string'i ifade eder. Ne anlama geldiğine az sonra anlatıcam

Şimdi elimizde boş bir yapı var. Artık içini doldurabiliriz.

In [4]:
veri['ad'] = ad
veri['yas'] = yas
veri['boy'] = boy
veri

array([('Mehmet', 25, 1.83), ('Hakan', 45, 1.69), ('Beyza', 37, 1.63),
       ('Selin', 19, 1.72), ('Vedat', 53, 1.75)],
      dtype=[('ad', '<U10'), ('yas', 'i1'), ('boy', '<f8')])

Baştaki amacımıza ulaştık, artık tek değişkende tüm verileri saklayabiliyoruz. Şimdi bildiğimiz yöntemlerle verilere ulaşabiliriz.

In [5]:
print("Adlar:", veri['ad'])
print("Sonuncu kişinin adı:", veri['ad'][-1])

Adlar: ['Mehmet' 'Hakan' 'Beyza' 'Selin' 'Vedat']
Sonuncu kişinin adı: Vedat


İleride Pandas derslerinde göreceğimiz üzere daha çeşitli veri seçme yöntemleri de kullanılabilir:

In [6]:
veri[1.7 < veri['boy']]['ad'] # boyu 1.7 metreden büyük olanların adı

array(['Mehmet', 'Selin', 'Vedat'], dtype='<U10')

### Yapısal Dizi Tanımlama

Yapısal dizi tanımlamak için yukarıda yaptığımız gibi `names`'e sütunların adları, `formats`'a sütunların veri tiplerini belirterek `dtype` parametresine verebilirsiniz.

Yapısal dizi oluşturmanın bir diğer yolu, dtype parametresine `(sütun adı, veri türü)` olacak şekilde tuple'lardan oluşan dizi vermektir.

In [7]:
np.dtype([('ad', 'U10'), ('yas', np.int8), ('boy', float)])

dtype([('ad', '<U10'), ('yas', 'i1'), ('boy', '<f8')])

Eğer sütunların adları önemli değilse string içinde veri türlerinin kısaltılmış adlarını yazarak da oluşturabilirsiniz.

In [8]:
np.dtype('S10,i1,f8')

dtype([('f0', 'S10'), ('f1', 'i1'), ('f2', '<f8')])

İlk karakter "&lt;" ve "&gt;" isteğe bağlıdır ve verinin bilgisayar hafızasında soldan sağa mı sağdan sola mı kaydedileceğini ifade eder (bkz. little endian, big endian). Sonraki karakter int, byte, string vs gibi veri türünü belirtir. Son karakter de verinin byte cinsinden boyutunu.

| Karakter | Açıklama          | Örnek              | Örneğin Karşılığı    |
|:--------:|-------------------|--------------------|----------------------|
| 'b'      | Byte              | np\.dtype\('b'\)   | np\.int8             |
| 'i'      | Signed Integer    | np\.dtype\('i4'\)  | np\.int32            |
| 'u'      | Unsigned Integer  | np\.dtype\('u1'\)  | np\.uint8            |
| 'f'      | Float             | np\.dtype\('f2'\)  | np\.float16          |
| 'c'      | Complex Float     | np\.dtype\('c16'\) | np\.complex128       |
| 'S', 'a' | String            | np\.dtype\('S5'\)  | 5 karakterlik string |
| 'U'      | Unicode String    | np\.dtype\('U'\)   | np\.str\_            |
| 'V'      | Raw Data \(Void\) | np\.dtype\('V'\)   | np\.void             |

Örneğin karşılığını `np.dtype` fonksiyonu ile görebilirsiniz.

In [9]:
np.dtype('f2')

dtype('float16')

### Daha Gelişmiş Veri Yapıları

Daha gelişmiş veri yapıları üretmek mümkün. Aşağıda sütun adları id ve mat olan, mat sütunundaki verilerin (3x3) olduğu bir dizi görüyoruz.

In [10]:
strc = np.dtype([('id', 'i8'), ('mat', 'f8', (3, 3))]) # Veri türümüz
X = np.zeros(1, dtype=strc) # Veri türümüzden bir satırlık veri üretiyoruz.
print("İlk satır:", X[0])
print("Mat sütununun ilk satırı:", X['mat'][0])

İlk satır: (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
Mat sütununun ilk satırı: [[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


Yapısal dizilerin bir artısı da, veriyi C türü veri yapısına çevirdiğinden C gibi bir dilden bu veriye ulaşılabilir.

## RecordArrays

RecordArrays, önce anlatılan yapısal dizilerle neredeyse aynıdır. Bir farklılıkla: sütun adları nitelik olarak yazılarak sütunlara ulaşılabilir. Numpy dizisini record array'e çevirmek için `dizi.view(np.recarray)` biçimi kullanılır.

In [11]:
print("Sütuna Index ile ulaşma:", veri['yas'])
veri_rec = veri.view(np.recarray) # veriyi recarray türüne çeviriyoruz
print("Sütuna nitelik ile ulaşma:", veri_rec.yas)

Sütuna Index ile ulaşma: [25 45 37 19 53]
Sütuna nitelik ile ulaşma: [25 45 37 19 53]


Gelgelelim recordarrays bi tık daha yavaştır. Kullanışlılığın yavaşlığa değip değmeyeceğini projenize göre karar verirsiniz.