## Sözlükler

Listeler aşağıdaki durumda yetersiz kalabilir. 

In [1]:
nufus = [30.55, 2.77, 39.21]
ulkeler = ["afghanistan", "albania", "algeria"]
alb_indeks = ulkeler.index("albania")
print(alb_indeks)

1


In [2]:
print(nufus[alb_indeks])

2.77


Görüldüğü üzere bu kullanım zahmetli ve sezgisel. Bu durum büyük verilerde hata yapmamıza sebep olabilir. Bu yüzden daha kolay yönetilebilen bir şey olmalı. İşte, sözlükler bu konuda devereye giriyor.

In [3]:
dunya_nufus = {"afghanistan":30.55,
               "albania":2.77,
               "algeria":39.21}

print(dunya_nufus["albania"])

2.77


Bir sözlük `anahtar: değer` çiftlerinden oluşur ve anahtar değerleri eşsiz olmalıdır. Eğer bir anahtar değer birden fazla sözlüğe eklenmişse, en sondaki `anahtar: değer` çiftine göre tanımlanır.

In [4]:
dunya_nufus = {"afghanistan":30.55, "albania":2.77, "algeria":39.21, "albania":2.81}

print(dunya_nufus)

{'afghanistan': 30.55, 'albania': 2.81, 'algeria': 39.21}


Sözlükteki anahtar nesneleri değiştirilemez nesnelerden oluşmalıdır.

In [5]:
print({0:"merhaba", True:"Python", "iki":"dünya"})

{0: 'merhaba', True: 'Python', 'iki': 'dünya'}


In [6]:
print({["sadece", "test", "için"]: "değer"})

TypeError: unhashable type: 'list'

Bir sözlüğe değer eklemek için `[]` karakerleri kullanılır.

In [7]:
dunya_nufus['sealand'] = 0.000027
print(dunya_nufus)

{'afghanistan': 30.55, 'albania': 2.81, 'algeria': 39.21, 'sealand': 2.7e-05}


Bir sözlükte anahtar nesnesinin olup olmadığı `in` operatörü ile öğrenilir. 

In [8]:
print('sealand' in dunya_nufus)

True


Bir sözlükte değer güncellemek için anahtar nesnesi girilerek yapılır.

In [9]:
dunya_nufus['sealand'] = 0.000028
print(dunya_nufus)

{'afghanistan': 30.55, 'albania': 2.81, 'algeria': 39.21, 'sealand': 2.8e-05}


Bir sözlükten değer anahtar nesnesi kullanılarak silinebilir.

In [10]:
del(dunya_nufus['sealand'])
print(dunya_nufus)

{'afghanistan': 30.55, 'albania': 2.81, 'algeria': 39.21}


## Pandas

Yapılandırılmış veri, satırların ve sütunların kullanılarak tutulduğu veri türlerinden biridir. Herbir satrı gözlemlemleri veya kayıtları temsil ederken her bir sütun özellikleri veya değişkenleri temsil eder.

Peki, 2 Boyutlu NumPy dizisinde veri tutabilir miyiz? NumPy dizileri sabit tipli yapılar olduğu için çeşitli olan verileri barındıramaz. Bu yüzden Pandas kütüphanesine başvuruyoruz.

Pandas, NumPy üzerine geliştirilen yüksek seviyeli veri manipülasyonu kütüphanesidir.

### Pandas Veri Çerçevesi Oluşturma

In [11]:
veri_sozlugu = {"country": ["Brazil", "Russia", "India", "China", "South Africa"],
                "capital": ["Brasilia", "Moscow", "New Delhi", "Beijing", "Pretoria"],
                "area": [8.516, 17.10, 3.286, 9.597, 1.221],
                "population": [200.4, 143.5, 1252, 1357, 52.98]}

# Anahtarlar, sütunları temsil ederken değerler her bir sütun için gözlemleri temsil etmektedir.

In [12]:
import pandas as pd
brics = pd.DataFrame(veri_sozlugu)
print(brics)

        country    capital    area  population
0        Brazil   Brasilia   8.516      200.40
1        Russia     Moscow  17.100      143.50
2         India  New Delhi   3.286     1252.00
3         China    Beijing   9.597     1357.00
4  South Africa   Pretoria   1.221       52.98


In [13]:
# index özniteliği ile satır numaraları güncellenebilir
brics.index = ["BR", "RU", "IN", "CH", "SA"]
print(brics)

         country    capital    area  population
BR        Brazil   Brasilia   8.516      200.40
RU        Russia     Moscow  17.100      143.50
IN         India  New Delhi   3.286     1252.00
CH         China    Beijing   9.597     1357.00
SA  South Africa   Pretoria   1.221       52.98


### CSV Dosyalarından Veri Çerçevesi Oluşturma

In [14]:
brics = pd.read_csv('data/brics.csv')
print(brics)

  Unnamed: 0       country    capital    area  population
0         BR        Brazil   Brasilia   8.516      200.40
1         RU        Russia     Moscow  17.100      143.50
2         IN         India  New Delhi   3.286     1252.00
3         CH         China    Beijing   9.597     1357.00
4         SA  South Africa   Pretoria   1.221       52.98


In [15]:
brics = pd.read_csv('data/brics.csv', index_col=0)
print(brics)

         country    capital    area  population
BR        Brazil   Brasilia   8.516      200.40
RU        Russia     Moscow  17.100      143.50
IN         India  New Delhi   3.286     1252.00
CH         China    Beijing   9.597     1357.00
SA  South Africa   Pretoria   1.221       52.98


### Veri Seçme

Pandas'ta veri seçmek için iki metot mevcuttur.

- Köşeli Parantez ile Index yöntemi
- İleri seviye yöntemler
    - loc
    - iloc

#### Sütun Seçme

In [16]:
# Köşeli parantez ile veri seçme
print(brics['country'])

BR          Brazil
RU          Russia
IN           India
CH           China
SA    South Africa
Name: country, dtype: object


In [17]:
print(type(brics['country']))

<class 'pandas.core.series.Series'>


Veri çerçevesinden bir köşeli parantez ile seçilen bir sütun bize Pandas Serisini verir. 

Pandas Serileri, tek boyutlu ve etiketlenmiş dizilerdir.

In [18]:
# İki köşeli parantez ile veri seçme
print(brics[['country']])

         country
BR        Brazil
RU        Russia
IN         India
CH         China
SA  South Africa


In [19]:
print(brics[["country", "capital"]])

         country    capital
BR        Brazil   Brasilia
RU        Russia     Moscow
IN         India  New Delhi
CH         China    Beijing
SA  South Africa   Pretoria


In [20]:
print(type(brics[['country']]))

<class 'pandas.core.frame.DataFrame'>


Veri çerçevesinden iki köşeli parantez ile seçilen bir veya birden fazla sütun bize Pandas Veri Çerçevesini verir. 

#### Satır Seçmek

In [21]:
print(brics[1:4]) # 2, 3, 4. satırları seçer

   country    capital    area  population
RU  Russia     Moscow  17.100       143.5
IN   India  New Delhi   3.286      1252.0
CH   China    Beijing   9.597      1357.0


#### Sütun ve Satır Seçmek

In [22]:
print(brics[1:4]["capital"]) # Bu şekilde seçim işlemi yapılabilir ama tavsiye edilmez.

RU       Moscow
IN    New Delhi
CH      Beijing
Name: capital, dtype: object


In [23]:
print(brics[1:4, "capital"]) # Bu şekilde seçim yapılamaz.

InvalidIndexError: (slice(1, 4, None), 'capital')

#### loc ile Satır Seçmek

`df.loc[[satır_etiket(ler)i], :]`

In [24]:
print(brics.loc[['RU'], :]) # Bir satır seçmek

   country capital  area  population
RU  Russia  Moscow  17.1       143.5


In [25]:
print(brics.loc[['RU', 'IN'], :]) # Birden fazla satır seçmek

   country    capital    area  population
RU  Russia     Moscow  17.100       143.5
IN   India  New Delhi   3.286      1252.0


#### loc ile Sütun Seçmek



`df.loc[:, [sutun_etiket(ler)i]]`

In [26]:
print(brics.loc[:, ["country"]]) # Bir sütun seçmek

         country
BR        Brazil
RU        Russia
IN         India
CH         China
SA  South Africa


In [27]:
print(brics.loc[:, ["country", "capital"]]) # Birden fazla sütun seçmek

         country    capital
BR        Brazil   Brasilia
RU        Russia     Moscow
IN         India  New Delhi
CH         China    Beijing
SA  South Africa   Pretoria


#### loc ile Satır ve Sütun Seçmek

`df.loc[[satır_etiket(ler)i], [sutun_etiket(ler)i]]`

In [28]:
print(brics.loc[['RU'], ['country']]) # Bir satır ve bir sütun seçmek

   country
RU  Russia


In [29]:
print(brics.loc[['RU', 'IN'], ['country']]) # Birden fazla satır ve bir sütun seçmek

   country
RU  Russia
IN   India


In [30]:
print(brics.loc[['RU'], ["country", "capital"]]) # Bir satır ve birden fazla sütun seçmek

   country capital
RU  Russia  Moscow


In [31]:
print(brics.loc[['RU', 'IN'], ["country", "capital"]]) # Birden fazla satır ve birden fazla sütun seçmek

   country    capital
RU  Russia     Moscow
IN   India  New Delhi


#### iloc ile Satır Seçmek

`df.loc[[satır_indeks(ler)i], :]`

In [32]:
print(brics.iloc[[1], :]) # Bir satır seçmek

   country capital  area  population
RU  Russia  Moscow  17.1       143.5


In [33]:
print(brics.iloc[[1, 2], :]) # Birden fazla satır seçmek

   country    capital    area  population
RU  Russia     Moscow  17.100       143.5
IN   India  New Delhi   3.286      1252.0


#### iloc ile Sütun Seçmek

`df.loc[:, [sutun_indeks(ler)i]]`

In [34]:
print(brics.iloc[:, [0]]) # Bir sütun seçmek

         country
BR        Brazil
RU        Russia
IN         India
CH         China
SA  South Africa


In [35]:
print(brics.iloc[:, [0, 1]]) # Birden fazla sütun seçmek

         country    capital
BR        Brazil   Brasilia
RU        Russia     Moscow
IN         India  New Delhi
CH         China    Beijing
SA  South Africa   Pretoria


#### iloc ile Satır ve Sütun Seçmek

`df.loc[[satır_indeks(ler)i], [sutun_indeks(ler)i]]`

In [36]:
print(brics.iloc[[1], [0]]) # Bir satır ve bir sütun seçmek

   country
RU  Russia


In [37]:
print(brics.iloc[[1, 2], [0]]) # Birden fazla satır ve bir sütun seçmek

   country
RU  Russia
IN   India


In [38]:
print(brics.iloc[[1], [0, 1]]) # Bir satır ve birden fazla sütun seçmek

   country capital
RU  Russia  Moscow


In [39]:
print(brics.iloc[[1, 2], [0, 1]]) # Birden fazla satır ve birden fazla sütun seçmek

   country    capital
RU  Russia     Moscow
IN   India  New Delhi
