# DÜZENLEME KOMUTLARI

## İndeks Değerlerini Ayarlamak

## index_col() Parametresi

Veri Çerçevesi (Data Frame) içerisinde bulunan sütunlardan birini, indeks değeri olarak ayarlamak/atamak istersek, **index_col()** fonksiyonunu kullanabiliriz.
Öncelikle elimizdeki excel dosyamızı veri çerçevesine dönüştürüp içeriğine göz atalım.

In [36]:
import pandas as pd

dogumlar = pd.read_excel("Veri_Setleri/AyaGöreDoğumlar.xlsx", sheet_name = "ortalama")
dogumlar.head()

Unnamed: 0,Yıl,Toplam,Ortalama
0,2001,1323341,110278.416667
1,2002,1229555,102462.916667
2,2003,1198927,99910.583333
3,2004,1222484,101873.666667
4,2005,1244041,103670.083333


Oluşan veri çerçevesindeki **Yıl** sütununu indeks olarak ayarlayalım.

In [None]:
dogumlar = pd.read_excel("Veri_Setleri/AyaGöreDoğumlar.xlsx", sheet_name = "ortalama", index_col=0)
dogumlar.head()

İşlem başarılı. **Yıl** Sütunu, indeks olarak ayarlandı.

## set_index() metodu

Veri Çerçevelerinin indeks değerlerini **index_col** parametresi ile değiştirebildiğimiz gibi İstersek **set_index()** metodu ile de değiştirebilir / atayabiliriz.
**dogumlar** isimli veri çerçevemizi yeniden oluşturup indeks başlığı **set_index()** metodu ile değiştirelim.

In [None]:
dogumlar = pd.read_excel("Veri_Setleri/AyaGöreDoğumlar.xlsx")
dogumlar

Veri çerçevesini yeniden (AyaGöreDoğumlar.xlsx isimli excel doyasından içe aktararak) oluşturduğumuz ve **index_col** parametresi kullanmadığımız için, İndeks değerleri Pandas tarafından otomatik olarak oluşturuldu. Bu kez de **Toplam** isimli sütun değerlerini **set_index** metoduyla, indeks değerleri olarak atayalım.

In [None]:
dogumlar.set_index("Toplam")

## Sütunları Atla

## usecols Parametresi

Bir Excel çalışma sayfasını, Pandas Veri Çerçevesine (DataFrame'e) dönüştürürken, bazı sütunları atlamamız / göz ardı etmemiz gerekebilir, bunu **usecols** parametresi kullanarak yapabiliriz. Bu parametre, tamsayı (int), metin (str), list-like veya callable (varsayılan None) değerlerini alır. Sütun adlarının veya konumlarının listesini belirtmek için, bir dize (string) listesi veya bir tamsayı (int) listesi kullanmalıyız.

Aylara Göre Doğum Sayıları tablosunu yukarıda görmüştük. Bu tabloda 14 sütun bulunmaktadır. Sadece istediğimiz aylara ait sütun bilgilerini görüntülemek istersek **usecols** parametresine ya **ay isimlerini** ya da **ayın sütun indis değerini** yazmamız gerekir. Her iki kullanımı da görelim.

In [None]:
dogumlar = pd.read_excel("Veri_Setleri/AyaGöreDoğumlar.xlsx", usecols=["Yıl", "Ocak", "Haziran", "Ağustos"])
dogumlar.head()

In [None]:
dogumlar = pd.read_excel("Veri_Setleri/AyaGöreDoğumlar.xlsx", usecols=[0,2,7,9])
dogumlar.head()

**usecols** parametresine, <u>sütun isimlerini yazarken</u>, sütun isimleri metinsel (string) ifade olduğu için **çift tırnak işareti "** kullandığımıza, <u>indis değeri yazarken</u> , indis değerleri tamsayı (int) olduğu için, tırnak işareti kullanmadığımıza dikkat edin.

Ayrıca, **usecols** parametresini, sütun aralığı belirterek te kullanabiliriz. Veri çerçevemizin sütunlarını, Excel programının sütun isimleri gibi (A, B, C,... şeklinde) düşünerek aralık belirtebiliriz. Aşağıdaki örnek, ne demek istediğimi daha net anlatacaktır.

In [None]:
dogumlar = pd.read_excel("Veri_Setleri/AyaGöreDoğumlar.xlsx", usecols="C:G")
dogumlar.head()

Oluşturduğumuz Veri Çerçevemizdeki **Yıl** Sütunu **A**'ya, **Toplam** sütunu **B**'ye, **Ocak** Sütunu da **C**'ye denk geldiği için, çıktımız **Ocak** Ayından başlayıp **G** sütununa denk gelen **Mayıs** ayına kadar olan aralığı alarak çıktı olarak bize sundu.

## Satırları Atla

## skiprows Parametresi

Bir Excel çalışma sayfasını, Pandas Veri Çerçevesine (DataFrame'e) dönüştürürken, bazı satırları atlamamız / göz ardı etmemiz gerekebilir, bunu **skiprows** parametresi kullanarak yapabiliriz. Bu, parametre olarak, list-like, tamsayı (int) veya callable (isteğe bağlı) değerlerini alır. Bu parametre ile ilk birkaç satırı, seçilen satırı ve belirttiğimiz satır aralığını atlayabiliriz.

In [None]:
basliksiz = pd.read_excel("Veri_Setleri/SatırAtla.xlsx")
basliksiz.head(10)

Atlamak / gözardı etmek istediğimiz satırları tek tek te belirtebiliriz.

In [None]:
basliksiz = pd.read_excel("Veri_Setleri/SatırAtla.xlsx", skiprows=[0,1,2,3,5,8,10,12])
basliksiz.head(10)

## Sütun Ekle

Veri çerçevesine yeni bir sütun ekleyip bu sütuna değer atamak mümkündür. Bunu şu yöntemle yapabiliriz.

***Veri_Çerçevesi_Adı["Yeni_Sütun_Adı"] = Atanacak_Değerler***

Örneğin NBA oyuncularının çeşitli bilgilerinin bulunduğu veri çerçevesinden, yıllık kazanç miktarlarını (**Salary**) 12'ye bölerek aylık kazançlarını hesaplayarak, **Aylık Kazanç** isimli yeni sütuna yazmaya çalışalım.
Önce Veri çerçevemizin orijinal haline göz atalım.

In [None]:
veri = pd.read_csv("Veri_Setleri/nba.csv")
veri

Şimdi istediğimizi yapmaya (yıllık kazanç miktarlarını (**Salary**) 12'ye bölerek aylık kazançları, **Aylık Kazanç** isimli yeni sütuna yazmaya) sıra geldi.

In [None]:
veri["Aylık Kazanç"] = veri["Salary"] / 12
veri

## Satır ya da Sütun Sil

Veri çerçevesine ekleme yapılabildiği gibi, silme / çıkarma işlemi de yapılabiliyor.
Bunun için **drop()** metodu kullanılıyor.

## drop() Metodu

Bu metodun kullanım/yazım şekli aşağıdaki gibidir.

***Veri_Çerçevesi_Adı.drop("Sütun_Adı", axis = 0 ya da 1, inplace = True ya da False)***

**drop()** metodunun parametrelerini, sırayla açıklayalım.
* **Sütun_Adı**, adından belli olduğu üzere, silinecek sütunun adıdır. Birden fazla sütun silinmek istenirse, isimler liste şeklinde yani köşeli parantez içinde yazılmalıdır.
* **axis** parametresi, Sıfır **(0)** Satırları, Bir **(1)** Sütunları temsil eder. Varsayılan (default) değeri 0'dır. Aynı isme ait satır ve sütun bilgisi olması durumunda, bu parametre satırın mı, sütunun  mu silinmesi gerektiği konusunda bize yardımcı olur.
* **inplace** parametresi, Gerçekleştirilen silme işleminin veri çerçevesinde kalıcı ya da geçici olmasını ayarladığımız kısımdır. **inplace = True** yazılırsa, yapılan işlem kalıcı hale gelecektir.

NBA oyuncularının bilgilerinin bulunduğu veri çerçevesinden, **Yaş (Age)** bilgisini silmeye çalışalım.

In [None]:
veri.drop("Age", axis = 1, inplace=True)
veri

Gördüğünüz gibi veri çerçevemizde artık Oyuncuların Yaş bilgilerini barındıran **Age** isimli sütun bulunmuyor, tamemiyle silindi.