## Pandas'a Giriş - Pandası Tanıyalım

* Pandas, **güçlü veri yapılarını kullanarak** yüksek performanslı **veri işleme ve analiz aracı sağlayan** açık kaynaklı bir Python Kitaplığıdır.

* **‘.csv’ ve ‘.txt’ dosyalarını** açmak ve içerisinde bulunan verileri okuyarak istenen sonuca kolayca ulaşmak için kullanılmaktadır. Ayrıca Pandas sayesinde bir **excel dosyasını açarak** içerisinde bulunan bir sütunu veya satırı seçip **işlem yapabiliriz.**

* Pandas’da verileri kolay analiz etmek için bazı veri yapıları vardır. Bunlardan en çok kullanılanları **Series ve DataFrame veri yapılarıdır.**

<span style='color:green'>**ÖNEMLİ**</span>
> Yaygın olarak kullanılan iki metin dosyası biçimi vardır:
Sınırlandırılmış metin dosyaları (.txt) ve içinde SEKME karakteri (ASCII karakter kodu 009) genellikle her metin alanını birbirinden ayırandır.
Virgülle ayrılmış değerler metin dosyaları (.csv) ve içinde virgül karakteri (,) genellikle metin her alanını birbirinden ayrılır.

> <span style='color:green'>**PANDASIN ÖZELLİKLERİ**</span>

* İndeksli DataFrame (veri iskeleti) objeleri ile veri işlemesi yapabilmek.
* Hafızadaki veya farklı türlerde bulunan veriyi okuyabilmek ve yazabilmek için araçlar sağlamak.
* Veri sıralama ve bütünleşik kayıp veri senaryolarına karşı esnek imkanlar sunması.
* Veri setlerinin tekrar boyutlandırılması veya döndürülmesi.
* Etiket bazlı dilimleme, özel indeksleme ve büyük veri setlerini ayrıştırma özelliği.
* Veri iskeletine sütun ekleme veya var olan sütunu çıkarma.
* Veri gruplama özelliği ile ayırma-uygulama-birleştirme uygulamalarının yapılabilmesi.
* Veri setlerinin birleştirilmesi ve birbirine eklenmesi.
* Hiyerarşik eksenleri indeksleme özelliğiyle birlikte çok boyutlu veriden, daha az boyutlu veri elde edilebilmesi.
* Zaman serisi özelliği: Zaman aralığı oluşturma[4] ve sıklık çevrimleri yapma, hareketli aralık istatistik fonksiyonları, tarih öteleme ve geciktirme.
* Veri filtrelemesi yapabilmek.

In [9]:
# Pandas kütüphanesini kullanmamız için import etmemiz lazım.
import pandas as pd

## Pandas Serisi Oluşturmak

In [1]:
import pandas as pd

seri = pd.Series([5,10,15,20,25])

print(seri,"\n\n",type(seri),",",seri.axes,",",seri.dtype,",",seri.size,",",seri.ndim,",",seri.values)

0     5
1    10
2    15
3    20
4    25
dtype: int64 

 <class 'pandas.core.series.Series'> , [RangeIndex(start=0, stop=5, step=1)] , int64 , 5 , 1 , [ 5 10 15 20 25]


In [2]:
import pandas as pd

seri = pd.Series([9,12,15,18,21])

print(seri,"\n",5*('--'),"\n",seri.head(3),"\n",5*('--'))    # head = Pandas Series ve DataFrame'lerinde elimizdeki verinin ilk n satırındaki gözlem değerlerine ulaşmak için head() fonksiyonunu kullanırız.

print(seri.tail(2),"\n",5*('--'))                            # tail = bu yöntem de elimizdeki verinin sondan n satırın gözlem değerlerine ulaşmak için kullanılır.

seri_index_degistirme = pd.Series([11,22,33,44,55], index = [5,6,7,8,9])    # pandas serisinin index numaralarını değiştirme

seri_index_degistirme_str = pd.Series([2,4,6,8,10], index = ["a","b","c","d","e"])

print(seri_index_degistirme,"\n",5*('--'),"\n",seri_index_degistirme_str)

0     9
1    12
2    15
3    18
4    21
dtype: int64 
 ---------- 
 0     9
1    12
2    15
dtype: int64 
 ----------
3    18
4    21
dtype: int64 
 ----------
5    11
6    22
7    33
8    44
9    55
dtype: int64 
 ---------- 
 a     2
b     4
c     6
d     8
e    10
dtype: int64


In [2]:
import pandas as pd

seri = pd.Series([99,100,101,102,103])

print(seri,"\n\n",seri[0],",",seri[4],"\n\n",seri[0:3])               # gözlem değerlerine ulaşma

seri_str = pd.Series([4,5,6,7,8], index = ["a","b","c","d","e"])

print("\n",seri_str["a"],"\n")
print(seri_str["e"],"\n")
print(seri_str["a":"e"])  #şuana kadarki bilgilerle normalde "e" indeksi dahil olmaması gerekir ama pandas indeks tipi str ise son indeks de dahil olur.

0     99
1    100
2    101
3    102
4    103
dtype: int64 

 99 , 103 

 0     99
1    100
2    101
dtype: int64

 4 

8 

a    4
b    5
c    6
d    7
e    8
dtype: int64


In [2]:
#Sözlük üzerinden liste oluşturma
import pandas as pd

a = pd.Series({"doğukan":80,"batuhan":70,"zeynep":90,"mehmet":100,"gülsen":110})

print(a,"\n\n",a.keys,"\n\n",a.values,"\n\n",list(a.items()))

doğukan     80
batuhan     70
zeynep      90
mehmet     100
gülsen     110
dtype: int64 

 <bound method Series.keys of doğukan     80
batuhan     70
zeynep      90
mehmet     100
gülsen     110
dtype: int64> 

 [ 80  70  90 100 110] 

 [('doğukan', 80), ('batuhan', 70), ('zeynep', 90), ('mehmet', 100), ('gülsen', 110)]


In [18]:
#İki seriyi birleştirme
import pandas as pd

a = pd.Series([99,100,101])
print(pd.concat([a,a]))

0     99
1    100
2    101
0     99
1    100
2    101
dtype: int64


In [159]:
import numpy as np

a = np.random.randint(3,20,size=40)
b = pd.Series(a, index = [i for i in range(100,140)])
b

100     5
101     5
102    15
103     4
104     4
105     8
106     8
107    12
108    11
109    15
110    16
111    14
112     7
113    19
114     3
115    12
116     6
117     9
118     8
119     4
120    13
121    12
122    16
123    16
124    17
125     7
126    10
127     5
128     9
129    16
130    13
131    14
132     9
133    15
134     4
135    19
136     3
137    13
138    15
139    12
dtype: int32

## Pandas Series Eleman İşlemleri

In [3]:
import numpy as np

a = np.array([44,55,66,'a'])
b = pd.Series(a)

print(b,"\n\n",b[0:3])

0    44
1    55
2    66
3     a
dtype: object 

 0    44
1    55
2    66
dtype: object


In [8]:
import pandas as pd

seri = pd.Series([121,200,150,99],index = ["reg","loj","cart","rf"])

print(seri.index)
print("\n",seri.values)
print("\n",seri.keys)
print("\n",list(seri.items()))
print("\n","reg" in seri)  
print("\n", seri[["rf","reg"]])   # fancy eleman
seri["reg"]=30
print("\n",seri,"\n\n",seri["reg"])
print("\n",seri["reg":"cart"])

Index(['reg', 'loj', 'cart', 'rf'], dtype='object')

 [121 200 150  99]

 <bound method Series.keys of reg     121
loj     200
cart    150
rf       99
dtype: int64>

 [('reg', 121), ('loj', 200), ('cart', 150), ('rf', 99)]

 True

 rf      99
reg    121
dtype: int64

 reg      30
loj     200
cart    150
rf       99
dtype: int64 

 30

 reg      30
loj     200
cart    150
dtype: int64
