# Pandas
- Pandas kütüphanesi veri analizi için kullanılan bir kütüphanedir.
- Panel Data'dan gelmektedir.
- Yapısal verilerle çalışmak için kullanılır.
- Veri manipülasyonu ve analizi için yazılmış açık kaynaklı bir Python kütüphanesidir.
- Ekonometrik ve finansal verilerle çalışmak için kullanılır.
- 2008 yılında Wes McKinney tarafından geliştirilmiştir.

Numpy ve Matplotlib kütüphaneleri ile birlikte çalışabilir.

pip install pandas komutu ile pandas kütüphanesini kurabiliriz.


In [1]:
pip install pandas

Collecting pandas
  Downloading pandas-2.0.1-cp311-cp311-win_amd64.whl (10.6 MB)
     ---------------------------------------- 10.6/10.6 MB 3.7 MB/s eta 0:00:00
Collecting pytz>=2020.1
  Downloading pytz-2023.3-py2.py3-none-any.whl (502 kB)
     -------------------------------------- 502.3/502.3 kB 3.9 MB/s eta 0:00:00
Collecting tzdata>=2022.1
  Downloading tzdata-2023.3-py2.py3-none-any.whl (341 kB)
     -------------------------------------- 341.8/341.8 kB 3.5 MB/s eta 0:00:00
Installing collected packages: pytz, tzdata, pandas
Successfully installed pandas-2.0.1 pytz-2023.3 tzdata-2023.3
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip available: 22.3.1 -> 23.1.2
[notice] To update, run: python.exe -m pip install --upgrade pip


# Pandas Serisi Oluşturmak

In [2]:
import pandas as pd
import numpy as np

pd.Series() ile pandas serisi oluşturabiliriz.

In [16]:
seri = pd.Series([1,2,3,4,5,6,7,8,9,10,11,12]) 

In [18]:
print(seri)

0      1
1      2
2      3
3      4
4      5
5      6
6      7
7      8
8      9
9     10
10    11
11    12
dtype: int64


In [19]:
type(seri)

pandas.core.series.Series

**.axes** ile serinin başlangıç, bitiş ve adım değerlerini görebiliriz.

In [20]:
print(seri.axes)

[RangeIndex(start=0, stop=12, step=1)]


dtype ile serinin veri tipini görebiliriz.

In [21]:
print(seri.dtype)

int64


.size ile serinin boyutunu görebiliriz.

.ndim ile serinin boyut sayısını görebiliriz.

In [22]:
print(seri.size)
print(seri.ndim)

12
1


.values ile serinin değerlerini görebiliriz.

In [24]:
print(seri.values)

[ 1  2  3  4  5  6  7  8  9 10 11 12]


.head() ile serinin ilk 5 değerini görebiliriz. Eğer isterseniz .head(10) diyerek ilk 10 değeri görebilirsiniz.

In [25]:
print(seri.head())

0    1
1    2
2    3
3    4
4    5
dtype: int64


In [26]:
print(seri.head(3))

0    1
1    2
2    3
dtype: int64


.tail() ile serinin son 5 değerini görebiliriz. Eğer isterseniz .tail(10) diyerek son 10 değeri görebilirsiniz.

In [28]:
print(seri.tail())

7      8
8      9
9     10
10    11
11    12
dtype: int64


In [27]:
print(seri.tail(3))

9     10
10    11
11    12
dtype: int64


## İndex İsimlendirme

In [31]:
#Normalde default olarak bu şekildeyken:
pd.Series([99,22,332,94,5], index = [0,1,2,3,4]) # index isimlendirme yapar

0     99
1     22
2    332
3     94
4      5
dtype: int64

In [33]:
#Bu yöntemi kullanarak indexlerin isimlerini değiştirebiliriz.
pd.Series([99,22,332,94,5], index = ["a","b","c","d","e"]) 

a     99
b     22
c    332
d     94
e      5
dtype: int64

In [34]:
seri = pd.Series([99,22,332,94,5], index = ["a","b","c","d","e"]) # index isimlendirme yapar
print(seri["a"])

99


In [35]:
print(seri["a":"c"])

a     99
b     22
c    332
dtype: int64


In [36]:
sozluk = {"reg":10, "log":11, "cart":12} #Bu isimler pandas'ta kullanılan fonksiyon isimleri.Göz aşinalığı olsun diye bu isimleri verdik :))
seri = pd.Series(sozluk) #Sözlüğü bir seriye dönüştür.
print(seri)

reg     10
log     11
cart    12
dtype: int64


In [40]:
#Aynı işlemleri farklı veri tiplerinde de yapabiliriz.
tuple = (12,45,89)
seri2 = pd.Series(tuple)
print(seri2)

0    12
1    45
2    89
dtype: int64


In [42]:
tuple = ("Hasan","Efe","Türkan")
seri2 = pd.Series(tuple)
print(seri2)

0     Hasan
1       Efe
2    Türkan
dtype: object


In [43]:
liste = [12,45,89]
seri3 = pd.Series(liste)
print(seri3)

0    12
1    45
2    89
dtype: int64


In [41]:
liste = ["Hasan","Efe","Türkan"]
seri3 = pd.Series(liste)
print(seri3)

0     Hasan
1       Efe
2    Türkan
dtype: object


## Numpy ile kullanma:

In [58]:
randomNumbers = np.random.randint(10,100,5)
pandas = pd.Series(randomNumbers)
print(pandas)

0    42
1    21
2    92
3    63
4    86
dtype: int32


In [59]:
print(pandas[4])

86


In [60]:
pandas2 = pd.Series(randomNumbers, index = ["a","b","c","d","e"]) #index isimlendirme de yapılabilir.
print(pandas2)

a    42
b    21
c    92
d    63
e    86
dtype: int32


In [61]:
print(pandas2["c"])

92


In [62]:
a = np.array([1,2,33,444,75])
seri = pd.Series(a)
print(seri)

0      1
1      2
2     33
3    444
4     75
dtype: int32


In [63]:
print(seri[0:3])

0     1
1     2
2    33
dtype: int32


In [64]:
seri = pd.Series([121,200,150,99], index = ["reg","loj","cart","rf"])
print(seri)

reg     121
loj     200
cart    150
rf       99
dtype: int64


In [69]:
print(seri.index)

Index(['reg', 'loj', 'cart', 'rf'], dtype='object')


In [73]:
print(seri.keys()) #Aynı çıktıyı verdi çünkü key = index

Index(['reg', 'loj', 'cart', 'rf'], dtype='object')


In [103]:
print(list(seri.keys())) #Keyleri = İndexleri listeye çevirdik.

['reg', 'loj', 'cart', 'rf']


In [105]:
print(list(seri.index)) #Keyleri = İndexleri listeye çevirdik.

['reg', 'loj', 'cart', 'rf']


In [71]:
print(seri.values)

[121 200 150  99]


In [80]:
print(list(seri)) # Value'ları Listeye çevirdik. 

[121, 200, 150, 99]


In [106]:
print(list(seri.values)) # Value'ları Listeye çevirdik. 

[121, 200, 150, 99]


In [88]:
print(seri.items)

<bound method Series.items of reg     121
loj     200
cart    150
rf       99
dtype: int64>


In [109]:
print(list(seri.items()))  #Komple listeye çevirdik.

[('reg', 121), ('loj', 200), ('cart', 150), ('rf', 99)]


In [112]:
print(seri)

reg     121
loj     200
cart    150
rf       99
dtype: int64


In [111]:
"reg" in seri #"Reg" seri de var mı ?

True

In [113]:
"a" in seri 

False

In [114]:
seri[["rf","reg"]]

rf      99
reg    121
dtype: int64

In [115]:
seri["rf"] = 125 #Veri güncelleyebiliriz.
print(seri)

reg     121
loj     200
cart    150
rf      125
dtype: int64
