## Series

Pandas serileri, temel veri yapılarından biridir. Bir Pandas serisi, tek boyutlu etiketli bir dizidir. Bu dizi her türlü veri türünü (tam sayılar, stringler, floating point sayılar, Python objeleri vb.) içerebilir ve her bir veri noktası bir indeks ile ilişkilendirilir. Bu indeks varsayılan olarak 0'dan başlayan sayısal indekslerdir, ancak zaman damgaları gibi özel indeksler veya stringler (dict yapısı) gibi başka türden etiketler de kullanılabilir.

In [None]:
import pandas as pd


std_list = [1, 2, 3, 4]

pd_series = pd.Series(std_list)
print(pd_series)

In [None]:
print(type(std_list))
print(type(pd_series))

pd_series[0]

Pandas serileri sözlük yapısı şeklinde de kullanılabilir.

In [None]:
import pandas as pd

std_list = [1, 2, 3, 4]
keys = ["a", "b", "c", "d"]

pd_series = pd.Series(std_list, index=keys)

print(pd_series)

In [None]:
import pandas as pd 

std_dict = {"a" : 1, "b" : 2, "c" : 3, "d": 4}
pd_series = pd.Series(std_dict)

print(pd_series)
print()
print(pd_series["a"])

In [None]:
import pandas as pd


std_list = [1, 2, 3, "a"]

pd_series = pd.Series(std_list)
print(pd_series)

In [None]:
import pandas as pd

std_dict = {"a" : 1, "b" : 2, "c" : 3, "d": 4}

pd_series = pd.Series(std_dict, index= ["a", "c"])

print(pd_series)
print(pd_series["a"])

### Fonksiyonlar

Pandas serilerinde kullanılan bazı temel fonksiyonlar aşağıda verilmiştir.

**Temel istatistikler**:
   - `mean()`: Ortalama değeri hesaplar.
   - `median()`: Medyan değeri hesaplar.
   - `sum()`: Serideki değerlerin toplamını hesaplar.
   - `max()`: Serideki maksimum değeri döner.
   - `min()`: Serideki minimum değeri döner.
   - `std()`: Standart sapmayı hesaplar.
   - `var()`: Varyansı hesaplar.

**Veri dönüştürme**:
   - `abs()`: Serideki tüm değerlerin mutlak değerini hesaplar.
   - `round()`: Serideki sayısal değerleri belirli bir basamağa kadar yuvarlar.
   - `astype()`: Serinin veri tipini değiştirir.

**Eleman işlemleri**:
   - `map()`: Serinin her elemanına bir fonksiyon uygular.
   - `apply()`: Serinin her elemanına daha karmaşık fonksiyonlar uygulamak için kullanılır.
   - `drop()`: Belirtilen etiketlere sahip elemanları seriden çıkarır.

**Filtreleme ve sorgulama**:
   - `filter()`: Belirli koşulları karşılayan elemanları seriden seçmek için kullanılır.
   - `where()`: Koşullara göre serideki değerleri filtreler, koşulu karşılamayanları belirli bir değer ile değiştirebilir.
   - `isin()`: Serinin elemanlarının, belirli bir değer listesinde olup olmadığını döner.

**Sıralama ve sıralı istatistikler**:
   - `sort_values()`: Seriyi değerlerine göre sıralar.
   - `rank()`: Serideki her bir elemana sıralamasına göre bir rütbe atar.

**Birleştirme ve gruplama**:
   - `append()`: İki seriyi uç uca ekler.
   - `groupby()`: Karmaşık veri dönüşümleri için kullanılır, özellikle DataFrame'lerle birlikte.

**Zaman sersi işlemleri**:
   - `resample()`: Zaman serisi verilerini yeniden örnekleme yapar (örneğin, günlük verileri aylık verilere dönüştürmek için).
   - `asfreq()`: Zaman serisi verilerini belirli bir frekansta doldurur.

**Kümülatif işlemler**:
   - `cumsum()`: Kümülatif toplamı hesaplar.
   - `cumprod()`: Kümülatif çarpımı hesaplar.
   - `cummax()`: Kümülatif maksimum değeri hesaplar.
   - `cummin()`: Kümülatif minimum değeri hesaplar.

Bu fonksiyonlar, veri analizlerinde oldukça yararlıdır ve Pandas'ın güçlü veri manipülasyon kabiliyetlerini temsil eder. Her fonksiyonun kullanımı, analiz yapmak istediğiniz veri yapısına ve ihtiyacınıza bağlı olarak değişiklik gösterebilir.

#### sort_values()

In [None]:
import pandas as pd

data = {"a" : 4, "b" : 2, "c" : 3, "ç": None, "d": 1, "e":5}
ps = pd.Series(data)
print(ps)


In [None]:
ps.sort_values(
    ascending=True, # Artan azalan sıralama
    na_position="last", # Boş değerler nereye yerleştirileceğini belirtir.
    ignore_index= False, # İndekslemeyi yeniden yapar.
    inplace=False, # Orijinal seriyi değitirme durumunu belirtir.
    )

In [None]:
import pandas as pd

data = [-1, -2, -4, 3]
ps = pd.Series(data)
print(ps.sort_values(key=lambda x: x**2))
print(ps.sort_values())

In [None]:
import pandas as pd

data = ["Alpha", "beta", "Gamma", "delta"]
ps = pd.Series(data)
sorted_ps = ps.sort_values(key=lambda x: x.str.lower())
print(sorted_ps)


#### filter()

Pandas serilerinde `.filter()` fonksiyonu, serideki belirli indeksleri seçmek için kullanılır fakat DataFrame yapılarındaki kadar işlevsel değildir.  
`.filter()` fonksiyonunun parametreleri:

1. **items**: Seçmek istediğiniz indekslerin listesi. Bu, serideki belirli indeksleri belirtmek için kullanılır.
2. **like**: İndeks isimlerinin içermesi gereken belirli bir string. Bu, indeks isimlerinde belirli bir deseni aramak için kullanılır.
3. **regex**: İndeksleri seçmek için kullanılabilecek düzenli ifade (regex). Bu, indeks isimlerinde belirli bir desene uyanları seçmek için kullanılır.




In [None]:
# items parametresi
import pandas as pd

ps = pd.Series(range(10), index=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'])
filtered_ps = ps.filter(items=['a', 'c', 'g'])
print(filtered_ps)


In [None]:

# like parametresi

import pandas as pd

ps = pd.Series(range(12), index=[
    'ocak', 'şubat', 'mart', 'nisan', 
    'mayıs', 'haziran', 'temmuz', 'ağustos', 
    'eylül', 'ekim', "kasım", "aralık"
    ])
filtered_ps = ps.filter(like='e' or "k")
print(filtered_ps)



In [None]:
# regex
import pandas as pd

ps = pd.Series(range(12), index=[
    'ocak', 'şubat', 'mart', 'nisan', 
    'mayıs', 'haziran', 'temmuz', 'ağustos', 
    'eylül', 'ekim', "kasım", "aralık"
    ])
filtered_ps = ps.filter(regex=r'[mk]$') # m veya k harfiyle bitenleri filtrele.
print(filtered_ps)


In [None]:
ps.argmax

## Dataframe


Birden fazla serinin yan yana gelerek oluşturduğu tablo tipi veri.

In [None]:
import pandas as pd

list1 = [1, 2, 3]
list2 = [4, 5, 6]

df = pd.DataFrame( {"a": list1, "b":list2}, index= ["x", "y", "z"])
print(df)
print(type(df))

In [None]:
ilk_sira = df.loc["x"]
print(ilk_sira)
print(type(ilk_sira))

In [None]:
ilk_sira = df.iloc[0]


print(ilk_sira)
print(type(ilk_sira))

In [None]:
ilk = df.loc[ :, "a"]
print(df)
print(ilk)
print(type(ilk))

In [None]:
df["c"] = pd.Series([11,22,33], index= ["x", "y", "z"])
print(df)

In [None]:
df.drop("c", axis= 1)

# Okuma

In [None]:
import pandas as pd
df  = pd.read_csv("yeni/ford.csv")

print(df)

In [None]:
import pandas as pd
df  = pd.read_excel("excel.xlsx", "Sheet2")

print(df)

In [None]:
dosya_yolu = r"C:\Users\ocesur\OneDrive\Ivır Zıvır\Dosyalar\normalizasyon.xlsx"

import pandas as pd
df  = pd.read_excel(dosya_yolu, "Anormal")




In [None]:
df.query('yil < 2018 and km > 120000')

In [None]:
import pandas as pd

# Örnek DataFrame oluşturalım
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Team': ['X', 'Y', 'X', 'Z']}

df = pd.DataFrame(data)

# 'Team' sütunu 'X' veya 'Y' takımlarını içeren satırları filtrelemek
teams = ['X', 'Y']
filtered_df = df[df['Team'].isin(teams)]
filtered_df

In [None]:
yil = [2017, 2015]

ndf = df[df["yil"].isin(yil)]
ndf

In [None]:
df["yil"].isin(yil)

# Filtreleme
Pandas'da filtreleme ve sorgulama işlemleri, veri setlerinden belirli koşulları karşılayan verileri seçmek için kullanılır. Bu işlemler, veri analizi sürecinde veri kümesini daraltmak, ilgili verileri çekmek ve istenmeyen verileri elemek için oldukça önemlidir. İşte Pandas'da kullanılan bazı temel filtreleme ve sorgulama yöntemleri:

### 1. Boolean Indexing
Bu yöntem, bir koşula bağlı olarak doğru (`True`) veya yanlış (`False`) değerler üreten bir boolean ifade kullanır. Sonuç olarak, doğru (`True`) değerleri karşılayan satırlar seçilir.

```python
# Örnek: 'Age' sütunu 30'dan büyük olan tüm satırları seç
filtered_data = df[df['Age'] > 30]
```

### 2. `isin()` Metodu
Bu metod, bir sütundaki değerlerin, belirli bir değer listesi içerisinde olup olmadığını kontrol eder. Listede yer alan değerler için `True`, diğer durumlar için `False` döner.

```python
# Örnek: 'Team' sütunu 'Team A' veya 'Team B' değerlerini içeren satırları seç
teams = ['Team A', 'Team B']
filtered_data = df[df['Team'].isin(teams)]
```

### 3. `filter()` Fonksiyonu
Bu fonksiyon, sütun isimlerini filtrelemek için kullanılır. Özellikle sütun isimlerinin belirli bir string içermesi gibi durumlar için kullanışlıdır.

```python
# Örnek: İsimlerinde 'profit' kelimesi geçen sütunları filtrele
filtered_columns = df.filter(like='profit')
```

### 4. `where()` Metodu
`where()` metodu, koşulu karşılamayan tüm değerleri başka bir değerle (varsayılan olarak NaN) değiştirir. Bu, koşulu karşılayan değerleri korurken diğerlerini maskelemek için kullanılır.

```python
# Örnek: 'Age' sütunu 30'dan büyük olan değerleri koru, diğerlerini NaN yap
masked_data = df['Age'].where(df['Age'] > 30)
```

### 5. `query()` Metodu
Bu metod, veri çerçevesini filtrelemek için string ifadeler kullanmanızı sağlar. Bu, daha okunaklı ve daha az karmaşık sorgular yazmayı mümkün kılar.

```python
# Örnek: 'Age' 30'dan büyük ve 'Team' 'Team A' olan satırları seç
filtered_data = df.query('Age > 30 and Team == "Team A"')
```

Bu yöntemler, veri setleriniz üzerinde etkili ve verimli bir şekilde filtreleme yapmanıza olanak tanır, böylece analizleriniz için sadece ilgili verilere odaklanabilirsiniz.

In [None]:
masked_data = df['yil'].where(df['yil'] > 2017)
masked_data

In [25]:
import pandas as pd

df = pd.DataFrame({
    'A1': range(1, 6),
    'B2': range(10, 15),
    'C1': range(20, 25),
})
# '_1' ile biten sütunları seç
result = df.filter(regex='_1$')
print(result)
print(df)

Empty DataFrame
Columns: []
Index: [0, 1, 2, 3, 4]
   A1  B2  C1
0   1  10  20
1   2  11  21
2   3  12  22
3   4  13  23
4   5  14  24


In [28]:
import pandas as pd

data = {'Name': ['Alice Smith', 'Bob Johnson', 'Charlie Brown', 'David Lee'],
        'Email': ['alice@example.com', 'bjohnson@example.net', 'charexlie.brown@foo.com', 'david.lee@bar.org']}
df = pd.DataFrame(data)

# Email sütununda 'example' geçen satırları filtrele
mask = df['Email'].str.contains('ex', regex=True)
filtered_df = df[mask]
print(filtered_df)


            Name                    Email
0    Alice Smith        alice@example.com
1    Bob Johnson     bjohnson@example.net
2  Charlie Brown  charexlie.brown@foo.com


Unnamed: 0,Name,Email
0,Alice Smith,alice@example.com
1,Bob Johnson,bjohnson@example.net
2,Charlie Brown,charexlie.brown@foo.com
3,David Lee,david.lee@bar.org
