# 1. Temel İşlemler 
### Gruplama (Grouping) , Sıralama (Sort),loc,iloc,query 
Gruplama işlemleri, veri analizinde çok sık kullanılır. groupby fonksiyonu ile veri gruplandırabilir ve çeşitli istatistikler hesaplayabilirsiniz.

In [5]:
import pandas as pd

# Örnek DataFrame
data = {
    'Player': ['Player1', 'Player2', 'Player3', 'Player4', 'Player5', 'Player6'],
    'Team': ['OKC', 'DAL', 'OKC', 'DAL', 'CHI', 'CHI'],
    'Position': ['G', 'F', 'F', 'C', 'G', 'F'],
    'Points': [25, 20, 30, 15, 22, 18],
    'Age': [25, 30, 22, 28, 24, 27]
}

df = pd.DataFrame(data)

# 1. Gruplama (Grouping) - Takım bazında oyuncu sayısını hesaplama
team_group = df.groupby('Team').size()
print("Takım Bazında Oyuncu Sayıları:\n", team_group)

# 2. Gruplama ve İstatistikler - Takıma göre ortalama yaş ve toplam puanları hesaplama
team_stats = df.groupby('Team').agg({
    'Age': 'mean',     # Ortalama yaş
    'Points': 'sum'    # Toplam puan
}).reset_index()
print("\nTüm Takımlar İçin Ortalama Yaş ve Toplam Puanlar:\n", team_stats)

# 3. Sıralama (Sort) - Ortalama yaşa göre sıralama
sorted_team_stats = team_stats.sort_values(by='Age')
print("\nOrtalama Yaşa Göre Sıralama:\n", sorted_team_stats)

# 4. loc - Belirli bir takım için tüm oyuncuları seçme
okc_players = df.loc[df['Team'] == 'OKC']
print("\nOKC Takımı Oyuncuları:\n", okc_players)

# 5. iloc - Satır ve sütun indekslerine göre veri seçme (örneğin: ilk 3 satır ve ilk 2 sütun)
subset_df = df.iloc[:3, :2]
print("\nİlk 3 Satır ve İlk 2 Sütun:\n", subset_df)

# 6. query - Belirli bir yaşın üstündeki oyuncuları sorgulama
older_players = df.query('Age > 25')
print("\n25 Yaş Üstü Oyuncular:\n", older_players)


Takım Bazında Oyuncu Sayıları:
 Team
CHI    2
DAL    2
OKC    2
dtype: int64

Tüm Takımlar İçin Ortalama Yaş ve Toplam Puanlar:
   Team   Age  Points
0  CHI  25.5      40
1  DAL  29.0      35
2  OKC  23.5      55

Ortalama Yaşa Göre Sıralama:
   Team   Age  Points
2  OKC  23.5      55
0  CHI  25.5      40
1  DAL  29.0      35

OKC Takımı Oyuncuları:
     Player Team Position  Points  Age
0  Player1  OKC        G      25   25
2  Player3  OKC        F      30   22

İlk 3 Satır ve İlk 2 Sütun:
     Player Team
0  Player1  OKC
1  Player2  DAL
2  Player3  OKC

25 Yaş Üstü Oyuncular:
     Player Team Position  Points  Age
1  Player2  DAL        F      20   30
3  Player4  DAL        C      15   28
5  Player6  CHI        F      18   27


# 2. Pivot Tablolar (Pivot Tables)
Pivot tablolar, verileri hızlı bir şekilde özetlemek ve analiz etmek için çok kullanışlıdır.

In [2]:
# Pivot tablo oluşturma
pivot = df.pivot_table(values='Sales', index='Company', columns='Product', aggfunc='sum')
print(pivot)


Product   P1   P2
Company          
A        100  150
B        200  130
C        140  180


# 3. Zaman Serileri (Time Series)
Pandas, zaman serileri ile çalışmak için güçlü araçlar sunar. Zaman damgalarını indeks olarak kullanarak veri analizini kolaylaştırabilirsiniz.




In [4]:
# Zaman serisi verisi oluşturma
import numpy as np
date_rng = pd.date_range(start='2023-01-01', end='2023-01-10', freq='D')
df_time = pd.DataFrame(date_rng, columns=['date'])
df_time['data'] = np.random.randint(0, 100, size=(len(date_rng)))

df_time = df_time.set_index('date')
print(df_time)

# Zaman serisi verisini yeniden örnekleme
df_resampled = df_time.resample('D').mean()
print(df_resampled)


            data
date            
2023-01-01    66
2023-01-02    43
2023-01-03    22
2023-01-04     4
2023-01-05     4
2023-01-06    10
2023-01-07    97
2023-01-08    33
2023-01-09    92
2023-01-10    63
            data
date            
2023-01-01  66.0
2023-01-02  43.0
2023-01-03  22.0
2023-01-04   4.0
2023-01-05   4.0
2023-01-06  10.0
2023-01-07  97.0
2023-01-08  33.0
2023-01-09  92.0
2023-01-10  63.0


# 4. Eksik Veri İşleme (Handling Missing Data)
Pandas, eksik verileri kolayca doldurmak veya çıkarmak için çeşitli yöntemler sunar.

In [5]:
# Eksik veri içeren örnek veri
data = {
    'A': [1, 2, np.nan, 4, 5],
    'B': [5, np.nan, np.nan, 8, 10],
    'C': [10, 20, 30, 40, 50]
}
df_missing = pd.DataFrame(data)

# Eksik verileri doldurma
df_filled = df_missing.fillna(method='ffill')
print(df_filled)


     A     B   C
0  1.0   5.0  10
1  2.0   5.0  20
2  2.0   5.0  30
3  4.0   8.0  40
4  5.0  10.0  50


# 5. İleri Seviye İndeksleme (Advanced Indexing)
Pandas, verileri daha esnek ve güçlü bir şekilde indekslemenizi sağlar.

In [6]:
# Çok seviyeli indeksleme (Multi-indexing)
arrays = [
    ['A', 'A', 'B', 'B'],
    ['one', 'two', 'one', 'two']
]
index = pd.MultiIndex.from_arrays(arrays, names=('Company', 'Product'))
df_multi = pd.DataFrame({'Sales': [10, 20, 30, 40]}, index=index)
print(df_multi)


                 Sales
Company Product       
A       one         10
        two         20
B       one         30
        two         40


# 6. Apply Fonksiyonu ile Veri Dönüşümü
apply fonksiyonu, DataFrame üzerinde eleman bazında işlemler yapmanızı sağlar.

In [7]:
# Örnek veri
df = pd.DataFrame({
    'A': [10, 20, 30],
    'B': [20, 30, 40]
})

# Her satırdaki elemanların toplamını hesaplama
df['Total'] = df.apply(lambda row: row.A + row.B, axis=1)
print(df)


    A   B  Total
0  10  20     30
1  20  30     50
2  30  40     70


# 7. Birleştirme ve Birlikte Kullanma (Merging and Joining)
Pandas, farklı DataFrame'leri birleştirmek için güçlü araçlar sunar.

In [4]:
# İki veri çerçevesi oluşturma
left = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
right = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})

# Birleştirme işlemi
merged_inner = pd.merge(left, right, on='key', how='inner')
print(merged_inner)

merged_left = pd.merge(left, right, on='key', how="left")
print(merged_left)

merged_right = pd.merge(left, right, on='key', how="right")
print(merged_right)

merged_outer = pd.merge(left, right, on='key', how="outer")
print(merged_outer)


  key  value_x  value_y
0   B        2        5
1   D        4        6
  key  value_x  value_y
0   A        1      NaN
1   B        2      5.0
2   C        3      NaN
3   D        4      6.0
  key  value_x  value_y
0   B      2.0        5
1   D      4.0        6
2   E      NaN        7
3   F      NaN        8
  key  value_x  value_y
0   A      1.0      NaN
1   B      2.0      5.0
2   C      3.0      NaN
3   D      4.0      6.0
4   E      NaN      7.0
5   F      NaN      8.0


# 8. Bellek Kullanımını Azaltma
Büyük veri setleriyle çalışırken bellek kullanımını azaltmak önemlidir.

In [9]:
# Veri tiplerini optimize etme
df_optimized = df.astype({'A': 'int32', 'B': 'int32'})
print(df_optimized.info())


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int32
 1   B       3 non-null      int32
 2   Total   3 non-null      int64
dtypes: int32(2), int64(1)
memory usage: 176.0 bytes
None


# 9. Koşullu Seçim (Conditional Selection)
Koşullu seçim ile veri çerçevesindeki belirli koşulları sağlayan verileri seçebilirsiniz.

In [10]:
# Örnek veri
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [10, 20, 30, 40]
})

# Koşullu seçim
selected = df[df['A'] > 2]
print(selected)


   A   B
2  3  30
3  4  40


# 10. String Fonksiyonları
Pandas, metin verileri üzerinde çalışmak için çeşitli string fonksiyonları sunar.

In [11]:
# Örnek veri
df = pd.DataFrame({'Name': ['John Doe', 'Jane Smith', 'Sara Lee']})

# Büyük harfe çevirme
df['Name_upper'] = df['Name'].str.upper()
print(df)


         Name  Name_upper
0    John Doe    JOHN DOE
1  Jane Smith  JANE SMITH
2    Sara Lee    SARA LEE
