# VeriSeti Okuma

In [1]:
import numpy as np
import pandas as pd

Alttaki kod pandas kütüphanesini kullanarak "ogrenciler.xlsx" adlı bir Excel dosyasını okuyup, elde edilen verileri Pandas DataFrame'e aktarıyor.

index_col=0: Bu parametre, DataFrame'in indeks sütununu belirtir. Yani, Excel dosyasındaki ilk sütun (sıfırıncı indeks) DataFrame'in indeks sütunu olarak ayarlanır. İndeks, her bir satırı benzersiz bir şekilde tanımlamak için kullanılır.

In [2]:
df = pd.read_excel('ogrenciler.xlsx', index_col=0)
print(df)

     isim  yazılı  sözlü  ortalama
o1   Ayşe      66     90      75.6
o2  Fatma      56     78      64.8
o3  Hasan      70     80      74.0
o4  Kemal      89     81      85.8
o5   Suna      10     90      42.0
o6  Özlem      78    100      86.8


### Satır ve Sütun Silme

Pandas, genellikle etiketleri kullanarak satır veya sütunları siler. Bu durumda, ['o2'] listesi hem bir sütun hem de bir satır etiketini temsil edebilir. Eğer belirtilen etiket hem satır hem de sütun olarak mevcutsa, Pandas genellikle ilk bulduğu etikete göre işlem yapar. Bu genellikle satırları ifade eden indeksi temsil eder. Eğer kesinlikle bir sütunu silmek istiyorsak, axis=1 parametresini kullanarak bunu belirtmeliyiz. Eğer bir satırı silmek istiyorsak, axis=0 veya index parametresini kullanabiliriz.

In [3]:
df2 = df.drop(['o2'])
print(df2)

     isim  yazılı  sözlü  ortalama
o1   Ayşe      66     90      75.6
o3  Hasan      70     80      74.0
o4  Kemal      89     81      85.8
o5   Suna      10     90      42.0
o6  Özlem      78    100      86.8


In [4]:
df3 = df.drop("o3", axis=0)
print (df3)

     isim  yazılı  sözlü  ortalama
o1   Ayşe      66     90      75.6
o2  Fatma      56     78      64.8
o4  Kemal      89     81      85.8
o5   Suna      10     90      42.0
o6  Özlem      78    100      86.8


In [5]:
df2 = df2.drop(['ortalama'], axis=1)
print(df2)

     isim  yazılı  sözlü
o1   Ayşe      66     90
o3  Hasan      70     80
o4  Kemal      89     81
o5   Suna      10     90
o6  Özlem      78    100


### Excel'e Indexsiz Veri Yazma

df2.to_excel('indexsiz_tablo.xlsx'): Bu satır, df2 DataFrame'indeki verileri 'indexsiz_tablo.xlsx' adlı bir Excel dosyasına yazar.
index=False: Bu parametre, Excel dosyasında indeks sütununun oluşturulmasını engeller. Yani, DataFrame'deki satırların solundaki indeks numaraları veya etiketleri Excel dosyasına yazdırılmaz.

In [6]:
df2.to_excel('indexsiz_tablo.xlsx', index=False)

### Verilere Erişme

In [7]:
print(df.loc['o3':'o6']['isim']) 
#'o3' ile 'o6' arasındaki satırları seçip, bu satırlardan sadece 'isim' sütunundaki verileri alır ve ekrana yazdırır.

o3    Hasan
o4    Kemal
o5     Suna
o6    Özlem
Name: isim, dtype: object


In [8]:
print(df.iloc[1:3]['ortalama']) 
# df DataFrame'inden 1. ve 2. indeksli satırları seçer (sayısal indekse göre)  sadece 'ortalama' sütunundaki verileri alır

o2    64.8
o3    74.0
Name: ortalama, dtype: float64


# CSV Dosyaları

### CSV Dosyası Yaratma

In [15]:
import pandas as pd

# Create a DataFrame from the data
sensor = {
    "interval": [0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3],
    "sensor": ["accel", "accel", "accel", "accel", "accel", "accel", "accel", "accel", "accel", "accel", "accel", "accel", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation", "orientation"],
    "axis": ["Z", "Y", "X", "Z", "Y", "X", "Z", "Y", "X", "Z", "Y", "X", "Z", "Y", "X", "Z", "Y", "X", "Z", "Y", "X", "Z", "Y", "X"],
    "reading": [0.0, 0.5, 1.0, 0.1, 0.4, 0.9, 0.2, 0.3, 0.8, 0.3, 0.2, 0.7, 0.0, 0.1, 0.0, 0.0, 0.2, 0.1, 0.0, 0.3, 0.2, 0.0, 0.4, 0.3]
}

df = pd.DataFrame(sensor)

# Save the DataFrame as a CSV file
df.to_csv("sensor.csv", index=False)

In [16]:
sensor_data = pd.read_csv("sensor.csv")
sensor_data

Unnamed: 0,interval,sensor,axis,reading
0,0,accel,Z,0.0
1,0,accel,Y,0.5
2,0,accel,X,1.0
3,1,accel,Z,0.1
4,1,accel,Y,0.4
5,1,accel,X,0.9
6,2,accel,Z,0.2
7,2,accel,Y,0.3
8,2,accel,X,0.8
9,3,accel,Z,0.3


In [17]:
sensor_grubu = sensor_data.groupby('sensor')
sensor_grubu # Bir gruplama nesnesi

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000027A925E69C0>

Bu gruplama nesnesi içinde, "accel" ve "orientation" gibi farklı sensör türlerine ait veriler ayrı ayrı gruplara ayrılmıştır.

sensor_grubu.get_group("accel") Kodunun Açıklaması
Bu kod parçası, daha önce sensor_data veri çerçevesini "sensor" sütununa göre gruplandırdığımız sensor_grubu nesnesinden, "accel" (ivme sensörü) verilerini içeren grubu seçer.

Adım Adım Açıklama:
sensor_grubu: Bu, daha önce sensor_data.groupby('sensor') komutu ile oluşturduğumuz bir gruplama nesnesidir. Bu nesne içinde, "accel" ve "orientation" gibi farklı sensör türlerine ait veriler ayrı ayrı gruplara ayrılmıştır.
get_group("accel"): Bu metod, sensor_grubu nesnesinden belirtilen adı taşıyan grubu seçer. Bu durumda, "accel" adlı grubu seçerek, sadece ivme sensörüne ait tüm verileri içeren bir veri çerçevesi elde ederiz.
Ne İşe Yarar?
Veri Parçalama: Tüm veri çerçevesinden sadece ilgilendiğimiz bir kısmını (örneğin, sadece ivme sensörü verilerini) ayırmak için kullanılır.
Ayrı Analizler: Farklı sensör türlerine ait verileri ayrı ayrı analiz etmek istediğimizde bu metod çok kullanışlıdır. Örneğin, sadece ivme sensörü verileri üzerinde istatistiksel hesaplamalar yapabilir, grafikler çizebilir veya makine öğrenmesi modellerine veri olarak verebiliriz.

In [18]:
sensor_grubu.get_group("accel")


Unnamed: 0,interval,sensor,axis,reading
0,0,accel,Z,0.0
1,0,accel,Y,0.5
2,0,accel,X,1.0
3,1,accel,Z,0.1
4,1,accel,Y,0.4
5,1,accel,X,0.9
6,2,accel,Z,0.2
7,2,accel,Y,0.3
8,2,accel,X,0.8
9,3,accel,Z,0.3


In [19]:
sensor_grubu.get_group("accel")[0:5]

Unnamed: 0,interval,sensor,axis,reading
0,0,accel,Z,0.0
1,0,accel,Y,0.5
2,0,accel,X,1.0
3,1,accel,Z,0.1
4,1,accel,Y,0.4


In [20]:
sensor_grubu.get_group("accel")["axis"][0:5]

0    Z
1    Y
2    X
3    Z
4    Y
Name: axis, dtype: object

Ngroups Metodu

Nesne içinde kaç tane farklı grup olduğunu verir.

In [21]:
sensor_grubu.ngroups

2

Groups Metodu

Bu attribute gruplama nesnesinin her bir grubun adını ve o gruba ait verilerin indekslerini içeren bir sözlük döndürür.

In [None]:
sensor_grubu.groups