# Package Pandas  

Digunakan untuk pengolahan data yang berkaitan dengan data frame. 

In [None]:
# Lakukan import pandas sebagai pd
import pandas as pd

In [None]:
# Lakukan import numpy sebagai np
import numpy as np

## 1. Membuat dataframe

Untuk membuat data frame, digunakan sintaks berikut: `pandas.DataFrame( data, index, columns, dtype, copy)`  
1. index merupakan label untuk baris   
2. columns merupakan label untuk kolom
3. dtype merupakan tipe data perkolom
4. copy digunakan untuk menyalin data, defaultnya False

In [None]:
# Membuat rentang waktu
tanggal = pd.date_range("20200901", freq="M", periods=9)
print(tanggal)

In [None]:
# Membuat data frame dengan data randon ukuran 9x4, serta label baris adalah tanggal dan label kolom A, B, C, D
contoh1 = pd.DataFrame(np.random.randn(9,4), index=tanggal, columns=("A","B","C","D"))
contoh1

In [None]:
# Membuat dataframe dengan daftar anggota
contoh2 = pd.DataFrame({"A": 1.,
                       "B": pd.Timestamp("20180925"),
                       "C": np.array([3]*4, dtype="int32"),
                       "D": pd.Categorical(["test","train"]*2),
                       "E": np.array([1,12,32,14])}, index=["satu","dua","tiga","empat"])
contoh2

## 2. Menambah, menghapus, dan menyeleksi kolom data frame

Menghapus kolom dengan fungsi:  
1. `del(data_frame["kolom"])` 
2. `.pop("kolom")`
3. `.drop("kolom", axis=1)`; axis=1 berarti menghapus sepanjang kolom yang dimaksud

Menambahkan kolom baru dengan operasi matematis "+"

In [None]:
# Menambahkan kolom baru dengan nama "F", dengan operasi penambahan kolom "C" dan "E"
contoh2["F"]=contoh2["C"]+contoh2["E"]
print(contoh2)

In [None]:
# Menambahkan kolom baru dengan nama "G", pada index satu, tiga, empat 
contoh2["G"]=pd.Series([10,20,30], index=["satu", "tiga", "empat"])
print(contoh2)

In [None]:
# Menghapus kolom "B" dengan fungsi del
del(contoh2["B"])
contoh2

In [None]:
# Menghapus kolom "C" dengan pop
contoh2.pop("C")
contoh2

In [None]:
# Menyeleksi kolom "A"
kolomA = contoh2["A"]
kolomA

In [None]:
# Menghapus kolom "A" dengan fungsi drop
contoh2_hapus = contoh2.drop("A", axis = 1)
contoh2_hapus.head()

## 3. Menambah, mengurang, dan menyeleksi baris pada data frame

Menyeleksi/mengiris data frame dengan fungsi:
1. `loc`: untuk seleksi dengan menggunakan indeks/bilangan bulat
2. `iloc`: untuk seleksi dengan menggunakan bilangan bulat

Menambah baris dengan fungsi: `.append()`

Menghapus baris dengan fungsi: `.del("index", axis=0)`, axis=0 berarti menghapus sepanjang baris.

In [None]:
# Menambah baris menggunakan fungsi append
contoh3 = pd.DataFrame([[1,"train",4,5,6.0], [2,"test",7,12,34]], columns=["A","D","E","F","G"])
contoh3

contoh4 = contoh2.append(contoh3)
contoh4

In [None]:
# Menyeleksi indeks "tiga" pada baris
contoh4.loc["tiga"]

In [None]:
# Menyeleksi baris ke 2 dan 3, dengan menyebut urutannya, kemudian mengcopy hasilnya
contoh5=contoh4.iloc[1:3].copy()
contoh5

In [None]:
# Menghapus baris dengan indeks "tiga". Simpan variabel dengan nama "contoh5_hapus"
contoh5_hapus = contoh5.drop("tiga", axis=0)
contoh5_hapus

## 4. Menyeleksi/megiris data frame berdasar baris dan kolom



In [None]:
contoh2

In [None]:
# mengiris data baris dan kolom
contoh2.iloc[1:3, 2:5]

In [None]:
# Menampilkan informasi pada data frame
contoh2.info()

### Fungsi dasar untuk series  


Berikut fungsi dasar untuk series (deret)  

No   | Fungsi   | Deskripsi
:---:|:---      |:---   
1    | axes     | Daftar label baris dan kolom |
2    | dtypes   | Daftar tipe data setiap kolom |
3    | empty    | Akan bernilai True jika deret ada yang kosong |
4    | size     | Ukuran dari data |
5    | values   | Mengubah deret menjadi ndarray (n dimensional array) |
6    | head()   | Menampilkan n data pertama |
7    | tail()   | Menampilkan n data terakhir |

In [None]:
# cobalah fungsi axes, dtypes, empty, size, head, tail untuk contoh2

## 5. Mengimport atau membaca file (csv, xls)

In [None]:
# Membaca file xls. File terletak dalam satu folder dengan notebook jupyter
superstore = pd.read_excel("Superstore.xls")
superstore.head()

In [None]:
# Gunakan fungsi dasar untuk series, untuk melihat informasi tabel
superstore.empty

In [None]:
superstore.dtypes

In [None]:
# Ukuran data frame (baris, kolom)
superstore.shape

In [None]:
# Ukuran data frame 
superstore.size

In [None]:
# apakah tipe data superstore? Gunakan fungsi type
type(superstore)

In [None]:
# Gunakan fungsi .info() untuk mengetahui gambaran data superstore
superstore.info()

In [None]:
# Pilih kolom "Product Name", dan simpan dalam variabel produk

produk = superstore['Product Name']
produk.head(10)

In [None]:
# Menjadikan series ke array dengan .values
produk.values

In [None]:
# Memilih baris kelipatan 3, dengan semua kolom. Kemudian tampilkan 10 data pertama
superstore.iloc[::3,:].head(10)

In [None]:
# Menyeleksi data dengan Kota adalah "Semarang". Kemudian tampilkan 5 data pertama
semarang = superstore[superstore.Kota == "Semarang"]
semarang.head(5)

## 6. Menambahkan kolom baru pada data frame

In [None]:
# Tambahkan kolom "Garansi", dan isikan semua baris dengan "Tidak Bergaransi"
superstore["Garansi"] = "Tidak bergaransi"
superstore.head(3)

In [None]:
# Seleksi kolom Customer ID, Kota, Sub-Category, dan Profit. Simpan dalam variabel superstore2
superstore2 = superstore[["Customer ID", "Kota", "Sub-Category", "Profit"]]
superstore2.head(5)

In [None]:
# Seleksi superstore2, yang Kota adalah Semarang, memiliki Profit lebih dari 20. Simpan dalam superstore2_filter. 
superstore2_filter = superstore2[(superstore2.Kota == "Semarang") & (superstore2.Profit > 20)] 
superstore2_filter.head()

In [None]:
# Berapakah data yang sesuai dengan kondisi setelah dilakukan filtering? 
superstore2_filter.count()