- Dengan library Pandas
- bentuk file : .xlsx ataupun .xls
import pandas as pd
from pandas import ExcelFile
FileExcel = "E:\dataset\smartphone.xlsx"
data = pd.read_excel(FileExcel, sheet_name="Sheet1")
print(data)- Dengan perintah fungsi .set_index()
- Kita bisa menjadikan field/kolom yang mempunyai nilai unik
- Seperti field/kolom Nomor Induk Pegawai, Nomor Induk Mahasiswa, Kode Barang, dll.
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
data.set_index("nama_kolom", inplace=True)
data- Dengan membuat list
- Kemudian list dimasukkan ke DataFrame
- Anda membuat/menambahkan data list dari kiri ke kanan, tetapi tampilan indeks dimulai dari atas ke bawah
listKeterangan = ["Tingkatkan", "Evaluasi", "Tingkatkan", "Evaluasi"]
data["nama_kolom_baru"] = listKeterangan
data- Dengan perintah fungsi .drop()
- axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
- Hapus sesuai nama indeksnya
data.drop([indeksnya], axis=0, inplace=True)
data- Dengan perintah fungsi .drop()
- axis=1 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada kolom
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
- Hapus sesuai nama kolom
data.drop(["nama_kolom"], axis=1, inplace=True)
data- Dengan perintah fungsi .rename()
- Kolom/field yang digunakan sebagai pengganti indeks tidak bisa ikut diganti/diubah
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
data.rename(columns = {"nama_kolom_lama" : "nama_kolom_baru", "nama_kolom_lama" : "nama_kolom_baru", "nama_kolom_lama" : "nama_kolom_baru"}, inplace = True)
data- Dengan perintah fungsi .rename()
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
data.rename(index = {3 : "AWAL", 58 : "AKHIR", 4 : 4},inplace=True)
data- Dengan perintah fungsi .filter()
data = data.filter(items=["nama_kolom1", "nama_kolom2", "nama_kolom3"])
data- Dengan perintah fungsi .sort_values()
- .astype() perintah fungsi untuk mengubah type data
- .replace() perintah fungsi untuk mengganti kata/kalimat/huruf/angka
- fungsi lambda dengan fungsi .map() untuk menerapkan fungsi ke semua nilai
- .zfill() perintah fungsi untuk menentukan panjang nilai X
- axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
- ascending=False, Ascending adalah pengurutan dari yang terkecil ke yang terbesar tetapi disini perintahnya False jadi besar ke kecil
data["ram"] = data["ram"].astype(str) #ubah type data
data["ram"] = [x.replace("gb","") for x in data["ram"]] #menghilangkan kata gb
data["ram"] = data["ram"].map(lambda x: x.zfill(2)) #2 digit angka
data.sort_values("ram", axis=0, ascending=False, inplace=True)
data- Dengan perintah fungsi .sort_values()
- axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
- ascending=False, Ascending adalah pengurutan dari yang terkecil ke yang terbesar tetapi disini perintahnya False jadi besar ke kecil
data.sort_index(axis=0, ascending=False, inplace=True)
data- Dengan perintah fungsi .dropna()
- axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
- inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
- parameter how=”any” menunjukkan bahwa penghapusan pada suatu baris dilakukan jika pada baris terdapat satu atau beberapa nilai NaN pada kolomnya
data.dropna(axis=0, how="any", inplace=True)
data- Dengan perintah fungsi .iterrows()
for i, baris in data.iterrows():
print("indeks:", i,
"nama_kolom:", baris["nama_kolom"])- Dengan kriteria harga diatas 4 juta tampilkan
data = data[data["harga"] > 4000000]
data