Skip to content

Hasil import data dari file Excel, CSV, MySQL ke Python dengan library Pandas menghasilkan data bertipe DataFrame

Notifications You must be signed in to change notification settings

akbarimaniyudhaputra/Python-Pandas-DataFrame

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

Python - Pandas - DataFrame

Mengambil Data di File Excel

  • Dengan library Pandas
  • bentuk file : .xlsx ataupun .xls

Perintah untuk mengambil data di file Excel

import pandas as pd
from pandas import ExcelFile

FileExcel = "E:\dataset\smartphone.xlsx"
data = pd.read_excel(FileExcel, sheet_name="Sheet1")

print(data)

1

1 lebih rapi

Cara Melebarkan Tampilan Notebook Jupyter

Mengubah Indeks

  • Dengan perintah fungsi .set_index()
  • Kita bisa menjadikan field/kolom yang mempunyai nilai unik
  • Seperti field/kolom Nomor Induk Pegawai, Nomor Induk Mahasiswa, Kode Barang, dll.
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut

Perintah untuk mengubah indeks

data.set_index("nama_kolom", inplace=True)
data

2

Menambah Kolom

  • Dengan membuat list
  • Kemudian list dimasukkan ke DataFrame
  • Anda membuat/menambahkan data list dari kiri ke kanan, tetapi tampilan indeks dimulai dari atas ke bawah

Perintah untuk menambah kolom

listKeterangan = ["Tingkatkan", "Evaluasi", "Tingkatkan", "Evaluasi"]
data["nama_kolom_baru"] = listKeterangan
data

3

Menghapus Data Baris

  • Dengan perintah fungsi .drop()
  • axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
  • Hapus sesuai nama indeksnya

Perintah untuk menghapus data baris

data.drop([indeksnya], axis=0, inplace=True)
data

4

Menghapus Data Kolom

  • Dengan perintah fungsi .drop()
  • axis=1 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada kolom
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
  • Hapus sesuai nama kolom

Perintah untuk menghapus Kolom

data.drop(["nama_kolom"], axis=1, inplace=True)
data

5

Mengubah Nama Kolom

  • Dengan perintah fungsi .rename()
  • Kolom/field yang digunakan sebagai pengganti indeks tidak bisa ikut diganti/diubah
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut

Perintah untuk mengubah nama kolom

data.rename(columns = {"nama_kolom_lama" : "nama_kolom_baru", "nama_kolom_lama" : "nama_kolom_baru", "nama_kolom_lama" : "nama_kolom_baru"}, inplace = True)
data

6

Mengubah Nama Indeks

  • Dengan perintah fungsi .rename()
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut

Perintah untuk mengubah nama indeks

data.rename(index = {3 : "AWAL", 58 : "AKHIR", 4 : 4},inplace=True) 
data

7

Mengakses beberapa Kolom beserta datanya

  • Dengan perintah fungsi .filter()

Perintah untuk mengakses beberapa kolom beserta datanya

data = data.filter(items=["nama_kolom1", "nama_kolom2", "nama_kolom3"])
data

8

Mengurutkan Data di Kolom tertentu

  • Dengan perintah fungsi .sort_values()
  • .astype() perintah fungsi untuk mengubah type data
  • .replace() perintah fungsi untuk mengganti kata/kalimat/huruf/angka
  • fungsi lambda dengan fungsi .map() untuk menerapkan fungsi ke semua nilai
  • .zfill() perintah fungsi untuk menentukan panjang nilai X
  • axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
  • ascending=False, Ascending adalah pengurutan dari yang terkecil ke yang terbesar tetapi disini perintahnya False jadi besar ke kecil

Perintah untuk mengurutkan Data di Kolom tertentu

data["ram"] = data["ram"].astype(str) #ubah type data
data["ram"] = [x.replace("gb","") for x in data["ram"]] #menghilangkan kata gb
data["ram"] = data["ram"].map(lambda x: x.zfill(2)) #2 digit angka
data.sort_values("ram", axis=0, ascending=False, inplace=True)
data

9

Mengurutkan Data Berdasarkan Indeks

  • Dengan perintah fungsi .sort_values()
  • axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
  • ascending=False, Ascending adalah pengurutan dari yang terkecil ke yang terbesar tetapi disini perintahnya False jadi besar ke kecil

Perintah untuk mengurutkan data berdasarkan Indeks

data.sort_index(axis=0, ascending=False, inplace=True)
data

12

Menghapus Nilai yang Hilang

  • Dengan perintah fungsi .dropna()
  • axis=0 artinya parameter untuk menunjukkan bahwa penghapusan dilakukan pada baris
  • inplace=True artinya parameter untuk menyatakan bahwa perubahan indeks tersebut langsung mengubah struktur DataFrame tersebut
  • parameter how=”any” menunjukkan bahwa penghapusan pada suatu baris dilakukan jika pada baris terdapat satu atau beberapa nilai NaN pada kolomnya

Perintah untuk menghapus nilai yang hilang

data.dropna(axis=0, how="any", inplace=True)
data

14

Melakukan Iterasi pada DataFrame

  • Dengan perintah fungsi .iterrows()

Perintah untuk melakukan iterasi pada DataFrame

for i, baris in data.iterrows():
   print("indeks:", i, 
        "nama_kolom:", baris["nama_kolom"])

15

Mencari Data dengan Kriteria Tertentu

  • Dengan kriteria harga diatas 4 juta tampilkan

Mencari Data dengan Kriteria Tertentu

data = data[data["harga"] > 4000000]
data

16

About

Hasil import data dari file Excel, CSV, MySQL ke Python dengan library Pandas menghasilkan data bertipe DataFrame

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published