Seperti diketahui, visualisasi data merupakan aspek kunci dalam analisis karena bisa membantu memahami tren dan pola dalam data yang sedang kita kerjakan. Matplotlib menyediakan alat yang fleksibel dan mudah digunakan untuk menciptakan visualisasi tersebut.

Dengan Matplotlib, kamu dapat membuat grafik garis, scatter plot, histogram, dan banyak lainnya dari data yang dimiliki.

Misalnya, jika kamu memiliki data penjualan bulanan, kamu bisa menggunakan Matplotlib untuk menggambarkan tren penjualan dalam bentuk grafik. Alhasil, tren tersebut lebih mudah dilihat dan dipahami.

Salah satu kelebihan lain dari Matplotlib adalah kemudahan dalam penggunaan. Hanya dengan menggunakan beberapa baris kode sederhana, kamu bisa menciptakan visualisasi yang kompleks. Visualisasi ini nantinya akan membantumu mengkomunikasikan temuan analisis kepada orang lain.

Cara Mengimpor Modul Matplotlib
Agar bisa menggunakan Matplotlib, kamu perlu mengimpor modul Matplotlib ke dalam kode Python. Proses ini sangat sederhana dan bisa dilakukan dengan mudah.

Pertama, kamu harus memastikan Matplotlib sudah terinstal di sistem kamu. Jika belum, kamu bisa menginstalnya menggunakan perintah PIP:

In [1]:
pip install matplotlib



Kemudian, kamu dapat mulai mengimpor modul Matplotlib ke dalam kode Python milikmu.

Ada beberapa cara untuk melakukan ini, tetapi cara yang paling umum adalah menggunakan perintah import untuk mengimpor matplotlib.pyplot.

Berikut contoh kodenya:

In [2]:
import matplotlib.pyplot as plt

Dalam contoh tersebut, kita mengambil library matplotlib.pyplot. Programmer umumnya menyingkat nama fungsi ini sebagai plt agar memudahkan dalam pemanggilan di kemudian hari.

Sekarang, kamu sudah bisa menggunakan plt untuk mengakses semua fungsi dan fitur yang ada dalam modul matplotlib.pyplot.

Setelah modul diimpor, kamu bebas menggunakan berbagai alat dan fungsi yang disediakan untuk menciptakan grafik dan diagram yang akan membantumu dalam analisis data

Cara Membuat Grafik Sederhana dengan Matplotlib
Berikut langkah-langkah membuat grafik garis menggunakan Matplotlib:

#1 Impor modul
Pertama, kamu perlu mengimpor modul Matplotlib. Seperti yang telah kita bahas sebelumnya, kamu bisa melakukannya dengan baris kode berikut:

In [3]:
import matplotlib.pyplot as plt

#2 Siapkan data
Selanjutnya, tentukan data yang ingin kamu plot.

Misalnya, kamu ingin membuat grafik garis yang menghubungkan titik-titik (1,2), (2,4), dan (3,6), kamu bisa menuliskan:

In [4]:
X = [1, 2, 3]
y = [2, 4, 6]

#3 Gunakan metode plot()
Metode plot() dipakai untuk menggambar grafik garis. Kamu dapat menggunakannya dengan cara berikut:

In [None]:
plt.plot(x, y)

Kode lengkap untuk membuat grafik garis di atas adalah sebagai berikut:

In [None]:
import matplotlib.pyplot as plt
X = [1, 2, 3]
y = [2, 4, 6]
plt.plot(x, y)
plt.show()

Output dari kode tersebut akan menampilkan grafik garis yang menghubungkan titik-titik (1,2), (2,4), dan (3,6).

Jenis Grafik yang Dapat Dibuat dengan Matplotlib
Berikut beberapa jenis grafik yang bisa dibuat dengan Matplotlib:

Grafik garis (line graphs)
Grafik garis biasanya digunakan untuk menampilkan tren data sepanjang interval waktu. Gunakan metode plot() untuk membuat grafik ini.

In [None]:
plt.scatter(x, y)
plt.show()

Grafik batang (bar chart)
Bar chart berguna untuk membandingkan nilai individu di kategori yang berbeda. Kamu dapat menggunakan metode bar() untuk membuat grafik ini.

In [None]:
plt.bar(x, y)
plt.show()

Grafik sebar (scatter plot)
Scatter plot dipakai untuk menampilkan hubungan antara dua variabel berkelanjutan. Penggunaanya dengan metode scatter().

In [None]:
plt.scatter(x, y)
plt.show()

Histogram
Histogram berfungsi untuk menampilkan distribusi data dalam rentang yang telah ditentukan. Untuk membuatnya, gunakan fungsi hist().

In [None]:
plt.hist(x, bins=10)
plt.show()

Pie chart
Pie chart menampilkan proporsi dari keseluruhan dalam kategori yang berbeda. Gunakan fungsi pie() untuk membuat grafik ini.

In [None]:
plt.pie(x, labels=labels)
plt.show()

Box plot
Box plot dipakai untuk menampilkan ringkasan statistik data seperti median, kuartil, dan pencilan. Untuk membuatnya, gunakan fungsi boxplot().

In [None]:
plt.boxplot(x)
plt.show()

Grafik kontur (contour plot):
Contour plot berguna untuk menampilkan kontur dari fungsi tiga dimensi. Gunakan metode contour() untuk membuat grafiknya.

In [None]:
plt.contour(X, Y, Z)
plt.show)

Grafik 3D
Grafik 3D berfungsi untuk memvisualisasikan data dalam tiga dimensi. Untuk membuatnya, gunakan kode berikut.

In [None]:
from mpl toolkits.mplot3d import Axes3D
ax = plt. axes (projection='3d' )
ax.plot_surface(X, Y, Z)
plt.show()

Grafik area (area plot):
Area plot menampilkan kuantitas melalui area yang diisi. Pembuatannya bisa dengan menggunakan fungsi between().

In [None]:
plt.fill_between(x, y1, y2)
plt.show)

Grafik hexbin
Grafik hexbin mirip dengan scatter plot, tetapi grafik ini menggunakan heksagon.

In [None]:
plt.hexbin(x, y, gridsize=30)
plt.show()

FAQ (Frequently Ask Question)
Apakah Matplotlib hanya bisa digunakan untuk data numerik?
Meskipun kebanyakan grafik di Matplotlib menggunakan data numerik, kamu tetap bisa membuat visualisasi dari data kategorikal, seperti grafik batang untuk membandingkan kategori berbeda.

Bagaimana cara menambahkan judul dan label sumbu pada grafik Matplotlib?
Untuk menambahkan judul dan label sumbu pada grafik Matplotlib, gunakan metode plt.title('Judul').

plt.xlabel('Label X') untuk label sumbu x dan plt.ylabel('Label Y') untuk label sumbu y.

Apakah Matplotlib kompatibel dengan Pandas?
Ya, Matplotlib sepenuhnya kompatibel dengan Pandas dan sering digunakan bersama-sama. Kamu dapat dengan mudah menggambarkan grafik langsung dari DataFrame Pandas.

Penutup
Sebagai library visualisasi, Matplotlib memungkinkan kita untuk mengubah data mentah menjadi informasi berharga melalui berbagai bentuk grafik dan diagram. Mulai dari grafik garis sederhana sampai visualisasi yang kompleks, Matplotlib membantu menyampaikan cerita di balik angka dengan cara yang intuitif dan mudah dipahami.

Mengenal Seaborn Python
Seaborn adalah library visualisasi data berbasis Python yang menyediakan high-level interface (antarmuka tingkat tinggi) untuk menggambar grafik statistik yang informatif.

Seaborn dibangun di atas Matplotlib, yaitu salah satu library visualisasi data paling dasar dan populer di Python. Artinya, Seaborn memanfaatkan fungsionalitas inti dari Matplotlib, sambil menambahkan lapisan abstraksi untuk memudahkan analyst membuat visualisasi yang lebih kompleks.

Menurut GeeksforGeeks, Seaborn memudahkan dalam memvisualisasikan data dengan berbagai jenis plot seperti distribusi, kategorikal, matriks, dan banyak lagi. Dengan kata lain, jika kamu ingin melihat distribusi data atau hubungan antara dua variabel, Seaborn memiliki alat yang tepat untuk melakukannya.

Tak hanya itu, Seaborn juga terintegrasi baik dengan struktur data Pandas, sehingga memungkinkan analisis dan visualisasi data menjadi lebih lancar.

Perbedaan Seaborn vs Matplotlib
Seaborn dan Matplotlib adalah dua library visualisasi data yang populer di Python, tetapi keduanya memiliki karakteristik dan kegunaan yang berbeda.

Berikut perbedaan keduanya:

Desain dan estetika: secara default, Seaborn memiliki tema dan palet warna yang lebih menarik dibandingkan dengan Matplotlib. Hal ini memungkinkan kamu untuk lebih mudah membuat visualisasi tanpa perlu banyak penyesuaian.
Fungsionalitas: meskipun Seaborn dibangun di atas Matplotlib dan memanfaatkannya sebagai dasar, Seaborn menawarkan berbagai jenis plot khusus yang dioptimalkan untuk analisis statistik, seperti plot distribusi, plot kategorikal, dan plot matriks. Di sisi lain, Matplotlib lebih fleksibel dan memungkinkan kamu membuat hampir semua jenis visualisasi, tetapi memerlukan lebih banyak kode.
Integrasi dengan Pandas: Seaborn bekerja dengan sangat baik dengan DataFrame Pandas, memudahkan pengguna untuk memvisualisasikan data langsung dari DataFrame. Meskipun Matplotlib juga mendukung DataFrame Pandas, Seaborn menyediakan interface yang lebih intuitif.
Kustomisasi: sebagai library dasar, Matplotlib memberikan kontrol lebih besar kepada analyst dalam hal kustomisasi. Semenetara itu, Seaborn mengoptimalkan untuk kasus penggunaan umum, tetapi mungkin tidak sefleksibel Matplotlib untuk kebutuhan kustomisasi yang sangat spesifik.
Dalam prakteknya, banyak data analyst menggunakan keduanya secara bersamaan. Seaborn untuk visualisasi cepat yang menarik dan informatif, sementara Matplotlib untuk kustomisasi lebih lanjut atau jenis visualisasi yang lebih kompleks.

Instalasi Seaborn
Berikut langkah-langkah menginstal Seaborn menggunakan PIP:

#1 Persiapkan environment kerja Python
Sebelum menginstal Seaborn, pastikan kamu sudah memiliki Python dan PIP terinstal di komputermu. Jika belum, kamu bisa mendownload dan menginstal Python dari website resminya.

Saat menginstal Python, PIP biasanya sudah termasuk dalam paket instalasi.

#2 Instalasi Seaborn
Setelah memastikan PIP berfungsi dengan baik, buka terminal atau command prompt dan ketik perintah berikut:

pip install seaborn

Tunggu beberapa saat sampai proses instalasi selesai. PIP akan mengunduh dan menginstal Seaborn beserta semua dependensinya.

#3 Mengatur environment Kerja Python
Setelah Seaborn terinstal, kamu bisa mulai mengatur environment kerja Python di perangkatmu. Pertama, buat sebuah file Python baru atau buka interpreter Python interaktif. Kemudian, impor library yang diperlukan.

Untuk menggunakan Seaborn, kamu juga perlu mengimpor Matplotlib karena Seaborn dibangun di atasnya. Berikut cara mengimpornya:

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

Cara Memuat Data untuk Visualisasi
Sebelum memulai visualisasi data dengan Seaborn, langkah pertama yang harus dilakukan adalah memuat data yang ingin divisualisasikan.

Seaborn menyediakan beberapa cara untuk melakukan ini:

#1 Menggunakan dataset sampel dari Seaborn
Salah satu fitur menarik dari Seaborn adalah kemampuannya memuat dataset sampel yang sudah disediakan. Fitur ini berguna jika kamu ingin belajar atau bereksperimen.

Untuk memuat dataset sampel, kamu bisa menggunakan fungsi load_dataset(). Misalnya, untuk memuat dataset yang bernama 'tips', kamu bisa mengetik perintah berikut:

In [None]:
import seaborn as sns
data = sns.load_dataset('tips')
print(data.head())

Fungsi head() dari Pandas digunakan untuk menampilkan lima baris pertama dari dataset..

#2 Menggunakan data yang sudah ada
Jika kamu memiliki data sendiri, misalnya dalam format CSV, kamu bisa memanfaatkan library Pandas untuk memuatnya.

Setelah data dimuat ke dalam DataFrame Pandas, kamu akan lebih mudah memvisualisasikannya dengan Seaborn. Berikut contoh cara memuat data dari file CSV:

In [None]:
import pandas as pd
import seaborn as sns

data = pd.read_csv('lokasi_file.csv')
print(data.head())

Cara Membuat Berbagai Jenis Plot dengan Seaborn
Seaborn menawarkan berbagai jenis plot yang dapat membantu kamu dalam menganalisis dan mempresentasikan data. Berikut beberapa jenis plot Seaborn sekaligus cara membuatnya:

Scatter plot
Plot ini berguna untuk menampilkan hubungan antara dua variabel kontinu.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('tips')
sns.scatterplot(x='total_bill', y='tip', data=data)
plt.show()

Line plot

In [None]:
data = sns.load_dataset('flights')
data_pivot = data.pivot_table(index='month', columns='year', values='passengers')
sns.lineplot(data=data_pivot)
plt.show()

Bar plot
Plot jenis ini berguna untuk membandingkan kuantitas variabel kategorikal.

In [None]:
data = sns.load_dataset('tips')
sns.barplot(x='day', y='total_bill', data=data)
plt.show()

Histogram
Histogram dipakai untuk menampilkan distribusi dari satu variabel kontinu.

In [None]:
data = sns.load_dataset('tips')
sns.histplot(data['total_bill'])
plt.show()

Box plot
Box plot menunjukkan distribusi data melalui kuartil dan dapat mengidentifikasi pencilan.

In [None]:
data = sns.load_dataset('tips')
sns.boxplot(x='day', y='total_bill', data=data)
plt.show()

Heatmap
Heatmap berguna untuk menampilkan korelasi atau hubungan antara dua variabel kategorikal.

In [None]:
data = sns.load_dataset('flights')
data_pivot = data.pivot_table(index='month', columns='year', values='passengers')
sns.heatmap(data_pivot, cmap='YlGnBu')
plt.show()

Cara Mengubah Tampilan Plot dengan Seaborn
Berikut beberapa cara mengubah tampilan plot dengan Seaborn:

Mengubah warna plot: Seaborn memiliki palet warna beragam yang dapat kamu gunakan untuk mempercantik plot. Misalnya, jika kamu ingin mengubah warna scatter plot, gunakan perintah berikut:

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('tips')
sns.scatterplot(x='total_bill', y='tip', data=data, palette='viridis')
plt.show()

Menambahkan dan mengkustomisasi label: label sangat penting untuk memastikan bahwa audiens memahami informasi yang disajikan. Berikut perintah untuk menggunakannya:

In [None]:
sns.scatterplot(x='total_bill', y='tip', data=data)
plt.title('Hubungan antara Total Bill dan Tip')
plt.xlabel('Total Bill')
plt.ylabel('Tip')
plt.show()

Mengubah style plot: Seaborn memungkinkan kamu mengubah style backround plot dengan fungsi set_style().

In [None]:
sns.set_style("whitegrid")
sns.scatterplot(x='total_bill', y='tip', data=data)
plt.show()

Menyesuaikan ukuran dan bentuk titik: pada scatter plot, kamu bisa mengubah ukuran dan bentuk titik berdasarkan variabel tertentu.

In [None]:
sns.scatterplot(x='total_bill', y='tip',
data=data, size='size', hue='sex', style='time')
plt.show()

Menggunakan tema: Seaborn menyediakan beberapa tema bawaan yang dapat kamu gunakan untuk mengubah tampilan keseluruhan plot dengan mudah.

In [None]:
sns.set_theme(style="darkgrid")
sns.lineplot(data=data_pivot)
plt.show()

Dengan mengkombinasikan berbagai fitur kustomisasi di atas, kamu bisa membuat visualisasi yang tidak hanya informatif, tetapi juga mudah dipahami oleh audiens.

Cara Membuat Heatmap dan Korelasi dengan Seaborn
Heatmap adalah salah satu jenis visualisasi untuk menampilkan hubungan antara dua variabel kategorikal atau untuk menampilkan korelasi antara variabel-variabel dalam dataset.

Pada konteks analisis data, heatmap sering dipakai untuk memvisualisasikan matriks korelasi antara variabel.

Berikut cara membuat heatmap untuk matriks korelasi.

Pertama-tama, kamu perlu menghitung matriks korelasi dari dataset menggunakan Pandas. Kemudian, kamu bisa memvisualisasikannya dengan Seaborn.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

data = sns.load_dataset('tips')
korelasi = data.corr()
sns.heatmap(korelasi, annot=True, cmap='coolwarm')
plt.show()

Dalam kode di atas, data.corr() menghitung matriks korelasi dari dataset. Parameter annot=True memastikan bahwa nilai korelasi ditampilkan di dalam sel heatmap. Sementara cmap digunakan untuk menentukan palet warna.

Jika kamu ingin mengubah format annotation pada heatmap, kamu bisa menambahkan parameter fmt. Contoh:

In [None]:
data = sns.load_dataset('tips')
korelasi = data.corr()
sns.heatmap(korelasi, annot=True, cmap='coolwarm', fmt='.4f')
plt.show()

Dengan menambahkan fmt='.4f', nilai korelasi akan ditampilkan dengan empat angka desimal.

Selain membuat matriks korelasi, heatmap juga memungkinkan kamu dengan cepat mengidentifikasi hubungan antara variabel.

Warna yang lebih hangat (misalnya, merah atau oranye) biasanya menunjukkan korelasi positif yang kuat, sedangkan warna yang lebih dingin (seperti biru) menunjukkan korelasi negatif. Jika sel dalam heatmap berwarna netral atau mendekati nol, menunjukkan tidak ada korelasi yang signifikan antara dua variabel tersebut.