# Tutorial Visualisasi Heatmap dengan Python

Heatmap adalah representasi grafis data di mana nilai-nilai individual dalam matriks ditampilkan sebagai warna. Heatmap sangat berguna untuk:
- Menampilkan korelasi antar variabel
- Memvisualisasikan pola dalam data
- Menunjukkan tren dan outlier dalam dataset

## Apa yang akan kita pelajari?
1. Dasar-dasar Heatmap menggunakan Seaborn
2. Membuat Heatmap dari data korelasi
3. Kustomisasi Heatmap
4. Studi Kasus: Analisis Korelasi Dataset
5. Latihan Mandiri

Mari kita mulai dengan mengimpor library yang diperlukan!

In [3]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Set style seaborn
sns.set_style("whitegrid")
plt.style.use('seaborn-v0_8')

# Mengatur ukuran plot default
plt.rcParams['figure.figsize'] = (10, 6)

# Untuk menampilkan plot di notebook
%matplotlib inline

## 1. Dasar-dasar Heatmap

Pertama, kita akan mengimpor library yang diperlukan dan membuat dataset sederhana untuk memahami konsep dasar heatmap.

In [4]:
# Import library yang diperlukan
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Set style
sns.set_style("whitegrid")
plt.style.use('seaborn-v0_8')

# Buat data sederhana
data = np.random.rand(5, 5)
df = pd.DataFrame(data, 
                 columns=['A', 'B', 'C', 'D', 'E'],
                 index=['P', 'Q', 'R', 'S', 'T'])

# Membuat heatmap dasar
plt.figure(figsize=(8, 6))
sns.heatmap(df, annot=True, cmap='YlOrRd')
plt.title('Heatmap Sederhana')
plt.show()

OSError: 'seaborn' is not a valid package style, path of style file, URL of style file, or library style name (library styles are listed in `style.available`)

## 2. Kustomisasi Heatmap

Seaborn menyediakan berbagai parameter untuk mengkustomisasi tampilan heatmap:
- `annot`: Menampilkan nilai dalam setiap sel
- `cmap`: Skema warna yang digunakan
- `fmt`: Format angka yang ditampilkan
- `cbar`: Menampilkan color bar
- `linewidths`: Ketebalan garis pembatas
- `center`: Nilai tengah untuk skema warna

Mari kita coba membuat heatmap dengan berbagai kustomisasi:

In [None]:
# Membuat dataset korelasi
np.random.seed(42)
data = np.random.randn(100, 5)
df = pd.DataFrame(data, columns=['Fitur A', 'Fitur B', 'Fitur C', 'Fitur D', 'Fitur E'])
correlation = df.corr()

# Membuat heatmap dengan kustomisasi
plt.figure(figsize=(10, 8))
sns.heatmap(correlation, 
            annot=True,           # Menampilkan nilai
            cmap='coolwarm',      # Skema warna
            fmt='.2f',            # Format 2 desimal
            linewidths=0.5,       # Ketebalan garis
            center=0,             # Nilai tengah colormap
            square=True,          # Membuat sel persegi
            cbar_kws={'label': 'Korelasi'})

plt.title('Heatmap Korelasi dengan Kustomisasi')
plt.show()

## 3. Studi Kasus: Analisis Dataset Penjualan

Dalam studi kasus ini, kita akan menganalisis dataset penjualan bulanan dengan beberapa metrik:
- Pendapatan
- Jumlah Transaksi
- Rata-rata Pembelian
- Tingkat Konversi
- Kepuasan Pelanggan

Kita akan melihat bagaimana metrik-metrik ini berkorelasi satu sama lain.

In [None]:
# Membuat dataset penjualan
np.random.seed(42)
n_months = 12

# Generate data
revenue = np.random.normal(1000, 200, n_months)
transactions = np.random.normal(500, 100, n_months)
avg_purchase = revenue / transactions
conversion_rate = np.random.normal(0.15, 0.03, n_months)
satisfaction = np.random.normal(4.2, 0.3, n_months)

# Buat DataFrame
sales_data = pd.DataFrame({
    'Pendapatan': revenue,
    'Jumlah_Transaksi': transactions,
    'Rata_Rata_Pembelian': avg_purchase,
    'Tingkat_Konversi': conversion_rate,
    'Kepuasan_Pelanggan': satisfaction
})

# Hitung korelasi
correlation = sales_data.corr()

# Buat heatmap
plt.figure(figsize=(12, 8))
sns.heatmap(correlation,
            annot=True,
            cmap='RdYlBu',
            fmt='.2f',
            linewidths=0.5,
            center=0,
            square=True,
            cbar_kws={'label': 'Koefisien Korelasi'})

plt.title('Korelasi Metrik Penjualan')
plt.tight_layout()
plt.show()

# Tampilkan interpretasi
print("\nInterpretasi Korelasi:")
print("- Korelasi positif kuat (mendekati 1): Kedua variabel bergerak searah")
print("- Korelasi negatif kuat (mendekati -1): Kedua variabel bergerak berlawanan arah")
print("- Korelasi mendekati 0: Tidak ada hubungan linear yang kuat")

## 4. Latihan Mandiri

### Latihan 1: Dataset Cuaca
Buatlah heatmap untuk menampilkan korelasi antara berbagai parameter cuaca:
- Suhu
- Kelembaban
- Curah Hujan
- Kecepatan Angin
- Tekanan Udara

### Latihan 2: Kustomisasi Tampilan
Modifikasi heatmap yang sudah dibuat dengan:
- Mengubah skema warna
- Menambahkan anotasi dengan format berbeda
- Mengubah ukuran dan rotasi label
- Menambahkan judul yang informatif

### Latihan 3: Analisis Data Sekolah
Buat dan analisis heatmap untuk data akademik yang mencakup:
- Nilai Matematika
- Nilai Bahasa
- Nilai IPA
- Kehadiran
- Waktu Belajar

### Tips Mengerjakan Latihan:
1. Mulai dengan membuat data dummy menggunakan numpy atau pandas
2. Eksperimen dengan berbagai parameter seaborn
3. Berikan interpretasi untuk setiap heatmap yang dibuat
4. Dokumentasikan temuan-temuan menarik

Selamat berlatih! 🚀

## Solusi Latihan 1: Dataset Cuaca

Berikut adalah contoh solusi untuk latihan dataset cuaca. Anda bisa menggunakan ini sebagai referensi setelah mencoba mengerjakan sendiri.

In [None]:
# Membuat dataset cuaca
np.random.seed(42)
n_days = 100

# Generate data cuaca
weather_data = pd.DataFrame({
    'Suhu': np.random.normal(25, 5, n_days),
    'Kelembaban': np.random.normal(70, 10, n_days),
    'Curah_Hujan': np.random.exponential(5, n_days),
    'Kecepatan_Angin': np.random.normal(15, 3, n_days),
    'Tekanan_Udara': np.random.normal(1013, 5, n_days)
})

# Hitung korelasi
weather_corr = weather_data.corr()

# Buat heatmap dengan masking untuk segitiga atas
mask = np.triu(np.ones_like(weather_corr, dtype=bool))

# Plot heatmap
plt.figure(figsize=(10, 8))
sns.heatmap(weather_corr,
            mask=mask,
            annot=True,
            cmap='viridis',
            fmt='.2f',
            linewidths=0.5,
            square=True,
            cbar_kws={'label': 'Koefisien Korelasi'})

plt.title('Korelasi Parameter Cuaca')
plt.tight_layout()
plt.show()

# Analisis korelasi
print("\nAnalisis Korelasi Parameter Cuaca:")
for i in range(len(weather_data.columns)):
    for j in range(i+1, len(weather_data.columns)):
        corr = weather_corr.iloc[i,j]
        if abs(corr) > 0.3:  # Hanya tampilkan korelasi yang cukup signifikan
            print(f"- {weather_data.columns[i]} dan {weather_data.columns[j]}: {corr:.2f}")

## Troubleshooting dan Tips

Jika Anda mengalami masalah dalam menjalankan kode:

1. Pastikan semua library terinstal dengan benar:
```python
pip install numpy pandas seaborn matplotlib
```

2. Jika mengalami masalah dengan tampilan plot:
   - Coba restart kernel Jupyter
   - Pastikan matplotlib backend dikonfigurasi dengan benar
   - Gunakan `%matplotlib inline` di awal notebook

3. Untuk data yang lebih besar:
   - Pertimbangkan untuk menggunakan `plt.figure(figsize=(width, height))` yang lebih besar
   - Gunakan parameter `fmt` yang sesuai untuk menghindari tumpang tindih angka
   - Pertimbangkan menggunakan `mask` untuk menampilkan hanya setengah heatmap

4. Tips Visualisasi:
   - Gunakan `sns.set_style()` untuk mengubah tema
   - Eksperimen dengan berbagai `cmap` untuk menemukan yang paling sesuai
   - Gunakan `plt.tight_layout()` untuk menghindari tumpang tindih
   - Rotasi label menggunakan `plt.xticks(rotation=45)` jika diperlukan

5. Penyimpanan Plot:
```python
plt.savefig('heatmap.png', dpi=300, bbox_inches='tight')
```

Selamat mencoba! 🚀