In [None]:
print(df)
print(df['purchase'])
print(df['purchase'].mean())
print(df.groupby('gender')['purchase'].mean())


### **Kapan Menggunakan Macam-Macam Jenis Bar Chart?**  

Bar chart digunakan untuk membandingkan nilai kategori, tetapi ada beberapa variasi yang cocok untuk berbagai situasi. Berikut adalah jenis-jenis bar chart dan kapan menggunakannya:  

---

### **1️⃣ Bar Chart Biasa (Vertical Bar Chart)**
📌 **Gunakan ketika:**  
- Membandingkan jumlah/frekuensi antar kategori secara langsung.  
- Data bersifat kategorikal dan tidak memiliki urutan tertentu.  
- Contoh: Perbandingan penjualan produk berdasarkan kategori.  

**📌 Contoh Kode:**  
```python
plt.figure(figsize=(10,6))
sns.barplot(x='Product', y='Sales', data=df, estimator=np.sum, ci=None)
plt.title('Total Sales per Product')
plt.xlabel('Product')
plt.ylabel('Total Sales')
plt.xticks(rotation=45)
plt.show()
```
✅ **Kelebihan:** Mudah dibaca dan digunakan untuk perbandingan sederhana.  

---

### **2️⃣ Horizontal Bar Chart**  
📌 **Gunakan ketika:**  
- Kategori memiliki nama panjang yang sulit dibaca pada sumbu X.  
- Ingin menampilkan urutan dengan lebih jelas.  
- Contoh: Perbandingan jumlah karyawan berdasarkan departemen.  

**📌 Contoh Kode:**  
```python
plt.figure(figsize=(10,6))
sns.barplot(y='Department', x='Employees', data=df, estimator=np.sum, ci=None, orient='h')
plt.title('Number of Employees per Department')
plt.ylabel('Department')
plt.xlabel('Number of Employees')
plt.show()
```
✅ **Kelebihan:** Lebih mudah dibaca jika nama kategori panjang.  

---

### **3️⃣ Grouped Bar Chart** (Perbandingan dalam Grup)  
📌 **Gunakan ketika:**  
- Membandingkan dua atau lebih kategori dalam satu grup.  
- Contoh: Penjualan produk berdasarkan tahun.  

**📌 Contoh Kode:**  
```python
plt.figure(figsize=(10,6))
sns.barplot(x='Product', y='Sales', hue='Year', data=df, estimator=np.sum, ci=None)
plt.title('Total Sales per Product by Year')
plt.xlabel('Product')
plt.ylabel('Total Sales')
plt.legend(title='Year')
plt.show()
```
✅ **Kelebihan:** Bisa membandingkan data dalam beberapa kategori sekaligus.  

---

### **4️⃣ Stacked Bar Chart** (Bar Tumpuk)  
📌 **Gunakan ketika:**  
- Menampilkan distribusi bagian dalam total.  
- Contoh: Perbandingan jumlah pelanggan berdasarkan kategori dan jenis kelamin.  

**📌 Contoh Kode:**  
```python
df_grouped = df.groupby(['Product', 'Gender'])['Sales'].sum().unstack()

df_grouped.plot(kind='bar', stacked=True, figsize=(10,6))
plt.title('Total Sales per Product by Gender')
plt.xlabel('Product')
plt.ylabel('Total Sales')
plt.legend(title='Gender')
plt.show()
```
✅ **Kelebihan:** Menampilkan bagian dari total dengan lebih jelas.  

---

### **5️⃣ 100% Stacked Bar Chart** (Distribusi Proporsi)  
📌 **Gunakan ketika:**  
- Ingin menunjukkan proporsi per kategori yang selalu berjumlah 100%.  
- Contoh: Persentase pelanggan yang memilih metode pembayaran tertentu per tahun.  

**📌 Contoh Kode:**  
```python
df_grouped_pct = df_grouped.div(df_grouped.sum(axis=1), axis=0) * 100

df_grouped_pct.plot(kind='bar', stacked=True, figsize=(10,6))
plt.title('Percentage of Sales per Product by Gender')
plt.xlabel('Product')
plt.ylabel('Percentage (%)')
plt.legend(title='Gender')
plt.show()
```
✅ **Kelebihan:** Menampilkan proporsi dengan lebih jelas.  

---

### **6️⃣ Bar Chart dengan Error Bars (Confidence Interval - CI)**  
📌 **Gunakan ketika:**  
- Data berasal dari sampel dan ingin menampilkan variasi atau ketidakpastian (confidence interval).  
- Contoh: Rata-rata rating produk dengan margin of error.  

**📌 Contoh Kode:**  
```python
plt.figure(figsize=(10,6))
sns.barplot(x='Product', y='Rating', data=df, ci=95)  # CI default 95%
plt.title('Average Rating per Product with Confidence Interval')
plt.xlabel('Product')
plt.ylabel('Average Rating')
plt.show()
```
✅ **Kelebihan:** Memberikan informasi statistik tambahan.  

---

### **Kesimpulan**  
| Jenis Bar Chart | Kapan Digunakan? |  
|----------------|----------------|  
| **Vertical Bar Chart** | Perbandingan sederhana antar kategori |  
| **Horizontal Bar Chart** | Jika kategori memiliki nama panjang |  
| **Grouped Bar Chart** | Membandingkan beberapa kategori dalam satu grup |  
| **Stacked Bar Chart** | Menampilkan bagian dari total dalam satu batang |  
| **100% Stacked Bar Chart** | Menampilkan proporsi dalam total 100% |  
| **Bar Chart dengan CI** | Menunjukkan rata-rata dengan margin of error |  

Semoga membantu! 🚀

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

In [None]:
# Bar Chart
plt.figure(figsize=(8, 5))
sns.barplot(x='Kategori', y='Jumlah', data=df, palette='viridis')
plt.title('Bar Chart Contoh')
plt.xlabel('Kategori')
plt.ylabel('Jumlah')
plt.show()

In [None]:
temp_df["year"].value_counts().plot(kind='barh')

In [None]:
# Pie Chart
plt.figure(figsize=(7, 7))
plt.pie(df['Jumlah'], labels=df['Kategori'], autopct='%1.1f%%', colors=['red', 'blue', 'green', 'purple'])
plt.title('Pie Chart Contoh')
plt.show()


In [None]:
temp_df["year"].value_counts().head(5).plot(kind='pie')

In [None]:

# Line Chart
plt.figure(figsize=(8, 5))
sns.lineplot(x='Tahun', y='Penjualan', data=df_line, marker='o', color='blue')
plt.title('Line Chart Contoh')
plt.xlabel('Tahun')
plt.ylabel('Penjualan')
plt.show()

In [None]:
# Scatter Plot
plt.figure(figsize=(8, 5))
sns.scatterplot(x='Tinggi', y='Berat', data=df_scatter, color='red')
plt.title('Scatter Plot Contoh')
plt.xlabel('Tinggi (cm)')
plt.ylabel('Berat (kg)')
plt.show()

In [None]:

# Histogram
plt.figure(figsize=(8, 5))
sns.histplot(data, bins=30, kde=True, color='green')
plt.title('Histogram Contoh')
plt.xlabel('Nilai')
plt.ylabel('Frekuensi')
plt.show()

In [None]:
# Box Plot
plt.figure(figsize=(8, 5))
sns.boxplot(y=df_scatter['Berat'], color='orange')
plt.title('Box Plot Contoh')
plt.ylabel('Berat (kg)')
plt.show()


In [None]:
# Heatmap
plt.figure(figsize=(8, 5))
sns.heatmap(df_scatter.corr(), annot=True, cmap='coolwarm')
plt.title('Heatmap Contoh')
plt.show()
