# Template Emas v2.0: Alur Kerja Analisis Data dari A sampai Z

*Ini adalah Prosedur Standar Operasional (SOP) untuk setiap proyek analisis data baru.*

---

### Fase 1: Tiba di TKP (Inspeksi & Perkenalan Data)
*Tujuan: Mendapatkan gambaran umum secepat mungkin.*

**1. Lihat 5 Baris Pertama:**
```python
df.head()

**2. Dapatkan Laporan Awal (Tipe Data & Non-Null):**

```python
df.info()

---

### Fase 2: Forensik Awal (Validasi & Pembersihan Data)
*Tujuan: Memastikan semua data valid, akurat, dan lengkap.*

**3. Cek Data Hilang:**

```python
df.isna().sum()

**Jika ada, tangani dengan .dropna() atau .fillna()**

**4. Cek Data Duplikat:**

```python
df.duplicated().sum()

**jika ada, tangani dengan .drop_duplicates()**

**5.Validasi Tipe Data:**


**Contoh: Mengubah object ke datetime**
```python
pd.to_datetime(df['kolom_tanggal'])

**Contoh: Mengubah object ke angka**
```python
df['kolom_angka'] = df['kolom_angka'].str.replace(",", "").astype(float)

**6. Cek Nilai Aneh (Outlier) pada Kolom Angka:**

```python
import seaborn as sns
sns.boxplot(x=df['nama_kolom_angka'])

---

### Fase 3: Membuat "Alat Bantu" Baru (Rekayasa Fitur)
*Tujuan: Membuat kolom baru yang lebih informatif dari data yang sudah ada.*


***7. Ekstrak Info dari Tanggal:***

```python
df['bulan'] = df['kolom_tanggal'].dt.month


***8. Mengelompokkan Angka menjadi Kategori:***

```python
pd.cut(df['kolom_angka'], bins=[...], labels=[...])

**9. Mengelompokkan Teks menjadi Kategori (berdasarkan kata kunci):**

```python
import numpy as np
conditions = [df['kolom_teks'].str.contains("Data Scientist"), ...]
choices = ["Data Science", ...]
df['Job_Category'] = np.select(conditions, choices, default="Other")

---

### Fase 4: Interogasi & Analisis Mendalam
*Tujuan: Menemukan wawasan dan cerita dari data yang sudah bersih.*



***10. Analisis Satu Variabel (Univariat):***

*Kategori:*

```python
df['kolom_kategori'].value_counts()
sns.countplot(y='kolom_kategori', data=df)

*Angka:*

```python
df['kolom_angka'].describe()
sns.histplot(x='kolom_angka', data=df, kde=True)

***11. Analisis Hubungan (Bivariat):***

*Angka vs Kategori:*

```python
sns.barplot(x='kolom_kategori', y='kolom_angka', data=df)

*Angka vs Angka:*

```python
sns.scatterplot(x='kolom_angka_1', y='kolom_angka_2', data=df)
sns.heatmap(df.corr(numeric_only=True), annot=True)

*Kategori vs Kategori:*

```python
pd.crosstab(index=df['kategori_1'], columns=df['kategori_2'])

***12. Analisis Kelompok (Agregasi):***

*Selalu reset index setelahnya jika ingin di-plotting*
```python
hasil_grup = df.groupby('kolom_kategori')['kolom_angka'].mean().reset_index()

----

***Bayangkan Anda seorang petualang yang dikirim ke sebuah pulau misterius (dataset baru) untuk mencari harta karun (wawasan/insight). Setiap pulau bentuknya berbeda-beda (setiap dataset punya masalah uniknya sendiri).***

***Template Emas itu bukanlah rute pasti menuju harta karun.***

***Paling tidak, template itu adalah peta dasar Anda yang berisi:***

1. Legenda: Penjelasan simbol-simbol di peta (df.info()).
2. Kompas: Arah mata angin yang jelas (Fase 1, Fase 2, dst.).
3. Prosedur Standar: "Saat tiba di lokasi baru, pertama-tama, periksa dulu kondisi tanah (df.isna().sum()), lihat vegetasi di sekitarnya (df.value_counts()), dan cari sumber air (df.describe())."


***Anda tidak akan mengikuti peta itu secara buta. Jika di tengah jalan Anda menemukan sebuah gua (kolom data yang menarik), tentu Anda akan keluar dari jalur untuk memeriksanya.***


***Tapi, saat Anda bingung harus mulai dari mana di pulau antah berantah itu, paling tidak Anda punya prosedur standar dan peta dasar untuk memulai investigasi Anda dengan percaya diri.***