---

## 📦 Materi: Data Warehouse

---

### 💡 **Apa itu Data Warehouse?**

**Data Warehouse** adalah Sistem komputerisasi untuk mengarsipkan dan menganalisis sebuah data historis untuk keperluan organisasi atau bahasa lainnya merupakan sistem penyimpanan data terintegrasi yang dirancang khusus untuk mendukung pengambilan keputusan. Dimana dengan menganalisis data secara terstruktur dapat menghasilkan informasi dan wawasan yang lebih luas untuk menunjang pengambilan keputusan. Data warehouse ini merupakan salah satu parameter penunjang kegiatan *Business Intelligence*.


Berbeda dengan database operasional yang mendukung aktivitas harian (OLTP), data warehouse digunakan untuk analisis, pelaporan, dan Business Intelligence (OLAP).

---

## 🧱 LATAR BELAKANG DATA WAREHOUSE

### 📌 1. **Solusi Tepat untuk Menyimpan Data dan Informasi Penting Perusahaan**
Dalam era digital, perusahaan mengumpulkan data dari berbagai sumber seperti:
- Transaksi penjualan
- Data pelanggan
- Aktivitas marketing (media sosial, marketplace, dll)
- Sistem operasional internal

Tanpa sistem penyimpanan yang tepat, data akan tersebar, tidak konsisten, dan sulit dianalisis.  
**Data Warehouse** hadir sebagai **solusi penyimpanan terpusat** yang:
- Terstruktur
- Konsisten
- Siap dianalisis

Contoh:
> Penjualan produk Fruit Glow dari Shopee, Tokopedia, IG, dan offline dapat dikonsolidasikan ke satu pusat data warehouse untuk dianalisis performanya.

---

### 📌 2. **Pengelolaan Informasi secara Lebih Terstruktur**
Data warehouse menyimpan data dalam **struktur yang telah dirancang khusus** untuk analisis, bukan hanya pencatatan.

Struktur ini dibangun berdasarkan **fakta** (misalnya penjualan) dan **dimensi** (seperti produk, waktu, channel, wilayah).

Manfaat:
- Mudah digunakan untuk analisis historis & tren
- Mendukung teknik OLAP (Online Analytical Processing)
- Dapat digunakan oleh tim manajemen untuk mengambil keputusan strategis

Contoh:
> Manajer bisa melihat penjualan per wilayah atau per produk bundling dengan cepat hanya dengan query ke data warehouse.

---

### 📌 3. **Data Dapat Diakses, Tersimpan, dan Terjaga dengan Baik**
Data warehouse memiliki keunggulan dibanding sistem operasional biasa, karena:
- **Akses cepat** melalui sistem OLAP, query SQL, dan tool visualisasi
- **Keamanan tinggi** dengan kontrol akses (siapa yang bisa baca, tulis, dll)
- **Data historis tidak hilang**, karena data tidak boleh diubah setelah masuk (non-volatile)

Dengan ini, perusahaan bisa:
- Melacak kinerja dari waktu ke waktu
- Menghindari kehilangan data karena overwrite
- Menyimpan data historis untuk kebutuhan audit atau analisis mendalam

Contoh:
> Tim manajemen bisa membandingkan penjualan Fruit Glow bulan Januari vs Desember tanpa khawatir datanya tertimpa atau hilang.

---

### 💡 **Kesimpulan**
> **Data Warehouse dibangun karena perusahaan membutuhkan pusat penyimpanan data yang rapi, terstruktur, mudah diakses, dan aman**, demi mendukung analisis dan pengambilan keputusan bisnis secara akurat dan cepat.

---

---

## 📌 FUNGSI DATA WAREHOUSE

---

### 🧠 1. **Membantu dalam Mengambil Keputusan**
> Keputusan bisnis yang baik harus berbasis data, bukan sekadar intuisi.

**Penjelasan:**
- Data warehouse menyajikan **data yang kredibel** karena telah melalui proses ETL (Extract, Transform, Load).
- Informasi yang disediakan mencakup berbagai aspek: penjualan, pelanggan, keuangan, inventaris, dll.
- Keputusan seperti *targeting pelanggan*, *pengelolaan stok*, dan *alokasi promosi* dapat dilakukan dengan lebih akurat.

**Contoh:**
> Manajer Fruit Glow bisa tahu bahwa produk bundling paling laku di Tokopedia wilayah Jawa Tengah → memutuskan buat push campaign di sana bulan depan.

---

### ⚡ 2. **Mudah dan Cepat dalam Mengakses Data**
> Waktu adalah kunci dalam dunia bisnis yang kompetitif.

**Penjelasan:**
- User bisa dengan cepat **meng-query data** melalui tools seperti Power BI, Tableau, atau Python.
- Data warehouse dirancang agar mudah diakses dan digunakan oleh semua level manajemen, bukan hanya IT.
- Kecepatan dalam membaca tren → menjadi keunggulan kompetitif.

**Contoh:**
> Tim marketing bisa langsung melihat performa tiap channel (Shopee, IG, TikTok) dalam hitungan detik untuk menentukan platform promosi selanjutnya.

---

### ✅ 3. **Menciptakan Konsistensi Data**
> Data dari berbagai sumber seringkali punya format berbeda. DW menyatukannya.

**Penjelasan:**
- Informasi dari marketplace, sosial media, dan offline store **disatukan dalam format yang seragam**.
- Konsistensi ini membuat analisis menjadi akurat, tidak misleading.
- Proses transformasi data (ETL) memastikan bahwa semua data “berbicara dalam bahasa yang sama”.

**Contoh:**
> Penamaan produk “Glow Serum” dari Shopee, IG, dan TikTok disamakan menjadi satu entitas di DW agar tidak dihitung sebagai entitas berbeda.

---

### 📈 4. **Menyediakan Historical Intelligence**
> Data warehouse menyimpan **data historis** jangka panjang untuk melihat tren dan pola.

**Penjelasan:**
- Manajemen bisa membandingkan performa antar bulan, musim, atau tahun.
- Tren ini bisa menjadi dasar untuk:
  - Prediksi permintaan
  - Strategi harga
  - Rencana distribusi
- Cocok untuk digunakan dengan **Data Mining** & **Forecasting Model**.

**Contoh:**
> Dari DW, terlihat bahwa penjualan Fruit Glow meningkat di akhir tahun → perusahaan bisa menyiapkan stok & promosi khusus Q4.

---

### 💬 Kesimpulan Singkat
| Fungsi | Manfaat Nyata |
|--------|----------------|
| Membantu Keputusan | Strategi yang tepat & cepat |
| Akses Cepat | Lebih kompetitif |
| Data Konsisten | Analisis akurat |
| Intelligence Historis | Prediksi dan perencanaan strategis |

---

---

## ⭐ KARAKTERISTIK DATA WAREHOUSE

---

### 🧩 1. **Berorientasi pada Subjek (Subject-Oriented)**
> Fokus pada topik utama yang mendukung analisis bisnis.

**Penjelasan:**
- Data Warehouse (DW) tidak dibangun berdasarkan proses bisnis (seperti sistem operasional), tapi berdasarkan **subjek penting bisnis**, misalnya:
  - Penjualan
  - Pelanggan
  - Produk
  - Waktu

**Tujuan:**
- Mempermudah analisis dan pengambilan keputusan di berbagai level manajemen.

**Contoh:**
> DW *Fruit Glow* difokuskan pada subjek: *penjualan per provinsi*, *kinerja sales*, *performa bundling*, sehingga tiap bagian manajemen bisa fokus menganalisis bagian mereka.

---

### 🔗 2. **Data Telah Terintegrasi (Integrated)**
> Data yang berasal dari berbagai sumber telah dibersihkan dan disatukan dalam satu sistem yang konsisten.

**Penjelasan:**
- Menggabungkan data dari:
  - E-commerce (Shopee, Tokopedia)
  - Sosial media (IG, TikTok)
  - Offline store
- Proses ETL memastikan format, kode produk, dan penamaan sudah **diseragamkan**.

**Manfaat:**
- Pengambilan keputusan jadi **efektif dan efisien** karena data sudah "berbicara dalam satu bahasa".

**Contoh:**
> Nama produk "Fruit Glow Serum 30ml" dari Shopee, IG dan TikTok dikonversi ke satu format yang sama sehingga tidak terjadi duplikasi saat analisis.

---

### 🔒 3. **Data Bersifat Tetap (Non-Volatile)**
> Data dalam data warehouse **tidak boleh diubah atau dihapus** setelah dimasukkan.

**Penjelasan:**
- Data hanya bisa ditambahkan (append-only).
- Hal ini menjamin integritas historis data.
- Setiap data disimpan dengan **penanda waktu (timestamp)**.

**Manfaat:**
- Analisis historis menjadi **konsisten dan dapat ditelusuri kembali**.
- Cocok untuk audit, prediksi, dan pelaporan tren jangka panjang.

**Contoh:**
> Penjualan Fruit Glow bulan Januari tetap tersimpan dan tidak tertimpa oleh data Februari → dapat dibandingkan kapan saja untuk melihat tren.

---

### ⏳ 4. **Dibuat dalam Rentang Waktu Tertentu (Time-Variant)**
> Data warehouse menyimpan data **berdasarkan waktu**.

**Penjelasan:**
- Semua data dilengkapi informasi waktu:
  - Tanggal transaksi
  - Bulan & tahun
  - Timestamp loading

**Manfaat:**
- Analisis tren, musiman, dan pertumbuhan bisa dilakukan secara akurat.

**Contoh:**
> Manajer bisa melihat bahwa permintaan bundling Fruit Glow meningkat di kuartal akhir setiap tahun → menyusun strategi promosi akhir tahun.

---

### 🧠 Ringkasan Karakteristik

| Karakteristik             | Penjelasan Singkat                                                      | Contoh Fruit Glow                          |
|--------------------------|-------------------------------------------------------------------------|--------------------------------------------|
| **Subjek-Oriented**      | Fokus pada area penting seperti penjualan dan pelanggan                 | Fokus analisis pada penjualan per provinsi |
| **Integrated**           | Data dari berbagai sumber disatukan secara konsisten                    | Data Shopee, IG, offline dijadikan satu    |
| **Non-Volatile**         | Data bersifat tetap dan hanya bisa ditambah, bukan diubah atau dihapus  | Data Januari tetap tersedia untuk perbandingan |
| **Time-Variant**         | Data selalu disertai informasi waktu                                    | Bisa lihat tren penjualan tiap bulan       |

---

## 📦 KOMONEN DATA WAREHOUSE

---

### 1. 🏢 **Gudang (Data Storage)**
> Tempat fisik atau virtual di mana data disimpan.

**Penjelasan:**
- Bentuknya bisa beragam, tergantung kebutuhan perusahaan:
  - **Appliance**: kombinasi hardware & software (misalnya IBM Netezza)
  - **Analytics Warehouse**: seperti Google BigQuery, Amazon Redshift
  - **Cloud-hosted**: seperti Snowflake, Microsoft Azure
  - **Relational DB**: seperti MySQL, PostgreSQL

**Contoh Studi Kasus – Fruit Glow**:
> Perusahaan menyimpan seluruh data penjualan (Shopee, Tokopedia, TikTok, IG, Offline) dalam **PostgreSQL** yang di-host di **Google Cloud Platform** sebagai data warehouse utama.

---

### 2. 🛠️ **Manajemen Gudang Data (Data Warehouse Management)**
> Komponen yang bertugas untuk **mengatur, menjaga, dan mengelola** data warehouse agar tetap optimal.

**Penjelasan:**
- Tugas tim manajemen data warehouse:
  - Menjaga **keamanan data**
  - Menjadwalkan **update data otomatis**
  - Menentukan **prioritas pemrosesan**
  - Menyusun sistem **backup & recovery**

**Contoh Studi Kasus – Fruit Glow**:
> Admin DW mengatur agar data penjualan dari semua channel **diupdate otomatis setiap tanggal 1**. Backup dilakukan setiap minggu ke cloud storage terpisah.

---

### 3. 📑 **Metadata**
> "Data tentang data" yang menjelaskan isi, struktur, dan arti dari data.

**Penjelasan:**
- Membantu user memahami:
  - Apa isi dari setiap kolom data
  - Satuan ukuran
  - Sumber data berasal dari mana
  - Tanggal pemrosesan dan update terakhir

**Contoh Studi Kasus – Fruit Glow**:
> Metadata menjelaskan bahwa kolom `sales_channel` berisi nama platform penjualan (`Shopee`, `TikTok`, dll), dan `order_quantity` satuannya dalam unit.

---

### 4. 📊 **Tools Akses (Access Tools)**
> Perangkat yang digunakan untuk **mengakses, menganalisis, dan menampilkan data**.

**Penjelasan:**
- Bisa berupa:
  - **Query tools** (SQL, pgAdmin, DBeaver)
  - **Reporting tools** (Power BI, Tableau, Looker)
  - **Data Mining & OLAP** untuk analisa multidimensional

**Contoh Studi Kasus – Fruit Glow**:
> Tim Marketing menggunakan **Power BI** untuk menganalisis penjualan berdasarkan provinsi dan bundling → visualisasi tren kuartal paling laris.

---

### 5. 🔄 **Tools ETL (Extract, Transform, Load)**
> Proses penting untuk memindahkan data dari sumber → membersihkannya → menyimpannya ke DW.

**Penjelasan:**
- **Extract**: mengambil data dari Shopee, Tokopedia, IG, dll
- **Transform**: menyamakan format tanggal, menggabungkan nama produk
- **Load**: memasukkan data ke warehouse

**Contoh Studi Kasus – Fruit Glow**:
> Data dari Shopee di-*extract* harian, kemudian nama produk `FruitGlow_Serum` disamakan menjadi `Glow Serum`, lalu disimpan ke DW.

---

## 💡 Ringkasan Komponen DW

| Komponen           | Fungsi Utama                                | Contoh Kasus Fruit Glow                      |
|--------------------|----------------------------------------------|----------------------------------------------|
| Gudang             | Tempat menyimpan seluruh data                | PostgreSQL di-host di GCP                    |
| Manajemen DW       | Mengelola keamanan dan update                | Admin mengatur backup mingguan              |
| Metadata           | Memberi konteks pada data                    | Penjelasan `channel`, `quantity`, dll        |
| Tools Akses        | Menganalisis & menampilkan data              | Visualisasi di Power BI                      |
| Tools ETL          | Pindahkan, bersihkan, masukkan data          | ETL otomatis tiap channel marketplace        |

---

## 🌟 Star Schema pada Data Warehouse

### 🧠 Definisi Singkat:
> **Star Schema** adalah skema sederhana dalam arsitektur Data Warehouse yang **menggambarkan hubungan antara satu tabel fakta utama** dengan **beberapa tabel dimensi** di sekelilingnya, sehingga membentuk **pola seperti bintang (star)**.

---

## ⭐ Komponen Utama Star Schema

---

### 1. 📊 **Tabel Fakta (Fact Table)**

#### ✅ Ciri-ciri:
- Inti dari skema bintang
- Menyimpan **fakta-fakta atau data kuantitatif** dari proses bisnis
- Kolom-kolomnya berisi angka (misalnya: total_penjualan, quantity, revenue)
- **Foreign key** yang menghubungkan ke tabel-tabel dimensi

#### 🧴 Contoh Tabel Fakta – *Fruit Glow*:

| id_transaksi | tanggal_id | produk_id | channel_id | provinsi_id | sales_id | quantity | total_penjualan |
|--------------|------------|-----------|------------|-------------|----------|----------|-----------------|
| T001         | TGL202401  | P01       | C01        | PR01        | S01      | 12       | 1.200.000        |
| T002         | TGL202401  | P03       | C02        | PR03        | S02      | 4        | 500.000          |

---

### 2. 📁 **Tabel Dimensi (Dimension Table)**

#### ✅ Ciri-ciri:
- Berisi **atribut deskriptif/kualitatif**
- Menjawab pertanyaan **siapa, apa, kapan, di mana, bagaimana**
- Sering dipakai untuk **filtering, grouping, dan labeling** saat analisis

#### 🔸 Contoh Tabel Dimensi:

---

#### 📆 a. Dimensi Tanggal:

| tanggal_id | bulan      | tahun |
|------------|------------|-------|
| TGL202401  | Januari    | 2024  |
| TGL202402  | Februari   | 2024  |

---

#### 🧴 b. Dimensi Produk:

| produk_id | nama_produk      | jenis        | bundling |
|-----------|------------------|--------------|----------|
| P01       | Glow Serum       | Serum        | Tidak    |
| P03       | Bundling Glow Set| Bundling     | Ya       |

---

#### 🌐 c. Dimensi Channel:

| channel_id | nama_channel |
|------------|--------------|
| C01        | Shopee       |
| C02        | TikTok       |

---

#### 🧑‍💼 d. Dimensi Sales:

| sales_id | nama_sales  | domisili     |
|----------|-------------|--------------|
| S01      | Rini        | Bandung      |
| S02      | Andi        | Surabaya     |

---

#### 🗺️ e. Dimensi Provinsi:

| provinsi_id | nama_provinsi |
|-------------|----------------|
| PR01        | Jawa Barat     |
| PR03        | Jawa Timur     |

---

## 🧩 Hubungan Visual: Skema Bintang

```
                  +-----------------+
                  |  Dim_Tanggal    |
                  +-----------------+
                          |
                          |
+------------+     +-------------+     +--------------+     +------------+
| Dim_Sales  | --> |  Tabel Fakta| <-- | Dim_Produk   | <-- | Dim_Channel|
+------------+     +-------------+     +--------------+     +------------+
                          |
                    +------------+
                    | Dim_Provinsi|
                    +------------+
```

---

## 💡 Kenapa Memakai Star Schema?

| Keunggulan                              | Penjelasan                                                                 |
|----------------------------------------|---------------------------------------------------------------------------|
| 🔍 **Mudah dianalisis**                | Tabel dimensi terstruktur jelas & bisa digunakan langsung dalam visual    |
| ⚡ **Cepat saat query OLAP**           | Karena hanya 1 tabel fakta, JOIN menjadi lebih cepat                      |
| 🧠 **User-friendly untuk analis**      | Struktur simpel, mudah dipahami oleh non-teknikal                         |

---

## 📌 Studi Kasus – *Fruit Glow*

> Saat manajemen ingin tahu:  
"**Penjualan bundling terbanyak per provinsi pada kuartal pertama 2024, per sales?**"

Maka mereka tinggal JOIN:
- Tabel Fakta + Dim_Produk (untuk tahu `bundling`)
- Tabel Fakta + Dim_Provinsi (untuk lihat `wilayah`)
- Tabel Fakta + Dim_Tanggal (untuk filter Q1)
- Tabel Fakta + Dim_Sales (untuk tahu siapa yang jual)

---

## Oh iya, kok bisa ya kemarin kita belajar DSS sekarang kita malah belajar Data Warehouse?

Banyak mahasiswa juga bertanya hal yang sama, karena secara **alur teknis**, biasanya orang pikir:

> “Harusnya kita bahas Data Warehouse dulu, baru DSS kan? Soalnya data-nya dari sana.”

Tapi kalau dilihat dari **tujuan pembelajaran**, urutan kampus yang bahas **DSS dulu baru Data Warehouse** itu ada logikanya juga. Nih penjelasan simpelnya:

---

### 🔁 **Kenapa DSS Duluan?**

Karena **Decision Support System (DSS) adalah alasan kenapa kita butuh Data Warehouse.**  
Artinya, kita harus tahu dulu *"mengapa kita butuh data yang terstruktur dengan baik?"* → jawabannya: **untuk mendukung pengambilan keputusan.**

> ❗ Jadi DSS duluan itu untuk memahami “tujuan akhirnya”.

Baru setelah itu, dijelaskan:
- Gimana cara ngumpulin datanya?
- Gimana supaya datanya bersih, cepat diakses, dan bisa dipercaya?

➡️ Nah, di situlah **Data Warehouse** masuk.

---

### 🔄 Analogi Simpel

Bayangin kamu mau bikin **ramuan rahasia** di laboratorium (DSS = keputusan strategis).  
Tapi kamu butuh bahan-bahan berkualitas tinggi dulu: rempah, air, dan bahan aktif (data).

Kalau bahan-bahannya kotor, berantakan, campur aduk, kamu bisa salah campur dan gagal total (keputusan salah).

Jadi, kamu perlu tempat penyimpanan bahan yang rapi dan bersih: itu **Data Warehouse**.

---