# 2. Data Understanding

## 2.1 Sumber Data
Dataset yang digunakan merupakan data historis harga Bitcoin dengan granularitas **harian (daily)**. Dataset ini berisi informasi harga OHLC dan volume perdagangan Bitcoin dalam periode jangka panjang.

Data bersifat time series dan digunakan untuk analisis tren serta forecasting harga penutupan (close).

## 2.2 Load Data

In [None]:
import pandas as pd

# Load dataset
data = pd.read_csv('/mnt/data/3ed03445-3971-4d35-8f52-4845f6854f82.csv')

# Konversi kolom tanggal
data['date'] = pd.to_datetime(data['date'])

# Urutkan data berdasarkan tanggal
data = data.sort_values('date')

# Set date sebagai index
data = data.set_index('date')

data.head()

## 2.3 Struktur Data

In [None]:
data.info()

Dataset memiliki variabel sebagai berikut:
- `open`   : Harga pembukaan Bitcoin
- `high`   : Harga tertinggi Bitcoin
- `low`    : Harga terendah Bitcoin
- `close`  : Harga penutupan Bitcoin (target variabel)
- `volume` : Volume transaksi Bitcoin

## 2.4 Statistik Deskriptif

In [None]:
data.describe()

Statistik deskriptif menunjukkan rentang harga Bitcoin yang sangat luas, yang mengindikasikan volatilitas tinggi sepanjang periode pengamatan.

## 2.5 Pemeriksaan Kualitas Data

In [None]:
# Cek missing value
data.isna().sum()

In [None]:
# Cek duplikasi tanggal
data.index.duplicated().sum()

Dataset tidak memiliki missing value signifikan dan tidak terdapat duplikasi tanggal.

## 2.6 Eksplorasi Visual Awal

In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(15,5))
plt.plot(data.index, data['close'])
plt.title('Harga Penutupan Bitcoin (Daily)')
plt.xlabel('Tanggal')
plt.ylabel('Harga (USD)')
plt.show()

In [None]:
plt.figure(figsize=(15,5))
plt.plot(data.index, data['volume'], color='orange')
plt.title('Volume Transaksi Bitcoin (Daily)')
plt.xlabel('Tanggal')
plt.ylabel('Volume')
plt.show()

## 2.7 Insight Awal

- Harga Bitcoin bersifat **non-stasioner**
- Terjadi lonjakan dan penurunan harga ekstrem
- Volatilitas berubah-ubah sepanjang waktu
- Volume meningkat pada periode pergerakan harga signifikan

## 2.8 Implikasi terhadap Modeling

Karakteristik data ini menunjukkan bahwa prediksi harga Bitcoin berbasis data historis saja memiliki keterbatasan, terutama dalam menangkap pergerakan harga yang dipicu oleh faktor eksternal.