# Stock Market Quantitative Analysis

## I. Pendahuluan

Analisis kuantitatif di pasar saham melibatkan penggunaan teknik matematika dan statistik untuk memahami, memprediksi, dan membuat keputusan tentang investasi keuangan.

Proses analisis kuantitatif dimulai dengan mendefinisikan tujuan dan pertanyaan yang akan dijawab. Selanjutnya, identifikasi indikator kinerja kunci (KPI) yang relevan untuk analisis. Kemudian, data historis pasar saham, termasuk harga, volume, dan indikator keuangan lainnya, dikumpulkan. Data kemudian dibersihkan dan diproses untuk menangani nilai yang hilang, outlier, dan kesalahan.

Setelah itu, analisis awal dilakukan untuk memahami distribusi data, pola, dan korelasi. Akhirnya, berbagai strategi diterapkan berdasarkan hasil analisis kuantitatif. Dengan demikian, analisis kuantitatif adalah pendekatan yang sistematis dan matematis untuk memahami dan mengambil keputusan di pasar saham.

## II. Tujuan

Tujuan analisis kuantitatif di pasar saham adalah menggunakan teknik matematika dan statistik untuk memahami, memprediksi, dan membuat keputusan investasi yang tepat. Proses dimulai dengan mendefinisikan tujuan dan pertanyaan yang ingin dijawab, serta mengidentifikasi indikator kinerja kunci (KPI). Data historis pasar saham, termasuk harga, volume, dan indikator keuangan lainnya, dikumpulkan, dibersihkan, dan diproses. Analisis awal dilakukan untuk memahami distribusi data, pola, dan korelasi, diikuti dengan penerapan berbagai strategi untuk memberikan wawasan mendalam dan solusi yang terukur dalam menghadapi dinamika pasar saham.

## III. WorkFlow Project

1. **Data Collection** : Tahap ini merupakan langkah awal dalam analisis data, di mana data dikumpulkan dari berbagai sumber.

2. **Descriptive Statistics** : Summary statistics (mean, median, standard deviation, etc.) untuk setiap stock.

3. **Time Series Analysis** : Mengidentifikasi tren dan pola dari waktu ke waktu, terutama untuk harga penutupan saham, untuk memahami bagaimana harga saham berubah seiring waktu.

4. **Volatility Analysis** : Menganalisis seberapa besar fluktuasi harga saham selama periode tertentu, memberikan pemahaman tentang tingkat risiko yang terkait dengan saham tersebut.

5. **Correlation Analysis** : Mengukur hubungan antara harga saham dari perusahaan yang berbeda, memahami sejauh mana pergerakan harga saham satu perusahaan berkaitan dengan pergerakan harga saham perusahaan lainnya.

6. **Comparative Analysis** : Membandingkan kinerja berbagai saham untuk mengevaluasi relatifnya masing-masing, membantu dalam pemilihan investasi.

7. **Risk-Return Trade-off Analysis** : Menganalisis keseimbangan antara risiko yang mungkin dihadapi dan imbal hasil yang diharapkan dari berbagai saham, membantu dalam manajemen portofolio.

8. **Kesimpulan** : Tahap terakhir adalah menarik kesimpulan dari hasil analisis data. Kesimpulan harus berdasarkan fakta dan data yang telah dianalisis.

# 1. Data Collection

Dataset ini berisi kolom-kolom berikut untuk data pasar saham:

- Ticker: Simbol ticker saham.
- Date: Tanggal perdagangan.
- Open: Harga pembukaan saham untuk hari itu.
- High: Harga tertinggi saham selama hari itu.
- Low: Harga terendah saham selama hari itu.
- Close: Harga penutupan saham untuk hari itu.
- Adj Close: Harga penutupan disesuaikan, yang memperhitungkan semua tindakan perusahaan seperti dividen, stock split, dll.
- Volume: Jumlah saham yang diperdagangkan selama hari itu.

### Subset Libraries

In [32]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.io as pio
pio.templates.default = "plotly_white"

### Subset Data

In [33]:
# Memuat Data yang Akan Dianalisis
data = pd.read_csv("https://raw.githubusercontent.com/FahdAby/4-Stock-Market-Quantitative-Analysis/master/stocks.csv?token=GHSAT0AAAAAACQTSZBVLUO6273JXCTQECWQZQSCCVA")
data.head()

Unnamed: 0,Ticker,Date,Open,High,Low,Close,Adj Close,Volume
0,AAPL,2023-02-07,150.639999,155.229996,150.639999,154.649994,154.41423,83322600
1,AAPL,2023-02-08,153.880005,154.580002,151.169998,151.919998,151.6884,64120100
2,AAPL,2023-02-09,153.779999,154.330002,150.419998,150.869995,150.639999,56007100
3,AAPL,2023-02-10,149.460007,151.339996,149.220001,151.009995,151.009995,57450700
4,AAPL,2023-02-13,150.949997,154.259995,150.919998,153.850006,153.850006,62199000


### Exploratory Data Analysis (EDA)

In [34]:
# Cek Ukuran Data
data.shape

(248, 8)

In [35]:
# Cek Tipe Data
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 248 entries, 0 to 247
Data columns (total 8 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   Ticker     248 non-null    object 
 1   Date       248 non-null    object 
 2   Open       248 non-null    float64
 3   High       248 non-null    float64
 4   Low        248 non-null    float64
 5   Close      248 non-null    float64
 6   Adj Close  248 non-null    float64
 7   Volume     248 non-null    int64  
dtypes: float64(5), int64(1), object(2)
memory usage: 15.6+ KB


In [36]:
# Cek Missing Value :
print("Berikut adalah jumlah missing value pada setiap variabel :")
for i in data.columns:
    print(f"{i} = {data[i].isnull().sum()}")

Berikut adalah jumlah missing value pada setiap variabel :
Ticker = 0
Date = 0
Open = 0
High = 0
Low = 0
Close = 0
Adj Close = 0
Volume = 0


## 2. Descriptive Statistics

In [37]:
# Statistika Deskriptif
stat_desk  = data.groupby("Ticker")["Close"].describe()
stat_desk

Unnamed: 0_level_0,count,mean,std,min,25%,50%,75%,max
Ticker,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
AAPL,62.0,158.240645,7.360485,145.309998,152.077499,158.055,165.162506,173.570007
GOOG,62.0,100.631532,6.279464,89.349998,94.702501,102.759998,105.962503,109.459999
MSFT,62.0,275.039839,17.676231,246.270004,258.7425,275.810013,287.217506,310.649994
NFLX,62.0,327.614677,18.554419,292.76001,315.672493,325.600006,338.899994,366.829987


**Interpretasi :**

- Data menunjukkan bahwa keempat ticker saham memiliki rata-rata harga yang berbeda-beda, dengan MSFT memiliki rata-rata harga tertinggi dan GOOG memiliki rata-rata harga terendah.
- Fluktuasi harga saham MSFT dan AAPL relatif lebih tinggi dibandingkan GOOG dan NFLX.
- Median harga saham dapat memberikan gambaran tentang harga saham yang lebih stabil dibandingkan rata-rata, karena median tidak terlalu terpengaruh oleh nilai outlier.

## 3. Time Series Analysis

In [38]:
# Analisis Time Series
data['Date'] = pd.to_datetime(data['Date'])
pivot_data = data.pivot(index='Date', columns='Ticker', values='Close')
pivot_data


Ticker,AAPL,GOOG,MSFT,NFLX
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2023-02-07,154.649994,108.040001,267.559998,362.950012
2023-02-08,151.919998,100.000000,266.730011,366.829987
2023-02-09,150.869995,95.459999,263.619995,362.500000
2023-02-10,151.009995,94.860001,263.100006,347.359985
2023-02-13,153.850006,95.000000,271.320007,358.570007
...,...,...,...,...
2023-05-01,169.589996,107.709999,305.559998,324.119995
2023-05-02,168.539993,105.980003,305.410004,317.549988
2023-05-03,167.449997,106.120003,304.399994,319.299988
2023-05-04,165.789993,105.209999,305.410004,320.779999


In [39]:
# Membuat Sublot
fig1 = make_subplots(rows=1, cols=1)

In [40]:
# Menambah Traces untuk setiap Stock Ticker
for column in pivot_data.columns:
    fig1.add_trace(
        go.Scatter(x=pivot_data.index, y=pivot_data[column], name=column),
        row=1, col=1
    )


In [41]:
# Memperbarui layout
fig1.update_layout(
    title_text='Time Series dari Closing Prices',
    xaxis_title='Date',
    yaxis_title='Closing Price',
    legend_title='Ticker',
    showlegend=True)

# Menampilkan Plot
fig1.show()

**Interpretasi :**

- Setiap saham menunjukkan tren uniknya selama periode yang diamati. Misalnya, AAPL dan MSFT menunjukkan tren umum yang naik selama periode ini. Ini menunjukkan bahwa nilai saham keduanya cenderung meningkat dari waktu ke waktu.

- Terdapat volatilitas yang mencolok dalam harga saham. Sebagai contoh, NFLX menunjukkan fluktuasi yang lebih nyata dibandingkan dengan yang lainnya. Hal ini menunjukkan bahwa harga saham NFLX lebih cenderung berubah secara signifikan dalam waktu yang relatif singkat, yang dapat menarik bagi investor yang mencari potensi keuntungan cepat atau risiko yang lebih tinggi.

- Saat membandingkan saham-saham tersebut, MSFT dan NFLX secara umum diperdagangkan pada level harga yang lebih tinggi daripada AAPL dan GOOG dalam dataset ini. Ini menunjukkan bahwa MSFT dan NFLX mungkin dianggap sebagai investasi yang lebih mahal dalam hal harga saham per lembar. Namun, harga yang lebih tinggi ini juga dapat mencerminkan persepsi pasar terhadap kinerja atau potensi pertumbuhan perusahaan yang lebih besar.

## 4. Volatility Analysis

In [42]:
# Analisis volatilitas
volatility = pivot_data.std().sort_values(ascending=False)

fig2 = px.bar(volatility,
             x=volatility.index,
             y=volatility.values,
             labels={'y': 'Standard Deviation', 'x': 'Ticker'},
             title='Volatilitas dari Closing Prices (Standard Deviation)',
             color=volatility.index)

# Menunjukkan Bar
fig2.show()

**Interpretasi :**

Volatilitas adalah ukuran dari fluktuasi harga suatu saham. Berdasarkan data standar deviasi harga penutupan, NFLX dan MSFT merupakan saham-saham yang paling volatil dalam periode yang diamati, dengan NFLX memiliki volatilitas tertinggi diikuti oleh MSFT. Sementara itu, AAPL dan GOOG menunjukkan volatilitas yang lebih rendah.

Ini menunjukkan bahwa investor yang memegang saham NFLX dan MSFT harus siap menghadapi fluktuasi harga yang lebih besar dibandingkan dengan AAPL dan GOOG selama periode waktu yang dianalisis. Ini dapat mempengaruhi strategi investasi dan tingkat risiko yang diambil oleh investor dalam portofolio mereka.

## 5. Correlation Analysis

In [43]:
# Menghitung Korelasi
korelasi_matriks  = pivot_data.corr()
korelasi_matriks

Ticker,AAPL,GOOG,MSFT,NFLX
Ticker,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
AAPL,1.0,0.901662,0.953037,0.154418
GOOG,0.901662,1.0,0.884527,0.201046
MSFT,0.953037,0.884527,1.0,0.191273
NFLX,0.154418,0.201046,0.191273,1.0


In [44]:
fig3 = go.Figure(data=go.Heatmap(
                    z=korelasi_matriks,
                    x=korelasi_matriks.columns,
                    y=korelasi_matriks.columns,
                    colorscale='magma',
                    colorbar=dict(title='Correlation'),
                    ))

# Update layout
fig3.update_layout(
    title='Korelasi Matriks dari Closing Price',
    xaxis_title='Ticker',
    yaxis_title='Ticker'
)

# Show the figure
fig3.show()

Heatmap di atas menampilkan matriks korelasi dari harga penutupan keempat saham (AAPL, GOOG, MSFT, NFLX). 

**Interpretasi :**

- Nilai yang mendekati +1 menunjukkan korelasi positif yang kuat, artinya ketika harga satu saham meningkat, harga saham lainnya cenderung juga meningkat.
- Nilai yang mendekati -1 menunjukkan korelasi negatif yang kuat, di mana kenaikan harga satu saham berkorelasi dengan penurunan harga saham lainnya.
- Nilai sekitar 0 menunjukkan kurangnya korelasi antar saham.

Dari heatmap, kita dapat mengamati bahwa terdapat berbagai tingkat korelasi positif antara harga saham, dengan beberapa pasangan menunjukkan korelasi yang lebih kuat daripada yang lain. Misalnya, AAPL dan MSFT tampak memiliki korelasi positif yang relatif lebih tinggi.

## 6. Comparative Analysis

In [45]:
# Menghitung persentase perubahan harga penutupan
percentage_change = ((pivot_data.iloc[-1] - pivot_data.iloc[0]) / pivot_data.iloc[0]) * 100
percentage_change


Ticker
AAPL    12.234086
GOOG    -1.689193
MSFT    16.104798
NFLX   -11.073151
dtype: float64

In [46]:
# Pembuatan Visualisasi
fig4 = px.bar(percentage_change,
             x=percentage_change.index,
             y=percentage_change.values,
             labels={'y': 'Percentage Change (%)', 'x': 'Ticker'},
             title='Persentase Perubahan in Closing Prices',
             color = percentage_change.index)

# Show the plot
fig4.show()

**Interpretasi :**

- **MSFT**: Mengalami kenaikan harga penutupan saham tertinggi selama periode yang diamati, dengan perubahan positif sekitar 16,10%. Hal ini menunjukkan performa yang kuat bagi saham MSFT selama periode tersebut.
- **AAPL**: Menunjukkan kenaikan harga penutupan yang positif sekitar 12,23%. Meskipun kinerjanya solid, namun sedikit lebih rendah daripada MSFT.
- **GOOG**: Mengalami sedikit penurunan harga penutupan sebesar sekitar -1,69%. Hal ini menunjukkan penurunan kecil dalam harga saham GOOG selama periode yang diamati.
- **NFLX**: Mengalami penurunan harga penutupan yang signifikan, dengan perubahan negatif sekitar -11,07%. Ini menunjukkan penurunan harga saham yang cukup besar bagi NFLX selama periode tersebut.

## 7. Daily Risk and Return Analysis

Dalam analisis ini, kita akan menghitung imbal hasil rata-rata harian dan standar deviasi dari imbal hasil harian untuk setiap saham. Standar deviasi akan menjadi representasi risiko, sementara imbal hasil rata-rata harian mewakili imbal hasil yang diharapkan.

In [47]:
# Menghitung Tingkat daily return
daily_returns = pivot_data.pct_change().dropna()
daily_returns.head()

Ticker,AAPL,GOOG,MSFT,NFLX
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2023-02-08,-0.017653,-0.074417,-0.003102,0.01069
2023-02-09,-0.006912,-0.0454,-0.01166,-0.011804
2023-02-10,0.000928,-0.006285,-0.001972,-0.041766
2023-02-13,0.018807,0.001476,0.031243,0.032272
2023-02-14,-0.004225,-0.000526,0.003133,0.003876


In [48]:
# Menghitung Kembali Rerata daily return dan Standar Deviasi dari risk
rata_daily_return = daily_returns.mean()
risk = daily_returns.std()

In [49]:
# Membuat Dataframe untuk Plot
risk_return_df = pd.DataFrame({'Risk': risk, 'Average Daily Return': rata_daily_return})
risk_return_df


Unnamed: 0_level_0,Risk,Average Daily Return
Ticker,Unnamed: 1_level_1,Unnamed: 2_level_1
AAPL,0.014152,0.001991
GOOG,0.02071,-6.7e-05
MSFT,0.017881,0.002606
NFLX,0.022481,-0.001676


In [50]:
# Membuat Plot Visualisasi
fig5 = go.Figure()

# Membuat Scatter Plot
fig5.add_trace(go.Scatter(
    x=risk_return_df['Risk'],
    y=risk_return_df['Average Daily Return'],
    mode='markers+text',
    text=risk_return_df.index,
    textposition="top center",
    marker=dict(size=10)
))

# Update layout
fig5.update_layout(
    title='Risk vs. Return Analysis',
    xaxis_title='Risk (Standard Deviation)',
    yaxis_title='Rata-rata Daily Return',
    showlegend=False
)

# Show the plot
fig5.show()

**Interpretasi :**

1. **AAPL** menunjukkan risiko terendah dan memiliki tingkat pengembalian harian yang positif, mengindikasikan investasi yang lebih stabil dengan pengembalian yang konsisten.

2. **GOOG** memiliki volatilitas yang lebih tinggi dibandingkan AAPL dan, secara rata-rata, memiliki pengembalian harian yang sedikit negatif, menunjukkan investasi yang lebih berisiko dan kurang menguntungkan selama periode tersebut.

3. **MSFT** menunjukkan risiko yang moderat dengan tingkat pengembalian harian tertinggi, mengindikasikan investasi yang potensial lebih menguntungkan, meskipun dengan volatilitas yang lebih tinggi dibandingkan AAPL.

4. **NFLX** menunjukkan risiko tertinggi dan memiliki pengembalian harian yang negatif, menunjukkan bahwa saham ini merupakan investasi paling volatile dan kurang menguntungkan di antara saham-saham tersebut selama periode yang dianalisis.

Secara singkat, AAPL dianggap sebagai investasi yang lebih stabil dengan pengembalian yang konsisten, sementara NFLX dianggap sebagai investasi yang paling berisiko dengan pengembalian yang kurang menguntungkan. 




## 8. Kesimpulan

1. **Tren dan Volatilitas Saham**: Setiap saham menunjukkan tren unik selama periode yang diamati, dengan beberapa saham seperti AAPL dan MSFT menunjukkan tren naik yang stabil, sementara saham lain seperti NFLX menunjukkan fluktuasi harga yang lebih besar. Volatilitas yang lebih tinggi dalam harga saham dapat menarik bagi investor yang mencari potensi keuntungan cepat, tetapi juga membawa risiko yang lebih tinggi.

2. **Perbandingan Harga Saham**: MSFT dan NFLX diperdagangkan pada level harga yang lebih tinggi daripada AAPL dan GOOG, yang mungkin mencerminkan persepsi pasar terhadap kinerja atau potensi pertumbuhan perusahaan yang lebih besar. Meskipun harga yang lebih tinggi dapat mengindikasikan investasi yang lebih mahal, hal ini juga dapat menunjukkan peluang pertumbuhan yang lebih besar.

3. **Korelasi Antara Saham**: Korelasi antara saham-saham menunjukkan berbagai tingkat hubungan positif antara harga saham. Sebagai contoh, AAPL dan MSFT tampak memiliki korelasi positif yang relatif tinggi, yang dapat menjadi faktor penting dalam diversifikasi portofolio investasi.

4. **Analisis Risiko dan Pengembalian Harian**: AAPL menunjukkan risiko terendah dan pengembalian harian yang positif, sementara NFLX memiliki risiko tertinggi dan pengembalian harian negatif. Ini mengindikasikan bahwa AAPL dianggap sebagai investasi yang lebih stabil dan konsisten, sementara NFLX dianggap sebagai investasi yang lebih berisiko dan kurang menguntungkan.

Kesimpulannya, berdasarkan analisis yang dilakukan, kita dapat menyimpulkan bahwa portofolio investasi dapat dirancang dengan mempertimbangkan faktor-faktor seperti tren harga saham, volatilitas, korelasi antara saham, dan tingkat risiko dan pengembalian harian. 
