## Vietnam Stock Market
 Thị trường chứng khoán Việt Nam đã tồn tại và phát triển suốt hơn 20 năm qua và đã trải qua nhiều thăng trầm. Năm 2018, thị trường đạt đỉnh lịch sử 1200 điểm để rồi 3 năm sau 2021, thị tường vượt lần lượt các mốc 120, 1400 và 1500. Với những kì vọng trước mắt thị trường được kì vọng sẽ vượt 1800 điểm vào năm 2022!





### Algorithmic Trading
Với sự phát triển của công nghệ và sự hỗ trợ của cộng động, trading bằng máy đã trở nên dễ dàng hơn bao giờ hết. Notebook này là mốc bắt đầu của một chuỗi chương trình với hy vọng sẽ đóng góp một chút công sức của mình vào sự páht triển của ngành công nghiệp trị giá rất lớn này.


#### Some words
Trước khi bắt đầu bất cứ một chương trình nào, chúng ta cần đánh giá về tiềm năng và tình khả thi của dự án. Hiện tại lượng data cung cấp cho thị trường chứng khoán Việt Nam vẫn còn rất hạn chế.
Về data, đơn vị cung cấp có VNDirect và SSI là 2 công ty chứng khoán lớn công khai cung cấp dữ liệu. Hoạt động Web scaping cũng có thể thực hiện với CafeF. 
Về intraday data, chúng ta có thể sử dụng data từ các đơn vị cung cấp API nước ngoài (mặc dù delay 15' và không đủ hết những mã chứng khoán tại thị trường Việt Nam, tuy vậy vẫn có thể áp dụng.



Về chương trình này, để tiết kiệm thời gian và công sức, mình xin sử dụng package vnquant của anh Phạm Đình Khánh, một package rất chính xác lấy nguồn data từ VNDirect và CafeF. Ngoài ra, mình đã cố gắng tìm những nguồn data miễn phí nhiều nhất có thể dành cho thị trường Việt Nam.



# Data Collection

Source data from [vnquant](https://github.com/phamdinhkhanh/vnquant) 
Another way is to use the [investpy](https://investpy.readthedocs.io), however there are lots of missing data for Vietnam

In order to run this program, please install requirements


In [109]:
#example of downloading via notebook
#Download mplfinance for plotting candlestick
!pip install mplfinance

You should consider upgrading via the '/Users/haquochung/opt/anaconda3/bin/python3 -m pip install --upgrade pip' command.[0m


In [None]:
#insert libraries and packages
import pandas as pd
import vnquant.DataLoader as dl
import datetime
import investpy
import matplotlib.pyplot as plt
import mplfinance as mpf

In [None]:
#create a function for collect price data and store it as a csv file

def load_data(symbol):
    start = '2018-01-01'
    
    #you can fix the time frame by using timedelta function of datetime library
    now = datetime.datetime.now()
    end = now.strftime("%Y-%m-%d")
    loader = dl.DataLoader(symbol, start,end, data_source='VND', minimal=True)
    data = loader.download()
    close_data = data['close'].dropna()
    
    
    #to store data remove the '#' on the following line
    #csv_file = close_data.to_csv(f'Data/ClosePrice/{symbol} historical since {start}', index=True)

    return data

In [None]:
#Use TCB as an example
data = load_data('TCB')
data

### Ploting
After collecting the data, we can plot price in many ways.
We can use package [mplfinance](https://github.com/matplotlib/mplfinance) for candlestick, however we can not interact with it.
Another way is to use [plotly](https://plotly.com) (vnquant do have a function to plot the candle chart by using plotly)


In [None]:
def plot_price(symbol, range):
    #format datetime
    now = datetime.datetime.now()
    end = now.strftime("%Y-%m-%d")
    begin = now - datetime.timedelta(range) #adjust timeframe by adjusting time delta
    start = begin.strftime("%Y-%m-%d")

    #extract data from vnquant
    loader = dl.DataLoader(symbol, start, end, data_source='VND', minimal=True)
    pricedata = loader.download()
    
    #format the data for the mplfinance
    stock = pricedata.copy()
    stock.reset_index(inplace = True)

    dailyInfo = pd.DataFrame( columns =['Date', 'Open', 'High', 'Low', 'Close', 'Volume'])
    dailyInfo['Date'] = stock['date']
    dailyInfo['Open'] = stock['open']
    dailyInfo['High'] = stock['high']
    dailyInfo['Low'] = stock['low']
    dailyInfo['Close'] = stock['close']
    dailyInfo['Volume'] = stock['volume']
    dailyInfo.set_index('Date', inplace= True)
    
    #plot candlestick
    mav = (5,15)
    fig, axes = mpf.plot(dailyInfo, type='candle', volume=True, mav=mav, returnfig=True, figsize = (12,6))
    title = ('%s | Candle chart in %r days') % (symbol, range)
    axes[0].set_title(title)
    axes[0].legend(mav)
    plt.show()

    
    return dailyInfo

In [None]:
#Change timeframe by proving in range

symbol = input('Enter a symbol: ')
symbol = symbol.upper()

timeframe = input('Please choose the timeframe: ')
timeframe = int(timeframe)


stock = plot_price(symbol, timeframe )

In [None]:
!pip install chart_studio

In [None]:
#interactive plot
import cufflinks as cf
df=cf.datagen.ohlc()
qf=cf.QuantFig(df,title='First Quant Figure',legend='top',name='GS')
qf.add_bollinger_bands()
qf.iplot()
df

#### Symbol ratio and information

Some of the information you can extract from the library [investpy](https://investpy.readthedocs.io) or write some code to get them.

Some of the basic data you want to have:

    - PE
    - Capitalization

In [185]:
stock = investpy.get_stock_information(stock = 'TCB',country = 'vietnam')
stock

Unnamed: 0,Stock Symbol,Prev. Close,Todays Range,Revenue,Open,52 wk Range,EPS,Volume,Market Cap,Dividend (Yield),Average Vol. (3m),P/E Ratio,Beta,1-Year Change,Shares Outstanding,Next Earnings Date
0,TCB,52200.0,"51,500-52,000",26650000000000.0,51700.0,"38,000-58,600",5140.35,6543700.0,181160000000000.0,N/A(N/A),11903468.0,10.27,1.3,33.33%,3510915000.0,02/03/2022


In [190]:
stock['P/E Ratio']

0    10.27
Name: P/E Ratio, dtype: float64

### Get index data

Stock indices, collections of stocks designed to represent or reflect the performance of a stock market, country, region, industry, or category of stocks, are commonplace in investing. Investors frequently use indices to track and measure investment performance, and passive investment strategies that seek to replicate the indices themselves have become hugely influential in recent decades. (Seeking Alpha)

Therefore, collecing the index data and make comparision between the stock and the index is a must-have process. 
In Vietnam, there are a few major indices that are usually used by many people. For example, Vnindex is the index of the Hose exchange, HNX is the index of the HNX exchange ,VN30 is the index of the thirty biggest company in Hose, VN100, HNX30, etc.

In [174]:
#create a function to get the index data

def load_index_data(x):
    end = datetime.datetime.now()
    index =investpy.get_index_historical_data(x,country='vietnam',from_date='01/01/2015',to_date=end.strftime('%d/%m/%Y'))
    index = pd.DataFrame(index)
    return index

In [182]:
#VN is VNindex
#VN 30 is VN30 index
#VN100 is VN100 index
#HNX is HNX index
#HNX 30 is HNX30 index
VN =load_index_data('VN')
VN

Unnamed: 0_level_0,Open,High,Low,Close,Volume,Currency
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015-01-05,545.43,549.22,543.78,544.45,95950,VND
2015-01-06,539.08,550.11,538.82,549.66,112316,VND
2015-01-07,548.44,555.83,548.44,552.05,111705,VND
2015-01-08,553.49,556.80,552.15,553.47,77867,VND
2015-01-09,555.53,570.52,555.53,569.73,107475,VND
...,...,...,...,...,...,...
2022-02-14,1501.71,1501.71,1471.96,1471.96,810716,VND
2022-02-15,1471.96,1495.56,1470.06,1492.75,606423,VND
2022-02-16,1492.75,1499.50,1486.68,1492.10,702522,VND
2022-02-17,1492.10,1507.99,1492.10,1507.99,615794,VND
