In [1]:
!pip install -U vnstock



In [2]:
from vnstock import Listing
from vnstock import Quote
import time
import logging
import numpy as np
listing = Listing()

In [3]:
# Log configurations
logging.basicConfig(
    filename='download_log.log',
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S',
    force=True
)

In [4]:
# List all stocks
all_stocks = listing.symbols_by_exchange()
all_stocks

Unnamed: 0,symbol,exchange,type,organ_short_name,organ_name,product_grp_id
0,YTC,UPCOM,STOCK,XNK Y tế TP.HCM,Công ty Cổ phần Xuất nhập khẩu Y tế Thành phố ...,UPX
1,YEG,HSX,STOCK,Tập đoàn Yeah1,Công ty Cổ phần Tập đoàn Yeah1,STO
2,YBM,HSX,STOCK,Khoáng sản CN Yên Bái,Công ty Cổ phần Khoáng sản Công nghiệp Yên Bái,STO
3,YBC,UPCOM,STOCK,Xi măng và Khoáng sản Yên Bái,Công ty Cổ phần Xi măng và Khoáng sản Yên Bái,UPX
4,XPH,UPCOM,STOCK,Xà phòng Hà Nội,Công ty Cổ phần Xà phòng Hà Nội,UPX
...,...,...,...,...,...,...
3055,41I1F7000,DELISTED,FU,41I1F7000 - HĐTL,41I1F7000 - HĐTL,FIO
3056,41BAG6000,HNX,FU,10-year Government Bond Futures 062026,10-year Government Bond Futures 062026,FBX
3057,41BAG3000,HNX,FU,10-year Government Bond Futures 032026,10-year Government Bond Futures 032026,FBX
3058,41B5G6000,HNX,FU,5-year Government Bond Futures 062026,5-year Government Bond Futures 062026,FBX


In [5]:
# Get dataframe for Stock
stock_df = all_stocks[all_stocks['type'] == 'STOCK']
stock_df

Unnamed: 0,symbol,exchange,type,organ_short_name,organ_name,product_grp_id
0,YTC,UPCOM,STOCK,XNK Y tế TP.HCM,Công ty Cổ phần Xuất nhập khẩu Y tế Thành phố ...,UPX
1,YEG,HSX,STOCK,Tập đoàn Yeah1,Công ty Cổ phần Tập đoàn Yeah1,STO
2,YBM,HSX,STOCK,Khoáng sản CN Yên Bái,Công ty Cổ phần Khoáng sản Công nghiệp Yên Bái,STO
3,YBC,UPCOM,STOCK,Xi măng và Khoáng sản Yên Bái,Công ty Cổ phần Xi măng và Khoáng sản Yên Bái,UPX
4,XPH,UPCOM,STOCK,Xà phòng Hà Nội,Công ty Cổ phần Xà phòng Hà Nội,UPX
...,...,...,...,...,...,...
3040,AAS,UPCOM,STOCK,Chứng khoán SmartInvest,Công ty Cổ phần Chứng khoán SmartInvest,UPX
3041,AAM,HSX,STOCK,Thủy sản Mekong,Công ty Cổ Phần Thủy Sản MeKong,STO
3042,AAH,UPCOM,STOCK,Than Hợp Nhất,Công ty Cổ phần Hợp Nhất,UPX
3043,AAA,HSX,STOCK,An Phát Bioplastics,Công ty Cổ phần Nhựa An Phát Xanh,STO


In [6]:
# Reset index for dataframe
stock_df = stock_df.reset_index().drop('index', axis=1)
stock_df

Unnamed: 0,symbol,exchange,type,organ_short_name,organ_name,product_grp_id
0,YTC,UPCOM,STOCK,XNK Y tế TP.HCM,Công ty Cổ phần Xuất nhập khẩu Y tế Thành phố ...,UPX
1,YEG,HSX,STOCK,Tập đoàn Yeah1,Công ty Cổ phần Tập đoàn Yeah1,STO
2,YBM,HSX,STOCK,Khoáng sản CN Yên Bái,Công ty Cổ phần Khoáng sản Công nghiệp Yên Bái,STO
3,YBC,UPCOM,STOCK,Xi măng và Khoáng sản Yên Bái,Công ty Cổ phần Xi măng và Khoáng sản Yên Bái,UPX
4,XPH,UPCOM,STOCK,Xà phòng Hà Nội,Công ty Cổ phần Xà phòng Hà Nội,UPX
...,...,...,...,...,...,...
1716,AAS,UPCOM,STOCK,Chứng khoán SmartInvest,Công ty Cổ phần Chứng khoán SmartInvest,UPX
1717,AAM,HSX,STOCK,Thủy sản Mekong,Công ty Cổ Phần Thủy Sản MeKong,STO
1718,AAH,UPCOM,STOCK,Than Hợp Nhất,Công ty Cổ phần Hợp Nhất,UPX
1719,AAA,HSX,STOCK,An Phát Bioplastics,Công ty Cổ phần Nhựa An Phát Xanh,STO


In [7]:
# Write to csv
stock_df.to_csv('./data/company_info.csv')

In [8]:
company_name = stock_df['symbol'].to_numpy()
company_name

array(['YTC', 'YEG', 'YBM', ..., 'AAH', 'AAA', 'A32'], dtype=object)

In [9]:
company_name = stock_df['symbol'].to_numpy()
company_name

array(['YTC', 'YEG', 'YBM', ..., 'AAH', 'AAA', 'A32'], dtype=object)

In [10]:
# Number of companies to collect
len(company_name)

1721

In [11]:
# Get stock for each company, and write each result to a CSV file
for company in company_name:
    attempts = 3
    for i in range(attempts):
        try:
            quote = Quote(symbol=company, source='VCI')
            df = quote.history(start='2012-01-01', end='2025-10-15', interval='1D')
            df.to_csv(f"./data/stock_data_{company}.csv")
            logging.info(f"Successfully downloaded and saved data for {company}.")
            
            time.sleep(1)
            break
    
        except Exception as e:
            if "VCI" in str(e) and "Vui lòng thử lại sau" in str(e):
                wait_time = 60 
                logging.warning(f"Rate limit hit for {company}. Waiting for {wait_time} seconds before retrying... ({i+1}/{attempts})")
                time.sleep(wait_time)
            else:
                logging.error(f"An unexpected error occurred for {company}: {e}")
                break

In [15]:
# Number of companies collected
!ls -1 ./data | wc -l

1688
