In [1]:
import pandas as pd
from vnstock import Vnstock

Phiên bản Vnstock 3.2.0 đã có mặt, vui lòng cập nhật với câu lệnh : `pip install vnstock --upgrade`.
Lịch sử phiên bản: https://vnstocks.com/docs/tai-lieu/lich-su-phien-ban
Phiên bản hiện tại 3.1.0.2

In [2]:
stock = Vnstock().stock()

2025-03-21 00:03:53 - vnstock.common.vnstock - INFO - Mã chứng khoán không được chỉ định, chương trình mặc định sử dụng VN30F1M


In [45]:
df = stock.listing.symbols_by_industries()
df = df[['symbol', 'organ_name', 'icb_name2', 'icb_name3', 'icb_name4']]
df.to_csv('../data/all_info.csv', index=False)

# 1. Cổ phiếu

## Lợi ích 

- Lợi nhuận từ chênh lệch giá: Nếu mua ở giá thấp và bán ở giá cao.
- Cổ tức: Một phần lợi nhuận công ty chia cho cổ đông.

## Rủi ro

- Biến động giá: Giá cổ phiếu có thể tăng hoặc giảm mạnh do thị trường.
- Rủi ro doanh nghiệp: Công ty có thể gặp khó khăn, phá sản, giảm lợi nhuận, giảm cổ tức.
- Rủi ro thanh khoản: Cổ phiếu không thể bán ra với giá mong muốn.

In [3]:
# 30 công ty có vốn hóa lớn nhất và thanh khoản cao nhất 
vn30 = stock.listing.symbols_by_group('VN30').to_list()

In [20]:
vn30

['ACB',
 'BCM',
 'BID',
 'BVH',
 'CTG',
 'FPT',
 'GAS',
 'GVR',
 'HDB',
 'HPG',
 'LPB',
 'MBB',
 'MSN',
 'MWG',
 'PLX',
 'SAB',
 'SHB',
 'SSB',
 'SSI',
 'STB',
 'TCB',
 'TPB',
 'VCB',
 'VHM',
 'VIB',
 'VIC',
 'VJC',
 'VNM',
 'VPB',
 'VRE']

In [30]:
# ICB (Industry Classification Benchmark) dùng để phân loại các công ty niêm yết trên thị trường chứng khoán theo ngành nghề của họ
df_icb = stock.listing.symbols_by_industries()
df_icb = df_icb[df_icb['symbol'].isin(vn30)]
df_icb = df_icb[['symbol', 'organ_name', 'icb_name2', 'icb_name3', 'icb_name4']]
df_icb.to_csv('../data/vn30_info.csv', index=False)
df_icb 

Unnamed: 0,symbol,organ_name,icb_name2,icb_name3,icb_name4
1,ACB,Ngân hàng Thương mại Cổ phần Á Châu,Ngân hàng,Ngân hàng,Ngân hàng
62,BID,Ngân hàng Thương mại Cổ phần Đầu tư và Phát tr...,Ngân hàng,Ngân hàng,Ngân hàng
138,FPT,Công ty Cổ phần FPT,Công nghệ Thông tin,Phần mềm & Dịch vụ Máy tính,Phần mềm
315,CTG,Ngân hàng Thương mại Cổ phần Công thương Việt Nam,Ngân hàng,Ngân hàng,Ngân hàng
369,BCM,Tổng Công ty Đầu tư và Phát triển Công nghiệp ...,Bất động sản,Bất động sản,Bất động sản
389,HPG,Công ty Cổ phần Tập đoàn Hòa Phát,Tài nguyên Cơ bản,Kim loại,Thép và sản phẩm thép
417,BVH,Tập đoàn Bảo Việt,Bảo hiểm,Bảo hiểm nhân thọ,Bảo hiểm nhân thọ
557,GAS,Tổng Công ty Khí Việt Nam - Công ty Cổ phần,"Điện, nước & xăng dầu khí đốt",Nước & Khí đốt,Phân phối xăng dầu & khí đốt
653,MBB,Ngân hàng Thương mại Cổ phần Quân đội,Ngân hàng,Ngân hàng,Ngân hàng
670,LPB,Ngân hàng Thương mại Cổ phần Lộc Phát Việt Nam,Ngân hàng,Ngân hàng,Ngân hàng


In [57]:
# Lấy dữ liệu lịch sử của 30 công ty VN30
for symbol in vn30:
	df = stock.quote.history(symbol=symbol, start='2020-01-01', end='2024-12-31', interval='1D')
	df.to_csv(f'../data/stock/{symbol}.csv', index=False)

In [17]:
df_volume = pd.DataFrame({'time': pd.date_range(start='2020-01-01', end='2024-12-31', freq='D')})
df_high = pd.DataFrame({'time': pd.date_range(start='2020-01-01', end='2024-12-31', freq='D')})
df_low = pd.DataFrame({'time': pd.date_range(start='2020-01-01', end='2024-12-31', freq='D')})

for symbol in vn30:
	df = pd.read_csv(f'../data/stock/{symbol}.csv')
	df['time'] = pd.to_datetime(df['time'])
	df_volume = pd.merge(df_volume, df[['time', 'volume']], on='time', how='left').rename(columns={'volume': symbol})
	df_high = pd.merge(df_high, df[['time', 'high']], on='time', how='left').rename(columns={'high': symbol})
	df_low = pd.merge(df_low, df[['time', 'low']], on='time', how='left').rename(columns={'low': symbol})

df_volume.to_csv('../data/vn30/volume.csv', index=False)
df_high.to_csv('../data/vn30/high.csv', index=False)
df_low.to_csv('../data/vn30/low.csv', index=False)

# 2023

In [23]:
for symbol in vn30:
	df_time = pd.DataFrame({'time': pd.date_range(start='2023-01-01', end='2024-12-31', freq='D')})
	df = stock.quote.history(symbol=symbol, start='2023-01-01', end='2024-12-31', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_time = pd.merge(df_time, df[['time', 'high', 'low']], on='time', how='left')
	df_time.to_csv(f'../data/2023/vn30/{symbol}.csv', index=False)

## 2024

In [24]:
df_volume = pd.DataFrame({'time': pd.date_range(start='2024-01-01', end='2024-12-31', freq='D')})
df_high = pd.DataFrame({'time': pd.date_range(start='2024-01-01', end='2024-12-31', freq='D')})
df_low = pd.DataFrame({'time': pd.date_range(start='2024-01-01', end='2024-12-31', freq='D')})
df_close = pd.DataFrame({'time': pd.date_range(start='2024-01-01', end='2024-12-31', freq='D')})

for symbol in vn30:
	df = stock.quote.history(symbol=symbol, start='2024-01-01', end='2024-12-31', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_volume = pd.merge(df_volume, df[['time', 'volume']], on='time', how='left').rename(columns={'volume': symbol})
	df_high = pd.merge(df_high, df[['time', 'high']], on='time', how='left').rename(columns={'high': symbol})
	df_low = pd.merge(df_low, df[['time', 'low']], on='time', how='left').rename(columns={'low': symbol})
	df_close = pd.merge(df_close, df[['time', 'close']], on='time', how='left').rename(columns={'close': symbol})

df_volume.to_csv('../data/2024/volume.csv', index=False)
df_high.to_csv('../data/2024/high.csv', index=False)
df_low.to_csv('../data/2024/low.csv', index=False)
df_close.to_csv('../data/2024/close.csv', index=False)

In [None]:
for symbol in vn30:
	df_time = pd.DataFrame({'time': pd.date_range(start='2024-01-01', end='2024-12-31', freq='D')})
	df = stock.quote.history(symbol=symbol, start='2024-01-01', end='2024-12-31', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_time = pd.merge(df_time, df[['time', 'high', 'low']], on='time', how='left')
	df_time.to_csv(f'../data/2024/vn30/{symbol}.csv', index=False)

In [4]:
for symbol in vn30:
	df_time = pd.DataFrame({'time': pd.date_range(start='2024-01-01', end='2024-12-31', freq='D')})
	df = stock.quote.history(symbol=symbol, start='2024-01-01', end='2024-12-31', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_time = pd.merge(df_time, df[['time', 'high', 'low', 'volume']], on='time', how='left')
	df_time.to_csv(f'../data/2024/vn30_train/{symbol}.csv', index=False)

## 2025

In [25]:
df_volume = pd.DataFrame({'time': pd.date_range(start='2025-01-01', end='2025-02-28', freq='D')})
df_high = pd.DataFrame({'time': pd.date_range(start='2025-01-01', end='2025-02-28', freq='D')})
df_low = pd.DataFrame({'time': pd.date_range(start='2025-01-01', end='2025-02-28', freq='D')})
df_close = pd.DataFrame({'time': pd.date_range(start='2025-01-01', end='2025-02-28', freq='D')})

for symbol in vn30:
	df = stock.quote.history(symbol=symbol, start='2025-01-01', end='2025-02-28', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_volume = pd.merge(df_volume, df[['time', 'volume']], on='time', how='left').rename(columns={'volume': symbol})
	df_high = pd.merge(df_high, df[['time', 'high']], on='time', how='left').rename(columns={'high': symbol})
	df_low = pd.merge(df_low, df[['time', 'low']], on='time', how='left').rename(columns={'low': symbol})
	df_close = pd.merge(df_close, df[['time', 'close']], on='time', how='left').rename(columns={'close': symbol})

df_volume.to_csv('../data/2025/volume.csv', index=False)
df_high.to_csv('../data/2025/high.csv', index=False)
df_low.to_csv('../data/2025/low.csv', index=False)
df_close.to_csv('../data/2025/close.csv', index=False)

In [28]:
for symbol in vn30:
	df_time = pd.DataFrame({'time': pd.date_range(start='2025-01-01', end='2025-02-28', freq='D')})
	df = stock.quote.history(symbol=symbol, start='2025-01-01', end='2025-02-28', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_time = pd.merge(df_time, df[['time', 'high', 'low']], on='time', how='left')
	df_time.to_csv(f'../data/2025/vn30/{symbol}.csv', index=False)

In [5]:
for symbol in vn30:
	df_time = pd.DataFrame({'time': pd.date_range(start='2025-01-01', end='2025-02-28', freq='D')})
	df = stock.quote.history(symbol=symbol, start='2025-01-01', end='2025-02-28', interval='1D')
	df['time'] = pd.to_datetime(df['time'])
	df_time = pd.merge(df_time, df[['time', 'high', 'low', 'volume']], on='time', how='left')
	df_time.to_csv(f'../data/2025/vn30_test/{symbol}.csv', index=False)

# 2. Hợp đồng tương lai

Hợp đồng tương lai (Futures Contract) là một thỏa thuận giữa hai bên để mua hoặc bán một tài sản (cổ phiếu, chỉ số chứng khoán, hàng hóa, v.v.) tại một mức giá xác định vào một ngày nhất định trong tương lai.

## Lợi ích

- Đòn bẩy: Không cần bỏ toàn bộ số tiền mà chỉ cần ký quỹ một phần. Nếu thị trường đi đúng hướng, lợi nhuận sẽ lớn.
- Phòng ngừa rủi ro: Nếu lo ngại thị trường giảm, có thể bán hợp đồng tương lai để bảo vệ giá cổ phiếu.
- Thanh khoản cao - Dễ dàng mua bán.

## Rủi ro

- Đòn bẩy khuếch đại cả lợi nhuận và thua lỗ.
- Biến động giá: Giá hợp đồng tương lai có thể tăng hoặc giảm mạnh do thị trường.
- Do tính chất biến động cao, nhà đầu tư phải theo dõi thị trường thường xuyên để quản lý vị thế.

In [None]:
for index in ['VN30', 'VN30F1M', 'VN30F2M']:
	df = stock.quote.history(symbol=index, start='2020-01-01', end='2024-12-31', interval='1D')
	df.to_csv(f'../data/future/{index}.csv', index=False)

In [21]:
for index in ['VNINDEX', 'HNXINDEX', 'UPCOMINDEX']:
	df = stock.quote.history(symbol=index, start='2020-01-01', end='2024-12-31', interval='1D')
	df.to_csv(f'../data/index/{index}.csv', index=False)
	df = stock.quote.history(symbol=index, start='2024-01-01', end='2024-12-31', interval='1D')
	df.to_csv(f'../data/2024/index/{index}.csv', index=False)
	df = stock.quote.history(symbol=index, start='2025-01-01', end='2025-02-28', interval='1D')
	df.to_csv(f'../data/2025/index/{index}.csv', index=False)

# 3. Trái phiếu

Trái phiếu là một loại chứng khoán xác nhận khoản nợ của tổ chức phát hành đối với người sở hữu.

# 4. Chứng quyền

Chứng quyền có bảo đảm (Covered Warrant - CW) là một loại chứng khoán do công ty chứng khoán phát hành, cho phép người sở hữu quyền mua hoặc bán chứng khoán cơ sở (thường là cổ phiếu) với giá xác định trước trong một khoảng thời gian nhất định.

# 5. Chỉ số tài chính

In [1]:
from vnstock import Finance

In [19]:
for company in vn30:
	df = Finance(symbol=company).ratio(period='quarter').reset_index()
	df = df.head(40)
	df.to_csv(f'../data/vn30/metric/{company}.csv', index=False)

In [14]:
for company in vn30:
	df = Finance(symbol=company).balance_sheet().reset_index().head(10)
	df.to_csv(f'../data/vn30/profile/{company}.csv', index=False)

# 6. Thông tin công ty

In [6]:
from vnstock import Company

for company in vn30:
	df = Company(symbol=company).overview()
	df.to_csv(f'../data/vn30/overview/{company}.csv', index=False)