In [2]:
import yfinance as yf
import pandas as pd
import json
import time

# Danh sách các mã cổ phiếu của các công ty
companies = {
    #Ngân hàng
    "MB Bank": "MBB",
    "Vietcombank": "VCB",
    "VietinBank": "CTG",
    "BIDV": "BID",
    "Techcombank": "TCB",
    "ACB": "ACB",
    "TPBank": "TPB",
    "VPBank": "VPB",
    "HDBank": "HDB",
    "Sacombank": "STB",
    "SeABank": "SSB",
    "OCB": "OCB",
    "LienVietPostBank": "LPB",
    "MSB": "MSB",
    "Nam A Bank": "NAB",
    "Bac A Bank": "BAB",
    "Eximbank": "EIB",
    "Nội Bài Bank (NB Bank)": "NBB",
    "Công ty tài chính cổ phần Điện lực (EVNFinance)": "EVF"
}

max_retries = 5
    
for company_name, ticker_symbol in companies.items():
    print(f"Đang xử lý: {company_name} ({ticker_symbol})")
    
    success = False
    retries = 0
    while not success and retries < max_retries:
        try:
            # Lấy dữ liệu từ 2019 đến 2024 từ mã cổ phiếu ban đầu
            ticker = yf.Ticker(ticker_symbol)
            data = ticker.history(start="2019-01-01", end="2024-12-31", interval="1d").iloc[:, :5]
            # Kiểm tra nếu dữ liệu có ít hơn 1000 dòng
            if len(data) < 1000:
                print(f"⚠️ Dữ liệu của {company_name} ({ticker_symbol}) ít hơn 1000 dòng. Thử mã với đuôi .VN.")
                ticker_symbol_vn = ticker_symbol + ".VN"
                ticker = yf.Ticker(ticker_symbol_vn)
                try:
                    data_vn = ticker.history(start="2019-01-01", end="2024-12-31", interval="1d")
                except Exception as e:
                    print(f"❌ Lỗi khi lấy dữ liệu cho {company_name} : {e}")

                # Gộp dữ liệu từ mã gốc và mã .VN nếu có dữ liệu
                if data_vn is not None and not data_vn.empty:
                    print(f"✅ Đã tìm thấy dữ liệu cho {company_name} với mã {ticker_symbol}.VN.")
                    data = pd.concat([data, data_vn.iloc[:, :5]])
                    data = data.loc[~data.index.duplicated(keep='last')]  # Loại bỏ các dòng trùng lặp
                    data_vn = None
    
            # Dữ liệu không trống, tiếp tục dù số dòng ít
            if data.empty:
                print(f"⚠️ Không có dữ liệu cho {company_name} ({ticker_symbol}). Bỏ qua.")
                break

            # Làm sạch dữ liệu, chuyển định dạng cột Date (bỏ giờ và timezone)
            data = data.reset_index()
            data['Date'] = pd.to_datetime(data['Date'], utc=True).dt.date
            data = data.set_index('Date')

            # Lưu vào file CSV
            filename = f"{company_name}_stock_data.csv"
            data.to_csv(filename)

            print(f"✅ Đã lưu dữ liệu cho {company_name} ({len(data)} dòng).")
            data = None
            success = True  # Gắn cờ thành công
    
        except Exception as e:
            retries += 1
            print(f"❌ Lỗi khi lấy dữ liệu cho {company_name} (thử lại {retries}/{max_retries}): {e}")
            if retries >= max_retries:
                print(f"⚠️ Đã thử {max_retries} lần mà không thành công. Bỏ qua {company_name}.")
            time.sleep(2)  # Delay ngắn giữa các lần thử lại
    
    time.sleep(3)  # Delay giữa các công ty
    
# Lưu danh sách công ty hợp lệ và không hợp lệ
print("\n✅ Hoàn thành.")

Đang xử lý: MB Bank (MBB)
✅ Đã lưu dữ liệu cho MB Bank (1509 dòng).
Đang xử lý: Vietcombank (VCB)
⚠️ Dữ liệu của Vietcombank (VCB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho Vietcombank với mã VCB.VN.
✅ Đã lưu dữ liệu cho Vietcombank (2289 dòng).


$CTG: possibly delisted; no timezone found


Đang xử lý: VietinBank (CTG)
⚠️ Dữ liệu của VietinBank (CTG) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho VietinBank với mã CTG.VN.
✅ Đã lưu dữ liệu cho VietinBank (1495 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])
$BID: possibly delisted; no timezone found


Đang xử lý: BIDV (BID)
⚠️ Dữ liệu của BIDV (BID) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho BIDV với mã BID.VN.
✅ Đã lưu dữ liệu cho BIDV (1499 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])


Đang xử lý: Techcombank (TCB)
⚠️ Dữ liệu của Techcombank (TCB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho Techcombank : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho Techcombank (786 dòng).
Đang xử lý: ACB (ACB)
✅ Đã lưu dữ liệu cho ACB (1509 dòng).
Đang xử lý: TPBank (TPB)
✅ Đã lưu dữ liệu cho TPBank (1509 dòng).
Đang xử lý: VPBank (VPB)
⚠️ Dữ liệu của VPBank (VPB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho VPBank : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho VPBank (790 dòng).
Đang xử lý: HDBank (HDB)
✅ Đã lưu dữ liệu cho HDBank (1509 dòng).


$STB: possibly delisted; no timezone found


Đang xử lý: Sacombank (STB)
⚠️ Dữ liệu của Sacombank (STB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho Sacombank với mã STB.VN.
✅ Đã lưu dữ liệu cho Sacombank (356 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])


Đang xử lý: SeABank (SSB)
✅ Đã lưu dữ liệu cho SeABank (1509 dòng).
Đang xử lý: OCB (OCB)


$OCB: possibly delisted; no price data found  (1d 2019-01-01 -> 2024-12-31)


⚠️ Dữ liệu của OCB (OCB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho OCB với mã OCB.VN.
✅ Đã lưu dữ liệu cho OCB (977 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])


Đang xử lý: LienVietPostBank (LPB)


$LPB: possibly delisted; no price data found  (1d 2019-01-01 -> 2024-12-31)


⚠️ Dữ liệu của LienVietPostBank (LPB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho LienVietPostBank với mã LPB.VN.
✅ Đã lưu dữ liệu cho LienVietPostBank (1036 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])


Đang xử lý: MSB (MSB)
✅ Đã lưu dữ liệu cho MSB (1509 dòng).
Đang xử lý: Nam A Bank (NAB)


$NAB: possibly delisted; no price data found  (1d 2019-01-01 -> 2024-12-31)


⚠️ Dữ liệu của Nam A Bank (NAB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho Nam A Bank với mã NAB.VN.
✅ Đã lưu dữ liệu cho Nam A Bank (208 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])


Đang xử lý: Bac A Bank (BAB)
✅ Đã lưu dữ liệu cho Bac A Bank (1509 dòng).
Đang xử lý: Eximbank (EIB)
⚠️ Dữ liệu của Eximbank (EIB) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho Eximbank : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho Eximbank (794 dòng).
Đang xử lý: Nội Bài Bank (NB Bank) (NBB)
✅ Đã lưu dữ liệu cho Nội Bài Bank (NB Bank) (1509 dòng).
Đang xử lý: Công ty tài chính cổ phần Điện lực (EVNFinance) (EVF)
✅ Đã lưu dữ liệu cho Công ty tài chính cổ phần Điện lực (EVNFinance) (1509 dòng).

✅ Hoàn thành.
