In [2]:
import yfinance as yf
import pandas as pd
import json
import time

# Danh sách các mã cổ phiếu của các công ty
companies = {
    # Nông nghiệp
    "Hoàng Anh Gia Lai": "HAG",
    "Tập đoàn PAN": "PAN",
    "Dabaco Việt Nam": "DBC",
    "Giống cây trồng Trung Ương": "NSC",
    "Mía đường Lam Sơn": "LSS",
    "Mía đường Thành Thành Công Tây Ninh": "SBT",
    "Mía đường Sơn La": "SLS",
    "Mía đường Sóc Trăng": "SLS",
    "Thực phẩm Sao Ta": "FMC",
    "Nông nghiệp Quốc tế Hoàng Anh Gia Lai": "HNG",
    "Thực phẩm Cholimex": "CMF",
    "Giống cây trồng Miền Nam": "SSC",
    "Công ty cổ phần Vĩnh Hoàn": "VHC",
    "Công ty cổ phần Nam Việt": "ANV",
    "Công ty cổ phần Thủy sản Minh Phú": "MPC",
    "Công ty cổ phần Thực phẩm Bích Chi": "BFC",
    "Công ty cổ phần Tập đoàn Lộc Trời": "LTG",
    "CTCP Nông nghiệp BaF Việt Nam": "BAF",
    "CTCP Dược phẩm Cửu Long": "DCL",
    "CTCP Thuốc sát trùng Việt Nam": "VFG",
    "CTCP XNK Thủy sản Bến Tre": "ABT",
    "CTCP XNK An Giang": "AGM",
    "CTCP Chế biến Gỗ Đức Thành": "GDT",
    "CTCP Tập đoàn Dược Bảo Châu": "BCP",
    "CTCP Tập đoàn Sao Mai": "ASM",
    "CTCP Dầu thực vật Tường An": "TAC",
    "CTCP Dầu thực vật Cái Lân": "VOC"
}
max_retries = 5
    
for company_name, ticker_symbol in companies.items():
    print(f"Đang xử lý: {company_name} ({ticker_symbol})")
    
    success = False
    retries = 0
    while not success and retries < max_retries:
        try:
            # Lấy dữ liệu từ 2019 đến 2024 từ mã cổ phiếu ban đầu
            ticker = yf.Ticker(ticker_symbol)
            data = ticker.history(start="2019-01-01", end="2024-12-31", interval="1d").iloc[:, :5]
            # Kiểm tra nếu dữ liệu có ít hơn 1000 dòng
            if len(data) < 1000:
                print(f"⚠️ Dữ liệu của {company_name} ({ticker_symbol}) ít hơn 1000 dòng. Thử mã với đuôi .VN.")
                ticker_symbol_vn = ticker_symbol + ".VN"
                ticker = yf.Ticker(ticker_symbol_vn)
                try:
                    data_vn = ticker.history(start="2019-01-01", end="2024-12-31", interval="1d")
                except Exception as e:
                    print(f"❌ Lỗi khi lấy dữ liệu cho {company_name} : {e}")

                # Gộp dữ liệu từ mã gốc và mã .VN nếu có dữ liệu
                if data_vn is not None and not data_vn.empty:
                    print(f"✅ Đã tìm thấy dữ liệu cho {company_name} với mã {ticker_symbol}.VN.")
                    data = pd.concat([data, data_vn.iloc[:, :5]])
                    data = data.loc[~data.index.duplicated(keep='last')]  # Loại bỏ các dòng trùng lặp
                    data_vn = None
    
            # Dữ liệu không trống, tiếp tục dù số dòng ít
            if data.empty:
                print(f"⚠️ Không có dữ liệu cho {company_name} ({ticker_symbol}). Bỏ qua.")
                break

            # Làm sạch dữ liệu, chuyển định dạng cột Date (bỏ giờ và timezone)
            data = data.reset_index()
            data['Date'] = pd.to_datetime(data['Date'], utc=True).dt.date
            data = data.set_index('Date')

            # Lưu vào file CSV
            filename = f"{company_name}_stock_data.csv"
            data.to_csv(filename)

            print(f"✅ Đã lưu dữ liệu cho {company_name} ({len(data)} dòng).")
            data = None
            success = True  # Gắn cờ thành công
    
        except Exception as e:
            retries += 1
            print(f"❌ Lỗi khi lấy dữ liệu cho {company_name} (thử lại {retries}/{max_retries}): {e}")
            if retries >= max_retries:
                print(f"⚠️ Đã thử {max_retries} lần mà không thành công. Bỏ qua {company_name}.")
            time.sleep(2)  # Delay ngắn giữa các lần thử lại
    
    time.sleep(3)  # Delay giữa các công ty
    
# Lưu danh sách công ty hợp lệ và không hợp lệ
print("\n✅ Hoàn thành.")

Đang xử lý: Hoàng Anh Gia Lai (HAG)
⚠️ Dữ liệu của Hoàng Anh Gia Lai (HAG) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho Hoàng Anh Gia Lai với mã HAG.VN.
✅ Đã lưu dữ liệu cho Hoàng Anh Gia Lai (1142 dòng).
Đang xử lý: Tập đoàn PAN (PAN)
⚠️ Dữ liệu của Tập đoàn PAN (PAN) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho Tập đoàn PAN : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho Tập đoàn PAN (700 dòng).
Đang xử lý: Dabaco Việt Nam (DBC)
✅ Đã lưu dữ liệu cho Dabaco Việt Nam (1509 dòng).
Đang xử lý: Giống cây trồng Trung Ương (NSC)
✅ Đã lưu dữ liệu cho Giống cây trồng Trung Ương (1509 dòng).
Đang xử lý: Mía đường Lam Sơn (LSS)
⚠️ Dữ liệu của Mía đường Lam Sơn (LSS) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho Mía đường Lam Sơn với mã LSS.VN.
✅ Đã lưu dữ liệu cho Mía đường Lam Sơn (2284 dòng).
Đang xử lý: Mía đường Thành Thành Công Tây Ninh (SBT)
✅ Đã lưu dữ liệu cho Mía đường Thành Thàn

$HNG.VN: possibly delisted; no timezone found


✅ Đã lưu dữ liệu cho Nông nghiệp Quốc tế Hoàng Anh Gia Lai (794 dòng).
Đang xử lý: Thực phẩm Cholimex (CMF)
✅ Đã lưu dữ liệu cho Thực phẩm Cholimex (1509 dòng).
Đang xử lý: Giống cây trồng Miền Nam (SSC)
⚠️ Dữ liệu của Giống cây trồng Miền Nam (SSC) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho Giống cây trồng Miền Nam : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho Giống cây trồng Miền Nam (675 dòng).
Đang xử lý: Công ty cổ phần Vĩnh Hoàn (VHC)
✅ Đã lưu dữ liệu cho Công ty cổ phần Vĩnh Hoàn (1509 dòng).
Đang xử lý: Công ty cổ phần Nam Việt (ANV)
⚠️ Dữ liệu của Công ty cổ phần Nam Việt (ANV) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho Công ty cổ phần Nam Việt : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho Công ty cổ phần Nam Việt (786 dòng).
Đang xử lý: Công ty cổ phần Thủy sản Minh Phú (MPC)
✅ Đã lưu dữ liệu cho Công ty cổ phần Thủy sản Minh Phú (1

$LTG.VN: possibly delisted; no timezone found


✅ Đã lưu dữ liệu cho Công ty cổ phần Tập đoàn Lộc Trời (108 dòng).
Đang xử lý: CTCP Nông nghiệp BaF Việt Nam (BAF)


$BAF: possibly delisted; no timezone found


⚠️ Dữ liệu của CTCP Nông nghiệp BaF Việt Nam (BAF) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho CTCP Nông nghiệp BaF Việt Nam với mã BAF.VN.
✅ Đã lưu dữ liệu cho CTCP Nông nghiệp BaF Việt Nam (765 dòng).


  data = pd.concat([data, data_vn.iloc[:, :5]])


Đang xử lý: CTCP Dược phẩm Cửu Long (DCL)
⚠️ Dữ liệu của CTCP Dược phẩm Cửu Long (DCL) ít hơn 1000 dòng. Thử mã với đuôi .VN.
✅ Đã tìm thấy dữ liệu cho CTCP Dược phẩm Cửu Long với mã DCL.VN.
✅ Đã lưu dữ liệu cho CTCP Dược phẩm Cửu Long (1142 dòng).
Đang xử lý: CTCP Thuốc sát trùng Việt Nam (VFG)
⚠️ Dữ liệu của CTCP Thuốc sát trùng Việt Nam (VFG) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho CTCP Thuốc sát trùng Việt Nam : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho CTCP Thuốc sát trùng Việt Nam (678 dòng).
Đang xử lý: CTCP XNK Thủy sản Bến Tre (ABT)
✅ Đã lưu dữ liệu cho CTCP XNK Thủy sản Bến Tre (1509 dòng).
Đang xử lý: CTCP XNK An Giang (AGM)
✅ Đã lưu dữ liệu cho CTCP XNK An Giang (1509 dòng).
Đang xử lý: CTCP Chế biến Thực phẩm Xuất khẩu miền Tây (WCF)
⚠️ Dữ liệu của CTCP Chế biến Thực phẩm Xuất khẩu miền Tây (WCF) ít hơn 1000 dòng. Thử mã với đuôi .VN.


$WCF.VN: possibly delisted; no timezone found


✅ Đã lưu dữ liệu cho CTCP Chế biến Thực phẩm Xuất khẩu miền Tây (4 dòng).
Đang xử lý: CTCP Chế biến Gỗ Đức Thành (GDT)
⚠️ Dữ liệu của CTCP Chế biến Gỗ Đức Thành (GDT) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho CTCP Chế biến Gỗ Đức Thành : Length mismatch: Expected axis has 2 elements, new values have 1 elements
✅ Đã lưu dữ liệu cho CTCP Chế biến Gỗ Đức Thành (790 dòng).
Đang xử lý: CTCP Chăn nuôi C.P. Việt Nam (CPV)
⚠️ Dữ liệu của CTCP Chăn nuôi C.P. Việt Nam (CPV) ít hơn 1000 dòng. Thử mã với đuôi .VN.


$CPV.VN: possibly delisted; no timezone found


✅ Đã lưu dữ liệu cho CTCP Chăn nuôi C.P. Việt Nam (108 dòng).
Đang xử lý: CTCP Tập đoàn Dược Bảo Châu (BCP)
⚠️ Dữ liệu của CTCP Tập đoàn Dược Bảo Châu (BCP) ít hơn 1000 dòng. Thử mã với đuôi .VN.


$BCP.VN: possibly delisted; no timezone found


✅ Đã lưu dữ liệu cho CTCP Tập đoàn Dược Bảo Châu (790 dòng).
Đang xử lý: CTCP Tập đoàn Sao Mai (ASM)
✅ Đã lưu dữ liệu cho CTCP Tập đoàn Sao Mai (1509 dòng).
Đang xử lý: CTCP Dầu thực vật Tường An (TAC)
✅ Đã lưu dữ liệu cho CTCP Dầu thực vật Tường An (1509 dòng).
Đang xử lý: CTCP Dầu thực vật Cái Lân (VOC)
✅ Đã lưu dữ liệu cho CTCP Dầu thực vật Cái Lân (1509 dòng).

✅ Hoàn thành.
