In [1]:
import yfinance as yf
import pandas as pd
import json
import time

# Danh sách các mã cổ phiếu của các công ty
companies = {
    #Công nghệ
    "FPT": "FPT",
    "CTCP Bán lẻ Kỹ thuật số FPT": "FRT",
    "CTCP Thế giới Di động": "MWG",
    "CTCP Tập đoàn Masan (có đầu tư vào tech)": "MSN",
    "CTCP Công nghệ Viễn thông Sài Gòn": "SGT",
    "CTCP Tập đoàn CMC": "CMG",
    "CTCP Công nghệ Viễn thông Elcom": "ELC",
    "CTCP Giải pháp Công nghệ Thông minh ITD": "ITD",
    "CTCP Tư vấn Đầu tư và Phát triển Tin học": "ITC",
    "CTCP Dịch vụ Trực tuyến NetNam": "NET",
    "CTCP VTC Dịch vụ truyền hình số": "VTC",
    "CTCP Công nghệ Truyền thông DTT": "DTT"
}

max_retries = 5
    
for company_name, ticker_symbol in companies.items():
    print(f"Đang xử lý: {company_name} ({ticker_symbol})")
    
    success = False
    retries = 0
    while not success and retries < max_retries:
        try:
            # Lấy dữ liệu từ 2019 đến 2024 từ mã cổ phiếu ban đầu
            ticker = yf.Ticker(ticker_symbol)
            data = ticker.history(start="2019-01-01", end="2024-12-31", interval="1d").iloc[:, :5]
            # Kiểm tra nếu dữ liệu có ít hơn 1000 dòng
            if len(data) < 1000:
                print(f"⚠️ Dữ liệu của {company_name} ({ticker_symbol}) ít hơn 1000 dòng. Thử mã với đuôi .VN.")
                ticker_symbol_vn = ticker_symbol + ".VN"
                ticker = yf.Ticker(ticker_symbol_vn)
                try:
                    data_vn = ticker.history(start="2019-01-01", end="2024-12-31", interval="1d")
                except Exception as e:
                    print(f"❌ Lỗi khi lấy dữ liệu cho {company_name} : {e}")

                # Gộp dữ liệu từ mã gốc và mã .VN nếu có dữ liệu
                if data_vn is not None and not data_vn.empty:
                    print(f"✅ Đã tìm thấy dữ liệu cho {company_name} với mã {ticker_symbol}.VN.")
                    data = pd.concat([data, data_vn.iloc[:, :5]])
                    data = data.loc[~data.index.duplicated(keep='last')]  # Loại bỏ các dòng trùng lặp
                    data_vn = None
    
            # Dữ liệu không trống, tiếp tục dù số dòng ít
            if data.empty:
                print(f"⚠️ Không có dữ liệu cho {company_name} ({ticker_symbol}). Bỏ qua.")
                break

            # Làm sạch dữ liệu, chuyển định dạng cột Date (bỏ giờ và timezone)
            data = data.reset_index()
            data['Date'] = pd.to_datetime(data['Date'], utc=True).dt.date
            data = data.set_index('Date')

            # Lưu vào file CSV
            filename = f"stock data/{company_name}_stock_data.csv"
            data.to_csv(filename)

            print(f"✅ Đã lưu dữ liệu cho {company_name} ({len(data)} dòng).")
            data = None
            success = True  # Gắn cờ thành công
    
        except Exception as e:
            retries += 1
            print(f"❌ Lỗi khi lấy dữ liệu cho {company_name} (thử lại {retries}/{max_retries}): {e}")
            if retries >= max_retries:
                print(f"⚠️ Đã thử {max_retries} lần mà không thành công. Bỏ qua {company_name}.")
            time.sleep(2)  # Delay ngắn giữa các lần thử lại
    
    time.sleep(3)  # Delay giữa các công ty
    
# Lưu danh sách công ty hợp lệ và không hợp lệ
print("\n✅ Hoàn thành.")

Đang xử lý: FPT (FPT)
⚠️ Dữ liệu của FPT (FPT) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho FPT : Length mismatch: Expected axis has 2 elements, new values have 1 elements
❌ Lỗi khi lấy dữ liệu cho FPT (thử lại 1/5): name 'data_vn' is not defined
⚠️ Dữ liệu của FPT (FPT) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho FPT : Length mismatch: Expected axis has 2 elements, new values have 1 elements
❌ Lỗi khi lấy dữ liệu cho FPT (thử lại 2/5): name 'data_vn' is not defined
⚠️ Dữ liệu của FPT (FPT) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho FPT : Length mismatch: Expected axis has 2 elements, new values have 1 elements
❌ Lỗi khi lấy dữ liệu cho FPT (thử lại 3/5): name 'data_vn' is not defined
⚠️ Dữ liệu của FPT (FPT) ít hơn 1000 dòng. Thử mã với đuôi .VN.
❌ Lỗi khi lấy dữ liệu cho FPT : Length mismatch: Expected axis has 2 elements, new values have 1 elements
❌ Lỗi khi lấy dữ liệu cho FPT (thử lại 4/5): name 'data_vn' is not define