In [None]:

import yfinance as yf
import pandas as pd

In [None]:
!pip install pandas beautifulsoup4 lxml --quiet


In [None]:
import requests
import pandas as pd
from bs4 import BeautifulSoup

# URL chứa báo cáo tài chính hợp nhất
url = "https://finance.vietstock.vn/ACB/tai-chinh.htm?tab=BCTC&cat=LNST"

headers = {
    "User-Agent": "Mozilla/5.0"
}

response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.content, "html.parser")

# Tìm tất cả các bảng trong trang
tables = soup.find_all("table")
dataframes = []

for table in tables:
    try:
        df = pd.read_html(str(table))[0]
        dataframes.append(df)
    except Exception as e:
        pass

print(f"✅ Đã cào được {len(dataframes)} bảng.")

# Ghi ra file Excel
output_file = "ACB_financials_vietstock_static.xlsx"
with pd.ExcelWriter(output_file, engine="openpyxl") as writer:
    for i, df in enumerate(dataframes):
        sheet_name = f"Sheet{i+1}"
        df.to_excel(writer, sheet_name=sheet_name, index=False)

print(f"✅ Đã lưu file: {output_file}")


In [None]:
from google.colab import files
files.download("ACB_financials_vietstock_static.xlsx")


In [None]:
import yfinance as yf

ticker = yf.Ticker("ACB")  # Mã ACB trên HoSE
print(ticker.info)            # Có thể trả về một số thông tin cơ bản

# Nhưng những dòng sau sẽ trả về rỗng:
print(ticker.financials)      # Báo cáo kết quả kinh doanh
print(ticker.balance_sheet)   # Bảng cân đối kế toán
print(ticker.cashflow)        # Báo cáo lưu chuyển tiền tệ


In [None]:
import yfinance as yf
import pandas as pd

ticker = yf.Ticker("ACB")  # hoặc "ACB.HM", "ACB.VN"

# Lấy báo cáo kết quả kinh doanh
income = ticker.financials

# Xoay bảng cho dễ nhìn (thời gian là dòng, chỉ tiêu là cột)
income = income.T

# Xuất ra file Excel
income.to_excel("ACB_income_statement.xlsx")
print("✅ Đã lưu báo cáo kết quả kinh doanh ACB ra Excel")


In [None]:
balance = ticker.balance_sheet.T
cashflow = ticker.cashflow.T

with pd.ExcelWriter("ACB_financials_from_yfinance.xlsx") as writer:
    income.to_excel(writer, sheet_name="Income Statement")
    balance.to_excel(writer, sheet_name="Balance Sheet")
    cashflow.to_excel(writer, sheet_name="Cash Flow")

print("✅ Đã lưu file Excel gồm 3 sheet.")


In [None]:
import yfinance as yf
import pandas as pd

# Tải dữ liệu
ticker = yf.Ticker("ACB")

# Lấy báo cáo tài chính (xoay dòng thành cột)
income = ticker.financials.T
balance = ticker.balance_sheet.T
cashflow = ticker.cashflow.T

# Ghi vào file Excel
file_name = "ACB_financials_from_yfinance.xlsx"
with pd.ExcelWriter(file_name) as writer:
    income.to_excel(writer, sheet_name="Income Statement")
    balance.to_excel(writer, sheet_name="Balance Sheet")
    cashflow.to_excel(writer, sheet_name="Cash Flow")

print("✅ Đã tạo file Excel.")


In [None]:
from google.colab import files
files.download("ACB_financials_from_yfinance.xlsx")


In [None]:
import yfinance as yf
import pandas as pd

# Tải dữ liệu ACB từ yfinance
ticker = yf.Ticker("ACB")

# Lấy báo cáo tài chính theo quý
income_q = ticker.quarterly_financials.T
balance_q = ticker.quarterly_balance_sheet.T
cashflow_q = ticker.quarterly_cashflow.T

# Kiểm tra có dữ liệu không
print("✅ Các mốc thời gian trong báo cáo quý:")
print("Income Statement:", income_q.index.tolist())
print("Balance Sheet:", balance_q.index.tolist())
print("Cash Flow:", cashflow_q.index.tolist())

# Xuất ra Excel
file_name = "ACB_financials_quarterly.xlsx"
with pd.ExcelWriter(file_name) as writer:
    income_q.to_excel(writer, sheet_name="Income Statement (Q)", index=True)
    balance_q.to_excel(writer, sheet_name="Balance Sheet (Q)", index=True)
    cashflow_q.to_excel(writer, sheet_name="Cash Flow (Q)", index=True)

print(f"✅ Đã tạo file: {file_name}")


In [None]:
from google.colab import files
files.download("ACB_financials_quarterly.xlsx")


In [None]:
import yfinance as yf
import pandas as pd

# Hiển thị đầy đủ DataFrame khi in (nếu cần)
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', None)  # Tùy chọn để xem dữ liệu đầy đủ :contentReference[oaicite:1]{index=1}

# Tạo đối tượng ticker
ticker = yf.Ticker("ACB.VN")  # hoặc "ACB.HM", "ACB"

# Lấy dữ liệu theo quý
income_q = ticker.quarterly_financials.T
balance_q = ticker.quarterly_balance_sheet.T
cashflow_q = ticker.quarterly_cashflow.T

# In kiểm tra dữ liệu có thu được không
print("Income (quarterly):")
print(income_q.head())
print("\nBalance Sheet (quarterly):")
print(balance_q.head())
print("\nCash Flow (quarterly):")
print(cashflow_q.head())

# Xuất Excel
output = "ACB_financials_quarterly_yfinance.xlsx"
with pd.ExcelWriter(output, engine="openpyxl") as writer:
    income_q.to_excel(writer, sheet_name="Income Q")
    balance_q.to_excel(writer, sheet_name="Balance Sheet Q")
    cashflow_q.to_excel(writer, sheet_name="Cash Flow Q")

print(f"  File đã tạo: {output}")


In [None]:
# Kiểm tra danh sách tất cả các cột thực tế từ bảng balance sheet để tránh lỗi KeyError
import yfinance as yf

ticker = yf.Ticker("ACB")
balance_q = ticker.quarterly_balance_sheet.T

# Hiển thị danh sách cột thật sự có trong bảng balance
balance_q.columns.tolist()


In [None]:
import yfinance as yf
import pandas as pd

# Tải dữ liệu ACB
ticker = yf.Ticker("ACB")

# Lấy dữ liệu các bảng tài chính theo quý
income_q = ticker.quarterly_financials.T
balance_q = ticker.quarterly_balance_sheet.T
cash_q = ticker.quarterly_cashflow.T

# Tiền xử lý: đổi index thành datetime (nếu cần)
income_q.index = pd.to_datetime(income_q.index)
balance_q.index = pd.to_datetime(balance_q.index)
cash_q.index = pd.to_datetime(cash_q.index)

# Lọc một số cột chính (tuỳ chỉnh theo ý bạn)
income_filtered = income_q[[
    "Total Revenue", "Operating Expense", "Net Income", "Diluted EPS"
]].rename(columns={
    "Total Revenue": "Revenue",
    "Operating Expense": "OpEx",
    "Net Income": "Net Income",
    "Diluted EPS": "EPS"
})

balance_filtered = balance_q[[
    "Total Assets", "Total Liabilities Net Minority Interest", "Common Stock Equity"
]].rename(columns={
    "Total Assets": "Assets",
    "Total Liabilities Net Minority Interest": "Liabilities",
    "Common Stock Equity": "Equity"
})

cash_filtered = cash_q[[
    "Operating Cash Flow", "Investing Cash Flow", "Financing Cash Flow"
]].rename(columns={
    "Operating Cash Flow": "CashFlow_Op",
    "Investing Cash Flow": "CashFlow_Inv",
    "Financing Cash Flow": "CashFlow_Fin"
})

# Xuất ra file Excel với 3 sheet
output_path = "/content/ACB_Financials_Split.xlsx"
with pd.ExcelWriter(output_path) as writer:
    income_filtered.to_excel(writer, sheet_name="Income Statement")
    balance_filtered.to_excel(writer, sheet_name="Balance Sheet")
    cash_filtered.to_excel(writer, sheet_name="Cash Flow")

# Tải file về
from google.colab import files
files.download(output_path)


In [None]:
from google.colab import files
files.download(output_path)


In [None]:
print("Dates in income:")
print(income_q.index)

print("Dates in balance sheet:")
print(balance_q.index)

print("Dates in cash flow:")
print(cash_q.index)
