In [1]:
from openai import OpenAI
import configparser
from firecrawl import FirecrawlApp, ScrapeOptions
import os
os.chdir('/root')

In [3]:
# Load credentials from config file
config = configparser.ConfigParser()
config.read('pyalgo.cfg')

['pyalgo.cfg']

In [6]:
fc_api_key = config['firecrawl']['api_key']

# Initialize the client with your API key
app = FirecrawlApp(api_key=fc_api_key)

# Perform a basic search
search_result = app.search(
    "Dự báo giá cổ phiếu VCB",
    limit=5,
    scrape_options=ScrapeOptions(formats=["markdown", "links"]),
    lang="vi",
    country="vn",
    tbs="qdr:w"
)

# Print the search results
for result in search_result.data:
    print(f"Title: {result['title']}")
    print(f"URL: {result['url']}")
    print(f"Description: {result['description']}") 

Title: Ngân hàng Thương mại cổ phần Ngoại thương Việt Nam (HOSE:VCB)
URL: https://cafef.vn/du-lieu/hose/vcb-ngan-hang-thuong-mai-co-phan-ngoai-thuong-viet-nam.chn
Description: Ngân hàng Thương mại cổ phần Ngoại thương Việt Nam (Mã VCB: HOSE). Giá cổ phiếu (sáng 12/05/2025): 56600 VNĐ. Khối lượng 5992500.
Title: Cập nhật cổ phiếu VCB - LNTT Q1 tăng 1,3%, sát với dự báo
URL: https://dautucophieu.net/cap-nhat-co-phieu-vcb-lntt-q1-tang-13-sat-voi-du-bao/
Description: VCB đã công bố LNTT Q1/2025 đạt 10,9 nghìn tỷ đồng, tăng 1,3% so với cùng kỳ và bằng 22% dự báo cả năm của chúng tôi.
Title: Ngân hàng Thương mại cổ phần Ngoại thương Việt Nam (VCB)
URL: https://vn.investing.com/equities/joint-stock-commercial-bank
Description: Giá Cổ Phiếu Vietcombank (VCB) Hôm Nay là Bao Nhiêu? Giá cổ phiếu Vietcombank hôm nay là 56,500.00 ; Vietcombank Giao Dịch trên Sàn Giao Dịch Chứng Khoán Nào?
Title: VCB: Cắt giảm dự phòng hỗ trợ lợi nhuận [Thị giá: 57.100; Mục tiêu
URL: https://yuanta.com.vn/phan-tich/

In [7]:
search_result



In [8]:
text_to_analyze = "\n\n---\n\n".join(item['description'] for item in search_result.data if 'description' in item)

In [4]:
openai_api_key = config['openai']['api_key']
client = OpenAI(api_key=openai_api_key)

In [10]:
models = client.models.list()

for model in models.data:
    print(model.id)

gpt-4o-audio-preview-2024-12-17
dall-e-3
dall-e-2
gpt-4o-audio-preview-2024-10-01
gpt-4-turbo-preview
text-embedding-3-small
gpt-4.1-nano
gpt-4.1-nano-2025-04-14
gpt-4o-realtime-preview-2024-10-01
gpt-4o-realtime-preview
babbage-002
o1-mini-2024-09-12
o1-mini
gpt-4
text-embedding-ada-002
chatgpt-4o-latest
gpt-4o-mini-audio-preview
gpt-4o-audio-preview
o1-preview-2024-09-12
gpt-4o-mini-realtime-preview
gpt-4.1-mini
gpt-4o-mini-realtime-preview-2024-12-17
gpt-3.5-turbo-instruct-0914
gpt-4o-mini-search-preview
gpt-4.1-mini-2025-04-14
gpt-3.5-turbo-16k
davinci-002
gpt-3.5-turbo-1106
gpt-4o-search-preview
gpt-3.5-turbo-instruct
gpt-3.5-turbo
gpt-4o-mini-search-preview-2025-03-11
gpt-4-0125-preview
gpt-4o-2024-11-20
whisper-1
gpt-4o-2024-05-13
o1-preview
gpt-4-1106-preview
gpt-4-0613
text-embedding-3-large
gpt-4o-mini-tts
gpt-4o-transcribe
gpt-4.5-preview
gpt-4.5-preview-2025-02-27
gpt-4o-search-preview-2025-03-11
omni-moderation-2024-09-26
gpt-image-1
tts-1-hd
gpt-4o
tts-1-hd-1106
gpt-4o-mi

In [18]:
import requests
from bs4 import BeautifulSoup

# Step 1: Get latest stock market news headlines from Cafef
url = 'https://cafef.vn/thi-truong-chung-khoan.chn'
res = requests.get(url)
soup = BeautifulSoup(res.text, 'html.parser')

# Step 2: Extract first 3 article links
articles = soup.select('.tlitem h3 a')[:3]
links = ['https://cafef.vn' + a['href'] for a in articles]

# Step 3: For each link, fetch and extract article content
full_texts = []
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36"
}
for link in links:
    r = requests.get(link, headers=headers)
    article_soup = BeautifulSoup(r.text, 'html.parser')
    
    # Try common Cafef content selectors
    paragraphs = article_soup.select('.detail-content p') or article_soup.select('.body-content p')
    
    content = '\n'.join(p.text.strip() for p in paragraphs if p.text.strip())
    full_texts.append(content)

# Step 4: Merge all articles into one string
text_to_analyze = "\n\n---\n\n".join(full_texts)


In [19]:
for i, article in enumerate(full_texts):
    print(f"\n--- Article {i+1} ---\n{article[:500]}")  # print first 500 characters



--- Article 1 ---
Kết thúc phiên 12-5, chỉ số VN-Index tăng 15,9 điểm, đóng cửa đạt 1.283,26 điểm.
Trong phiên giao dịch ngày 12-5, chỉ số VN-Index khởi đầu mạnh mẽ, đạt đỉnh trong 30 phút đầu nhờ sự dẫn dắt của các cổ phiếu lớn như VIC, FPT và nhóm ngân hàng.
Dù chịu áp lực điều chỉnh khi chạm ngưỡng kháng cự 1.280 điểm, VN-Index vẫn phục hồi ấn tượng vào phiên chiều, đóng cửa tăng 15,9 điểm (1,26%), đạt 1.283,26 điểm. Thanh khoản tăng so với phiên trước, cho thấy dòng tiền đang hỗ trợ đà tăng của thị trường.
Đi

--- Article 2 ---
Thị trường tiền tệ, chứng khoán toàn cầu khởi sắc
Ngày 12/5, Mỹ và Trung Quốc đạt được thỏa thuận tạm dừng áp thuế trong vòng 90 ngày, đồng thời tiến hành cắt giảm đáng kể các mức thuế quan hiện hành.
Ông Scott Bessent - Bộ trưởng Tài chính Mỹ - cho biết: "Hai bên sẽ giảm thuế quan qua lại 115 điểm phần trăm. Hai quốc gia đều quan tâm đến thương mại cân bằng, Mỹ sẽ tiếp tục hướng tới mục tiêu đó".
Bộ Thương mại Trung Quốc thông tin hai bên cam kết hành động

In [11]:
prompt = f"""Dưới đây là toàn bộ nội dung của 3 bài báo tài chính mới nhất từ Cafef:
{text_to_analyze[:8000]}
Nêu những thông tin ảnh hưởng tới giá cổ phiếu VCB một cách ngắn gọn, và phân tích xem ảnh hưởng đến giá cổ phiếu VCB như nào, ngắn gọn hết mức."""

response = client.chat.completions.create(
    model="gpt-4.1-mini",
    max_completion_tokens=1000,    
    messages=[{"role": "user", "content": prompt}]
)

print(response.choices[0].message.content)

Không có thông tin nào trong các bài báo trên liên quan hoặc ảnh hưởng trực tiếp đến cổ phiếu BID. Vì vậy, không có yếu tố nào tác động rõ ràng đến giá cổ phiếu BID từ các tin này.


In [5]:
prompt = f"""
Thông tin mới về cổ phiếu VCB hôm nay"""

response = client.chat.completions.create(
    model="gpt-4.1-mini",
    max_completion_tokens=1000,    
    messages=[{"role": "user", "content": prompt}]
)

print(response.choices[0].message.content)

NameError: name 'text_to_analyze' is not defined

In [23]:
input_tokens = response.usage.prompt_tokens
output_tokens = response.usage.completion_tokens

In [25]:
output_tokens

233