# AI cập nhật dữ liệu mới nhất cho báo cáo tuần

In [66]:
import sys
import os
import importlib
sys.path.append(os.path.join(os.path.dirname(os.getcwd()), 'import'))
sys.path.append(os.path.join(os.path.dirname(os.getcwd()), 'module'))

import import_default
import import_database
import import_other
import get_and_crawl_data
import gemini_model
import plotly_and_upload

importlib.reload(import_default)
importlib.reload(import_database)
importlib.reload(import_other)
importlib.reload(get_and_crawl_data)
importlib.reload(gemini_model)
importlib.reload(plotly_and_upload)

from import_default import *
from import_database import *
from import_other import *
from get_and_crawl_data import *
from gemini_model import *
from plotly_and_upload import *

- Lấy dữ liệu từ Mongo

In [67]:
date_series = get_mongo_collection(ref_db, 'date_series')
time_series = get_mongo_collection(ref_db, 'time_series')
name_map = get_mongo_collection(ref_db, "name_map")
name_map_dict = name_map.set_index('code')['full_name'].to_dict()
full_stock_classification_df = get_mongo_collection(ref_db, 'full_stock_classification')

In [68]:
projection = {
    "_id": 0,
    "date": 1,
    "ticker": 1,
    "open": 1,
    "high": 1,
    "low": 1,
    "close": 1,
    "pct_change": 1,
    "diff": 1,
    "volume": 1,
    "option": 1,
    "SMA_20": 1,
    "SMA_60": 1,
    "RSI_14": 1,
    "week_open": 1,
    "month_prev_high": 1,
    "month_prev_low": 1,
    "month_open": 1,
    "quarter_prev_high": 1,
    "quarter_prev_low": 1,
    "quarter_open": 1,
    "year_open": 1,
    "MFIBO_0382": 1,
    "MFIBO_0500": 1,
    "MFIBO_0618": 1,
    "QFIBO_0382": 1,
    "QFIBO_0500": 1,
    "QFIBO_0618": 1,
	"YFIBO_0382": 1,
    "YFIBO_0500": 1,
    "YFIBO_0618": 1,
}
today_index_df = get_mongo_collection(stock_db, "today_index", projection=projection)
history_index_df = get_mongo_collection(stock_db, "history_index", projection=projection)
full_index_df = pd.concat([today_index_df, history_index_df], axis=0, ignore_index=True)

In [69]:
projection = {"_id": 0,"date": 1,"ticker": 1,"trend_5p": 1,"trend_20p": 1,"trend_60p": 1,"trend_240p": 1}
today_ms_chart_df = get_mongo_collection(stock_db, "today_ms_chart", find_query={"ticker":'all'}, projection=projection)
history_ms_chart_df = get_mongo_collection(stock_db, "history_ms_chart", find_query={"ticker":'all'}, projection=projection)
full_ms_chart_df = pd.concat([today_ms_chart_df, history_ms_chart_df], axis=0, ignore_index=True).drop(columns=['ticker'])

today_stock_df = get_mongo_collection(stock_db, "today_stock", find_query={"date": {"$in": date_series['date'].iloc[:5].tolist()}})
history_stock_df = get_mongo_collection(stock_db, "history_stock", find_query={"date": {"$in": date_series['date'].iloc[:5].tolist()}})
origin_stock_df = pd.concat([today_stock_df, history_stock_df], axis=0, ignore_index=True)
full_stock_df = origin_stock_df[["date","ticker","open","high","low","close","volume",'cap','t5_score']]

other_ticker_df = get_mongo_collection(stock_db, 'other_ticker')
nntd_index_df = get_mongo_collection(stock_db, 'nntd_index')
nntd_stock_df = get_mongo_collection(stock_db, 'nntd_stock')

- Lấy dữ liệu từ AlphaVantage

In [70]:
# Lấy dữ liệu các tỷ giá cần thiết từ Alpha Vantage
fx_pairs = [
    ('USD', 'VND', 'USD_VND'),
    ('USD', 'SEK', 'USD_SEK')
]

data_frames = []
for from_curr, to_curr, col_name in fx_pairs:
    df = get_data_from_av(from_curr, to_curr, col_name)
    if df is not None:
        data_frames.append(df)

av_ticker_df = pd.concat(data_frames, axis=1)
av_ticker_df = av_ticker_df.fillna(method='ffill').dropna()

### Phần bối cảnh vĩ mô

#### Dữ liệu các biểu đồ biến động

- Tính toán DXY từ các cặp tiền

In [71]:
currency_config = {
    'EUR_USD': {'source': 'other_ticker_df', 'weight': -0.576},
    'USD_JPY': {'source': 'other_ticker_df', 'weight': 0.136},
    'GBP_USD': {'source': 'other_ticker_df', 'weight': -0.119},
    'USD_CAD': {'source': 'other_ticker_df', 'weight': 0.091},
    'USD_CHF': {'source': 'other_ticker_df', 'weight': 0.036},
    'USD_SEK': {'source': 'av_ticker_df', 'weight': 0.042}
}

# Tạo DataFrame cho mỗi cặp tiền tệ
currency_data = {}
for pair, config in currency_config.items():
    if config['source'] == 'other_ticker_df':
        df = other_ticker_df[other_ticker_df['ticker'] == pair][['date', 'close']].set_index('date')
        df.columns = [pair]
    else:
        df = av_ticker_df[['USD_SEK']].copy()
        df.columns = [pair]
    
    currency_data[pair] = df

# Kết hợp tất cả dữ liệu tỷ giá
dxy_calculation_df = pd.concat(currency_data.values(), axis=1, sort=True)
dxy_calculation_df = dxy_calculation_df.sort_index().bfill().ffill()

# Tính toán chỉ số DXY theo công thức chuẩn
dxy_base = 50.14348112
dxy_calculation = dxy_base
for pair, config in currency_config.items():
    dxy_calculation *= (dxy_calculation_df[pair] ** config['weight'])

dxy_calculation_df['ticker'] = 'DXY'
dxy_calculation_df['close'] = dxy_calculation
dxy_calculation_df = dxy_calculation_df[['ticker', 'close']].reset_index()

- Chuẩn bị tỉ giá USD/VND

In [72]:
usd_vnd_df = av_ticker_df[['USD_VND']].rename(columns={'USD_VND': 'close'})
usd_vnd_df['ticker'] = 'USD_VND'
usd_vnd_df = usd_vnd_df.reset_index()

- Ghép tất cả vào ticker_dict

In [73]:
FINAL_DAYS = 5
TICKER_CONFIG = {
    # Chỉ số Việt Nam
    'VNINDEX':   {'df': full_index_df, 'market': 'hose', 'type': 'vn'},
    'VN30':      {'df': full_index_df, 'market': 'hose', 'type': 'vn'},
    'HNXINDEX':  {'df': full_index_df, 'market': 'hnx', 'type': 'vn'},
    'UPINDEX':   {'df': full_index_df, 'market': 'hnx', 'type': 'vn'},
    'VN30F1M':   {'df': full_index_df, 'market': 'derivatives', 'type': 'vn'},
    'VN30F2M':   {'df': full_index_df, 'market': 'derivatives', 'type': 'vn'},
    
    # Hàng hóa & Crypto
    'XAU_USD':   {'df': other_ticker_df, 'market': 'commodity', 'type': 'other'},
    'CLZ':       {'df': other_ticker_df, 'market': 'commodity', 'type': 'other'},
    'BTC_USD':   {'df': other_ticker_df, 'market': 'crypto', 'type': 'other'},
    'ETH_USD':   {'df': other_ticker_df, 'market': 'crypto', 'type': 'other'},
    
    # Chỉ số quốc tế
    'DJI':       {'df': other_ticker_df, 'market': 'us', 'type': 'international'},
    'SPX':       {'df': other_ticker_df, 'market': 'us', 'type': 'international'},
    'FTSE':      {'df': other_ticker_df, 'market': 'eu', 'type': 'international'},
    'STOXX50E':  {'df': other_ticker_df, 'market': 'eu', 'type': 'international'},
    'N225':      {'df': other_ticker_df, 'market': 'asia', 'type': 'international'},
    'SSEC':      {'df': other_ticker_df, 'market': 'asia', 'type': 'international'},
    
    # Tiền tệ
    'DXY':       {'df': dxy_calculation_df, 'market': 'fx', 'type': 'other'},
    'USD_VND':   {'df': usd_vnd_df, 'market': 'fx', 'type': 'other'},
}
FINAL_COLUMNS = ['date', 'ticker', 'close', 'cum_change', '1d_change', '5d_change', '20d_change', 'market', 'type']


# 2. XỬ LÝ THEO LUỒNG MỚI
final_df_list = []
for ticker, config in TICKER_CONFIG.items():
    # Lấy và sắp xếp dữ liệu nguồn
    source_df = config['df']
    temp_df = source_df[source_df['ticker'] == ticker].sort_values('date', ascending=False).copy()

    # TÍNH TOÁN TRƯỚC trên toàn bộ chuỗi dữ liệu đã sắp xếp để đảm bảo chính xác
    temp_df['1d_change'] = temp_df['close'][::-1].pct_change()[::-1].fillna(0)
    temp_df['5d_change'] = temp_df['close'][::-1].pct_change(5)[::-1].fillna(0)
    temp_df['20d_change'] = temp_df['close'][::-1].pct_change(20)[::-1].fillna(0)
    
    # Gán các thông tin phân loại
    temp_df['market'] = config['market']
    temp_df['type'] = config['type']

    # CẮT 1 LẦN DUY NHẤT về 5 ngày sau khi đã tính toán xong
    final_rows = temp_df.head(FINAL_DAYS)

    # Tính toán cuối cùng trên 5 dòng đã cắt
    final_rows['cum_change'] = final_rows['1d_change'][::-1].cumsum()[::-1]
    final_df_list.append(final_rows)

# 3. KẾT QUẢ CUỐI CÙNG
weekly_history_data_df = pd.concat(final_df_list, ignore_index=True)[FINAL_COLUMNS]

#### Phần nhận xét các Index

In [74]:
# Thiết lập kết nối với cơ sở dữ liệu
genai.configure(api_key=load_env("GEMINI_API"))
model_list = get_gemini_models()
standard_model_list = select_standard_models(model_list)
standard_model_dict = {model_name: genai.GenerativeModel(model_name) for model_name in standard_model_list}

def create_prompt(type_name):
    if type_name == 'vn':
        senerio = """
            Câu 1 (Thị trường chung): Bắt đầu bằng nhận định về chỉ số chính VN-Index, trích dẫn số liệu tăng trưởng tuần (1w_change).
            Câu 2 (Nhóm Cổ phiếu Lớn): Nhận xét về nhóm cổ phiếu blue-chip qua chỉ số VN30, trích dẫn số liệu tăng trưởng tuần (1w_change), nhấn mạnh mức độ biến động và so sánh với VN-Index.
            Câu 3 (Các Chỉ Số Khác): Mô tả xu hướng chung của hai chỉ số HNXINDEX và UPINDEX, trích dẫn số liệu 1w_change của chúng.
            Câu 4 (Thị trường Phái sinh): Nhận xét về thị trường phái sinh, chỉ nhận xét VN30F1M bỏ qua VN30F2M. So sánh điểm số đóng cửa của nó với chỉ số VN30 cơ sở để nêu bật mức chênh lệch (basis).
            Câu 5 (Kết luận): Viết một câu kết luận khách quan để tổng hợp lại bức tranh chung, ví dụ như mức độ lan tỏa của đà tăng hoặc vai trò dẫn dắt của nhóm cổ phiếu nào.
        """
    elif type_name == 'international':
        senerio = """
            Câu 1: Nhận định chung về thị trường chứng khoán toàn cầu trong tuần qua.
            Câu 2: Tập trung vào thị trường Mỹ (DJI, SPX) và trích dẫn số liệu 1w_change.
            Câu 3: Tập trung vào thị trường Châu Âu (FTSE, STOXX50E) và trích dẫn số liệu 1w_change.
            Câu 4: Tập trung vào thị trường Châu Á (N225, SSEC) và trích dẫn số liệu 1w_change.
            Câu 5: Viết một câu kết luận cuối cùng. Câu này phải **hoàn toàn khách quan**, chỉ tổng hợp lại thông tin, **tuyệt đối không đưa ra quan điểm cá nhân hay dự đoán**.
        """
    elif type_name == 'other':
        senerio = """
            Câu 1: Nhận định chung về các loại thị trường trong tuần qua (Crypto, Hàng hóa, Ngoại hối).
            Câu 2: Tập trung vào thị trường Tiền điện tử (BTC, ETH) và trích dẫn số liệu 1w_change.
            Câu 3: Tập trung vào thị trường Hàng hóa (Vàng, Dầu) và trích dẫn số liệu 1w_change.
            Câu 4: Tập trung vào thị trường Ngoại hối (DXY, USD/VND) và trích dẫn số liệu 1w_change.
            Câu 5: Viết một câu kết luận cuối cùng. Câu này phải **hoàn toàn khách quan**, chỉ tổng hợp lại thông tin, **tuyệt đối không đưa ra quan điểm cá nhân hay dự đoán**.
        """

    #Tách bảng lớn ra thành nhiều bảng để AI dễ đọc
    type_df = weekly_history_data_df[weekly_history_data_df['type'] == type_name]
    type_dict = {}
    index_list = type_df['ticker'].unique().tolist()
    for index in index_list:
        temp_df = type_df[type_df['ticker'] == index]
        temp_df = temp_df.sort_values('date', ascending=False).reset_index(drop=True)
        type_dict[index] = temp_df.to_csv(index=False, sep='|', lineterminator='\n')

    prompt = f"""
        Dựa vào các bảng dữ liệu được cung cấp dưới đây, hãy viết một đoạn văn nhận xét thị trường:
        Index số 1: {type_dict[index_list[0]]}\n
        Index số 2: {type_dict[index_list[1]]}\n
        Index số 3: {type_dict[index_list[2]]}\n
        Index số 4: {type_dict[index_list[3]]}\n
        Index số 5: {type_dict[index_list[4]]}\n
        Index số 6: {type_dict[index_list[5]]}\n
        ---
        **Yêu cầu BẮT BUỘC:**

        1.  **Định dạng:** Toàn bộ nội dung phải nằm trong **một đoạn văn duy nhất**.
        2.  **Độ dài:** Mỗi câu có độ dài khoảng **20 từ**.
        3.  **Cấu trúc & Nội dung:** Đoạn văn phải có **chính xác 5 câu** theo kịch bản dưới đây.
            {senerio}
        4.  Văn phong & Sáng tạo:
            Mục tiêu: Hành văn phải chuyên nghiệp, trôi chảy và khách quan như một nhà phân tích thị trường, với các nhận định phản ánh đúng bối cảnh của dữ liệu.
            Quy tắc 1: Phân tích Bối cảnh (Rất quan trọng):
                - Việc lựa chọn từ ngữ mô tả xu hướng (ví dụ: 'phục hồi', 'tăng trưởng') phải dựa trên diễn biến giá trong lịch sử gần đây có trong dữ liệu, không chỉ dựa vào một con số của tuần gần nhất.
                - Ví dụ cụ thể: Chỉ được dùng từ "phục hồi" hoặc "hồi phục" khi thị trường vừa trải qua một đợt sụt giảm rõ rệt trước đó. Nếu thị trường vốn đang đi lên và tiếp tục tăng mạnh, phải dùng các từ như "tăng trưởng mạnh", "bứt phá", hoặc "nới rộng đà tăng".
            Quy tắc 2: Thuật ngữ Chuẩn xác:
                - Ưu tiên sử dụng các thuật ngữ tài chính khách quan, định lượng. Tránh các từ ngữ cảm tính hoặc không phù hợp (ví dụ: không dùng "sôi động", "tiến bộ").
            Quy tắc 3: Chống lặp từ:
                - Tuyệt đối không lặp lại từ ngữ, cụm từ và cấu trúc câu trong toàn bộ đoạn văn để đảm bảo sự linh hoạt và tự nhiên.
            Quy tắc 4: Từ ngữ không được sử dụng:
                - Tuyệt đối không sử dụng từ "Tóm lại" trong bất kỳ trường hợp
            Quy tắc 5: Trích xuất số liệu:
                - Các số liệu gốc ở dạng só thập phân khi trích dẫn phải ghi về dạng phần trăm, ví dụ: 0.05 phải ghi là 5%, 0.1234 phải ghi là 12.34%.
                - Không ghi số liệu dạng chữ, ví dụ: "tăng 5%" thay vì "tăng năm phần trăm".
    """
    return prompt

vn_comment = generate_content_with_model_dict(standard_model_dict, create_prompt('vn'))
international_comment = generate_content_with_model_dict(standard_model_dict, create_prompt('international'))
other_comment = generate_content_with_model_dict(standard_model_dict, create_prompt('other'))

### Phần phân tích thị trường

#### Dữ liệu VNINDEX và MS

- Tạo các bảng dữ liệu

In [75]:
ta_vn_index_df = full_index_df[full_index_df['ticker'] == 'VNINDEX'].reset_index(drop=True).iloc[:60]
ms_vn_index_df = full_ms_chart_df.iloc[:60]
weekly_ms_index_df = pd.merge(ta_vn_index_df[['date', 'close']], ms_vn_index_df, on='date', how='left')

- Vẽ biểu đồ kĩ thuật

In [85]:
vnindex_chart_df = full_index_df[full_index_df['ticker'] == 'VNINDEX'].iloc[:120].sort_values('date').reset_index(drop=True)
image_name = 'TA_WEEKLY_VNINDEX.png'

line_name_dict = {
    'SMA_20': 'SMA 20',
    'SMA_60': 'SMA 60',
    'week_open': 'WEEK OPEN',
    'month_open': 'MONTH OPEN',
    'quarter_open': 'QUARTER OPEN',
    'year_open': 'YEAR OPEN',
    'month_prev_high': 'LAST MHIGH',
    'month_prev_low': 'LAST MLOW',
    'quarter_prev_high': 'LAST QHIGH',
    'quarter_prev_low': 'LAST QLOW',
    'MFIBO_0382': 'MFIBO 0.382',
    'MFIBO_0500': 'MFIBO 0.500',
    'MFIBO_0618': 'MFIBO 0.618',
    'QFIBO_0382': 'QFIBO 0.382',
    'QFIBO_0500': 'QFIBO 0.500',
    'QFIBO_0618': 'QFIBO 0.618',
	'YFIBO_0382': 'YFIBO 0.382',
    'YFIBO_0500': 'YFIBO 0.500',
    'YFIBO_0618': 'YFIBO 0.618'
}

chart_config = create_chart_config(
	title_font_size=30,
	axis_font_size=24,
	tag_font_size=24,
	price_tag_font_size=24,
    min_spacing_ratio = 0.042,
	margin=dict(l=20, r=220, t=20, b=20, pad=10)
)

max_attempts = 5
for attempt in range(max_attempts):
    try:
        fig, fig_images = create_financial_chart(
            vnindex_chart_df, # DataFrame của bạn
            width=1400,
            height=1200,
            line_name_dict=line_name_dict,
            line_columns=list(line_name_dict.keys()),
            chart_config=chart_config,
            path='../output/weekly/',
            image_name = image_name
        )
        upload_to_r2(fig_images, image_name)
        break
    except Exception as e:
        if attempt == max_attempts - 1:
            raise e
# fig.show()

#### Nhận xét VNINDEX và MS

In [77]:
prompt = f"""
    Đây là dữ liệu của chỉ số VNINDEX:
        {ta_vn_index_df.to_csv(index=False, sep='|', lineterminator='\n')}
    **Vai trò:** Bạn là một **nhà phân tích kỹ thuật cấp cao**, có kinh nghiệm tại một công ty chứng khoán.
    **Nhiệm vụ:** Dựa trên dữ liệu biến động giá và các chỉ báo kỹ thuật của chỉ số VNINDEX được cung cấp, hãy viết một báo cáo phân tích kỹ thuật chuyên nghiệp, súc tích và liền mạch, tuân thủ nghiêm ngặt cấu trúc 8 câu dưới đây.
    **Yêu cầu về nội dung, cấu trúc và định dạng:**
        Báo cáo phải gồm **8 câu, mỗi câu dài khoảng 20 đến 25 từ** và được chia thành **3 đoạn văn riêng biệt**. Bắt đầu thẳng vào nội dung phân tích, không có lời chào.
        **Đoạn 1 (3 câu):**
            * **Câu 1:** Nhận định tổng quan về xu hướng chính của chỉ số trong **tuần vừa qua**.
            * **Câu 2:** Phân tích vai trò của hai đường **SMA 20 và SMA 60** (hỗ trợ/kháng cự).
            * **Câu 3:** Đánh giá chỉ báo **RSI 14** và ý nghĩa của nó đối với áp lực thị trường.
        **Đoạn 2 (3 câu):**
            * **Câu 4:** Phân tích mốc hỗ trợ/kháng cự quan trọng theo **khung Tuần** (kết hợp O-H-L gần nhất và Fibonacci gần nhất).
            * **Câu 5:** Phân tích mốc hỗ trợ/kháng cự quan trọng theo **khung Tháng** (kết hợp O-H-L gần nhất và Fibonacci gần nhất).
            * **Câu 6:** Phân tích mốc hỗ trợ/kháng cự quan trọng theo **khung Quý** (kết hợp O-H-L gần nhất và Fibonacci gần nhất).
        **Đoạn 3 (2 câu):**
            * **Câu 7:** Tổng hợp và nhấn mạnh **một mốc hỗ trợ hoặc kháng cự cốt lõi nhất** cần theo dõi.
            * **Câu 8:** Đề xuất **chiến lược giao dịch** cho tuần tới một cách rõ ràng, dứt khoát.
        **Yêu cầu về ngôn ngữ và trình bày:**
            * **Bắt buộc trích dẫn số liệu cụ thể và đa dạng:**
                * **Với mỗi ngưỡng hỗ trợ/kháng cự, hãy linh hoạt trích dẫn khoảng cách tới giá đóng cửa. Sử dụng xen kẽ giữa độ lệch phần trăm (%) và độ lệch điểm tuyệt đối để tránh nhàm chán trong văn phong.** Hãy diễn đạt một cách tự nhiên, ví dụ: "...tại 1381.12, thấp hơn 5.2% so với giá hiện tại" hoặc "...quanh 1392 điểm, cách giá đóng cửa hơn 65 điểm".
                * Các nhận xét đưa ra đều phải kèm theo số liệu của chỉ báo.
            * **Yêu cầu về văn phong và diễn đạt:**
                * Sử dụng văn phong **sắc bén, quyết đoán và có chiều sâu**.
                * **Sử dụng cấu trúc câu và từ vựng đa dạng.** Tránh lặp lại một mẫu câu hoặc một từ nhiều lần.
                * **Liên kết các câu văn một cách mượt mà** bằng các từ/cụm từ chuyển tiếp để tạo thành một dòng chảy phân tích liền mạch.
            * **Yêu cầu về định dạng và thuật ngữ:**
                * **TUYỆT ĐỐI KHÔNG được viết tên cột dữ liệu gốc (ví dụ: `WFIBO_0382`, `month_prev_high`). BẮT BUỘC phải diễn giải chúng sang ngôn ngữ phân tích chuyên nghiệp (ví dụ: 'ngưỡng Fibonacci 38.2% của khung tuần', 'đỉnh giá của tháng trước').**
                * **TUYỆT ĐỐI KHÔNG** bao gồm lời mở đầu như "Kính gửi Quý Khách hàng" hoặc "Dựa trên dữ liệu được cung cấp:", hãy bắt đầu ngay vào nội dung phân tích.
                * **LUÔN LUÔN** sử dụng ngày dạng dd/mm trong bài viết, ví dụ: "ngày 03/01" thay vì "ngày 2023-01-03".
"""
ta_vnindex_comment = generate_content_with_model_dict(standard_model_dict, prompt)

In [78]:
prompt = f"""
### **Phần 1: Bối cảnh và Diễn giải Dữ liệu (Kiến thức nền cho AI)**

Trước khi thực hiện nhiệm vụ, hãy nghiên cứu và hiểu rõ bản chất của bộ dữ liệu dưới đây.

#### **I. Tổng quan**
Bộ dữ liệu này thể hiện các **đường xu hướng** thị trường qua các khung thời gian khác nhau. Mục tiêu là cung cấp một cái nhìn đa chiều, giúp xác định sức mạnh, sự bền vững của xu hướng và các vùng cần chú ý đặc biệt.

#### **II. Cấu trúc Dữ liệu**
* `date`: Ngày ghi nhận dữ liệu.
* `trend_5p`: **Đường xu hướng** cho khung thời gian **tuần**.
* `trend_20p`: **Đường xu hướng** cho khung thời gian **tháng**.
* `trend_60p`: **Đường xu hướng** cho khung thời gian **quý**.

#### **III. Diễn giải Giá trị của các Đường xu hướng**
Tất cả các cột `trend_*` là giá trị thập phân từ 0 đến 1, **tương ứng với 0% đến 100%**. **Khi viết bài phân tích, bạn phải luôn chuyển đổi và sử dụng định dạng phần trăm (ví dụ: 0.62 sẽ được viết là 62%).**

* **Tiến về 100%**: Thể hiện một **xu hướng tăng** đang mạnh dần lên.
* **Tiến về 0%**: Thể hiện một **xu hướng giảm** đang mạnh dần lên.
* **Ngưỡng `80%`**: Một **vùng giá trị cao**, cho thấy đà tăng đã rất mạnh. Việc mua vào tại vùng này có thể gặp bất lợi về giá (mua đuổi) và cần sự thận trọng.
* **Ngưỡng `20%`**: Một vùng giá trị thấp và được xem là **vùng rủi ro cao**. Bán ra tại đây có rủi ro bán đúng đáy, trong khi việc mua vào cũng cần hết sức thận trọng vì xu hướng giảm có thể chưa kết thúc.

#### **IV. Các Nguyên tắc Phân tích Chính**
1.  **Nguyên tắc Chu kỳ:** Các đường xu hướng có xu hướng di chuyển theo chu kỳ giữa vùng giá trị thấp và cao.
2.  **Nguyên tắc Đồng pha:** Xu hướng bền vững khi có sự đồng thuận từ nhiều đường xu hướng.
3.  **Nguyên tắc Chi phối:** Khung thời gian lớn hơn sẽ chi phối biến động của khung nhỏ hơn, nếu xu hướng khung thời gian lớn đang tăng, khung nhỏ giảm thì đánh giá đây là nhịp giảm ngắn hạn.
4.  **Nguyên tắc Hỗ trợ/Kháng cự:** Các ngưỡng **20%** và **80%** là các mốc tâm lý quan trọng.

---

### **Phần 2: Yêu cầu Phân tích (Nhiệm vụ cần thực hiện)**

**Dữ liệu:**
{ms_vn_index_df.drop(columns=['trend_240p']).to_csv(index=False, sep='|', lineterminator='\n')}

**Vai trò**: Bạn là một nhà phân tích chiến lược thị trường cấp cao, với trách nhiệm đưa ra các phân tích và khuyến nghị cho khách hàng.
**Nhiệm vụ:** Dựa trên kiến thức về bộ dữ liệu và bảng dữ liệu được cung cấp, hãy viết một báo cáo phân tích xu hướng thị trường cho khách hàng trong tuần tới.
**Yêu cầu về cấu trúc và nội dung:** 
    *Báo cáo phải được trình bày chính xác trong hai đoạn văn ngắn gọn, không có lời chào hay các đề mục. 
    *Phải gồm **6 câu, mỗi câu dài khoảng 20 đến 25 từ** và được chia thành **2 đoạn văn riêng biệt**. Bắt đầu thẳng vào nội dung phân tích, không có lời chào.

    **Đoạn 1 (3 câu):**
        * **Câu 1:** Xác định thay đổi nổi bật nhất của xu hướng tuần trong phiên gần nhất và trong tuần vừa qua (5 phiên gần nhất).
        * **Câu 2:** Nêu ra sự biến động trong tuần của xu hướng tháng, đặc biệt là so sánh tương quan biến động với xu hướng tuần.
        * **Câu 3:** Xác định xem xu hướng quý đang ở vùng giá trị cao (> 70%) hãy thấp (< 30%), đưa ra nhận định xem xu hướng này đang có hỗ trợ cho xu hướng tuần hoặc xu hướng tháng hay không:
            * Nếu xu hướng quý ở vùng giá trị cao thì nó sẽ hỗ trợ cho xu hường tăng của tuần và tháng (cản trở xu hướng giảm của tuần và tháng).
            * Nếu xu hướng quý ở vùng giá trị thấp thì nó sẽ hỗ trợ cho xu hướng giảm của tuần và tháng (cản trở xu huong tăng của tuần và tháng).
            * Nếu xu huớng quý ở vùng giá trị trung tính (30% < x < 70%) thì nó sẽ không hỗ trợ cho xu hướng tuần và tháng. Trong trường hợp này chỉ liệt kê biến động của xu hươngs quý trong tuần vừa qua.

    **Đoạn 2 (3 câu):** Đoạn văn đầu tiên phải tập trung vào hiện trạng và luận giải. 
        * **Câu 4:** Luận giải về mối quan hệ giữa các xu hướng này và kết luận xem chúng đang tuần theo nguyên tắc nào (đồng thuận, phân kì, chi phối). Phải giải thích chi tiết mỗi nguyên tắc trong trường hợp cụ thể hiện tại, ko chỉ nêu ra tên.
        * **Câu 5:** Đưa ra một kết luận sắc bén về bản chất thị trường hiện tại và xu hướng ngắn hạn trong thời gian tới.
        * **Câu 6:** Đề xuất một chiến lược hành động duy nhất, rõ ràng và quyết đoán cho tuần tới, dựa trên các phân tích ở trên.

**Yêu cầu về ngôn ngữ và trình bày:**

* **Sử dụng thuật ngữ đa dạng:** Hạn chế lặp lại nguyên văn tên các đường xu hướng.
* **Yêu cầu về văn phong và diễn đạt:**
    * Sử dụng văn phong **sắc bén, quyết đoán và có chiều sâu**.
    * **Sử dụng cấu trúc câu và từ vựng đa dạng.** Tránh lặp lại một mẫu câu hoặc một từ nhiều lần.
    * **Liên kết các câu văn một cách mượt mà** bằng các từ/cụm từ chuyển tiếp để tạo thành một dòng chảy phân tích liền mạch.
* **Trích dẫn số liệu:** Các nhận xét phải kèm theo số liệu dưới **định dạng phần trăm**.
* **Định dạng và Thuật ngữ:**
    * **TUYỆT ĐỐI KHÔNG** được viết tên cột dữ liệu gốc (ví dụ: `trend_5p`).
    * **TUYỆT ĐỐI KHÔNG SỬ DỤNG TỪ 'CHỈ BÁO' (INDICATOR).** Đây là các **'đường xu hướng' (trend lines)**. Hãy luôn sử dụng đúng thuật ngữ này.
    * **TUYỆT ĐỐI KHÔNG** bao gồm lời mở đầu hoặc kết thúc.
    * **LUÔN LUÔN** sử dụng ngày dạng dd/mm trong bài viết, ví dụ: "ngày 03/01" thay vì "ngày 2023-01-03".
    * **LUÔN LUÔN** sử dụng từ "vùng giá trị cao/thấp" thay vì "vùng cao/thấp".
    """

ms_chart_comment = generate_content_with_model_dict(standard_model_dict, prompt)

#### Khối ngoại và tự doanh

- Lịch sử mua bán ròng trong tuần

In [79]:
weekly_nntd_history_df = nntd_index_df[nntd_index_df['ticker'].isin(['VNINDEX','HNXINDEX', 'UPINDEX'])].drop(columns=['ticker'])
weekly_nntd_history_df = weekly_nntd_history_df.groupby(['date', 'type']).sum().sort_values('date', ascending=False).reset_index()
latest_dates = weekly_nntd_history_df['date'].drop_duplicates().sort_values(ascending=False).head(5)
weekly_nntd_history_df = weekly_nntd_history_df[weekly_nntd_history_df['date'].isin(latest_dates)]
weekly_nntd_history_df[[col for col in weekly_nntd_history_df.columns if '_volume' in col]] = \
    weekly_nntd_history_df[[col for col in weekly_nntd_history_df.columns if '_volume' in col]] / 1000000

- Top cổ phiếu mua bán ròng

In [80]:
temp_df_list = []

for stock_type in ['NN', 'TD']:
    type_df = pd.DataFrame()
    
    for ticker in nntd_stock_df['ticker'].unique():
        temp_df = nntd_stock_df[(nntd_stock_df['ticker'] == ticker) & (nntd_stock_df['type'] == stock_type)]
        temp_df = temp_df.sort_values('date', ascending=False).reset_index(drop=True)
        
        if len(temp_df) == 0:
            continue
            
        temp_df['weekly_value'] = temp_df['net_value'][::-1].rolling(window=5, min_periods=1).sum()[::-1]
        type_df = pd.concat([type_df, temp_df[['type', 'ticker', 'weekly_value']].iloc[[0]]], ignore_index=True)
    
    type_df = type_df.sort_values('weekly_value', ascending=False).reset_index(drop=True)
    temp_df_list.append(pd.concat([type_df.head(10), type_df.tail(10)], ignore_index=True))

# Gán kết quả và tổng hợp
weekly_nntd_stock_df = pd.concat(temp_df_list, ignore_index=True)
weekly_nntd_stock_df['top_check'] = (weekly_nntd_stock_df['weekly_value'] > 0).astype(int)
weekly_nntd_stock_df['weekly_value'] = abs(weekly_nntd_stock_df['weekly_value'])

#### Biến động vốn hoá

In [81]:
# --- PHẦN 1: TÍNH TOÁN NET_CAP CHO TỪNG CỔ PHIẾU ---
open_week_date = full_stock_df['date'].min()
close_week_date = full_stock_df['date'].max()

open_week_stock_cap_df = full_stock_df[full_stock_df['date'] == open_week_date][['ticker', 'cap']].rename(columns={'cap': 'open_cap'})
close_week_stock_cap_df = full_stock_df[full_stock_df['date'] == close_week_date][['ticker', 'cap']].rename(columns={'cap': 'close_cap'})

stock_cap_df = pd.merge(open_week_stock_cap_df, close_week_stock_cap_df, on='ticker', how='outer')
stock_cap_df.fillna({'open_cap': 0, 'close_cap': 0}, inplace=True)
stock_cap_df['net_cap'] = stock_cap_df['close_cap'] - stock_cap_df['open_cap']
stock_cap_df['industry'] = stock_cap_df['ticker'].map(full_stock_classification_df.set_index('ticker')['industry_name']).map(name_map_dict)
stock_cap_df = stock_cap_df.sort_values('net_cap', ascending=False).reset_index(drop=True)

# --- PHẦN 2: TÍNH TOÁN TỔNG LỰC KÉO/ĐẨY TOÀN THỊ TRƯỜNG ---
# Vẫn tính toán các giá trị này như biến thông thường để sử dụng
gainers_df = stock_cap_df[stock_cap_df['net_cap'] > 0]
losers_df = stock_cap_df[stock_cap_df['net_cap'] < 0]

cap_gain = gainers_df['net_cap'].sum()
cap_loss = abs(losers_df['net_cap'].sum()) # Dùng abs() để mẫu số luôn dương

# --- PHẦN 3: TỔNG HỢP DỮ LIỆU THỊ TRƯỜNG, NGÀNH, CỔ PHIẾU ---
# 3.1. Tổng hợp cho toàn thị trường
market_cap_sum = stock_cap_df.select_dtypes(include=[np.number]).sum(axis=0)
change_market_cap_df = pd.DataFrame([market_cap_sum])
change_market_cap_df['ticker'] = 'Thị trường'
change_market_cap_df['type'] = 'market'

# 3.2. Tổng hợp cho các ngành
change_industry_cap_df = (
    stock_cap_df
    .drop(columns=['ticker'])
    .groupby('industry').sum().reset_index()
    .rename(columns={'industry': 'ticker'})
    .sort_values('net_cap', ascending=False)
)
change_industry_cap_df['type'] = 'industry'

# 3.3. Tổng hợp cho top cổ phiếu
change_stock_cap_df = pd.concat([
    stock_cap_df.head(5).drop(columns=['industry']),
    stock_cap_df.tail(5).drop(columns=['industry'])],
    ignore_index=True
)
change_stock_cap_df['type'] = 'stock'

# 3.4. Ghép các bảng lại
market_cap_change_df = pd.concat([change_market_cap_df, change_industry_cap_df, change_stock_cap_df], ignore_index=True)

# --- PHẦN 4: TÍNH TOÁN CÁC CHỈ SỐ CUỐI CÙNG --- ## MODIFIED ##
# ## NEW ##: Thêm 2 cột mới để chứa giá trị tổng lực kéo và đẩy
# Các giá trị này sẽ được lặp lại trên tất cả các hàng
market_cap_change_df['cap_gain'] = cap_gain
market_cap_change_df['cap_loss'] = cap_loss

# Tính % thay đổi vốn hóa (giữ nguyên)
market_cap_change_df['change_cap'] = np.divide(
    (market_cap_change_df['close_cap'] - market_cap_change_df['open_cap']),
    market_cap_change_df['open_cap']
)
market_cap_change_df['change_cap'].replace([np.inf, -np.inf], 0, inplace=True)

# Tính toán tác động Kéo/Đẩy
market_cap_change_df['impact_group'] = 'Không đổi'
market_cap_change_df['impact_ratio'] = 0.0

# Áp dụng logic cho nhóm "positive"
gainers_mask = market_cap_change_df['net_cap'] > 0
market_cap_change_df.loc[gainers_mask, 'impact_group'] = 'positive'
# ## MODIFIED ##: Chia cho cột 'cap_gain' thay vì biến
market_cap_change_df.loc[gainers_mask, 'impact_ratio'] = market_cap_change_df.apply(lambda x: 
    (x['net_cap'] / x['cap_gain']) * (x['cap_gain'] / (x['cap_gain'] + x['cap_loss'])) , axis=1)

# Áp dụng logic cho nhóm "negative"
losers_mask = market_cap_change_df['net_cap'] < 0
market_cap_change_df.loc[losers_mask, 'impact_group'] = 'nagative' # "nagative" -> "negative"
# ## MODIFIED ##: Chia cho cột 'cap_loss' thay vì biến
market_cap_change_df.loc[losers_mask, 'impact_ratio'] = market_cap_change_df.apply(lambda x: 
    (x['net_cap'] / x['cap_loss']) * (x['cap_loss'] / (x['cap_gain'] + x['cap_loss'])) , axis=1)

# Xử lý riêng cho dòng 'Thị trường'
market_mask = market_cap_change_df['type'] == 'market'
market_cap_change_df.loc[market_mask, 'impact_group'] = 'neutral'
market_cap_change_df.loc[market_mask, 'impact_ratio'] = 1.0

# ## MODIFIED ##: Sắp xếp lại các cột cuối cùng, thêm 2 cột mới vào
market_cap_change_df = market_cap_change_df[[
    'type', 'ticker', 'open_cap', 'close_cap', 
    'cap_gain', 'cap_loss', 'net_cap', 'change_cap',
    'impact_group', 'impact_ratio'
]]

### Phần danh mục khuyến nghị

In [82]:
weekly_portfolio_df = pd.read_excel('../data/weekly/cts_portfolio.xlsx')
weekly_portfolio_df['industry'] = weekly_portfolio_df['ticker'].map(full_stock_classification_df.set_index('ticker')['industry_name']).map(name_map_dict)

t5_pct_change_list = []
for ticker in weekly_portfolio_df['ticker'].unique():
    temp_df = full_stock_df[full_stock_df['ticker'] == ticker]
    temp_df['t5_pct_change'] = temp_df['close'][::-1].pct_change(4).fillna(0)[::-1]
    t5_pct_change_list.append(temp_df['t5_pct_change'].iloc[0])

#Ghép các cột thông tin
ref_stock_df = origin_stock_df[origin_stock_df['date'] == max(origin_stock_df['date'])].set_index('ticker')
weekly_portfolio_df = weekly_portfolio_df.set_index('ticker')

# Các cột biến động
weekly_portfolio_df['current_price'] = ref_stock_df['close']
weekly_portfolio_df['t5_pct_change'] = t5_pct_change_list
weekly_portfolio_df['mean_vol'] = origin_stock_df.groupby('ticker')['vol_ratio'].mean()

# Các cột khoảng cách giá trị kỹ thuật
weekly_portfolio_df['distance_mopen'] = (ref_stock_df['close'] - ref_stock_df['month_open']) / ref_stock_df['month_open']
weekly_portfolio_df['distance_mhigh_prev'] = (ref_stock_df['close'] - ref_stock_df['month_prev_high']) / ref_stock_df['month_prev_high']
weekly_portfolio_df['distance_mlow_prev'] = (ref_stock_df['close'] - ref_stock_df['month_prev_low']) / ref_stock_df['month_prev_low']
weekly_portfolio_df['distance_yopen'] = (ref_stock_df['close'] - ref_stock_df['year_open']) / ref_stock_df['year_open']
weekly_portfolio_df['distance_yhigh_prev'] = (ref_stock_df['close'] - ref_stock_df['year_prev_high']) / ref_stock_df['year_prev_high']
weekly_portfolio_df['distance_ylow_prev'] = (ref_stock_df['close'] - ref_stock_df['year_prev_low']) / ref_stock_df['year_prev_low']

weekly_portfolio_df = weekly_portfolio_df.reset_index()

# Chuyển đổi các cột giá trị sang kiểu số và xử lý NaN/Inf
for col in weekly_portfolio_df.columns[2:]:
    weekly_portfolio_df[col] = pd.to_numeric(weekly_portfolio_df[col], errors='coerce')
    weekly_portfolio_df[col] = weekly_portfolio_df[col].replace([np.inf, -np.inf], np.nan)
    weekly_portfolio_df[col] = weekly_portfolio_df[col].round(6)

# Sắp xếp theo 'industry' trước, sau đó đến 't5_pct_change' giảm dần
weekly_portfolio_df = weekly_portfolio_df.sort_values(['industry', 't5_pct_change'], ascending=[True, False]).reset_index(drop=True)

### Lưu vào MSSQL


In [83]:
weekly_data_comments_df = pd.DataFrame(
    {
        "type":     ["vn", "international", "other", "ta_vnindex", "ms_chart", "update_time"],
        "group":    ["news", "news", "news", "chart", "chart", "time"],
        "comment": [
            vn_comment,
            international_comment,
            other_comment,
            ta_vnindex_comment,
            ms_chart_comment,
            time_series["date"].max().strftime("%H:%M ngày %d/%m/%Y"),
        ],
    }
)

In [84]:
%%capture
save_to_mssql(cts_engine, weekly_history_data_df, 'weekly_history_data')
save_to_mssql(cts_engine, weekly_nntd_history_df, 'weekly_nntd_history')
save_to_mssql(cts_engine, weekly_nntd_stock_df, 'weekly_nntd_stock')
save_to_mssql(cts_engine, weekly_ms_index_df, 'weekly_ms_index')
save_to_mssql(cts_engine, weekly_data_comments_df, 'weekly_data_comments')
save_to_mssql(cts_engine, market_cap_change_df, 'market_cap_change')
save_to_mssql(cts_engine, weekly_portfolio_df, 'weekly_portfolio')