In [2]:
pip install jupyterlab


[0mNote: you may need to restart the kernel to use updated packages.


In [3]:
!python -m pip install --upgrade pip


[0m

In [4]:
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
!pip install transformers sentencepiece
!pip install tiktoken pytesseract PyMuPDF numpy pandas scikit-learn matplotlib seaborn yfinance
!pip install pythainlp


Looking in indexes: https://download.pytorch.org/whl/cu117
[0m

In [5]:
import torch
print("GPU Available:", torch.cuda.is_available())
print("Device Name:", torch.cuda.get_device_name(0) if torch.cuda.is_available() else "CPU")


GPU Available: True
Device Name: Tesla V100-SXM2-32GB


In [6]:
import os
os.environ['TYPHOON_API_KEY'] = 'sk-oHvFDpRkCC1dCMwOvMqInFpCRWJqvgk3sVASJ6k00ys3fVl8'
os.environ['SETSMART_API_KEY'] = '65322b83-2986-4471-8efd-43a761d49aad'
os.environ['GEMINI_API_KEY'] = 'AIzaSyDklUcezZsxJ-9K4_G-LlwcmF0zp7qLF6E'

In [7]:
!pip install --upgrade pip
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
!pip install transformers pandas numpy matplotlib seaborn pytesseract pythainlp yfinance scipy fitz Pillow
!apt-get install -y libpoppler-cpp-dev tesseract-ocr tesseract-ocr-tha
!pip install python-magic


[0mLooking in indexes: https://download.pytorch.org/whl/cu118
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
tesseract-ocr is already the newest version (4.1.1-2.1build1).
tesseract-ocr-tha is already the newest version (1:4.00~git30-7274cfa-1.1).
libpoppler-cpp-dev is already the newest version (22.02.0-2ubuntu0.5).
0 upgraded, 0 newly installed, 0 to remove and 118 not upgraded.
[0m

In [8]:
pip install --upgrade pythainlp


[0mNote: you may need to restart the kernel to use updated packages.


In [10]:
pip install PyMuPDF

[0mNote: you may need to restart the kernel to use updated packages.


In [15]:
!apt-get update
!apt-get install -y libpoppler-cpp-dev 
!apt-get install -y tesseract-ocr
!apt-get install -y tesseract-ocr-tha

Hit:1 http://security.ubuntu.com/ubuntu jammy-security InRelease
Hit:2 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64  InRelease
Hit:3 http://archive.ubuntu.com/ubuntu jammy InRelease              
Hit:4 https://ppa.launchpadcontent.net/deadsnakes/ppa/ubuntu jammy InRelease
Hit:5 http://archive.ubuntu.com/ubuntu jammy-updates InRelease
Hit:6 http://archive.ubuntu.com/ubuntu jammy-backports InRelease
Reading package lists... Done
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
libpoppler-cpp-dev is already the newest version (22.02.0-2ubuntu0.5).
0 upgraded, 0 newly installed, 0 to remove and 118 not upgraded.
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
tesseract-ocr is already the newest version (4.1.1-2.1build1).
0 upgraded, 0 newly installed, 0 to remove and 118 not upgraded.
Reading package lists... Done
Building dependency tree... Done
Reading state info

In [11]:
# -*- coding: utf-8 -*-
import fitz  # PyMuPDF
import re
from transformers import pipeline
import requests
import numpy as np
import pandas as pd
import yfinance as yf
from typing import Dict, Optional, Tuple, List, Any
from dataclasses import dataclass
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
import os
from datetime import datetime
from PIL import Image
import pytesseract
import io

import pythainlp
from pythainlp.tokenize import word_tokenize
from pythainlp.util import normalize

warnings.filterwarnings('ignore')

sns.set(style='whitegrid')

# Data Classes
@dataclass
class FinancialMetrics:
    basic_metrics: Dict[str, float]
    technical_indicators: Dict[str, Any]
    risk_metrics: Dict[str, float]
    statistical_metrics: Dict[str, Any]

@dataclass
class IndustryAnalysis:
    industry_type: str
    key_indicators: List[str]
    study_topics: List[str]
    peer_companies: List[str]
    industry_metrics: Dict[str, float]

@dataclass
class FinancialData:
    symbol: str
    prices: np.ndarray
    returns: np.ndarray
    dates: np.ndarray
    volume: np.ndarray
    market_cap: float
    sector: str
    financial_metrics: Optional[FinancialMetrics] = None

class MarketData:
    def __init__(self):
        self.market_index = "^SET.BK"
        self.cache = {}

    def get_stock_data(self, symbol: str, period: str = "1y") -> Optional[FinancialData]:
        print(f"\nดึงข้อมูลหุ้นสำหรับ {symbol}")
        try:
            if symbol in self.cache:
                print(f"ใช้ข้อมูลที่แคชไว้สำหรับ {symbol}")
                return self.cache[symbol]

            stock = yf.Ticker(symbol)
            hist = stock.history(period=period)

            if hist.empty:
                raise ValueError(f"ไม่พบข้อมูลสำหรับ {symbol}")

            info = stock.info
            data = FinancialData(
                symbol=symbol,
                prices=hist['Close'].values,
                returns=hist['Close'].pct_change().dropna().values,
                dates=hist.index.values,
                volume=hist['Volume'].values,
                market_cap=info.get('marketCap', 0),
                sector=info.get('sector', 'Unknown')
            )

            self.cache[symbol] = data
            print(f"ดึงข้อมูลสำเร็จสำหรับ {symbol}")
            return data

        except Exception as e:
            print(f"Error fetching data for {symbol}: {e}")
            return None

class AdvancedFinancialAnalyzer:
    def __init__(self, api_key: Optional[str] = None):
        self.api_key = api_key
        print("กำลังโหลดโมเดลจำแนกประเภท...")
        self.classifier = pipeline(
            "zero-shot-classification",
            model="joeddav/xlm-roberta-large-xnli",
            tokenizer="joeddav/xlm-roberta-large-xnli",
            device='cpu'
        )
        self.market_data = MarketData()

    def extract_text_from_pdf(self, file_path: str) -> Optional[str]:
        """Extract and clean text from PDF"""
        print(f"\nกำลังดึงข้อความจากไฟล์ PDF: {file_path}")
        try:
            text = ""
            with fitz.open(file_path) as pdf:
                for page_num in range(len(pdf)):
                    page = pdf[page_num]
                    page_text = page.get_text()
                    if page_text.strip():
                        # ถ้ามีข้อความอยู่แล้ว
                        text += page_text
                    else:
                        # ถ้าไม่มีข้อความ ให้ใช้ OCR
                        pix = page.get_pixmap()
                        img_data = pix.tobytes("png")
                        img = Image.open(io.BytesIO(img_data))
                        ocr_text = pytesseract.image_to_string(img, lang='tha+eng')
                        text += ocr_text
            cleaned_text = self._clean_text(text) if text else None
            print("\nข้อความหลังทำความสะอาด:")
            print(cleaned_text[:500])  # แสดงข้อความที่ทำความสะอาดแล้ว (500 ตัวอักษรแรก)
            return cleaned_text
        except Exception as e:
            print(f"PDF extraction error: {e}")
            return None

    def _clean_text(self, text: str) -> str:
        """Clean and normalize text while preserving important financial information"""
        print("\nกำลังทำความสะอาดข้อความ...")
        # Remove extra whitespace
        text = re.sub(r'\s+', ' ', text)

        # Preserve financial numbers and symbols and Thai characters
        # Remove unwanted characters but preserve Thai characters and common punctuation
        text = re.sub(r'[^\w\s$.,%-]', '', text, flags=re.UNICODE)

        # Normalize numerical formats
        text = re.sub(r'(\d),(\d)', r'\1\2', text)
        print("ทำความสะอาดข้อความสำเร็จ")
        return text.strip()

    def find_stock_symbol(self, text: str) -> Optional[str]:
        """Find stock symbol using Typhoon API"""
        print("\nกำลังค้นหาสัญลักษณ์หุ้นจากข้อความ...")
        if not self.api_key:
            print("ไม่สามารถค้นหาสัญลักษณ์หุ้นได้เนื่องจากไม่ได้ตั้งค่า Typhoon API Key")
            return None

        prompt = f"จากข้อความต่อไปนี้ คุณทราบสัญลักษณ์หุ้นของบริษัทนี้ใน yfinance หรือไม่:\n\n{text[:2000]}"

        response = self._call_typhoon_api(prompt)
        if response:
            answer = response['choices'][0]['message']['content']
            print(f"\nคำตอบจาก Typhoon API:\n{answer}")
            # ใช้ Regular Expression เพื่อค้นหาสัญลักษณ์หุ้น
            symbol_match = re.search(r'สัญลักษณ์หุ้น.*?คือ\s*"?([A-Z]{1,5}(?:\.BK)?)"?', answer)
            if symbol_match:
                symbol = symbol_match.group(1)
                # เพิ่ม ".BK" หากเป็นหุ้นไทยและไม่มีนามสกุล
                if '.BK' not in symbol and symbol.isupper():
                    symbol += '.BK'
                print(f"\nพบสัญลักษณ์หุ้น: {symbol}")
                return symbol
            else:
                print("ไม่สามารถดึงสัญลักษณ์หุ้นจากคำตอบของ Typhoon")
                return None
        else:
            return None

    def analyze_company(self, text: str) -> Tuple[str, Dict[str, Any]]:
        """Comprehensive company analysis"""
        # Try to find stock symbol
        symbol = self.find_stock_symbol(text)
        if not symbol:
            print("ไม่สามารถระบุสัญลักษณ์หุ้นได้")
            stock_data = None
        else:
            # Get market data
            stock_data = self.market_data.get_stock_data(symbol)
            if stock_data is None:
                print(f"ไม่สามารถดึงข้อมูลหุ้น {symbol} ได้")

        # Industry Classification
        industry = self._classify_industry(text)

        # เพิ่มการแนะนำหลังจากจำแนกประเภทธุรกิจ
        print(f"\nบริษัทนี้อยู่ในอุตสาหกรรม: {industry}")
        print("คุณควรศึกษาปัจจัยเฉพาะของอุตสาหกรรมนี้เพิ่มเติมเพื่อการตัดสินใจลงทุน")

        # Calculate financial metrics if stock data is available
        if stock_data:
            financial_metrics = self._calculate_financial_metrics(stock_data)
        else:
            financial_metrics = None

        # Industry analysis
        industry_analysis = self._analyze_industry_specifics(text, industry, symbol)

        # Get AI recommendations
        ai_analysis = self._get_ai_analysis(text, industry, financial_metrics)

        return industry, {
            'symbol': symbol,
            'financial_metrics': financial_metrics,
            'industry_analysis': industry_analysis,
            'ai_recommendations': ai_analysis,
            'stock_data': stock_data
        }

    def _classify_industry(self, text: str) -> str:
        """Classify company industry using Typhoon summarization and zero-shot classification"""
        print("\nกำลังสรุปข้อความเพื่อจำแนกประเภทอุตสาหกรรม...")

        # สรุปข้อความ
        summary = self._summarize_with_typhoon(text)
        if not summary:
            summary = text[:1024]  # ใช้ข้อความเดิมหากสรุปไม่สำเร็จ
        print(f"\nสรุปข้อความ:\n{summary}")

        # ดึงข้อมูลสำคัญ
        key_info = self._extract_key_info(text)
        if key_info:
            print(f"\nข้อมูลสำคัญที่ดึงได้:\n{key_info}")
            text_for_classification = key_info
        else:
            text_for_classification = summary

        # Extract industries from key info
        dynamic_labels = self._extract_industries_from_text(text_for_classification)
        if not dynamic_labels:
            dynamic_labels = ['ธนาคาร', 'ก่อสร้าง', 'เทคโนโลยี', 'สุขภาพ', 'พลังงาน', 'อสังหาริมทรัพย์', 'การขนส่ง', 'การสื่อสาร', 'การเกษตร', 'อาหาร', 'การท่องเที่ยว', 'ค้าปลีก', 'การผลิต', 'การเงิน', 'สื่อ', 'บันเทิง', 'เคมีภัณฑ์']

        print(f"\nLabels สำหรับการจำแนกประเภท: {dynamic_labels}")

        print("\nกำลังจำแนกประเภทอุตสาหกรรม...")
        result = self.classifier(text_for_classification, candidate_labels=dynamic_labels, hypothesis_template="นี่คือข้อความเกี่ยวกับ {}.")
        industry = result['labels'][0]
        print(f"\nประเภทอุตสาหกรรมที่จำแนกได้: {industry}")
        return industry

    def _summarize_with_typhoon(self, text: str) -> Optional[str]:
        """Summarize text using Typhoon API"""
        if not self.api_key:
            print("ไม่สามารถสรุปข้อความด้วย Typhoon API ได้เนื่องจากไม่ได้ตั้งค่า API Key")
            return None

        # Payload สำหรับการสรุปข้อความ - ต้องการความหลากหลาย
        summary_payload = {
            "model": "typhoon-v1.5x-70b-instruct",
            "messages": [{"role": "user", "content": f"กรุณาสรุปสาระสำคัญของข้อความต่อไปนี้ให้ครบถ้วน:\n\n{text[:2000]}"}],
            "temperature": 0.3,
            "max_tokens": 1024,
            "top_p": 0.9,
            "top_k": 30 # เพิ่มความหลากหลาย
        }

        response = self._call_typhoon_api(summary_payload)
        if response:
            summary = response['choices'][0]['message']['content'].strip()
            return summary
        else:
            return None

    def _extract_key_info(self, text: str) -> Optional[str]:
        """Extract key information using Typhoon API"""
        if not self.api_key:
            print("ไม่สามารถดึงข้อมูลสำคัญได้เนื่องจากไม่ได้ตั้งค่า API Key")
            return None

        # Payload สำหรับดึงข้อมูลสำคัญ - ต้องการความแม่นยำ
        info_payload = {
            "model": "typhoon-v1.5x-70b-instruct",
            "messages": [{"role": "user", "content": f"กรุณาระบุข้อมูลสำคัญเกี่ยวกับธุรกิจและอุตสาหกรรมจากข้อความนี้:\n\n{text[:2000]}"}],
            "temperature": 0.2,  # ลด temperature ให้ได้ข้อมูลที่แน่นอน
            "max_tokens": 1024,
            "top_p": 0.7,
            "top_k": 10  # เน้นความแม่นยำ
        }

        response = self._call_typhoon_api(info_payload)
        if response:
            key_info = response['choices'][0]['message']['content'].strip()
            return key_info
        else:
            return None

    def _extract_industries_from_text(self, text: str) -> List[str]:
        """Extract potential industry types from text using NLP techniques"""
        # ทำการตัดคำและลบคำซ้ำ
        words = set(word_tokenize(normalize(text), engine='newmm'))

        # คำที่เกี่ยวข้องกับประเภทธุรกิจทั่วไป
        common_industry_terms = [
            'ธนาคาร', 'ก่อสร้าง', 'เทคโนโลยี', 'สุขภาพ', 'พลังงาน', 'อสังหาริมทรัพย์',
            'การขนส่ง', 'การสื่อสาร', 'การเกษตร', 'อาหาร', 'การท่องเที่ยว',
            'ค้าปลีก', 'การผลิต', 'การเงิน', 'สื่อ', 'บันเทิง', 'เคมีภัณฑ์',
            # เพิ่มเติมคำอื่น ๆ ที่เกี่ยวข้อง
        ]

        # สกัดคำที่ตรงกับประเภทธุรกิจ
        extracted_industries = [word for word in words if word in common_industry_terms]

        # ลบคำซ้ำและคืนค่าเป็นรายการ
        return list(set(extracted_industries))

    def _calculate_financial_metrics(self, stock_data: FinancialData) -> FinancialMetrics:
        """Calculate comprehensive financial metrics"""
        print("\nกำลังคำนวณตัวชี้วัดทางการเงิน...")
        prices = stock_data.prices
        returns = stock_data.returns

        financial_metrics = FinancialMetrics(
            basic_metrics=self._calculate_basic_metrics(stock_data),
            technical_indicators=self._calculate_technical_indicators(prices),
            risk_metrics=self._calculate_risk_metrics(returns),
            statistical_metrics=self._calculate_statistical_metrics(returns)
        )
        print("\nคำนวณตัวชี้วัดทางการเงินสำเร็จ")
        return financial_metrics

    def _calculate_basic_metrics(self, stock_data: FinancialData) -> Dict[str, float]:
        """Calculate basic financial ratios"""
        print(" - กำลังคำนวณอัตราส่วนทางการเงินพื้นฐาน...")
        try:
            current_price = stock_data.prices[-1]
            basic_metrics = {
                'price': current_price,
                'market_cap': stock_data.market_cap,
                'pe_ratio': self._safe_calc(lambda: current_price / self._get_eps(stock_data.symbol)),
                'pb_ratio': self._safe_calc(lambda: current_price / self._get_book_value(stock_data.symbol)),
                'roe': self._safe_calc(lambda: self._get_net_income(stock_data.symbol) / self._get_equity(stock_data.symbol))
            }
            print(f"\nอัตราส่วนทางการเงินพื้นฐาน: {basic_metrics}")
            return basic_metrics
        except Exception as e:
            print(f"Error calculating basic metrics: {e}")
            return {}

    def _calculate_technical_indicators(self, prices: np.ndarray) -> Dict[str, Any]:
        """Calculate technical analysis indicators"""
        print(" - กำลังคำนวณตัวชี้วัดทางเทคนิค...")
        try:
            technical_indicators = {
                'rsi': self._calculate_rsi(prices),
                'macd': self._calculate_macd(prices),
                'bollinger_bands': self._calculate_bollinger_bands(prices),
                'moving_averages': {
                    'ma20': np.mean(prices[-20:]),
                    'ma50': np.mean(prices[-50:]),
                    'ma200': np.mean(prices[-200:])
                }
            }
            print(f"\nตัวชี้วัดทางเทคนิค: {technical_indicators}")
            return technical_indicators
        except Exception as e:
            print(f"Error calculating technical indicators: {e}")
            return {}

    def _calculate_risk_metrics(self, returns: np.ndarray) -> Dict[str, float]:
        """Calculate risk and performance metrics"""
        print(" - กำลังคำนวณตัวชี้วัดความเสี่ยง...")
        try:
            risk_metrics = {
                'volatility': np.std(returns) * np.sqrt(252),
                'var_95': np.percentile(returns, 5),
                'cvar_95': np.mean(returns[returns <= np.percentile(returns, 5)]),
                'sharpe_ratio': np.mean(returns) / np.std(returns) * np.sqrt(252),
                'sortino_ratio': np.mean(returns) / np.std(returns[returns < 0]) * np.sqrt(252)
            }
            print(f"\nตัวชี้วัดความเสี่ยง: {risk_metrics}")
            return risk_metrics
        except Exception as e:
            print(f"Error calculating risk metrics: {e}")
            return {}

    def _calculate_statistical_metrics(self, returns: np.ndarray) -> Dict[str, Any]:
        """Calculate statistical properties"""
        print(" - กำลังคำนวณตัวชี้วัดสถิติ...")
        try:
            # Stationarity test
            adf_stat, adf_pvalue = stats.adfuller(returns)[:2]

            # Normality tests
            shapiro_stat, shapiro_pvalue = stats.shapiro(returns)

            statistical_metrics = {
                'stationarity': {
                    'adf_statistic': adf_stat,
                    'adf_pvalue': adf_pvalue
                },
                'normality': {
                    'shapiro_statistic': shapiro_stat,
                    'shapiro_pvalue': shapiro_pvalue
                },
                'skewness': stats.skew(returns),
                'kurtosis': stats.kurtosis(returns)
            }
            print(f"\nตัวชี้วัดสถิติ: {statistical_metrics}")
            return statistical_metrics
        except Exception as e:
            print(f"Error calculating statistical metrics: {e}")
            return {}

    def _get_ai_analysis(self, text: str, industry: str, metrics: Optional[FinancialMetrics]) -> Dict[str, Any]:
        """Get AI-powered analysis and recommendations"""
        if not self.api_key:
            print("ไม่สามารถขอคำแนะนำจาก Typhoon API ได้เนื่องจากไม่ได้ตั้งค่า API Key")
            return {}

        print("\nกำลังขอคำแนะนำจาก Typhoon API...")
        # ใช้ Prompt ตามที่คุณต้องการ
        investment_factors_prompt = f"จากข้อมูลนี้ หากต้องการลงทุนในบริษัทนี้ ควรพิจารณาปัจจัยใดบ้างเพื่อทำการตัดสินใจในการลงทุน?"
        indicators_prompt = f"สำหรับธุรกิจในอุตสาหกรรม {industry} กรุณาแนะนำตัวชี้วัดทางการเงินที่ควรศึกษาเพิ่มเติมในการประเมินการลงทุน"

        # ดึงตัวเลขทางการเงินสำคัญจากข้อความ
        financial_numbers = self.extract_financial_numbers(text)
        print("\nตัวเลขทางการเงินที่ดึงได้จากข้อความ:")
        print(financial_numbers)

        # รวม Prompt และข้อมูลทางการเงิน
        trimmed_text = "\n".join(financial_numbers)[:2000]
        full_prompt = f"""
นี่คือข้อมูลทางการเงินที่สรุปแล้วจากเอกสาร:
{trimmed_text}

{investment_factors_prompt}

{indicators_prompt}
"""

        # ส่งไปยัง Typhoon API
        response = self._call_typhoon_api({
            "model": "typhoon-v1.5x-70b-instruct",
            "messages": [{"role": "user", "content": full_prompt}],
            "temperature": 0.3,  # ค่า temperature ปกติสำหรับคำแนะนำ
            "max_tokens": 1024,
            "top_p": 0.9,
            "top_k": 0,
            "repetition_penalty": 1.05,
            "min_p": 0
        })

        if response:
            summary = response['choices'][0]['message']['content']
            print(f"\nคำแนะนำจาก Typhoon API:\n{summary}")
            return {
                'summary': summary,
                'confidence': response.get('confidence', 0.0),
                'timestamp': datetime.now().isoformat()
            }
        else:
            return {}

    def extract_financial_numbers(self, text: str) -> List[str]:
        """Extract important financial numbers from text"""
        pattern = r'([ก-๙a-zA-Z ]+)\s+([\d,]+\.\d{2}|\d+,?\d*)'
        matches = re.findall(pattern, text)
        return [f"{item.strip()}: {value.strip()}" for item, value in matches]

    def _call_typhoon_api(self, payload: Dict) -> Optional[Dict]:
        """Call Typhoon API with error handling"""
        print("\nเรียกใช้งาน Typhoon API...")
        endpoint = 'https://api.opentyphoon.ai/v1/chat/completions'
        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }

        try:
            response = requests.post(endpoint, json=payload, headers=headers)
            response.raise_for_status()
            print("เรียกใช้งาน Typhoon API สำเร็จ")
            return response.json()
        except Exception as e:
            print(f"API call error: {e}")
            return None

    def generate_investment_report(self, file_path: str):
        """Generate comprehensive investment report"""
        text = self.extract_text_from_pdf(file_path)
        if not text:
            print("ไม่สามารถวิเคราะห์เอกสารได้")
            return

        try:
            industry, analysis = self.analyze_company(text)
            self._display_results(industry, analysis)
        except Exception as e:
            print(f"เกิดข้อผิดพลาดในการวิเคราะห์: {e}")

    def _display_results(self, industry: str, analysis: Dict[str, Any]):
        """Display results including plots"""
        symbol = analysis.get('symbol', 'N/A')
        financial_metrics = analysis.get('financial_metrics', None)
        industry_analysis = analysis.get('industry_analysis', {})
        ai_recommendations = analysis.get('ai_recommendations', {})
        stock_data = analysis.get('stock_data', None)

        # แสดงสัญลักษณ์หุ้น
        print(f"\nสัญลักษณ์หุ้น: {symbol}")

        # แสดงประเภทธุรกิจ
        print(f"\nประเภทธุรกิจ: {industry}")

        # แสดงคำแนะนำจาก AI
        print("\nคำแนะนำจาก AI:")
        print(ai_recommendations.get('summary', 'ไม่มีคำแนะนำ'))

        # แสดงหัวข้อที่ควรศึกษาเพิ่มเติม
        print("\nหัวข้อที่ควรศึกษาเพิ่มเติมเกี่ยวกับธุรกิจนี้:")
        for topic in industry_analysis.get('study_topics', []):
            print(f"- {topic}")

        # แสดงบริษัทในอุตสาหกรรมเดียวกันที่น่าสนใจ
        print("\nบริษัทในอุตสาหกรรมเดียวกันที่น่าสนใจ:")
        peer_companies = industry_analysis.get('peer_companies', [])
        for company in peer_companies:
            print(f"- {company}")

        # แสดงกราฟราคาหุ้นของบริษัทในอุตสาหกรรมเดียวกัน
        if stock_data:
            self._plot_peer_companies([symbol] + peer_companies)
        else:
            print("ไม่มีข้อมูลราคาหุ้นสำหรับการแสดงกราฟ")

    def _plot_peer_companies(self, symbols: List[str]):
        """Plot stock prices of peer companies"""
        print("\nกำลังแสดงกราฟราคาหุ้นของบริษัทในอุตสาหกรรมเดียวกัน...")
        plt.figure(figsize=(12, 6))
        for symbol in symbols:
            data = self.market_data.get_stock_data(symbol)
            if data:
                plt.plot(data.dates, data.prices, label=symbol)
        plt.title('Stock prices of companies in the same industry')
        plt.xlabel('date')
        plt.ylabel('price (THB)')
        plt.legend()
        plt.show()

    def _analyze_industry_specifics(self, text: str, industry: str, symbol: Optional[str]) -> Dict[str, Any]:
        """Analyze industry-specific factors using Typhoon and NLP"""
        print("\nกำลังวิเคราะห์ปัจจัยเฉพาะของอุตสาหกรรม...")
        # ใช้ Typhoon และ NLP ในการหาบริษัทที่คล้ายกัน
        peer_companies = self._find_similar_companies(text, symbol)
        if symbol and symbol in peer_companies:
            peer_companies.remove(symbol)  # เอาบริษัทที่เราวิเคราะห์ออก

        return {
            'study_topics': self._get_study_topics(industry),
            'peer_companies': peer_companies,
        }

    def _find_similar_companies(self, text: str, symbol: Optional[str]) -> List[str]:
        """Use Typhoon and NLP to find similar companies and extract their stock symbols"""
        if not self.api_key:
            print("ไม่สามารถหาบริษัทที่คล้ายกันได้เนื่องจากไม่ได้ตั้งค่า Typhoon API Key")
            return []

        print("\nกำลังหาบริษัทที่คล้ายกันโดยใช้ Typhoon API...")
        if symbol:
            prompt = f"สำหรับบริษัทที่มีชื่อสัญลักษณ์ {symbol} กรุณาระบุชื่อบริษัทที่คล้ายกันในอุตสาหกรรมเดียวกันพร้อมสัญลักษณ์หุ้นของพวกเขา"
        else:
            prompt = f"จากข้อมูลต่อไปนี้ กรุณาระบุชื่อบริษัทที่คล้ายกันในอุตสาหกรรมเดียวกันพร้อมสัญลักษณ์หุ้นของพวกเขา:\n\n{text[:2000]}"

        response = self._call_typhoon_api({
            "model": "typhoon-v1.5x-70b-instruct",
            "messages": [{"role": "user", "content": prompt}],
            "temperature": 0.3,
            "max_tokens": 1024,
            "top_p": 0.9,
            "top_k": 0,
            "repetition_penalty": 1.05,
            "min_p": 0
        })
        if response:
            content = response['choices'][0]['message']['content']
            print(f"\nคำตอบจาก Typhoon API:\n{content}")
            # ใช้ NLP เพื่อสกัดสัญลักษณ์หุ้นจากคำตอบ
            stock_symbols = self._extract_stock_symbols(content)
            print(f"\nสัญลักษณ์หุ้นที่พบ: {stock_symbols}")
            return stock_symbols
        return []

    def _extract_stock_symbols(self, text: str) -> List[str]:
        """Extract stock symbols from text using regex"""
        # Regex pattern to find stock symbols, adjust as necessary
        pattern = r'\b[A-Z]{1,5}(?:\.BK)?\b'
        symbols = re.findall(pattern, text)
        # Remove duplicates
        symbols = list(set(symbols))
        return symbols

    def _get_study_topics(self, industry: str) -> List[str]:
        """Get study topics based on industry"""
        topics = {
            'ธนาคาร': ['การจัดการความเสี่ยงทางการเงิน', 'กฎระเบียบของธนาคารกลาง'],
            'เทคโนโลยี': ['นวัตกรรมใหม่', 'การแข่งขันในตลาด'],
            # เพิ่มหัวข้อสำหรับอุตสาหกรรมอื่นๆ ตามต้องการ
        }
        return topics.get(industry, ['ศึกษาภาพรวมของอุตสาหกรรมเพิ่มเติม'])

    # ฟังก์ชัน Helper
    def _safe_calc(self, func):
        """Safely execute calculation"""
        try:
            return func()
        except:
            return None

    # Placeholder functions for financial data fetching
    def _get_eps(self, symbol: str) -> float:
        """Fetch EPS for the stock symbol"""
        # Placeholder for actual EPS fetching logic
        return 5.0

    def _get_book_value(self, symbol: str) -> float:
        """Fetch Book Value per share"""
        # Placeholder for actual Book Value fetching logic
        return 50.0

    def _get_net_income(self, symbol: str) -> float:
        """Fetch Net Income"""
        # Placeholder for actual Net Income fetching logic
        return 1000000.0

    def _get_equity(self, symbol: str) -> float:
        """Fetch Total Equity"""
        # Placeholder for actual Equity fetching logic
        return 5000000.0

    def _calculate_rsi(self, prices: np.ndarray, period: int = 14) -> float:
        """Calculate Relative Strength Index"""
        delta = np.diff(prices)
        up = delta.clip(min=0)
        down = -1 * delta.clip(max=0)
        avg_gain = np.mean(up[-period:])
        avg_loss = np.mean(down[-period:])
        rs = avg_gain / avg_loss if avg_loss != 0 else 0
        rsi = 100 - (100 / (1 + rs))
        return rsi

    def _calculate_macd(self, prices: np.ndarray) -> float:
        """Calculate Moving Average Convergence Divergence"""
        exp1 = pd.Series(prices).ewm(span=12, adjust=False).mean()
        exp2 = pd.Series(prices).ewm(span=26, adjust=False).mean()
        macd = exp1 - exp2
        signal = macd.ewm(span=9, adjust=False).mean()
        return macd.iloc[-1] - signal.iloc[-1]

    def _calculate_bollinger_bands(self, prices: np.ndarray, period: int = 20) -> Dict[str, float]:
        """Calculate Bollinger Bands"""
        sma = np.mean(prices[-period:])
        std = np.std(prices[-period:])
        upper_band = sma + (2 * std)
        lower_band = sma - (2 * std)
        return {'upper_band': upper_band, 'lower_band': lower_band}

# การใช้งาน
if __name__ == "__main__":
    # เก็บ API Key อย่างปลอดภัยโดยใช้ตัวแปรสภาพแวดล้อม
    api_key = os.getenv('TYPHOON_API_KEY')
    if not api_key:
        print("หมายเหตุ: คุณไม่ได้ตั้งค่า Typhoon API Key ผลลัพธ์บางส่วนอาจไม่ทำงาน")
        api_key = None

    analyzer = AdvancedFinancialAnalyzer(api_key=api_key)

    # ระบุเส้นทางไปยังไฟล์ PDF ของคุณ
    file_path = "k.pdf"  # เปลี่ยนเป็นเส้นทางไฟล์ PDF ที่คุณต้องการวิเคราะห์

    # ตรวจสอบว่าไฟล์ PDF มีอยู่หรือไม่
    if not os.path.isfile(file_path):
        print(f"ไม่พบไฟล์ PDF ที่ระบุ: {file_path}")
    else:
        analyzer.generate_investment_report(file_path)

ModuleNotFoundError: No module named 'frontend'