<a href="https://colab.research.google.com/github/PinRay22/Big-Data-Analytics-for-Finance/blob/main/week12.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# 安裝yahoo finance套件
!pip install yfinance



In [4]:
import google.generativeai as genai  # Google生成式AI套件Gemini API
import os  # 系統檔，用來操作檔案與文件
import requests  # 用來發HTTP請求，用於網路爬蟲
from bs4 import BeautifulSoup  # 網路爬蟲套件
import numpy as np  # 數值計算
import pandas as pd  # 資料處理
import yfinance as yf  # Yahoo finance 股價資訊
import datetime as dt  # 處理日期時間


# 爬取股票資訊的類別
class StockInfo():

    # 取得全部股票的股號、股名
    def stock_name(self):
        response = requests.get('https://isin.twse.com.tw/isin/C_public.jsp?strMode=2')
        url_data = BeautifulSoup(response.text, 'html.parser')
        stock_company = url_data.find_all('tr')

        # 資料處理
        data = [
            (row.find_all('td')[0].text.split('\u3000')[0].strip(),
                row.find_all('td')[0].text.split('\u3000')[1],
                row.find_all('td')[4].text.strip())
            for row in stock_company[2:] if len(row.find_all('td')[0].text.split('\u3000')[0].strip()) == 4
        ]

        df = pd.DataFrame(data, columns=['股號', '股名', '產業別'])
        return df

    # 取得股票名稱
    def get_stock_name(self, stock_id, name_df):
        return name_df.set_index('股號').loc[stock_id, '股名']

In [3]:
# 分析股票的類別
class StockAnalysis():

    def __init__(self, gemini_api_key):
        # 初始化 Gemini API 金鑰
        genai.configure(api_key=gemini_api_key)
        '''
        可以根據需求更換模型
            * gemini-1.5-flash
                - 輸入內容：音訊、圖片、影片和文字
                - 輸出：文字
                - 適合用途：在各種任務中提供快速且多功能的效能
            * gemini-1.5-flash-8b
                - 輸入內容：音訊、圖片、影片和文字
                - 輸出：文字
                - 適合用途：大量且較不智慧的工作
            * gemini-1.5-pro
                - 輸入內容：音訊、圖片、影片和文字
                - 輸出：文字
                - 適合用途：需要更多智慧功能的複雜推論工作
        '''
        self.model = genai.GenerativeModel('gemini-1.5-flash')
        self.stock_info = StockInfo()  # 實例化 StockInfo 類別
        self.name_df = self.stock_info.stock_name()  # 取得台股資訊


    # 從 yfinance 取得兩周股價資料
    def stock_price(self, stock_id, days=15):
        stock_id += '.TW'

        end = dt.date.today() # 資料結束時間
        start = end - dt.timedelta(days=days) # 資料開始時間
        # 下載資料
        df = yf.download(stock_id, start=start)

        # 更換列名
        df.columns = ['開盤價', '最高價', '最低價',
                    '收盤價', '調整後收盤價', '成交量']

        data = {
            '日期': df.index.strftime('%Y-%m-%d').tolist(),
            '收盤價': df['收盤價'].tolist(),
            '每日報酬': df['收盤價'].pct_change().tolist(),
            # '漲跌價差': df['調整後收盤價'].diff().tolist()
        }
        return data


    # 基本面資料
    def stock_fundamental(self, stock_id):
        stock_id += '.TW'
        stock = yf.Ticker(stock_id)
        # 營收成長率
        quarterly_revenue_growth = np.round(
            stock.quarterly_financials.loc['Total Revenue'].pct_change(-1, fill_method=None).dropna().tolist(),
            2
        )

        # 每季EPS
        quarterly_eps = np.round(
            stock.quarterly_financials.loc['Basic EPS'].dropna().tolist(),
            2
        )

        # EPS季增率
        quarterly_eps_growth = np.round(
            stock.quarterly_financials.loc['Basic EPS'].pct_change(-1, fill_method=None).dropna().tolist(),
            2
        )

        # 轉換日期
        dates = [date.strftime('%Y-%m-%d') for date in stock.quarterly_financials.columns]

        data = {
            '季日期': dates[:len(quarterly_revenue_growth)],  # 以最短的數據列表長度為准，確保數據對齊
            '營收成長率': quarterly_revenue_growth.tolist(),
            'EPS': quarterly_eps.tolist(),
            'EPS 季增率': quarterly_eps_growth.tolist()
        }

        return data


    # 新聞資料
    def stock_news(self, stock_name):
        data = []
        # 鉅亨網（Anue）的新聞 API，取得 Json 格式資料
        json_data = requests.get(f'https://ess.api.cnyes.com/ess/api/v1/news/keyword?q={stock_name}&limit=6&page=1').json()

        # 依照格式擷取資料
        items=json_data['data']['items']
        for item in items:
            # 網址、標題和日期
            news_id = item['newsId']
            title = item['title']
            publish_at = item['publishAt']

            # 使用 UTC 時間格式
            utc_time = dt.datetime.utcfromtimestamp(publish_at)
            formatted_date = utc_time.strftime('%Y-%m-%d')

            # 前往網址擷取內容
            url = requests.get(f'https://news.cnyes.com/news/id/{news_id}').content
            soup = BeautifulSoup(url, 'html.parser')
            p_elements=soup .find_all('p')

            # 提取段落内容
            p=''
            for paragraph in p_elements[4:]:
                p += paragraph.get_text()
            data.append([stock_name, formatted_date ,title,p])
        return data


    # 取得 gemini 的回應
    def _get_reply(self, content_msg):
        response = self.model.generate_content(
            content_msg, # 傳送的訊息
            generation_config=genai.types.GenerationConfig(
                max_output_tokens=1600,  # 限制回應的最大 Token 數為 1600
                temperature=1.0,  # 調整回應的隨機性（1.0 為適中的隨機性，範圍[0.0, 2.0]，值越高越有創意，值越低個準確）
            )
        )
        reply = response.text
        return reply

    def stock_gimini_sort(self, message):
        content_msg = f'''你現在是一位專業的股票分析師, 會根據各股的專業趨勢分析報告去評斷適不適合投資, 並給予0-100之間的評分。
            以 50 分為基準, 有任何正面消息可以加分如: 股價整體上升、法人買超、營收成長上升、新聞有正面消息；
            若有任何負面消息必須扣分如: 股價整體下降、法人賣超、營收成長下降、新聞有負面消息。
            最後請將所有股票依照評分排序出來。{str(message)}(使用繁體中文回應)'''
        reply = self._get_reply(content_msg)
        return reply


    def stock_gimini_choice(self, message):
        content_msg = f'''你現在是一位專業的證券分析師, 你會針對各股的專業趨勢分析報告,
            選擇出最適合投資的一檔股票，即便目前都不適合投資也要一定要選出一檔，說明選擇它的理由。
            {str(message)}(使用繁體中文回應)'''
        reply = self._get_reply(content_msg)
        return reply


    def stock_gimini_analysis(self, stock_id):
        stock_name = self.stock_info.get_stock_name(stock_id, self.name_df)

        # 取得股價資訊
        price_data = self.stock_price(stock_id)

        # 取得新聞資訊
        news_data = self.stock_news(stock_name)

        # 告訴 Gemini 現在他是什麼角色
        content_msg = f'''你現在是一位專業的證券分析師, 你會依據以下資料來進行分析並給出一份完整的分析報告:
            近期價格資訊: \n{price_data}

            你現在是一位專業的證券分析師，你會依據以下資料來進行分析並給出一份完整的分析報告:
            近期價格資訊: \n{price_data}'''

        stock_value_data = self.stock_fundamental(stock_id)
        content_msg += f'每季營收資訊: \n{stock_value_data}'

        content_msg += f'''近期新聞資訊: \n{news_data}
            請給我{stock_name}近期的趨勢報告，請以詳細、嚴謹及專業的角度撰寫此報告，並提及重要的數字(使用繁體中文回應)。
        '''
        reply = self._get_reply(content_msg)
        return reply


In [6]:
# Gemini API Key
gemini_api_key = 'AIzaSyAbXmZj-r6XfSbRg6q-7kEpkb1B-S_fPGI'
# 建立 StockAnalysis 類別
stock_analysis = StockAnalysis(gemini_api_key)

In [7]:
reply = stock_analysis.stock_gimini_analysis('2330')
print(reply)

[*********************100%***********************]  1 of 1 completed


**台積電近期趨勢報告 (2024年11月14日至2024年11月29日)**

**報告日期:** 2024年11月29日

**分析師:**  [您的姓名/機構名稱]


**一、 價格走勢分析:**

本報告期間，台積電股價呈現震盪下跌趨勢。從11月14日的1025元收盤價開始，股價在11月15日小幅上漲至1030元，隨後便開始持續下跌，至11月29日收盤價跌至994元，跌幅約3%。  價格波動劇烈，呈現明顯的震盪格局，未呈現明確的向上或向下趨勢。  每日報酬率數據顯示，漲跌幅度介於-1.94%至+0.49%之間，波動較大，缺乏持續性單邊趨勢。

**圖表:** (建議在此處加入台積電股價走勢圖，清晰顯示11月14日至11月29日的價格變化。)


**二、 財務數據分析:**

雖然提供的資料僅包含近期價格資訊和部分營收EPS數據，但仍可看出部分端倪。

* **營收成長率:**  2024年第三季營收成長率為13%，顯示公司營收仍保持一定增長，但較前幾季有所放緩。值得注意的是，2024年第一季營收成長率為14%，但第二季卻呈現-5%的負成長，顯示公司營收成長存在一定的波動性。EPS季增率也反映了類似的波動趨勢。

* **EPS:**  EPS數據顯示，公司盈利能力在2023年四季度至2024年三季度呈現波動，最高點為2024年三季度的12.54元，最低點為2024年第一季度的8.7元。這也間接反映了市場對台積電營收成長的預期與實際表現存在差距。

**三、 新聞資訊分析:**

近期新聞資訊主要集中在以下幾個方面：

* **地緣政治風險:** 美國可能對中國實施新的晶片出口限制，這對台積電的營運造成潛在風險。  雖然部分分析師認為此措施影響有限，且台積電在先進製程和CoWoS產能方面仍保持領先地位，但地緣政治的不確定性仍是重要的風險因素。新聞中提及中芯國際等中國晶圓廠的發展，也間接反映出台積電面臨的競爭壓力。

* **市場需求:**  儘管SEMI與TechInsights預估全球半導體出貨量在2024年第四季度將增長20%，但市場對於AI晶片需求的持續性仍存在疑慮。  部分新聞提及中國手機廠商發展自研晶片，以及市場對於成熟製程產能過剩的擔憂，都可能影響台積電未來的營收成長。

* **投資者行為:** 外資近期持續減碼台積電股票，顯示投資者對台積電

In [8]:
# 建立股票清單
stock_list = ['2330', '2535', '3041', '5215', '2363']

# 設定儲存路徑
today_time = dt.date.today().strftime('%Y%m%d')
path = './StockGemini/TrendReport/'
os.makedirs(path, exist_ok=True)

# 建立多檔股票的趨勢報告並儲存
content = {}

for stock in stock_list:
    file_path = f"{path}trend_{stock}_{today_time}.txt"

    if not os.path.exists(file_path):
        with open(file_path, "w", encoding="utf-8") as f:
            f.write(stock_analysis.stock_gimini_analysis(stock_id=stock))

        with open(file_path, "r", encoding="utf-8") as f:
            content[stock] = f.read()

# 印出所有股票的趨勢報告
content

[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


{'2330': '## 台積電近期趨勢報告 (2024年11月14日至2024年11月29日)\n\n**報告日期:** 2024年11月29日\n\n**分析師:**  [您的姓名/機構名稱]\n\n**一、 價格走勢與報酬率分析:**\n\n本報告分析台積電(2330-TW)在2024年11月14日至2024年11月29日期間的價格走勢及每日報酬率。根據提供的資料，台積電股價呈現震盪下跌趨勢。\n\n| 日期        | 收盤價     | 每日報酬率(%) |\n|-------------|-------------|-----------------|\n| 2024-11-14  | 1025.0      | -               |\n| 2024-11-15  | 1030.0      | 0.49             |\n| 2024-11-18  | 1020.0      | -0.97            |\n| 2024-11-19  | 1025.0      | 0.49             |\n| 2024-11-20  | 1025.0      | 0.00             |\n| 2024-11-21  | 1010.0      | -1.46            |\n| 2024-11-22  | 1035.0      | 2.47             |\n| 2024-11-25  | 1030.0      | -0.48            |\n| 2024-11-26  | 1010.0      | -1.94            |\n| 2024-11-27  | 1000.0      | -0.99            |\n| 2024-11-28  | 992.0       | -0.80            |\n| 2024-11-29  | 994.0       | 0.20            |\n\n\n從數據觀察，股價在11月29日收盤價為994元，較11月14日收盤價1025元下跌31元，跌幅約為3.02%。期間雖然出現幾次小幅反彈，但整體趨勢仍偏弱，呈現下跌走勢。  每日報酬率波動較大，顯示市場情緒不穩定。  

In [9]:
reply = stock_analysis.stock_gimini_choice(str(content))
print(reply)

身為一位專業證券分析師，在審閱提供的四檔股票（2330台積電、2535達欣工、6438揚智、5215科嘉-KY、2363矽統科技）的報告後，即便目前市場環境都不利於投資，我仍必須選擇一檔股票，並說明理由。

**我選擇的股票是：2330 台積電**

**理由：**

儘管台積電近期股價呈現震盪下跌，且報告中指出短期內市場情緒不穩定，存在地緣政治風險等不確定性因素，但我選擇台積電的理由基於以下長期考量：

1. **產業領先地位和技術壁壘：**  報告明確指出台積電在先進製程和CoWoS領域的領先地位，這構成了其強大的競爭力護城河。  短期股價波動並不能撼動其在半導體產業的龍頭地位。  技術壁壘是台積電最大的資產，也是抵禦市場波動的基石。

2. **長期成長潛力：**  雖然中國手機市場拉貨動能放緩對短期營收造成影響，但報告也指出AI晶片需求強勁，預期全球半導體出貨量將持續增長，這對台積電的長期發展是正面因素。  AI產業的蓬勃發展將為台積電帶來巨大的長期成長機會。

3. **相對穩定的財務基礎：**  雖然報告指出台積電EPS季增率有負值，但整體上維持相對穩定的水平。 與其他三檔股票相比，台積電的財務基礎相對穩健，抗風險能力較強。  更詳細的財報資料可以進一步佐證這點。

4. **風險承受能力的考量：**  投資總有風險，但台積電的風險承受度相對較低。  其他三檔股票（達欣工、揚智、科嘉-KY、矽統科技）都面臨著營收下滑、獲利能力不穩定、淨值跌破票面等較為嚴重的問題，風險顯著高於台積電。 即使在目前市場環境下，台積電的風險仍相對可控。

**策略建議：**

基於以上分析，目前雖然不建議積極買入，但可以考慮逢低分批佈局，採取長期投資策略。  密切關注地緣政治風險和市場需求變化，及時調整投資策略。  在投資前，應仔細評估自身風險承受能力，並做好必要的風險管理。

**免責聲明：** 本分析僅供參考，不構成任何投資建議。投資人應根據自身風險承受能力和投資目標做出獨立判斷，並承擔相應的投資風險。


需要再次強調的是，目前的市場環境充滿不確定性，任何投資都存在風險。  以上分析僅基於提供的有限資訊，更全面的分析需要更豐富的數據和更深入的研究。



In [10]:
reply = stock_analysis.stock_gimini_sort(str(content))
print(reply)

您好，根據您提供的資料，我作為專業股票分析師，將對每支股票進行評分 (0-100)，並依評分高低排序。評分標準如下：

* **基礎分數:** 50分
* **正面消息加分:** 股價整體上升、法人買超、營收成長上升、新聞有正面消息 (每項根據影響程度加1-10分)
* **負面消息扣分:** 股價整體下降、法人賣超、營收成長下降、新聞有負面消息 (每項根據影響程度扣1-10分)


**股票評分及分析:**


**1. 台積電 (2330): 評分 60 分**

* **基礎分數:** 50分
* **負面消息:** 股價整體下跌 (扣10分)，外資賣超(扣5分)，部分季度獲利下滑(扣3分)
* **正面消息:** AI晶片需求強勁，預期全球半導體出貨量將持續增長 (加8分)，先進製程和封裝技術領先 (加4分)。地緣政治風險影響有限，被視為正面看待(加2分)。


**2. 科嘉-KY (5215): 評分 45 分**

* **基礎分數:** 50分
* **負面消息:** 營收及EPS呈現波動，缺乏持續穩定增長 (扣10分)，股價震盪，缺乏明確的上升趨勢 (扣5分)


**3. 達欣工 (2535): 評分 40 分**

* **基礎分數:** 50分
* **負面消息:** 營收下滑 (扣10分)，EPS波動且多為負值 (扣5分)，關係人交易需謹慎觀察 (扣5分)
* **正面消息:** 股價小幅上漲 (加3分)


**4. 矽統科技 (2363): 評分 35 分**

* **基礎分數:** 50分
* **負面消息:** 股價整體下跌 (扣10分)，紘康科技終止上櫃 (扣10分)，營收成長率不穩定，EPS波動較大 (扣5分)
* **正面消息:** 10月份營收大幅成長 (加10分)


**5. 揚智 (3041): 評分 25 分**

* **基礎分數:** 50分
* **負面消息:** 股價整體下跌 (扣10分)，營收成長率和EPS均不理想，持續虧損 (扣15分)，淨值跌破票面 (扣5分)，子公司喪失控制力 (扣5分)
* **正面消息:** 盤中一度大漲 (加5分)



**股票評分排序 (由高至低):**

1. 台積電 (2330) - 60 分
2. 科嘉-KY (5215) - 45 分
3. 達欣工 (2535) -

In [12]:
 def stock_gimini_sort(self, message):
        content_msg = f'''你現在是一位專業的股票分析師, 會根據各股的專業趨勢分析報告去評斷適不適合投資, 並給予0-100之間的評分。
            以 50 分為基準, 有任何正面消息可以加分如: 股價整體上升、法人買超、營收成長上升、新聞有正面消息；
            若有任何負面消息必須扣分如: 股價整體下降、法人賣超、營收成長下降、新聞有負面消息。
            最後請將所有股票依照評分排序出來。{str(message)}(使用繁體中文回應)'''
        reply = self._get_reply(content_msg)
        return reply


def stock_gimini_choice(self, message):
    # 完成
    return reply


def stock_gimini_analysis(self, stock_id):
    stock_name = self.stock_info.get_stock_name(stock_id, self.name_df)