<a href="https://colab.research.google.com/github/wilburkwan/net_learning/blob/main/HW04.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
!pip install gspread pandas google-generativeai



In [None]:
# ========================================
# PTT爬蟲 + 中文分析 + Gemini AI 整合系統
# 自動化流程：爬蟲 → Sheet → 分析 → AI摘要
# ========================================

import requests
from bs4 import BeautifulSoup
import pandas as pd
import re
import jieba
import jieba.posseg as pseg
from collections import Counter, defaultdict
from sklearn.feature_extraction.text import TfidfVectorizer
import gradio as gr
import google.generativeai as genai
import gspread
from google.colab import auth
from google.auth import default
import time

print("✅ 函式庫載入完成")

# ========================================
# 第一部分：認證與全域設定
# ========================================

# Google 認證
auth.authenticate_user()
creds, _ = default()
gc = gspread.authorize(creds)

# 設定參數
GEMINI_API_KEY = "AIzaSyBwzkoPUxcwmbZUfZHybZ0PyLuATLxf1g4"
genai.configure(api_key=GEMINI_API_KEY)

# PTT 爬蟲設定
HEADERS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36',
    'Cookie': 'over18=1'  # 繞過18歲確認
}

# 停用詞設定
STOPWORDS = set(['的', '了', '是', '在', '我', '你', '他', '她', '之', '一個', '和',
                 '討論', '分享', 'Re', 'Fw', '這', '那', '有', '也', '都', '就'])

print("✅ 認證與設定完成")

# ========================================
# 第二部分：PTT 爬蟲模組
# ========================================

def get_previous_page_url(soup):
    """獲取 PTT 上一頁連結"""
    paging_div = soup.find('div', class_='btn-group btn-group-paging')
    if paging_div:
        buttons = paging_div.find_all('a')
        if len(buttons) > 1:
            prev_button = buttons[1]
            if 'href' in prev_button.attrs and prev_button['href'] != '#':
                return "https://www.ptt.cc" + prev_button['href']
    return None

def extract_index_from_url(url):
    """從 URL 提取頁碼"""
    try:
        index_str = url.split('index')[1].split('.html')[0]
        return int(index_str)
    except (IndexError, ValueError):
        return None

def crawl_ptt_board(board_name='movie', pages=5, delay=1):
    """
    爬取 PTT 看板文章

    參數:
        board_name: 看板名稱 (預設: movie)
        pages: 爬取頁數 (預設: 5)
        delay: 每次請求間隔秒數 (預設: 1)

    回傳:
        DataFrame: 包含 title, author, date, href, page_index 欄位
    """
    articles_data = []
    base_url = f"https://www.ptt.cc/bbs/{board_name}/index.html"

    try:
        # 取得起始頁
        response = requests.get(base_url, headers=HEADERS, timeout=10)
        soup = BeautifulSoup(response.text, 'html.parser')
        current_url = get_previous_page_url(soup)

        if not current_url:
            print("❌ 無法取得起始頁面")
            return pd.DataFrame()

        start_index = extract_index_from_url(current_url)
        print(f"🚀 開始爬取 PTT {board_name} 版，從第 {start_index} 頁開始")

        # 批次爬取
        for page_num in range(pages):
            try:
                page_index = start_index - page_num
                url = f"https://www.ptt.cc/bbs/{board_name}/index{page_index}.html"
                print(f"⏳ 正在爬取第 {page_num + 1}/{pages} 頁: {url}")

                response = requests.get(url, headers=HEADERS, timeout=10)
                response.raise_for_status()

                soup = BeautifulSoup(response.text, 'html.parser')
                article_list = soup.find_all('div', class_='r-ent')

                for article in article_list:
                    try:
                        title_div = article.find('div', class_='title')
                        title_tag = title_div.find('a') if title_div else None

                        if title_tag and 'href' in title_tag.attrs:
                            title = title_tag.text.strip()
                            href = "https://www.ptt.cc" + title_tag['href']
                        else:
                            title = title_div.text.strip() if title_div else "(無標題)"
                            href = "N/A"

                        author_div = article.find('div', class_='author')
                        author = author_div.text.strip() if author_div else "(匿名)"

                        date_div = article.find('div', class_='date')
                        date = date_div.text.strip() if date_div else "(無日期)"

                        articles_data.append({
                            'title': title,
                            'date': date,
                            'author': author,
                            'href': href,
                            'page_index': page_index
                        })
                    except Exception as e:
                        continue

                print(f"✅ 第 {page_num + 1} 頁完成，取得 {len(article_list)} 篇文章")
                time.sleep(delay)  # 避免請求過快

            except Exception as e:
                print(f"❌ 第 {page_num + 1} 頁爬取失敗: {e}")
                continue

        print(f"🎉 爬蟲完成！共收集 {len(articles_data)} 篇文章")
        return pd.DataFrame(articles_data)

    except Exception as e:
        print(f"❌ 爬蟲初始化失敗: {e}")
        return pd.DataFrame()

# ========================================
# 第三部分：Google Sheet 讀寫模組
# ========================================

def write_to_sheet(df, sheet_url, worksheet_name='爬蟲資料'):
    """將 DataFrame 寫入 Google Sheet"""
    try:
        # 開啟試算表
        try:
            sh = gc.open_by_url(sheet_url)
        except:
            # 如果試算表不存在，創建新的
            sh = gc.create(worksheet_name)
            print(f"📝 已建立新試算表: {sh.url}")

        # 檢查工作表是否存在
        try:
            ws = sh.worksheet(worksheet_name)
            ws.clear()  # 清空現有資料
        except:
            ws = sh.add_worksheet(title=worksheet_name, rows=str(len(df)+10), cols=str(len(df.columns)+5))

        # 寫入資料
        ws.update([df.columns.values.tolist()] + df.values.tolist())
        print(f"✅ 已將 {len(df)} 筆資料寫入「{worksheet_name}」工作表")
        return sh.url

    except Exception as e:
        print(f"❌ 寫入 Google Sheet 失敗: {e}")
        return None

def read_from_sheet(sheet_url, worksheet_name='爬蟲資料'):
    """從 Google Sheet 讀取資料"""
    try:
        sh = gc.open_by_url(sheet_url)
        ws = sh.worksheet(worksheet_name)
        df = pd.DataFrame(ws.get_all_records())
        print(f"✅ 已讀取 {len(df)} 筆資料")
        return df
    except Exception as e:
        print(f"❌ 讀取 Google Sheet 失敗: {e}")
        return None

# ========================================
# 第四部分：中文斷詞與 TF-IDF 分析模組
# ========================================

def analyze_text(df, text_column='title', topN=10):
    """
    執行文本分析：詞頻統計 + TF-IDF

    參數:
        df: DataFrame
        text_column: 要分析的文字欄位
        topN: 回傳前 N 名結果

    回傳:
        tuple: (詞頻統計列表, TF-IDF排名列表)
    """
    print(f"\n🔍 開始分析「{text_column}」欄位...")

    # 過濾空值
    texts = df[text_column].dropna().astype(str).tolist()

    if not texts:
        print("❌ 沒有可分析的文字")
        return [], []

    # === 詞頻統計 ===
    all_words = []
    for text in texts:
        # 清理文字
        cleaned_text = re.sub(r'[^\w\s]', ' ', text)
        # 斷詞
        words = jieba.lcut(cleaned_text)
        # 過濾
        filtered_words = [w.strip() for w in words
                         if w.strip() and len(w.strip()) > 1 and w.strip() not in STOPWORDS]
        all_words.extend(filtered_words)

    freq_counter = Counter(all_words)
    top_freq = freq_counter.most_common(topN)

    print(f"✅ 詞頻統計完成，共 {len(freq_counter)} 個不重複詞彙")

    # === TF-IDF 分析 ===
    try:
        # 準備文檔
        documents = []
        for text in texts:
            cleaned_text = re.sub(r'[^\w\s]', ' ', text)
            words = jieba.lcut(cleaned_text)
            filtered_words = [w.strip() for w in words
                             if w.strip() and len(w.strip()) > 1 and w.strip() not in STOPWORDS]
            documents.append(" ".join(filtered_words))

        # 計算 TF-IDF
        vectorizer = TfidfVectorizer()
        tfidf_matrix = vectorizer.fit_transform(documents)
        feature_names = vectorizer.get_feature_names_out()

        # 計算平均權重
        avg_scores = tfidf_matrix.mean(axis=0).A1
        tfidf_rank = sorted(zip(feature_names, avg_scores),
                           key=lambda x: x[1], reverse=True)[:topN]

        print(f"✅ TF-IDF 分析完成")

    except Exception as e:
        print(f"⚠️ TF-IDF 分析失敗: {e}")
        tfidf_rank = []

    return top_freq, tfidf_rank

# ========================================
# 第五部分：Gemini AI 摘要生成模組
# ========================================

def generate_gemini_summary(hot_words, sample_texts, analysis_type="文章標題"):
    """
    使用 Gemini AI 生成分析摘要

    參數:
        hot_words: 熱門關鍵詞列表
        sample_texts: 部分文本樣本
        analysis_type: 分析類型描述

    回傳:
        str: AI 生成的摘要
    """
    print("\n🤖 開始生成 Gemini AI 摘要...")

    # 準備 prompt
    hot_words_str = "、".join([f"{word}({count}次)" for word, count in hot_words[:10]])
    sample_str = "\n".join([f"- {text[:100]}" for text in sample_texts[:5]])

    prompt = f"""你是一位專業的資料分析師，負責分析 PTT 論壇的{analysis_type}資料。

**熱門關鍵詞統計：**
{hot_words_str}

**部分{analysis_type}樣本：**
{sample_str}

**請進行以下分析：**
1. 用5句話總結當前討論的主要趨勢與現象
2. 提供一段120字的繁體中文專業結論摘要
3. 指出討論的熱點話題與值得關注的方向

請直接提供分析結果，不要包含分析步驟說明。使用繁體中文回答。"""

    try:
        model = genai.GenerativeModel('gemini-2.5-flash')
        response = model.generate_content(prompt)

        if hasattr(response, 'text'):
            print("✅ AI 摘要生成完成")
            return response.text
        else:
            return "❌ AI 無法生成摘要"

    except Exception as e:
        error_msg = f"❌ Gemini API 呼叫失敗: {e}"
        print(error_msg)
        return error_msg

# ========================================
# 第六部分：統計結果回寫模組
# ========================================

def write_analysis_to_sheet(freq_stats, tfidf_stats, ai_summary,
                            sheet_url, worksheet_name='分析統計'):
    """將分析結果回寫到 Google Sheet"""
    try:
        sh = gc.open_by_url(sheet_url)

        # 建立或清空工作表
        try:
            ws = sh.worksheet(worksheet_name)
            ws.clear()
        except:
            ws = sh.add_worksheet(title=worksheet_name, rows="100", cols="10")

        # 寫入時間戳記
        from datetime import datetime
        timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        ws.update('A1', [[f"分析報告 - 生成時間：{timestamp}"]])

        # 寫入詞頻統計
        ws.update('A3', [["📊 詞頻統計（前10名）", "", ""]])
        ws.update('A4', [["排名", "關鍵詞", "出現次數"]])
        for i, (word, count) in enumerate(freq_stats[:10], start=1):
            ws.update(f'A{4+i}', [[i, word, count]])

        # 寫入 TF-IDF 分析
        tfidf_start_row = 4 + len(freq_stats[:10]) + 3
        ws.update(f'A{tfidf_start_row}', [["📈 TF-IDF 重要詞彙分析", ""]])
        ws.update(f'A{tfidf_start_row+1}', [["關鍵詞", "TF-IDF 分數"]])
        for i, (word, score) in enumerate(tfidf_stats[:10], start=1):
            ws.update(f'A{tfidf_start_row+1+i}', [[word, round(score, 4)]])

        # 寫入 AI 摘要
        summary_row = tfidf_start_row + len(tfidf_stats[:10]) + 4
        ws.update(f'A{summary_row}', [["🤖 Gemini AI 深度洞察分析"]])
        ws.update(f'A{summary_row+1}', [[ai_summary]])

        print(f"✅ 統計結果已寫入「{worksheet_name}」工作表")
        return True

    except Exception as e:
        print(f"❌ 回寫統計失敗: {e}")
        return False

# ========================================
# 第七部分：完整流程整合
# ========================================

def full_automation_pipeline(board_name, pages, topN, sheet_url=None):
    """
    完整自動化流程：爬蟲 → Sheet → 分析 → AI → 回寫

    參數:
        board_name: PTT 看板名稱
        pages: 爬取頁數
        topN: 顯示前 N 名關鍵詞
        sheet_url: Google Sheet URL (可選)

    回傳:
        str: 執行結果報告
    """
    report = []
    report.append("=" * 60)
    report.append("🚀 PTT 爬蟲與文本分析系統 - 執行開始")
    report.append("=" * 60 + "\n")

    try:
        # ===== 步驟 1: 爬取 PTT 資料 =====
        report.append("📍 步驟 1/5：爬取 PTT 資料")
        df_articles = crawl_ptt_board(board_name=board_name, pages=pages, delay=1)

        if df_articles.empty:
            return "\n".join(report) + "\n❌ 爬蟲失敗，無法繼續執行"

        report.append(f"✅ 成功爬取 {len(df_articles)} 篇文章\n")

        # ===== 步驟 2: 寫入 Google Sheet =====
        report.append("📍 步驟 2/5：寫入 Google Sheet")
        if not sheet_url:
            # 創建新試算表
            new_sheet = gc.create(f'PTT_{board_name}_分析')
            sheet_url = new_sheet.url
            report.append(f"📝 已建立新試算表：{sheet_url}")

        result_url = write_to_sheet(df_articles, sheet_url, worksheet_name='爬蟲資料')
        if result_url:
            report.append(f"✅ 資料已寫入：{result_url}\n")
        else:
            report.append("⚠️ 寫入失敗，但繼續執行分析\n")

        # ===== 步驟 3: 從 Sheet 讀取並分析 =====
        report.append("📍 步驟 3/5：文本分析（詞頻 + TF-IDF）")
        freq_stats, tfidf_stats = analyze_text(df_articles, text_column='title', topN=topN)

        if freq_stats:
            report.append(f"✅ 分析完成，發現 {len(freq_stats)} 個熱門詞彙\n")
        else:
            return "\n".join(report) + "\n❌ 分析失敗"

        # ===== 步驟 4: Gemini AI 生成摘要 =====
        report.append("📍 步驟 4/5：Gemini AI 生成洞察摘要")
        sample_texts = df_articles['title'].dropna().astype(str).tolist()
        ai_summary = generate_gemini_summary(freq_stats, sample_texts, analysis_type="文章標題")
        report.append("✅ AI 摘要生成完成\n")

        # ===== 步驟 5: 回寫統計結果 =====
        report.append("📍 步驟 5/5：回寫分析統計")
        if sheet_url:
            write_analysis_to_sheet(freq_stats, tfidf_stats, ai_summary,
                                   sheet_url, worksheet_name='分析統計')
            report.append(f"✅ 統計結果已回寫至試算表\n")

        # ===== 生成最終報告 =====
        report.append("=" * 60)
        report.append("📊 分析結果摘要")
        report.append("=" * 60 + "\n")

        # 熱門關鍵詞
        report.append("### 🔥 熱門關鍵詞統計（前10名）")
        for i, (word, count) in enumerate(freq_stats[:10], 1):
            report.append(f"{i}. **{word}** - {count} 次")
        report.append("")

        # TF-IDF 重要詞彙
        report.append("### 📈 TF-IDF 重要詞彙（前10名）")
        for i, (word, score) in enumerate(tfidf_stats[:10], 1):
            report.append(f"{i}. **{word}** - {score:.4f}")
        report.append("")

        # AI 洞察
        report.append("### 🤖 Gemini AI 深度洞察")
        report.append(ai_summary)
        report.append("")

        # 資料概覽
        report.append("### 📋 資料概覽")
        report.append(f"- 看板名稱：**{board_name}**")
        report.append(f"- 文章數量：**{len(df_articles)}** 篇")
        report.append(f"- 分析時間：**{pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}**")
        if sheet_url:
            report.append(f"- Google Sheet：[點此查看]({sheet_url})")

        report.append("\n" + "=" * 60)
        report.append("🎉 所有流程執行完成！")
        report.append("=" * 60)

        return "\n".join(report)

    except Exception as e:
        report.append(f"\n❌ 執行過程發生錯誤：{e}")
        return "\n".join(report)

# ========================================
# 第八部分：Gradio UI 介面
# ========================================

def create_gradio_interface():
    """建立 Gradio 使用者介面"""

    with gr.Blocks(theme=gr.themes.Soft(), title="PTT 爬蟲分析系統") as demo:
        gr.Markdown("""
        # 🎯 PTT 爬蟲與文本分析系統
        **完整自動化流程：** PTT爬蟲 → Google Sheet → 中文斷詞 → TF-IDF分析 → Gemini AI洞察 → 統計回寫
        """)

        with gr.Row():
            with gr.Column(scale=1):
                gr.Markdown("### 📝 參數設定")
                board_input = gr.Textbox(
                    label="🎬 PTT 看板名稱",
                    value="movie",
                    placeholder="例如：movie, Gossiping, Tech_Job",
                    info="輸入要爬取的 PTT 看板名稱"
                )
                pages_input = gr.Slider(
                    minimum=1,
                    maximum=20,
                    value=5,
                    step=1,
                    label="📄 爬取頁數",
                    info="每頁約 20 篇文章"
                )
                topN_input = gr.Slider(
                    minimum=5,
                    maximum=30,
                    value=10,
                    step=1,
                    label="🔢 顯示前 N 名關鍵詞"
                )
                sheet_url_input = gr.Textbox(
                    label="🔗 Google Sheet URL（選填）",
                    placeholder="留空則自動建立新試算表",
                    info="若要使用現有試算表，請貼上完整 URL"
                )

                submit_btn = gr.Button(
                    "🚀 開始執行完整分析",
                    variant="primary",
                    size="lg"
                )

            with gr.Column(scale=2):
                gr.Markdown("### 📊 執行結果")
                output_box = gr.Textbox(
                    label="分析報告",
                    lines=25,
                    max_lines=30,
                    show_copy_button=True
                )

        # 按鈕事件綁定
        submit_btn.click(
            fn=full_automation_pipeline,
            inputs=[board_input, pages_input, topN_input, sheet_url_input],
            outputs=output_box
        )

        gr.Markdown("""
        ---
        ### 📌 使用說明
        1. **Gemini API Key**：請先在程式碼中填入您的 API Key（前往 [Google AI Studio](https://makersuite.google.com/app/apikey) 申請）
        2. **看板名稱**：輸入要分析的 PTT 看板（例如：movie、Gossiping、Stock）
        3. **頁數設定**：建議 5-10 頁，避免爬取過多導致執行時間過長
        4. **執行流程**：點擊「開始執行」後，系統會自動完成所有步驟
        5. **查看結果**：分析完成後會在右側顯示報告，並自動寫入 Google Sheet

        ### ⚠️ 注意事項
        - 請遵守 PTT 使用規範，適度使用爬蟲功能
        - 爬取速度已設定延遲，避免對伺服器造成負擔
        - 確保已完成 Google Colab 的授權認證
        - Gemini API 有使用額度限制，請注意配額使用狀況

        ### 🔧 系統架構
        | 模組 | 技術 | 功能 |
        |------|------|------|
        | 爬蟲 | requests + BeautifulSoup | 批次爬取文章資料 |
        | 儲存 | gspread + OAuth2 | Google Sheet 讀寫 |
        | 斷詞 | jieba | 中文文本斷詞 |
        | 分析 | scikit-learn TF-IDF | 關鍵詞提取 |
        | AI | Gemini API | 智能摘要生成 |
        | UI | Gradio | 互動式介面 |
        """)

    return demo

# ========================================
# 主程式執行區
# ========================================

if __name__ == "__main__":
    print("\n" + "="*60)
    print("🎯 PTT 爬蟲與文本分析系統")
    print("="*60 + "\n")

    # 啟動 Gradio 介面
    demo = create_gradio_interface()
    demo.launch(
        share=True,  # 產生公開連結
        debug=True   # 開啟除錯模式
    )

    print("\n✅ Gradio 介面已啟動")
    print("📱 可透過產生的連結在任何裝置上使用")


✅ 函式庫載入完成
✅ 認證與設定完成

🎯 PTT 爬蟲與文本分析系統

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://69a63e355eae9babf8.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


🚀 開始爬取 PTT movie 版，從第 10809 頁開始
⏳ 正在爬取第 1/5 頁: https://www.ptt.cc/bbs/movie/index10809.html
✅ 第 1 頁完成，取得 20 篇文章
⏳ 正在爬取第 2/5 頁: https://www.ptt.cc/bbs/movie/index10808.html
✅ 第 2 頁完成，取得 20 篇文章
⏳ 正在爬取第 3/5 頁: https://www.ptt.cc/bbs/movie/index10807.html
✅ 第 3 頁完成，取得 20 篇文章
⏳ 正在爬取第 4/5 頁: https://www.ptt.cc/bbs/movie/index10806.html
✅ 第 4 頁完成，取得 20 篇文章
⏳ 正在爬取第 5/5 頁: https://www.ptt.cc/bbs/movie/index10805.html
✅ 第 5 頁完成，取得 20 篇文章
🎉 爬蟲完成！共收集 100 篇文章
✅ 已將 100 筆資料寫入「爬蟲資料」工作表

🔍 開始分析「title」欄位...
✅ 詞頻統計完成，共 428 個不重複詞彙
✅ TF-IDF 分析完成

🤖 開始生成 Gemini AI 摘要...
✅ AI 摘要生成完成


  ws.update('A1', [[f"分析報告 - 生成時間：{timestamp}"]])
  ws.update('A3', [["📊 詞頻統計（前10名）", "", ""]])
  ws.update('A4', [["排名", "關鍵詞", "出現次數"]])
  ws.update(f'A{4+i}', [[i, word, count]])
  ws.update(f'A{tfidf_start_row}', [["📈 TF-IDF 重要詞彙分析", ""]])
  ws.update(f'A{tfidf_start_row+1}', [["關鍵詞", "TF-IDF 分數"]])
  ws.update(f'A{tfidf_start_row+1+i}', [[word, round(score, 4)]])
  ws.update(f'A{summary_row}', [["🤖 Gemini AI 深度洞察分析"]])
  ws.update(f'A{summary_row+1}', [[ai_summary]])


✅ 統計結果已寫入「分析統計」工作表
🚀 開始爬取 PTT movie 版，從第 10809 頁開始
⏳ 正在爬取第 1/5 頁: https://www.ptt.cc/bbs/movie/index10809.html
✅ 第 1 頁完成，取得 20 篇文章
⏳ 正在爬取第 2/5 頁: https://www.ptt.cc/bbs/movie/index10808.html
✅ 第 2 頁完成，取得 20 篇文章
⏳ 正在爬取第 3/5 頁: https://www.ptt.cc/bbs/movie/index10807.html
✅ 第 3 頁完成，取得 20 篇文章
⏳ 正在爬取第 4/5 頁: https://www.ptt.cc/bbs/movie/index10806.html
✅ 第 4 頁完成，取得 20 篇文章
⏳ 正在爬取第 5/5 頁: https://www.ptt.cc/bbs/movie/index10805.html
✅ 第 5 頁完成，取得 20 篇文章
🎉 爬蟲完成！共收集 100 篇文章
✅ 已將 100 筆資料寫入「爬蟲資料」工作表

🔍 開始分析「title」欄位...
✅ 詞頻統計完成，共 428 個不重複詞彙
✅ TF-IDF 分析完成

🤖 開始生成 Gemini AI 摘要...
✅ AI 摘要生成完成


  ws.update('A1', [[f"分析報告 - 生成時間：{timestamp}"]])
  ws.update('A3', [["📊 詞頻統計（前10名）", "", ""]])
  ws.update('A4', [["排名", "關鍵詞", "出現次數"]])
  ws.update(f'A{4+i}', [[i, word, count]])
  ws.update(f'A{tfidf_start_row}', [["📈 TF-IDF 重要詞彙分析", ""]])
  ws.update(f'A{tfidf_start_row+1}', [["關鍵詞", "TF-IDF 分數"]])
  ws.update(f'A{tfidf_start_row+1+i}', [[word, round(score, 4)]])
  ws.update(f'A{summary_row}', [["🤖 Gemini AI 深度洞察分析"]])
  ws.update(f'A{summary_row+1}', [[ai_summary]])


✅ 統計結果已寫入「分析統計」工作表
