In [20]:
#------------------------------------------
#　ライブラリのインポート
#------------------------------------------
# ライブラリのインポート
import getpass
import os
import pandas as pd
import markdown
from bs4 import BeautifulSoup, SoupStrainer
from IPython.display import display, HTML

# langchain のインポート
from langchain import hub
from langchain_google_genai import ChatGoogleGenerativeAI, GoogleGenerativeAIEmbeddings
from langchain_core.prompts import PromptTemplate, FewShotPromptTemplate, ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser
from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.runnables import RunnablePassthrough
from langchain_core.tools import tool
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_chroma import Chroma
from langchain_community.document_loaders import WebBaseLoader
from langgraph.prebuilt import create_react_agent

In [21]:
import google.generativeai as genai

genai.configure(api_key="AIzaSyA7ff88iym-pPHbjSKf-x6ddwFYzULZ9ec")
gemini=genai.GenerativeModel("gemini-2.0-flash")

In [22]:
#------------------------------------------
#　LLMの出力を表示する関数。Markdownテキストを受け取り、HTMLに変換して表示。
#------------------------------------------
def display_markdown(md_text):
    html_output = markdown.markdown(md_text)
    display(HTML(html_output))

In [23]:
#------------------------------------------
#　通常の生成: 全ての文章の生成が完了した後に、生成した文章をまとめて出力する。
#------------------------------------------
result = gemini.generate_content("LLMについて説明してください。")
display_markdown(result.text) # ← display_markdown(result.content)で.content ではなく .text を使う

In [24]:
# Google の google.generativeai ライブラリにおける GenerativeModel（例：Gemini 2.0 Flash）は、
# 現時点（2025年時点）では stream() メソッドをサポートしていません。
# つまり、Gemini API では stream() は存在しないため、直接使おうとするとこのエラーになります。

# 以下は擬似的に「文字を1文字ずつ表示」する方法
import time

response = gemini.generate_content("LLMについて説明してください。")

for char in response.text:
    print(char, end='', flush=True)
    time.sleep(0.01)  # 少しずつ出力（擬似的ストリーミング）


## LLM（大規模言語モデル）とは？

LLM（Large Language Model、大規模言語モデル）とは、**大量のテキストデータを学習し、人間が使う言語を理解し、生成することができるAIモデル**です。その名の通り、非常に大規模な学習データとパラメータ数を持つことが特徴です。

**簡単に言うと、「言葉を理解し、操ることができる賢いコンピュータプログラム」です。**

**LLMの主な特徴:**

*   **大規模なデータセット:** インターネット上のテキストデータ、書籍、論文など、膨大な量のテキストデータを学習しています。
*   **高度な言語理解能力:** テキストの意味を理解し、文法的な構造や文脈を把握することができます。
*   **テキスト生成能力:** 人間が書くような自然な文章を生成することができます。
*   **多様なタスクに対応:** 質問応答、翻訳、要約、文章作成、コード生成など、様々なタスクを実行できます。
*   **文脈理解:** 長い文章や会話の流れを理解し、文脈に沿った応答を生成できます。
*   **知識獲得:** 学習データに含まれる情報を知識として蓄積し、質問に答えたり、推論を行ったりすることができます。

**LLMの仕組み（概要）:**

LLMは、主に**Transformer**と呼ばれるニューラルネットワークアーキテクチャに基づいて構築されています。Transformerは、テキスト内の単語間の関係性を効率的に捉えることができるため、言語理解と生成に非常に適しています。

学習プロセスでは、LLMは大量のテキストデータを用いて、単語の出現パターンや文法規則などを学習します。具体的には、ある単語の後に続く可能性の高い単語を予測したり、文脈に合った単語を選択したりする能力を習得します。

**LLMの活用例:**

*   **チャットボット:** ユーザーからの質問に答えたり、会話をしたりすることができます。
*   **文章作成支援:** ブログ記事、メール、レポートなどの文章作成を支援します。
*   **翻訳:** ある言語の文章を別の言語に翻訳します。
*   **要約:** 長い文章を要約します。
*   **プログラミング:** コードを生成したり、バグを修正したりします。
*   **検索

In [25]:
import google.generativeai as genai
from IPython.display import display, HTML
import markdown

# APIキーの設定
genai.configure(api_key="AIzaSyA7ff88iym-pPHbjSKf-x6ddwFYzULZ9ec")
gemini = genai.GenerativeModel("gemini-2.0-flash")

# Markdown表示用（Jupyterなどで使う場合）
def display_markdown(md_text):
    html_output = markdown.markdown(md_text)
    display(HTML(html_output))

# 通常のテキスト生成
prompts = [
    "20-2-8を計算して",
    "3+25-8を計算して",
    "29+3-2を計算して"
]

for prompt in prompts:
    response = gemini.generate_content(prompt)
    display_markdown(response.text)

In [26]:
#Gemini（google.generativeai.GenerativeModel）の generate_content() は、リスト形式のプロンプトは受け取るが、要素は単なる文字列である必要がある。
prompt = """
あなたは日本語で具体例を使いながら、わかりやすく回答するチャットボットです。
以下の質問に答えてください。

質問: LLMについて教えてください。
"""
response = gemini.generate_content(prompt)
display_markdown(response.text)

In [27]:
#------------------------------------------
#　チャット履歴とLLMを連携したchain_with_historyを作成
#------------------------------------------



In [28]:
from langchain.prompts import ChatPromptTemplate
from langchain.schema.output_parser import StrOutputParser
from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_google_genai import ChatGoogleGenerativeAI

# Gemini の LangChain 対応モデル
gemini = ChatGoogleGenerativeAI(model="gemini-pro")

# プロンプト定義
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "あなたは日本語で会話するチャットボットです"),
        ("placeholder", "{chat_history}"),
        ("human", "{input}"),
    ]
)

# チェーンの構成
chain = prompt | gemini | StrOutputParser()

# メモリの定義
history = InMemoryChatMessageHistory()

# チェーンと履歴を組み合わせた実行可能なオブジェクト
chain_with_history = RunnableWithMessageHistory(
    chain,
    lambda session_id: history,
)


In [29]:
#------------------------------------------
# chain_with_historyを呼び出し、チャット履歴を参照したテキスト生成を行う。終了するには「終了」と入力します。
#------------------------------------------

In [30]:
import google.generativeai as genai

# ✅ APIキーの設定（安全のため環境変数で管理すべき）
genai.configure(api_key="AIzaSyA7ff88iym-pPHbjSKf-x6ddwFYzULZ9ec")

# ✅ モデルの初期化
gemini = genai.GenerativeModel("gemini-2.0-flash")  # または "gemini-pro"

# ✅ チャットセッションを開始（履歴あり）
chat = gemini.start_chat(history=[])

# ✅ チャットループ
while True:
    user_input = input("プロンプトを入力してください（終了するには '終了' と入力）: ")

    if user_input.strip().lower() in ["終了", "exit", "quit"]:
        print("チャットを終了します。")
        break

    try:
        # ✅ 履歴付きチャットセッションにメッセージ送信
        response = chat.send_message(user_input)

        # ✅ 応答表示
        print("\nLLMの応答:")
        print(response.text)
        print("\n")  # 空行で見やすくする

    except Exception as e:
        print("⚠️ エラーが発生しました:", e)


チャットを終了します。


In [None]:
#RAG

import os
os.environ["USER_AGENT"] = "MyLangChainBot/1.0"

# --- LangChain Core コンポーネント ---
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_core.output_parsers import StrOutputParser # LangChain 0.1.0 以降は langchain.schema.output_parser ではなくこちらを推奨
from langchain_core.prompts import ChatPromptTemplate
# from langchain_core.documents import Document # 必要に応じてインポート（今回は直接使用していませんが、ドキュメント操作でよく使われます）

# --- LangChain Community コンポーネント (外部連携) ---
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
# from langchain_community.chat_models import ChatGoogleGenerativeAI # コメントアウトまたは削除
from langchain_google_genai import ChatGoogleGenerativeAI # こちらを使用

# --- その他のライブラリ ---
from bs4 import SoupStrainer # Web スクレイピングに必要
# from IPython.display import display_markdown # Jupyter環境などでMarkdown表示に使う場合

# --- ドキュメントの読み込みと前処理 ---
# ⚠️ 注意: 大規模なWebサイトをクロールする際は、robots.txt を確認し、
# サイトの利用規約に従ってください。過度なリクエストは避けるべきです。
loader = WebBaseLoader(
    web_paths=("https://arxiv.org/html/2303.08774v6",),
    # SoupStrainer を使うことで、特定のHTML要素のみを解析し、効率化できます。
    bs_kwargs={'parse_only': SoupStrainer(class_="ltx_section")}
)
docs = loader.load()

# ドキュメントをチャンクに分割することで、LLMのコンテキストウィンドウに収まるようにします。
# チャンクサイズとオーバーラップは、ドキュメントの性質やタスクによって調整が必要です。
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000, # チャンクの最大文字数
    chunk_overlap=200 # チャンク間の重複文字数。これにより、文脈の途切れを防ぎます。
)
splits = text_splitter.split_documents(docs)

# --- 埋め込みモデルとベクトルストアの準備 ---
# Hugging Face の埋め込みモデルを使用。多言語対応モデルは日本語RAGに特に有効です。
# ローカルでモデルをダウンロードして実行するため、インターネット接続は初回のみ必要です。
embedding_model = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-small")

# ChromaDB はローカルで動作する軽量なベクトルストアで、開発や小規模なアプリケーションに適しています。
# persist_directory を指定することで、次回以降はデータベースを再構築せずに利用できます。
vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=embedding_model,
    persist_directory="./chroma_db"
)
# ベクトルストアがディスクに永続化されたことを明示的に伝えるために `persist()` を呼び出すことを推奨します。
vectorstore.persist()

# --- LLM とプロンプトの準備 ---
# Google Gemini の LLM を定義。
llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-pro",
    google_api_key="AIzaSyA7ff88iym-pPHbjSKf-x6ddwFYzULZ9ec"  # ここに取得したAPIキーを入力
)
# from langchain_openai import ChatOpenAI # OpenAIを使う場合の例

# LangChain Hub から RAG 用プロンプトを取得。
# これらのプロンプトは、RAGタスクに最適化されており、効果的な応答生成を助けます。
prompt = ChatPromptTemplate.from_template("""
あなたはユーザーの質問に答えるAIアシスタントです。
提供された情報のみに基づいて、質問に答えてください。
情報が不足している場合は、その旨を伝えてください。

{context}

質問: {question}
""")
# 💡 LangChain Hub (pull("rlm/rag-prompt")) も便利ですが、
# プロンプトのカスタマイズ性を考慮し、ここでは `ChatPromptTemplate.from_template` を使用する例を示します。
# 必要に応じて Hub のプロンプトをプルして内容を確認し、上記のように調整することも可能です。

# ベクトルストアの retriever を定義。
# 検索結果の数を k で制御できます。
retriever = vectorstore.as_retriever(search_kwargs={"k": 3}) # 関連ドキュメントを3つ取得する例

# --- RAG チェーンの構築 ---
# ドキュメントをLLMのプロンプトに組み込むために整形する関数
def format_docs(docs):
    # 各ドキュメントのページ内容を結合し、区切り文字を挿入します。
    # これにより、LLMがコンテキストを理解しやすくなります。
    return "\n\n".join(doc.page_content for doc in docs)

# LangChain Expression Language (LCEL) を用いた RAG チェーンの構成。
# これにより、チェーンの可読性とモジュール性が向上します。
RAG_chain = (
    # "context" には retriever で取得したドキュメントを format_docs で整形したものを渡します。
    # "question" にはユーザーからの質問をそのまま渡します。
    {"context": retriever | RunnableLambda(format_docs), "question": RunnablePassthrough()}
    | prompt # 質問とコンテキストをプロンプトテンプレートに渡します。
    | llm    # プロンプトをLLMに入力し、応答を生成します。
    | StrOutputParser() # LLMの出力を文字列としてパースします。
)

# --- RAG を使った生成の実行 ---
# ユーザーの質問に対して RAG チェーンを実行し、関連情報に基づいた回答を得ます。
question = "MMLUベンチマークにおけるGPT4の性能を日本語で教えてください。"
print(f"## 質問: {question}\n")
RAG_result = RAG_chain.invoke(question)
print("## RAGを使う場合の生成結果:\n" + RAG_result)

# display_markdown("## RAGを使う場合の生成結果:\n" + RAG_result) # Jupyter 環境以外では動作しないためコメントアウト

# --- 追加の考慮事項 ---
# - ストリーミング出力: 大規模な応答の場合、ストリーミング出力を使うとユーザー体験が向上します。
#   `RAG_chain.stream(question)` を使用し、チャンクごとに処理できます。
# - エラーハンドリング: API呼び出しやファイル操作におけるエラーハンドリングを追加することを検討してください。
# - キャッシュ: 同じ質問に対する応答をキャッシュすることで、APIコストを削減し、応答速度を向上できます。
# - ログ: アプリケーションの動作を追跡するために、ログ記録を設定することを推奨します。

## 質問: MMLUベンチマークにおけるGPT4の性能を日本語で教えてください。

## RAGを使う場合の生成結果:
提供された情報には、GPT-4がMMLUベンチマークを多言語に翻訳してテストした結果、GPT-3.5やChinchilla、PaLMといった既存の言語モデルの英語での性能を上回ったことが記載されています。ラトビア語、ウェールズ語、スワヒリ語といった低リソース言語でも同様の結果が得られたことが明記されています。

しかし、日本語でのGPT-4の性能については、この情報には具体的に記載されていません。そのため、日本語での性能に関する情報は提供できません。


In [None]:
#RAG ストリーミング出力

import os
# 環境変数は、APIキーなど機密情報を扱う際に特に重要です。
# 今回の USER_AGENT は LangChain の挙動に影響しますが、機密情報ではありません。
os.environ["USER_AGENT"] = "MyLangChainBot/1.0"

# --- LangChain Core コンポーネント ---
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_core.output_parsers import StrOutputParser # LangChain 0.1.0 以降は langchain.schema.output_parser ではなくこちらを推奨
from langchain_core.prompts import ChatPromptTemplate
# from langchain_core.documents import Document # 必要に応じてインポート（今回は直接使用していませんが、ドキュメント操作でよく使われます）

# --- LangChain Community コンポーネント (外部連携) ---
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
# from langchain_community.chat_models import ChatGoogleGenerativeAI # コメントアウトまたは削除
from langchain_google_genai import ChatGoogleGenerativeAI # こちらを使用
from langchain.text_splitter import RecursiveCharacterTextSplitter # RecursiveCharacterTextSplitterのインポートが抜けていました

# --- その他のライブラリ ---
from bs4 import SoupStrainer # Web スクレイピングに必要
# from IPython.display import display_markdown # Jupyter環境などでMarkdown表示に使う場合

# --- ドキュメントの読み込みと前処理 ---
# ⚠️ 注意: 大規模なWebサイトをクロールする際は、robots.txt を確認し、
# サイトの利用規約に従ってください。過度なリクエストは避けるべきです。
loader = WebBaseLoader(
    web_paths=("https://arxiv.org/html/2303.08774v6",),
    # SoupStrainer を使うことで、特定のHTML要素のみを解析し、効率化できます。
    bs_kwargs={'parse_only': SoupStrainer(class_="ltx_section")}
)
docs = loader.load()

# ドキュメントをチャンクに分割することで、LLMのコンテキストウィンドウに収まるようにします。
# チャンクサイズとオーバーラップは、ドキュメントの性質やタスクによって調整が必要です。
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000, # チャンクの最大文字数
    chunk_overlap=200 # チャンク間の重複文字数。これにより、文脈の途切れを防ぎます。
)
splits = text_splitter.split_documents(docs)

# --- 埋め込みモデルとベクトルストアの準備 ---
# Hugging Face の埋め込みモデルを使用。多言語対応モデルは日本語RAGに特に有効です。
# ローカルでモデルをダウンロードして実行するため、インターネット接続は初回のみ必要です。
embedding_model = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-small")

# ChromaDB はローカルで動作する軽量なベクトルストアで、開発や小規模なアプリケーションに適しています。
# persist_directory を指定することで、次回以降はデータベースを再構築せずに利用できます。
vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=embedding_model,
    persist_directory="./chroma_db"
)
# ベクトルストアがディスクに永続化されたことを明示的に伝えるために `persist()` を呼び出すことを推奨します。
vectorstore.persist()

# --- LLM とプロンプトの準備 ---
# Google Gemini の LLM を定義。
# ⚠️ 注意: APIキーをコードに直接記述することは、セキュリティ上非推奨です。
# 環境変数を使用するか、.env ファイルから読み込むことを強く推奨します。
# 例: os.environ["GOOGLE_API_KEY"] = "YOUR_API_KEY" を事前に設定。
llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-pro",
    google_api_key="AIzaSyA7ff88iym-pPHbjSKf-x6ddwFYzULZ9ec", # ここに取得したAPIキーを入力
    temperature=0.7 # 温度設定を追加。回答の多様性を制御します。
)
# from langchain_openai import ChatOpenAI # OpenAIを使う場合の例

# LangChain Hub から RAG 用プロンプトを取得。
# これらのプロンプトは、RAGタスクに最適化されており、効果的な応答生成を助けます。
prompt = ChatPromptTemplate.from_template("""
あなたはユーザーの質問に答えるAIアシスタントです。
提供された情報のみに基づいて、質問に答えてください。
情報が不足している場合は、その旨を伝えてください。

{context}

質問: {question}
""")
# 💡 LangChain Hub (pull("rlm/rag-prompt")) も便利ですが、
# プロンプトのカスタマイズ性を考慮し、ここでは `ChatPromptTemplate.from_template` を使用する例を示します。
# 必要に応じて Hub のプロンプトをプルして内容を確認し、上記のように調整することも可能です。

# ベクトルストアの retriever を定義。
# 検索結果の数を k で制御できます。
retriever = vectorstore.as_retriever(search_kwargs={"k": 3}) # 関連ドキュメントを3つ取得する例

# --- RAG チェーンの構築 ---
# ドキュメントをLLMのプロンプトに組み込むために整形する関数
def format_docs(docs):
    # 各ドキュメントのページ内容を結合し、区切り文字を挿入します。
    # これにより、LLMがコンテキストを理解しやすくなります。
    return "\n\n".join(doc.page_content for doc in docs)

# LangChain Expression Language (LCEL) を用いた RAG チェーンの構成。
# これにより、チェーンの可読性とモジュール性が向上します。
RAG_chain = (
    # "context" には retriever で取得したドキュメントを format_docs で整形したものを渡します。
    # "question" にはユーザーからの質問をそのまま渡します。
    {"context": retriever | RunnableLambda(format_docs), "question": RunnablePassthrough()}
    | prompt # 質問とコンテキストをプロンプトテンプレートに渡します。
    | llm    # プロンプトをLLMに入力し、応答を生成します。
    | StrOutputParser() # LLMの出力を文字列としてパースします。
)

# --- RAG を使った生成の実行 (ストリーミング版) ---
# ユーザーの質問に対して RAG チェーンを実行し、関連情報に基づいた回答を得ます。
question = "MMLUベンチマークにおけるGPT4の性能を日本語で教えてください。"
print(f"## 質問: {question}\n")
print("## RAGを使う場合の生成結果 (ストリーミング):\n")

# ✅ invoke() の代わりに stream() を使用し、逐次結果を出力
for chunk in RAG_chain.stream(question):
    print(chunk, end="", flush=True) # chunk を受け取るたびに表示し、バッファをフラッシュ
print("\n") # 最後に改行を追加して整形

# --- 追加の考慮事項 ---
# - ストリーミング出力: 大規模な応答の場合、ストリーミング出力を使うとユーザー体験が向上します。
#   `RAG_chain.stream(question)` を使用し、チャンクごとに処理できます。
# - エラーハンドリング: API呼び出しやファイル操作におけるエラーハンドリングを追加することを検討してください。
# - キャッシュ: 同じ質問に対する応答をキャッシュすることで、APIコストを削減し、応答速度を向上できます。
# - ログ: アプリケーションの動作を追跡するために、ログ記録を設定することを推奨します。

## 質問: MMLUベンチマークにおけるGPT4の性能を日本語で教えてください。

## RAGを使う場合の生成結果 (ストリーミング):

提供された情報には、GPT-4がMMLUベンチマークを多数の言語に翻訳してテストし、GPT-3.5、Chinchilla、PaLMといった既存の言語モデルよりも多くの言語で優れた性能を示したことが記載されています。ラトビア語、ウェールズ語、スワヒリ語のような低リソース言語でも良い結果を出したことが明記されています。

しかし、日本語でのGPT-4の性能については具体的に言及されていません。そのため、日本語での性能に関する情報は提供されたテキストからは判断できません。




In [None]:
#RAG ページの全てのコンテンツを解析し、それをドキュメントとしてロード

import os
os.environ["USER_AGENT"] = "MyLangChainBot/1.0"

# --- LangChain Core コンポーネント ---
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate

# --- LangChain Community コンポーネント (外部連携) ---
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.text_splitter import RecursiveCharacterTextSplitter # RecursiveCharacterTextSplitterのインポート

# --- その他のライブラリ ---
from bs4 import SoupStrainer # Web スクレイピングに必要ですが、今回は使用しないので残しておくか削除するかはお好みで。

# --- ドキュメントの読み込みと前処理 ---
# ⚠️ 注意: 大規模なWebサイトをクロールする際は、robots.txt を確認し、
# サイトの利用規約に従ってください。過度なリクエストは避けるべきです。
loader = WebBaseLoader(
    web_paths=("https://news.yahoo.co.jp/",),
    # 💡 サイト全体から情報を取得するため、bs_kwargs パラメータを削除しました。
    # これにより、WebBaseLoaderはWebページのHTML全体を解析します。
)
docs = loader.load()

# ドキュメントをチャンクに分割することで、LLMのコンテキストウィンドウに収まるようにします。
# チャンクサイズとオーバーラップは、ドキュメントの性質やタスクによって調整が必要です。
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000, # チャンクの最大文字数
    chunk_overlap=200 # チャンク間の重複文字数。これにより、文脈の途切れを防ぎます。
)
splits = text_splitter.split_documents(docs)

# --- 埋め込みモデルとベクトルストアの準備 ---
# Hugging Face の埋め込みモデルを使用。多言語対応モデルは日本語RAGに特に有効です。
# ローカルでモデルをダウンロードして実行するため、インターネット接続は初回のみ必要です。
embedding_model = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-small")

# ChromaDB はローカルで動作する軽量なベクトルストアで、開発や小規模なアプリケーションに適しています。
# persist_directory を指定することで、次回以降はデータベースを再構築せずに利用できます。
vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=embedding_model,
    persist_directory="./chroma_db"
)
# ベクトルストアがディスクに永続化されたことを明示的に伝えるために `persist()` を呼び出すことを推奨します。
vectorstore.persist()

# --- LLM とプロンプトの準備 ---
# Google Gemini の LLM を定義。
# ⚠️ 注意: APIキーをコードに直接記述することは、セキュリティ上非推奨です。
# 環境変数を使用するか、.env ファイルから読み込むことを強く推奨します。
# 例: os.environ["GOOGLE_API_KEY"] = "YOUR_API_KEY" を事前に設定。
llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-pro",
    google_api_key="AIzaSyA7ff88iym-pPHbjSKf-x6ddwFYzULZ9ec", # ここに取得したAPIキーを入力
    temperature=0.7 # 温度設定を追加。回答の多様性を制御します。
)

# LangChain Hub から RAG 用プロンプトを取得。
# これらのプロンプトは、RAGタスクに最適化されており、効果的な応答生成を助けます。
prompt = ChatPromptTemplate.from_template("""
あなたはユーザーの質問に答えるAIアシスタントです。
提供された情報のみに基づいて、質問に答えてください。
情報が不足している場合は、その旨を伝えてください。

{context}

質問: {question}
""")

# ベクトルストアの retriever を定義。
# 検索結果の数を k で制御できます。
retriever = vectorstore.as_retriever(search_kwargs={"k": 3}) # 関連ドキュメントを3つ取得する例

# --- RAG チェーンの構築 ---
# ドキュメントをLLMのプロンプトに組み込むために整形する関数
def format_docs(docs):
    # 各ドキュメントのページ内容を結合し、区切り文字を挿入します。
    # これにより、LLMがコンテキストを理解しやすくなります。
    return "\n\n".join(doc.page_content for doc in docs)

# LangChain Expression Language (LCEL) を用いた RAG チェーンの構成。
# これにより、チェーンの可読性とモジュール性が向上します。
RAG_chain = (
    # "context" には retriever で取得したドキュメントを format_docs で整形したものを渡します。
    # "question" にはユーザーからの質問をそのまま渡します。
    {"context": retriever | RunnableLambda(format_docs), "question": RunnablePassthrough()}
    | prompt # 質問とコンテキストをプロンプトテンプレートに渡します。
    | llm    # プロンプトをLLMに入力し、応答を生成します。
    | StrOutputParser() # LLMの出力を文字列としてパースします。
)

# --- RAG を使った生成の実行 (ストリーミング版) ---
# ユーザーの質問に対して RAG チェーンを実行し、関連情報に基づいた回答を得ます。
question = "今日のニュースを教えてください。"
print(f"## 質問: {question}\n")
print("## RAGを使う場合の生成結果 (ストリーミング):\n")

# invoke() の代わりに stream() を使用し、逐次結果を出力
for chunk in RAG_chain.stream(question):
    print(chunk, end="", flush=True) # chunk を受け取るたびに表示し、バッファをフラッシュ
print("\n") # 最後に改行を追加して整形

## 質問: 今日のニュースを教えてください。

## RAGを使う場合の生成結果 (ストリーミング):

提供された情報に基づくと、今日のニュースは以下のとおりです。

* **各地で30℃超え 熱中症のリスク大**
* **東電株主訴訟 揺れる司法判断**
* **コメ適正価格は3000円 生産者団体**
* **トンネルで車が正面衝突 男性死亡**
* **電話が苦手な20代 企業の対応は**
* **ガルベス氏 長嶋さんに謝りたい**
* **6月の風物詩 大河クランクイン**
* **西内まりや SNS更新「お元気で」**

その他、小泉農水相の発言による米の備蓄放出に関する話題や、元フジ女子アナへの誹謗中傷、元なでしこ宮間あやさんの引退後の活動、長嶋茂雄さん追悼特番への不満、タイで日本人男性の死刑求刑など、様々なニュースが報じられています。

アクセスランキング上位としては、ガルベス氏が長嶋茂雄さんについて語った記事や、無期懲役囚の終身刑化に関する報道、宮沢りえさんの話題などが注目を集めているようです。




