In [None]:
import os
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
import seaborn as sns

# ----- 設定 -----
embedding_path = "../data/embeddings/bge_embeddings.npy"  # 埋め込みベクトル
metadata_path = "../data/processed/cleaned_risk_dataset.csv"  # メタ情報（docID, company_name など）
output_plot_path = "../outputs/tsne_clusters.png"

In [None]:
# ----- データ読み込み -----
print("Loading data...")
embeddings = np.load(embedding_path)
df = pd.read_csv(metadata_path)

# docIDが一致しているか確認（埋め込み数 = データ数）
assert embeddings.shape[0] == len(df), "データ数とベクトル数が一致しません"

In [None]:
# ----- クラスタリング -----
print("Clustering...")
n_clusters = 9  # 適宜変更
kmeans = KMeans(n_clusters=n_clusters, random_state=42)
df["cluster"] = kmeans.fit_predict(embeddings)

In [None]:
# ----- 次元圧縮（t-SNE） -----
print("Running t-SNE...")
tsne = TSNE(n_components=2, random_state=42, perplexity=30)
reduced = tsne.fit_transform(embeddings)
df["x"] = reduced[:, 0]
df["y"] = reduced[:, 1]

plt.title("t-SNE plot of Risk Embeddings (by Cluster)")
# 事前にoutputsディレクトリを作成しておく
os.makedirs("outputs", exist_ok=True)
plt.savefig(output_plot_path)
plt.show()
print(f"✅ クラスタプロットを保存しました: {output_plot_path}")

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.manifold import TSNE
from sklearn.cluster import KMeans

# Notebook内描画設定
%matplotlib inline

# 埋め込み読み込み
embeddings = np.load("../data/embeddings/bge_embeddings.npy")

# t-SNEで次元削減
tsne = TSNE(n_components=2, random_state=42, perplexity=30)
embeddings_2d = tsne.fit_transform(embeddings)

# KMeansクラスタリング
kmeans = KMeans(n_clusters=10, random_state=42)
labels = kmeans.fit_predict(embeddings)

# 描画
plt.figure(figsize=(10, 8))
plt.scatter(embeddings_2d[:, 0], embeddings_2d[:, 1], c=labels, cmap="tab10", alpha=0.7)
plt.title("t-SNE Visualization of Risk Embeddings")
plt.xlabel("t-SNE 1")
plt.ylabel("t-SNE 2")
plt.colorbar(label="Cluster")
plt.grid(True)
plt.show()

In [None]:
# 業種情報を追加
import pandas as pd
df2 = pd.read_csv('../data/processed/nikkei225_complete.csv')
df_complete = pd.merge(df.copy(), df2[['ＥＤＩＮＥＴコード', '提出者業種']], left_on='edinet_code', right_on='ＥＤＩＮＥＴコード', how='left')
df_complete = df_complete.rename(columns={'提出者業種': 'industry'})
df_complete.to_csv('../data/processed/df_rag.csv')

## RAG
構成（llama-index + FAISS + LLM）

In [None]:
import pandas as pd
df = pd.read_csv('../data/processed/df_rag.csv')

In [None]:
from sklearn.feature_extraction.text import TfidfVectorizer
import numpy as np

# 1. 全文を使ってTF-IDFを計算
all_texts = df["token_str"].dropna().tolist()
vectorizer_all = TfidfVectorizer(max_features=3000)
tfidf_all = vectorizer_all.fit_transform(all_texts)
global_vocab = vectorizer_all.get_feature_names_out()

# 2. 単語ごとのスコア平均を算出
mean_scores_all = tfidf_all.mean(axis=0).A1

# 3. 上位 N個の「共通語」を取得（除外候補）
top_common = list(set(global_vocab[mean_scores_all.argsort()[::-1][:50]]))

In [None]:
from sklearn.feature_extraction.text import TfidfVectorizer

stop_words = top_common
vectorizer = TfidfVectorizer(max_features=1000, stop_words=stop_words)

for cluster_id in sorted(df["cluster"].unique()):
    texts = df[df["cluster"] == cluster_id]["token_str"].dropna().tolist()
    
    if not texts:
        continue

    tfidf_matrix = vectorizer.fit_transform(texts)
    feature_names = vectorizer.get_feature_names_out()
    mean_scores = tfidf_matrix.mean(axis=0).A1
    top_n = 10
    top_idx = mean_scores.argsort()[::-1][:top_n]

    print(f"\nクラスタ {cluster_id} の特徴語 Top {top_n}:")
    for i in top_idx:
        print(f"  {feature_names[i]}: {mean_scores[i]:.3f}")

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import japanize_matplotlib  # すでに入ってる場合はスキップ

# 1. 全体の業種比率（期待値）
industry_total_ratio = df_complete["industry"].value_counts(normalize=True)

# 2. クラスタ × 業種 の出現頻度
cluster_industry = df_complete.groupby(["cluster", "industry"]).size().unstack(fill_value=0)

# 3. 各クラスタ内の業種比率
cluster_industry_ratio = cluster_industry.div(cluster_industry.sum(axis=1), axis=0)

# 4. 補正比率（観測 / 期待）
corrected_ratio = cluster_industry_ratio.copy()
for col in corrected_ratio.columns:
    corrected_ratio[col] = corrected_ratio[col] / industry_total_ratio[col]

# 5. ヒートマップ表示（1.0が平均、濃いほど過剰）
plt.figure(figsize=(14, 6))
sns.heatmap(corrected_ratio, annot=True, cmap="RdBu_r", center=1.0, fmt=".2f")
plt.title("クラスタごとの業種構成比（全体比に対する相対値）")
plt.xlabel("業種")
plt.ylabel("クラスタ")
plt.xticks(rotation=45, ha='right')
plt.yticks(rotation=0)
plt.tight_layout()
plt.show()

In [None]:
df.columns

In [None]:
# =========================
# ✅ 1. ライブラリ読み込み
# =========================
import pandas as pd
import json
import pickle
import faiss

from llama_index.core import Document, Settings, get_response_synthesizer, VectorStoreIndex
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core.retrievers import VectorIndexRetriever
from llama_index.vector_stores.faiss import FaissVectorStore
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core.postprocessor import SentenceTransformerRerank # 追加

from langchain_community.llms.llamacpp import LlamaCpp

# =========================
# ✅ 2. LLMとEmbeddingの設定
# =========================
print("🔧 Setting LLM and embedder...")
llm = LlamaCpp(
    model_path="../models/Llama-3-ELYZA-JP-8B-q4_k_m.gguf",
    temperature=0.0,
    n_ctx=2048,
    max_tokens=512,
    verbose=False
)
Settings.llm = llm

# 埋め込みモデル
Settings.embed_model = HuggingFaceEmbedding(model_name="pkshatech/RoSEtta-base", trust_remote_code=True)

# =========================
# ✅ 3. データ読み込みと準備
# =========================
# Assuming 'df' is loaded and prepared before this section
# For demonstration purposes, let's create a dummy DataFrame if df is not defined

assert "token_str" in df.columns and "cluster" in df.columns, "必須カラムが不足しています"

documents = [Document(text=row["token_str"]) for _, row in df.iterrows()]

# =========================
# ✅ 4. FAISS Indexの作成
# =========================
print("📦 Creating FAISS index...")
dimension = 1024 # Ensure this matches your embedding model's dimension (RoSEtta-base has 1024)
faiss_index = faiss.IndexFlatL2(dimension)
faiss_store = FaissVectorStore(faiss_index=faiss_index)

index = VectorStoreIndex.from_documents(
    documents,
    vector_store=faiss_store,
    transformations=[SentenceSplitter(chunk_size=512, chunk_overlap=20)],
    show_progress=True
)

# オプション：保存
with open("faiss_index.pkl", "wb") as f:
    pickle.dump(index, f)
print("✅ faiss_index.pkl saved.")

In [None]:
# =========================
# ✅ 5. Query Engine セットアップ (Reranker組み込み)
# =========================
# Retrieverの設定
retriever = VectorIndexRetriever(index=index, similarity_top_k=10) # 最初に多めに取得

# Rerankerの設定
reranker = SentenceTransformerRerank(
    model="hotchpotch/japanese-reranker-cross-encoder-base-v1",
    top_n=3 # リランキング後に最終的に取得するドキュメント数
)

# Response Synthesizerの設定
synthesizer = get_response_synthesizer(response_mode="tree_summarize")

# Query Engineの構築
query_engine = RetrieverQueryEngine(
    retriever=retriever,
    response_synthesizer=synthesizer,
    node_postprocessors=[reranker] # ここでrerankerを追加
)
print("✅ Query Engine with Reranker setup complete.")

In [None]:
# =========================
# ✅ 6. クラスタごとの要約処理
# =========================
print("🧠 クラスタ要約開始...")
cluster_ids = sorted(df["cluster"].unique())
cluster_summaries = {}

for cluster_id in cluster_ids:
    print(f"\n【クラスタ {cluster_id}】要約中...")

    # 各クラスタに属するドキュメントのみをフィルタリングしてquery_engineに渡す
    # ただし、現状のコードではquery_engineはFAISSインデックス全体に対してクエリを実行します。
    # 特定のクラスタのドキュメントのみを要約したい場合は、
    # そのクラスタのドキュメントを一時的に別のインデックスに入れてクエリするか、
    # 既存のdfからフィルタリングしたデータを使ってSummaryIndexを作成するなどの工夫が必要です。
    # ここでは、簡略化のため、全体のインデックスに対してクエリを発行し、プロンプトで制御することを想定します。

    # クエリにクラスタ固有の情報を追加し、LLMにそのクラスタのドキュメントから要約させる
    # 実際には、cluster_idに対応するドキュメントを抽出して渡す必要がありますが、
    # 現在のLlamaIndexのRetrieverQueryEngineの設計では、
    # クエリ時に動的に特定のクラスタのドキュメントのみを対象とすることは直接的ではありません。
    # そのため、プロンプトで「このクラスタに関連する」というニュアンスを持たせることで、
    # LLMがretrieverから取得したドキュメントの中から関連性の高いものを選択するよう促します。

    # ここをより厳密にするには、cluster_idごとに新しいVectorStoreIndexを作成し、
    # そのindexに対してquery_engineを構築する必要があります。
    # 例:
    # cluster_docs = [Document(text=row["token_str"]) for _, row in df[df["cluster"] == cluster_id].iterrows()]
    # cluster_index = VectorStoreIndex.from_documents(cluster_docs, transformations=[SentenceSplitter(chunk_size=512, chunk_overlap=20)])
    # cluster_retriever = VectorIndexRetriever(index=cluster_index, similarity_top_k=5)
    # cluster_query_engine = RetrieverQueryEngine(retriever=cluster_retriever, response_synthesizer=synthesizer, node_postprocessors=[reranker])
    # response = cluster_query_engine.query(query)

    # 現在のコードの構造を維持しつつ、要約のプロンプトを調整
    query = (
        "以下は同じクラスタに属するリスク文です。\n"
        "このクラスタ特有のリスクの種類・内容を、できるだけ具体的に2～3点、箇条書きで要約してください。\n"
        "抽象的なフレーズ（例：リスク管理、サステナビリティ）ではなく、実際に文中で言及されている内容を用いてください。"
    )

    response = query_engine.query(query)
    summary = str(response).strip()
    cluster_summaries[cluster_id] = summary
    print(f"✅ 要約完了: {summary}")

# =========================
# ✅ 7. JSON形式で保存
# =========================
output_path = "../outputs/reports/cluster_summaries.json"
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(cluster_summaries, f, ensure_ascii=False, indent=2)

print(f"📄 クラスタ要約を {output_path} に保存しました。")

In [None]:
# 長すぎるクラスタを防ぐために、最大件数を制限（例: 30件）
MAX_DOCS_PER_CLUSTER = 30
cluster_docs_df = cluster_docs_df.head(MAX_DOCS_PER_CLUSTER)

In [None]:
# =========================
# ✅ 1. ライブラリ読み込み
# =========================
import pandas as pd
import json
import pickle
import faiss

from llama_index.core import Document, Settings, get_response_synthesizer, VectorStoreIndex
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core.retrievers import VectorIndexRetriever
from llama_index.vector_stores.faiss import FaissVectorStore
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core.postprocessor import SentenceTransformerRerank

from langchain_community.llms.llamacpp import LlamaCpp

# =========================
# ✅ 2. LLMとEmbeddingの設定
# =========================
print("🔧 Setting LLM and embedder...")
llm = LlamaCpp(
    model_path="../models/Llama-3-ELYZA-JP-8B-q4_k_m.gguf",
    temperature=0.1,
    n_ctx=8192,  # 8192に変更
    max_tokens=512,
    verbose=False,
    n_gpu_layers=32
)
Settings.llm = llm

# 埋め込みモデル
# HuggingFaceEmbeddingのインスタンスを直接変数に格納する
embed_model_instance = HuggingFaceEmbedding(model_name="pkshatech/RoSEtta-base", trust_remote_code=True)
Settings.embed_model = embed_model_instance # Settingsにも設定しておく

# =========================
# ✅ 3. データ読み込みと準備
# =========================
df = pd.read_csv('../data/processed/df_rag.csv')
assert "risk_text" in df.columns and "cluster" in df.columns, "必須カラムが不足しています"

# =========================
# ✅ 4. Rerankerの設定 (一度だけ定義)
# =========================
# Rerankerの設定
reranker = SentenceTransformerRerank(
    model="hotchpotch/japanese-reranker-cross-encoder-base-v1",
    top_n=3 # リランキング後に最終的に取得するドキュメント数
)
print("✅ Reranker setup complete.")


# =========================
# ✅ 5. クラスタごとの要約処理 (メインの変更点)
# =========================
print("🧠 クラスタ要約開始...")
cluster_ids = sorted(df["cluster"].unique())
cluster_summaries = {}

# Node Parser (SentenceSplitter) はここでも使用
node_parser = SentenceSplitter(chunk_size=512, chunk_overlap=20)

for cluster_id in cluster_ids:
    print(f"\n【クラスタ {cluster_id}】要約中...")

    # 1. 特定クラスタのドキュメントのみを抽出
    cluster_docs_df = df[df["cluster"] == cluster_id]
    cluster_documents = [Document(text=row["risk_text"]) for _, row in cluster_docs_df.iterrows()]

    if not cluster_documents:
        print(f"⚠️ クラスタ {cluster_id} にドキュメントがありません。スキップします。")
        cluster_summaries[cluster_id] = "このクラスタには要約するドキュメントがありません。"
        continue

    # 長すぎるクラスタを防ぐために、最大件数を制限（例: 30件）
    MAX_DOCS_PER_CLUSTER = 30
    # ここでdfの件数を制限するのではなく、cluster_documentsのリストを直接制限する
    cluster_documents = cluster_documents[:MAX_DOCS_PER_CLUSTER]


    # 2. そのクラスタのドキュメントから一時的なFAISS Indexを作成
    # 各クラスタでFAISS Indexを再作成するため、次元を再定義
    dimension = 1024 # RoSEtta-baseの次元
    cluster_faiss_index = faiss.IndexFlatL2(dimension)
    cluster_faiss_store = FaissVectorStore(faiss_index=cluster_faiss_index)

    cluster_index = VectorStoreIndex.from_documents(
        cluster_documents,
        vector_store=cluster_faiss_store,
        transformations=[node_parser], # 既存のnode_parserを使用
        embed_model=embed_model_instance, # 明示的に埋め込みモデルを指定する
        show_progress=False # 各クラスタでprogress barを出すと煩雑になるためオフ
    )
    print(f"  --- クラスタ {cluster_id} の一時インデックスを作成しました。")

    # 3. クラスタ専用のQuery Engineを構築
    cluster_retriever = VectorIndexRetriever(index=cluster_index, similarity_top_k=5) # クラスタ内の取得数を5に変更
    synthesizer = get_response_synthesizer(response_mode="tree_summarize") # Synthesizerは再利用可能

    cluster_query_engine = RetrieverQueryEngine(
        retriever=cluster_retriever,
        response_synthesizer=synthesizer,
        node_postprocessors=[reranker] # ここでrerankerを追加
    )
    print(f"  --- クラスタ {cluster_id} のQuery Engineを設定しました。")

    # 4. 要約クエリの実行
    query = (
        "以下は同じクラスタに属するリスク文です。\n"
        "このクラスタ特有のリスクの種類・内容を、できるだけ具体的に2～3点、箇条書きで要約してください。\n"
        "抽象的なフレーズ（例：リスク管理、サステナビリティ）ではなく、実際に文中で言及されている内容を用いてください。\n"
        "出力は日本語で、200文字以内に収めてください。"
    )

    response = cluster_query_engine.query(query)
    summary = str(response).strip()
    cluster_summaries[cluster_id] = summary
    print(f"✅ 要約完了: {summary}")

# =========================
# ✅ 6. JSON形式で保存
# =========================
output_path = "../outputs/reports/cluster_summaries.json"
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(cluster_summaries, f, ensure_ascii=False, indent=2)

print(f"📄 クラスタ要約を {output_path} に保存しました。")

In [None]:
import pandas as pd
import 
import json
import torch
import gc # ガベージコレクション用

# LLMの接続にopenaiライブラリとLlamaIndexのOpenAILLMラッパーを使用
from openai import OpenAI
from llama_index.llms.openai import OpenAI as LlamaIndexOpenAI

from llama_index.core import Document, Settings, get_response_synthesizer, VectorStoreIndex
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core.retrievers import VectorIndexRetriever
from llama_index.vector_stores.faiss import FaissVectorStore # faiss-gpu-cu12などをインストールした場合
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core.postprocessor import SentenceTransformerRerank

# =========================
# 1. LLMとEmbeddingの設定
# =========================
print("🔧 LLMと埋め込みモデルを設定中...")

# LLMの設定 (llama.cpp server + OpenAI互換API経由)
# OpenAIクライアントをllama.cppサーバーに接続します
# api_keyはダミーで問題ありません。
client = OpenAI(
    base_url="http://localhost:8080/v1", # llama-serverがリッスンしているURL
    api_key="dummy_api_key"             # ダミーキーでOK
)

# LlamaIndexのOpenAILLMラッパーを設定
# モデル名もllama-serverではダミーで問題ありません
llm = LlamaIndexOpenAI(
    model="gpt-3.5-turbo",              # 任意のモデル名
    api_key="dummy_api_key",            # ダミーキーでOK
    api_base="http://localhost:8080/v1",# llama-serverがリッスンしているURL
    temperature=0.6,                    # 生成の多様性 (0.0-1.0)。高いほど多様な回答。
    max_tokens=512,                     # LLMが生成する最大トークン数。要約の長さに応じて調整。
    # LlamaIndexのOpenAILLMは、OpenAI APIのチャットテンプレートに準拠するため、
    # llama.cppサーバーが期待するChatML形式と互換性があります。
    # system_promptやquery_wrapper_promptはLlamaIndexが適切に処理します。
)
Settings.llm = llm

# 埋め込みモデルの設定 (これはこれまでと同じ)
# pkshatech/RoSEtta-base は初回実行時に自動でダウンロードされます
embed_model_instance = HuggingFaceEmbedding(model_name="pkshatech/RoSEtta-base", trust_remote_code=True)
Settings.embed_model = embed_model_instance

print("✅ LLMと埋め込みモデルの設定が完了しました。")

# =========================
# 2. データ読み込みと準備
# =========================
# dfは前もって定義されていることを前提とします。
# 例: df = pd.read_csv("your_data.csv")
# あるいは、テスト用にダミーデータを作成（本番ではこれを削除）
df = pd.read_csv('../data/processed/df_rag.csv')

assert "risk_text" in df.columns and "cluster" in df.columns, "DataFrameに必須カラム 'risk_text' または 'cluster' が見つかりません。"

# =========================
# 3. Rerankerの設定
# =========================
# Rerankerの設定 (これはこれまでと同じ)
# hotchpotch/japanese-reranker-cross-encoder-base-v1 も自動ダウンロードされます
reranker = SentenceTransformerRerank(
    model="hotchpotch/japanese-reranker-cross-encoder-base-v1",
    top_n=3 # リランキング後に最終的に取得するドキュメント数
)
print("✅ Rerankerの設定が完了しました。")

# =========================
# 4. クラスタごとの要約処理
# =========================
print("🧠 クラスタごとの要約を開始します...")
# cluster_idsをPythonのint型に変換して取得 (TypeError対策)
cluster_ids = sorted([int(c_id) for c_id in df["cluster"].unique()])
cluster_summaries = {}

# Node Parser (SentenceSplitter)
node_parser = SentenceSplitter(chunk_size=512, chunk_overlap=20)

for cluster_id in cluster_ids:
    print(f"\n--- 【クラスタ {cluster_id}】要約中...")

    # 1. 特定クラスタのドキュメントのみを抽出
    cluster_docs_df = df[df["cluster"] == cluster_id]
    cluster_documents = [Document(text=row["risk_text"]) for _, row in cluster_docs_df.iterrows()]

    if not cluster_documents:
        print(f"⚠️ クラスタ {cluster_id} に要約するドキュメントがありません。スキップします。")
        cluster_summaries[int(cluster_id)] = "このクラスタには要約するドキュメントがありません。"
        continue

    # 長すぎるクラスタを防ぐために、最大件数を制限（例: 30件）
    MAX_DOCS_PER_CLUSTER = 30
    cluster_documents = cluster_documents[:MAX_DOCS_PER_CLUSTER]

    # 2. そのクラスタのドキュメントから一時的なFAISS Indexを作成
    # RoSEtta-baseの埋め込み次元は1024
    dimension = 1024
    cluster_faiss_index = faiss.IndexFlatL2(dimension)
    cluster_faiss_store = FaissVectorStore(faiss_index=cluster_faiss_index)

    cluster_index = VectorStoreIndex.from_documents(
        cluster_documents,
        vector_store=cluster_faiss_store,
        transformations=[node_parser],
        embed_model=embed_model_instance, # 明示的に埋め込みモデルを指定
        show_progress=False
    )
    print(f"  --- クラスタ {cluster_id} の一時インデックスを作成しました。")

    # 3. クラスタ専用のQuery Engineを構築
    cluster_retriever = VectorIndexRetriever(index=cluster_index, similarity_top_k=5)
    synthesizer = get_response_synthesizer(response_mode="tree_summarize")

    cluster_query_engine = RetrieverQueryEngine(
        retriever=cluster_retriever,
        response_synthesizer=synthesizer,
        node_postprocessors=[reranker]
    )
    print(f"  --- クラスタ {cluster_id} のQuery Engineを設定しました。")

    # 4. 要約クエリの実行
    # ここでのクエリはLLMに直接渡されます
    query = (
        "このクラスタに属するリスク文を2～3点、箇条書きで具体的に要約してください。\n"
        "抽象的なフレーズは避け、文中で言及されている内容のみを用いてください。\n"
        "出力は日本語で、200文字以内に収めてください。"
    )

    try:
        response = cluster_query_engine.query(query)
        summary = str(response).strip()
        cluster_summaries[int(cluster_id)] = summary # キーが確実にPythonのint型であることを保証
        print(f"✅ 要約完了: {summary}")
    except Exception as e:
        print(f"❌ クラスタ {cluster_id} の要約中にエラーが発生しました: {e}")
        cluster_summaries[int(cluster_id)] = f"要約中にエラーが発生しました: {e}"

# =========================
# 5. JSON形式で保存
# =========================
output_path = "../outputs/reports/cluster_summaries.json"
# outputs/reports ディレクトリが存在しない場合に作成
import os
os.makedirs(os.path.dirname(output_path), exist_ok=True)

with open(output_path, "w", encoding="utf-8") as f:
    json.dump(cluster_summaries, f, ensure_ascii=False, indent=2)

print(f"📄 クラスタ要約結果を {output_path} に保存しました。")

# =========================
# 6. メモリ解放の試み
# =========================
# llama.cppサーバーのモデルは別プロセスでメモリ管理されるため、Pythonスクリプト側での解放は不要です。
# ただし、埋め込みモデルのインスタンスやLlamaIndexのSettingsは削除しておくと良いでしょう。
if 'embed_model_instance' in locals():
    del embed_model_instance
# if 'Settings' in locals() and hasattr(Settings, 'llm'): # この行と次行を削除またはコメントアウト
#     del Settings.llm                                     # この行を削除またはコメントアウト
# if 'Settings' in locals() and hasattr(Settings, 'embed_model'): # この行と次行を削除またはコメントアウト
#     del Settings.embed_model                             # この行を削除またはコメントアウト

# Pythonのガベージコレクタを強制的に実行
gc.collect()

# PyTorchのCUDAキャッシュをクリア（念のため）
if torch.cuda.is_available():
    torch.cuda.empty_cache()

print("GPUメモリの解放を試みました（該当する場合）。")

In [None]:
df.columns

In [13]:
import json
import pickle
import faiss
from llama_index.core import Document, Settings, get_response_synthesizer, VectorStoreIndex
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.vector_stores.faiss import FaissVectorStore
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.llama_cpp import LlamaCPP
from llama_index.core.retrievers import VectorIndexRetriever
from llama_index.core.postprocessor import SentenceTransformerRerank
from llama_index.core.node_parser import SentenceSplitter # for chunking
from llama_index.core.prompts import PromptTemplate
import pandas as pd
from collections import defaultdict
from kneed import KneeLocator
import numpy as np # for KMeans
import matplotlib.pyplot as plt

import warnings
warnings.filterwarnings("ignore")

# --- LLMと埋め込みモデルの設定 ---
# LLM (llama-server)
Settings.llm = LlamaCPP(
    model_path="../models/Llama-3-ELYZA-JP-8B-q4_k_m.gguf",
    temperature=0.1,
    max_new_tokens=1024, # 要約に必要な最大トークン数 (必要に応じて調整)
    context_window=8192, # Llama 3 ELYZA JP 8B のコンテキストウィンドウに合わせて調整
    # その他、llama-serverで設定したパラメータがあればここに追加できる
    # 例: n_gpu_layers=32 (ただしこれはサーバー側で設定済みなので不要なはず)
    # LlamaIndex 0.10.x 以降では、これらの引数は LlamaCPP 初期化時に渡す
)

# Embedding model
Settings.embed_model = HuggingFaceEmbedding(
    model_name="pkshatech/RoSEtta-base",
    trust_remote_code=True
)

# --- Rerankerの設定 ---
reranker = SentenceTransformerRerank(
    model="hotchpotch/japanese-reranker-cross-encoder-base-v1",
    top_n=3,
    device="cuda"
)

# --- データ読み込み ---
# 仮に 'data/processed/all_risk_sentences.csv' に全ての期間のリスク文があるとする
# ここでは 'cleaned_risk_text' カラムにリスク文、'date' カラムに日付が入っていると仮定
df_all_risks = pd.read_csv('../data/processed/df_rag.csv')

# 'date' カラムから 'year' カラムを抽出
df_all_risks['year'] = pd.to_datetime(df_all_risks['date']).dt.year

# --- 年ごとのループ処理 ---
start_year = 2018
end_year = 2024 # 2024年のデータも対象に含める場合

# outputsディレクトリがなければ作成
import os
os.makedirs('../outputs/reports', exist_ok=True)

for current_year in range(start_year, end_year + 1):
    print(f"\n🧠 【{current_year}年】クラスタごとの要約を開始します...")

    # 指定年のデータのみをフィルタリング
    df_year = df_all_risks[df_all_risks['year'] == current_year].copy()

    if df_year.empty:
        print(f"--- {current_year}年のリスクデータが見つかりませんでした。スキップします。")
        continue

    # フィルタリングされたデータからDocumentオブジェクトを作成
    documents = [Document(text=row['cleaned_risk_text'], metadata={
                    'doc_id': row['doc_id'],
                    'date': row['date'],
                    'company_name': row['filer_name'],
                    'edinet_code': row['edinet_code'],
                    'sec_code': row['sec_code'],
                    'industry': row['industry'],
                 }) for index, row in df_year.iterrows()]

    # --- クラスタリング処理 (年ごとに実行) ---
    from sklearn.cluster import KMeans
    from sklearn.preprocessing import normalize

    print(f"--- 【{current_year}年】埋め込みベクトルの生成中...")
    # LlamaIndexの埋め込みモデルを使って、Documentsから直接埋め込みを生成する
    # これは時間がかかる処理なので、もし既に生成済みの埋め込みがある場合は、それをロードする方が効率的
    embeddings_list = [Settings.embed_model.get_text_embedding(doc.text) for doc in documents]
    
    # numpy 配列に変換
    X = np.array(embeddings_list)
    
    # 正規化 (KMeansでコサイン類似度に近い結果を得るため)
    X_normalized = normalize(X)

    # --- エルボー法による最適なクラスタ数の決定 ---
    # ドキュメント数が少ない場合はクラスタ数を制限する
    # 各クラスタに最低でも2つのドキュメントがあることを想定し、Kの最大値を調整
    max_k_for_elbow = min(len(documents) // 2, 15)
    
    # 最小クラスタ数を2に設定（1だとクラスタリングの意味がないため）
    if max_k_for_elbow < 2:
        print(f"--- {current_year}年のドキュメント数 ({len(documents)}) が少なすぎるため、クラスタリングをスキップします。最低2つのクラスタリングには4つ以上のドキュメントが必要です。")
        continue

    distortions = []
    # Kの範囲を2からmax_k_for_elbowまで試す
    K_range = range(2, max_k_for_elbow + 1)

    print(f"--- 【{current_year}年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～{max_k_for_elbow})...")
    for k in K_range:
        kmeans = KMeans(n_clusters=k, random_state=42, n_init='auto')
        kmeans.fit(X_normalized)
        distortions.append(kmeans.inertia_)

    # KneeLocatorを使って最適なKを自動決定
    # S=1.0 はエルボーの鋭さの感度。調整が必要な場合もある
    kneedle = KneeLocator(K_range, distortions, S=1.0, curve="convex", direction="decreasing")
    optimal_n_clusters = kneedle.elbow

    # 最適なKが見つからなかった場合や、K=1（意味がない）になる場合などへの対策
    if optimal_n_clusters is None or optimal_n_clusters < 2:
        # ドキュメント数に応じてデフォルト値を設定
        if len(documents) >= 100: # ドキュメント数が多い場合
            optimal_n_clusters = 5
        elif len(documents) >= 20: # 中程度の場合
            optimal_n_clusters = 3
        else: # 少ない場合
            optimal_n_clusters = 2
        print(f"--- 【{current_year}年】自動検出で最適なクラスタ数が見つからなかったか、小さすぎました。デフォルト値 {optimal_n_clusters} を使用します。")
    
    print(f"--- 【{current_year}年】最適なクラスタ数: {optimal_n_clusters}")

    # エルボープロットの描画と保存（最適点を強調）
    plt.figure(figsize=(10, 6))
    plt.plot(K_range, distortions, marker='o')
    if optimal_n_clusters: # 最適なKが見つかっていればプロットに点を打つ
        plt.vlines(optimal_n_clusters, plt.ylim()[0], plt.ylim()[1], linestyles='dashed', colors='red', label=f'Optimal K = {optimal_n_clusters}')
        plt.legend()
    plt.xlabel('Number of clusters (K)')
    plt.ylabel('Distortion (Inertia)')
    plt.title(f'Elbow Method for Optimal K ({current_year}) - Optimal K: {optimal_n_clusters}')
    plt.grid(True)
    
    elbow_plot_filename = f'../outputs/elbow_plots/elbow_method_{current_year}.png'
    plt.savefig(elbow_plot_filename)
    plt.close()
    print(f"--- 【{current_year}年】エルボープロットを '{elbow_plot_filename}' に保存しました。")

    # --- クラスタリング (最適なn_clustersで実行) ---
    print(f"--- 【{current_year}年】KMeansクラスタリング実行中 (K={optimal_n_clusters})...")
    kmeans = KMeans(n_clusters=optimal_n_clusters, random_state=42, n_init='auto')
    kmeans_labels = kmeans.fit_predict(X_normalized)

    # クラスタリング結果をDocumentオブジェクトに付与
    for i, doc in enumerate(documents):
        doc.metadata['cluster_label'] = int(kmeans_labels[i]) # NumPy int64をPython intに変換

    # クラスタごとにドキュメントをグループ化
    clustered_documents = defaultdict(list)
    for doc in documents:
        clustered_documents[doc.metadata['cluster_label']].append(doc)

    # --- クラスタごとの要約ループ ---
    all_cluster_summaries = {}

    for cluster_label, cluster_docs in sorted(clustered_documents.items()):
        print(f"--- 【クラスタ {cluster_label}】要約中...")

        # クラスタにドキュメントがない場合はスキップ
        if not cluster_docs:
            print(f"--- クラスタ {cluster_label} にドキュメントがありません。スキップします。")
            continue

        # FAISSインデックスの次元を設定（RoSEtta-baseは1024次元）
        dimension = 1024 
        
        # 毎回新しいFaissIndexインスタンスを作成し、そこへドキュメントを埋め込み・追加
        # ここで`faiss.IndexFlatL2`を使っているが、`faiss.IndexFlatIP`（内積）の方がコサイン類似度に近い
        # (ただし、埋め込みベクトルが正規化されている場合はL2でも良い結果になる)
        cluster_faiss_index = faiss.IndexFlatL2(dimension) 
        cluster_faiss_store = FaissVectorStore(faiss_index=cluster_faiss_index)

        cluster_index = VectorStoreIndex.from_documents(
            cluster_docs,
            vector_store=cluster_faiss_store,
            transformations=[SentenceSplitter(chunk_size=4096, chunk_overlap=20)],
            show_progress=False
        )

        # Query Engineの設定
        retriever = VectorIndexRetriever(
            index=cluster_index,
            similarity_top_k=5, # 関連性の高い上位K件を取得
        )
        my_prompt = PromptTemplate(
            template="""
        以下は、事業リスクに関する情報です。
        {context_str}
        
        これらの情報から、リスク文を2～3点、箇条書きで具体的に要約したものを出力してください。
        抽象的なフレーズを避け、文中で言及されている内容のみを用いて、要約したリスク文を箇条書きで具体的に出力してください。
        **要約結果のみを簡潔に箇条書きで出力してください。それ以外の前書きや説明は一切不要です。**
        """
        )
        response_synthesizer = get_response_synthesizer(
            response_mode="compact", # 要約モード
            text_qa_template=my_prompt
        )
        query_engine = RetrieverQueryEngine(
            retriever=retriever,
            response_synthesizer=response_synthesizer,
            node_postprocessors=[reranker],
        )

        # 要約クエリの実行
        query_text = f"このクラスタにまとめられている主要な{current_year}年の事業リスクは何ですか？" # 年をクエリに含める
        response = query_engine.query(query_text)
        
        summary_text = str(response)
        all_cluster_summaries[f"cluster_{cluster_label}"] = {
            "summary": summary_text,
            "document_count": len(cluster_docs),
            "sample_risk_sentences": [doc.text for doc in cluster_docs[:3]] # 代表的なリスク文を3つ含める
        }

        print(f"✅ 要約完了: クラスタ {cluster_label}")
        print(summary_text)

    # --- 結果の保存 (年ごとのファイル名に変更) ---
    output_filename = f'../outputs/reports/cluster_summaries_{current_year}.json'
    with open(output_filename, 'w', encoding='utf-8') as f:
        json.dump(all_cluster_summaries, f, ensure_ascii=False, indent=4)
    print(f"\n--- 【{current_year}年】の要約結果を '{output_filename}' に保存しました。")

print("\n--- 全期間の年ごとのクラスタリングと要約プロセスが完了しました ---")

llama_model_loader: loaded meta data with 22 key-value pairs and 291 tensors from ../models/Llama-3-ELYZA-JP-8B-q4_k_m.gguf (version GGUF V3 (latest))
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.name str              = Llama-3-8B-optimal-merged-stage2
llama_model_loader: - kv   2:                          llama.block_count u32              = 32
llama_model_loader: - kv   3:                       llama.context_length u32              = 8192
llama_model_loader: - kv   4:                     llama.embedding_length u32              = 4096
llama_model_loader: - kv   5:                  llama.feed_forward_length u32              = 14336
llama_model_loader: - kv   6:                 llama.attention.head_count u32              = 32
llama_model_loader: - kv   7:              lla


🧠 【2018年】クラスタごとの要約を開始します...
--- 【2018年】埋め込みベクトルの生成中...
--- 【2018年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2018年】最適なクラスタ数: 8
--- 【2018年】エルボープロットを '../outputs/elbow_plots/elbow_method_2018.png' に保存しました。
--- 【2018年】KMeansクラスタリング実行中 (K=8)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 0
2018年、当社グループにまとめられている主要な事業リスクは以下のとおりです。

1. 消費増税や五輪後の不況発生に係るリスク
2. 少子高齢化長寿命化に係るリスク
3. 所得の二極化に係るリスク
4. テクノロジーの進化に係るリスク
5. ＣＳＲの重要性アップに係るリスク
6. 減損に係るリスク
7. 資金調達に係るリスク
8. 資産運用に関するリスク
9. 国内外の自然災害による多額の保険金支払のリスク
10. 流動性リスク
11. 再保険取引に関するリスク
12. 経済環境社会環境等の予期せぬ変化により損失が発生するリスク
13. 保険業界の競争に関するリスク
14. 国内生命保険事業に関するリスク
15. 海外事業に関するリスク
16. 関連事業に関するリスク
17. 情報漏洩等に関するリスク
18. システムリスク
19. 人事労務に関するリスク
20. 事業運営に関するリスク
21. 事業中断に関するリスク
22. 統合のシナジーが十分に発揮されないリスク
--- 【クラスタ 1】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
2018年は、分譲マンションの新規供給量や販売状況の変動が業績に影響を与える可能性があります。建設資材労務等の急激な高騰や調達難が生じた場合、生産能力の低下が生じて業績に悪影響を及ぼす可能性があります。分譲マンション建設用地の供給や取引先デベロッパーの事業規模の変動が業績に影響を与える可能性があります。
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 2
2018年における主要な事業リスクは、以下の通りです。

- コンシューマープロダクツ事業の消費者ニーズの変化への対応ができない場合、ブランド価値を落とす可能性がある。
- 流通の変化に対応した販売活動や新たな提案ができない場合、当社グループの財政状態及び経営成績に影響を及ぼす可能性がある。
- 原材料の調達で予想を超えて市場価格に急激な変動が生じた場合、当社グループの財政状態及び経営成績に影響を及ぼす可能性がある。
- 生産工場の爆発火災事故、原材料購入先のトラブル、電力や水などの社会インフラの機能不全、有害物質による環境汚染、感染症の蔓延、テロ、政変、暴動などが発生し、商品の市場への供給に支障をきたした場合、当社グループへの信用、財政状態及び経営成績に重大な影響を及ぼす可能性がある。
- 為替の変動による影響を受けるが、為替予約取引や通貨スワップ取引などにより為替変動リスクをヘッジすることにしており、経営成績に与える影響を軽減している。
- 繰延税金資産や減損処理の影響で、有形固定資産、無形資産、のれん、繰延税金資産等の資産について、期待されるキャッシュフローが生み出せない場合、当社グループの財政状態及び経営成績に影響を及ぼす可能性がある。
- 人財の確保ができず、多様で優秀な人財が不足した場合、当社グループの財政状態及び経営成績に影響を及ぼす可能性がある。
- 法規制の遵守ができず、重大な法令違反を起こした場合、当社グループへの信用、財政状態及び経営成績に影響を及ぼす可能性がある。
- 情報管理が不適切で、顧客情報が漏洩した場合、顧客個人に支払う損害賠償による費用の発生や当社グループの社会的信用の失墜による売上高の減少が考えられ、当社グループの業績や財務状況に悪影響を及ぼす可能性がある。
- 自然災害や政治情勢の変化などが発生し、当社グループの店舗や製造工場、物流センター等の設備や人的資源に被害が発生した場合、営業活動に支障が生じ、業績や財務状況に悪影響を及ぼす可能性がある。

Original Answer: 
- コンシューマープロダクツ事業の消費者ニーズの変化への対応ができない場合、ブランド価値を落とす可能性がある。
- 流通の変化に対応した販売活動や新たな提案ができない場合、当社グループの財政状態及び経営成績に影響を及ぼす

Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 3
 - 災害等の発生による人的被害や建物設備の損傷、営業制約、消費マインドの冷え込み等による業績や財務状況の影響
         - 感染症の流行による施設利用客の減少、鉄道の列車運行等の事業運営の支障、業績や財務状況の影響
         - 事故等の発生による人的被害や事業の中断、被害者に対する損害賠償責任や施設の復旧等に伴う費用の発生、顧客の信頼及び社会的評価の低下による業績や財務状況の影響
         - 保有資産及び商品の瑕疵欠陥による改善原状復帰補償等にかかる費用の発生や信用低下等による業績や財務状況の影響
         - システム障害の発生による事業活動の支障、業績や財務状況の影響
         - コンプライアンス違反や個人情報管理の不備、情報開示の不適切さ等による社会的信頼の低下や法的責任の発生、業績や財務状況の影響
         - 人材の確保や法的規制の変更、金利の変動、重要な訴訟等による事業の継続や業績の影響
--- 【クラスタ 4】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 4
 - 経営人材リスク
         - 競合リスク
         - 海外事業リスク
         - 為替リスク
         - 製造物責任リスク
         - 営業秘密個人情報漏洩リスク
         - 天候リスク
         - 災害リスク
         - 紛争訴訟リスク
         - 経済環境消費動向の変化のリスク
         - 輸出リスク
         - 為替レートの変動リスク
         - 新興国市場のリスク
         - 原材料の価格変動サプライヤーの供給能力に係るリスク
         - 生産活動に使用される原材料の供給停止や遅延のリスク
         - 外部委託先や社内工程における製造の遅延や不良のリスク
         - 電力不足や電力費の上昇が生産活動及び販売活動に及ぼすリスク
--- 【クラスタ 5】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 5
1. 景気の動向の影響を受けるリスク
         - 競合他社の存在や技術革新の影響を受けるリスク
         - リクルートブランドの毀損や評判の悪化のリスク
         - サービス提供媒体の変化に伴うリスク
         - 技術革新によるリスク
         - クライアントの需要動向の変化に関するリスク
         - ユーザーの需要動向の変化に関するリスク
         - 主要なソフトウェアベンダ又はハードウェアベンダの製品にウイルス対策やサイバーセキュリティ機能が付加される可能性についてのリスク
         - 当社グループは連結売上のほとんどを単一の事業領域に依存していることにより当該市場の需要低下の影響を大きく受けてしまう可能性についてのリスク
         - 技術革新により当社グループの各種製品及びサービスが陳腐化してしまう可能性についてのリスク
         - ハードウェア製品の製造リスク在庫リスクについてのリスク
         - 他社との戦略的提携から期待通りの成果があげられない可能性についてのリスク
         - 当社グループの競合先企業が日本市場で成功を収めた場合に当社グループの日本市場での売上高やマーケットシェアが低下する可能性についてのリスク
         - 将来の企業買収により利益の減少やオペレーションコストの増加が発生する可能性についてのリスク
         - ハッカーやクラッカーによる当社グループのシステムへの不正侵入により当社グループの信用が失墜する可能性についてのリスク
         - 当社グループ関係者による情報漏洩リスク
--- 【クラスタ 6】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 6
 - 安全対策の不備による事故の発生
         - 自然災害やテロ等の外部要因による鉄道インフラの被害
         - コンピュータシステムの機能障害や個人情報流出による業務運営の影響
         - 有利子負債の返済や金利の変動による財務の影響
         - コンプライアンス違反や法令の変更による社会的信用の失墜や行政処分のリスク
         - 国際事業の政治的、社会的、経済的リスクや大型プロジェクトの投資リスク
--- 【クラスタ 7】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 7
2018年、当社グループの主要な事業リスクは以下の通りです。

- 製品の安全性や品質に問題が発生した場合、患者や製品の安定供給に影響を及ぼす可能性があります。
- 副作用が発現した場合、販売の停止や回収等の措置が必要となり、業績に重要な影響を及ぼす可能性があります。
- 新薬開発の不確実性やジェネリック医薬品の低価格での販売により、売上収益が減少する可能性があります。
- 工場の閉鎖または操業停止のリスク、環境に関するリスク、災害等に関するリスクがあります。
- 法規制に関するリスク、個人消費動向に関するリスク、食の安全性に関するリスク、原材料価格の高騰等に関するリスクがあります。
- 特許権の保護期間満了や特許権の侵害、訴訟に関するリスクがあります。

These risks can impact our company's industry, financial performance, and reputation.

--- 【2018年】の要約結果を '../outputs/reports/cluster_summaries_2018.json' に保存しました。

🧠 【2019年】クラスタごとの要約を開始します...
--- 【2019年】埋め込みベクトルの生成中...
--- 【2019年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2019年】最適なクラスタ数: 4
--- 【2019年】エルボープロットを '../outputs/elbow_plots/elbow_method_2019.png' に保存しました。
--- 【2019年】KMeansクラスタリング実行中 (K=4)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 0
 - 法的規制の変更や運賃改定の結果、当社の業績に影響を及ぼす可能性がある。
         - 少子高齢化や人口減少が進行することで、当社の業績や財務状況に影響を及ぼす可能性がある。
         - 長期債務や借入金の返済が重くのしかかり、当社の財務状況に影響を及ぼす可能性がある。
         - 自然災害やテロ等の外部要因により、当社の鉄道事業に大きな影響が生じる可能性がある。
         - コンピュータシステムの障害やサイバー攻撃等により、当社の業務運営に影響を与える可能性がある。
         - 超電導リニアによる中央新幹線計画の進捗や実現性が、当社の経営や財務に影響を及ぼす可能性がある。
--- 【クラスタ 1】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
2019年、当社グループの主要な事業リスクは、技術変化の読みと対応の遅れによる成長性や業績の悪影響、主要市場の経済状況の変化による業績の悪化、競合の激化による価格競争の激化と業績の悪化、部品原材料の価格変動と為替レートの変動による業績の悪化、技術強化領域の設定や資源の投下の遅れによる成長性や業績の悪影響、人材の確保や育成の遅れによる成長性や業績の悪影響、イノベーションや技術革新の遅れによる成長性や業績の悪影響、などです。

Original Answer: 主要な2019年の事業リスクは、主要市場の経済状況の変化による業績の悪化、競合の激化による価格競争の激化と業績の悪化、部品原材料の価格変動と為替レートの変動による業績の悪化です。
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 2
 - 資産運用に関するリスク
         - 自然災害による多額の保険金支払のリスク
         - 再保険取引に関するリスク
         - シェアリングエコノミーの進展に係るリスク
         - テクノロジーの進化に係るリスク
         - 人事労務に関するリスク
         - 事業運営に関するリスク
         - 事業中断に関するリスク
         - 統合のシナジーが十分に発揮されないリスク
         - 情報漏洩等に関するリスク
         - 海外事業に関するリスク
         - 関連事業に関するリスク
         - システムリスク
         - ESG環境社会ガバナンスの重要性向上に係るリスク
--- 【クラスタ 3】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 3
2019年の主要な事業リスクは、研究開発の途中で有効性や安全性が承認に必要な水準を充たさないことが判明した場合の研究開発中断やコスト回収のリスク、特許権が満了した場合の後発品の市場参入による売上低下のリスク、新たな副作用の確認による使用上の注意の記載や使用方法の制限、販売中止や回収等のリスクです。

Original Answer: 2019年の主要な事業リスクは、研究開発の途中で有効性や安全性が承認に必要な水準を充たさないことが判明した場合の研究開発中断やコスト回収のリスク、特許権が満了した場合の後発品の市場参入による売上低下のリスク、新たな副作用の確認による使用上の注意の記載や使用方法の制限、販売中止や回収等のリスクです。

--- 【2019年】の要約結果を '../outputs/reports/cluster_summaries_2019.json' に保存しました。

🧠 【2020年】クラスタごとの要約を開始します...
--- 【2020年】埋め込みベクトルの生成中...
--- 【2020年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2020年】最適なクラスタ数: 8
--- 【2020年】エルボープロットを '../outputs/elbow_plots/elbow_method_2020.png' に保存しました。
--- 【2020年】KMeansクラスタリング実行中 (K=8)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Llama.generate: 1 prefix-match hit, remaining 4454 prompt tokens to eval
llama_perf_context_prin

✅ 要約完了: クラスタ 0
1. 法的規制の変更や運賃改定の結果、業績に影響を及ぼす可能性がある。
2. 少子高齢化や人口減少が進行し、鉄道事業の需要が減少する可能性がある。
3. 自然災害や感染症の発生等の外的要因により、安全確保が難しい状況に陥り、業績に影響を及ぼす可能性がある。
4. 調達金利の変動や資源価格の高騰が、業績に影響を及ぼす可能性がある。
5. 情報セキュリティ対策や個人情報の管理が不十分な場合、業績に影響を及ぼす可能性がある。

Original Answer:
- 法的規制の変更や運賃改定の結果、業績に影響を及ぼす可能性がある。
- 少子高齢化や人口減少が進行し、鉄道事業の需要が減少する可能性がある。
- 自然災害や感染症の発生等の外的要因により、安全確保が難しい状況に陥り、業績に影響を及ぼす可能性がある。
--- 【クラスタ 1】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
2020年は、米中貿易摩擦の影響を受ける可能性が高く、中国向け売上の比率が高いため、政治状況の悪化が進むと当社グループの業績に悪影響を与える可能性があります。また、為替変動や金利変動の影響を受ける可能性があり、半導体FPD市場の動向や特定顧客の設備投資動向の影響も受ける可能性があります。さらに、借入金に係る契約の財務制限条項に抵触し借入先金融機関の請求があった場合、期限の利益を喪失する可能性があり、当社グループの社債やその他の借入金についても連動して期限の利益を喪失する可能性があります。加えて、パンデミックに関するリスクや情報セキュリティに関するリスク、製品の品質と安全に関するリスク、環境負荷低減に関するリスク、係争法令違反に関するリスク、固定資産の減損に関するリスク、為替の変動に関するリスク、事故災害に関するリスク、重要なサプライヤーに関するリスク、自然災害に関するリスク、戦争やテロに関するリスク、訴訟や法的手続きに関するリスクなど、多くのリスクが存在します。
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 2
2020年6月22日現在、当社グループが認識している主要な事業リスクは以下の通りです。

1. 新型コロナウイルス感染拡大による与信費用の増加、保有有価証券の評価損益悪化、外貨建資金調達の不安定化、原油価格下落等を起因とした金融市場混乱の拡大。
2. 競争環境の変化、社会構造、産業構造の変化によるビジネス戦略の影響。
3. 人財に関するリスク、人財が確保できない場合や人財の一斉流出等が発生した場合の業務運営や業績財務状況の悪影響。

Original Answer: 
- 新型コロナウイルス感染拡大による与信費用の増加、保有有価証券の評価損益悪化、外貨建資金調達の不安定化、原油価格下落等を起因とした金融市場混乱の拡大
         - 競争環境の変化、社会構造、産業構造の変化によるビジネス戦略の影響
         - 人財に関するリスク、人財が確保できない場合や人財の一斉流出等が発生した場合の業務運営や業績財務状況の悪影響
--- 【クラスタ 3】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 3
2020年の主要な事業リスクは、以下の通りです。

- 信用リスク：景気悪化や融資先の経営状況悪化に伴う不良債権の増加、破綻先の整理回収活動の困難化。
- 市場関連リスク：株価下落や金利上昇に伴う有価証券の減損や評価損の発生。
- 流動性リスク：調達環境の悪化や資金の確保に高い金利での資金調達を余儀なくされることによる資金繰りの悪化。
- 新型コロナウイルス感染症拡大に関するリスク：不特定多数の顧客や取引先の感染拡大に伴う事業の停止や遅延、経済活動の縮小による業績の悪化。

Original Answer: 
- 信用リスク：景気悪化や融資先の経営状況悪化に伴う不良債権の増加、破綻先の整理回収活動の困難化。
- 市場関連リスク：株価下落や金利上昇に伴う有価証券の減損や評価損の発生。
- 流動性リスク：調達環境の悪化や資金の確保に高い金利での資金調達を余儀なくされることによる資金繰りの悪化。
--- 【クラスタ 4】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 4
 - 主要なソフトウェアベンダやハードウェアベンダがウイルス対策やサイバーセキュリティ機能を付加した製品を低価格で販売することで、当社グループの競争力が低下する可能性。
         - 技術革新のスピードが速く、当社グループの製品やサービスが陳腐化する可能性。
         - ハードウェア製品の製造を委託している製造業者が当社グループの注文通りに製品を生産できず、生産体制を築けないリスク。
         - 自然災害や有事（紛争、クーデター、テロ等）が発生し、当社グループの事業が停止や制限を受ける可能性。
         - 新型コロナウイルス感染症の流行拡大が続き、当社グループの業績に影響を与える可能性。
         - 将来の企業買収により利益の減少やオペレーションコストの増加が発生する可能性。
         - ハッカー等による当社グループのシステムへの不正侵入により、当社グループの信用が失墜する可能性。
         - 当社グループ関係者による情報漏洩リスク。

Original Answer: 
- 主要なソフトウェアベンダやハードウェアベンダがウイルス対策やサイバーセキュリティ機能を付加した製品を低価格で販売することで、当社グループの競争力が低下する可能性。
         - 技術革新のスピードが速く、当社グループの製品やサービスが陳腐化する可能性。
         - ハードウェア製品の製造を委託している製造業者が当社グループの注文通りに製品を生産できず、生産体制を築けないリスク。
--- 【クラスタ 5】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 5
2020年の主要な事業リスクは、以下の通りです。

1. 経済環境の変化に伴う景気後退や保護主義政策の流れが当社の経営成績に悪影響を及ぼす可能性がある。
2. 為替レートの変動が当社の業績に影響を与えるため、為替予約やヘッジを実施している。
3. オフィスでの出力機会の減少やワークスタイルの変化が当社のオフィス事業に悪影響を及ぼす可能性がある。

Original Answer: 
- 経済環境の変化に伴う景気後退や保護主義政策の流れが当社の経営成績に悪影響を及ぼす可能性がある。
         - 為替レートの変動が当社の業績に影響を与えるため、為替予約やヘッジを実施している。
         - オフィスでの出力機会の減少やワークスタイルの変化が当社のオフィス事業に悪影響を及ぼす可能性がある。
--- 【クラスタ 6】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 6
2020年の主要な事業リスクは、以下の通りです。

1. 人口動態や市場嗜好の変化に伴う競争環境の激化や法令改正の影響によるリスク
2. 新薬の研究開発の長期化や期待通りの有効性が認められない場合のリスク
3. 知的財産権の侵害や特許権の満了に伴う製品の売上収益の減少のリスク

Original Answer:
- 人口動態や市場嗜好の変化に伴う競争環境の激化や法令改正の影響によるリスク
- 新薬の研究開発の長期化や期待通りの有効性が認められない場合のリスク
- 知的財産権の侵害や特許権の満了に伴う製品の売上収益の減少のリスク
--- 【クラスタ 7】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 7
2020年、ソニーの主要な事業リスクは以下の通りです。

1. 新型コロナウイルス感染拡大がソニーの事業活動、業績、財政状態に悪影響を及ぼす可能性がある。
2. 激化する競争に直面し、収益や営業利益率の低下のリスクがある。
3. コンスーマーエレクトロニクス事業では、価格競争、製品サイクルの短期化、販売流通チャネルの変化に直面する。

仮にソニーが技術その他の競争力を持つ分野においてその優位性を保てなくなった場合、ソニーのコンスーマー製品に対して頻繁に影響を及ぼす継続的な価格下落又はその事業に影響を及ぼすコスト圧力について効果的に予測し対応できない場合、既存の事業モデルや消費者の嗜好が変化した場合、又はソニーのコンスーマー製品の平均価格の下落スピードが当該製品の製造原価削減のスピードを上回った場合には、ソニーの業績及び財政状態に悪影響を及ぼす可能性があります。

加えて、ソニーは競争力を維持し消費者の需要を喚起し製品及びサービスの革新を実現するために研究開発投資を行う必要があり、また新しい製品及びサービスの頻繁な導入を適切に管理しなければなりません。

--- 【2020年】の要約結果を '../outputs/reports/cluster_summaries_2020.json' に保存しました。

🧠 【2021年】クラスタごとの要約を開始します...
--- 【2021年】埋め込みベクトルの生成中...
--- 【2021年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2021年】最適なクラスタ数: 8
--- 【2021年】エルボープロットを '../outputs/elbow_plots/elbow_method_2021.png' に保存しました。
--- 【2021年】KMeansクラスタリング実行中 (K=8)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 0
2021年の事業リスクとして、以下の点が挙げられます。

- 経済状況の悪化による雇用環境や家計の悪化が当社の業績に悪影響を及ぼす可能性がある。
- 競争環境の激化や新規参入により、当社の競争力が低下し、業績に悪影響を及ぼす可能性がある。
- 大規模災害や新型コロナウイルス感染症の流行が当社の事業活動や業績に悪影響を及ぼす可能性がある。
- 資金調達のリスク: 当社グループの主な資金調達方法は銀行など金融機関からの借入金や社債、コマーシャルペーパー（CP）の発行など資本市場からの調達であり、短期借入金やCPなど調達期間が一年以内のものが相当額あり、また一年以内に返済償還予定の長期負債もあることから、当社グループ固有の要素である業績悪化や信用格付の格下げなどや外部の要素である経済金融危機や自然災害など、さまざまな要因によって流動性リスクが増加すると事業活動や業績に重大な影響を及ぼす可能性がある。
- マーケットリスク: 当社グループは上場会社、非上場会社の株式、ベンチャー企業、投資ファンド、債券、不動産、不動産ファンドなどへの投資を行っており、投資資産の価格が市場において下落した場合には当社グループの業績及び財政状態に悪影響を及ぼす可能性がある。
- 金融商品の減損、貸倒引当金: 当社グループは各事業においてさまざまな融資を行っており、多数の顧客に対する債権を保有しており、国内外の経済環境、景気後退に伴う雇用環境、家計、個人消費等の状況の変化により多くの顧客において契約条件に従った債権の返済がなされず、当社グループの業績及び財政状態に悪影響を及ぼす可能性がある。

Original Answer: 
- 経済状況の悪化による雇用環境や家計の悪化が当社の業績に悪影響を及ぼす可能性がある。
- 競争環境の激化や新規参入により、当社の競争力が低下し、業績に悪影響を及ぼす可能性がある。
- 大規模災害や新型コロナウイルス感染症の流行が当社の事業活動や業績に悪影響を及ぼす可能性がある。
--- 【クラスタ 1】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
 - プロジェクトの受注及び遂行に関するリスク
         - カントリーリスク
         - 自然災害疫病等に関するリスク
         - 新型コロナウイルス感染症の世界的な感染拡大に伴うプロジェクトの遅延や中断、顧客の最終投資判断の先送りによる新規プロジェクトの計画変更や延期の可能性
         - 為替変動リスク
         - 工事従事者の不足賃金高騰リスク
         - 資機材原燃材料費の高騰リスク
         - 環境保全リスク
         - 品質管理リスク
         - 情報セキュリティリスク
         - 労働力の不足リスク
         - 法的規制リスク
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 2
2021年の主要な事業リスクは以下の通りです。

1. 新型コロナウイルス感染症の影響で、受注や生産に支障が生じる可能性があります。
2. 情報セキュリティ管理態勢の高度化やプロジェクトリスクに対するマネジメントの徹底が必要です。
3. 品質に関するリスクとして、システムの安定稼働やデータセンターの安全確保が重要です。

Original Answer:
- 新型コロナウイルス感染症の影響で、受注や生産に支障が生じる可能性がある。
- 情報セキュリティ管理態勢の高度化やプロジェクトリスクに対するマネジメントの徹底が必要。
- 品質に関するリスクとして、システムの安定稼働やデータセンターの安全確保が重要。
--- 【クラスタ 3】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 3
1. 単一の事業領域に依存していることによる影響とリスクの可能性
2. 技術革新や業界の変化により当社グループの各種製品及びサービスが陳腐化してしまう可能性
3. ハードウエア製品の製造リスク在庫リスクについて
4. 情報セキュリティマネジメントシステムの国際規格ISO27001及びJISQ15001プライバシーマークを取得し、業務委託先または従業員との間で機密保持目的の契約の締結、情報管理規定の整備、社員及び委託先への教育や周知徹底、インフラのセキュリティ強化、社内情報システムへの外部からの侵入防止対策を講じる等管理の強化徹底と漏洩の防止に努めるが、上記リスクを防げない可能性があります。
5. 中間販売業者が当社グループの各種製品及びサービスを返品する可能性や、競合先企業の製品販売に注力する可能性があります。
6. 当社グループの事業領域は拡大をしており、成長を支えるマネジメントや従業員等の人的リソースは限られるため、人材の獲得確保並びに従業員に対する教育研修、オペレーションシステム会計システム等の情報システムの整備、経営及び管理体制の有効活用が必要です。
7. 当社グループが属するサイバーセキュリティ業界は市場競争が激化しており、優秀な人材の確保は競合各社とも技術革新を支える重要な課題となっており、人材の流出についても対策が必要です。

Please note that the refined answer is based on the provided context and may not be exhaustive.
--- 【クラスタ 4】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 4
2021年の主要な事業リスクは、以下の3つです。

1. クレジットクオリティの悪化による与信先の業績悪化や担保価値の下落による与信関連費用の増加
2. 保有有価証券の価値下落による保有有価証券の価値の下落や市場流動性の低下
3. 新型コロナウイルス感染症拡大や金融緩和による過剰流動性、グローバルな地政学リスクの顕在化、インフレ金利上昇懸念の台頭などを背景に金融市場が不安定化することによる流動性リスクや外貨調達の不安定化
--- 【クラスタ 5】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 5
2021年の主要な事業リスクは以下の通りです。

1. 新型コロナウイルス感染症の感染再拡大や世界経済の影響による業績悪化の可能性
2. 環境課題や気候変動に対する社会的要請の高まりによる企業ブランド価値の低下や代替素材の推進の可能性
3. 原燃料の調達リスクや原油価格の変動による採算の悪化や固定資産の減損損失の可能性
4. 為替相場の変動や金利の変動による資金調達や有価証券の価値の変動の可能性
5. 将来予測等の前提条件の変動に伴う退職給付債務や繰延税金資産の計上の可能性
6. グローバル事業展開に関わるリスク（米中対立、制裁関税、為替変動、原材料の調達リスク、製造物責任、法規制コンプライアンス、知的財産、訴訟、為替の変動、海外事業展開）
7. 製造物責任に関わるリスク（品質の欠陥に起因する大規模な製品回収、PL保険でカバーできない損害賠償等の損失の発生、顧客からの信頼や社会的信用の失墜）
8. 事故災害に関わるリスク（爆発火災有害物質の漏洩などの事故災害の未然防止及び災害発生時の被害の極小化、原燃料設備メンテナンス部品やサービスの提供などを担っているサプライヤーにおける事故災害の発生）
9. 法規制コンプライアンスに関わるリスク（独占禁止法遵守、コンプライアンスの徹底、法令違反を起こした場合の顧客からの信頼や社会的信用の失墜、損害賠償責任や罰金が課されることなど）
10. 訴訟に関わるリスク（独占禁止法遵守指針の定期的見直し、競合他社との接触に関するガイドラインの制定、競合他社との取引会合の事前審査、役員従業員向けセミナーの開催、遵守状況に関する社内聴取入札情報の管理及び入札部署を対象とした法務部監査等の様々な施策）

Original Answer: 
- 新型コロナウイルス感染症の感染再拡大や世界経済の影響による業績悪化の可能性
- 環境課題や気候変動に対する社会的要請の高まりによる企業ブランド価値の低下や代替素材の推進の可能性
- 原燃料の調達リスクや原油価格の変動による採算の悪化や固定資産の減損損失の可能性
- 為替相場の変動や金利の変動による資金調達や有価証券の価値の変動の可能性
- 将来予測等の前提条件の変動に伴う退職給付債務や繰延税金資産の計上の可能性
--- 【クラスタ 6】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 6
 - 経済環境や金融市場の動向の影響を受ける。
         - 為替相場や金利の変動が、外貨建ての営業債権や負債に影響を与える。
         - 市況変動や新型コロナウイルス感染症の流行が、ICT市場や顧客の事業に悪影響を与える。
         - 海外での事業展開に伴うカントリーリスクや外国為替相場の変動が、当社の事業に影響を与える。
         - 製品の欠陥や製造物責任が、当社の事業に悪影響を与える。

Note: The refined answer includes the new context information, specifically the risks related to COVID-19, country risks, and foreign exchange risks.
--- 【クラスタ 7】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 7
2021年の主要な事業リスクは、法的規制の変更や運賃改定の結果、業績に影響を及ぼす可能性があること、出生率の低下や少子高齢化の急激な加速が、沿線地域で起きた場合、業績に影響を及ぼす可能性があること、パンデミック等の発生が、運輸事業やレジャー事業の利用者減少を招き、業績に影響を及ぼす可能性があることです。

--- 【2021年】の要約結果を '../outputs/reports/cluster_summaries_2021.json' に保存しました。

🧠 【2022年】クラスタごとの要約を開始します...
--- 【2022年】埋め込みベクトルの生成中...
--- 【2022年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2022年】最適なクラスタ数: 11
--- 【2022年】エルボープロットを '../outputs/elbow_plots/elbow_method_2022.png' に保存しました。
--- 【2022年】KMeansクラスタリング実行中 (K=11)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 0
 - 戦略リスク
         - 気候変動リスク
         - 相場変動リスク
         - 資金調達コスト増加リスク
         - 資産減損等リスク
         - 大規模災害リスク
         - 経営人材に関わるリスク
         - カントリーリスク
         - 環境に関わるリスク
--- 【クラスタ 1】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
2022年6月22日現在、当社グループが認識している主要な事業リスクは以下の通りです。

1. 市場の混乱による保有有価証券の価値下落
2. クレジットクオリティの悪化による与信関連費用の増加
3. 流動性リスクによる外貨資金繰りの悪化や調達コストの上昇

Original Answer:
- 市場の混乱による保有有価証券の価値下落
         - クレジットクオリティの悪化による与信関連費用の増加
         - 流動性リスクによる外貨資金繰りの悪化や調達コストの上昇
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Llama.generate: 1 prefix-match hit, remaining 4521 prompt tokens to eval
llama_perf_context_print:        load time =   95697.98 ms
llama_perf_context_print: prompt eval time =       0.00 ms /  4521 tokens (    0.00 ms per token,      inf tokens per second)
llama_perf_context_print:        eval time =       0.00 ms /    

✅ 要約完了: クラスタ 2
2022年の事業リスクは以下の通りです。

1. 単一の事業領域に依存していることによる影響とリスクの可能性。
2. 技術革新や業界の変化により当社グループの各種製品及びサービスが陳腐化してしまう可能性。
3. ハードウエア製品の製造リスク在庫リスク。
4. 情報セキュリティガバナンスのリスク、具体的にはセキュリティインシデントの発生、情報漏洩、不正アクセス等のリスク。
5. 中間販売業者に依存していることによるリスク、具体的には競合先企業の製品販売に注力する可能性や中間販売業者が当社グループの製品を返品する可能性等。
6. 経営管理体制の対応の遅れや不備によるリスク、具体的には新たな人材の獲得や教育研修の遅れ、組織体制の不備等。
7. 人材の流出や技術者並びに人材の流出によるリスク、具体的には主要な技術者や人材が流出する可能性や当社グループの技術や戦略等の重要な情報が流出する可能性等。
8. 為替並びに金融市場の変動によるリスク、具体的には為替相場の変動や金融市場の変動による当社グループの連結決算の数値の変動や評価損の計上等。
9. 法令違反や法令等の改正によるリスク、具体的には法令等の遵守の不備や法令等の改正による規制や制限の強化等。
10. 主要な経営陣の離脱や法令違反によるリスク、具体的には主要な経営陣が離脱する可能性や法令違反が発生する可能性等。
11. ユーザのキャンセルや返品等によるリスク、具体的には企業ユーザの業績見通しの悪化や経済状況の悪化等による当社グループの各種製品やサービスの購入のキャンセルや時期の延期等。
12. 知的財産権に関するリスク、具体的には当社グループの技術や戦略等の重要な情報の流出や類似した技術の開発等。
13. 電力不足地震等の自然災害や地政学的リスク、感染症ウイルス等によるリスク、具体的には電力不足や地震等の自然災害や感染症ウイルス等による当社グループの設備施設等の被害や当社グループの事業の停止等。

These risks are not exhaustive, and the actual risks faced by the company may be different.
--- 【クラスタ 3】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 3
 - 新型コロナウイルス感染拡大に係るリスク
         - ウクライナ情勢に係るリスク
         - 気候変動に係るリスク
         - 顧客の生産計画に係るリスク（特に、国内外のメーカーからの受注生産が大部分を占めるため、顧客の生産計画の影響を直接受ける）
         - 品質製造物責任に係るリスク
         - 事故自然災害に係るリスク
         - 環境に係るリスク
         - 海外事業展開に係るリスク
         - 財務に係るリスク
         - 固定資産の減損に係るリスク
         - 訴訟等に係るリスク
--- 【クラスタ 4】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 4
 - 事業戦略の失敗や新規事業の収益化の遅れにより、成長が遅滞するリスク
         - ユーザー数や利用頻度の低下、市場変化や景気変動による広告料の低下のリスク
         - パートナーシップの構築や維持が困難になるリスク、パートナーの売上収益やトラフィックが期待値に満たないリスク
         - 経済情勢、規制環境、市場環境の変化に伴う競争激化や新規参入者による影響のリスク
         - 技術やビジネスモデルの移り変わりが早い情報産業において、当社グループが新たな技術やビジネスモデルに適時かつ適切に対応できず、市場変化に適した優れたサービスや技術を創出や導入ができないリスク
--- 【クラスタ 5】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 5
 - 景気変動リスク
         - 新型コロナウイルス感染症等の感染症拡大リスク
         - 多額の借入金と金利変動リスク、財務制限条項のリスク
         - 主要取引先の設備投資の規模や構造等の動向に伴うリスク
         - 安全品質に関するリスク
         - 個人情報の流出に関するリスク
         - 業績の季節変動に伴うリスク
         - 保有資産に関するリスク
         - 取引先の信用リスク
--- 【クラスタ 6】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Llama.generate: 1 prefix-match hit, remaining 4353 prompt tokens to eval
llama_perf_context_prin

✅ 要約完了: クラスタ 6
1. 事業環境の変化に伴うリスク
         - 原材料の市況変動に伴うリスク
         - 製造物責任に伴うリスク
         - 重大な法令違反に伴うリスク
         - 知的財産権の侵害や係争に伴うリスク
         - 訴訟に伴うリスク
         - 為替の変動に伴うリスク
         - 海外事業展開に伴うリスク
         - 情報セキュリティに伴うリスク

Original Answer: 
- 事業環境の変化に伴うリスク
         - 原材料の市況変動に伴うリスク
         - 製造物責任に伴うリスク
         - 重大な法令違反に伴うリスク
         - 知的財産権の侵害や係争に伴うリスク
         - 訴訟に伴うリスク
--- 【クラスタ 7】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 7
2022年において、当社グループの主要な事業リスクは以下の通りです。

1. 経済環境に関するリスク: 世界的な経済活動の本格的な再開に伴い、半導体を中心に電子部品が不足するなどグローバルサプライチェーン上の問題が発生し、物価上昇圧力が一段と強まっています。米国経済は雇用所得環境の改善により回復基調を維持していますが、経済活動回復に伴う需要増加による資源価格の高騰や供給網の混乱による需給の不均衡、労働市場の人手不足などの影響によりインフレ率の上昇が続き、米連邦準備制度理事会(FRB)はインフレ抑制に向けて金融緩和の縮小ペースを加速させています。

2. 新型コロナウイルス感染症に関するリスク: 新型コロナウイルス感染症は国地域によって差はあるものの変異株が出現するなど依然として感染拡大の懸念を残しており、米中の覇権争いに起因するハイテク冷戦の影響なども引き続き懸念されます。

3. 情報セキュリティに関するリスク: インターネットがインフラとして定着し、情報漏洩のリスクが高まっています。特に情報サービス産業は顧客の機密情報を扱う機会が多く、より高度な情報セキュリティ管理や社員教育の徹底が求められます。

4. 品質に関するリスク: 当社グループが開発する情報システムは顧客の業務の重要な基盤となることが多く、完成後の安定稼働が重要です。特に金融サービス業のシステムについては当社顧客のみでなく金融市場全体の信頼性に関わる場合もあり、その重要性を強く認識しています。

5. 地震台風などの自然災害や火災爆発などの災害が発生した場合、あるいは事件事故などの不祥事案件が発生した場合の対応を誤ると企業価値の毀損につながる可能性があります。

6. 米中の覇権争いに起因するハイテク冷戦の影響: 米中の覇権争いは、半導体や電子部品の供給網に影響を与え、当社の事業に悪影響を及ぼす可能性があります。

7. ウクライナ情勢の緊迫化: ウクライナ情勢の緊迫化は、世界各国の安全保障並びに経済活動に大きく影響し、ロシアが主な輸出国である天然ガスなどの資源エネルギーウクライナが主な輸出国である半導体製造用ネオンガスなどの物資の供給が滞ることにより、エネルギー価格の高騰更なる半導体不足が加速するリスクがあります。
--- 【クラスタ 8】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 8
2022年の事業リスクとして、以下のものが挙げられます。

1. 新しい製品サービスのリリースに関するリスク
2. 競争に関するリスク
3. 景気低迷に関するリスク
4. 自然災害等に関するリスク
5. 新型コロナウイルス感染症の影響
6. セキュリティに関するリスク
7. 内部管理体制に関するリスク
8. 人的資源に関するリスク
9. 気候変動に関するリスク

Original Answer: 
- 新しい製品サービスのリリースに関するリスク
         - 競争に関するリスク
         - 景気低迷に関するリスク
         - 自然災害等に関するリスク
         - 新型コロナウイルス感染症の影響
         - セキュリティに関するリスク
--- 【クラスタ 9】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 9
 - 医療費抑制策の影響による業績の悪化
         - 新薬開発の不確実性による研究開発投資の無駄や中止
         - 品質問題や法令違反による製品回収や行政処分のリスク

The refined answer takes into account the provided context, which includes information about the company's business, industry, and market trends.
--- 【クラスタ 10】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 10
2022年は、当社がグローバルに事業を拡大していることから、感染症の流行やテロ行為、戦争紛争等の事態に巻き込まれるリスクがあります。具体的には、開発、製造、販売、サービス等の事業活動が中断、混乱、または延期する可能性があります。また、地震等の自然災害や設備故障、人為的ミスによる大規模な災害等が発生した場合、当社の施設に影響を与える大規模な災害等が発生した場合、当社の事業への影響が考えられます。さらに、財務会計に関するリスクとして、顧客の財政状態が悪化し売掛債権が回収困難となるリスクや、当社が保有する投資有価証券の株価変動が当社の財政状態に重要な影響を及ぼすリスクがあります。

--- 【2022年】の要約結果を '../outputs/reports/cluster_summaries_2022.json' に保存しました。

🧠 【2023年】クラスタごとの要約を開始します...
--- 【2023年】埋め込みベクトルの生成中...
--- 【2023年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2023年】最適なクラスタ数: 7
--- 【2023年】エルボープロットを '../outputs/elbow_plots/elbow_method_2023.png' に保存しました。
--- 【2023年】KMeansクラスタリング実行中 (K=7)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 0
2023年の事業リスクとして、以下の点が挙げられます。

1. 新製品の研究開発リスク: 新薬開発の難度が高まる中、開発が計画どおりに進まず、承認発売に至らない場合や、有効性や安全性の観点から開発が遅延し、または開発を中止しなければならない事態が発生する可能性があります。

2. 連結売上収益に関するリスク: ラツーダの米国での独占販売期間が2023年2月に終了したことにより、後発医薬品メーカーによるラツーダの競合品が発売され、2023年度の売上収益が大幅に減少する見込みです。

3. 知的財産権に関するリスク: 当社グループが保有する知的財産権が第三者に侵害された場合や、知的財産権の有効性や帰属を巡る係争が発生した場合、競争上の優位性を十分に保持できない可能性があります。

4. 医療制度改革に関するリスク: 各国の医療制度改革の方向性によっては、当社グループの経営成績等に重要な影響を及ぼす可能性があります。

5. 副作用に関するリスク: 市販後に予期せぬ副作用が発生した場合、当社グループの経営成績等に重要な影響を及ぼす可能性があります。

6. 品質に関するリスク: 重大な品質問題が発生した場合、製品回収、行政処分、社会的信用の毀損等により、当社グループの経営成績等に重要な影響を及ぼす可能性があります。

7. 主要な事業活動の前提となる事項に関するリスク: 許可等の取消し等を命ぜられた場合、当社グループの経営成績等に重要な影響を及ぼす可能性があります。

8. 技術開発と技術の変化に関するリスク: 当社グループの事業分野におけるテクノロジーの急激な変化や市場ニーズの激変等から、当社グループ製品が予想より早く陳腐化する可能性があります。

9. 国際活動及び海外進出に関するリスク: 海外の政治経済情勢や法整備の影響を受け、当社グループの財政状態や経営成績等に重要な影響を及ぼす可能性があります。

10. 情報管理に関するリスク: 情報が漏洩した場合、営業秘密の流出による競争力の低下や顧客の信用や社会的信用の低下を招き、当社グループの経営成績等に重要な影響を及ぼす可能性があります。

11. 製品の欠陥訴訟問題に関するリスク: 将来において、当社グループ製品の製造物責任や安全性などを問うクレームが発生し、当社グループの経営成績等に重

Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
2023年の主要な事業リスクは、以下の通りです。

1. サイバーセキュリティに関するリスク
2. サプライチェーンマネジメントに関するリスク
3. 新型コロナウイルス感染症によるパンデミックやロシアウクライナ情勢等のグローバル環境の変化に伴う想定外の業績影響

Additionally, other potential risks include:

4. 人事関連コンプライアンス対応のリスク
5. グループガバナンスに関するリスク
6. オフィスプリンティング市場における環境変化のリスク
7. 戦略的買収によるオフィスサービス事業の成長のリスク
8. 商用印刷事業の成長リスク
9. サーマル市場の価格競争激化のリスク
10. のれん固定資産の減損のリスク
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 2
2023年の事業リスクとして、以下のリスクが認識されています。

1. 中長期経営方針の達成を阻害するリスク
2. 新型コロナウイルス感染症の影響によるリスク
3. 欧州オセアニア地域の景気悪化によるリスク

Original Answer: 主要なリスクとして、以下のリスクが認識されています。

1. 中長期経営方針の達成を阻害するリスク
2. 新型コロナウイルス感染症の影響によるリスク
3. 欧州オセアニア地域の景気悪化によるリスク
--- 【クラスタ 3】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 3
2023年の主要な事業リスクとして、以下のものが挙げられます。

1.紛争、テロ、内乱、暴動、地政学的問題、法規制、税務、労働環境、慣習、インフラの未整備、貿易摩擦、経済や金融環境の変動、自然災害、パンデミック、人材の採用確保の困難、ユーティリティ供給不足、原燃料の価格上昇、輸送コストの上昇、サプライチェーンの途絶、経済安全保障をめぐる国際情勢の変化などが挙げられます。

2.事故災害リスクとして、製造設備の定期点検の不備や自然災害による物的人的被害や環境汚染等が生じた場合、生産への影響や社会的信頼の低下等業績に影響を与える可能性があります。

3.法規制コンプライアンスリスクとして、法令の変更や規制強化が行われた場合、当社グループの活動の制限やコストの増加につながる可能性があり、万が一法規制に違反し刑事民事上の責任を問われまた行政処分を課された場合には当社グループの事業展開及び経営成績に影響を与える可能性があります。

4.情報セキュリティリスクとして、当社グループが保有する企業情報及び個人情報が流出し不正使用されるなどの問題が発生した場合、競争力や社会的信頼の低下等業績に影響を与える可能性があります。

5.人権リスクとして、当社グループの海外グループ会社において人権侵害に関与する事案が発生し社会的信頼の低下や取引停止などに繋がり業績に影響を与える可能性があります。

6.気候変動等環境課題リスクとして、気候変動や資源エネルギーをはじめとする環境課題の包括的な解決に向けて当社グループはサーキュラーエコノミーを重要な戦略と位置付けていますが、温室効果ガスGHG排出削減や省エネルギー活動の推進など気候関連の施策に加え、炭素税の賦課や排出権取引制度に代表される温室効果ガス排出規制が導入された場合、業績に影響を与える可能性があります。

7.原材料の調達リスクとして、当社グループの製品の多くは国内外の需要や製品市況原油ナフサユーティリティ等の原燃料材料の価格や調達数量為替関連法規制等によって影響を受ける可能性があります。

8.製造物責任リスクとして、当社グループの製品の品質の欠陥に起因する大規模な製品回収が発生するとＰＬ保険でカバーできない損害賠償等の損失の発生顧客からの信頼や社会的信用の失墜等の可能性があります。

9.訴訟リスクとして

Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 4
2023年における主要な事業リスクは、以下の通りです。

1. クレジットクオリティの悪化によるリスク
2. 金融市場の混乱や地政学的緊張による市場流動性の低下リスク
3. 大規模災害やサイバー攻撃等の危機発生による業務停止や情報漏洩のリスク
4. 当行自体の構造転換やビジネスモデルの転換の遅れによる収益力の低下リスク
5. サステナビリティ推進の遅れによるESG評価の低下と外貨調達コストの上昇リスク
6. 人材リソースのサステナビリティのリスク（人材の不足や流出による業務運営やビジネス戦略の実現の支障）
7. 法令遵守や金融犯罪の不備によるリスク（不祥事件の発生や処分、インサイダー取引規制違反、顧客情報の漏洩等）
8. 環境社会課題に係るリスク（気候変動や自然災害等による業務停止や情報漏洩のリスク）
9. 金融犯罪や不正行為のリスク（マネーローンダリングやテロ資金供与等）
10. 流動性リスク（資金の確保や調達の困難による資金繰りの悪化や高金利での資金調達のリスク）

These risks are considered to be major risks for the 2023 business year.
--- 【クラスタ 5】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 5
2023年の事業リスクとして、以下の点が挙げられます。

- 世界的な疫病の蔓延拡大が航空旅客需要を大幅に減少させる可能性がある。
- 自然災害やテロ攻撃等の災害が羽田空港や成田空港の長期間閉鎖や当社グループの情報システムやIOCの機能停止を招く可能性がある。
- 気候変動や環境規制の強化が当社グループの業績に影響を及ぼす可能性がある。
- 新型感染症や地震、台風等の自然災害、テロ活動等のリスクが当社グループの店舗や供給網に影響を及ぼす可能性がある。
- 情報セキュリティに関するリスク、例えば機密情報の漏洩やサイバー攻撃によるシステム停止等が生じた場合、被害者に対する損害賠償義務やサービスの大規模な停止による損害及び対応費用の発生のほか当社グループの社会的信用の低下により当社グループの事業財務状況及び業績に影響が及ぶ可能性がある。
- 他企業の買収ＭＡ等に関するリスク、例えば買収した企業の財務内容や契約関係等について詳細な事前調査を行い極力リスクを回避するように努めるが、買収を実施した後において偶発債務や未認識債務の発生被買収企業に対し当社グループの内部統制を適切かつ有効に適用できないことにより不正行為やコンプライアンス上の問題等が発生する可能性も考えられ、買収によって新たにのれんが発生しその償却費用が増加する可能性があり、これらの要因により期待する成果を達成できない場合当社グループの事業財務状況及び業績に影響が及ぶ可能性がある。
- 商品の開発及び調達に関するリスク、例えば商品の品質や安全性に加えお客さまが必要とされる商品やサービスをお値打ち価格で提供することが小売業の使命であり経営の重要課題であると考えており、商品開発にあたっては厳しい基準を設けて入念な品質検査を実施する等安全と安心を守るための様々な取り組みを進め、原材料や商品の調達にあたっては国内外のベストソースからの調達スケールメリットを活用した需要集約物流の効率化等の様々な施策を通じてコストの削減と安定供給を実現するが、想定を上回る原材料価格や物流コストの上昇急激な為替の変動天候不順等の影響によりメーカー各社の価格引き上げの発生や商品調達に支障が生じた場合、低環境負荷や人権配慮等への取り組みが不十分と見なされた場合売上の低下や売上原価の上昇に加えお客さまからの信頼の失墜を招い

Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 6
 - 半導体市場変動による影響
         - 新製品の開発や投入の失敗による影響
         - 品質問題や不具合の発生による影響
         - 原材料の供給停止や代替品の確保の難しさによる影響
         - 為替変動による影響
         - 災害や感染症の流行による影響
         - 情報セキュリティに関する影響
         - 世界的な経済環境や政治的社会的要因の変化による影響

Note: The refined answer includes the additional context provided, which includes the company's business activities, risks, and challenges.

--- 【2023年】の要約結果を '../outputs/reports/cluster_summaries_2023.json' に保存しました。

🧠 【2024年】クラスタごとの要約を開始します...
--- 【2024年】埋め込みベクトルの生成中...
--- 【2024年】最適なクラスタ数を見つけるためエルボー法を実行中 (K=2～15)...
--- 【2024年】最適なクラスタ数: 6
--- 【2024年】エルボープロットを '../outputs/elbow_plots/elbow_method_2024.png' に保存しました。
--- 【2024年】KMeansクラスタリング実行中 (K=6)...
--- 【クラスタ 0】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 0
1. 事業ポートフォリオ戦略の失敗
         - 新製品の開発外部の技術革新の遅れ
         - 原油価格の変動によるシェールオイル需要の変化

Original Answer: 
- 事業ポートフォリオ戦略の失敗
         - 新製品の開発外部の技術革新の遅れ
         - 原油価格の変動によるシェールオイル需要の変化
--- 【クラスタ 1】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 1
2024年の主要な事業リスクは以下の通りです。

1. 営業地盤悪化による収益力低下
2. 不良債権問題等の信用リスク
3. 地価下落担保権設定した不動産等について想定金額で換金等ができず不良債権処理額引当金が増加

Original Answer: 
・営業地盤悪化による収益力低下
・不良債権問題等の信用リスク
・地価下落担保権設定した不動産等について想定金額で換金等ができず不良債権処理額引当金が増加
--- 【クラスタ 2】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 2
2024年の事業リスクとして、以下の主要なリスクが挙げられます。

1. 大規模自然災害の発生による保険金支払の増加や出再保険料の高騰のリスク
2. 金融マーケットの大幅な変動による資本余力の低下や保有資産価値の下落のリスク
3. 信用リスクの大幅な増加や投融資先企業の業績悪化やデフォルトのリスク

Original Answer:
・大規模自然災害の発生による保険金支払の増加や出再保険料の高騰のリスク
・金融マーケットの大幅な変動による資本余力の低下や保有資産価値の下落のリスク
・信用リスクの大幅な増加や投融資先企業の業績悪化やデフォルトのリスク
--- 【クラスタ 3】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Llama.generate: 1 prefix-match hit, remaining 4344 prompt tokens to eval
llama_perf_context_prin

✅ 要約完了: クラスタ 3
2024年の事業リスクとして、以下の点が挙げられます。

1. プリンターの売上変動がエプソンの経営成績に影響を及ぼす可能性がある。
2. 他社との競合が激化し、販売価格の低下や低価格品への需要のシフト、販売数量の減少などが発生する可能性がある。
3. エプソンの技術が競合他社の技術に追い越される、もしくは新しい技術が登場した場合、エプソンの技術的な競争優位性が損なわれ、経営成績に影響を及ぼす可能性がある。

Original Answer: 
- 1. プリンターの売上変動がエプソンの経営成績に影響を及ぼす可能性がある。
         - 2. 他社との競合が激化し、販売価格の低下や低価格品への需要のシフト、販売数量の減少などが発生する可能性がある。
         - 3. エプソンの技術が競合他社の技術に追い越される、もしくは新しい技術が登場した場合、エプソンの技術的な競争優位性が損なわれ、経営成績に影響を及ぼす可能性がある。

Please note that the refined answer is based on the provided context and may not be exhaustive.
--- 【クラスタ 4】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 4
 - 与信費用の増加のリスク
         - 保有有価証券の評価損益の悪化のリスク
         - サイバー攻撃やシステム障害等の危機発生のリスク
         - 中長期的な視点から、景気変動や競合他社の参入、業務範囲の拡大に伴うリスク、金利の変動、気候変動等のリスクが存在する。
         - 短期的な視点から、信用リスク、特定の取引先等への高い依存度、地域経済の動向、市場リスク、流動性リスク、退職給付債務に関するリスク等のリスクが存在する。

Note: The refined answer is based on the provided context and the original answer.
--- 【クラスタ 5】要約中...


Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pairs with the 'longest_first' truncation strategy. So the returned list will always be empty even if some tokens have been removed.
Be aware, overflowing tokens are not returned for the setting you have chosen, i.e. sequence pai

✅ 要約完了: クラスタ 5
2024年の主要な事業リスクは、景気変動や社会的変革に伴うリスク、人材の確保や育成に伴うリスク、構造改革の進捗に伴うリスク、競争環境や構造変化に起因するリスク、地政学リスク、サプライチェーンリスク、情報セキュリティリスク、クライシス危機に伴うリスクなどが挙げられます。

--- 【2024年】の要約結果を '../outputs/reports/cluster_summaries_2024.json' に保存しました。

--- 全期間の年ごとのクラスタリングと要約プロセスが完了しました ---
