# Cube Semantic Layer | Cube セマンティックレイヤー




このノートブックは、Cubeのデータモデルメタデータを取得し、それをLLMへの埋め込みとして適した形式で渡すプロセスを示しており、これによって文脈情報が強化されることを示しています。

> This notebook demonstrates the process of retrieving Cube's data model metadata in a format suitable for passing to LLMs as embeddings, thereby enhancing contextual information.




### About Cube | Cubeについて




[Cube](https://cube.dev/)は、データアプリを構築するためのセマンティックレイヤーです。データエンジニアやアプリケーション開発者が現代のデータストアからデータにアクセスし、それを一貫した定義に整理し、あらゆるアプリケーションに提供するのを支援します。

> [Cube](https://cube.dev/) is the Semantic Layer for building data apps. It helps data engineers and application developers access data from modern data stores, organize it into consistent definitions, and deliver it to every application.




Cubeのデータモデルは、LLMがデータを理解し、正しいクエリを生成するための文脈と定義を提供します。LLMは複雑な結合やメトリクスの計算をナビゲートする必要がありません。なぜなら、Cubeはそれらを抽象化し、SQLテーブルやカラム名ではなく、ビジネスレベルの用語に基づいて操作するシンプルなインターフェースを提供するからです。この単純化は、LLMがエラーを起こしにくくなり、誤解を招くような情報を生成することを避けるのに役立ちます。

> Cube’s data model provides structure and definitions that are used as a context for LLM to understand data and generate correct queries. LLM doesn’t need to navigate complex joins and metrics calculations because Cube abstracts those and provides a simple interface that operates on the business-level terminology, instead of SQL table and column names. This simplification helps LLM to be less error-prone and avoid hallucinations.




### Example | 例




**入力引数（必須）**

> **Input arguments (mandatory)**

`Cube Semantic Loader`は2つの引数を必要とします：

> `Cube Semantic Loader` requires 2 arguments:

* `cube_api_url`：CubeのデプロイメントREST APIのURLです。ベースパスの設定方法については、[Cubeのドキュメント](https://cube.dev/docs/http-api/rest#configuration-base-path)を参照してください。

  > `cube_api_url`: The URL of your Cube's deployment REST API. Please refer to the [Cube documentation](https://cube.dev/docs/http-api/rest#configuration-base-path) for more information on configuring the base path.


* `cube_api_token`：CubeのAPIシークレットに基づいて生成された認証トークンです。JSON Web Tokens（JWT）の生成方法については、[Cubeのドキュメント](https://cube.dev/docs/security#generating-json-web-tokens-jwt)を参照してください。

  > `cube_api_token`: The authentication token generated based on your Cube's API secret. Please refer to the [Cube documentation](https://cube.dev/docs/security#generating-json-web-tokens-jwt) for instructions on generating JSON Web Tokens (JWT).


**入力引数（オプショナル）**

> **Input arguments (optional)**

* `load_dimension_values`: 文字列次元ごとに次元の値を読み込むかどうか。

  > `load_dimension_values`: Whether to load dimension values for every string dimension or not.


* `dimension_values_limit`: 読み込む次元値の最大数。

  > `dimension_values_limit`: Maximum number of dimension values to load.


* `dimension_values_max_retries`: 次元値を読み込む最大のリトライ回数。

  > `dimension_values_max_retries`: Maximum number of retries to load dimension values.


* `dimension_values_retry_delay`：次元値の読み込みをリトライする際の遅延時間。

  > `dimension_values_retry_delay`: Delay between retries to load dimension values.





In [None]:
import jwt
from langchain.document_loaders import CubeSemanticLoader

api_url = "https://api-example.gcp-us-central1.cubecloudapp.dev/cubejs-api/v1/meta"
cubejs_api_secret = "api-secret-here"
security_context = {}
# Read more about security context here: https://cube.dev/docs/security
api_token = jwt.encode(security_context, cubejs_api_secret, algorithm="HS256")

loader = CubeSemanticLoader(api_url, api_token)

documents = loader.load()

以下の属性を持つドキュメントのリストを返します：

> Returns a list of documents with the following attributes:

* ページ内容

  > `page_content`

* `metadata`

  > `metadata`
  
* `table_name`

    > `table_name`

  * `column_name`

    > `column_name`

  * `column_data_type`

    > `column_data_type`

  * `column_title`

    > `column_title`

  * `column_description`

    > `column_description`

  * `column_values`

    > `column_values`

  * `cube_data_obj_type`

    > `cube_data_obj_type`





In [None]:
# Given string containing page content
page_content = "Users View City, None"

# Given dictionary containing metadata
metadata = {
    "table_name": "users_view",
    "column_name": "users_view.city",
    "column_data_type": "string",
    "column_title": "Users View City",
    "column_description": "None",
    "column_member_type": "dimension",
    "column_values": [
        "Austin",
        "Chicago",
        "Los Angeles",
        "Mountain View",
        "New York",
        "Palo Alto",
        "San Francisco",
        "Seattle",
    ],
    "cube_data_obj_type": "view",
}