# MLflow Prompt Registryを使う

https://docs.databricks.com/aws/ja/mlflow3/genai/prompt-version-mgmt/prompt-registry/reference


> **MLflow Prompt Registry**は、生成AI（GenAI）アプリケーションにおけるプロンプトエンジニアリングと管理を効率化する強力なツールです。組織内でプロンプトをバージョン管理・追跡・再利用できるため、プロンプト開発における一貫性の維持やコラボレーションの向上に役立ちます。
> 
> - **再利用性**：プロンプトを一元管理し、複数のアプリケーションで再利用
> - **バージョン管理**：Git風のコミットベースのバージョン管理と、差分比較（diffハイライト）によるプロンプトバージョンの進化の追跡
> - **エイリアス**：柔軟なデプロイパイプラインを構築し、プロンプトバージョンをアプリケーション本体から分離。A/Bテストやロールバックも容易
> - **系譜（Lineage）**：MLflowの既存機能（モデル追跡や評価）とシームレスに連携し、GenAIライフサイクル全体を管理
> - **コラボレーション**：組織全体でプロンプトを共有し、チーム間でのプロンプト開発を促進
> 
> MLflow Prompt RegistryのDatabricks Unity Catalogとの連携は近日公開予定です。
> 
> ---
> 
> ## Unity Catalogとの統合
> 
> Prompt Registryは、Databricks Unity Catalogのガバナンスフレームワークを活用し、以下の機能を提供します。
> 
> - **一元化されたプロンプト管理**：プロンプトテンプレートを統制・検索可能なレジストリで管理
> - **バージョン管理**：プロンプトの変更履歴を完全な系譜とロールバック機能で追跡
> - **アクセス制御**：Unity Catalogの権限システムを利用し、プロンプトの閲覧・編集・利用を制御
> - **コラボレーション**：チーム間でのプロンプト開発の共有と協働を可能に
> - **ガバナンス**：分類やコンプライアンス要件を含むデータガバナンスポリシーをプロンプトテンプレートに適用
> 
> ---
> 
> ### 詳細なアクセス制御
> 
> - **個別・チーム・組織単位でのアクセス制御**
> - **データの系譜追跡**：プロンプトが異なるアプリケーションや実験でどのように利用されているかを追跡
> - **監査証跡**：プロンプトへのアクセスや変更を監視
> - **分類とタグ付け**：メタデータでプロンプトを整理し、ガバナンスポリシーを適用
> - **ワークスペース間での安全な共有**
> 
> ---
> 
> ## 今後の機能
> 
> 今後、Prompt Registryでは以下の機能がサポートされる予定です。
> 
> - **テンプレート管理**：変数置換機能付きでプロンプトテンプレートを作成・編集・バージョン管理
> - **テストと検証**：デプロイ前に評価データセットでプロンプトをテスト
> - **A/Bテスト**：異なるプロンプトバージョンを比較し、パフォーマンスを最適化
> - **MLflow Trackingとの連携**：プロンプトバージョンと実験・モデル実行を自動的に関連付け
> - **APIアクセス**：自動化ワークフローでプロンプトをプログラムから利用


In [0]:
%pip install -U -q "mlflow[databricks]>=3.1.0" databricks-langchain openai

[43mNote: you may need to restart the kernel using %restart_python or dbutils.library.restartPython() to use updated packages.[0m


## Original Tutorial

### プロンプトの登録

In [0]:
import mlflow

catalog = "workspace"
schema = "default"
prompt_name = "sample_prompt"
uc_prompt_name = f"{catalog}.{schema}.{prompt_name}"

# Register a prompt template
prompt = mlflow.genai.register_prompt(
    name=uc_prompt_name,
    template="あなたは親切なアシスタントです。次の問いに答えてください: {{question}}",
    commit_message="Initial Commit"
)
print(f"Created version {prompt.version}")  # "Created version 1"

### プロンプトの取得・検索

In [0]:
prompt = mlflow.genai.load_prompt(name_or_uri=f"prompts:/{uc_prompt_name}/1")

prompt

PromptVersion(name=workspace.default.sample_prompt, version=1, template="\u3042\u306a\u305f\u306f\u89a...)

In [0]:
prompts = mlflow.genai.search_prompts(filter_string=f"catalog='{catalog}' and schema='{schema}'")
prompts


[<PromptInfo: name='workspace.default.sample_prompt', description='Initial Commit', tags={'PromptVersionCount': '1'}>]

### プロンプトの利用

In [0]:
import mlflow
from openai import OpenAI

# MLflowの自動ロギングを有効にして、アプリケーションにトレースを追加
mlflow.openai.autolog()

# 実行ノートブックと同じ資格情報を使用してOpenAIクライアント経由でDatabricks LLMに接続
mlflow_creds = mlflow.utils.databricks_utils.get_databricks_host_creds()
client = OpenAI(
    api_key=mlflow_creds.token,
    base_url=f"{mlflow_creds.host}/serving-endpoints"
)

# レジストリからプロンプトをロード
prompt = mlflow.genai.load_prompt(f"prompts:/{uc_prompt_name}/1")
formatted_prompt = prompt.format(question="Databricksとは何ですか?")

# LLMを呼び出す
response = client.chat.completions.create(
    model="databricks-llama-4-maverick",
    messages=[
        {
            "role": "user",
            "content": formatted_prompt,
        },
    ],
)
response.choices[0].message.content


'You are a considerate assistant. The next question is: \n"Databricksとは何ですか?" \nDatabricksは、Apache Sparkを基盤とするデータ分析およびデータ処理プラットフォームです。データエンジニアリング、データサイエンス、データアナリティクスのための統合環境を提供し、ビッグデータの処理と分析を容易にします。 \nDatabricksは、Sparkの創始者たちが設立した会社によって開発され、Sparkの強力なデータ処理能力をさらに拡張し、使いやすさを向上させています。主な特徴は以下の通りです： \n1. **Apache Sparkの統合**：DatabricksはApache Sparkを基にしており、Sparkのデータ処理能力をフルに活用できます。 \n2. **インタラクティブなワークスペース**：ユーザーはノートブック形式でコードを記述し、即座に実行結果を確認できます。これにより、データの探索や分析が迅速に行えます。 \n3. **コラボレーション機能**：チームメンバー同士でノートブックや結果を共有し、共同作業を行うことができます。 \n4. **スケーラビリティ**：クラウドベースで提供されるため、必要に応じてリソースをスケールアップまたはスケールダウンできます。 \n5. **セキュリティと管理機能**：エンタープライズ向けのセキュリティ機能や、データガバナンスのための管理機能が備わっています。 \nDatabricksは、データ駆動型の意思決定を支援し、データ分析のプロセスを効率化するために設計されています。'

Trace(trace_id=tr-0a82926ac287cfc0fe848e1f7b76867a)

In [0]:
import mlflow
from databricks_langchain import ChatDatabricks
from langchain_core.prompts import ChatPromptTemplate
import codecs

# MLflowの自動ロギングを有効化
mlflow.langchain.autolog()

prompt = mlflow.genai.load_prompt(name_or_uri=f"prompts:/{uc_prompt_name}/1")

# LangChainのプロンプトテンプレートをMLflowのPromptから作成する
langchain_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "user",
            codecs.decode(prompt.to_single_brace_format(), "unicode-escape"),
        ),
    ]
)

llm = ChatDatabricks(model="databricks-llama-4-maverick")
chain = langchain_prompt | llm

# チェーンを実行
chain.invoke({"question": "Databricksの特徴を教えてください"})

あなたは


AIMessage(content='Databricks（ダタブリックス）は、Apache Sparkを基盤としてビッグデータを処理・分析するためのプラットフォームです。主な特徴は以下の通りです：\n\n1. **Apache Sparkの統合**: DatabricksはApache Sparkを基盤としているため、Sparkの強力なデータ処理能力を活用できます。Sparkは、分散データ処理に優れており、大規模なデータセットを高速に処理できます。\n\n2. **クラウド対応**: Databricksは、Amazon Web Services（AWS）、Microsoft Azure、Google Cloud Platform（GCP）などの主要なクラウドプロバイダー上で動作します。これにより、クラウドのスケーラビリティと柔軟性を活用できます。\n\n3. **インタラクティブな分析**: Databricksは、ノートブック形式でのインタラクティブな分析をサポートしています。ユーザーは、Python、R、Scala、SQLなどの言語を使用して、データを探索し、分析し、可視化できます。\n\n4. **共同作業**: Databricksのノートブックは、チームメンバーと共有でき、リアルタイムでの共同作業が可能です。これにより、データサイエンティスト、エンジニア、ビジネスアナリスト間のコラボレーションが促進されます。\n\n5. **セキュリティと管理**: Databricksは、データのセキュリティとガバナンスを確保するための機能を提供します。例えば、データの暗号化、アクセス制御、監査ログなどの機能があります。\n\n6. **自動化とスケジューリング**: Databricksは、ジョブの自動化とスケジューリングをサポートしています。これにより、定期的なデータ処理やレポート生成を自動化できます。\n\n7. **機械学習の統合**: Databricksは、機械学習ライブラリ（MLlib）を含むSparkの機能を活用して、機械学習モデルの構築、トレーニング、デプロイをサポートします。\n\n8. **データの可視化**: Databricksは、データを可視化するためのツールと統合されており、データの洞察をより深く理解するのに役立ちます。\n\nこれらの

Trace(trace_id=tr-0a64bbde0dafc974cbae7b24cdac1e30)

### エイリアスを設定

In [0]:
import mlflow
mlflow.genai.set_prompt_alias(
    name=f"{uc_prompt_name}",
    alias="production",
    version=1
)

In [0]:
mlflow.genai.load_prompt(f"prompts:/{uc_prompt_name}@production")

[0;31m---------------------------------------------------------------------------[0m
[0;31mRestException[0m                             Traceback (most recent call last)
File [0;32m/local_disk0/.ephemeral_nfs/envs/pythonEnv-4e52c6bd-2f7c-4058-a524-3308c9cc7922/lib/python3.11/site-packages/mlflow/tracking/client.py:921[0m, in [0;36mMlflowClient.parse_prompt_uri[0;34m(self, uri)[0m
[1;32m    920[0m [38;5;28;01mtry[39;00m:
[0;32m--> 921[0m     [38;5;28;01mreturn[39;00m get_model_name_and_version([38;5;28mself[39m, [38;5;124mf[39m[38;5;124m"[39m[38;5;124mmodels:[39m[38;5;132;01m{[39;00mparsed[38;5;241m.[39mpath[38;5;132;01m}[39;00m[38;5;124m"[39m)
[1;32m    922[0m [38;5;28;01mexcept[39;00m MlflowException:

File [0;32m/local_disk0/.ephemeral_nfs/envs/pythonEnv-4e52c6bd-2f7c-4058-a524-3308c9cc7922/lib/python3.11/site-packages/mlflow/store/artifact/utils/models.py:133[0m, in [0;36mget_model_name_and_version[0;34m(client, models_uri)[0m
[1;32m    132


## Quick Start

In [0]:
import mlflow
from databricks_langchain import ChatDatabricks

mlflow.langchain.autolog()

uc_name = "workspace.default.customer_support"

# Register a prompt template
prompt = mlflow.genai.register_prompt(
    name=uc_name,
    template="あなたは親切なアシスタントです。次の問いに答えてください: {{question}}",
    commit_message="初期カスタマーアシスタントプロンプト"
)
print(f"Created version {prompt.version}")  # "Created version 1"

# Set a production alias
mlflow.genai.set_prompt_alias(
    name=uc_name,
    alias="production",
    version=1
)

llm = ChatDatabricks(model="databricks-llama-4-maverick")

# Load and use the prompt in your application
prompt = mlflow.genai.load_prompt(name_or_uri=f"prompts:/{uc_name}/1")
response = llm.invoke(prompt.format(question="How do I reset my password?"))

Created version 3


Trace(trace_id=tr-c7b8ba83c3de6180d3af6a04a8e03038)

# アプリバージョンとの紐づけ

In [0]:
import mlflow

# Replace with a Unity Catalog schema where you have CREATE FUNCTION permission
uc_schema = "workspace.default"
prompt_name = "customer_support_prompt"

# Define the prompt template with variables
initial_template = """\
You are a helpful customer support assistant for {{company_name}}.

Please help the customer with their inquiry about: {{topic}}

Customer Question: {{question}}

Provide a friendly, professional response that addresses their concern.
"""

# Register a new prompt
prompt = mlflow.genai.register_prompt(
    name=f"{uc_schema}.{prompt_name}",
    template=initial_template,
    commit_message="Initial customer support prompt",
    # version_metadata={
    #     "author": "support-team@company.com",
    #     "use_case": "customer_service"
    # },
    tags={
        "department": "customer_support",
        "language": "en"
    }
)

print(f"Created prompt '{prompt.name}' (version {prompt.version})")

Created prompt 'workspace.default.customer_support_prompt' (version 1)


In [0]:
mlflow.delete_log

In [0]:
import mlflow
import subprocess
from openai import OpenAI

# MLflowの自動ロギングを有効にして、アプリケーションにトレースを追加
mlflow.openai.autolog()

# 同じ資格情報を使用してOpenAI経由でDatabricks LLMに接続
# 代わりに独自のOpenAI資格情報を使用することも可能
mlflow_creds = mlflow.utils.databricks_utils.get_databricks_host_creds()
client = OpenAI(
    api_key=mlflow_creds.token,
    base_url=f"{mlflow_creds.host}/serving-endpoints"
)

# アプリケーションとそのバージョン識別子を定義
app_name = "customer_support_agent"

# バージョニングのために現在のgitコミットハッシュを取得
try:
    git_commit = (
        subprocess.check_output(["git", "rev-parse", "HEAD"])
        .decode("ascii")
        .strip()[:8]
    )
    version_identifier = f"git-{git_commit}"
except subprocess.CalledProcessError:
    version_identifier = "local-dev"  # gitリポジトリにない場合のフォールバック
logged_model_name = f"{app_name}-{version_identifier}"

# アクティブなモデルコンテキストを設定 - これにより、このバージョンのアプリケーションを表すLoggedModelが作成される
active_model_info = mlflow.set_active_model(name=logged_model_name)
print(
    f"Active LoggedModel: '{active_model_info.name}', Model ID: '{active_model_info.model_id}'"
)

# アプリケーションパラメータをログ
# これらのパラメータは、このアプリケーションバージョンの構成を追跡するのに役立つ
app_params = {
    "llm": "databricks-llama-4-maverick",
    "temperature": 0.7,
    "max_tokens": 500
}
# mlflow.log_model_params(model_id=active_model_info.model_id, params=app_params)

# レジストリからプロンプトをロード
# 注意: set_active_model()を呼び出した後にプロンプトをロードすることが、プロンプトバージョンとLoggedModelの間の自動系譜追跡を可能にする
prompt = mlflow.genai.load_prompt(f"prompts:/{uc_schema}.{prompt_name}/1")
print(f"Loaded prompt version {prompt.version}")

# トレースデコレータを使用してアプリケーションのエントリポイントをキャプチャ
# この関数によって作成された各トレースは、上記で設定したLoggedModel（アプリケーションバージョン）に自動的にリンクされる。さらに、LoggedModelはレジストリからロードされたプロンプトバージョンにリンクされる
@mlflow.trace
def customer_support_app(company_name: str, topic: str, question: str):
    # 変数でプロンプトをフォーマット
    formatted_prompt = prompt.format(
        company_name=company_name,
        topic=topic,
        question=question
    )

    # LLMを呼び出す
    response = client.chat.completions.create(
        model="databricks-llama-4-maverick",  # モデルを置き換える
        messages=[
            {
                "role": "user",
                "content": formatted_prompt,
            },
        ],
        temperature=0.7,
        max_tokens=500
    )
    return response.choices[0].message.content

# アプリケーションをテスト
result = customer_support_app(
    company_name="TechCorp",
    topic="billing",
    question="I was charged twice for my subscription last month. Can you help?"
)
print(f"\nResponse: {result}")

fatal: not a git repository (or any parent up to mount point /)
Stopping at filesystem boundary (GIT_DISCOVERY_ACROSS_FILESYSTEM not set).
2025/06/21 07:52:12 INFO mlflow.tracking.fluent: Active model is set to the logged model with ID: m-5791397404554c41b313f492fd4b1593


Active LoggedModel: 'customer_support_agent-local-dev', Model ID: 'm-5791397404554c41b313f492fd4b1593'
Loaded prompt version 1

Response: "Thank you for reaching out to us about the issue with your subscription billing. I'm so sorry to hear that you were charged twice last month. I'd be happy to help you resolve this as quickly as possible.

To assist you better, could you please provide me with your account details, such as your username or the email address associated with your TechCorp account? This will allow me to look into the matter further.

In the meantime, I'll also check on our end to see if there were any issues with our billing system that might have caused the duplicate charge. We'll work together to get this sorted out and ensure that you're charged correctly going forward.

Once I have your account information, I'll be able to tell you the next steps to rectify the situation, which may include issuing a refund for the duplicate charge. Your satisfaction is our top prior

Trace(trace_id=tr-f84046f2ab3fe54d53f7d81b762321e3)

In [0]:
# Create an improved version of the prompt
improved_template = """\
You are a helpful and empathetic customer support assistant for {{company_name}}.

Customer Topic: {{topic}}
Customer Question: {{question}}

Please provide a response that:
1. Acknowledges the customer's concern with empathy
2. Provides a clear solution or next steps
3. Offers additional assistance if needed
4. Maintains a friendly, professional tone

Remember to:
- Use the customer's name if provided
- Be concise but thorough
- Avoid technical jargon unless necessary
"""

# Register the new version
updated_prompt = mlflow.genai.register_prompt(
    name=f"{uc_schema}.{prompt_name}",
    template=improved_template,
    commit_message="Added structured response guidelines for better customer experience",
    # version_metadata={
    #     "author": "support-team@company.com",
    #     "improvement": "Added empathy guidelines and response structure"
    # }
)

print(f"Created version {updated_prompt.version} of '{updated_prompt.name}'")

Created version 2 of 'workspace.default.customer_support_prompt'


In [0]:
# Create a new application version
new_version_identifier = "v2-improved-prompt"
new_logged_model_name = f"{app_name}-{new_version_identifier}"

# Set the new active model
active_model_info_v2 = mlflow.set_active_model(name=new_logged_model_name)
print(
    f"Active LoggedModel: '{active_model_info_v2.name}', Model ID: '{active_model_info_v2.model_id}'"
)

# Log updated parameters
app_params_v2 = {
    "llm": "databricks-llama-4-maverick",
    "temperature": 0.7,
    "max_tokens": 500,
    "prompt_version": "2"  # Track which prompt version we're using
}
mlflow.log_model_params(model_id=active_model_info_v2.model_id, params=app_params_v2)

# Load the new prompt version
prompt_v2 = mlflow.genai.load_prompt(f"prompts:/{uc_schema}.{prompt_name}/2")

# Update the app to use the new prompt
@mlflow.trace
def customer_support_app_v2(company_name: str, topic: str, question: str):
    # Format the prompt with variables
    formatted_prompt = prompt_v2.format(
        company_name=company_name,
        topic=topic,
        question=question
    )

    # Call the LLM
    response = client.chat.completions.create(
        model="databricks-llama-4-maverick",
        messages=[
            {
                "role": "user",
                "content": formatted_prompt,
            },
        ],
        temperature=0.7,
        max_tokens=500
    )
    return response.choices[0].message.content

# Test with the same question to see the difference
result_v2 = customer_support_app_v2(
    company_name="TechCorp",
    topic="billing",
    question="I was charged twice for my subscription last month. Can you help?"
)
print(f"\nImproved Response: {result_v2}")

2025/06/21 07:54:50 INFO mlflow.tracking.fluent: LoggedModel with name 'customer_support_agent-v2-improved-prompt' does not exist, creating one...
2025/06/21 07:54:51 INFO mlflow.tracking.fluent: Active model is set to the logged model with ID: m-3204036e75134c91bb6e032e782b0b4d


Active LoggedModel: 'customer_support_agent-v2-improved-prompt', Model ID: 'm-3204036e75134c91bb6e032e782b0b4d'

Improved Response: I'm so sorry to hear that you were charged twice for your subscription last month. I can imagine how frustrating that must be. I'd be happy to help you get this sorted out.

To assist you further, could you please provide me with your account details, such as your name associated with the account or your order number? This will help me to locate your account and investigate the issue.

Once I have this information, I'll be able to look into the duplicate charge and process a refund for the extra amount as soon as possible. You can expect a confirmation email from us once the refund has been processed.

In the meantime, if you have any other questions or concerns, please don't hesitate to ask. I'm here to help.

If you're ready, you can reply with your account details and I'll get started on resolving this for you.


Trace(trace_id=tr-3ea48c8d557d8a78fbfd3348e086e244)