# データセット概要

OMMX Quantum Benchmarksは、OMMX形式に変換された最適化ベンチマークデータセットへのアクセスを提供します。このページでは、利用可能なデータセットカテゴリの現在の状況について説明します。

**現在のソース**: 初回リリースではQOBLIBからのデータセットを含んでおり、将来的には追加のベンチマークソースへの拡張を想定した設計となっています。

## Marketsplit (`01_marketsplit`)

**問題タイプ**: マーケット分割最適化問題  
**モデル**: バイナリ線形、バイナリ制約なし  
**インスタンス数**: モデルごとに120インスタンス (ms_03_050_002 - ms_15_200_003)

In [1]:
from ommx_quantum_benchmarks.qoblib import Marketsplit

dataset = Marketsplit()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['binary_linear', 'binary_unconstrained']
binary_linear: 156 instances
binary_unconstrained: 156 instances


## Labs (`02_labs`)

**問題タイプ**: 低自己相関バイナリ列  
**モデル**: 整数、二次制約なし  
**インスタンス数**: 99インスタンス (labs002 - labs100)

In [2]:
from ommx_quantum_benchmarks.qoblib import Labs

dataset = Labs()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['integer', 'quadratic_unconstrained']
integer: 99 instances
quadratic_unconstrained: 99 instances


## Birkhoff (`03_birkhoff`)

**問題タイプ**: 最小Birkhoff分解  
**モデル**: 整数線形  
**インスタンス数**: 800インスタンス (bhD-3-001 - bhS-6-100)

In [3]:
from ommx_quantum_benchmarks.qoblib import Birkhoff

dataset = Birkhoff()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['integer_linear']
integer_linear: 800 instances


## Steiner (`04_steiner`)

**問題タイプ**: Steiner木パッキング問題  
**モデル**: 整数線形  
**インスタンス数**: 31インスタンス (stp_s020_l2_t3_h2_rs24098 - stp_s040_l2_t4_h3_rs123)

In [4]:
from ommx_quantum_benchmarks.qoblib import Steiner

dataset = Steiner()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['integer_linear']
integer_linear: 31 instances


## Independent Set (`07_independentset`)

**問題タイプ**: 最大独立集合問題  
**モデル**: バイナリ線形、バイナリ制約なし  
**インスタンス数**: モデルごとに42インスタンス (各種グラフインスタンス)

In [5]:
from ommx_quantum_benchmarks.qoblib import IndependentSet

dataset = IndependentSet()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['binary_linear', 'binary_unconstrained']
binary_linear: 42 instances
binary_unconstrained: 42 instances


## Network (`08_network`)

**問題タイプ**: ネットワーク設計  
**モデル**: 整数LP  
**インスタンス数**: 20インスタンス (network05 - network24)

In [6]:
from ommx_quantum_benchmarks.qoblib import Network

dataset = Network()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['integer_lp']
integer_lp: 20 instances


## Routing (`09_routing`)

**問題タイプ**: 配送計画  
**モデル**: 整数線形  
**インスタンス数**: 55インスタンス (XSH-n20-k4-01 - XSH-n20-k4-55)

In [7]:
from ommx_quantum_benchmarks.qoblib import Routing

dataset = Routing()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['integer_linear']
integer_linear: 55 instances


## Topology (`10_topology`)

**問題タイプ**: トポロジー設計  
**モデル**: Flow MIP、Seidel線形、Seidel二次  
**インスタンス数**: モデルごとに16インスタンス (topology_15_3 - topology_50_4)

In [8]:
from ommx_quantum_benchmarks.qoblib import Topology

dataset = Topology()
print(f"Available models: {dataset.model_names}")
for model in dataset.model_names:
    instances = dataset.available_instances[model]
    print(f"{model}: {len(instances)} instances")

Available models: ['flow_mip', 'seidel_linear', 'seidel_quadratic']
flow_mip: 16 instances
seidel_linear: 16 instances
seidel_quadratic: 16 instances


## その他のデータセットカテゴリ

以下のデータセットカテゴリはフレームワーク内で定義されていますが、現在インスタンスは含まれていません。これらは将来のリリースで拡張される可能性のある問題タイプを表しています:

- **Sports** (`05_sports`) - 混合整数線形スポーツスケジューリング問題
- **Portfolio** (`06_portfolio`) - バイナリ二次およびバイナリ制約なしポートフォリオ最適化

**注意**: これらのデータセットはインスタンス化できますが、空のインスタンスリストを返します。現在の利用可能性を確認するには、`available_instances`プロパティを確認してください。

## 現在のステータスまとめ

| データセット | モデル数 | インスタンス数 | ステータス |
|---------|--------|----------------|---------|
| Marketsplit | 2 | モデルごとに120 | ✅ 利用可能 |
| Labs | 2 | モデルごとに99 | ✅ 利用可能 |
| Birkhoff | 1 | 800 | ✅ 利用可能 |
| Steiner | 1 | 31 | ✅ 利用可能 |
| Sports | 1 | 0 | 🚧 定義済み、インスタンスなし |
| Portfolio | 2 | 0 | 🚧 定義済み、インスタンスなし |
| IndependentSet | 2 | モデルごとに42 | ✅ 利用可能 |
| Network | 1 | 20 | ✅ 利用可能 |
| Routing | 1 | 55 | ✅ 利用可能 |
| Topology | 3 | モデルごとに16 | ✅ 利用可能 |

**凡例**: 
- ✅ 利用可能: インスタンスが変換済みでアクセス可能
- 🚧 定義済み、インスタンスなし: データセットクラスは存在するが、現在インスタンスは利用不可