## 编写yaml配置文件

对于纯图像数据评估，可编写如下格式的yaml文件，其中data下的配置用于指定数据集的路径和相关信息，scorers下的配置用于指定您想使用的评估指标。
```yaml
model_cache_path: '../ckpt' # Path to cache models
num_workers: 2

data:
  image:
    meta_data_path: "../data/image_data.json" # 元数据的存放位置
    data_path: "../data/images" # 图像数据的存放位置
    image_key: 'image' # 元数据中图像路径（或图像名）对应的键
    id_key: 'id' # 元数据中id对应的键
    formatter: 'PureImageFormatter' # image数据固定使用PureImageFormatter

scorers:
  LiqeScorer:
      batch_size: 2
      device: "cuda"
  ArniqaScorer:
      batch_size: 2
      device: "cuda"
```
以上配置文件对应的元数据（`../data/image_data.json`）如下：
```json
[
    {
        "id": "000114",
        "image": "000114.jpg"
    },
    {
        "id": "000810",
        "image": "000810.jpg"
    }
]
```

类似的，对于图片-caption数据集，可编写如下格式的yaml文件，其中data下的配置用于指定数据集的路径和相关信息，scorers下的配置用于指定您想使用的评估指标。
```yaml
model_cache_path: '../ckpt' # Path to cache models
num_workers: 2

data:
  image_caption:
    meta_data_path: "../data/image_caption_data.json" # 元数据的存放位置
    data_path: "../data/images" # 图像数据的存放位置
    image_key: 'image' # 元数据中图像路径（或图像名）对应的键
    image_caption_key: 'caption' # 元数据中caption对应的键
    id_key: 'id' # 元数据中id对应的键
    formatter: 'ImageCaptionFormatter' # image数据固定使用ImageCaptionFormatter

scorers:
  ClipScorer:
      batch_size: 2
      device: "cuda"
  LongClipScorer:
      model_size: B # For larger models, use L
      batch_size: 2
      device: "cuda"
```
以上配置文件对应的元数据（`../data/image_caption_data.json`）如下：
```json
[
    {
        "id": "000114",
        "image": "000114.jpg",
        "caption": "an old man"
    },
    {
        "id": "000810",
        "image": "000810.jpg",
        "caption": "blue sky"
    }
]
```

## 评估数据集

编写好yaml配置文件后，调用 calculate_score() 即可对数据进行评估。

In [None]:
import sys
import os
dataflow_path = os.path.abspath(os.path.join(os.getcwd(), '..', '..')) 
sys.path.insert(0, dataflow_path)
sys.argv = ['notebook', '--config', 'path/to/scorer_example.yaml']

from dataflow.utils.utils import calculate_score
calculate_score()