# 嗜好調整のためのデータセットを生成する

このノートブックでは、嗜好調整のためのデータセットを生成するプロセスを案内します。`distilabel`パッケージを使用して嗜好調整のためのデータセットを生成します。

それでは、嗜好調整データセットを見てみましょう。

<div style='background-color: lightblue; padding: 10px; border-radius: 5px; margin-bottom: 20px; color:black'>
    <h2 style='margin: 0;color:blue'>演習: 嗜好調整のためのデータセットを生成する</h2>
    <p>嗜好調整のためのデータセットを生成する方法を見たので、実際に嗜好調整のためのデータセットを生成してみましょう。</p>
    <p><b>難易度レベル</b></p>
    <p>🐢 嗜好調整のためのデータセットを生成する</p>
    <p>🐕 応答の進化を使用して嗜好調整のためのデータセットを生成する</p>
    <p>🦁 応答の進化とモデルプーリングを使用して嗜好調整のためのデータセットを生成する</p>
</div>

## 依存関係のインストール

transformersの代わりに、`vllm`や`hf-inference-endpoints`をインストールすることもできます。

In [None]:
!pip install "distilabel[hf-transformers,outlines,instructor]"

## 合成の開始

前のノートブックで見たように、嗜好データセット生成のためのdistilabelパイプラインを作成できます。最低限のパイプラインはすでに提供されています。このパイプラインをスケールアップして、嗜好調整のための大規模なデータセットを生成してください。モデル、モデルプロバイダー、生成引数を入れ替えて、データセットの品質にどのように影響するかを確認してください。小規模に実験し、後でスケールアップしましょう。

[distilabelコンポーネントギャラリー](https://distilabel.argilla.io/latest/components-gallery/)で、処理クラスの情報とその使用方法を確認してください。

辞書からデータをロードする代わりに、Hubからデータをロードする例を以下に示します。

```python
from datasets import load_dataset

with Pipeline(...) as pipeline:
    ...

if __name__ == "__main__:
    dataset = load_dataset("my-dataset", split="train")
    distiset = pipeline.run(dataset=dataset)
```

パイプラインを実行した後、データセットをHubにプッシュするのを忘れないでください！

In [None]:
from distilabel.llms import TransformersLLM
from distilabel.pipeline import Pipeline
from distilabel.steps import GroupColumns, LoadDataFromDicts
from distilabel.steps.tasks import TextGeneration

with Pipeline() as pipeline:
    data = LoadDataFromDicts(data=[{"instruction": "合成データとは何ですか？"}])
    llm_a = TransformersLLM(model="HuggingFaceTB/SmolLM2-1.7B-Instruct")
    gen_a = TextGeneration(llm=llm_a)
    llm_b = TransformersLLM(model="Qwen/Qwen2.5-1.5B-Instruct")
    gen_b = TextGeneration(llm=llm_b)
    group = GroupColumns(columns=["generation"])
    data >> [gen_a, gen_b] >> group

if __name__ == "__main__":
    distiset = pipeline.run()
    distiset.push_to_hub("huggingface-smol-course-preference-tuning-dataset")

## 🌯 まとめ

嗜好調整のためのデータセットを生成する方法を見てきました。これを使用して次のことができます：

- 嗜好調整のためのデータセットを生成する。
- 嗜好調整のための評価データセットを作成する。

次に

🏋️‍♂️ 合成データセットに基づいて[嗜好調整の章](../../2_preference_alignment/README.md)でモデルを微調整する
