# 概要
tiktoken は、OpenAI が開発した トークナイザー（tokenizer） のライブラリで、GPT系のモデル（たとえば gpt-3.5-turbo や gpt-4）が入力テキストを処理する際に、どのようにトークンに分割するかを決定するために使われます。
URL(https://github.com/openai/tiktoken)

# install
```bash
pip install tiktoken
```


# よく使用される用途
- チャット履歴のトークン数を計測して、モデルの制限内に収める
- プロンプトの設計（token制限を意識）
- コスト計算（OpenAIのAPIはトークン数に応じて課金）


# textのトークン数を計算

In [None]:
import tiktoken

def count_tokens(text: str, encoding_name: str = "cl100k_base") -> int:
    """
    指定したテキストのトークン数を計算する関数。

    Args:
        text (str): トークン数を数えたい文字列。
        encoding_name (str): 使用するトークナイザの名前（デフォルト: "cl100k_base"）。これは、GPT-4, 3.5用

    Returns:
        int: テキストのトークン数。

    使用例:
        >>> count_tokens("Hello World!")
        3
    """
    enc = tiktoken.get_encoding(encoding_name)
    tokens = enc.encode(text)
    return len(tokens)

system_prompt = "あなたは優秀なアシスタントです。AをBに変換してください。"
count_tokens(system_prompt)