# DatetimeOutputParser

- 著者: [Donghak Lee](https://github.com/stsr1284)
- ピアレビュー: [JaeHo Kim](https://github.com/Jae-hoya), [ranian963](https://github.com/ranian963)
- 校正: [Two-Jay](https://github.com/Two-Jay)
- これは [LangChain Open Tutorial](https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial) の一部です

[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/03-OutputParser/06-DatetimeOutputParser.ipynb)[![Open in GitHub](https://img.shields.io/badge/Open%20in%20GitHub-181717?style=flat-square&logo=github&logoColor=white)](https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/03-OutputParser/06-DatetimeOutputParser.ipynb)
## 概要

```DatetimeOutputParser```は、```datetime```オブジェクトの形式で構造化された出力を生成する出力パーサーです。

LLMの出力を```datetime```オブジェクトに変換することで、日付と時刻データのより体系的で一貫した処理が可能になり、データ処理と分析に役立ちます。

このチュートリアルでは、```DatetimeOutputParser```を使用して以下のことを実演します:
1. ```datetime```生成用のパーサーの設定と初期化
2. ```datetime```オブジェクトを文字列に変換

### 目次

- [概要](#概要)
- [環境設定](#環境設定)
- [DatetimeOutputParserの使用](#DatetimeOutputParserの使用)
- [astreamでDatetimeOutputParserを使用](#astreamでDatetimeOutputParserを使用)


### 参考文献

- [LangChain DatetimeOutputParser](https://python.langchain.com/api_reference/langchain/output_parsers/langchain.output_parsers.datetime.DatetimeOutputParser.html)
- [LangChain ChatOpenAI APIリファレンス](https://python.langchain.com/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html)
----

## 環境設定

環境をセットアップします。詳細については[環境設定](https://wikidocs.net/257836)を参照してください。

**[注意]**
- ```langchain-opentutorial```は、チュートリアル用の使いやすい環境設定、便利な関数、ユーティリティを提供するパッケージです。
- 詳細については[```langchain-opentutorial```](https://github.com/LangChain-OpenTutorial/langchain-opentutorial-pypi)をご確認ください。

In [1]:
%%capture --no-stderr
%pip install langchain-opentutorial

In [2]:
# 必要なパッケージをインストール
from langchain_opentutorial import package

package.install(
    [
        "langchain",
        "langchain_core",
        "langchain_openai",
    ],
    verbose=False,
    upgrade=False,
)

In [3]:
# 環境変数を設定
from langchain_opentutorial import set_env

set_env(
    {
        "OPENAI_API_KEY": "",
        "LANGCHAIN_API_KEY": "",
        "LANGCHAIN_TRACING_V2": "true",
        "LANGCHAIN_ENDPOINT": "https://api.smith.langchain.com",
        "LANGCHAIN_PROJECT": "06-DatetimeOutputParser",
    }
)

環境変数が正常に設定されました。


あるいは、```.env```ファイルに```OPENAI_API_KEY```を設定して読み込むこともできます。

[注意] 前の手順で```OPENAI_API_KEY```を既に設定している場合、これは不要です。

In [4]:
from dotenv import load_dotenv

load_dotenv(override=True)

False

## ```DatetimeOutputParser```の使用
日付や時刻の形式で出力を生成する必要がある場合、LangChainの```DatetimeOutputParser```がプロセスを簡素化します。

**```DatetimeOutputParser```のフォーマット**は、以下の表を参照して指定できます。

| フォーマットコード | 説明                  | 例                   |
|-------------------|----------------------|----------------------|
| %Y                | 4桁の年              | 2024                 |
| %y                | 2桁の年              | 24                   |
| %m                | 2桁の月              | 07                   |
| %d                | 2桁の日              | 04                   |
| %H                | 24時間形式の時       | 14                   |
| %I                | 12時間形式の時       | 02                   |
| %p                | AMまたはPM           | PM                   |
| %M                | 2桁の分              | 45                   |
| %S                | 2桁の秒              | 08                   |
| %f                | マイクロ秒(6桁)      | 000123               |
| %z                | UTCオフセット        | +0900                |
| %Z                | タイムゾーン名       | JST                  |
| %a                | 曜日の省略形         | 木                   |
| %A                | 曜日の完全名         | 木曜日               |
| %b                | 月の省略形           | 7月                  |
| %B                | 月の完全名           | 7月                  |
| %c                | 完全な日付と時刻     | 木 7月 4 14:45:08 2024 |
| %x                | 完全な日付           | 07/04/24             |
| %X                | 完全な時刻           | 14:45:08             |

In [5]:
from langchain.output_parsers import DatetimeOutputParser
from langchain_core.prompts import PromptTemplate

# 出力パーサーを初期化
output_parser = DatetimeOutputParser()

# 日付フォーマットを指定
date_format = "%Y-%m-%d"
output_parser.format = date_format

# フォーマット指示を取得
format_instructions = output_parser.get_format_instructions()

# ユーザーの質問に対する回答テンプレートを作成
template = """ユーザーの質問に答えてください:\n\n#フォーマット指示: \n{format_instructions}\n\n#質問: \n{question}\n\n#回答:"""

# テンプレートからプロンプトを作成
prompt = PromptTemplate.from_template(
    template,
    partial_variables={
        "format_instructions": format_instructions,
    },  # パーサーのフォーマット指示を使用
)

print(format_instructions)
print("-----------------------------------------------\n")
print(prompt)

次のパターンに一致するdatetime文字列を書いてください: '%Y-%m-%d'。

例: 0594-05-12, 0088-08-25, 0371-10-02

この文字列のみを返し、他の言葉は不要です！
-----------------------------------------------

input_variables=['question'] input_types={} partial_variables={'format_instructions': "次のパターンに一致するdatetime文字列を書いてください: '%Y-%m-%d'。\n\n例: 0594-05-12, 0088-08-25, 0371-10-02\n\nこの文字列のみを返し、他の言葉は不要です！"} template='ユーザーの質問に答えてください:\n\n#フォーマット指示: \n{format_instructions}\n\n#質問: \n{question}\n\n#回答:'


In [6]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(temperature=0, model_name="gpt-4o-mini")

# プロンプト、チャットモデル、出力パーサーをチェーンに結合
chain = prompt | model | output_parser

# チェーンを呼び出して質問への回答を取得
output = chain.invoke({"question": "Googleが設立された年"})

print(output)
print(type(output))

1998-09-04 00:00:00
<class 'datetime.datetime'>


In [7]:
# 結果を文字列に変換
output.strftime(date_format)

'1998-09-04'

## ```astream```で```DatetimeOutputParser```を使用
[ユーザー定義ジェネレーター](https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/13-LangChain-Expression-Language/09-Generator.ipynb)を参照して、ジェネレーター関数を作成します。

ジェネレーター関数を使用して```astream```出力を```datetime```オブジェクトに変換する簡単な例を作成しましょう。

In [8]:
from langchain_core.output_parsers.string import StrOutputParser
from langchain.output_parsers.datetime import DatetimeOutputParser
from langchain_core.prompts.prompt import PromptTemplate
from langchain_openai.chat_models.base import ChatOpenAI
import datetime
from typing import AsyncIterator, List

# 出力パーサーを初期化
output_parser = DatetimeOutputParser()

# 日付フォーマットを指定
date_format = "%Y-%m-%d"
output_parser.format = date_format

# フォーマット指示を取得
format_instructions = output_parser.get_format_instructions()

# ユーザーの質問に対する回答テンプレートを作成
template = (
    "ユーザーの質問に答えてください:\n\n"
    "#フォーマット指示: \n{format_instructions}\n"
    "{company}に類似した企業の設立年をカンマ区切りで5つ書いてください"
)

# テンプレートからプロンプトを作成
prompt = PromptTemplate.from_template(
    template,
    partial_variables={"format_instructions": format_instructions},
)

# temperatureを0.0に設定してChatOpenAIモデルを初期化
model = ChatOpenAI(temperature=0.0, model_name="gpt-4o-mini")

# プロンプト、モデル、文字列出力パーサーを組み合わせたチェーンを作成
str_chain = prompt | model | StrOutputParser()


# 文字列をdatetimeオブジェクトに変換する非同期関数を定義
async def convert_strings_to_datetime(
    input: AsyncIterator[str],
) -> AsyncIterator[List[datetime.datetime]]:
    buffer = ""
    async for chunk in input:
        buffer += chunk
        while "," in buffer:
            comma_index = buffer.index(",")
            date_str = buffer[:comma_index].strip()
            date_obj = output_parser.parse(date_str)  # datetimeオブジェクトに変換
            yield [date_obj]
            buffer = buffer[comma_index + 1 :]
    date_str = buffer.strip()
    if date_str:
        date_obj = output_parser.parse(
            date_str
        )  # 残りのバッファをdatetimeオブジェクトに変換
        yield [date_obj]


# str_chainとconvert_strings_to_datetimeをパイプラインで接続
alist_chain = str_chain | convert_strings_to_datetime

In [9]:
# async forループを使用してデータをストリーミング
async for chunk in alist_chain.astream({"company": "Google"}):
    # 各チャンクを出力してバッファをフラッシュ
    print(chunk, flush=True)

[datetime.datetime(1998, 9, 4, 0, 0)]
[datetime.datetime(2004, 2, 4, 0, 0)]
[datetime.datetime(2003, 2, 4, 0, 0)]
[datetime.datetime(2001, 3, 1, 0, 0)]
[datetime.datetime(1994, 3, 1, 0, 0)]
