Skip to content

Convert Japanese kanji time expressions to datetime objects

License

Notifications You must be signed in to change notification settings

corkborg/kanji_to_time

Repository files navigation

Kanji to time

日本語の漢字などで書かれた年月日をPythonのdatetime型やtimedelta型に変換するライブラリ。
漢数字、旧字漢数字、全角などに対応しています。

内部では正規表現ではなくパーサージェネレータを使用しているので複雑なルールに対応しやすいようになっています。

使い方

pip install kanji_to_time
import kanji_to_time as ktt

text = "2024年4月5日22時30分4秒"
dt = ktt.to_datetime(text)
print(dt)

text = "二時間三十秒"
td = ktt.to_timedelta(text)
print(td)

対応パターン例

datetimeの変換

dt = ktt.to_datetime("2024年4月5日22時30分4秒")
self.assertEqual(
    dt, datetime(year=2024, month=4, day=5, hour=22, minute=30, second=4)
)

dt = ktt.to_datetime("2020年5月7日")
self.assertEqual(dt, datetime(year=2020, month=5, day=7))

dt = ktt.to_datetime("二〇二五年十二月七日")
self.assertEqual(dt, datetime(year=2025, month=12, day=7))

dt = ktt.to_datetime("二千年八月三日")
self.assertEqual(dt, datetime(year=2000, month=8, day=3))

dt = ktt.to_datetime("弐零弐参年伍月肆日")
self.assertEqual(dt, datetime(year=2023, month=5, day=4))

timedeltaの変換

td = ktt.to_timedelta("二時間三十秒")
self.assertEqual(td, timedelta(hours=2, seconds=30))

td = ktt.to_timedelta("六日間二時間五分間三秒間")
self.assertEqual(td, timedelta(days=6, hours=2, minutes=5, seconds=3))

td = ktt.to_timedelta("六日二時五分三秒")
self.assertEqual(td, timedelta(days=6, hours=2, minutes=5, seconds=3))

td = ktt.to_timedelta("90秒")
self.assertEqual(td, timedelta(seconds=90))

td = ktt.to_timedelta("マイナス七億分")
self.assertEqual(td, timedelta(minutes=-700_000_000))

td = ktt.to_timedelta("45秒前")
self.assertEqual(td, timedelta(seconds=-45))

td = ktt.to_timedelta("45秒後")
self.assertEqual(td, timedelta(seconds=45))

その他詳細なパターンはこちらのファイルを参照

対応している文法の構造自体を確認したい場合はLark定義ファイルを参照

ユニットテスト

pip install -r requirements.txt
python -m unittest discover -s tests

リンター

チェック

ruff check

フォーマット修正

ruff format

問い合わせ

バグや機能要望についてはissueに報告をお願いします。
https://github.com/corkborg/kanji_to_time/issues

その他の問い合わせはメールまで(メール転送サービスを利用しています)
ax4squil8@mozmail.com

リリースノート

v0.0.3

  • to_timedeltaで接尾辞の「前」、「後」のサポート。 (ex: 20秒前は-20秒に、20秒後は20秒に)
  • to_timedeltaで「プラス」、「+」などのサポート。(ex: +20分)
  • カンマで区切られた数値をサポート(ex: 2,000)

About

Convert Japanese kanji time expressions to datetime objects

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages