Библиотека написана в рамках хакатона школы 21 совместно с ленинской библиотекой
Предназначена для матчинга извлеченных из произвольного текста токенов, относящихся к датам, с неким языком регулярных выражений. На основе последовательностей токенов можно создавать разнообразные движки для извлечения дат.
Установка:
$ pip install datesearch
Пример:
from datesearch import search
print(search("ночью, в двадцать минут третьего", 'ne'))
Вывод программы:
[Number(20), Period("m")]
По полученным спискам токенов гораздо проще уже находить нужные комбинации чисел, промежутков времени и прочих видов токенов.
Типы токенов:
'd': Dilimiter, 'e': Period, 'n': Number, 'P': Punctuation, 'o': Other,
Из них в настоящее время поддерживаются: e, n, o
Остальные токены будут добавлены в ближайшее время.