Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Предварительная токенизация слов #83

Closed
qertis opened this issue Jan 19, 2019 · 7 comments
Closed

Предварительная токенизация слов #83

qertis opened this issue Jan 19, 2019 · 7 comments
Assignees

Comments

@qertis
Copy link
Member

qertis commented Jan 19, 2019

Взять за основу
https://github.com/spencermountain/compromise

@qertis qertis self-assigned this Jan 19, 2019
@qertis
Copy link
Member Author

qertis commented Jan 23, 2019

с этим должна повыситься точность, также можно будет распределять одно предложение на несколько действий

например, пользователь пишет:

сегодня пошел и купил сыра на 100 граммов

предложение нужно будет перепрочитать по умному:

когда? - сегодня - получаем абстрактное время от пользователя, которое нужно перевести в более точное.
что сделал? - купил сыра -> говорим что произошло действие "покупка", ищутся все предыдущие связи для актуализации этой покупке (место, время, валюта, ищется стоимость, кому была отправлена транзакция, из каких ресурсов)
купил что? сыр - 100 грамм -> из БД продуктов ищется сыр 100 грамм и прикрепляется ссылка

@qertis
Copy link
Member Author

qertis commented Mar 13, 2019

Нужна библиотека которая будет детектировать имена людей

@qertis
Copy link
Member Author

qertis commented Mar 13, 2019

поставил compromise

@qertis qertis added this to the Разбор слов milestone Mar 23, 2019
@qertis
Copy link
Member Author

qertis commented Apr 13, 2019

вот еще - https://github.com/deNULL/Az.js

@qertis
Copy link
Member Author

qertis commented Apr 13, 2019

нужно обрабатывать ссылки на сервере и на клиенте выдается уже нормализованный вид текста (html)

@qertis
Copy link
Member Author

qertis commented Jun 27, 2019

связано с #84

@qertis
Copy link
Member Author

qertis commented Jul 7, 2019

токенизация делается через google language

      const { tokens } = await languageService.annotateText(this.#spelledText, this.language[0]);

@qertis qertis closed this as completed Jul 7, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Development

No branches or pull requests

1 participant