-
Notifications
You must be signed in to change notification settings - Fork 13
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Q: сам/самий #9
Comments
VS: Це дуже слизьке місце. Найкраще було б оптимізувати в словнику, скажімо, об'єднати це в одну лему з широкою й великою парадигмою — але щоб лема була одна! Ну або одна лема "самий" з великою парадигмою і окремо форми сам v_naz/v_zna. Я довго думав, як би це краще зробити, але обидва варіанти спрощення муляють. |
VS: я теж не до кінця певний щодо саме цього випадку, але вже утвердився в думці, що таке об'єднання — менше зло, ніж витрата купи часу на розмежування цих омонімів. Адже нам треба спершу вручну вибрати в кожному випадку правильний варіант, а потім натренувати модель, яка сама розрізнятиме. І саме в цьому випадку буде складно і людині, а модель взагалі робитиме купу помилок, бо контексти дууууже подібні, а відтак тягнутиме донизу загальну точність тегування. Якщо об'єднати, то все буде просто й однозначно. |
ВЕСУМ:
Теоретично критерії досить чіткі:
Тобто «на самому велотреці було людно» - тут са́мому не звучить, і можна сказати «на сам велотрек я приїхав» схоже «само́му» і лема «сам». Але якщо дивитися на фразу «на самому початку» то є сумніви, бо:
The text was updated successfully, but these errors were encountered: