Skip to content

slavkaa/ukraine_dictionary

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Словник слів українською

Слова, словоформи, морфологічні данні, посилання на приклади вживання; у планах: тлумачення, синоніми, антоніми.

База створюється для полегшення роботи програмістів, якім потрібно мати достовірну, актуальну базу слів української мови. Наприклад, для створення ігор зі словами: гра Шибениця, ШІ для гри Єрудит, данні для ігор на складання слів з літер, на пошук слів серед літер, для сриптів автоматизованого складання кросвордів.

Ліцензія

Дозволяється, безоплатно, будь-якій особі, що отримала копію цього програмного забезпечення та супутньої документації (надалі Продукт), використовувати Продукт без обмежень, зокрема без обмежень, прав на використання, копіювання, змінювання, доповнення, публікацію, поширення, субліцензування та / або продаж (змінених та оброблених) копій Продукта, також як і особам, яким надається цей Продукт, за дотримання наступних умов: Вищезгадані авторські права та ці умови мають бути включені в усі копії або значущі частини нового Продукту Дійсне програмне забезпечення надається «як є», без гарантій будь-якого виду, прямих або непрямих, включаючи, але не обмежуючись, гарантіями комерційної вигоди, відповідності його конкретному призначенню й відсутності порушення прав. У жодному разі автори або власники авторських прав не відповідають за будь-якими судовими позовами, щодо збитків або інших претензій, чи дій договору, цивільного правопорушення або інших, що виникають поза, або у зв'язку з програмним забезпеченням або використанням чи іншими діями програмного забезпечення. https://uk.wikipedia.org/wiki/%D0%9B%D1%96%D1%86%D0%B5%D0%BD%D0%B7%D1%96%D1%8F_MIT https://opensource.org/licenses/MIT

Поточний стан

  • Версія v.10.
  • 29 897 слів у 405 363 словоформах (відмінки, роди, часи ...).

Для порівняння: Український орфографічний словник містить приблизно 175 000 слів (уклали В. В. Чумак [та ін.]; за ред. В. Г. Скляренка. — Вид. 9-е, переробл. і доповн. — Київ: Дніпро, 2009. — 1011 с. — «Словники України». — ISBN 978-966-507-260-7).

Для кожного слова вказана частина мови і характеристики притаманні цій частині мови. Слова об'єднані так, шоб можна було легко знайти всі форми слова з їх характеристиками. Також вказані тексти, в яких кожне слово було знайдене.

Дякую відкритим бібліотекам, за тексти класичних українських творів:

  • ukrlib.com.ua
  • onlyart.org.ua
  • taras-shevchenko.com.ua
  • taras-shevchenko.in.ua
  • t-shevchenko.name
  • ua-lib.ru

Дякую онлайн словнику, за джерело данних про словоформи і морфологічні ознаки слів:

  • slovnyk.ua

Документація

Опист структури бази данних (БД) у WIKI проекту.

Історія змін

Плани на майбутнє

Данна база вирізняється тим, що буде будуватися на основі лексики знайденої в літературних і побутових текстах.

В планах:

  • обробити твори Шевченка
  • обробити твори Гончара
  • додати тлумачення до кожного слова
  • додати таблицю з частотами вживання слова у кожному конкретному тесті, і в усіх тестах загалом
  • Додати посилання на синоніми і антоніми між словарними статтями
  • виокремити слова пові'язані з календарем: дні тиждня, місяці
  • виокремити назви всіх країн світу
  • виокремити словник імен
  • виокремити словник міст
  • виокремити словник географічних топонімів взагалі
  • виокремити словник назв живності
  • виокремити словник назв музичних інструментів
  • виокремити словник назв професій

Контанки

ukr_dictionary@ukr.net

About

Словник слів українською (слова, словоформи, синтаксичні данні, літературні джерела)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published