Данное программное решение предназначено для анализа частоты встречаемости слов в текстах на русском языке. Решение поддерживает объединение различных форм одного слова при помощи лемматизации (т. е. приведения к единой грамматической основе), а также обладает функциональностью черного списка для исключения слов из результатов анализа. Предлагаемый по умолчанию черный список осуществляет исключение предлогов, местоимений и других служебных слов. Пользователю также предлагается возможность редактирования черного списка.
В программном решении используются элементы Solarix SDK, в частности, база данных слов (словарь) и некоторые алгоритмы обработки текста.
Скомпилированная версия программного решения доступна по ссылке: https://drive.google.com/open?id=1ZFj4SaCDRgda-CLDX9wnCZ4l6mOFKB2j
- введена концепция рабочих пространств; возможность их сохранения и загрузки;
- введена возможность редактирования черного списка для каждого уникального рабочего пространства;
- черный список и другие настройки выведены на главную форму;
- исправлен баг некорректного сохранения *.csv-файла;
- исправлены некоторые другие баги.