Задание 1. Контейнеры, IO потоки, классы Object и String.

Условия

Написать программу, которая будет принимать в качестве аргумента имя текстового файла, и выводить CSV файл с колонками:

Слово.
Частота.
Частота (в %).

CSV файл должен быть упорядочен по убыванию частоты, то есть самые частые слова должны идти в начале. Разделителями слов считать все символы, кроме букв и цифр.

Методические указания:

Использовать класс java.lang.StringBuilder для построения слов.
Для чтения из файла удобно использовать java.io.InputStreamReader, например:

Reader reader = null;
try
{
    reader = new InputStreamReader(new FileInputStream("FILE NAME"));
    // read the data here
}
catch (IOException e)
{
    System.err.println("Error while reading file: " + e.getLocalizedMessage());
}
finally
{
    if (null != reader)
    {
        try
        {
            reader.close();
        }
        catch (IOException e)
        {
            e.printStackTrace(System.err);
        }
    }
}

Для определения класса символа использовать метод Character.isLetterOrDigit.
Для хранения статистики в памяти можно использовать одну из реализаций интерфейса java.util.Set, который должен будет хранить объекты специального класса. Данный класс должен содержать слово и счётчик. В случае использования java.util.HashSet класс также должен реализовать методы equals, hashCode.

Теоретические сведения:

Контейнеры стандартной библиотеки расположены в пакете java.util. IO классы (потоки ввода-вывода) располагаются в пакете java.io. Основные интерфейсы:

Set – множество без дубликатов и без доступа по индексу.
Map – множество пар ключ-значение, где ключи не повторяются.

Их основные реализации:

HashMap, HashSet — реализации на основе функции hashCode.
TreeMap, TreeSet – реализация на основе бинарного дерева. Ключи (элементы) должны реализовывать интерфейс Comporable, иначе необходимо передавать в контейнер при его создании объект, реализующий интерфейс Comparator. Хранимые в данных контейнерах данные упорядочены. Лучшее время поиска, но большее накладные расходы на вставку, чем на основе функции hashCode.

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
.github/workflows		.github/workflows
demo		demo
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Задание 1. Контейнеры, IO потоки, классы Object и String.

Условия

Методические указания:

Теоретические сведения:

About

Releases

Packages

Languages

License

ptrvsrg/word-stat-collector

Folders and files

Latest commit

History

Repository files navigation

Задание 1. Контейнеры, IO потоки, классы Object и String.

Условия

Методические указания:

Теоретические сведения:

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages