It is a terminal application to analyse words' frequency which are used in texts on websites. It is possible to download a page or several pages, if they are recorded in a text file. The result of the analysis can be found in terminal or in csv file which depends on given set of preconditions.
Programme needs language libraries, thus there are two steps in the installation process:
git clone git@github.com:smysloff/tfc-cli.git
Download zip-archive, then extract files in a preferable folder.
It is possible to use Russian and English dictionaries which can be installed in two ways:
-
Compile files using source code on official website
-
Download already compiled files from third-party server
It is obligatory to place binary files of dictionaries in the folder: src/Libs/phpmorphy/dicts/
Open the terminal in the project's root and launch the programme using file tfa.php
and PHP-interpritator.
Do not forget to provide an argument - address of the website or the file name where the list of websites' addresses put.
an address of the website as an argument:
php tfa.php example.com
a file with the list of websites' addresses as an argument:
php tfa.php in/urls.txt
If URL is provided as an argument, it is possible to specify the file where the result of analysis will be presented:
php tfa.php -i example.com -o test-out/output.csv
If file name is provided as an argument, it is possible to specify the folder where the result of analysis will be presented, in this case there will be a report for every website listed in the file:
php tfa.php in/urls.txt -o test-out
Use an argument -h
to get information about programme's work
php tfa.php -h
GNU General Public License v3.0
Консольная программа для анализа частотности слов, использованных в текстах на сайтах. Для анализа можно передавать как одну страницу, так и список страниц, записанных в текстовый файл. Результат анализа выводится либо в терминал, либо в csv-файл, в зависимости от заданных условий.
Для работы программы требуется наличие языковых библиотек. Поэтому процесс установки можно разделить на два этапа:
git clone git@github.com:smysloff/tfc-cli.git
Скачайте zip-архив и распакуйте в удобную для вас папку.
Программа работает с русскими и английскими словарями, получить которые можно двумя способами:
-
Скомпилировать из исходников с официального сайта
-
Скачать уже скомпилированные файлы со стороннего сервера
Разместить бинарные файлы словарей необходимо в директории: src/Libs/phpmorphy/dicts/
Для запуска программы следует открыть терминал в корне проекта и запустить при помощи PHP-интерпретатора файл tfa.php
,
передав в качестве аргумента адрес страницы сайта или название файла со списком адресов.
Передать на вход URL:
php tfa.php example.com
Передать на вход файл со списком URL
php tfa.php in/urls.txt
Если в качестве входного параметра указан URL, то можно указать в какой файл должен выводиться результат анализа
php tfa.php -i example.com -o test-out/output.csv
Если в качестве входного параметра указан файл, то можно указать директорию для выходных данных, в этом случае отчет по каждой странице будет сохранен в отдельном файле
php tfa.php in/urls.txt -o test-out
Для справки по работе программы, нужно указать аргумент -h
php tfa.php -h