Этот репозиторий содержит конфигурацию для запуска Apache NiFi с помощью Docker Compose. NiFi используется для обработки данных, полученных с IoT-устройств, которые измеряют температуру. В рамках домашнего задания были выполнены преобразования данных из датасета Temperature Readings from IoT Devices.
- Вычислить 5 самых жарких и самых холодных дней за весну.
- Отфильтровать данные по условию
out/in = in. - Преобразовать поле
noted_dateв формат'yyyy-MM-dd'с типом данныхdate. - Очистить температуру по 5-му и 95-му процентилю.
nifi-files/: Директория для хранения файлов NiFi, монтируется в контейнер.docker-compose.yaml: Конфигурация Docker Compose для запуска NiFi.start.sh: Скрипт для запуска контейнера.stop.sh: Скрипт для остановки контейнера..gitignore: Файл для исключения ненужных файлов из Git.README.md: Описание проекта и инструкции по использованию.
- Установленный Docker и Docker Compose.
- Доступ к интернету для загрузки образа Apache NiFi.
-
Клонируйте репозиторий:
git clone https://github.com/ivanovra-study/DE_ETL.git cd DE_ETL -
Скачайте датасет: Датасет с показаниями температуры IoT-устройств можно скачать по ссылке:
Скачать датасетПосле скачивания поместите файлы датасета в директорию
nifi-files/. -
Запустите NiFi: Для запуска контейнера выполните:
./start.sh
NiFi будет доступен по адресу:
https://localhost:8443/nifiЛогин:
admin
Пароль:ctsBtRBKHRAx69EqUghvvgEvjnaLjFEB -
Остановите NiFi: Для остановки контейнера выполните:
./stop.sh