В этом репозитории находятся материалы (исходный код), которые могут "скрасить" жизнь дата инженера.
Структура
- airflow: полезные материалы для Apache Airflow (пока маловато, в процессе)
- data_doc: документирование данных и связанный код
- fileutils: код, помогающий в работе с файлами (данных)
- livy_tools: примеры использования Apache Livy совместно с Apache Airflow
- orc: материалы по формату ORC