Skip to content

NameArtem/hadoop-spark-standalone-docker

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Apache Hadoop and Spark Standalone Cluster on Docker

Доступ к сборкам

Сборка кластера Apache Spark и Apache Hadoop для курсов Анализ Больших данных. Кластер Apache Spark предоставляет доступ к JupyterLab в качестве интерфеса.

Для обучения Apache Spark на языках программирования Scala, Python (PySpark) и R (SparkR) .

!!! Максимально просто, в 3 шага: git clone, docker-compose up, использовать!

Пример JupyterLab с Apache Spark:

Docker установка

Версии в сборках

  • Инфраструктура кластера
Component Version
Docker Engine 1.13.0+
Docker Compose 1.10.0+
  • Jupyter Kernels и языки программирования
Spark Hadoop Scala Scala Kernel Python Python Kernel R R Kernel
3.x 3.2 2.12.10 0.10.9 3.7.3 7.19.0 3.5.2 1.1.1
2.x 2.7 2.11.12 0.6.0 3.7.3 7.19.0 3.5.2 1.1.1
  • Приложения
Component Version Docker Tag
Apache Spark 2.4.0 | 2.4.4 | 3.0.0 <spark-version>
JupyterLab 2.1.4 | 3.0.0 <jupyterlab-version>-spark-<spark-version>

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published