YBIGTA SPARK DOCKER IMAGE

소개

와이빅타 엔지니어링 팀에서 사용하는 spark를 위한 도커 이미지 입니다.
참고

특징

~~아나콘다 3.5.2~~
자바 openjdk 8
하둡 2.9
스파크 2.4.3
pyspark
하이브 2.3.3
분산 처리가 아닌 로컬로 실행
ybigta 엔지니어링 위키를 기본으로 생성하였습니다.

사용법

1. 인스턴스 만들기

생략

2. 레포 다운로드

git clone https://github.com/xodhx4/ybigta_pyspark_docker.git

3. 도커 다운로드

repo 안으로 이동한다.
docker_install.sh를 실행한다.
sh docker_install.sh
다시 로그인 할 때부터는 sudo를 안붙여도 도커 실행 가능

이미지 다운로드

repo안으로 이동한다.

docker image 생성

docker build --tag IMAGE_NAME_YOUWANT:VERSION_YOUWANT .
#예시
docker build --tag hello:1.0 .

컨테이너 생성 및 실행

docker run -it --name MYCONTAINER -p 10001:10001 -v ~/workspace:/root/workspace hello:1.0
# 이름이 MYCONTAINER, host의 10001번과 container의 10001번 포트를 연결
# host의 ~/workspace 폴더와 container의 /root/workspace 폴더를 연결
# hadoop, hive, spark 까지 자동 실행 되므로
# https://{ec2 ip}:10001 에 접속

컨테이너 중지

# pyspark를 종료 한 후
kill $(ps -ef | grep hive | awk '{print $2}')
# hive 종료
$HADOOP_HOME/sbin/stop-yarn.sh
$HADOOP_HOME/sbin/stop-dfs.sh

exit

컨테이너 중지하지 않고 bash 만 빠져나가고 싶을 때

ctrl + p + q

컨테이너 재실행

docker start MYCONTAINER
docker attach MYCONTAINER

주피터 노트북 비밀번호 설정

jupyter_init.sh 파일에서

jupyter notebook password << END
admin # 이 두 개 부분을 원하는 비밀 번호로 바꾸신 후
admin # 이미지를 새로 build 해주세요
END

Name		Name	Last commit message	Last commit date
Latest commit History 70 Commits
.gitignore		.gitignore
.travis.yml		.travis.yml
Dockerfile		Dockerfile
README.md		README.md
core-site.xml		core-site.xml
docker_install.sh		docker_install.sh
hadoop-env.sh		hadoop-env.sh
hdfs-site.xml		hdfs-site.xml
hive-env.sh		hive-env.sh
hive-site.xml		hive-site.xml
hive_init.sh		hive_init.sh
jupyter_init.sh		jupyter_init.sh
jupyter_notebook_config.py		jupyter_notebook_config.py
mapred-site.xml		mapred-site.xml
spark-env.sh		spark-env.sh
ssh_init.sh		ssh_init.sh
start.sh		start.sh
yarn-site.xml		yarn-site.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

YBIGTA SPARK DOCKER IMAGE

소개

특징

사용법

1. 인스턴스 만들기

2. 레포 다운로드

3. 도커 다운로드

이미지 다운로드

컨테이너 생성 및 실행

컨테이너 중지

컨테이너 중지하지 않고 bash 만 빠져나가고 싶을 때

컨테이너 재실행

주피터 노트북 비밀번호 설정

About

Releases

Packages

Languages

xodhx4/ybigta_pyspark_docker

Folders and files

Latest commit

History

Repository files navigation

YBIGTA SPARK DOCKER IMAGE

소개

특징

사용법

1. 인스턴스 만들기

2. 레포 다운로드

3. 도커 다운로드

이미지 다운로드

컨테이너 생성 및 실행

컨테이너 중지

컨테이너 중지하지 않고 bash 만 빠져나가고 싶을 때

컨테이너 재실행

주피터 노트북 비밀번호 설정

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages