Big data pipeline

This project is a big data pipeline designed to handle streaming stock market data. It consists of two main components: batch processing using Hadoop MapReduce and stream processing using Spark Streaming.

Usage

batch processing (Hadoop MapReduce)

calculate min and max of closing price on historical data

stream processing (Spark Streaming)

filtering high volume streaming stock market data and store it to cassandra
calculate daily range (high - low) and store to cassandra

Architecture

Demo

Screencast.from.10-05-23.23.51.35.webm

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.bsp		.bsp
.idea		.idea
project		project
src/main		src/main
.gitignore		.gitignore
README.md		README.md
architecture.png		architecture.png
architecture_old.png		architecture_old.png
build.sbt		build.sbt
mimic-stream.sh		mimic-stream.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.bsp

.bsp

.idea

.idea

project

project

src/main

src/main

.gitignore

.gitignore

README.md

README.md

architecture.png

architecture.png

architecture_old.png

architecture_old.png

build.sbt

build.sbt

mimic-stream.sh

mimic-stream.sh

Repository files navigation

Big data pipeline

Usage

batch processing (Hadoop MapReduce)

stream processing (Spark Streaming)

Architecture

Demo

About

Releases

Packages

Languages

Driramohamedfarouk/bigdata-stock-market-pipeline

Folders and files

Latest commit

History

Repository files navigation

Big data pipeline

Usage

batch processing (Hadoop MapReduce)

stream processing (Spark Streaming)

Architecture

Demo

About

Topics

Resources

Stars

Watchers

Forks

Languages