data-pipeline

Here are 24 public repositories matching this topic...

Ashfaqbs / Microservices-Based-Wikimedia-Data-Processing-with-Kafka

Efficiently captures real-time Wikimedia data, like a newsroom for Wikipedia changes. Uses microservices, Kafka, and Spring Boot for reliability and scalability. Ideal for research and analysis.

kafka spring-boot microservice jpa java-8 data-pipeline

Updated Oct 12, 2023
Java

ghowkay / realtime-metrics-calculation

Star

Realtime metrics calculation pipeline using kafka, elasticsearch and kibana.

docker elasticsearch kibana docker-compose data-engineering data-pipeline kakfa

Updated Feb 16, 2024
Java

ProsperChuks / airbyte

Star

Airbyte is an open-source EL(T) platform that helps you replicate your data in your warehouses, lakes and databases.

data-engineering data-pipeline

Updated Oct 28, 2021
Java

rashmishrm / serverhealth

Star

This is Kafka-Elastic Search pipeline for storing and analyzing server health logs

java kafka data-analysis elastic-search data-pipeline

Updated Jul 18, 2017
Java

kwangjong / coinbase-real-time-data-pipeline

Star

A real-time cryptocurrency data streaming pipeline.

java docker kubernetes scala apache-spark grafana hdfs k8s apache-kafka apache-cassandra data-pipeline

Updated Jun 25, 2024
Java

cjannun / kafka-based-data-pipeline

Star

Cloud server data pipeline built with Apache Kafka and Java

java kafka apache-kafka kafka-streams data-pipeline

Updated Nov 5, 2022
Java

sanogotech / spring-boot-with-kafkalighttest

Star

KAFKA par la Pratique

kafka spring-boot data-pipeline

Updated May 18, 2022
Java

mujahidniaz / iot_device_streaming_pipeline_cloudera-kakfa-spark-hbase

Star

Real Time Data Streaming Pipeline

kafka spark impala cloudera hbase data-pipeline streaming-data data-ingestion streaming-pipeline iots

Updated Jan 9, 2020
Java

iShiBin / CS502Capstone

Star

CS502Capstone

scala spark cassandra prediction recommender-systems data-pipeline kafak

Updated Feb 18, 2018
Java

BrahianVT / Data-Pipeline

Star

Data-pipeline

mysql database restapi data-pipeline

Updated Jun 21, 2022
Java

JinsYin / datalink

Star

⚡ 数据集成 | DataLink is a lightweight data integration framework build on top of DataX, Spark and Flink

data streaming framework big-data spark integration pipeline etl bigdata batch data-integration data-collection flink cdc data-exchange data-synchronization data-pipeline datalink flink-cdc

Updated Jun 19, 2024
Java

colechristini / dataset-lib

Star

Data-processing and common libraries used in main project, all available under Apache 2.0

java data big-data java-8 data-processing data-pipeline

Updated Feb 27, 2019
Java

sushovankarmakar / kafka-spark-streaming

Star

An end to end data pipeline with Kafka Spark Streaming Integration

java kafka spark spark-streaming java-8 data-pipeline kafka-spark kafka-spark-streaming

Updated Jun 16, 2022
Java

mbrtargeting / camus

Star

LinkedIn's previous generation Kafka to HDFS pipeline.

kafka hadoop data-engineering hdfs data-pipeline

Updated Mar 12, 2019
Java

illuin-tech / data-pipeline

Star

Toolkit for describing data transformation pipelines by compositing simple reusable components.

java etl data-pipeline

Updated Jul 2, 2024
Java

apache / seatunnel-datasource-sdk

Star

SeaTunnel is a distributed, high-performance data integration platform for the synchronization and transformation of massive data (offline & real-time).

real-time offline high-performance apache data-integration sql-engine data-pipeline etl-framework seatunnel