#

pyspark

Here are 25 public repositories matching this topic...

logicalclocks / hopsworks

Hopsworks - Data-Intensive AI platform with a Feature Store

python aws data-science machine-learning serverless azure gcp ml pyspark feature-engineering governance model-serving mlops feature-store feature-management hopsworks kserve

Updated Jun 7, 2024
Java

apache / linkis

Apache Linkis builds a computation middleware layer to facilitate connection, governance and orchestration between the upper applications and the underlying data engines.

Updated Jun 5, 2024
Java

airscholar / SparkingFlow

This project demonstrates how to use Apache Airflow to submit jobs to Apache spark cluster in different programming laguages using Python, Scala and Java as an example.

java docker scala spark pyspark dataengineering apache-airflow

Updated Mar 14, 2024
Java

jelmerk / hnswlib

Java library for approximate nearest neighbors search using Hierarchical Navigable Small World graphs

java algorithm scala spark pyspark knn-search k-nearest-neighbors

Updated Jan 20, 2024
Java

Ayoub-etoullali / Activites-Pratiques-BigData

MapReduce Job Development, RDDs Programming, Medical Data Management, Sales Analysis, And Efficient Data Integration For Big Data Analysis. Spark: Big Data Processing, SQOOP Integration, And Spark Structured Streaming For Real-Time Data.

real-time spark apache-spark pyspark data-integration mapreduce real-time-data sqoop mapreduce-jobs sales-analysis spark-structured-streaming mapreduce-java real-time-database big-data-processing rdds sqoop-export sqoop-import big-data-analysis medical-data-management

Updated Jun 7, 2023
Java

bigData-architecturesStockages

no-aya / bigData-architecturesStockages

L'integralité des activités du module 2 semestre 4, filière II-BDCC sous l'encadrement de M. Bousselham Abdelmajid

big-data spark apache-spark hadoop pyspark mapreduce

Updated May 15, 2023
Java

charliecai00 / Tree-Versus-Income

Examining the Relationship Between Tree Quality and Socioeconomic Status in New York City

pyspark mapreduce-java

Updated May 8, 2023
Java

mahmoudparsian / data-algorithms-book

MapReduce, Spark, Java, and Scala for Data Algorithms Book

python java machine-learning scala apache-spark distributed-computing design-patterns pyspark mapreduce reducers partitioning hadoop-mapreduce distributed-algorithms mappers data-algorithms apache-hadoop

Updated Apr 21, 2023
Java

zli78122 / Guli_Online_Education

B2C Online Education Website, Development Model of Separation of Frontend and Backend, MVC Design Pattern, Course Recommendation System

aws microservice pyspark recommendation-system mapreduce

Updated Jun 29, 2022
Java

jamestiotio / dbsys

SUTD 2021 50.043 Database and Big Data Systems Code Dump

Updated May 17, 2022
Java

SotirisSotiriou / big-data-hadoop-spark

Assignment for UoM lesson "Big Data"

apache-spark hadoop pyspark hadoop-mapreduce pyspark-mllib

Updated May 7, 2022
Java

SparkMMS

niftimus / SparkMMS

Custom AEMO MMS Data Model CSV reader for Apache Spark

java spark pyspark mms electricity partitioning aemo datasourcev2

Updated Feb 26, 2022
Java

JKhan01 / kafka-spark-stream

The Project and workaround repository to generate a producer stream to kafka cluster, consume and then process it.

big-data apache-spark maven pyspark apache-kafka big-data-analytics

Updated Nov 4, 2021
Java

cevatarmutlu / spring-kafka-etl-api

spring-boot rest-api pyspark spring-kafka

Updated Oct 6, 2021
Java

acaorizondo / spark-code-examples

Example of using apache spark libraries to implement machine learning algorithms.

java machine-learning spark apache-spark pyspark

Updated Jan 8, 2021
Java

choyrim / sparkhacks-hadoop291

spark s3 workarounds for hadoop 2.9.1 (versions < 3.4)

spark s3 pyspark

Updated Nov 2, 2020
Java

anshul1004 / MutualFriends

Implementation of Hadoop and Spark

Updated May 11, 2020
Java

vks2106 / spark-custom

Spark examples.

spark hadoop pyspark sparksql

Updated May 21, 2019
Java

Chabane / spark-custom-datasource

apache-spark pyspark inputformat apache-arrow apache-hadoop

Updated Mar 25, 2019
Java

JonathanLoscalzo / catedra-big-data

Concepts and Applications of Big Data. Hadoop and Spark exercises

hadoop bigdata pyspark spark-streaming dataframe

Updated Dec 19, 2018
Java

Improve this page

Add a description, image, and links to the pyspark topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the pyspark topic, visit your repo's landing page and select "manage topics."