map-reduce

Prosto is a data processing toolkit radically changing how data is processed by heavily relying on functions and operations with functions - an alternative to map-reduce and join-groupby

python workflow data-science spark pandas map-reduce business-intelligence olap data-wrangling data-preprocessing feature-engineering data-processing data-preparation

Updated Nov 21, 2021
Python

NupurShukla / Market-Basket-Analysis

Star

data-mining spark map-reduce movielens-dataset apriori-algorithm apriori-son inf553

Updated Aug 15, 2018
Python

asuiu / streamerate

Star

Iterable Java8 style Streams for Python

python streaming python3 java-streams map-reduce mapreduce python-streaming python-multiprocessing python-itertools python-multithreading python-iterables python-mapreduce

Updated Oct 30, 2024
Python

terodea / CS-BigData

Star

Learn Big Data tools/ framework by doing examples, POC, per projects.

java airflow scala kafka big-data spark hive hadoop bigdata hbase python3 map-reduce sqoop case-study hadoop-mapreduce

Updated Jul 29, 2022
Python

MandarGogate / Association-Rule-Mining-Hadoop-Python

Star

A case study on mining association rules between different factors related to deaths of people in the United States

python data-science machine-learning data-mining hadoop mining map-reduce mapreduce association-rules hadoop-mapreduce hadoop-streaming

Updated Jun 24, 2017
Python

klaxa / dist-enc

Star

Distributed encoding, second generation.

rest-api distributed-computing map-reduce ffmpeg-wrapper matroska video-encoding

Updated Aug 4, 2020
Python

SwastikUdupa / TF-IDF-hadoop

Star

This is a TF-IDF calculator for shakespearean play dataset

python3 map-reduce tf-idf hadoop-filesystem shakespeare-plays hadoop-hdfs

Updated Nov 15, 2017
Python

Drapegnik / bsuir

Star

🎓Repository for masters labs on FCSN, BSUIR

machine-learning tcp aws-lambda study dsp oop blockchain uml map-reduce bsuir labs neural-networks plc hyperledger hyperledger-fabric digital-signal-processing tcp-chat traffic-light bsuir-labworks

Updated Jan 7, 2023
Python

ActiveState / recipe-577676-dirt-simple-mapreduce

Star

Dirt simple map/reduce

learning recipes snippets learning-python map-reduce learning-by-doing

Updated Nov 8, 2019
Python

natelalor / AI_report_generator

Star

A tool that converts long audio files into a thorough, summarized report. Leverages OpenAI and its API (ChatGPT backend), Langchain for text processing, and Pinecone for vector database facilitation.