apache-hadoop

Big Data Technologies can be defined as software tools for analyzing, processing, and extracting data from an extremely complex and large data set with which traditional management tools can never deal

apache-spark apache-kafka apache-hive apache-hadoop apache-hbase pysark

Updated Apr 30, 2022
Python

felidsche / movie-recommender

Star

A movie recommendation system built using Apache Spark’s ML library

apache-spark recommender-system spark-mllib apache-hadoop

Updated Apr 14, 2021
Python

felidsche / mail-spam-filter

Star

An email spam filter using Apache Spark’s ML library

apache-spark spark-ml apache-hadoop

Updated Apr 14, 2021
Python

FayStatha / atds-project-NTUA-2021

Star

A project for Advanced Topics in Database Systems course of ECE, NTUA for fall semester of academic year 2020-2021.

apache-spark pyspark spark-sql apache-hadoop ntua-ece

Updated Mar 19, 2021
Python

kowaalczyk / spark-minimal-algorithms

Star

An python implementation of Minimal Mapreduce Algorithms for Apache Spark

python spark apache-spark algorithms python3 pyspark hadoop-mapreduce apache-hadoop minimal-algorithms

Updated Jun 22, 2020
Python

unobatbayar / big-data-processing

Star

Learning Apache Hadoop for Big Data. Moreover, exploring Map Reduce, Apache Spark RDD, Distributed Processing and Stream Processing

big-data map-reduce apache-hadoop

Updated May 27, 2020
Python

hridayns / Big-Data-Apache-server-logs-analysis-using-Pig-and-Python

Star

Big Data – Apache server logs analysis using Pig and Python

python pig apache-pig logs-analysis apache-hadoop

Updated May 23, 2019
Python

Improve this page

Add a description, image, and links to the apache-hadoop topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the apache-hadoop topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

apache-hadoop

Here are 12 public repositories matching this topic...

Abdelhakim-gh / BigData_Project

VikentiosVitalis / advanced_topics_in_database_systems

on2e / ntua-atdb

esakik / data-engineering-essentials

mohammadtavakoli78 / Cloud-Computing

sawadogosalif / Big-Data-Technologies

felidsche / movie-recommender

felidsche / mail-spam-filter

FayStatha / atds-project-NTUA-2021

kowaalczyk / spark-minimal-algorithms

unobatbayar / big-data-processing

hridayns / Big-Data-Apache-server-logs-analysis-using-Pig-and-Python

Improve this page

Add this topic to your repo