apache-hadoop

Big Data Technologies can be defined as software tools for analyzing, processing, and extracting data from an extremely complex and large data set with which traditional management tools can never deal

apache-spark apache-kafka apache-hive apache-hadoop apache-hbase pysark

Updated Apr 30, 2022
Python

unobatbayar / big-data-processing

Star

Learning Apache Hadoop for Big Data. Moreover, exploring Map Reduce, Apache Spark RDD, Distributed Processing and Stream Processing

big-data map-reduce apache-hadoop

Updated May 27, 2020
Python

FayStatha / atds-project-NTUA-2021

Star

A project for Advanced Topics in Database Systems course of ECE, NTUA for fall semester of academic year 2020-2021.

apache-spark pyspark spark-sql apache-hadoop ntua-ece

Updated Mar 19, 2021
Python

VikentiosVitalis / advanced_topics_in_database_systems

Star

Data Science Project - for 'Advanced Topics in Database Systems' M.Sc. Course ECE @ntua

python data-science big-data apache-spark pyspark apache-hadoop

Updated Jan 17, 2024
Python

felidsche / movie-recommender

Star

A movie recommendation system built using Apache Spark’s ML library

apache-spark recommender-system spark-mllib apache-hadoop

Updated Apr 14, 2021
Python

hridayns / Big-Data-Apache-server-logs-analysis-using-Pig-and-Python

Star

Big Data – Apache server logs analysis using Pig and Python

python pig apache-pig logs-analysis apache-hadoop

Updated May 23, 2019
Python

on2e / ntua-atdb

Star

Advanced Topics in Databases course project - NTUA ECE - 2022-23

apache-spark pyspark spark-dataframes advanced-database apache-hadoop ntua-ece spark-rdd

Updated Mar 30, 2023
Python

Improve this page

Add a description, image, and links to the apache-hadoop topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the apache-hadoop topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

apache-hadoop

Here are 12 public repositories matching this topic...

kowaalczyk / spark-minimal-algorithms

mohammadtavakoli78 / Cloud-Computing

felidsche / mail-spam-filter

Abdelhakim-gh / BigData_Project

esakik / data-engineering-essentials

sawadogosalif / Big-Data-Technologies

unobatbayar / big-data-processing

FayStatha / atds-project-NTUA-2021

VikentiosVitalis / advanced_topics_in_database_systems

felidsche / movie-recommender

hridayns / Big-Data-Apache-server-logs-analysis-using-Pig-and-Python

on2e / ntua-atdb

Improve this page

Add this topic to your repo