Data & Machine Learning - The Boring Way

This tutorial walks you through setting up and building a Data Engineering & Machine Learning Platform. The tutorial is designed to explore many different technologies for the similar problems without any bias.

This is not a Production Ready Setup

Target Audience

Data Engineers, Machine Learning Engineer, Data Scientist, SRE, Infrastructure Engineer, Data Analysts, Data Analytics Engineer

Expected Technologies & Workflow

Data Engineering & Analytics

Monitoring & Observability

Grafana Setting Up Grafana for Monitoring components. Start with Monitoring Pods
FluentD logging metrics from pods & interact the same with Monitoring layer
Setting up a full Monitoring and Alerting Platform & integrate minitoring across other technologies
Setting up an Observability system

Machine Learning

Prerequisites

🐳 Docker Installed
kubectl Installed, The Kubernetes command-line tool, kubectl, allows you to run commands against Kubernetes clusters
Lens Installed, UI for Kubernetes.
This is optional, kubectl is enough for getting all relevant stats from kubernetes cluster
Helm The package manager for Kubernetes

Lab Basic Setup

Setting Up Kind
Deleting older Pods PodCleaner

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
.github		.github
dags		dags
docs		docs
examples/spark		examples/spark
helm-charts		helm-charts
helm_values		helm_values
pyspark_jobs		pyspark_jobs
rbac		rbac
.gitignore		.gitignore
.gitignore.save		.gitignore.save
Dockerfile.spark		Dockerfile.spark
README.md		README.md
ok.yml		ok.yml

abhishek-ch/data-machinelearning-the-boring-way

Folders and files

Latest commit

History

Repository files navigation

Data & Machine Learning - The Boring Way

Target Audience

Expected Technologies & Workflow

Data Engineering & Analytics

Monitoring & Observability

Machine Learning

Prerequisites

Lab Basic Setup

About

Topics

Resources

Stars

Watchers

Forks

Languages