Statistics and Machine Learning Blogs

The objective of this compilation is to bring together a variety of resources that provide straightforward and accessible explanations of fundamental principles in statistics and machine learning.

Defintions

Probability

Set theory
Venn Diagrams
Probability Axioms
pdf,cdf,ppt
Quantiles
Experiment, Sample space, Event, Probability function, Random variable
Properties of cdf and pdf
Transformations of Random Variables
Joint Probability Distribution
Expected Values, Properties of Expected Value
Variance Values, Properties of Variance
Bayes Rule

Probability Distributions

Univariate distributions
Bernoulli distribution
Binomial distribution
Continous Uniform Distribution
Poission distribution
Exponential distribution

Statistics

Multiple Hypothesis Testing

F-Test

F-distribution
General Linear F-test
Calculating F-Statistic
Coding Systems For Categorical Variables

ANOVA

What is ANOVA
One Way Anova
ANOVA mathematical model
ANOVA Assumptions
Linear Combinations and Contrasts
Fixed Effect, Random Effect and Mixed Effect models
Factorial and Unbalanced ANOVA
ANCOVA

Multiple Comparision Problem

Multiple Comparison Problem
Bonferroni’s Correction
Holm’s Step-Down and Hochberg’s Step-Up Procedure
Studentized range distribution
Turkey's Range Test

Multivariate Hypothesis Testing

MANOVA
PCA
Factor Analysis
Canonical Analysis

Structure Equation Modeling

Basics
Tutorial

Statistical Paradoxes

Monty Hall
Russels Paradox

Bayesian Statistics

Bayesian Learning
A/B testing, Bayesian
Hierarchical Modeling

Bayesian Samplers

Rejection Sampling
Importance Sampling
Inverse Transform Sampling
The Metropolis-hasting algorithm and also
Gibbs Sampling
Gibbs Sampling as a Special Case of Metropolis–Hastings

Causal Inference

Structural Causal Models
Chains, and Forks
Colliders
d-separation
Model Testing and Causal Search
Interventions
The Adjustment Formula
Backdoor Criterion
Front-door Criterion

Gaussian Process
Bootstrapping

Machine Learning

Decision Trees

Decision Trees
ID3, C4.5, C5.0, CART decision tree difference
C4.5 and C5.0 Algorithm
ID3 Algorithm
Pruning
Gini Impurity, Entropy, Classification Error

Expectation Maximization (Kmeans, and GMM)

K-means clustering
Gaussian Mixture Modeling

Support Vector Machines

Support Vector Machine
SVM vs logisitic regression

Ensemble Methods

Ensemble methods: bagging, boosting and stacking
Adaboost
Gradient Boosting

Explanation Methods

Lime
Shapley and Shap
Counterfactual Explanations
Global Surrogate

Time Series Modeling

Arima
Sarima, Sarimax
Prophet
Forecasting: Principles and Practice

Anomality Detection

General Introduction
Isolation Forest
One Class SVM
Local Outlier Factor
Robust Covariance Estimator

Data

Data Cleaning
Imbalanced datasets
Data Set Shift
Covariate Shift

Data Splitting

The Importance of Data Splitting
Training, Development and Test errors

Deep Learning

My sides on Convolutional Neural Networks
My sides on Sequence Modles

Transformers

Mechanics of Seq2seq Models With Attention
The illustrated transformer
Line-by-line implementation of “Attention is All You Need”
Illustrated GPT-2
Decoding Strategies

Name		Name	Last commit message	Last commit date
Latest commit History 255 Commits
LICENSE		LICENSE
README.md		README.md

License

RoozbehSanaei/Stat-and-ML-Blogs

Folders and files

Latest commit

History

LICENSE

LICENSE

README.md

README.md

Repository files navigation

Statistics and Machine Learning Blogs

Probability

Probability Distributions

Statistics

General Concepts

Correlation

Estimators

Hypothesis Testing

Z-test

t-rest

Chi-square test

Non-Paramteric Tests

Linear Regression

Multi Linear Regression

Bias-Variance

Multiple Hypothesis Testing

F-Test

ANOVA

Multiple Comparision Problem

Multivariate Hypothesis Testing

Structure Equation Modeling

Statistical Paradoxes

Bayesian Statistics

Bayesian Samplers

Causal Inference

Machine Learning

Decision Trees

Expectation Maximization (Kmeans, and GMM)

Support Vector Machines

Ensemble Methods

Explanation Methods

Time Series Modeling

Anomality Detection

Data

Data Splitting

Deep Learning

Transformers

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Packages