Machine Learning Papers and best sources to learn topics

Aggregators

https://42papers.com/
https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap - roadmap for NN from basis to advance
https://paperswithcode.com/ - papers with code
https://andlukyane.com/blog/ - review of modern papers
https://farid.one/kaggle-solutions/ - top kaggle solutions
https://emacsway.github.io/ru/self-learning-for-software-engineer - #offtop computer science roadmap
https://www.arxiv-vanity.com/ - convert arxiv papers to html with click references and ability to translate via browser
http://jalammar.github.io - best visualisations and explanation for papers
https://lena-voita.github.io/nlp_course.html - excelent NLP course pages
http://nlpprogress.com/ - SOTA rank results for every NLP task

Deep learning

NLP

Word2Vec, 2013
Negative Sampling, Hierarchical Softmax in Word2Vec, 2013
FastText, 2016
Clear explanation FastText
BERT, 2018
SummaRuNNer - text summarization
P-tuning - train embeddings for prompt tokens and freeze main LLM params to solve specific tasks

Computer vision

Segmentation

Image Segmentation Using Deep Learning: A Survey

Detection

Object Detection in 20 Years: A Survey
SSD - best tutorial

GAN

Common

RNN

The Unreasonable Effectiveness of Recurrent Neural Networks
Neural Machine Translation by Jointly Learning to Align and Translate - attention in machine translating with RNN

RL

Deep Reinforcement Learning: Pong from Pixels - policy function algorithm
*Playing Atari with Deep Reinforcement Learning - Q-function algorithm

Distilation knowledge

Common

Batchnorm explanation - main idea for cv: norm over minibatch for each filter
Layernorm explanation - main idea for cv: norm over ONE sample in minibatch for each filter
Guide for learning rate schedulers
A Recipe for Training Neural Networks - tricks and guide for coding DL|ML
Deep Double Descent: Where Bigger Models and More Data Hurt
Auto-Encoding Variational Bayes (VAE)
VAE notes - excelent explanation for VAE in russian

Transformers

Attention Is All You Need - transformer
Explanation of "Attention Is All You Need" - best explanation of paper
*A Survey of Transformers
*GPT-3

Recommender systems

MF

Collaborative Filtering for Implicit Feedback Datasets - SGD, MSE, implicit, clean dataset, explain recommendations
ALS distributed, notes
Bayesian Personalized Ranking from Implicit Feedback - LearnBPR, MF, bayes optimizing ranking function
WSABIE: Scaling Up To Large Vocabulary Image Annotation - smart pairwise sampling, optimizing ranking function
*Factorization Machine

Improving recommendations

Using deep learning

Monolith: Real Time Recommendation System With Collisionless Embedding Table - tik-tok online learning, cucko hash encoding
Deep Neural Networks for YouTube Recommendations
BERT4Rec
SAS4Rec

Statistics - A/B

Trustworthy Online Controlled Experiments - A Practical Guide to A/B Testing
Practitioner’s Guide to Statistical Tests - tests for proportion, pitfalls
Possion bootstrap
*Delta Method
Hypo testing bootstrap
CUPED at A/B. Paper
CUPED, X5 simulations
Linearization at A/B
Overlapping Experiment Infrastructure: More, Better, Faster Experimentation - several experiments for one user at once

Web search

Multi-intent

Embedding search

Embedding-based Retrieval in Facebook Search - embedding search
Que2Search - improving Embedding-based Retrieval in Facebook Search with bert model

Personalization

Real-time Personalization using Embeddings for Search Ranking at Airbnb (Airbnb 2018)
Personalized Transformer-based Ranking for e-Commerce at Yandex
Real-Time Personalized Ranking in E-commerce Search - 3 types of features, Kendall-Tau measuring personalization

Click

Can clicks be both labels and features? Unbiased Behavior Feature Collection and Uncertainty-aware Learning to Rank

Uplift

Pricing

*Pricing Promotional Products Under Upselling

Advertising

Practical Lessons from Predicting Clicks on Ads at Facebook - downsampling, features from GBM for LogReg, data freshness
Smart Pacing for Effective Online Ad Campaign Optimization

GradientBoosting

Metrics

F1-score, ROC_AUC, PR-AUC, comparison, prons and cons
NDCG
MRR - Mean_reciprocal_rank

TimeSeries

Kats - time series library (better than prophet)

ANN

Product quantization

Name		Name	Last commit message	Last commit date
Latest commit History 122 Commits
marked_articles		marked_articles
README.md		README.md
Relationships-between-the-Dice-similarity-coefficient-DSC-Jaccard-similarity.png		Relationships-between-the-Dice-similarity-coefficient-DSC-Jaccard-similarity.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Machine Learning Papers and best sources to learn topics

Aggregators

Deep learning

NLP

Computer vision

Segmentation

Detection

GAN

Common

RNN

RL

Distilation knowledge

Common

Transformers

Recommender systems

MF

Improving recommendations

Using deep learning

Statistics - A/B

Web search

Multi-intent

Embedding search

Personalization

Click

Uplift

Pricing

Advertising

GradientBoosting

Metrics

TimeSeries

ANN

About

Releases

Packages

iptkachev/papers

Folders and files

Latest commit

History

Repository files navigation

Machine Learning Papers and best sources to learn topics

Aggregators

Deep learning

NLP

Computer vision

Segmentation

Detection

GAN

Common

RNN

RL

Distilation knowledge

Common

Transformers

Recommender systems

MF

Improving recommendations

Using deep learning

Statistics - A/B

Web search

Multi-intent

Embedding search

Personalization

Click

Uplift

Pricing

Advertising

GradientBoosting

Metrics

TimeSeries

ANN

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages