base_deep_learning

Репозиторий для кратких решений основных задач из DL

Audio

Word2Vec - реализация модели Word2Vec в подходе Skip-Gram (из центрального слова предсказать контекст)
BiLSTM_CRF - реализация сети со слоем CRF (+ small optimization) для задачи NER (новости) + инференс на ONNX
Seq2Seq_with_Attention - задача машинного перевода (EN->RU) с механизмом внимания
Transformer - задача машинного перевода (EN->RU) с обучением трансформера

Style Transformer - перенос стиля через обученную сверточную сеть из репозитория
SSD300 Detector - по мотивам семинаров Ozon Masters и источника SSD для детекции текста из датасета

PixelCNN - реализация авторегрессионной генеративной модели PixelCNN на бинарном датасете MNIST
VAE - реализация VAE на датасете MNIST
RealNVP - реализация RealNVP на датасете MNIST
WGAN-GP - WGAN with Gradient Penalty
WGAN-SN - WGAN with Spectral Norm

Cross Entropy Method discrete - реализация метода Кросс-Энтропии для среды Taxi-v3 с использованием сглаживания
Cross Entropy Method continuous - реализация метода Кросс-Энтропии для среды LunarLander-v2
Model Free - реализация методов Q-Learning, Sarsa, Monte-Carlo для среды CartPole-v1 с бинаризацией состояний среды
Deep Q-Networks - реализация методов DQN, HardTargetDQN, SoftTargetDQN, DoubleDQN для среды LunarLander-v2
PPO Acrobot - реализация метода PPO для среды Acrobot-v1
PPO Pendulum - реализация метода PPO для среды Pendulum-v1
SAC Pendulum - реализация метода Soft Actor-Critic для среды Pendulum-v1
SAC CartPole - реализация метода Soft Actor-Critic для среды CartPole-v1

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
Audio		Audio
CV		CV
Generative Models		Generative Models
NLP		NLP
RL		RL
README.md		README.md