Репозиторий для кратких решений основных задач из DL
- Word2Vec - реализация модели Word2Vec в подходе Skip-Gram (из центрального слова предсказать контекст)
- BiLSTM_CRF - реализация сети со слоем CRF (+ small optimization) для задачи NER (новости) + инференс на ONNX
- Seq2Seq_with_Attention - задача машинного перевода (EN->RU) с механизмом внимания
- Transformer - задача машинного перевода (EN->RU) с обучением трансформера
- Style Transformer - перенос стиля через обученную сверточную сеть из репозитория
- SSD300 Detector - по мотивам семинаров Ozon Masters и источника SSD для детекции текста из датасета
- PixelCNN - реализация авторегрессионной генеративной модели PixelCNN на бинарном датасете MNIST
- VAE - реализация VAE на датасете MNIST
- RealNVP - реализация RealNVP на датасете MNIST
- WGAN-GP - WGAN with Gradient Penalty
- WGAN-SN - WGAN with Spectral Norm
- Cross Entropy Method discrete - реализация метода Кросс-Энтропии для среды Taxi-v3 с использованием сглаживания
- Cross Entropy Method continuous - реализация метода Кросс-Энтропии для среды LunarLander-v2
- Model Free - реализация методов Q-Learning, Sarsa, Monte-Carlo для среды CartPole-v1 с бинаризацией состояний среды
- Deep Q-Networks - реализация методов DQN, HardTargetDQN, SoftTargetDQN, DoubleDQN для среды LunarLander-v2
- PPO Acrobot - реализация метода PPO для среды Acrobot-v1
- PPO Pendulum - реализация метода PPO для среды Pendulum-v1
- SAC Pendulum - реализация метода Soft Actor-Critic для среды Pendulum-v1
- SAC CartPole - реализация метода Soft Actor-Critic для среды CartPole-v1