- Добавить второй GPU, тогда модель Seq2Seq на PyTorch будет работать в десятки раз быстрее.
- Архитектура легко масштабируется горизонтально. Можно добавлять tf-serving воркеры и балансировать трафик между ними, например, через HAProxy или Envoy. Также легко масштабируются и aiohttp воркеры.
- Заменить HTTP на gRPC между tf-serving воркерами и воркерами aiohttp. Это позволит ускорить передачу изображений.
- Роутить сообщения между aiohttp воркерами и бекендом с помощью быстрой очереди, например, ZeroMQ.
- Перевести модель PyTorch в Tensorflow с помощью ONNX и хостить её на быстром tf-serving.
- Вертикальное масштабирование. Добавить больше GPU, CPU и тд.
-
Notifications
You must be signed in to change notification settings - Fork 0
yutkin/Machine-Learning-VK-bot
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published