<img src='https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/diagrams/dl_frameworks.drawio.png'/>

# Параллельные вычисления

## CUDA

CUDA (**Compute Unified Device Architecture**) — **программно-аппаратная архитектура параллельных вычислений**, которая позволяет существенно увеличить вычислительную производительность благодаря использованию графических процессоров фирмы **Nvidia**.

CUDA SDK позволяет программистам реализовывать на специальных упрощённых диалектах языков программирования **C, C++ и Фортран** алгоритмы, выполнимые на **графических и тензорных процессорах Nvidia**.

Функции, ускоренные при помощи CUDA, можно вызывать из различных языков, в том числе **Python**, **MATLAB** и т. п.

- CUDA API основан на стандартном **яыке программирования C** некоторыми ограничениями. По мнению разработчиков, это должно упростить и сгладить процесс изучения архитектуры CUDA.
- **Разделяемая между потоками память (shared memory)**.
- Более **эфективные транзакции между памятью ЦП и видеопамятью**.
- Полная **аппаратная поддержка целочисленных и побитовых операций**.
- Поддержка **компиляции кода GPU** средствами открытого проекта **LLVM (Low Level Virtual Machine)** — проект программной инфраструктуры для создания компиляторов и сопутствующих им утилит. Написан на C++, обеспечивает оптимизации на этапах компиляции, компоновки и исполнения.
- Все функции, выполнимые на устройстве, **не поддерживают рекурсии** (в версии CUDA Toolkit 3.1 поддерживает указатели и рекурсию) и имеют некоторые другие ограничения.

## OpenCL

OpenCL (Open Computing Language) — фреймворк для написания компьютерных программ, связанных с параллельными вычислениями на различных **графических и центральных процессорах, а также FPGA**. Автор — **Apple**.

- В OpenCL входят язык программирования, который основан на стандарте языка программирования **Си** C99, и интерфейс программирования приложений.
- OpenCL обеспечивает параллелизм на уровне инструкций и на уровне данных и является осуществлением техники GPGPU. 
- OpenCL является **полностью открытым стандартом**, его использование не облагается лицензионными отчислениями.
- Цель OpenCL состоит в том, чтобы дополнить открытые отраслевые стандарты для трёхмерной компьютерной графики и звука — OpenGL и OpenAL, соответственно, — возможностями GPU для высокопроизводительных вычислений.
- OpenCL разрабатывается и поддерживается некоммерческим консорциумом Khronos Group, в который входят много крупных компаний, включая AMD, Apple, ARM, Intel, Nvidia, Sony Computer Entertainment и другие.


## Тензорный процессор Google (TPU)

Тензорный процессор Google (Google Tensor Processing Unit, Google TPU) — тензорный процессор, относящийся к классу **нейронных процессоров**, являющийся специализированной интегральной схемой, разработанной корпорацией Google и предназначенной **для использования с библиотекой машинного обучения TensorFlow**.

По сравнению с GPU, рассчитан на более **высокий объём вычислений с пониженной точностью** (например, всего 8-разрядную точность) при более **высокой производительности на ватт** и **отсутствии модуля для растризации и текстурных блоков**.

Различные типы процессоров подходят для разных типов моделей машинного обучения, **TPU хорошо подходят для CNN**, в то время как **GPU имеют преимущества для некоторых полносвязных нейронных сетей**, а **CPU могут иметь преимущества для RNN**.

# Математика

## MATLAB

MATLAB (MATrix LABoratory) — пакет прикладных программ для решения задач **технических вычислений**. 

MATLAB как язык программирования был разработан Кливом Моулером (Cleve Moler) **в конце 1970-х годов**, когда он был деканом факультета компьютерных наук в Университете Нью-Мексико.

Язык MATLAB является **высокоуровневым интерпретируемым языком** программирования, включающим о**снованные на матрицах структуры данных**, широкий спектр функций, интегрированную среду разработки, объектно-ориентированные возможности и интерфейсы к программам, написанным на других языках программирования.

Совместимые с MATLAB **аналоги** на уровне языка программирования:
- GNU **Octave**
- Scilab
- FreeMat

## Octave

GNU Octave — свободная программная система для математических вычислений, использующая совместимый с MATLAB язык высокого уровня.

Octave представляет интерактивный командный интерфейс для решения линейных и нелинейных математических задач, а также проведения других численных экспериментов. 

Octave — **интерпретируемый** язык программирования. Он **похож на Си** и поддерживает большинство основных функций стандартной библиотеки Си, а также основные команды и системные вызовы Unix. С другой стороны, он не поддерживает передачу аргументов по ссылке (особенность дизайна).

Синтаксис языка **очень похож на MATLAB**, и грамотно написанные скрипты будут запускаться как в Octave, так и в MATLAB.

## Wolfram Mathematica

Mathematica — проприетарная **система компьютерной алгебры**, широко используемая для научных, инженерных, математических расчётов. 

**Разработана в 1988** году Стивеном Вольфрамом, дальнейшим развитием системы занята основанная им совместно с Теодором Греем компания Wolfram Research.

**Wolfram — интерпретируемый язык функционального программирования, составляющий лингвистическую основу системы**, позволяющий расширять её возможности; более того, система Mathematica в значительной степени написана на языке Wolfram, хотя некоторые функции, особенно относящиеся к линейной алгебре, в целях оптимизации реализованы на Си.

Программы могут использовать внешние динамические библиотеки, в том числе **поддерживается интеграция с CUDA** и **OpenCL**.

# Нейронные сети

## TensorFlow

TensorFlow — открытая программная библиотека для машинного обучения, разработанная компанией **Google** для решения задач построения и тренировки нейронной сети с целью автоматического **нахождения и классификации образов**, достигая качества человеческого восприятия.

Основной **API** для работы с библиотекой реализован для **Python**, также существуют реализации для **R, C Sharp, C++, Haskell, Java, Go и Swift**.

TensorFlow хорошо **подходит для автоматизированной аннотации изображений** в таких системах как DeepDream.

Google использует систему RankBrain для **увеличения релевантности ранжировки поисковой выдачи (самообучающаяся система обрабатывающая отклики поисковой системы)** Google. RankBrain основан на TensorFlow.

В мае 2016 года Google сообщила о применении для задач DL аппаратного ускорителя собственной разработки — **тензорного процессора (TPU) — специализированной интегральной схемы, адаптированной под задачи для TensorFlow**, и обеспечивающей высокую производительность в арифметике пониженной точности (например, для 8-битной архитектуры) и направленной скорее на **применение моделей, чем на их обучение**.

Сообщалось, что после использования **TPU** в собственных задачах Google по обработке данных удалось добиться **на порядок лучших показателей продуктивности на ватт затраченной энергии**.

## Keras

Keras — открытая библиотека, **написанная на языке Python** и обеспечивающая взаимодействие с искусственными нейронными сетями.

Основной автор и ведущий разработчик — инженер **Google** Франсуа Шолле (фр. François Chollet).

**Keras действует как интерфейс для библиотеки TensorFlow.**

Начиная с версии 2.4 **поддерживается только TensorFlow**.

Модели, созданные в Keras, могут быть развёрнуты не только на серверных узлах, но и на смартфонах (под управлением iOS и Android) и в браузере (TF.js).

## Torch

Torch — библиотека для языка программирования **Lua** с открытым исходным кодом, предоставляет большое количество алгоритмов для глубинного обучения и научных расчётов.

Ядро написано на Си, прикладная часть выполняется на LuaJIT, поддерживается распараллеливание вычислений средствами **CUDA** и **OpenMP**.

**Стиль работы с массивами схож с Matlab и Octave, в связи с чем иногда определяется как Matlab-подобное окружение для машинного обучения.**

По состоянию на 2018 год **Torch больше не находится в активной разработке**. Однако по состоянию на август 2022 года **PyTorch, основанный на библиотеке Torch, активно развивается**.

## PyTorch

PyTorch — это платформа машинного обучения **с открытым исходным кодом, основанная на библиотеке Torch**, используемая для таких приложений, как **компьютерное зрение и обработка естественного языка**, в первую очередь разработанная **Meta AI**. 

Хотя интерфейс **Python** более совершенен и находится в центре внимания разработки, PyTorch также **имеет интерфейс C++**.

Также вокруг этого фреймворка выстроена экосистема, состоящая из различных библиотек, разрабатываемых сторонними командами: **PyTorch Lightning** и **Fast.ai**, упрощающие процесс обучения моделей, **Pyro**, модуль для вероятностного программирования, от Uber, **Flair**, для обработки естественного языка и **Catalyst**, для обучения DL и RL моделей.

## Caffe

Caffe (**Convolution Architecture For Feature Extraction** = Свёрточная архитектура для извлечения признаков) — среда для глубокого обучения, разработанная Яньцинем Цзя (Yangqing Jia) в процессе подготовки своей диссертации в университете Беркли. 

Caffe является открытым программным обеспечением, распространяемым под лицензией BSD license. 

Написано на языке C++, и поддерживает **интерфейс на языке Python**.

Caffe поддерживает много типов машинного обучения, нацеленных в первую очередь на решение задач **классификации** и **сегментации изображений**. 

Для ускорения обучения применяется система графических процессоров (GPU), поддерживаемая архитектурой **CUDA** и иcпользующих библиотеку CuDNN от фирмы Nvidia.

**В мае 2018 команды Caffe2 и PyTorch объединились. С тех пор код Caffe2 перенесён в репозиторий PyTorch и является частью последнего.**

## PyTorch Lightning

PyTorch Lightning — это библиотека **Python** с открытым исходным кодом, которая предоставляет **высокоуровневый интерфейс для PyTorch**, популярной среды глубокого обучения.

Он предназначен для создания **масштабируемых моделей глубокого обучения**, которые могут легко работать на распределенном оборудовании, сохраняя при этом **аппаратно-независимые модели**.

Lightning применяет следующую структуру к вашему коду, что делает его повторно используемым и доступным:
- Исследовательский код (LightningModule). 
- Инженерный код. 
- Несущественный исследовательский код.
- Данные (используйте PyTorch DataLoaders или организуйте их в LightningDataModule).

**Как только вы это сделаете, вы сможете тренироваться на нескольких GPU, TPU, CPU, IPU, HPU и даже с 16-битной точностью без изменения кода!**

# References

[Caffe](https://ru.wikipedia.org/wiki/Caffe)

[Caffe](https://en.wikipedia.org/wiki/Caffe_(software))

[CUDA](https://ru.wikipedia.org/wiki/CUDA)

[LLVM](https://ru.wikipedia.org/wiki/LLVM)

[Keras](https://ru.wikipedia.org/wiki/Keras)

[Keras.io documentation generator](https://github.com/keras-team/keras-io)

[TensorFlow](https://ru.wikipedia.org/wiki/TensorFlow)

[TensorFlow Examples](https://github.com/tensorflow/examples)

[Тензорный процессор Google](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BD%D0%B7%D0%BE%D1%80%D0%BD%D1%8B%D0%B9_%D0%BF%D1%80%D0%BE%D1%86%D0%B5%D1%81%D1%81%D0%BE%D1%80_Google)

[Tensor Processing Unit](https://en.wikipedia.org/wiki/Tensor_Processing_Unit)

[Torch](https://ru.wikipedia.org/wiki/Torch)

[Torch (github)](https://github.com/torch)

[Torch](https://en.wikipedia.org/wiki/Torch_(machine_learning))

[MATLAB](https://en.wikipedia.org/wiki/MATLAB)

[MATLAB](https://ru.wikipedia.org/wiki/MATLAB)

[Mathematica](https://ru.wikipedia.org/wiki/Mathematica)

[Wolfram Mathematica](https://en.wikipedia.org/wiki/Wolfram_Mathematica)

[PyTorch Lightning](https://en.wikipedia.org/wiki/PyTorch_Lightning)

[GNU Octave](https://ru.wikipedia.org/wiki/GNU_Octave)

[GNU Octave](https://en.wikipedia.org/wiki/GNU_Octave)

[PyTorch Lightning](https://pypi.org/project/pytorch-lightning/)

[OpenCL](https://ru.wikipedia.org/wiki/OpenCL)