From 0d9212683ffe2f101f660eb3a8847816d68bfc84 Mon Sep 17 00:00:00 2001
From: Patryk Elszkowski <patryk.elszkowski@intel.com>
Date: Mon, 19 Jul 2021 11:20:54 +0200
Subject: [PATCH 01/71] FakeQuantize - reference implementation refactor
 (#6478)

* new implementation of FakeQuantize

* move FakeQuantize backend test to fake_quantize.in.cpp

* enable some test for FakeQuantize

* Add support for PDPD broadcasting and some backend tests

* arm plugin expect less attributes in function call

* try to fix arm plugin build

* try to build arm plugin

* start changing backend test

* add check for attributes number in visitor test

* fix backend test after refactoring

* add default parameter value to runtime::reference::fake_quantize

* Revert "add default parameter value to runtime::reference::fake_quantize"

This reverts commit 9d2c00d9674d0cdddac33d097ff46f527abc7bd9.

* add SLT for FakeQuantize

* remove fesetround

* change `v1` namesapce to `v0` in ref impl

* add FakeQuantize-1 to VERIFIED_OP_REFERENCES

* pass immutable reference to test functions
---
 .../single_layer_tests/fake_quantize.cpp      |  67 +++-
 .../single_layer_tests/fake_quantize.cpp      |   7 +-
 .../single_layer_tests/fake_quantize.cpp      |   7 +-
 .../single_layer_tests/fake_quantize.hpp      |   2 +-
 .../single_layer/fake_quantize.hpp            |  41 +-
 .../src/single_layer/fake_quantize.cpp        | 116 +++++-
 .../layer_tests_summary/utils/constants.py    |   1 +
 .../core/include/ngraph/op/fake_quantize.hpp  |   2 +-
 .../runtime/reference/fake_quantize.hpp       | 349 +++++++++++-------
 ngraph/test/CMakeLists.txt                    |   1 +
 ngraph/test/backend/fake_quantize.in.cpp      | 187 ++++++++++
 ngraph/test/backend/fused_op.in.cpp           | 176 ---------
 ngraph/test/runtime/ie/unit_test.manifest     |   7 +-
 .../runtime/interpreter/evaluates_map.cpp     |  31 +-
 .../runtime/interpreter/unit_test.manifest    |   2 -
 ngraph/test/visitors/op/fake_quantize.cpp     |   4 +
 16 files changed, 635 insertions(+), 365 deletions(-)
 create mode 100644 ngraph/test/backend/fake_quantize.in.cpp

diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp
index bc0440b0d87f4a..1b16a37812c62f 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp
@@ -11,11 +11,19 @@ using namespace LayerTestsDefinitions;
 
 namespace {
 
-const std::vector<InferenceEngine::Precision> netPrecisions = {
-        InferenceEngine::Precision::FP32,
-        InferenceEngine::Precision::FP16
+const ngraph::op::AutoBroadcastSpec numpyBroadcast = ngraph::op::AutoBroadcastType::NUMPY;
+
+const ngraph::op::AutoBroadcastSpec noneBroadcast = ngraph::op::AutoBroadcastType::NONE;
+
+const std::vector<ngraph::op::AutoBroadcastSpec> broadcasts = {
+    {ngraph::op::AutoBroadcastType::NUMPY},
+    {ngraph::op::AutoBroadcastType::PDPD, -1},
 };
 
+const std::vector<InferenceEngine::Precision>
+    netPrecisions = {InferenceEngine::Precision::FP32,
+                     InferenceEngine::Precision::FP16};
+
 const std::vector<std::vector<size_t>> inputShapes = {{1, 1}, {2, 6}, {1, 1, 1}, {2, 6, 13},
                                                       {1, 1, 1, 1}, {3, 10, 5, 6}, {2, 8, 5, 18}, {2, 16, 3, 18}, {3, 49, 5, 6},
                                                       {1, 1, 1, 1, 1}, {3, 10, 2, 5, 6}, {2, 8, 1, 5, 18}, {2, 16, 4, 3, 18}, {3, 49, 7, 5, 6}};
@@ -30,10 +38,11 @@ const auto fqParams = ::testing::Combine(
         ::testing::ValuesIn(levels),
         ::testing::ValuesIn(constShapes),
         ::testing::Values(fqArgs),
-        ::testing::Values(inputParams)
+        ::testing::Values(inputParams),
+        ::testing::ValuesIn(broadcasts)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTest,
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTestRevise,
                         ::testing::Combine(
                                 fqParams,
                                 ::testing::ValuesIn(netPrecisions),
@@ -44,27 +53,52 @@ INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTest,
                                 ::testing::ValuesIn(inputShapes),
                                 ::testing::Values(CommonTestUtils::DEVICE_CPU),
                                 ::testing::Values(config)),
-                        FakeQuantizeLayerTest::getTestCaseName);
+                        FakeQuantizeLayerTestRevise::getTestCaseName);
+
+
+const std::vector<size_t> singleShape = {3, 4, 2, 5};
+const auto noneBroadcastFqParams = ::testing::Combine(
+        ::testing::ValuesIn(levels),
+        ::testing::Values(singleShape),
+        ::testing::Values(fqArgs),
+        ::testing::Values(inputParams),
+        ::testing::Values(noneBroadcast)
+);
+
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizeNoneBroadcast, FakeQuantizeLayerTestRevise,
+                        ::testing::Combine(
+                                noneBroadcastFqParams,
+                                ::testing::ValuesIn(netPrecisions),
+                                ::testing::Values(InferenceEngine::Precision::UNSPECIFIED),
+                                ::testing::Values(InferenceEngine::Precision::UNSPECIFIED),
+                                ::testing::Values(InferenceEngine::Layout::ANY),
+                                ::testing::Values(InferenceEngine::Layout::ANY),
+                                ::testing::Values(singleShape),
+                                ::testing::Values(CommonTestUtils::DEVICE_CPU),
+                                ::testing::Values(config)),
+                        FakeQuantizeLayerTestRevise::getTestCaseName);
 
 const std::vector<std::vector<size_t>> inputShapesPerChannel = {{11, 10, 22, 19}, {11, 10, 5, 6}};
 const std::vector<std::vector<size_t>> constShapesPerChannelAxis0 = {{11, 1, 1, 1}};
-const std::vector<std::vector<size_t>> constShapesPerChannelAxis1 = {{1, 10, 1, 1}};
+const std::vector<std::vector<size_t>> constShapesPerChannelAxis1 = {{1, 10, 1, 1}, {10, 1, 1}};
 
 const auto fqParamsPerChannelAxis0 = ::testing::Combine(
         ::testing::ValuesIn(levels),
         ::testing::ValuesIn(constShapesPerChannelAxis0),
         ::testing::Values(fqArgs),
-        ::testing::Values(inputParams)
+        ::testing::Values(inputParams),
+        ::testing::Values(numpyBroadcast)
 );
 
 const auto fqParamsPerChannelAxis1 = ::testing::Combine(
         ::testing::ValuesIn(levels),
         ::testing::ValuesIn(constShapesPerChannelAxis1),
         ::testing::Values(fqArgs),
-        ::testing::Values(inputParams)
+        ::testing::Values(inputParams),
+        ::testing::Values(numpyBroadcast)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannelAxis0, FakeQuantizeLayerTest,
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannelAxis0, FakeQuantizeLayerTestRevise,
                         ::testing::Combine(
                                 fqParamsPerChannelAxis0,
                                 ::testing::ValuesIn(netPrecisions),
@@ -75,9 +109,9 @@ INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannelAxis0, FakeQuantizeLayerTes
                                 ::testing::ValuesIn(inputShapesPerChannel),
                                 ::testing::Values(CommonTestUtils::DEVICE_CPU),
                                 ::testing::Values(config)),
-                        FakeQuantizeLayerTest::getTestCaseName);
+                        FakeQuantizeLayerTestRevise::getTestCaseName);
 
-INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannelAxis1, FakeQuantizeLayerTest,
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannelAxis1, FakeQuantizeLayerTestRevise,
                         ::testing::Combine(
                                 fqParamsPerChannelAxis1,
                                 ::testing::ValuesIn(netPrecisions),
@@ -88,7 +122,7 @@ INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannelAxis1, FakeQuantizeLayerTes
                                 ::testing::ValuesIn(inputShapesPerChannel),
                                 ::testing::Values(CommonTestUtils::DEVICE_CPU),
                                 ::testing::Values(config)),
-                        FakeQuantizeLayerTest::getTestCaseName);
+                        FakeQuantizeLayerTestRevise::getTestCaseName);
 
 const std::vector<std::vector<size_t>> inputShapesPerChannel2D = {{1, 10}};
 const std::vector<std::vector<size_t>> constShapesPerChannel2D = { {10}, {1, 10}, {1} };
@@ -96,10 +130,11 @@ const auto fqParamsPerChannel2D = ::testing::Combine(
     ::testing::ValuesIn(levels),
     ::testing::ValuesIn(constShapesPerChannel2D),
     ::testing::Values(fqArgs),
-    ::testing::Values(inputParams)
+    ::testing::Values(inputParams),
+    ::testing::Values(numpyBroadcast)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannel2D, FakeQuantizeLayerTest,
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannel2D, FakeQuantizeLayerTestRevise,
     ::testing::Combine(
         fqParamsPerChannel2D,
         ::testing::ValuesIn(netPrecisions),
@@ -110,6 +145,6 @@ INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantizePerChannel2D, FakeQuantizeLayerTest,
         ::testing::ValuesIn(inputShapesPerChannel2D),
         ::testing::Values(CommonTestUtils::DEVICE_CPU),
         ::testing::Values(config)),
-    FakeQuantizeLayerTest::getTestCaseName);
+    FakeQuantizeLayerTestRevise::getTestCaseName);
 
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/single_layer_tests/fake_quantize.cpp b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/single_layer_tests/fake_quantize.cpp
index 4a50e05ce089d4..96a8319da61d58 100644
--- a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/single_layer_tests/fake_quantize.cpp
+++ b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/single_layer_tests/fake_quantize.cpp
@@ -81,10 +81,11 @@ const auto fqParams = ::testing::Combine(
     ::testing::ValuesIn(levels),
     ::testing::ValuesIn(constShapes),
     ::testing::ValuesIn(fqArgs),
-    ::testing::ValuesIn(inputParams)
+    ::testing::ValuesIn(inputParams),
+    ::testing::Values(ngraph::op::AutoBroadcastType::NUMPY)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTest,
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTestRevise,
     ::testing::Combine(
     fqParams,
     ::testing::ValuesIn(netPrecisions),
@@ -95,6 +96,6 @@ INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTest,
     ::testing::ValuesIn(inputShapes),
     ::testing::Values(CommonTestUtils::DEVICE_GNA),
     ::testing::ValuesIn(gnaQuantModes)),
-    FakeQuantizeLayerTest::getTestCaseName);
+    FakeQuantizeLayerTestRevise::getTestCaseName);
 
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp
index a5223cb641c697..50eba79b54aeca 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/fake_quantize.cpp
@@ -29,10 +29,11 @@ const auto fqParams = ::testing::Combine(
         ::testing::ValuesIn(levels),
         ::testing::ValuesIn(constShapes),
         ::testing::Values(fqArgs),
-        ::testing::Values(inputParams)
+        ::testing::Values(inputParams),
+        ::testing::Values(ngraph::op::AutoBroadcastType::NUMPY)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTest,
+INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTestRevise,
                         ::testing::Combine(
                                 fqParams,
                                 ::testing::ValuesIn(netPrecisions),
@@ -43,6 +44,6 @@ INSTANTIATE_TEST_SUITE_P(smoke_FakeQuantize, FakeQuantizeLayerTest,
                                 ::testing::ValuesIn(inputShapes),
                                 ::testing::Values(CommonTestUtils::DEVICE_GPU),
                                 ::testing::Values(config)),
-                        FakeQuantizeLayerTest::getTestCaseName);
+                        FakeQuantizeLayerTestRevise::getTestCaseName);
 
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/fake_quantize.hpp b/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/fake_quantize.hpp
index e140257c799ac0..0172b8c903dbcb 100644
--- a/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/fake_quantize.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/fake_quantize.hpp
@@ -8,7 +8,7 @@
 
 namespace LayerTestsDefinitions {
 
-TEST_P(FakeQuantizeLayerTest, CompareWithRefs) {
+TEST_P(FakeQuantizeLayerTestRevise, CompareWithRefs) {
     Run();
     SKIP_IF_CURRENT_TEST_IS_DISABLED();
 
diff --git a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/fake_quantize.hpp b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/fake_quantize.hpp
index b465fcedf07c24..d4811fcdce0206 100644
--- a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/fake_quantize.hpp
+++ b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/fake_quantize.hpp
@@ -26,6 +26,7 @@
 
 namespace LayerTestsDefinitions {
 
+
 typedef std::tuple<
         size_t,              // levels
         std::vector<size_t>, // const inputs shape
@@ -48,7 +49,45 @@ typedef std::tuple<
 class FakeQuantizeLayerTest : public testing::WithParamInterface<fqLayerTestParamsSet>,
                               virtual public LayerTestsUtils::LayerTestsCommon {
 public:
-    static std::string getTestCaseName(testing::TestParamInfo<fqLayerTestParamsSet> obj);
+    static std::string getTestCaseName(const testing::TestParamInfo<fqLayerTestParamsSet>& obj);
+    InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo &info) const override;
+protected:
+    void SetUp() override;
+    void UpdateSeed();
+
+ protected:
+    float inputDataMin        = 0.0;
+    float inputDataMax        = 10.0;
+    float inputDataResolution = 1.0;
+    int32_t  seed = 1;
+};
+
+
+//TODO after update all plugins remove *Revise types
+typedef std::tuple<
+        size_t,                         // fake quantize levels
+        std::vector<size_t>,            // fake quantize inputs shape
+        std::vector<float>,             // fake quantize (inputLow, inputHigh, outputLow, outputHigh) or empty for random
+        std::vector<float>,             // input generator data (low, high, resolution) or empty for default
+        ngraph::op::AutoBroadcastSpec   // fake quantize broadcast mode
+> fqSpecificParamsRevise;
+typedef std::tuple<
+        fqSpecificParamsRevise,
+        InferenceEngine::Precision,        // Net precision
+        InferenceEngine::Precision,        // Input precision
+        InferenceEngine::Precision,        // Output precision
+        InferenceEngine::Layout,           // Input layout
+        InferenceEngine::Layout,           // Output layout
+        InferenceEngine::SizeVector,       // Input shapes
+        LayerTestsUtils::TargetDevice,     // Device name
+
+        std::pair<std::string, std::map<std::string, std::string>> // Additional backend configuration and alis name to it
+> fqLayerTestParamsSetRevise;
+
+class FakeQuantizeLayerTestRevise : public testing::WithParamInterface<fqLayerTestParamsSetRevise>,
+                                    virtual public LayerTestsUtils::LayerTestsCommon {
+public:
+    static std::string getTestCaseName(const testing::TestParamInfo<fqLayerTestParamsSetRevise>& obj);
     InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo &info) const override;
 protected:
     void SetUp() override;
diff --git a/inference-engine/tests/functional/shared_test_classes/src/single_layer/fake_quantize.cpp b/inference-engine/tests/functional/shared_test_classes/src/single_layer/fake_quantize.cpp
index 57bed0c9044557..f4f100b00ad102 100644
--- a/inference-engine/tests/functional/shared_test_classes/src/single_layer/fake_quantize.cpp
+++ b/inference-engine/tests/functional/shared_test_classes/src/single_layer/fake_quantize.cpp
@@ -6,7 +6,8 @@
 
 namespace LayerTestsDefinitions {
 
-std::string FakeQuantizeLayerTest::getTestCaseName(testing::TestParamInfo<fqLayerTestParamsSet> obj) {
+
+std::string FakeQuantizeLayerTest::getTestCaseName(const testing::TestParamInfo<fqLayerTestParamsSet>& obj) {
     fqSpecificParams fqParams;
     InferenceEngine::Precision netPrecision;
     InferenceEngine::Precision inPrc, outPrc;
@@ -113,4 +114,117 @@ void FakeQuantizeLayerTest::UpdateSeed() {
     std::cout << "\033[0;32m" << "[          ] " << "\033[0;0m"
               << "seed = " << seed << std::endl;
 }
+
+
+
+std::string FakeQuantizeLayerTestRevise::getTestCaseName(const testing::TestParamInfo<fqLayerTestParamsSetRevise>& obj) {
+    fqSpecificParamsRevise fqParams;
+    InferenceEngine::Precision netPrecision;
+    InferenceEngine::Precision inPrc, outPrc;
+    InferenceEngine::Layout inLayout, outLayout;
+    InferenceEngine::SizeVector inputShapes;
+    std::string targetDevice;
+    std::pair<std::string, std::map<std::string, std::string>> config;
+    std::tie(fqParams, netPrecision, inPrc, outPrc, inLayout, outLayout, inputShapes, targetDevice, config) = obj.param;
+    size_t levels;
+    std::vector<size_t> constShape;
+    std::vector<float> fqDirectArgs;
+    std::vector<float> inputArg;
+    ngraph::op::AutoBroadcastSpec broadcast;
+    std::tie(levels, constShape, fqDirectArgs, inputArg, broadcast) = fqParams;
+
+    std::ostringstream result;
+    result << "IS=" << CommonTestUtils::vec2str(inputShapes) << "_";
+    result << "CS=" << CommonTestUtils::vec2str(constShape) << "_";
+    result << "LEVELS=" << levels << "_";
+    result << "netPRC=" << netPrecision.name() << "_";
+    result << "inPRC=" << inPrc.name() << "_";
+    result << "outPRC=" << outPrc.name() << "_";
+    result << "inL=" << inLayout << "_";
+    result << "outL=" << outLayout << "_";
+    result << "trgDev=" << targetDevice;
+    if (!config.first.empty()) {
+        result << "_targetConfig=" << config.first;
+    }
+    if (!fqDirectArgs.empty()) {
+        result << "_fqArgs=" << fqDirectArgs[0] << "_" << fqDirectArgs[1] << "_" << fqDirectArgs[2] << "_" << fqDirectArgs[3];
+    }
+    if (inputArg.size() == 3) {
+        result << "_inputArg=" << inputArg[0] << "_" << inputArg[1] << "_" << inputArg[2];
+    }
+    result << "_" << broadcast.m_type;
+    return result.str();
+}
+
+void FakeQuantizeLayerTestRevise::SetUp() {
+    fqSpecificParamsRevise fqParams;
+    std::vector<size_t> inputShape;
+    std::pair<std::string, std::map<std::string, std::string>> config;
+    auto netPrecision = InferenceEngine::Precision::UNSPECIFIED;
+    std::tie(fqParams, netPrecision, inPrc, outPrc, inLayout, outLayout, inputShape, targetDevice, config) = this->GetParam();
+    InferenceEngine::SizeVector kernel, stride, dilation;
+    size_t levels;
+    std::vector<size_t> constShape;
+    std::vector<float> fqDirectArg;
+    std::vector<float> inputArg;
+    ngraph::op::AutoBroadcastSpec broadcast;
+    std::tie(levels, constShape, fqDirectArg, inputArg, broadcast) = fqParams;
+    if (inputArg.size() == 3) {
+        inputDataMin = inputArg[0];
+        inputDataMax = inputArg[1];
+        inputDataResolution = inputArg[2];
+    }
+    if (fqDirectArg.size() != 0) {
+        threshold = (fqDirectArg[3] - fqDirectArg[2]) / levels;
+    }
+    auto ngPrc = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(netPrecision);
+    auto params = ngraph::builder::makeParams(ngPrc, {inputShape});
+    auto paramOuts = ngraph::helpers::convert2OutputVector(ngraph::helpers::castOps2Nodes<ngraph::op::Parameter>(params));
+
+    UpdateSeed();
+
+    std::shared_ptr<ngraph::Node> fakeQNode;
+    if (fqDirectArg.empty()) {
+        int32_t ngraphSeed = seed;
+        if (NGRAPH_SEED != USE_CLOCK_TIME) {
+            ngraphSeed = NGRAPH_SEED;
+        }
+        std::cout << "\033[0;32m" << "[          ] " << "\033[0;0m"
+                  << "ngraphSeed = " << ngraphSeed << std::endl;
+        fakeQNode = ngraph::builder::makeFakeQuantize(paramOuts[0], ngPrc, levels, constShape, ngraphSeed);
+    } else {
+        fakeQNode = ngraph::builder::makeFakeQuantize(
+            paramOuts[0],
+            ngPrc,
+            levels,
+            constShape,
+            {fqDirectArg[0]},
+            {fqDirectArg[1]},
+            {fqDirectArg[2]},
+            {fqDirectArg[3]});
+    }
+    auto fq = std::dynamic_pointer_cast<ngraph::opset1::FakeQuantize>(fakeQNode);
+
+    ngraph::ResultVector results{std::make_shared<ngraph::opset1::Result>(fq)};
+    function = std::make_shared<ngraph::Function>(results, params, "fakeQuantize");
+
+    configuration = config.second;
+}
+
+InferenceEngine::Blob::Ptr FakeQuantizeLayerTestRevise::GenerateInput(const InferenceEngine::InputInfo &info) const {
+    return FuncTestUtils::createAndFillBlob(info.getTensorDesc(), inputDataMax - inputDataMin, inputDataMin, 1 / inputDataResolution,
+      seed);
+}
+
+void FakeQuantizeLayerTestRevise::UpdateSeed() {
+    if (BASE_SEED == USE_CLOCK_TIME) {
+        seed = std::chrono::system_clock::now().time_since_epoch().count();
+    } else if (BASE_SEED == USE_INCREMENTAL_SEED) {
+        seed += 9999;
+    } else {
+        seed = BASE_SEED;
+    }
+    std::cout << "\033[0;32m" << "[          ] " << "\033[0;0m"
+              << "seed = " << seed << std::endl;
+}
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
index b58608168bb14f..d7eaf8a48ebc2b 100644
--- a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
+++ b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
@@ -35,6 +35,7 @@
     'ExperimentalDetectronPriorGridGenerator-6',
     'ExperimentalDetectronROIFeatureExtractor-6',
     'ExperimentalDetectronTopKROIs-6',
+    'FakeQuantize-1',
     'Floor-1'
     'FloorMod-1'
     'GRUSequence-5',
diff --git a/ngraph/core/include/ngraph/op/fake_quantize.hpp b/ngraph/core/include/ngraph/op/fake_quantize.hpp
index 3caff056760c3b..3528af44b71d4a 100644
--- a/ngraph/core/include/ngraph/op/fake_quantize.hpp
+++ b/ngraph/core/include/ngraph/op/fake_quantize.hpp
@@ -5,8 +5,8 @@
 #pragma once
 
 #include "ngraph/node.hpp"
+#include "ngraph/op/op.hpp"
 #include "ngraph/op/util/attr_types.hpp"
-#include "ngraph/op/util/fused_op.hpp"
 
 namespace ngraph
 {
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/fake_quantize.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/fake_quantize.hpp
index d3a30caa9cff82..2b0c3b7110a799 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/fake_quantize.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/fake_quantize.hpp
@@ -4,12 +4,15 @@
 
 #pragma once
 
+#include <algorithm>
 #include <cmath>
 #include <cstddef>
 #include <numeric>
 #include <utility>
 #include <vector>
 
+#include "ngraph/check.hpp"
+#include "ngraph/op/util/attr_types.hpp"
 #include "ngraph/shape.hpp"
 
 namespace ngraph
@@ -18,9 +21,9 @@ namespace ngraph
     {
         namespace reference
         {
-            namespace
+            namespace fake_quantize_details
             {
-                std::vector<size_t>
+                inline std::vector<size_t>
                     calc_broadcast_index_offset(const std::vector<size_t>& memory_offsets,
                                                 const std::vector<size_t>& broadcast_shape)
                 {
@@ -32,9 +35,8 @@ namespace ngraph
                             broadcast_offsets[i] = memory_offsets[i];
                         }
                     }
-                    if (!std::all_of(broadcast_shape.begin(),
-                                     broadcast_shape.end(),
-                                     [](size_t i) { return i == 1; }) &&
+                    const auto not_one = [](size_t i) { return i != 1; };
+                    if (std::any_of(broadcast_shape.begin(), broadcast_shape.end(), not_one) &&
                         broadcast_shape.back() == 1)
                     {
                         broadcast_offsets[broadcast_offsets.size() - 1] = 1;
@@ -53,182 +55,243 @@ namespace ngraph
                     return broadcast_offsets;
                 }
 
-                size_t calc_full_broadcast_offset(const std::vector<size_t>& current_dims,
-                                                  const std::vector<size_t>& offsets)
+                inline size_t calc_full_broadcast_offset(const std::vector<size_t>& current_dims,
+                                                         const std::vector<size_t>& offsets)
                 {
-                    size_t full_index_offset = 0;
-                    for (size_t i = 0; i < current_dims.size(); ++i)
-                    {
-                        full_index_offset += offsets[i] * current_dims[i];
-                    }
-                    return full_index_offset;
+                    return std::inner_product(
+                        begin(current_dims), end(current_dims), begin(offsets), 0);
                 }
 
-                void align_shape_sizes(Shape& shape, size_t target_size)
+                inline Shape align_shape_sizes(const Shape& shape,
+                                               const Shape& target_shape,
+                                               const op::AutoBroadcastSpec& broadcast)
                 {
-                    for (size_t i = 0; i < shape.size() - target_size; ++i)
+                    Shape s;
+                    switch (broadcast.m_type)
+                    {
+                    case op::AutoBroadcastType::NONE:
+                    {
+                        s = shape;
+                        break;
+                    }
+                    case op::AutoBroadcastType::NUMPY:
+                    {
+                        s = Shape(target_shape.size(), 1);
+                        std::copy(begin(shape), end(shape), prev(end(s), shape.size()));
+                        break;
+                    }
+                    case op::AutoBroadcastType::PDPD:
                     {
-                        shape.insert(shape.begin(), 1);
+                        const size_t axis = broadcast.m_axis == -1
+                                                ? target_shape.size() - shape.size()
+                                                : static_cast<size_t>(broadcast.m_axis);
+
+                        s = Shape(target_shape.size(), 1);
+                        const auto axis_to_copy = target_shape.size() - axis;
+                        const auto b = begin(shape);
+                        const auto e = b + axis_to_copy; // from e to end(shape) should be only ones
+                        std::copy(b, e, next(begin(s), axis));
+                        break;
+                    }
                     }
+                    return s;
                 }
 
-                void increment_current_dim(std::vector<size_t>& current_dims,
-                                           const std::vector<size_t>& shape,
-                                           size_t incremented_dim_number)
+                inline void increment_current_dim(std::vector<size_t>& current_dims,
+                                                  const std::vector<size_t>& shape)
                 {
-                    current_dims[incremented_dim_number] += 1;
-                    if (current_dims[incremented_dim_number] == shape[incremented_dim_number] &&
-                        incremented_dim_number != 0)
+                    size_t incremented_dim_number = current_dims.size();
+                    while (incremented_dim_number-- > 0)
                     {
-                        for (size_t i = incremented_dim_number; i < shape.size(); ++i)
+                        current_dims[incremented_dim_number] += 1;
+                        if (current_dims[incremented_dim_number] < shape[incremented_dim_number])
                         {
-                            current_dims[i] = 0;
+                            break;
                         }
-                        increment_current_dim(current_dims, shape, incremented_dim_number - 1);
+                        current_dims[incremented_dim_number] = 0;
                     }
                 }
-            } // namespace
-
-            template <typename T>
-            void fake_quantize(const T* arg,
-                               const T* in_low,
-                               const T* in_high,
-                               const T* out_low,
-                               const T* out_high,
-                               T* out,
-                               const Shape& arg_shape,
-                               const Shape& _in_low_shape,
-                               const Shape& _in_high_shape,
-                               const Shape& _out_low_shape,
-                               const Shape& _out_high_shape,
-                               size_t levels)
-            {
-                auto initial_round_mode = std::fegetround();
-                std::fesetround(FE_TONEAREST);
-                Shape in_low_shape(_in_low_shape);
-                Shape in_high_shape(_in_high_shape);
-                Shape out_low_shape(_out_low_shape);
-                Shape out_high_shape(_out_high_shape);
-
-                if (in_low_shape.size() > arg_shape.size() ||
-                    in_high_shape.size() > arg_shape.size() ||
-                    out_low_shape.size() > arg_shape.size() ||
-                    out_high_shape.size() > arg_shape.size())
-                {
-                    throw std::runtime_error(
-                        std::string("Tensors with inout\\output ranges should have rank less or "
-                                    "equal to data tensor rank equal to ") +
-                        std::to_string(arg_shape.size()));
-                }
 
-                std::vector<size_t> arg_memory_offsets(arg_shape.size(), 0);
-                for (int i = arg_shape.size() - 2; i >= 0; i--)
+                template <typename T>
+                class QuantizationBound
                 {
-                    arg_memory_offsets[i] = std::accumulate(
-                        arg_shape.begin() + i + 1, arg_shape.end(), 1, std::multiplies<size_t>());
-                }
-                align_shape_sizes(in_low_shape, arg_shape.size());
-                align_shape_sizes(in_high_shape, arg_shape.size());
-                align_shape_sizes(out_low_shape, arg_shape.size());
-                align_shape_sizes(out_high_shape, arg_shape.size());
-
-                std::vector<size_t> in_low_offsets, in_high_offsets, out_low_offsets,
-                    out_high_offsets;
-                bool in_low_trivial_broadcast = false;
-                bool in_high_trivial_broadcast = false;
-                bool out_low_trivial_broadcast = false;
-                bool out_high_trivial_broadcast = false;
-                bool in_low_aligned = false;
-                bool in_high_aligned = false;
-                bool out_low_aligned = false;
-                bool out_high_aligned = false;
-
-                auto check_trivial_broadcast =
-                    [&arg_shape, &arg_memory_offsets](Shape& shape_to_check,
-                                                      std::vector<size_t>& target_offsets,
-                                                      bool& trivial_broadcast,
-                                                      bool& aligned) {
-                        if (shape_size(shape_to_check) == 1 || shape_size(shape_to_check) == 0)
+                public:
+                    enum class Bound
+                    {
+                        trivial,
+                        aligned,
+                        broadcast,
+                    };
+                    QuantizationBound(const T* const bound_data,
+                                      const Shape& bound_shape,
+                                      const Shape& arg_shape,
+                                      const op::AutoBroadcastSpec& broadcast_spec)
+                        : bounds(bound_data)
+                    {
+                        if (shape_size(bound_shape) == 1)
                         {
-                            trivial_broadcast = true;
+                            bound = Bound::trivial;
                         }
-                        else if (shape_to_check == arg_shape)
+                        else if (bound_shape == arg_shape)
                         {
-                            aligned = true;
+                            bound = Bound::aligned;
                         }
                         else
                         {
-                            target_offsets =
-                                calc_broadcast_index_offset(arg_memory_offsets, shape_to_check);
+                            bound = Bound::broadcast;
+                            const auto arg_memory_offsets = row_major_strides(arg_shape);
+                            const auto unsqueezed_bound_shape =
+                                align_shape_sizes(bound_shape, arg_shape, broadcast_spec);
+                            row_strides = calc_broadcast_index_offset(arg_memory_offsets,
+                                                                      unsqueezed_bound_shape);
                         }
-                    };
-                check_trivial_broadcast(
-                    in_low_shape, in_low_offsets, in_low_trivial_broadcast, in_low_aligned);
-                check_trivial_broadcast(
-                    in_high_shape, in_high_offsets, in_high_trivial_broadcast, in_high_aligned);
-                check_trivial_broadcast(
-                    out_low_shape, out_low_offsets, out_low_trivial_broadcast, out_low_aligned);
-                check_trivial_broadcast(
-                    out_high_shape, out_high_offsets, out_high_trivial_broadcast, out_high_aligned);
-
-                std::vector<size_t> current_dim(arg_shape.size(), 0);
-
-                auto get_value = [&current_dim](bool is_trivial_broadcast,
-                                                bool is_aligned,
-                                                const T* data,
-                                                size_t idx,
-                                                const std::vector<size_t>& offsets) {
-                    T val;
-                    if (is_aligned)
-                    {
-                        val = data[idx];
-                    }
-                    else if (is_trivial_broadcast)
-                    {
-                        val = data[0];
                     }
-                    else
+                    T get_value(const std::vector<size_t>& current_dim, size_t idx) const
                     {
-                        size_t index_offset = calc_full_broadcast_offset(current_dim, offsets);
-                        if (index_offset != 0)
+                        T val{};
+                        switch (bound)
+                        {
+                        case Bound::trivial: val = *bounds; break;
+                        case Bound::aligned: val = bounds[idx]; break;
+                        case Bound::broadcast:
                         {
-                            NGRAPH_CHECK(idx >= index_offset, "Incorrect index offset value!");
+                            const size_t index_offset =
+                                calc_full_broadcast_offset(current_dim, row_strides);
+                            NGRAPH_CHECK(0 <= index_offset && index_offset <= idx,
+                                         "Incorrect index offset value!");
+                            val = bounds[idx - index_offset];
+                            break;
+                        }
                         }
-                        val = data[idx - index_offset];
+                        return val;
                     }
-                    return val;
+
+                private:
+                    Bound bound;
+                    std::vector<size_t> row_strides;
+                    const T* const bounds;
                 };
-                for (size_t i = 0; i < shape_size(arg_shape); ++i)
+
+                template <typename T>
+                inline T quantize(const T& arg,
+                                  const T& in_low,
+                                  const T& in_high,
+                                  const T& out_low,
+                                  const T& out_high,
+                                  const size_t& levels)
                 {
-                    T in_low_val = get_value(
-                        in_low_trivial_broadcast, in_low_aligned, in_low, i, in_low_offsets);
-                    T in_high_val = get_value(
-                        in_high_trivial_broadcast, in_high_aligned, in_high, i, in_high_offsets);
-                    T out_low_val = get_value(
-                        out_low_trivial_broadcast, out_low_aligned, out_low, i, out_low_offsets);
-                    T out_high_val = get_value(out_high_trivial_broadcast,
-                                               out_high_aligned,
-                                               out_high,
-                                               i,
-                                               out_high_offsets);
-                    if (arg[i] <= std::min(in_low_val, in_high_val))
+                    if (arg <= std::min(in_low, in_high))
+                    {
+                        return out_low;
+                    }
+                    else if (arg > std::max(in_low, in_high))
                     {
-                        out[i] = out_low_val;
+                        return out_high;
                     }
-                    else if (arg[i] > std::max(in_low_val, in_high_val))
+                    return std::nearbyint((arg - in_low) / (in_high - in_low) * (levels - 1)) /
+                               (levels - 1) * (out_high - out_low) +
+                           out_low;
+                }
+
+            } // namespace fake_quantize_details
+            namespace v0
+            {
+                template <typename T>
+                void fake_quantize(const T* const arg,
+                                   const T* const in_low,
+                                   const T* const in_high,
+                                   const T* const out_low,
+                                   const T* const out_high,
+                                   T* const out,
+                                   const Shape& arg_shape,
+                                   const Shape& in_low_shape,
+                                   const Shape& in_high_shape,
+                                   const Shape& out_low_shape,
+                                   const Shape& out_high_shape,
+                                   size_t levels,
+                                   const op::AutoBroadcastSpec& broadcast)
+                {
+                    using namespace fake_quantize_details;
+
+                    if (shape_size(in_low_shape) == 1 && shape_size(in_high_shape) == 1 &&
+                        shape_size(out_low_shape) == 1 && shape_size(out_high_shape) == 1)
                     {
-                        out[i] = out_high_val;
+                        const size_t arg_size = shape_size(arg_shape);
+                        const auto q = [=](const T& a) {
+                            return quantize(a, *in_low, *in_high, *out_low, *out_high, levels);
+                        };
+                        for (size_t i = 0; i < arg_size; ++i)
+                        {
+                            out[i] = q(arg[i]);
+                        }
                     }
                     else
                     {
-                        out[i] = nearbyint((arg[i] - in_low_val) / (in_high_val - in_low_val) *
-                                           (levels - 1)) /
-                                     (levels - 1) * (out_high_val - out_low_val) +
-                                 out_low_val;
+                        NGRAPH_CHECK(in_low_shape.size() <= arg_shape.size() &&
+                                         in_high_shape.size() <= arg_shape.size() &&
+                                         out_low_shape.size() <= arg_shape.size() &&
+                                         out_high_shape.size() <= arg_shape.size(),
+                                     "Tensors with inout\\output ranges should have rank less or "
+                                     "equal to data tensor rank equal to ",
+                                     arg_shape.size());
+
+                        const QuantizationBound<T> in_low_bound(
+                            in_low, in_low_shape, arg_shape, broadcast);
+                        const QuantizationBound<T> in_high_bound(
+                            in_high, in_high_shape, arg_shape, broadcast);
+                        const QuantizationBound<T> out_low_bound(
+                            out_low, out_low_shape, arg_shape, broadcast);
+                        const QuantizationBound<T> out_high_bound(
+                            out_high, out_high_shape, arg_shape, broadcast);
+
+                        std::vector<size_t> current_dim(arg_shape.size(), 0);
+                        const auto arg_shape_size = shape_size(arg_shape);
+                        for (size_t index = 0; index < arg_shape_size; ++index)
+                        {
+                            const T in_low_val = in_low_bound.get_value(current_dim, index);
+                            const T in_high_val = in_high_bound.get_value(current_dim, index);
+                            const T out_low_val = out_low_bound.get_value(current_dim, index);
+                            const T out_high_val = out_high_bound.get_value(current_dim, index);
+
+                            out[index] = quantize(arg[index],
+                                                  in_low_val,
+                                                  in_high_val,
+                                                  out_low_val,
+                                                  out_high_val,
+                                                  levels);
+                            increment_current_dim(current_dim, arg_shape);
+                        }
                     }
-                    increment_current_dim(current_dim, arg_shape, arg_shape.size() - 1);
                 }
-                std::fesetround(initial_round_mode);
+            } // namespace v0
+
+            template <typename T>
+            void fake_quantize(const T* const arg,
+                               const T* const in_low,
+                               const T* const in_high,
+                               const T* const out_low,
+                               const T* const out_high,
+                               T* const out,
+                               const Shape& arg_shape,
+                               const Shape& in_low_shape,
+                               const Shape& in_high_shape,
+                               const Shape& out_low_shape,
+                               const Shape& out_high_shape,
+                               size_t levels)
+            {
+                v0::fake_quantize(arg,
+                                  in_low,
+                                  in_high,
+                                  out_low,
+                                  out_high,
+                                  out,
+                                  arg_shape,
+                                  in_low_shape,
+                                  in_high_shape,
+                                  out_low_shape,
+                                  out_high_shape,
+                                  levels,
+                                  op::AutoBroadcastType::NUMPY);
             }
         } // namespace reference
     }     // namespace runtime
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 19414c0059fb9a..78e14870aa5dbf 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -416,6 +416,7 @@ set(MULTI_TEST_SRC
     backend/exp.in.cpp
     backend/experimental_detectron_detection_output.in.cpp
     backend/experimental_detectron_prior_grid.in.cpp
+    backend/fake_quantize.in.cpp
     backend/floor.in.cpp
     backend/floor_mod.in.cpp
     backend/function_name.in.cpp
diff --git a/ngraph/test/backend/fake_quantize.in.cpp b/ngraph/test/backend/fake_quantize.in.cpp
new file mode 100644
index 00000000000000..363e89b31c3247
--- /dev/null
+++ b/ngraph/test/backend/fake_quantize.in.cpp
@@ -0,0 +1,187 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <memory>
+#include <string>
+#include <vector>
+
+#include "ngraph/op/parameter.hpp"
+#include "ngraph/output_vector.hpp"
+#include "ngraph/shape.hpp"
+
+// clang-format off
+#ifdef ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
+#define DEFAULT_FLOAT_TOLERANCE_BITS ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
+#endif
+
+#ifdef ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
+#define DEFAULT_DOUBLE_TOLERANCE_BITS ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
+#endif
+// clang-format on
+
+#include "gtest/gtest.h"
+#include "ngraph/ngraph.hpp"
+#include "util/engine/test_engines.hpp"
+#include "util/test_case.hpp"
+#include "util/test_control.hpp"
+
+using namespace ngraph;
+
+static std::string s_manifest = "${MANIFEST}";
+using TestEngine = test::ENGINE_CLASS_NAME(${BACKEND_NAME});
+
+namespace
+{
+    template <typename T>
+    std::vector<T> iota_vector(size_t size, T first_value = {})
+    {
+        std::vector<T> d(size);
+        std::iota(begin(d), end(d), first_value);
+        return d;
+    }
+} // namespace
+
+NGRAPH_TEST(${BACKEND_NAME}, fake_quantize)
+{
+    const Shape data_shape{1, 2, 3, 4};
+    const size_t levels = 4;
+    const auto data = std::make_shared<op::Parameter>(element::f32, data_shape);
+    const auto input_low = op::Constant::create(element::f32, Shape{}, {0.f});
+    const auto input_high = op::Constant::create(element::f32, Shape{}, {23.f});
+    const auto output_low = op::Constant::create(element::f32, Shape{}, {2.f});
+    const auto output_high = op::Constant::create(element::f32, Shape{}, {16.f});
+
+    const auto quantize = std::make_shared<op::FakeQuantize>(
+        data, input_low, input_high, output_low, output_high, levels);
+    const auto function = std::make_shared<Function>(NodeVector{quantize}, ParameterVector{data});
+    auto test_case = test::TestCase<TestEngine>(function);
+
+    test_case.add_input<float>(iota_vector<float>(shape_size(data_shape)));
+
+    // expected result
+    test_case.add_expected_output<float>(
+        data_shape,
+        std::vector<float>{2.f,          2.f,          2.f,          2.f,          6.6666669f,
+                           6.6666669f,   6.6666669f,   6.6666669f,   6.6666669f,   6.6666669f,
+                           6.6666669f,   6.6666669f,   11.33333301f, 11.33333301f, 11.33333301f,
+                           11.33333301f, 11.33333301f, 11.33333301f, 11.33333301f, 11.33333301f,
+                           16.f,         16.f,         16.f,         16.f});
+
+    test_case.run();
+}
+
+NGRAPH_TEST(${BACKEND_NAME}, fake_quantize_with_clip)
+{
+    const Shape data_shape{1, 2, 3, 4};
+    const size_t levels = 5;
+    const auto data = std::make_shared<op::Parameter>(element::f32, data_shape);
+    const auto input_low = op::Constant::create(element::f32, Shape{}, {3.f});
+    const auto input_high = op::Constant::create(element::f32, Shape{}, {17.f});
+    const auto output_low = op::Constant::create(element::f32, Shape{}, {2.f});
+    const auto output_high = op::Constant::create(element::f32, Shape{}, {16.f});
+
+    const auto quantize = std::make_shared<op::FakeQuantize>(
+        data, input_low, input_high, output_low, output_high, levels);
+    const auto function = std::make_shared<Function>(NodeVector{quantize}, ParameterVector{data});
+    auto test_case = test::TestCase<TestEngine>(function);
+
+    test_case.add_input<float>(iota_vector<float>(shape_size(data_shape)));
+
+    // expected result
+    test_case.add_expected_output<float>(
+        data_shape, std::vector<float>{2.f,  2.f,  2.f,  2.f,  2.f,   5.5f,  5.5f,  5.5f,
+                                       5.5f, 9.f,  9.f,  9.f,  12.5f, 12.5f, 12.5f, 12.5f,
+                                       16.f, 16.f, 16.f, 16.f, 16.f,  16.f,  16.f,  16.f});
+
+    test_case.run();
+}
+
+NGRAPH_TEST(${BACKEND_NAME}, fake_quantize_with_clip_across_channels)
+{
+    Shape data_shape{1, 2, 5, 5};
+    size_t levels = 5;
+    auto data = std::make_shared<op::Parameter>(element::f32, data_shape);
+    auto input_low = op::Constant::create(element::f32, Shape{2, 1, 1}, {5.f, 30.f});
+    auto input_high = op::Constant::create(element::f32, Shape{2, 1, 1}, {10.f, 40.f});
+    auto output_low = op::Constant::create(element::f32, Shape{2, 1, 1}, {0.f, 50.f});
+    auto output_high = op::Constant::create(element::f32, Shape{2, 1, 1}, {20.f, 70.f});
+
+    auto quantize = std::make_shared<op::FakeQuantize>(
+        data, input_low, input_high, output_low, output_high, levels);
+    auto function = std::make_shared<Function>(NodeVector{quantize}, ParameterVector{data});
+    auto test_case = test::TestCase<TestEngine>(function);
+
+    test_case.add_input<float>(iota_vector<float>(shape_size(data_shape)));
+
+    // expected result
+    test_case.add_expected_output<float>(
+        data_shape,
+        std::vector<float>{0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  5.0f,  10.0f, 10.0f, 15.0f,
+                           20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f,
+                           20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 50.0f, 50.0f, 50.0f, 50.0f, 50.0f,
+                           50.0f, 50.0f, 55.0f, 55.0f, 60.0f, 60.0f, 60.0f, 65.0f, 65.0f, 70.0f,
+                           70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f});
+
+    test_case.run();
+}
+
+NGRAPH_TEST(${BACKEND_NAME}, fake_quantize_pdpd)
+{
+    Shape data_shape{1, 2, 5, 5};
+    size_t levels = 5;
+    const auto broadcast = op::AutoBroadcastSpec(op::AutoBroadcastType::PDPD, 1);
+    auto data = std::make_shared<op::Parameter>(element::f32, data_shape);
+    auto input_low = op::Constant::create(element::f32, Shape{2, 1, 1, 1}, {5.f, 30.f});
+    auto input_high = op::Constant::create(element::f32, Shape{2, 1, 1, 1}, {10.f, 40.f});
+    auto output_low = op::Constant::create(element::f32, Shape{2, 1, 1, 1}, {0.f, 50.f});
+    auto output_high = op::Constant::create(element::f32, Shape{2, 1, 1, 1}, {20.f, 70.f});
+
+    auto quantize = std::make_shared<op::FakeQuantize>(
+        data, input_low, input_high, output_low, output_high, levels, broadcast);
+    auto function = std::make_shared<Function>(NodeVector{quantize}, ParameterVector{data});
+    auto test_case = test::TestCase<TestEngine>(function);
+
+    test_case.add_input<float>(iota_vector<float>(shape_size(data_shape)));
+
+    // expected result
+    test_case.add_expected_output<float>(
+        data_shape,
+        std::vector<float>{0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  5.0f,  10.0f, 10.0f, 15.0f,
+                           20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f,
+                           20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 50.0f, 50.0f, 50.0f, 50.0f, 50.0f,
+                           50.0f, 50.0f, 55.0f, 55.0f, 60.0f, 60.0f, 60.0f, 65.0f, 65.0f, 70.0f,
+                           70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f});
+
+    test_case.run();
+}
+
+NGRAPH_TEST(${BACKEND_NAME}, fake_quantize_pdpd_default_axis)
+{
+    Shape data_shape{1, 2, 5, 5};
+    size_t levels = 5;
+    const auto broadcast = op::AutoBroadcastSpec(op::AutoBroadcastType::PDPD, -1);
+    auto data = std::make_shared<op::Parameter>(element::f32, data_shape);
+    auto input_low = op::Constant::create(element::f32, Shape{2, 1, 1}, {5.f, 30.f});
+    auto input_high = op::Constant::create(element::f32, Shape{2, 1, 1}, {10.f, 40.f});
+    auto output_low = op::Constant::create(element::f32, Shape{2, 1, 1}, {0.f, 50.f});
+    auto output_high = op::Constant::create(element::f32, Shape{2, 1, 1}, {20.f, 70.f});
+
+    auto quantize = std::make_shared<op::FakeQuantize>(
+        data, input_low, input_high, output_low, output_high, levels, broadcast);
+    auto function = std::make_shared<Function>(NodeVector{quantize}, ParameterVector{data});
+    auto test_case = test::TestCase<TestEngine>(function);
+
+    test_case.add_input<float>(iota_vector<float>(shape_size(data_shape)));
+
+    // expected result
+    test_case.add_expected_output<float>(
+        data_shape,
+        std::vector<float>{0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  5.0f,  10.0f, 10.0f, 15.0f,
+                           20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f,
+                           20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 50.0f, 50.0f, 50.0f, 50.0f, 50.0f,
+                           50.0f, 50.0f, 55.0f, 55.0f, 60.0f, 60.0f, 60.0f, 65.0f, 65.0f, 70.0f,
+                           70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f});
+
+    test_case.run();
+}
diff --git a/ngraph/test/backend/fused_op.in.cpp b/ngraph/test/backend/fused_op.in.cpp
index 9eab2a77e55ae5..f6e2a13e67c235 100644
--- a/ngraph/test/backend/fused_op.in.cpp
+++ b/ngraph/test/backend/fused_op.in.cpp
@@ -254,182 +254,6 @@ NGRAPH_TEST(${BACKEND_NAME}, DISABLED_squared_difference_broadcast)
     test_case.run();
 }
 
-// TODO: Issue: 37511
-NGRAPH_TEST(${BACKEND_NAME}, DISABLED_fake_quantize)
-{
-    const Shape data_shape{1, 2, 3, 4};
-    const size_t levels = 4;
-    const auto data = make_shared<op::Parameter>(element::f32, data_shape);
-    const auto input_low = make_shared<op::Parameter>(element::f32, Shape{});
-    const auto input_high = make_shared<op::Parameter>(element::f32, Shape{});
-    const auto output_low = make_shared<op::Parameter>(element::f32, Shape{});
-    const auto output_high = make_shared<op::Parameter>(element::f32, Shape{});
-
-    const auto quantize =
-        make_shared<op::FakeQuantize>(data, input_low, input_high, output_low, output_high, levels);
-    const auto function = make_shared<Function>(
-        NodeVector{quantize},
-        ParameterVector{data, input_low, input_high, output_low, output_high});
-    auto test_case = test::TestCase<TestEngine>(function);
-
-    const size_t n_elements = shape_size(data_shape);
-    vector<float> input_data(n_elements);
-    iota(begin(input_data), end(input_data), 0);
-
-    test_case.add_input<float>(input_data);
-    // input_low
-    test_case.add_input<float>({0.0f});
-    // input_high
-    test_case.add_input<float>({23.f});
-    // output_low
-    test_case.add_input<float>({2.f});
-    // output_high
-    test_case.add_input<float>({16.f});
-
-    // expected result
-    test_case.add_expected_output<float>(
-        data_shape,
-        vector<float>{2.f,          2.f,          2.f,          2.f,          6.6666669f,
-                      6.6666669f,   6.6666669f,   6.6666669f,   6.6666669f,   6.6666669f,
-                      6.6666669f,   6.6666669f,   11.33333301f, 11.33333301f, 11.33333301f,
-                      11.33333301f, 11.33333301f, 11.33333301f, 11.33333301f, 11.33333301f,
-                      16.f,         16.f,         16.f,         16.f});
-
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, DISABLED_fake_quantize_with_clip)
-{
-    const Shape data_shape{1, 2, 3, 4};
-    const size_t levels = 5;
-    const auto data = make_shared<op::Parameter>(element::f32, data_shape);
-    const auto input_low = make_shared<op::Parameter>(element::f32, Shape{});
-    const auto input_high = make_shared<op::Parameter>(element::f32, Shape{});
-    const auto output_low = make_shared<op::Parameter>(element::f32, Shape{});
-    const auto output_high = make_shared<op::Parameter>(element::f32, Shape{});
-
-    const auto quantize =
-        make_shared<op::FakeQuantize>(data, input_low, input_high, output_low, output_high, levels);
-    const auto function = make_shared<Function>(
-        NodeVector{quantize},
-        ParameterVector{data, input_low, input_high, output_low, output_high});
-    auto test_case = test::TestCase<TestEngine>(function);
-
-    const size_t n_elements = shape_size(data_shape);
-    vector<float> input_data(n_elements);
-    iota(begin(input_data), end(input_data), 0);
-
-    test_case.add_input<float>(input_data);
-    // input_low
-    test_case.add_input<float>({3.f});
-    // input_high
-    test_case.add_input<float>({17.f});
-    // output_low
-    test_case.add_input<float>({2.f});
-    // output_high
-    test_case.add_input<float>({16.f});
-
-    // expected result
-    test_case.add_expected_output<float>(
-        data_shape,
-        vector<float>{2.f,   2.f,   2.f,   2.f,   2.f,  5.5f, 5.5f, 5.5f, 5.5f, 9.f,  9.f,  9.f,
-                      12.5f, 12.5f, 12.5f, 12.5f, 16.f, 16.f, 16.f, 16.f, 16.f, 16.f, 16.f, 16.f});
-
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, DISABLED_fake_quantize_with_clip_across_channels)
-{
-    Shape data_shape{1, 2, 5, 5};
-    size_t levels = 5;
-    auto data = make_shared<op::Parameter>(element::f32, data_shape);
-    auto input_low = make_shared<op::Parameter>(element::f32, Shape{2, 1, 1});
-    auto input_high = make_shared<op::Parameter>(element::f32, Shape{2, 1, 1});
-    auto output_low = make_shared<op::Parameter>(element::f32, Shape{2, 1, 1});
-    auto output_high = make_shared<op::Parameter>(element::f32, Shape{2, 1, 1});
-
-    auto quantize =
-        make_shared<op::FakeQuantize>(data, input_low, input_high, output_low, output_high, levels);
-    auto function = make_shared<Function>(
-        NodeVector{quantize},
-        ParameterVector{data, input_low, input_high, output_low, output_high});
-    auto test_case = test::TestCase<TestEngine>(function);
-
-    size_t n_elements = shape_size(data_shape);
-    vector<float> input_data(n_elements);
-    iota(begin(input_data), end(input_data), 0);
-
-    test_case.add_input<float>(input_data);
-    // input_low
-    test_case.add_input<float>(vector<float>{5.f, 30.f});
-    // input_high
-    test_case.add_input<float>(vector<float>{10.f, 40.f});
-    // output_low
-    test_case.add_input<float>(vector<float>{0.f, 50.f});
-    // output_high
-    test_case.add_input<float>(vector<float>{20.f, 70.f});
-
-    // expected result
-    test_case.add_expected_output<float>(
-        data_shape,
-        vector<float>{0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  5.0f,  10.0f, 10.0f, 15.0f,
-                      20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f,
-                      20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 50.0f, 50.0f, 50.0f, 50.0f, 50.0f,
-                      50.0f, 50.0f, 55.0f, 55.0f, 60.0f, 60.0f, 60.0f, 65.0f, 65.0f, 70.0f,
-                      70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f});
-
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, DISABLED_fake_quantize_pdpd)
-{
-    Shape data_shape{1, 2, 5, 5};
-    size_t levels = 5;
-    auto data = make_shared<op::Parameter>(element::f32, data_shape);
-    auto input_low = make_shared<op::Parameter>(element::f32, Shape{2});
-    auto input_high = make_shared<op::Parameter>(element::f32, Shape{2});
-    auto output_low = make_shared<op::Parameter>(element::f32, Shape{2});
-    auto output_high = make_shared<op::Parameter>(element::f32, Shape{2});
-
-    auto quantize =
-        make_shared<op::FakeQuantize>(data,
-                                      input_low,
-                                      input_high,
-                                      output_low,
-                                      output_high,
-                                      levels,
-                                      op::AutoBroadcastSpec(op::AutoBroadcastType::PDPD, 1));
-    auto function = make_shared<Function>(
-        NodeVector{quantize},
-        ParameterVector{data, input_low, input_high, output_low, output_high});
-    auto test_case = test::TestCase<TestEngine>(function);
-
-    size_t n_elements = shape_size(data_shape);
-    vector<float> input_data(n_elements);
-    iota(begin(input_data), end(input_data), 0);
-
-    test_case.add_input<float>(input_data);
-    // input_low
-    test_case.add_input<float>(vector<float>{5.f, 30.f});
-    // input_high
-    test_case.add_input<float>(vector<float>{10.f, 40.f});
-    // output_low
-    test_case.add_input<float>(vector<float>{0.f, 50.f});
-    // output_high
-    test_case.add_input<float>(vector<float>{20.f, 70.f});
-
-    // expected result
-    test_case.add_expected_output<float>(
-        data_shape,
-        vector<float>{0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  0.0f,  5.0f,  10.0f, 10.0f, 15.0f,
-                      20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 20.0f,
-                      20.0f, 20.0f, 20.0f, 20.0f, 20.0f, 50.0f, 50.0f, 50.0f, 50.0f, 50.0f,
-                      50.0f, 50.0f, 55.0f, 55.0f, 60.0f, 60.0f, 60.0f, 65.0f, 65.0f, 70.0f,
-                      70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f, 70.0f});
-
-    test_case.run();
-}
-
 NGRAPH_TEST(${BACKEND_NAME}, depth_to_space_space_to_depth_block_first)
 {
     auto backend = runtime::Backend::create("${BACKEND_NAME}");
diff --git a/ngraph/test/runtime/ie/unit_test.manifest b/ngraph/test/runtime/ie/unit_test.manifest
index ea38479783dc66..bc65f4700a527a 100644
--- a/ngraph/test/runtime/ie/unit_test.manifest
+++ b/ngraph/test/runtime/ie/unit_test.manifest
@@ -255,10 +255,11 @@ numeric_float_nan
 numeric_float_inf
 numeric_double_nan
 numeric_double_inf
-fake_quantize
-fake_quantize_with_clip
-fake_quantize_with_clip_across_channels
+
 fake_quantize_pdpd
+IE_GPU.fake_quantize
+IE_GPU.fake_quantize_with_clip
+IE_GPU.fake_quantize_with_clip_across_channels
 
 # <op name> has zero dimension that is not allowable
 zero_sized_abs
diff --git a/ngraph/test/runtime/interpreter/evaluates_map.cpp b/ngraph/test/runtime/interpreter/evaluates_map.cpp
index c068f14c7defea..8e29acd20fbfa6 100644
--- a/ngraph/test/runtime/interpreter/evaluates_map.cpp
+++ b/ngraph/test/runtime/interpreter/evaluates_map.cpp
@@ -1227,7 +1227,7 @@ namespace
                                                 info.selected_outputs_shape,
                                                 selected_indices.data(),
                                                 info.selected_indices_shape,
-                                                valid_outputs.data());                                                  
+                                                valid_outputs.data());
 
         void* pscores = nullptr;
         void* pselected_num = nullptr;
@@ -2437,18 +2437,19 @@ namespace
                   const HostTensorVector& inputs)
     {
         using T = typename element_type_traits<ET>::value_type;
-        runtime::reference::fake_quantize<T>(inputs[0]->get_data_ptr<const T>(),
-                                             inputs[1]->get_data_ptr<const T>(),
-                                             inputs[2]->get_data_ptr<const T>(),
-                                             inputs[3]->get_data_ptr<const T>(),
-                                             inputs[4]->get_data_ptr<const T>(),
-                                             outputs[0]->get_data_ptr<T>(),
-                                             op->get_input_shape(0),
-                                             op->get_input_shape(1),
-                                             op->get_input_shape(2),
-                                             op->get_input_shape(3),
-                                             op->get_input_shape(4),
-                                             op->get_levels());
+        runtime::reference::v0::fake_quantize<T>(inputs[0]->get_data_ptr<const T>(),
+                                                 inputs[1]->get_data_ptr<const T>(),
+                                                 inputs[2]->get_data_ptr<const T>(),
+                                                 inputs[3]->get_data_ptr<const T>(),
+                                                 inputs[4]->get_data_ptr<const T>(),
+                                                 outputs[0]->get_data_ptr<T>(),
+                                                 op->get_input_shape(0),
+                                                 op->get_input_shape(1),
+                                                 op->get_input_shape(2),
+                                                 op->get_input_shape(3),
+                                                 op->get_input_shape(4),
+                                                 op->get_levels(),
+                                                 op->get_auto_broadcast());
         return true;
     }
 
@@ -2523,7 +2524,7 @@ namespace
                     op->get_merge_repeated());
             }
         }
-    }
+    } // ctc_greedy_decoder_v6
     template <element::Type_t ET>
     bool evaluate(const shared_ptr<op::v6::CTCGreedyDecoderSeqLen>& op,
                   const HostTensorVector& outputs,
@@ -2781,7 +2782,7 @@ namespace
     {
         using T = typename element_type_traits<ET>::value_type;
         NGRAPH_CHECK(inputs.size() > 1 && inputs[1]->get_shape().size() == 2,
-                        "2D tensor must be provided as second input. ");
+                     "2D tensor must be provided as second input. ");
         outputs[0]->set_shape({inputs[1]->get_shape()[0],
                                static_cast<size_t>(op->get_output_dim()),
                                static_cast<size_t>(op->get_group_size()),
diff --git a/ngraph/test/runtime/interpreter/unit_test.manifest b/ngraph/test/runtime/interpreter/unit_test.manifest
index 370d803d3b7502..97183b4f61b758 100644
--- a/ngraph/test/runtime/interpreter/unit_test.manifest
+++ b/ngraph/test/runtime/interpreter/unit_test.manifest
@@ -1,5 +1,3 @@
-fake_quantize_pdpd
-
 INTERPRETER.onnx_model_quant_conv_linear
 INTERPRETER.onnx_top_k_opset_10
 
diff --git a/ngraph/test/visitors/op/fake_quantize.cpp b/ngraph/test/visitors/op/fake_quantize.cpp
index 161e65f5ed8432..8746ed547d85c9 100644
--- a/ngraph/test/visitors/op/fake_quantize.cpp
+++ b/ngraph/test/visitors/op/fake_quantize.cpp
@@ -35,6 +35,10 @@ TEST(attributes, fake_quantize_op)
     NodeBuilder builder(fake_quantize);
     auto g_fake_quantize = as_type_ptr<opset1::FakeQuantize>(builder.create());
 
+    // attribute count
+    const auto expected_attr_count = 2;
+    EXPECT_EQ(builder.get_value_map_size(), expected_attr_count);
+
     EXPECT_EQ(g_fake_quantize->get_levels(), fake_quantize->get_levels());
     EXPECT_EQ(g_fake_quantize->get_auto_broadcast(), fake_quantize->get_auto_broadcast());
 }

From c3c26b4807cfca81895d56fbf5dd4501a9c59857 Mon Sep 17 00:00:00 2001
From: Edward Shogulin <edward.shogulin@intel.com>
Date: Mon, 19 Jul 2021 14:48:20 +0100
Subject: [PATCH 02/71] [LPT] Refactoring: PoC (#5226)

* LPT fix for Windows

* LPT fix for Windows

* Remove inference_engine_transformations_EXPORTS

* [nGraph] Register new node in GraphRewrite

* [LPT] nGraph alignment

* [LPT] nGraph alignment: tests

Co-authored-by: Ilya Lavrenov <ilya.lavrenov@intel.com>
---
 .../src/cldnn_engine/cldnn_engine.cpp         | 103 +++-
 .../CMakeLists.txt                            |   2 -
 .../include/low_precision/add.hpp             |   9 +-
 .../align_quantization_intervals.hpp          |  25 +
 .../align_quantization_parameters.hpp         |  26 +
 .../include/low_precision/avg_pool.hpp        |   8 +-
 .../low_precision/base_matcher_pass.hpp       |  24 +
 .../include/low_precision/clamp.hpp           |   8 +-
 .../common/dequantization_op.hpp              |  12 +-
 .../common/fake_quantize_dequantization.hpp   |   3 +-
 .../low_precision/common/ie_lpt_exception.hpp |   6 +-
 ...on_per_tensor_quantization_restriction.hpp |  56 ++
 .../operation_precision_restriction.hpp       |  59 ++
 .../include/low_precision/common/subgraph.hpp |  42 --
 .../include/low_precision/concat.hpp          |  27 +-
 .../low_precision/concat_multi_channels.hpp   |  51 --
 .../include/low_precision/convert.hpp         |   9 +-
 .../convert_subtract_constant.hpp             |   4 +-
 .../include/low_precision/convolution.hpp     |  11 +-
 .../convolution_backprop_data.hpp             |  10 +-
 .../low_precision/create_attribute.hpp        |  61 +++
 .../create_precisions_dependent_attribute.hpp |  70 +++
 .../include/low_precision/depth_to_space.hpp  |   9 +-
 .../eltwise_base_transformation.hpp           |   2 +-
 .../include/low_precision/fake_quantize.hpp   |  13 +-
 .../fake_quantize_decomposition.hpp           |   8 +-
 .../include/low_precision/fold_convert.hpp    |   9 +-
 .../low_precision/fold_fake_quantize.hpp      |  25 +
 .../include/low_precision/fuse_convert.hpp    |   9 +-
 .../low_precision/fuse_fake_quantize.hpp      |   9 +-
 .../fuse_multiply_to_fake_quantize.hpp        |   9 +-
 .../fuse_subtract_to_fake_quantize.hpp        |   9 +-
 .../low_precision/group_convolution.hpp       |  11 +-
 .../ilayer_transformations_manager.hpp        |  24 -
 .../include/low_precision/interpolate.hpp     |   9 +-
 .../include/low_precision/iparams_manager.hpp |  24 -
 .../low_precision/layer_transformation.hpp    | 191 ++-----
 .../include/low_precision/low_precision.hpp   |  74 +++
 .../low_precision/lpt_itt.hpp}                |   3 +-
 .../include/low_precision/lpt_visibility.hpp  |  18 +
 .../include/low_precision/main.hpp            |  36 --
 .../markup_avg_pool_precision_preserved.hpp   |  25 +
 .../low_precision/markup_can_be_quantized.hpp |  25 +
 .../markup_per_tensor_quantization.hpp        |  44 ++
 .../low_precision/markup_precisions.hpp       |  47 ++
 .../include/low_precision/mat_mul.hpp         |  10 +-
 .../include/low_precision/max_pool.hpp        |   8 +-
 .../include/low_precision/multiply.hpp        |   9 +-
 .../multiply_to_group_convolution.hpp         |  15 +-
 .../include/low_precision/mvn.hpp             |   8 +-
 .../include/low_precision/network_helper.hpp  | 175 +++++-
 .../include/low_precision/normalize_l2.hpp    |   8 +-
 .../include/low_precision/prelu.hpp           |   9 +-
 .../low_precision/propagate_precisions.hpp    |  29 +
 .../low_precision/propagate_shared_value.hpp  | 164 ++++++
 .../propagate_through_precision_preserved.hpp | 118 ++++
 .../low_precision/propagate_to_input.hpp      | 105 ++++
 .../pull_reshape_through_dequantization.hpp   |   4 +-
 .../pull_transpose_through_dequantization.hpp |   4 +-
 .../low_precision/quantization_details.hpp    |  26 +-
 .../reduce_base_transformation.hpp            |   6 +-
 .../include/low_precision/reduce_max.hpp      |   6 +-
 .../include/low_precision/reduce_mean.hpp     |   6 +-
 .../include/low_precision/reduce_min.hpp      |   6 +-
 .../include/low_precision/reduce_sum.hpp      |   4 +-
 .../include/low_precision/relu.hpp            |   9 +-
 .../include/low_precision/reshape.hpp         |   9 +-
 .../rt_info/attribute_parameters.hpp          |  14 +
 ...avg_pool_precision_preserved_attribute.hpp |  39 ++
 .../rt_info/intervals_alignment_attribute.hpp |  88 +++
 .../per_tensor_quantization_attribute.hpp     |  33 ++
 .../rt_info/precision_preserved_attribute.hpp |  51 ++
 .../rt_info/precisions_attribute.hpp          |  64 +++
 .../quantization_alignment_attribute.hpp      |  60 +++
 .../rt_info/shared_value_attribute.hpp        |  59 ++
 .../low_precision/shuffle_channels.hpp        |   8 +-
 .../include/low_precision/split.hpp           |   8 +-
 .../include/low_precision/squeeze.hpp         |   8 +-
 .../include/low_precision/strided_slice.hpp   |   8 +-
 .../include/low_precision/subtract.hpp        |   9 +-
 .../subtract_multiply_to_multiply_add.hpp     |   9 +-
 .../low_precision/transformation_context.hpp  |   3 +-
 .../include/low_precision/transformer.hpp     | 316 -----------
 .../transparent_base_transformation.hpp       |   4 +-
 .../include/low_precision/transpose.hpp       |   9 +-
 .../include/low_precision/unsqueeze.hpp       |   8 +-
 .../update_shared_precision_preserved.hpp     | 107 ++++
 .../include/low_precision/variadic_split.hpp  |   6 +-
 .../weightable_layer_transformation.hpp       |  19 +-
 .../low_precision_transformations/src/add.cpp |  20 +-
 .../src/align_quantization_intervals.cpp      |  25 +
 .../src/align_quantization_parameters.cpp     |  27 +
 .../src/avg_pool.cpp                          |  39 +-
 .../src/base_matcher_pass.cpp                 |  13 +
 .../src/clamp.cpp                             |  23 +-
 .../operation_precision_restriction.cpp       |  19 +
 .../src/concat.cpp                            | 451 +++++-----------
 .../src/concat_multi_channels.cpp             | 334 ------------
 .../src/convert.cpp                           |  20 +-
 .../src/convolution.cpp                       |  70 ++-
 .../src/convolution_backprop_data.cpp         |  76 +--
 .../create_precisions_dependent_attribute.cpp |  22 +
 .../src/depth_to_space.cpp                    |  27 +-
 .../src/fake_quantize.cpp                     |  32 +-
 .../src/fake_quantize_decomposition.cpp       | 435 +++++++++++----
 .../src/fold_convert.cpp                      |  22 +-
 .../src/fold_fake_quantize.cpp                |  64 +++
 .../src/fuse_convert.cpp                      |  49 +-
 .../src/fuse_fake_quantize.cpp                |  20 +-
 .../src/fuse_multiply_to_fake_quantize.cpp    |  26 +-
 .../src/fuse_subtract_to_fake_quantize.cpp    |  20 +-
 .../src/group_convolution.cpp                 |  29 +-
 .../src/interpolate.cpp                       |  52 +-
 .../src/layer_transformation.cpp              | 268 +++-------
 .../src/low_precision.cpp                     | 283 ++++++++++
 .../markup_avg_pool_precision_preserved.cpp   |  26 +
 .../src/markup_can_be_quantized.cpp           |  59 ++
 .../src/markup_per_tensor_quantization.cpp    |  85 +++
 .../src/markup_precisions.cpp                 | 217 ++++++++
 .../src/mat_mul.cpp                           |  72 ++-
 .../src/max_pool.cpp                          |  23 +-
 .../src/multiply.cpp                          |  21 +-
 .../src/multiply_to_group_convolution.cpp     |  56 +-
 .../low_precision_transformations/src/mvn.cpp |  37 +-
 .../src/network_helper.cpp                    | 233 ++++++--
 .../src/normalize_l2.cpp                      |  31 +-
 .../src/prelu.cpp                             |  24 +-
 .../src/propagate_precisions.cpp              |  29 +
 .../src/quantization_details.cpp              | 151 ++----
 .../src/reduce_base_transformation.cpp        |   2 +-
 .../src/reduce_max.cpp                        |  21 +-
 .../src/reduce_mean.cpp                       |  21 +-
 .../src/reduce_min.cpp                        |  21 +-
 .../src/reduce_sum.cpp                        |  21 +-
 .../src/relu.cpp                              |  24 +-
 .../src/reshape.cpp                           |  30 +-
 ...avg_pool_precision_preserved_attribute.cpp |  27 +
 .../rt_info/intervals_alignment_attribute.cpp | 216 ++++++++
 .../per_tensor_quantization_attribute.cpp     |  10 +
 .../rt_info/precision_preserved_attribute.cpp |  26 +
 .../src/rt_info/precisions_attribute.cpp      |  80 +++
 .../quantization_alignment_attribute.cpp      |  90 ++++
 .../src/rt_info/shared_value_attribute.cpp    |  16 +
 .../src/shuffle_channels.cpp                  |  25 +-
 .../src/split.cpp                             |  46 +-
 .../src/squeeze.cpp                           |  23 +-
 .../src/strided_slice.cpp                     |  26 +-
 .../src/subgraph.cpp                          | 246 ---------
 .../src/subtract.cpp                          |  31 +-
 .../src/subtract_multiply_to_multiply_add.cpp |  20 +-
 .../src/transformation_context.cpp            |   2 +
 .../src/transformer.cpp                       | 504 ------------------
 .../src/transparent_base_transformation.cpp   |   2 +-
 .../src/transpose.cpp                         |  24 +-
 .../src/unsqueeze.cpp                         |  23 +-
 .../src/variadic_split.cpp                    |  31 +-
 .../src/weightable_layer_transformation.cpp   |  63 ++-
 .../src/mkldnn_plugin/mkldnn_graph.cpp        |   6 +-
 .../src/mkldnn_plugin/mkldnn_plugin.cpp       |  69 ++-
 .../lp_transformations/add_transformation.cpp |  11 +-
 ...quantization_parameters_transformation.cpp | 179 +++++++
 .../avg_pool_transformation.cpp               |   9 +-
 .../avg_pool_with_child_transformation.cpp    | 183 +++++++
 .../clamp_transformation.cpp                  |   2 +-
 .../compose_fake_quantize_transformation.cpp  |   2 +-
 ...ction_with_intermediate_transformation.cpp |  16 +-
 .../concat_transformation.cpp                 | 471 +++++++++++++---
 ...t_with_different_precision_on_children.cpp |  23 +-
 ...ate_precision_selection_transformation.cpp |  26 +-
 ...th_intermediate_reshape_transformation.cpp |   8 +-
 ...oncat_with_intermediate_transformation.cpp |  50 +-
 ...ermediate_with_constant_transformation.cpp |  22 +-
 .../concat_with_neighbors_transformation.cpp  | 149 ++++--
 ...ghbors_transformation_with_convolution.cpp | 269 ++++++++++
 ...th_not_quantized_parent_transformation.cpp | 315 +++++++++++
 ...with_reshape_at_the_end_transformation.cpp |  10 +-
 .../concat_with_split_transformation.cpp      |  58 +-
 ...ncat_with_strided_slice_transformation.cpp |  27 +-
 ...lly_transformation_with_dequantization.cpp |   2 +-
 ...nvert_subtract_constant_transformation.cpp |   2 +-
 ...nvolution_backprop_data_transformation.cpp |   2 +-
 .../convolution_qdq_transformation.cpp        |   2 +-
 .../convolution_transformation.cpp            |  55 +-
 .../convolution_with_incorrect_weights.cpp    |  34 +-
 .../depth_to_space_transformation.cpp         |   5 +-
 ...i_parent_dequantization_transformation.cpp |   9 +-
 ...d_two_output_branches_with_convolution.cpp |  34 +-
 ...tize_on_weights_with_unsupported_child.cpp |  20 +-
 ...ize_precision_selection_transformation.cpp |  18 +-
 .../fake_quantize_transformation.cpp          | 110 ++--
 ...ize_with_dq_not_optimal_transformation.cpp |  22 +-
 ..._with_dynamic_intervals_transformation.cpp |   2 +-
 .../fold_convert_transformation.cpp           |   5 +-
 .../fold_fake_quantize_in_transformations.cpp |   5 +-
 .../fuse_convert_transformation.cpp           |   2 +-
 .../fuse_fake_quantize_transformation.cpp     |   3 +-
 ...ntize_with_multi_inputs_transformation.cpp |   3 +-
 ...ltiply_to_fake_quantize_transformation.cpp |  10 +-
 ...btract_to_fake_quantize_transformation.cpp |  14 +-
 .../group_convolution_transformation.cpp      |  14 +-
 .../interpolate_transformation.cpp            |   2 +-
 .../is_function_quantized_transformation.cpp  |   4 +-
 .../layer_transformation.cpp                  | 151 ++++--
 .../layer_transformation.hpp                  | 246 ++++++++-
 .../low_precision_transformations_test.cpp    | 106 ++--
 .../lpt_public_methods_test.cpp               |  37 +-
 ...kup_avg_pool_precisions_transformation.cpp | 388 ++++++++++++++
 .../mat_mul_transformation.cpp                |   3 +-
 .../mat_mul_with_constant_transformation.cpp  |  11 +-
 .../max_pool_transformation.cpp               |   5 +-
 ...ve_dequantization_after_transformation.cpp |   2 +-
 ..._to_scaleshift_or_power_transformation.cpp |   2 +-
 ...ly_to_group_convolution_transformation.cpp |  45 +-
 .../multiply_transformation.cpp               |   9 +-
 .../lp_transformations/mvn_transformation.cpp |   2 +-
 ...ormalize_dequantization_transformation.cpp |   2 +-
 .../normalize_l2_transformation.cpp           |   5 +-
 .../precision_details_test.cpp                |  10 +-
 .../prelu_transformation.cpp                  |   2 +-
 ..._through_dequantization_transformation.cpp |   2 +-
 ..._through_dequantization_transformation.cpp |   2 +-
 .../reduce_max_transformation.cpp             |   5 +-
 .../reduce_mean_transformation.cpp            |   5 +-
 .../reduce_min_transformation.cpp             |   5 +-
 .../reduce_sum_transformation.cpp             |   5 +-
 .../reduce_transformation.hpp                 |   2 +-
 .../relu_transformation.cpp                   |   4 +-
 .../reshape_transformation.cpp                |   2 +-
 ...te_in_standalone_branch_transformation.cpp |   5 +-
 .../shuffle_channels_transformation.cpp       |   6 +-
 .../simple_low_precision_transformer.cpp      |  99 +---
 .../simple_low_precision_transformer.hpp      |  57 +-
 .../split_transformation.cpp                  |   2 +-
 .../squeeze_transformation.cpp                |   5 +-
 .../strided_slice_transformation.cpp          |   4 +-
 ...ultiply_to_multiply_add_transformation.cpp |   5 +-
 ...sformations_after_split_transformation.cpp |  59 +-
 .../transformer_is_function_quantized.cpp     |   4 +-
 .../transpose_transformation.cpp              |   2 +-
 .../unsqueeze_transformation.cpp              |   5 +-
 .../variadic_split_transformation.cpp         |   2 +-
 .../clamp_transformation.cpp                  |   6 +-
 ...t_with_different_precision_on_children.cpp |   2 +-
 ...oncat_with_intermediate_transformation.cpp |   8 +-
 .../concat_with_neighbors_transformation.cpp  |   8 +-
 .../concat_with_split_transformation.cpp      |   8 +-
 .../convolution_qdq_transformation.cpp        |   4 +-
 .../fake_quantize_transformation.cpp          |   2 +-
 ...ize_with_dq_not_optimal_transformation.cpp |   4 +-
 .../gemm_transformation.cpp                   |   7 +-
 .../group_convolution_transformation.cpp      |  33 +-
 .../groupconvolution_qdq_transformation.cpp   |   4 +-
 .../mat_mul_transformation.cpp                |   6 +-
 ...put_layers_handling_in_transformations.cpp |   4 +-
 ...handling_in_transformations_for_concat.cpp |   4 +-
 ...ansformations_for_concat_multi_channel.cpp |   4 +-
 .../reshape_transformation.cpp                |   6 +-
 .../split_transformation.cpp                  |   6 +-
 .../squeeze_transformation.cpp                |   4 +-
 .../strided_slice_transformation.cpp          |   8 +-
 .../subtract_transformation.cpp               |   6 +-
 .../transpose_after_matmul_transformation.cpp |   6 +-
 .../unsqueeze_transformation.cpp              |   4 +-
 .../variadic_split_transformation.cpp         |   6 +-
 .../clamp_transformation.cpp                  |   8 +-
 ...t_with_different_precision_on_children.cpp |   2 +-
 ...oncat_with_intermediate_transformation.cpp |   8 +-
 ...at_with_neighbors_graph_transformation.cpp |   8 +-
 .../concat_with_split_transformation.cpp      |   8 +-
 .../convolution_qdq_transformation.cpp        |   2 +-
 .../convolution_transformation.cpp            |   2 +-
 .../fake_quantize_transformation.cpp          |   2 +-
 ...ize_with_dq_not_optimal_transformation.cpp |   2 +-
 .../group_convolution_transformation.cpp      |   9 +-
 .../groupconvolution_qdq_transformation.cpp   |   4 +-
 .../layer_transformation.cpp                  | 132 +----
 ..._through_dequantization_transformation.cpp |   2 +-
 .../reshape_transformation.cpp                |   6 +-
 .../split_transformation.cpp                  |   8 +-
 .../squeeze_transformation.cpp                |   4 +-
 .../unsqueeze_transformation.cpp              |   4 +-
 .../variadic_split_transformation.cpp         |   8 +-
 .../add_transformation.hpp                    |   3 -
 .../clamp_transformation.hpp                  |   3 +-
 .../concat_transformation.hpp                 |   3 -
 ...t_with_different_precision_on_children.hpp |   3 -
 ...oncat_with_intermediate_transformation.hpp |   5 +-
 ...at_with_neighbors_graph_transformation.hpp |   5 +-
 .../convolution_transformation.hpp            |   3 -
 .../convolution_with_incorrect_weights.hpp    |   3 -
 .../depth_to_space_transformation.hpp         |   3 -
 ...e_quantize_and_avg_pool_transformation.hpp |   3 -
 ...e_quantize_and_max_pool_transformation.hpp |   3 -
 ...d_two_output_branches_with_convolution.hpp |   3 -
 ...ize_precision_selection_transformation.hpp |   3 -
 .../fake_quantize_transformation.hpp          |   3 +-
 .../fully_connected_transformation.hpp        |   3 -
 .../fuse_convert_transformation.hpp           |   3 -
 ...uantize_and_scale_shift_transformation.hpp |   3 -
 .../fuse_fake_quantize_transformation.hpp     |   3 -
 ...ltiply_to_fake_quantize_transformation.hpp |   3 -
 ...btract_to_fake_quantize_transformation.hpp |   3 -
 .../gemm_transformation.hpp                   |   3 -
 .../group_convolution_transformation.hpp      |   6 +-
 .../interpolate_transformation.hpp            |   3 -
 .../mat_mul_transformation.hpp                |   3 -
 .../mat_mul_with_constant_transformation.hpp  |   3 -
 ..._constant_fake_quantize_transformation.hpp |   3 -
 .../multiply_transformation.hpp               |   3 -
 .../mvn_transformation.hpp                    |   3 -
 .../normalize_transformation.hpp              |   3 -
 .../prelu_transformation.hpp                  |   3 -
 .../relu_transformation.hpp                   |   3 -
 .../reshape_transformation.hpp                |   3 -
 .../split_transformation.hpp                  |   4 +-
 .../squeeze_transformation.hpp                |   3 -
 .../strided_slice_transformation.hpp          |   4 +-
 ...ultiply_to_multiply_add_transformation.hpp |   3 -
 .../transpose_after_matmul_transformation.hpp |   3 -
 .../transpose_transformation.hpp              |   3 -
 .../unsqueeze_transformation.hpp              |   3 -
 .../variadic_split_transformation.hpp         |   4 +-
 .../add_transformation.cpp                    |  31 +-
 .../clamp_transformation.cpp                  |  34 --
 .../concat_transformation.cpp                 |  31 +-
 ...t_with_different_precision_on_children.cpp |  24 +-
 ...oncat_with_intermediate_transformation.cpp |  31 +-
 ...at_with_neighbors_graph_transformation.cpp |  22 +-
 .../concat_with_split_transformation.cpp      |   2 +-
 .../convolution_transformation.cpp            |  30 --
 .../convolution_with_incorrect_weights.cpp    |  25 -
 .../depth_to_space_transformation.cpp         |  23 -
 ...e_quantize_and_avg_pool_transformation.cpp |  20 -
 ...e_quantize_and_max_pool_transformation.cpp |  20 -
 ...d_two_output_branches_with_convolution.cpp |  27 -
 ...ize_precision_selection_transformation.cpp |  33 --
 .../fake_quantize_transformation.cpp          |   9 +-
 .../fully_connected_transformation.cpp        |  17 -
 .../fuse_convert_transformation.cpp           |   1 -
 ...uantize_and_scale_shift_transformation.cpp |  19 -
 .../fuse_fake_quantize_transformation.cpp     |  15 -
 ...ltiply_to_fake_quantize_transformation.cpp |  15 -
 ...btract_to_fake_quantize_transformation.cpp |  15 -
 .../gemm_transformation.cpp                   |  22 +-
 .../group_convolution_transformation.cpp      |  30 +-
 .../interpolate_transformation.cpp            |  23 -
 .../layer_transformation.cpp                  | 112 +---
 .../mat_mul_transformation.cpp                |  17 -
 .../mat_mul_with_constant_transformation.cpp  |  19 -
 ..._constant_fake_quantize_transformation.cpp |  18 -
 ...ly_to_group_convolution_transformation.cpp |   1 -
 .../multiply_transformation.cpp               |  39 +-
 .../mvn_transformation.cpp                    |  24 -
 .../normalize_transformation.cpp              |  27 +-
 ...ansformations_for_concat_multi_channel.cpp |   2 +-
 .../prelu_transformation.cpp                  |  21 -
 .../relu_transformation.cpp                   |  22 -
 .../reshape_transformation.cpp                |  22 -
 .../split_transformation.cpp                  |  24 -
 .../squeeze_transformation.cpp                |  18 -
 .../strided_slice_transformation.cpp          |  18 -
 ...ultiply_to_multiply_add_transformation.cpp |  16 -
 .../transpose_after_matmul_transformation.cpp |  19 -
 .../transpose_transformation.cpp              |  21 -
 .../unsqueeze_transformation.cpp              |  18 -
 .../variadic_split_transformation.cpp         |  24 -
 .../layer_transformation.hpp                  |  20 +-
 .../layer_transformation.cpp                  |  36 +-
 ...oncat_quantization_parameters_function.hpp |  41 ++
 .../avg_pool_function.hpp                     |   7 +-
 .../lpt_ngraph_functions/common/builders.hpp  |  55 +-
 .../common/fake_quantize_on_data.hpp          |   8 +-
 .../lpt_ngraph_functions/concat_function.hpp  |  22 +-
 .../convolution_function.hpp                  |   3 +-
 .../fake_quantize_function.hpp                |   8 +-
 .../group_convolution_function.hpp            |   3 +-
 .../markup_avg_pool_precisions_function.hpp   |  50 ++
 .../precision_propagation_function.hpp        |  51 ++
 ...oncat_quantization_parameters_function.cpp | 242 +++++++++
 .../src/avg_pool_function.cpp                 |  67 ++-
 .../src/common/builders.cpp                   |  74 ++-
 .../src/common/fake_quantize_on_data.cpp      |  12 +-
 .../src/concat_function.cpp                   | 222 +++++++-
 .../src/convolution_function.cpp              |   8 +-
 ...fake_quantize_and_convolution_function.cpp |  16 +-
 ...put_branches_with_convolution_function.cpp |   4 +-
 .../src/fake_quantize_function.cpp            |  45 +-
 .../src/group_convolution_function.cpp        |  30 +-
 .../markup_avg_pool_precisions_function.cpp   | 234 ++++++++
 .../src/precision_propagation_function.cpp    | 302 +++++++++++
 .../transformations_after_split_function.cpp  |   6 +-
 .../low_precision/calclulate_levels_test.cpp  |  84 +++
 .../include/ngraph/pass/graph_rewrite.hpp     |   7 +
 393 files changed, 9559 insertions(+), 5323 deletions(-)
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_intervals.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_parameters.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/base_matcher_pass.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/common/operation_per_tensor_quantization_restriction.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/common/operation_precision_restriction.hpp
 delete mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/common/subgraph.hpp
 delete mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/concat_multi_channels.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/create_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/create_precisions_dependent_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/fold_fake_quantize.hpp
 delete mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/ilayer_transformations_manager.hpp
 delete mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/iparams_manager.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/low_precision.hpp
 rename inference-engine/src/low_precision_transformations/{src/lpt_itt.h => include/low_precision/lpt_itt.hpp} (95%)
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/lpt_visibility.hpp
 delete mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/main.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/markup_avg_pool_precision_preserved.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/markup_can_be_quantized.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/markup_per_tensor_quantization.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/markup_precisions.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/propagate_precisions.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/propagate_shared_value.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/propagate_through_precision_preserved.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/propagate_to_input.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/attribute_parameters.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/intervals_alignment_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/per_tensor_quantization_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precision_preserved_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precisions_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/quantization_alignment_attribute.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/rt_info/shared_value_attribute.hpp
 delete mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/transformer.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/include/low_precision/update_shared_precision_preserved.hpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/align_quantization_intervals.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/align_quantization_parameters.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/base_matcher_pass.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/common/operation_precision_restriction.cpp
 delete mode 100644 inference-engine/src/low_precision_transformations/src/concat_multi_channels.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/create_precisions_dependent_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/low_precision.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/markup_avg_pool_precision_preserved.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/markup_can_be_quantized.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/markup_per_tensor_quantization.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/markup_precisions.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/propagate_precisions.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/avg_pool_precision_preserved_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/per_tensor_quantization_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/precision_preserved_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/precisions_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/quantization_alignment_attribute.cpp
 create mode 100644 inference-engine/src/low_precision_transformations/src/rt_info/shared_value_attribute.cpp
 delete mode 100644 inference-engine/src/low_precision_transformations/src/subgraph.cpp
 delete mode 100644 inference-engine/src/low_precision_transformations/src/transformer.cpp
 create mode 100644 inference-engine/tests/functional/inference_engine/lp_transformations/align_concat_quantization_parameters_transformation.cpp
 create mode 100644 inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_with_child_transformation.cpp
 create mode 100644 inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation_with_convolution.cpp
 create mode 100644 inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_not_quantized_parent_transformation.cpp
 create mode 100644 inference-engine/tests/functional/inference_engine/lp_transformations/markup_avg_pool_precisions_transformation.cpp
 create mode 100644 inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/align_concat_quantization_parameters_function.hpp
 create mode 100644 inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/markup_avg_pool_precisions_function.hpp
 create mode 100644 inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/precision_propagation_function.hpp
 create mode 100644 inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/align_concat_quantization_parameters_function.cpp
 create mode 100644 inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/markup_avg_pool_precisions_function.cpp
 create mode 100644 inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/precision_propagation_function.cpp
 create mode 100644 inference-engine/tests/unit/inference_engine/transformations/low_precision/calclulate_levels_test.cpp

diff --git a/inference-engine/src/cldnn_engine/cldnn_engine.cpp b/inference-engine/src/cldnn_engine/cldnn_engine.cpp
index 078a68c67843b6..206c50c93c857a 100644
--- a/inference-engine/src/cldnn_engine/cldnn_engine.cpp
+++ b/inference-engine/src/cldnn_engine/cldnn_engine.cpp
@@ -70,9 +70,12 @@
 #include <transformations/low_precision/disable_convert_constant_folding_on_const_path.hpp>
 #include <low_precision/pull_reshape_through_dequantization.hpp>
 #include <low_precision/pull_transpose_through_dequantization.hpp>
-#include <low_precision/transformer.hpp>
+#include <low_precision/convolution.hpp>
 #include <low_precision/convolution_backprop_data.hpp>
+#include <low_precision/group_convolution.hpp>
+#include <low_precision/low_precision.hpp>
 #include <low_precision/mat_mul.hpp>
+#include <low_precision/multiply_to_group_convolution.hpp>
 #include <low_precision/strided_slice.hpp>
 #include <low_precision/network_helper.hpp>
 
@@ -151,10 +154,12 @@ InferenceEngine::CNNNetwork clDNNEngine::CloneAndTransformNetwork(const Inferenc
         OV_ITT_SCOPED_TASK(itt::domains::CLDNNPlugin, "clDNNEngine::TransformNetwork");
         auto nGraphFunc = clonedNetwork.getFunction();
 
+        using const_node_ptr = const std::shared_ptr<const ngraph::Node>;
+
         bool enableInt8;
         {
             ngraph::pass::Manager manager;
-            enableInt8 = config.enableInt8 && ngraph::pass::low_precision::LowPrecisionTransformer::isFunctionQuantized(nGraphFunc);
+            enableInt8 = config.enableInt8 && ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(nGraphFunc);
             if (enableInt8) {
                 manager.register_pass<ngraph::pass::DisableConvertConstantFoldingOnConstPath>(
                     std::vector<ngraph::element::Type>{ ngraph::element::i8, ngraph::element::u8, ngraph::element::i4, ngraph::element::u4 });
@@ -208,8 +213,6 @@ InferenceEngine::CNNNetwork clDNNEngine::CloneAndTransformNetwork(const Inferenc
 
             auto pass_config = manager.get_pass_config();
 
-            using const_node_ptr = const std::shared_ptr<const ngraph::Node>;
-
             // SpaceToDepth/DepthToSpace node implementation supports only equal input/output tensors with rank <= 5
             pass_config->set_callback<ngraph::pass::ConvertSpaceToDepth,
                                       ngraph::pass::ConvertDepthToSpace>(
@@ -391,28 +394,78 @@ InferenceEngine::CNNNetwork clDNNEngine::CloneAndTransformNetwork(const Inferenc
             if (!config.enable_fp16_for_quantized_models) {
                 manager.register_pass<ngraph::pass::ConvertPrecision>(precisions_array {{ ngraph::element::f16, ngraph::element::f32 }});
             }
-            auto lptPrerequisites = manager.register_pass<ngraph::pass::GraphRewrite>();
-            const std::vector<ngraph::element::Type> supportedTypes = { ngraph::element::i8, ngraph::element::u8 };
-            lptPrerequisites->add_matcher<PullReshapeThroughDequantization>(supportedTypes);
-            lptPrerequisites->add_matcher<PullTransposeThroughDequantization>(supportedTypes);
-            lptPrerequisites->add_matcher<ngraph::pass::LinOpSequenceFusion>();
-            manager.run_passes(nGraphFunc);
 
-            auto params = LayerTransformation::Params(true,                                                        // updatePrecisions
-                                                      LayerTransformation::QuantizedTensorAlignment::UpdateLevel,  // quantizedTensorAlignmentOnActivations
-                                                      LayerTransformation::QuantizedTensorAlignment::None,         // quantizedTensorAlignmentOnWeights
-                                                      true);                                                       // supportAsymmetricQuantization
-            LowPrecisionTransformer transformer(LowPrecisionTransformer::getAllTransformations(params)
-                .add<MatMulTransformation, ngraph::opset1::MatMul>(LayerTransformation::Params(params)
-                    .setSupportAsymmetricQuantization(false)
-                    .setSupport3DTensorOnActivations(false))
-                .add<ConvolutionBackpropDataTransformation, ngraph::opset1::ConvolutionBackpropData>(LayerTransformation::Params(params)
-                    .setSupportAsymmetricQuantization(false)
-                    .setDeconvolutionSpecificChannelsRatio(true))
-                // INT8 StridedSlice not supported
-                .remove<StridedSliceTransformation, ngraph::opset1::StridedSlice>());
-
-            transformer.transform(nGraphFunc);
+            auto supportedPrecisions = std::vector<OperationPrecisionRestriction>({
+                OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                    {0, {ngraph::element::u8, ngraph::element::i8}},
+                    {1, {ngraph::element::i8}},
+                }),
+                OperationPrecisionRestriction::create<ngraph::opset1::ConvolutionBackpropData>({
+                    {0, {ngraph::element::u8, ngraph::element::i8}},
+                    {1, {ngraph::element::i8}}
+                }),
+                OperationPrecisionRestriction::create<ngraph::opset1::GroupConvolution>({
+                    {0, {ngraph::element::u8, ngraph::element::i8}},
+                    {1, {ngraph::element::i8}}
+                }),
+                OperationPrecisionRestriction::create<ngraph::opset1::StridedSlice>({})
+            });
+
+            auto perTensorQuantization = std::vector<OperationPerTensorQuantizationRestriction>({
+                OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>({0}),
+                OperationPerTensorQuantizationRestriction::create<ngraph::opset1::ConvolutionBackpropData>({0}),
+            });
+
+            ngraph::pass::Manager lptManager;
+
+            auto lptPassConfig = lptManager.get_pass_config();
+            lptPassConfig->disable<ngraph::pass::low_precision::StridedSliceTransformation>();
+            lptPassConfig->set_callback<ngraph::pass::low_precision::MarkupPrecisions>([](const_node_ptr& node) -> bool {
+                if (const auto mulitply = std::dynamic_pointer_cast<const ngraph::opset1::Multiply>(node)) {
+                    return !MultiplyToGroupConvolutionTransformation::canBeTransformedToGroupConvolution(mulitply);
+                }
+                return false;
+            });
+            lptPassConfig->set_callback<ConvolutionBackpropDataTransformation>([](const_node_ptr& node) -> bool {
+                auto fillStaticChannel = [](const ngraph::PartialShape& shape, size_t& channel) -> bool {
+                    const auto rank = shape.rank();
+                    if (rank.is_dynamic()) {
+                        return false;
+                    }
+                    if (rank.get_length() < 2ul) {
+                        return false;
+                    }
+                    const auto dimension = shape[1];
+                    if (dimension.is_dynamic()) {
+                        return false;
+                    }
+                    channel = dimension.get_length();
+                    return true;
+                };
+
+                size_t inputChannels;
+                if (!fillStaticChannel(node->get_input_partial_shape(0), inputChannels)) {
+                    return true;
+                }
+
+                size_t outputChannels;
+                if (!fillStaticChannel(node->get_output_partial_shape(0), outputChannels)) {
+                    return true;
+                }
+
+
+                if ((inputChannels % 4 != 0) || (outputChannels % 16 != 0)) {
+                    return true;
+                }
+
+                return LayerTransformation::isAsymmetricQuantization(node) || WeightableLayerTransformation::isAsymmetricOnWeights(node);
+            });
+            lptPassConfig->set_callback<MatMulTransformation>([](const_node_ptr& node) -> bool {
+                return MatMulTransformation::is3DTensorOnActivations(node);
+            });
+
+            lptManager.register_pass<LowPrecision>(supportedPrecisions, perTensorQuantization);
+            lptManager.run_passes(nGraphFunc);
         }
 
         {
diff --git a/inference-engine/src/low_precision_transformations/CMakeLists.txt b/inference-engine/src/low_precision_transformations/CMakeLists.txt
index c6306dbc08f067..7f9d34e7149c88 100644
--- a/inference-engine/src/low_precision_transformations/CMakeLists.txt
+++ b/inference-engine/src/low_precision_transformations/CMakeLists.txt
@@ -28,8 +28,6 @@ ie_faster_build(${TARGET_NAME}
 ie_add_vs_version_file(NAME ${TARGET_NAME}
                        FILEDESCRIPTION "Inference Engine LP transformations library")
 
-target_compile_definitions(${TARGET_NAME} PRIVATE inference_engine_transformations_EXPORTS)
-
 target_link_libraries(${TARGET_NAME} PUBLIC inference_engine_transformations
                                      PRIVATE openvino::itt)
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/add.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/add.hpp
index fa64037797a384..92caba9f382a5f 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/add.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/add.hpp
@@ -11,12 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API AddTransformation : public EltwiseBaseTransformation {
+class LP_TRANSFORMATIONS_API AddTransformation : public EltwiseBaseTransformation {
 public:
-    AddTransformation(const Params& params) : EltwiseBaseTransformation(params) {}
-    ~AddTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    AddTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_intervals.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_intervals.hpp
new file mode 100644
index 00000000000000..4293be82f15d23
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_intervals.hpp
@@ -0,0 +1,25 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <ngraph/pass/pass.hpp>
+#include "low_precision/lpt_visibility.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API AlignQuantizationIntervals;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class ngraph::pass::low_precision::AlignQuantizationIntervals : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_parameters.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_parameters.hpp
new file mode 100644
index 00000000000000..fc7f7d30e7f876
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/align_quantization_parameters.hpp
@@ -0,0 +1,26 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+
+#include <ngraph/pass/pass.hpp>
+#include "low_precision/lpt_visibility.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API AlignQuantizationParameters;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class ngraph::pass::low_precision::AlignQuantizationParameters : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/avg_pool.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/avg_pool.hpp
index 823c8990110904..2d37f030ae30a0 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/avg_pool.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/avg_pool.hpp
@@ -11,11 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API AvgPoolTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API AvgPoolTransformation : public LayerTransformation {
 public:
-    AvgPoolTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    AvgPoolTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/base_matcher_pass.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/base_matcher_pass.hpp
new file mode 100644
index 00000000000000..4c637624e40f3d
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/base_matcher_pass.hpp
@@ -0,0 +1,24 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+#include <ngraph/node.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include "rt_info/attribute_parameters.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API BaseMatcherPass;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class LP_TRANSFORMATIONS_API ngraph::pass::low_precision::BaseMatcherPass : public ngraph::pass::MatcherPass {
+public:
+    BaseMatcherPass(const AttributeParameters& params = AttributeParameters());
+    AttributeParameters params;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/clamp.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/clamp.hpp
index 7698cf5b6da3ca..a3cf76a1284470 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/clamp.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/clamp.hpp
@@ -12,11 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ClampTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ClampTransformation : public LayerTransformation {
 public:
-    ClampTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    ClampTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/common/dequantization_op.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/common/dequantization_op.hpp
index e2fdc58f1b7e18..46b739959d6c28 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/common/dequantization_op.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/common/dequantization_op.hpp
@@ -13,7 +13,7 @@
 #include <ngraph/check.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
-#include "transformations_visibility.hpp"
+#include "low_precision/lpt_visibility.hpp"
 #include "transformations/rt_info/dequantization_attribute.hpp"
 
 namespace ngraph {
@@ -21,7 +21,7 @@ namespace pass {
 namespace low_precision {
 
 // template<typename BaseOp2>
-// class TRANSFORMATIONS_API DequantizationOp : public BaseOp2 {
+// class LP_TRANSFORMATIONS_API DequantizationOp : public BaseOp2 {
 // public:
 //    template <typename ... Args>
 //    DequantizationOp(Args&&... args) : BaseOp2(std::forward<Args>(args)...) {
@@ -63,7 +63,7 @@ void copyRuntimeInfo(const ngraph::Node& from, ngraph::Node& to) {
 
 } // namespace
 
-class TRANSFORMATIONS_API DequantizationConvert : public ngraph::opset1::Convert {
+class LP_TRANSFORMATIONS_API DequantizationConvert : public ngraph::opset1::Convert {
 public:
     DequantizationConvert(const ngraph::Output<Node>& arg, const ngraph::element::Type& destination_type) :
         ngraph::opset1::Convert(arg, destination_type) {
@@ -77,7 +77,7 @@ class TRANSFORMATIONS_API DequantizationConvert : public ngraph::opset1::Convert
     }
 };
 
-class TRANSFORMATIONS_API DequantizationSubtract : public ngraph::opset1::Subtract {
+class LP_TRANSFORMATIONS_API DequantizationSubtract : public ngraph::opset1::Subtract {
 public:
     DequantizationSubtract(
         const ngraph::Output<Node>& arg0,
@@ -94,7 +94,7 @@ class TRANSFORMATIONS_API DequantizationSubtract : public ngraph::opset1::Subtra
     }
 };
 
-class TRANSFORMATIONS_API DequantizationMultiply : public ngraph::opset1::Multiply {
+class LP_TRANSFORMATIONS_API DequantizationMultiply : public ngraph::opset1::Multiply {
 public:
     DequantizationMultiply(
         const Output<Node>& arg0,
@@ -116,7 +116,7 @@ class TRANSFORMATIONS_API DequantizationMultiply : public ngraph::opset1::Multip
     }
 };
 
-class TRANSFORMATIONS_API DequantizationAdd : public ngraph::opset1::Add {
+class LP_TRANSFORMATIONS_API DequantizationAdd : public ngraph::opset1::Add {
 public:
     DequantizationAdd(
         const ngraph::Output<Node>& arg0,
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/common/fake_quantize_dequantization.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/common/fake_quantize_dequantization.hpp
index 67c522bb7e3fcf..a9fba5234d1846 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/common/fake_quantize_dequantization.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/common/fake_quantize_dequantization.hpp
@@ -8,6 +8,7 @@
 #include <tuple>
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset1.hpp>
+#include <low_precision/lpt_visibility.hpp>
 
 namespace ngraph {
 namespace pass {
@@ -15,7 +16,7 @@ namespace low_precision {
 
 typedef std::tuple<std::shared_ptr<Node>, std::shared_ptr<Node>> FakeQuantizeDequantizationValues;
 
-class FakeQuantizeDequantization {
+class LP_TRANSFORMATIONS_API FakeQuantizeDequantization {
 public:
     FakeQuantizeDequantization();
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/common/ie_lpt_exception.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/common/ie_lpt_exception.hpp
index 1c4cd359f5114e..7057fc1f59764a 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/common/ie_lpt_exception.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/common/ie_lpt_exception.hpp
@@ -7,7 +7,7 @@
 #include <exception>
 #include <string>
 #include <ngraph/node.hpp>
-#include <transformations_visibility.hpp>
+#include <low_precision/lpt_visibility.hpp>
 
 /**
 * @def THROW_TRANSFORMATION_EXCEPTION_LPT
@@ -19,7 +19,7 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API Exception : std::exception {
+class LP_TRANSFORMATIONS_API Exception : std::exception {
     std::shared_ptr<std::ostringstream> buffer;
     mutable std::string buffer_str;
 public:
@@ -42,7 +42,7 @@ class TRANSFORMATIONS_API Exception : std::exception {
 #define THROW_TRANSFORMATION_EXCEPTION throw ::ngraph::pass::low_precision::Exception() << __FILE__ << ":" << __LINE__ << " "
 
 
-class TRANSFORMATIONS_API InferenceEngineLptException : public Exception {
+class LP_TRANSFORMATIONS_API InferenceEngineLptException : public Exception {
 public:
     InferenceEngineLptException(const std::string& filename, const size_t line, const Node& node) {
         *this
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/common/operation_per_tensor_quantization_restriction.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/common/operation_per_tensor_quantization_restriction.hpp
new file mode 100644
index 00000000000000..4c5321b26bef99
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/common/operation_per_tensor_quantization_restriction.hpp
@@ -0,0 +1,56 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class OperationPerTensorQuantizationRestriction {
+public:
+    using RestrictedPorts = std::vector<size_t>;
+
+    ngraph::Node::type_info_t operationType;
+    bool specifyVersion;
+    std::vector<size_t> restrictedPorts;
+
+    OperationPerTensorQuantizationRestriction() = default;
+    OperationPerTensorQuantizationRestriction(
+        const ngraph::Node::type_info_t operationType,
+        const bool specifyVersion,
+        const RestrictedPorts& restrictedPorts) :
+        operationType(operationType),
+        specifyVersion(specifyVersion),
+        restrictedPorts(restrictedPorts) {}
+
+    template <typename T>
+    static OperationPerTensorQuantizationRestriction create(
+        const RestrictedPorts& restrictedPorts = {},
+        const bool specifyVersion = false) {
+        return OperationPerTensorQuantizationRestriction(T::get_type_info_static(), specifyVersion, restrictedPorts);
+    }
+
+    template <typename T>
+    static RestrictedPorts getPrecisionsByOperationType(std::vector<OperationPerTensorQuantizationRestriction>& restrictions) {
+        for (const auto& restriction : restrictions) {
+            if (restriction.operationType == T::get_type_info_static()) {
+                return restriction.restrictedPorts;
+            }
+        }
+        return {};
+    }
+};
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/common/operation_precision_restriction.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/common/operation_precision_restriction.hpp
new file mode 100644
index 00000000000000..d22252ee7afd88
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/common/operation_precision_restriction.hpp
@@ -0,0 +1,59 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <set>
+#include <unordered_set>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class OperationPrecisionRestriction {
+public:
+    using PrecisionsByPort = std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>>;
+
+    ngraph::Node::type_info_t operationType;
+    bool specifyVersion;
+    std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>> precisionsByPort;
+
+    OperationPrecisionRestriction() = default;
+    OperationPrecisionRestriction(
+        const ngraph::Node::type_info_t operationType,
+        const bool specifyVersion,
+        const PrecisionsByPort& precisionsByPort) :
+        operationType(operationType),
+        specifyVersion(specifyVersion),
+        precisionsByPort(precisionsByPort) {}
+
+    template <typename T>
+    static OperationPrecisionRestriction create(
+        const PrecisionsByPort& precisionsByPort,
+        const bool specifyVersion = false) {
+        return OperationPrecisionRestriction(T::get_type_info_static(), specifyVersion, precisionsByPort);
+    }
+
+    template <typename T>
+    static PrecisionsByPort getPrecisionsByOperationType(std::vector<OperationPrecisionRestriction>& restrictions) {
+        for (const auto& restriction : restrictions) {
+            if (restriction.operationType == T::get_type_info_static()) {
+                return restriction.precisionsByPort;
+            }
+        }
+        return {};
+    }
+};
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/common/subgraph.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/common/subgraph.hpp
deleted file mode 100644
index 83e8cfc9cc955c..00000000000000
--- a/inference-engine/src/low_precision_transformations/include/low_precision/common/subgraph.hpp
+++ /dev/null
@@ -1,42 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-#include <memory>
-#include <string>
-#include <unordered_map>
-#include <vector>
-
-#include <ngraph/ngraph.hpp>
-#include <ngraph/check.hpp>
-#include <ngraph/opsets/opset1.hpp>
-#include "../ilayer_transformations_manager.hpp"
-
-namespace ngraph {
-namespace pass {
-namespace low_precision {
-
-class Subgraph {
-public:
-    Subgraph(ngraph::pass::ILayerTransformationsManager* layerTransformationsManager);
-
-    bool fillSubgraphForConcat(const std::shared_ptr<ngraph::opset1::Concat>& concat, std::unordered_set<std::string>& handledLayers);
-    bool empty() const;
-
-    std::vector<std::shared_ptr<ngraph::Node>> quantizationLayers;
-    std::vector<std::shared_ptr<ngraph::opset1::Concat>> concatLayers;
-    std::unordered_map<std::string, std::shared_ptr<ngraph::Node>> layers;
-
-private:
-    bool atLeastOneIsIntermediate(const std::shared_ptr<ngraph::Node>& node) const;
-    bool fillSubgraphForQuantization(const std::shared_ptr<ngraph::opset1::FakeQuantize>& fakeQuantize, std::unordered_set<std::string>& handledLayers);
-    bool fillSubgraphForIntermediate(const std::shared_ptr<ngraph::Node>& intermediate, std::unordered_set<std::string>& handledLayers);
-    bool fill(const std::shared_ptr<ngraph::Node>& concat, std::unordered_set<std::string>& handledLayers);
-    const ngraph::pass::ILayerTransformationsManager* layerTransformationsManager;
-};
-
-} // namespace low_precision
-} // namespace pass
-} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/concat.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/concat.hpp
index e381fd5d0a0401..db16f572224293 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/concat.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/concat.hpp
@@ -13,32 +13,21 @@
 #include <ngraph/ngraph.hpp>
 
 #include "layer_transformation.hpp"
-#include "common/subgraph.hpp"
 #include "common/fake_quantize_dequantization.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ConcatTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ConcatTransformation : public LayerTransformation {
 public:
-    ConcatTransformation(const Params& params) : LayerTransformation(params) {}
-    ~ConcatTransformation() override {};
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    ConcatTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 
 protected:
-    void addDequantizationLayers(
-        TransformationContext& context,
-        ngraph::pass::low_precision::Subgraph& subgraph,
-        std::function<void(
-            std::shared_ptr<ngraph::Node> layer,
-            std::shared_ptr<ngraph::Node> child,
-            const std::string originalLayerName,
-            std::vector<FakeQuantizeDequantization>& dequantizationsToConcatenate)> getLayerDequantizationCallback) const;
-
     static bool isHandled(
         const TransformationContext& context,
         const std::vector<std::shared_ptr<ngraph::Node>>& quantizationOperations);
@@ -51,14 +40,6 @@ class TRANSFORMATIONS_API ConcatTransformation : public LayerTransformation {
         NodeVector& multiplyNodes) const;
 
     std::shared_ptr<Node> concatenateDeqNodes(NodeVector& nodes) const;
-
-private:
-    size_t getMinQuantizationLevels(
-        const DataPrecision& dataPrecision,
-        const float maxOutputInterval,
-        const std::vector<QuantizationDetails>& quantizationLayersDetails,
-        const float outputLowValue,
-        const float outputHighValue) const;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/concat_multi_channels.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/concat_multi_channels.hpp
deleted file mode 100644
index 48c0a0ef9eaa5f..00000000000000
--- a/inference-engine/src/low_precision_transformations/include/low_precision/concat_multi_channels.hpp
+++ /dev/null
@@ -1,51 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-#include <memory>
-#include <string>
-#include <unordered_map>
-
-#include <ngraph/ngraph.hpp>
-
-#include "concat.hpp"
-#include "common/subgraph.hpp"
-#include "common/fake_quantize_dequantization.hpp"
-
-namespace ngraph {
-namespace pass {
-namespace low_precision {
-
-class TRANSFORMATIONS_API ConcatMultiChannelsTransformation : public ConcatTransformation {
-public:
-    ConcatMultiChannelsTransformation(const Params& params) : ConcatTransformation(params) {}
-    ~ConcatMultiChannelsTransformation() override {};
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
-    bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
-
-private:
-    // Go through the parent elements of the layer and fill dequantization collection
-    // with Dq operations that should be inserted before the layer.
-    void fillDequantization(
-        const std::shared_ptr<ngraph::Node> layer,
-        const std::unordered_map<std::string, FakeQuantizeDequantization>& dequantizationByFakeQuantize,
-        std::vector<FakeQuantizeDequantization>& dequantization) const;
-
-    FakeQuantizeDequantization getConcatenatedDequantization(
-        const std::shared_ptr<ngraph::opset1::Concat> concat,
-        const std::vector<FakeQuantizeDequantization>& dequantization) const;
-
-    static FakeQuantizeDequantization getFoldedDequantization(
-        const std::shared_ptr<ngraph::Node> operation,
-        const FakeQuantizeDequantization& dequantization,
-        const size_t sourceOutputIdx);
-
-    bool isMultiChannel(const std::vector<std::shared_ptr<ngraph::opset1::Concat>>& concatLayers) const noexcept;
-};
-
-} // namespace low_precision
-} // namespace pass
-} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/convert.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/convert.hpp
index ca860903420873..cf7299c9def383 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/convert.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/convert.hpp
@@ -11,12 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ConvertTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ConvertTransformation : public LayerTransformation {
 public:
-    ConvertTransformation(const Params& params) : LayerTransformation(params) {}
-    ~ConvertTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    ConvertTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/convert_subtract_constant.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/convert_subtract_constant.hpp
index ea2219df6e5863..f9584eb6842e60 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/convert_subtract_constant.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/convert_subtract_constant.hpp
@@ -7,14 +7,14 @@
 #include <memory>
 #include <utility>
 
-#include <transformations_visibility.hpp>
+#include <low_precision/lpt_visibility.hpp>
 #include <ngraph/pass/graph_rewrite.hpp>
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ConvertSubtractConstant;
+class LP_TRANSFORMATIONS_API ConvertSubtractConstant;
 
 }  // namespace low_precision
 }  // namespace pass
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/convolution.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/convolution.hpp
index e3041a0b08f2c1..5542d04d70adb3 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/convolution.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/convolution.hpp
@@ -11,12 +11,13 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ConvolutionTransformation : public WeightableLayerTransformation {
+class LP_TRANSFORMATIONS_API ConvolutionTransformation : public WeightableLayerTransformation {
 public:
-    ConvolutionTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
-    bool isQuantized(std::shared_ptr<Node> layer) const noexcept override;
+    NGRAPH_RTTI_DECLARATION;
+    ConvolutionTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
+    bool isQuantized(const std::shared_ptr<const Node>& layer) const noexcept override;
+    static bool isQuantizedStatic(const std::shared_ptr<const Node>& layer) noexcept;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/convolution_backprop_data.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/convolution_backprop_data.hpp
index d6bbe504dc6eea..35b5d806be1a7b 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/convolution_backprop_data.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/convolution_backprop_data.hpp
@@ -11,13 +11,13 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ConvolutionBackpropDataTransformation : public WeightableLayerTransformation {
+class LP_TRANSFORMATIONS_API ConvolutionBackpropDataTransformation : public WeightableLayerTransformation {
 public:
-    ConvolutionBackpropDataTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    ConvolutionBackpropDataTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
-    bool isQuantized(std::shared_ptr<Node> layer) const noexcept override;
+    bool isQuantized(const std::shared_ptr<const Node>& layer) const noexcept override;
+    static bool isQuantizedStatic(const std::shared_ptr<const Node>& layer) noexcept;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/create_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/create_attribute.hpp
new file mode 100644
index 00000000000000..819cd11b430306
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/create_attribute.hpp
@@ -0,0 +1,61 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <cassert>
+#include <memory>
+#include <vector>
+
+#include <ngraph/pass/graph_rewrite.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/variant.hpp>
+#include "low_precision/lpt_visibility.hpp"
+#include "low_precision/base_matcher_pass.hpp"
+#include "low_precision/lpt_itt.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+template <typename AttributeType, typename OperationType>
+class CreateAttribute;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+enum class AttributeSource {
+    Node,
+    OutputPort
+};
+
+template <typename AttributeType, typename OperationType = ngraph::pattern::op::Label>
+class ngraph::pass::low_precision::CreateAttribute : public ngraph::pass::low_precision::BaseMatcherPass {
+public:
+    CreateAttribute(const AttributeSource source = AttributeSource::Node) {
+        assert((source == AttributeSource::Node) || (source == AttributeSource::OutputPort));
+        auto operation = std::is_same<OperationType, pattern::op::Label>::value ?
+            pattern::any_input() :
+            pattern::wrap_type<OperationType>();
+
+        ngraph::graph_rewrite_callback callback = [&](pattern::Matcher& m) {
+            auto op = m.get_match_root();
+            if (transformation_callback(op)) {
+                return false;
+            }
+            {
+                OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "CreateAttribute");
+                const auto attribute = ngraph::VariantWrapper<AttributeType>::create(op, params);
+                if (attribute == nullptr) {
+                    return false;
+                }
+            }
+            return true;
+        };
+
+        auto matcher = std::make_shared<ngraph::pattern::Matcher>(operation, "CreateAttribute");
+        this->register_matcher(matcher, callback);
+    }
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/create_precisions_dependent_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/create_precisions_dependent_attribute.hpp
new file mode 100644
index 00000000000000..4104d646e23b0f
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/create_precisions_dependent_attribute.hpp
@@ -0,0 +1,70 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include <ngraph/opsets/opset1.hpp>
+#include "rt_info/precision_preserved_attribute.hpp"
+#include "network_helper.hpp"
+#include "lpt_itt.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+template <typename AttributeType, typename OperationType>
+class CreatePrecisionsDependentAttribute;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+template <typename AttributeType, typename OperationType>
+class ngraph::pass::low_precision::CreatePrecisionsDependentAttribute : public ngraph::pass::MatcherPass {
+public:
+    CreatePrecisionsDependentAttribute() {
+        auto operation = pattern::wrap_type<OperationType>();
+
+        ngraph::graph_rewrite_callback callback = [&](pattern::Matcher& m) {
+            auto node = m.get_match_root();
+            if (transformation_callback(node)) {
+                return false;
+            }
+
+            {
+                OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "CreatePrecisionsDependentAttribute");
+                auto &rt = node->get_rt_info();
+
+                const auto precisionPreservedAttribute = std::make_shared<ngraph::VariantWrapper<PrecisionPreservedAttributePtr>>(
+                    std::make_shared<PrecisionPreservedAttribute>(false));
+                rt[ngraph::VariantWrapper<PrecisionPreservedAttributePtr>::type_info.name] = precisionPreservedAttribute;
+                const auto &targetSharedValue = precisionPreservedAttribute->get()->sharedValue;
+
+                const auto attribute = std::make_shared<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>>(
+                    std::make_shared<AttributeType>());
+                rt[ngraph::VariantWrapper<std::shared_ptr<AttributeType>>::type_info.name] = attribute;
+
+                ngraph::pass::low_precision::NetworkHelper::reassign<PrecisionPreservedSharedValue, PrecisionPreservedAttribute>(
+                    targetSharedValue,
+                    {
+                        std::dynamic_pointer_cast<PrecisionPreservedAttribute>(attribute->get()),
+                        std::dynamic_pointer_cast<PrecisionPreservedAttribute>(precisionPreservedAttribute->get())
+                    });
+            }
+            return true;
+        };
+
+        auto matcher = std::make_shared<ngraph::pattern::Matcher>(operation, "CreatePrecisionsDependentAttribute");
+        this->register_matcher(matcher, callback);
+    }
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/depth_to_space.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/depth_to_space.hpp
index 0fc9d6446897d1..b02ead7321b622 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/depth_to_space.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/depth_to_space.hpp
@@ -10,12 +10,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API DepthToSpaceTransformation : public TransparentBaseTransformation {
+class LP_TRANSFORMATIONS_API DepthToSpaceTransformation : public TransparentBaseTransformation {
 public:
-    DepthToSpaceTransformation(const Params& params) : TransparentBaseTransformation(params) {}
-    ~DepthToSpaceTransformation() override {}
-    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) const override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
+    NGRAPH_RTTI_DECLARATION;
+    DepthToSpaceTransformation(const Params& params = Params());
+    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/eltwise_base_transformation.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/eltwise_base_transformation.hpp
index 67cc0f9904136d..c648d6efadc4b0 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/eltwise_base_transformation.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/eltwise_base_transformation.hpp
@@ -12,7 +12,7 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API EltwiseBaseTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API EltwiseBaseTransformation : public LayerTransformation {
 public:
     EltwiseBaseTransformation(const Params& params) : LayerTransformation(params) {}
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize.hpp
index ac75f406a2be98..15975782ef07f5 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize.hpp
@@ -13,17 +13,20 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FakeQuantizeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FakeQuantizeTransformation : public LayerTransformation {
 public:
-    FakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FakeQuantizeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 
     static bool checkElementwise(const std::shared_ptr<Node>& eltwise);
 
 private:
-    std::shared_ptr<opset1::FakeQuantize> fuseElementwise(TransformationContext& context, const std::shared_ptr<opset1::FakeQuantize>& fakeQuantize) const;
+    std::shared_ptr<opset1::FakeQuantize> fuseElementwise(
+            TransformationContext& context,
+            MatcherPass* matcherPass,
+            const std::shared_ptr<opset1::FakeQuantize>& fakeQuantize) const;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize_decomposition.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize_decomposition.hpp
index 0c6da56592e334..45948ca32b72ad 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize_decomposition.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fake_quantize_decomposition.hpp
@@ -13,11 +13,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FakeQuantizeDecompositionTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FakeQuantizeDecompositionTransformation : public LayerTransformation {
 public:
-    FakeQuantizeDecompositionTransformation(const Params& params) : LayerTransformation(params) {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FakeQuantizeDecompositionTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fold_convert.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fold_convert.hpp
index d41706f920579b..4390b7290e2f60 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fold_convert.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fold_convert.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FoldConvertTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FoldConvertTransformation : public LayerTransformation {
 public:
-    FoldConvertTransformation(const Params& params) : LayerTransformation(params) {}
-    ~FoldConvertTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FoldConvertTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fold_fake_quantize.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fold_fake_quantize.hpp
new file mode 100644
index 00000000000000..7f2862fc942288
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fold_fake_quantize.hpp
@@ -0,0 +1,25 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <ngraph/ngraph.hpp>
+#include "low_precision/layer_transformation.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API FoldFakeQuantizeTransformation : public LayerTransformation {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    FoldFakeQuantizeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
+    bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
+    bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
+};
+
+} // namespace low_precision
+} // namespace pass
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_convert.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_convert.hpp
index e8f2e864e46e29..4ccc59808ad129 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_convert.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_convert.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FuseConvertTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FuseConvertTransformation : public LayerTransformation {
 public:
-    FuseConvertTransformation(const Params& params) : LayerTransformation(params) {}
-    ~FuseConvertTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FuseConvertTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_fake_quantize.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_fake_quantize.hpp
index 8d46c68f3d77d1..b752df52a494cd 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_fake_quantize.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_fake_quantize.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FuseFakeQuantizeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FuseFakeQuantizeTransformation : public LayerTransformation {
 public:
-    FuseFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {}
-    ~FuseFakeQuantizeTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FuseFakeQuantizeTransformation(const Params& params);
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 
 private:
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_multiply_to_fake_quantize.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_multiply_to_fake_quantize.hpp
index dea0fa340551b3..d43aa87441eb29 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_multiply_to_fake_quantize.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_multiply_to_fake_quantize.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FuseMultiplyToFakeQuantizeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FuseMultiplyToFakeQuantizeTransformation : public LayerTransformation {
 public:
-    FuseMultiplyToFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {}
-    ~FuseMultiplyToFakeQuantizeTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FuseMultiplyToFakeQuantizeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_subtract_to_fake_quantize.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_subtract_to_fake_quantize.hpp
index 2c67aebfcf186a..80d6f22f785eff 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/fuse_subtract_to_fake_quantize.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/fuse_subtract_to_fake_quantize.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API FuseSubtractToFakeQuantizeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API FuseSubtractToFakeQuantizeTransformation : public LayerTransformation {
 public:
-    FuseSubtractToFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {}
-    ~FuseSubtractToFakeQuantizeTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    FuseSubtractToFakeQuantizeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/group_convolution.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/group_convolution.hpp
index 0372f0173d9d87..d53c37b8df93b8 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/group_convolution.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/group_convolution.hpp
@@ -11,12 +11,13 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API GroupConvolutionTransformation : public ConvolutionTransformation {
+class LP_TRANSFORMATIONS_API GroupConvolutionTransformation : public ConvolutionTransformation {
 public:
-    GroupConvolutionTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
-    bool isQuantized(std::shared_ptr<Node> layer) const noexcept override;
+    NGRAPH_RTTI_DECLARATION;
+    GroupConvolutionTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
+    bool isQuantized(const std::shared_ptr<const Node>& layer) const noexcept override;
+    static bool isQuantizedStatic(const std::shared_ptr<const Node>& layer) noexcept;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/ilayer_transformations_manager.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/ilayer_transformations_manager.hpp
deleted file mode 100644
index 389584b7448203..00000000000000
--- a/inference-engine/src/low_precision_transformations/include/low_precision/ilayer_transformations_manager.hpp
+++ /dev/null
@@ -1,24 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-#include <memory>
-#include <ngraph/node.hpp>
-#include "transformations_visibility.hpp"
-
-namespace ngraph {
-namespace pass {
-
-/**
- * @brief low precision transformation component interface.
-  */
-class TRANSFORMATIONS_API ILayerTransformationsManager {
-public:
-    virtual bool isQuantized(const std::shared_ptr<Node>& layer) const noexcept = 0;
-    virtual bool isPrecisionPreserved(const std::shared_ptr<Node>& layer) const noexcept = 0;
-};
-
-}  // namespace pass
-}  // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/interpolate.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/interpolate.hpp
index 184d1c159fe615..9d454e59542dd8 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/interpolate.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/interpolate.hpp
@@ -10,12 +10,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API InterpolateTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API InterpolateTransformation : public LayerTransformation {
 public:
-    InterpolateTransformation(const Params& params) : LayerTransformation(params) {}
-    ~InterpolateTransformation() override {}
-    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) const override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
+    NGRAPH_RTTI_DECLARATION;
+    InterpolateTransformation(const Params& params = Params());
+    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/iparams_manager.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/iparams_manager.hpp
deleted file mode 100644
index 2d45179a600b9a..00000000000000
--- a/inference-engine/src/low_precision_transformations/include/low_precision/iparams_manager.hpp
+++ /dev/null
@@ -1,24 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-#include <vector>
-#include <ngraph/ngraph.hpp>
-#include <transformations_visibility.hpp>
-
-namespace ngraph {
-namespace pass {
-
-/**
- * @brief low precision transformation component interface.
-  */
-class TRANSFORMATIONS_API IParamsManager {
-public:
-    // TODO FIXME: it is not correct to have a string as a key here, try to use NodeTypeInfo
-    virtual std::vector<element::Type> getPrecisionsOnActivations(const Node& op) const noexcept = 0;
-};
-
-}  // namespace pass
-}  // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/layer_transformation.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/layer_transformation.hpp
index 06a37ab8b22015..40807928305e85 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/layer_transformation.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/layer_transformation.hpp
@@ -13,8 +13,6 @@
 #include <ngraph/ngraph.hpp>
 #include <ngraph/pass/graph_rewrite.hpp>
 
-#include "iparams_manager.hpp"
-#include "ilayer_transformations_manager.hpp"
 #include "transformation_context.hpp"
 #include "quantization_details.hpp"
 #include "low_precision/common/ie_lpt_exception.hpp"
@@ -41,7 +39,7 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API DataPrecision {
+class LP_TRANSFORMATIONS_API DataPrecision {
 public:
     DataPrecision() : precision(element::undefined), min(0.f), max(0.f), hasZeroPoint(false) {}
 
@@ -108,6 +106,17 @@ class TRANSFORMATIONS_API DataPrecision {
         }
     }
 
+    // Return maximum value for quantization level. Quantization level is maximum value for precision.
+    static float getMaxValue(const size_t maxLevelsForPrecision) {
+        if (maxLevelsForPrecision == 255ul) {
+            return 254.f;
+        } else if (maxLevelsForPrecision == 256ul) {
+            return 255.f;
+        } else {
+            THROW_TRANSFORMATION_EXCEPTION << "unexpected quantization level " << maxLevelsForPrecision;
+        }
+    }
+
     static bool hasNegativeValues(const std::vector<float>& values) {
         for (const float value : values) {
             if (value < 0.0) {
@@ -148,92 +157,28 @@ inline std::ostream &operator << (std::ostream &os, const DataPrecision& value)
 }
 
 // Base class for all LP transformations, holds some common data structures
-class TRANSFORMATIONS_API LayerTransformation {
+class LP_TRANSFORMATIONS_API LayerTransformation : public ngraph::pass::MatcherPass {
 public:
-    enum QuantizedTensorAlignment {
-        None,
-        UpdateLevel
-    };
-
     class Params {
     public:
         Params(
-                const bool updatePrecisions = true,
-                const QuantizedTensorAlignment quantizedTensorAlignmentOnActivations = QuantizedTensorAlignment::UpdateLevel,
-                const QuantizedTensorAlignment quantizedTensorAlignmentOnWeights = QuantizedTensorAlignment::None,
-                bool supportAsymmetricQuantization = false,
-                std::vector<element::Type> precisionsOnActivations = { element::u8, element::i8 },
-                std::vector<element::Type> precisionsOnWeights = { element::i8 },
-                element::Type deqPrecision = element::f32,
-                bool support3DTensorOnActivations = true,
-                bool deconvolutionSpecificChannelsRatio = false) :
-                updatePrecisions(updatePrecisions),
-                quantizedTensorAlignmentOnActivations(quantizedTensorAlignmentOnActivations),
-                quantizedTensorAlignmentOnWeights(quantizedTensorAlignmentOnWeights),
-                supportAsymmetricQuantization(supportAsymmetricQuantization),
-                precisionsOnActivations(precisionsOnActivations),
-                precisionsOnWeights(precisionsOnWeights),
-                deqPrecision(deqPrecision),
-                support3DTensorOnActivations(support3DTensorOnActivations),
-                deconvolutionSpecificChannelsRatio(deconvolutionSpecificChannelsRatio) {
-            if (precisionsOnActivations.size() == 0ul) {
-                THROW_TRANSFORMATION_EXCEPTION << "precisions on activations are not specisifed";
-            }
-
-            if (precisionsOnWeights.size() == 0ul) {
-                THROW_TRANSFORMATION_EXCEPTION << "precisions on weights are not specisifed";
-            }
-        }
+            const bool updatePrecisions = true,
+            element::Type deqPrecision = element::f32) :
+            updatePrecisions(updatePrecisions),
+            deqPrecision(deqPrecision) {}
 
         Params& setUpdatePrecisions(const bool updatePrecisions) {
             this->updatePrecisions = updatePrecisions;
             return *this;
         }
 
-        Params& setQuantizedTensorAlignmentOnActivations(const QuantizedTensorAlignment quantizedTensorAlignmentOnActivations) {
-            this->quantizedTensorAlignmentOnActivations = quantizedTensorAlignmentOnActivations;
-            return *this;
-        }
-
-        Params& setQuantizedTensorAlignmentOnWeights(const QuantizedTensorAlignment quantizedTensorAlignmentOnWeights) {
-            this->quantizedTensorAlignmentOnWeights = quantizedTensorAlignmentOnWeights;
-            return *this;
-        }
-
-        Params& setSupportAsymmetricQuantization(const bool supportAsymmetricQuantization) {
-            this->supportAsymmetricQuantization = supportAsymmetricQuantization;
-            return *this;
-        }
-
-        Params& setPrecisionsOnActivations(const std::vector<element::Type>& precisionsOnActivations) {
-            this->precisionsOnActivations = precisionsOnActivations;
-            return *this;
-        }
-
-        Params& setPrecisionsOnWeights(const std::vector<element::Type>& precisionsOnWeights) {
-            this->precisionsOnWeights = precisionsOnWeights;
-            return *this;
-        }
-
-        Params& setSupport3DTensorOnActivations(const bool support3DTensorOnActivations) {
-            this->support3DTensorOnActivations = support3DTensorOnActivations;
-            return *this;
-        }
-
-        Params& setDeconvolutionSpecificChannelsRatio(const bool deconvolutionSpecificChannelsRatio) {
-            this->deconvolutionSpecificChannelsRatio = deconvolutionSpecificChannelsRatio;
+        Params& setDeqPrecision(const element::Type& deqPrecision) {
+            this->deqPrecision = deqPrecision;
             return *this;
         }
 
         bool updatePrecisions;
-        QuantizedTensorAlignment quantizedTensorAlignmentOnActivations;
-        QuantizedTensorAlignment quantizedTensorAlignmentOnWeights;
-        bool supportAsymmetricQuantization;
-        std::vector<element::Type> precisionsOnActivations;
-        std::vector<element::Type> precisionsOnWeights;
         element::Type deqPrecision;
-        bool support3DTensorOnActivations;
-        bool deconvolutionSpecificChannelsRatio;
     };
 
     class PrecisionDetails {
@@ -243,55 +188,49 @@ class TRANSFORMATIONS_API LayerTransformation {
                 hasNegativeOutput(hasNegativeOutput),
                 hasZeroPoint(hasZeroPoint) {}
 
-        const element::Type precision;
-        const bool hasNegativeOutput;
-        const bool hasZeroPoint;
+        element::Type precision;
+        bool hasNegativeOutput;
+        bool hasZeroPoint;
     };
 
     LayerTransformation(const Params& params);
     virtual ~LayerTransformation() = default;
-    virtual void registerMatcherIn(ngraph::pass::GraphRewrite& pass, TransformationContext& context) const = 0;
-    virtual bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const = 0;
+    virtual bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) = 0;
 
-    void setParamsManager(IParamsManager* paramsManager) noexcept;
-    void setLayerTransformationsManager(ILayerTransformationsManager* layerTransformationsManager) noexcept;
+    void setContext(TransformationContext* context) noexcept;
 
     void setUpdatePrecisions(const bool updatePrecisions);
-    void setQuantizedTensorAlignmentOnActivations(const QuantizedTensorAlignment quantizedTensorAlignmentOnActivations);
-    void setQuantizedTensorAlignmentOnWeights(const QuantizedTensorAlignment quantizedTensorAlignmentOnWeights);
-
-    void setQuantizationIntervalAsymmetryThreshold(const float value);
-    void setZeroThreshold(const float value);
-    void setMinQuantizationLevels(const size_t levels);
-
-    const std::vector<element::Type>& getPrecisionsOnActivations() const;
-    const std::vector<element::Type>& getPrecisionsOnWeights() const;
 
     virtual bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const;
-
-    bool canSubtractBeHandled(const std::shared_ptr<Node>& op, const size_t parentIndex = 0ul) const;
+    static bool canBeTransformedStatic(const std::shared_ptr<Node>& layer);
 
     bool canSubtractBeHandled(const std::shared_ptr<Node>& op, const FakeQuantizeDequantization& dequantization) const;
 
-    PrecisionDetails getPrecisionDetails(const QuantizationDetails& quantizationDetails) const;
+    // Get precision based on FakeQuantize operation.
+    // Undefined value is expected. In this case the accuracy has to be defined by the calling code.
+    // TODO: LPT: INT8 specific here
+    static PrecisionDetails getPrecisionDetails(
+        const size_t quantizationLevels,
+        const std::vector<float>& outputLowValues,
+        const std::vector<float>& outputHighValues);
+    static PrecisionDetails getPrecisionDetails(const QuantizationDetails& quantizationDetails);
+
+    static bool isAsymmetricQuantization(const std::shared_ptr<const Node>& node);
 
     // return true if operation can be quantized and false otherwise
     // for example: if convolution operation weights are not quantized, then isQuantize returns false and true otherwise
     // note: dequantization operations on activations are absent during method execution
-    virtual bool isQuantized(std::shared_ptr<Node> layer) const noexcept;
+    virtual bool isQuantized(const std::shared_ptr<const Node>& layer) const noexcept;
 
     // return true if operation can be preserved for precision
     // note: dequantization operations on activations are absent during method execution
     virtual bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept = 0;
 
-    DataPrecision getDataPrecision(
-            std::shared_ptr<Node> layer,
+    // weights specific
+    static DataPrecision getDataPrecision(
+            const std::shared_ptr<Node>& layer,
             const QuantizationDetails& quantizationDetails,
-            const bool onWeights) const;
-
-    void fillAvailablePrecisions(std::shared_ptr<Node> layer, std::vector<element::Type>& availablePrecisions) const;
-
-    std::vector<std::shared_ptr<Node>> getChildrenRecursivelyExceptPrecisionPreserved(const std::shared_ptr<Node>& op) const noexcept;
+            const std::vector<element::Type>& precisions);
 
 protected:
 #ifdef LPT_PRINT_DEQUANTIZATION_INFO
@@ -303,24 +242,10 @@ class TRANSFORMATIONS_API LayerTransformation {
 #endif
 
     bool updatePrecisions;
-    QuantizedTensorAlignment quantizedTensorAlignmentOnActivations;
-    QuantizedTensorAlignment quantizedTensorAlignmentOnWeights;
-    bool supportAsymmetricQuantization;
-    std::vector<element::Type> precisionsOnActivations;
-    std::vector<element::Type> precisionsOnWeights;
     element::Type deqPrecision;
-    bool support3DTensorOnActivations;
-    bool deconvolutionSpecificChannelsRatio;
-
-    // absolute value, used to determine quantization interval asymmetry
-    float quantizationIntervalAsymmetryThreshold;
-    // absolute value, used to determine zero
-    float zeroThreshold;
-    size_t minQuantizationLevels;
 
     static const char originalLayerPostfix[];
-    IParamsManager* paramsManager;
-    ILayerTransformationsManager* layerTransformationsManager;
+    TransformationContext* context;
 
 protected:
     std::shared_ptr<ngraph::Node> moveDequantizationAfter(
@@ -340,7 +265,7 @@ class TRANSFORMATIONS_API LayerTransformation {
         std::shared_ptr<ngraph::Node> lastNode,
         std::string originalName) const;
 
-    void addPattern(ngraph::pass::GraphRewrite& pass, TransformationContext& context, std::shared_ptr<Node> patternRoot) const;
+    void addPattern(ngraph::pass::GraphRewrite& pass, TransformationContext& context, std::shared_ptr<Node> patternRoot);
 
     //TODO: replace with canBeTransformed when quantization by special dimension is supported for all transformations
     bool canBeTransformedSpatialDimension(const TransformationContext& context, std::shared_ptr<Node> layer) const;
@@ -358,38 +283,6 @@ class TRANSFORMATIONS_API LayerTransformation {
     }
 };
 
-inline std::ostream &operator << (std::ostream &os, const LayerTransformation::QuantizedTensorAlignment& value) {
-    switch (value) {
-        case LayerTransformation::QuantizedTensorAlignment::None: {
-            os << "None";
-            break;
-        }
-        case LayerTransformation::QuantizedTensorAlignment::UpdateLevel: {
-            os << "UpdateLevel";
-            break;
-        }
-        default: {
-            os << static_cast<int>(value);
-            break;
-        }
-    }
-    return os;
-}
-
-inline std::ostream &operator << (std::ostream &os, const std::vector<element::Type>& values) {
-    os << "{";
-    for (size_t i = 0; i < values.size(); ++i) {
-        const element::Type& value = values[i];
-        if (i > 0) {
-            os << value;
-        } else {
-            os << ", " << value;
-        }
-    }
-    os << "}";
-    return os;
-}
-
 typedef std::shared_ptr<LayerTransformation> LayerTransformationPtr;
 
 }  // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/low_precision.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/low_precision.hpp
new file mode 100644
index 00000000000000..454ebebfda338c
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/low_precision.hpp
@@ -0,0 +1,74 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <vector>
+#include <memory>
+
+// one place to include all Low Precision Transformations from ngraph::pass::low_precision
+#include <low_precision/rt_info/intervals_alignment_attribute.hpp>
+#include <low_precision/rt_info/quantization_alignment_attribute.hpp>
+#include <low_precision/rt_info/precisions_attribute.hpp>
+#include <low_precision/rt_info/precision_preserved_attribute.hpp>
+
+#include <low_precision/markup_precisions.hpp>
+#include <low_precision/markup_avg_pool_precision_preserved.hpp>
+#include <low_precision/propagate_precisions.hpp>
+#include <low_precision/align_quantization_intervals.hpp>
+
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include <low_precision/common/operation_per_tensor_quantization_restriction.hpp>
+#include "low_precision/layer_transformation.hpp"
+#include "low_precision/markup_precisions.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API TypeRelaxedReplacer;
+class LP_TRANSFORMATIONS_API MarkupOptimizations;
+class LP_TRANSFORMATIONS_API LowPrecision;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class LP_TRANSFORMATIONS_API ngraph::pass::low_precision::MarkupOptimizations : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    MarkupOptimizations(
+        const std::vector<OperationPrecisionRestriction>& precisionRestrictions,
+        const std::vector<OperationPerTensorQuantizationRestriction>& quantizationRestrictions);
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+private:
+    const std::vector<OperationPrecisionRestriction>& precisionRestrictions;
+    const std::vector<OperationPerTensorQuantizationRestriction>& quantizationRestrictions;
+};
+
+class LP_TRANSFORMATIONS_API ngraph::pass::low_precision::TypeRelaxedReplacer : public ngraph::pass::GraphRewrite {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    TypeRelaxedReplacer();
+};
+
+class LP_TRANSFORMATIONS_API ngraph::pass::low_precision::LowPrecision : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    LowPrecision(
+        const std::vector<OperationPrecisionRestriction>& precisionRestrictions = {},
+        const std::vector<OperationPerTensorQuantizationRestriction>& quantizationRestrictions = {},
+        const LayerTransformation::Params = LayerTransformation::Params());
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+
+    static bool isFunctionQuantized(const std::shared_ptr<const ngraph::Function>& function);
+
+protected:
+    std::vector<OperationPrecisionRestriction> precisionRestrictions;
+    std::vector<OperationPerTensorQuantizationRestriction> quantizationRestrictions;
+    // remove
+    LayerTransformation::Params params;
+};
diff --git a/inference-engine/src/low_precision_transformations/src/lpt_itt.h b/inference-engine/src/low_precision_transformations/include/low_precision/lpt_itt.hpp
similarity index 95%
rename from inference-engine/src/low_precision_transformations/src/lpt_itt.h
rename to inference-engine/src/low_precision_transformations/include/low_precision/lpt_itt.hpp
index 5b3f1b524bcb9d..081c5b8d39e79e 100644
--- a/inference-engine/src/low_precision_transformations/src/lpt_itt.h
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/lpt_itt.hpp
@@ -4,11 +4,12 @@
 
 /**
  * @brief Defines openvino domains for tracing
- * @file lpt_itt.h
+ * @file lpt_itt.hpp
  */
 
 #pragma once
 
+
 #include <openvino/itt.hpp>
 
 namespace ngraph {
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/lpt_visibility.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/lpt_visibility.hpp
new file mode 100644
index 00000000000000..3867192208f652
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/lpt_visibility.hpp
@@ -0,0 +1,18 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "ngraph/visibility.hpp"
+
+/**
+ * @file lpt_visibility.hpp
+ * @brief Defines visibility settings for Inference Engine LP Transformations library
+ */
+
+#ifdef inference_engine_lp_transformations_EXPORTS
+#define LP_TRANSFORMATIONS_API NGRAPH_HELPER_DLL_EXPORT
+#else
+#define LP_TRANSFORMATIONS_API NGRAPH_HELPER_DLL_IMPORT
+#endif
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/main.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/main.hpp
deleted file mode 100644
index 79ce4f06ace999..00000000000000
--- a/inference-engine/src/low_precision_transformations/include/low_precision/main.hpp
+++ /dev/null
@@ -1,36 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-#include <memory>
-
-#include <ie_api.h>
-
-#include <ngraph/ngraph.hpp>
-
-#include <ngraph/pass/graph_rewrite.hpp>
-#include <low_precision/ilayer_transformations_manager.hpp>
-#include <low_precision/iparams_manager.hpp>
-
-using namespace std;
-
-
-namespace ngraph {
-namespace pass {
-
-class TRANSFORMATIONS_API LowPrecisionTransformations: public ngraph::pass::GraphRewrite, IParamsManager, ILayerTransformationsManager {
-public:
-    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
-
-    // IParamsManager interface implementation
-    std::vector<element::Type> getPrecisionsOnActivations(const NodeTypeInfo& layerName) const noexcept override;
-
-    // ILayerTransformationsManager interface implementation
-    bool isQuantized(std::shared_ptr<Node> layer) const noexcept override;
-    bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
-};
-
-}// namespace pass
-}// namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/markup_avg_pool_precision_preserved.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/markup_avg_pool_precision_preserved.hpp
new file mode 100644
index 00000000000000..e3a517bff307a2
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/markup_avg_pool_precision_preserved.hpp
@@ -0,0 +1,25 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <ngraph/pass/pass.hpp>
+#include <low_precision/lpt_visibility.hpp>
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API MarkupAvgPoolPrecisionPreserved;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class ngraph::pass::low_precision::MarkupAvgPoolPrecisionPreserved : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/markup_can_be_quantized.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/markup_can_be_quantized.hpp
new file mode 100644
index 00000000000000..82f66857337c3a
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/markup_can_be_quantized.hpp
@@ -0,0 +1,25 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <ngraph/pass/pass.hpp>
+#include "low_precision/lpt_visibility.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API MarkupCanBeQuantized;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class ngraph::pass::low_precision::MarkupCanBeQuantized : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/markup_per_tensor_quantization.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/markup_per_tensor_quantization.hpp
new file mode 100644
index 00000000000000..5aa9f76b1fd23f
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/markup_per_tensor_quantization.hpp
@@ -0,0 +1,44 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <unordered_map>
+#include <vector>
+
+#include <ngraph/pass/pass.hpp>
+#include "common/operation_per_tensor_quantization_restriction.hpp"
+#include "low_precision/lpt_visibility.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API MarkupPerTensorQuantization;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class ngraph::pass::low_precision::MarkupPerTensorQuantization : public ngraph::pass::FunctionPass {
+public:
+    class PerTensorQuantization {
+    public:
+        explicit PerTensorQuantization(const bool versionIsRequired) : versionIsRequired(versionIsRequired) {}
+        void add(const uint64_t version, const std::vector<size_t>& ports) {
+            portsByVersion.emplace(version, ports);
+        }
+
+        bool versionIsRequired;
+        std::unordered_map<uint64_t, std::vector<size_t>> portsByVersion;
+    };
+
+    NGRAPH_RTTI_DECLARATION;
+    explicit MarkupPerTensorQuantization(const std::vector<OperationPerTensorQuantizationRestriction>& restrictions = {});
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+
+private:
+    std::unordered_map<std::string, PerTensorQuantization> restrictionsByOperation;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/markup_precisions.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/markup_precisions.hpp
new file mode 100644
index 00000000000000..87c7cc85a40824
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/markup_precisions.hpp
@@ -0,0 +1,47 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <set>
+#include <vector>
+
+#include <ngraph/pass/pass.hpp>
+#include "low_precision/lpt_visibility.hpp"
+#include "low_precision/common/operation_precision_restriction.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API MarkupPrecisions;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+// Transformation is used to add customization options runtime
+class ngraph::pass::low_precision::MarkupPrecisions : public ngraph::pass::FunctionPass {
+public:
+    class Restriction {
+    public:
+        explicit Restriction(const bool versionIsRequired) : versionIsRequired(versionIsRequired) {}
+        void add(const uint64_t version, const std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>>& precisions) {
+            precisionsByVersion.emplace(version, precisions);
+        }
+
+        bool versionIsRequired;
+        std::unordered_map<uint64_t, std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>>> precisionsByVersion;
+    };
+
+    NGRAPH_RTTI_DECLARATION;
+    explicit MarkupPrecisions(const std::vector<OperationPrecisionRestriction>& restrictions = {});
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+
+private:
+    static bool isPrecisionPreserved(const std::shared_ptr<Node>& node);
+    static bool isSupported(const std::shared_ptr<Node>& node);
+    std::unordered_map<std::string, Restriction> restrictionsByOperation;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/mat_mul.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/mat_mul.hpp
index 332d28b934b44e..067f82ea59b28b 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/mat_mul.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/mat_mul.hpp
@@ -11,14 +11,14 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API MatMulTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API MatMulTransformation : public LayerTransformation {
 public:
-    MatMulTransformation(const Params& params) : LayerTransformation(params) {}
-    ~MatMulTransformation() override {}
-    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) const override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
+    NGRAPH_RTTI_DECLARATION;
+    MatMulTransformation(const Params& params = Params());
+    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
+    static bool is3DTensorOnActivations(const std::shared_ptr<const Node>& node);
 };
 
 }  // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/max_pool.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/max_pool.hpp
index 2cf1d54eda7f44..ca2b8a08272817 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/max_pool.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/max_pool.hpp
@@ -12,12 +12,12 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API MaxPoolTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API MaxPoolTransformation : public LayerTransformation {
 public:
-    MaxPoolTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
+    NGRAPH_RTTI_DECLARATION;
+    MaxPoolTransformation(const Params& params = Params());
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/multiply.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/multiply.hpp
index 30f1cff5444d37..da226fe263b757 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/multiply.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/multiply.hpp
@@ -11,12 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API MultiplyTransformation : public EltwiseBaseTransformation {
+class LP_TRANSFORMATIONS_API MultiplyTransformation : public EltwiseBaseTransformation {
 public:
-    MultiplyTransformation(const Params& params) : EltwiseBaseTransformation(params) {}
-    ~MultiplyTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    MultiplyTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp
index d4a575f4d9a9de..f25ba9c9284fc6 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp
@@ -7,24 +7,29 @@
 #include <memory>
 #include <ngraph/ngraph.hpp>
 #include "low_precision/layer_transformation.hpp"
+#include "common/operation_precision_restriction.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API MultiplyToGroupConvolutionTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API MultiplyToGroupConvolutionTransformation : public LayerTransformation {
 public:
-    MultiplyToGroupConvolutionTransformation(const Params& params) : LayerTransformation(params), groupSize(1ul) {}
+    NGRAPH_RTTI_DECLARATION;
+    MultiplyToGroupConvolutionTransformation(
+        const Params& params = Params(),
+        const OperationPrecisionRestriction::PrecisionsByPort& restrictions = {});
     ~MultiplyToGroupConvolutionTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
-    bool isQuantized(std::shared_ptr<Node> layer) const noexcept override;
+    bool isQuantized(const std::shared_ptr<const Node>& layer) const noexcept override;
+    static bool canBeTransformedToGroupConvolution(const std::shared_ptr<const Node>& layer) noexcept;
 
     void setGroupSize(const size_t groupSize);
     size_t getGroupSize() const;
 private:
+    OperationPrecisionRestriction::PrecisionsByPort restrictions;
     size_t groupSize;
 };
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/mvn.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/mvn.hpp
index 37244a3aa74c0b..42ddd6f0b620a1 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/mvn.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/mvn.hpp
@@ -10,11 +10,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API MVNTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API MVNTransformation : public LayerTransformation {
 public:
-    MVNTransformation(const Params& params) : LayerTransformation(params) {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    MVNTransformation(const Params& params = Params());
+    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/network_helper.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/network_helper.hpp
index 891b341b87f522..77218320dba376 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/network_helper.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/network_helper.hpp
@@ -16,6 +16,10 @@
 #include "ngraph_ops/type_relaxed.hpp"
 #include <ngraph/rt_info.hpp>
 
+#include "rt_info/shared_value_attribute.hpp"
+#include "rt_info/precisions_attribute.hpp"
+#include "rt_info/per_tensor_quantization_attribute.hpp"
+#include "rt_info/intervals_alignment_attribute.hpp"
 #include "transformation_context.hpp"
 #include "quantization_details.hpp"
 #include "transformations/utils/utils.hpp"
@@ -30,7 +34,7 @@ namespace low_precision {
 /**
 * @brief NetworkHelper class encapsulates manipulations with nGraph function.
 */
-class TRANSFORMATIONS_API NetworkHelper {
+class LP_TRANSFORMATIONS_API NetworkHelper {
 public:
     // Return true if `type` can be castable to at least one of `type`
     static bool is_castable_to_one_of(NodeTypeInfo type, const std::unordered_set<NodeTypeInfo>& types);
@@ -76,6 +80,10 @@ class TRANSFORMATIONS_API NetworkHelper {
 
     static std::shared_ptr<Node> swapMultiplyAndAdd(std::shared_ptr<opset1::Add> addAfterMultiply, const int multiplyBranch);
 
+    static void copyInfo(const std::vector<std::shared_ptr<Node>>& sources, const std::vector<std::shared_ptr<Node>>& targets);
+
+    static void copyInfo(const std::vector<std::shared_ptr<Node>>& sources, const std::shared_ptr<Node>& target);
+
     static void copyInfo(const std::shared_ptr<Node>& source, const std::shared_ptr<Node>& target);
 
     static void cleanRunTimeInfo(const std::shared_ptr<Node>& layer);
@@ -116,7 +124,8 @@ class TRANSFORMATIONS_API NetworkHelper {
         std::shared_ptr<opset1::FakeQuantize> fq,
         element::Type precision,
         float min,
-        float max);
+        float max,
+        const bool replace = true);
 
     static FakeQuantizeDequantization makeDequantization(
         const float dequantizationMul,
@@ -124,7 +133,8 @@ class TRANSFORMATIONS_API NetworkHelper {
         const ngraph::element::Type originalPrecision,
         const ngraph::PartialShape dataNodeOutputShape,
         element::Type precision,
-        const element::Type deqPrecision = element::f32);
+        const element::Type deqPrecision = element::f32,
+        std::shared_ptr<ngraph::Node> input = nullptr);
 
     static FakeQuantizeDequantization createDequantizationFromFakeQuantize(
         std::shared_ptr<opset1::FakeQuantize> fq,
@@ -143,7 +153,7 @@ class TRANSFORMATIONS_API NetworkHelper {
 
     static FakeQuantizeDequantization getDequantization(const std::shared_ptr<Node>& node, const size_t parentIndex = 0ul, const bool inPlace = false);
 
-    static FakeQuantizeDequantization getDequantizationBelow(const std::shared_ptr<Node>& node);
+    static FakeQuantizeDequantization getDequantizationBelow(const std::shared_ptr<Node>& node, const bool convertIsMandatory = false);
 
     static FakeQuantizeDequantization normalizeDequantization(FakeQuantizeDequantization dequantization);
 
@@ -200,6 +210,115 @@ class TRANSFORMATIONS_API NetworkHelper {
 
     static bool isDQByDynamicDimension(const std::shared_ptr<Node>& layer, size_t inputIdx = 0);
 
+    static bool isPrecisionPreserved(const std::shared_ptr<ngraph::Node>& node);
+
+    static void replaceAttributeInNodes(
+        std::shared_ptr<ngraph::Function> f,
+        const std::string& name,
+        const std::shared_ptr<ngraph::Variant> newAttribute,
+        const std::shared_ptr<ngraph::Variant> oldAttribute,
+        const std::shared_ptr<ngraph::Node>& initialNode) {
+        std::set<std::shared_ptr<Node>> visited;
+        std::deque<std::shared_ptr<Node>> nodes;
+        nodes.emplace_back(initialNode);
+
+        while (!nodes.empty()) {
+            auto node = nodes.front();
+            nodes.pop_front();
+
+            if (visited.count(node) || is_type<op::Constant>(node)) {
+                continue;
+            }
+
+            visited.insert(node);
+
+            bool handleConnectedNodes = false;
+            if (NetworkHelper::isPrecisionPreserved(node) || is_type<opset1::FakeQuantize>(node)) {
+                auto& rt = node->get_rt_info();
+
+                if (node == initialNode) {
+                    rt[name] = newAttribute;
+                    handleConnectedNodes = true;
+                } else {
+                    auto it = rt.find(name);
+                    if (it != rt.end()) {
+                        const auto currentAttribute = it->second;
+                        if (oldAttribute.get() == currentAttribute.get()) {
+                            rt[name] = newAttribute;
+                        }
+                        handleConnectedNodes = true;
+                    }
+                }
+            }
+
+            if (!handleConnectedNodes) {
+                continue;
+            }
+
+            if (!is_type<opset1::FakeQuantize>(node)) {
+                for (size_t index = 0ul; index < node->get_input_size(); ++index) {
+                    auto getInput = [](const std::shared_ptr<ngraph::Node>& node, const size_t index) {
+                        const auto dequantization = NetworkHelper::getDequantization(node, index);
+                        if (!dequantization.empty() &&
+                            (is_type<opset1::Convert>(dequantization.data.get_node())) &&
+                            is_type<opset1::FakeQuantize>(dequantization.data.get_node()->get_input_node_ptr(0))) {
+                            const auto input = dequantization.data.get_node()->input(0);
+                            return input;
+                        }
+                        return node->input(index);
+                    };
+
+                    const auto& input = getInput(node, index);
+                    const auto& input_node = input.get_source_output().get_node_shared_ptr();
+
+                    //const auto& input_node = input.get_source_output().get_node_shared_ptr();
+                    if (visited.count(input_node) || is_type<op::Constant>(input_node)) {
+                        continue;
+                    }
+
+                    nodes.push_front(input_node);
+                }
+            }
+
+            for (auto& output : node->outputs()) {
+                for (auto& input_value : output.get_target_inputs()) {
+                    const auto& output_node = input_value.get_node()->shared_from_this();
+                    if (visited.count(output_node) || is_type<op::Constant>(output_node)) {
+                        continue;
+                    }
+
+                    nodes.push_front(output_node);
+                }
+            }
+        }
+    }
+
+    template <typename SharedValueType, typename SharedAttributeType>
+    static void reassign(
+        const std::shared_ptr<SharedValueType>& sharedValue,
+        const std::vector<std::weak_ptr<SharedAttributeType>>& attributes) {
+        for (const auto attributeWeakPtr : attributes) {
+            auto attribute = attributeWeakPtr.lock();
+            if (attribute == nullptr) {
+                continue;
+            }
+            attribute->sharedValue = sharedValue;
+            sharedValue->attributes.push_back(attribute);
+        }
+    }
+
+    static size_t calculateLevels(
+        const float dataPrecisionMin,
+        const float dataPrecisionMax,
+        const float combinedIntervalLow,
+        const float combinedIntervalHigh,
+        const float minIntervalLow,
+        const float minIntervalHigh,
+        float& dequantizationMul,
+        float& dequantizationSub,
+        float& updatedOutputLowValue,
+        float& updatedOutputHighValue);
+
 private:
     static std::shared_ptr<Node> foldFakeQuantize(
             const std::shared_ptr<opset1::FakeQuantize>& fq,
@@ -292,6 +411,54 @@ std::shared_ptr<Node> fold_reshape(Args&&... args) {
     return node;
 }
 
+template <typename T>
+std::shared_ptr<ngraph::VariantWrapper<T>> getAttribute(const std::shared_ptr<Node>& inputNode) {
+    auto& rt = inputNode->get_rt_info();
+    auto it = rt.find(ngraph::VariantWrapper<T>::type_info.name);
+    if (it == rt.end()) {
+        return nullptr;
+    }
+
+    auto attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<T>>(it->second);
+    assert(attribute != nullptr);
+    return attribute;
+}
+
+template <typename T>
+std::shared_ptr<ngraph::VariantWrapper<T>> getAttribute(const Input<Node>& input) {
+    auto& rt = input.get_rt_info();
+    auto it = rt.find(ngraph::VariantWrapper<T>::type_info.name);
+    if (it == rt.end()) {
+        return nullptr;
+    }
+
+    auto attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<T>>(it->second);
+    assert(attribute != nullptr);
+    return attribute;
+}
+
+template <typename T>
+std::shared_ptr<ngraph::VariantWrapper<T>> getAttributeFromOutput(const Output<Node>& output) {
+    auto& rt = output.get_rt_info();
+    auto it = rt.find(ngraph::VariantWrapper<T>::type_info.name);
+    if (it == rt.end()) {
+        return nullptr;
+    }
+
+    auto attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<T>>(it->second);
+    assert(attribute != nullptr);
+    return attribute;
+}
+
+bool isDisabled(const std::shared_ptr<Node>& node);
+
+template <typename T, typename ... Args>
+std::shared_ptr<T> make_shared_attribute(Args&& ... args) {
+    std::shared_ptr<T> attribute = std::make_shared<T>(std::forward<Args>(args)...);
+    attribute->sharedValue->attributes.push_back(attribute);
+    return attribute;
+}
+
 }  // namespace low_precision
 }  // namespace pass
 }  // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/normalize_l2.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/normalize_l2.hpp
index 9591a631e86a6b..88a113cb38a49d 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/normalize_l2.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/normalize_l2.hpp
@@ -10,11 +10,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API NormalizeL2Transformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API NormalizeL2Transformation : public LayerTransformation {
 public:
-    NormalizeL2Transformation(const Params& params) : LayerTransformation(params) {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    NormalizeL2Transformation(const Params& params = Params());
+    bool transform(TransformationContext &context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/prelu.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/prelu.hpp
index ef767127315a60..e58d4b25615752 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/prelu.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/prelu.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API PReluTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API PReluTransformation : public LayerTransformation {
 public:
-    PReluTransformation(const Params& params) : LayerTransformation(params) {}
-    ~PReluTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    PReluTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/propagate_precisions.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_precisions.hpp
new file mode 100644
index 00000000000000..5995b6473722dd
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_precisions.hpp
@@ -0,0 +1,29 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include <low_precision/lpt_visibility.hpp>
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+class LP_TRANSFORMATIONS_API PropagatePrecisions;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+class ngraph::pass::low_precision::PropagatePrecisions : public ngraph::pass::FunctionPass {
+public:
+    NGRAPH_RTTI_DECLARATION;
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/propagate_shared_value.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_shared_value.hpp
new file mode 100644
index 00000000000000..9866d63197ff1d
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_shared_value.hpp
@@ -0,0 +1,164 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <assert.h>
+#include <memory>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include "low_precision/network_helper.hpp"
+#include "lpt_itt.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+template <class AttributeType>
+class LP_TRANSFORMATIONS_API PropagateSharedValue;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+template <class AttributeType>
+class ngraph::pass::low_precision::PropagateSharedValue : public ngraph::pass::FunctionPass {
+public:
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override {
+        OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "PropagateSharedValue");
+
+        std::vector<std::shared_ptr<ngraph::Node>> nodes(f->get_ordered_ops());
+        for (auto it = nodes.begin(); it != nodes.end(); it++) {
+            const std::shared_ptr<Node> node = *it;
+            if (is_type<opset1::FakeQuantize>(node)) {
+                assert(node->get_output_size() == 1ul);
+                auto& outputRtInfo = node->output(0).get_rt_info();
+
+                auto attribute = make_shared_attribute<AttributeType>(std::set<element::Type>{element::u8, element::i8});
+
+                auto attributeWrapper = std::make_shared<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(attribute);
+                outputRtInfo[ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name] = attributeWrapper;
+                continue;
+            }
+
+            if (!NetworkHelper::isPrecisionPreserved(node)) {
+                for (auto& input : node->inputs()) {
+                    auto parentNode = input.get_source_output().get_node_shared_ptr();
+
+                    auto getAttributes = [](const Input<Node>& nodeInput) {
+                        const std::string name = ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name;
+
+                        auto node = nodeInput.get_source_output().get_node_shared_ptr();
+                        std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>> attributes;
+                        if (is_type<opset1::FakeQuantize>(node)) {
+                            // output
+                            auto& rt = nodeInput.get_source_output().get_rt_info();
+                            auto it = rt.find(name);
+                            if (it != rt.end()) {
+                                const auto& attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(it->second);
+                                attributes.push_back(attribute);
+                            }
+                        }
+
+                        return attributes;
+                    };
+
+                    auto& nodeRt = input.get_rt_info();
+
+                    const std::string name = ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name;
+                    const auto it = nodeRt.find(name);
+                    if (it == nodeRt.end()) {
+                        continue;
+                    }
+
+                    const auto& attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(it->second);
+                    std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>> attributes{ attribute };
+
+                    auto parentAttributes = getAttributes(input);
+                    if (parentAttributes.empty()) {
+                        continue;
+                    }
+
+                    for (auto& parentAttribute : parentAttributes) {
+                        parentAttribute->merge(attributes);
+                    }
+
+                    nodeRt[name] = parentAttributes[0];
+                }
+                continue;
+            }
+
+            handle(f, node);
+        }
+        return true;
+    }
+
+private:
+    std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>> getParentInputRestrictions(
+        const std::shared_ptr<ngraph::Node> node) {
+        std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>> parentAttributes;
+        for (size_t index = 0ul; index < node->get_input_size(); index++) {
+            const Input<Node>& input = node->input(index);
+            auto inputNode = input.get_source_output().get_node()->shared_from_this();
+
+            const auto dequantization = NetworkHelper::getDequantization(node, index);
+            if (!dequantization.empty() &&
+                (is_type<opset1::Convert>(dequantization.data.get_node())) &&
+                is_type<opset1::FakeQuantize>(dequantization.data.get_node()->get_input_node_ptr(0))) {
+                inputNode = dequantization.data.get_node()->get_input_node_shared_ptr(0);
+            }
+
+            if (NetworkHelper::isPrecisionPreserved(inputNode)) {
+                auto& inputRtInfo = inputNode->get_rt_info();
+                auto inputAttributeIt = inputRtInfo.find(ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name);
+                if (inputAttributeIt != inputRtInfo.end()) {
+                    const auto attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(inputAttributeIt->second);
+                    parentAttributes.push_back(attribute);
+                }
+            } else if (is_type<opset1::FakeQuantize>(inputNode)) {
+                const auto& outputPortRtInfo = inputNode->outputs()[0].get_rt_info();
+                auto attributeIt = outputPortRtInfo.find(ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name);
+                if (attributeIt != outputPortRtInfo.end()) {
+                    const auto attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(attributeIt->second);
+                    parentAttributes.push_back(attribute);
+                }
+            }
+        }
+        return parentAttributes;
+    }
+
+    void handle(std::shared_ptr<ngraph::Function> f, const std::shared_ptr<ngraph::Node>& node) {
+        const bool precisionPreserved = NetworkHelper::isPrecisionPreserved(node);
+        if (precisionPreserved) {
+            const auto parentRestrictions = getParentInputRestrictions(node);
+            if (parentRestrictions.empty()) {
+                return;
+            }
+
+            // one operation - one output precision
+            // merge parent inputs to one current output
+            auto resultAttribute = parentRestrictions[0];
+
+            std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>> toMerge = parentRestrictions;
+            toMerge.erase(toMerge.begin());
+            resultAttribute->merge(toMerge);
+
+            for (size_t index = 1ul; index < parentRestrictions.size(); index++) {
+                const auto oldAttribute = parentRestrictions[index]->get();
+                NetworkHelper::reassign<PrecisionsSharedValue, PrecisionsAttribute>(
+                    resultAttribute->get()->sharedValue,
+                    parentRestrictions[index]->get()->sharedValue->attributes);
+            }
+
+            auto& rt = node->get_rt_info();
+            rt[ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name] = resultAttribute;
+        }
+    }
+};
+
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/propagate_through_precision_preserved.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_through_precision_preserved.hpp
new file mode 100644
index 00000000000000..18a8f1e0ab839b
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_through_precision_preserved.hpp
@@ -0,0 +1,118 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/variant.hpp>
+
+#include "low_precision/lpt_visibility.hpp"
+#include "low_precision/network_helper.hpp"
+#include "low_precision/lpt_itt.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+template <typename AttributeType>
+class PropagateThroughPrecisionPreserved;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+template <typename AttributeType>
+class ngraph::pass::low_precision::PropagateThroughPrecisionPreserved : public ngraph::pass::MatcherPass {
+public:
+    PropagateThroughPrecisionPreserved() {
+        ngraph::graph_rewrite_callback callback = [&](pattern::Matcher& m) {
+            auto node = m.get_match_root();
+            if (transformation_callback(node)) {
+                return false;
+            }
+
+            {
+                OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "PropagateThroughPrecisionPreserved");
+
+                if (!ngraph::pass::low_precision::NetworkHelper::isPrecisionPreserved(node)) {
+                    return false;
+                }
+
+                const auto parentRestrictions = getParentInputRestrictions(node);
+                if (parentRestrictions.empty()) {
+                    return false;
+                }
+
+                auto resultAttribute = parentRestrictions[0];
+
+                std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>>> toMerge = parentRestrictions;
+                // TODO: LPT: handle pointer on itself in VariantWrapper<IntervalsAlignmentAttributePtr>::merge and remove erase, task #59498
+                toMerge.erase(toMerge.begin());
+                resultAttribute->merge(toMerge);
+
+                for (size_t index = 1ul; index < parentRestrictions.size(); index++) {
+                    const auto attributes = parentRestrictions[index]->get()->sharedValue->attributes;
+                    for (const auto attributeWeakPtr : attributes) {
+                        auto attribute = attributeWeakPtr.lock();
+                        if (attribute == nullptr) {
+                            continue;
+                        }
+                        attribute->sharedValue = resultAttribute->get()->sharedValue;
+                        resultAttribute->get()->sharedValue->attributes.push_back(attribute);
+                    }
+                }
+
+                auto &rt = node->get_rt_info();
+                rt[ngraph::VariantWrapper<std::shared_ptr<AttributeType>>::type_info.name] = resultAttribute;
+            }
+            return true;
+        };
+
+        auto matcher = std::make_shared<ngraph::pattern::Matcher>(pattern::any_input(), "PropagateThroughPrecisionPreserved");
+        this->register_matcher(matcher, callback);
+    }
+
+private:
+    std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>> getSourceOutputAttribute(const Input<Node>& input) {
+        auto input2 = input;
+        auto output = input2.get_source_output();
+        std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>> attribute = getAttributeFromOutput<std::shared_ptr<AttributeType>>(output);
+        if (attribute == nullptr) {
+            attribute = getAttribute<std::shared_ptr<AttributeType>>(output.get_node_shared_ptr());
+        }
+        return attribute;
+    }
+
+    // TODO: possible duplicate: PropagateToInput::getSourceOutputAttribute
+    std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>>> getParentInputRestrictions(
+        const std::shared_ptr<ngraph::Node> node) {
+        std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>>> parentAttributes;
+        auto getInput = [](const std::shared_ptr<ngraph::Node>& node, const size_t index) -> Input<Node> {
+            const auto dequantization = NetworkHelper::getDequantization(node, index);
+            if (!dequantization.empty() &&
+                is_type<opset1::Convert>(dequantization.data.get_node()) &&
+                (dequantization.data.get_node()->get_input_size() == 1ul) &&
+                is_type<opset1::FakeQuantize>(dequantization.data.get_node()->get_input_node_ptr(0))) {
+                return dequantization.data.get_node()->input(0);
+            }
+
+            return node->input(index);
+        };
+
+        for (size_t index = 0ul; index < node->get_input_size(); index++) {
+            const Input<Node>& input = getInput(node, index);
+            const auto attribute = getSourceOutputAttribute(input);
+            if (attribute != nullptr) {
+                parentAttributes.push_back(attribute);
+            }
+        }
+
+        return parentAttributes;
+    }
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/propagate_to_input.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_to_input.hpp
new file mode 100644
index 00000000000000..1f30ab7b4a07d5
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/propagate_to_input.hpp
@@ -0,0 +1,105 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include "network_helper.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+template <typename AttributeType>
+class PropagateToInput;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+template <typename AttributeType>
+class ngraph::pass::low_precision::PropagateToInput : public ngraph::pass::MatcherPass {
+public:
+    PropagateToInput() {
+        ngraph::graph_rewrite_callback callback = [&](pattern::Matcher& m) {
+            auto node = m.get_match_root();
+            if (transformation_callback(node)) {
+                return false;
+            }
+
+            {
+                OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "PropagateToInput");
+
+                for (auto input : node->inputs()) {
+                    auto parentAttribute = getSourceOutputAttribute(input);
+                    if (parentAttribute == nullptr) {
+                        continue;
+                    }
+
+                    auto attribute = getAttribute<std::shared_ptr<AttributeType>>(input);
+                    if (attribute != nullptr) {
+                        if ((attribute->get()->sharedValue != nullptr) && (attribute->get()->sharedValue->precisions.empty())) {
+                            return false;
+                        }
+
+                        std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<AttributeType>>>> attributes = { attribute };
+                        parentAttribute->merge(attributes);
+                    }
+
+                    auto& rt = input.get_rt_info();
+                    rt[ngraph::VariantWrapper<std::shared_ptr<AttributeType>>::type_info.name] = parentAttribute;
+                }
+            }
+            return true;
+        };
+
+        auto matcher = std::make_shared<ngraph::pattern::Matcher>(pattern::any_input(), "PropagateThroughPrecisionPreserved");
+        this->register_matcher(matcher, callback);
+    }
+
+private:
+    // TODO: possible duplicate: PropagateThroughPrecisionPreserved::getParentInputRestrictions
+    std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>> getSourceOutputAttribute(const Input<Node>& input) {
+        auto getInput = [](const Input<Node>& input) {
+            const auto dequantization = NetworkHelper::getDequantization(input.get_node()->shared_from_this(), input.get_index());
+            if (!dequantization.empty() &&
+                is_type<opset1::Convert>(dequantization.data.get_node()) &&
+                (dequantization.data.get_node()->get_input_size() == 1ul) &&
+                is_type<opset1::FakeQuantize>(dequantization.data.get_node()->get_input_node_ptr(0))) {
+                return dequantization.data.get_node()->input(0);
+            }
+
+            return input;
+        };
+
+        auto input2 = getInput(input);
+        auto output = input2.get_source_output();
+        std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>> attribute = getAttributeFromOutput<std::shared_ptr<AttributeType>>(output);
+        if (attribute == nullptr) {
+            attribute = getAttribute<std::shared_ptr<AttributeType>>(output.get_node_shared_ptr());
+        }
+        return attribute;
+    }
+
+    std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>>> getParentInputRestrictions(
+        const std::shared_ptr<ngraph::Node> node) {
+        std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AttributeType>>>> parentAttributes;
+        for (size_t index = 0ul; index < node->get_input_size(); index++) {
+            const Input<Node>& input = node->input(index);
+            const auto attribute = getSourceOutputAttribute(input);
+            if (attribute != nullptr) {
+                parentAttributes.push_back(attribute);
+            }
+        }
+        return parentAttributes;
+    }
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/pull_reshape_through_dequantization.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/pull_reshape_through_dequantization.hpp
index 639e1a00e65c74..e8bc2add659a39 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/pull_reshape_through_dequantization.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/pull_reshape_through_dequantization.hpp
@@ -6,14 +6,14 @@
 
 #include <memory>
 #include <vector>
-#include <transformations_visibility.hpp>
+#include <low_precision/lpt_visibility.hpp>
 #include <ngraph/pass/graph_rewrite.hpp>
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API PullReshapeThroughDequantization;
+class LP_TRANSFORMATIONS_API PullReshapeThroughDequantization;
 
 }  // namespace low_precision
 }  // namespace pass
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/pull_transpose_through_dequantization.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/pull_transpose_through_dequantization.hpp
index 3f1648841220b3..f9d957389e6e5a 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/pull_transpose_through_dequantization.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/pull_transpose_through_dequantization.hpp
@@ -6,14 +6,14 @@
 
 #include <memory>
 #include <vector>
-#include <transformations_visibility.hpp>
+#include <low_precision/lpt_visibility.hpp>
 #include <ngraph/pass/graph_rewrite.hpp>
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API PullTransposeThroughDequantization;
+class LP_TRANSFORMATIONS_API PullTransposeThroughDequantization;
 
 }  // namespace low_precision
 }  // namespace pass
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/quantization_details.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/quantization_details.hpp
index 1e4b05fce2812b..a1c2f1ca4976b1 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/quantization_details.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/quantization_details.hpp
@@ -8,7 +8,7 @@
 #include <ostream>
 #include <vector>
 
-#include <transformations_visibility.hpp>
+#include <low_precision/lpt_visibility.hpp>
 
 #include <ngraph/node.hpp>
 #include <ngraph/opsets/opset1.hpp>
@@ -18,7 +18,7 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API QuantizationDetails {
+class LP_TRANSFORMATIONS_API QuantizationDetails {
 public:
     QuantizationDetails();
     QuantizationDetails(const QuantizationDetails& quantizationDetails);
@@ -27,33 +27,25 @@ class TRANSFORMATIONS_API QuantizationDetails {
             const std::vector<float>& inputLowValues,
             const std::vector<float>& inputHighValues,
             const std::vector<float>& outputLowValues,
-            const std::vector<float>& outputHighValues,
-            const size_t inputIntervalsCount,
-            const size_t outputIntervalsCount,
-            const size_t outputChannelsCount);
+            const std::vector<float>& outputHighValues);
 
     static bool outputLayoutIsSupported(std::shared_ptr<opset1::FakeQuantize> quantize);
 
     static void getInputIntervals(
             std::shared_ptr<opset1::FakeQuantize> quantize,
             std::vector<float>& inputLowValues,
-            std::vector<float>& inputHighValues,
-            size_t& inputIntervalsCount);
+            std::vector<float>& inputHighValues);
 
     static void getOutputIntervals(
             std::shared_ptr<opset1::FakeQuantize> quantize,
             std::vector<float>& outputLowValues,
-            std::vector<float>& outputHighValues,
-            size_t& outputIntervalsCount);
+            std::vector<float>& outputHighValues);
 
     static QuantizationDetails getDetails(std::shared_ptr<opset1::FakeQuantize>);
     bool hasNegativeOutput() const;
     float maxOutput(const size_t channel) const;
     float maxInput(const size_t channel) const;
 
-    float maxOutputHigh() const;
-    float minOutputLow() const;
-
     float getInputLowValue(const size_t channel) const;
     float getInputHighValue(const size_t channel) const;
     float getOutputLowValue(const size_t channel) const;
@@ -66,19 +58,15 @@ class TRANSFORMATIONS_API QuantizationDetails {
     const std::vector<float> inputHighValues;
     const std::vector<float> outputLowValues;
     const std::vector<float> outputHighValues;
-    const size_t inputIntervalsCount;
-    const size_t outputIntervalsCount;
-    const size_t outputChannelsCount;
 
 private:
-    static void validate(std::shared_ptr<Node> constantLayer);
     static std::vector<float> getBlobValue(std::shared_ptr<Node> constantLayer);
 };
 
 inline std::ostream &operator << (std::ostream &os, const QuantizationDetails& value) {
     os << "levels: " << value.levels <<
-       ", input 1/" << value.inputIntervalsCount << ": [" << value.getInputLowValue(0) << " : " << value.getInputHighValue(0) << "], " <<
-       ", output 1/" << value.outputIntervalsCount << ": [" << value.getOutputLowValue(0) << " : " << value.getOutputHighValue(0) << "]";
+       ", input 1/" << value.inputLowValues.size() << ": [" << value.getInputLowValue(0) << " : " << value.getInputHighValue(0) << "], " <<
+       ", output 1/" << value.outputLowValues.size() << ": [" << value.getOutputLowValue(0) << " : " << value.getOutputHighValue(0) << "]";
     return os;
 }
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_base_transformation.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_base_transformation.hpp
index 679a8d0f61d6db..0b9782e4eb207a 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_base_transformation.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_base_transformation.hpp
@@ -19,10 +19,10 @@ namespace low_precision {
 * 
 */
 
-class TRANSFORMATIONS_API ReduceBaseTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ReduceBaseTransformation : public LayerTransformation {
 public:
-    ReduceBaseTransformation(const Params& params);
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) const override;
+    ReduceBaseTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const override;
 
 protected:
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_max.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_max.hpp
index 453f48dfeca48b..b9c2b98253ef82 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_max.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_max.hpp
@@ -14,11 +14,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ReduceMaxTransformation : public ReduceBaseTransformation {
+class LP_TRANSFORMATIONS_API ReduceMaxTransformation : public ReduceBaseTransformation {
 public:
-    ReduceMaxTransformation(const Params& params);
+    NGRAPH_RTTI_DECLARATION;
+    ReduceMaxTransformation(const Params& params = Params());
     bool isPrecisionPreserved(std::shared_ptr<Node> reduce) const noexcept override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const override;
 
 protected:
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_mean.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_mean.hpp
index 8f62c34cc0cec0..31f542a37548b2 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_mean.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_mean.hpp
@@ -14,11 +14,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ReduceMeanTransformation : public ReduceBaseTransformation {
+class LP_TRANSFORMATIONS_API ReduceMeanTransformation : public ReduceBaseTransformation {
 public:
-    ReduceMeanTransformation(const Params& params);
+    NGRAPH_RTTI_DECLARATION;
+    ReduceMeanTransformation(const Params& params = Params());
     bool isPrecisionPreserved(std::shared_ptr<Node> reduce) const noexcept override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const override;
 
 protected:
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_min.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_min.hpp
index 2545af1e9febd7..e4ccdeab97e74a 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_min.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_min.hpp
@@ -14,11 +14,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ReduceMinTransformation : public ReduceBaseTransformation {
+class LP_TRANSFORMATIONS_API ReduceMinTransformation : public ReduceBaseTransformation {
 public:
-    ReduceMinTransformation(const Params& params);
+    NGRAPH_RTTI_DECLARATION;
+    ReduceMinTransformation(const Params& params = Params());
     bool isPrecisionPreserved(std::shared_ptr<Node> reduce) const noexcept override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const override;
 
 protected:
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_sum.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_sum.hpp
index ae7f07efe6bc65..5053545fbff5bb 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/reduce_sum.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/reduce_sum.hpp
@@ -14,11 +14,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ReduceSumTransformation : public ReduceBaseTransformation {
+class LP_TRANSFORMATIONS_API ReduceSumTransformation : public ReduceBaseTransformation {
 public:
+    NGRAPH_RTTI_DECLARATION;
     ReduceSumTransformation(const Params& params);
     bool isPrecisionPreserved(std::shared_ptr<Node> reduce) const noexcept override;
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const override;
 
 protected:
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/relu.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/relu.hpp
index 734a42273c50c3..1f7489a73d8337 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/relu.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/relu.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ReluTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ReluTransformation : public LayerTransformation {
 public:
-    ReluTransformation(const Params& params) : LayerTransformation(params) {}
-    ~ReluTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    ReluTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/reshape.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/reshape.hpp
index 290e028dc5f3e9..cb1b3a28456f03 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/reshape.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/reshape.hpp
@@ -11,12 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ReshapeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ReshapeTransformation : public LayerTransformation {
 public:
-    ReshapeTransformation(const Params& params) : LayerTransformation(params) {}
-    ~ReshapeTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    ReshapeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/attribute_parameters.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/attribute_parameters.hpp
new file mode 100644
index 00000000000000..6789bc73ae564f
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/attribute_parameters.hpp
@@ -0,0 +1,14 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <ngraph/type/element_type.hpp>
+#include "low_precision/lpt_visibility.hpp"
+
+class LP_TRANSFORMATIONS_API AttributeParameters {
+public:
+    AttributeParameters(const ngraph::element::Type deqPrecision = ngraph::element::f32) : deqPrecision(deqPrecision) {}
+    ngraph::element::Type deqPrecision;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp
new file mode 100644
index 00000000000000..b8aabf3718db4b
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp
@@ -0,0 +1,39 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <string>
+#include <vector>
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+#include "low_precision/lpt_visibility.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+
+namespace ngraph {
+class LP_TRANSFORMATIONS_API AvgPoolPrecisionPreservedAttribute : public PrecisionPreservedAttribute {
+};
+
+using AvgPoolPrecisionPreservedAttributePtr = std::shared_ptr<AvgPoolPrecisionPreservedAttribute>;
+
+extern template class LP_TRANSFORMATIONS_API VariantImpl<AvgPoolPrecisionPreservedAttributePtr>;
+
+template<>
+class LP_TRANSFORMATIONS_API VariantWrapper<AvgPoolPrecisionPreservedAttributePtr> : public VariantImpl<AvgPoolPrecisionPreservedAttributePtr> {
+public:
+    static constexpr VariantTypeInfo type_info{ "LowPrecision::AvgPoolPrecisionPreserved", 0 };
+
+    const VariantTypeInfo& get_type_info() const override {
+        return type_info;
+    }
+
+    VariantWrapper(const value_type& value) : VariantImpl<value_type>(value) {}
+
+    AvgPoolPrecisionPreservedAttributePtr get() { return this->m_value; }
+
+    void merge(std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AvgPoolPrecisionPreservedAttribute>>>>& attributes);
+    std::string to_string() override;
+};
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/intervals_alignment_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/intervals_alignment_attribute.hpp
new file mode 100644
index 00000000000000..3c723a444055c4
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/intervals_alignment_attribute.hpp
@@ -0,0 +1,88 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <string>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include "low_precision/rt_info/shared_value_attribute.hpp"
+#include "low_precision/rt_info/attribute_parameters.hpp"
+#include "low_precision/lpt_visibility.hpp"
+
+namespace ngraph {
+class IntervalsAlignmentAttribute;
+
+class LP_TRANSFORMATIONS_API IntervalsAlignmentSharedValue : public SharedValue<IntervalsAlignmentAttribute> {
+public:
+    class Interval {
+    public:
+        Interval() = default;
+        Interval(const float low, const float high) : low(low), high(high) {}
+        float low;
+        float high;
+    };
+
+    IntervalsAlignmentSharedValue() = default;
+    IntervalsAlignmentSharedValue(
+        const Interval& combinedInterval,
+        const Interval& minInterval,
+        const size_t minLevels) :
+        combinedInterval(combinedInterval),
+        minInterval(minInterval),
+        minLevels(minLevels) {}
+
+    Interval combinedInterval;
+    Interval minInterval;
+    size_t minLevels;
+    // preferable precisions which are preferred by affected quantization operations to avoid zero points
+    std::set<element::Type> preferablePrecisions;
+
+#ifdef LPT_DEBUG
+    std::string minLevelsOperation;
+#endif
+};
+
+class LP_TRANSFORMATIONS_API IntervalsAlignmentAttribute : public SharedValueAttribute<IntervalsAlignmentSharedValue> {
+public:
+    IntervalsAlignmentAttribute() = default;
+    IntervalsAlignmentAttribute(IntervalsAlignmentSharedValue::Interval combinedInterval, size_t levels);
+    IntervalsAlignmentAttribute(
+        const IntervalsAlignmentSharedValue::Interval combinedInterval,
+        const size_t levels,
+        const IntervalsAlignmentSharedValue::Interval minInterval,
+        const size_t minLevels);
+
+    // specify subgraph original levels
+    size_t levels;
+};
+
+using IntervalsAlignmentAttributePtr = std::shared_ptr<IntervalsAlignmentAttribute>;
+
+extern template class LP_TRANSFORMATIONS_API ngraph::VariantImpl<IntervalsAlignmentAttributePtr>;
+
+template<>
+class LP_TRANSFORMATIONS_API VariantWrapper<std::shared_ptr<IntervalsAlignmentAttribute>> :
+    public VariantImpl<std::shared_ptr<IntervalsAlignmentAttribute>> {
+public:
+    static constexpr VariantTypeInfo type_info{ "LowPrecision::IntervalsAlignment", 0 };
+
+    const VariantTypeInfo& get_type_info() const override {
+        return type_info;
+    }
+
+    VariantWrapper(const value_type& value) : VariantImpl<value_type>(value) {}
+
+    std::shared_ptr<IntervalsAlignmentAttribute> get() const { return this->m_value; }
+
+    static std::shared_ptr<VariantWrapper<std::shared_ptr<IntervalsAlignmentAttribute>>> create(
+        const std::shared_ptr<ngraph::Node>& node,
+        const AttributeParameters& params);
+    void merge(std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<IntervalsAlignmentAttribute>>>>& attributes);
+    std::string to_string() override;
+};
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/per_tensor_quantization_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/per_tensor_quantization_attribute.hpp
new file mode 100644
index 00000000000000..1001df8bffeaf7
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/per_tensor_quantization_attribute.hpp
@@ -0,0 +1,33 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include "low_precision/rt_info/shared_value_attribute.hpp"
+#include "low_precision/layer_transformation.hpp"
+#include "attribute_parameters.hpp"
+
+namespace ngraph {
+class LP_TRANSFORMATIONS_API PerTensorQuantizationAttribute {
+};
+
+extern template class LP_TRANSFORMATIONS_API ngraph::VariantImpl<PerTensorQuantizationAttribute>;
+
+template<>
+class LP_TRANSFORMATIONS_API VariantWrapper<PerTensorQuantizationAttribute> : public VariantImpl<PerTensorQuantizationAttribute> {
+public:
+    static constexpr VariantTypeInfo type_info { "LowPrecision::PerTensorQuantization", 0 };
+
+    VariantWrapper(const value_type& value) : VariantImpl<value_type>(value) {}
+
+    const VariantTypeInfo& get_type_info() const override {
+        return type_info;
+    }
+};
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precision_preserved_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precision_preserved_attribute.hpp
new file mode 100644
index 00000000000000..bf109407d008e9
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precision_preserved_attribute.hpp
@@ -0,0 +1,51 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+#include "low_precision/lpt_visibility.hpp"
+#include "low_precision/rt_info/shared_value_attribute.hpp"
+
+namespace ngraph {
+
+class LP_TRANSFORMATIONS_API PrecisionPreservedAttribute;
+
+class LP_TRANSFORMATIONS_API PrecisionPreservedSharedValue : public SharedValue<PrecisionPreservedAttribute> {
+public:
+    PrecisionPreservedSharedValue() = default;
+    PrecisionPreservedSharedValue(const bool value) : value(value) {}
+    bool value;
+};
+
+class LP_TRANSFORMATIONS_API PrecisionPreservedAttribute : public SharedValueAttribute<PrecisionPreservedSharedValue> {
+public:
+    PrecisionPreservedAttribute() = default;
+    PrecisionPreservedAttribute(const bool value);
+};
+
+using PrecisionPreservedAttributePtr = std::shared_ptr<PrecisionPreservedAttribute>;
+
+extern template class LP_TRANSFORMATIONS_API ngraph::VariantImpl<PrecisionPreservedAttributePtr>;
+
+template<>
+class LP_TRANSFORMATIONS_API VariantWrapper<PrecisionPreservedAttributePtr> : public VariantImpl<PrecisionPreservedAttributePtr> {
+public:
+    static constexpr VariantTypeInfo type_info{ "LowPrecision::PrecisionPreserved", 0 };
+
+    const VariantTypeInfo& get_type_info() const override {
+        return type_info;
+    }
+
+    VariantWrapper(const value_type& value) : VariantImpl<value_type>(value) {}
+
+    PrecisionPreservedAttributePtr get() { return this->m_value; }
+
+    std::string to_string() override;
+};
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precisions_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precisions_attribute.hpp
new file mode 100644
index 00000000000000..5fc08c17926a98
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/precisions_attribute.hpp
@@ -0,0 +1,64 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <set>
+#include <unordered_set>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include <ngraph/variant.hpp>
+
+#include "low_precision/layer_transformation.hpp"
+#include "low_precision/lpt_visibility.hpp"
+#include "low_precision/rt_info/attribute_parameters.hpp"
+#include "low_precision/rt_info/shared_value_attribute.hpp"
+
+namespace ngraph {
+
+class PrecisionsAttribute;
+
+class LP_TRANSFORMATIONS_API PrecisionsSharedValue : public SharedValue<PrecisionsAttribute> {
+public:
+    std::vector<ngraph::element::Type> precisions;
+};
+
+using PrecisionsAttributePtr = std::shared_ptr<PrecisionsAttribute>;
+
+class LP_TRANSFORMATIONS_API PrecisionsAttribute : public SharedValueAttribute<PrecisionsSharedValue> {
+public:
+    static const std::vector<ngraph::element::Type> defaultPrecisions;
+    PrecisionsAttribute(const std::vector<ngraph::element::Type>& precisions = defaultPrecisions);
+};
+
+extern template class LP_TRANSFORMATIONS_API ngraph::VariantImpl<std::shared_ptr<PrecisionsAttribute>>;
+
+template<>
+class LP_TRANSFORMATIONS_API VariantWrapper<std::shared_ptr<PrecisionsAttribute>> : public VariantImpl<std::shared_ptr<PrecisionsAttribute>> {
+public:
+    static constexpr VariantTypeInfo type_info{ "LowPrecision::Precisions", 0 };
+
+    const VariantTypeInfo& get_type_info() const override {
+        return type_info;
+    }
+
+    VariantWrapper(const value_type& value) : VariantImpl<value_type>(value) {}
+
+    std::shared_ptr<Variant> init(const std::shared_ptr<ngraph::Node>& node) override;
+
+    std::shared_ptr<PrecisionsAttribute> get() { return this->m_value; }
+
+    // create attribute instance for node
+    static std::shared_ptr<VariantWrapper<std::shared_ptr<PrecisionsAttribute>>> create(
+        const std::shared_ptr<ngraph::Node>& node,
+        const AttributeParameters& params);
+    // merge attribute instances which can be got from different sources: node, input port or output port
+    void merge(std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>>& attributes);
+    // vizualize shared attributes details in VizualizeTree pass
+    std::string to_string() override;
+};
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/quantization_alignment_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/quantization_alignment_attribute.hpp
new file mode 100644
index 00000000000000..198301a9c4aef2
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/quantization_alignment_attribute.hpp
@@ -0,0 +1,60 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <set>
+#include <unordered_set>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+#include "shared_value_attribute.hpp"
+#include "attribute_parameters.hpp"
+
+namespace ngraph {
+class QuantizationAlignmentAttribute;
+
+class LP_TRANSFORMATIONS_API QuantizationAlignmentSharedValue : public SharedValue<QuantizationAlignmentAttribute> {
+public:
+    QuantizationAlignmentSharedValue(const bool value = false) : value(value) {}
+    bool value;
+};
+
+class LP_TRANSFORMATIONS_API QuantizationAlignmentAttribute : public SharedValueAttribute<QuantizationAlignmentSharedValue>{
+public:
+    QuantizationAlignmentAttribute(const bool value = false);
+};
+
+using QuantizationAlignmentAttributePtr = std::shared_ptr<QuantizationAlignmentAttribute>;
+
+extern template class LP_TRANSFORMATIONS_API ngraph::VariantImpl<QuantizationAlignmentAttributePtr>;
+
+template<>
+class LP_TRANSFORMATIONS_API VariantWrapper<std::shared_ptr<QuantizationAlignmentAttribute>> :
+    public VariantImpl<std::shared_ptr<QuantizationAlignmentAttribute>> {
+public:
+    static constexpr VariantTypeInfo type_info{ "LowPrecision::QuantizationAlignment", 0 };
+
+    const VariantTypeInfo& get_type_info() const override {
+        return type_info;
+    }
+
+    VariantWrapper(const value_type& value) : VariantImpl<value_type>(value) {}
+
+    std::shared_ptr<Variant> init(const std::shared_ptr<ngraph::Node>& node) override;
+
+    std::shared_ptr<QuantizationAlignmentAttribute> get() { return this->m_value; }
+
+    static std::shared_ptr<VariantWrapper<std::shared_ptr<QuantizationAlignmentAttribute>>> create(
+        const std::shared_ptr<ngraph::Node>& node,
+        const AttributeParameters& params);
+    void merge(std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<QuantizationAlignmentAttribute>>>>& attributes);
+    std::string to_string() override;
+};
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/shared_value_attribute.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/shared_value_attribute.hpp
new file mode 100644
index 00000000000000..706ff46d590fa6
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/rt_info/shared_value_attribute.hpp
@@ -0,0 +1,59 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <unordered_set>
+#include <vector>
+
+#include <ngraph/node.hpp>
+#include <ngraph/variant.hpp>
+
+#include <low_precision/lpt_visibility.hpp>
+#include <ngraph/pass/graph_rewrite.hpp>
+
+template <class SharedAttributeType>
+class LP_TRANSFORMATIONS_API SharedValue;
+
+template <class SharedValueType>
+class LP_TRANSFORMATIONS_API SharedValueAttribute {
+public:
+    SharedValueAttribute() : sharedValue(std::make_shared<SharedValueType>()) {}
+    virtual ~SharedValueAttribute() = default;
+    std::shared_ptr<SharedValueType> sharedValue;
+    std::string get_string() {
+        std::stringstream ss;
+
+        const size_t rawPointer = (size_t)this;
+        ss << rawPointer << ": ";
+
+        const size_t sharedValueRawPointer = (size_t)sharedValue.get();
+        ss << "sharedValue: " << sharedValueRawPointer;
+
+        bool firstAttribute = true;
+        ss << ", attributes: {";
+        for (auto& attributeWeakPtr : sharedValue->attributes) {
+            auto attribute = attributeWeakPtr.lock();
+            if (attribute == nullptr) {
+                continue;
+            }
+
+            if (!firstAttribute) {
+                ss << ", ";
+            }
+            ss << (size_t)attribute.get();
+            firstAttribute = false;
+        }
+        ss << "}, ";
+        return ss.str();
+    }
+};
+
+template <class SharedValueAttributeType>
+class LP_TRANSFORMATIONS_API SharedValue {
+public:
+    virtual ~SharedValue() = default;
+    std::vector<std::weak_ptr<SharedValueAttributeType>> attributes;
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/shuffle_channels.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/shuffle_channels.hpp
index 42124d4b7b101b..ab28d754598e67 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/shuffle_channels.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/shuffle_channels.hpp
@@ -11,11 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API ShuffleChannelsTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API ShuffleChannelsTransformation : public LayerTransformation {
 public:
-    ShuffleChannelsTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    ShuffleChannelsTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/split.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/split.hpp
index 5a9fbc48ce7916..d4f2c72b8beb7b 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/split.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/split.hpp
@@ -13,11 +13,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API SplitTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API SplitTransformation : public LayerTransformation {
 public:
-    SplitTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    SplitTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     void updateOutputs(
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/squeeze.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/squeeze.hpp
index df4d3576a2b68d..fab050564c8bc0 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/squeeze.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/squeeze.hpp
@@ -11,11 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API SqueezeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API SqueezeTransformation : public LayerTransformation {
 public:
-    SqueezeTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    SqueezeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/strided_slice.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/strided_slice.hpp
index 2228020d45988c..5a0520f54ae9b1 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/strided_slice.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/strided_slice.hpp
@@ -12,11 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API StridedSliceTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API StridedSliceTransformation : public LayerTransformation {
 public:
-    StridedSliceTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    StridedSliceTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher& m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/subtract.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/subtract.hpp
index e0beb34946ae88..56c66d9945040b 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/subtract.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/subtract.hpp
@@ -11,12 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API SubtractTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API SubtractTransformation : public LayerTransformation {
 public:
-    SubtractTransformation(const Params& params) : LayerTransformation(params) {}
-    ~SubtractTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    SubtractTransformation(const Params& params);
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/subtract_multiply_to_multiply_add.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/subtract_multiply_to_multiply_add.hpp
index 62bcd527663a6e..cee4f4f5d627e1 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/subtract_multiply_to_multiply_add.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/subtract_multiply_to_multiply_add.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API SubtractMultiplyToMultiplyAddTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API SubtractMultiplyToMultiplyAddTransformation : public LayerTransformation {
 public:
-    SubtractMultiplyToMultiplyAddTransformation(const Params& params) : LayerTransformation(params) {}
-    ~SubtractMultiplyToMultiplyAddTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    SubtractMultiplyToMultiplyAddTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/transformation_context.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/transformation_context.hpp
index 0419cac1256cc8..1aad5e55bd648e 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/transformation_context.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/transformation_context.hpp
@@ -13,8 +13,9 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API TransformationContext {
+class LP_TRANSFORMATIONS_API TransformationContext {
 public:
+    TransformationContext();
     explicit TransformationContext(std::shared_ptr<Function> function);
     std::shared_ptr<Function> function;
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/transformer.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/transformer.hpp
deleted file mode 100644
index 9e096c85ce458a..00000000000000
--- a/inference-engine/src/low_precision_transformations/include/low_precision/transformer.hpp
+++ /dev/null
@@ -1,316 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-#include <algorithm>
-#include <map>
-#include <memory>
-#include <string>
-#include <vector>
-
-#include <ngraph/ngraph.hpp>
-#include <ngraph_ops/type_relaxed.hpp>
-
-#include "layer_transformation.hpp"
-#include "iparams_manager.hpp"
-#include "ilayer_transformations_manager.hpp"
-
-namespace ngraph {
-namespace pass {
-namespace low_precision {
-
-struct StandaloneCleanup {
-    std::string typeName;
-    std::string typeId;
-    LayerTransformationPtr transformation;
-};
-
-class TRANSFORMATIONS_API LowPrecisionTransformations {
-public:
-    LowPrecisionTransformations() {}
-    LowPrecisionTransformations(
-        const std::map<std::string, LayerTransformationPtr>& branchSpecificTransformations,
-        const std::map<std::string, LayerTransformationPtr>& decompositionTransformations,
-        const std::map<std::string, LayerTransformationPtr>& transformations,
-        const std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>>& cleanupTransformations,
-        const std::vector<StandaloneCleanup>& standaloneCleanupTransformations);
-
-    void setUpdatePrecisions(const bool updatePrecisions);
-    void setQuantizedTensorAlignmentOnActivations(const LayerTransformation::QuantizedTensorAlignment quantizedTensorAlignmentOnActivations);
-    void setQuantizedTensorAlignmentOnWeights(const LayerTransformation::QuantizedTensorAlignment quantizedTensorAlignmentOnWeights);
-
-    /**
-     * Remove branch specific transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& removeBranchSpecific() {
-        const std::string operationType = getType<Operation>();
-        const std::string transformationType = typeid(Transformation).name();
-
-        for (auto it = branchSpecificTransformations.begin(); it != branchSpecificTransformations.end(); ++it) {
-            const auto& tranformationPtr = *it->second;
-            if ((it->first == operationType) && (typeid(tranformationPtr).name() == transformationType)) {
-                branchSpecificTransformations.erase(it);
-                break;
-            }
-        }
-        return *this;
-    }
-
-    /**
-     * Remove transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& remove() {
-        const std::string operationType = getType<Operation>();
-        const std::string transformationType = typeid(Transformation).name();
-
-        for (auto it = transformations.begin(); it != transformations.end(); ++it) {
-            const auto& tranformationPtr = *it->second;
-            if ((it->first == operationType) && (typeid(tranformationPtr).name() == transformationType)) {
-                transformations.erase(it);
-                break;
-            }
-        }
-        return *this;
-    }
-
-    /**
-     * Remove cleanup transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& removeCleanup() {
-        const std::string operationType = getType<Operation>();
-        const std::string transformationType = typeid(Transformation).name();
-
-        const auto it = cleanupTransformations.find(operationType);
-        if (it != cleanupTransformations.end()) {
-            const auto it1 = std::find_if(it->second.begin(), it->second.end(),
-                [&](const std::pair<std::string, LayerTransformationPtr>& transformation) {
-                    return transformation.first == transformationType;
-                });
-            if (it1 != it->second.end()) {
-                it->second.erase(it1);
-                if (it->second.empty()) {
-                    cleanupTransformations.erase(it);
-                }
-            }
-        }
-        return *this;
-    }
-
-    /**
-     * Remove standalone cleanup transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& removeStandaloneCleanup() {
-        const std::string operationType = getType<Operation>();
-        const std::string transformationType = typeid(Transformation).name();
-
-        for (auto it = standaloneCleanupTransformations.begin(); it != standaloneCleanupTransformations.end(); ++it) {
-            const auto& standaloneCleanup = *it;
-            if ((operationType == standaloneCleanup.typeName) && (transformationType == standaloneCleanup.typeId)) {
-                standaloneCleanupTransformations.erase(it);
-                break;
-            }
-        }
-        return *this;
-    }
-
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& removeAll() {
-        removeBranchSpecific<Transformation, Operation>();
-        remove<Transformation, Operation>();
-        removeCleanup<Transformation, Operation>();
-        removeStandaloneCleanup<Transformation, Operation>();
-
-        return *this;
-    }
-
-    /**
-     * Add branch specific transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& addBranchSpecific(const LayerTransformation::Params& params) {
-        const std::string typeName = getType<Operation>();
-        const auto it = branchSpecificTransformations.find(typeName);
-        if (it != branchSpecificTransformations.end()) {
-            branchSpecificTransformations.erase(it);
-        }
-
-        branchSpecificTransformations.emplace(typeName, std::make_shared<Transformation>(params));
-        return *this;
-    }
-
-    /**
-    * Add decomposition transformation. Transformation type and operation type are required.
-    * Operation type is used to find transformation by operation during precision definition.
-    */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& addDecomposition(const LayerTransformation::Params& params) {
-        const std::string typeName = getType<Operation>();
-        const auto it = decompositionTransformations.find(typeName);
-        if (it != decompositionTransformations.end()) {
-            decompositionTransformations.erase(it);
-        }
-
-        decompositionTransformations.emplace(typeName, std::make_shared<Transformation>(params));
-        return *this;
-    }
-
-    /**
-     * Add transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& add(const LayerTransformation::Params& params) {
-        const std::string typeName = getType<Operation>();
-        const auto it = transformations.find(typeName);
-        if (it != transformations.end()) {
-            transformations.erase(it);
-        }
-
-        transformations.emplace(typeName, std::make_shared<Transformation>(params));
-        return *this;
-    }
-
-    /**
-     * Add cleanup transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& addCleanup(const LayerTransformation::Params& params) {
-        const std::string typeName = getType<Operation>();
-        const std::string typeId = typeid(Transformation).name();
-        const auto it = cleanupTransformations.find(typeName);
-        if (it == cleanupTransformations.end()) {
-            cleanupTransformations.emplace(typeName,
-                std::vector<std::pair<std::string, LayerTransformationPtr>>{ std::make_pair(typeId, std::make_shared<Transformation>(params)) });
-        } else {
-            const auto it1 = std::find_if(it->second.begin(), it->second.end(),
-                [&](const std::pair<std::string, LayerTransformationPtr>& transformation) {
-                    return transformation.first == typeName;
-                });
-            if (it1 != it->second.end()) {
-                it->second.erase(it1);
-            }
-            it->second.emplace_back(std::make_pair(typeId, std::make_shared<Transformation>(params)));
-        }
-        return *this;
-    }
-
-    /**
-     * Add cleanup transformation. Transformation type and operation type are required.
-     * Operation type is used to find transformation by operation during precision definition.
-     */
-    template <class Transformation, class Operation>
-    LowPrecisionTransformations& addStandaloneCleanup(const LayerTransformation::Params& params) {
-        const std::string typeName = getType<Operation>();
-        const std::string typeId = typeid(Transformation).name();
-        const auto it = std::find_if(standaloneCleanupTransformations.begin(), standaloneCleanupTransformations.end(),
-            [&](const StandaloneCleanup& transformation) {
-                return transformation.typeName == typeName && transformation.typeId == typeId;
-            });
-        if (it == standaloneCleanupTransformations.end()) {
-            standaloneCleanupTransformations.emplace_back(StandaloneCleanup{ typeName, typeId, std::make_shared<Transformation>(params) });
-        } else {
-            *it = { typeName, typeId, std::make_shared<Transformation>(params) };
-        }
-
-        return *this;
-    }
-
-    template <class Operation>
-    static std::string getType() {
-        return Operation::get_type_info_static().name;
-    }
-
-    static std::string getType(const Node& operation) {
-        return operation.get_type_name();
-    }
-
-    std::vector<LayerTransformationPtr> find(const std::string& transformationName) const;
-
-    template <class Operation>
-    std::vector<LayerTransformationPtr> find() const {
-        const std::string transformationKey = getType<Operation>();
-        return find(transformationKey);
-    }
-
-    void setParamsManager(IParamsManager* paramsManager) noexcept;
-    void setLayerTransformationsManager(ILayerTransformationsManager* layerTransformationsManager) noexcept;
-
-    // Key is not a layer type, but just a name of transformation
-    // Layer type (or a pattern) is defined by transformation itself as an ngraph matcher
-    std::map<std::string, LayerTransformationPtr> branchSpecificTransformations;
-    std::map<std::string, LayerTransformationPtr> decompositionTransformations;
-    std::map<std::string, LayerTransformationPtr> transformations;
-    std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>> cleanupTransformations;
-    std::vector<StandaloneCleanup> standaloneCleanupTransformations;
-
-private:
-    static void setParamsManager(IParamsManager* paramsManager, std::map<std::string, LayerTransformationPtr>& transformations) noexcept;
-    static void setParamsManager(
-        IParamsManager* paramsManager,
-        std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>>& transformations) noexcept;
-    static void setParamsManager(IParamsManager* paramsManager, std::vector<StandaloneCleanup>& transformations) noexcept;
-    static void setLayerTransformationsManager(
-        ILayerTransformationsManager* layerTransformationsManager,
-        std::map<std::string, LayerTransformationPtr>& transformations) noexcept;
-    static void setLayerTransformationsManager(
-        ILayerTransformationsManager* layerTransformationsManager,
-        std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>>& transformations) noexcept;
-    static void setLayerTransformationsManager(
-        ILayerTransformationsManager* layerTransformationsManager,
-        std::vector<StandaloneCleanup>& transformations) noexcept;
-};
-
-/**
- * @brief low precision transformation component.
-  */
-class TRANSFORMATIONS_API LowPrecisionTransformer : public IParamsManager, ILayerTransformationsManager {
-public:
-    static LowPrecisionTransformations getAllTransformations(const LayerTransformation::Params& params = LayerTransformation::Params());
-
-    static bool isFunctionQuantized(const std::shared_ptr<const Function>& function);
-
-    LowPrecisionTransformer();
-    LowPrecisionTransformer(const LowPrecisionTransformations& transformations);
-    void transform(std::shared_ptr<Function> network);
-
-    // IParamsManager interface implementation
-    std::vector<element::Type> getPrecisionsOnActivations(const Node& op) const noexcept override;
-
-    // ILayerTransformationsManager interface implementation
-    bool isQuantized(const std::shared_ptr<Node>& layer) const noexcept override;
-    bool isPrecisionPreserved(const std::shared_ptr<Node>& layer) const noexcept override;
-
-private:
-    LowPrecisionTransformations transformations;
-
-    void registerAllMatchers(
-        std::map<std::string, LayerTransformationPtr> transformations,
-        GraphRewrite& pass,
-        TransformationContext& context);
-
-    void registerAllMatchers(
-        std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>> transformations,
-        GraphRewrite& pass,
-        TransformationContext& context);
-};
-
-class TRANSFORMATIONS_API TypeRelaxedReplacer : public GraphRewrite {
-public:
-    TypeRelaxedReplacer();
-};
-
-} // namespace low_precision
-} // namespace pass
-} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/transparent_base_transformation.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/transparent_base_transformation.hpp
index d915515b598197..05b0dbebc0191f 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/transparent_base_transformation.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/transparent_base_transformation.hpp
@@ -12,11 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API TransparentBaseTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API TransparentBaseTransformation : public LayerTransformation {
 public:
     TransparentBaseTransformation(const Params& params) : LayerTransformation(params) {}
     ~TransparentBaseTransformation() override {};
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
 
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/transpose.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/transpose.hpp
index 3b41f3d48b25a7..d22fcc8ed8cf36 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/transpose.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/transpose.hpp
@@ -12,12 +12,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API TransposeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API TransposeTransformation : public LayerTransformation {
 public:
-    TransposeTransformation(const Params& params) : LayerTransformation(params) {}
-    ~TransposeTransformation() override {}
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    TransposeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/unsqueeze.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/unsqueeze.hpp
index ea166c979120ab..580c09ad80bcce 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/unsqueeze.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/unsqueeze.hpp
@@ -11,11 +11,11 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API UnsqueezeTransformation : public LayerTransformation {
+class LP_TRANSFORMATIONS_API UnsqueezeTransformation : public LayerTransformation {
 public:
-    UnsqueezeTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
-    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) const override;
+    NGRAPH_RTTI_DECLARATION;
+    UnsqueezeTransformation(const Params& params = Params());
+    bool transform(TransformationContext& context, ngraph::pattern::Matcher &m) override;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
 };
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/update_shared_precision_preserved.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/update_shared_precision_preserved.hpp
new file mode 100644
index 00000000000000..119ae13c412126
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/update_shared_precision_preserved.hpp
@@ -0,0 +1,107 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <vector>
+
+#include <ngraph/pass/pass.hpp>
+#include <ngraph/variant.hpp>
+
+#include "low_precision/network_helper.hpp"
+#include "low_precision/lpt_itt.hpp"
+#include "low_precision/lpt_visibility.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+template <typename AttributeType, typename OperationType>
+class UpdateSharedPrecisionPreserved;
+
+}  // namespace low_precision
+}  // namespace pass
+}  // namespace ngraph
+
+template <typename AttributeType, typename ExpectedAttributeType = AttributeType>
+class ngraph::pass::low_precision::UpdateSharedPrecisionPreserved : public ngraph::pass::MatcherPass {
+public:
+    UpdateSharedPrecisionPreserved() {
+        ngraph::graph_rewrite_callback callback = [&](pattern::Matcher& m) {
+            auto node = m.get_match_root();
+
+            const bool needToCheckExpectedAttributeType = !std::is_same<ExpectedAttributeType, AttributeType>::value;
+            if (!needToCheckExpectedAttributeType) {
+                // expected attribute is ignored, set attributes for node inputs except Result & FakeQuantize operations
+                if (is_type<ngraph::opset1::Result>(node) ||
+                    is_type<ngraph::opset1::FakeQuantize>(node) ||
+                    transformation_callback(node)) {
+                    return false;
+                }
+            }
+
+            if (ngraph::pass::low_precision::NetworkHelper::isPrecisionPreserved(node) || is_type<opset1::FakeQuantize>(node)) {
+                return false;
+            }
+
+            {
+                OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "UpdateSharedPrecisionPreserved");
+
+                // TODO: check if node can be quantized, if not, then doesn't update
+                for (auto input : node->inputs()) {
+                    auto precisionsAttributeWrapper = getAttribute<PrecisionsAttributePtr>(input);
+                    if (precisionsAttributeWrapper != nullptr) {
+                        const auto precisionsAttribute = precisionsAttributeWrapper->get();
+                        assert(precisionsAttribute != nullptr);
+                        if (precisionsAttribute->sharedValue->precisions.empty()) {
+                            return false;
+                        }
+                    }
+                }
+
+                for (auto input : node->inputs()) {
+                    if (needToCheckExpectedAttributeType) {
+                        if (getAttribute<ExpectedAttributeType>(input) == nullptr) {
+                            return false;
+                        }
+                    }
+                    auto parentAttribute = getSourceAttribute(input);
+                    if (parentAttribute == nullptr) {
+                        continue;
+                    }
+
+                    parentAttribute->get()->sharedValue->value = true;
+                }
+            }
+
+            return true;
+        };
+
+        auto matcher = std::make_shared<ngraph::pattern::Matcher>(pattern::any_input(), "PropagateThroughPrecisionPreserved");
+        this->register_matcher(matcher, callback);
+    }
+
+private:
+    Input<Node> getDequantizationInput(const Input<Node>& input) {
+        const auto dequantization = NetworkHelper::getDequantization(input.get_node()->shared_from_this(), input.get_index());
+        if (!dequantization.empty() &&
+            (is_type<opset1::Convert>(dequantization.data.get_node())) &&
+            is_type<opset1::FakeQuantize>(dequantization.data.get_node()->get_input_node_ptr(0))) {
+            assert(dequantization.data.get_target_inputs().size() == 1ul);
+            return *dequantization.data.get_target_inputs().begin();
+        }
+        return input;
+    }
+
+    std::shared_ptr<ngraph::VariantWrapper<AttributeType>> getSourceAttribute(const Input<Node>& input) {
+        const auto dequantizationInput = getDequantizationInput(input);
+        const auto output = dequantizationInput.get_source_output();
+        auto attribute = ngraph::pass::low_precision::getAttribute<AttributeType>(output.get_node()->shared_from_this());
+        if (attribute == nullptr) {
+            attribute = ngraph::pass::low_precision::getAttribute<AttributeType>(output.get_node_shared_ptr());
+        }
+        return attribute;
+    }
+};
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/variadic_split.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/variadic_split.hpp
index e7cab0c527c10e..014b3775fe75b8 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/variadic_split.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/variadic_split.hpp
@@ -13,10 +13,10 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API VariadicSplitTransformation : public SplitTransformation {
+class LP_TRANSFORMATIONS_API VariadicSplitTransformation : public SplitTransformation {
 public:
-    VariadicSplitTransformation(const Params& params);
-    void registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const override;
+    NGRAPH_RTTI_DECLARATION;
+    VariadicSplitTransformation(const Params& params = Params());
 };
 } // namespace low_precision
 } // namespace pass
diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/weightable_layer_transformation.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/weightable_layer_transformation.hpp
index aeb0a6d9abd576..d2b5823fd3d16d 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/weightable_layer_transformation.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/weightable_layer_transformation.hpp
@@ -13,21 +13,30 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-class TRANSFORMATIONS_API WeightableLayerTransformation : public LayerTransformation{
+class LP_TRANSFORMATIONS_API WeightableLayerTransformation : public LayerTransformation{
 public:
     WeightableLayerTransformation(const Params& params);
     bool canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const override;
     bool canConvolutionBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const;
-    bool isQuantized(std::shared_ptr<Node> layer, bool reshapeIsRequired) const noexcept;
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
 
+    static bool checkPrecisionOnActivation(
+        const std::shared_ptr<const ngraph::Node>& node,
+        const std::vector<ngraph::element::Type>& supportedPrecisionsOnActivations) {
+        return true;
+    }
+
+    static bool isQuantizedStatic(const std::shared_ptr<const Node>& layer, const bool reshapeIsRequired) noexcept;
+
 protected:
-    void decomposeFakeQuantizeForWeightsPath(const std::shared_ptr<Node>& weightableLayer, size_t outChannelsShapeIndex = 0ul) const;
+    bool decomposeFakeQuantizeForWeightsPath(const std::shared_ptr<Node>& weightableLayer, size_t outChannelsShapeIndex = 0ul) const;
     static bool isGroup(const std::shared_ptr<Node>& node);
     static bool isDepthwise(const std::shared_ptr<Node>& node);
 
-    std::shared_ptr<opset1::FakeQuantize> getFakeQuantizeOnWeights(const std::shared_ptr<Node>& node) const;
-    DataPrecision getDataPrecisionOnWeights(const std::shared_ptr<Node>& node) const;
+public:
+    static std::shared_ptr<opset1::FakeQuantize> getFakeQuantizeOnWeights(const std::shared_ptr<Node>& node);
+    static DataPrecision getDataPrecisionOnWeights(const std::shared_ptr<Node>& node);
+    static bool isAsymmetricOnWeights(const std::shared_ptr<const Node>& node);
 };
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/src/add.cpp b/inference-engine/src/low_precision_transformations/src/add.cpp
index 915e87d2f60803..4ecd8464370c94 100644
--- a/inference-engine/src/low_precision_transformations/src/add.cpp
+++ b/inference-engine/src/low_precision_transformations/src/add.cpp
@@ -10,6 +10,7 @@
 #include <utility>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "ngraph_ops/type_relaxed.hpp"
 
 #include "low_precision/common/ie_lpt_exception.hpp"
@@ -20,6 +21,8 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
+NGRAPH_RTTI_DEFINITION(AddTransformation, "AddTransformation", 0);
+
 std::shared_ptr<opset1::Subtract> replaceToSubtract(const std::shared_ptr<Node>& op) {
     // TODO: separate this part to standalone transformation: AddToSubtractTransformation
     // motivation:
@@ -88,11 +91,22 @@ std::shared_ptr<opset1::Subtract> fuseWithSubtract(const std::shared_ptr<Node>&
     return newSubtract;
 }
 
-void AddTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Add>(pass, context);
+AddTransformation::AddTransformation(const Params& params) : EltwiseBaseTransformation(params) {
+    auto matcher = ngraph::pattern::wrap_type<opset1::Add>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "AddTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool AddTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool AddTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::Add> op = as_type_ptr<opset1::Add>(m.get_match_root());
     if ((op == nullptr) || (!canBeTransformed(context, op))) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/align_quantization_intervals.cpp b/inference-engine/src/low_precision_transformations/src/align_quantization_intervals.cpp
new file mode 100644
index 00000000000000..728161d0207aa1
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/align_quantization_intervals.cpp
@@ -0,0 +1,25 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/align_quantization_intervals.hpp"
+#include <memory>
+#include <ngraph/opsets/opset1.hpp>
+#include "low_precision/create_attribute.hpp"
+#include "low_precision/propagate_through_precision_preserved.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::AlignQuantizationIntervals, "AlignQuantizationIntervals", 0);
+
+bool ngraph::pass::low_precision::AlignQuantizationIntervals::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    ngraph::pass::Manager manager;
+    manager.set_per_pass_validation(false);
+    std::shared_ptr<ngraph::pass::GraphRewrite> intervalsAlignment = manager.register_pass<ngraph::pass::GraphRewrite>();
+    intervalsAlignment->add_matcher<low_precision::CreateAttribute<IntervalsAlignmentAttributePtr, opset1::FakeQuantize>>();
+    intervalsAlignment->add_matcher<low_precision::PropagateThroughPrecisionPreserved<IntervalsAlignmentAttribute>>();
+    manager.run_passes(f);
+    return false;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/align_quantization_parameters.cpp b/inference-engine/src/low_precision_transformations/src/align_quantization_parameters.cpp
new file mode 100644
index 00000000000000..72d4ed1184c694
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/align_quantization_parameters.cpp
@@ -0,0 +1,27 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/align_quantization_parameters.hpp"
+#include <memory>
+#include "low_precision/create_attribute.hpp"
+#include "low_precision/propagate_through_precision_preserved.hpp"
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
+#include "low_precision/rt_info/per_tensor_quantization_attribute.hpp"
+#include "low_precision/update_shared_precision_preserved.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::AlignQuantizationParameters, "AlignQuantizationParameters", 0);
+
+bool ngraph::pass::low_precision::AlignQuantizationParameters::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    ngraph::pass::Manager manager;
+    manager.set_per_pass_validation(false);
+    std::shared_ptr<ngraph::pass::GraphRewrite> propagation = manager.register_pass<ngraph::pass::GraphRewrite>();
+    propagation->add_matcher<low_precision::CreateAttribute<QuantizationAlignmentAttributePtr>>();
+    propagation->add_matcher<low_precision::PropagateThroughPrecisionPreserved<QuantizationAlignmentAttribute>>();
+    propagation->add_matcher<low_precision::UpdateSharedPrecisionPreserved<QuantizationAlignmentAttributePtr, PerTensorQuantizationAttribute>>();
+    manager.run_passes(f);
+    return false;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/avg_pool.cpp b/inference-engine/src/low_precision_transformations/src/avg_pool.cpp
index 3af973904e4be1..1fde22ec550f5e 100644
--- a/inference-engine/src/low_precision_transformations/src/avg_pool.cpp
+++ b/inference-engine/src/low_precision_transformations/src/avg_pool.cpp
@@ -7,39 +7,39 @@
 #include <memory>
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset1.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
 
 #include "low_precision/network_helper.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-AvgPoolTransformation::AvgPoolTransformation(const Params& params) : LayerTransformation(params) {
-}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::AvgPoolTransformation, "AvgPoolTransformation", 0);
 
-void AvgPoolTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::AvgPool>({ make_op_label<opset1::Multiply>() }));
+AvgPoolTransformation::AvgPoolTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::AvgPool>({ pattern::wrap_type<opset1::Multiply>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "AvgPoolTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool AvgPoolTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool AvgPoolTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
 
     const std::shared_ptr<Node> pooling = NetworkHelper::separateInStandaloneBranch(m.get_match_root());
-
-    const std::vector<std::shared_ptr<ngraph::Node>> children = getChildrenRecursivelyExceptPrecisionPreserved(pooling);
-
-    bool updatePrecision;
-    if ((children.size() == 1ul) && (!this->layerTransformationsManager->isQuantized(children[0]))) {
-        updatePrecision = false;
-    } else {
-        updatePrecision = NetworkHelper::notAllChildrensAreFQ(children);
-    }
-
+    const bool updatePrecision = isPrecisionPreserved(pooling);
     moveDequantizationAfter(context, pooling, NetworkHelper::getDequantization(pooling), updatePrecision);
     return true;
 }
@@ -55,8 +55,7 @@ bool AvgPoolTransformation::canBeTransformed(const TransformationContext& contex
 }
 
 bool AvgPoolTransformation::isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept {
-    const std::vector<std::shared_ptr<ngraph::Node>> children = getChildrenRecursivelyExceptPrecisionPreserved(layer);
-    return NetworkHelper::notAllChildrensAreFQ(children);
+    return NetworkHelper::isPrecisionPreserved(layer);
 }
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/src/base_matcher_pass.cpp b/inference-engine/src/low_precision_transformations/src/base_matcher_pass.cpp
new file mode 100644
index 00000000000000..2514559179edb1
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/base_matcher_pass.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/base_matcher_pass.hpp"
+#include <ngraph/node.hpp>
+#include "low_precision/rt_info/attribute_parameters.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
+
+ngraph::pass::low_precision::BaseMatcherPass::BaseMatcherPass(const AttributeParameters& params) : params(params) {
+}
diff --git a/inference-engine/src/low_precision_transformations/src/clamp.cpp b/inference-engine/src/low_precision_transformations/src/clamp.cpp
index 56cee1d88a497b..45c4cd5986c1a1 100644
--- a/inference-engine/src/low_precision_transformations/src/clamp.cpp
+++ b/inference-engine/src/low_precision_transformations/src/clamp.cpp
@@ -6,21 +6,32 @@
 #include <algorithm>
 #include <memory>
 #include <ngraph/ngraph.hpp>
+
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-ClampTransformation::ClampTransformation(const Params& params) : LayerTransformation(params) {}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ClampTransformation, "ClampTransformation", 0);
+
+ClampTransformation::ClampTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Clamp>({ pattern::wrap_type<opset1::Multiply>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void ClampTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::Clamp>({ make_op_label<opset1::Multiply>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ClampTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool ClampTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) const {
+bool ClampTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) {
     auto subWithTheSameValues = [](std::shared_ptr<ngraph::opset1::Subtract> sub) {
         if (sub == nullptr) {
             return false;
diff --git a/inference-engine/src/low_precision_transformations/src/common/operation_precision_restriction.cpp b/inference-engine/src/low_precision_transformations/src/common/operation_precision_restriction.cpp
new file mode 100644
index 00000000000000..0ec085d7245129
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/common/operation_precision_restriction.cpp
@@ -0,0 +1,19 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/common/operation_precision_restriction.hpp"
+
+#include <memory>
+#include <unordered_set>
+#include <set>
+#include <vector>
+
+#include <ngraph/opsets/opset1.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
+#include "low_precision/network_helper.hpp"
+#include "low_precision/rt_info/precisions_attribute.hpp"
+
+using namespace ngraph;
+
diff --git a/inference-engine/src/low_precision_transformations/src/concat.cpp b/inference-engine/src/low_precision_transformations/src/concat.cpp
index 622550794b29ab..0863dcb3f09763 100644
--- a/inference-engine/src/low_precision_transformations/src/concat.cpp
+++ b/inference-engine/src/low_precision_transformations/src/concat.cpp
@@ -11,11 +11,11 @@
 #include <utility>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
 #include "low_precision/common/fake_quantize_dequantization.hpp"
 #include "low_precision/common/ie_lpt_exception.hpp"
-#include "low_precision/common/subgraph.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -23,218 +23,155 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void ConcatTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addSingleNodePattern<opset1::Concat>(pass, context);
-}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ConcatTransformation, "ConcatTransformation", 0);
 
-bool ConcatTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
-    std::shared_ptr<ngraph::opset1::Concat> concat = ngraph::as_type_ptr<ngraph::opset1::Concat>(m.get_match_root());
-    if (!canBeTransformed(context, concat)) {
-        return false;
-    }
+ConcatTransformation::ConcatTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = ngraph::pattern::wrap_type<opset1::Concat>();
 
-    ngraph::pass::low_precision::Subgraph subgraph(layerTransformationsManager);
-    std::unordered_set<std::string> handledLayers;
-    if (!subgraph.fillSubgraphForConcat(concat, handledLayers)) {
-        return false;
-    }
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
 
-    if (subgraph.quantizationLayers.empty() || isHandled(context, subgraph.quantizationLayers)) {
-        return false;
-    }
+        return transform(*context, m);
+    };
 
-    // Concat operations precision is defined:
-    // 1. consumers after Concat
-    // 2. FakeQuantize precisions without zero point
-    ngraph::Node& quantizationLayer = *subgraph.quantizationLayers[0];
-    std::shared_ptr<ngraph::opset1::FakeQuantize> fq = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(quantizationLayer.shared_from_this());
-    if (!NetworkHelper::isQuantizeSupported(fq)) {
-        return false;
-    }
-    DataPrecision dataPrecision = getDataPrecision(fq, QuantizationDetails::getDetails(fq), false);
-    if (dataPrecision.precision == ngraph::element::undefined) {
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ConcatTransformation");
+    this->register_matcher(m, callback);
+}
+
+bool ConcatTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
+    std::shared_ptr<ngraph::opset1::Concat> concat = ngraph::as_type_ptr<ngraph::opset1::Concat>(m.get_match_root());
+    if (!canBeTransformed(context, concat)) {
         return false;
     }
 
-    std::vector<element::Type> concatChildrenPrecisions = precisionsOnActivations;
-
-    for (size_t i = 0; i < subgraph.quantizationLayers.size(); ++i) {
-        fq = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(subgraph.quantizationLayers[i]);
-        if (fq == nullptr) {
+    std::vector<FakeQuantizeDequantization> layerDequantizations;
+    layerDequantizations.reserve(concat->get_input_size());
+    for (size_t parentIndex = 0ul; parentIndex < concat->get_input_size(); parentIndex++) {
+        FakeQuantizeDequantization dequantization = NetworkHelper::getDequantization(concat, parentIndex);
+        if (dequantization.empty()) {
             return false;
         }
+        layerDequantizations.push_back(dequantization);
+    }
 
-        if (!NetworkHelper::isQuantizeSupported(fq)) {
-            return false;
+    bool allDequantizationShiftAreZero = true;
+    bool allDequantizationMultiplyAreZero = true;
+    for (const auto& dequantization : layerDequantizations) {
+        if (dequantization.subtract != nullptr) {
+            allDequantizationShiftAreZero = false;
         }
 
-        const QuantizationDetails& quantizationDetails = QuantizationDetails::getDetails(fq);
-
-        // per tensor scale is supported only
-        if (quantizationDetails.inputHighValues.size() != 1ul) {
-            return false;
+        if (dequantization.multiply != nullptr) {
+            allDequantizationMultiplyAreZero = false;
         }
 
-        // define concatenation operation consumers precisions
-        std::vector<element::Type> fqChildrenPrecisions = precisionsOnActivations;
-        fillAvailablePrecisions(subgraph.quantizationLayers[i], fqChildrenPrecisions);
-        concatChildrenPrecisions = NetworkHelper::precisionIntersection(concatChildrenPrecisions, fqChildrenPrecisions);
-        if (concatChildrenPrecisions.empty()) {
-            return false;
+        if (!allDequantizationShiftAreZero && !allDequantizationMultiplyAreZero) {
+            break;
         }
+    }
 
-        // define FakeQuantize precisions without zero point
-        const DataPrecision dataPrecision2 = getDataPrecision(subgraph.quantizationLayers[i]->shared_from_this(), quantizationDetails, false);
-        if (dataPrecision2.precision == ngraph::element::undefined) {
-            return false;
-        }
+    auto broadcastElementWiseConst = [](
+        // FakeQuantize constant shape must be broadcastable to the shape on data.
+        std::shared_ptr<ngraph::opset1::Constant> operation,
+        const ngraph::Shape targetShape) -> std::shared_ptr<Node> {
+            auto targetShapeConst = std::make_shared<ngraph::opset1::Constant>(
+                element::i64, ngraph::Shape{ targetShape.size() },
+                targetShape);
 
-        if (dataPrecision.precision != dataPrecision2.precision) {
-            dataPrecision = dataPrecision.precision.is_signed() ? dataPrecision : dataPrecision2;
-        }
-    }
+            auto broadcast = ngraph::pass::low_precision::fold<ngraph::opset1::Broadcast>(
+                operation,
+                targetShapeConst,
+                ngraph::op::AutoBroadcastType::NUMPY);
 
-    if (std::find(concatChildrenPrecisions.begin(), concatChildrenPrecisions.end(), dataPrecision.precision) == concatChildrenPrecisions.end()) {
-        dataPrecision = DataPrecision(concatChildrenPrecisions[0]);
-    }
+            return broadcast;
+    };
 
-    std::vector<QuantizationDetails> quantizationLayersDetails;
-    for (size_t i = 0; i < subgraph.quantizationLayers.size(); ++i) {
-        std::shared_ptr<opset1::FakeQuantize> fakeQuantize = as_type_ptr<opset1::FakeQuantize>(subgraph.quantizationLayers[i]);
-        auto newFakeQuantize = NetworkHelper::fuseConvert(fakeQuantize);
-        if (newFakeQuantize == nullptr) {
-            subgraph.quantizationLayers[i] = fakeQuantize;
-            quantizationLayersDetails.push_back(QuantizationDetails::getDetails(fakeQuantize));
-            continue;
+    bool someDqInLowPrecision = std::any_of(
+        layerDequantizations.begin(),
+        layerDequantizations.end(),
+        [](const FakeQuantizeDequantization& value) { return value.isLowPrecision(); });
+
+    bool someDqInFpPrecision = std::any_of(
+        layerDequantizations.begin(),
+        layerDequantizations.end(),
+        [](const FakeQuantizeDequantization& value) { return !value.isLowPrecision(); });
+
+    bool DqWithDifferentPrecision = someDqInLowPrecision && someDqInFpPrecision;
+
+    OutputVector dataNodes;
+    NodeVector convertNodes;
+    NodeVector subtractNodes;
+    NodeVector multiplyNodes;
+    for (size_t i = 0; i < layerDequantizations.size(); ++i) {
+        const auto& dequantization = layerDequantizations[i];
+
+        if (DqWithDifferentPrecision && dequantization.isLowPrecision()) {
+            dataNodes.push_back(dequantization.convert);
+        } else {
+            dataNodes.push_back(dequantization.data);
         }
 
-        fakeQuantize = newFakeQuantize;
-        newFakeQuantize = NetworkHelper::composeFakeQuantize(fakeQuantize);
-        if (newFakeQuantize == nullptr) {
-            subgraph.quantizationLayers[i] = fakeQuantize;
-            quantizationLayersDetails.push_back(QuantizationDetails::getDetails(fakeQuantize));
-            continue;
+        if (dequantization.convert != nullptr) {
+            convertNodes.push_back(dequantization.convert);
         }
 
-        fakeQuantize = newFakeQuantize;
-        subgraph.quantizationLayers[i] = fakeQuantize;
-        quantizationLayersDetails.push_back(QuantizationDetails::getDetails(fakeQuantize));
-    }
-
-    FakeQuantizeDequantization dequantization;
+        Shape targetShape(concat->get_input_partial_shape(i).rank().get_length(), 1ul);
+        targetShape[1] = concat->get_input_partial_shape(i)[1].get_length();
 
-    if ((quantizationLayersDetails[0].inputHighValues.size() == 1)) {
-        float outputLowValue = quantizationLayersDetails[0].outputLowValues[0];
-        float outputHighValue = quantizationLayersDetails[0].outputHighValues[0];
-
-        for (size_t index = 0lu; index < subgraph.quantizationLayers.size(); index++) {
-            const QuantizationDetails& quantizationDetails = quantizationLayersDetails[index];
-            if (outputLowValue > quantizationDetails.outputLowValues[0]) {
-                outputLowValue = quantizationDetails.outputLowValues[0];
-            }
-            if (outputHighValue < quantizationDetails.outputHighValues[0]) {
-                outputHighValue = quantizationDetails.outputHighValues[0];
-            }
+        if (!allDequantizationShiftAreZero) {
+            subtractNodes.push_back(dequantization.subtract == nullptr ?
+                std::make_shared<ngraph::opset1::Constant>(deqPrecision, targetShape, std::vector<float>({ 0.f })) :
+                broadcastElementWiseConst(dequantization.subtractConstant, targetShape));
         }
 
-        if ((outputLowValue == 0.f) && (outputHighValue == 0.f)) {
-            return false;
+        if (!allDequantizationMultiplyAreZero) {
+            multiplyNodes.push_back(dequantization.multiply == nullptr ?
+                std::make_shared<ngraph::opset1::Constant>(deqPrecision, targetShape, std::vector<float>({ 1.0f })) :
+                broadcastElementWiseConst(dequantization.multiplyConstant, targetShape));
         }
+    }
 
-        const float maxOutputInterval = outputHighValue - outputLowValue;
-        if (quantizedTensorAlignmentOnActivations == QuantizedTensorAlignment::UpdateLevel) {
-            const size_t minLevels = getMinQuantizationLevels(
-                dataPrecision,
-                maxOutputInterval,
-                quantizationLayersDetails,
-                outputLowValue,
-                outputHighValue);
-            if (minLevels < this->minQuantizationLevels) {
-                return false;
-            }
-        }
+    const auto newConcat = concat->clone_with_new_inputs(dataNodes);
 
-        // FQ -> SUB_quantization -> MUL_quantization -[INT8]-> SUB_dequantization -> MUL_dequantization ->
-        const float quantizationMul = (dataPrecision.max - dataPrecision.min) / maxOutputInterval;
-        const float dequantizationMul = maxOutputInterval / (dataPrecision.max - dataPrecision.min);
-
-        // FQ outputLowValue = dataPrecision.min * dequantizationMul - quantizationSub
-        const float quantizationSub = outputLowValue - dataPrecision.min * dequantizationMul;
-        const float dequantizationSub = std::round(-quantizationSub * quantizationMul);
-
-        // 1. get data for dequantization. Dequantization data will be used several times later.
-        dequantization = ngraph::pass::low_precision::NetworkHelper::makeDequantization(
-            dequantizationMul,
-            dequantizationSub,
-            subgraph.quantizationLayers[0]->get_output_element_type(0),
-            subgraph.quantizationLayers[0]->get_output_partial_shape(0),
-            updatePrecisions ? dataPrecision.precision : subgraph.quantizationLayers[0]->get_output_element_type(0),
-            deqPrecision);
-
-        for (size_t index = 0; index < subgraph.quantizationLayers.size(); index++) {
-            std::shared_ptr<ngraph::opset1::FakeQuantize> fakeQuantizeLayer = as_type_ptr<ngraph::opset1::FakeQuantize>(
-                subgraph.quantizationLayers[index]->shared_from_this());
-
-            const QuantizationDetails& quantizationDetails = quantizationLayersDetails[index];
-
-            switch (quantizedTensorAlignmentOnActivations) {
-                case QuantizedTensorAlignment::None: {
-                    THROW_TRANSFORMATION_EXCEPTION << "not implemented: " << quantizedTensorAlignmentOnActivations;
-                }
-                case QuantizedTensorAlignment::UpdateLevel: {
-                    const float updatedOutputLowValue = (quantizationDetails.outputLowValues[0] - quantizationSub) * quantizationMul;
-                    const float updatedOutputHighValue = (quantizationDetails.outputHighValues[0] - quantizationSub) * quantizationMul;
-
-                    // 2. update FakeQuantize - one time action
-                    std::shared_ptr<opset1::FakeQuantize> newFakeQuantizeLayer = ngraph::pass::low_precision::NetworkHelper::updateFakeQuantize(
-                        fakeQuantizeLayer,
-                        updatePrecisions ? dataPrecision.precision : fakeQuantizeLayer->get_output_element_type(0),
-                        roundf(updatedOutputLowValue),
-                        roundf(updatedOutputHighValue));
-
-                    const size_t levels = static_cast<size_t>(fabs(roundf(updatedOutputHighValue) - roundf(updatedOutputLowValue)) + 1.0);
-                    newFakeQuantizeLayer->set_levels(levels);
-
-                    subgraph.quantizationLayers[index] = newFakeQuantizeLayer;
-                    subgraph.layers[fakeQuantizeLayer->get_friendly_name()] = newFakeQuantizeLayer;
-                    break;
-                }
-                default: {
-                    THROW_TRANSFORMATION_EXCEPTION << "unexpected value " << quantizedTensorAlignmentOnActivations;
-                }
-            }
-        }
-    } else {
-        return false;
+    std::shared_ptr<ngraph::Node> lastDequantization = newConcat;
+    if (!convertNodes.empty()) {
+        const auto convert = convertNodes[0]->clone_with_new_inputs({ newConcat });
+
+        NetworkHelper::copyInfo({ concat, convert }, convert);
+        lastDequantization = convert;
     }
 
-    auto dequantizationValuesCallback = [&](
-        std::shared_ptr<ngraph::Node> layer,
-        std::shared_ptr<ngraph::Node> child,
-        const std::string originalLayerName,
-        std::vector<FakeQuantizeDequantization>& dequantizationsToConcatenate) {
-        dequantizationsToConcatenate.push_back(dequantization);
-    };
+    // concatenation axis is 1
+    if (!subtractNodes.empty()) {
+        const auto subtract = std::make_shared<DequantizationSubtract>(
+            lastDequantization,
+            NetworkHelper::toScalarIfPossible(subtractNodes.size() == 1ul ?
+                subtractNodes[0] :
+                ngraph::pass::low_precision::fold<ngraph::opset1::Concat>(subtractNodes, 1)));
 
-    addDequantizationLayers(context, subgraph, dequantizationValuesCallback);
-
-    if (updatePrecisions) {
-        for (const auto it : subgraph.layers) {
-            const std::shared_ptr<ngraph::Node>& node = it.second;
-            if (std::dynamic_pointer_cast<ngraph::op::TypeRelaxedBase>(node) != nullptr) {
-                ngraph::pass::low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(node->shared_from_this(), dataPrecision.precision);
-            } else {
-                // set precision to explicitly to have updated precision during transformation
-                for (size_t i = 0; i < node->get_output_size(); ++i) {
-                    node->set_output_type(i, dataPrecision.precision, node->get_output_partial_shape(i));
-                }
-            }
-        }
+        NetworkHelper::copyInfo({ concat, subtract }, subtract);
+        lastDequantization = subtract;
     }
 
-    for (const std::shared_ptr<ngraph::Node>& quantizationLayer : subgraph.quantizationLayers) {
-        context.quantizedFakeQuantizeNames.insert(quantizationLayer->get_friendly_name());
+    if (!multiplyNodes.empty()) {
+        const auto multiply = std::make_shared<op::TypeRelaxed<DequantizationMultiply>>(
+            DequantizationMultiply(
+                lastDequantization,
+                NetworkHelper::toScalarIfPossible(multiplyNodes.size() == 1ul ?
+                    multiplyNodes[0] :
+                    ngraph::pass::low_precision::fold<ngraph::opset1::Concat>(multiplyNodes, 1))),
+            layerDequantizations[0].multiply->get_output_element_type(0));
+
+        NetworkHelper::copyInfo({ concat, multiply }, multiply);
+        lastDequantization = multiply;
     }
+
+    replace_node(concat, lastDequantization);
+    NetworkHelper::copyInfo(concat, newConcat);
+    updateOutput(context, lastDequantization, newConcat);
     return true;
 }
 
@@ -251,6 +188,8 @@ bool ConcatTransformation::canBeTransformed(const TransformationContext& context
     const auto axis = concat->get_axis();
     const auto outPShape = concat->get_output_partial_shape(0);
     const size_t normalizedAxis = ngraph::normalize_axis(concat->get_friendly_name(), axis, outPShape.rank());
+
+    // TODO: LPT: to support current flow: #58269
     if (normalizedAxis != 1ul) {
         return false;
     }
@@ -259,6 +198,27 @@ bool ConcatTransformation::canBeTransformed(const TransformationContext& context
         return false;
     }
 
+    const bool perTensorQuantizationIsRequired = normalizedAxis != 1ul;
+
+    element::Type precision;
+    for (size_t i = 0ul; i < concat->get_input_size(); i++) {
+        const FakeQuantizeDequantization dequantization = NetworkHelper::getDequantization(concat, i);
+        if (dequantization.empty() || (updatePrecisions && !dequantization.isLowPrecision())) {
+            return false;
+        }
+
+        if (precision == element::undefined) {
+            precision = dequantization.data.get_element_type();
+        } else if (precision != dequantization.data.get_element_type()) {
+            return false;
+        }
+
+        if (perTensorQuantizationIsRequired &&
+            (((dequantization.subtractConstant != nullptr) && !NetworkHelper::isScalarLike(dequantization.subtractConstant)) ||
+            ((dequantization.multiplyConstant != nullptr) && !NetworkHelper::isScalarLike(dequantization.multiplyConstant)))) {
+            return false;
+        }
+    }
     return true;
 }
 
@@ -338,115 +298,6 @@ std::shared_ptr<Node> ConcatTransformation::concatenateDeqNodes(NodeVector& node
     return nodes.size() == 1ul ? nodes[0] : fold<ngraph::opset1::Concat>(nodes, 1);
 }
 
-void ConcatTransformation::addDequantizationLayers(
-    TransformationContext& context,
-    ngraph::pass::low_precision::Subgraph& subgraph,
-    std::function<void(
-        std::shared_ptr<ngraph::Node> layer,
-        std::shared_ptr<ngraph::Node> child,
-        const std::string originalLayerName,
-        std::vector<FakeQuantizeDequantization>& dequantizationsToConcatenate)> getLayerDequantizationCallback) const {
-    std::unordered_map<std::string, ngraph::Node*> outputs;
-    for (size_t i = 0; i < context.function->get_output_size(); ++i) {
-        ngraph::Node* node = context.function->get_output_op(i).get();
-        if (node->get_input_size() != 1ul) {
-            THROW_IE_LPT_EXCEPTION(*node) << "unexpected inputs count for result node";
-        }
-
-        outputs.emplace(node->get_input_node_shared_ptr(0)->get_friendly_name(), node);
-    }
-
-    std::unordered_map<std::string, std::shared_ptr<ngraph::Node>> notHandledSubgraphLayers = subgraph.layers;
-    while (notHandledSubgraphLayers.size() != 0ul) {
-        const auto layerIt = notHandledSubgraphLayers.begin();
-        std::shared_ptr<ngraph::Node> layer = layerIt->second;
-        notHandledSubgraphLayers.erase(layerIt);
-
-        std::vector<FakeQuantizeDequantization> layerDequantizations;
-
-        for (size_t i = 0; i < layer->get_output_size(); ++i) {
-            const auto childInputs = layer->get_output_target_inputs(i);
-            for (const auto childInput : childInputs) {
-                ngraph::Node& child = *childInput.get_node();
-
-                if (subgraph.layers.find(child.get_friendly_name()) == subgraph.layers.end()) {
-                    std::shared_ptr<ngraph::Node> source = layer;
-                    const std::shared_ptr<ngraph::Node> destination = child.shared_from_this();
-
-                    if (layerDequantizations.size() == 0ul) {
-                        // fill layerDequantizations collection
-                        getLayerDequantizationCallback(source, destination, source->get_friendly_name(), layerDequantizations);
-                    }
-
-                    {
-                        NodeVector convertNodes;
-                        NodeVector subtractNodes;
-                        NodeVector multiplyNodes;
-
-                        // forming nodes for concatenation
-                        fillDequantizationNodes(layerDequantizations, layer, convertNodes, subtractNodes, multiplyNodes);
-
-                        // TODO: the second place (first is FQ decomposition) where dequantization operations are inserted
-                        if (!convertNodes.empty()) {
-                            const size_t sourceOutputIdx = NetworkHelper::getChildInputIndex(source, destination);
-                            std::shared_ptr<ngraph::Node> convert =
-                                convertNodes[0]->clone_with_new_inputs({ destination->get_input_source_output(sourceOutputIdx) });
-
-                            insert_new_node_between(source, destination, convert);
-                            ngraph::copy_runtime_info({ layer, convert }, convert);
-                            source = convert;
-                        }
-
-                        // concatenation axis is 1
-                        if (!subtractNodes.empty()) {
-                            const size_t sourceOutputIdx = NetworkHelper::getChildInputIndex(source, destination);
-                            std::shared_ptr<ngraph::opset1::Subtract> subtract = std::make_shared<DequantizationSubtract>(
-                                destination->get_input_source_output(sourceOutputIdx),
-                                NetworkHelper::toScalarIfPossible(concatenateDeqNodes(subtractNodes)));
-
-                            insert_new_node_between(source, destination, subtract);
-                            ngraph::copy_runtime_info({ layer, subtract }, subtract);
-                            source = subtract;
-                        }
-
-                        if (!multiplyNodes.empty()) {
-                            const size_t sourceOutputIdx = NetworkHelper::getChildInputIndex(source, destination);
-                            std::shared_ptr<ngraph::opset1::Multiply> multiply = std::make_shared<op::TypeRelaxed<DequantizationMultiply>>(
-                                DequantizationMultiply(
-                                    destination->get_input_source_output(sourceOutputIdx),
-                                    NetworkHelper::toScalarIfPossible(concatenateDeqNodes(multiplyNodes))),
-                                    layerDequantizations[0].multiply->get_output_element_type(0));
-
-                            insert_new_node_between(source, destination, multiply);
-                            ngraph::copy_runtime_info({ layer, multiply }, multiply);
-                            source = multiply;
-                        }
-                    }
-
-                    // first input is used
-                    const ngraph::element::Type precision = layerDequantizations[0].data.get_element_type();
-                    layer->set_output_type(0, precision, layer->get_output_partial_shape(0));
-
-                    const auto it = outputs.find(layer->get_friendly_name());
-                    if (it != outputs.end() && is_type<ngraph::opset1::Result>(child.shared_from_this())) {
-                        const std::string originalName = layer->get_friendly_name();
-                        const std::string newName = layer->get_friendly_name() + LayerTransformation::originalLayerPostfix;
-                        layer->set_friendly_name(newName);
-
-                        // Split & VariadicSplit have other naming rules
-                        if (is_type<opset1::Split>(layer) || is_type<opset1::VariadicSplit>(layer)) {
-                            source->set_friendly_name(originalName + "." + std::to_string(i));
-                        } else {
-                            source->set_friendly_name(originalName);
-                        }
-                        subgraph.layers[layer->get_friendly_name()] = layer;
-                    }
-                }
-            }
-        }
-    }
-}
-
 bool ConcatTransformation::isHandled(const TransformationContext& context, const std::vector<std::shared_ptr<ngraph::Node>>& quantizationOperations) {
     for (const std::shared_ptr<ngraph::Node>& quantizationLayer : quantizationOperations) {
         if (context.quantizedFakeQuantizeNames.find(quantizationLayer->get_friendly_name()) != context.quantizedFakeQuantizeNames.end()) {
@@ -457,32 +308,6 @@ bool ConcatTransformation::isHandled(const TransformationContext& context, const
     return false;
 }
 
-size_t ConcatTransformation::getMinQuantizationLevels(
-    const DataPrecision& dataPrecision,
-    const float maxOutputInterval,
-    const std::vector<QuantizationDetails>& quantizationLayersDetails,
-    const float outputLowValue,
-    const float outputHighValue) const {
-    size_t minLevels = std::numeric_limits<std::size_t>::max();
-    for (const QuantizationDetails quantizationDetails : quantizationLayersDetails) {
-        // if there is negative part then calculation is based on `outputLowValue` if not then on `outputHighValue` only
-        const float updatedOutputLowValue = outputLowValue != 0.f ?
-            (quantizationDetails.outputLowValues[0] / outputLowValue) * dataPrecision.min :
-            (quantizationDetails.outputLowValues[0] / outputHighValue) * dataPrecision.max;
-
-        // if there is positive part then calculation is based on `outputHighValue` if not then on `outputLowValue` only
-        const float updatedOutputHighValue = outputHighValue != 0.f ?
-            (quantizationDetails.outputHighValues[0] / outputHighValue) * dataPrecision.max :
-            (quantizationDetails.outputHighValues[0] / outputLowValue) * dataPrecision.min;
-
-        const size_t levels = static_cast<size_t>(fabs(roundf(updatedOutputHighValue) - roundf(updatedOutputLowValue)) + 1.0);
-        if (minLevels > levels) {
-            minLevels = levels;
-        }
-    }
-    return minLevels;
-}
-
 } // namespace low_precision
 } // namespace pass
 } // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/concat_multi_channels.cpp b/inference-engine/src/low_precision_transformations/src/concat_multi_channels.cpp
deleted file mode 100644
index cd1f01a54f68cc..00000000000000
--- a/inference-engine/src/low_precision_transformations/src/concat_multi_channels.cpp
+++ /dev/null
@@ -1,334 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "low_precision/concat_multi_channels.hpp"
-
-#include <queue>
-#include <memory>
-#include <string>
-#include <unordered_map>
-#include <vector>
-
-#include <ngraph/ngraph.hpp>
-#include <ngraph/opsets/opset1.hpp>
-
-#include "low_precision/common/fake_quantize_dequantization.hpp"
-#include "low_precision/common/dequantization_op.hpp"
-#include "low_precision/common/ie_lpt_exception.hpp"
-#include "low_precision/common/subgraph.hpp"
-#include "low_precision/network_helper.hpp"
-
-namespace ngraph {
-namespace pass {
-namespace low_precision {
-
-bool ConcatMultiChannelsTransformation::isMultiChannel(const std::vector<std::shared_ptr<ngraph::opset1::Concat>>& concatLayers) const noexcept {
-    for (const std::shared_ptr<ngraph::opset1::Concat>& concat : concatLayers) {
-        const std::vector<std::shared_ptr<ngraph::Node>> children = getChildrenRecursivelyExceptPrecisionPreserved(concat);
-        for (const std::shared_ptr<ngraph::Node>& child : children) {
-            if ((is_type<ngraph::opset1::Convolution>(child.get()) ||
-                is_type<ngraph::opset1::ConvolutionBackpropData>(child.get())) &&
-                this->layerTransformationsManager->isQuantized(child)) {
-                return false;
-            }
-        }
-    }
-    return true;
-}
-
-void ConcatMultiChannelsTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addSingleNodePattern<opset1::Concat>(pass, context);
-}
-
-bool ConcatMultiChannelsTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
-    std::shared_ptr<ngraph::opset1::Concat> concat = ngraph::as_type_ptr<ngraph::opset1::Concat>(m.get_match_root());
-    if (!canBeTransformed(context, concat)) {
-        return false;
-    }
-
-    ngraph::pass::low_precision::Subgraph subgraph(layerTransformationsManager);
-    std::unordered_set<std::string> handledLayers;
-    if (!subgraph.fillSubgraphForConcat(concat, handledLayers)) {
-        return false;
-    }
-
-    if (subgraph.quantizationLayers.empty() || isHandled(context, subgraph.quantizationLayers)) {
-        return false;
-    }
-
-    if (!isMultiChannel(subgraph.concatLayers)) {
-        ConcatTransformation::transform(context, m);
-        return false;
-    }
-
-    DataPrecision dataPrecision;
-    {
-        std::vector<element::Type> concatChildrenPrecisions = precisionsOnActivations;
-        for (auto quantizationLayer : subgraph.quantizationLayers) {
-            std::shared_ptr<ngraph::opset1::FakeQuantize> fq = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(quantizationLayer->shared_from_this());
-            if (!NetworkHelper::isQuantizeSupported(fq)) {
-                return false;
-            }
-
-            // define concatenation operation consumers precisions
-            std::vector<element::Type> fqChildrenPrecisions = precisionsOnActivations;
-            fillAvailablePrecisions(quantizationLayer, fqChildrenPrecisions);
-            concatChildrenPrecisions = NetworkHelper::precisionIntersection(concatChildrenPrecisions, fqChildrenPrecisions);
-            if (concatChildrenPrecisions.empty()) {
-                return false;
-            }
-
-            // define FakeQuantize precisions without zero point
-            const DataPrecision tmp = getDataPrecision(fq, QuantizationDetails::getDetails(fq), false);
-            if (dataPrecision.precision == ngraph::element::undefined) {
-                dataPrecision = tmp;
-                continue;
-            }
-
-            if ((tmp.precision != dataPrecision.precision) && (tmp.precision == ngraph::element::u8)) {
-                dataPrecision = tmp;
-            }
-        }
-
-        if (std::find(concatChildrenPrecisions.begin(), concatChildrenPrecisions.end(), dataPrecision.precision) == concatChildrenPrecisions.end()) {
-            dataPrecision = DataPrecision(concatChildrenPrecisions[0]);
-        }
-    }
-
-    for (size_t i = 0; i < subgraph.quantizationLayers.size(); ++i) {
-        const std::shared_ptr<ngraph::opset1::FakeQuantize> fq = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(subgraph.quantizationLayers[i]);
-        if (fq == nullptr) {
-            return false;
-        }
-
-        if (!NetworkHelper::isQuantizeSupported(fq)) {
-            return false;
-        }
-    }
-
-    std::unordered_map<std::string, ngraph::pass::low_precision::FakeQuantizeDequantization> dequantizations;
-
-    for (size_t i = 0; i < subgraph.quantizationLayers.size(); ++i) {
-        const std::shared_ptr<ngraph::Node>& fakeQuantizeLayer = subgraph.quantizationLayers[i];
-
-        std::shared_ptr<ngraph::opset1::FakeQuantize> fq = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(fakeQuantizeLayer->shared_from_this());
-        assert(fq);
-
-        auto newFakeQuantize = NetworkHelper::fuseConvert(fq);
-        if (newFakeQuantize != nullptr) {
-            fq = newFakeQuantize;
-        }
-
-        newFakeQuantize = NetworkHelper::composeFakeQuantize(fq);
-        if (newFakeQuantize != nullptr) {
-            fq = newFakeQuantize;
-        }
-
-        const DataPrecision currentDataPrecision = getDataPrecision(fq, QuantizationDetails::getDetails(fq), false);
-        const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(fq);
-
-        // 1. get data for dequantization. Dequantization data will be used several times later.
-        const FakeQuantizeDequantization fakeQuantizeDequantization = ngraph::pass::low_precision::NetworkHelper::createDequantizationFromFakeQuantize(
-            fq,
-            dataPrecision.precision,
-            dataPrecision.min,
-            dataPrecision.max,
-            dataPrecision.precision == currentDataPrecision.precision ? currentDataPrecision.hasZeroPoint : true,
-            updatePrecisions,
-            deqPrecision);
-        dequantizations[fakeQuantizeLayer->get_friendly_name()] = fakeQuantizeDequantization;
-
-        // 2. update FakeQuantize - one time action
-        const std::shared_ptr<opset1::FakeQuantize> newFakeQuantizeLayer = ngraph::pass::low_precision::NetworkHelper::updateFakeQuantize(
-            fq,
-            updatePrecisions ? dataPrecision.precision : fakeQuantizeLayer->get_output_element_type(0),
-            roundf(dataPrecision.min),
-            roundf(dataPrecision.max));
-
-        subgraph.quantizationLayers[i] = newFakeQuantizeLayer;
-        subgraph.layers[fakeQuantizeLayer->get_friendly_name()] = newFakeQuantizeLayer;
-    }
-
-    auto dequantizationValuesCallback = [&](
-        std::shared_ptr<ngraph::Node> layer,
-        std::shared_ptr<ngraph::Node> child,
-        const std::string originalLayerName,
-        std::vector<FakeQuantizeDequantization>& dequantizationsToConcatenate) {
-        if (layer->get_friendly_name() != originalLayerName) {
-            const auto update = [](
-                const std::string& originalLayerName,
-                const std::string& newLayerName,
-                std::unordered_map<std::string, FakeQuantizeDequantization>& dequantizationLayers) {
-                auto it = dequantizationLayers.find(originalLayerName);
-                if (it != dequantizationLayers.end()) {
-                    dequantizationLayers.emplace(newLayerName, it->second);
-                    dequantizationLayers.erase(it);
-                }
-            };
-            update(originalLayerName, layer->get_friendly_name(), dequantizations);
-        }
-
-        fillDequantization(
-            layer,
-            dequantizations,
-            dequantizationsToConcatenate);
-
-        if (!is_type<ngraph::opset1::Concat>(layer)) {
-            // for intermediate layers we should get Dq operations to be inserted between layer and child
-            assert(dequantizationsToConcatenate.size() == 1ul);
-            const size_t sourceOutputIdx = NetworkHelper::getParentOutputIndex(layer, child);
-            if (layer->get_input_partial_shape(0)[1] != layer->get_output_partial_shape(sourceOutputIdx)[1]) {
-                dequantizationsToConcatenate[0] = getFoldedDequantization(layer, dequantizationsToConcatenate[0], sourceOutputIdx);
-            }
-        }
-    };
-
-    addDequantizationLayers(context, subgraph, dequantizationValuesCallback);
-
-    if (updatePrecisions) {
-        for (const auto it : subgraph.layers) {
-            const std::shared_ptr<ngraph::Node> node = it.second;
-            if (std::dynamic_pointer_cast<ngraph::op::TypeRelaxedBase>(node)) {
-                ngraph::pass::low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(node->shared_from_this(), dataPrecision.precision);
-            } else {
-                // set precision to explicitly to have updated precision during transformation
-                for (size_t i = 0; i < node->get_output_size(); ++i) {
-                    node->set_output_type(i, dataPrecision.precision, node->get_output_partial_shape(i));
-                }
-            }
-        }
-    }
-
-    for (const std::shared_ptr<ngraph::Node>& quantizationLayer : subgraph.quantizationLayers) {
-        context.quantizedFakeQuantizeNames.insert(quantizationLayer->get_friendly_name());
-    }
-    return true;
-}
-
-bool ConcatMultiChannelsTransformation::isPrecisionPreserved(std::shared_ptr<Node>) const noexcept {
-    return true;
-}
-
-void ConcatMultiChannelsTransformation::fillDequantization(
-    const std::shared_ptr<ngraph::Node> layer,
-    const std::unordered_map<std::string, FakeQuantizeDequantization>& dequantizationByFakeQuantize,
-    std::vector<FakeQuantizeDequantization>& dequantization) const {
-    const auto fillDqByFakeQuantize = [&](const std::shared_ptr<ngraph::Node>& fq) {
-        const auto it = dequantizationByFakeQuantize.find(fq->get_friendly_name());
-        if (it == dequantizationByFakeQuantize.end()) {
-            THROW_IE_LPT_EXCEPTION(*fq) << "dequantization scale values are not found";
-        }
-
-        const FakeQuantizeDequantization& fakeQuantizeDequantization = it->second;
-        dequantization.push_back(fakeQuantizeDequantization);
-    };
-
-    if (is_type<ngraph::opset1::FakeQuantize>(layer)) {
-        fillDqByFakeQuantize(layer);
-    } else {
-        for (size_t i = 0; i < layer->get_input_size(); ++i) {
-            std::shared_ptr<ngraph::Node> parent = layer->get_input_node_shared_ptr(i);
-            if (as_type_ptr<ngraph::opset1::Constant>(parent)) {
-                continue;
-            }
-
-            const auto fakeQuantize = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(parent);
-            if (fakeQuantize) {
-                fillDqByFakeQuantize(fakeQuantize);
-            } else {
-                const auto concat = ngraph::as_type_ptr<ngraph::opset1::Concat>(parent);
-                if (concat) {
-                    std::vector<FakeQuantizeDequantization> dequantizationToConcatenate;
-                    fillDequantization(concat, dequantizationByFakeQuantize, dequantizationToConcatenate);
-
-                    // add concatenated dequantization operations to dequantization collection
-                    dequantization.push_back(getConcatenatedDequantization(concat, dequantizationToConcatenate));
-                } else {
-                    const size_t sourceOutputIdx = NetworkHelper::getParentOutputIndex(parent, layer);
-                    if (parent->get_input_partial_shape(0)[1] != parent->get_output_partial_shape(sourceOutputIdx)[1]) {
-                        std::vector<FakeQuantizeDequantization> dequantizationToPropagate;
-                        fillDequantization(parent, dequantizationByFakeQuantize, dequantizationToPropagate);
-
-                        // add folded dequantization operations to dequantization colection
-                        dequantization.push_back(getFoldedDequantization(parent, dequantizationToPropagate[0], sourceOutputIdx));
-                    } else {
-                        fillDequantization(parent, dequantizationByFakeQuantize, dequantization);
-                    }
-                }
-            }
-        }
-    }
-}
-
-FakeQuantizeDequantization ConcatMultiChannelsTransformation::getConcatenatedDequantization(
-    const std::shared_ptr<ngraph::opset1::Concat> concat,
-    const std::vector<FakeQuantizeDequantization>& dequantization) const {
-    NodeVector convertNodes;
-    NodeVector subtractNodes;
-    NodeVector multiplyNodes;
-
-    // forming nodes for concatenation
-    fillDequantizationNodes(dequantization, concat, convertNodes, subtractNodes, multiplyNodes);
-
-    std::shared_ptr<Node> parent = concat;
-    std::shared_ptr<DequantizationConvert> convert;
-    if (!convertNodes.empty()) {
-        convert = as_type_ptr<DequantizationConvert>(dequantization[0].convert->clone_with_new_inputs({ parent }));
-        parent = convert;
-    }
-
-    std::shared_ptr<DequantizationSubtract> subtract;
-    std::shared_ptr<ngraph::opset1::Constant> subConst;
-    if (!subtractNodes.empty()) {
-        subConst = as_type_ptr<ngraph::opset1::Constant>(concatenateDeqNodes(subtractNodes));
-        subtract = std::make_shared<DequantizationSubtract>(parent, subConst);
-        parent = subtract;
-    }
-
-    std::shared_ptr<DequantizationMultiply> multiply;
-    std::shared_ptr<ngraph::opset1::Constant> mulConst;
-    if (!multiplyNodes.empty()) {
-        mulConst = as_type_ptr<ngraph::opset1::Constant>(concatenateDeqNodes(multiplyNodes));
-        multiply = std::make_shared<DequantizationMultiply>(parent, mulConst);
-    }
-
-    return FakeQuantizeDequantization(concat, convert, subtract, nullptr, subConst, multiply, mulConst);
-}
-
-FakeQuantizeDequantization ConcatMultiChannelsTransformation::getFoldedDequantization(
-    const std::shared_ptr<ngraph::Node> operation,
-    const FakeQuantizeDequantization& dequantization,
-    const size_t sourceOutputIdx) {
-    OutputVector inputs = operation->input_values();
-    OutputVector outputs(operation->get_output_size());
-    Output<Node> data = operation->output(sourceOutputIdx);
-
-    std::shared_ptr<Node> parent = operation;
-    std::shared_ptr<DequantizationConvert> convert;
-    if (dequantization.convert) {
-        convert = as_type_ptr<DequantizationConvert>(dequantization.convert->clone_with_new_inputs({ data }));
-        parent = convert;
-    }
-
-    std::shared_ptr<DequantizationSubtract> subtract;
-    std::shared_ptr<ngraph::opset1::Constant> subConst;
-    if (dequantization.subtract) {
-        subConst = NetworkHelper::foldDequantizationConstant(dequantization.subtractConstant, operation, sourceOutputIdx);
-        subtract = std::make_shared<DequantizationSubtract>(parent, subConst);
-        parent = subtract;
-    }
-
-    std::shared_ptr<DequantizationMultiply> multiply;
-    std::shared_ptr<ngraph::opset1::Constant> mulConst;
-    if (dequantization.multiply) {
-        mulConst = NetworkHelper::foldDequantizationConstant(dequantization.multiplyConstant, operation, sourceOutputIdx);
-        multiply = std::make_shared<DequantizationMultiply>(parent, mulConst);
-    }
-
-    return FakeQuantizeDequantization(data, convert, subtract, nullptr, subConst, multiply, mulConst);
-}
-
-} // namespace low_precision
-} // namespace pass
-} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/convert.cpp b/inference-engine/src/low_precision_transformations/src/convert.cpp
index 19bcce50e8c8a6..e96fc4820c77e3 100644
--- a/inference-engine/src/low_precision_transformations/src/convert.cpp
+++ b/inference-engine/src/low_precision_transformations/src/convert.cpp
@@ -11,6 +11,7 @@
 #include <utility>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -18,11 +19,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void ConvertTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Convert>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ConvertTransformation, "ConvertTransformation", 0);
+
+ConvertTransformation::ConvertTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Convert>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ConvertTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool ConvertTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool ConvertTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::Convert> convert = as_type_ptr<opset1::Convert>(m.get_match_root());
     if (!convert) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/convolution.cpp b/inference-engine/src/low_precision_transformations/src/convolution.cpp
index 1dc4c42b476f34..889315678e9704 100644
--- a/inference-engine/src/low_precision_transformations/src/convolution.cpp
+++ b/inference-engine/src/low_precision_transformations/src/convolution.cpp
@@ -10,6 +10,8 @@
 #include <vector>
 #include <cassert>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
 #include "low_precision/network_helper.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 
@@ -17,28 +19,39 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-ConvolutionTransformation::ConvolutionTransformation(const Params& params) : WeightableLayerTransformation(params) {
-}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ConvolutionTransformation, "ConvolutionTransformation", 0);
 
-void ConvolutionTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Convolution>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Multiply>() }));
+ConvolutionTransformation::ConvolutionTransformation(const Params& params) : WeightableLayerTransformation(params) {
+    auto matcher = ngraph::pattern::wrap_type<opset1::Convolution>({
+        ngraph::pattern::wrap_type<opset1::Multiply>(),
+        std::make_shared<pattern::op::Or>(OutputVector {
+            pattern::wrap_type<opset1::Multiply>(),
+            pattern::wrap_type<opset1::FakeQuantize>()
+        })
+    });
+
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Convolution>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::FakeQuantize>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ConvolutionTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool ConvolutionTransformation::isQuantized(std::shared_ptr<Node> layer) const noexcept {
-    return WeightableLayerTransformation::isQuantized(layer, false);
+bool ConvolutionTransformation::isQuantized(const std::shared_ptr<const Node>& layer) const noexcept {
+    return ConvolutionTransformation::isQuantizedStatic(layer);
 }
 
+bool ConvolutionTransformation::isQuantizedStatic(const std::shared_ptr<const Node>& layer) noexcept {
+    return WeightableLayerTransformation::isQuantizedStatic(layer, false);
+}
 
-
-bool ConvolutionTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool ConvolutionTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     auto convolution = m.get_match_root();
 
     if (!canConvolutionBeTransformed(context, convolution)) {
@@ -150,7 +163,7 @@ bool ConvolutionTransformation::transform(TransformationContext &context, ngraph
                 reducedConstant->cast_vector<float>()[0]);
         }
 
-        const auto copyNode = convolution->copy_with_new_inputs({ dequantization.multiply->input_value(0), convolution->input_value(1) });
+        const auto copyNode = convolution->clone_with_new_inputs({ dequantization.multiply->input_value(0), convolution->input_value(1) });
         auto conv = as_type_ptr<opset1::Convolution>(copyNode);
         std::shared_ptr<Node> relaxedNewConvolution;
         if (conv) {
@@ -164,6 +177,7 @@ bool ConvolutionTransformation::transform(TransformationContext &context, ngraph
                     std::vector<element::Type>{deqPrecision, deqPrecision},
                     std::vector<element::Type>{deqPrecision});
         }
+        NetworkHelper::copyInfo(convolution, relaxedNewConvolution);
 
         std::shared_ptr<ngraph::opset1::Multiply> newMultiplyAfter = std::make_shared<op::TypeRelaxed<DequantizationMultiply>>(
             std::vector<element::Type>{ deqPrecision, deqPrecision },
@@ -179,12 +193,18 @@ bool ConvolutionTransformation::transform(TransformationContext &context, ngraph
                 convolution->get_input_node_ptr(0)->get_input_source_output(0),
                 convolution->input_value(1)});
             replace_node(convolution, newConvolution);
+            NetworkHelper::copyInfo(convolution, newConvolution);
             convolution = newConvolution;
         }
     }
 
     {
-        decomposeFakeQuantizeForWeightsPath(convolution);
+        const bool decomposed = decomposeFakeQuantizeForWeightsPath(convolution);
+        assert((updatePrecisions && decomposed) || (!updatePrecisions));
+        if (!updatePrecisions && !decomposed) {
+            // TODO: LPT: issue #58685
+            return false;
+        }
 
         std::shared_ptr<opset1::Reshape> reshapeFromWeights = as_type_ptr<opset1::Reshape>(convolution->input_value(1).get_node_shared_ptr());
 
@@ -218,13 +238,16 @@ bool ConvolutionTransformation::transform(TransformationContext &context, ngraph
                     reshapeFromWeights->input_value(1) }));
             }
 
+            auto newConvolution = convolution->clone_with_new_inputs({
+                convolution->input_value(0),
+                reshapeFromWeights != nullptr ?
+                    reshapeFromWeights :
+                    multiplyFromWeights->input_value(0)
+            });
+            NetworkHelper::copyInfo(convolution, newConvolution);
+
             auto newMultiplyAfter = std::make_shared<DequantizationMultiply>(
-                convolution->copy_with_new_inputs({
-                    convolution->input_value(0),
-                    reshapeFromWeights != nullptr ?
-                        reshapeFromWeights :
-                        multiplyFromWeights->input_value(0)
-                    }),
+                newConvolution,
                 foldConvert(
                     fold_reshape<opset1::Reshape>(
                         multiplyFromWeights->input_value(1),
@@ -270,6 +293,7 @@ bool ConvolutionTransformation::transform(TransformationContext &context, ngraph
                     convolution->get_input_node_ptr(1)->input_value(0) :
                     childNode->copy_with_new_inputs({convertFromWeights->input_value(0), childNode->input_value(1)})});
             replace_node(convolution, newConvolution);
+            NetworkHelper::copyInfo(convolution, newConvolution);
             convolution = newConvolution;
         }
 
diff --git a/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp b/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp
index a73ee1de155781..cd8661143d7f47 100644
--- a/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp
+++ b/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp
@@ -10,6 +10,8 @@
 #include <vector>
 #include <cassert>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
 #include "low_precision/network_helper.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 
@@ -18,41 +20,48 @@ namespace pass {
 namespace low_precision {
 
 ConvolutionBackpropDataTransformation::ConvolutionBackpropDataTransformation(const Params& params) : WeightableLayerTransformation(params) {
+    auto matcher = std::make_shared<pattern::op::Or>(OutputVector{
+        pattern::wrap_type<opset1::ConvolutionBackpropData>({
+            pattern::wrap_type<opset1::Multiply>(),
+            pattern::wrap_type<opset1::Multiply>()
+        }),
+        ngraph::pattern::wrap_type<opset1::ConvolutionBackpropData>({
+            pattern::wrap_type<opset1::Multiply>(),
+            pattern::wrap_type<opset1::FakeQuantize>()
+        }),
+        ngraph::pattern::wrap_type<opset1::ConvolutionBackpropData>({
+            pattern::wrap_type<opset1::Multiply>(),
+            pattern::wrap_type<opset1::Multiply>(),
+            pattern::wrap_type<opset1::Constant>()
+        }),
+        ngraph::pattern::wrap_type<opset1::ConvolutionBackpropData>({
+            pattern::wrap_type<opset1::Multiply>(),
+            pattern::wrap_type<opset1::FakeQuantize>(),
+            pattern::wrap_type<opset1::Constant>()
+        }),
+    });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ConvolutionBackpropDataTransformation");
+    this->register_matcher(m, callback);
 }
 
-void ConvolutionBackpropDataTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-            pass,
-            context,
-            make_op_pattern<opset1::ConvolutionBackpropData>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Multiply>() }));
-    addPattern(
-            pass,
-            context,
-            make_op_pattern<opset1::ConvolutionBackpropData>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::FakeQuantize>() }));
-    addPattern(
-            pass,
-            context,
-            make_op_pattern<opset1::ConvolutionBackpropData>(
-                    { make_op_label<opset1::Multiply>(), make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
-    addPattern(
-            pass,
-            context,
-            make_op_pattern<opset1::ConvolutionBackpropData>(
-                    { make_op_label<opset1::Multiply>(), make_op_label<opset1::FakeQuantize>(), make_op_label<opset1::Constant>() }));
+bool ConvolutionBackpropDataTransformation::isQuantized(const std::shared_ptr<const Node>& layer) const noexcept {
+    return ConvolutionBackpropDataTransformation::isQuantizedStatic(layer);
 }
 
-bool ConvolutionBackpropDataTransformation::isQuantized(std::shared_ptr<Node> layer) const noexcept {
-    if (deconvolutionSpecificChannelsRatio) {
-        size_t inputChannels = layer->get_input_shape(0)[1];
-        size_t outputChannels = layer->get_output_shape(0)[1];
-        if (inputChannels % 4 != 0 || outputChannels % 16 != 0) {
-            return false;
-        }
-    }
-    return WeightableLayerTransformation::isQuantized(layer, false);
+bool ConvolutionBackpropDataTransformation::isQuantizedStatic(const std::shared_ptr<const Node>& layer) noexcept {
+    return WeightableLayerTransformation::isQuantizedStatic(layer, false);
 }
 
-bool ConvolutionBackpropDataTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool ConvolutionBackpropDataTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     auto convolutionBackpropData = m.get_match_root();
 
     if (!canBeTransformed(context, convolutionBackpropData)) {
@@ -198,18 +207,11 @@ bool ConvolutionBackpropDataTransformation::transform(TransformationContext &con
         rt["DISABLED_CONSTANT_FOLDING"] = std::make_shared<ngraph::VariantWrapper<std::string>>("");
     }
 
+
     return true;
 }
 
 bool ConvolutionBackpropDataTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const {
-    if (deconvolutionSpecificChannelsRatio) {
-        size_t inputChannels = op->get_input_shape(0)[1];
-        size_t outputChannels = op->get_output_shape(0)[1];
-        if (inputChannels % 4 != 0 || outputChannels % 16 != 0) {
-            return false;
-        }
-    }
-
     return canConvolutionBeTransformed(context, op);
 }
 
diff --git a/inference-engine/src/low_precision_transformations/src/create_precisions_dependent_attribute.cpp b/inference-engine/src/low_precision_transformations/src/create_precisions_dependent_attribute.cpp
new file mode 100644
index 00000000000000..7ddd060b06dc6d
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/create_precisions_dependent_attribute.cpp
@@ -0,0 +1,22 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/create_precisions_dependent_attribute.hpp"
+
+#include <assert.h>
+#include <deque>
+#include <memory>
+#include <unordered_map>
+#include <set>
+#include <vector>
+
+#include <ngraph/opsets/opset1.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
+#include "low_precision/rt_info/precisions_attribute.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+#include "low_precision/network_helper.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
diff --git a/inference-engine/src/low_precision_transformations/src/depth_to_space.cpp b/inference-engine/src/low_precision_transformations/src/depth_to_space.cpp
index c004d0ca59f92a..09d3b6fac17e33 100644
--- a/inference-engine/src/low_precision_transformations/src/depth_to_space.cpp
+++ b/inference-engine/src/low_precision_transformations/src/depth_to_space.cpp
@@ -4,25 +4,32 @@
 
 #include "low_precision/depth_to_space.hpp"
 
-#include <algorithm>
 #include <memory>
-#include <string>
-#include <vector>
-
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/network_helper.hpp"
 
 using namespace ngraph;
 using namespace ngraph::pass;
 using namespace ngraph::pass::low_precision;
 
-void DepthToSpaceTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::DepthToSpace>({ make_op_label<ngraph::opset1::Multiply>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::DepthToSpaceTransformation, "DepthToSpaceTransformation", 0);
+
+DepthToSpaceTransformation::DepthToSpaceTransformation(const Params& params) : TransparentBaseTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::DepthToSpace>({ pattern::wrap_type<opset1::Multiply>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "DepthToSpaceTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool DepthToSpaceTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool DepthToSpaceTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> depthToSpace = m.get_match_root();
     if (!canBeTransformed(context, depthToSpace)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/fake_quantize.cpp b/inference-engine/src/low_precision_transformations/src/fake_quantize.cpp
index 90aeb5aabe8bc2..93e6aa813c1cbb 100644
--- a/inference-engine/src/low_precision_transformations/src/fake_quantize.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fake_quantize.cpp
@@ -7,6 +7,7 @@
 #include <cmath>
 #include <memory>
 #include <ngraph/opsets/opset1.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
 
 #include "low_precision/network_helper.hpp"
 
@@ -14,11 +15,25 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FakeQuantizeTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addSingleNodePattern<opset1::FakeQuantize>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FakeQuantizeTransformation, "FakeQuantizeTransformation", 0);
+
+FakeQuantizeTransformation::FakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::FakeQuantize>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "FakeQuantizeTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool FakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool FakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::FakeQuantize> layer = std::dynamic_pointer_cast<opset1::FakeQuantize>(m.get_match_root());
     if (!QuantizationDetails::outputLayoutIsSupported(layer)) {
         return false;
@@ -28,13 +43,14 @@ bool FakeQuantizeTransformation::transform(TransformationContext& context, ngrap
         return false;
     }
 
+    bool wasHandled = false;
     std::shared_ptr<opset1::FakeQuantize> fakeQuantize = layer;
     do {
-        layer = fakeQuantize;
-        fakeQuantize = fuseElementwise(context, fakeQuantize);
+        fakeQuantize = fuseElementwise(context, this, fakeQuantize);
+        wasHandled = wasHandled || (fakeQuantize != nullptr);
     } while (fakeQuantize != nullptr);
 
-    return true;
+    return wasHandled;
 }
 
 namespace fq {
@@ -110,6 +126,7 @@ bool FakeQuantizeTransformation::checkElementwise(const std::shared_ptr<Node>& e
 
 std::shared_ptr<opset1::FakeQuantize> FakeQuantizeTransformation::fuseElementwise(
     TransformationContext& context,
+    MatcherPass* matcherPass,
     const std::shared_ptr<opset1::FakeQuantize>& fakeQuantize) const {
     const std::shared_ptr<Node> eltwise = fakeQuantize->get_input_node_shared_ptr(0);
 
@@ -172,6 +189,7 @@ std::shared_ptr<opset1::FakeQuantize> FakeQuantizeTransformation::fuseElementwis
 
     const auto data = fq::getData(eltwise);
     const size_t outputIdx = NetworkHelper::getParentOutputIndex(data, eltwise);
+
     std::shared_ptr<opset1::FakeQuantize> newFakeQuantize = as_type_ptr<opset1::FakeQuantize>(fakeQuantize->clone_with_new_inputs({
         data->output(outputIdx),
         inputLowConst_f32,
@@ -179,6 +197,8 @@ std::shared_ptr<opset1::FakeQuantize> FakeQuantizeTransformation::fuseElementwis
         foldConvert(fakeQuantize->input_value(3), deqPrecision),
         foldConvert(fakeQuantize->input_value(4), deqPrecision) }));
 
+    matcherPass->register_new_node(newFakeQuantize);
+
     replace_node(fakeQuantize, newFakeQuantize);
     ngraph::copy_runtime_info({ fakeQuantize, eltwise }, newFakeQuantize);
     newFakeQuantize->set_friendly_name(fakeQuantize->get_friendly_name());
diff --git a/inference-engine/src/low_precision_transformations/src/fake_quantize_decomposition.cpp b/inference-engine/src/low_precision_transformations/src/fake_quantize_decomposition.cpp
index b9d491238aac98..b522546c55e342 100644
--- a/inference-engine/src/low_precision_transformations/src/fake_quantize_decomposition.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fake_quantize_decomposition.cpp
@@ -6,20 +6,252 @@
 
 #include <memory>
 #include <ngraph/opsets/opset1.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
 
+#include <low_precision/lpt_itt.hpp>
 #include "low_precision/common/ie_lpt_exception.hpp"
+#include "low_precision/rt_info/precisions_attribute.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FakeQuantizeDecompositionTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addSingleNodePattern<opset1::FakeQuantize>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, "FakeQuantizeDecompositionTransformation", 0);
+
+FakeQuantizeDecompositionTransformation::FakeQuantizeDecompositionTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::FakeQuantize>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "FakeQuantizeDecompositionTransformation");
+    this->register_matcher(m, callback);
+}
+
+namespace fq_decomposition {
+
+// get precision details, depends on:
+// 1. FakeQuantize operation parameters (QuantizationDetails::getDetails & LayerTransformation::getPrecisionDetails)
+// 2. Precisions on port
+DataPrecision getDataPrecisionByOutputPortAndFakeQuantize(std::shared_ptr<opset1::FakeQuantize> layer) {
+    const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(layer);
+    auto precisionsAttribute = getAttributeFromOutput<std::shared_ptr<PrecisionsAttribute>>(layer->output(0));
+    if (precisionsAttribute == nullptr) {
+        // TODO: explore this case in more details:
+        // 1. we should not be here
+        assert(true);
+
+        // 2. not possible to get optimal precision by decomposed FakeQuantize
+        LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(quantizationDetails);
+        return DataPrecision(
+            precisionDetailsAtOutputIntervals.precision,
+            DataPrecision::getMinValue(precisionDetailsAtOutputIntervals.precision, quantizationDetails.levels),
+            DataPrecision::getMaxValue(precisionDetailsAtOutputIntervals.precision, quantizationDetails.levels),
+            precisionDetailsAtOutputIntervals.hasZeroPoint);
+    }
+
+    const auto& precisions = precisionsAttribute->get()->sharedValue->precisions;
+
+    ngraph::element::Type precision;
+    bool hasZeroPoint;
+    if (precisions.size() > 1ul) {
+        LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(quantizationDetails);
+        const auto foundIt = std::find(precisions.begin(), precisions.end(), precisionDetailsAtOutputIntervals.precision);
+
+        if (foundIt == precisions.end()) {
+            precision = *precisions.begin();
+            hasZeroPoint = true;
+        } else {
+            precision = precisionDetailsAtOutputIntervals.precision;
+            hasZeroPoint = precisionDetailsAtOutputIntervals.hasZeroPoint;
+        }
+
+        // update shared attribute to affect all operations in subgraph
+        precisionsAttribute->get()->sharedValue->precisions = { precision };
+    } else {
+        // use only available precision
+        precision = *precisions.begin();
+        LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(quantizationDetails);
+        hasZeroPoint = precisionDetailsAtOutputIntervals.precision != precision;
+    }
+
+    return DataPrecision(
+        precision,
+        DataPrecision::getMinValue(precision, quantizationDetails.levels),
+        DataPrecision::getMaxValue(precision, quantizationDetails.levels),
+        hasZeroPoint);
+}
+
+// get precision details, depends on:
+// 1. FakeQuantize operation parameters (QuantizationDetails::getDetails & LayerTransformation::getPrecisionDetails)
+// 2. Precisions on port
+DataPrecision getDataPrecisionByOutputPort(std::shared_ptr<opset1::FakeQuantize> layer) {
+    const size_t levels = layer->get_levels();
+    const std::vector<float> outputLowValues = as_type_ptr<opset1::Constant>(layer->get_input_node_shared_ptr(3))->cast_vector<float>();
+    const std::vector<float> outputHighValues = as_type_ptr<opset1::Constant>(layer->get_input_node_shared_ptr(4))->cast_vector<float>();
+
+    auto precisionsAttribute = getAttributeFromOutput<std::shared_ptr<PrecisionsAttribute>>(layer->output(0));
+    if (precisionsAttribute == nullptr) {
+        // TODO: explore this case in more details:
+        // 1. we should not be here
+        assert(true);
+
+        // 2. not possible to get optimal precision by decomposed FakeQuantize
+        LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(
+            levels,
+            outputLowValues,
+            outputHighValues);
+
+        return DataPrecision(
+            precisionDetailsAtOutputIntervals.precision,
+            DataPrecision::getMinValue(precisionDetailsAtOutputIntervals.precision, levels),
+            DataPrecision::getMaxValue(precisionDetailsAtOutputIntervals.precision, levels),
+            precisionDetailsAtOutputIntervals.hasZeroPoint);
+    }
+
+    const auto& precisions = precisionsAttribute->get()->sharedValue->precisions;
+
+    ngraph::element::Type precision;
+    bool hasZeroPoint;
+    if (precisions.size() > 1ul) {
+        LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(
+            levels,
+            outputLowValues,
+            outputHighValues);
+        const auto foundIt = std::find(precisions.begin(), precisions.end(), precisionDetailsAtOutputIntervals.precision);
+
+        if (foundIt == precisions.end()) {
+            precision = *precisions.begin();
+            hasZeroPoint = true;
+        } else {
+            precision = precisionDetailsAtOutputIntervals.precision;
+            hasZeroPoint = precisionDetailsAtOutputIntervals.hasZeroPoint;
+        }
+
+        // update shared attribute to affect all operations in subgraph
+        precisionsAttribute->get()->sharedValue->precisions = { precision };
+    } else {
+        // use only available precision
+        precision = *precisions.begin();
+        LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(
+            levels,
+            outputLowValues,
+            outputHighValues);
+        hasZeroPoint = precisionDetailsAtOutputIntervals.precision != precision;
+    }
+
+    return DataPrecision(
+        precision,
+        DataPrecision::getMinValue(precision, levels),
+        DataPrecision::getMaxValue(precision, levels),
+        hasZeroPoint);
+}
+
+// TODO: LPT: refactor: use one way to decompose FakeQuantize
+std::shared_ptr<ngraph::Node> decomposeFakeQuantize(
+    MatcherPass* matcherPass,
+    std::shared_ptr<opset1::FakeQuantize>& layer,
+    const std::shared_ptr<IntervalsAlignmentAttribute>& intervalsAlignment,
+    const DataPrecision& dataPrecision,
+    const bool updatePrecisions,
+    const element::Type deqPrecision) {
+    std::shared_ptr<ngraph::Node> dequantize;
+    if (intervalsAlignment != nullptr) {
+        OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "decomposeFakeQuantize1");
+        const std::vector<float> outputLowValues = as_type_ptr<opset1::Constant>(layer->get_input_node_shared_ptr(3))->cast_vector<float>();
+        const std::vector<float> outputHighValues = as_type_ptr<opset1::Constant>(layer->get_input_node_shared_ptr(4))->cast_vector<float>();
+
+        float dequantizationMul;
+        float dequantizationSub;
+        float updatedOutputLowValue;
+        float updatedOutputHighValue;
+        const size_t levels = NetworkHelper::calculateLevels(
+            dataPrecision.min,
+            dataPrecision.max,
+            intervalsAlignment->sharedValue->combinedInterval.low,
+            intervalsAlignment->sharedValue->combinedInterval.high,
+            outputLowValues[0],
+            outputHighValues[0],
+            dequantizationMul,
+            dequantizationSub,
+            updatedOutputLowValue,
+            updatedOutputHighValue);
+
+        if ((updatePrecisions == false) && (dequantizationMul == 1.f) && (dequantizationSub == 0.f)) {
+            return nullptr;
+        }
+
+        //TODO: pass min levels as a parameter?
+        if (levels < 2ul) {
+            return nullptr;
+        }
+
+        // 2. update FakeQuantize - one time action
+        std::shared_ptr<opset1::FakeQuantize> newFakeQuantizeLayer = ngraph::pass::low_precision::NetworkHelper::updateFakeQuantize(
+            layer,
+            updatePrecisions ? dataPrecision.precision : layer->get_output_element_type(0),
+            roundf(updatedOutputLowValue),
+            roundf(updatedOutputHighValue),
+            false);
+        matcherPass->register_new_node(newFakeQuantizeLayer);
+        newFakeQuantizeLayer->set_levels(levels);
+
+        auto dequantization = ngraph::pass::low_precision::NetworkHelper::makeDequantization(
+            dequantizationMul,
+            dequantizationSub,
+            layer->get_output_element_type(0),
+            layer->get_output_partial_shape(0),
+            updatePrecisions ? dataPrecision.precision : layer->get_output_element_type(0),
+            deqPrecision,
+            newFakeQuantizeLayer);
+
+        replace_node(layer, dequantization.multiply);
+
+        std::vector<std::shared_ptr<ngraph::Node>> sourceNodes{ layer };
+        std::vector<std::shared_ptr<ngraph::Node>> targetNodes{ newFakeQuantizeLayer,  dequantization.multiply };
+        if (dequantization.convert != nullptr) {
+            targetNodes.push_back(dequantization.convert);
+        }
+        if (dequantization.subtract != nullptr) {
+            targetNodes.push_back(dequantization.subtract);
+        }
+        NetworkHelper::copyInfo(sourceNodes, targetNodes);
+
+        dequantize = dequantization.multiply;
+    } else {
+        OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "decomposeFakeQuantize2");
+        // Split FakeQuantize to two parts: Quantize and Dequantize
+        auto QDQ = NetworkHelper::decomposeFakeQuantize(
+            as_type_ptr<opset1::FakeQuantize>(layer),
+            dataPrecision.precision,
+            dataPrecision.min,
+            dataPrecision.max,
+            dataPrecision.hasZeroPoint,
+            updatePrecisions);
+
+        const auto newFakeQuantize = std::get<0>(QDQ);
+        if (newFakeQuantize == nullptr) {
+            return nullptr;
+        }
+        matcherPass->register_new_node(newFakeQuantize);
+        dequantize = std::get<1>(QDQ);
+    }
+
+    return dequantize;
 }
 
-bool FakeQuantizeDecompositionTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
-    std::shared_ptr<opset1::FakeQuantize> layer = std::dynamic_pointer_cast<opset1::FakeQuantize>(m.get_match_root());
+} // namespace fq_decomposition
+
+bool FakeQuantizeDecompositionTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) {
+    auto layer = as_type_ptr<opset1::FakeQuantize>(m.get_match_root());
     if (!NetworkHelper::isQuantizeSupported(layer)) {
         return false;
     }
@@ -30,59 +262,24 @@ bool FakeQuantizeDecompositionTransformation::transform(TransformationContext& c
 
     layer = NetworkHelper::fuseConvert(layer);
     if (NetworkHelper::isConstantPath(layer)) {
-        // fold fq if constant just before fq and child layers aren't supported in LPT
-        if (as_type<opset1::Constant>(layer->get_input_node_ptr(0))) {
-            bool nextOpearionsWillBeNotHandled = true;
-            for (auto output : layer->outputs()) {
-                for (auto input : output.get_target_inputs()) {
-                    const auto node = input.get_node();
-
-                    if (as_type<ngraph::opset1::Reshape>(node)) {
-                        for (const auto& child : NetworkHelper::consumers(node->shared_from_this())) {
-                            if ((as_type_ptr<ngraph::opset1::GroupConvolution>(child)) &&
-                                (paramsManager->getPrecisionsOnActivations(*child).size() != 0ul)) {
-                                nextOpearionsWillBeNotHandled = false;
-                                break;
-                            }
-                        }
-                    }
-
-                    if (paramsManager->getPrecisionsOnActivations(*input.get_node()).size() != 0ul) {
-                        nextOpearionsWillBeNotHandled = false;
-                        break;
-                    }
-                }
-
-                if (!nextOpearionsWillBeNotHandled) {
-                    break;
-                }
-            }
+        return false;
+    }
 
-            if (nextOpearionsWillBeNotHandled) {
-                const std::shared_ptr<ngraph::Node> resultConstant = NetworkHelper::fold_fake_quantize(layer);
-                if (as_type_ptr<opset1::Constant>(resultConstant)) {
-                    replace_node(layer, resultConstant);
-                    return true;
-                }
-            }
-        }
+    auto attribute = getAttributeFromOutput<std::shared_ptr<PrecisionsAttribute>>(layer->output(0));
+    if ((attribute == nullptr) || (attribute->get()->sharedValue->precisions.empty())) {
         return false;
     }
 
-    const ngraph::element::Type precision = layer->get_output_element_type(0);
-    if (DataPrecision::isSupported(precision)) {
-        const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(layer);
+    const ngraph::element::Type outputPrecision = layer->get_output_element_type(0);
+    if (DataPrecision::isSupported(outputPrecision)) {
         const FakeQuantizeDequantization dequantization = NetworkHelper::getDequantizationBelow(layer);
         if (dequantization.empty()) {
             return false;
         }
 
-        const DataPrecision expectedDataPrecision = getDataPrecision(dequantization.multiply, quantizationDetails, false);
-        if (expectedDataPrecision.precision == element::undefined) {
-            return false;
-        }
-
-        if (expectedDataPrecision.precision == precision) {
+        const DataPrecision expectedDataPrecision = fq_decomposition::getDataPrecisionByOutputPortAndFakeQuantize(layer);
+        // TODO: need test to compose FakeQuantize
+        if ((expectedDataPrecision.precision == element::undefined) || (expectedDataPrecision.precision == outputPrecision)) {
             return false;
         }
 
@@ -92,76 +289,122 @@ bool FakeQuantizeDecompositionTransformation::transform(TransformationContext& c
         }
     }
 
-    if (as_type<opset1::Constant>(layer->get_input_node_ptr(0))) {
-        bool nextOpearionsWillBeNotHandled = true;
-        for (auto output : layer->outputs()) {
-            for (auto input : output.get_target_inputs()) {
-                auto activations = paramsManager->getPrecisionsOnActivations(*input.get_node());
-                if (paramsManager->getPrecisionsOnActivations(*input.get_node()).size() != 0ul) {
-                    nextOpearionsWillBeNotHandled = false;
-                    break;
-                }
-            }
+    if (!QuantizationDetails::outputLayoutIsSupported(layer)) {
+        return false;
+    }
 
-            if (!nextOpearionsWillBeNotHandled) {
-                break;
-            }
+    if (!QuantizationDetails::isSupportedLevel(layer->get_levels())) {
+        return false;
+    }
+
+    DataPrecision dataPrecision = fq_decomposition::getDataPrecisionByOutputPort(layer);
+
+    std::shared_ptr<PrecisionsAttribute> precisionsAttribute;
+    {
+        // TODO: LPT: return attribute (not wrapper)
+        auto attributeWrapper = getAttributeFromOutput<std::shared_ptr<PrecisionsAttribute>>(layer->output(0));
+        if (attributeWrapper == nullptr) {
+            THROW_IE_LPT_EXCEPTION(*layer) << "PrecisionAttribute is absent";
         }
+        precisionsAttribute = attributeWrapper->get();
+        if (precisionsAttribute == nullptr) {
+            THROW_IE_LPT_EXCEPTION(*layer) << "PrecisionAttribute is absent";
+        }
+    }
 
-        if (nextOpearionsWillBeNotHandled) {
-            const std::shared_ptr<ngraph::Node> resultConstant = NetworkHelper::fold_fake_quantize(layer);
-            if (as_type_ptr<opset1::Constant>(resultConstant)) {
-                replace_node(layer, resultConstant);
-                return true;
+    std::shared_ptr<QuantizationAlignmentAttribute> quantizationAlignment;
+    for (const auto& input : layer->output(0).get_target_inputs()) {
+        const auto alignmentValueWrapper = low_precision::getAttribute<std::shared_ptr<QuantizationAlignmentAttribute>>(input.get_node()->shared_from_this());
+        if (alignmentValueWrapper != nullptr) {
+            quantizationAlignment = alignmentValueWrapper->get();
+            if (quantizationAlignment->sharedValue->value) {
+                break;
             }
         }
     }
 
-    if (!QuantizationDetails::outputLayoutIsSupported(layer)) {
-        return false;
+    std::shared_ptr<IntervalsAlignmentAttribute> intervalsAlignment;
+    {
+        if ((quantizationAlignment != nullptr) && quantizationAlignment->sharedValue->value) {
+            auto intervalsAlignmentWrapper = low_precision::getAttribute<std::shared_ptr<IntervalsAlignmentAttribute>>(layer);
+            if (intervalsAlignmentWrapper != nullptr) {
+                intervalsAlignment = intervalsAlignmentWrapper->get();
+            }
+        }
     }
 
-    if (!QuantizationDetails::isSupportedLevel(layer->get_levels())) {
+    // FakeQuantize operations are combined in supported cascade (per tensor quantization)
+    if ((intervalsAlignment != nullptr) && (intervalsAlignment->sharedValue->minLevels <= 2ul)) {
         return false;
     }
 
-    const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(layer);
-    const DataPrecision dataPrecision = getDataPrecision(layer, quantizationDetails, false);
+    // if IntervalsAlignment attribute is defined then, the attribute defines decomposition parameters,
+    // if IntervalsAlignment attribute is not defined, then FakeQuantize operation intervals define decomposition parameters
     if (dataPrecision.precision == element::undefined) {
-        return false;
-    }
+        element::Type precision;
+        const auto levels = layer->get_levels();
+        const std::vector<float> outputLowValues = as_type_ptr<opset1::Constant>(layer->get_input_node_shared_ptr(3))->cast_vector<float>();
+        const std::vector<float> outputHighValues = as_type_ptr<opset1::Constant>(layer->get_input_node_shared_ptr(4))->cast_vector<float>();
+        if (intervalsAlignment == nullptr) {
+            // define precision by FakeQuantize intervals
+            LayerTransformation::PrecisionDetails precisionDetailsAtOutputIntervals = LayerTransformation::getPrecisionDetails(
+                levels,
+                outputLowValues,
+                outputHighValues);
+            const auto foundIt = std::find(
+                precisionsAttribute->sharedValue->precisions.begin(),
+                precisionsAttribute->sharedValue->precisions.end(),
+                precisionDetailsAtOutputIntervals.precision);
 
-    // Split FakeQuantize to two parts: Quantize and Dequantize
-    auto QDQ = NetworkHelper::decomposeFakeQuantize(
-        as_type_ptr<opset1::FakeQuantize>(layer),
-        dataPrecision.precision,
-        dataPrecision.min,
-        dataPrecision.max,
-        dataPrecision.hasZeroPoint,
-        updatePrecisions);
+            bool hasZeroPoint;
+            if (foundIt == precisionsAttribute->sharedValue->precisions.end()) {
+                precision = *precisionsAttribute->sharedValue->precisions.begin();
+                hasZeroPoint = true;
+            } else {
+                precision = precisionDetailsAtOutputIntervals.precision;
+                hasZeroPoint = precisionDetailsAtOutputIntervals.hasZeroPoint;
+            }
 
-#ifdef LPT_PRINT_DEQUANTIZATION_INFO
-    {
-        const std::shared_ptr<opset1::Multiply> multiply = as_type_ptr<opset1::Multiply>(std::get<1>(QDQ));
-        const std::shared_ptr<opset1::Constant> multiplyConst = as_type_ptr<opset1::Constant>(multiply->get_input_node_shared_ptr(1));
-        const std::vector<float> dequantizationScales = multiplyConst->cast_vector<float>();
-
-        const std::shared_ptr<opset1::Subtract> subtract = as_type_ptr<opset1::Subtract>(multiply->get_input_node_shared_ptr(0));
-        std::vector<float> dequantizationShifts;
-        if (subtract != nullptr) {
-            const std::shared_ptr<opset1::Constant> subtractConst = as_type_ptr<opset1::Constant>(subtract->get_input_node_shared_ptr(1));
-            dequantizationShifts = subtractConst->cast_vector<float>();
+            dataPrecision = DataPrecision(
+                precision,
+                DataPrecision::getMinValue(precision, levels),
+                DataPrecision::getMaxValue(precision, levels),
+                hasZeroPoint);
         } else {
-            dequantizationShifts = std::vector<float>(dequantizationScales.size());
+            // define precision by attribute
+            if (intervalsAlignment->sharedValue->preferablePrecisions.empty()) {
+                // TODO: LPT: add user defined preferredPrecision
+                precision = *precisionsAttribute->sharedValue->precisions.begin();
+            } else {
+                // TODO: LPT: add user defined preferredPrecision
+                precision = *intervalsAlignment->sharedValue->preferablePrecisions.begin();
+            }
+
+            dataPrecision = DataPrecision(
+                precision,
+                DataPrecision::getMinValue(precision, levels),
+                DataPrecision::getMaxValue(precision, levels),
+                LayerTransformation::getPrecisionDetails(levels, outputLowValues, outputHighValues).precision != precision);
         }
+    }
 
-        printDequantizationValues(dequantizationScales, dequantizationShifts);
+    std::shared_ptr<ngraph::Node> dequantize = fq_decomposition::decomposeFakeQuantize(
+        this,
+        layer,
+        intervalsAlignment,
+        dataPrecision,
+        updatePrecisions,
+        deqPrecision);
+    if (dequantize == nullptr) {
+        return false;
     }
-#endif
 
-    std::shared_ptr<ngraph::Node> dequantize = std::get<1>(QDQ);
     updateOutput(context, dequantize, layer);
 
+    if (precisionsAttribute->sharedValue->precisions.size() != 1ul) {
+        precisionsAttribute->sharedValue->precisions = { dataPrecision.precision };
+    }
+
     return true;
 }
 
diff --git a/inference-engine/src/low_precision_transformations/src/fold_convert.cpp b/inference-engine/src/low_precision_transformations/src/fold_convert.cpp
index 091380442b8244..5e673a1ef512f4 100644
--- a/inference-engine/src/low_precision_transformations/src/fold_convert.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fold_convert.cpp
@@ -5,18 +5,32 @@
 #include "low_precision/fold_convert.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
-#include "low_precision/fake_quantize.hpp"
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FoldConvertTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Subtract>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FoldConvertTransformation, "FoldConvertTransformation", 0);
+
+FoldConvertTransformation::FoldConvertTransformation(const Params& params) : LayerTransformation(params) {
+    auto subtract = pattern::wrap_type<opset1::Subtract>();
+    auto matcher = std::make_shared<ngraph::pattern::Matcher>(subtract, "FoldConvertTransformation");
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    this->register_matcher(matcher, callback);
 }
 
-bool FoldConvertTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool FoldConvertTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     const auto subtract = m.get_match_root();
     if (!canBeTransformed(context, subtract)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp b/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp
new file mode 100644
index 00000000000000..4981f66a7d4f9d
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp
@@ -0,0 +1,64 @@
+﻿// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/fold_fake_quantize.hpp"
+
+#include <memory>
+#include <string>
+#include <vector>
+
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include "low_precision/network_helper.hpp"
+
+namespace ngraph {
+namespace pass {
+namespace low_precision {
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FoldFakeQuantizeTransformation, "FoldFakeQuantizeTransformation", 0);
+
+FoldFakeQuantizeTransformation::FoldFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {
+    auto fakeQuantize = pattern::wrap_type<opset1::FakeQuantize>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(fakeQuantize, "FoldFakeQuantizeTransformation");
+    this->register_matcher(m, callback);
+}
+
+bool FoldFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
+    const auto fakeQuantize = as_type_ptr<opset1::FakeQuantize>(m.get_match_root());
+    if (fakeQuantize == nullptr) {
+        return false;
+    }
+
+    if (!canBeTransformed(context, fakeQuantize)) {
+        return false;
+    }
+
+    const auto resultConstant = NetworkHelper::fold_fake_quantize(fakeQuantize, false);
+    if (is_type<opset1::Constant>(resultConstant)) {
+        replace_node(fakeQuantize, resultConstant);
+        return true;
+    }
+
+    return false;
+}
+
+bool FoldFakeQuantizeTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const {
+    return NetworkHelper::isConstantPath(op);
+}
+
+bool FoldFakeQuantizeTransformation::isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept {
+    return false;
+}
+
+} // namespace low_precision
+} // namespace pass
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/fuse_convert.cpp b/inference-engine/src/low_precision_transformations/src/fuse_convert.cpp
index 38aa2133940308..48fbea0211946a 100644
--- a/inference-engine/src/low_precision_transformations/src/fuse_convert.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fuse_convert.cpp
@@ -5,9 +5,11 @@
 #include "low_precision/fuse_convert.hpp"
 
 #include <memory>
-#include <string>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -15,21 +17,25 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FuseConvertTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Multiply>({ make_op_label<opset1::Convert>(), make_op_label<opset1::Constant>() }));
-
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Subtract>({ make_op_label<opset1::Convert>(), make_op_label<opset1::Constant>() }));
-
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Add>({ make_op_label<opset1::Convert>(), make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FuseConvertTransformation, "FuseConvertTransformation", 0);
+
+FuseConvertTransformation::FuseConvertTransformation(const Params& params) : LayerTransformation(params) {
+    auto multiply = pattern::wrap_type<opset1::Multiply>({ pattern::wrap_type<opset1::Convert>(), pattern::wrap_type<opset1::Constant>() });
+    auto subtract = pattern::wrap_type<opset1::Subtract>({ pattern::wrap_type<opset1::Convert>(), pattern::wrap_type<opset1::Constant>() });
+    auto add = pattern::wrap_type<opset1::Add>({ pattern::wrap_type<opset1::Convert>(), pattern::wrap_type<opset1::Constant>() });
+    auto matcher = std::make_shared<ngraph::pattern::Matcher>(
+        std::make_shared<pattern::op::Or>(OutputVector{ multiply, subtract,  add }),
+        "FuseConvertTransformation");
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    this->register_matcher(matcher, callback);
 }
 
 std::shared_ptr<Node> removeConvertIfPossibleForSubtract(
@@ -50,7 +56,7 @@ std::shared_ptr<Node> removeConvertIfPossibleForSubtract(
     return newSubtract;
 }
 
-bool FuseConvertTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool FuseConvertTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     const auto op = m.get_match_root();
     if (!canBeTransformed(context, op)) {
         return false;
@@ -84,10 +90,13 @@ bool FuseConvertTransformation::transform(TransformationContext& context, ngraph
             replace_node(op, newOp);
         }
 
-        if (newOp != nullptr) {
-            ngraph::copy_runtime_info({ convert, op }, newOp);
-            newOp->set_friendly_name(op->get_friendly_name());
+        if (newOp == nullptr) {
+            return false;
         }
+
+        ngraph::copy_runtime_info({ convert, op }, newOp);
+        newOp->set_friendly_name(op->get_friendly_name());
+        register_new_node(newOp);
     }
 
     return true;
diff --git a/inference-engine/src/low_precision_transformations/src/fuse_fake_quantize.cpp b/inference-engine/src/low_precision_transformations/src/fuse_fake_quantize.cpp
index 6ef45c0b6cae2c..b15b466b4761c0 100644
--- a/inference-engine/src/low_precision_transformations/src/fuse_fake_quantize.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fuse_fake_quantize.cpp
@@ -5,6 +5,7 @@
 #include "low_precision/fuse_fake_quantize.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -12,11 +13,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FuseFakeQuantizeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::FakeQuantize>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FuseFakeQuantizeTransformation, "FuseFakeQuantizeTransformation", 0);
+
+FuseFakeQuantizeTransformation::FuseFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::FakeQuantize>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "FuseFakeQuantizeTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool FuseFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool FuseFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::FakeQuantize> fakeQuantize = as_type_ptr<ngraph::opset1::FakeQuantize>(m.get_match_root());
     do {
         fakeQuantize = handle(context, fakeQuantize);
diff --git a/inference-engine/src/low_precision_transformations/src/fuse_multiply_to_fake_quantize.cpp b/inference-engine/src/low_precision_transformations/src/fuse_multiply_to_fake_quantize.cpp
index 734d9abec435ec..ccff4188d3a5c1 100644
--- a/inference-engine/src/low_precision_transformations/src/fuse_multiply_to_fake_quantize.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fuse_multiply_to_fake_quantize.cpp
@@ -5,6 +5,8 @@
 #include "low_precision/fuse_multiply_to_fake_quantize.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
 #include "low_precision/fake_quantize.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -12,11 +14,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FuseMultiplyToFakeQuantizeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Multiply>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FuseMultiplyToFakeQuantizeTransformation, "FuseMultiplyToFakeQuantizeTransformation", 0);
+
+FuseMultiplyToFakeQuantizeTransformation::FuseMultiplyToFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Multiply>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "FuseMultiplyToFakeQuantizeTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool FuseMultiplyToFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool FuseMultiplyToFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     const auto multiply = m.get_match_root();
     if (!canBeTransformed(context, multiply)) {
         return false;
@@ -65,6 +80,11 @@ bool FuseMultiplyToFakeQuantizeTransformation::transform(TransformationContext&
     replace_node(multiply, newFakeQuantize);
     NetworkHelper::copyInfo(fakeQuantize, newFakeQuantize);
 
+    const auto intervalAlignment = getAttribute<IntervalsAlignmentAttributePtr>(fakeQuantize);
+    if ((intervalAlignment != nullptr) && (intervalAlignment->get()->levels != 0ul)) {
+        newFakeQuantize->set_levels(intervalAlignment->get()->levels);
+    }
+
     updateOutput(context, newFakeQuantize, multiply);
     return true;
 }
diff --git a/inference-engine/src/low_precision_transformations/src/fuse_subtract_to_fake_quantize.cpp b/inference-engine/src/low_precision_transformations/src/fuse_subtract_to_fake_quantize.cpp
index 8d8d9968802e44..b8ec9b192fd272 100644
--- a/inference-engine/src/low_precision_transformations/src/fuse_subtract_to_fake_quantize.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fuse_subtract_to_fake_quantize.cpp
@@ -5,6 +5,7 @@
 #include "low_precision/fuse_subtract_to_fake_quantize.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/fake_quantize.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -12,11 +13,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void FuseSubtractToFakeQuantizeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Subtract>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::FuseSubtractToFakeQuantizeTransformation, "FuseSubtractToFakeQuantizeTransformation", 0);
+
+FuseSubtractToFakeQuantizeTransformation::FuseSubtractToFakeQuantizeTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Subtract>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "FuseSubtractToFakeQuantizeTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool FuseSubtractToFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool FuseSubtractToFakeQuantizeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     const auto subtract = m.get_match_root();
     if (!canBeTransformed(context, subtract)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/group_convolution.cpp b/inference-engine/src/low_precision_transformations/src/group_convolution.cpp
index 8dd7b0b1ce727e..42d9600d13c7a0 100644
--- a/inference-engine/src/low_precision_transformations/src/group_convolution.cpp
+++ b/inference-engine/src/low_precision_transformations/src/group_convolution.cpp
@@ -8,24 +8,35 @@
 #include <string>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-GroupConvolutionTransformation::GroupConvolutionTransformation(const Params& params) : ConvolutionTransformation(params) {
-}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::GroupConvolutionTransformation, "GroupConvolutionTransformation", 0);
 
-void GroupConvolutionTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::GroupConvolution>(pass, context);
+GroupConvolutionTransformation::GroupConvolutionTransformation(const Params& params) : ConvolutionTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::GroupConvolution>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "GroupConvolutionTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool GroupConvolutionTransformation::isQuantized(std::shared_ptr<Node> layer) const noexcept {
-    return WeightableLayerTransformation::isQuantized(layer, true);
+bool GroupConvolutionTransformation::isQuantized(const std::shared_ptr<const Node>& layer) const noexcept {
+    return GroupConvolutionTransformation::isQuantizedStatic(layer);
 }
 
-bool GroupConvolutionTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool GroupConvolutionTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     auto convolution = m.get_match_root();
 
     if (!GroupConvolutionTransformation::canBeTransformed(context, convolution)) {
@@ -36,6 +47,10 @@ bool GroupConvolutionTransformation::transform(TransformationContext &context, n
     return true;
 }
 
+bool GroupConvolutionTransformation::isQuantizedStatic(const std::shared_ptr<const Node>& layer) noexcept {
+    return WeightableLayerTransformation::isQuantizedStatic(layer, true);
+}
+
 } // namespace low_precision
 } // namespace pass
 } // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/interpolate.cpp b/inference-engine/src/low_precision_transformations/src/interpolate.cpp
index 66aba3fc7c429f..b8538bfd14b5d1 100644
--- a/inference-engine/src/low_precision_transformations/src/interpolate.cpp
+++ b/inference-engine/src/low_precision_transformations/src/interpolate.cpp
@@ -9,30 +9,50 @@
 #include <string>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
 #include "low_precision/network_helper.hpp"
 
 using namespace ngraph;
 using namespace ngraph::pass;
 using namespace ngraph::pass::low_precision;
 
-void InterpolateTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Interpolate>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset4::Interpolate>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>(),
-            make_op_label<opset1::Constant>(), make_op_label<opset1::Constant>() }));
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset4::Interpolate>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>(),
-            make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::InterpolateTransformation, "InterpolateTransformation", 0);
+
+InterpolateTransformation::InterpolateTransformation(const Params& params) : LayerTransformation(params) {
+    auto mul = pattern::wrap_type<opset1::Multiply>();
+
+    auto interpolate1 = pattern::wrap_type<opset1::Interpolate>({
+        mul,
+        pattern::wrap_type<opset1::Constant>() });
+
+    auto interpolate4 = pattern::wrap_type<opset4::Interpolate>({
+        mul,
+        pattern::wrap_type<opset1::Constant>(),
+        pattern::wrap_type<opset1::Constant>() });
+
+    auto interpolate4_2 = pattern::wrap_type<opset4::Interpolate>({
+        mul,
+        pattern::wrap_type<opset1::Constant>(),
+        pattern::wrap_type<opset1::Constant>(),
+        pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto matcher = std::make_shared<ngraph::pattern::Matcher>(
+        std::make_shared<pattern::op::Or>(OutputVector{ interpolate1, interpolate4, interpolate4_2 }),
+        "InterpolateTransformation");
+
+    this->register_matcher(matcher, callback);
 }
 
-bool InterpolateTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool InterpolateTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> interpolate = m.get_match_root();
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/layer_transformation.cpp b/inference-engine/src/low_precision_transformations/src/layer_transformation.cpp
index d1dc736e536ed4..14d21fa29b67c3 100644
--- a/inference-engine/src/low_precision_transformations/src/layer_transformation.cpp
+++ b/inference-engine/src/low_precision_transformations/src/layer_transformation.cpp
@@ -25,50 +25,16 @@ const char LayerTransformation::originalLayerPostfix[] = "_original";
 
 LayerTransformation::LayerTransformation(const Params& params) :
     updatePrecisions(params.updatePrecisions),
-    quantizedTensorAlignmentOnActivations(params.quantizedTensorAlignmentOnActivations),
-    quantizedTensorAlignmentOnWeights(params.quantizedTensorAlignmentOnWeights),
-    supportAsymmetricQuantization(params.supportAsymmetricQuantization),
-    precisionsOnActivations(params.precisionsOnActivations),
-    precisionsOnWeights(params.precisionsOnWeights),
-    deqPrecision(params.deqPrecision),
-    support3DTensorOnActivations(params.support3DTensorOnActivations),
-    deconvolutionSpecificChannelsRatio(params.deconvolutionSpecificChannelsRatio),
-    quantizationIntervalAsymmetryThreshold(0.002f),
-    zeroThreshold(1.e-6f),
-    minQuantizationLevels(2ul),
-    paramsManager(nullptr),
-    layerTransformationsManager(nullptr) {}
-
-void LayerTransformation::setParamsManager(IParamsManager* paramsManager) noexcept {
-    this->paramsManager = paramsManager;
-}
+    deqPrecision(params.deqPrecision) {}
 
-void LayerTransformation::setLayerTransformationsManager(ILayerTransformationsManager* layerTransformationsManager) noexcept {
-    this->layerTransformationsManager = layerTransformationsManager;
+void LayerTransformation::setContext(TransformationContext* context) noexcept {
+    this->context = context;
 }
 
 void LayerTransformation::setUpdatePrecisions(const bool updatePrecisions) {
     this->updatePrecisions = updatePrecisions;
 }
 
-void LayerTransformation::setQuantizedTensorAlignmentOnActivations(
-    const QuantizedTensorAlignment quantizedTensorAlignmentOnActivations) {
-    this->quantizedTensorAlignmentOnActivations = quantizedTensorAlignmentOnActivations;
-}
-
-void LayerTransformation::setQuantizedTensorAlignmentOnWeights(
-    const QuantizedTensorAlignment quantizedTensorAlignmentOnWeights) {
-    this->quantizedTensorAlignmentOnWeights = quantizedTensorAlignmentOnWeights;
-}
-
-const std::vector<element::Type>& LayerTransformation::getPrecisionsOnActivations() const {
-    return precisionsOnActivations;
-}
-
-const std::vector<element::Type>& LayerTransformation::getPrecisionsOnWeights() const {
-    return precisionsOnWeights;
-}
-
 bool LayerTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const {
     if (!isQuantized(layer)) {
         return false;
@@ -78,6 +44,10 @@ bool LayerTransformation::canBeTransformed(const TransformationContext& context,
         return false;
     }
 
+    return canBeTransformedStatic(layer);
+}
+
+bool LayerTransformation::canBeTransformedStatic(const std::shared_ptr<Node>& layer) {
     for (const auto& output : layer->outputs()) {
         const auto rank = output.get_partial_shape().rank();
         if (rank.is_dynamic()) {
@@ -120,13 +90,13 @@ bool LayerTransformation::canBeTransformed(const TransformationContext& context,
 
         if ((dequantization.subtract != nullptr) && (!perChannelQuantization(
             dequantization.subtract->get_output_partial_shape(0),
-            dequantization.subtract->get_input_shape(1)))) {
+            dequantization.subtractConstant->get_shape()))) {
             return false;
         }
 
         if ((dequantization.multiply != nullptr) && (!perChannelQuantization(
             dequantization.multiply->get_output_partial_shape(0),
-            dequantization.multiply->get_input_shape(1)))) {
+            dequantization.multiplyConstant->get_shape()))) {
             return false;
         }
     }
@@ -158,19 +128,11 @@ bool LayerTransformation::canBeTransformedSpatialDimension(const TransformationC
     return true;
 }
 
-bool LayerTransformation::canSubtractBeHandled(const std::shared_ptr<Node>& op, const size_t parentIndex) const {
-    return canSubtractBeHandled(op, NetworkHelper::getDequantization(op, parentIndex));
-}
-
 bool LayerTransformation::canSubtractBeHandled(const std::shared_ptr<Node>& op, const FakeQuantizeDequantization& dequantization) const {
     if (dequantization.empty() || (dequantization.subtract == nullptr)) {
         return true;
     }
 
-    if (!supportAsymmetricQuantization) {
-        return false;
-    }
-
     if (!updatePrecisions) {
         return true;
     }
@@ -229,36 +191,31 @@ void LayerTransformation::printDequantizationValues(
 }
 #endif
 
-void LayerTransformation::setQuantizationIntervalAsymmetryThreshold(const float value) {
-    this->quantizationIntervalAsymmetryThreshold = value;
-}
+LayerTransformation::PrecisionDetails LayerTransformation::getPrecisionDetails(
+    const size_t quantizationLevels,
+    const std::vector<float>& outputLowValues,
+    const std::vector<float>& outputHighValues) {
+    // TODO: workaround: hardcoded values
+    const float zeroThreshold = 1.e-6f;
+    const float quantizationIntervalAsymmetryThreshold = 0.002f;
 
-void LayerTransformation::setZeroThreshold(const float value) {
-    this->zeroThreshold = value;
-}
-
-void LayerTransformation::setMinQuantizationLevels(const size_t levels) {
-    this->minQuantizationLevels = levels;
-}
-
-LayerTransformation::PrecisionDetails LayerTransformation::getPrecisionDetails(const QuantizationDetails& quantizationDetails) const {
     const float asymmetricIntervalSideRatio256 = -128.f / 127.f;
     bool hasNegative = false;
     bool signedPrecision = true;
     bool unsignedPrecision = true;
 
     bool hasZeroPoint = false;
-    for (size_t i = 0; i < quantizationDetails.outputLowValues.size(); ++i) {
-        const bool signedInterval = std::signbit(quantizationDetails.outputLowValues[i]) != std::signbit(quantizationDetails.outputHighValues[i]);
-        const bool outputLowValueIsNotZero = std::fabs(quantizationDetails.outputLowValues[i]) >= zeroThreshold;
+    for (size_t i = 0; i < outputLowValues.size(); ++i) {
+        const bool signedInterval = std::signbit(outputLowValues[i]) != std::signbit(outputHighValues[i]);
+        const bool outputLowValueIsNotZero = std::fabs(outputLowValues[i]) >= zeroThreshold;
         if (signedInterval && outputLowValueIsNotZero) {
             // signed
             unsignedPrecision = false;
             hasNegative = true;
 
-            if (quantizationDetails.outputHighValues[i] != 0.f) {
-                const float expectedRatio = quantizationDetails.levels == 256 ? asymmetricIntervalSideRatio256 : -1.f;
-                const float actualRatio = quantizationDetails.outputLowValues[i] / quantizationDetails.outputHighValues[i];
+            if (outputHighValues[i] != 0.f) {
+                const float expectedRatio = quantizationLevels == 256 ? asymmetricIntervalSideRatio256 : -1.f;
+                const float actualRatio = outputLowValues[i] / outputHighValues[i];
                 const float actual = std::fabs((actualRatio - expectedRatio) / std::min(actualRatio, expectedRatio));
                 if (actual > quantizationIntervalAsymmetryThreshold) {
                     hasZeroPoint = true;
@@ -291,6 +248,17 @@ LayerTransformation::PrecisionDetails LayerTransformation::getPrecisionDetails(c
         }
     }
 
+    // TODO: use this implementation after merge <= not aligned with master
+//    if (signedPrecision && (!unsignedPrecision)) {
+//        return LayerTransformation::PrecisionDetails(element::i8, hasNegative, hasZeroPoint);
+//    }
+//
+//    if ((!signedPrecision) && unsignedPrecision) {
+//        return LayerTransformation::PrecisionDetails(element::u8, hasNegative, hasZeroPoint);
+//    }
+//
+//    THROW_TRANSFORMATION_EXCEPTION << "unexpected interval";
+
     if (!hasZeroPoint) {
         if (signedPrecision && (!unsignedPrecision)) {
             return LayerTransformation::PrecisionDetails(element::i8, hasNegative, hasZeroPoint);
@@ -304,135 +272,51 @@ LayerTransformation::PrecisionDetails LayerTransformation::getPrecisionDetails(c
     return LayerTransformation::PrecisionDetails(element::undefined, hasNegative, hasZeroPoint);
 }
 
-bool LayerTransformation::isQuantized(std::shared_ptr<Node> layer) const noexcept {
+LayerTransformation::PrecisionDetails LayerTransformation::getPrecisionDetails(const QuantizationDetails& quantizationDetails) {
+    return getPrecisionDetails(quantizationDetails.levels, quantizationDetails.outputLowValues, quantizationDetails.outputHighValues);
+}
+
+bool LayerTransformation::isAsymmetricQuantization(const std::shared_ptr<const Node>& layer) {
+    const auto nonConstNode = const_cast<ngraph::Node*>(layer.get())->shared_from_this();
+    const auto dequantization = NetworkHelper::getDequantization(nonConstNode);
+    return dequantization.subtract != nullptr;
+}
+
+bool LayerTransformation::isQuantized(const std::shared_ptr<const Node>& layer) const noexcept {
     return true;
 }
 
 DataPrecision LayerTransformation::getDataPrecision(
-        std::shared_ptr<Node> layer,
+        const std::shared_ptr<Node>& layer,
         const QuantizationDetails& quantizationDetails,
-        const bool onWeights) const {
+        const std::vector<element::Type>& precisions) {
 #ifdef LPT_PRINT_DEQUANTIZATION_INFO
     printDequantizationInfo(layer);
 #endif
-    std::vector<element::Type> precisions = onWeights ? precisionsOnWeights : precisionsOnActivations;
     PrecisionDetails precisionDetailsAtOutputIntervals = getPrecisionDetails(quantizationDetails);
-    {
-        if (precisionDetailsAtOutputIntervals.precision != element::undefined) {
-            if (!onWeights) {
-                fillAvailablePrecisions(layer, precisions);
-            }
-
-            // if supportedPrecisions is empty then use the first available, not supported layer will be in original precision
-            if (!precisions.empty()) {
-                const auto foundIt = std::find(precisions.begin(), precisions.end(), precisionDetailsAtOutputIntervals.precision);
-                const element::Type resultPrecision = foundIt != precisions.end() ?
-                                                  precisionDetailsAtOutputIntervals.precision :
-                                                  *precisions.begin();
 
-                const DataPrecision dataPrecision(
-                        resultPrecision,
-                        DataPrecision::getMinValue(resultPrecision, quantizationDetails.levels),
-                        DataPrecision::getMaxValue(resultPrecision, quantizationDetails.levels),
-                        foundIt != precisions.end() ? precisionDetailsAtOutputIntervals.hasZeroPoint : true);
-
-#ifdef LPT_PRINT_DEQUANTIZATION_INFO
-                printDequantizationInfo(dataPrecision);
-#endif
-                return dataPrecision;
-            }
+    if (precisionDetailsAtOutputIntervals.precision != element::undefined) {
+        // if supportedPrecisions is empty then use the first available, not supported layer will be in original precision
+        if (!precisions.empty()) {
+            const auto foundIt = std::find(precisions.begin(), precisions.end(), precisionDetailsAtOutputIntervals.precision);
+            const element::Type resultPrecision = foundIt != precisions.end() ?
+                precisionDetailsAtOutputIntervals.precision :
+                *precisions.begin();
+
+            const DataPrecision dataPrecision(
+                resultPrecision,
+                DataPrecision::getMinValue(resultPrecision, quantizationDetails.levels),
+                DataPrecision::getMaxValue(resultPrecision, quantizationDetails.levels),
+                foundIt != precisions.end() ? precisionDetailsAtOutputIntervals.hasZeroPoint : true);
+
+            return dataPrecision;
         }
     }
-
-    const DataPrecision dataPrecision = precisions.empty() ?
-                                        DataPrecision(element::undefined, 0.f, 0.f, false) :
-                                        DataPrecision(
-                                                *precisions.begin(),
-                                                DataPrecision::getMinValue(*precisions.begin(), quantizationDetails.levels),
-                                                DataPrecision::getMaxValue(*precisions.begin(), quantizationDetails.levels),
-                                                true);
-#ifdef LPT_PRINT_DEQUANTIZATION_INFO
-    printDequantizationInfo(dataPrecision);
-#endif
-    return dataPrecision;
-}
-
-void LayerTransformation::fillAvailablePrecisions(std::shared_ptr<Node> layer, std::vector<element::Type>& availablePrecisions) const {
-    if (availablePrecisions.empty()) {
-        return;
-    }
-
-    const std::vector<std::shared_ptr<Node>> children = NetworkHelper::consumers(layer);
-    for (auto child : children) {
-        if (child->get_type_info().is_castable(opset1::FakeQuantize::get_type_info_static())) {
-            // FakeQuantize layer updates precision
-            continue;
-        }
-
-        if (!layerTransformationsManager->isQuantized(child)) {
-            // low precision chain is interrupted here: next operation supported precisions are ignored
-            continue;
-        }
-
-        const std::vector<element::Type> childPrecisionsOnActivations = paramsManager->getPrecisionsOnActivations(*child);
-        if (childPrecisionsOnActivations.size() == 0ul) {
-            continue;
-        }
-
-        for (size_t index = 0ul; index < availablePrecisions.size();) {
-            const element::Type availablePrecision = availablePrecisions[index];
-            if (!std::any_of(
-                    childPrecisionsOnActivations.begin(),
-                    childPrecisionsOnActivations.end(),
-                    [&](const element::Type precision) { return availablePrecision == precision; })) {
-                availablePrecisions.erase(availablePrecisions.begin() + index);
-            } else {
-                ++index;
-            }
-        }
-
-        if (!layerTransformationsManager->isPrecisionPreserved(child)) {
-            continue;
-        }
-
-        fillAvailablePrecisions(child, availablePrecisions);
-        if (availablePrecisions.empty()) {
-            return;
-        }
-    }
-}
-
-std::vector<std::shared_ptr<Node>> LayerTransformation::getChildrenRecursivelyExceptPrecisionPreserved(
-        const std::shared_ptr<Node>& op) const noexcept {
-    std::queue<std::shared_ptr<Node>> notHandledChildren;
-
-    for (const auto& output : op->outputs()) {
-        for (const auto& input : output.get_target_inputs()) {
-            std::shared_ptr<Node> child = input.get_node()->shared_from_this();
-            notHandledChildren.emplace(child);
-        }
-    }
-
-    std::vector<std::shared_ptr<Node>> resultChildren;
-
-    while (!notHandledChildren.empty()) {
-        const std::shared_ptr<ngraph::Node> operation = notHandledChildren.front();
-        notHandledChildren.pop();
-
-        if (!this->layerTransformationsManager->isPrecisionPreserved(operation)) {
-            resultChildren.push_back(operation);
-            continue;
-        }
-
-        for (const auto& output : operation->outputs()) {
-            for (const auto& input : output.get_target_inputs()) {
-                std::shared_ptr<Node> child = input.get_node()->shared_from_this();
-                notHandledChildren.emplace(child);
-            }
-        }
-    }
-
-    return resultChildren;
+    return DataPrecision(
+        precisionDetailsAtOutputIntervals.precision,
+        0.f,
+        0.f,
+        precisionDetailsAtOutputIntervals.hasZeroPoint);
 }
 
 std::shared_ptr<ngraph::Node> LayerTransformation::moveDequantizationAfter(
@@ -450,15 +334,15 @@ void LayerTransformation::updateOutput(
     TransformationContext &context,
     std::shared_ptr<ngraph::Node> lastNode,
     std::shared_ptr<ngraph::Node> originalNode) const {
-    const size_t outputSize = context.function->get_output_size();
-    for (size_t i = 0; i < outputSize; ++i) {
-        std::shared_ptr<ngraph::Node> result = context.function->get_output_op(i);
-        std::shared_ptr<ngraph::Node> outputNode = result->get_input_node_shared_ptr(0);
-        if (outputNode.get() == lastNode.get()) {
-            const std::string originalName = originalNode->get_friendly_name();
-            originalNode->set_friendly_name(originalName + LayerTransformation::originalLayerPostfix);
-            lastNode->set_friendly_name(originalName);
-            break;
+    // TODO: not tested!!!
+    for (auto output : lastNode->outputs()) {
+        for (auto input : output.get_target_inputs()) {
+            if (is_type<ngraph::opset1::Result>(input.get_node())) {
+                const std::string originalName = originalNode->get_friendly_name();
+                originalNode->set_friendly_name(originalName + LayerTransformation::originalLayerPostfix);
+                lastNode->set_friendly_name(originalName);
+                break;
+            }
         }
     }
 }
@@ -478,7 +362,7 @@ void LayerTransformation::updateOutput(
     }
 }
 
-void LayerTransformation::addPattern(ngraph::pass::GraphRewrite& pass, TransformationContext& context, std::shared_ptr<Node> patternRoot) const {
+void LayerTransformation::addPattern(ngraph::pass::GraphRewrite& pass, TransformationContext& context, std::shared_ptr<Node> patternRoot) {
     ngraph::graph_rewrite_callback internal_callback = [this, &context](ngraph::pattern::Matcher &m) {
         const bool result = transform(context, m);
         (void)result;
diff --git a/inference-engine/src/low_precision_transformations/src/low_precision.cpp b/inference-engine/src/low_precision_transformations/src/low_precision.cpp
new file mode 100644
index 00000000000000..a138b484d7f0d2
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/low_precision.cpp
@@ -0,0 +1,283 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/low_precision.hpp"
+
+#include <memory>
+
+#include <ngraph/ngraph.hpp>
+#include <ngraph/pass/manager.hpp>
+#include <ngraph/pass/constant_folding.hpp>
+#include <ngraph_ops/type_relaxed.hpp>
+#include <ngraph/opsets/opset1.hpp>
+#include <ngraph/opsets/opset4.hpp>
+#include <ngraph/opsets/opset6.hpp>
+#include <transformations/utils/utils.hpp>
+#include <low_precision/markup_per_tensor_quantization.hpp>
+#include <low_precision/lpt_itt.hpp>
+
+#include "low_precision/align_quantization_intervals.hpp"
+#include "low_precision/fake_quantize_decomposition.hpp"
+#include "low_precision/markup_precisions.hpp"
+#include "low_precision/markup_can_be_quantized.hpp"
+#include "low_precision/markup_avg_pool_precision_preserved.hpp"
+#include "low_precision/propagate_precisions.hpp"
+#include "low_precision/align_quantization_parameters.hpp"
+
+#include "transformations/common_optimizations/lin_op_sequence_fusion.hpp"
+#include "low_precision/fold_convert.hpp"
+#include "low_precision/pull_reshape_through_dequantization.hpp"
+#include "low_precision/pull_transpose_through_dequantization.hpp"
+
+// branch specific transformations
+#include "low_precision/concat.hpp"
+
+#include "low_precision/fake_quantize_decomposition.hpp"
+
+// general transformations
+#include "low_precision/add.hpp"
+#include "low_precision/avg_pool.hpp"
+#include "low_precision/clamp.hpp"
+#include "low_precision/convolution.hpp"
+#include "low_precision/convolution_backprop_data.hpp"
+#include "low_precision/depth_to_space.hpp"
+#include "low_precision/fake_quantize.hpp"
+#include "low_precision/group_convolution.hpp"
+#include "low_precision/interpolate.hpp"
+#include "low_precision/mat_mul.hpp"
+#include "low_precision/max_pool.hpp"
+#include "low_precision/multiply.hpp"
+#include "low_precision/mvn.hpp"
+#include "low_precision/normalize_l2.hpp"
+#include "low_precision/prelu.hpp"
+#include "low_precision/reduce_max.hpp"
+#include "low_precision/reduce_mean.hpp"
+#include "low_precision/reduce_min.hpp"
+#include "low_precision/reduce_sum.hpp"
+#include "low_precision/reshape.hpp"
+#include "low_precision/relu.hpp"
+#include "low_precision/squeeze.hpp"
+#include "low_precision/subtract.hpp"
+#include "low_precision/split.hpp"
+#include "low_precision/shuffle_channels.hpp"
+#include "low_precision/strided_slice.hpp"
+#include "low_precision/transpose.hpp"
+#include "low_precision/unsqueeze.hpp"
+#include "low_precision/variadic_split.hpp"
+
+// cleanup transformations
+#include "low_precision/convert.hpp"
+#include "low_precision/fold_fake_quantize.hpp"
+#include "low_precision/fuse_convert.hpp"
+#include "low_precision/fuse_fake_quantize.hpp"
+#include "low_precision/fuse_subtract_to_fake_quantize.hpp"
+#include "low_precision/fuse_multiply_to_fake_quantize.hpp"
+#include "low_precision/multiply_to_group_convolution.hpp"
+#include "low_precision/subtract_multiply_to_multiply_add.hpp"
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::LowPrecision, "LowPrecision", 0);
+
+ngraph::pass::low_precision::LowPrecision::LowPrecision(
+    const std::vector<OperationPrecisionRestriction>& precisionRestrictions,
+    const std::vector<OperationPerTensorQuantizationRestriction>& quantizationRestrictions,
+    const LayerTransformation::Params params) :
+    precisionRestrictions(precisionRestrictions),
+    quantizationRestrictions(quantizationRestrictions),
+    params(params) {
+}
+
+using namespace ngraph::pass::low_precision;
+
+template <typename BaseOp>
+void make_matcher_type_relaxed(ngraph::pass::GraphRewrite* transformation) {
+    using namespace ngraph;
+
+    auto is_op_type = [](std::shared_ptr<Node> n) {
+        return !!as_type_ptr<BaseOp>(n);
+    };
+
+    auto p_node = std::make_shared<pattern::op::Label>(element::f32, Shape{}, is_op_type);
+
+    ngraph::graph_rewrite_callback callback = [](ngraph::pattern::Matcher& m) {
+        auto l_node = std::dynamic_pointer_cast<BaseOp>(m.get_match_root());
+        if (std::dynamic_pointer_cast<ngraph::op::TypeRelaxedBase>(l_node)) {
+            return false;
+        }
+        if (!l_node) {
+            THROW_IE_LPT_EXCEPTION(*l_node) << "unexpected operation type";
+        }
+
+        OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "LowPrecisionTypeRelaxedMatcher");
+
+        std::vector<element::Type> inputPrecisions;
+        for (auto& inputs : l_node->inputs()) {
+            inputPrecisions.push_back(inputs.get_element_type());
+        }
+
+        std::vector<element::Type> outputPrecisions;
+        for (auto& output : l_node->outputs()) {
+            outputPrecisions.push_back(output.get_element_type());
+        }
+
+        auto replacement = std::make_shared<ngraph::op::TypeRelaxed<BaseOp>>(*l_node, inputPrecisions, outputPrecisions);
+
+        copy_runtime_info(l_node, replacement);
+        replace_node(l_node, replacement);
+        return true;
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(p_node, "TypeRelaxedReplacer");
+    NGRAPH_SUPPRESS_DEPRECATED_START
+    transformation->add_matcher(m, callback, ngraph::pass::PassProperty::CHANGE_DYNAMIC_STATE);
+    NGRAPH_SUPPRESS_DEPRECATED_END
+}
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::TypeRelaxedReplacer, "TypeRelaxedReplacer", 0);
+
+ngraph::pass::low_precision::TypeRelaxedReplacer::TypeRelaxedReplacer() {
+    make_matcher_type_relaxed<opset1::Add>(this);
+    make_matcher_type_relaxed<opset1::AvgPool>(this);
+    make_matcher_type_relaxed<opset1::Clamp>(this);
+    make_matcher_type_relaxed<opset1::Convolution>(this);
+    make_matcher_type_relaxed<opset1::ConvolutionBackpropData>(this);
+    make_matcher_type_relaxed<opset1::DepthToSpace>(this);
+    make_matcher_type_relaxed<opset1::FakeQuantize>(this);
+    make_matcher_type_relaxed<opset1::GroupConvolution>(this);
+    make_matcher_type_relaxed<opset1::PRelu>(this);
+    make_matcher_type_relaxed<opset1::ReduceMean>(this);
+    make_matcher_type_relaxed<opset1::ReduceSum>(this);
+    make_matcher_type_relaxed<opset1::Subtract>(this);
+    make_matcher_type_relaxed<opset1::Interpolate>(this);
+    make_matcher_type_relaxed<opset1::Multiply>(this);
+    make_matcher_type_relaxed<op::MVN>(this);
+    make_matcher_type_relaxed<opset6::MVN>(this);
+    make_matcher_type_relaxed<opset1::NormalizeL2>(this);
+    make_matcher_type_relaxed<opset4::Interpolate>(this);
+}
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MarkupOptimizations, "MarkupOptimizations", 0);
+
+MarkupOptimizations::MarkupOptimizations(
+    const std::vector<OperationPrecisionRestriction>& precisionRestrictions,
+    const std::vector<OperationPerTensorQuantizationRestriction>& quantizationRestrictions) :
+    precisionRestrictions(precisionRestrictions),
+    quantizationRestrictions(quantizationRestrictions) {}
+
+bool ngraph::pass::low_precision::MarkupOptimizations::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    ngraph::pass::Manager markup(get_pass_config());
+    markup.set_per_pass_validation(false);
+    markup.register_pass<low_precision::MarkupCanBeQuantized>();
+    if (!precisionRestrictions.empty()) {
+        markup.register_pass<low_precision::MarkupPrecisions>(precisionRestrictions);
+    }
+    if (!quantizationRestrictions.empty()) {
+        markup.register_pass<low_precision::MarkupPerTensorQuantization>(quantizationRestrictions);
+    }
+    if (ngraph::op::util::has_op_with_type<ngraph::opset1::AvgPool>(f)) {
+        markup.register_pass<low_precision::MarkupAvgPoolPrecisionPreserved>();
+    }
+    markup.register_pass<low_precision::PropagatePrecisions>();
+    if (ngraph::op::util::has_op_with_type<ngraph::opset1::Concat>(f)) {
+        markup.register_pass<low_precision::AlignQuantizationIntervals>();
+        markup.register_pass<low_precision::AlignQuantizationParameters>();
+    }
+    markup.run_passes(f);
+    return false;
+}
+
+bool ngraph::pass::low_precision::LowPrecision::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "LowPrecision");
+
+    auto passConfig = get_pass_config();
+    ngraph::pass::Manager manager(passConfig);
+
+    auto prerequisites = manager.register_pass<ngraph::pass::GraphRewrite>();
+    const std::vector<ngraph::element::Type> supportedTypes = {ngraph::element::i8, ngraph::element::u8};
+    prerequisites->add_matcher<PullReshapeThroughDequantization>(supportedTypes);
+    prerequisites->add_matcher<PullTransposeThroughDequantization>(supportedTypes);
+    prerequisites->add_matcher<ngraph::pass::LinOpSequenceFusion>();
+
+    manager.register_pass<TypeRelaxedReplacer>();
+
+    manager.register_pass<ngraph::pass::low_precision::MarkupOptimizations>(precisionRestrictions, quantizationRestrictions);
+
+    std::shared_ptr<ngraph::pass::GraphRewrite> common = manager.register_pass<ngraph::pass::GraphRewrite>();
+    common->add_matcher<ngraph::pass::low_precision::AddTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::AvgPoolTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ClampTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ConcatTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ConvolutionTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ConvolutionBackpropDataTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::DepthToSpaceTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::FakeQuantizeTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::InterpolateTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::GroupConvolutionTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::MatMulTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::MaxPoolTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::MultiplyTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::MVNTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::NormalizeL2Transformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::PReluTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ReduceMaxTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ReduceMeanTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ReduceMinTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ReduceSumTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ReluTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ReshapeTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::SqueezeTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::ShuffleChannelsTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::SplitTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::StridedSliceTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::TransposeTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::UnsqueezeTransformation>(params);
+    common->add_matcher<ngraph::pass::low_precision::VariadicSplitTransformation>(params);
+
+    std::shared_ptr<ngraph::pass::GraphRewrite> cleanup = manager.register_pass<ngraph::pass::GraphRewrite>();
+    cleanup->add_matcher<ngraph::pass::low_precision::FoldConvertTransformation>(params);
+    cleanup->add_matcher<ngraph::pass::low_precision::FuseConvertTransformation>(params);
+    cleanup->add_matcher<ngraph::pass::low_precision::FuseSubtractToFakeQuantizeTransformation>(params);
+    cleanup->add_matcher<ngraph::pass::low_precision::FuseMultiplyToFakeQuantizeTransformation>(params);
+    // WA: precision restrictions for groupConv must be propagated to MultiplyToGroupConvolution transformation
+    cleanup->add_matcher<ngraph::pass::low_precision::MultiplyToGroupConvolutionTransformation>(
+        params,
+        OperationPrecisionRestriction::getPrecisionsByOperationType<opset1::GroupConvolution>(precisionRestrictions));
+    manager.register_pass<ngraph::pass::low_precision::SubtractMultiplyToMultiplyAddTransformation>(params);
+    manager.register_pass<ngraph::pass::low_precision::FoldFakeQuantizeTransformation>(params);
+    manager.register_pass<ngraph::pass::ConstantFolding>();
+
+    manager.run_passes(f);
+    return false;
+}
+
+bool ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(const std::shared_ptr<const ngraph::Function>& function) {
+    std::set<std::shared_ptr<ngraph::Node>> handledNodes;
+    std::deque<std::shared_ptr<ngraph::Node>> nodes;
+    for (auto result : function->get_results()) {
+        nodes.push_front(result);
+    }
+
+    while (!nodes.empty()) {
+        auto node = nodes.front();
+        nodes.pop_front();
+
+        for (size_t i = 0; i < node->inputs().size(); ++i) {
+            auto parent = node->get_input_node_shared_ptr(i);
+            if (handledNodes.find(parent) != handledNodes.end()) {
+                continue;
+            }
+
+            const std::shared_ptr<ngraph::opset1::FakeQuantize> fakeQuantize = as_type_ptr<ngraph::opset1::FakeQuantize>(parent);
+            if ((fakeQuantize != nullptr) &&
+                QuantizationDetails::outputLayoutIsSupported(fakeQuantize) &&
+                QuantizationDetails::isSupportedLevel(fakeQuantize->get_levels())) {
+                return true;
+            }
+
+            nodes.push_front(parent);
+            handledNodes.insert(parent);
+        }
+    }
+    return false;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/markup_avg_pool_precision_preserved.cpp b/inference-engine/src/low_precision_transformations/src/markup_avg_pool_precision_preserved.cpp
new file mode 100644
index 00000000000000..2dc256920c74b8
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/markup_avg_pool_precision_preserved.cpp
@@ -0,0 +1,26 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/markup_avg_pool_precision_preserved.hpp"
+#include <memory>
+#include <ngraph/opsets/opset1.hpp>
+#include "low_precision/create_precisions_dependent_attribute.hpp"
+#include "low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp"
+#include "low_precision/propagate_through_precision_preserved.hpp"
+#include "low_precision/update_shared_precision_preserved.hpp"
+
+using namespace ngraph;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MarkupAvgPoolPrecisionPreserved, "MarkupAvgPoolPrecisionPreserved", 0);
+
+bool ngraph::pass::low_precision::MarkupAvgPoolPrecisionPreserved::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    ngraph::pass::Manager manager;
+    manager.set_per_pass_validation(false);
+    std::shared_ptr<ngraph::pass::GraphRewrite> markupAvgPoolPrecision = manager.register_pass<ngraph::pass::GraphRewrite>();
+    markupAvgPoolPrecision->add_matcher<low_precision::CreatePrecisionsDependentAttribute<AvgPoolPrecisionPreservedAttribute, opset1::AvgPool>>();
+    markupAvgPoolPrecision->add_matcher<low_precision::PropagateThroughPrecisionPreserved<AvgPoolPrecisionPreservedAttribute>>();
+    markupAvgPoolPrecision->add_matcher<low_precision::UpdateSharedPrecisionPreserved<AvgPoolPrecisionPreservedAttributePtr>>();
+    manager.run_passes(f);
+    return false;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/markup_can_be_quantized.cpp b/inference-engine/src/low_precision_transformations/src/markup_can_be_quantized.cpp
new file mode 100644
index 00000000000000..3117efc2debd14
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/markup_can_be_quantized.cpp
@@ -0,0 +1,59 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/markup_can_be_quantized.hpp"
+
+#include <memory>
+
+#include <ngraph/opsets/opset1.hpp>
+#include "low_precision/convolution.hpp"
+#include "low_precision/convolution_backprop_data.hpp"
+#include "low_precision/group_convolution.hpp"
+#include "low_precision/network_helper.hpp"
+#include "low_precision/rt_info/precisions_attribute.hpp"
+
+using namespace ngraph;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MarkupCanBeQuantized, "MarkupCanBeQuantized", 0);
+
+bool ngraph::pass::low_precision::MarkupCanBeQuantized::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    auto setEmptyPrecisions = [](const std::shared_ptr<ngraph::Node>& node) {
+        for (auto& input : node->inputs()) {
+            auto& rt = input.get_rt_info();
+
+            auto attribute = ngraph::pass::low_precision::make_shared_attribute<PrecisionsAttribute>(std::vector<element::Type>());
+            auto attributeWrapper = std::make_shared<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(attribute);
+
+            rt.emplace(
+                    ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name,
+                    attributeWrapper);
+        }
+    };
+
+    for (const std::shared_ptr<Node>& node : f->get_ordered_ops()) {
+        if (node->get_input_size() == 0 || transformation_callback(node)) {
+            continue;
+        }
+
+        if (const auto convolution = std::dynamic_pointer_cast<ngraph::opset1::Convolution>(node)) {
+            if (!ConvolutionTransformation::isQuantizedStatic(convolution)) {
+                setEmptyPrecisions(convolution);
+            }
+            continue;
+        }
+        if (const auto convolutionBackpropData = std::dynamic_pointer_cast<ngraph::opset1::ConvolutionBackpropData>(node)) {
+            if (!ConvolutionBackpropDataTransformation::isQuantizedStatic(convolutionBackpropData)) {
+                setEmptyPrecisions(convolutionBackpropData);
+            }
+            continue;
+        }
+        if (const auto groupConvolution = std::dynamic_pointer_cast<ngraph::opset1::GroupConvolution>(node)) {
+            if (!GroupConvolutionTransformation::isQuantizedStatic(groupConvolution)) {
+                setEmptyPrecisions(groupConvolution);
+            }
+            continue;
+        }
+    }
+    return true;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/markup_per_tensor_quantization.cpp b/inference-engine/src/low_precision_transformations/src/markup_per_tensor_quantization.cpp
new file mode 100644
index 00000000000000..4cd37c94658a53
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/markup_per_tensor_quantization.cpp
@@ -0,0 +1,85 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/markup_per_tensor_quantization.hpp"
+
+#include <cassert>
+#include <memory>
+#include <vector>
+#include <ngraph/node.hpp>
+#include "low_precision/rt_info/per_tensor_quantization_attribute.hpp"
+
+using namespace ngraph;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MarkupPerTensorQuantization, "MarkupPerTensorQuantization", 0);
+
+ngraph::pass::low_precision::MarkupPerTensorQuantization::MarkupPerTensorQuantization(
+    const std::vector<OperationPerTensorQuantizationRestriction>& restrictions) {
+    for (const OperationPerTensorQuantizationRestriction& restriction : restrictions) {
+        const auto it = restrictionsByOperation.find(restriction.operationType.name);
+        if (it == restrictionsByOperation.end()) {
+            PerTensorQuantization r(restriction.specifyVersion);
+            r.portsByVersion.emplace(restriction.operationType.version, restriction.restrictedPorts);
+            restrictionsByOperation.emplace(restriction.operationType.name, r);
+        } else {
+            it->second.add(restriction.operationType.version, restriction.restrictedPorts);
+        }
+    }
+}
+
+bool ngraph::pass::low_precision::MarkupPerTensorQuantization::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    auto setRestriction = [](const std::shared_ptr<Node>& node, const std::vector<size_t>& restrictedPorts) {
+        auto createAttribute = [](Input<Node>& input){
+            auto &rt = input.get_rt_info();
+            rt.emplace(
+                    ngraph::VariantWrapper<PerTensorQuantizationAttribute>::type_info.name,
+                    std::make_shared<::ngraph::VariantWrapper<PerTensorQuantizationAttribute>>(PerTensorQuantizationAttribute()));
+        };
+
+        if (restrictedPorts.empty()) {
+            // markup all ports
+            for (size_t item = 0ul; item < node->get_input_size(); item++) {
+                Input<Node> input = node->input(item);
+                createAttribute(input);
+            }
+        } else {
+            // markup specific ports
+            for (const size_t item : restrictedPorts) {
+                Input<Node> input = node->input(item);
+                createAttribute(input);
+            }
+        }
+    };
+
+    for (const std::shared_ptr<Node>& node : f->get_ordered_ops()) {
+        if (node->get_input_size() == 0) {
+            continue;
+        }
+
+        const auto typeIt = restrictionsByOperation.find(node->get_type_info().name);
+        if (typeIt == restrictionsByOperation.end()) {
+            continue;
+        }
+
+        const auto& restriction = typeIt->second;
+        if (restriction.portsByVersion.empty()) {
+            continue;
+        }
+
+        if (restriction.versionIsRequired) {
+            const auto it2 = restriction.portsByVersion.find(node->get_type_info().version);
+            if (it2 == restriction.portsByVersion.end()) {
+                continue;
+            }
+
+            const std::vector<size_t>& restrictedPorts = it2->second;
+            setRestriction(node, restrictedPorts);
+        } else {
+            assert(restriction.portsByVersion.size() == 1ul);
+            const std::vector<size_t>& restrictedPorts = restriction.portsByVersion.begin()->second;
+            setRestriction(node, restrictedPorts);
+        }
+    }
+    return true;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/markup_precisions.cpp b/inference-engine/src/low_precision_transformations/src/markup_precisions.cpp
new file mode 100644
index 00000000000000..17747179345c1f
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/markup_precisions.cpp
@@ -0,0 +1,217 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/markup_precisions.hpp"
+
+#include <memory>
+#include <unordered_set>
+#include <set>
+#include <vector>
+
+#include <ngraph/opsets/opset1.hpp>
+#include <ngraph/opsets/opset6.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
+#include "low_precision/network_helper.hpp"
+#include "low_precision/rt_info/precisions_attribute.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+
+using namespace ngraph;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MarkupPrecisions, "MarkupPrecisions", 0);
+
+ngraph::pass::low_precision::MarkupPrecisions::MarkupPrecisions(const std::vector<OperationPrecisionRestriction>& restrictions) {
+    for (const auto& restriction : restrictions) {
+        const auto it = restrictionsByOperation.find(restriction.operationType.name);
+        if (it == restrictionsByOperation.end()) {
+            Restriction r(restriction.specifyVersion);
+            r.precisionsByVersion.emplace(restriction.operationType.version, restriction.precisionsByPort);
+            restrictionsByOperation.emplace(restriction.operationType.name, r);
+        } else {
+            it->second.add(restriction.operationType.version, restriction.precisionsByPort);
+        }
+    }
+}
+
+namespace {
+void setRestriction(
+    const std::shared_ptr<Node>& node,
+    const std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>>& precisionsByPort) {
+    if (precisionsByPort.empty()) {
+        // if available precisions for any port is empty then mark all input ports
+        for (auto& input : node->inputs()) {
+            auto& rt = input.get_rt_info();
+
+            auto attribute = ngraph::pass::low_precision::make_shared_attribute<PrecisionsAttribute>(std::vector<element::Type>());
+            auto attributeWrapper = std::make_shared<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(attribute);
+
+            rt.emplace(
+                ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name,
+                attributeWrapper);
+        }
+    } else {
+        for (const std::pair<size_t, std::vector<ngraph::element::Type>>& item : precisionsByPort) {
+            Input<Node> input = node->input(item.first);
+
+            auto precisionsAttribute = ngraph::pass::low_precision::getAttribute<std::shared_ptr<PrecisionsAttribute>>(input);
+            if ((precisionsAttribute != nullptr) &&
+                (precisionsAttribute->get()->sharedValue != nullptr) &&
+                (precisionsAttribute->get()->sharedValue->precisions.empty())) {
+                return;
+            }
+
+            auto attribute = ngraph::pass::low_precision::make_shared_attribute<PrecisionsAttribute>(item.second);
+            auto attributeWrapper = std::make_shared<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(attribute);
+
+            auto& rt = input.get_rt_info();
+            rt[ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name] = attributeWrapper;
+        }
+    }
+}
+} // namespace
+
+bool ngraph::pass::low_precision::MarkupPrecisions::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    for (const std::shared_ptr<Node>& node : f->get_ordered_ops()) {
+        if (node->get_input_size() == 0) {
+            continue;
+        }
+
+        if (transformation_callback(node)) {
+            continue;
+        }
+
+        // TODO: don't need to set restrictions for not supported operations
+        // if don't set restrictions for not supported operations then accuracy drop appears, issue #59197
+        const bool supported = is_type<opset1::Result>(node) || isSupported(node);
+        if (!supported || !LayerTransformation::canBeTransformedStatic(node)) {
+            setRestriction(node, std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>> { {0ul, {}}});
+            continue;
+        }
+
+        const bool precisionPreserved = isPrecisionPreserved(node);
+        if (precisionPreserved) {
+            auto& rt = node->get_rt_info();
+            rt.emplace(
+                ngraph::VariantWrapper<PrecisionPreservedAttributePtr>::type_info.name,
+                std::make_shared<::ngraph::VariantWrapper<PrecisionPreservedAttributePtr>>(
+                    make_shared_attribute<PrecisionPreservedAttribute>(precisionPreserved)));
+        }
+
+        const auto& typeInfo = node->get_type_info();
+        auto it = restrictionsByOperation.find(typeInfo.name);
+        if (it != restrictionsByOperation.end()) {
+            const Restriction& r = it->second;
+            if (r.versionIsRequired) {
+                const auto it2 = r.precisionsByVersion.find(typeInfo.version);
+                if (it2 == r.precisionsByVersion.end()) {
+                    continue;
+                }
+
+                const std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>>& precisionsByPort = it2->second;
+                setRestriction(node, precisionsByPort);
+            } else {
+                assert(r.precisionsByVersion.size() == 1ul);
+
+                const std::vector<std::pair<size_t, std::vector<ngraph::element::Type>>>& precisionsByPort = r.precisionsByVersion.begin()->second;
+                setRestriction(node, precisionsByPort);
+            }
+        }
+    }
+    return true;
+}
+
+template <class Operation>
+std::string name() {
+    return Operation::get_type_info_static().name;
+}
+
+bool ngraph::pass::low_precision::MarkupPrecisions::isPrecisionPreserved(const std::shared_ptr<Node>& node) {
+    if (isDisabled(node)) {
+        return false;
+    }
+
+    // TODO: think how to handle conditions <= not mandatory for PoC
+    // TODO: operation set version is not affected <= not mandatory for PoC
+    static std::unordered_set<std::string> precisionPreservedOps = {
+        { name<opset1::Concat>() },
+        { name<opset1::DepthToSpace>() },
+        { name<opset1::MaxPool>() },
+        { name<opset1::ReduceMax>() },
+        { name<opset1::ReduceMin>() },
+        { name<opset1::Relu>() },
+        // TODO: there are conditions
+        { name<opset1::Reshape>() },
+        { name<opset1::Squeeze>() },
+        { name<opset1::Split>() },
+        { name<opset1::StridedSlice>() },
+        { name<opset1::ShuffleChannels>() },
+        { name<opset1::Transpose>() },
+        { name<opset1::Unsqueeze>() },
+        { name<opset1::VariadicSplit>() }
+    };
+
+    const bool precisionPreserved = precisionPreservedOps.find(node->get_type_name()) != precisionPreservedOps.end();
+    if (precisionPreserved) {
+        return precisionPreserved;
+    }
+
+    if (is_type<opset1::Interpolate>(node)) {
+        std::shared_ptr<opset1::Interpolate> interpolate1 = as_type_ptr<opset1::Interpolate>(node);
+        if (interpolate1) {
+            const auto attrs = interpolate1->get_attrs();
+            return attrs.mode == "nearest";
+        }
+
+        std::shared_ptr<opset4::Interpolate> interpolate4 = as_type_ptr<opset4::Interpolate>(node);
+        if (interpolate4) {
+            const auto attrs = interpolate4->get_attrs();
+            return attrs.mode == op::v4::Interpolate::InterpolateMode::nearest;
+        }
+    }
+
+    return false;
+}
+
+bool ngraph::pass::low_precision::MarkupPrecisions::isSupported(const std::shared_ptr<Node>& node) {
+    static std::unordered_set<std::string> supportedOps = {
+        { name<opset1::Add>() },
+        { name<opset1::AvgPool>() },
+        { name<opset1::Clamp>() },
+        { name<opset1::Concat>() },
+        // ?
+        { name<opset1::Convert>() },
+        { name<opset1::Convolution>() },
+        { name<opset1::ConvolutionBackpropData>() },
+        { name<opset1::DepthToSpace>() },
+        { name<opset1::FakeQuantize>() },
+        { name<opset1::Interpolate>() },
+        { name<opset4::Interpolate>() },
+        { name<opset1::GroupConvolution>() },
+        { name<opset1::MatMul>() },
+        { name<opset1::MaxPool>() },
+        { name<opset1::Multiply>() },
+        { name<ngraph::op::MVN>() },
+        { name<opset6::MVN>() },
+        { name<opset1::NormalizeL2>() },
+        { name<opset1::PRelu>() },
+        { name<opset1::ReduceMax>() },
+        { name<opset1::ReduceMean>() },
+        { name<opset1::ReduceMin>() },
+        { name<opset1::ReduceSum>() },
+        { name<opset1::Relu>() },
+        // TODO: there are conditions
+        { name<opset1::Reshape>() },
+        { name<opset1::Squeeze>() },
+        { name<opset1::ShuffleChannels>() },
+        { name<opset1::Split>() },
+        { name<opset1::StridedSlice>() },
+        // ?
+        { name<opset1::Subtract>() },
+        { name<opset1::Transpose>() },
+        { name<opset1::Unsqueeze>() },
+        { name<opset1::VariadicSplit>() }
+    };
+
+    return supportedOps.find(node->get_type_name()) != supportedOps.end();
+}
diff --git a/inference-engine/src/low_precision_transformations/src/mat_mul.cpp b/inference-engine/src/low_precision_transformations/src/mat_mul.cpp
index 1d9745da53f9dc..693d0e6490e2e9 100644
--- a/inference-engine/src/low_precision_transformations/src/mat_mul.cpp
+++ b/inference-engine/src/low_precision_transformations/src/mat_mul.cpp
@@ -9,6 +9,9 @@
 #include <string>
 #include <vector>
 
+#include <ngraph/pattern/op/or.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 
@@ -16,20 +19,33 @@ using namespace ngraph;
 using namespace ngraph::pass;
 using namespace ngraph::pass::low_precision;
 
-bool MatMulTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MatMulTransformation, "MatMulTransformation", 0);
+
+MatMulTransformation::MatMulTransformation(const Params& params) : LayerTransformation(params) {
+    auto mul1 = pattern::wrap_type<opset1::Multiply>();
+    auto mul2 = pattern::wrap_type<opset1::Multiply>();
+    auto fq2 = pattern::wrap_type<opset1::FakeQuantize>();
+    auto matcher = pattern::wrap_type<opset1::MatMul>({ mul1, std::make_shared<pattern::op::Or>(OutputVector{ mul2, fq2 })});
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "MatMulTransformation");
+    this->register_matcher(m, callback);
+}
+
+bool MatMulTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::MatMul> matMul = as_type_ptr<opset1::MatMul>(m.get_match_root());
     if ((matMul == nullptr) || !canBeTransformed(context, matMul)) {
         return false;
     }
 
     matMul = as_type_ptr<opset1::MatMul>(NetworkHelper::separateInStandaloneBranch(matMul));
-    if (!support3DTensorOnActivations) {
-        const auto inputRank = matMul->get_input_partial_shape(0).rank();
-        if (inputRank.is_dynamic() || inputRank.get_length() == 3) {
-            return false;
-        }
-    }
-
     const auto dequantization1 = NetworkHelper::getDequantization(matMul, 0);
     auto dequantization2 = NetworkHelper::getDequantization(matMul, 1);
 
@@ -38,7 +54,12 @@ bool MatMulTransformation::transform(TransformationContext &context, ngraph::pat
             as_type_ptr<opset1::FakeQuantize>(dequantization2.data.get_node_shared_ptr());
         if (fakeQuantize != nullptr) {
             const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(fakeQuantize);
-            const DataPrecision dataPrecision = getDataPrecision(fakeQuantize, quantizationDetails, true);
+
+            const auto precisionsAttribute = getAttributeFromOutput<PrecisionsAttributePtr>(fakeQuantize);
+            const auto precisions = precisionsAttribute == nullptr ?
+                PrecisionsAttribute::defaultPrecisions :
+                precisionsAttribute->get()->sharedValue->precisions;
+            const DataPrecision dataPrecision = getDataPrecision(fakeQuantize, quantizationDetails, precisions);
 
             auto tuple = NetworkHelper::decomposeFakeQuantize(
                 fakeQuantize,
@@ -147,27 +168,20 @@ bool MatMulTransformation::transform(TransformationContext &context, ngraph::pat
     replace_node(matMul, newMultiply);
     copy_runtime_info({ newMultiply, matMul }, newMultiply);
 
-    updateOutput(context, newMultiply, matMul);
+    updateOutput(context, newMultiply, newMatMul);
 
     return true;
 }
 
-void MatMulTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::MatMul>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Multiply>() }));
-
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::MatMul>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::FakeQuantize>() }));
-}
-
 bool MatMulTransformation::isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept {
     return false;
 }
 
+bool MatMulTransformation::is3DTensorOnActivations(const std::shared_ptr<const Node>& node) {
+    const auto inputDataRank = node->get_input_partial_shape(0).rank();
+    return inputDataRank.is_dynamic() || inputDataRank.get_length() == 3;
+}
+
 bool MatMulTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> layer) const {
     if (!LayerTransformation::canBeTransformedSpatialDimension(context, layer)) {
         return false;
@@ -204,6 +218,8 @@ bool MatMulTransformation::canBeTransformed(const TransformationContext& context
         if (!NetworkHelper::checkZeroPoint(dequantization1.subtract)) {
             return false;
         }
+    } else {
+        return false;
     }
 
     const auto dequantization2 = NetworkHelper::getDequantization(layer, 1);
@@ -240,7 +256,13 @@ bool MatMulTransformation::canBeTransformed(const TransformationContext& context
         }
 
         const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(fakeQuantize);
-        const DataPrecision dataPrecision = getDataPrecision(fakeQuantize, quantizationDetails, true);
+
+        const auto precisionsAttribute = getAttribute<PrecisionsAttributePtr>(matMul->input(1));
+        const auto precisions = precisionsAttribute == nullptr ?
+            PrecisionsAttribute::defaultPrecisions :
+            precisionsAttribute->get()->sharedValue->precisions;
+
+        const DataPrecision dataPrecision = getDataPrecision(fakeQuantize, quantizationDetails, precisions);
         if (dataPrecision.hasZeroPoint) {
             return false;
         }
@@ -259,6 +281,10 @@ bool MatMulTransformation::canBeTransformed(const TransformationContext& context
         }
     }
 
+    if (!fakeQuantize && dequantization2.empty()) {
+        return false;
+    }
+
     if ((!NetworkHelper::isConstantPath(layer->get_input_node_shared_ptr(1))) && (dequantization1.subtract)) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/max_pool.cpp b/inference-engine/src/low_precision_transformations/src/max_pool.cpp
index 4f867cc4bdda49..68a73cac59e522 100644
--- a/inference-engine/src/low_precision_transformations/src/max_pool.cpp
+++ b/inference-engine/src/low_precision_transformations/src/max_pool.cpp
@@ -8,20 +8,29 @@
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MaxPoolTransformation, "MaxPoolTransformation", 0);
+
 MaxPoolTransformation::MaxPoolTransformation(const Params& params) : LayerTransformation(params) {
-}
+    auto matcher = pattern::wrap_type<opset1::MaxPool>({ pattern::wrap_type<opset1::Multiply>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void MaxPoolTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::MaxPool>({ make_op_label<opset1::Multiply>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "MaxPoolTransformation");
+    this->register_matcher(m, callback);
 }
 
 bool MaxPoolTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> op) const {
@@ -42,7 +51,7 @@ bool MaxPoolTransformation::canBeTransformed(const TransformationContext& contex
     return true;
 }
 
-bool MaxPoolTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool MaxPoolTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/multiply.cpp b/inference-engine/src/low_precision_transformations/src/multiply.cpp
index bf354bfc5f0613..d95fe2812c3f1e 100644
--- a/inference-engine/src/low_precision_transformations/src/multiply.cpp
+++ b/inference-engine/src/low_precision_transformations/src/multiply.cpp
@@ -12,6 +12,8 @@
 #include <vector>
 #include <cassert>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 #include "low_precision/network_helper.hpp"
@@ -20,11 +22,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void MultiplyTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Multiply>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MultiplyTransformation, "MultiplyTransformation", 0);
+
+MultiplyTransformation::MultiplyTransformation(const Params& params) : EltwiseBaseTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Multiply>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "MultiplyTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool MultiplyTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool MultiplyTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     auto multiply = m.get_match_root();
     if (!LayerTransformation::canBeTransformed(context, multiply)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp b/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp
index 9d477ed11c4b05..7f06ea3a32e878 100644
--- a/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp
+++ b/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp
@@ -5,17 +5,33 @@
 #include "low_precision/multiply_to_group_convolution.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void MultiplyToGroupConvolutionTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Multiply>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MultiplyToGroupConvolutionTransformation, "MultiplyToGroupConvolutionTransformation", 0);
+
+MultiplyToGroupConvolutionTransformation::MultiplyToGroupConvolutionTransformation(
+    const Params& params,
+    const OperationPrecisionRestriction::PrecisionsByPort& restrictions) : LayerTransformation(params), restrictions(restrictions), groupSize(1ul) {
+    auto matcher = pattern::wrap_type<opset1::Multiply>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "MultiplyToGroupConvolutionTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool MultiplyToGroupConvolutionTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool MultiplyToGroupConvolutionTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     const auto multiply = m.get_match_root();
     if (!canBeTransformed(context, multiply)) {
         return false;
@@ -35,7 +51,27 @@ bool MultiplyToGroupConvolutionTransformation::transform(TransformationContext&
         dequantization = NetworkHelper::foldDequantization(multiply, inputIndex);
     }
 
-    const element::Type weightsPrecision = updatePrecisions ? precisionsOnWeights[0] : dequantization.data.get_element_type();
+    element::Type weightsPrecision = element::undefined;
+    if (updatePrecisions) {
+        // try to find restrictions on weights for GroupConvolution
+        if (restrictions.size() > 1ul) {
+            const auto& availablePreisions = restrictions[1].second;
+            if (!availablePreisions.empty()) {
+                weightsPrecision = availablePreisions[0];
+            }
+        }
+
+        // if restrictions are absent precisions attribute is used
+        if (weightsPrecision == element::undefined) {
+            const auto precisionsAttribute = getAttribute<PrecisionsAttributePtr>(multiply->input(inputIndex == 0ul ? 1ul : 0ul));
+            const auto precisions = precisionsAttribute == nullptr ?
+                PrecisionsAttribute::defaultPrecisions :
+                precisionsAttribute->get()->sharedValue->precisions;
+            weightsPrecision = precisions[0];
+        }
+    } else {
+        weightsPrecision = dequantization.data.get_element_type();
+    }
 
     const size_t inputChannelsCount = input->get_output_partial_shape(0)[1].get_length();
     const size_t outputChannelsCount = multiply->get_output_partial_shape(0)[1].get_length();
@@ -152,9 +188,11 @@ bool MultiplyToGroupConvolutionTransformation::canBeTransformed(const Transforma
         }
     }
 
-    if (updatePrecisions) {
+    if (updatePrecisions && restrictions.size() > 0) {
         const element::Type parentPrecision = dequantization.data.get_element_type();
-        if (std::find(precisionsOnActivations.begin(), precisionsOnActivations.end(), parentPrecision) == precisionsOnActivations.end()) {
+
+        const auto& availablePreisions = restrictions[0].second;
+        if (std::find(availablePreisions.begin(), availablePreisions.end(), parentPrecision) == availablePreisions.end()) {
             return false;
         }
     }
@@ -162,7 +200,11 @@ bool MultiplyToGroupConvolutionTransformation::canBeTransformed(const Transforma
     return true;
 }
 
-bool MultiplyToGroupConvolutionTransformation::isQuantized(std::shared_ptr<Node> layer) const noexcept {
+bool MultiplyToGroupConvolutionTransformation::isQuantized(const std::shared_ptr<const Node>& layer) const noexcept {
+    return MultiplyToGroupConvolutionTransformation::canBeTransformedToGroupConvolution(layer);
+}
+
+bool MultiplyToGroupConvolutionTransformation::canBeTransformedToGroupConvolution(const std::shared_ptr<const Node>& layer) noexcept {
     const auto parent0 = layer->get_input_node_shared_ptr(0);
     const auto parent1 = layer->get_input_node_shared_ptr(1);
 
diff --git a/inference-engine/src/low_precision_transformations/src/mvn.cpp b/inference-engine/src/low_precision_transformations/src/mvn.cpp
index dc6df6d5b0fa4e..7883235e42de44 100644
--- a/inference-engine/src/low_precision_transformations/src/mvn.cpp
+++ b/inference-engine/src/low_precision_transformations/src/mvn.cpp
@@ -10,6 +10,9 @@
 #include <cmath>
 #include <vector>
 
+#include <ngraph/pattern/op/or.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "ngraph/type/element_type.hpp"
 #include "ngraph/type/element_type_traits.hpp"
 #include "low_precision/network_helper.hpp"
@@ -21,6 +24,8 @@ using namespace ngraph;
 using namespace ngraph::pass;
 using namespace ngraph::pass::low_precision;
 
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::MVNTransformation, "MVNTransformation", 0);
+
 namespace mvn {
 
 template<typename T>
@@ -38,6 +43,24 @@ std::shared_ptr<ngraph::op::Constant> createNewScalesConst(const ngraph::op::Con
 
 } // namespace mvn
 
+MVNTransformation::MVNTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = std::make_shared<pattern::op::Or>(OutputVector{
+        pattern::wrap_type<ngraph::op::MVN>({ pattern::wrap_type<ngraph::opset1::Multiply>() }),
+        pattern::wrap_type<ngraph::opset6::MVN>({ pattern::wrap_type<ngraph::opset1::Multiply>(), pattern::wrap_type<ngraph::opset1::Constant>() })
+    });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "MVNTransformation");
+    this->register_matcher(m, callback);
+}
+
 bool MVNTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> operation) const {
     if (!LayerTransformation::canBeTransformed(context, operation)) {
         return false;
@@ -86,19 +109,7 @@ bool MVNTransformation::canBeTransformed(const TransformationContext& context, s
     return perTensor && isScalarScales;
 }
 
-void MVNTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<ngraph::op::MVN>({ make_op_label<ngraph::opset1::Multiply>() }));
-    addPattern(
-            pass,
-            context,
-            make_op_pattern<ngraph::opset6::MVN>({ make_op_label<ngraph::opset1::Multiply>(),
-                                                   make_op_label<ngraph::opset1::Constant>() }));
-}
-
-bool MVNTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool MVNTransformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> operation = m.get_match_root();
     if (!canBeTransformed(context, operation)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/network_helper.cpp b/inference-engine/src/low_precision_transformations/src/network_helper.cpp
index 6b26398878ca4f..3f49e8b327cc04 100644
--- a/inference-engine/src/low_precision_transformations/src/network_helper.cpp
+++ b/inference-engine/src/low_precision_transformations/src/network_helper.cpp
@@ -20,6 +20,9 @@
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 #include "low_precision/layer_transformation.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
 
 namespace ngraph {
 namespace pass {
@@ -286,26 +289,65 @@ std::shared_ptr<Node> NetworkHelper::swapMultiplyAndAdd(std::shared_ptr<opset1::
             std::vector<element::Type>{ multiply->get_output_element_type(0) },
             ngraph::op::TemporaryReplaceOutputType(newAdd, element::f32).get(),
             ngraph::op::TemporaryReplaceOutputType(a, element::f32).get());
-    copyInfo(multiply, newMultiply);
+    copyInfo({ multiply, newMultiply }, newMultiply);
 
     replace_node(addAfterMultiply, newMultiply);
     return newMultiply;
 }
 
-void NetworkHelper::copyInfo(const std::shared_ptr<Node>& source, const std::shared_ptr<Node>& target) {
-    // TODO: merge_runtime_info with correctly defined DEQUANTIZATION
-    const auto& sourceAttributes = source->get_rt_info();
-    auto& targetAttrubutes = target->get_rt_info();
-    for (auto attribute : sourceAttributes) {
-        targetAttrubutes[attribute.first] = attribute.second;
-    }
+void NetworkHelper::copyInfo(
+    const std::vector<std::shared_ptr<Node>>& sources,
+    const std::vector<std::shared_ptr<Node>>& targets) {
+    ngraph::copy_runtime_info(sources, targets);
+
+    for (const auto& target : targets) {
+        const std::string friendlyName = sources[0]->get_friendly_name();
+        if (!friendlyName.empty()) {
+            target->set_friendly_name(friendlyName);
+        }
+
+        {
+            // TODO: has to be implemented in ngraph::copy_runtime_info
+
+            for (auto& source : sources) {
+                if (target->get_type_info() != source->get_type_info()) {
+                    continue;
+                }
 
-    const std::string friendlyName = source->get_friendly_name();
-    if (!friendlyName.empty()) {
-        target->set_friendly_name(friendlyName);
+                assert(source->get_input_size() == target->get_input_size());
+                for (size_t i = 0; i < target->get_input_size(); ++i) {
+                    auto sourceInput = source->input(i);
+                    const auto& sourceRt = sourceInput.get_rt_info();
+                    auto targetInput = target->input(i);
+                    auto& targetRt = targetInput.get_rt_info();
+                    for (const auto& it : sourceRt) {
+                        targetRt[it.first] = it.second;
+                    }
+                }
+
+                assert(source->get_output_size() == target->get_output_size());
+                for (size_t i = 0; i < target->get_output_size(); ++i) {
+                    auto sourceOutput = source->output(i);
+                    const auto& sourceRt = sourceOutput.get_rt_info();
+                    auto targetOutput = target->output(i);
+                    auto& targetRt = targetOutput.get_rt_info();
+                    for (const auto& it : sourceRt) {
+                        targetRt[it.first] = it.second;
+                    }
+                }
+            }
+        }
     }
 }
 
+void NetworkHelper::copyInfo(const std::vector<std::shared_ptr<Node>>& sources, const std::shared_ptr<Node>& target) {
+    copyInfo(sources, std::vector<std::shared_ptr<Node>>{ target });
+}
+
+void NetworkHelper::copyInfo(const std::shared_ptr<Node>& source, const std::shared_ptr<Node>& target) {
+    copyInfo(std::vector<std::shared_ptr<Node>>{ source }, std::vector<std::shared_ptr<Node>>{ target });
+}
+
 void NetworkHelper::cleanRunTimeInfo(const std::shared_ptr<Node>& layer) {
     auto& rt_info = layer->get_rt_info();
     auto attributeIter = rt_info.find("DEQUANTIZATION");
@@ -315,7 +357,21 @@ void NetworkHelper::cleanRunTimeInfo(const std::shared_ptr<Node>& layer) {
 }
 
 bool NetworkHelper::isScalarLike(std::shared_ptr<opset1::Constant> constant) {
-    return constant->get_all_data_elements_bitwise_identical();
+    // ticket #48857
+    // return constant->get_all_data_elements_bitwise_identical();
+
+    const auto shape = constant->output(0).get_shape();
+    if (shape_size(shape) == 1ul) {
+        return true;
+    }
+
+
+    const auto values = constant->cast_vector<float>();
+    if (values.empty()) {
+        return true;
+    }
+
+    return !std::any_of(values.begin(), values.end(), [&](float value) { return values[0] != value; });
 }
 
 bool NetworkHelper::isZero(std::shared_ptr<opset1::Constant> constant) {
@@ -524,8 +580,10 @@ std::shared_ptr<ngraph::Node> NetworkHelper::separateInStandaloneBranch(std::sha
     if (dequantization.isShared()) {
         Output<Node> parent = dequantization.data;
         if (dequantization.convert != nullptr) {
-            parent = dequantization.convert->clone_with_new_inputs({ parent });
-            parent.get_node_shared_ptr()->set_friendly_name(parent.get_node_shared_ptr()->get_name() + "_new");
+            auto convert = dequantization.convert->clone_with_new_inputs({ parent });
+            convert->set_friendly_name("");
+            copy_runtime_info(parent.get_node_shared_ptr(), convert);
+            parent = convert->output(0);
         }
 
         if (dequantization.subtract != nullptr) {
@@ -537,15 +595,19 @@ std::shared_ptr<ngraph::Node> NetworkHelper::separateInStandaloneBranch(std::sha
                 outputs.push_back(input.get_source_output());
             }
 
-            parent = dequantization.subtract->clone_with_new_inputs({parent, parentOnWeights->clone_with_new_inputs(outputs) });
-            parent.get_node_shared_ptr()->set_friendly_name(parent.get_node_shared_ptr()->get_name() + "_new");
+            auto subtract = dequantization.subtract->clone_with_new_inputs({parent, parentOnWeights->clone_with_new_inputs(outputs) });
+            subtract->set_friendly_name("");
+            copy_runtime_info(parent.get_node_shared_ptr(), subtract);
+            parent = subtract->output(0);
         }
 
         if (dequantization.multiply != nullptr) {
-            parent = dequantization.multiply->clone_with_new_inputs({
+            auto multiply = dequantization.multiply->clone_with_new_inputs({
                 parent,
                 dequantization.multiply->get_input_node_shared_ptr(1)->clone_with_new_inputs({}) });
-            parent.get_node_shared_ptr()->set_friendly_name(parent.get_node_shared_ptr()->get_name() + "_new");
+            multiply->set_friendly_name("");
+            copy_runtime_info(parent.get_node_shared_ptr(), multiply);
+            parent = multiply->output(0);
         }
 
         std::vector<Output<Node>> inputs = node->input_values();
@@ -556,7 +618,7 @@ std::shared_ptr<ngraph::Node> NetworkHelper::separateInStandaloneBranch(std::sha
         const size_t inputIndex = NetworkHelper::getChildInputIndex(originalParent, node);
         inputs[inputIndex] = parent;
         const std::shared_ptr<Node> newNode = node->clone_with_new_inputs(inputs);
-
+        copy_runtime_info(node, newNode);
         replace_node(node, newNode);
         newNode->set_friendly_name(node->get_friendly_name());
 
@@ -592,10 +654,49 @@ std::shared_ptr<opset1::FakeQuantize> NetworkHelper::fuseConvert(const std::shar
         fakeQuantize->get_levels());
     NetworkHelper::setOutDataPrecisionForTypeRelaxed(newFakeQuantize, node->get_output_element_type(0));
     replace_node(node->shared_from_this(), newFakeQuantize);
-    newFakeQuantize->set_friendly_name(fakeQuantize->get_friendly_name());
+    NetworkHelper::copyInfo(fakeQuantize, newFakeQuantize);
+
     return newFakeQuantize;
 }
 
+bool NetworkHelper::isPrecisionPreserved(const std::shared_ptr<ngraph::Node>& node) {
+    auto& rt = node->get_rt_info();
+    auto it = rt.find(ngraph::VariantWrapper<PrecisionPreservedAttributePtr>::type_info.name);
+    if (it == rt.end()) {
+        return false;
+    }
+    auto attribute = std::dynamic_pointer_cast<ngraph::VariantWrapper<PrecisionPreservedAttributePtr>>(it->second);
+    assert(attribute != nullptr);
+    return attribute->get()->sharedValue->value;
+}
+
+size_t NetworkHelper::calculateLevels(
+    const float dataPrecisionMin,
+    const float dataPrecisionMax,
+    const float combinedIntervalLow,
+    const float combinedIntervalHigh,
+    const float minIntervalLow,
+    const float minIntervalHigh,
+    float& dequantizationMul,
+    float& dequantizationSub,
+    float& updatedOutputLowValue,
+    float& updatedOutputHighValue) {
+    const float maxOutputInterval = combinedIntervalHigh - combinedIntervalLow;
+    // FQ -> SUB_quantization -> MUL_quantization -[INT8]-> SUB_dequantization -> MUL_dequantization ->
+    const float quantizationMul = (dataPrecisionMax - dataPrecisionMin) / maxOutputInterval;
+    dequantizationMul = maxOutputInterval / (dataPrecisionMax - dataPrecisionMin);
+
+    // FQ outputLowValue = dataPrecision.min * dequantizationMul - quantizationSub
+    const float quantizationSub = combinedIntervalLow - dataPrecisionMin * dequantizationMul;
+    dequantizationSub = std::round(-quantizationSub * quantizationMul);
+
+    updatedOutputLowValue = (minIntervalLow - quantizationSub) * quantizationMul;
+    updatedOutputHighValue = (minIntervalHigh - quantizationSub) * quantizationMul;
+
+    const size_t levels = static_cast<size_t>(fabs(roundf(updatedOutputHighValue) - roundf(updatedOutputLowValue)) + 1.0);
+    return levels;
+}
+
 std::shared_ptr<Node> NetworkHelper::foldFakeQuantize(
     const std::shared_ptr<opset1::FakeQuantize>& fq,
     const bool roundValuesArg,
@@ -772,7 +873,8 @@ std::shared_ptr<opset1::FakeQuantize> NetworkHelper::composeFakeQuantize(const s
             newFakeQuantize->get_levels(),
             newFakeQuantize->get_auto_broadcast());
         replace_node(dequantization.convert, replacement);
-        replacement->set_friendly_name(newFakeQuantize->get_friendly_name());
+        //replacement->set_friendly_name(newFakeQuantize->get_friendly_name());
+        copyInfo({ fakeQuantize, dequantization.convert }, replacement);
         NetworkHelper::setOutDataPrecisionForTypeRelaxed(replacement, dequantization.convert->output(0).get_element_type());
         newFakeQuantize = replacement;
     }
@@ -791,7 +893,8 @@ std::shared_ptr<opset1::FakeQuantize> NetworkHelper::composeFakeQuantize(const s
             newFakeQuantize->get_levels(),
             newFakeQuantize->get_auto_broadcast());
         replace_node(dequantization.subtract, replacement);
-        replacement->set_friendly_name(newFakeQuantize->get_friendly_name());
+        //replacement->set_friendly_name(newFakeQuantize->get_friendly_name());
+        copyInfo({ newFakeQuantize, dequantization.subtract }, replacement);
         newFakeQuantize = replacement;
     }
 
@@ -827,7 +930,8 @@ std::shared_ptr<opset1::FakeQuantize> NetworkHelper::composeFakeQuantize(const s
             newFakeQuantize->get_auto_broadcast());
 
         replace_node(dequantization.multiply, replacement);
-        replacement->set_friendly_name(newFakeQuantize->get_friendly_name());
+        //replacement->set_friendly_name(newFakeQuantize->get_friendly_name());
+        copyInfo({ newFakeQuantize, dequantization.multiply }, replacement);
         newFakeQuantize = replacement;
     }
 
@@ -872,6 +976,12 @@ std::tuple<std::shared_ptr<Node>, std::shared_ptr<Node>> NetworkHelper::decompos
         }
     }
 
+    if ((!updatePrecision) &&
+        std::all_of(scales.begin(), scales.end(), [](const float value) { return value == 1.f; }) &&
+        std::all_of(shifts.begin(), shifts.end(), [](const float value) { return value == 0.f; })) {
+        return std::make_tuple(nullptr, nullptr);
+    }
+
     std::shared_ptr<Node> shift = hasZeroPoint ?
         std::make_shared<opset1::Constant>(deqPrecision, outputLow.get_shape(), shifts) :
         nullptr;
@@ -980,7 +1090,8 @@ std::shared_ptr<opset1::FakeQuantize> NetworkHelper::updateFakeQuantize(
     std::shared_ptr<opset1::FakeQuantize> fq,
     element::Type precision,
     float min,
-    float max) {
+    float max,
+    const bool replace) {
     auto newMin = std::make_shared<opset1::Constant>(fq->get_output_element_type(0), Shape{}, min);
     auto newMax = std::make_shared<opset1::Constant>(fq->get_output_element_type(0), Shape{}, max);
 
@@ -994,7 +1105,9 @@ std::shared_ptr<opset1::FakeQuantize> NetworkHelper::updateFakeQuantize(
             fq->get_auto_broadcast());
 
     NetworkHelper::setOutDataPrecision(newFQ, precision);
-    replace_node(fq, newFQ);
+    if (replace) {
+        replace_node(fq, newFQ);
+    }
 
     newFQ->set_friendly_name(fq->get_friendly_name());
     return newFQ;
@@ -1006,9 +1119,12 @@ FakeQuantizeDequantization NetworkHelper::makeDequantization(
     const ngraph::element::Type originalPrecision,
     const ngraph::PartialShape dataNodeOutputShape,
     element::Type precision,
-    const ngraph::element::Type deqPrecision) {
-    // TODO: we create input here! we really need it here?
-    const std::shared_ptr<opset1::Parameter> input = std::make_shared<ngraph::opset1::Parameter>(precision, dataNodeOutputShape);
+    const ngraph::element::Type deqPrecision,
+    std::shared_ptr<ngraph::Node> input) {
+    if (input == nullptr) {
+        // TODO: we create input here! we really need it here?
+        input = std::make_shared<ngraph::opset1::Parameter>(precision, dataNodeOutputShape);
+    }
     std::shared_ptr<ngraph::Node> parent = input;
 
     std::shared_ptr<DequantizationConvert> convert;
@@ -1016,7 +1132,7 @@ FakeQuantizeDequantization NetworkHelper::makeDequantization(
         convert = nullptr;
     } else {
         convert = std::make_shared<DequantizationConvert>(
-            input,
+            parent,
             deqPrecision);
         parent = convert;
     }
@@ -1212,11 +1328,20 @@ FakeQuantizeDequantization NetworkHelper::getDequantization(const std::shared_pt
     return FakeQuantizeDequantization(dataNode, convert, subtract, subtractConvert, subtractConstant, multiply, multiplyConstant);
 }
 
-FakeQuantizeDequantization NetworkHelper::getDequantizationBelow(const std::shared_ptr<Node>& node) {
+FakeQuantizeDequantization NetworkHelper::getDequantizationBelow(const std::shared_ptr<Node>& node, const bool convertIsMandatory) {
     const Output<Node> dataNode = node->output(0);
-    std::shared_ptr<Node> lastNode = dataNode.get_target_inputs().begin()->get_node()->shared_from_this();
+    const auto& targetInputs = dataNode.get_target_inputs();
+    if (targetInputs.size() == 0ul) {
+        return FakeQuantizeDequantization();
+    }
+
+    std::shared_ptr<Node> lastNode = targetInputs.begin()->get_node()->shared_from_this();
 
     const std::shared_ptr<opset1::Convert> convert = as_type_ptr<opset1::Convert>(lastNode);
+    if (convertIsMandatory && (convert == nullptr)) {
+        return FakeQuantizeDequantization();
+    }
+
     if (convert != nullptr) {
         if ((convert->input(0).get_element_type() != element::i8) && (convert->input(0).get_element_type() != element::u8) &&
             (convert->output(0).get_element_type() != element::f32)) {
@@ -1466,11 +1591,13 @@ NetworkHelper::InsertDequantizationResult NetworkHelper::moveDequantizationAfter
                     dequantization.subtractConstant->output(0).get_element_type();
             }
 
-            parent = std::make_shared<DequantizationSubtract>(
-                parent,
-                dequantization.subtractConstant->output(0).get_element_type() == parentPrecision ?
-                    dequantization.subtractConstant :
-                    foldConvert(dequantization.subtractConstant, parentPrecision));
+            parent = std::make_shared<op::TypeRelaxed<DequantizationSubtract>>(
+                std::vector<element::Type>{element::f32, element::f32}, std::vector<element::Type>{ element::f32 },
+                ngraph::op::TemporaryReplaceOutputType(parent, element::f32).get(),
+                ngraph::op::TemporaryReplaceOutputType(
+                    dequantization.subtractConstant->output(0).get_element_type() == parentPrecision ?
+                        dequantization.subtractConstant :
+                        foldConvert(dequantization.subtractConstant, parentPrecision), element::f32).get());
             ngraph::copy_runtime_info({ newOperation, parent }, parent);
         } else {
             parent = std::make_shared<DequantizationSubtract>(parent, dequantization.subtractConvert);
@@ -1594,8 +1721,8 @@ bool NetworkHelper::checkZeroPoint(const std::shared_ptr<Node>& node, const Data
             }
         }
         const auto subtractValues = subtractConst->cast_vector<float>();
-        if (std::any_of(subtractValues.begin(), subtractValues.end(), [min, max] (const float& val) {
-                return (val < min) || (val > max); })) {
+        if (std::any_of(subtractValues.begin(), subtractValues.end(), [min, max](const float& val) {
+            return (val < min) || (val > max); })) {
             return false;
         }
     } else if (is_type<opset1::FakeQuantize>(node)) {
@@ -1605,12 +1732,12 @@ bool NetworkHelper::checkZeroPoint(const std::shared_ptr<Node>& node, const Data
         min = dataPrecision.min - 0.5f;
         max = dataPrecision.max + 0.5f;
         const auto quantizationDetails = QuantizationDetails::getDetails(as_type_ptr<opset1::FakeQuantize>(node));
-        for (size_t i = 0; i < quantizationDetails.outputIntervalsCount; ++i) {
+        for (size_t i = 0; i < quantizationDetails.outputLowValues.size(); ++i) {
             float shift;
             if (quantizationDetails.outputHighValues[i] != quantizationDetails.outputLowValues[i]) {
                 shift = (dataPrecision.min * quantizationDetails.outputHighValues[i] -
-                         dataPrecision.max * quantizationDetails.outputLowValues[i]) /
-                        (quantizationDetails.outputHighValues[i] - quantizationDetails.outputLowValues[i]);
+                    dataPrecision.max * quantizationDetails.outputLowValues[i]) /
+                    (quantizationDetails.outputHighValues[i] - quantizationDetails.outputLowValues[i]);
             } else {
                 shift = 0.f;
             }
@@ -1619,6 +1746,7 @@ bool NetworkHelper::checkZeroPoint(const std::shared_ptr<Node>& node, const Data
             }
         }
     }
+
     return true;
 }
 
@@ -1705,6 +1833,23 @@ bool NetworkHelper::isDQByDynamicDimension(const std::shared_ptr<Node>& layer, s
     return false;
 }
 
-}  // namespace low_precision
-}  // namespace pass
-}  // namespace ngraph
+bool isDisabled(const std::shared_ptr<Node>& node) {
+    for (const auto& input : node->inputs()) {
+        auto precisionAttribute = getAttribute<std::shared_ptr<PrecisionsAttribute>>(input);
+        if (precisionAttribute == nullptr) {
+            continue;
+        }
+
+        assert(precisionAttribute->get() != nullptr);
+        assert(precisionAttribute->get()->sharedValue != nullptr);
+
+        const auto& precisionRestrictions = precisionAttribute->get()->sharedValue->precisions;
+        if (precisionRestrictions.empty()) {
+            return true;
+        }
+    }
+    return false;
+}
+} // namespace low_precision
+} // namespace pass
+} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/normalize_l2.cpp b/inference-engine/src/low_precision_transformations/src/normalize_l2.cpp
index 474602166751af..0ec9876e309a7d 100644
--- a/inference-engine/src/low_precision_transformations/src/normalize_l2.cpp
+++ b/inference-engine/src/low_precision_transformations/src/normalize_l2.cpp
@@ -9,6 +9,8 @@
 #include <cmath>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "ngraph/type/element_type.hpp"
 #include "ngraph/type/element_type_traits.hpp"
 #include "low_precision/network_helper.hpp"
@@ -18,6 +20,8 @@ using namespace ngraph;
 using namespace ngraph::pass;
 using namespace ngraph::pass::low_precision;
 
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::NormalizeL2Transformation, "NormalizeL2Transformation", 0);
+
 namespace normalize_l2 {
 
 template<typename T>
@@ -35,6 +39,21 @@ std::shared_ptr<ngraph::op::Constant> createNewScalesConst(const ngraph::op::Con
 
 } // namespace normalize_l2
 
+NormalizeL2Transformation::NormalizeL2Transformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::NormalizeL2>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "NormalizeL2Transformation");
+    this->register_matcher(m, callback);
+}
+
 bool NormalizeL2Transformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> operation) const {
     if (!LayerTransformation::canBeTransformed(context, operation)) {
         return false;
@@ -79,17 +98,7 @@ bool NormalizeL2Transformation::canBeTransformed(const TransformationContext& co
     return true;
 }
 
-void NormalizeL2Transformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<ngraph::opset1::NormalizeL2>({
-            make_op_label<ngraph::opset1::Multiply>(),
-            make_op_label<ngraph::opset1::Constant>()
-            }));
-}
-
-bool NormalizeL2Transformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) const {
+bool NormalizeL2Transformation::transform(TransformationContext &context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> operation = m.get_match_root();
     if (!canBeTransformed(context, operation)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/prelu.cpp b/inference-engine/src/low_precision_transformations/src/prelu.cpp
index 797d2d1dbfb389..17827ef9f712c7 100644
--- a/inference-engine/src/low_precision_transformations/src/prelu.cpp
+++ b/inference-engine/src/low_precision_transformations/src/prelu.cpp
@@ -8,6 +8,8 @@
 #include <memory>
 #include <string>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -15,14 +17,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void PReluTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::PRelu>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::PReluTransformation, "PReluTransformation", 0);
+
+PReluTransformation::PReluTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::PRelu>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "PReluTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool PReluTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool PReluTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> prelu = m.get_match_root();
     if (!canBeTransformed(context, prelu)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/propagate_precisions.cpp b/inference-engine/src/low_precision_transformations/src/propagate_precisions.cpp
new file mode 100644
index 00000000000000..4b15dd7e7b922f
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/propagate_precisions.cpp
@@ -0,0 +1,29 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/propagate_precisions.hpp"
+
+#include <memory>
+
+#include <ngraph/opsets/opset1.hpp>
+#include <low_precision/create_attribute.hpp>
+#include "low_precision/rt_info/precisions_attribute.hpp"
+#include "low_precision/propagate_through_precision_preserved.hpp"
+#include "low_precision/propagate_to_input.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::PropagatePrecisions, "PropagatePrecisions", 0);
+
+bool ngraph::pass::low_precision::PropagatePrecisions::run_on_function(std::shared_ptr<ngraph::Function> f) {
+    ngraph::pass::Manager manager;
+    manager.set_per_pass_validation(false);
+    std::shared_ptr<ngraph::pass::GraphRewrite> precisionsPropagation = manager.register_pass<ngraph::pass::GraphRewrite>();
+    precisionsPropagation->add_matcher<low_precision::CreateAttribute<PrecisionsAttributePtr, opset1::FakeQuantize>>(AttributeSource::OutputPort);
+    precisionsPropagation->add_matcher<low_precision::PropagateThroughPrecisionPreserved<PrecisionsAttribute>>();
+    precisionsPropagation->add_matcher<low_precision::PropagateToInput<PrecisionsAttribute>>();
+    manager.run_passes(f);
+    return false;
+}
diff --git a/inference-engine/src/low_precision_transformations/src/quantization_details.cpp b/inference-engine/src/low_precision_transformations/src/quantization_details.cpp
index ed8ef754102384..ca97aae0dc3e2c 100644
--- a/inference-engine/src/low_precision_transformations/src/quantization_details.cpp
+++ b/inference-engine/src/low_precision_transformations/src/quantization_details.cpp
@@ -15,6 +15,8 @@
 #include <utility>
 #include <vector>
 
+#include "low_precision/lpt_itt.hpp"
+
 #include <low_precision/common/ie_lpt_exception.hpp>
 #include <low_precision/network_helper.hpp>
 
@@ -27,130 +29,80 @@ QuantizationDetails::QuantizationDetails()
       inputLowValues({}),
       inputHighValues({}),
       outputLowValues({}),
-      outputHighValues({}),
-      inputIntervalsCount(0),
-      outputIntervalsCount(0),
-      outputChannelsCount(0) {}
+      outputHighValues({}) {}
 
 QuantizationDetails::QuantizationDetails(const QuantizationDetails& quantizationDetails)
     : levels(quantizationDetails.levels),
       inputLowValues(quantizationDetails.inputLowValues),
       inputHighValues(quantizationDetails.inputHighValues),
       outputLowValues(quantizationDetails.outputLowValues),
-      outputHighValues(quantizationDetails.outputHighValues),
-      inputIntervalsCount(quantizationDetails.inputIntervalsCount),
-      outputIntervalsCount(quantizationDetails.outputIntervalsCount),
-      outputChannelsCount(quantizationDetails.outputChannelsCount) {}
+      outputHighValues(quantizationDetails.outputHighValues) {}
 
 QuantizationDetails::QuantizationDetails(const size_t levels, const std::vector<float>& inputLowValues,
                                          const std::vector<float>& inputHighValues,
                                          const std::vector<float>& outputLowValues,
-                                         const std::vector<float>& outputHighValues, const size_t inputIntervalsCount,
-                                         const size_t outputIntervalsCount, const size_t outputChannelsCount)
+                                         const std::vector<float>& outputHighValues)
     : levels(levels),
       inputLowValues(inputLowValues),
       inputHighValues(inputHighValues),
       outputLowValues(outputLowValues),
-      outputHighValues(outputHighValues),
-      inputIntervalsCount(inputIntervalsCount),
-      outputIntervalsCount(outputIntervalsCount),
-      outputChannelsCount(outputChannelsCount) {}
+      outputHighValues(outputHighValues) {}
 
 bool QuantizationDetails::outputLayoutIsSupported(std::shared_ptr<opset1::FakeQuantize> quantize) {
-    if (!is_type<opset1::Constant>(quantize->get_input_node_ptr(1)) ||
-        !is_type<opset1::Constant>(quantize->get_input_node_ptr(2)) ||
-        !is_type<opset1::Constant>(quantize->get_input_node_ptr(3)) ||
-        !is_type<opset1::Constant>(quantize->get_input_node_ptr(4))) {
-        return false;
-    }
-
-    const size_t inputLowValuesSize = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(1))->cast_vector<float>().size();
-    const size_t inputHighValuesSize = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(2))->cast_vector<float>().size();
-    if (inputLowValuesSize != inputHighValuesSize) {
-        return false;
-    }
-
-    const size_t outputLowValuesSize = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(3))->cast_vector<float>().size();
-    const size_t outputHighValuesSize = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(4))->cast_vector<float>().size();
-    if (outputLowValuesSize != outputHighValuesSize) {
-        return false;
-    }
-
-    return true;
+    return is_type<opset1::Constant>(quantize->get_input_node_ptr(1)) &&
+        is_type<opset1::Constant>(quantize->get_input_node_ptr(2)) &&
+        is_type<opset1::Constant>(quantize->get_input_node_ptr(3)) &&
+        is_type<opset1::Constant>(quantize->get_input_node_ptr(4));
 }
 
 void QuantizationDetails::getInputIntervals(
         std::shared_ptr<opset1::FakeQuantize> quantize,
         std::vector<float>& inputLowValues,
-        std::vector<float>& inputHighValues,
-        size_t& inputIntervalsCount) {
+        std::vector<float>& inputHighValues) {
     std::shared_ptr<opset1::Constant> inputLowLayer = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(1));
-    validate(inputLowLayer);
     const std::vector<float>& inputLowBlobValues = getBlobValue(inputLowLayer);
     inputLowValues.insert(inputLowValues.end(), inputLowBlobValues.begin(), inputLowBlobValues.end());
 
     std::shared_ptr<opset1::Constant> inputHighLayer = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(2));
-    validate(inputHighLayer);
     const std::vector<float> inputHighBlobValues = getBlobValue(inputHighLayer);
     inputHighValues.insert(inputHighValues.end(), inputHighBlobValues.begin(), inputHighBlobValues.end());
 
     if (inputLowValues.size() != inputHighValues.size()) {
         THROW_IE_LPT_EXCEPTION(*quantize) << "Quantize input values sizes are not equal for layer " << quantize->get_friendly_name();
     }
-
-    inputIntervalsCount = inputLowValues.size();
 }
 
 
 void QuantizationDetails::getOutputIntervals(
         std::shared_ptr<opset1::FakeQuantize> quantize,
         std::vector<float>& outputLowValues,
-        std::vector<float>& outputHighValues,
-        size_t& outputIntervalsCount) {
+        std::vector<float>& outputHighValues) {
     std::shared_ptr<opset1::Constant> outputLowLayer = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(3));
-    validate(outputLowLayer);
     const std::vector<float>& outputLowBlobValues = getBlobValue(outputLowLayer);
     outputLowValues.insert(outputLowValues.end(), outputLowBlobValues.begin(), outputLowBlobValues.end());
 
     std::shared_ptr<opset1::Constant> outputHighLayer = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(4));
-    validate(outputHighLayer);
     const std::vector<float> outputHighBlobValues = getBlobValue(outputHighLayer);
     outputHighValues.insert(outputHighValues.end(), outputHighBlobValues.begin(), outputHighBlobValues.end());
 
     if (outputLowValues.size() != outputHighValues.size()) {
         THROW_IE_LPT_EXCEPTION(*quantize) << "Quantize output values sizes are not equal for layer " << quantize->get_friendly_name();
     }
-
-    outputIntervalsCount = outputLowValues.size();
 }
 
-
 QuantizationDetails QuantizationDetails::getDetails(std::shared_ptr<opset1::FakeQuantize> quantize) {
-    std::vector<float> inputLowValues;
-    std::vector<float> inputHighValues;
-    size_t inputIntervalsCount;
-    getInputIntervals(quantize, inputLowValues, inputHighValues, inputIntervalsCount);
-
-    std::vector<float> outputLowValues;
-    std::vector<float> outputHighValues;
-    size_t outputIntervalsCount;
-    getOutputIntervals(quantize, outputLowValues, outputHighValues, outputIntervalsCount);
-
-    const size_t outputChannelsCount = outputLowValues.size() == 1ul ? 1ul :
-        NetworkHelper::getOutputChannelsCount(quantize, NetworkHelper::isConstantPath(quantize));
-    if (!outputLayoutIsSupported(quantize)) {
-        THROW_IE_LPT_EXCEPTION(*quantize) << "Expected output channels count " << outputIntervalsCount << " but found " << outputChannelsCount;
-    }
+    const std::vector<float> inputLowValues = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(1))->cast_vector<float>();
+    const std::vector<float> inputHighValues = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(2))->cast_vector<float>();
+
+    const std::vector<float> outputLowValues = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(3))->cast_vector<float>();
+    const std::vector<float> outputHighValues = as_type_ptr<opset1::Constant>(quantize->get_input_node_shared_ptr(4))->cast_vector<float>();
 
     return QuantizationDetails(
-            quantize->get_levels(),
-            inputLowValues,
-            inputHighValues,
-            outputLowValues,
-            outputHighValues,
-            inputIntervalsCount,
-            outputIntervalsCount,
-            outputChannelsCount);
+        quantize->get_levels(),
+        inputLowValues,
+        inputHighValues,
+        outputLowValues,
+        outputHighValues);
 }
 
 bool QuantizationDetails::hasNegativeOutput() const {
@@ -181,63 +133,20 @@ float QuantizationDetails::maxInput(const size_t channel) const {
     return value;
 }
 
-float QuantizationDetails::maxOutputHigh() const {
-    float output = getOutputHighValue(0);
-    for (size_t channel = 1; channel < outputIntervalsCount; ++channel) {
-        if (output < getOutputHighValue(channel)) {
-            output = getOutputHighValue(channel);
-        }
-    }
-    return output;
-}
-
-float QuantizationDetails::minOutputLow() const {
-    float output = getOutputLowValue(0);
-    for (size_t channel = 1; channel < outputIntervalsCount; ++channel) {
-        if (output > getOutputLowValue(channel)) {
-            output = getOutputLowValue(channel);
-        }
-    }
-    return output;
-}
-
-float QuantizationDetails::getInputLowValue(const size_t channel) const {
-    if ((inputIntervalsCount != 1) && (channel >= inputIntervalsCount)) {
-        THROW_TRANSFORMATION_EXCEPTION << "channel " << channel << " is out of bound, input channels count " << inputIntervalsCount;
-    }
-    const float value = inputLowValues.size() == 1 ? inputLowValues[0] : inputLowValues[channel];
-    return value;
-}
-
-float QuantizationDetails::getInputHighValue(const size_t channel) const {
-    if ((inputIntervalsCount != 1) && (channel >= inputIntervalsCount)) {
-        THROW_TRANSFORMATION_EXCEPTION << "channel " << channel << " is out of bound, input channels count " << inputIntervalsCount;
-    }
-    const float value = inputHighValues.size() == 1 ? inputHighValues[0] : inputHighValues[channel];
-    return value;
+float QuantizationDetails::getInputLowValue(const size_t index) const {
+    return inputLowValues.size() == 1ul ? inputLowValues[0] : inputLowValues[index];
 }
 
-float QuantizationDetails::getOutputLowValue(const size_t channel) const {
-    if ((outputIntervalsCount != 1) && (channel >= outputIntervalsCount)) {
-        THROW_TRANSFORMATION_EXCEPTION << "channel " << channel << " is out of bound, output channels count "
-                           << outputIntervalsCount;
-    }
-    const float value = outputLowValues.size() == 1 ? outputLowValues[0] : outputLowValues[channel];
-    return value;
+float QuantizationDetails::getInputHighValue(const size_t index) const {
+    return inputHighValues.size() == 1ul ? inputHighValues[0] : inputHighValues[index];
 }
 
-float QuantizationDetails::getOutputHighValue(const size_t channel) const {
-    if ((outputIntervalsCount != 1) && (channel >= outputIntervalsCount)) {
-        THROW_TRANSFORMATION_EXCEPTION << "channel " << channel << " is out of bound, output channels count "
-                           << outputIntervalsCount;
-    }
-    const float value = outputHighValues.size() == 1 ? outputHighValues[0] : outputHighValues[channel];
-    return value;
+float QuantizationDetails::getOutputLowValue(const size_t index) const {
+    return outputLowValues.size() == 1ul ? outputLowValues[0] : outputLowValues[index];
 }
 
-void QuantizationDetails::validate(std::shared_ptr<Node> constantLayer) {
-    // nothing to validate
-    // TODO: remove?
+float QuantizationDetails::getOutputHighValue(const size_t index) const {
+    return outputHighValues.size() == 1ul ? outputHighValues[0] : outputHighValues[index];
 }
 
 std::vector<float> QuantizationDetails::getBlobValue(std::shared_ptr<Node> constantLayer) {
diff --git a/inference-engine/src/low_precision_transformations/src/reduce_base_transformation.cpp b/inference-engine/src/low_precision_transformations/src/reduce_base_transformation.cpp
index d79be9f6e5416f..e178d94b98a090 100644
--- a/inference-engine/src/low_precision_transformations/src/reduce_base_transformation.cpp
+++ b/inference-engine/src/low_precision_transformations/src/reduce_base_transformation.cpp
@@ -13,7 +13,7 @@ namespace low_precision {
 
 ReduceBaseTransformation::ReduceBaseTransformation(const Params& params) : LayerTransformation(params) {}
 
-bool ReduceBaseTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) const {
+bool ReduceBaseTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/reduce_max.cpp b/inference-engine/src/low_precision_transformations/src/reduce_max.cpp
index e5c039d9fc2869..29e230314e72d9 100644
--- a/inference-engine/src/low_precision_transformations/src/reduce_max.cpp
+++ b/inference-engine/src/low_precision_transformations/src/reduce_max.cpp
@@ -5,18 +5,29 @@
 #include "low_precision/reduce_max.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-ReduceMaxTransformation::ReduceMaxTransformation(const Params& params) : ReduceBaseTransformation(params) {}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ReduceMaxTransformation, "ReduceMaxTransformation", 0);
+
+ReduceMaxTransformation::ReduceMaxTransformation(const Params& params) : ReduceBaseTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::ReduceMax>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void ReduceMaxTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::ReduceMax>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ReduceMaxTransformation");
+    this->register_matcher(m, callback);
 }
 
 bool ReduceMaxTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const {
diff --git a/inference-engine/src/low_precision_transformations/src/reduce_mean.cpp b/inference-engine/src/low_precision_transformations/src/reduce_mean.cpp
index deb5b5237d1170..c91abbeb1ccc9e 100644
--- a/inference-engine/src/low_precision_transformations/src/reduce_mean.cpp
+++ b/inference-engine/src/low_precision_transformations/src/reduce_mean.cpp
@@ -5,18 +5,29 @@
 #include "low_precision/reduce_mean.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-ReduceMeanTransformation::ReduceMeanTransformation(const Params& params) : ReduceBaseTransformation(params) {}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ReduceMeanTransformation, "ReduceMeanTransformation", 0);
+
+ReduceMeanTransformation::ReduceMeanTransformation(const Params& params) : ReduceBaseTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::ReduceMean>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void ReduceMeanTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::ReduceMean>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ReduceMeanTransformation");
+    this->register_matcher(m, callback);
 }
 
 bool ReduceMeanTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const {
diff --git a/inference-engine/src/low_precision_transformations/src/reduce_min.cpp b/inference-engine/src/low_precision_transformations/src/reduce_min.cpp
index 8e8d7ef031498d..1d0e9da5accddc 100644
--- a/inference-engine/src/low_precision_transformations/src/reduce_min.cpp
+++ b/inference-engine/src/low_precision_transformations/src/reduce_min.cpp
@@ -5,18 +5,29 @@
 #include "low_precision/reduce_min.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-ReduceMinTransformation::ReduceMinTransformation(const Params& params) : ReduceBaseTransformation(params) {}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ReduceMinTransformation, "ReduceMinTransformation", 0);
+
+ReduceMinTransformation::ReduceMinTransformation(const Params& params) : ReduceBaseTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::ReduceMin>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void ReduceMinTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::ReduceMin>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ReduceMinTransformation");
+    this->register_matcher(m, callback);
 }
 
 bool ReduceMinTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const {
diff --git a/inference-engine/src/low_precision_transformations/src/reduce_sum.cpp b/inference-engine/src/low_precision_transformations/src/reduce_sum.cpp
index 5ad65d782186f4..7ffcb435bd0895 100644
--- a/inference-engine/src/low_precision_transformations/src/reduce_sum.cpp
+++ b/inference-engine/src/low_precision_transformations/src/reduce_sum.cpp
@@ -5,18 +5,29 @@
 #include "low_precision/reduce_sum.hpp"
 #include <memory>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-ReduceSumTransformation::ReduceSumTransformation(const Params& params) : ReduceBaseTransformation(params) {}
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ReduceSumTransformation, "ReduceSumTransformation", 0);
+
+ReduceSumTransformation::ReduceSumTransformation(const Params& params) : ReduceBaseTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::ReduceSum>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void ReduceSumTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::ReduceSum>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ReduceSumTransformation");
+    this->register_matcher(m, callback);
 }
 
 bool ReduceSumTransformation::canBeTransformed(const TransformationContext& context, std::shared_ptr<Node> reduce) const {
diff --git a/inference-engine/src/low_precision_transformations/src/relu.cpp b/inference-engine/src/low_precision_transformations/src/relu.cpp
index 0a0b79bebad517..0c9f43c37e9487 100644
--- a/inference-engine/src/low_precision_transformations/src/relu.cpp
+++ b/inference-engine/src/low_precision_transformations/src/relu.cpp
@@ -8,6 +8,8 @@
 #include <memory>
 #include <string>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -15,14 +17,24 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void ReluTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Relu>({ make_op_label<opset1::Multiply>()}));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ReluTransformation, "ReluTransformation", 0);
+
+ReluTransformation::ReluTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Relu>({ pattern::wrap_type<opset1::Multiply>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ReluTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool ReluTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool ReluTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> relu = m.get_match_root();
     if (!canBeTransformed(context, relu)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/reshape.cpp b/inference-engine/src/low_precision_transformations/src/reshape.cpp
index db751f58f2fb78..f478928537ee47 100644
--- a/inference-engine/src/low_precision_transformations/src/reshape.cpp
+++ b/inference-engine/src/low_precision_transformations/src/reshape.cpp
@@ -11,6 +11,8 @@
 #include <utility>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -18,11 +20,21 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void ReshapeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Reshape>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ReshapeTransformation, "ReshapeTransformation", 0);
+
+ReshapeTransformation::ReshapeTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Reshape>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ReshapeTransformation");
+    this->register_matcher(m, callback);
 }
 
 void reshapeDequantizationConstant(const std::shared_ptr<opset1::Reshape>& reshape) {
@@ -154,7 +166,7 @@ void reshapeDequantizationConstant(const std::shared_ptr<opset1::Reshape>& resha
     }
 }
 
-bool ReshapeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool ReshapeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::Reshape> reshape = as_type_ptr<opset1::Reshape>(m.get_match_root());
     if (NetworkHelper::isConstantPath(reshape)) {
         return false;
@@ -204,6 +216,12 @@ bool ReshapeTransformation::canBeTransformed(const TransformationContext& contex
         return false;
     }
 
+    // TODO: LPT: to support current flow: #58269
+    //if (((dequantization.subtractConstant != nullptr) && NetworkHelper::isScalarLike(dequantization.subtractConstant)) ||
+    //    ((dequantization.multiplyConstant != nullptr) && NetworkHelper::isScalarLike(dequantization.multiplyConstant))) {
+    //    return true;
+    //}
+
     const Shape subtractShape = dequantization.subtract == nullptr ? Shape{} : dequantization.subtractConstant->get_shape();
     Shape subtractShapeWithBatch = subtractShape;
     const PartialShape inputPShape = op->get_input_partial_shape(0);
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/avg_pool_precision_preserved_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/avg_pool_precision_preserved_attribute.cpp
new file mode 100644
index 00000000000000..3bafe518a91b01
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/avg_pool_precision_preserved_attribute.cpp
@@ -0,0 +1,27 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp"
+
+#include <memory>
+#include <vector>
+#include <ngraph/variant.hpp>
+
+using namespace ngraph;
+
+template class ngraph::VariantImpl<AvgPoolPrecisionPreservedAttributePtr>;
+
+constexpr VariantTypeInfo VariantWrapper<AvgPoolPrecisionPreservedAttributePtr>::type_info;
+
+void VariantWrapper<AvgPoolPrecisionPreservedAttributePtr>::merge(
+    std::vector<std::shared_ptr<ngraph::VariantWrapper<std::shared_ptr<AvgPoolPrecisionPreservedAttribute>>>>& attributes) {
+}
+
+std::string VariantWrapper<AvgPoolPrecisionPreservedAttributePtr>::to_string() {
+    auto value = this->m_value;
+    std::stringstream ss;
+    ss << m_value->get_string();
+    ss << "value: " << (value->sharedValue->value ? "true" : "false");
+    return ss.str();
+}
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp
new file mode 100644
index 00000000000000..e20fed518e4bad
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp
@@ -0,0 +1,216 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+
+#include <memory>
+#include <string>
+#include <vector>
+
+#include "low_precision/lpt_itt.hpp"
+#include "low_precision/network_helper.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
+
+IntervalsAlignmentAttribute::IntervalsAlignmentAttribute(
+    const IntervalsAlignmentSharedValue::Interval combinedInterval,
+    size_t levels) : levels(levels) {
+    sharedValue = std::make_shared<IntervalsAlignmentSharedValue>(combinedInterval, combinedInterval, levels);
+}
+
+IntervalsAlignmentAttribute::IntervalsAlignmentAttribute(
+    const IntervalsAlignmentSharedValue::Interval combinedInterval,
+    const size_t levels,
+    const IntervalsAlignmentSharedValue::Interval minInterval,
+    const size_t minLevels) : levels(levels) {
+    sharedValue = std::make_shared<IntervalsAlignmentSharedValue>(combinedInterval, minInterval, minLevels);
+}
+
+template class ngraph::VariantImpl<IntervalsAlignmentAttributePtr>;
+
+constexpr VariantTypeInfo VariantWrapper<IntervalsAlignmentAttributePtr>::type_info;
+
+std::shared_ptr<VariantWrapper<std::shared_ptr<IntervalsAlignmentAttribute>>> VariantWrapper<IntervalsAlignmentAttributePtr>::create(
+    const std::shared_ptr<ngraph::Node>& node,
+    const AttributeParameters& params) {
+    if (!is_type<opset1::FakeQuantize>(node)) {
+        return nullptr;
+    }
+
+    auto fakeQuantize = as_type_ptr<opset1::FakeQuantize>(node);
+    if (!QuantizationDetails::outputLayoutIsSupported(fakeQuantize) || !QuantizationDetails::isSupportedLevel(fakeQuantize->get_levels())) {
+        return nullptr;
+    }
+
+    float lowInterval;
+    float highInterval;
+    {
+        OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "calculateIntervals");
+
+        FakeQuantizeDequantization dequantization;
+        {
+            const auto targetInputs = node->output(0).get_target_inputs();
+            if (targetInputs.size() == 1ul) {
+                dequantization = NetworkHelper::getDequantizationBelow(node, true);
+            }
+        }
+
+        const auto outLow = as_type_ptr<opset1::Constant>(node->get_input_node_shared_ptr(3));
+        const auto outHigh = as_type_ptr<opset1::Constant>(node->get_input_node_shared_ptr(4));
+        if (!NetworkHelper::isScalarLike(outLow) || !NetworkHelper::isScalarLike(outHigh)) {
+            return nullptr;
+        }
+
+        if (dequantization.empty()) {
+            const std::vector<float> lowIntervals = outLow->cast_vector<float>();
+            lowInterval = *std::min_element(lowIntervals.begin(), lowIntervals.end());
+
+            const std::vector<float> highIntervals = outHigh->cast_vector<float>();
+            highInterval = *std::max_element(highIntervals.begin(), highIntervals.end());
+        } else {
+            {
+                auto multiplyResult = dequantization.multiplyConstant == nullptr ?
+                    node->get_input_node_ptr(3)->shared_from_this() :
+                    fold<opset1::Multiply>(
+                        foldConvert(node->get_input_node_ptr(3)->shared_from_this(), params.deqPrecision),
+                        dequantization.multiplyConstant);
+
+                auto multiplyResultConstant = as_type_ptr<opset1::Constant>(multiplyResult);
+                auto intervals = multiplyResultConstant->cast_vector<float>();
+                lowInterval = *std::min_element(intervals.begin(), intervals.end());
+            }
+
+            {
+                auto multiplyResult = dequantization.multiplyConstant == nullptr ?
+                    node->get_input_node_ptr(4)->shared_from_this() :
+                    fold<opset1::Multiply>(
+                        foldConvert(node->get_input_node_ptr(4)->shared_from_this(), params.deqPrecision),
+                        dequantization.multiplyConstant);
+
+                auto multiplyResultConstant = as_type_ptr<opset1::Constant>(multiplyResult);
+                auto intervals = multiplyResultConstant->cast_vector<float>();
+                highInterval = *std::max_element(intervals.begin(), intervals.end());
+            }
+        }
+
+        if (std::isinf(lowInterval) || std::isinf(highInterval)) {
+            return nullptr;
+        }
+    }
+
+    {
+        OV_ITT_SCOPE(FIRST_INFERENCE, itt::domains::LPT_LT, "create");
+
+        assert(!std::isinf(lowInterval));
+        assert(!std::isinf(highInterval));
+
+        auto& rtInfo = node->get_rt_info();
+        const IntervalsAlignmentSharedValue::Interval interval{ lowInterval, highInterval };
+        const auto attribute = std::make_shared<::ngraph::VariantWrapper<IntervalsAlignmentAttributePtr>>(
+            ngraph::pass::low_precision::make_shared_attribute<IntervalsAlignmentAttribute>(
+                interval,
+                fakeQuantize->get_levels()));
+        rtInfo[ngraph::VariantWrapper<IntervalsAlignmentAttributePtr>::type_info.name] = attribute;
+
+        const std::vector<float> outputLowValues = as_type_ptr<opset1::Constant>(fakeQuantize->get_input_node_shared_ptr(3))->cast_vector<float>();
+        const std::vector<float> outputHighValues = as_type_ptr<opset1::Constant>(fakeQuantize->get_input_node_shared_ptr(4))->cast_vector<float>();
+        LayerTransformation::PrecisionDetails preferablePrecision = LayerTransformation::getPrecisionDetails(
+            fakeQuantize->get_levels(),
+            outputLowValues,
+            outputHighValues);
+
+        if (preferablePrecision.precision != element::undefined) {
+            attribute->get()->sharedValue->preferablePrecisions.insert(preferablePrecision.precision);
+        }
+
+#ifdef LPT_DEBUG
+        attribute->get()->sharedValue->minLevelsOperation = node->get_friendly_name();
+#endif
+
+        return attribute;
+    }
+}
+
+void VariantWrapper<IntervalsAlignmentAttributePtr>::merge(
+    std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<IntervalsAlignmentAttribute>>>>& attributes) {
+    std::shared_ptr<IntervalsAlignmentAttribute> resultAttribute = get();
+    for (const auto& attributeWrapper : attributes) {
+        auto attribute = attributeWrapper->get();
+
+        // TODO: LPT: copy/past: merge()
+        const auto& resultSharedValue = resultAttribute->sharedValue;
+        const auto& sharedValue = attribute->sharedValue;
+        if (resultAttribute->levels != attribute->levels) {
+            // TODO: LPT: not supported right now
+            resultAttribute->levels = 0ul;
+            resultSharedValue->minLevels = 0ul;
+        }
+
+        if (resultSharedValue->combinedInterval.low > sharedValue->combinedInterval.low) {
+            resultSharedValue->combinedInterval.low = sharedValue->combinedInterval.low;
+        }
+
+        if (resultSharedValue->combinedInterval.high < sharedValue->combinedInterval.high) {
+            resultSharedValue->combinedInterval.high = sharedValue->combinedInterval.high;
+        }
+
+        assert(!std::isinf(resultSharedValue->combinedInterval.low));
+        assert(!std::isinf(resultSharedValue->combinedInterval.high));
+
+        resultSharedValue->preferablePrecisions.insert(sharedValue->preferablePrecisions.begin(), sharedValue->preferablePrecisions.end());
+
+        const auto resultSize = abs(resultSharedValue->minInterval.high - resultSharedValue->minInterval.low);
+        const auto size = abs(sharedValue->minInterval.high - sharedValue->minInterval.low);
+        if (resultSize > size) {
+            resultSharedValue->minInterval = sharedValue->minInterval;
+
+            float dequantizationMul;
+            float dequantizationSub;
+            float updatedOutputLowValue;
+            float updatedOutputHighValue;
+
+            const size_t minLevels = NetworkHelper::calculateLevels(
+                0.f,
+                DataPrecision::getMaxValue(resultAttribute->levels),
+                resultSharedValue->combinedInterval.low,
+                resultSharedValue->combinedInterval.high,
+                resultSharedValue->minInterval.low,
+                resultSharedValue->minInterval.high,
+                dequantizationMul,
+                dequantizationSub,
+                updatedOutputLowValue,
+                updatedOutputHighValue);
+
+            resultSharedValue->minLevels = minLevels;
+
+#ifdef LPT_DEBUG
+            resultSharedValue->minLevelsOperation = sharedValue->minLevelsOperation;
+#endif
+        }
+    }
+}
+
+std::string VariantWrapper<IntervalsAlignmentAttributePtr>::to_string() {
+    std::stringstream preferablePrecisions;
+    preferablePrecisions << "{";
+    size_t index = 0;
+    for (const auto& precision : m_value->sharedValue->preferablePrecisions) {
+        preferablePrecisions << (index > 0 ? ", " : "") << precision;
+        ++index;
+    }
+    preferablePrecisions << "}";
+
+    std::stringstream ss;
+    ss << m_value->get_string();
+    ss << "levels: " + std::to_string(m_value->levels) << ", " <<
+        "combined: { " << m_value->sharedValue->combinedInterval.low << ", " << m_value->sharedValue->combinedInterval.high << " }, " <<
+        "min: { " << m_value->sharedValue->minInterval.low << ", " << m_value->sharedValue->minInterval.high << " }, "
+        "minLevels: " << m_value->sharedValue->minLevels <<
+#ifdef LPT_DEBUG
+        ", minLevelsOperation: " << m_value->sharedValue->minLevelsOperation <<
+#endif
+        ", preferablePrecisions: " << preferablePrecisions.str();
+    return ss.str();
+}
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/per_tensor_quantization_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/per_tensor_quantization_attribute.cpp
new file mode 100644
index 00000000000000..fe418173f2c524
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/per_tensor_quantization_attribute.cpp
@@ -0,0 +1,10 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/per_tensor_quantization_attribute.hpp"
+
+using namespace ngraph;
+
+template class ngraph::VariantImpl<PerTensorQuantizationAttribute>;
+constexpr VariantTypeInfo VariantWrapper<PerTensorQuantizationAttribute>::type_info;
\ No newline at end of file
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/precision_preserved_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/precision_preserved_attribute.cpp
new file mode 100644
index 00000000000000..8e8a9b0b62f04e
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/precision_preserved_attribute.cpp
@@ -0,0 +1,26 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+
+#include <memory>
+#include <string>
+
+using namespace ngraph;
+
+PrecisionPreservedAttribute::PrecisionPreservedAttribute(const bool value) {
+    sharedValue->value = value;
+}
+
+template class ngraph::VariantImpl<PrecisionPreservedAttributePtr>;
+
+constexpr VariantTypeInfo VariantWrapper<PrecisionPreservedAttributePtr>::type_info;
+
+std::string VariantWrapper<PrecisionPreservedAttributePtr>::to_string() {
+    auto& value = this->m_value;
+    std::stringstream ss;
+    ss << m_value->get_string();
+    ss << "value: " << (value->sharedValue->value ? "true" : "false");
+    return ss.str();
+}
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/precisions_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/precisions_attribute.cpp
new file mode 100644
index 00000000000000..c69fc1d9b690d2
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/precisions_attribute.cpp
@@ -0,0 +1,80 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/precisions_attribute.hpp"
+
+#include <memory>
+#include <string>
+#include <unordered_map>
+#include <iterator>
+#include <vector>
+
+#include <ngraph/opsets/opset1.hpp>
+#include "low_precision/network_helper.hpp"
+
+using namespace ngraph;
+
+// order defines default precision
+const std::vector<ngraph::element::Type> PrecisionsAttribute::defaultPrecisions = { ngraph::element::u8, ngraph::element::i8 };
+
+PrecisionsAttribute::PrecisionsAttribute(const std::vector<ngraph::element::Type>& precisions) {
+    sharedValue->precisions = precisions;
+}
+
+template class ngraph::VariantImpl<std::shared_ptr<PrecisionsAttribute>>;
+
+constexpr VariantTypeInfo VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info;
+
+std::shared_ptr<VariantWrapper<std::shared_ptr<PrecisionsAttribute>>> VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::create(
+    const std::shared_ptr<ngraph::Node>& node,
+    const AttributeParameters& params) {
+    auto attribute = ngraph::pass::low_precision::make_shared_attribute<PrecisionsAttribute>();
+    auto wrapper = std::make_shared<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(attribute);
+
+    auto& rt = is_type<opset1::FakeQuantize>(node) ? node->output(0).get_rt_info() : node->get_rt_info();
+    rt[ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::type_info.name] = wrapper;
+    return wrapper;
+}
+
+void VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::merge(
+    std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>>& attributes) {
+    auto& my = this->get()->sharedValue->precisions;
+    for (auto attribute : attributes) {
+        const auto& attributeValues = attribute->get()->sharedValue->precisions;
+        auto it = my.begin();
+        while (it != my.end()) {
+            if (std::find(attributeValues.begin(), attributeValues.end(), *it) == attributeValues.end()) {
+                it = my.erase(it);
+            } else {
+                it++;
+            }
+        }
+        if (my.size() == 0ul) {
+            break;
+        }
+    }
+}
+
+std::shared_ptr<ngraph::Variant> VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::init(const std::shared_ptr<ngraph::Node>& node) {
+    return nullptr;
+}
+
+std::string VariantWrapper<std::shared_ptr<PrecisionsAttribute>>::to_string() {
+    std::stringstream ss;
+
+    ss << m_value->get_string();
+
+    bool firstPrecision = true;
+    ss << "precisions: {";
+    for (const auto& value : m_value->sharedValue->precisions) {
+        if (!firstPrecision) {
+            ss << ", ";
+        }
+        ss << value;
+        firstPrecision = false;
+    }
+    ss << "}";
+
+    return ss.str();
+}
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/quantization_alignment_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/quantization_alignment_attribute.cpp
new file mode 100644
index 00000000000000..e02c8153b2c0d5
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/quantization_alignment_attribute.cpp
@@ -0,0 +1,90 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
+
+#include <memory>
+#include <string>
+#include <unordered_map>
+#include <vector>
+
+#include <ngraph/opsets/opset1.hpp>
+#include "low_precision/network_helper.hpp"
+
+using namespace ngraph;
+using namespace ngraph::pass::low_precision;
+
+QuantizationAlignmentAttribute::QuantizationAlignmentAttribute(const bool hasToBeAligned) {
+    sharedValue = std::make_shared<QuantizationAlignmentSharedValue>(hasToBeAligned);
+}
+
+template class ngraph::VariantImpl<QuantizationAlignmentAttributePtr>;
+
+constexpr VariantTypeInfo VariantWrapper<QuantizationAlignmentAttributePtr>::type_info;
+
+std::shared_ptr<ngraph::Variant> VariantWrapper<QuantizationAlignmentAttributePtr>::init(const std::shared_ptr<ngraph::Node>& node) {
+    return nullptr;
+}
+
+std::shared_ptr<VariantWrapper<std::shared_ptr<QuantizationAlignmentAttribute>>> VariantWrapper<QuantizationAlignmentAttributePtr>::create(
+    const std::shared_ptr<ngraph::Node>& node,
+    const AttributeParameters& params) {
+    if (getAttribute<std::shared_ptr<QuantizationAlignmentAttribute>>(node) != nullptr) {
+        return nullptr;
+    }
+
+    if (!NetworkHelper::isPrecisionPreserved(node)) {
+        return nullptr;
+    }
+
+    bool leastOneOperationIsFakeQuantize = false;
+    bool leastOneOperationIsNotFakeQuantize = false;
+    for (auto index = 0ul; index < node->get_input_size(); ++index) {
+        const auto& input = node->input(index);
+        auto inputNode = input.get_source_output().get_node_shared_ptr();
+
+        const auto dequantization = NetworkHelper::getDequantization(node, index);
+        if (!dequantization.empty() &&
+            (is_type<opset1::Convert>(dequantization.data.get_node())) &&
+            is_type<opset1::FakeQuantize>(dequantization.data.get_node()->get_input_node_ptr(0))) {
+            inputNode = dequantization.data.get_node()->get_input_node_shared_ptr(0);
+        }
+
+        if (is_type<opset1::Constant>(inputNode)) {
+            continue;
+        }
+
+        if (!is_type<opset1::FakeQuantize>(inputNode)) {
+            leastOneOperationIsNotFakeQuantize = true;
+            break;
+        }
+
+        leastOneOperationIsFakeQuantize = true;
+    }
+
+    if (leastOneOperationIsFakeQuantize && !leastOneOperationIsNotFakeQuantize) {
+        auto& rt = node->get_rt_info();
+        const auto attribute = std::make_shared<ngraph::VariantWrapper<QuantizationAlignmentAttributePtr>>(
+            make_shared_attribute<QuantizationAlignmentAttribute>());
+        rt[ngraph::VariantWrapper<QuantizationAlignmentAttributePtr>::type_info.name] = attribute;
+        return attribute;
+    }
+
+    return nullptr;
+}
+
+void VariantWrapper<QuantizationAlignmentAttributePtr>::merge(
+    std::vector<std::shared_ptr<VariantWrapper<std::shared_ptr<QuantizationAlignmentAttribute>>>>& attributes) {
+    auto currentAttributte = get();
+    for (const auto& attribute : attributes) {
+        currentAttributte->sharedValue->value = currentAttributte->sharedValue->value || attribute->get()->sharedValue->value;
+    }
+}
+
+std::string VariantWrapper<QuantizationAlignmentAttributePtr>::to_string() {
+    std::stringstream ss;
+    ss << m_value->get_string();
+    ss << "value: " << (m_value->sharedValue->value ? "true" : "false");
+    return ss.str();
+}
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/shared_value_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/shared_value_attribute.cpp
new file mode 100644
index 00000000000000..95cc5fa72eae79
--- /dev/null
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/shared_value_attribute.cpp
@@ -0,0 +1,16 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "low_precision/rt_info/shared_value_attribute.hpp"
+
+#include <memory>
+#include <string>
+#include <unordered_map>
+#include <iterator>
+#include <vector>
+
+#include <ngraph/opsets/opset1.hpp>
+#include "low_precision/network_helper.hpp"
+
+using namespace ngraph;
diff --git a/inference-engine/src/low_precision_transformations/src/shuffle_channels.cpp b/inference-engine/src/low_precision_transformations/src/shuffle_channels.cpp
index 2ed3e54a86badb..129bcb23977547 100644
--- a/inference-engine/src/low_precision_transformations/src/shuffle_channels.cpp
+++ b/inference-engine/src/low_precision_transformations/src/shuffle_channels.cpp
@@ -8,21 +8,32 @@
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
-ShuffleChannelsTransformation::ShuffleChannelsTransformation(const Params& params) : LayerTransformation(params) {}
 
-void ShuffleChannelsTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::ShuffleChannels>({ make_op_label<opset1::Multiply>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::ShuffleChannelsTransformation, "ShuffleChannelsTransformation", 0);
+
+ShuffleChannelsTransformation::ShuffleChannelsTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::ShuffleChannels>({ pattern::wrap_type<opset1::Multiply>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "ShuffleChannelsTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool ShuffleChannelsTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) const {
+bool ShuffleChannelsTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/split.cpp b/inference-engine/src/low_precision_transformations/src/split.cpp
index 919c6b5e87b185..a663fc64f0a2fa 100644
--- a/inference-engine/src/low_precision_transformations/src/split.cpp
+++ b/inference-engine/src/low_precision_transformations/src/split.cpp
@@ -4,21 +4,34 @@
 
 #include "low_precision/split.hpp"
 #include "ngraph/node.hpp"
+
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 #include "low_precision/common/dequantization_op.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
-SplitTransformation::SplitTransformation(const Params& params) : LayerTransformation(params) {}
 
-void SplitTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::Split>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::SplitTransformation, "SplitTransformation", 0);
+
+SplitTransformation::SplitTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Split>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "SplitTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool SplitTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) const {
+bool SplitTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
@@ -106,19 +119,20 @@ void SplitTransformation::updateOutputs(
     TransformationContext& context,
     std::vector<std::shared_ptr<ngraph::Node>> lastNodes,
     std::shared_ptr<ngraph::Node> originalNode) const {
-    const size_t outputSize = context.function->get_output_size();
-    if (outputSize == 1) {
+    //TODO: LPT: during refactoring update is not tested
+    if (lastNodes.size() == 1ul) {
         updateOutput(context, lastNodes[0], originalNode);
     } else {
         const std::string originalName = originalNode->get_friendly_name();
-        for (size_t outIdx = 0; outIdx < lastNodes.size(); ++outIdx) {
-            for (size_t i = 0; i < outputSize; ++i) {
-                std::shared_ptr<ngraph::Node> result = context.function->get_output_op(i);
-                std::shared_ptr<ngraph::Node> outputNode = result->get_input_node_shared_ptr(0);
-                if (outputNode.get() == lastNodes[outIdx].get()) {
-                    originalNode->set_friendly_name(originalName + LayerTransformation::originalLayerPostfix);
-                    lastNodes[outIdx]->set_friendly_name(originalName + "." + std::to_string(outIdx));
-                    break;
+        for (size_t i = 0; i < lastNodes.size(); ++i) {
+            const auto lastNode = lastNodes[i];
+            for (auto output : lastNodes[i]->outputs()) {
+                for (auto input : output.get_target_inputs()) {
+                    if (is_type<ngraph::opset1::Result>(input.get_node())) {
+                        originalNode->set_friendly_name(originalName + LayerTransformation::originalLayerPostfix);
+                        lastNode->set_friendly_name(originalName + "." + std::to_string(i));
+                        break;
+                    }
                 }
             }
         }
diff --git a/inference-engine/src/low_precision_transformations/src/squeeze.cpp b/inference-engine/src/low_precision_transformations/src/squeeze.cpp
index 4203f8ce4f251c..8ecad0adea489a 100644
--- a/inference-engine/src/low_precision_transformations/src/squeeze.cpp
+++ b/inference-engine/src/low_precision_transformations/src/squeeze.cpp
@@ -8,23 +8,32 @@
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::SqueezeTransformation, "SqueezeTransformation", 0);
+
 SqueezeTransformation::SqueezeTransformation(const Params& params) : LayerTransformation(params) {
-}
+    auto matcher = pattern::wrap_type<opset1::Squeeze>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void SqueezeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Squeeze>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "SqueezeTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool SqueezeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool SqueezeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/strided_slice.cpp b/inference-engine/src/low_precision_transformations/src/strided_slice.cpp
index ea01d1e8b24715..5e34d1bf45b453 100644
--- a/inference-engine/src/low_precision_transformations/src/strided_slice.cpp
+++ b/inference-engine/src/low_precision_transformations/src/strided_slice.cpp
@@ -7,12 +7,15 @@
 #include <memory>
 #include <ngraph/ngraph.hpp>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::StridedSliceTransformation, "StridedSliceTransformation", 0);
+
 std::shared_ptr<Node> stridedSliceDeqConstant(
     const std::shared_ptr<ngraph::Node> strSlice,
     const std::shared_ptr<ngraph::Node> dequantizaitonConstant) {
@@ -71,19 +74,22 @@ std::shared_ptr<Node> stridedSliceDeqConstant(
     return NetworkHelper::toScalarIfPossible(result);
 }
 
-StridedSliceTransformation::StridedSliceTransformation(const Params& params) : LayerTransformation(params) {}
+StridedSliceTransformation::StridedSliceTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = ngraph::pattern::wrap_type<opset1::StridedSlice>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void StridedSliceTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-        context,
-        make_op_pattern<opset1::StridedSlice>({
-            make_op_label<opset1::Multiply>(),
-            make_op_label<opset1::Constant>(),
-            make_op_label<opset1::Constant>(),
-            make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "StridedSliceTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool StridedSliceTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) const {
+bool StridedSliceTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher& m) {
     if (!StridedSliceTransformation::canBeTransformed(context, m.get_match_root())) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/subgraph.cpp b/inference-engine/src/low_precision_transformations/src/subgraph.cpp
deleted file mode 100644
index 4fd36f8d7e8b6c..00000000000000
--- a/inference-engine/src/low_precision_transformations/src/subgraph.cpp
+++ /dev/null
@@ -1,246 +0,0 @@
-﻿// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <algorithm>
-#include <memory>
-#include <string>
-#include <unordered_set>
-#include <utility>
-#include <vector>
-
-#include <ngraph/rt_info.hpp>
-#include <ngraph/opsets/opset1.hpp>
-
-#include <low_precision/common/subgraph.hpp>
-#include "low_precision/quantization_details.hpp"
-#include "low_precision/common/ie_lpt_exception.hpp"
-#include "low_precision/network_helper.hpp"
-
-
-namespace ngraph {
-namespace pass {
-namespace low_precision {
-
-bool operationIsSupportedInConcat(const std::shared_ptr<ngraph::Node>& node) {
-    // list of operations, which change channels, but supported in ConcatTransformation
-    if (ngraph::is_type<opset1::StridedSlice>(node) ||
-        ngraph::is_type<opset1::Split>(node) ||
-        ngraph::is_type<opset1::VariadicSplit>(node)) {
-        return true;
-    }
-
-    // operations, which change channels, usually don't support in ConcatTransformation
-    const auto inputs = node->input_values();
-    for (const auto& input : inputs) {
-        if (ngraph::is_type<opset1::Constant>(input.get_node())) {
-            continue;
-        }
-
-        const PartialShape& in = input.get_partial_shape();
-        const PartialShape& out = node->get_output_partial_shape(0);
-        if (in.rank().is_dynamic() || out.rank().is_dynamic()) {
-            return false;
-        }
-
-        const auto inRank = in.rank().get_length();
-        const auto outRank = out.rank().get_length();
-        if (inRank < 2 || outRank < 2) {
-            return false;
-        }
-
-        for (int i = 0; i < 2; ++i) {
-            if ((i >= inRank) || (i >= outRank)) {
-                // all previous dimensions are equal
-                return true;
-            }
-            if (in[i] != out[i]) {
-                return false;
-            }
-        }
-    }
-
-    return true;
-}
-
-Subgraph::Subgraph(ngraph::pass::ILayerTransformationsManager* layerTransformationsManager) : layerTransformationsManager(layerTransformationsManager) {
-}
-
-bool Subgraph::fillSubgraphForQuantization(
-    const std::shared_ptr<ngraph::opset1::FakeQuantize>& fakeQuantize,
-    std::unordered_set<std::string>& handledLayers) {
-    quantizationLayers.push_back(fakeQuantize);
-    handledLayers.insert(fakeQuantize->get_friendly_name());
-    layers.emplace(fakeQuantize->get_friendly_name(), fakeQuantize);
-
-    for (size_t index = 0; index < fakeQuantize->get_output_size(); ++index) {
-        const auto childInputs = fakeQuantize->get_output_target_inputs(index);
-        for (const auto childInput : childInputs) {
-            const std::shared_ptr<ngraph::Node> child = childInput.get_node()->shared_from_this();
-            if (handledLayers.find(child->get_friendly_name()) != handledLayers.end()) {
-                continue;
-            }
-
-            const std::shared_ptr<ngraph::opset1::Concat> concatChild = ngraph::as_type_ptr<ngraph::opset1::Concat>(child);
-            if (concatChild != nullptr) {
-                if (!fillSubgraphForConcat(concatChild, handledLayers)) {
-                    return false;
-                }
-            } else {
-                const std::shared_ptr<ngraph::opset1::FakeQuantize> fakeQuantizeChild = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(child);
-                if (fakeQuantizeChild != nullptr) {
-                    //
-                } else {
-                    if (layerTransformationsManager->isPrecisionPreserved(child) && operationIsSupportedInConcat(child)) {
-                        if (!fillSubgraphForIntermediate(child, handledLayers)) {
-                            return false;
-                        }
-                    }
-                }
-            }
-        }
-    }
-
-    return true;
-}
-
-bool Subgraph::atLeastOneIsIntermediate(const std::shared_ptr<ngraph::Node>& node) const {
-    for (size_t index = 0; index < node->get_output_size(); ++index) {
-        const auto childInputs = node->get_output_target_inputs(index);
-        for (const auto childInput : childInputs) {
-            auto child = childInput.get_node()->shared_from_this();
-            if (as_type_ptr<opset1::Concat>(child)) {
-                return true;
-            }
-
-            if (!layerTransformationsManager->isPrecisionPreserved(child) || !operationIsSupportedInConcat(child)) {
-                // child branch is out of subgraph
-                continue;
-            }
-
-            if (atLeastOneIsIntermediate(child)) {
-                return true;
-            }
-        }
-    }
-    return false;
-}
-
-std::shared_ptr<ngraph::opset1::FakeQuantize> getFakeQuantize(const FakeQuantizeDequantization& dequantization) {
-    std::shared_ptr<Node> node = dequantization.data.get_node_shared_ptr();
-    std::shared_ptr<opset1::FakeQuantize> fakeQuantize = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(node);
-    if (fakeQuantize != nullptr) {
-        return fakeQuantize;
-    }
-
-    if (is_type<opset1::Convert>(node)) {
-        fakeQuantize = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(node->get_input_node_shared_ptr(0));
-    }
-    return fakeQuantize;
-}
-
-bool Subgraph::fill(const std::shared_ptr<ngraph::Node>& layer, std::unordered_set<std::string>& handledLayers) {
-    // if at least one parent is handled incorrectly then subgraph is not in low precision
-    for (size_t index = 0; index < layer->get_input_size(); ++index) {
-        const std::shared_ptr<ngraph::Node> parent = layer->get_input_node_shared_ptr(index);
-        if (handledLayers.find(parent->get_friendly_name()) != handledLayers.end()) {
-            continue;
-        }
-
-        const std::shared_ptr<ngraph::opset1::Concat> concatParent = ngraph::as_type_ptr<ngraph::opset1::Concat>(parent);
-        if (concatParent != nullptr) {
-            if (!fillSubgraphForConcat(concatParent, handledLayers)) {
-                return false;
-            }
-        } else {
-            const FakeQuantizeDequantization dequantization = NetworkHelper::getDequantization(parent, 0, true);
-            const std::shared_ptr<ngraph::opset1::FakeQuantize> fakeQuantizeParent = dequantization.empty() ?
-                ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(parent) :
-                getFakeQuantize(dequantization);
-            if (fakeQuantizeParent != nullptr) {
-                if (!fillSubgraphForQuantization(fakeQuantizeParent, handledLayers)) {
-                    //
-                }
-            } else {
-                const std::shared_ptr<ngraph::opset1::Constant> constant = ngraph::as_type_ptr<ngraph::opset1::Constant>(parent);
-                if (constant != nullptr) {
-                    //
-                } else {
-                    if (layerTransformationsManager->isPrecisionPreserved(parent) && operationIsSupportedInConcat(parent)) {
-                        if (!fillSubgraphForIntermediate(parent, handledLayers)) {
-                            return false;
-                        }
-                    } else {
-                        return false;
-                    }
-                }
-            }
-        }
-    }
-
-    // TODO: if at least one child was handled correctly then subgraph is low precision
-    for (size_t index = 0; index < layer->get_output_size(); ++index) {
-        const auto childInputs = layer->get_output_target_inputs(index);
-        for (const auto childInput : childInputs) {
-            const std::shared_ptr<ngraph::Node> child = childInput.get_node()->shared_from_this();
-
-            if (handledLayers.find(child->get_friendly_name()) != handledLayers.end()) {
-                continue;
-            }
-
-            const std::shared_ptr<ngraph::opset1::Concat> concatChild = ngraph::as_type_ptr<ngraph::opset1::Concat>(child);
-            if (concatChild != nullptr) {
-                if (!fillSubgraphForConcat(concatChild, handledLayers)) {
-                    return false;
-                }
-            } else {
-                // check if children branches between Concat operations
-                if (!atLeastOneIsIntermediate(child)) {
-                    continue;
-                }
-
-                const std::shared_ptr<ngraph::opset1::FakeQuantize> fakeQuantizeChild = ngraph::as_type_ptr<ngraph::opset1::FakeQuantize>(child);
-                if (fakeQuantizeChild != nullptr) {
-                    //
-                } else if (layerTransformationsManager->isPrecisionPreserved(child) && operationIsSupportedInConcat(child)) {
-                    if (!fillSubgraphForIntermediate(child, handledLayers)) {
-                        return false;
-                    }
-                }
-            }
-        }
-    }
-
-    return true;
-}
-
-bool Subgraph::fillSubgraphForIntermediate(const std::shared_ptr<ngraph::Node>& intermediate, std::unordered_set<std::string>& handledLayers) {
-    handledLayers.insert(intermediate->get_friendly_name());
-    layers.emplace(intermediate->get_friendly_name(), intermediate);
-
-    return fill(intermediate, handledLayers);
-}
-
-bool Subgraph::empty() const {
-    return quantizationLayers.empty();
-}
-
-bool Subgraph::fillSubgraphForConcat(const std::shared_ptr<ngraph::opset1::Concat>& concat, std::unordered_set<std::string>& handledLayers) {
-    const auto axis = concat->get_axis();
-    const size_t normalizedAxis = ngraph::normalize_axis(concat->get_friendly_name(), axis, concat->get_output_partial_shape(0).rank());
-    // supported only per-channel concat
-    if (normalizedAxis != 1ul) {
-        return false;
-    }
-
-    concatLayers.push_back(concat);
-    handledLayers.insert(concat->get_friendly_name());
-    layers.emplace(concat->get_friendly_name(), concat);
-
-    std::shared_ptr<ngraph::Node> node = concat;
-    return fill(node, handledLayers);
-}
-
-}  // namespace low_precision
-}  // namespace pass
-}  // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/subtract.cpp b/inference-engine/src/low_precision_transformations/src/subtract.cpp
index 2f86bfc97c7931..4c71e191c2f6e2 100644
--- a/inference-engine/src/low_precision_transformations/src/subtract.cpp
+++ b/inference-engine/src/low_precision_transformations/src/subtract.cpp
@@ -11,6 +11,9 @@
 #include <utility>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+#include <ngraph/pattern/op/or.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -18,19 +21,27 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void SubtractTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Subtract>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::SubtractTransformation, "SubtractTransformation", 0);
+
+SubtractTransformation::SubtractTransformation(const Params& params) : LayerTransformation(params) {
+    auto convert = pattern::wrap_type<opset1::Convert>();
+    auto multiply = pattern::wrap_type<opset1::Multiply>();
+    auto subParent = std::make_shared<pattern::op::Or>(OutputVector{ convert, multiply });
+    auto subtract = pattern::wrap_type<opset1::Subtract>({ subParent, pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Subtract>({ make_op_label<opset1::Convert>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(subtract, "SubtractTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool SubtractTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool SubtractTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<opset1::Subtract> subtract = as_type_ptr<opset1::Subtract>(m.get_match_root());
     if (!canBeTransformed(context, subtract)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/subtract_multiply_to_multiply_add.cpp b/inference-engine/src/low_precision_transformations/src/subtract_multiply_to_multiply_add.cpp
index f79021f93b8bae..f8554db8721ed9 100644
--- a/inference-engine/src/low_precision_transformations/src/subtract_multiply_to_multiply_add.cpp
+++ b/inference-engine/src/low_precision_transformations/src/subtract_multiply_to_multiply_add.cpp
@@ -8,6 +8,7 @@
 #include <string>
 #include <vector>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 #include "low_precision/common/dequantization_op.hpp"
@@ -16,8 +17,21 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void SubtractMultiplyToMultiplyAddTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addSingleNodePattern<opset1::Multiply>(pass, context);
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::SubtractMultiplyToMultiplyAddTransformation, "SubtractMultiplyToMultiplyAddTransformation", 0);
+
+SubtractMultiplyToMultiplyAddTransformation::SubtractMultiplyToMultiplyAddTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Multiply>();
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "SubtractMultiplyToMultiplyAddTransformation");
+    this->register_matcher(m, callback);
 }
 
 FakeQuantizeDequantization get(const std::shared_ptr<Node> node) {
@@ -52,7 +66,7 @@ FakeQuantizeDequantization get(const std::shared_ptr<Node> node) {
     return FakeQuantizeDequantization(dataNode, convert, subtract, subtractConvert, subtractConstant, multiply, multiplyConstant);
 }
 
-bool SubtractMultiplyToMultiplyAddTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool SubtractMultiplyToMultiplyAddTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     auto multiply = m.get_match_root();
     if (!canBeTransformed(context, multiply)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/transformation_context.cpp b/inference-engine/src/low_precision_transformations/src/transformation_context.cpp
index 22d8d3444682de..d5d21c7ecfcc9a 100644
--- a/inference-engine/src/low_precision_transformations/src/transformation_context.cpp
+++ b/inference-engine/src/low_precision_transformations/src/transformation_context.cpp
@@ -8,6 +8,8 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
+TransformationContext::TransformationContext() : function(nullptr) {}
+
 TransformationContext::TransformationContext(std::shared_ptr<Function> function) : function(function) {
 }
 
diff --git a/inference-engine/src/low_precision_transformations/src/transformer.cpp b/inference-engine/src/low_precision_transformations/src/transformer.cpp
deleted file mode 100644
index 6018c6f820f67b..00000000000000
--- a/inference-engine/src/low_precision_transformations/src/transformer.cpp
+++ /dev/null
@@ -1,504 +0,0 @@
-﻿// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "low_precision/transformer.hpp"
-#include "low_precision/network_helper.hpp"
-
-#include <algorithm>
-#include <cmath>
-#include <limits>
-#include <map>
-#include <memory>
-#include <string>
-#include <typeinfo>
-#include <unordered_set>
-#include <utility>
-#include <vector>
-
-#include "ngraph_ops/type_relaxed.hpp"
-#include "ngraph/pass/constant_folding.hpp"
-#include "ngraph/opsets/opset6.hpp"
-
-#include "lpt_itt.h"
-
-// branch specific transformations
-#include "low_precision/concat.hpp"
-#include "low_precision/concat_multi_channels.hpp"
-
-// decomposition transformations
-#include "low_precision/fake_quantize_decomposition.hpp"
-
-// general transformations
-#include "low_precision/add.hpp"
-#include "low_precision/avg_pool.hpp"
-#include "low_precision/clamp.hpp"
-#include "low_precision/convolution.hpp"
-#include "low_precision/convolution_backprop_data.hpp"
-#include "low_precision/depth_to_space.hpp"
-#include "low_precision/fake_quantize.hpp"
-#include "low_precision/group_convolution.hpp"
-#include "low_precision/interpolate.hpp"
-#include "low_precision/mat_mul.hpp"
-#include "low_precision/max_pool.hpp"
-#include "low_precision/multiply.hpp"
-#include "low_precision/mvn.hpp"
-#include "low_precision/normalize_l2.hpp"
-#include "low_precision/prelu.hpp"
-#include "low_precision/reduce_max.hpp"
-#include "low_precision/reduce_mean.hpp"
-#include "low_precision/reduce_min.hpp"
-#include "low_precision/reduce_sum.hpp"
-#include "low_precision/reshape.hpp"
-#include "low_precision/relu.hpp"
-#include "low_precision/shuffle_channels.hpp"
-#include "low_precision/squeeze.hpp"
-#include "low_precision/subtract.hpp"
-#include "low_precision/split.hpp"
-#include "low_precision/strided_slice.hpp"
-#include "low_precision/transpose.hpp"
-#include "low_precision/unsqueeze.hpp"
-#include "low_precision/variadic_split.hpp"
-#include "low_precision/split.hpp"
-
-// cleanup transformations
-#include "low_precision/fuse_convert.hpp"
-#include "low_precision/fold_convert.hpp"
-#include "low_precision/fuse_fake_quantize.hpp"
-#include "low_precision/fuse_subtract_to_fake_quantize.hpp"
-#include "low_precision/fuse_multiply_to_fake_quantize.hpp"
-#include "low_precision/multiply_to_group_convolution.hpp"
-#include "low_precision/subtract_multiply_to_multiply_add.hpp"
-
-namespace ngraph {
-namespace pass {
-namespace low_precision {
-
-LowPrecisionTransformations::LowPrecisionTransformations(
-    const std::map<std::string, LayerTransformationPtr>& branchSpecificTransformations,
-    const std::map<std::string, LayerTransformationPtr>& decompositionTransformations,
-    const std::map<std::string, LayerTransformationPtr>& transformations,
-    const std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>>& cleanupTransformations,
-    const std::vector<StandaloneCleanup>& standaloneCleanupTransformations) :
-    branchSpecificTransformations(branchSpecificTransformations),
-    decompositionTransformations(decompositionTransformations),
-    transformations(transformations),
-    cleanupTransformations(cleanupTransformations),
-    standaloneCleanupTransformations(standaloneCleanupTransformations) {}
-
-void LowPrecisionTransformations::setUpdatePrecisions(const bool updatePrecisions) {
-    for (auto it = branchSpecificTransformations.begin(); it != branchSpecificTransformations.end(); ++it) {
-        it->second->setUpdatePrecisions(updatePrecisions);
-    }
-    for (auto it = transformations.begin(); it != transformations.end(); ++it) {
-        it->second->setUpdatePrecisions(updatePrecisions);
-    }
-}
-
-void LowPrecisionTransformations::setQuantizedTensorAlignmentOnActivations(
-    const LayerTransformation::QuantizedTensorAlignment quantizedTensorAlignmentOnActivations) {
-    for (auto it = branchSpecificTransformations.begin(); it != branchSpecificTransformations.end(); ++it) {
-        it->second->setQuantizedTensorAlignmentOnActivations(quantizedTensorAlignmentOnActivations);
-    }
-    for (auto it = transformations.begin(); it != transformations.end(); ++it) {
-        it->second->setQuantizedTensorAlignmentOnActivations(quantizedTensorAlignmentOnActivations);
-    }
-}
-
-void LowPrecisionTransformations::setQuantizedTensorAlignmentOnWeights(
-    const LayerTransformation::QuantizedTensorAlignment quantizedTensorAlignmentOnWeights) {
-    for (auto it = branchSpecificTransformations.begin(); it != branchSpecificTransformations.end(); ++it) {
-        it->second->setQuantizedTensorAlignmentOnWeights(quantizedTensorAlignmentOnWeights);
-    }
-    for (auto it = transformations.begin(); it != transformations.end(); ++it) {
-        it->second->setQuantizedTensorAlignmentOnWeights(quantizedTensorAlignmentOnWeights);
-    }
-}
-
-std::vector<LayerTransformationPtr> LowPrecisionTransformations::find(const std::string& transformationKey) const {
-    auto it = branchSpecificTransformations.find(transformationKey);
-    std::vector<LayerTransformationPtr> res;
-    if (it != branchSpecificTransformations.end()) {
-        res.emplace_back(it->second);
-    }
-
-    it = transformations.find(transformationKey);
-    if (it != transformations.end()) {
-        res.emplace_back(it->second);
-    }
-
-    const auto it1 = cleanupTransformations.find(transformationKey);
-    if (it1 != cleanupTransformations.end()) {
-        for (const auto& transformation : it1->second) {
-            res.emplace_back(transformation.second);
-        }
-    }
-
-    for (const auto& transformation : standaloneCleanupTransformations) {
-        if (transformation.typeName == transformationKey) {
-            res.emplace_back(transformation.transformation);
-        }
-    }
-
-    return res;
-}
-
-void LowPrecisionTransformations::setParamsManager(IParamsManager* paramsManager) noexcept {
-    setParamsManager(paramsManager, branchSpecificTransformations);
-    setParamsManager(paramsManager, decompositionTransformations);
-    setParamsManager(paramsManager, transformations);
-    setParamsManager(paramsManager, cleanupTransformations);
-    setParamsManager(paramsManager, standaloneCleanupTransformations);
-}
-
-void LowPrecisionTransformations::setLayerTransformationsManager(ILayerTransformationsManager* layerTransformationsManager) noexcept {
-    setLayerTransformationsManager(layerTransformationsManager, branchSpecificTransformations);
-    setLayerTransformationsManager(layerTransformationsManager, decompositionTransformations);
-    setLayerTransformationsManager(layerTransformationsManager, transformations);
-    setLayerTransformationsManager(layerTransformationsManager, cleanupTransformations);
-    setLayerTransformationsManager(layerTransformationsManager, standaloneCleanupTransformations);
-}
-
-void LowPrecisionTransformations::setParamsManager(
-    IParamsManager* paramsManager,
-    std::map<std::string, LayerTransformationPtr>& transformations) noexcept {
-    for (auto it : transformations) {
-        it.second->setParamsManager(paramsManager);
-    }
-}
-
-void LowPrecisionTransformations::setParamsManager(
-    IParamsManager* paramsManager,
-    std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>>& transformations) noexcept {
-    for (auto it : transformations) {
-        for (auto transform : it.second) {
-            transform.second->setParamsManager(paramsManager);
-        }
-    }
-}
-
-void LowPrecisionTransformations::setParamsManager(
-    IParamsManager* paramsManager,
-    std::vector<StandaloneCleanup>& transformations) noexcept {
-    for (auto it : transformations) {
-        it.transformation->setParamsManager(paramsManager);
-    }
-}
-
-void LowPrecisionTransformations::setLayerTransformationsManager(
-    ILayerTransformationsManager* layerTransformationsManager,
-    std::map<std::string, LayerTransformationPtr>& transformations) noexcept {
-    for (auto it : transformations) {
-        it.second->setLayerTransformationsManager(layerTransformationsManager);
-    }
-}
-
-void LowPrecisionTransformations::setLayerTransformationsManager(
-    ILayerTransformationsManager* layerTransformationsManager,
-    std::map < std::string, std::vector < std::pair<std::string,  LayerTransformationPtr >> > & transformations) noexcept {
-    for (auto it : transformations) {
-        for (auto transform : it.second) {
-            transform.second->setLayerTransformationsManager(layerTransformationsManager);
-        }
-    }
-}
-
-void LowPrecisionTransformations::setLayerTransformationsManager(
-    ILayerTransformationsManager* layerTransformationsManager,
-    std::vector<StandaloneCleanup>& transformations) noexcept {
-    for (auto it : transformations) {
-        it.transformation->setLayerTransformationsManager(layerTransformationsManager);
-    }
-}
-
-LowPrecisionTransformations LowPrecisionTransformer::getAllTransformations(const LayerTransformation::Params& params) {
-    using namespace pass::low_precision;
-
-    auto transformer = LowPrecisionTransformations().
-        addBranchSpecific<pass::low_precision::ConcatMultiChannelsTransformation, opset1::Concat>(params).
-
-        addDecomposition<pass::low_precision::FakeQuantizeDecompositionTransformation, opset1::FakeQuantize>(params).
-
-        add<AddTransformation, opset1::Add>(params).
-        add<AvgPoolTransformation, opset1::AvgPool>(params).
-        add<ClampTransformation, opset1::Clamp>(params).
-        add<ConvolutionTransformation, opset1::Convolution>(params).
-        add<ConvolutionBackpropDataTransformation, opset1::ConvolutionBackpropData>(params).
-        add<DepthToSpaceTransformation, opset1::DepthToSpace>(params).
-        add<FakeQuantizeTransformation, opset1::FakeQuantize>(params).
-        add<GroupConvolutionTransformation, opset1::GroupConvolution>(params).
-        add<InterpolateTransformation, opset1::Interpolate>(params).
-        add<InterpolateTransformation, opset4::Interpolate>(params).
-        add<MatMulTransformation, opset1::MatMul>(params).
-        add<MaxPoolTransformation, opset1::MaxPool>(params).
-        add<MultiplyTransformation, opset1::Multiply>(params).
-        add<MVNTransformation, op::MVN>(params).
-        add<MVNTransformation, opset6::MVN>(params).
-        add<NormalizeL2Transformation, opset1::NormalizeL2>(params).
-        add<PReluTransformation, opset1::PRelu>(params).
-        add<ReduceMaxTransformation, opset1::ReduceMax>(params).
-        add<ReduceMeanTransformation, opset1::ReduceMean>(params).
-        add<ReduceMinTransformation, opset1::ReduceMin>(params).
-        add<ReduceSumTransformation, opset1::ReduceSum>(params).
-        add<ReluTransformation, opset1::Relu>(params).
-        add<ReshapeTransformation, opset1::Reshape>(params).
-        add<ShuffleChannelsTransformation, opset1::ShuffleChannels>(params).
-        add<SqueezeTransformation, opset1::Squeeze>(params).
-        add<SplitTransformation, opset1::Split>(params).
-        add<StridedSliceTransformation, opset1::StridedSlice>(params).
-        add<TransposeTransformation, opset1::Transpose>(params).
-        add<UnsqueezeTransformation, opset1::Unsqueeze>(params).
-        add<VariadicSplitTransformation, opset1::VariadicSplit>(params).
-
-        addCleanup<FoldConvertTransformation, opset1::Subtract>(params).
-        addCleanup<FuseConvertTransformation, opset1::Multiply>(params).
-
-        addStandaloneCleanup<FuseSubtractToFakeQuantizeTransformation, opset1::Subtract>(params).
-        addStandaloneCleanup<FuseMultiplyToFakeQuantizeTransformation, opset1::Multiply>(params).
-        addStandaloneCleanup<MultiplyToGroupConvolutionTransformation, opset1::Multiply>(params).
-        addStandaloneCleanup<SubtractMultiplyToMultiplyAddTransformation, opset1::Multiply>(params);
-
-    return transformer;
-}
-
-bool LowPrecisionTransformer::isFunctionQuantized(const std::shared_ptr<const Function>& function) {
-    std::set<std::shared_ptr<Node>> handledNodes;
-    std::deque<std::shared_ptr<Node>> nodes;
-    for (auto result : function->get_results()) {
-        nodes.push_front(result);
-    }
-
-    while (!nodes.empty()) {
-        auto node = nodes.front();
-        nodes.pop_front();
-
-        for (size_t i = 0; i < node->inputs().size(); ++i) {
-            auto parent = node->get_input_node_shared_ptr(i);
-            if (handledNodes.find(parent) != handledNodes.end()) {
-                continue;
-            }
-
-            const std::shared_ptr<ngraph::opset1::FakeQuantize> fakeQuantize = as_type_ptr<ngraph::opset1::FakeQuantize>(parent);
-            if ((fakeQuantize != nullptr) &&
-                QuantizationDetails::outputLayoutIsSupported(fakeQuantize) &&
-                QuantizationDetails::isSupportedLevel(fakeQuantize->get_levels())) {
-                return true;
-            }
-
-            nodes.push_front(parent);
-            handledNodes.insert(parent);
-        }
-    }
-    return false;
-}
-
-LowPrecisionTransformer::LowPrecisionTransformer(): transformations(LowPrecisionTransformer::getAllTransformations()) {}
-
-template <typename BaseOp>
-void make_matcher_type_relaxed(ngraph::pass::GraphRewrite* transformation) {
-    using namespace ngraph;
-
-    auto is_op_type = [](std::shared_ptr<Node> n) {
-        return !!as_type_ptr<BaseOp>(n);
-    };
-
-    auto p_node = std::make_shared<pattern::op::Label>(element::f32, Shape{}, is_op_type);
-
-    ngraph::graph_rewrite_callback callback = [](ngraph::pattern::Matcher &m) {
-        auto l_node = std::dynamic_pointer_cast<BaseOp>(m.get_match_root());
-        if (std::dynamic_pointer_cast<op::TypeRelaxedBase>(l_node)) {
-            return false;
-        }
-        if (!l_node) {
-            THROW_IE_LPT_EXCEPTION(*l_node) << "unexpected operation type";
-        }
-
-        std::vector<element::Type> inputPrecisions;
-        for (auto& inputs : l_node->inputs()) {
-            inputPrecisions.push_back(inputs.get_element_type());
-        }
-
-        std::vector<element::Type> outputPrecisions;
-        for (auto& output : l_node->outputs()) {
-            outputPrecisions.push_back(output.get_element_type());
-        }
-
-        auto replacement = std::make_shared<ngraph::op::TypeRelaxed<BaseOp>>(*l_node, inputPrecisions, outputPrecisions);
-
-        copy_runtime_info(l_node, replacement);
-        replace_node(l_node, replacement);
-        return true;
-    };
-
-    auto m = std::make_shared<ngraph::pattern::Matcher>(p_node, "TypeRelaxedReplacer");
-    NGRAPH_SUPPRESS_DEPRECATED_START
-    transformation->add_matcher(m, callback, ngraph::pass::PassProperty::CHANGE_DYNAMIC_STATE);
-    NGRAPH_SUPPRESS_DEPRECATED_END
-}
-
-TypeRelaxedReplacer::TypeRelaxedReplacer() {
-    make_matcher_type_relaxed<opset1::Add>(this);
-    make_matcher_type_relaxed<opset1::AvgPool>(this);
-    make_matcher_type_relaxed<opset1::Clamp>(this);
-    make_matcher_type_relaxed<opset1::Concat>(this);
-    make_matcher_type_relaxed<opset1::Convolution>(this);
-    make_matcher_type_relaxed<opset1::ConvolutionBackpropData>(this);
-    make_matcher_type_relaxed<opset1::DepthToSpace>(this);
-    make_matcher_type_relaxed<opset1::FakeQuantize>(this);
-    make_matcher_type_relaxed<opset1::GroupConvolution>(this);
-    make_matcher_type_relaxed<opset1::PRelu>(this);
-    make_matcher_type_relaxed<opset1::ReduceMean>(this);
-    make_matcher_type_relaxed<opset1::ReduceSum>(this);
-    make_matcher_type_relaxed<opset1::Subtract>(this);
-    make_matcher_type_relaxed<opset1::Interpolate>(this);
-    make_matcher_type_relaxed<opset1::Multiply>(this);
-    make_matcher_type_relaxed<op::MVN>(this);
-    make_matcher_type_relaxed<opset6::MVN>(this);
-    make_matcher_type_relaxed<opset1::NormalizeL2>(this);
-    make_matcher_type_relaxed<opset4::Interpolate>(this);
-}
-
-LowPrecisionTransformer::LowPrecisionTransformer(const LowPrecisionTransformations& transformations)
-    : transformations(transformations) {}
-
-void LowPrecisionTransformer::transform(std::shared_ptr<Function> network) {
-    if (!isFunctionQuantized(network)) {
-        return;
-    }
-
-    OV_ITT_SCOPE_CHAIN(FIRST_INFERENCE, taskChain, itt::domains::LPT_LT, "LowPrecisionTransformer", "transform");
-
-    ngraph::pass::ConstantFolding constantFolding;
-    constantFolding.run_on_function(network);
-
-    transformations.setParamsManager(this);
-    transformations.setLayerTransformationsManager(this);
-
-    TransformationContext context(network);
-
-    OV_ITT_SCOPE_NEXT(FIRST_INFERENCE, taskChain, "TypeRelaxedReplacer");
-
-    // Extend necessary operations with polymorphic semantics
-    {
-        TypeRelaxedReplacer pass;
-        pass.run_on_function(network);
-    }
-
-    OV_ITT_SCOPE_NEXT(FIRST_INFERENCE, taskChain, "BranchSpecificTransformations");
-
-    {
-        // Branch specific transformations
-        GraphRewrite pass;
-        registerAllMatchers(transformations.branchSpecificTransformations, pass, context);
-        pass.run_on_function(network);
-    }
-
-    OV_ITT_SCOPE_NEXT(FIRST_INFERENCE, taskChain, "FakeQuantizeDecomposition");
-
-    {
-        // Step #1: FakeQuantize decomposition transformation execution
-        GraphRewrite pass;
-        registerAllMatchers(transformations.decompositionTransformations, pass, context);
-        pass.run_on_function(network);
-    }
-
-    OV_ITT_SCOPE_NEXT(FIRST_INFERENCE, taskChain, "LayerTransformations");
-
-    {
-        // Step #2: layer transformations execution
-        GraphRewrite pass;
-        registerAllMatchers(transformations.transformations, pass, context);
-        pass.run_on_function(network);
-    }
-
-    OV_ITT_SCOPE_NEXT(FIRST_INFERENCE, taskChain, "CleanupTransformations");
-
-    {
-        // Step #3: cleanup transformations execution
-        GraphRewrite pass;
-        registerAllMatchers(transformations.cleanupTransformations, pass, context);
-        pass.run_on_function(network);
-    }
-
-    OV_ITT_SCOPE_NEXT(FIRST_INFERENCE, taskChain, "StandaloneCleanupTransformations");
-
-    {
-        // Step #4: standalone cleanup transformations execution
-
-        for (auto it : transformations.standaloneCleanupTransformations) {
-            GraphRewrite pass;
-            it.transformation->registerMatcherIn(pass, context);
-            pass.run_on_function(network);
-        }
-    }
-
-    network->validate_nodes_and_infer_types();
-}
-
-std::vector<element::Type> LowPrecisionTransformer::getPrecisionsOnActivations(const Node& op) const noexcept {
-    const std::string operantionType = LowPrecisionTransformations::getType(op);
-    const std::vector<LayerTransformationPtr> transformation = transformations.find(operantionType);
-    if (transformation.empty()) {
-        return std::vector<element::Type>();
-    }
-    std::vector<element::Type> precisions = transformation[0]->getPrecisionsOnActivations();
-
-    for (const auto& transform : transformation) {
-        precisions = NetworkHelper::precisionIntersection(precisions, transform->getPrecisionsOnActivations());
-    }
-    return precisions;
-}
-
-bool LowPrecisionTransformer::isQuantized(const std::shared_ptr<Node>& layer) const noexcept {
-    const std::string operantionType = LowPrecisionTransformations::getType(*layer);
-    const std::vector<LayerTransformationPtr> transformation = transformations.find(operantionType);
-    if (transformation.empty()) {
-        return false;
-    }
-
-    for (const auto& transform : transformation) {
-        if (!transform->isQuantized(layer)) {
-            return false;
-        }
-    }
-    return true;
-}
-
-bool LowPrecisionTransformer::isPrecisionPreserved(const std::shared_ptr<Node>& layer) const noexcept {
-    const std::string operantionType = LowPrecisionTransformations::getType(*layer);
-    const std::vector<LayerTransformationPtr> transformation = transformations.find(operantionType);
-    if (transformation.empty()) {
-        return false;
-    }
-
-    for (const auto& transform : transformation) {
-        if (!transform->isPrecisionPreserved(layer)) {
-            return false;
-        }
-    }
-    return true;
-}
-
-void LowPrecisionTransformer::registerAllMatchers(
-    std::map<std::string, LayerTransformationPtr> transformations,
-    GraphRewrite& pass,
-    TransformationContext& context) {
-    for (auto it : transformations) {
-        it.second->registerMatcherIn(pass, context);
-    }
-}
-
-void LowPrecisionTransformer::registerAllMatchers(
-    std::map<std::string, std::vector<std::pair<std::string, LayerTransformationPtr>>> transformations,
-    GraphRewrite& pass,
-    TransformationContext& context) {
-    for (auto it : transformations) {
-        for (auto transform : it.second) {
-            transform.second->registerMatcherIn(pass, context);
-        }
-    }
-}
-
-} // namespace low_precision
-} // namespace pass
-} // namespace ngraph
diff --git a/inference-engine/src/low_precision_transformations/src/transparent_base_transformation.cpp b/inference-engine/src/low_precision_transformations/src/transparent_base_transformation.cpp
index b8c75d43619b49..c89ca0e9144c67 100644
--- a/inference-engine/src/low_precision_transformations/src/transparent_base_transformation.cpp
+++ b/inference-engine/src/low_precision_transformations/src/transparent_base_transformation.cpp
@@ -15,7 +15,7 @@ using namespace ngraph;
 using namespace ngraph::pass;
 using namespace ngraph::pass::low_precision;
 
-bool TransparentBaseTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool TransparentBaseTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     auto operation = m.get_match_root();
     const std::shared_ptr<Node> dequantization = operation->input_value(0).get_node_shared_ptr();
     // const std::shared_ptr<Node> dequantizationParent = dequantization->input_value(0).get_node_shared_ptr();
diff --git a/inference-engine/src/low_precision_transformations/src/transpose.cpp b/inference-engine/src/low_precision_transformations/src/transpose.cpp
index de3cd40e0d5257..66f29a66ec88f9 100644
--- a/inference-engine/src/low_precision_transformations/src/transpose.cpp
+++ b/inference-engine/src/low_precision_transformations/src/transpose.cpp
@@ -7,6 +7,8 @@
 #include <memory>
 #include <ngraph/ngraph.hpp>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/common/ie_lpt_exception.hpp"
 #include "low_precision/network_helper.hpp"
 
@@ -14,11 +16,21 @@ namespace ngraph {
 namespace pass {
 namespace low_precision {
 
-void TransposeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Transpose>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::TransposeTransformation, "TransposeTransformation", 0);
+
+TransposeTransformation::TransposeTransformation(const Params& params) : LayerTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::Transpose>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "TransposeTransformation");
+    this->register_matcher(m, callback);
 }
 
 void transposeDequantizationConstant(std::shared_ptr<Node>& transpose) {
@@ -74,7 +86,7 @@ void transposeDequantizationConstant(std::shared_ptr<Node>& transpose) {
     }
 }
 
-bool TransposeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool TransposeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     std::shared_ptr<Node> transpose = m.get_match_root();
     if (!canBeTransformed(context, transpose)) {
         return false;
diff --git a/inference-engine/src/low_precision_transformations/src/unsqueeze.cpp b/inference-engine/src/low_precision_transformations/src/unsqueeze.cpp
index b53341005d477a..b03046e2253357 100644
--- a/inference-engine/src/low_precision_transformations/src/unsqueeze.cpp
+++ b/inference-engine/src/low_precision_transformations/src/unsqueeze.cpp
@@ -8,23 +8,32 @@
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
 
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::UnsqueezeTransformation, "UnsqueezeTransformation", 0);
+
 UnsqueezeTransformation::UnsqueezeTransformation(const Params& params) : LayerTransformation(params) {
-}
+    auto matcher = pattern::wrap_type<opset1::Unsqueeze>({ pattern::wrap_type<opset1::Multiply>(), pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
 
-void UnsqueezeTransformation::registerMatcherIn(GraphRewrite &pass, TransformationContext &context) const {
-    addPattern(
-        pass,
-        context,
-        make_op_pattern<opset1::Unsqueeze>({ make_op_label<opset1::Multiply>(), make_op_label<opset1::Constant>() }));
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "UnsqueezeTransformation");
+    this->register_matcher(m, callback);
 }
 
-bool UnsqueezeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) const {
+bool UnsqueezeTransformation::transform(TransformationContext& context, ngraph::pattern::Matcher &m) {
     if (!canBeTransformed(context, m.get_match_root())) {
         return false;
     }
diff --git a/inference-engine/src/low_precision_transformations/src/variadic_split.cpp b/inference-engine/src/low_precision_transformations/src/variadic_split.cpp
index 685219f27730d0..8cc9ba7caaadea 100644
--- a/inference-engine/src/low_precision_transformations/src/variadic_split.cpp
+++ b/inference-engine/src/low_precision_transformations/src/variadic_split.cpp
@@ -4,20 +4,33 @@
 
 #include "low_precision/variadic_split.hpp"
 #include "ngraph/node.hpp"
+
+#include <ngraph/pattern/op/wrap_type.hpp>
+
 #include "low_precision/network_helper.hpp"
 
 namespace ngraph {
 namespace pass {
 namespace low_precision {
-VariadicSplitTransformation::VariadicSplitTransformation(const Params& params) : SplitTransformation(params) {}
-
-void VariadicSplitTransformation::registerMatcherIn(GraphRewrite& pass, TransformationContext& context) const {
-    addPattern(pass,
-               context,
-               make_op_pattern<opset1::VariadicSplit>({
-                    make_op_label<opset1::Multiply>(),
-                    make_op_label<opset1::Constant>(),
-                    make_op_label<opset1::Constant>() }));
+
+NGRAPH_RTTI_DEFINITION(ngraph::pass::low_precision::VariadicSplitTransformation, "VariadicSplitTransformation", 0);
+
+VariadicSplitTransformation::VariadicSplitTransformation(const Params& params) : SplitTransformation(params) {
+    auto matcher = pattern::wrap_type<opset1::VariadicSplit>({
+        pattern::wrap_type<opset1::Multiply>(),
+        pattern::wrap_type<opset1::Constant>(),
+        pattern::wrap_type<opset1::Constant>() });
+
+    ngraph::graph_rewrite_callback callback = [this](pattern::Matcher& m) {
+        auto op = m.get_match_root();
+        if (transformation_callback(op)) {
+            return false;
+        }
+        return transform(*context, m);
+    };
+
+    auto m = std::make_shared<ngraph::pattern::Matcher>(matcher, "VariadicSplitTransformation");
+    this->register_matcher(m, callback);
 }
 
 } // namespace low_precision
diff --git a/inference-engine/src/low_precision_transformations/src/weightable_layer_transformation.cpp b/inference-engine/src/low_precision_transformations/src/weightable_layer_transformation.cpp
index c760f9a7bace13..402327f277ad74 100644
--- a/inference-engine/src/low_precision_transformations/src/weightable_layer_transformation.cpp
+++ b/inference-engine/src/low_precision_transformations/src/weightable_layer_transformation.cpp
@@ -42,9 +42,6 @@ bool WeightableLayerTransformation::canConvolutionBeTransformed(const Transforma
     if (dequantization.empty()) {
         const auto fqOnWeights = getFakeQuantizeOnWeights(layer);
         const auto dataPrecision = getDataPrecisionOnWeights(layer);
-        if ((!supportAsymmetricQuantization) && dataPrecision.hasZeroPoint) {
-            return false;
-        }
         if (!NetworkHelper::checkZeroPoint(fqOnWeights, dataPrecision)) {
             return false;
         }
@@ -218,7 +215,7 @@ bool WeightableLayerTransformation::canBeTransformed(const TransformationContext
     return true;
 }
 
-bool WeightableLayerTransformation::isQuantized(std::shared_ptr<Node> layer, bool reshapeIsRequired) const noexcept {
+bool WeightableLayerTransformation::isQuantizedStatic(const std::shared_ptr<const Node>& layer, const bool reshapeIsRequired) noexcept {
     FakeQuantizeDequantization dequantizationOnWeights;
     if (reshapeIsRequired) {
         const auto reshape = layer->get_input_node_shared_ptr(1);
@@ -236,7 +233,9 @@ bool WeightableLayerTransformation::isQuantized(std::shared_ptr<Node> layer, boo
         const std::shared_ptr<opset1::FakeQuantize> fq = as_type_ptr<opset1::FakeQuantize>(layer->get_input_node_shared_ptr(1));
         return NetworkHelper::isQuantizeSupported(fq);
     } else {
-        dequantizationOnWeights = NetworkHelper::getDequantization(layer, 1);
+        // TODO: update NetworkHelper API later
+        const std::shared_ptr<ngraph::Node> op = const_cast<ngraph::Node*>(layer.get())->shared_from_this();
+        dequantizationOnWeights = NetworkHelper::getDequantization(op, 1);
     }
 
     if (dequantizationOnWeights.empty()) {
@@ -283,14 +282,21 @@ bool WeightableLayerTransformation::isPrecisionPreserved(std::shared_ptr<Node> l
     return false;
 }
 
-void WeightableLayerTransformation::decomposeFakeQuantizeForWeightsPath(const std::shared_ptr<Node>& node, const size_t outChannelsShapeIndex) const {
+bool WeightableLayerTransformation::decomposeFakeQuantizeForWeightsPath(const std::shared_ptr<Node>& node, const size_t outChannelsShapeIndex) const {
     const auto fq = getFakeQuantizeOnWeights(node);
     if (fq == nullptr) {
-        return;
+        // FakeQuantize has been decomposed already
+        return true;
     }
 
     const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(fq);
-    const DataPrecision dataPrecision = getDataPrecision(fq, quantizationDetails, true);
+    const auto precisionsAttribute = getAttributeFromOutput<PrecisionsAttributePtr>(fq);
+    const auto precisions = precisionsAttribute == nullptr ?
+        PrecisionsAttribute::defaultPrecisions :
+        precisionsAttribute->get()->sharedValue->precisions;
+
+    const DataPrecision dataPrecision = getDataPrecision(fq, quantizationDetails, precisions);
+
     auto tuple = NetworkHelper::decomposeFakeQuantize(
         fq,
         dataPrecision.precision,
@@ -302,9 +308,16 @@ void WeightableLayerTransformation::decomposeFakeQuantizeForWeightsPath(const st
         outChannelsShapeIndex);
 
     std::shared_ptr<ngraph::Node> fqOnWeights = std::get<0>(tuple);
+    // TODO: LPT: issue #58685
+    if ((!updatePrecisions) && (fqOnWeights == nullptr)) {
+        return false;
+    }
+
     if (as_type_ptr<ngraph::opset1::Constant>(fqOnWeights) == nullptr) {
         THROW_IE_LPT_EXCEPTION(*fqOnWeights) << "FakeQuantize on weights was not folded to constant";
     }
+
+    return true;
 }
 
 bool WeightableLayerTransformation::isGroup(const std::shared_ptr<Node>& layer) {
@@ -327,7 +340,7 @@ bool WeightableLayerTransformation::isDepthwise(const std::shared_ptr<Node>& lay
     return (group == inputChannelsCount) && (inputChannelsCount == outputChannelsCount);
 }
 
-std::shared_ptr<opset1::FakeQuantize> WeightableLayerTransformation::getFakeQuantizeOnWeights(const std::shared_ptr<Node>& node) const {
+std::shared_ptr<opset1::FakeQuantize> WeightableLayerTransformation::getFakeQuantizeOnWeights(const std::shared_ptr<Node>& node) {
     auto fq = as_type_ptr<opset1::FakeQuantize>(node->input_value(1).get_node_shared_ptr());
     // TODO: temporary workaround
     if (fq == nullptr) {
@@ -337,10 +350,38 @@ std::shared_ptr<opset1::FakeQuantize> WeightableLayerTransformation::getFakeQuan
     return fq;
 }
 
-DataPrecision WeightableLayerTransformation::getDataPrecisionOnWeights(const std::shared_ptr<Node>& node) const {
+DataPrecision WeightableLayerTransformation::getDataPrecisionOnWeights(const std::shared_ptr<Node>& node) {
     const auto fq = getFakeQuantizeOnWeights(node);
     const QuantizationDetails quantizationDetails = QuantizationDetails::getDetails(fq);
-    return getDataPrecision(fq, quantizationDetails, true);
+
+    const auto precisionsAttribute = getAttributeFromOutput<PrecisionsAttributePtr>(fq);
+    const auto precisions = precisionsAttribute == nullptr ?
+        PrecisionsAttribute::defaultPrecisions :
+        precisionsAttribute->get()->sharedValue->precisions;
+
+    return getDataPrecision(fq, quantizationDetails, precisions);
+}
+
+bool WeightableLayerTransformation::isAsymmetricOnWeights(const std::shared_ptr<const Node>& node) {
+    const auto n = const_cast<ngraph::Node*>(node.get())->shared_from_this();
+
+    const auto reshapeFromWeights = ngraph::as_type_ptr<ngraph::opset1::Reshape>(n->get_input_node_shared_ptr(1));
+    const auto dequantization = reshapeFromWeights == nullptr ?
+        NetworkHelper::getDequantization(n, 1ul) :
+        NetworkHelper::getDequantization(reshapeFromWeights);
+
+    if (dequantization.empty()) {
+        const auto dataPrecision = WeightableLayerTransformation::getDataPrecisionOnWeights(n);
+        if (dataPrecision.hasZeroPoint) {
+            return true;
+        }
+    } else {
+        if (dequantization.subtract != nullptr) {
+            return true;
+        }
+    }
+
+    return false;
 }
 
 } // namespace low_precision
diff --git a/inference-engine/src/mkldnn_plugin/mkldnn_graph.cpp b/inference-engine/src/mkldnn_plugin/mkldnn_graph.cpp
index 9d10ad036da759..4e3fba2d2b1c8b 100644
--- a/inference-engine/src/mkldnn_plugin/mkldnn_graph.cpp
+++ b/inference-engine/src/mkldnn_plugin/mkldnn_graph.cpp
@@ -45,7 +45,7 @@
 #include <ngraph/variant.hpp>
 #include <ngraph/ops.hpp>
 #include <transformations/utils/utils.hpp>
-#include <low_precision/transformer.hpp>
+#include <low_precision/low_precision.hpp>
 
 /*****************************************************
  * Debug capability
@@ -94,7 +94,7 @@ void MKLDNNGraph::Replicate(const std::shared_ptr<const ngraph::Function> &subgr
     this->reuse_io_tensors = false;
 
     isQuantizedFlag = (config.lpTransformsMode == Config::On) &&
-                      ngraph::pass::low_precision::LowPrecisionTransformer::isFunctionQuantized(subgraph);
+                      ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(subgraph);
 
     // Map data object onto producer node
     std::map<std::shared_ptr<ngraph::Node>, std::pair<MKLDNNNodePtr, int>> op2node;
@@ -192,7 +192,7 @@ void MKLDNNGraph::Replicate(const CNNNetwork &network, const MKLDNNExtensionMana
     }
 
     isQuantizedFlag = (config.lpTransformsMode == Config::On) &&
-                      ngraph::pass::low_precision::LowPrecisionTransformer::isFunctionQuantized(func);
+                      ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(func);
 
     auto orderedOps = func->get_ordered_ops();
 
diff --git a/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp b/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
index 35dd779d6f11d9..49b89ee339a89f 100644
--- a/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
+++ b/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
@@ -74,13 +74,12 @@
 #include <transformations/common_optimizations/lin_op_sequence_fusion.hpp>
 
 #include <transformations/low_precision/disable_convert_constant_folding_on_const_path.hpp>
-#include <low_precision/pull_reshape_through_dequantization.hpp>
-#include <low_precision/pull_transpose_through_dequantization.hpp>
-#include <low_precision/transformer.hpp>
+#include <low_precision/common/operation_per_tensor_quantization_restriction.hpp>
 #include <low_precision/convert_subtract_constant.hpp>
 #include <low_precision/convolution.hpp>
 #include <low_precision/convolution_backprop_data.hpp>
-#include <low_precision/group_convolution.hpp>
+#include <low_precision/layer_transformation.hpp>
+#include <low_precision/low_precision.hpp>
 #include <low_precision/multiply_to_group_convolution.hpp>
 #include <low_precision/network_helper.hpp>
 
@@ -121,7 +120,7 @@ static void Transformation(CNNNetwork& clonedNetwork, const Config& conf) {
 
     const bool useLpt =
         (conf.lpTransformsMode == Config::LPTransformsMode::On) &&
-        ngraph::pass::low_precision::LowPrecisionTransformer::isFunctionQuantized(nGraphFunc);
+        ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(nGraphFunc);
     if (useLpt) {
         manager.register_pass<ngraph::pass::DisableConvertConstantFoldingOnConstPath>(
             std::vector<ngraph::element::Type>{ ngraph::element::i8, ngraph::element::u8, ngraph::element::i4, ngraph::element::u4 });
@@ -314,30 +313,42 @@ static void Transformation(CNNNetwork& clonedNetwork, const Config& conf) {
     if (useLpt) {
         OV_ITT_SCOPE(FIRST_INFERENCE, MKLDNNPlugin::itt::domains::MKLDNN_LT, "LowPrecisionTransformations");
 
-        ngraph::pass::Manager manager;
-        auto lptPrerequisites = manager.register_pass<ngraph::pass::GraphRewrite>();
-        const std::vector<ngraph::element::Type> supportedTypes = { ngraph::element::i8, ngraph::element::u8 };
-        lptPrerequisites->add_matcher<PullReshapeThroughDequantization>(supportedTypes);
-        lptPrerequisites->add_matcher<PullTransposeThroughDequantization>(supportedTypes);
-        lptPrerequisites->add_matcher<ngraph::pass::LinOpSequenceFusion>();
-        manager.run_passes(nGraphFunc);
-
-        auto params = LayerTransformation::Params(
-            true,  // updatePrecisions
-            LayerTransformation::QuantizedTensorAlignment::UpdateLevel,  // quantizedTensorAlignmentOnActivations
-            LayerTransformation::QuantizedTensorAlignment::None,  // quantizedTensorAlignmentOnWeights
-            true);  // supportAsymmetricQuantization
-        LowPrecisionTransformer transformer(LowPrecisionTransformer::getAllTransformations(params)
-            .add<ConvolutionTransformation, ngraph::opset1::Convolution>(
-                LayerTransformation::Params(params).setPrecisionsOnActivations({ngraph::element::u8}).setSupportAsymmetricQuantization(true))
-            .add<GroupConvolutionTransformation, ngraph::opset1::GroupConvolution>(
-                LayerTransformation::Params(params).setPrecisionsOnActivations({ ngraph::element::u8 }).setSupportAsymmetricQuantization(true))
-            .addStandaloneCleanup<MultiplyToGroupConvolutionTransformation, ngraph::opset1::Multiply>(
-                LayerTransformation::Params(params).setPrecisionsOnActivations({ ngraph::element::u8 }))
-            .add<ConvolutionBackpropDataTransformation, ngraph::opset1::ConvolutionBackpropData>(
-                    LayerTransformation::Params(params).setSupportAsymmetricQuantization(false)));
-
-        transformer.transform(nGraphFunc);
+        auto supportedPrecisions = std::vector<OperationPrecisionRestriction>({
+            OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}},
+            }),
+            OperationPrecisionRestriction::create<ngraph::opset1::ConvolutionBackpropData>({
+                {0, {ngraph::element::u8, ngraph::element::i8}},
+                {1, {ngraph::element::i8}}
+            }),
+            OperationPrecisionRestriction::create<ngraph::opset1::GroupConvolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            }),
+            OperationPrecisionRestriction::create<ngraph::opset1::Multiply>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}},
+            }),
+        });
+
+        auto perTensorQuantization = std::vector<OperationPerTensorQuantizationRestriction>({
+            OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>({0}),
+            OperationPerTensorQuantizationRestriction::create<ngraph::opset1::ConvolutionBackpropData>({0})
+        });
+
+        ngraph::pass::Manager lptManager;
+        lptManager.register_pass<ngraph::pass::low_precision::LowPrecision>(supportedPrecisions, perTensorQuantization);
+        lptManager.get_pass_config()->set_callback<ngraph::pass::low_precision::MarkupPrecisions>([](const_node_ptr& node) -> bool {
+            if (const auto mulitply = std::dynamic_pointer_cast<const ngraph::opset1::Multiply>(node)) {
+                return !MultiplyToGroupConvolutionTransformation::canBeTransformedToGroupConvolution(mulitply);
+            }
+            return false;
+        });
+        lptManager.get_pass_config()->set_callback<ngraph::pass::low_precision::ConvolutionBackpropDataTransformation>([](const_node_ptr& node) -> bool {
+            return LayerTransformation::isAsymmetricQuantization(node) || WeightableLayerTransformation::isAsymmetricOnWeights(node);
+        });
+        lptManager.run_passes(nGraphFunc);
     }
 
     ngraph::pass::Manager postLPTPassManager;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/add_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/add_transformation.cpp
index eac35fdfb9f893..c88a17b32db48a 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/add_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/add_transformation.cpp
@@ -65,7 +65,7 @@ class AddTransformationTestValues {
     ngraph::element::Type precision;
     bool broadcast;
     int constInput;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
     std::string additionalLayer;
@@ -102,7 +102,7 @@ class AddTransformation : public LayerTransformation, public testing::WithParamI
             inputShapes.first,
             inputShapes.second,
             testValues.broadcast,
-            testValues.params,
+            TestTransformationParams::toParams(testValues.params),
             testValues.actual.precision1,
             testValues.actual.dequantization1,
             testValues.actual.precision2,
@@ -112,8 +112,7 @@ class AddTransformation : public LayerTransformation, public testing::WithParamI
             testValues.additionalLayer);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::AddTransformation, ngraph::opset1::Add>(
-                low_precision::LayerTransformation::Params(testValues.params));
+        transform.add<ngraph::pass::low_precision::AddTransformation, ngraph::opset1::Add>(testValues.params);
         transform.transform(actualFunction);
 
         auto inputShape1Ref = inputShapes.first;
@@ -127,7 +126,7 @@ class AddTransformation : public LayerTransformation, public testing::WithParamI
             inputShape1Ref,
             inputShape2Ref,
             testValues.broadcast,
-            testValues.params,
+            TestTransformationParams::toParams(testValues.params),
             testValues.expected.precision1,
             testValues.expected.dequantization1,
             testValues.expected.precision2,
@@ -164,7 +163,7 @@ class AddTransformation : public LayerTransformation, public testing::WithParamI
 
 TEST_P(AddTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/align_concat_quantization_parameters_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/align_concat_quantization_parameters_transformation.cpp
new file mode 100644
index 00000000000000..5264e4586698cc
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/align_concat_quantization_parameters_transformation.cpp
@@ -0,0 +1,179 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "layer_transformation.hpp"
+
+#include <memory>
+
+#include <gtest/gtest.h>
+
+#include <transformations/utils/utils.hpp>
+#include <transformations/init_node_info.hpp>
+
+#include <low_precision/avg_pool.hpp>
+#include <low_precision/concat.hpp>
+#include <low_precision/convolution.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/max_pool.hpp>
+
+#include "common_test_utils/ngraph_test_utils.hpp"
+#include "simple_low_precision_transformer.hpp"
+#include "lpt_ngraph_functions/align_concat_quantization_parameters_function.hpp"
+#include "lpt_ngraph_functions/common/dequantization_operations.hpp"
+
+using namespace testing;
+using namespace ngraph::pass;
+
+class AlignConcatQuantizationParametersTransformationTestValues {
+public:
+public:
+    class Actual {
+    public:
+        ngraph::element::Type inputPrecision;
+        ngraph::builder::subgraph::DequantizationOperations dequantization;
+    };
+
+    class Expected {
+    public:
+        ngraph::element::Type inputPrecision;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationBefore;
+        ngraph::element::Type preicsionAfterOperation;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
+    };
+
+    TestTransformationParams params;
+    Actual actual;
+    Expected expected;
+};
+
+typedef std::tuple<
+    ngraph::element::Type,
+    ngraph::Shape,
+    bool, // additional FakeQuantize After
+    std::string, // additional layer before FQ
+    AlignConcatQuantizationParametersTransformationTestValues> AlignConcatQuantizationParametersTransformationParams;
+
+class AlignConcatQuantizationParametersTransformation :
+    public LayerTransformation,
+    public testing::WithParamInterface<AlignConcatQuantizationParametersTransformationParams> {
+public:
+    void SetUp() override {
+        ngraph::element::Type precision;
+        ngraph::Shape shape;
+        bool addFakeQuantize;
+        std::string additionalLayer;
+        AlignConcatQuantizationParametersTransformationTestValues testValues;
+        std::tie(precision, shape, addFakeQuantize, additionalLayer, testValues) = GetParam();
+
+        actualFunction = ngraph::builder::subgraph::AlignConcatQuantizationParametersFunction::getOriginal(
+            precision,
+            testValues.actual.inputPrecision,
+            shape,
+            addFakeQuantize,
+            additionalLayer,
+            testValues.actual.dequantization);
+
+        auto supportedPrecisions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            })
+        });
+
+        auto perTensorQuantization = std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+            ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>({0}),
+        });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisions, perTensorQuantization);
+        transform.add<ngraph::pass::low_precision::AvgPoolTransformation, ngraph::opset1::AvgPool>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
+        transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
+        transform.transform(actualFunction);
+
+        referenceFunction = ngraph::builder::subgraph::AlignConcatQuantizationParametersFunction::getReference(
+            precision,
+            testValues.expected.inputPrecision,
+            shape,
+            addFakeQuantize,
+            additionalLayer,
+            testValues.expected.dequantizationBefore,
+            testValues.expected.preicsionAfterOperation,
+            testValues.expected.dequantizationAfter);
+    }
+
+    static std::string getTestCaseName(testing::TestParamInfo<AlignConcatQuantizationParametersTransformationParams> obj) {
+        ngraph::element::Type precision;
+        ngraph::Shape shape;
+        bool addFakeQuantize;
+        std::string additionalLayer;
+        AlignConcatQuantizationParametersTransformationTestValues testValues;
+        std::tie(precision, shape, addFakeQuantize, additionalLayer, testValues) = obj.param;
+
+        std::ostringstream result;
+        result <<
+            precision << "_" <<
+            LayerTransformation::getTestCaseNameByParams(testValues.actual.inputPrecision, shape, testValues.params) << "_" <<
+            testValues.actual.dequantization << "_" <<
+            testValues.expected.dequantizationBefore << "_" <<
+            testValues.expected.preicsionAfterOperation << "_" <<
+            testValues.expected.dequantizationAfter << "_" <<
+            (addFakeQuantize ? "_FQ_after_" : "_") << additionalLayer;
+        return result.str();
+    }
+};
+
+TEST_P(AlignConcatQuantizationParametersTransformation, CompareFunctions) {
+    InitNodeInfo().run_on_function(actualFunction);
+    actualFunction->validate_nodes_and_infer_types();
+
+    auto res = compare_functions(referenceFunction, actualFunction, true, true);
+    ASSERT_TRUE(res.first) << res.second;
+}
+
+const std::vector<ngraph::element::Type> precisions = {
+    ngraph::element::f32
+};
+
+const std::vector<std::string> additionalLayer = {
+    "maxpool"  // any transparent layer
+};
+
+const std::vector<bool> addFQ = {
+    false
+};
+
+const std::vector<ngraph::Shape> shapes = {
+    { 1, 3, 9, 9 },
+    { 4, 3, 9, 9 }
+};
+
+const std::vector<AlignConcatQuantizationParametersTransformationTestValues> testValues = {
+    // U8 per tensor quantization
+    {
+        LayerTransformation::createParamsU8I8(),
+        {
+            ngraph::element::f32,
+            {{ngraph::element::f32}, {128.f}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {{}, {std::vector<float>(6, 128.f), element::f32, {1, 6, 1, 1}}, {}},
+            ngraph::element::f32,
+            {{}, {}, {std::vector<float>(9, 0.0001f), element::f32, {1, 9, 1, 1}}}
+        }
+    }
+};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_LPT,
+    AlignConcatQuantizationParametersTransformation,
+    ::testing::Combine(
+        ::testing::ValuesIn(precisions),
+        ::testing::ValuesIn(shapes),
+        ::testing::ValuesIn(addFQ),
+        ::testing::ValuesIn(additionalLayer),
+        ::testing::ValuesIn(testValues)),
+    AlignConcatQuantizationParametersTransformation::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_transformation.cpp
index 20df23ff4a50f6..bdcf903b4879cc 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_transformation.cpp
@@ -13,7 +13,6 @@
 #include <transformations/init_node_info.hpp>
 #include <low_precision/avg_pool.hpp>
 #include <low_precision/max_pool.hpp>
-#include <low_precision/transformer.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "simple_low_precision_transformer.hpp"
@@ -25,7 +24,6 @@ using namespace ngraph::pass;
 using namespace ngraph;
 
 class AvgPoolTransformationTestValues {
-public:
 public:
     class Actual {
     public:
@@ -41,7 +39,7 @@ class AvgPoolTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -67,7 +65,7 @@ class AvgPoolTransformation : public LayerTransformation, public testing::WithPa
             testValues.actual.inputPrecision,
             shape,
             addFakeQuantize,
-            additionalLayer,
+            { additionalLayer },
             testValues.actual.dequantization);
 
         SimpleLowPrecisionTransformer transform;
@@ -80,9 +78,10 @@ class AvgPoolTransformation : public LayerTransformation, public testing::WithPa
             testValues.expected.inputPrecision,
             shape,
             addFakeQuantize,
-            additionalLayer,
+            { additionalLayer },
             testValues.expected.dequantizationBefore,
             testValues.expected.preicsionAfterOperation,
+            {},
             testValues.expected.dequantizationAfter);
     }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_with_child_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_with_child_transformation.cpp
new file mode 100644
index 00000000000000..aa2c591eeb3178
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/avg_pool_with_child_transformation.cpp
@@ -0,0 +1,183 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "layer_transformation.hpp"
+
+#include <string>
+#include <memory>
+
+#include <gtest/gtest.h>
+
+#include <transformations/utils/utils.hpp>
+#include <transformations/init_node_info.hpp>
+#include <low_precision/avg_pool.hpp>
+#include <low_precision/convolution.hpp>
+
+#include "common_test_utils/ngraph_test_utils.hpp"
+#include "simple_low_precision_transformer.hpp"
+#include "lpt_ngraph_functions/avg_pool_function.hpp"
+#include "lpt_ngraph_functions/common/dequantization_operations.hpp"
+
+using namespace testing;
+using namespace ngraph::pass;
+
+class AvgPoolWithChildTransformationTestValues {
+public:
+    class Actual {
+    public:
+        ngraph::element::Type inputPrecision;
+        ngraph::builder::subgraph::DequantizationOperations dequantization;
+    };
+
+    class Expected {
+    public:
+        ngraph::element::Type inputPrecision;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationBefore;
+        ngraph::element::Type preicsionAfterOperation;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationEnd;
+    };
+
+    TestTransformationParams params;
+    std::vector<std::string> additionalOperations;
+    Actual actual;
+    Expected expected;
+};
+
+typedef std::tuple<
+    ngraph::element::Type,
+    ngraph::PartialShape,
+    AvgPoolWithChildTransformationTestValues> AvgPoolWithChildTransformationParams;
+
+class AvgPoolWithChildTransformation : public LayerTransformation, public testing::WithParamInterface<AvgPoolWithChildTransformationParams> {
+public:
+    void SetUp() override {
+        ngraph::element::Type precision;
+        ngraph::PartialShape shape;
+        std::string additionalLayer;
+        AvgPoolWithChildTransformationTestValues testValues;
+        std::tie(precision, shape, testValues) = GetParam();
+        actualFunction = ngraph::builder::subgraph::AvgPoolFunction::getOriginal(
+            precision,
+            testValues.actual.inputPrecision,
+            shape,
+            false,
+            testValues.additionalOperations,
+            testValues.actual.dequantization);
+
+        SimpleLowPrecisionTransformer transform;
+        transform.add<ngraph::pass::low_precision::AvgPoolTransformation, ngraph::opset1::AvgPool>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
+        transform.transform(actualFunction);
+
+        referenceFunction = ngraph::builder::subgraph::AvgPoolFunction::getReference(
+            precision,
+            testValues.expected.inputPrecision,
+            shape,
+            false,
+            testValues.additionalOperations,
+            testValues.expected.dequantizationBefore,
+            testValues.expected.preicsionAfterOperation,
+            testValues.expected.dequantizationAfter,
+            testValues.expected.dequantizationEnd);
+    }
+
+    static std::string getTestCaseName(testing::TestParamInfo<AvgPoolWithChildTransformationParams> obj) {
+        ngraph::element::Type precision;
+        ngraph::PartialShape shape;
+        std::string additionalLayer;
+        AvgPoolWithChildTransformationTestValues testValues;
+        std::tie(precision, shape, testValues) = obj.param;
+
+        std::ostringstream result;
+        result <<
+            precision << "_" <<
+            LayerTransformation::getTestCaseNameByParams(testValues.actual.inputPrecision, shape, testValues.params) << "_" <<
+            testValues.actual.dequantization << "_" <<
+            testValues.expected.dequantizationBefore << "_" <<
+            testValues.expected.preicsionAfterOperation << "_" <<
+            testValues.expected.dequantizationAfter << "_additional_operations_";
+        for (const auto& elem : testValues.additionalOperations) {
+            result << elem << "_";
+        }
+
+        return result.str();
+    }
+};
+
+TEST_P(AvgPoolWithChildTransformation, CompareFunctions) {
+    InitNodeInfo().run_on_function(actualFunction);
+    actualFunction->validate_nodes_and_infer_types();
+
+    auto res = compare_functions(referenceFunction, actualFunction, true, true);
+    ASSERT_TRUE(res.first) << res.second;
+}
+
+const std::vector<ngraph::element::Type> precisions = {
+    ngraph::element::f32
+};
+
+const std::vector<ngraph::PartialShape> shapes = {
+    { 1, 3, 72, 48 },
+    { 4, 3, 72, 48 }
+};
+
+const std::vector<AvgPoolWithChildTransformationTestValues> testValues = {
+    // U8 per tensor quantization
+    {
+        LayerTransformation::createParamsU8I8(),
+        { "convolution" },
+        {
+            ngraph::element::u8,
+            {{ngraph::element::f32}, {}, {0.02f}}
+        },
+        {
+            ngraph::element::u8,
+            {},
+            ngraph::element::u8,
+            {},
+            {{}, {}, {std::vector<float>{0.0002f}, element::f32, {1, 6, 1, 1}}}
+        }
+    },
+    // U8 per tensor quantization
+    {
+        LayerTransformation::createParamsU8I8(),
+        { "softmax", "convolution" },
+        {
+            ngraph::element::u8,
+            {{ngraph::element::f32}, {}, {0.02f}}
+        },
+        {
+            ngraph::element::u8,
+            {},
+            ngraph::element::f32,
+            {{}, {}, {0.02f}},
+            {}
+        }
+    },
+    {
+        LayerTransformation::createParamsU8I8(),
+        { "unsupported_convolution" },
+        {
+            ngraph::element::u8,
+            {{ngraph::element::f32}, {}, {0.02f}}
+        },
+        {
+            ngraph::element::u8,
+            {},
+            ngraph::element::f32,
+            {{}, {}, {0.02f}},
+            {}
+        }
+    }
+};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_LPT,
+    AvgPoolWithChildTransformation,
+    ::testing::Combine(
+        ::testing::ValuesIn(precisions),
+        ::testing::ValuesIn(shapes),
+        ::testing::ValuesIn(testValues)),
+    AvgPoolWithChildTransformation::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/clamp_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/clamp_transformation.cpp
index 940568bedafc06..6fd8c2c1bd4846 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/clamp_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/clamp_transformation.cpp
@@ -38,7 +38,7 @@ class ClampTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
     bool nonDequantizationMultiply;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/compose_fake_quantize_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/compose_fake_quantize_transformation.cpp
index 247569a9573bf9..982c78720769b7 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/compose_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/compose_fake_quantize_transformation.cpp
@@ -89,7 +89,7 @@ class ComposeFakeQuantizeTransformation :
 
 TEST_P(ComposeFakeQuantizeTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, false, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, false, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_selection_with_intermediate_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_selection_with_intermediate_transformation.cpp
index cadf373676c82d..4cb954ce8a37c1 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_selection_with_intermediate_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_selection_with_intermediate_transformation.cpp
@@ -12,9 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/max_pool.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
@@ -58,7 +57,7 @@ inline std::ostream& operator<<(std::ostream& out, const ResultValues& values) {
 class TestValues {
 public:
     ngraph::Shape inputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool transparentIntermediate;
     ActualValues actual;
     ResultValues result;
@@ -86,8 +85,15 @@ class ConcatSelectionWithIntermediateTransformation : public LayerTransformation
             testValues.actual.fakeQuantize1,
             testValues.actual.fakeQuantize2);
 
-        SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
+        auto supportedPrecisions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}}
+            })
+        });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.transform(actualFunction);
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_transformation.cpp
index 7795eef3168754..8b1c65fc439ff7 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_transformation.cpp
@@ -4,26 +4,36 @@
 
 #include "layer_transformation.hpp"
 
-#include <string>
 #include <sstream>
 #include <memory>
+#include <vector>
 
 #include <gtest/gtest.h>
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
+
+#include <low_precision/low_precision.hpp>
+
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/rt_info/precision_preserved_attribute.hpp>
+#include <low_precision/align_quantization_parameters.hpp>
+#include <low_precision/fuse_subtract_to_fake_quantize.hpp>
+#include <low_precision/fuse_multiply_to_fake_quantize.hpp>
+#include <low_precision/markup_can_be_quantized.hpp>
+#include <low_precision/markup_per_tensor_quantization.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/concat_function.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
 #include "simple_low_precision_transformer.hpp"
 
 using namespace testing;
 using namespace ngraph;
 using namespace ngraph::pass;
+using namespace ngraph::builder::subgraph;
 
 namespace {
 
@@ -72,11 +82,32 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    ConcatTransformationTestValues() = default;
+    ConcatTransformationTestValues(
+        const TestTransformationParams& params,
+        const bool multiChannels,
+        const  std::int64_t axis,
+        const ConcatTransformationActualValues& actual,
+        const ConcatTransformationResultValues& result,
+        const bool addNotPrecisionPreservedOperation = false,
+        const bool checkIntervalsAlignmentAttributes = true) :
+        params(params),
+        multiChannels(multiChannels),
+        axis(axis),
+        actual(actual),
+        result(result),
+        addNotPrecisionPreservedOperation(addNotPrecisionPreservedOperation),
+        checkIntervalsAlignmentAttributes(checkIntervalsAlignmentAttributes) {}
+
+    TestTransformationParams params;
     bool multiChannels;
     std::int64_t axis;
     ConcatTransformationActualValues actual;
     ConcatTransformationResultValues result;
+    // add not precision preserved operation to set output precision for FakeQuantize
+    // don't set to 'true' by default to keep test cases with tested operation as output
+    bool addNotPrecisionPreservedOperation;
+    bool checkIntervalsAlignmentAttributes;
 };
 
 inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationTestValues& values) {
@@ -114,17 +145,39 @@ class ConcatTransformation : public LayerTransformation, public testing::WithPar
             testValues.actual.fakeQuantize2,
             testValues.actual.convert2,
             testValues.actual.dequantization2,
+            {},
             ngraph::element::undefined,
             {},
-            testValues.axis);
+            testValues.axis,
+            testValues.addNotPrecisionPreservedOperation);
+
+        auto supportedPrecisionsOnActivation = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::AvgPool>({{0, testValues.params.precisionsOnActivations}})
+        });
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::AvgPool>()
+            });
+
+        const auto params = TestTransformationParams::toParams(testValues.params);
+        SimpleLowPrecisionTransformer transformer(supportedPrecisionsOnActivation, quantizationRestrictions);
+        transformer.commonGraphRewrite->add_matcher<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation>(params);
+        transformer.commonGraphRewrite->add_matcher<ngraph::pass::low_precision::ConcatTransformation>(params);
+        transformer.transform(actualFunction);
+
+        {
+            ngraph::pass::Manager standaloneCleanupManager;
+            standaloneCleanupManager.register_pass<ngraph::pass::low_precision::FuseSubtractToFakeQuantizeTransformation>();
+            standaloneCleanupManager.run_passes(actualFunction);
+        }
+
+        {
+            ngraph::pass::Manager standaloneCleanupManager;
+            standaloneCleanupManager.register_pass<ngraph::pass::low_precision::FuseMultiplyToFakeQuantizeTransformation>();
+            standaloneCleanupManager.run_passes(actualFunction);
         }
-        transform.transform(actualFunction);
 
         // dequantization output precision depends on input precision
         // to avoid huge amount of tests cases let's define dequantization output precision as input precision
@@ -138,6 +191,8 @@ class ConcatTransformation : public LayerTransformation, public testing::WithPar
             testValues.result.dequantizationAfter.convert = {};
         }
 
+        IntervalsAlignmentSharedValue::Interval interval{-1.28f, 2.55f};
+
         referenceFunction = ngraph::builder::subgraph::ConcatFunction::get(
             precision,
             shape,
@@ -147,9 +202,15 @@ class ConcatTransformation : public LayerTransformation, public testing::WithPar
             testValues.result.fakeQuantize2,
             testValues.result.convert2,
             testValues.result.dequantization2,
+            {
+                make_shared_attribute_ptr<PrecisionPreservedAttribute>(true),
+                make_shared_attribute_ptr<IntervalsAlignmentAttribute>(interval, 256),
+                make_shared_attribute_ptr<QuantizationAlignmentAttribute>(false)
+            },
             testValues.result.precisionAfterOperation,
             testValues.result.dequantizationAfter,
-            testValues.axis);
+            testValues.axis,
+            testValues.addNotPrecisionPreservedOperation);
     }
 
     static std::string getTestCaseName(testing::TestParamInfo<ConcatTransformationParams> obj) {
@@ -170,13 +231,25 @@ class ConcatTransformation : public LayerTransformation, public testing::WithPar
 
 TEST_P(ConcatTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false, true, false);
     ASSERT_TRUE(res.first) << res.second;
+
+    const auto actualFakeQuantizes = LayerTransformation::get<opset1::FakeQuantize>(actualFunction);
+    ASSERT_TRUE(checkIfOutputAttributesSharedValuesAreTheSame<std::shared_ptr<PrecisionsAttribute>>(actualFakeQuantizes)) <<
+        "PrecisionsAttribute are not the same";
+
+    ConcatTransformationTestValues testValues = std::get<2>(GetParam());
+    if (testValues.checkIntervalsAlignmentAttributes) {
+        auto operations = LayerTransformation::get<opset1::Concat>(actualFunction);
+        operations.insert(operations.end(), actualFakeQuantizes.begin(), actualFakeQuantizes.end());
+        ASSERT_TRUE(checkIfAttributesSharedValuesAreTheSame<std::shared_ptr<IntervalsAlignmentAttribute>>(operations)) <<
+            "IntervalsAlignmentAttribute are not the same";
+    }
 }
 
 const std::vector<ngraph::element::Type> precisions = {
     ngraph::element::f32,
-    ngraph::element::f16
+    //ngraph::element::f16
 };
 
 namespace testValues1 {
@@ -187,6 +260,84 @@ const std::vector<ngraph::PartialShape> shapes = {
 };
 
 const std::vector<ConcatTransformationTestValues> testValues = {
+    // U8: concat: levels less then threshold is ignored, function is not transformed
+    // U8: concat: per-channel quantization: function is transformed
+    {
+        LayerTransformation::createParamsU8I8(),
+        true,
+        1,
+        {
+            { 256ul, {}, {0.f}, {2550.f}, {0.f}, {2550.f} },
+            {},
+            {},
+            { 256ul, {}, {0.f}, {0.1f}, {0.f}, {0.1f} }
+        },
+        {
+            {
+                256ul, {}, {0.f}, {2550.f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            {
+                256ul, {}, {0.f}, {0.1f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            ngraph::element::u8,
+            { ngraph::element::f32, {}, {{ 10.f, 10.f, 10.f, 0.000392157f, 0.000392157f, 0.000392157f }} },
+        },
+        true
+    },
+    // right branch is not quantized
+    {
+        LayerTransformation::createParamsU8I8(),
+        false,
+        1,
+        {
+            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} },
+            {},
+            {},
+            {}
+        },
+        {
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f}, ngraph::element::f32,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            {},
+            {},
+            {},
+            ngraph::element::f32,
+        }
+    },
+    // left branch is not quantized
+    {
+        LayerTransformation::createParamsU8I8(),
+        false,
+        1,
+        {
+            {},
+            {},
+            {},
+            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} }
+        },
+        {
+            {},
+            {},
+            {},
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f}, ngraph::element::f32,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            ngraph::element::f32,
+        }
+    },
     // U8: concat
     {
         LayerTransformation::createParamsU8I8(),
@@ -199,10 +350,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} }
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -231,10 +388,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             },
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -263,10 +426,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             },
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -291,10 +460,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             },
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -319,10 +494,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             },
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -343,10 +524,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {{1}, {1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {{1}, {1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {{1}, {1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {{1}, {1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -367,10 +554,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {{1, 1, 1, 1}, {1, 1, 1, 1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {{1, 1, 1, 1}, {1, 1, 1, 1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {{1, 1, 1, 1}, {1, 1, 1, 1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {{1, 1, 1, 1}, {1, 1, 1, 1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -391,10 +584,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {0.f}, {1.275f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {1.275f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -415,10 +614,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {{1}, {1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {{1}, {1}, {}, {}}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {{1}, {1}, {}, {}}, {0.f}, {1.275f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {{1}, {1}, {}, {}}, {0.f}, {1.275f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -451,7 +656,8 @@ const std::vector<ConcatTransformationTestValues> testValues = {
                 256ul,
                 {{1, 3, 1, 1}, {1, 3, 1, 1}, {}, {}},
                 {0.f, 0.f, 0.f}, {2.55f, 2.55f, 2.55f}, {0.f}, {255.f},
-                ngraph::element::u8
+                ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
             },
             {},
             {},
@@ -459,41 +665,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
                 256ul,
                 {{1, 3, 1, 1}, {1, 3, 1, 1}, {}, {}},
                 {0.f, 0.f, 0.f}, {1.275f, 1.275f, 1.275f}, {0.f}, {255.f},
-                ngraph::element::u8
+                ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
             },
             {},
             {},
             ngraph::element::u8,
             { ngraph::element::f32, {}, {{ 0.01f / 1.f, 0.01f / 2.f, 0.01f / 3.f, 0.005f / 1.f, 0.005f / 2.f, 0.005f / 3.f }} }
-        }
-    },
-    // U8: concat multi channels with subtract
-    {
-        LayerTransformation::createParamsU8I8(),
-        true,
-        1,
-        {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} },
-            {},
-            {},
-            { 256ul, {}, {1.275f}, {2.55f}, {1.275f}, {2.55f} },
-            {},
-            {}
         },
-        {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
-            {},
-            {},
-            { 256ul, {}, {1.275f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
-            {},
-            {},
-            ngraph::element::u8,
-            {
-                ngraph::element::f32,
-                {{ 0.f, 0.f, 0.f, -255.f, -255.f, -255.f }},
-                {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }}
-            }
-        }
+        false,
+        false
     },
     // I8
     {
@@ -509,10 +690,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {}, {-1.28f}, {1.27f}, {-128.f}, {127.f}, ngraph::element::i8 },
+            {
+                256ul, {}, {-1.28f}, {1.27f}, {-128.f}, {127.f}, ngraph::element::i8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {-1.28f}, {1.27f}, {-128.f}, {127.f}, ngraph::element::i8 },
+            {
+                256ul, {}, {-1.28f}, {1.27f}, {-128.f}, {127.f}, ngraph::element::i8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::i8,
@@ -533,14 +720,20 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {85.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {-1.28f}, {1.27f}, {0.f}, {170.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {-1.28f}, {1.27f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
-            { ngraph::element::f32, { 85 }, { 0.015f } }
+            { ngraph::element::f32, { {0.f, 0.f, 0.f, 128.f, 128.f, 128.f } }, { 0.01f } }
         }
     },
     // mixed: U8 + I8: concat multi channels
@@ -557,10 +750,16 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
         {
-            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 2.55f}, 256ul) }
+            },
             {},
             {},
-            { 256ul, {}, {-1.28f}, {1.27f}, {0.f}, {255.f}, ngraph::element::u8 },
+            {
+                256ul, {}, {-1.28f}, {1.27f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 2.55f}, 256ul) }
+            },
             {},
             {},
             ngraph::element::u8,
@@ -589,7 +788,8 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {},
             ngraph::element::u8,
             { ngraph::element::f32, { 85 }, { 0.015f } }
-        }
+        },
+        true
     },
     // real case from ctdet_coco_dlav0_384 model, coverage bad rounding
     {
@@ -613,7 +813,8 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {},
             ngraph::element::u8,
             { ngraph::element::f32, { 128 }, { 0.0302619f } }
-        }
+        },
+        true
     },
     // U8: concat multi channels with subtract, negative axis
     {
@@ -665,6 +866,83 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {}
         },
     },
+    // U8: concat multi channels with subtract
+    // Features:
+    //  1. fakeQuantize1 defines precision
+    //  2. fakeQuantize2 has zero point (doesn't define precision)
+    //  3. FakeQuantize operations order is not important.
+    {
+        LayerTransformation::createParamsU8I8(),
+        true,
+        1,
+        {
+            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} },
+            {},
+            {},
+            { 256ul, {}, {1.275f}, {2.55f}, {1.275f}, {2.55f} },
+            {},
+            {}
+        },
+        {
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            {
+                256ul, {}, {1.275f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            ngraph::element::u8,
+            {
+                ngraph::element::f32,
+                {{ 0.f, 0.f, 0.f, -255.f, -255.f, -255.f }},
+                {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }}
+            }
+        },
+    },
+    // U8: concat multi channels with subtract
+    // Features:
+    //  1. fakeQuantize2 has zero point (doesn't define precision)
+    //  2. fakeQuantize1 defines precision
+    //  3. FakeQuantize operations order is not important.
+    {
+        LayerTransformation::createParamsU8I8(),
+        true,
+        1,
+        {
+            { 256ul, {}, {1.275f}, {2.55f}, {1.275f}, {2.55f} },
+            {},
+            {},
+            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} },
+            {},
+            {}
+        },
+        {
+            {
+                256ul, {}, {1.275f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul) }
+            },
+            {},
+            {},
+            {
+                256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{0.f, 2.55f}, 256ul)
+            }
+            },
+            {},
+            {},
+            ngraph::element::u8,
+            {
+                ngraph::element::f32,
+                {{ -255.f, -255.f, -255.f, 0.f, 0.f, 0.f }},
+                {{ 0.005f, 0.005f, 0.005f, 0.01f, 0.01f, 0.01f }}
+            }
+        },
+    },
     // not update precisions
     {
         LayerTransformation::createParamsU8I8().setUpdatePrecisions(false),
@@ -711,7 +989,9 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {},
             ngraph::element::f32,
             {},
-        }
+        },
+        false,
+        false,
     },
     // unexpected quantization levels, concat multi channels
     {
@@ -735,7 +1015,9 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             {},
             ngraph::element::f32,
             {},
-        }
+        },
+        false,
+        false
     }
 };
 
@@ -752,7 +1034,6 @@ INSTANTIATE_TEST_SUITE_P(
 namespace testValues2 {
 const std::vector<ngraph::PartialShape> shapesWithDynamicChannels = {
     { Dimension::dynamic(), Dimension::dynamic(), Dimension::dynamic(), Dimension::dynamic() },
-    PartialShape::dynamic()
 };
 
 const std::vector<ConcatTransformationTestValues> testValues = {
@@ -788,4 +1069,46 @@ INSTANTIATE_TEST_SUITE_P(
         ::testing::ValuesIn(testValues)),
     ConcatTransformation::getTestCaseName);
 } // namespace testValues2
+
+namespace testValues3 {
+const std::vector<ngraph::PartialShape> shapesWithDynamicChannels = {
+    PartialShape::dynamic()
+};
+
+const std::vector<ConcatTransformationTestValues> testValues = {
+    // issue #58915
+    //{
+    //    LayerTransformation::createParamsU8I8(),
+    //    true,
+    //    1,
+    //    {
+    //        { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} },
+    //        {},
+    //        {},
+    //        { 256ul, {}, {1.275f}, {2.55f}, {1.275f}, {2.55f} },
+    //        {},
+    //        {}
+    //    },
+    //    {
+    //        { 256ul, {}, {0.f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8, },
+    //        {},
+    //        {{ngraph::element::f32}, {}, {0.01f}},
+    //        { 256ul, {}, {1.275f}, {2.55f}, {0.f}, {255.f}, ngraph::element::u8 },
+    //        {},
+    //        {{ngraph::element::f32}, {-255.f}, {0.005f}},
+    //        ngraph::element::f32,
+    //        {},
+    //    },
+    //},
+};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_LPT,
+    ConcatTransformation,
+    ::testing::Combine(
+        ::testing::ValuesIn(precisions),
+        ::testing::ValuesIn(shapesWithDynamicChannels),
+        ::testing::ValuesIn(testValues)),
+    ConcatTransformation::getTestCaseName);
+} // namespace testValues3
 } // namespace
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_different_precision_on_children.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_different_precision_on_children.cpp
index 259b94191c8305..e781b8b258d1a6 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_different_precision_on_children.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_different_precision_on_children.cpp
@@ -12,9 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/max_pool.hpp>
 #include <low_precision/clamp.hpp>
 
@@ -22,6 +21,7 @@
 #include "lpt_ngraph_functions/concat_function.hpp"
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
 #include "simple_low_precision_transformer.hpp"
+#include "low_precision/common/operation_per_tensor_quantization_restriction.hpp"
 
 
 using namespace testing;
@@ -61,7 +61,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     ConcatTransformationActualValues actual;
     ConcatTransformationResultValues result;
@@ -90,12 +90,15 @@ class ConcatWithDifferentChildrenTransformation : public LayerTransformation, pu
             testValues.actual.fakeQuantize1,
             testValues.actual.fakeQuantize2);
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::AvgPool>()
+            });
+
+        SimpleLowPrecisionTransformer transform({}, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.add<ngraph::pass::low_precision::ClampTransformation, ngraph::opset1::Clamp>(testValues.params);
         transform.transform(actualFunction);
@@ -130,7 +133,7 @@ class ConcatWithDifferentChildrenTransformation : public LayerTransformation, pu
 
 TEST_P(ConcatWithDifferentChildrenTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_precision_selection_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_precision_selection_transformation.cpp
index 52c07e6239c74e..ad126eed1fd895 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_precision_selection_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_precision_selection_transformation.cpp
@@ -12,11 +12,10 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/avg_pool.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
 #include <low_precision/max_pool.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/concat_function.hpp"
@@ -61,7 +60,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     ConcatTransformationActualValues actual;
     ConcatTransformationResultValues result;
@@ -90,14 +89,21 @@ class ConcatWithIntermediatePrecisionSelectionTransformation : public LayerTrans
             testValues.actual.fakeQuantize1,
             testValues.actual.fakeQuantize2);
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.addBranchSpecific<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.addBranchSpecific<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
+        auto supportedPrecisionsOnActivation = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::AvgPool>({{0, testValues.params.precisionsOnActivations}})
+        });
+
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::AvgPool>()
+            });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisionsOnActivation, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.add<ngraph::pass::low_precision::AvgPoolTransformation, ngraph::opset1::AvgPool>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.transform(actualFunction);
 
         referenceFunction = ngraph::builder::subgraph::ConcatFunction::getReferenceWithIntermediateAvgPool(
@@ -130,7 +136,7 @@ class ConcatWithIntermediatePrecisionSelectionTransformation : public LayerTrans
 
 TEST_P(ConcatWithIntermediatePrecisionSelectionTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, false, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, false, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_reshape_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_reshape_transformation.cpp
index a56c34ce08aefd..a9f22bd40b40ac 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_reshape_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_reshape_transformation.cpp
@@ -11,8 +11,9 @@
 #include <gtest/gtest.h>
 
 #include <transformations/utils/utils.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/reshape.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/concat.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/concat_function.hpp"
@@ -49,7 +50,7 @@ class TestValues {
 public:
     ngraph::Shape inputShape;
     ngraph::Shape reshapeOutputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ActualValues actual;
     ResultValues result;
 };
@@ -77,7 +78,8 @@ class ConcatWithIntermediateReshapeTransformation : public LayerTransformation,
             testValues.actual.fakeQuantize2);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::ReshapeTransformation, ngraph::opset1::Reshape>(testValues.params);
         transform.transform(actualFunction);
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_transformation.cpp
index 85ec7767fbe472..33a78c138c1f1b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_transformation.cpp
@@ -12,9 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/max_pool.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
@@ -60,7 +59,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     bool transparentIntermediate;
     ConcatTransformationActualValues actual;
@@ -91,12 +90,15 @@ class ConcatWithIntermediateTransformation : public LayerTransformation, public
             testValues.actual.fakeQuantize1,
             testValues.actual.fakeQuantize2);
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>()
+            });
+
+        SimpleLowPrecisionTransformer transform({}, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.transform(actualFunction);
 
@@ -131,7 +133,7 @@ class ConcatWithIntermediateTransformation : public LayerTransformation, public
 
 TEST_P(ConcatWithIntermediateTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -158,13 +160,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f / 2.f}, {0.f}, { 128.f} },
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f / 2.f}, {0.f}, { 255.f} },
             ngraph::element::u8,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::u8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { ngraph::element::f32, {}, { 0.005f } }
         }
     },
     // I8: concat
@@ -178,13 +180,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-64.f}, { 64.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-128.f}, {127.f} },
             ngraph::element::i8,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::i8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { ngraph::element::f32, {}, { 0.005f } }
         }
     },
     // U8: concat with subtract
@@ -198,13 +200,17 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {1.275f}, {2.55f}, {128.f}, {255.f} },
+            { 256ul, ngraph::Shape({}), {1.275f}, {2.55f}, {0.f}, {255.f} },
             ngraph::element::u8,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::u8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            {
+                ngraph::element::f32,
+                {{ 0.f, 0.f, 0.f, -255.f, -255.f, -255.f }},
+                {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }}
+            },
+            { ngraph::element::f32, {-255.f}, { 0.005f } }
         }
     },
     // U8: concat multi channels
@@ -282,13 +288,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f / 2.f}, {0.f}, { 128.f} },
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f / 2.f}, {0.f}, { 255.f} },
             ngraph::element::f32,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::f32,
-            { {}, {}, { 0.01f } },
-            { {}, {}, { 0.01f } }
+            { {}, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { {}, {}, { 0.005f } }
         }
     },
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_with_constant_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_with_constant_transformation.cpp
index 3df8d25071b867..e5565781069641 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_with_constant_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_intermediate_with_constant_transformation.cpp
@@ -12,9 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/max_pool.hpp>
 #include <low_precision/interpolate.hpp>
 
@@ -61,7 +60,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     bool transparentIntermediate;
     ConcatTransformationActualValues actual;
@@ -92,12 +91,15 @@ class ConcatWithIntermediateWithConstantTransformation : public LayerTransformat
             testValues.actual.fakeQuantize1,
             testValues.actual.fakeQuantize2);
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::AvgPool>()
+            });
+
+        SimpleLowPrecisionTransformer transform({}, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.add<ngraph::pass::low_precision::InterpolateTransformation, ngraph::opset1::Interpolate>(testValues.params);
         transform.transform(actualFunction);
@@ -133,7 +135,7 @@ class ConcatWithIntermediateWithConstantTransformation : public LayerTransformat
 
 TEST_P(ConcatWithIntermediateWithConstantTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation.cpp
index 88b291d1f048b0..1dacc2f7eb7c2b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation.cpp
@@ -12,10 +12,16 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
+
+#include <low_precision/align_quantization_intervals.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/markup_precisions.hpp>
+#include <low_precision/markup_avg_pool_precision_preserved.hpp>
+#include <low_precision/propagate_precisions.hpp>
+
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
 #include <low_precision/convolution.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/concat_function.hpp"
@@ -62,7 +68,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     ConcatTransformationActualValues actual;
     ConcatTransformationResultValues result;
@@ -96,21 +102,24 @@ class ConcatWithNeighborsTransformation : public LayerTransformation, public tes
             testValues.neighborType,
             testValues.additionalLayer);
 
-        SimpleLowPrecisionTransformer transformBranchSpecific;
-        if (testValues.multiChannels) {
-            transformBranchSpecific.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transformBranchSpecific.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
-        if (testValues.additionalLayer == "convolution" || testValues.neighborType == "convolution") {
-            transformBranchSpecific.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
-        }
-        transformBranchSpecific.transform(actualFunction);
-        if (testValues.additionalLayer == "convolution" || testValues.neighborType == "convolution") {
-            SimpleLowPrecisionTransformer transformConvolution;
-            transformConvolution.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
-            transformConvolution.transform(actualFunction);
-        }
+        auto supportedPrecisionsOnActivation = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, testValues.params.precisionsOnActivations},
+                {1, testValues.params.precisionsOnWeights}
+            })
+        });
+
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>()
+        });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisionsOnActivation, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
+        transform.transform(actualFunction);
 
         referenceFunction = ngraph::builder::subgraph::ConcatFunction::getReferenceWithNeighbors(
             precision,
@@ -144,7 +153,7 @@ class ConcatWithNeighborsTransformation : public LayerTransformation, public tes
 
 TEST_P(ConcatWithNeighborsTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -171,13 +180,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {128.f} },
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {85.f} },
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
             ngraph::element::u8,
             {{}, {}, {}},
             ngraph::element::u8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { ngraph::element::f32, {}, {{ 0.005f, 0.005f, 0.005f, 0.00333f, 0.00333f, 0.00333f }} }
         },
         "concat",
         ""
@@ -237,13 +246,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-64}, {64.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {-43}, {42.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-128.f}, {127.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {-128.f}, {127.f} },
             ngraph::element::i8,
             {{}, {}, {}},
             ngraph::element::i8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { ngraph::element::f32, {}, {{ 0.005f, 0.005f, 0.005f, 0.00333f, 0.00333f, 0.00333f }} }
         },
         "concat",
         ""
@@ -280,14 +289,14 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} }
         },
         {
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
-            ngraph::element::u8,
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {-128.f}, {127.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
+            ngraph::element::i8,
             {{}, {}, {}},
-            ngraph::element::u8,
-            { ngraph::element::f32, {{ 0.f, 0.f, 0.f, 128.f, 128.f, 128.f }}, { 0.01f } },
-            { ngraph::element::f32, { 128.f }, { 0.01f } }
+            ngraph::element::i8,
+            { ngraph::element::f32, {{ -128.f, -128.f, -128.f, 0.f, 0.f, 0.f }}, { 0.01f } },
+            { ngraph::element::f32, {}, { 0.01f } }
         },
         "concat",
         ""
@@ -302,14 +311,14 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} }
         },
         {
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
-            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {-128.f}, {127.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
             ngraph::element::f32,
             {{}, {}, {}},
             ngraph::element::f32,
-            { {}, {{ 0.f, 0.f, 0.f, 128.f, 128.f, 128.f }}, { 0.01f } },
-            { {}, { 128.f }, { 0.01f } }
+            { {}, {{ -128.f, -128.f, -128.f, 0.f, 0.f, 0.f }}, { 0.01f } },
+            { {}, {}, { 0.01f } }
         },
         "concat",
         ""
@@ -318,7 +327,7 @@ const std::vector<ConcatTransformationTestValues> testValues = {
     // different precisions on FQ, u8 have to be chosen
     {
         LayerTransformation::createParamsU8I8(),
-        true,
+        false,
         {
             { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {2.55f} },
             { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-12.8f}, {12.7f} },
@@ -343,6 +352,66 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         "convolution",
         "convolution"
     },
+    //// I8: concat multi channels
+    //{
+    //    LayerTransformation::createParamsI8I8(),
+    //    true,
+    //    {
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-1.28f / 2.f}, {1.27f / 2.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {-1.28f / 3.f}, {1.27f / 3.f} }
+    //    },
+    //    {
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-128.f}, {127.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {-128.f}, {127.f} },
+    //        ngraph::element::i8,
+    //        {{}, {}, {}},
+    //        ngraph::element::i8,
+    //        { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+    //        { ngraph::element::f32, {}, {{ 0.005f, 0.005f, 0.005f, 0.00333f, 0.00333f, 0.00333f }} }
+    //    }
+    //},
+    //// mixed: U8 + I8: concat multi channels
+    //{
+    //    LayerTransformation::createParamsU8I8(),
+    //    true,
+    //    {
+    //        { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {2.55f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} }
+    //    },
+    //    {
+    //        { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
+    //        ngraph::element::u8,
+    //        {{}, {}, {}},
+    //        ngraph::element::u8,
+    //        { ngraph::element::f32, {{ 0.f, 0.f, 0.f, 128.f, 128.f, 128.f }}, { 0.01f } },
+    //        { ngraph::element::f32, { 128.f }, { 0.01f } }
+    //    }
+    //},
+    //// not update precisions
+    //{
+    //    LayerTransformation::createParamsU8I8().setUpdatePrecisions(false),
+    //    true,
+    //    {
+    //        { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {2.55f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} }
+    //    },
+    //    {
+    //        { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
+    //        { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
+    //        ngraph::element::f32,
+    //        {{}, {}, {}},
+    //        ngraph::element::f32,
+    //        { {}, {{ 0.f, 0.f, 0.f, 128.f, 128.f, 128.f }}, { 0.01f } },
+    //        { {}, { 128.f }, { 0.01f } }
+    //    }
+    //},
 };
 
 INSTANTIATE_TEST_SUITE_P(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation_with_convolution.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation_with_convolution.cpp
new file mode 100644
index 00000000000000..1b22f085f23e45
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_neighbors_transformation_with_convolution.cpp
@@ -0,0 +1,269 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "layer_transformation.hpp"
+
+#include <sstream>
+#include <memory>
+#include <gtest/gtest.h>
+
+#include <transformations/utils/utils.hpp>
+#include <low_precision/concat.hpp>
+#include <low_precision/convolution.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/max_pool.hpp>
+
+#include "lpt_ngraph_functions/precision_propagation_function.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
+#include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
+#include "simple_low_precision_transformer.hpp"
+
+using namespace testing;
+using namespace ngraph;
+using namespace ngraph::pass;
+using namespace ngraph::builder::subgraph;
+
+namespace {
+
+class ConcatWithNeighborsWithConvolutionActualValues {
+public:
+    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize1;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert1;
+    ngraph::builder::subgraph::DequantizationOperations dequantization1;
+    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize2;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert2;
+    ngraph::builder::subgraph::DequantizationOperations dequantization2;
+    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize3;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert3;
+    ngraph::builder::subgraph::DequantizationOperations dequantization3;
+};
+
+inline std::ostream& operator<<(std::ostream& out, const ConcatWithNeighborsWithConvolutionActualValues& values) {
+    return out << "_" << values.fakeQuantize1 << "_" << values.fakeQuantize2 << "_" << values.fakeQuantize3;
+}
+
+class ConcatWithNeighborsWithConvolutionResultValues {
+public:
+    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize1;
+    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize2;
+    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize3;
+    ngraph::element::Type precisionBeforeOp;
+    ngraph::builder::subgraph::DequantizationOperations dequantizationBefore;
+    ngraph::element::Type precisionAfterOp;
+    ngraph::builder::subgraph::DequantizationOperations dequantizationAfter1;
+    ngraph::builder::subgraph::DequantizationOperations dequantizationAfter2;
+};
+
+inline std::ostream& operator<<(std::ostream& out, const ConcatWithNeighborsWithConvolutionResultValues& values) {
+    return out << "_" <<
+        values.fakeQuantize1 << "_" <<
+        values.fakeQuantize2 << "_" <<
+        values.fakeQuantize3 << "_" <<
+        values.dequantizationAfter1 << "_" <<
+        values.dequantizationAfter2;
+}
+
+class ConcatWithNeighborsWithConvolutionTestValues {
+public:
+    TestTransformationParams params;
+    bool multiChannels;
+    ConcatWithNeighborsWithConvolutionActualValues actual;
+    ConcatWithNeighborsWithConvolutionResultValues result;
+};
+
+inline std::ostream& operator<<(std::ostream& out, const ConcatWithNeighborsWithConvolutionTestValues& values) {
+    return out << "_" << values.multiChannels << "_" << values.actual << "_" << values.result;
+}
+
+typedef std::tuple <
+    ngraph::element::Type,
+    ngraph::Shape,
+    ConcatWithNeighborsWithConvolutionTestValues
+> ConcatWithNeighborsWithConvolutionParams;
+
+class ConcatWithNeighborsWithConvolutionTransformation :
+    public LayerTransformation,
+    public testing::WithParamInterface<ConcatWithNeighborsWithConvolutionParams> {
+public:
+    void SetUp() override {
+        const ngraph::element::Type precision = std::get<0>(GetParam());
+        const ngraph::Shape shape = std::get<1>(GetParam());
+        ConcatWithNeighborsWithConvolutionTestValues testValues = std::get<2>(GetParam());
+
+        actualFunction = ngraph::builder::subgraph::PrecisionPropagationFunction::getOriginalWithNeighbors(
+            precision,
+            shape,
+            testValues.actual.fakeQuantize1,
+            testValues.actual.convert1,
+            testValues.actual.dequantization1,
+            testValues.actual.fakeQuantize2,
+            testValues.actual.convert2,
+            testValues.actual.dequantization2,
+            testValues.actual.fakeQuantize3,
+            testValues.actual.convert3,
+            testValues.actual.dequantization3);
+
+        auto supportedPrecisionsOnActivation = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            })
+        });
+
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>({0})
+            });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisionsOnActivation, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
+        transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
+        transform.transform(actualFunction);
+
+        referenceFunction = ngraph::builder::subgraph::PrecisionPropagationFunction::getReferenceWithNeighbors(
+            precision,
+            shape,
+            testValues.result.fakeQuantize1,
+            testValues.result.fakeQuantize2,
+            testValues.result.fakeQuantize3,
+            testValues.result.precisionBeforeOp,
+            testValues.result.dequantizationBefore,
+            testValues.result.precisionAfterOp,
+            testValues.result.dequantizationAfter1,
+            testValues.result.dequantizationAfter2);
+    }
+
+    static std::string getTestCaseName(testing::TestParamInfo<ConcatWithNeighborsWithConvolutionParams> obj) {
+        const ngraph::element::Type precision = std::get<0>(obj.param);
+        const ngraph::Shape shape = std::get<1>(obj.param);
+        const ConcatWithNeighborsWithConvolutionTestValues testValues = std::get<2>(obj.param);
+
+        std::ostringstream result;
+        result <<
+            LayerTransformation::getTestCaseNameByParams(precision, shape, testValues.params) << "_" <<
+            (testValues.multiChannels ? "multiChannels_" : "notMultiChannels_") <<
+            testValues.actual << "_" <<
+            testValues.result << "_";
+        return result.str();
+    }
+};
+
+TEST_P(ConcatWithNeighborsWithConvolutionTransformation, CompareFunctions) {
+    actualFunction->validate_nodes_and_infer_types();
+    //auto res = compare_functions(referenceFunction, actualFunction, true, false, false);
+    //ASSERT_TRUE(res.first) << res.second;
+
+    auto actualFakeQuantizes = LayerTransformation::get<opset1::FakeQuantize>(actualFunction);
+    ASSERT_EQ(3ul, actualFakeQuantizes.size()) << "unexpected FakeQuantize operations count " << actualFakeQuantizes.size();
+
+    ASSERT_TRUE(checkIfOutputAttributesSharedValuesAreTheSame<std::shared_ptr<PrecisionsAttribute>>(actualFakeQuantizes)) <<
+        "PrecisionsAttribute shared values are not the same";
+
+    auto actualConcatOperations = LayerTransformation::get<opset1::Concat>(actualFunction);
+    ASSERT_EQ(2ul, actualConcatOperations.size()) << "unexpected concat operations";
+    ASSERT_NE(nullptr, ngraph::pass::low_precision::getAttribute<std::shared_ptr<QuantizationAlignmentAttribute>>(actualConcatOperations[0]));
+    ASSERT_NE(nullptr, ngraph::pass::low_precision::getAttribute<std::shared_ptr<QuantizationAlignmentAttribute>>(actualConcatOperations[1]));
+
+    actualConcatOperations.insert(actualConcatOperations.end(), actualFakeQuantizes.begin(), actualFakeQuantizes.end());
+    ASSERT_TRUE(checkIfAttributesSharedValuesAreTheSame<std::shared_ptr<IntervalsAlignmentAttribute>>(actualConcatOperations)) <<
+        "IntervalsAlignmentAttribute shared values are not the same";
+
+    auto convolutions = LayerTransformation::get<opset1::Convolution>(actualFunction);
+    ASSERT_EQ(1ul, convolutions.size()) << "unexpected convolution operations";
+    ASSERT_EQ(2ul, convolutions[0]->input(0).get_rt_info().size()) <<
+        "unexpected input 0 attributes count: LowPrecision::PerTensorQuantization & LowPrecision::Precisions";
+    ASSERT_EQ(1ul, convolutions[0]->input(1).get_rt_info().size()) << "unexpected input 1 attributes count";
+    auto a1 = std::dynamic_pointer_cast<ngraph::VariantWrapper<std::shared_ptr<PrecisionsAttribute>>>(convolutions[0]->input(1).get_rt_info().begin()->second);
+    ASSERT_EQ(element::i8, *a1->get().get()->sharedValue->precisions.begin());
+}
+
+const std::vector<ngraph::element::Type> precisions = {
+    ngraph::element::f32
+};
+
+const std::vector<ConcatWithNeighborsWithConvolutionTestValues> testValues = {
+    // I8: concat: composed FakeQuantize
+    {
+        LayerTransformation::createParamsI8I8(),
+        false,
+        {
+            { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {-1.28f / 3.f}, {1.27f / 3.f} },
+            {},
+            {},
+            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-1.28f / 2.f}, {1.27f / 2.f} },
+            {},
+            {},
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} },
+            {},
+            {}
+        },
+        {
+            {
+                256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {0.f}, {255.f}, element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 1.27f}, 256ul) }
+            },
+            {
+                256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {64.f}, {192.f}, element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 1.27f}, 256ul) }
+            },
+            {
+                256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f}, element::u8,
+                { make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 1.27f}, 256ul) }
+            },
+            ngraph::element::u8,
+            {{}, {}, {}},
+            ngraph::element::u8,
+            { ngraph::element::f32, {128.f}, {{ 0.00333333f, 0.00333333f, 0.00333333f, 0.01f, 0.01f, 0.01f }} },
+            { {}, {}, {{ 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f }} }
+        }
+    },
+    // I8: concat: decomposed FakeQuantize
+    {
+        LayerTransformation::createParamsI8I8(),
+        false,
+        {
+            { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {-128.f}, {127.f} },
+            { ngraph::element::i8 },
+            {
+                { element::f32 },
+                {},
+                { 0.003333333333333f }
+            },
+            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-1.28f / 2.f}, {1.27f / 2.f} },
+            {},
+            {},
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-1.28f}, {1.27f} },
+            {},
+            {}
+        },
+        {
+            { 256ul, ngraph::Shape({}), {-1.28f / 3.f}, {1.27f / 3.f}, {0.f}, {255.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {64.f}, {192.f} },
+            { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {0.f}, {255.f} },
+            ngraph::element::u8,
+            {{}, {}, {}},
+            ngraph::element::u8,
+            { ngraph::element::f32, {128.f}, {{ 0.00333333f, 0.00333333f, 0.00333333f, 0.01f, 0.01f, 0.01f }} },
+            { {}, {}, {{ 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f, 0.0001f }} }
+        }
+    }
+};
+
+const std::vector<ngraph::Shape> shapes = {
+    { 1, 3, 9, 9 },
+    { 4, 3, 9, 9 }
+};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_LPT,
+    ConcatWithNeighborsWithConvolutionTransformation,
+    ::testing::Combine(
+        ::testing::ValuesIn(precisions),
+        ::testing::ValuesIn(shapes),
+        ::testing::ValuesIn(testValues)),
+    ConcatWithNeighborsWithConvolutionTransformation::getTestCaseName);
+}  // namespace
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_not_quantized_parent_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_not_quantized_parent_transformation.cpp
new file mode 100644
index 00000000000000..b34480ad5a41b3
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_not_quantized_parent_transformation.cpp
@@ -0,0 +1,315 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "layer_transformation.hpp"
+
+#include <sstream>
+#include <memory>
+#include <vector>
+
+#include <gtest/gtest.h>
+
+#include <transformations/utils/utils.hpp>
+#include <transformations/init_node_info.hpp>
+
+#include <low_precision/low_precision.hpp>
+
+#include <low_precision/concat.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/rt_info/precision_preserved_attribute.hpp>
+#include <low_precision/align_quantization_parameters.hpp>
+#include <low_precision/fuse_subtract_to_fake_quantize.hpp>
+#include <low_precision/fuse_multiply_to_fake_quantize.hpp>
+#include <low_precision/markup_can_be_quantized.hpp>
+#include <low_precision/markup_per_tensor_quantization.hpp>
+
+#include "common_test_utils/ngraph_test_utils.hpp"
+#include "lpt_ngraph_functions/concat_function.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
+#include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
+
+using namespace testing;
+using namespace ngraph;
+using namespace ngraph::pass;
+using namespace ngraph::builder::subgraph;
+
+namespace {
+
+class ConcatWithNotQuantizedParentTransformationActualValues {
+public:
+    ngraph::builder::subgraph::FakeQuantizeOnDataWithConstant fakeQuantize1;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert1;
+    ngraph::builder::subgraph::DequantizationOperations dequantization1;
+    ngraph::builder::subgraph::FakeQuantizeOnDataWithConstant fakeQuantize2;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert2;
+    ngraph::builder::subgraph::DequantizationOperations dequantization2;
+};
+
+inline std::ostream& operator<<(std::ostream& out, const ConcatWithNotQuantizedParentTransformationActualValues& values) {
+    return out << "_" <<
+        values.fakeQuantize1 << "_" <<
+        values.convert1.outPrecision << "_" <<
+        values.dequantization1 << "_" <<
+        values.fakeQuantize2 << "_" <<
+        values.convert2.outPrecision << "_" <<
+        values.dequantization2;
+}
+
+class ConcatWithNotQuantizedParentTransformationResultValues {
+public:
+    ngraph::builder::subgraph::FakeQuantizeOnDataWithConstant fakeQuantize1;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert1;
+    ngraph::builder::subgraph::DequantizationOperations dequantization1;
+    ngraph::builder::subgraph::FakeQuantizeOnDataWithConstant fakeQuantize2;
+    ngraph::builder::subgraph::DequantizationOperations::Convert convert2;
+    ngraph::builder::subgraph::DequantizationOperations dequantization2;
+    ngraph::element::Type precisionAfterOperation;
+    ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
+};
+
+inline std::ostream& operator<<(std::ostream& out, const ConcatWithNotQuantizedParentTransformationResultValues& values) {
+    return out << "_" <<
+        values.fakeQuantize1 << "_" <<
+        values.convert1.outPrecision << "_" <<
+        values.dequantization1 << "_" <<
+        values.fakeQuantize2 << "_" <<
+        values.convert2.outPrecision << "_" <<
+        values.dequantization2 << "_" <<
+        values.dequantizationAfter;
+}
+
+class ConcatWithNotQuantizedParentTransformationTestValues {
+public:
+    ConcatWithNotQuantizedParentTransformationTestValues() = default;
+    ConcatWithNotQuantizedParentTransformationTestValues(
+        const TestTransformationParams& params,
+        const bool multiChannels,
+        const  std::int64_t axis,
+        const ConcatWithNotQuantizedParentTransformationActualValues& actual,
+        const ConcatWithNotQuantizedParentTransformationResultValues& result,
+        const bool addNotPrecisionPreservedOperation = false,
+        const bool checkIntervalsAlignmentAttributes = true) :
+        params(params),
+        multiChannels(multiChannels),
+        axis(axis),
+        actual(actual),
+        result(result),
+        addNotPrecisionPreservedOperation(addNotPrecisionPreservedOperation),
+        checkIntervalsAlignmentAttributes(checkIntervalsAlignmentAttributes) {}
+
+    TestTransformationParams params;
+    bool multiChannels;
+    std::int64_t axis;
+    ConcatWithNotQuantizedParentTransformationActualValues actual;
+    ConcatWithNotQuantizedParentTransformationResultValues result;
+    // add not precision preserved operation to set output precision for FakeQuantize
+    // don't set to 'true' by default to keep test cases with tested operation as output
+    bool addNotPrecisionPreservedOperation;
+    bool checkIntervalsAlignmentAttributes;
+};
+
+inline std::ostream& operator<<(std::ostream& out, const ConcatWithNotQuantizedParentTransformationTestValues& values) {
+    return out << "_" << values.multiChannels << "_" << values.actual << "_" << values.result;
+}
+
+typedef std::tuple <
+    ngraph::element::Type,
+    std::pair<ngraph::Shape, ngraph::Shape>,
+    ConcatWithNotQuantizedParentTransformationTestValues
+> ConcatWithNotQuantizedParentTransformationParams;
+
+class ConcatWithNotQuantizedParentTransformation :
+    public LayerTransformation,
+    public testing::WithParamInterface<ConcatWithNotQuantizedParentTransformationParams> {
+public:
+    void SetUp() override {
+        const ngraph::element::Type precision = std::get<0>(GetParam());
+        const std::pair<ngraph::Shape, ngraph::Shape> shapes = std::get<1>(GetParam());
+        ConcatWithNotQuantizedParentTransformationTestValues testValues = std::get<2>(GetParam());
+
+        // dequantization output precision depends on input precision
+        // to avoid huge amount of tests cases let's define dequantization output precision as input precision
+        if (!testValues.actual.dequantization1.multiply.empty()) {
+            testValues.actual.dequantization1.multiply.outPrecision = precision;
+        }
+        if (!testValues.actual.dequantization2.multiply.empty()) {
+            testValues.actual.dequantization2.multiply.outPrecision = precision;
+        }
+
+        actualFunction = ngraph::builder::subgraph::ConcatFunction::get(
+            precision,
+            shapes.first,
+            testValues.actual.fakeQuantize1,
+            testValues.actual.convert1,
+            testValues.actual.dequantization1,
+            false,
+            shapes.second,
+            testValues.actual.fakeQuantize2,
+            testValues.actual.convert2,
+            testValues.actual.dequantization2,
+            true,
+            {},
+            ngraph::element::undefined,
+            {},
+            testValues.axis,
+            testValues.addNotPrecisionPreservedOperation);
+
+        auto precisionsRestrictions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            }),
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::AvgPool>({{0, testValues.params.precisionsOnActivations}})
+        });
+
+        auto quantizationRestrictions = std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+            ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>({0})
+        });
+
+        const auto params = TestTransformationParams(testValues.params.updatePrecisions);
+        const auto legacyParams = TestTransformationParams::toParams(params);
+
+        ngraph::pass::Manager manager;
+        manager.register_pass<ngraph::pass::low_precision::MarkupPrecisions>(precisionsRestrictions);
+        manager.register_pass<ngraph::pass::low_precision::MarkupPerTensorQuantization>(quantizationRestrictions);
+        manager.register_pass<ngraph::pass::low_precision::MarkupAvgPoolPrecisionPreserved>();
+        manager.register_pass<ngraph::pass::low_precision::PropagatePrecisions>();
+        manager.register_pass<ngraph::pass::low_precision::AlignQuantizationIntervals>();
+        manager.register_pass<ngraph::pass::low_precision::AlignQuantizationParameters>();
+
+        std::shared_ptr<ngraph::pass::GraphRewrite> common = manager.register_pass<ngraph::pass::GraphRewrite>();
+        common->add_matcher<ngraph::pass::low_precision::ConcatTransformation>(legacyParams);
+        common->add_matcher<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation>(legacyParams);
+        manager.run_passes(actualFunction);
+
+        {
+            ngraph::pass::Manager standaloneCleanupManager;
+            standaloneCleanupManager.register_pass<ngraph::pass::low_precision::FuseSubtractToFakeQuantizeTransformation>();
+            standaloneCleanupManager.run_passes(actualFunction);
+        }
+
+        {
+            ngraph::pass::Manager standaloneCleanupManager;
+            standaloneCleanupManager.register_pass<ngraph::pass::low_precision::FuseMultiplyToFakeQuantizeTransformation>();
+            standaloneCleanupManager.run_passes(actualFunction);
+        }
+
+        if (!testValues.result.dequantizationAfter.multiply.empty()) {
+            testValues.result.dequantizationAfter.multiply.outPrecision = precision;
+        }
+
+        if (!testValues.params.updatePrecisions &&
+            (precision == ngraph::element::f32) &&
+            !testValues.result.dequantizationAfter.convert.empty()) {
+            testValues.result.dequantizationAfter.convert = {};
+        }
+
+        referenceFunction = ngraph::builder::subgraph::ConcatFunction::get(
+            precision,
+            shapes.first,
+            testValues.result.fakeQuantize1,
+            testValues.result.convert1,
+            testValues.result.dequantization1,
+            false,
+            shapes.second,
+            testValues.result.fakeQuantize2,
+            testValues.result.convert2,
+            testValues.result.dequantization2,
+            true,
+            {
+                make_shared_attribute_ptr<PrecisionPreservedAttribute>(true),
+                make_shared_attribute_ptr<IntervalsAlignmentAttribute>(IntervalsAlignmentSharedValue::Interval{-1.28f, 2.55f}, 256ul),
+                make_shared_attribute_ptr<QuantizationAlignmentAttribute>(false)
+            },
+            testValues.result.precisionAfterOperation,
+            testValues.result.dequantizationAfter,
+            testValues.axis,
+            testValues.addNotPrecisionPreservedOperation);
+    }
+
+    static std::string getTestCaseName(testing::TestParamInfo<ConcatWithNotQuantizedParentTransformationParams> obj) {
+        const ngraph::element::Type precision = std::get<0>(obj.param);
+        const std::pair<ngraph::Shape, ngraph::Shape> shapes = std::get<1>(obj.param);
+        const ConcatWithNotQuantizedParentTransformationTestValues testValues = std::get<2>(obj.param);
+
+        std::ostringstream result;
+        result <<
+            LayerTransformation::getTestCaseNameByParams(precision, shapes.first, testValues.params) << "_" <<
+            shapes.second <<
+            (testValues.multiChannels ? "multiChannels_" : "notMultiChannels_") <<
+            "axis_" << testValues.axis << "_" <<
+            testValues.actual << "_" <<
+            testValues.result << "_";
+        return result.str();
+    }
+};
+
+TEST_P(ConcatWithNotQuantizedParentTransformation, CompareFunctions) {
+    actualFunction->validate_nodes_and_infer_types();
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false, true, false);
+    ASSERT_TRUE(res.first) << res.second;
+
+    auto actualFakeQuantizes = LayerTransformation::get<opset1::FakeQuantize>(actualFunction);
+    for (auto it = actualFakeQuantizes.begin(); it != actualFakeQuantizes.end(); it++) {
+        const auto actualFakeQuantize = *it;
+        if (actualFakeQuantize->output(0).get_target_inputs().begin()->get_index() == 1ul) {
+            actualFakeQuantizes.erase(it);
+            break;
+        }
+    }
+    ASSERT_TRUE(checkIfOutputAttributesSharedValuesAreTheSame<std::shared_ptr<PrecisionsAttribute>>(actualFakeQuantizes)) <<
+        "PrecisionsAttribute are not the same";
+
+    ConcatWithNotQuantizedParentTransformationTestValues testValues = std::get<2>(GetParam());
+    if (testValues.checkIntervalsAlignmentAttributes) {
+        auto operations = LayerTransformation::get<opset1::Concat>(actualFunction);
+        operations.insert(operations.end(), actualFakeQuantizes.begin(), actualFakeQuantizes.end());
+        ASSERT_TRUE(checkIfAttributesSharedValuesAreTheSame<std::shared_ptr<IntervalsAlignmentAttribute>>(operations)) <<
+            "IntervalsAlignmentAttribute are not the same";
+    }
+}
+
+const std::vector<ngraph::element::Type> precisions = {
+    ngraph::element::f32,
+    //ngraph::element::f16
+};
+
+const std::vector<ConcatWithNotQuantizedParentTransformationTestValues> testValues = {
+    {
+        LayerTransformation::createParamsU8I8(),
+        false,
+        1,
+        {
+            { 256ul, {}, {0.f}, {1.275f}, {0.f}, {1.275f} },
+            {},
+            {},
+            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} }
+        },
+        {
+            { 256ul, {}, {0.f}, {1.275f}, {0.f}, {1.28f} },
+            {},
+            {},
+            { 256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f} },
+            {},
+            {},
+            ngraph::element::f32,
+            {},
+        }
+    }
+};
+
+const std::vector<std::pair<ngraph::Shape, ngraph::Shape>> shapes = {
+    {{ 1, 3, 9, 9 }, { 1, 3, 9, 9 }},
+    {{ 4, 3, 9, 9 }, { 4, 3, 9, 9 }}
+};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_LPT,
+    ConcatWithNotQuantizedParentTransformation,
+    ::testing::Combine(
+        ::testing::ValuesIn(precisions),
+        ::testing::ValuesIn(shapes),
+        ::testing::ValuesIn(testValues)),
+    ConcatWithNotQuantizedParentTransformation::getTestCaseName);
+}  // namespace
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_reshape_at_the_end_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_reshape_at_the_end_transformation.cpp
index 599e4f2c0bc5af..a1c67bd8a467c4 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_reshape_at_the_end_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_reshape_at_the_end_transformation.cpp
@@ -12,9 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/max_pool.hpp>
 #include <low_precision/reshape.hpp>
 
@@ -56,7 +55,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ConcatTransformationActualValues actual;
     ConcatTransformationResultValues result;
 };
@@ -86,7 +85,8 @@ class ConcatWithReshapeAtTheEndTransformation : public LayerTransformation, publ
             testValues.actual.fakeQuantize3);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.add<ngraph::pass::low_precision::ReshapeTransformation, ngraph::opset1::Reshape>(testValues.params);
         transform.transform(actualFunction);
@@ -118,7 +118,7 @@ class ConcatWithReshapeAtTheEndTransformation : public LayerTransformation, publ
 
 TEST_P(ConcatWithReshapeAtTheEndTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_split_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_split_transformation.cpp
index de2eea92024fc2..ee1f3cde8f6ce0 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_split_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_split_transformation.cpp
@@ -12,10 +12,16 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/split.hpp>
+#include <low_precision/align_quantization_parameters.hpp>
+#include <low_precision/align_quantization_intervals.hpp>
+#include <low_precision/propagate_precisions.hpp>
+#include <low_precision/markup_avg_pool_precision_preserved.hpp>
+#include <low_precision/markup_precisions.hpp>
+#include <low_precision/markup_per_tensor_quantization.hpp>
+#include "low_precision/common/operation_precision_restriction.hpp"
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/concat_function.hpp"
@@ -61,7 +67,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     ConcatTransformationActualValues actual;
     ConcatTransformationResultValues result;
@@ -93,12 +99,22 @@ class ConcatWithSplitTransformation : public LayerTransformation, public testing
             testValues.actual.fakeQuantize2,
             addConvolution);
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
+        auto supportedPrecisions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+               ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                   {0, testValues.params.precisionsOnActivations},
+                   {1, testValues.params.precisionsOnWeights},
+               })
+           });
+
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>()
+            });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisions, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::SplitTransformation, ngraph::opset1::Split>(testValues.params);
         transform.transform(actualFunction);
 
@@ -161,13 +177,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f}},
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f / 2.f}, {0.f}, { 128.f}},
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f / 2.f}, {0.f}, { 255.f}},
             ngraph::element::u8,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::u8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { ngraph::element::f32, {}, { 0.005f } }
         }
     },
     // I8: concat
@@ -180,13 +196,13 @@ const std::vector<ConcatTransformationTestValues> testValues = {
         },
         {
             { 256ul, ngraph::Shape({}), {-1.28f}, {1.27f}, {-128.f}, {127.f}},
-            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-64.f}, { 64.f}},
+            { 256ul, ngraph::Shape({}), {-1.28f / 2.f}, {1.27f / 2.f}, {-128.f}, {127.f}},
             ngraph::element::i8,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::i8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            { ngraph::element::f32, {}, {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }} },
+            { ngraph::element::f32, {}, { 0.005f } }
         }
     },
     // U8: concat with subtract
@@ -198,14 +214,18 @@ const std::vector<ConcatTransformationTestValues> testValues = {
             { 256ul, ngraph::Shape({}), {1.275f}, {2.55f}, {1.275f}, {2.55f} }
         },
         {
-            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f}},
-            { 256ul, ngraph::Shape({}), {1.275f}, {2.55f}, {128.f}, {255.f}},
+            { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {255.f} },
+            { 256ul, ngraph::Shape({}), {1.275f}, {2.55f}, {0.f}, {255.f} },
             ngraph::element::u8,
             {{}, {}, {}},
             {{}, {}, {}},
             ngraph::element::u8,
-            { ngraph::element::f32, {}, { 0.01f } },
-            { ngraph::element::f32, {}, { 0.01f } }
+            {
+                ngraph::element::f32,
+                {{ 0.f, 0.f, 0.f, -255.f, -255.f, -255.f }},
+                {{ 0.01f, 0.01f, 0.01f, 0.005f, 0.005f, 0.005f }}
+            },
+            { ngraph::element::f32, {-255.f}, { 0.005f } }
         }
     },
     // U8: concat multi channels
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_strided_slice_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_strided_slice_transformation.cpp
index 8dbdf29586f903..cea034e5c7af20 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_strided_slice_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/concat_with_strided_slice_transformation.cpp
@@ -12,9 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/concat.hpp>
-#include <low_precision/concat_multi_channels.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
 #include <low_precision/max_pool.hpp>
 #include <low_precision/strided_slice.hpp>
 
@@ -60,7 +59,7 @@ inline std::ostream& operator<<(std::ostream& out, const ConcatTransformationRes
 
 class ConcatTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool multiChannels;
     bool ssBeforeConcat;
     bool ssAfterConcat;
@@ -93,12 +92,22 @@ class ConcatWithStridedSliceTransformation : public LayerTransformation, public
             testValues.ssBeforeConcat,
             testValues.ssAfterConcat);
 
-        SimpleLowPrecisionTransformer transform;
-        if (testValues.multiChannels) {
-            transform.add<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>(testValues.params);
-        } else {
-            transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
-        }
+        auto supportedPrecisions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+           ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+               {0, testValues.params.precisionsOnActivations},
+               {1, testValues.params.precisionsOnWeights},
+           })
+       });
+
+        auto quantizationRestrictions = testValues.multiChannels ?
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>() :
+            std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+                ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>()
+            });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisions, quantizationRestrictions);
+        transform.add<ngraph::pass::low_precision::ConcatTransformation, ngraph::opset1::Concat>(testValues.params);
+        transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(testValues.params);
         transform.add<ngraph::pass::low_precision::StridedSliceTransformation, ngraph::opset1::StridedSlice>(testValues.params);
         transform.transform(actualFunction);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convert_mul_or_add_finally_transformation_with_dequantization.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convert_mul_or_add_finally_transformation_with_dequantization.cpp
index edb4e813b7fe7a..e0091e571531ca 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convert_mul_or_add_finally_transformation_with_dequantization.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convert_mul_or_add_finally_transformation_with_dequantization.cpp
@@ -41,7 +41,7 @@ class ConvertMulOrAddFinallyTransformationWithDequantizationTestValues {
     std::vector<float> multiplyConstValues;
     ngraph::Shape inputShape;
     ngraph::element::Type inputPrecision;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
 };
 
 using TestValuesType = ConvertMulOrAddFinallyTransformationWithDequantizationTestValues;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convert_subtract_constant_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convert_subtract_constant_transformation.cpp
index 235c6f77e26e62..6e65c76c0d009d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convert_subtract_constant_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convert_subtract_constant_transformation.cpp
@@ -34,7 +34,7 @@ class ConvertSubtractConstantTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Values actual;
     Values expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp
index b99aa06969948e..70ea890c92cd2b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp
@@ -65,7 +65,7 @@ class ConvolutionBackpropDataTransformationTestValues {
         bool transformed;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_qdq_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_qdq_transformation.cpp
index 4e1b5d10603400..32300353277963 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_qdq_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_qdq_transformation.cpp
@@ -35,7 +35,7 @@ class ConvolutionQDqTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Values actual;
     Values expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp
index 6efad6e96fb59c..db43dbccb2746b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp
@@ -43,7 +43,7 @@ class ConvolutionTransformationTestValues {
         ngraph::element::Type precisionAfterDequantization;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -70,6 +70,12 @@ class ConvolutionTransformation : public LayerTransformation, public testing::Wi
 
         SimpleLowPrecisionTransformer transform;
         transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
+        if (testValues.params.supportAsymmetricQuantization == false) {
+            transform.set_callback<ngraph::pass::low_precision::ConvolutionTransformation>(
+                [](const std::shared_ptr<const ngraph::Node>& node) -> bool {
+                    return ngraph::pass::low_precision::LayerTransformation::isAsymmetricQuantization(node);
+                });
+        }
         transform.transform(actualFunction);
 
         if (!testValues.params.updatePrecisions) {
@@ -112,7 +118,7 @@ class ConvolutionTransformation : public LayerTransformation, public testing::Wi
 
 TEST_P(ConvolutionTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -164,8 +170,8 @@ const std::vector<ConvolutionTransformationTestValues> testValues = {
         {
             ngraph::element::u8,
             {{ ngraph::element::f32 }, { 128.f }, { 0.02f }},
-            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ -1.25f }),
-            {},
+            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 2.f }),
+            { 255ul, Shape({ 1, 1, 1, 1 }), { 0.f }, { 254.f }, { -1.27f }, { 1.27f } },
             ngraph::element::f32,
             {}
         }
@@ -406,26 +412,27 @@ const std::vector<ConvolutionTransformationTestValues> testValues = {
             {}
         }
     },
-    // incorrect zero point on weights [not transformed, weights folded]
-    {
-        LayerTransformation::createParamsU8I8(),
-        // ActualValues
-        {
-            ngraph::element::u8,
-            {{element::f32}, {}, { {0.02f}, element::f32 }},
-            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 0.f }),
-            { 255ul, Shape({ 1, 1, 1, 1 }), { 0.f }, { 254.f }, { 5.f }, { 6.f } }
-        },
-        // ExpectedValues
-        {
-            ngraph::element::u8,
-            {{element::f32}, {}, { {0.02f}, element::f32 }},
-            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 5.f }),
-            {},
-            ngraph::element::f32,
-            {}
-        }
-    },
+    // TODO: uncomment: remove precisionsOnActivations & precisionsOnWeights
+//    // incorrect zero point on weights [not transformed, weights folded]
+//    {
+//        LayerTransformation::createParamsU8I8(),
+//        // ActualValues
+//        {
+//            ngraph::element::u8,
+//            {{element::f32}, {}, { {0.02f}, element::f32 }},
+//            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 0.f }),
+//            { 255ul, Shape({ 1, 1, 1, 1 }), { 0.f }, { 254.f }, { 5.f }, { 6.f } }
+//        },
+//        // ExpectedValues
+//        {
+//            ngraph::element::u8,
+//            {{element::f32}, {}, { {0.02f}, element::f32 }},
+//            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 5.f }),
+//            {},
+//            ngraph::element::f32,
+//            {}
+//        }
+//    },
 };
 
 INSTANTIATE_TEST_SUITE_P(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_with_incorrect_weights.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_with_incorrect_weights.cpp
index 7a6b43bc54788c..3a28bbe934ee49 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_with_incorrect_weights.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_with_incorrect_weights.cpp
@@ -11,6 +11,8 @@
 #include <transformations/init_node_info.hpp>
 #include <low_precision/convolution.hpp>
 #include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/fold_fake_quantize.hpp>
+#include <ngraph/pass/constant_folding.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/common/dequantization_operations.hpp"
@@ -22,7 +24,7 @@
 
 
 namespace {
-class ConvolutionWIthIncorrectWeightsTestValues {
+class ConvolutionWithIncorrectWeightsTestValues {
 public:
     class Actual {
     public:
@@ -40,18 +42,18 @@ class ConvolutionWIthIncorrectWeightsTestValues {
 
     ngraph::element::Type inputPrecision;
     ngraph::Shape inputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool isCorrect;
     Actual actual;
     Expected expected;
 };
 
-class ConvolutionWIthIncorrectWeightsTransformation :
+class ConvolutionWithIncorrectWeightsTransformation :
     public LayerTransformation,
-    public testing::WithParamInterface<ConvolutionWIthIncorrectWeightsTestValues> {
+    public testing::WithParamInterface<ConvolutionWithIncorrectWeightsTestValues> {
 public:
     void SetUp() override {
-        const ConvolutionWIthIncorrectWeightsTestValues testValues = GetParam();
+        const ConvolutionWithIncorrectWeightsTestValues testValues = GetParam();
 
         actualFunction = ngraph::builder::subgraph::ConvolutionFunction::getOriginalWithIncorrectWeights(
             testValues.inputShape,
@@ -65,18 +67,22 @@ class ConvolutionWIthIncorrectWeightsTransformation :
         transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.transform(actualFunction);
 
+        ngraph::pass::Manager cleanupManager;
+        cleanupManager.register_pass<ngraph::pass::low_precision::FoldFakeQuantizeTransformation>();
+        cleanupManager.register_pass<ngraph::pass::ConstantFolding>();
+        cleanupManager.run_passes(actualFunction);
+
         referenceFunction = ngraph::builder::subgraph::ConvolutionFunction::getReferenceWithIncorrectWeights(
             testValues.inputShape,
             testValues.inputPrecision,
             testValues.expected.dequantizationBefore,
             testValues.expected.weightsPrecision,
             testValues.expected.weightsValues,
-            testValues.expected.dequantizationAfter,
-            testValues.isCorrect);
+            testValues.expected.dequantizationAfter);
     }
 
-    static std::string getTestCaseName(testing::TestParamInfo<ConvolutionWIthIncorrectWeightsTestValues> obj) {
-        const ConvolutionWIthIncorrectWeightsTestValues testValues = obj.param;
+    static std::string getTestCaseName(testing::TestParamInfo<ConvolutionWithIncorrectWeightsTestValues> obj) {
+        const ConvolutionWithIncorrectWeightsTestValues testValues = obj.param;
 
         std::ostringstream result;
         result << toString(testValues.params) <<
@@ -85,7 +91,7 @@ class ConvolutionWIthIncorrectWeightsTransformation :
     }
 };
 
-TEST_P(ConvolutionWIthIncorrectWeightsTransformation, CompareFunctions) {
+TEST_P(ConvolutionWithIncorrectWeightsTransformation, CompareFunctions) {
     ngraph::pass::InitNodeInfo().run_on_function(actualFunction);
     actualFunction->validate_nodes_and_infer_types();
 
@@ -93,7 +99,7 @@ TEST_P(ConvolutionWIthIncorrectWeightsTransformation, CompareFunctions) {
     ASSERT_TRUE(res.first) << res.second;
 }
 
-const std::vector<ConvolutionWIthIncorrectWeightsTestValues> testValues = {
+const std::vector<ConvolutionWithIncorrectWeightsTestValues> testValues = {
     // incorrect weights
     {
         ngraph::element::u8,
@@ -107,7 +113,7 @@ const std::vector<ConvolutionWIthIncorrectWeightsTestValues> testValues = {
         {
             {ngraph::element::f32, {}, {0.1f}},
             ngraph::element::f32,
-            {-126.f},
+            {-129.f},
             {}
         },
     },
@@ -132,8 +138,8 @@ const std::vector<ConvolutionWIthIncorrectWeightsTestValues> testValues = {
 
 INSTANTIATE_TEST_SUITE_P(
     smoke_LPT,
-    ConvolutionWIthIncorrectWeightsTransformation,
+    ConvolutionWithIncorrectWeightsTransformation,
     ::testing::ValuesIn(testValues),
-    ConvolutionWIthIncorrectWeightsTransformation::getTestCaseName);
+    ConvolutionWithIncorrectWeightsTransformation::getTestCaseName);
 
 } // namespace
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/depth_to_space_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/depth_to_space_transformation.cpp
index d117a90da041ab..aad6d5e0a9a0f1 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/depth_to_space_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/depth_to_space_transformation.cpp
@@ -42,7 +42,7 @@ class DepthToSpaceTransformationTestValues {
 
     DepthToSpace::DepthToSpaceMode mode;
     size_t blockSize;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -65,8 +65,7 @@ class DepthToSpaceTransformation : public LayerTransformation, public testing::W
             testValues.actual.dequantization);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<low_precision::DepthToSpaceTransformation, ngraph::opset1::DepthToSpace>(
-            low_precision::LayerTransformation::Params(testValues.params));
+        transform.add<low_precision::DepthToSpaceTransformation, ngraph::opset1::DepthToSpace>(testValues.params);
         transform.transform(actualFunction);
 
         referenceFunction = DepthToSpaceFunction::getReference(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/elementwise_with_multi_parent_dequantization_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/elementwise_with_multi_parent_dequantization_transformation.cpp
index 415301ec850816..c850a471b47e91 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/elementwise_with_multi_parent_dequantization_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/elementwise_with_multi_parent_dequantization_transformation.cpp
@@ -45,7 +45,7 @@ class ElementwiseWithMultiParentDequantizationTransformationTestValues {
 
     ngraph::element::Type precision;
     ngraph::Shape inputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -73,21 +73,20 @@ class ElementwiseWithMultiParentDequantizationTransformation :
         actualFunction = ElementwiseWithMultiParentDequantizationFunction::get(
             testValues.precision,
             testValues.inputShape,
-            testValues.params,
+            TestTransformationParams::toParams(testValues.params),
             testValues.actual.precision1,
             testValues.actual.dequantization1,
             testValues.actual.precision2,
             testValues.actual.dequantization2);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::AddTransformation, ngraph::opset1::Add>(
-            low_precision::LayerTransformation::Params(testValues.params));
+        transform.add<ngraph::pass::low_precision::AddTransformation, ngraph::opset1::Add>(testValues.params);
         transform.transform(actualFunction);
 
         referenceFunction = ElementwiseWithMultiParentDequantizationFunction::get(
             testValues.precision,
             testValues.inputShape,
-            testValues.params,
+            TestTransformationParams::toParams(testValues.params),
             testValues.expected.precision1,
             testValues.expected.dequantization1,
             testValues.expected.precision2,
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp
index ca4bc3e294c5d2..7ff622912590de 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp
@@ -48,7 +48,7 @@ class FakeQuantizeAndTwoOutputBranchesWithConvolutionTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter2;
     };
 
-    low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ActualValues actual;
     ExpectedValues expected;
 };
@@ -82,7 +82,7 @@ class FakeQuantizeAndTwoOutputBranchesWithConvolutionTransformation :
         referenceFunction = ngraph::builder::subgraph::FakeQuantizeAndTwoOutputBranchesWithConvolutionFunction::getReference(
             precision,
             shape,
-            testValues.params,
+            TestTransformationParams::toParams(testValues.params),
             testValues.expected.fqOnData,
             testValues.expected.precisionBeforeOp,
             testValues.expected.dequantizationBefore,
@@ -135,22 +135,42 @@ const std::vector<FakeQuantizeAndTwoOutputBranchesWithConvolutionTestValues> fak
             {{}, {}, {{ 1.f }, ngraph::element::f32, { 1, 1, 1, 1 }}},
         }
     },
+    // TODO: LPT: issue #58685
+//    // not update precisions
+//    {
+//        LayerTransformation::createParamsU8I8().setUpdatePrecisions(false),
+//        {
+//            { 256ul, {}, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
+//            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+//            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+//        },
+//        {
+//            { 256ul, {}, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
+//            ngraph::element::f32,
+//            {{}, {}, {}},
+//            ngraph::element::f32,
+//            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+//            {{}, {}, {{ 1.f }, ngraph::element::f32, { 1, 1, 1, 1 }}},
+//            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+//            {{}, {}, {{ 1.f }, ngraph::element::f32, { 1, 1, 1, 1 }}},
+//        }
+//    },
     // not update precisions
     {
         LayerTransformation::createParamsU8I8().setUpdatePrecisions(false),
         {
             { 256ul, {}, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
-            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
-            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -1.27f }, { 1.27f } },
+            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -1.27f }, { 1.27f } },
         },
         {
-            { 256ul, {}, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
+            { 256ul, {}, { 0.f }, { 2.55f }, { 0.f }, { 255.f } },
             ngraph::element::f32,
             {{}, {}, {}},
             ngraph::element::f32,
-            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+            { },
             {{}, {}, {{ 1.f }, ngraph::element::f32, { 1, 1, 1, 1 }}},
-            { 255ul, {1, 1, 1, 1}, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+            { },
             {{}, {}, {{ 1.f }, ngraph::element::f32, { 1, 1, 1, 1 }}},
         }
     }
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_on_weights_with_unsupported_child.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_on_weights_with_unsupported_child.cpp
index b29eff3926e379..3699efe02ef268 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_on_weights_with_unsupported_child.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_on_weights_with_unsupported_child.cpp
@@ -12,6 +12,8 @@
 
 #include <transformations/utils/utils.hpp>
 #include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/fold_fake_quantize.hpp>
+#include <ngraph/pass/constant_folding.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "simple_low_precision_transformer.hpp"
@@ -35,7 +37,7 @@ class FakeQuantizeOnWeightsWithUnsupportedChildTestValues {
         builder::subgraph::FakeQuantizeOnWeights fakeQuantizeOnWeights;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ngraph::element::Type precision;
     Actual actual;
     Expected expected;
@@ -45,7 +47,7 @@ typedef std::tuple<
     ngraph::Shape,
     FakeQuantizeOnWeightsWithUnsupportedChildTestValues> FakeQuantizeOnWeightsWithUnsupportedChildParams;
 
-class FakeQuantizeOnWeightsWithUnsupportedChild :
+class FakeQuantizeOnWeightsWithUnsupportedChildTransformation :
     public LayerTransformation,
     public testing::WithParamInterface<FakeQuantizeOnWeightsWithUnsupportedChildParams> {
 public:
@@ -63,6 +65,12 @@ class FakeQuantizeOnWeightsWithUnsupportedChild :
         transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(testValues.params);
         transform.transform(actualFunction);
 
+        ngraph::pass::Manager cleanupManager;
+        cleanupManager.register_pass<ngraph::pass::low_precision::FoldFakeQuantizeTransformation>();
+        cleanupManager.register_pass<ngraph::pass::ConstantFolding>();
+        cleanupManager.run_passes(actualFunction);
+
+
         referenceFunction = ngraph::builder::subgraph::FakeQuantizeOnWeightsAndUnsupportedChildFunction::get(
             inputShape,
             testValues.precision,
@@ -81,9 +89,9 @@ class FakeQuantizeOnWeightsWithUnsupportedChild :
     }
 };
 
-TEST_P(FakeQuantizeOnWeightsWithUnsupportedChild, CompareFunctions) {
+TEST_P(FakeQuantizeOnWeightsWithUnsupportedChildTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -121,8 +129,8 @@ const std::vector<FakeQuantizeOnWeightsWithUnsupportedChildTestValues> testValue
 
 INSTANTIATE_TEST_SUITE_P(
     smoke_LPT,
-    FakeQuantizeOnWeightsWithUnsupportedChild,
+    FakeQuantizeOnWeightsWithUnsupportedChildTransformation,
     ::testing::Combine(
         ::testing::ValuesIn(shapes),
         ::testing::ValuesIn(testValues)),
-    FakeQuantizeOnWeightsWithUnsupportedChild::getTestCaseName);
+    FakeQuantizeOnWeightsWithUnsupportedChildTransformation::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_precision_selection_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_precision_selection_transformation.cpp
index c0db76cfd24d7b..feba51eb661381 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_precision_selection_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_precision_selection_transformation.cpp
@@ -73,11 +73,11 @@ class FakeQuantizePrecisionSelectionTransformation : public LayerTransformation,
         const bool updatePrecision = std::get<2>(GetParam());
         const FakeQuantizePrecisionSelectionTransformationTestValues testValues = std::get<3>(GetParam());
 
-        low_precision::LayerTransformation::Params params = createParamsU8I8AndI8();
+        auto params = createParamsU8I8AndI8();
         params.setUpdatePrecisions(updatePrecision);
         params.setPrecisionsOnActivations(testValues.precisionsOnActivations);
 
-        low_precision::LayerTransformation::Params precisionLimitedOperationParams(params);
+        auto precisionLimitedOperationParams(params);
         precisionLimitedOperationParams.setPrecisionsOnActivations(testValues.precisionsOnActivationForLimitedOperation);
 
         actualFunction = ngraph::builder::subgraph::FakeQuantizePrecisionSelectionFunction::getOriginal(
@@ -88,8 +88,16 @@ class FakeQuantizePrecisionSelectionTransformation : public LayerTransformation,
                 testValues.actual.fakeQuantizeOnData,
                 testValues.actual.fakeQuantizeOnWeights
             });
-        SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::PReluTransformation, ngraph::opset1::AvgPool>(params);
+
+        auto supportedPrecisions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+           ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+               {0, testValues.precisionsOnActivationForLimitedOperation},
+               {1, { element::i8 }}
+           })
+        });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisions);
+        transform.add<ngraph::pass::low_precision::PReluTransformation, ngraph::opset1::PRelu>(params);
         transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(precisionLimitedOperationParams);
         transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(params);
         transform.add<ngraph::pass::low_precision::MaxPoolTransformation, ngraph::opset1::MaxPool>(params);
@@ -113,7 +121,7 @@ class FakeQuantizePrecisionSelectionTransformation : public LayerTransformation,
         FakeQuantizePrecisionSelectionTransformationTestValues testValues;
         std::tie(precision, shape, updatePrecision, testValues) = obj.param;
 
-        low_precision::LayerTransformation::Params params;
+        TestTransformationParams params;
         params.setUpdatePrecisions(updatePrecision);
         params.setPrecisionsOnActivations(testValues.precisionsOnActivations);
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_transformation.cpp
index 027cde6c7cdeed..cef8f87a01ed17 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_transformation.cpp
@@ -11,8 +11,9 @@
 
 #include <gtest/gtest.h>
 
+#include <low_precision/avg_pool.hpp>
+#include <low_precision/common/operation_precision_restriction.hpp>
 #include <low_precision/fake_quantize_decomposition.hpp>
-
 #include "common_test_utils/ngraph_test_utils.hpp"
 
 #include "lpt_ngraph_functions/fake_quantize_function.hpp"
@@ -26,11 +27,30 @@ using namespace ngraph::pass;
 
 class FakeQuantizeTransformationTestValues {
 public:
-    low_precision::LayerTransformation::Params params;
+    FakeQuantizeTransformationTestValues() = default;
+
+    FakeQuantizeTransformationTestValues(
+        const TestTransformationParams& params,
+        const builder::subgraph::FakeQuantizeOnDataWithConstant& actual,
+        const builder::subgraph::FakeQuantizeOnDataWithConstant& expected,
+        const ngraph::element::Type expectedFakeQuantizeOnDataPrecision,
+        const std::map<ngraph::element::Type, ngraph::builder::subgraph::DequantizationOperations>& expectedValues,
+        const bool addNotPrecisionPreservedOperation = false) :
+            params(params),
+            actual(actual),
+            expected(expected),
+            expectedFakeQuantizeOnDataPrecision(expectedFakeQuantizeOnDataPrecision),
+            expectedValues(expectedValues),
+            addNotPrecisionPreservedOperation(addNotPrecisionPreservedOperation) {}
+
+    TestTransformationParams params;
     builder::subgraph::FakeQuantizeOnDataWithConstant actual;
     builder::subgraph::FakeQuantizeOnDataWithConstant expected;
     ngraph::element::Type expectedFakeQuantizeOnDataPrecision;
     std::map<ngraph::element::Type, ngraph::builder::subgraph::DequantizationOperations> expectedValues;
+    // add not precision preserved operation to set output precision for FakeQuantize
+    // don't set to 'true' by default to keep test cases with tested operation as output
+    bool addNotPrecisionPreservedOperation;
 };
 
 inline std::ostream& operator<<(std::ostream& os, const std::vector<float>& values) {
@@ -63,25 +83,33 @@ class FakeQuantizeTransformation : public LayerTransformation, public testing::W
         const bool updatePrecision = std::get<2>(GetParam());
         const FakeQuantizeTransformationTestValues fakeQuantizeOnData = std::get<3>(GetParam());
 
-        const low_precision::LayerTransformation::Params params = low_precision::LayerTransformation::Params(fakeQuantizeOnData.params).
-            setUpdatePrecisions(updatePrecision);
+        const auto params = TestTransformationParams(fakeQuantizeOnData.params).setUpdatePrecisions(updatePrecision);
 
         actualFunction = ngraph::builder::subgraph::FakeQuantizeFunction::getOriginal(
+            TestTransformationParams::toParams(fakeQuantizeOnData.params),
             precision,
             shape,
-            fakeQuantizeOnData.actual);
+            fakeQuantizeOnData.actual,
+            fakeQuantizeOnData.addNotPrecisionPreservedOperation);
+
+        auto supportedPrecisions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+           ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::AvgPool>({{0, params.precisionsOnActivations}})
+        });
 
-        SimpleLowPrecisionTransformer transform;
+        SimpleLowPrecisionTransformer transform(supportedPrecisions);
         transform.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(params);
+        transform.add<ngraph::pass::low_precision::AvgPoolTransformation, ngraph::opset1::AvgPool>(params);
         transform.transform(actualFunction);
 
         referenceFunction = ngraph::builder::subgraph::FakeQuantizeFunction::getReference(
+            TestTransformationParams::toParams(fakeQuantizeOnData.params),
             precision,
             shape,
             params.updatePrecisions,
             fakeQuantizeOnData.expected,
             fakeQuantizeOnData.expectedFakeQuantizeOnDataPrecision,
-            fakeQuantizeOnData.expectedValues.find(element::f32)->second);
+            fakeQuantizeOnData.expectedValues.find(element::f32)->second,
+            fakeQuantizeOnData.addNotPrecisionPreservedOperation);
     }
 
     static std::string getTestCaseName(testing::TestParamInfo<FakeQuantizeTransformationParams> obj) {
@@ -101,7 +129,7 @@ class FakeQuantizeTransformation : public LayerTransformation, public testing::W
 
 TEST_P(FakeQuantizeTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -138,9 +166,10 @@ const std::vector<FakeQuantizeTransformationTestValues> fakeQuantizeTransformati
         { 256ul, {}, { -1.23f }, { 2.55f }, { 0.f }, { 255.f } },
         ngraph::element::u8,
         {
-            { ngraph::element::f32, {{ngraph::element::f32}, { 82.97619048f }, { 0.014823529f }} },
-            { ngraph::element::f16, {{ngraph::element::f16}, { 83.f }, { 0.014823529f }} }
-        }
+            { ngraph::element::f32, {{}, { 82.97619048f }, { 0.014823529f }} },
+            { ngraph::element::f16, {{}, { 83.f }, { 0.014823529f }} }
+        },
+        true
     },
     {
         LayerTransformation::createParamsU8I8(),
@@ -148,9 +177,10 @@ const std::vector<FakeQuantizeTransformationTestValues> fakeQuantizeTransformati
         { 256ul, {}, { -1.28f} , { 1.27f }, { 0.f }, { 255.f } },
         ngraph::element::u8,
         {
-            { ngraph::element::f32, {{ngraph::element::f32}, { 128.f }, { 0.01f }} },
-            { ngraph::element::f16, {{ngraph::element::f16}, { 128.f }, { 0.01f }} }
-        }
+            { ngraph::element::f32, {{}, { 128.f }, { 0.01f }} },
+            { ngraph::element::f16, {{}, { 128.f }, { 0.01f }} }
+        },
+        true
     },
 
     // I8
@@ -170,9 +200,10 @@ const std::vector<FakeQuantizeTransformationTestValues> fakeQuantizeTransformati
         { 256ul, {}, { -0.12f}, { 1.27f }, { -128.f}, { 127.f } },
         ngraph::element::i8,
         {
-            { ngraph::element::f32, {{ngraph::element::f32}, { -105.9856115f }, { 0.00545098f }} },
-            { ngraph::element::f16, {{ngraph::element::f16}, { -105.9856115f }, { 0.00545098f }} }
-        }
+            { ngraph::element::f32, {{}, { -105.9856115f }, { 0.00545098f }} },
+            { ngraph::element::f16, {{}, { -105.9856115f }, { 0.00545098f }} }
+        },
+        true
     },
     {
         LayerTransformation::createParamsI8I8(),
@@ -180,11 +211,11 @@ const std::vector<FakeQuantizeTransformationTestValues> fakeQuantizeTransformati
         { 256ul, {}, { 0.f }, { 2.55f }, { -128.f }, { 127.f } },
         ngraph::element::i8,
         {
-            { ngraph::element::f32, {{ngraph::element::f32}, { -128.f }, { 0.01f }} },
-            { ngraph::element::f16, {{ngraph::element::f16}, { -128.f }, { 0.01f }} }
-        }
+            { ngraph::element::f32, {{}, { -128.f }, { 0.01f }} },
+            { ngraph::element::f16, {{}, { -128.f }, { 0.01f }} }
+        },
+        true
     },
-
     // dot interval
     {
         LayerTransformation::createParamsI8I8(),
@@ -192,8 +223,9 @@ const std::vector<FakeQuantizeTransformationTestValues> fakeQuantizeTransformati
         { 256ul, {}, { 0.f }, { 2.55f }, { 1.f }, { 1.f } },
         ngraph::element::Type_t::i8,
         {
-            { ngraph::element::f32, {{ngraph::element::f32}, {}, { 2.55f }} }
-        }
+            { ngraph::element::f32, {{}, {}, { 2.55f }} }
+        },
+        true
     },
 
     // efficientnet-b0: efficientnet-b0/model/blocks_2/depthwise_conv2d/depthwise/fq_input_0, interval: -0.504395 - +0.5
@@ -221,22 +253,22 @@ const std::vector<FakeQuantizeTransformationTestValues> fakeQuantizeTransformati
         }
     },
 
-    // U8 per-channel
-    {
-        LayerTransformation::createParamsU8I8(),
-        {
-            256ul,
-            {{1, 3, 1, 1}, {1, 3, 1, 1}, {1, 3, 1, 1}, {1, 3, 1, 1}},
-            { 0.f, 0.f, 0.f }, { 2.55f, 2.55f, 2.55f },
-            { 0.f, 0.f, 0.f }, { 2.55f, 25.5f, 255.f }
-        },
-        { 256ul, {{1, 3, 1, 1}, {1, 3, 1, 1}, {}, {}}, { 0.f }, { 2.55f }, { 0.f }, { 255.f } },
-        ngraph::element::u8,
-        {
-            { ngraph::element::f32, { {ngraph::element::f32}, {}, { {0.01f, 0.1f, 1.f} }} },
-            { ngraph::element::f16, { {ngraph::element::f16}, {}, { {0.01f, 0.1f, 1.f} }} }
-        }
-    },
+    // Failed when updatePrecisions = false, U8 per-channel
+    //{
+    //    LayerTransformation::createParamsU8I8(),
+    //    {
+    //        256ul,
+    //        {{1, 3, 1, 1}, {1, 3, 1, 1}, {1, 3, 1, 1}, {1, 3, 1, 1}},
+    //        { 0.f, 0.f, 0.f }, { 2.55f, 2.55f, 2.55f },
+    //        { 0.f, 0.f, 0.f }, { 2.55f, 25.5f, 255.f }
+    //    },
+    //    { 256ul, {{1, 3, 1, 1}, {1, 3, 1, 1}, {}, {}}, { 0.f }, { 2.55f }, { 0.f }, { 255.f } },
+    //    ngraph::element::u8,
+    //    {
+    //        { ngraph::element::f32, { {ngraph::element::f32}, {}, { {0.01f, 0.1f, 1.f} }} },
+    //        { ngraph::element::f16, { {ngraph::element::f16}, {}, { {0.01f, 0.1f, 1.f} }} }
+    //    }
+    //},
 };
 
 INSTANTIATE_TEST_SUITE_P(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
index a67d10ed8bf164..9266a6d8e629f5 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
@@ -39,7 +39,7 @@ class FakeQuantizeWithNotOptimalTransformationTestValues {
         builder::subgraph::DequantizationOperations dequantizationOnWeights;
         builder::subgraph::DequantizationOperations dequantizationAfter;
     };
-    low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Values actual;
     Values expected;
 };
@@ -66,8 +66,7 @@ class FakeQuantizeWithNotOptimalTransformation :
         const bool updatePrecision = std::get<2>(GetParam());
         const FakeQuantizeWithNotOptimalTransformationTestValues testValues = std::get<3>(GetParam());
 
-        const low_precision::LayerTransformation::Params params = low_precision::LayerTransformation::Params(testValues.params).
-            setUpdatePrecisions(updatePrecision);
+        const auto params = TestTransformationParams(testValues.params).setUpdatePrecisions(updatePrecision);
 
         actualFunction = ngraph::builder::subgraph::FakeQuantizeAndConvolutionFunction::get(
             precision,
@@ -81,9 +80,20 @@ class FakeQuantizeWithNotOptimalTransformation :
             testValues.actual.dequantizationOnWeights,
             testValues.actual.dequantizationAfter);
 
-        SimpleLowPrecisionTransformer transformer;
+        auto precisionsRestrictions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            })
+        });
+
+        auto quantizationRestrictions = std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>({
+            ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction::create<ngraph::opset1::Convolution>()
+        });
+
+        SimpleLowPrecisionTransformer transformer(precisionsRestrictions, quantizationRestrictions);
         transformer.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(
-            low_precision::LayerTransformation::Params(params).setPrecisionsOnActivations({ element::u8 }));
+            TestTransformationParams(params).setPrecisionsOnActivations({ element::u8 }));
         transformer.add<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation, ngraph::opset1::FakeQuantize>(params);
         transformer.transform(actualFunction);
 
@@ -117,7 +127,7 @@ class FakeQuantizeWithNotOptimalTransformation :
 
 TEST_P(FakeQuantizeWithNotOptimalTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dynamic_intervals_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dynamic_intervals_transformation.cpp
index 77513ca6b92148..b6f2c2fd2b328e 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dynamic_intervals_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fake_quantize_with_dynamic_intervals_transformation.cpp
@@ -21,7 +21,7 @@ using namespace ngraph::pass;
 
 class FakeQuantizeWithDynamicIntervalsTransformationTestValues {
 public:
-    low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool inputLowConst;
     bool inpuHighConst;
     bool outputLowConst;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fold_convert_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fold_convert_transformation.cpp
index 9e1299e2b5db91..0b7125617cd494 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fold_convert_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fold_convert_transformation.cpp
@@ -29,7 +29,7 @@ using namespace ngraph::builder::subgraph;
 
 class FoldConvertTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ngraph::element::Type precision;
     ngraph::builder::subgraph::DequantizationOperations dequantizationActual;
     ngraph::builder::subgraph::DequantizationOperations dequantizationExpected;
@@ -61,8 +61,7 @@ class FoldConvertTransformation : public LayerTransformation, public testing::Wi
         actualFunction = createFunction(testValues.precision, inputShape, testValues.dequantizationActual);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::FoldConvertTransformation, ngraph::opset1::Add>(
-            low_precision::LayerTransformation::Params(testValues.params));
+        transform.add<ngraph::pass::low_precision::FoldConvertTransformation, ngraph::opset1::Add>(testValues.params);
         transform.transform(actualFunction);
 
         referenceFunction = createFunction(testValues.precision, inputShape, testValues.dequantizationExpected);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fold_fake_quantize_in_transformations.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fold_fake_quantize_in_transformations.cpp
index 3be09188b8cdb3..b84bdc000d8bc5 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fold_fake_quantize_in_transformations.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fold_fake_quantize_in_transformations.cpp
@@ -40,7 +40,7 @@ class FoldFakeQuantizeInTransformationsTestValues {
     };
 
     ngraph::Shape constShape;
-    low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool updatePrecision;
     bool roundValues;
     Actual actual;
@@ -64,8 +64,7 @@ class FoldFakeQuantizeInTransformations : public LayerTransformation, public tes
     void SetUp() override {
         const FoldFakeQuantizeInTransformationsTestValues testValues = GetParam();
 
-        const low_precision::LayerTransformation::Params params = low_precision::LayerTransformation::Params(testValues.params).
-            setUpdatePrecisions(testValues.updatePrecision);
+        const auto params = TestTransformationParams(testValues.params).setUpdatePrecisions(testValues.updatePrecision);
 
         const auto constant = std::make_shared<ngraph::opset1::Constant>(
             testValues.actual.constPrecision, testValues.constShape, testValues.actual.constValues);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_convert_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_convert_transformation.cpp
index 7cee0f547d0791..85da2f104ee37b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_convert_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_convert_transformation.cpp
@@ -39,7 +39,7 @@ class FuseConvertTransformationTestValues {
     };
 
     bool constInput;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_transformation.cpp
index 2cc8aad79db619..354e0dab7f6264 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_transformation.cpp
@@ -12,7 +12,6 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/fake_quantize.hpp>
 #include <low_precision/fake_quantize_decomposition.hpp>
 #include "lpt_ngraph_functions/common/add.hpp"
@@ -54,7 +53,7 @@ class FuseFakeQuantizeTransformationTestValues {
     };
 
     ngraph::PartialShape inputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_with_multi_inputs_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_with_multi_inputs_transformation.cpp
index 0f51338a464600..66584f0a8d5301 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_with_multi_inputs_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_fake_quantize_with_multi_inputs_transformation.cpp
@@ -12,7 +12,6 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/fuse_fake_quantize.hpp>
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
 #include "lpt_ngraph_functions/common/dequantization_operations.hpp"
@@ -46,7 +45,7 @@ class FuseFakeQuantizeTransformationTestValues {
     };
 
     ngraph::Shape inputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_multiply_to_fake_quantize_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_multiply_to_fake_quantize_transformation.cpp
index 007a05509aec49..48d637370a0ff7 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_multiply_to_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_multiply_to_fake_quantize_transformation.cpp
@@ -37,7 +37,7 @@ class FuseMultiplyToFakeQuantizeTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantization;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -51,8 +51,8 @@ class FuseMultiplyToFakeQuantizeTransformation : public LayerTransformation,
     public testing::WithParamInterface<FuseMultiplyToFakeQuantizeTransformationTestParams> {
 public:
     void SetUp() override {
-        const size_t quantizationLevel = get<0>(GetParam());
-        const ngraph::PartialShape inputShape = get<1>(GetParam());
+        const size_t quantizationLevel = std::get<0>(GetParam());
+        const ngraph::PartialShape inputShape = std::get<1>(GetParam());
         FuseMultiplyToFakeQuantizeTransformationTestValues testValues = std::get<2>(GetParam());
 
         if (!testValues.actual.fakeQuantizeOnData.empty()) {
@@ -78,8 +78,8 @@ class FuseMultiplyToFakeQuantizeTransformation : public LayerTransformation,
     }
 
     static std::string getTestCaseName(testing::TestParamInfo<FuseMultiplyToFakeQuantizeTransformationTestParams> obj) {
-        const size_t quantizationLevel = get<0>(obj.param);
-        const ngraph::PartialShape inputShape = get<1>(obj.param);
+        const size_t quantizationLevel = std::get<0>(obj.param);
+        const ngraph::PartialShape inputShape = std::get<1>(obj.param);
         FuseMultiplyToFakeQuantizeTransformationTestValues testValues = std::get<2>(obj.param);
 
         if (!testValues.actual.fakeQuantizeOnData.empty()) {
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_subtract_to_fake_quantize_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_subtract_to_fake_quantize_transformation.cpp
index cdfdcf0afbb70c..2af936da365720 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_subtract_to_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/fuse_subtract_to_fake_quantize_transformation.cpp
@@ -42,7 +42,7 @@ class FuseSubtractToFakeQuantizeTransformationTestValues {
         DequantizationOperations dequantization2;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -56,9 +56,9 @@ class FuseSubtractToFakeQuantizeTransformation : public LayerTransformation,
     public testing::WithParamInterface<FuseSubtractToFakeQuantizeTransformationTestParams> {
 public:
     void SetUp() override {
-        const size_t quantizationLevel = get<0>(GetParam());
-        const ngraph::PartialShape inputShape = get<1>(GetParam());
-        FuseSubtractToFakeQuantizeTransformationTestValues testValues = get<2>(GetParam());
+        const size_t quantizationLevel = std::get<0>(GetParam());
+        const ngraph::PartialShape inputShape = std::get<1>(GetParam());
+        FuseSubtractToFakeQuantizeTransformationTestValues testValues = std::get<2>(GetParam());
 
         if (!testValues.actual.fakeQuantizeOnData.empty()) {
             testValues.actual.fakeQuantizeOnData.quantizationLevel = quantizationLevel;
@@ -103,9 +103,9 @@ class FuseSubtractToFakeQuantizeTransformation : public LayerTransformation,
     }
 
     static std::string getTestCaseName(testing::TestParamInfo<FuseSubtractToFakeQuantizeTransformationTestParams> obj) {
-        const size_t quantizationLevel = get<0>(obj.param);
-        const ngraph::PartialShape inputShape = get<1>(obj.param);
-        FuseSubtractToFakeQuantizeTransformationTestValues testValues = get<2>(obj.param);
+        const size_t quantizationLevel = std::get<0>(obj.param);
+        const ngraph::PartialShape inputShape = std::get<1>(obj.param);
+        FuseSubtractToFakeQuantizeTransformationTestValues testValues = std::get<2>(obj.param);
 
         if (!testValues.actual.fakeQuantizeOnData.empty()) {
             testValues.actual.fakeQuantizeOnData.quantizationLevel = quantizationLevel;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp
index 755410557b4d6e..025bd3bb69493e 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp
@@ -49,7 +49,7 @@ class GroupConvolutionTestValues {
         ngraph::element::Type precisionAfterDequantization;
     };
 
-    low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     size_t group;
     int groupCalculationDimention;
     Actual actual;
@@ -83,6 +83,12 @@ class GroupConvolutionTransformation : public LayerTransformation, public testin
 
         SimpleLowPrecisionTransformer transform;
         transform.add<ngraph::pass::low_precision::GroupConvolutionTransformation, ngraph::opset1::GroupConvolution>(testValues.params);
+        if (testValues.params.supportAsymmetricQuantization == false) {
+            transform.set_callback<ngraph::pass::low_precision::GroupConvolutionTransformation>(
+                [](const std::shared_ptr<const ngraph::Node>& node) -> bool {
+                    return ngraph::pass::low_precision::LayerTransformation::isAsymmetricQuantization(node);
+                });
+        }
         transform.transform(actualFunction);
 
         referenceFunction = ngraph::builder::subgraph::GroupConvolutionFunction::get(
@@ -122,7 +128,7 @@ class GroupConvolutionTransformation : public LayerTransformation, public testin
 
 TEST_P(GroupConvolutionTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -228,8 +234,8 @@ const std::vector<GroupConvolutionTestValues> testValuesGroupConv = {
         {
             ngraph::element::u8,
             {{ ngraph::element::f32 }, { 128.f }, { 0.02f }},
-            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ -1.25f }),
-            {},
+            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 2.f }),
+            { 255ul, Shape({ 1, 1, 1, 1 }), { 0.f }, { 254.f }, { -1.27f }, { 1.27f } },
             {},
             ngraph::element::f32,
             {}
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/interpolate_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/interpolate_transformation.cpp
index d00f5c3d123aed..0dfece76d576f5 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/interpolate_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/interpolate_transformation.cpp
@@ -81,7 +81,7 @@ class InterpolateTransformationTestValues {
     ngraph::PartialShape inputShape;
     ngraph::Shape outputShape;
     ngraph::Shape scalesShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     interpAttributes interpAttrs;
     interp4Attributes interp4Attrs;
     int opset_version;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/is_function_quantized_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/is_function_quantized_transformation.cpp
index b66b02eba31e2d..f83420b9f4537b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/is_function_quantized_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/is_function_quantized_transformation.cpp
@@ -8,6 +8,8 @@
 #include <sstream>
 #include <memory>
 
+#include <low_precision/low_precision.hpp>
+
 #include <gtest/gtest.h>
 #include "lpt_ngraph_functions/common/builders.hpp"
 
@@ -66,7 +68,7 @@ class IsFunctionQuantizedTransformation : public LayerTransformation, public tes
 };
 
 TEST_P(IsFunctionQuantizedTransformation, Run) {
-    const bool isQuantized = ngraph::pass::low_precision::LowPrecisionTransformer::isFunctionQuantized(function);
+    const bool isQuantized = ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(function);
 
     const auto testValues = GetParam();
     ASSERT_EQ(testValues.isQuantized, isQuantized);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.cpp
index 7eeb2aa55e6742..d316adab1e327f 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.cpp
@@ -11,68 +11,137 @@
 using namespace testing;
 using namespace ngraph::pass;
 
-ngraph::pass::low_precision::LayerTransformation::Params LayerTransformation::createParamsU8U8() {
-    return low_precision::LayerTransformation::Params(
-        true,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::u8 },
-        { ngraph::element::u8 });
+TestTransformationParams::TestTransformationParams(
+    bool updatePrecisions,
+    std::vector<element::Type> precisionsOnActivations,
+    std::vector<element::Type> precisionsOnWeights,
+    bool supportAsymmetricQuantization,
+    element::Type deqPrecision,
+    bool support3DTensorOnActivations,
+    bool deconvolutionSpecificChannelsRatio) :
+    updatePrecisions(updatePrecisions),
+    precisionsOnActivations(precisionsOnActivations),
+    precisionsOnWeights(precisionsOnWeights),
+    supportAsymmetricQuantization(supportAsymmetricQuantization),
+    deqPrecision(deqPrecision),
+    support3DTensorOnActivations(support3DTensorOnActivations),
+    deconvolutionSpecificChannelsRatio(deconvolutionSpecificChannelsRatio) {
+    if (precisionsOnActivations.size() == 0ul) {
+        THROW_TRANSFORMATION_EXCEPTION << "precisions on activations are not specisifed";
+    }
+
+    if (precisionsOnWeights.size() == 0ul) {
+        THROW_TRANSFORMATION_EXCEPTION << "precisions on weights are not specisifed";
+    }
 }
 
-ngraph::pass::low_precision::LayerTransformation::Params LayerTransformation::createParamsU8I8() {
-    return low_precision::LayerTransformation::Params(
-        true,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::u8 },
-        { ngraph::element::i8 });
+TestTransformationParams& TestTransformationParams::setUpdatePrecisions(const bool updatePrecisions) {
+    this->updatePrecisions = updatePrecisions;
+    return *this;
 }
 
-ngraph::pass::low_precision::LayerTransformation::Params LayerTransformation::createParamsI8I8() {
-    return low_precision::LayerTransformation::Params(
-        true,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::i8 },
-        { ngraph::element::i8 });
+TestTransformationParams& TestTransformationParams::setSupportAsymmetricQuantization(const bool supportAsymmetricQuantization) {
+    this->supportAsymmetricQuantization = supportAsymmetricQuantization;
+    return *this;
+}
+
+TestTransformationParams& TestTransformationParams::setPrecisionsOnActivations(const std::vector<element::Type>& precisionsOnActivations) {
+    this->precisionsOnActivations = precisionsOnActivations;
+    return *this;
+}
+
+TestTransformationParams& TestTransformationParams::setPrecisionsOnWeights(const std::vector<element::Type>& precisionsOnWeights) {
+    this->precisionsOnWeights = precisionsOnWeights;
+    return *this;
+}
+
+TestTransformationParams& TestTransformationParams::setSupport3DTensorOnActivations(const bool support3DTensorOnActivations) {
+    this->support3DTensorOnActivations = support3DTensorOnActivations;
+    return *this;
+}
+
+TestTransformationParams& TestTransformationParams::setDeconvolutionSpecificChannelsRatio(const bool deconvolutionSpecificChannelsRatio) {
+    this->deconvolutionSpecificChannelsRatio = deconvolutionSpecificChannelsRatio;
+    return *this;
 }
 
-ngraph::pass::low_precision::LayerTransformation::Params LayerTransformation::createParamsU8I8AndI8() {
+TestTransformationParams LayerTransformation::createParamsU8U8() {
+    return TestTransformationParams(true, { ngraph::element::u8 }, { ngraph::element::u8 });
+}
+
+TestTransformationParams LayerTransformation::createParamsU8I8() {
+    return TestTransformationParams(true, { ngraph::element::u8 }, { ngraph::element::i8 });
+}
+
+TestTransformationParams LayerTransformation::createParamsI8I8() {
+    return TestTransformationParams(true, { ngraph::element::i8 }, { ngraph::element::i8 });
+}
+
+TestTransformationParams LayerTransformation::createParamsU8I8AndI8() {
+    return TestTransformationParams(true, { ngraph::element::u8, ngraph::element::i8 }, { ngraph::element::i8 });
+}
+
+pass::low_precision::LayerTransformation::Params TestTransformationParams::toParams(const TestTransformationParams& params) {
     return low_precision::LayerTransformation::Params(
-        true,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
-        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::u8, ngraph::element::i8 },
-        { ngraph::element::i8 });
+        params.updatePrecisions,
+        params.deqPrecision);
 }
 
-std::string LayerTransformation::toString(const ngraph::pass::low_precision::LayerTransformation::Params& params) {
+//TestTransformationParams LayerTransformation::createParamsU8U8() {
+//    return low_precision::LayerTransformation::Params(
+//        true,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
+//        true,
+//        { ngraph::element::u8 },
+//        { ngraph::element::u8 });
+//}
+//
+//TestTransformationParams LayerTransformation::createParamsU8I8() {
+//    return low_precision::LayerTransformation::Params(
+//        true,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
+//        true,
+//        { ngraph::element::u8 },
+//        { ngraph::element::i8 });
+//}
+//
+//TestTransformationParams LayerTransformation::createParamsI8I8() {
+//    return low_precision::LayerTransformation::Params(
+//        true,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
+//        true,
+//        { ngraph::element::i8 },
+//        { ngraph::element::i8 });
+//}
+//
+//TestTransformationParams LayerTransformation::createParamsU8I8AndI8() {
+//    return low_precision::LayerTransformation::Params(
+//        true,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
+//        low_precision::LayerTransformation::QuantizedTensorAlignment::None,
+//        true,
+//        { ngraph::element::u8, ngraph::element::i8 },
+//        { ngraph::element::i8 });
+//}
+
+std::string LayerTransformation::toString(const TestTransformationParams& params) {
     std::ostringstream result;
     result <<
         (params.supportAsymmetricQuantization ? "asymmetric_" : "symmetric_") <<
         (params.updatePrecisions ? "" : "notUpdatePrecisions_") <<
         params.precisionsOnActivations[0] << "_" <<
-        params.precisionsOnWeights[0] << "_" <<
-        params.quantizedTensorAlignmentOnActivations;
+        params.precisionsOnWeights[0];
 
     return result.str();
 }
 
-void LayerTransformation::transform(std::shared_ptr<ngraph::Function> function) {
-    ngraph::pass::low_precision::LowPrecisionTransformations transformations = ngraph::pass::low_precision::LowPrecisionTransformer::getAllTransformations();
-    ngraph::pass::low_precision::LowPrecisionTransformer transformer(transformations);
-    transformer.transform(function);
-}
-
 std::string LayerTransformation::getTestCaseNameByParams(
     const ngraph::element::Type& type,
     const ngraph::PartialShape& shape,
-    const ngraph::pass::low_precision::LayerTransformation::Params& params) {
+    const TestTransformationParams& params) {
     std::ostringstream result;
     result << type << "_" << shape << "_" << toString(params);
     return result.str();
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.hpp b/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.hpp
index 67c8e275719238..a6f316f9cbd813 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.hpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/layer_transformation.hpp
@@ -5,39 +5,247 @@
 #pragma once
 
 #include "common_test_utils/test_common.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+#include "low_precision/rt_info/precisions_attribute.hpp"
 #include "low_precision/layer_transformation.hpp"
 #include "low_precision/transformation_context.hpp"
-#include "low_precision/transformer.hpp"
+#include "low_precision/network_helper.hpp"
 #include "lpt_ngraph_functions/common/dequantization_operations.hpp"
 
+using namespace ngraph;
+
 typedef std::tuple<
-    ngraph::element::Type,
-    ngraph::Shape,
-    ngraph::pass::low_precision::LayerTransformation::Params> LayerTransformationParams;
+    element::Type,
+    Shape,
+    pass::low_precision::LayerTransformation::Params> LayerTransformationParams;
+
+struct TestTransformationParams {
+    TestTransformationParams(
+        bool updatePrecisions = true,
+        std::vector<element::Type> precisionsOnActivations = { element::u8, element::i8 },
+        std::vector<element::Type> precisionsOnWeights = { element::i8 },
+        bool supportAsymmetricQuantization = true,
+        element::Type deqPrecision = element::f32,
+        bool support3DTensorOnActivations = true,
+        bool deconvolutionSpecificChannelsRatio = false);
+
+    TestTransformationParams& setUpdatePrecisions(const bool updatePrecisions);
+    TestTransformationParams& setSupportAsymmetricQuantization(const bool supportAsymmetricQuantization);
+    TestTransformationParams& setPrecisionsOnActivations(const std::vector<element::Type>& precisionsOnActivations);
+    TestTransformationParams& setPrecisionsOnWeights(const std::vector<element::Type>& precisionsOnWeights);
+    TestTransformationParams& setSupport3DTensorOnActivations(const bool support3DTensorOnActivations);
+    TestTransformationParams& setDeconvolutionSpecificChannelsRatio(const bool deconvolutionSpecificChannelsRatio);
+
+    static pass::low_precision::LayerTransformation::Params toParams(const TestTransformationParams& params);
+
+    bool updatePrecisions;
+    std::vector<element::Type> precisionsOnActivations;
+    std::vector<element::Type> precisionsOnWeights;
+    bool supportAsymmetricQuantization;
+    element::Type deqPrecision;
+    bool support3DTensorOnActivations;
+    bool deconvolutionSpecificChannelsRatio;
+};
+
+/*
+TestTransformationParams& setSupportAsymmetricQuantization(const bool supportAsymmetricQuantization) {
+        this->supportAsymmetricQuantization = supportAsymmetricQuantization;
+        return *this;
+    }
+
+    TestTransformationParams& setPrecisionsOnActivations(const std::vector<element::Type>& precisionsOnActivations) {
+        this->precisionsOnActivations = precisionsOnActivations;
+        return *this;
+    }
+
+    TestTransformationParams& setPrecisionsOnWeights(const std::vector<element::Type>& precisionsOnWeights) {
+        this->precisionsOnWeights = precisionsOnWeights;
+        return *this;
+    }
+
+    TestTransformationParams& setSupport3DTensorOnActivations(const bool support3DTensorOnActivations) {
+        this->support3DTensorOnActivations = support3DTensorOnActivations;
+        return *this;
+    }
+
+    TestTransformationParams& setDeconvolutionSpecificChannelsRatio(const bool deconvolutionSpecificChannelsRatio) {
+        this->deconvolutionSpecificChannelsRatio = deconvolutionSpecificChannelsRatio;
+        return *this;
+    }
+*/
 
 class LayerTransformation : public CommonTestUtils::TestsCommon {
 public:
-    static ngraph::pass::low_precision::LayerTransformation::Params createParamsU8U8();
-    static ngraph::pass::low_precision::LayerTransformation::Params createParamsU8I8();
-    static ngraph::pass::low_precision::LayerTransformation::Params createParamsI8I8();
-    static ngraph::pass::low_precision::LayerTransformation::Params createParamsU8I8AndI8();
+    static TestTransformationParams createParamsU8U8();
+    static TestTransformationParams createParamsU8I8();
+    static TestTransformationParams createParamsI8I8();
+    static TestTransformationParams createParamsU8I8AndI8();
 
-    static std::string toString(const ngraph::pass::low_precision::LayerTransformation::Params& params);
+    static std::string toString(const TestTransformationParams& params);
 
     static std::string getTestCaseNameByParams(
         const ngraph::element::Type& type,
         const ngraph::PartialShape& shape,
-        const ngraph::pass::low_precision::LayerTransformation::Params& params);
+        const TestTransformationParams& params);
 
-    static ngraph::builder::subgraph::DequantizationOperations toDequantizationOperations(
-        const ngraph::pass::low_precision::FakeQuantizeDequantization& dequantization);
+    static builder::subgraph::DequantizationOperations toDequantizationOperations(
+        const pass::low_precision::FakeQuantizeDequantization& dequantization);
 
-protected:
-    void transform(std::shared_ptr<ngraph::Function> function);
-    void transform(
-        std::shared_ptr<ngraph::Function> function,
-        std::map<std::string, ngraph::pass::low_precision::LayerTransformationPtr>& transformations);
+    template <class Operation>
+    static NodeVector get(std::shared_ptr<ngraph::Function> function) {
+        NodeVector foundNodes;
+        NodeVector nodes = function->get_ordered_ops();
+
+        for (auto& node : nodes) {
+            if (ngraph::is_type<Operation>(node)) {
+                foundNodes.push_back(node);
+            }
+        }
+        return foundNodes;
+    }
+
+    static bool checkIfOutputAttributesAreEqual(const NodeVector& nodes, float intervalLow, float intervalHigh) {
+        for (size_t nodeIndex = 0ul; nodeIndex < nodes.size(); nodeIndex++) {
+            auto& rt = nodes[nodeIndex]->get_rt_info();
+            for (auto& it : rt) {
+                auto reference = std::dynamic_pointer_cast<VariantWrapper<std::shared_ptr<IntervalsAlignmentAttribute>>>(it.second);
+                assert(reference != nullptr);
+                if ((reference->get()->sharedValue->combinedInterval.low != intervalLow) &&
+                    (reference->get()->sharedValue->combinedInterval.high != intervalHigh)) {
+                    return false;
+                }
+            }
+        }
+
+        return true;
+    }
 
-    std::shared_ptr<ngraph::Function> actualFunction;
-    std::shared_ptr<ngraph::Function> referenceFunction;
+    static bool compare(
+        const std::shared_ptr<IntervalsAlignmentAttribute>& value1,
+        const std::shared_ptr<IntervalsAlignmentAttribute>& value2) {
+        if ((value1->sharedValue->combinedInterval.low != value2->sharedValue->combinedInterval.low) ||
+            (value1->sharedValue->combinedInterval.high != value2->sharedValue->combinedInterval.high)) {
+            return false;
+        }
+        return true;
+    }
+
+    template <class Operation>
+    static bool checkIfOutputAttributesAreEqual(const NodeVector& actualNodes, const NodeVector& referenceNodes) {
+        if (actualNodes.size() != referenceNodes.size()) {
+            return false;
+        }
+
+        for (size_t nodeIndex = 0ul; nodeIndex < actualNodes.size(); nodeIndex++) {
+            auto& actualRt = actualNodes[nodeIndex]->get_rt_info();
+            auto& referenceRt = referenceNodes[nodeIndex]->get_rt_info();
+            if (actualRt.size() != referenceRt.size()) {
+                return false;
+            }
+
+            for (auto& actualIt : actualRt) {
+                auto referenceIt = referenceRt.find(actualIt.first);
+                if (referenceIt == referenceRt.end()) {
+                    return false;
+                }
+
+                auto reference = std::dynamic_pointer_cast<VariantWrapper<Operation>>(referenceIt->second);
+                auto actual = std::dynamic_pointer_cast<VariantWrapper<Operation>>(actualIt.second);
+                if ((actual != nullptr) && (reference != nullptr)) {
+                    if (!compare(reference->get(), actual->get())) {
+                        return false;
+                    }
+                }
+            }
+        }
+
+        return true;
+    }
+
+    template <class Attribute>
+    static bool checkIfOutputAttributesAreTheSame(const NodeVector& nodes) {
+        Variant* first = nullptr;
+        for (auto node : nodes) {
+            for (auto output : node->outputs()) {
+                auto& rt = output.get_rt_info();
+                const std::string& name = VariantWrapper<Attribute>::type_info.name;
+                auto it = rt.find(name);
+                if (it == rt.end()) {
+                    return false;
+                }
+
+                auto value = it->second;
+                if (first == nullptr) {
+                    first = value.get();
+                } else if (value.get() != first) {
+                    return false;
+                }
+            }
+        }
+        return true;
+    }
+
+    template <class Attribute>
+    static bool checkIfOutputAttributesSharedValuesAreTheSame(const NodeVector& nodes) {
+        std::shared_ptr<Variant> first = nullptr;
+        for (auto node : nodes) {
+            for (auto output : node->outputs()) {
+                auto value = ngraph::pass::low_precision::getAttributeFromOutput<Attribute>(output);
+                if (first == nullptr) {
+                    first = value;
+                } else {
+                    const auto sharedValue1 = std::dynamic_pointer_cast<ngraph::VariantWrapper<Attribute>>(value)->get()->sharedValue;
+                    const auto sharedValue2 = std::dynamic_pointer_cast<ngraph::VariantWrapper<Attribute>>(first)->get()->sharedValue;
+                    if (sharedValue1 != sharedValue2) {
+                        return false;
+                    }
+                }
+            }
+        }
+        return true;
+    }
+
+    template <class Attribute>
+    static bool checkIfAttributesSharedValuesAreTheSame(const NodeVector& nodes) {
+        std::shared_ptr<Variant> first = nullptr;
+        for (auto node : nodes) {
+            auto value = ngraph::pass::low_precision::getAttribute<Attribute>(node);
+            if (value == nullptr) {
+                return false;
+            }
+
+            if (first == nullptr) {
+                first = value;
+            } else {
+                const auto sharedValue1 = std::dynamic_pointer_cast<ngraph::VariantWrapper<Attribute>>(value)->get()->sharedValue;
+                const auto sharedValue2 = std::dynamic_pointer_cast<ngraph::VariantWrapper<Attribute>>(first)->get()->sharedValue;
+                if (sharedValue1 != sharedValue2) {
+                    return false;
+                }
+            }
+        }
+        return true;
+    }
+
+    template <class Attribute>
+    static bool checkIfAttributesAreTheSame(const NodeVector& nodes) {
+        Variant* first = nullptr;
+        for (auto node : nodes) {
+            auto value = ngraph::pass::low_precision::getAttribute<Attribute>(node);
+            if (value == nullptr) {
+                return false;
+            }
+
+            if (first == nullptr) {
+                first = value.get();
+            } else if (value.get() != first) {
+                return false;
+            }
+        }
+        return true;
+    }
+
+protected:
+    std::shared_ptr<Function> actualFunction;
+    std::shared_ptr<Function> referenceFunction;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/low_precision_transformations_test.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/low_precision_transformations_test.cpp
index ec5f5a703a6e97..3849c941bd5121 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/low_precision_transformations_test.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/low_precision_transformations_test.cpp
@@ -3,9 +3,8 @@
 //
 
 #include <gtest/gtest.h>
-#include "low_precision/transformer.hpp"
 
-#include "low_precision/concat_multi_channels.hpp"
+#include "low_precision/concat.hpp"
 #include "low_precision/convolution.hpp"
 #include "low_precision/mat_mul.hpp"
 #include "low_precision/fuse_convert.hpp"
@@ -14,56 +13,59 @@
 using namespace ::testing;
 using namespace ngraph::pass::low_precision;
 
-class LowPrecisionTransformationsTests : public Test {};
+class smoke_LPT_LowPrecisionTransformationsTests : public Test {};
 
-TEST_F(LowPrecisionTransformationsTests, removeAll) {
-    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
-    auto transformation = transformations.find("Convolution");
-    ASSERT_NE(0, transformation.size());
+// TODO: LPT: not implemented
+TEST_F(smoke_LPT_LowPrecisionTransformationsTests, DISABLED_removeAll) {
+    //TODO: FIXME
+    ASSERT_EQ(1, 0);
+    //LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
+    //auto transformation = transformations.find("Convolution");
+    //ASSERT_NE(0, transformation.size());
 
-    transformations.removeAll<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>();
-    transformation = transformations.find("Convolution");
-    ASSERT_EQ(0, transformation.size());
-}
-
-TEST_F(LowPrecisionTransformationsTests, removeBranchSpecific) {
-    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
-    auto transformation = transformations.find("Concat");
-    ASSERT_NE(0, transformation.size());
-
-    transformations.removeBranchSpecific<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>();
-    transformation = transformations.find("Concat");
-    ASSERT_EQ(0, transformation.size());
-}
-
-TEST_F(LowPrecisionTransformationsTests, remove) {
-    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
-    auto transformation = transformations.find("MatMul");
-    ASSERT_NE(0, transformation.size());
-
-    transformations.remove<ngraph::pass::low_precision::MatMulTransformation, ngraph::opset1::MatMul>();
-    transformation = transformations.find("MatMul");
-    ASSERT_EQ(0, transformation.size());
-}
-
-TEST_F(LowPrecisionTransformationsTests, removeCleanup) {
-    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
-    auto transformation = transformations.find("Multiply");
-    ASSERT_NE(0, transformation.size());
-    const size_t originalSize = transformation.size();
-
-    transformations.removeCleanup<ngraph::pass::low_precision::FuseConvertTransformation, ngraph::opset1::Multiply>();
-    transformation = transformations.find("Multiply");
-    ASSERT_EQ(originalSize - 1, transformation.size());
-}
-
-TEST_F(LowPrecisionTransformationsTests, removeStandaloneCleanup) {
-    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
-    auto transformation = transformations.find("Multiply");
-    ASSERT_NE(0, transformation.size());
-    const size_t originalSize = transformation.size();
-
-    transformations.removeStandaloneCleanup<ngraph::pass::low_precision::SubtractMultiplyToMultiplyAddTransformation, ngraph::opset1::Multiply>();
-    transformation = transformations.find("Multiply");
-    ASSERT_EQ(originalSize - 1, transformation.size());
+    //transformations.removeAll<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>();
+    //transformation = transformations.find("Convolution");
+    //ASSERT_EQ(0, transformation.size());
 }
+//
+//TEST_F(LowPrecisionTransformationsTests, removeBranchSpecific) {
+//    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
+//    auto transformation = transformations.find("Concat");
+//    ASSERT_NE(0, transformation.size());
+//
+//    transformations.removeBranchSpecific<ngraph::pass::low_precision::ConcatMultiChannelsTransformation, ngraph::opset1::Concat>();
+//    transformation = transformations.find("Concat");
+//    ASSERT_EQ(0, transformation.size());
+//}
+//
+//TEST_F(LowPrecisionTransformationsTests, remove) {
+//    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
+//    auto transformation = transformations.find("MatMul");
+//    ASSERT_NE(0, transformation.size());
+//
+//    transformations.remove<ngraph::pass::low_precision::MatMulTransformation, ngraph::opset1::MatMul>();
+//    transformation = transformations.find("MatMul");
+//    ASSERT_EQ(0, transformation.size());
+//}
+//
+//TEST_F(LowPrecisionTransformationsTests, removeCleanup) {
+//    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
+//    auto transformation = transformations.find("Multiply");
+//    ASSERT_NE(0, transformation.size());
+//    const size_t originalSize = transformation.size();
+//
+//    transformations.removeCleanup<ngraph::pass::low_precision::FuseConvertTransformation, ngraph::opset1::Multiply>();
+//    transformation = transformations.find("Multiply");
+//    ASSERT_EQ(originalSize - 1, transformation.size());
+//}
+//
+//TEST_F(LowPrecisionTransformationsTests, removeStandaloneCleanup) {
+//    LowPrecisionTransformations transformations = LowPrecisionTransformer::getAllTransformations(LayerTransformation::Params());
+//    auto transformation = transformations.find("Multiply");
+//    ASSERT_NE(0, transformation.size());
+//    const size_t originalSize = transformation.size();
+//
+//    transformations.removeStandaloneCleanup<ngraph::pass::low_precision::SubtractMultiplyToMultiplyAddTransformation, ngraph::opset1::Multiply>();
+//    transformation = transformations.find("Multiply");
+//    ASSERT_EQ(originalSize - 1, transformation.size());
+//}
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/lpt_public_methods_test.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/lpt_public_methods_test.cpp
index 8b903504fa7736..1337de2ea8ea55 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/lpt_public_methods_test.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/lpt_public_methods_test.cpp
@@ -11,46 +11,25 @@
 #include <transformations/utils/utils.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
-#include "low_precision/transformer.hpp"
 
 using namespace testing;
 using namespace ngraph;
 using namespace ngraph::pass;
 
-TEST(LPT, isPrecisionPreservedTransformation) {
-    const auto layer = std::make_shared<opset1::Parameter>(element::f32, Shape{ 1, 3, 16, 16 });
-    const auto transformations = low_precision::LowPrecisionTransformer::getAllTransformations();
-
-    for (const auto& transformation : transformations.transformations) {
-        ASSERT_NO_THROW(transformation.second->isPrecisionPreserved(layer));
-    }
-}
-
-TEST(LPT, canBeTransformedTransformation) {
+// TODO: LPT: not implemented
+TEST(DISABLED_LPT, isQuantizedTransformation) {
     const auto input = std::make_shared<opset1::Parameter>(element::f32, Shape{ 1, 3, 16, 16 });
     const auto mulConst = op::v0::Constant::create(element::f32, Shape{}, { 1.f });
     const auto mul = std::make_shared<ngraph::opset1::Multiply>(input, mulConst);
     const auto shapeConst = op::v0::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 1, 3, 16, 16 });
     const auto layer = std::make_shared<opset1::Reshape>(mul, shapeConst, true);
 
-    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(layer) };
-    const auto function = std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "TestFunction");
-
-    const auto transformations = low_precision::LowPrecisionTransformer::getAllTransformations();
-    for (const auto& transformation : transformations.transformations) {
-        ASSERT_NO_THROW(transformation.second->canBeTransformed(low_precision::TransformationContext(function), layer));
-    }
-}
+    // TODO: FIXME
+    EXPECT_EQ(1, 0);
 
-TEST(LPT, isQuantizedTransformation) {
-    const auto input = std::make_shared<opset1::Parameter>(element::f32, Shape{ 1, 3, 16, 16 });
-    const auto mulConst = op::v0::Constant::create(element::f32, Shape{}, { 1.f });
-    const auto mul = std::make_shared<ngraph::opset1::Multiply>(input, mulConst);
-    const auto shapeConst = op::v0::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 1, 3, 16, 16 });
-    const auto layer = std::make_shared<opset1::Reshape>(mul, shapeConst, true);
+    //const auto transformations = low_precision::LowPrecisionTransformer::getAllTransformations();
 
-    const auto transformations = low_precision::LowPrecisionTransformer::getAllTransformations();
-    for (const auto& transformation : transformations.transformations) {
-        ASSERT_NO_THROW(transformation.second->isQuantized(layer));
-    }
+    //for (const auto& transformation : transformations.transformations) {
+    //    ASSERT_NO_THROW(transformation.second->isQuantized(layer));
+    //}
 }
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/markup_avg_pool_precisions_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/markup_avg_pool_precisions_transformation.cpp
new file mode 100644
index 00000000000000..ce38a8a4dba137
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/markup_avg_pool_precisions_transformation.cpp
@@ -0,0 +1,388 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "layer_transformation.hpp"
+
+#include <string>
+#include <memory>
+
+#include <gtest/gtest.h>
+
+#include <transformations/utils/utils.hpp>
+#include <transformations/init_node_info.hpp>
+
+#include <low_precision/rt_info/avg_pool_precision_preserved_attribute.hpp>
+
+#include <low_precision/low_precision.hpp>
+#include <low_precision/avg_pool.hpp>
+#include <low_precision/convolution.hpp>
+#include <low_precision/fake_quantize_decomposition.hpp>
+#include <low_precision/max_pool.hpp>
+
+#include <low_precision/fake_quantize.hpp>
+#include <low_precision/fuse_subtract_to_fake_quantize.hpp>
+#include <low_precision/fuse_multiply_to_fake_quantize.hpp>
+
+#include "lpt_ngraph_functions/markup_avg_pool_precisions_function.hpp"
+#include "lpt_ngraph_functions/common/dequantization_operations.hpp"
+#include "simple_low_precision_transformer.hpp"
+
+using namespace testing;
+using namespace ngraph::pass;
+
+class MarkupAvgPoolPrecisionsTransformationTestValues {
+public:
+public:
+    class Actual {
+    public:
+        ngraph::element::Type inputPrecision;
+        ngraph::builder::subgraph::DequantizationOperations dequantization;
+    };
+
+    class Expected {
+    public:
+        ngraph::element::Type inputPrecision;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationBefore;
+        ngraph::element::Type preicsionAfterOperation;
+        ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
+    };
+
+    TestTransformationParams params;
+    Actual actual;
+    Expected expected;
+};
+
+typedef std::tuple<
+    ngraph::element::Type,
+    ngraph::Shape,
+    bool, // additional FakeQuantize After
+    std::string, // additional layer before FQ
+    MarkupAvgPoolPrecisionsTransformationTestValues> MarkupAvgPoolPrecisionsTransformationParams;
+
+class MarkupAvgPoolPrecisionsTransformation : public LayerTransformation, public testing::WithParamInterface<MarkupAvgPoolPrecisionsTransformationParams> {
+public:
+    void SetUp() override {
+        ngraph::element::Type precision;
+        ngraph::Shape shape;
+        bool addFakeQuantize;
+        std::string additionalLayer;
+        MarkupAvgPoolPrecisionsTransformationTestValues testValues;
+        std::tie(precision, shape, addFakeQuantize, additionalLayer, testValues) = GetParam();
+
+        actualFunction = ngraph::builder::subgraph::MarkupAvgPoolPrecisionsFunction::getOriginal(
+            precision,
+            testValues.actual.inputPrecision,
+            shape,
+            addFakeQuantize,
+            additionalLayer,
+            testValues.actual.dequantization,
+            1,
+            0);
+
+        ngraph::pass::low_precision::TypeRelaxedReplacer pass;
+        pass.run_on_function(actualFunction);
+
+        auto supportedPrecisionsOnActivation = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Convolution>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            })
+        });
+
+        SimpleLowPrecisionTransformer transform(supportedPrecisionsOnActivation);
+        transform.commonGraphRewrite->add_matcher<ngraph::pass::low_precision::AvgPoolTransformation>();
+        transform.commonGraphRewrite->add_matcher<ngraph::pass::low_precision::ConvolutionTransformation>();
+        transform.commonGraphRewrite->add_matcher<ngraph::pass::low_precision::FakeQuantizeDecompositionTransformation>();
+        transform.commonGraphRewrite->add_matcher<ngraph::pass::low_precision::MaxPoolTransformation>();
+        transform.cleanup->add_matcher<ngraph::pass::low_precision::FakeQuantizeTransformation>();
+        transform.cleanup->add_matcher<ngraph::pass::low_precision::FuseSubtractToFakeQuantizeTransformation>();
+        transform.cleanup->add_matcher<ngraph::pass::low_precision::FuseMultiplyToFakeQuantizeTransformation>();
+        transform.transform(actualFunction);
+
+        referenceFunction = ngraph::builder::subgraph::MarkupAvgPoolPrecisionsFunction::getReference(
+            precision,
+            testValues.expected.inputPrecision,
+            shape,
+            addFakeQuantize,
+            additionalLayer,
+            testValues.expected.dequantizationBefore,
+            testValues.expected.preicsionAfterOperation,
+            testValues.expected.dequantizationAfter);
+    }
+
+    static std::string getTestCaseName(testing::TestParamInfo<MarkupAvgPoolPrecisionsTransformationParams> obj) {
+        ngraph::element::Type precision;
+        ngraph::Shape shape;
+        bool addFakeQuantize;
+        std::string additionalLayer;
+        MarkupAvgPoolPrecisionsTransformationTestValues testValues;
+        std::tie(precision, shape, addFakeQuantize, additionalLayer, testValues) = obj.param;
+
+        std::ostringstream result;
+        result <<
+            precision << "_" <<
+            LayerTransformation::getTestCaseNameByParams(testValues.actual.inputPrecision, shape, testValues.params) << "_" <<
+            testValues.actual.dequantization << "_" <<
+            testValues.expected.dequantizationBefore << "_" <<
+            testValues.expected.preicsionAfterOperation << "_" <<
+            testValues.expected.dequantizationAfter << "_" <<
+            (addFakeQuantize ? "_FQ_after_" : "_") << additionalLayer;
+        return result.str();
+    }
+};
+
+TEST_P(MarkupAvgPoolPrecisionsTransformation, CompareFunctions) {
+    InitNodeInfo().run_on_function(actualFunction);
+    actualFunction->validate_nodes_and_infer_types();
+
+    const auto avgPoolOperations = LayerTransformation::get<opset1::AvgPool>(actualFunction);
+    ASSERT_EQ(1ul, avgPoolOperations.size()) << "unexpected avgPoolOperations size: " << avgPoolOperations.size();
+
+    {
+        auto avgPoolPrecisioinPreservedAttribute = ngraph::pass::low_precision::getAttribute<AvgPoolPrecisionPreservedAttributePtr>(
+                *avgPoolOperations.begin());
+        ASSERT_NE(nullptr, avgPoolPrecisioinPreservedAttribute);
+        ASSERT_EQ(true, avgPoolPrecisioinPreservedAttribute->get()->sharedValue->value);
+    }
+
+    const auto precisionPreserved = LayerTransformation::get<opset1::MaxPool>(actualFunction);
+    ASSERT_TRUE(checkIfAttributesAreTheSame<std::shared_ptr<AvgPoolPrecisionPreservedAttribute>>(precisionPreserved)) <<
+        "AvgPoolPrecisionPreservedAttribute are not the same";
+
+    //auto res = compare_functions(referenceFunction, actualFunction, true, true);
+    //ASSERT_TRUE(res.first) << res.second;
+}
+
+const std::vector<ngraph::element::Type> precisions = {
+    ngraph::element::f32,
+    //ngraph::element::f16
+};
+
+const std::vector<std::string> additionalLayer = {
+    "maxpool"  // any transparent layer
+};
+
+const std::vector<bool> addFQ = {
+    //true,
+    false
+};
+
+const std::vector<ngraph::Shape> shapes = {
+    { 1, 3, 9, 9 }
+};
+
+const std::vector<MarkupAvgPoolPrecisionsTransformationTestValues> testValues = {
+    // U8 per tensor quantization
+    {
+        LayerTransformation::createParamsU8I8(),
+        {
+            ngraph::element::f32,
+            {{ngraph::element::f32}, {128.f}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {{}, {128.f}, {0.02f}}
+        }
+    },
+    // U8 without subtract
+    {
+        LayerTransformation::createParamsU8I8(),
+        {
+            ngraph::element::f32,
+            {{ngraph::element::f32}, {}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {{}, {}, {0.02f}}
+        }
+    },
+    // U8 per channel quantization with different values
+    {
+        LayerTransformation::createParamsU8I8(),
+        {
+            ngraph::element::f32,
+            {
+                {ngraph::element::f32},
+                {{128.f, 0.f, 128.f / 2}},
+                {{3.f, 1.f, 2.f}}
+            }
+        },
+        {
+            ngraph::element::f32,
+            {{}, {}, {}},
+            ngraph::element::f32,
+            {
+                {},
+                {{128.f, 0.f, 128.f / 2}},
+                {{3.f, 1.f, 2.f}}
+            },
+        }
+    },
+    // U8 per channel quantization with the same values
+    {
+        LayerTransformation::createParamsU8I8(),
+        {
+            ngraph::element::f32,
+            {
+                {ngraph::element::f32},
+                {{128.f, 128.f, 128.f}},
+                {{3.f, 3.f, 3.f}}
+            }
+        },
+        {
+            ngraph::element::f32,
+            {{}, {}, {}},
+            ngraph::element::f32,
+            {
+                {},
+                {{128.f, 128.f, 128.f}},
+                {{3.f, 3.f, 3.f}}
+            },
+        }
+    },
+    // U8 without dequantization
+    {
+        LayerTransformation::createParamsU8I8(),
+        {
+            ngraph::element::f32,
+            {}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {}
+        }
+    },
+    // U8 not update precisions
+    {
+        LayerTransformation::createParamsU8I8().setUpdatePrecisions(false),
+        {
+            ngraph::element::f32,
+            {{}, {128.f}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {{}, {128.f}, {0.02f}}
+        }
+    },
+    // I8 per tensor quantization
+    {
+        LayerTransformation::createParamsI8I8(),
+        {
+            ngraph::element::f32,
+            {{ngraph::element::f32}, {128.f}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {{}, {128.f}, {0.02f}}
+        }
+    },
+    // failed
+    // I8 without subtract
+    {
+        LayerTransformation::createParamsI8I8(),
+        {
+            ngraph::element::f32,
+            {{ngraph::element::f32}, {}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {{}, {}, {0.02f}}
+        }
+    },
+    // I8 per channel quantization with different values
+    {
+        LayerTransformation::createParamsI8I8(),
+        {
+            ngraph::element::f32,
+            {
+                {ngraph::element::f32},
+                {{64.f, 0.f, 32.f}},
+                {{3.f, 1.f, 2.f}}
+            }
+        },
+        {
+            ngraph::element::f32,
+            {{}, {}, {}},
+            ngraph::element::f32,
+            {
+                {},
+                {{64.f, 0.f, 32.f}},
+                {{3.f, 1.f, 2.f}}
+            },
+        }
+    },
+    // I8 per channel quantization with the same values
+    {
+        LayerTransformation::createParamsI8I8(),
+        {
+            ngraph::element::f32,
+            {
+                {ngraph::element::f32},
+                {{64.f, 64.f, 64.f}},
+                {{3.f, 3.f, 3.f}}
+            }
+        },
+        {
+            ngraph::element::f32,
+            {{}, {}, {}},
+            ngraph::element::f32,
+            {
+                {},
+                {{64.f, 64.f, 64.f}},
+                {{3.f, 3.f, 3.f}}
+            },
+        }
+    },
+    // I8 without dequantization
+    {
+        LayerTransformation::createParamsI8I8(),
+        {
+            ngraph::element::f32,
+            {}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {}
+        }
+    },
+    // I8 not update precisions
+    {
+        LayerTransformation::createParamsI8I8().setUpdatePrecisions(false),
+        {
+            ngraph::element::f32,
+            {{}, {128.f}, {0.02f}}
+        },
+        {
+            ngraph::element::f32,
+            {},
+            ngraph::element::f32,
+            {{}, {128.f}, {0.02f}}
+        }
+    },
+};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_LPT,
+    MarkupAvgPoolPrecisionsTransformation,
+    ::testing::Combine(
+        ::testing::ValuesIn(precisions),
+        ::testing::ValuesIn(shapes),
+        ::testing::ValuesIn(addFQ),
+        ::testing::ValuesIn(additionalLayer),
+        ::testing::ValuesIn(testValues)),
+    MarkupAvgPoolPrecisionsTransformation::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_transformation.cpp
index 707d4da971adc5..76f9d867b2d0b4 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_transformation.cpp
@@ -12,7 +12,6 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/mat_mul.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
@@ -47,7 +46,7 @@ class MatMullTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations result;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp
index 55ca921c6a16ec..608ffa4399ba5a 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp
@@ -11,7 +11,6 @@
 #include <gtest/gtest.h>
 
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/mat_mul.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
@@ -51,7 +50,7 @@ class MatMullTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationOnWeights;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -105,6 +104,12 @@ class MatMulWithConstantTransformation : public LayerTransformation, public test
 
         SimpleLowPrecisionTransformer transformer;
         transformer.add<ngraph::pass::low_precision::MatMulTransformation, ngraph::opset1::MatMul>(testValues.params);
+        if (testValues.params.support3DTensorOnActivations == false) {
+            transformer.set_callback<ngraph::pass::low_precision::MatMulTransformation>(
+                [](const std::shared_ptr<const ngraph::Node>& node) -> bool {
+                    return ngraph::pass::low_precision::MatMulTransformation::is3DTensorOnActivations(node);
+                });
+        }
         transformer.transform(actualFunction);
 
         referenceFunction = (testValues.expected.fqOnWeights.empty() && testValues.expected.dequantizationOnWeights.empty()) ?
@@ -139,7 +144,7 @@ class MatMulWithConstantTransformation : public LayerTransformation, public test
 
 TEST_P(MatMulWithConstantTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/max_pool_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/max_pool_transformation.cpp
index 114b31a8ca8b1f..b905fd447bb83b 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/max_pool_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/max_pool_transformation.cpp
@@ -12,7 +12,6 @@
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
 #include <low_precision/max_pool.hpp>
-#include <low_precision/transformer.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "simple_low_precision_transformer.hpp"
@@ -42,7 +41,7 @@ class MaxPoolTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantization2;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -93,7 +92,7 @@ class MaxPoolTransformation : public LayerTransformation, public testing::WithPa
 
 TEST_P(MaxPoolTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, false, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, false, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/move_dequantization_after_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/move_dequantization_after_transformation.cpp
index a9106994aa7320..da515be1f8681d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/move_dequantization_after_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/move_dequantization_after_transformation.cpp
@@ -38,7 +38,7 @@ class MoveDequantizationAfterTransformationParams {
     };
 
     ngraph::element::Type originalPrecision;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool updatePrecision;
     bool moveSubtract;
     Actual actual;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/mul_add_to_scaleshift_or_power_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/mul_add_to_scaleshift_or_power_transformation.cpp
index 0b32cedb3515f6..3a9348f6ab6b8d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/mul_add_to_scaleshift_or_power_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/mul_add_to_scaleshift_or_power_transformation.cpp
@@ -29,7 +29,7 @@ namespace {
 
 class MulAddToScaleshiftOrPowerParams {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ngraph::builder::subgraph::DequantizationOperations::Multiply mulValues;
     ngraph::builder::subgraph::Add addValues;
     ngraph::element::Type precisionAfterOperation;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_to_group_convolution_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_to_group_convolution_transformation.cpp
index e03d597a9cda3d..a15b63eaf484b8 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_to_group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_to_group_convolution_transformation.cpp
@@ -41,7 +41,7 @@ class MultiplyToGroupConvolutionTransformationTestValues {
     };
 
     ngraph::PartialShape inputShape;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     bool transformed;
     bool haveMultiplyWithNoConstBeforeDequantization;
     Actual actual;
@@ -73,7 +73,15 @@ class MultiplyToGroupConvolutionTransformation :
             testValues.actual.precisionBeforeDequantization,
             testValues.actual.dequantization,
             testValues.haveMultiplyWithNoConstBeforeDequantization);
-        SimpleLowPrecisionTransformer transformer;
+
+        auto precisionRestrictions = std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>({
+            ngraph::pass::low_precision::OperationPrecisionRestriction::create<ngraph::opset1::Multiply>({
+                {0, {ngraph::element::u8}},
+                {1, {ngraph::element::i8}}
+            })
+        });
+
+        SimpleLowPrecisionTransformer transformer(precisionRestrictions);
         transformer.add<ngraph::pass::low_precision::MultiplyToGroupConvolutionTransformation, ngraph::opset1::Multiply>(testValues.params);
         transformer.transform(actualFunction);
 
@@ -321,22 +329,23 @@ const std::vector<MultiplyToGroupConvolutionTransformationTestValues> testValues
             }
         }
     },
-    // i8 (not transformed)
-    {
-        { 1, 4, 1, 1 },
-        LayerTransformation::createParamsU8I8(),
-        false,
-        false,
-        {
-            ngraph::element::i8,
-            {
-                {},
-                {{1.f, 2.f, 3.f, 4.f}, ngraph::element::f32},
-                {{0.45f, 0.82f, 0.71f, 0.37f}}
-            }
-        },
-        {}
-    },
+    // TODO: LPT: not implemented
+//    // i8 (not transformed)
+//    {
+//        ngraph::Shape{ 1, 4, 1, 1 },
+//        LayerTransformation::createParamsU8I8(),
+//        false,
+//        false,
+//        {
+//            ngraph::element::i8,
+//            {
+//                {},
+//                {{1.f, 2.f, 3.f, 4.f}, ngraph::element::f32},
+//                {{0.45f, 0.82f, 0.71f, 0.37f}}
+//            }
+//        },
+//        {}
+//    },
     // by spatial dimensions (not transformed)
     {
         { 1, 1, 2, 2 },
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_transformation.cpp
index 26ca442f551bef..3a527f6856a3e0 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/multiply_transformation.cpp
@@ -28,14 +28,14 @@ using namespace ngraph::builder::subgraph;
 
 class MultiplyTransformationTestValues {
 public:
-    low_precision::LayerTransformation::Params transformationParams;
+    TestTransformationParams transformationParams;
     MultiplyValues actual;
     MultiplyValues expected;
 
     MultiplyTransformationTestValues() = default;
 
     MultiplyTransformationTestValues(
-        low_precision::LayerTransformation::Params transformationParams,
+        TestTransformationParams transformationParams,
         MultiplyValues actual,
         MultiplyValues expected):
         transformationParams(std::move(transformationParams)),
@@ -55,8 +55,7 @@ class MultiplyTransformation : public LayerTransformation, public testing::WithP
 
         actualFunction = MultiplyFunction::get(precision, testParams.actual);
         SimpleLowPrecisionTransformer transform;
-        transform.add<low_precision::MultiplyTransformation, ngraph::opset1::Multiply>(
-            low_precision::LayerTransformation::Params(testParams.transformationParams));
+        transform.add<low_precision::MultiplyTransformation, ngraph::opset1::Multiply>(testParams.transformationParams);
         transform.transform(actualFunction);
 
         referenceFunction = MultiplyFunction::get(precision, testParams.expected);
@@ -77,7 +76,7 @@ class MultiplyTransformation : public LayerTransformation, public testing::WithP
 
 TEST_P(MultiplyTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/mvn_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/mvn_transformation.cpp
index 470b639f3ab464..a36e78c873523a 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/mvn_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/mvn_transformation.cpp
@@ -43,7 +43,7 @@ class MVNTransformationTestValues {
 
     ngraph::AxisSet reductionAxes;
     bool normalizeVariance;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_dequantization_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_dequantization_transformation.cpp
index 17a8b601f12c6c..82d173e0acb67a 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_dequantization_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_dequantization_transformation.cpp
@@ -34,7 +34,7 @@ class NormalizeDequantizationTestValues {
         ngraph::element::Type precisionBeforeDequantization;
         ngraph::builder::subgraph::DequantizationOperations dequantization;
     };
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ngraph::Shape inputShape;
     Actual actual;
     Expected expected;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_l2_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_l2_transformation.cpp
index 7135ab10142efa..68f8e31ee226c0 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_l2_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/normalize_l2_transformation.cpp
@@ -39,7 +39,7 @@ class NormalizeL2TransformationTestValues {
         ngraph::element::Type precisionAfterOperation;
         DequantizationOperations dequantizationAfter;
     };
-    low_precision::LayerTransformation::Params transformationParams;
+    TestTransformationParams transformationParams;
     Actual actual;
     Expected expected;
 };
@@ -70,8 +70,7 @@ class NormalizeL2Transformation : public LayerTransformation, public testing::Wi
             params.actual.dequantization);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<low_precision::NormalizeL2Transformation, ngraph::opset1::NormalizeL2>(
-            low_precision::LayerTransformation::Params(params.transformationParams));
+        transform.add<low_precision::NormalizeL2Transformation, ngraph::opset1::NormalizeL2>(params.transformationParams);
         transform.transform(actualFunction);
 
         referenceFunction = ngraph::builder::subgraph::NormalizeL2Function::getReference(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/precision_details_test.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/precision_details_test.cpp
index 1d3f026e042021..8a0a6b218a08ed 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/precision_details_test.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/precision_details_test.cpp
@@ -15,11 +15,11 @@ using namespace ngraph::pass::low_precision;
 
 class PrecisionDetailsTests : public ::testing::Test {
 protected:
-    const QuantizationDetails i8levels255WithoutZeroPoint = QuantizationDetails(255ul, { -1.27f }, { 1.27f }, { -1.27f }, { 1.27f }, 1ul, 1ul, 1ul);
-    const QuantizationDetails i8levels255WithZeroPoint = QuantizationDetails(255ul, { -1.27f / 2.f }, { 1.27f }, { -1.27f / 2.f }, { 1.27f }, 1ul, 1ul, 1ul);
-    const QuantizationDetails i8levels256WithoutZeroPoint = QuantizationDetails(256ul, { -1.28f }, { 1.27f }, { -1.28f }, { 1.27f }, 1ul, 1ul, 1ul);
-    const QuantizationDetails u8levels256WithoutZeroPoint = QuantizationDetails(256ul, { 0.f }, { 1.23f }, { 0.f }, { 1.23f }, 1ul, 1ul, 1ul);
-    const QuantizationDetails u8levels256WithZeroPoint = QuantizationDetails(256ul, { 0.12f }, { 1.23f }, { 0.12f }, { 1.23f }, 1ul, 1ul, 1ul);
+    const QuantizationDetails i8levels255WithoutZeroPoint = QuantizationDetails(255ul, { -1.27f }, { 1.27f }, { -1.27f }, { 1.27f });
+    const QuantizationDetails i8levels255WithZeroPoint = QuantizationDetails(255ul, { -1.27f / 2.f }, { 1.27f }, { -1.27f / 2.f }, { 1.27f });
+    const QuantizationDetails i8levels256WithoutZeroPoint = QuantizationDetails(256ul, { -1.28f }, { 1.27f }, { -1.28f }, { 1.27f });
+    const QuantizationDetails u8levels256WithoutZeroPoint = QuantizationDetails(256ul, { 0.f }, { 1.23f }, { 0.f }, { 1.23f });
+    const QuantizationDetails u8levels256WithZeroPoint = QuantizationDetails(256ul, { 0.12f }, { 1.23f }, { 0.12f }, { 1.23f });
 };
 
 TEST_F(PrecisionDetailsTests, getPrecisionDetailsI8levels255WithoutZeroPoint) {
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/prelu_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/prelu_transformation.cpp
index c24fb8b3df0bf9..5d97304378f80d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/prelu_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/prelu_transformation.cpp
@@ -41,7 +41,7 @@ class PReluTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/pull_reshape_through_dequantization_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/pull_reshape_through_dequantization_transformation.cpp
index 33a9b90cd54c78..8459e1ce212d56 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/pull_reshape_through_dequantization_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/pull_reshape_through_dequantization_transformation.cpp
@@ -40,7 +40,7 @@ class PullReshapeThroughDequantizationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Values actual;
     Values expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/pull_transpose_through_dequantization_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/pull_transpose_through_dequantization_transformation.cpp
index fd459eeb1d1a6a..1e21defb8c1fae 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/pull_transpose_through_dequantization_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/pull_transpose_through_dequantization_transformation.cpp
@@ -40,7 +40,7 @@ class PullTransposeThroughDequantizationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Values actual;
     Values expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_max_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_max_transformation.cpp
index 60aae6478a130f..d867e86f171891 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_max_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_max_transformation.cpp
@@ -33,15 +33,14 @@ class ReduceMaxTransformation : public ReduceTransformation<opset1::ReduceMax> {
         const auto transformationParams = std::get<1>(GetParam()).params;
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ReduceMaxTransformation, ngraph::opset1::ReduceMax>(
-            low_precision::LayerTransformation::Params(transformationParams));
+        transform.add<ngraph::pass::low_precision::ReduceMaxTransformation, ngraph::opset1::ReduceMax>(transformationParams);
         transform.transform(actualFunction);
     }
 };
 
 TEST_P(ReduceMaxTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_mean_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_mean_transformation.cpp
index c33ae1d329c74a..849fc05432578d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_mean_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_mean_transformation.cpp
@@ -33,15 +33,14 @@ class ReduceMeanTransformation : public ReduceTransformation<opset1::ReduceMean>
         const auto transformationParams = std::get<1>(GetParam()).params;
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ReduceMeanTransformation, ngraph::opset1::ReduceMean>(
-            low_precision::LayerTransformation::Params(transformationParams));
+        transform.add<ngraph::pass::low_precision::ReduceMeanTransformation, ngraph::opset1::ReduceMean>(transformationParams);
         transform.transform(actualFunction);
     }
 };
 
 TEST_P(ReduceMeanTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_min_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_min_transformation.cpp
index 143b5d72e7885f..c461eea6fcd6da 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_min_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_min_transformation.cpp
@@ -33,15 +33,14 @@ class ReduceMinTransformation : public ReduceTransformation<opset1::ReduceMin> {
         const auto transformationParams = std::get<1>(GetParam()).params;
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ReduceMinTransformation, ngraph::opset1::ReduceMin>(
-            low_precision::LayerTransformation::Params(transformationParams));
+        transform.add<ngraph::pass::low_precision::ReduceMinTransformation, ngraph::opset1::ReduceMin>(transformationParams);
         transform.transform(actualFunction);
     }
 };
 
 TEST_P(ReduceMinTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_sum_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_sum_transformation.cpp
index d3524d39e6da7b..0d9329eda1e1ae 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_sum_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_sum_transformation.cpp
@@ -33,15 +33,14 @@ class ReduceSumTransformation : public ReduceTransformation<opset1::ReduceSum> {
         const auto transformationParams = std::get<1>(GetParam()).params;
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ReduceSumTransformation, ngraph::opset1::ReduceSum>(
-            low_precision::LayerTransformation::Params(transformationParams));
+        transform.add<ngraph::pass::low_precision::ReduceSumTransformation, ngraph::opset1::ReduceSum>(transformationParams);
         transform.transform(actualFunction);
     }
 };
 
 TEST_P(ReduceSumTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_transformation.hpp b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_transformation.hpp
index 7af8f5a8fe3b83..8686b62f410484 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_transformation.hpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/reduce_transformation.hpp
@@ -39,7 +39,7 @@ class ReduceTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     std::vector<int64_t> constantValues;
     bool keepDims;
     Actual actual;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/relu_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/relu_transformation.cpp
index 50777c1e29526b..a567374acdffb8 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/relu_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/relu_transformation.cpp
@@ -41,7 +41,7 @@ class ReluTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -94,7 +94,7 @@ class ReluTransformation : public LayerTransformation, public testing::WithParam
 
 TEST_P(ReluTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/reshape_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/reshape_transformation.cpp
index c7de0b9934145c..8383c79267ad3d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/reshape_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/reshape_transformation.cpp
@@ -43,7 +43,7 @@ class ReshapeTransformationTestValues {
 
     ngraph::PartialShape inputShape;
     std::vector<int> reshapeConstValues;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/separate_in_standalone_branch_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/separate_in_standalone_branch_transformation.cpp
index a62be54c87f860..0d40f6c17e2172 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/separate_in_standalone_branch_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/separate_in_standalone_branch_transformation.cpp
@@ -12,7 +12,6 @@
 
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
-#include <low_precision/transformer.hpp>
 #include <low_precision/mat_mul.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
@@ -31,7 +30,7 @@ using namespace ngraph::pass;
 
 class SeparateInStandaloneBranchTransformationTestValues {
 public:
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     ngraph::element::Type precisionBefore;
     ngraph::builder::subgraph::DequantizationOperations dequantization;
 };
@@ -127,7 +126,7 @@ class SeparateInStandaloneBranchTransformation :
 
 TEST_P(SeparateInStandaloneBranchTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/shuffle_channels_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/shuffle_channels_transformation.cpp
index a44ac2b05800f8..595d304f7bfcc3 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/shuffle_channels_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/shuffle_channels_transformation.cpp
@@ -39,7 +39,7 @@ class ShuffleChannelsTransformationTestValues {
         ngraph::builder::subgraph::DequantizationOperations dequantizationAfter;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     std::int64_t axis;
     std::int64_t group;
     Actual actual;
@@ -62,11 +62,10 @@ class ShuffleChannelsTransformation : public LayerTransformation, public testing
             testValues.actual.dequantization,
             testValues.axis,
             testValues.group);
-        ngraph::pass::VisualizeTree("C://models//test.actual").run_on_function(actualFunction);
+
         SimpleLowPrecisionTransformer transform;
         transform.add<ngraph::pass::low_precision::ShuffleChannelsTransformation, ngraph::opset1::ShuffleChannels>(testValues.params);
         transform.transform(actualFunction);
-        ngraph::pass::VisualizeTree("C://models//test.transformed").run_on_function(actualFunction);
 
         referenceFunction = ngraph::builder::subgraph::ShuffleChannelsFunction::getReference(
             testValues.expected.inputPrecision,
@@ -76,7 +75,6 @@ class ShuffleChannelsTransformation : public LayerTransformation, public testing
             testValues.group,
             testValues.expected.preicsionAfterOperation,
             testValues.expected.dequantizationAfter);
-        ngraph::pass::VisualizeTree("C://models//test.reference").run_on_function(referenceFunction);
     }
 
     static std::string getTestCaseName(testing::TestParamInfo<ShuffleChannelsTransformationParams> obj) {
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp
index 3c48d56be5b099..180bdb070d5b5d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp
@@ -6,84 +6,41 @@
 
 #include <string>
 #include <ngraph/ngraph.hpp>
+#include <low_precision/low_precision.hpp>
 #include <low_precision/transformation_context.hpp>
-#include <low_precision/transformer.hpp>
+#include <low_precision/layer_transformation.hpp>
+#include <low_precision/transformation_context.hpp>
+#include <low_precision/low_precision.hpp>
+#include <low_precision/align_quantization_parameters.hpp>
+#include <low_precision/markup_per_tensor_quantization.hpp>
+#include <low_precision/markup_can_be_quantized.hpp>
 
 using namespace testing;
 using namespace ngraph::pass;
 
-SimpleLowPrecisionTransformer::SimpleLowPrecisionTransformer() {}
-
-std::vector<ngraph::element::Type> SimpleLowPrecisionTransformer::getPrecisionsOnActivations(const ngraph::Node& op) const noexcept {
-    const auto it = transformations.find(ngraph::pass::low_precision::LowPrecisionTransformations::getType(op));
-    if (it == transformations.end()) {
-        return std::vector<ngraph::element::Type>();
-    }
-
-    const ngraph::pass::low_precision::LayerTransformationPtr transformation = it->second;
-    return transformation->getPrecisionsOnActivations();
-}
-
-bool SimpleLowPrecisionTransformer::isQuantized(const std::shared_ptr<ngraph::Node>& layer) const noexcept {
-    const std::string operantionType = ngraph::pass::low_precision::LowPrecisionTransformations::getType(*layer);
-
-    const auto it = transformations.find(operantionType);
-    if (it == transformations.end()) {
-        return false;
-    }
-
-    const ngraph::pass::low_precision::LayerTransformationPtr transformation = it->second;
-    return transformation->isQuantized(layer);
-}
-
-bool SimpleLowPrecisionTransformer::isPrecisionPreserved(const std::shared_ptr<ngraph::Node>& layer) const noexcept {
-    const std::string operantionType = ngraph::pass::low_precision::LowPrecisionTransformations::getType(*layer);
-
-    const auto it = transformations.find(operantionType);
-    if (it == transformations.end()) {
-        return false;
-    }
-
-    const ngraph::pass::low_precision::LayerTransformationPtr transformation = it->second;
-    return transformation->isPrecisionPreserved(layer);
+SimpleLowPrecisionTransformer::SimpleLowPrecisionTransformer(
+    const std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>& precisionRestrictions,
+    const std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>& quantizationRestrictions) {
+
+    // TODO: use one pass manager
+    markup = std::make_shared<ngraph::pass::Manager>();
+    markup->register_pass<ngraph::pass::low_precision::MarkupCanBeQuantized>();
+    markup->register_pass<ngraph::pass::low_precision::MarkupPrecisions>(precisionRestrictions);
+    markup->register_pass<ngraph::pass::low_precision::MarkupPerTensorQuantization>(quantizationRestrictions);
+    markup->register_pass<ngraph::pass::low_precision::MarkupAvgPoolPrecisionPreserved>();
+    markup->register_pass<ngraph::pass::low_precision::PropagatePrecisions>();
+    markup->register_pass<ngraph::pass::low_precision::AlignQuantizationIntervals>();
+    markup->register_pass<ngraph::pass::low_precision::AlignQuantizationParameters>();
+
+    common = std::make_shared<ngraph::pass::Manager>();
+    commonGraphRewrite = common->register_pass<ngraph::pass::GraphRewrite>();
+    cleanup = common->register_pass<ngraph::pass::GraphRewrite>();
 }
 
 void SimpleLowPrecisionTransformer::transform(std::shared_ptr<ngraph::Function>& function) {
-    // initialization
-    for (auto it : branchSpecificTransformations) {
-        ngraph::pass::low_precision::LayerTransformationPtr transformation = it.second;
-        transformation->setParamsManager(this);
-        transformation->setLayerTransformationsManager(this);
-    }
-
-    for (auto it : transformations) {
-        ngraph::pass::low_precision::LayerTransformationPtr transformation = it.second;
-        transformation->setParamsManager(this);
-        transformation->setLayerTransformationsManager(this);
-    }
-
-    // transformation
-    {
-        ngraph::pass::low_precision::TypeRelaxedReplacer pass;
-        pass.run_on_function(function);
-    }
-
-    ngraph::pass::low_precision::TransformationContext context(function);
-    {
-        GraphRewrite pass;
-        for (auto it : branchSpecificTransformations) {
-            ngraph::pass::low_precision::LayerTransformationPtr transformation = it.second;
-            transformation->registerMatcherIn(pass, context);
-        }
-        pass.run_on_function(function);
-    }
+    ngraph::pass::low_precision::TypeRelaxedReplacer pass;
+    pass.run_on_function(function);
 
-    {
-        GraphRewrite pass;
-        for (auto it : transformations) {
-            ngraph::pass::low_precision::LayerTransformationPtr transformation = it.second;
-            transformation->registerMatcherIn(pass, context);
-        }
-        pass.run_on_function(function);
-    }
+    markup->run_passes(function);
+    common->run_passes(function);
 }
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp
index c9582adf0f0115..7439d06bedd071 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp
@@ -8,57 +8,32 @@
 
 #include <ngraph/ngraph.hpp>
 
+#include "layer_transformation.hpp"
 #include "common_test_utils/test_common.hpp"
 #include "low_precision/layer_transformation.hpp"
-#include "low_precision/transformation_context.hpp"
-#include <low_precision/transformer.hpp>
-#include <low_precision/iparams_manager.hpp>
-#include <low_precision/ilayer_transformations_manager.hpp>
+#include "low_precision/common/operation_precision_restriction.hpp"
+#include "low_precision/common/operation_per_tensor_quantization_restriction.hpp"
 
-class SimpleLowPrecisionTransformer : public
-    ngraph::pass::IParamsManager,
-    ngraph::pass::ILayerTransformationsManager {
+class SimpleLowPrecisionTransformer {
 public:
-    SimpleLowPrecisionTransformer();
-
-    // IParamsManager interface implementation
-    std::vector<ngraph::element::Type> getPrecisionsOnActivations(const ngraph::Node& op) const noexcept override;
-
-    // ILayerTransformationsManager interface implementation
-    bool isQuantized(const std::shared_ptr<ngraph::Node>& layer) const noexcept override;
-    bool isPrecisionPreserved(const std::shared_ptr<ngraph::Node>& layer) const noexcept override;
+    SimpleLowPrecisionTransformer(
+        const std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>& precisionRestrictions = {},
+        const std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>& quantizationRestrictions = {});
 
     template <class T, class Operation>
-    ngraph::pass::low_precision::LayerTransformationPtr addBranchSpecific(const ngraph::pass::low_precision::LayerTransformation::Params& params) {
-        const std::string typeName = ngraph::pass::low_precision::LowPrecisionTransformations::getType<Operation>();
-
-        const auto it = branchSpecificTransformations.find(typeName);
-        if (it != branchSpecificTransformations.end()) {
-            branchSpecificTransformations.erase(it);
-        }
-
-        auto transformation = std::make_shared<T>(params);
-        branchSpecificTransformations.emplace(typeName, transformation);
-        return transformation;
+    void add(const TestTransformationParams& params) {
+        commonGraphRewrite->add_matcher<T>(TestTransformationParams::toParams(params));
     }
 
-    template <class T, class Operation>
-    ngraph::pass::low_precision::LayerTransformationPtr add(const ngraph::pass::low_precision::LayerTransformation::Params& params) {
-        const std::string typeName = ngraph::pass::low_precision::LowPrecisionTransformations::getType<Operation>();
-
-        const auto it = transformations.find(typeName);
-        if (it != transformations.end()) {
-            transformations.erase(it);
-        }
-
-        auto transformation = std::make_shared<T>(params);
-        transformations.emplace(typeName, transformation);
-        return transformation;
+    template <class T>
+    void set_callback(const std::function<bool(const std::shared_ptr<const ::ngraph::Node>)>& callback) {
+        common->get_pass_config()->set_callback<T>(callback);
     }
 
     void transform(std::shared_ptr<ngraph::Function>& function);
 
-private:
-    std::map<std::string, ngraph::pass::low_precision::LayerTransformationPtr> branchSpecificTransformations;
-    std::map<std::string, ngraph::pass::low_precision::LayerTransformationPtr> transformations;
+    std::shared_ptr<ngraph::pass::Manager> markup;
+    std::shared_ptr<ngraph::pass::Manager> common;
+    std::shared_ptr<ngraph::pass::GraphRewrite> commonGraphRewrite;
+    std::shared_ptr<ngraph::pass::GraphRewrite> cleanup;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/split_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/split_transformation.cpp
index bce1b71bd8c525..560258976e6b1d 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/split_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/split_transformation.cpp
@@ -40,7 +40,7 @@ class SplitTransformationTestValues {
     ngraph::PartialShape inputShape;
     std::int64_t splitedAxis;
     size_t numSplits;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
     bool addUnsupportedConcat;
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/squeeze_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/squeeze_transformation.cpp
index 3fa80a30bfeab5..6447d273016c3c 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/squeeze_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/squeeze_transformation.cpp
@@ -12,7 +12,6 @@
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
 #include <low_precision/squeeze.hpp>
-#include <low_precision/transformer.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "simple_low_precision_transformer.hpp"
@@ -55,7 +54,7 @@ class SqueezeTransformationTestValues {
 
     ngraph::PartialShape inputShape;
     std::vector<float> axes;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -102,7 +101,7 @@ class SqueezeTransformation : public LayerTransformation, public testing::WithPa
 
 TEST_P(SqueezeTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/strided_slice_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/strided_slice_transformation.cpp
index 25422b3f3c4695..a51b061ec8ba06 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/strided_slice_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/strided_slice_transformation.cpp
@@ -66,7 +66,7 @@ class StridedSliceTransformationTestValues {
         std::vector<int64_t> elipsisMask;
     };
 
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     LayerParams layerParams;
     Actual actual;
     Expected expected;
@@ -132,7 +132,7 @@ class StridedSliceTransformation : public LayerTransformation, public testing::W
 
 TEST_P(StridedSliceTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/subtract_multiply_to_multiply_add_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/subtract_multiply_to_multiply_add_transformation.cpp
index 4b745c0aeae434..d4a71e496c8299 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/subtract_multiply_to_multiply_add_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/subtract_multiply_to_multiply_add_transformation.cpp
@@ -41,7 +41,7 @@ class SubtractMultiplyToMultiplyAddTransformationTestValues {
         Multiply multiply;
         Add add;
     };
-    low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -65,8 +65,7 @@ class SubtractMultiplyToMultiplyAddTransformation :
             testValues.actual.precisionAfter);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<low_precision::SubtractMultiplyToMultiplyAddTransformation, ngraph::opset1::Multiply>(
-            low_precision::LayerTransformation::Params(testValues.params));
+        transform.add<low_precision::SubtractMultiplyToMultiplyAddTransformation, ngraph::opset1::Multiply>(testValues.params);
         transform.transform(actualFunction);
 
         referenceFunction = SubtractMultiplyToMultiplyAddFunction::getReference(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/transformations_after_split_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/transformations_after_split_transformation.cpp
index 0795c8d5101697..678592ae601beb 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/transformations_after_split_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/transformations_after_split_transformation.cpp
@@ -51,107 +51,107 @@ using namespace testing;
 using namespace ngraph;
 using namespace ngraph::pass;
 
-SimpleLowPrecisionTransformer getTransformerWithTransformationByName(
-    const ngraph::pass::low_precision::LayerTransformation::Params& params,
-    std::string name) {
+void getTransformerWithTransformationByName(
+    SimpleLowPrecisionTransformer& transformer,
+    const TestTransformationParams& params,
+    const std::string name) {
     using namespace pass::low_precision;
-    SimpleLowPrecisionTransformer transformer;
 
     if (name == "AddTransformationWithoutConcat" || name == "AddTransformationWithConcat") {
         transformer.add<AddTransformation, ngraph::opset1::Add>(params);
-        return transformer;
+        return;
     }
     if (name == "AvgPoolTransformation") {
         transformer.add<AvgPoolTransformation, opset1::AvgPool>(params);
-        return transformer;
+        return;
     }
     if (name == "ClampTransformation") {
         transformer.add<ClampTransformation, opset1::Clamp>(params);
-        return transformer;
+        return;
     }
     if (name == "ConvolutionTransformation" || name == "AsymmetricConvolutionTransformation") {
         transformer.add<ConvolutionTransformation, opset1::Convolution>(params);
-        return transformer;
+        return;
     }
     if (name == "DepthToSpaceTransformation") {
         transformer.add<DepthToSpaceTransformation, opset1::DepthToSpace>(params);
-        return transformer;
+        return;
     }
     if (name == "FakeQuantizeTransformation") {
         transformer.add<FakeQuantizeTransformation, opset1::FakeQuantize>(params);
-        return transformer;
+        return;
     }
     if (name == "InterpolateTransformation") {
         transformer.add<InterpolateTransformation, ngraph::opset1::Interpolate>(params);
-        return transformer;
+        return;
     }
     if (name == "MatMulTransformation") {
         transformer.add<MatMulTransformation, ngraph::opset1::MatMul>(params);
-        return transformer;
+        return;
     }
     if (name == "MaxPoolTransformation") {
         transformer.add<MaxPoolTransformation, ngraph::opset1::MaxPool>(params);
-        return transformer;
+        return;
     }
     if (name == "MultiplyTransformation") {
         transformer.add<MultiplyTransformation, ngraph::opset1::Multiply>(params);
-        return transformer;
+        return;
     }
     if (name == "MVNTransformation") {
         transformer.add<MVNTransformation, ngraph::op::MVN>(params);
-        return transformer;
+        return;
     }
     if (name == "NormalizeL2Transformation") {
         transformer.add<NormalizeL2Transformation, ngraph::opset1::NormalizeL2>(params);
-        return transformer;
+        return;
     }
     if (name == "PReluTransformation") {
         transformer.add<PReluTransformation, ngraph::opset1::PRelu>(params);
-        return transformer;
+        return;
     }
     if (name == "ReluTransformation") {
         transformer.add<ReluTransformation, ngraph::opset1::Relu>(params);
-        return transformer;
+        return;
     }
     if (name == "ReshapeTransformation") {
         transformer.add<ReshapeTransformation, ngraph::opset1::Reshape>(params);
-        return transformer;
+        return;
     }
     if (name == "SqueezeTransformation") {
         transformer.add<SqueezeTransformation, ngraph::opset1::Squeeze>(params);
-        return transformer;
+        return;
     }
     if (name == "StridedSliceTransformation") {
         transformer.add<StridedSliceTransformation, ngraph::opset1::StridedSlice>(params);
-        return transformer;
+        return;
     }
     if (name == "TransposeTransformation") {
         transformer.add<TransposeTransformation, ngraph::opset1::Transpose>(params);
-        return transformer;
+        return;
     }
     if (name == "UnsqueezeTransformation") {
         transformer.add<UnsqueezeTransformation, ngraph::opset1::Unsqueeze>(params);
-        return transformer;
+        return;
     }
     if (name == "FuseConvertTransformation") {
         transformer.add<FuseConvertTransformation, ngraph::opset1::Multiply>(params);
-        return transformer;
+        return;
     }
     if (name == "FuseSubtractToFakeQuantizeTransformation") {
         transformer.add<FuseSubtractToFakeQuantizeTransformation, ngraph::opset1::Subtract>(params);
-        return transformer;
+        return;
     }
     if (name == "FuseMultiplyToFakeQuantizeTransformation") {
         transformer.add<FuseMultiplyToFakeQuantizeTransformation, ngraph::opset1::Multiply>(params);
-        return transformer;
+        return;
     }
     if (name == "MultiplyToGroupConvolutionTransformation") {
         transformer.add<MultiplyToGroupConvolutionTransformation, ngraph::opset1::Multiply>(params);
-        return transformer;
+        return;
     }
     if (name == "SubtractMultiplyToMultiplyAddTransformation") {
         transformer.add<SubtractMultiplyToMultiplyAddTransformation, ngraph::opset1::Multiply>(params);
-        return transformer;
+        return;
     }
     throw std::runtime_error("unexpected transformation name");
 }
@@ -179,7 +179,8 @@ class TransformationsAfterSplitTransformation : public LayerTransformation, publ
 TEST_P(TransformationsAfterSplitTransformation, Run) {
     const std::string layerName = GetParam();
     const auto params = LayerTransformation::createParamsU8I8();
-    SimpleLowPrecisionTransformer transformer = getTransformerWithTransformationByName(params, layerName);
+    SimpleLowPrecisionTransformer transformer;
+    getTransformerWithTransformationByName(transformer, params, layerName);
 
     ASSERT_NO_THROW(transformer.transform(function));
 }
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/transformer_is_function_quantized.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/transformer_is_function_quantized.cpp
index 5a00bbc015cb58..83ad3505484adc 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/transformer_is_function_quantized.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/transformer_is_function_quantized.cpp
@@ -11,7 +11,7 @@
 
 #include <gtest/gtest.h>
 #include <low_precision/fake_quantize.hpp>
-#include <low_precision/transformer.hpp>
+#include <low_precision/low_precision.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
@@ -56,7 +56,7 @@ class TransformerIsFunctionQuantized : public LayerTransformation, public testin
 
 TEST_P(TransformerIsFunctionQuantized, isFunctionQuantized) {
     actualFunction->validate_nodes_and_infer_types();
-    const bool isFunctionQuantized = ngraph::pass::low_precision::LowPrecisionTransformer::isFunctionQuantized(actualFunction);
+    const bool isFunctionQuantized = ngraph::pass::low_precision::LowPrecision::isFunctionQuantized(actualFunction);
 
     const TestValues testValues = GetParam();
     const bool expected = !testValues.fqOnData.empty() || !testValues.fqOnWeights.empty();
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/transpose_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/transpose_transformation.cpp
index bbca648c5bc9f1..dbf9e46e3da801 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/transpose_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/transpose_transformation.cpp
@@ -41,7 +41,7 @@ class TransposeTransformationTestValues {
     };
 
     std::vector<int> transposeConstValues;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/unsqueeze_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/unsqueeze_transformation.cpp
index 85ea6de6e6f212..74a094a4b59667 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/unsqueeze_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/unsqueeze_transformation.cpp
@@ -12,7 +12,6 @@
 #include <transformations/utils/utils.hpp>
 #include <transformations/init_node_info.hpp>
 #include <low_precision/unsqueeze.hpp>
-#include <low_precision/transformer.hpp>
 
 #include "common_test_utils/ngraph_test_utils.hpp"
 #include "simple_low_precision_transformer.hpp"
@@ -55,7 +54,7 @@ class UnsqueezeTransformationTestValues {
 
     ngraph::PartialShape inputShape;
     std::vector<float> axes;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
@@ -102,7 +101,7 @@ class UnsqueezeTransformation : public LayerTransformation, public testing::With
 
 TEST_P(UnsqueezeTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/variadic_split_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/variadic_split_transformation.cpp
index ab07fa3a2e3e68..f6cf1c442dd905 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/variadic_split_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/variadic_split_transformation.cpp
@@ -40,7 +40,7 @@ class VariadicSplitTransformationTestValues {
     ngraph::PartialShape inputShape;
     std::int64_t axis;
     std::vector<size_t> splitLengths;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
+    TestTransformationParams params;
     Actual actual;
     Expected expected;
 };
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp
index 8b9a1c407c6807..e616d9bebe996d 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp
@@ -18,10 +18,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
     // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::ClampTransformationParam> params{
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp
index 64b6b0b4d2a335..b3631fe57d7819 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp
@@ -16,7 +16,7 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp
index 0033b65b1c3e75..c817d3d3688f65 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp
@@ -17,10 +17,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<bool> transparentIntermediateValues = { true, false };
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_transformation.cpp
index 8d41c2b4086206..d335ec85e23e78 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_transformation.cpp
@@ -17,10 +17,10 @@ const std::vector<ngraph::element::Type> precisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<ngraph::PartialShape> shapes = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp
index 47dfa3385f671b..b76617ed213a7d 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp
@@ -16,10 +16,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<ConcatWithSplitTransformationParam> testValues = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp
index 61050800444a38..36a5794404891c 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp
@@ -17,8 +17,8 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
 const std::vector<LayerTestsDefinitions::ConvolutionQDqTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp
index 52cf2b24ba749e..e81a0c0deee075 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp
@@ -31,7 +31,7 @@ const std::vector<FakeQuantizeTransformationParam> fakeQuantizeOnDataValues = {
         "Pooling", "U8"
     },
     {
-        { 256ul, { 1ul }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
+        { 256ul, { {1ul}, {1ul}, {1ul}, {1ul} }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
         "Pooling", "U8"
     },
     {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
index 792323057f13cb..3ba7d8b2bef4b5 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
@@ -18,8 +18,8 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8().setUpdatePrecisions(false)
+    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8(),
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8().setUpdatePrecisions(false)
 };
 
 const std::vector<FakeQuantizeWithNotOptimalTransformationTestValues> fakeQuantizeOnDataValues = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/gemm_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/gemm_transformation.cpp
index 4aef2c749c4888..6d3dd3a7fda042 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/gemm_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/gemm_transformation.cpp
@@ -21,10 +21,9 @@ const std::vector<ngraph::PartialShape> dimensions = {
 };
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setSupportAsymmetricQuantization(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setSupportAsymmetricQuantization(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 INSTANTIATE_TEST_SUITE_P(smoke_LPT, GemmTransformation,
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
index cc62ec4db63640..040396db8bc40a 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
@@ -16,10 +16,12 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
+const std::vector<bool> addPrecisionPreserved = { true, false };
+
 const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> params = {
     // group convolution, tensor quantization
     {
@@ -69,6 +71,8 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
             { 25.5f, 25.5f, 25.5f / 2.f, 25.5f / 2.f, 25.5f / 4.f, 25.5f / 4.f }
         },
         { 255ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+        "",
+        ""
     },
     // depth-wise convolution, tensor quantization
     {
@@ -78,6 +82,8 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         -1,
         { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
         { 255ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+        "",
+        ""
     },
     // depth-wise convolution, per-channel quantization
     {
@@ -94,6 +100,26 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
             { 25.5f, 25.5f, 25.5f / 2.f, 25.5f / 2.f, 25.5f / 4.f, 25.5f / 4.f }
         },
         { 255ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+        "",
+        ""
+    },
+    // depth-wise convolution, per-channel quantization
+    {
+        ngraph::Shape{ 1, 6, 24, 24 },
+        ngraph::Shape{ 1, 6, 18, 18 },
+        6ul,
+        -1,
+        {
+            256ul,
+            ngraph::Shape { 6, 1, 1, 1 },
+            { 0.f, 0.f, 0.f, 0.f, 0.f, 0.f },
+            { 25.5f, 25.5f, 25.5f / 2.f, 25.5f / 2.f, 25.5f / 4.f, 25.5f / 4.f },
+            { 0.f, 0.f, 0.f, 0.f, 0.f, 0.f },
+            { 25.5f, 25.5f, 25.5f / 2.f, 25.5f / 2.f, 25.5f / 4.f, 25.5f / 4.f }
+        },
+        { 255ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
+        "",
+        ""
     }
 };
 
@@ -102,6 +128,7 @@ INSTANTIATE_TEST_SUITE_P(smoke_LPT, GroupConvolutionTransformation,
         ::testing::ValuesIn(netPrecisions),
         ::testing::Values(CommonTestUtils::DEVICE_CPU),
         ::testing::ValuesIn(trasformationParamValues),
-        ::testing::ValuesIn(params)),
+        ::testing::ValuesIn(params),
+        ::testing::ValuesIn(addPrecisionPreserved)),
     GroupConvolutionTransformation::getTestCaseName);
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
index 8a80f2b13b1ad8..e74a5d1f5b98e9 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
@@ -17,8 +17,8 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
 const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/mat_mul_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/mat_mul_transformation.cpp
index a3c782b39d00ea..b1bdd91ddbcb9d 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/mat_mul_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/mat_mul_transformation.cpp
@@ -21,7 +21,7 @@ std::vector<MatMulTransformationTestValues> testValues = {
         { 256ul, ngraph::Shape({}), {0.f}, {25.5f}, {0.f}, {25.5f} },
         { 1, 4, 2, 12 },
         { 256ul, ngraph::Shape({}), {-12.8f}, {12.7f}, {-12.8f}, {12.7f} },
-        "matMul/1",
+        "matMul_original",
         "U8"
     },
     {
@@ -29,7 +29,7 @@ std::vector<MatMulTransformationTestValues> testValues = {
         { 256ul, ngraph::Shape({}), {0.f}, {25.5f}, {0.f}, {25.5f} },
         { 8, 4, 2, 12 },
         { 256ul, ngraph::Shape({}), {-12.8f}, {12.7f}, {-12.8f}, {12.7f} },
-        "matMul/1",
+        "matMul_original",
         "U8"
     },
     {
@@ -37,7 +37,7 @@ std::vector<MatMulTransformationTestValues> testValues = {
         { 256ul, ngraph::Shape({}), {-12.8f}, {12.7f}, {-12.8f}, {12.7f} },
         { 1, 4, 2, 12 },
         { 256ul, ngraph::Shape({}), {-12.8f}, {12.7f}, {-12.8f}, {12.7f} },
-        "matMul/1",
+        "matMul_original",
         "I8"
     }
 };
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations.cpp
index 828d9f852bf53b..a875a63df11dff 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations.cpp
@@ -18,8 +18,8 @@ const std::vector<InferenceEngine::Precision> netPrecisions = {
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
     LayerTestsUtils::LayerTransformationParamsFactory::createParams(),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8()
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8()
 };
 
 
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat.cpp
index a8ee6f581f5467..a137e3876440eb 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat.cpp
@@ -18,8 +18,8 @@ const std::vector<InferenceEngine::Precision> netPrecisions = {
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
     LayerTestsUtils::LayerTransformationParamsFactory::createParams(),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8()
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8()
 };
 
 INSTANTIATE_TEST_SUITE_P(DISABLED_smoke_LPT, OutputLayersHandlingInTransformationsForConcat,
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp
index 6c0c6ad3fd1bfb..85cda1592f5e4d 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp
@@ -18,8 +18,8 @@ const std::vector<InferenceEngine::Precision> netPrecisions = {
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
     LayerTestsUtils::LayerTransformationParamsFactory::createParams(),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8()
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8()
 };
 
 // TODO: issue #41231: enable previous LPT version tests
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
index c8de61e3fd46e1..7353032f4a0f70 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
@@ -16,9 +16,9 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<ReshapeTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp
index 6170a5c77af6f7..2e70d32f1562fa 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp
@@ -19,10 +19,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
     // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::SplitTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp
index 0e608b55c10fa2..e47ac4498b150a 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp
@@ -18,8 +18,8 @@ namespace {
 
     const std::vector<LayerTransformation::Params> trasformationParamValues = {
         LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8(),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
     };
 
     const std::vector<LayerTestsDefinitions::SqueezeTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/strided_slice_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/strided_slice_transformation.cpp
index f184a6e7658611..f8576676d5eb63 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/strided_slice_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/strided_slice_transformation.cpp
@@ -18,10 +18,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::StridedSliceTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/subtract_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/subtract_transformation.cpp
index e2a82110508ea2..00b980b3736a12 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/subtract_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/subtract_transformation.cpp
@@ -17,9 +17,9 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 INSTANTIATE_TEST_SUITE_P(smoke_LPT, SubtractTransformation,
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/transpose_after_matmul_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/transpose_after_matmul_transformation.cpp
index 4057c6bdd58ebf..0ad5f57dd18339 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/transpose_after_matmul_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/transpose_after_matmul_transformation.cpp
@@ -17,9 +17,9 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<bool> perTensorValues = { true, false };
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp
index eb8e47fe08c36a..2ca39f762f0b91 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp
@@ -18,8 +18,8 @@ namespace {
 
     const std::vector<LayerTransformation::Params> trasformationParamValues = {
         LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8(),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
     };
 
     const std::vector<LayerTestsDefinitions::UnsqueezeTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp
index 55924de077afd4..f8c5529368a7a1 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp
@@ -19,10 +19,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
     // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::VariadicSplitTransformationParam> params{
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp
index 59ba772fcca514..95c87ff52f4ecf 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/clamp_transformation.cpp
@@ -18,10 +18,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    //  LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    //  LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    //  LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::ClampTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp
index 71913315cfb567..731946ef016032 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_different_precision_on_children.cpp
@@ -16,7 +16,7 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
     LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp
index 13b0791ba90b3f..947f601276450a 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_intermediate_transformation.cpp
@@ -17,10 +17,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<bool> transparentIntermediateValues = { true, false };
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp
index 90790ca04b9d98..ba33ff079b4e3c 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp
@@ -17,10 +17,10 @@ const std::vector<ngraph::element::Type> precisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 INSTANTIATE_TEST_SUITE_P(smoke_LPT, ConcatWithNeighborsGraphTransformation,
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp
index 418cf879fb8f06..d3e8fb25a19c6c 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/concat_with_split_transformation.cpp
@@ -16,10 +16,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<ConcatWithSplitTransformationParam> testValues = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp
index b629703ae6dc56..05bb4cd1dcee30 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_qdq_transformation.cpp
@@ -17,7 +17,7 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
     // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp
index 6b76d8a9eaafa2..6d13029f2a248b 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp
@@ -17,7 +17,7 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
     // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp
index 7cb9d409e9e3f5..5d07fdf8d3473a 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_transformation.cpp
@@ -31,7 +31,7 @@ const std::vector<FakeQuantizeTransformationParam> fakeQuantizeOnDataValues = {
         "Pooling", "U8"
     },
     {
-        { 256ul, { 1ul }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
+        { 256ul, { {1ul}, {1ul}, {1ul}, {1ul} }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
         "Pooling", "U8"
     },
     {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
index f7b5f76aa327e1..adfaac572d6705 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/fake_quantize_with_dq_not_optimal_transformation.cpp
@@ -18,7 +18,7 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8(),
     // LayerTestsUtils::LayerTransformationParamsFactory::createParamsU8I8AndI8().setUpdatePrecisions(false),
 };
 
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
index 9a404a11b89832..3543e311e89bdb 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
@@ -16,10 +16,12 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
+const std::vector<bool> addPrecisionPreserved = { true, false };
+
 const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> params = {
     // group convolution, tensor quantization
     {
@@ -102,6 +104,7 @@ INSTANTIATE_TEST_SUITE_P(smoke_LPT, GroupConvolutionTransformation,
         ::testing::ValuesIn(netPrecisions),
         ::testing::Values(CommonTestUtils::DEVICE_GPU),
         ::testing::ValuesIn(trasformationParamValues),
-        ::testing::ValuesIn(params)),
+        ::testing::ValuesIn(params),
+        ::testing::ValuesIn(addPrecisionPreserved)),
     GroupConvolutionTransformation::getTestCaseName);
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
index 4f5977a99a5884..19b294e58929bf 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
@@ -17,8 +17,8 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
 const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/layer_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/layer_transformation.cpp
index fd396fd631d2d6..9d9fc324082daf 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/layer_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/layer_transformation.cpp
@@ -45,132 +45,6 @@ using namespace InferenceEngine::details;
 
 namespace LayerTestsUtils {
 
-ngraph::pass::low_precision::LowPrecisionTransformations LayerTransformation::getLowPrecisionTransformationsNGraph(
-    const ngraph::pass::low_precision::LayerTransformation::Params& params) const {
-    return ngraph::pass::low_precision::LowPrecisionTransformer::getAllTransformations(params);
-        // add<ngraph::pass::low_precision::MatMulTransformation>(
-        //    ngraph::pass::low_precision::LayerTransformation::Params(params).setSupportAsymmetricQuantization(false), "MatMul");
-}
-
-InferenceEngine::CNNNetwork convert(std::shared_ptr<ngraph::Function> function) {
-    auto net1 = InferenceEngine::CNNNetwork(function);
-    InferenceEngine::CNNNetwork clonedNetwork = InferenceEngine::cloneNetwork(net1);
-    if (clonedNetwork.getFunction()) {
-        const auto transformations_callback = [](const std::shared_ptr<const ::ngraph::Node> &node) -> bool {
-            // Reshape->Permute->Reshape pattern in theory can change output rank, so this check is added to be sure
-            // that the following primitives will be handled correctly
-            // DepthToSpace node implementation supports only equal input/output tensors with rank <= 5
-            if (auto dtsOp = std::dynamic_pointer_cast<const ::ngraph::opset3::DepthToSpace>(node)) {
-                return dtsOp->input_value(0).get_shape().size() <= 5lu && dtsOp->input_value(0).get_shape().size() == dtsOp->get_output_shape(0).size();
-            }
-
-            // SpaceToDepth node implementation supports only equal input/output tensors with rank <= 5
-            if (auto stdOp = std::dynamic_pointer_cast<const ::ngraph::opset3::SpaceToDepth>(node)) {
-                return stdOp->input_value(0).get_shape().size() <= 5lu && stdOp->input_value(0).get_shape().size() == stdOp->get_output_shape(0).size();
-            }
-
-            // Reduce node implementation with reduce along features performs better with Reshape->Pooling->Reshape pattern
-            // Reshape->Pooling->Reshape scenario is also more optimal in case when batch > 1 and network precission is FP16
-            if (auto redOp = std::dynamic_pointer_cast<const ::ngraph::opset1::ReduceMean>(node)) {
-                auto reduction_axes = redOp->get_reduction_axes().to_vector();
-                bool reduce_along_f = redOp->get_reduction_axes().size() == 1 && std::count(reduction_axes.begin(), reduction_axes.end(), 1) != 0;
-                bool fp16_batch_not_1 = redOp->get_element_type() == ngraph::element::f16 && redOp->input(0).get_shape()[0] != 1;
-                bool can_use_reduce = !reduce_along_f && !fp16_batch_not_1;
-                return can_use_reduce;
-            }
-            if (auto redOp = std::dynamic_pointer_cast<const ::ngraph::opset1::ReduceMax>(node)) {
-                auto reduction_axes = redOp->get_reduction_axes().to_vector();
-                bool reduce_along_f = redOp->get_reduction_axes().size() == 1 && std::count(reduction_axes.begin(), reduction_axes.end(), 1) != 0;
-                bool fp16_batch_not_1 = redOp->get_element_type() == ngraph::element::f16 && redOp->input(0).get_shape()[0] != 1;
-                bool can_use_reduce = !reduce_along_f && !fp16_batch_not_1;
-                return can_use_reduce;
-            }
-            if (auto redOp = std::dynamic_pointer_cast<const ::ngraph::opset1::ReduceSum>(node)) {
-                auto reduction_axes = redOp->get_reduction_axes().to_vector();
-                bool reduce_along_f = redOp->get_reduction_axes().size() == 1 && std::count(reduction_axes.begin(), reduction_axes.end(), 1) != 0;
-                bool fp16_batch_not_1 = redOp->get_element_type() == ngraph::element::f16 && redOp->input(0).get_shape()[0] != 1;
-                bool can_use_reduce = !reduce_along_f && !fp16_batch_not_1;
-                return can_use_reduce;
-            }
-
-            if (auto add_op = std::dynamic_pointer_cast<const ngraph::opset1::Add>(node)) {
-                return ngraph::is_type<ngraph::opset1::Convolution>(add_op->get_input_node_shared_ptr(0)) ||
-                    ngraph::is_type<ngraph::opset1::GroupConvolution>(add_op->get_input_node_shared_ptr(0)) ||
-                    ngraph::is_type<ngraph::opset1::MatMul>(add_op->get_input_node_shared_ptr(0));
-            }
-
-            return std::dynamic_pointer_cast<const ::ngraph::opset2::Gelu>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset3::ShuffleChannels>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset2::BatchToSpace>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset2::SpaceToBatch>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset3::ExtractImagePatches>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset4::HSwish>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset4::ReduceL1>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset4::ReduceL2>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset4::SoftPlus>(node);
-        };
-        auto nGraphFunc = clonedNetwork.getFunction();
-
-        // Note: instead of running all Conversion Transformations you can make up your own transformation pipeline
-        ngraph::pass::Manager manager;
-        manager.register_pass<ngraph::pass::InitNodeInfo>();
-        // WA: ConvertPriorBox must be executed before the 1st ConstantFolding pass
-        manager.register_pass<ngraph::pass::ConvertPriorBox>();
-        manager.register_pass<ngraph::pass::CommonOptimizations>();
-        manager.register_pass<ngraph::pass::ConvertOpSet3ToOpSet2>();
-        manager.register_pass<ngraph::pass::ConvertOpSet2ToOpSet1>();
-        NGRAPH_SUPPRESS_DEPRECATED_START
-        manager.set_callback(transformations_callback);
-        NGRAPH_SUPPRESS_DEPRECATED_END
-        manager.run_passes(nGraphFunc);
-    }
-
-    return clonedNetwork;
-}
-
-std::shared_ptr<ngraph::Function> LayerTransformation::transformNGraph(
-    const ngraph::pass::low_precision::LayerTransformation::Params& params,
-    const ngraph::pass::low_precision::LowPrecisionTransformations& transformations) {
-    InferenceEngine::CNNNetwork clonedNetwork = convert(function);
-
-    InferenceEngine::NetPass::ConvertPrecision(clonedNetwork, InferenceEngine::Precision::FP16, InferenceEngine::Precision::FP32);
-
-    auto nGraphFunc = clonedNetwork.getFunction();
-
-    ngraph::pass::low_precision::LowPrecisionTransformer transformer(transformations);
-    transformer.transform(nGraphFunc);
-
-    const auto transformations_callback = [](const std::shared_ptr<const ::ngraph::Node> &node) -> bool {
-        // DepthToSpace node implementation supports only equal input/output tensors with rank <= 5
-        if (auto dtsOp = std::dynamic_pointer_cast<const ::ngraph::opset3::DepthToSpace>(node)) {
-            return dtsOp->input_value(0).get_shape().size() <= 5lu && dtsOp->input_value(0).get_shape().size() == dtsOp->get_output_shape(0).size();
-        }
-
-        // SpaceToDepth node implementation supports only equal input/output tensors with rank <= 5
-        if (auto stdOp = std::dynamic_pointer_cast<const ::ngraph::opset3::SpaceToDepth>(node)) {
-            return stdOp->input_value(0).get_shape().size() <= 5lu && stdOp->input_value(0).get_shape().size() == stdOp->get_output_shape(0).size();
-        }
-
-        if (auto fc_op = std::dynamic_pointer_cast<const ngraph::op::FullyConnected>(node)) {
-            return fc_op->input_value(0).get_shape().size() == 3ul;
-        }
-
-        return std::dynamic_pointer_cast<const ::ngraph::opset2::Gelu>(node) ||
-            std::dynamic_pointer_cast<const ::ngraph::opset2::BatchToSpace>(node) ||
-            std::dynamic_pointer_cast<const ::ngraph::opset2::SpaceToBatch>(node) ||
-            std::dynamic_pointer_cast<const ::ngraph::opset3::ShuffleChannels>(node);
-    };
-
-    ngraph::pass::Manager manager;
-    manager.register_pass<ngraph::pass::ConvertOpSet1ToLegacy>();
-    NGRAPH_SUPPRESS_DEPRECATED_START
-    manager.set_callback(transformations_callback);
-    NGRAPH_SUPPRESS_DEPRECATED_END
-    manager.run_passes(nGraphFunc);
-
-    return clonedNetwork.getFunction();
-}
-
 InferenceEngine::Precision LayerTransformation::getDeviceInternalPrecision(const InferenceEngine::Precision precision) {
     if (precision == InferenceEngine::Precision::FP16) {
         return InferenceEngine::Precision::FP32;
@@ -180,11 +54,7 @@ InferenceEngine::Precision LayerTransformation::getDeviceInternalPrecision(const
 }
 
 ngraph::pass::low_precision::LayerTransformation::Params LayerTransformationParamsNGraphFactory::createParams() {
-    return ngraph::pass::low_precision::LayerTransformation::Params(
-        true,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true);
+    return ngraph::pass::low_precision::LayerTransformation::Params();
 }
 
 }  // namespace LayerTestsUtils
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization_transformation.cpp
index 9ad74ec60e05f1..d5f47e0d1921ce 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization_transformation.cpp
@@ -16,7 +16,7 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
     // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
 };
 
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
index 5dc8a2124122d1..b74f1d2769e263 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
@@ -16,9 +16,9 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<ReshapeTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp
index 5e0e56c0306458..c0f630736fbf2b 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/split_transformation.cpp
@@ -19,10 +19,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::SplitTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp
index 586a1ac9695b18..fb198553c5bcca 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/squeeze_transformation.cpp
@@ -19,8 +19,8 @@ namespace {
 
     const std::vector<LayerTransformation::Params> trasformationParamValues = {
         LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8(),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
     };
 
     const std::vector<LayerTestsDefinitions::SqueezeTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp
index 5bb19861240c52..17e538e8faa108 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/unsqueeze_transformation.cpp
@@ -19,8 +19,8 @@ namespace {
 
     const std::vector<LayerTransformation::Params> trasformationParamValues = {
         LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8(),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
-        LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(false),
+        // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8().setUpdatePrecisions(true),
     };
 
     const std::vector<LayerTestsDefinitions::UnsqueezeTransformationParam> params = {
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp
index 3cdded43eb6062..4570846045b270 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/variadic_split_transformation.cpp
@@ -19,10 +19,10 @@ const std::vector<ngraph::element::Type> netPrecisions = {
 };
 
 const std::vector<ngraph::pass::low_precision::LayerTransformation::Params> trasformationParamValues = {
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(true),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
-    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
+    LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams().setUpdatePrecisions(false),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsI8I8(),
+    // LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8()
 };
 
 const std::vector<LayerTestsDefinitions::VariadicSplitTransformationParam> params{
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/add_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/add_transformation.hpp
index 37151d0b1bae86..1611191bcbfc62 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/add_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/add_transformation.hpp
@@ -35,9 +35,6 @@ class AddTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/clamp_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/clamp_transformation.hpp
index e11672d4973190..f87f2e32fc278d 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/clamp_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/clamp_transformation.hpp
@@ -32,7 +32,6 @@ class ClampTransformation :
     static std::string getTestCaseName(testing::TestParamInfo<ClampTransformationParams> obj);
 protected:
     void SetUp() override;
-private:
-    void validate();
 };
+
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_transformation.hpp
index 11aeb6701dd9f5..6364994019f398 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_transformation.hpp
@@ -33,9 +33,6 @@ class ConcatTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_different_precision_on_children.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_different_precision_on_children.hpp
index 385ba9216df8c4..a92974bed4c179 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_different_precision_on_children.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_different_precision_on_children.hpp
@@ -35,9 +35,6 @@ class ConcatWithDifferentChildrenTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_intermediate_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_intermediate_transformation.hpp
index a0881a3950a9b6..11e7a1d145217f 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_intermediate_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_intermediate_transformation.hpp
@@ -25,13 +25,10 @@ class ConcatWithIntermediateTransformation :
     public LayerTestsUtils::LayerTransformation {
 public:
     static std::string getTestCaseName(testing::TestParamInfo<ConcatWithIntermediateTransformationParams> obj);
-    InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo &info) const override;
+    InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo& info) const override;
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_neighbors_graph_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_neighbors_graph_transformation.hpp
index c77dd2cb490701..c419cf6b283901 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_neighbors_graph_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/concat_with_neighbors_graph_transformation.hpp
@@ -22,13 +22,10 @@ class ConcatWithNeighborsGraphTransformation :
     public LayerTestsUtils::LayerTransformation {
 public:
     static std::string getTestCaseName(testing::TestParamInfo<ConcatNeighboringGraphTransformationParams> obj);
-    InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo &info) const override;
+    InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo& info) const override;
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_transformation.hpp
index adcabc8734ab3b..6b3c1f641506d3 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_transformation.hpp
@@ -41,9 +41,6 @@ class ConvolutionTransformation :
     void SetUp() override;
 
     void Run() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_with_incorrect_weights.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_with_incorrect_weights.hpp
index 1bc8197ca20e73..95eddf1d2b2ac2 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_with_incorrect_weights.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/convolution_with_incorrect_weights.hpp
@@ -36,9 +36,6 @@ class ConvolutionWIthIncorrectWeightsTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/depth_to_space_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/depth_to_space_transformation.hpp
index 8b385dca96e52d..fe0393ccc31e20 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/depth_to_space_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/depth_to_space_transformation.hpp
@@ -26,9 +26,6 @@ class DepthToSpaceTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_avg_pool_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_avg_pool_transformation.hpp
index ed182705f2dedd..d821a5900c9bd8 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_avg_pool_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_avg_pool_transformation.hpp
@@ -27,9 +27,6 @@ class FakeQuantizeAndAvgPoolTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_max_pool_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_max_pool_transformation.hpp
index 29a85a20d26f43..db5a4c7a6d5800 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_max_pool_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_max_pool_transformation.hpp
@@ -27,9 +27,6 @@ class FakeQuantizeAndMaxPoolTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.hpp
index 03a75530d23167..8268cb3fcdd380 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.hpp
@@ -36,9 +36,6 @@ class FakeQuantizeAndTwoOutputBranchesWithConvolutionTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_precision_selection_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_precision_selection_transformation.hpp
index 8f0da855be7a7f..ba3032e3b5f84c 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_precision_selection_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_precision_selection_transformation.hpp
@@ -63,9 +63,6 @@ class FakeQuantizePrecisionSelectionTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_transformation.hpp
index c43672edd57bd6..aa372252ca121f 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fake_quantize_transformation.hpp
@@ -12,7 +12,7 @@
 namespace LayerTestsDefinitions {
 class FakeQuantizeTransformationParam {
 public:
-    ngraph::builder::subgraph::FakeQuantizeOnData fakequantize;
+    ngraph::builder::subgraph::FakeQuantizeOnDataWithConstant fakequantize;
 
     std::string layerName;
     std::string expectedKernelType;
@@ -33,7 +33,6 @@ class FakeQuantizeTransformation :
 
 protected:
     void SetUp() override;
-
     void Run() override;
 };
 
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fully_connected_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fully_connected_transformation.hpp
index 8e273f825ded99..6613b6db436d9b 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fully_connected_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fully_connected_transformation.hpp
@@ -33,9 +33,6 @@ class FullyConnectedTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_convert_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_convert_transformation.hpp
index 9e87a6ecb099d1..1113c87b365622 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_convert_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_convert_transformation.hpp
@@ -30,9 +30,6 @@ class FuseConvertTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.hpp
index 0d5036bb8e71a9..82a0e8fb8b2fff 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.hpp
@@ -26,9 +26,6 @@ class FuseFakeQuantizeAndScaleShiftTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_transformation.hpp
index 0ef83d52947887..f4cd6a924a2dc0 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_fake_quantize_transformation.hpp
@@ -43,9 +43,6 @@ class FuseFakeQuantizeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.hpp
index d1ce8a01e5bfe7..07705f8d336ad9 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.hpp
@@ -39,9 +39,6 @@ class FuseMultiplyToFakeQuantizeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.hpp
index 6c88512ea9bd65..64cfa3645faab2 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.hpp
@@ -39,9 +39,6 @@ class FuseSubtractToFakeQuantizeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/gemm_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/gemm_transformation.hpp
index 0e54077bb8335b..16d1747b5b9629 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/gemm_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/gemm_transformation.hpp
@@ -26,9 +26,6 @@ class GemmTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/group_convolution_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/group_convolution_transformation.hpp
index 506763418d86e7..ed63c92a9fc22a 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/group_convolution_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/group_convolution_transformation.hpp
@@ -29,7 +29,8 @@ typedef std::tuple<
     ngraph::element::Type,
     std::string,
     ngraph::pass::low_precision::LayerTransformation::Params,
-    GroupConvolutionTransformationParam
+    GroupConvolutionTransformationParam,
+    bool // add precision preserved operation
 > GroupConvolutionTransformationParams;
 
 class GroupConvolutionTransformation :
@@ -42,9 +43,6 @@ class GroupConvolutionTransformation :
     void SetUp() override;
 
     void Run() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/interpolate_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/interpolate_transformation.hpp
index 83311f469296ff..c702d02645180d 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/interpolate_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/interpolate_transformation.hpp
@@ -49,9 +49,6 @@ class InterpolateTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_transformation.hpp
index 37f8d88151bca4..cc4231e6a14928 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_transformation.hpp
@@ -39,9 +39,6 @@ class MatMulTransformation :
 protected:
     void SetUp() override;
     void Run() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_constant_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_constant_transformation.hpp
index 6c058727d69e92..7840e282313bf8 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_constant_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_constant_transformation.hpp
@@ -46,9 +46,6 @@ class MatMulWithConstantTransformation :
     void SetUp() override;
 
     void Run() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.hpp
index ddb24903d3f513..54d800a7e27e85 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.hpp
@@ -33,9 +33,6 @@ class MatMulWithOptimizedConstantFakeQuantizeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_transformation.hpp
index db868f7438e8e5..f9a28f2ee2117f 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_transformation.hpp
@@ -36,9 +36,6 @@ class MultiplyTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mvn_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mvn_transformation.hpp
index ac01efe9895124..dc206a5095b159 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mvn_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/mvn_transformation.hpp
@@ -29,9 +29,6 @@ class MVNTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/normalize_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/normalize_transformation.hpp
index fefecb17becb63..2efe1c850a8f0e 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/normalize_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/normalize_transformation.hpp
@@ -28,9 +28,6 @@ class NormalizeL2Transformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/prelu_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/prelu_transformation.hpp
index 493edfe3182b23..096cd314f1dda2 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/prelu_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/prelu_transformation.hpp
@@ -32,9 +32,6 @@ class PReluTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/relu_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/relu_transformation.hpp
index 5155fd8f32b635..cf7b2e633c7808 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/relu_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/relu_transformation.hpp
@@ -32,9 +32,6 @@ class ReluTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/reshape_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/reshape_transformation.hpp
index 912066a6e359b8..29175cf77ee0ab 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/reshape_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/reshape_transformation.hpp
@@ -35,9 +35,6 @@ class ReshapeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/split_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/split_transformation.hpp
index adcae0a25d8034..a7c3892a08220d 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/split_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/split_transformation.hpp
@@ -31,8 +31,6 @@ class SplitTransformation :
     InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo& info) const override;
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
+
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/squeeze_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/squeeze_transformation.hpp
index 4ddb1178f1e81f..b93f26d06458dd 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/squeeze_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/squeeze_transformation.hpp
@@ -37,9 +37,6 @@ class SqueezeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/strided_slice_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/strided_slice_transformation.hpp
index c2e769e1b04467..d64a9e0935be26 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/strided_slice_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/strided_slice_transformation.hpp
@@ -38,8 +38,6 @@ class StridedSliceTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
+
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.hpp
index 19fa50096be211..da6eb048d6e466 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.hpp
@@ -31,9 +31,6 @@ class SubtractMultiplyToMultiplyAddTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_after_matmul_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_after_matmul_transformation.hpp
index f2258619b7fe50..7b15ce69bced52 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_after_matmul_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_after_matmul_transformation.hpp
@@ -27,9 +27,6 @@ class TransposeAfterMatMulTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_transformation.hpp
index 6e26c6d6e7b826..1f8679b5228af9 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/transpose_transformation.hpp
@@ -34,9 +34,6 @@ class TransposeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/unsqueeze_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/unsqueeze_transformation.hpp
index 3abee33a5b1205..91c396a1fce034 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/unsqueeze_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/unsqueeze_transformation.hpp
@@ -35,9 +35,6 @@ class UnsqueezeTransformation :
 
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/variadic_split_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/variadic_split_transformation.hpp
index 5f4665940fdeae..69b2a5247e8552 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/variadic_split_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/variadic_split_transformation.hpp
@@ -31,8 +31,6 @@ class VariadicSplitTransformation :
     InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo& info) const override;
 protected:
     void SetUp() override;
-
-private:
-    void validate();
 };
+
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/add_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/add_transformation.cpp
index 2448bf7984f557..3d0bd61fe9fd9f 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/add_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/add_transformation.cpp
@@ -24,13 +24,17 @@ std::string AddTransformation::getTestCaseName(testing::TestParamInfo< AddTransf
     AddTestValues param;
     std::tie(netPrecision, inputShapes, targetDevice, param) = obj.param;
 
-    if (!param.precisionOnActivations.empty()) {
-        params.precisionsOnActivations = param.precisionOnActivations;
-    }
-
     std::ostringstream result;
     result << getTestCaseNameByParams(netPrecision, inputShapes, targetDevice, params) <<
         (param.broadcast ? "_broadcast" : "");
+    for (const auto& elem : param.precisionOnActivations) {
+        result << "_" << elem << "_";
+    }
+    result << "expected_precisions_";
+    for (const auto& elem : param.expectedPrecisions) {
+        result << "_" << elem << "_";
+    }
+
     if (!param.fakeQuantize1.empty()) {
         result << "_on_branch1_" <<
             param.fakeQuantize1.inputLowValues[0] << "_" <<
@@ -59,25 +63,6 @@ void AddTransformation::SetUp() {
         param.fakeQuantize1, param.fakeQuantize2);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void AddTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    AddTestValues param;
-    std::tie(precision, inputShape, targetDevice, param) = this->GetParam();
-
-    const auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    if ((!param.fakeQuantize1.empty()) && (!param.fakeQuantize2.empty())) {
-        const auto scaleShift = output->get_input_node_shared_ptr(0);
-        const std::string typeName = scaleShift->get_type_name();
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
 }
 
 TEST_P(AddTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/clamp_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/clamp_transformation.cpp
index d23da32cc56045..39a89073c90c76 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/clamp_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/clamp_transformation.cpp
@@ -41,40 +41,6 @@ void ClampTransformation::SetUp() {
         param.fakeQuantize,
         param.clampLowConst,
         param.clampHighConst);
-
-    validate();
-}
-
-void ClampTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ClampTransformationParam param;
-    std::tie(netPrecision, inputShape, targetDevice, params, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    EXPECT_EQ(1ul, transformed->get_output_size());
-    std::shared_ptr<ngraph::Node> output = transformed->get_output_op(0);
-
-    std::shared_ptr<ngraph::Node> parent = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(parent == nullptr);
-    const std::string typeName = parent->get_type_name();
-    if (!param.dequantizationAfter.empty()) {
-        EXPECT_EQ("ScaleShiftIE", typeName);
-        EXPECT_EQ(3, parent->get_input_size());
-
-        const auto expectedScale = param.dequantizationAfter.multiply.values;
-        const auto actualScale =
-            ngraph::as_type_ptr<ngraph::opset1::Constant>(parent->get_input_node_shared_ptr(1))->cast_vector<float>();
-        EXPECT_EQ(expectedScale.size(), actualScale.size());
-
-        const auto expectedShift = param.dequantizationAfter.subtract.values;
-        const auto actualShift =
-            ngraph::as_type_ptr<ngraph::opset1::Constant>(parent->get_input_node_shared_ptr(2))->cast_vector<float>();
-        EXPECT_EQ(expectedShift.size(), actualShift.size());
-    }
 }
 
 TEST_P(ClampTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_transformation.cpp
index a2e6f85c7050ac..74a140d1c51264 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_transformation.cpp
@@ -37,13 +37,8 @@ InferenceEngine::Blob::Ptr ConcatTransformation::GenerateInput(const InferenceEn
     ConcatTransformationTestValues testValues;
     std::tie(netPrecision, inputShape, targetDevice, testValues) = this->GetParam();
 
-    const auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-
     const float k = (info.name() == "input1") ? 1.f : (info.name() == "input2" ? 2.f : 3.f);
-    return LayerTransformation::GenerateInput(
-        params.precisionsOnActivations[0],
-        info.getTensorDesc(),
-        k);
+    return LayerTransformation::GenerateInput(ngraph::element::u8, info.getTensorDesc(), k);
 }
 
 void ConcatTransformation::SetUp() {
@@ -57,30 +52,6 @@ void ConcatTransformation::SetUp() {
         inputShape,
         testValues.fqOnData1,
         testValues.fqOnData2);
-
-    validate();
-}
-
-void ConcatTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShapes;
-    std::string targetDevice;
-    ConcatTransformationTestValues testValues;
-    std::tie(precision, inputShapes, targetDevice, testValues) = GetParam();
-
-    const auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto previousLayer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = previousLayer->get_type_name();
-
-    if (testValues.fqOnData1.quantizationLevel != 256ul ||
-        testValues.fqOnData2.quantizationLevel != 256ul) {
-        ASSERT_EQ("Concat", typeName);
-    } else {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
 }
 
 TEST_P(ConcatTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_different_precision_on_children.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_different_precision_on_children.cpp
index c74d9740871a9e..6334b3d644f70a 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_different_precision_on_children.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_different_precision_on_children.cpp
@@ -46,7 +46,7 @@ InferenceEngine::Blob::Ptr ConcatWithDifferentChildrenTransformation::GenerateIn
     std::tie(netPrecision, inputShapes, targetDevice, param, params, multiChannel) = this->GetParam();
 
     const float k = (info.name() == "input1") ? 1.f : (info.name() == "input2" ? 2.f : 3.f);
-    return LayerTransformation::GenerateInput(params.precisionsOnActivations[0], info.getTensorDesc(), k);
+    return LayerTransformation::GenerateInput(ngraph::element::u8, info.getTensorDesc(), k);
 }
 
 void ConcatWithDifferentChildrenTransformation::SetUp() {
@@ -59,28 +59,6 @@ void ConcatWithDifferentChildrenTransformation::SetUp() {
 
     function = ngraph::builder::subgraph::ConcatFunction::getOriginalWithDifferentPrecisionOnChildren(
         netPrecision, inputShapes, param.fqOnData1, param.fqOnData2);
-
-    validate();
-}
-
-void ConcatWithDifferentChildrenTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShapes;
-    std::string targetDevice;
-    ConcatWithDifferentChildrenTransformationParam param;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    bool multiChannel;
-    std::tie(netPrecision, inputShapes, targetDevice, param, params, multiChannel) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    ASSERT_EQ(2ul, transformed->get_output_size());
-    for (size_t i = 0; i < 2ul; ++i) {
-        const auto output = transformed->get_output_op(0);
-        const auto scaleShift = output->get_input_node_shared_ptr(0);
-        const std::string typeName = scaleShift->get_type_name();
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
 }
 
 TEST_P(ConcatWithDifferentChildrenTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_intermediate_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_intermediate_transformation.cpp
index 12f3bf17565b59..9d1af48a6ee47e 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_intermediate_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_intermediate_transformation.cpp
@@ -47,7 +47,7 @@ InferenceEngine::Blob::Ptr ConcatWithIntermediateTransformation::GenerateInput(c
     std::tie(netPrecision, inputShape, targetDevice, trasformationParams, transparentIntermediate, multichannel) = this->GetParam();
 
     const float k = (info.name() == "input1") ? 1.f : (info.name() == "input2" ? 2.f : 3.f);
-    return LayerTransformation::GenerateInput(trasformationParams.precisionsOnActivations[0], info.getTensorDesc(), k);
+    return LayerTransformation::GenerateInput(ngraph::element::u8, info.getTensorDesc(), k);
 }
 
 /*
@@ -72,35 +72,6 @@ void ConcatWithIntermediateTransformation::SetUp() {
         transparentIntermediate,
         { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {2.55f} },
         { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {2.55f / 2.f} });
-
-    validate();
-}
-
-void ConcatWithIntermediateTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    bool transparentIntermediate;
-    bool multichannel;
-    std::tie(netPrecision, inputShape, targetDevice, params, transparentIntermediate, multichannel) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    ASSERT_EQ(2ul, transformed->get_output_size());
-
-    const auto concatOutput = transformed->get_output_op(0);
-    const auto scaleShiftOrConcat = concatOutput->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShiftOrConcat->get_type_name();
-    if (transparentIntermediate) {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    } else {
-        ASSERT_EQ("Concat", typeName);
-    }
-
-    const auto convOutput = transformed->get_output_op(1);
-    const auto convolution = convOutput->get_input_node_shared_ptr(0);
-    const std::string convName = convolution->get_type_name();
-    ASSERT_EQ("ConvolutionIE", convName);
 }
 
 TEST_P(ConcatWithIntermediateTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp
index 2c7c1a100fa136..84adcc30c34489 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_neighbors_graph_transformation.cpp
@@ -37,7 +37,7 @@ InferenceEngine::Blob::Ptr ConcatWithNeighborsGraphTransformation::GenerateInput
         IE_THROW() << "unexpected input name " << info.name();
     }
     const float k = (info.name() == "input1") ? 1.f : (info.name() == "input2" ? 2.f : 3.f);
-    return LayerTransformation::GenerateInput(params.precisionsOnActivations[0], info.getTensorDesc(), k);
+    return LayerTransformation::GenerateInput(ngraph::element::u8, info.getTensorDesc(), k);
 }
 
 void ConcatWithNeighborsGraphTransformation::SetUp() {
@@ -55,26 +55,6 @@ void ConcatWithNeighborsGraphTransformation::SetUp() {
         { 256ul, ngraph::Shape({}), {0.f}, {2.55f}, {0.f}, {2.55f / 3.f} },
         "concat",
         "");
-
-    validate();
-}
-
-void ConcatWithNeighborsGraphTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    std::tie(netPrecision, inputShape, targetDevice, params) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    ASSERT_EQ(2ul, transformed->get_output_size());
-
-    for (size_t i = 0; i < 2ul; ++i) {
-        const auto concatOutput = transformed->get_output_op(0);
-        const auto scaleShift = concatOutput->get_input_node_shared_ptr(0);
-        const std::string typeName = scaleShift->get_type_name();
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
 }
 
 TEST_P(ConcatWithNeighborsGraphTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_split_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_split_transformation.cpp
index 728656b4e2845a..c8f7d43422e11a 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/concat_with_split_transformation.cpp
@@ -41,7 +41,7 @@ InferenceEngine::Blob::Ptr ConcatWithSplitTransformation::GenerateInput(const In
     std::tie(netPrecision, inputShapes, targetDevice, param, params) = this->GetParam();
 
     const float k = (info.name() == "input1") ? 1.f : (info.name() == "input2" ? 2.f : 3.f);
-    return LayerTransformation::GenerateInput(params.precisionsOnActivations[0], info.getTensorDesc(), k);
+    return LayerTransformation::GenerateInput(ngraph::element::u8, info.getTensorDesc(), k);
 }
 
 /*
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_transformation.cpp
index 221a7cd8a2a674..c88acbe38abfd7 100755
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_transformation.cpp
@@ -50,8 +50,6 @@ void ConvolutionTransformation::SetUp() {
         // TODO: pass from test parameters
         param.fakeQuantizeOnData,
         param.fakeQuantizeOnWeights);
-
-    validate();
 }
 
 void ConvolutionTransformation::Run() {
@@ -66,34 +64,6 @@ void ConvolutionTransformation::Run() {
     EXPECT_EQ(actualPrecision, expectedPrecision);
 }
 
-void ConvolutionTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ConvolutionTransformationParam param;
-    std::tie(netPrecision, inputShape, targetDevice, params, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto parent = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(parent == nullptr);
-
-    const std::string typeName = parent->get_type_name();
-    const auto isQuantizationSupported = [](const ngraph::builder::subgraph::FakeQuantizeOnData& fq) {
-        return (fq.quantizationLevel == 255) || (fq.quantizationLevel == 256);
-    };
-
-    if (param.fakeQuantizeOnData.empty() || (!isQuantizationSupported(param.fakeQuantizeOnData)) ||
-        param.fakeQuantizeOnWeights.empty() || (!isQuantizationSupported(param.fakeQuantizeOnWeights))) {
-        ASSERT_EQ("ConvolutionIE", typeName);
-    } else {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
-}
-
 TEST_P(ConvolutionTransformation, CompareWithRefImpl) {
     Run();
 };
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_with_incorrect_weights.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_with_incorrect_weights.cpp
index 89d05397da3265..ae73d952ba3413 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_with_incorrect_weights.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/convolution_with_incorrect_weights.cpp
@@ -51,31 +51,6 @@ void ConvolutionWIthIncorrectWeightsTransformation::SetUp() {
         param.fakeQuantizeOnWeights,
         param.fakeQuantizeOnData,
         param.isCorrect);
-
-    validate();
-}
-
-void ConvolutionWIthIncorrectWeightsTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ConvolutionWIthIncorrectWeightsParam param;
-    std::tie(netPrecision, inputShape, targetDevice, params, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto parent = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(parent == nullptr);
-
-    const std::string typeName = parent->get_type_name();
-    if (param.isCorrect) {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    } else {
-        ASSERT_EQ("ConvolutionIE", typeName);
-    }
 }
 
 TEST_P(ConvolutionWIthIncorrectWeightsTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/depth_to_space_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/depth_to_space_transformation.cpp
index 28df2617b6a712..e81263fa958e6c 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/depth_to_space_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/depth_to_space_transformation.cpp
@@ -57,7 +57,6 @@ void DepthToSpaceTransformation::SetUp() {
     ngraph::PartialShape inputShape;
     DepthToSpace::DepthToSpaceMode mode;
     size_t blockSize;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
     std::tie(precision, inputShape, targetDevice, mode, blockSize) = this->GetParam();
 
     if (inputShape.rank().is_dynamic() || inputShape.rank().get_length() != 4) {
@@ -65,28 +64,6 @@ void DepthToSpaceTransformation::SetUp() {
     }
 
     function = ngraph::builder::subgraph::DepthToSpaceFunction::getOriginal(precision, inputShape, mode, blockSize);
-
-    validate();
-}
-
-void DepthToSpaceTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    DepthToSpace::DepthToSpaceMode mode;
-    size_t blockSize;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    std::tie(precision, inputShape, targetDevice, mode, blockSize) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(scaleShift == nullptr);
-
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(DepthToSpaceTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_avg_pool_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_avg_pool_transformation.cpp
index de0e57153009d8..53c444e8aa7393 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_avg_pool_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_avg_pool_transformation.cpp
@@ -41,26 +41,6 @@ void FakeQuantizeAndAvgPoolTransformation::SetUp() {
         fakeQuantize);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FakeQuantizeAndAvgPoolTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShapes;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize;
-    std::tie(precision, inputShapes, targetDevice, params, fakeQuantize) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(scaleShift == nullptr);
-
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(FakeQuantizeAndAvgPoolTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_max_pool_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_max_pool_transformation.cpp
index f71a4a6bba91f5..399045c2e90a64 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_max_pool_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_max_pool_transformation.cpp
@@ -40,26 +40,6 @@ void FakeQuantizeAndMaxPoolTransformation::SetUp() {
         fakeQuantize);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FakeQuantizeAndMaxPoolTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShapes;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantize;
-    std::tie(precision, inputShapes, targetDevice, params, fakeQuantize) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(scaleShift == nullptr);
-
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(FakeQuantizeAndMaxPoolTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp
index 1ee2255a1ad6ba..81f5bc6f0e35e3 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_and_two_output_branches_with_convolution.cpp
@@ -49,33 +49,6 @@ void FakeQuantizeAndTwoOutputBranchesWithConvolutionTransformation::SetUp() {
         testValues.fqOnData,
         testValues.fqOnWeights1,
         testValues.fqOnWeights2);
-
-    validate();
-}
-
-void FakeQuantizeAndTwoOutputBranchesWithConvolutionTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShapes;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    FakeQuantizeAndTwoOutputBranchesWithConvolution testValues;
-    std::tie(precision, inputShapes, targetDevice, params, testValues) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto concat = output->get_input_node_shared_ptr(0);
-
-    const std::string typeName = concat->get_type_name();
-    ASSERT_EQ("Concat", typeName);
-
-    EXPECT_EQ(2ul, concat->get_input_size());
-    for (size_t i = 0; i < 2; ++i) {
-        const auto scaleShift = concat->get_input_node_shared_ptr(i);
-        const std::string scaleShiftName = scaleShift->get_type_name();
-        ASSERT_EQ("ScaleShiftIE", scaleShiftName);
-    }
 }
 
 TEST_P(FakeQuantizeAndTwoOutputBranchesWithConvolutionTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_precision_selection_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_precision_selection_transformation.cpp
index 321da6f49bbf3a..95c2317f26deda 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_precision_selection_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_precision_selection_transformation.cpp
@@ -45,39 +45,6 @@ void FakeQuantizePrecisionSelectionTransformation::SetUp() {
         });
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FakeQuantizePrecisionSelectionTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShapes;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    FakeQuantizePrecisionSelectionTransformationTestValues param;
-    std::tie(precision, inputShapes, targetDevice, params, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto concat = output->get_input_node_shared_ptr(0);
-
-    const std::string typeName = concat->get_type_name();
-    ASSERT_EQ("Concat", typeName);
-
-    EXPECT_EQ(2ul, concat->get_input_size());
-
-    const auto scaleShiftOrConv = concat->get_input_node_shared_ptr(0);
-    const std::string scaleShiftOrConvName = scaleShiftOrConv->get_type_name();
-    if (param.operationBeforeLimitedOperationIsPrecisionTransparent) {
-        ASSERT_EQ("ScaleShiftIE", scaleShiftOrConvName);
-    } else {
-        ASSERT_EQ("ConvolutionIE", scaleShiftOrConvName);
-    }
-
-    const auto scaleShift = concat->get_input_node_shared_ptr(1);
-    const std::string scaleShiftName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", scaleShiftName);
 }
 
 TEST_P(FakeQuantizePrecisionSelectionTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_transformation.cpp
index 25d5f3760dd23d..3dd9bc7552911a 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fake_quantize_transformation.cpp
@@ -37,10 +37,14 @@ void FakeQuantizeTransformation::SetUp() {
     FakeQuantizeTransformationParam testParams;
     std::tie(netPrecision, inputShape, targetDevice, params, testParams) = this->GetParam();
 
-    function = ngraph::builder::subgraph::FakeQuantizeFunction::getOriginalWithMaxPool(
+    function = ngraph::builder::subgraph::FakeQuantizeFunction::getOriginal(
+        params,
         netPrecision,
         inputShape,
-        testParams.fakequantize);
+        testParams.fakequantize,
+        true);
+
+    ngraph::pass::InitNodeInfo().run_on_function(function);
 }
 
 void FakeQuantizeTransformation::Run() {
@@ -52,6 +56,7 @@ void FakeQuantizeTransformation::Run() {
     if (expectedPrecision == "FP32" && std::get<0>(GetParam()) == ngraph::element::f16) {
         expectedPrecision = "FP16";
     }
+
     EXPECT_EQ(actualPrecision, expectedPrecision);
 }
 
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fully_connected_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fully_connected_transformation.cpp
index 7c2d26737cc785..3392a086dcbcd4 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fully_connected_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fully_connected_transformation.cpp
@@ -50,23 +50,6 @@ void FullyConnectedTransformation::SetUp() {
         shapes.inputB,
         shapes.transposeA,
         shapes.transposeB);
-
-    validate();
-}
-
-void FullyConnectedTransformation::validate() {
-    ngraph::element::Type precision;
-    MatMulShapes shapes;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    std::tie(precision, shapes, targetDevice, params) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(FullyConnectedTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_convert_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_convert_transformation.cpp
index 0682f617127f00..0f9f0135665601 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_convert_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_convert_transformation.cpp
@@ -39,7 +39,6 @@ std::string FuseConvertTransformation::getTestCaseName(testing::TestParamInfo<Fu
 void FuseConvertTransformation::SetUp() {
     ngraph::PartialShape shape;
     ngraph::element::Type precision;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
     ngraph::builder::subgraph::DequantizationOperations deqOperations;
     bool constInput;
     std::tie(precision, shape, targetDevice, deqOperations, constInput) = this->GetParam();
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.cpp
index 879e34a8f27e4d..46fb7b6ae4a315 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_and_scale_shift_transformation.cpp
@@ -40,25 +40,6 @@ void FuseFakeQuantizeAndScaleShiftTransformation::SetUp() {
         fakeQuantizeOnData);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FuseFakeQuantizeAndScaleShiftTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ngraph::builder::subgraph::FakeQuantizeOnData fakeQuantizeOnData;
-    std::tie(netPrecision, inputShape, targetDevice, params, fakeQuantizeOnData) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-    EXPECT_EQ(1ul, function->get_output_op(0)->get_input_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto fakeQuantize = output->get_input_node_shared_ptr(0);
-    const std::string typeName = fakeQuantize->get_type_name();
-    ASSERT_EQ("FakeQuantize", typeName);
 }
 
 TEST_P(FuseFakeQuantizeAndScaleShiftTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_transformation.cpp
index c88f04cf02b3be..b65b2792564f83 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_fake_quantize_transformation.cpp
@@ -47,21 +47,6 @@ void FuseFakeQuantizeTransformation::SetUp() {
         testValues.actual.fakeQuantizeOnData);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FuseFakeQuantizeTransformation::validate() {
-    std::string targetDevice;
-    FuseFakeQuantizeTransformationTestValues testValues;
-    std::tie(targetDevice, testValues) = this->GetParam();
-
-    const auto transformed = transformNGraph(testValues.params, getLowPrecisionTransformationsNGraph(testValues.params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto fakeQuantize = output->get_input_node_shared_ptr(0);
-    const std::string typeName = fakeQuantize->get_type_name();
-    ASSERT_EQ("FakeQuantize", typeName);
 }
 
 TEST_P(FuseFakeQuantizeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.cpp
index fea144ece1f1d9..806eb8dc26c246 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_multiply_to_fake_quantize_transformation.cpp
@@ -36,21 +36,6 @@ void FuseMultiplyToFakeQuantizeTransformation::SetUp() {
         testValues.actual.dequantization);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FuseMultiplyToFakeQuantizeTransformation::validate() {
-    std::string targetDevice;
-    FuseMultiplyToFakeQuantizeTransformationTestValues testValues;
-    std::tie(targetDevice, testValues) = this->GetParam();
-
-    const auto transformed = transformNGraph(testValues.params, getLowPrecisionTransformationsNGraph(testValues.params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto fakeQuantize = output->get_input_node_shared_ptr(0);
-    const std::string typeName = fakeQuantize->get_type_name();
-    ASSERT_EQ("FakeQuantize", typeName);
 }
 
 TEST_P(FuseMultiplyToFakeQuantizeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.cpp
index e7f91d0fefea11..59a65e5d04d309 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/fuse_subtract_to_fake_quantize_transformation.cpp
@@ -36,21 +36,6 @@ void FuseSubtractToFakeQuantizeTransformation::SetUp() {
         testValues.actual.dequantization);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void FuseSubtractToFakeQuantizeTransformation::validate() {
-    std::string targetDevice;
-    FuseSubtractToFakeQuantizeTransformationTestValues testValues;
-    std::tie(targetDevice, testValues) = this->GetParam();
-
-    const auto transformed = transformNGraph(testValues.params, getLowPrecisionTransformationsNGraph(testValues.params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto fakeQuantize = output->get_input_node_shared_ptr(0);
-    const std::string typeName = fakeQuantize->get_type_name();
-    ASSERT_EQ("FakeQuantize", typeName);
 }
 
 TEST_P(FuseSubtractToFakeQuantizeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/gemm_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/gemm_transformation.cpp
index 0657458f6be4dc..ceec2a8b646a97 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/gemm_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/gemm_transformation.cpp
@@ -37,32 +37,14 @@ void GemmTransformation::SetUp() {
     ngraph::pass::low_precision::LayerTransformation::Params params;
     std::tie(netPrecision, inputShape, targetDevice, params) = this->GetParam();
 
-    const float low = params.precisionsOnActivations[0] == ngraph::element::u8 ? 0.f : -128.f;
-    const float high = params.precisionsOnActivations[0] == ngraph::element::u8 ? 255.f : 127.f;
+    const float low = 0.f; // params.precisionsOnActivations[0] == ngraph::element::u8 ? 0.f : -128.f;
+    const float high = 255.f; // params.precisionsOnActivations[0] == ngraph::element::u8 ? 255.f : 127.f;
 
     function = ngraph::builder::subgraph::MatMulFunction::getOriginal(
         netPrecision,
         inputShape,
         low,
         high);
-
-    validate();
-}
-
-void GemmTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    std::tie(netPrecision, inputShape, targetDevice, params) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(GemmTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/group_convolution_transformation.cpp
index c9baa32932975c..df70070e7333c5 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/group_convolution_transformation.cpp
@@ -25,7 +25,8 @@ std::string GroupConvolutionTransformation::getTestCaseName(testing::TestParamIn
     std::string targetDevice;
     ngraph::pass::low_precision::LayerTransformation::Params params;
     GroupConvolutionTransformationParam param;
-    std::tie(netPrecision, targetDevice, params, param) = obj.param;
+    bool addPrecisionPreserved;
+    std::tie(netPrecision, targetDevice, params, param, addPrecisionPreserved) = obj.param;
 
     std::ostringstream result;
     result <<
@@ -35,6 +36,7 @@ std::string GroupConvolutionTransformation::getTestCaseName(testing::TestParamIn
         param.group << "_" <<
         param.groupCalculationDimention << "_" <<
         param.fakeQuantizeOnData << "_" <<
+        (addPrecisionPreserved ? "max_pool_" : "") <<
         param.fakeQuantizeOnWeights;
     return result.str();
 }
@@ -45,7 +47,8 @@ void GroupConvolutionTransformation::SetUp() {
     ngraph::element::Type netPrecision;
     ngraph::pass::low_precision::LayerTransformation::Params params;
     GroupConvolutionTransformationParam param;
-    std::tie(netPrecision, targetDevice, params, param) = this->GetParam();
+    bool addPrecisionPreserved;
+    std::tie(netPrecision, targetDevice, params, param, addPrecisionPreserved) = this->GetParam();
 
     function = ngraph::builder::subgraph::GroupConvolutionFunction::getOriginal(
         netPrecision,
@@ -54,9 +57,8 @@ void GroupConvolutionTransformation::SetUp() {
         param.group,
         param.groupCalculationDimention,
         param.fakeQuantizeOnData,
-        param.fakeQuantizeOnWeights);
-
-    validate();
+        param.fakeQuantizeOnWeights,
+        addPrecisionPreserved);
 }
 
 void GroupConvolutionTransformation::Run() {
@@ -73,24 +75,6 @@ void GroupConvolutionTransformation::Run() {
     }
 }
 
-void GroupConvolutionTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    GroupConvolutionTransformationParam param;
-
-    std::tie(netPrecision, targetDevice, params, param) = this->GetParam();
-
-    auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    EXPECT_EQ(1ul, transformed->get_output_size());
-    std::shared_ptr<ngraph::Node> output = transformed->get_output_op(0);
-
-    std::shared_ptr<ngraph::Node> parent = output->get_input_node_shared_ptr(0);
-    ASSERT_FALSE(parent == nullptr);
-    const std::string typeName = parent->get_type_name();
-
-    ASSERT_TRUE(typeName == "ScaleShiftIE" || typeName == "PowerIE" || typeName == "ConvolutionIE");
-}
-
 TEST_P(GroupConvolutionTransformation, CompareWithRefImpl) {
     Run();
 };
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/interpolate_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/interpolate_transformation.cpp
index 5df9c905c9ee2c..338ed73147b77c 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/interpolate_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/interpolate_transformation.cpp
@@ -53,7 +53,6 @@ void InterpolateTransformation::SetUp() {
     ngraph::element::Type precision;
     std::pair<ngraph::PartialShape, ngraph::Shape> shapes;
     interpAttributes attributes;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
     std::tie(precision, shapes, targetDevice, attributes) = this->GetParam();
 
     ngraph::op::InterpolateAttrs interpAttrs;
@@ -65,28 +64,6 @@ void InterpolateTransformation::SetUp() {
     interpAttrs.pads_end = attributes.pads_end;
 
     function = ngraph::builder::subgraph::InterpolateFunction::getOriginal(precision, shapes.first, shapes.second, interpAttrs);
-
-    validate();
-}
-
-void InterpolateTransformation::validate() {
-    ngraph::element::Type precision;
-    std::pair<ngraph::PartialShape, ngraph::Shape> shapes;
-    std::string targetDevice;
-    interpAttributes attributes;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    std::tie(precision, shapes, targetDevice, attributes) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    if (attributes.mode == "nearest") {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    } else {
-        ASSERT_TRUE("Interp" == typeName || "Interpolate" == typeName);
-    }
 }
 
 TEST_P(InterpolateTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/layer_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/layer_transformation.cpp
index ff01c926baa371..26fac0ebbe2a0a 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/layer_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/layer_transformation.cpp
@@ -38,116 +38,10 @@
 #include "shared_test_classes/base/layer_test_utils.hpp"
 #include "shared_test_classes/base/low_precision_transformations/layer_transformation.hpp"
 
-#include <low_precision/transformer.hpp>
 #include <low_precision/convolution.hpp>
 
 namespace LayerTestsUtils {
 
-
-ngraph::pass::low_precision::LowPrecisionTransformations LayerTransformation::getLowPrecisionTransformationsNGraph(
-    const ngraph::pass::low_precision::LayerTransformation::Params& params) const {
-    return ngraph::pass::low_precision::LowPrecisionTransformer::getAllTransformations(params).
-        add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(
-            ngraph::pass::low_precision::LayerTransformation::Params(params).setPrecisionsOnActivations({ ngraph::element::u8 }));
-    // addCleanup<ScaleShiftToConvolutionTransformation>(
-    //    LayerTransformation::Params(params).setPrecisionsOnActivations({ ngraph::element::u8 }),
-    //    "ScaleShift"));
-}
-
-InferenceEngine::CNNNetwork convert(std::shared_ptr<ngraph::Function> function) {
-    InferenceEngine::CNNNetwork net1(function);
-    InferenceEngine::CNNNetwork clonedNetwork = InferenceEngine::cloneNetwork(net1);
-    if (clonedNetwork.getFunction()) {
-        const auto transformations_callback = [](const std::shared_ptr<const ::ngraph::Node> &node) -> bool {
-            // DepthToSpace node implementation supports only equal input/output tensors with rank <= 5
-            if (auto dtsOp = std::dynamic_pointer_cast<const ::ngraph::opset3::DepthToSpace>(node)) {
-                return dtsOp->input_value(0).get_shape().size() <= 5lu && dtsOp->input_value(0).get_shape().size() == dtsOp->get_output_shape(0).size();
-            }
-
-            // SpaceToDepth node implementation supports only equal input/output tensors with rank <= 5
-            if (auto stdOp = std::dynamic_pointer_cast<const ::ngraph::opset3::SpaceToDepth>(node)) {
-                return stdOp->input_value(0).get_shape().size() <= 5lu && stdOp->input_value(0).get_shape().size() == stdOp->get_output_shape(0).size();
-            }
-
-            if (auto fc_op = std::dynamic_pointer_cast<const ngraph::op::FullyConnected>(node)) {
-                return fc_op->input_value(0).get_shape().size() == 3ul;
-            }
-
-            return std::dynamic_pointer_cast<const ::ngraph::opset2::Gelu>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset2::BatchToSpace>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset2::SpaceToBatch>(node) ||
-                std::dynamic_pointer_cast<const ::ngraph::opset3::ShuffleChannels>(node);
-        };
-        auto nGraphFunc = clonedNetwork.getFunction();
-
-        // Note: instead of running all Conversion Transformations you can make up your own transformation pipeline
-        ngraph::pass::Manager manager;
-        manager.register_pass<ngraph::pass::InitNodeInfo>();
-        // WA: ConvertPriorBox must be executed before the 1st ConstantFolding pass
-        manager.register_pass<ngraph::pass::ConvertPriorBox>();
-        manager.register_pass<ngraph::pass::CommonOptimizations>();
-        manager.register_pass<ngraph::pass::ConvertOpSet3ToOpSet2>();
-        manager.register_pass<ngraph::pass::ConvertOpSet2ToOpSet1>();
-        NGRAPH_SUPPRESS_DEPRECATED_START
-        manager.set_callback(transformations_callback);
-        NGRAPH_SUPPRESS_DEPRECATED_END
-        manager.run_passes(nGraphFunc);
-    }
-
-    return clonedNetwork;
-}
-
-std::shared_ptr<ngraph::Function> LayerTransformation::transformNGraph(
-    const ngraph::pass::low_precision::LayerTransformation::Params& params,
-    const ngraph::pass::low_precision::LowPrecisionTransformations& transformations) {
-    InferenceEngine::CNNNetwork clonedNetwork = convert(function);
-    auto nGraphFunc = clonedNetwork.getFunction();
-
-    ngraph::pass::low_precision::LowPrecisionTransformer transformer(transformations);
-    transformer.transform(nGraphFunc);
-
-    const auto transformations_callback = [](const std::shared_ptr<const ::ngraph::Node> &node) -> bool {
-        // DepthToSpace node implementation supports only equal input/output tensors with rank <= 5
-        if (auto dtsOp = std::dynamic_pointer_cast<const ::ngraph::opset3::DepthToSpace>(node)) {
-            return dtsOp->input_value(0).get_shape().size() <= 5lu && dtsOp->input_value(0).get_shape().size() == dtsOp->get_output_shape(0).size();
-        }
-
-        // SpaceToDepth node implementation supports only equal input/output tensors with rank <= 5
-        if (auto stdOp = std::dynamic_pointer_cast<const ::ngraph::opset3::SpaceToDepth>(node)) {
-            return stdOp->input_value(0).get_shape().size() <= 5lu && stdOp->input_value(0).get_shape().size() == stdOp->get_output_shape(0).size();
-        }
-
-        if (auto fc_op = std::dynamic_pointer_cast<const ngraph::op::FullyConnected>(node)) {
-            return fc_op->input_value(0).get_shape().size() == 3ul;
-        }
-
-        if (auto add_op = std::dynamic_pointer_cast<const ngraph::opset1::Add>(node)) {
-            return ngraph::is_type<ngraph::opset1::Convolution>(add_op->get_input_node_shared_ptr(0)) ||
-                ngraph::is_type<ngraph::opset1::GroupConvolution>(add_op->get_input_node_shared_ptr(0)) ||
-                ngraph::is_type<ngraph::opset1::MatMul>(add_op->get_input_node_shared_ptr(0));
-        }
-
-        return std::dynamic_pointer_cast<const ngraph::opset2::Gelu>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset2::BatchToSpace>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset2::SpaceToBatch>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset3::ExtractImagePatches>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset4::HSwish>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset4::ReduceL1>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset4::ReduceL2>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset4::SoftPlus>(node) ||
-            std::dynamic_pointer_cast<const ngraph::opset4::Pad>(node);
-    };
-
-    ngraph::pass::Manager manager;
-    manager.register_pass<ngraph::pass::ConvertOpSet1ToLegacy>();
-    NGRAPH_SUPPRESS_DEPRECATED_START
-    manager.set_callback(transformations_callback);
-    NGRAPH_SUPPRESS_DEPRECATED_END
-    manager.run_passes(nGraphFunc);
-
-    return clonedNetwork.getFunction();
-}
-
 InferenceEngine::Precision LayerTransformation::getDeviceInternalPrecision(const InferenceEngine::Precision precision) {
     if (precision == InferenceEngine::Precision::FP16) {
         return InferenceEngine::Precision::FP32;
@@ -157,11 +51,7 @@ InferenceEngine::Precision LayerTransformation::getDeviceInternalPrecision(const
 }
 
 ngraph::pass::low_precision::LayerTransformation::Params LayerTransformationParamsNGraphFactory::createParams() {
-    return ngraph::pass::low_precision::LayerTransformation::Params(
-        true,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::UpdateLevel,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true);
+    return ngraph::pass::low_precision::LayerTransformation::Params();
 }
 
 }  // namespace LayerTestsUtils
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_transformation.cpp
index cba7e5c048a430..f82dd4ac001bf2 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_transformation.cpp
@@ -72,23 +72,6 @@ void MatMulTransformation::SetUp() {
         testValues.fqOnData2);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void MatMulTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    MatMulTransformationTestValues testValues;
-    std::tie(precision, inputShape, targetDevice, testValues) = this->GetParam();
-
-    const auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 void MatMulTransformation::Run() {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_constant_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_constant_transformation.cpp
index 50f7c4b324130c..44233cf52a001e 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_constant_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_constant_transformation.cpp
@@ -71,25 +71,6 @@ void MatMulWithConstantTransformation::SetUp() {
         testValues.deqOnWeights);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-
-    if (testValues.deqOnWeights.empty()) {
-        validate();
-    }
-}
-
-void MatMulWithConstantTransformation::validate() {
-    ngraph::element::Type precision;
-    std::string targetDevice;
-    MatMulWithConstantTransformationTestValues testValues;
-    std::tie(precision, targetDevice, testValues) = this->GetParam();
-
-    const auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_TRUE("ScaleShiftIE" == typeName || "Eltwise" == typeName);
 }
 
 void MatMulWithConstantTransformation::Run() {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.cpp
index 6aa6de626560f9..aa5be33128f2a9 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mat_mul_with_optimized_constant_fake_quantize_transformation.cpp
@@ -54,24 +54,6 @@ void MatMulWithOptimizedConstantFakeQuantizeTransformation::SetUp() {
         shapes.second,
         param.fqOnData,
         param.fqOnWeights);
-
-    validate();
-}
-
-void MatMulWithOptimizedConstantFakeQuantizeTransformation::validate() {
-    ngraph::element::Type precision;
-    std::pair<ngraph::PartialShape, ngraph::PartialShape> shapes;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    MatMulWithOptimizedConstantFakeQuantizeTransformationTestValues param;
-    std::tie(precision, shapes, targetDevice, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(MatMulWithOptimizedConstantFakeQuantizeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
index f9d62e4e1721b8..9368fa9877daa2 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
@@ -37,7 +37,6 @@ std::string MultiplyToGroupConvolutionTransformation::getTestCaseName(testing::T
 void MultiplyToGroupConvolutionTransformation::SetUp() {
     ngraph::PartialShape shape;
     ngraph::element::Type precision;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
     builder::subgraph::FakeQuantizeOnData fqOnData;
     std::tie(precision, shape, targetDevice, fqOnData) = this->GetParam();
 
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_transformation.cpp
index 48c0ea0f042833..62be4e6092d9cc 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_transformation.cpp
@@ -25,13 +25,17 @@ std::string MultiplyTransformation::getTestCaseName(testing::TestParamInfo<Multi
     MultiplyTestValues param;
     std::tie(precision, inputShapes, targetDevice, param) = obj.param;
 
-    if (!param.precisionOnActivations.empty()) {
-        params.precisionsOnActivations = param.precisionOnActivations;
-    }
-
     std::ostringstream result;
     result << getTestCaseNameByParams(precision, inputShapes, targetDevice, params) <<
         (param.broadcast ? "_broadcast" : "");
+    for (const auto& elem : param.precisionOnActivations) {
+        result << "_" << elem << "_";
+    }
+    result << "expected_precisions_";
+    for (const auto& elem : param.expectedPrecisions) {
+        result << "_" << elem << "_";
+    }
+
     if (!param.fakeQuantize1.empty()) {
         result << "_on_branch1_" <<
             param.fakeQuantize1.inputLowValues[0] << "_" <<
@@ -63,33 +67,6 @@ void MultiplyTransformation::SetUp() {
         param.fakeQuantize2);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void MultiplyTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    MultiplyTestValues param;
-    std::tie(precision, inputShape, targetDevice, param) = this->GetParam();
-
-    const auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8().
-        setPrecisionsOnActivations(param.precisionOnActivations);
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-    const auto output = transformed->get_output_op(0);
-
-    if ((!param.fakeQuantize1.empty()) && (!param.fakeQuantize2.empty())) {
-        const auto mul = output->get_input_node_shared_ptr(0);
-        const std::string typeName = mul->get_type_name();
-        ASSERT_EQ("Eltwise", typeName);
-        const bool notTransformed = param.expectedPrecisions[0] == param.expectedPrecisions[1];
-        for (size_t i = 0; i < param.expectedPrecisions.size(); ++i) {
-            const auto curPrecision = mul->get_input_element_type(i);
-            const auto expectedPrecision = notTransformed ? precision : param.expectedPrecisions[i];
-            ASSERT_EQ(curPrecision, expectedPrecision);
-        }
-    }
 }
 
 TEST_P(MultiplyTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mvn_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mvn_transformation.cpp
index 383f0a62a12c51..597a95d102be06 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mvn_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/mvn_transformation.cpp
@@ -39,7 +39,6 @@ std::string MVNTransformation::getTestCaseName(testing::TestParamInfo<MVNTransfo
 void MVNTransformation::SetUp() {
     ngraph::PartialShape shape;
     ngraph::element::Type precision;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
     ngraph::AxisSet reductionAxes;
     bool normalizeVariance;
     std::tie(precision, shape, targetDevice, reductionAxes, normalizeVariance) = this->GetParam();
@@ -49,29 +48,6 @@ void MVNTransformation::SetUp() {
         shape,
         reductionAxes,
         normalizeVariance);
-
-    validate();
-}
-
-void MVNTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape shape;
-    std::string targetDevice;
-    ngraph::AxisSet reductionAxes;
-    bool normalizeVariance;
-    std::tie(precision, shape, targetDevice, reductionAxes, normalizeVariance) = this->GetParam();
-
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-    if (normalizeVariance) {
-        ASSERT_EQ("MVN", typeName);
-    } else {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
 }
 
 TEST_P(MVNTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/normalize_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/normalize_transformation.cpp
index 62c3198f4a46b5..b6a6afed9f84f2 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/normalize_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/normalize_transformation.cpp
@@ -47,7 +47,6 @@ void NormalizeL2Transformation::SetUp() {
     threshold = 3.e-3;
     std::pair<ngraph::PartialShape, ngraph::Shape> shapes;
     ngraph::element::Type precision;
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
     std::vector<uint64_t> axes;
     bool fuseMultiply;
     bool shift;
@@ -56,34 +55,10 @@ void NormalizeL2Transformation::SetUp() {
     function = ngraph::builder::subgraph::NormalizeL2Function::getOriginal(
         precision,
         shapes,
-        params.precisionsOnActivations[0],
+        ngraph::element::u8,
         axes,
         fuseMultiply,
         shift);
-
-    validate();
-}
-
-void NormalizeL2Transformation::validate() {
-    ngraph::element::Type precision;
-    std::pair<ngraph::PartialShape, ngraph::Shape> shapes;
-    std::string targetDevice;
-    std::vector<uint64_t> axes;
-    bool fuseMultiply;
-    bool shift;
-    std::tie(precision, shapes, targetDevice, axes, fuseMultiply, shift) = this->GetParam();
-
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto normalize = output->get_input_node_shared_ptr(0);
-    const std::string typeName = normalize->get_type_name();
-    ASSERT_EQ("NormalizeIE", typeName);
-
-    const auto inputPrecision = normalize->get_input_element_type(0);
-    const auto expectedPrecision = shift ? precision : ngraph::element::u8;
-    ASSERT_EQ(inputPrecision, expectedPrecision);
 }
 
 TEST_P(NormalizeL2Transformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp
index 07dab5fefb20bc..5ee5a1d7dfe1ad 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/output_layers_handling_in_transformations_for_concat_multi_channel.cpp
@@ -51,7 +51,7 @@ InferenceEngine::Blob::Ptr OutputLayersHandlingInTransformationsForConcatMultiCh
     }
     const float k = (info.name() == "input1") ? 1.f : (info.name() == "input2" ? 2.f : 3.f);
 
-    const auto interval = outputLayersHandlingInTransformationsForConcatMultiChannelGetInterval(params.precisionsOnActivations);
+    const auto interval = outputLayersHandlingInTransformationsForConcatMultiChannelGetInterval({ ngraph::element::u8, ngraph::element::i8 });
     const float low = interval.first / k;
     const float hight = interval.second / k;
 
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/prelu_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/prelu_transformation.cpp
index 56bbbe8a5ae267..38bff18b3f0334 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/prelu_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/prelu_transformation.cpp
@@ -55,27 +55,6 @@ void PReluTransformation::SetUp() {
     function = ngraph::builder::subgraph::PReluFunction::getOriginal(inputShape, precision, testValues.fakeQuantize);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void PReluTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    PReluTestValues testValues;
-    std::tie(precision, inputShape, targetDevice, testValues) = this->GetParam();
-
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-    if ((!testValues.fakeQuantize.empty()) && (!testValues.isSubtract)) {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    } else {
-        ASSERT_EQ("ReLUIE", typeName);
-    }
 }
 
 TEST_P(PReluTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/relu_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/relu_transformation.cpp
index df023ef988e90c..9b681dc1d2b0cd 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/relu_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/relu_transformation.cpp
@@ -55,28 +55,6 @@ void ReluTransformation::SetUp() {
     function = ngraph::builder::subgraph::ReluFunction::getOriginal(inputShape, precision, testValues.fakeQuantize);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void ReluTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ReluTestValues testValues;
-    std::tie(precision, inputShape, targetDevice, testValues) = this->GetParam();
-
-    auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-    if ((!testValues.fakeQuantize.empty()) && (!testValues.isSubtract)) {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    } else {
-        ASSERT_EQ("Relu", typeName);
-    }
 }
 
 TEST_P(ReluTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/reshape_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/reshape_transformation.cpp
index 6ba90574cd41f8..2d5141c6800fea 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/reshape_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/reshape_transformation.cpp
@@ -48,28 +48,6 @@ void ReshapeTransformation::SetUp() {
         param.reshapeConstValues,
         netPrecision,
         param.fakeQuantize);
-
-    validate();
-}
-
-void ReshapeTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    ReshapeTransformationParam param;
-    std::tie(netPrecision, targetDevice, params, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-
-    if (param.isTransformed) {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    } else {
-        ASSERT_EQ("Reshape", typeName);
-    }
 }
 
 TEST_P(ReshapeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/split_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/split_transformation.cpp
index 95316108aa917e..0a872acfdb5f4d 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/split_transformation.cpp
@@ -58,30 +58,6 @@ void SplitTransformation::SetUp() {
         param.fakeQuantize,
         param.splitedAxis,
         param.numSplit);
-
-    validate();
-}
-
-void SplitTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    SplitTransformationParam param;
-    std::tie(netPrecision, inputShape, targetDevice, params, param) = this->GetParam();
-
-    ngraph::pass::low_precision::LowPrecisionTransformations transformations = getLowPrecisionTransformationsNGraph(params);
-    transformations.add<ngraph::pass::low_precision::SplitTransformation, ngraph::opset1::Split>(params);
-    const auto transformed = transformNGraph(params, transformations);
-
-    EXPECT_EQ(param.numSplit, transformed->get_output_size());
-
-    for (size_t i = 0; i < param.numSplit; ++i) {
-        const auto output = transformed->get_output_op(0);
-        const auto scaleShift = output->get_input_node_shared_ptr(0);
-        const std::string typeName = scaleShift->get_type_name();
-        ASSERT_TRUE(typeName == "ScaleShiftIE" || typeName == "PowerIE" || typeName == "ConvolutionIE");
-    }
 }
 
 TEST_P(SplitTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/squeeze_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/squeeze_transformation.cpp
index 4ca33445a5d9ca..7d14b198b219ff 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/squeeze_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/squeeze_transformation.cpp
@@ -76,24 +76,6 @@ void SqueezeTransformation::SetUp() {
         squeezeParam.squeezeAxes);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void SqueezeTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    SqueezeTransformationParam squeezeParam;
-
-    std::tie(netPrecision, targetDevice, params, squeezeParam) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(SqueezeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/strided_slice_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/strided_slice_transformation.cpp
index 9712ebf01214d8..ef14239fc936c6 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/strided_slice_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/strided_slice_transformation.cpp
@@ -59,24 +59,6 @@ void StridedSliceTransformation::SetUp() {
         param.newAxisMask,
         param.shrinkAxisMask,
         param.elipsisMask);
-
-    validate();
-}
-
-void StridedSliceTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    StridedSliceTransformationParam param;
-    std::tie(netPrecision, inputShape, targetDevice, params, param) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(StridedSliceTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.cpp
index 1aff8e06d6a7a4..af06bd2d5f1858 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/subtract_multiply_to_multiply_add_transformation.cpp
@@ -37,22 +37,6 @@ void SubtractMultiplyToMultiplyAddTransformation::SetUp() {
         testValues.inputShape,
         testValues.precision,
         testValues.fqOnData);
-
-    validate();
-}
-
-void SubtractMultiplyToMultiplyAddTransformation::validate() {
-    SubtractMultiplyToMultiplyAddTransformationTestValues testValues;
-    std::tie(targetDevice, testValues) = this->GetParam();
-
-    const ngraph::pass::low_precision::LayerTransformation::Params params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParams();
-    auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    ASSERT_EQ(1ul, transformed->get_output_size());
-    std::shared_ptr<ngraph::Node> output = transformed->get_output_op(0);
-    std::shared_ptr<ngraph::Node> scaleShift = output->get_input_node_shared_ptr(0);
-    const std::string typeName = scaleShift->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(SubtractMultiplyToMultiplyAddTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_after_matmul_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_after_matmul_transformation.cpp
index 7135ab31f318f4..11c7bdb729b4f0 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_after_matmul_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_after_matmul_transformation.cpp
@@ -46,25 +46,6 @@ void TransposeAfterMatMulTransformation::SetUp() {
     std::tie(precision, inputShape, targetDevice, params, perTensor, transposeChannelDim) = this->GetParam();
 
     function = ngraph::builder::subgraph::TransposeAfterMatMulFunction::getOriginal(precision, inputShape);
-
-    validate();
-}
-
-void TransposeAfterMatMulTransformation::validate() {
-    ngraph::element::Type precision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    bool perTensor;
-    bool transposeChannelDim;
-    std::tie(precision, inputShape, targetDevice, params, perTensor, transposeChannelDim) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(TransposeAfterMatMulTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_transformation.cpp
index fe672b238fe1f4..874a0f2e2a725c 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/transpose_transformation.cpp
@@ -40,27 +40,6 @@ void TransposeTransformation::SetUp() {
         testValues.transposeConstValues,
         testValues.precisionBeforeFq,
         testValues.fqOnData);
-
-    validate();
-}
-
-void TransposeTransformation::validate() {
-    ngraph::element::Type precision;
-    std::string targetDevice;
-    TransposeTransformationTestValues testValues;
-    std::tie(precision, targetDevice, testValues) = this->GetParam();
-
-    const auto transformed = transformNGraph(testValues.params, getLowPrecisionTransformationsNGraph(testValues.params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-
-    if (testValues.fqOnData.outputLowValues.size() > 1 || testValues.fqOnData.outputHighValues.size() > 1) {
-        ASSERT_EQ("Reshape", typeName);
-    } else {
-        ASSERT_EQ("ScaleShiftIE", typeName);
-    }
 }
 
 TEST_P(TransposeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/unsqueeze_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/unsqueeze_transformation.cpp
index 3ab69cd633fe85..3678f160babc16 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/unsqueeze_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/unsqueeze_transformation.cpp
@@ -76,24 +76,6 @@ void UnsqueezeTransformation::SetUp() {
         unsqueezeParam.unsqueezeAxes);
 
     ngraph::pass::InitNodeInfo().run_on_function(function);
-    validate();
-}
-
-void UnsqueezeTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    UnsqueezeTransformationParam unsqueezeParam;
-
-    std::tie(netPrecision, targetDevice, params, unsqueezeParam) = this->GetParam();
-
-    const auto transformed = transformNGraph(params, getLowPrecisionTransformationsNGraph(params));
-
-    const auto output = transformed->get_output_op(0);
-    const auto layer = output->get_input_node_shared_ptr(0);
-    const std::string typeName = layer->get_type_name();
-
-    ASSERT_EQ("ScaleShiftIE", typeName);
 }
 
 TEST_P(UnsqueezeTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/variadic_split_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/variadic_split_transformation.cpp
index 10ed98080617aa..695883b600462a 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/variadic_split_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/variadic_split_transformation.cpp
@@ -65,30 +65,6 @@ void VariadicSplitTransformation::SetUp() {
         param.fakeQuantize,
         param.splitedAxis,
         param.splitLengths);
-
-    validate();
-}
-
-void VariadicSplitTransformation::validate() {
-    ngraph::element::Type netPrecision;
-    ngraph::PartialShape inputShape;
-    std::string targetDevice;
-    ngraph::pass::low_precision::LayerTransformation::Params params;
-    VariadicSplitTransformationParam param;
-    std::tie(netPrecision, inputShape, targetDevice, params, param) = this->GetParam();
-
-    ngraph::pass::low_precision::LowPrecisionTransformations transformations = getLowPrecisionTransformationsNGraph(params);
-    transformations.add<ngraph::pass::low_precision::VariadicSplitTransformation, ngraph::opset1::VariadicSplit>(params);
-    const auto transformed = transformNGraph(params, transformations);
-
-    ASSERT_EQ(param.splitLengths.size(), transformed->get_output_size());
-
-    for (size_t i = 0; i < param.splitLengths.size(); ++i) {
-        const auto output = transformed->get_output_op(0);
-        const auto scaleShift = output->get_input_node_shared_ptr(0);
-        const std::string typeName = scaleShift->get_type_name();
-        ASSERT_TRUE(typeName == "ScaleShiftIE" || typeName == "PowerIE" || typeName == "ConvolutionIE");
-    }
 }
 
 TEST_P(VariadicSplitTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/base/low_precision_transformations/layer_transformation.hpp b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/base/low_precision_transformations/layer_transformation.hpp
index 942e836d828bd2..b41c5a4bc2fc76 100644
--- a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/base/low_precision_transformations/layer_transformation.hpp
+++ b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/base/low_precision_transformations/layer_transformation.hpp
@@ -4,12 +4,18 @@
 
 #pragma once
 
+#include <algorithm>
+#include <map>
+#include <memory>
 #include <string>
 #include <tuple>
-#include <memory>
+#include <vector>
+
+#include <ngraph/ngraph.hpp>
+#include <ngraph_ops/type_relaxed.hpp>
 
+#include "low_precision/layer_transformation.hpp"
 #include "shared_test_classes/base/layer_test_utils.hpp"
-#include <low_precision/transformer.hpp>
 
 namespace LayerTestsUtils {
 
@@ -33,16 +39,6 @@ class LayerTransformation : virtual public LayerTestsUtils::LayerTestsCommon {
         const InferenceEngine::TensorDesc& tensorDesc,
         const float k = 1.f);
 
-    ngraph::pass::low_precision::LowPrecisionTransformations getLowPrecisionTransformationsNGraph(
-        const ngraph::pass::low_precision::LayerTransformation::Params& params) const;
-
-    ngraph::pass::low_precision::LowPrecisionTransformer getLowPrecisionTransformerNGraph(
-        const ngraph::pass::low_precision::LayerTransformation::Params& params) const;
-
-    std::shared_ptr<ngraph::Function> transformNGraph(
-        const ngraph::pass::low_precision::LayerTransformation::Params& params,
-        const ngraph::pass::low_precision::LowPrecisionTransformations& transformations);
-
     static std::pair<float, float> getQuantizationInterval(const ngraph::element::Type precision);
 
     static std::string toString(const ngraph::pass::low_precision::LayerTransformation::Params& params);
diff --git a/inference-engine/tests/functional/shared_test_classes/src/base/low_precision_transformations/layer_transformation.cpp b/inference-engine/tests/functional/shared_test_classes/src/base/low_precision_transformations/layer_transformation.cpp
index a3e110a9f970a4..221a60d33c47ef 100644
--- a/inference-engine/tests/functional/shared_test_classes/src/base/low_precision_transformations/layer_transformation.cpp
+++ b/inference-engine/tests/functional/shared_test_classes/src/base/low_precision_transformations/layer_transformation.cpp
@@ -17,35 +17,16 @@ using namespace InferenceEngine;
 using namespace ngraph;
 
 namespace LayerTestsUtils {
-
 ngraph::pass::low_precision::LayerTransformation::Params LayerTransformationParamsNGraphFactory::createParamsU8I8AndI8() {
-    return ngraph::pass::low_precision::LayerTransformation::Params(
-        true,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::u8, ngraph::element::i8 },
-        { ngraph::element::i8 });
+    return ngraph::pass::low_precision::LayerTransformation::Params();
 }
 
 ngraph::pass::low_precision::LayerTransformation::Params LayerTransformationParamsNGraphFactory::createParamsU8I8() {
-    return ngraph::pass::low_precision::LayerTransformation::Params(
-        true,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::u8 },
-        { ngraph::element::i8 });
+    return ngraph::pass::low_precision::LayerTransformation::Params();
 }
 
 ngraph::pass::low_precision::LayerTransformation::Params LayerTransformationParamsNGraphFactory::createParamsI8I8() {
-    return ngraph::pass::low_precision::LayerTransformation::Params(
-        true,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        ngraph::pass::low_precision::LayerTransformation::QuantizedTensorAlignment::None,
-        true,
-        { ngraph::element::i8 },
-        { ngraph::element::i8 });
+    return ngraph::pass::low_precision::LayerTransformation::Params();
 }
 
 LayerTransformation::LayerTransformation() {
@@ -65,12 +46,6 @@ InferenceEngine::Blob::Ptr LayerTransformation::GenerateInput(
     return FuncTestUtils::createAndFillBlobConsistently(tensorDesc, hight - low, static_cast<int32_t>(low), 1ul);
 }
 
-ngraph::pass::low_precision::LowPrecisionTransformer LayerTransformation::getLowPrecisionTransformerNGraph(
-    const ngraph::pass::low_precision::LayerTransformation::Params& params) const {
-    ngraph::pass::low_precision::LowPrecisionTransformer transformer(getLowPrecisionTransformationsNGraph(params));
-    return transformer;
-}
-
 std::pair<float, float> LayerTransformation::getQuantizationInterval(const ngraph::element::Type precision) {
     const bool unsignedInterval = precision == ngraph::element::u8;
     const float low = unsignedInterval ? 0.f : -128.f;
@@ -82,11 +57,8 @@ std::string LayerTransformation::toString(const ngraph::pass::low_precision::Lay
     using namespace ngraph::pass::low_precision;
     std::ostringstream result;
     result <<
-        (params.supportAsymmetricQuantization ? "asymmetric_" : "symmetric_") <<
         (params.updatePrecisions ? "" : "notUpdatePrecisions_") <<
-        params.precisionsOnActivations[0] << "_" <<
-        params.precisionsOnWeights[0] << "_" <<
-        params.quantizedTensorAlignmentOnActivations;
+        params.deqPrecision;
 
     return result.str();
 }
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/align_concat_quantization_parameters_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/align_concat_quantization_parameters_function.hpp
new file mode 100644
index 00000000000000..362e13ec6d50e4
--- /dev/null
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/align_concat_quantization_parameters_function.hpp
@@ -0,0 +1,41 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <ngraph/ngraph.hpp>
+
+#include "low_precision/layer_transformation.hpp"
+#include "common/fake_quantize_on_data.hpp"
+#include "common/builders.hpp"
+
+namespace ngraph {
+namespace builder {
+namespace subgraph {
+
+class AlignConcatQuantizationParametersFunction {
+public:
+    static std::shared_ptr<ngraph::Function> getOriginal(
+        const ngraph::element::Type precision,
+        const ngraph::element::Type inputPrecision,
+        const ngraph::Shape& inputShape,
+        const bool addFQ,
+        const std::string additionalLayer,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore);
+
+    static std::shared_ptr<ngraph::Function> getReference(
+        const ngraph::element::Type precision,
+        const ngraph::element::Type inputPrecision,
+        const ngraph::Shape& inputShape,
+        const bool addFQ,
+        const std::string additionalLayer,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
+        const ngraph::element::Type precisionAfterOperation,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter);
+};
+
+}  // namespace subgraph
+}  // namespace builder
+}  // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/avg_pool_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/avg_pool_function.hpp
index 3b411e3621f286..ac39154e3f17ce 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/avg_pool_function.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/avg_pool_function.hpp
@@ -22,7 +22,7 @@ class AvgPoolFunction {
         const ngraph::element::Type inputPrecision,
         const ngraph::PartialShape& inputShape,
         const bool addFQ,
-        const std::string additionalLayer,
+        const std::vector<std::string>& additionalLayers,
         const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore);
 
     static std::shared_ptr<ngraph::Function> getOriginal(
@@ -35,10 +35,11 @@ class AvgPoolFunction {
         const ngraph::element::Type inputPrecision,
         const ngraph::PartialShape& inputShape,
         const bool addFQ,
-        const std::string additionalLayer,
+        const std::vector<std::string>& additionalLayers,
         const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
         const ngraph::element::Type precisionAfterOperation,
-        const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter);
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationEnd);
 };
 
 }  // namespace subgraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/builders.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/builders.hpp
index 244445ce1b92f3..9a4e12d78ea664 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/builders.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/builders.hpp
@@ -10,8 +10,10 @@
 #include <ngraph/op/constant.hpp>
 #include "ngraph_ops/type_relaxed.hpp"
 
-#include "low_precision/network_helper.hpp"
 #include "low_precision/common/dequantization_op.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
+#include "low_precision/network_helper.hpp"
 
 #include "lpt_ngraph_functions/common/add.hpp"
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
@@ -73,12 +75,12 @@ std::shared_ptr<Node> makeReshape(const Output<Node>& data, const Reshape& resha
 std::shared_ptr<Node> makeTranspose(const Output<Node>& data, const Transpose& reshape);
 
 std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantize(
-    const Output<Node>& input,
+    const Output<Node>& output,
     const ngraph::element::Type precision,
     const FakeQuantizeOnData& fqOnData);
 
 std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantizeTypeRelaxed(
-    const std::shared_ptr<ngraph::Node>& input,
+    const Output<ngraph::Node>& output,
     const ngraph::element::Type precision,
     const FakeQuantizeOnData& fqOnData);
 
@@ -95,6 +97,53 @@ std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantizeTypeRelaxed(
 
 std::shared_ptr<Node> addDequantizationAttribute(const std::shared_ptr<Node>& op);
 
+template <typename ... Args>
+void addAttribute(std::vector<std::shared_ptr<ngraph::Node>> nodes, Args&& ... args) {
+    const auto attribute = std::make_shared<ngraph::VariantWrapper<QuantizationAlignmentAttributePtr>>(
+        QuantizationAlignmentAttribute(std::forward<Args>(args)...));
+
+    for (const auto& node : nodes) {
+        node->get_rt_info()[ngraph::VariantWrapper<QuantizationAlignmentAttributePtr>::type_info.name] = attribute;
+    }
+}
+
+template <typename T>
+void addAttribute2(std::vector<std::shared_ptr<ngraph::Node>> nodes, T attribute) {
+    const std::string typeInfoName = attribute->get_type_info().name;
+    for (const auto& node : nodes) {
+        auto& rt = node->get_rt_info();
+        rt[typeInfoName] = attribute;
+    }
+}
+
+template <typename T, typename ... Args>
+void addAttribute3(std::vector<std::shared_ptr<ngraph::Node>> nodes, Args&& ... args) {
+    const auto attribute = std::make_shared<::ngraph::VariantWrapper<T>>(T(std::forward<Args>(args)...));
+    for (const auto& node : nodes) {
+        node->get_rt_info()[ngraph::VariantWrapper<T>::type_info.name] = attribute;
+    }
+}
+
+void addAttributes(std::vector<std::shared_ptr<ngraph::Node>> nodes, std::vector<std::shared_ptr<Variant>> attributes);
+
+template <typename T, typename ... Args>
+std::shared_ptr<Variant> make_shared_attribute(Args&& ... args) {
+    const auto attribute = std::make_shared<::ngraph::VariantWrapper<T>>(T(std::forward<Args>(args)...));
+    return attribute;
+}
+
+template <typename T, typename ... Args>
+std::shared_ptr<Variant> make_shared_attribute_ptr(Args&& ... args) {
+    const auto attribute = std::make_shared<::ngraph::VariantWrapper<std::shared_ptr<T>>>(std::make_shared<T>(std::forward<Args>(args)...));
+    return attribute;
+}
+
+std::shared_ptr<Node> makeConvolution(
+    const std::shared_ptr<Node>& parent,
+    const element::Type precision,
+    const bool weightsWithoutFQ,
+    const element::Type weightsprecision = element::i8);
+
 } // namespace subgraph
 } // namespace builder
 } // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/fake_quantize_on_data.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/fake_quantize_on_data.hpp
index f89e980d374f4c..af98d72327d38b 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/fake_quantize_on_data.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/common/fake_quantize_on_data.hpp
@@ -23,7 +23,8 @@ class FakeQuantizeOnData {
         const std::vector<float>& inputHighValues,
         const std::vector<float>& outputLowValues,
         const std::vector<float>& outputHighValues,
-        const ngraph::element::Type outputPrecision = ngraph::element::undefined);
+        const ngraph::element::Type outputPrecision = ngraph::element::undefined,
+        const std::vector<std::shared_ptr<Variant>>& attributes = {});
 
     virtual ~FakeQuantizeOnData();
 
@@ -37,6 +38,7 @@ class FakeQuantizeOnData {
     std::vector<float> outputLowValues;
     std::vector<float> outputHighValues;
     ngraph::element::Type outputPrecision;
+    std::vector<std::shared_ptr<Variant>> attributes;
 };
 
 inline std::ostream& operator<<(std::ostream& os, const std::vector<float>& values) {
@@ -68,7 +70,8 @@ class FakeQuantizeOnDataWithConstant {
         const std::vector<float>& inputHighValues,
         const std::vector<float>& outputLowValues,
         const std::vector<float>& outputHighValues,
-        const ngraph::element::Type outputPrecision = ngraph::element::undefined);
+        const ngraph::element::Type outputPrecision = ngraph::element::undefined,
+        const std::vector<std::shared_ptr<Variant>>& attributes = {});
 
     virtual ~FakeQuantizeOnDataWithConstant();
 
@@ -81,6 +84,7 @@ class FakeQuantizeOnDataWithConstant {
     std::vector<float> outputLowValues;
     std::vector<float> outputHighValues;
     ngraph::element::Type outputPrecision;
+    std::vector<std::shared_ptr<Variant>> attributes;
 };
 
 inline std::ostream& operator<<(std::ostream& out, const FakeQuantizeOnDataWithConstant& data) {
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/concat_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/concat_function.hpp
index e3456ad2a4bfec..241b250bb00256 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/concat_function.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/concat_function.hpp
@@ -122,9 +122,29 @@ class ConcatFunction {
         const FakeQuantizeOnDataWithConstant& fakeQuantize2,
         const DequantizationOperations::Convert& convert2,
         const DequantizationOperations& dequantization2,
+        const std::vector<std::shared_ptr<Variant>>& concatAttributes,
         const ngraph::element::Type precisionAfterOperation,
         const DequantizationOperations& dequantizationAfter,
-        const std::int64_t& axis);
+        const std::int64_t& axis,
+        const bool addNotPrecisionPreservedOperation = false);
+
+    static std::shared_ptr<ngraph::Function> get(
+        const ngraph::element::Type inputPrecision,
+        const ngraph::Shape& inputShape1,
+        const FakeQuantizeOnDataWithConstant& fakeQuantize1,
+        const DequantizationOperations::Convert& convert1,
+        const DequantizationOperations& dequantization1,
+        const bool addReshape1,
+        const ngraph::Shape& inputShape2,
+        const FakeQuantizeOnDataWithConstant& fakeQuantize2,
+        const DequantizationOperations::Convert& convert2,
+        const DequantizationOperations& dequantization2,
+        const bool addReshape2,
+        const std::vector<std::shared_ptr<Variant>>& concatAttributes,
+        const ngraph::element::Type precisionAfterOperation,
+        const DequantizationOperations& dequantizationAfter,
+        const std::int64_t& axis,
+        const bool addNotPrecisionPreservedOperation = false);
 
     static std::shared_ptr<ngraph::Function> getReferenceWithNeighbors(
         const ngraph::element::Type precision,
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/convolution_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/convolution_function.hpp
index 0bff29ac9c3782..325b981ec16e2e 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/convolution_function.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/convolution_function.hpp
@@ -46,8 +46,7 @@ class ConvolutionFunction {
         ngraph::builder::subgraph::DequantizationOperations dequantizationBefore,
         ngraph::element::Type weightsPrecision,
         std::vector<float> weightsValues,
-        ngraph::builder::subgraph::DequantizationOperations dequantizationAfter,
-        bool isCorrect);
+        ngraph::builder::subgraph::DequantizationOperations dequantizationAfter);
 
     static std::shared_ptr<ngraph::Function> getReference(
         const ngraph::element::Type netPrecision,
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/fake_quantize_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/fake_quantize_function.hpp
index d1a212490daac6..ef0885e6ffceaf 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/fake_quantize_function.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/fake_quantize_function.hpp
@@ -19,9 +19,11 @@ namespace subgraph {
 class FakeQuantizeFunction {
 public:
     static std::shared_ptr<ngraph::Function> getOriginal(
+        const ngraph::pass::low_precision::LayerTransformation::Params& params,
         const ngraph::element::Type precision,
         const ngraph::PartialShape& inputShape,
-        const FakeQuantizeOnDataWithConstant& fakeQuantizeOnData);
+        const FakeQuantizeOnDataWithConstant& fakeQuantizeOnData,
+        const bool addNotPrecisionPreservedOperation);
 
     static std::shared_ptr<ngraph::Function> getOriginalWithMaxPool(
             const ngraph::element::Type precision,
@@ -29,12 +31,14 @@ class FakeQuantizeFunction {
             const FakeQuantizeOnData& fakeQuantizeOnData);
 
     static std::shared_ptr<ngraph::Function> getReference(
+        const ngraph::pass::low_precision::LayerTransformation::Params& params,
         const ngraph::element::Type precision,
         const ngraph::PartialShape& inputShape,
         const bool updatePrecisions,
         const FakeQuantizeOnDataWithConstant& fakeQuantizeOnData,
         const ngraph::element::Type fakeQuantizeOutputPrecision,
-        const ngraph::builder::subgraph::DequantizationOperations& dequantization);
+        const ngraph::builder::subgraph::DequantizationOperations& dequantization,
+        const bool addNotPrecisionPreservedOperation);
 };
 
 }  // namespace subgraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/group_convolution_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/group_convolution_function.hpp
index e4f4499e26c3e1..852225cccb702b 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/group_convolution_function.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/group_convolution_function.hpp
@@ -34,7 +34,8 @@ class GroupConvolutionFunction {
         const size_t groupCount,
         const int groupCalculationDimention,
         const FakeQuantizeOnData& fakeQuantizeOnData,
-        const FakeQuantizeOnWeights& fakeQuantizeOnWeights);
+        const FakeQuantizeOnWeights& fakeQuantizeOnWeights,
+        const bool addPrecisionPreserved = false);
 
     static std::shared_ptr<ngraph::Function> get(
         const ngraph::element::Type precision,
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/markup_avg_pool_precisions_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/markup_avg_pool_precisions_function.hpp
new file mode 100644
index 00000000000000..8a0094a248baa3
--- /dev/null
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/markup_avg_pool_precisions_function.hpp
@@ -0,0 +1,50 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <memory>
+#include <ngraph/ngraph.hpp>
+
+#include "low_precision/layer_transformation.hpp"
+#include "common/fake_quantize_on_data.hpp"
+#include "common/builders.hpp"
+
+namespace ngraph {
+namespace builder {
+namespace subgraph {
+
+class MarkupAvgPoolPrecisionsFunction {
+public:
+    static std::shared_ptr<ngraph::Function> getOriginal(
+        const ngraph::element::Type precision,
+        const ngraph::element::Type inputPrecision,
+        const ngraph::Shape& inputShape,
+        const bool addFQ,
+        const std::string additionalLayer,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
+        // -1 - no Convolution
+        const int convoutionBranch,
+        // -1 - no FakeQuantize
+        const int fakeQuantizeBranch);
+
+    static std::shared_ptr<ngraph::Function> getOriginal(
+        const ngraph::element::Type originalFunctionPrecision,
+        const ngraph::Shape& inputShape,
+        const FakeQuantizeOnData& fakeQuantizeOnData);
+
+    static std::shared_ptr<ngraph::Function> getReference(
+        const ngraph::element::Type precision,
+        const ngraph::element::Type inputPrecision,
+        const ngraph::Shape& inputShape,
+        const bool addFQ,
+        const std::string additionalLayer,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
+        const ngraph::element::Type precisionAfterOperation,
+        const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter);
+};
+
+}  // namespace subgraph
+}  // namespace builder
+}  // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/precision_propagation_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/precision_propagation_function.hpp
new file mode 100644
index 00000000000000..c20c3b1dddeae6
--- /dev/null
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/precision_propagation_function.hpp
@@ -0,0 +1,51 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <algorithm>
+#include <memory>
+#include <ngraph/ngraph.hpp>
+#include "low_precision/layer_transformation.hpp"
+#include "common/fake_quantize_on_data.hpp"
+#include "common/dequantization_operations.hpp"
+
+namespace ngraph {
+namespace builder {
+namespace subgraph {
+
+class PrecisionPropagationFunction {
+public:
+    static std::shared_ptr<ngraph::Function> getOriginalWithNeighbors(
+        const ngraph::element::Type precision,
+        const ngraph::Shape& inputShape,
+        const FakeQuantizeOnData& fqOnData1,
+        const DequantizationOperations::Convert& convert1,
+        const DequantizationOperations& dequantization1,
+        const FakeQuantizeOnData& fqOnData2,
+        const DequantizationOperations::Convert& convert2,
+        const DequantizationOperations& dequantization2,
+        const FakeQuantizeOnData& fqOnData3,
+        const DequantizationOperations::Convert& convert3,
+        const DequantizationOperations& dequantization3);
+
+    static std::shared_ptr<ngraph::Function> getReferenceWithNeighbors(
+        const ngraph::element::Type precision,
+        const ngraph::Shape& inputShape,
+        const FakeQuantizeOnData& fqOnData1,
+        const FakeQuantizeOnData& fqOnData2,
+        const FakeQuantizeOnData& fqOnData3,
+        const ngraph::element::Type precisionBeforeOp,
+        const DequantizationOperations& dequantizationBefore,
+        const ngraph::element::Type precisionAfterOperation,
+        const DequantizationOperations& dequantizationOperations1,
+        const DequantizationOperations& dequantizationOperations2);
+
+private:
+    static std::shared_ptr<Node> makeMaxPool(const Output<Node>& parent, const std::vector<size_t>& kernel);
+};
+
+}  // namespace subgraph
+}  // namespace builder
+}  // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/align_concat_quantization_parameters_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/align_concat_quantization_parameters_function.cpp
new file mode 100644
index 00000000000000..53d018394d2f99
--- /dev/null
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/align_concat_quantization_parameters_function.cpp
@@ -0,0 +1,242 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "lpt_ngraph_functions/align_concat_quantization_parameters_function.hpp"
+
+#include <ngraph/opsets/opset1.hpp>
+#include <ngraph_ops/type_relaxed.hpp>
+
+#include "low_precision/network_helper.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
+#include "ngraph_functions/subgraph_builders.hpp"
+
+namespace ngraph {
+namespace builder {
+namespace subgraph {
+
+std::shared_ptr<ngraph::Function> AlignConcatQuantizationParametersFunction::getOriginal(
+    const ngraph::element::Type precision,
+    const ngraph::element::Type inputPrecision,
+    const ngraph::Shape& inputShape,
+    const bool addFQ,
+    const std::string additionalLayer,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore) {
+    const auto input1 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+    std::shared_ptr<ngraph::Node> parent1 = input1;
+    {
+        parent1 = ngraph::builder::makeFakeQuantize(input1, precision, 256, {}, { -1.28 }, { 1.27 }, { -1.28 }, { 1.27 });
+        parent1->set_friendly_name("fakeQuantizeOnActivations1");
+
+        parent1 = std::make_shared<ngraph::opset1::AvgPool>(
+            parent1,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR);
+        parent1->set_friendly_name("avgPool1");
+
+        if (additionalLayer == "maxpool") {
+            parent1 = std::make_shared<ngraph::opset1::MaxPool>(
+                parent1,
+                Strides{ 1, 1 },
+                Shape{ 1, 1 },
+                Shape{ 0, 0 },
+                Shape{ 2, 2 },
+                op::RoundingType::FLOOR);
+            parent1->set_friendly_name("maxPool1");
+        }
+
+        if (addFQ) {
+            parent1 = ngraph::builder::makeFakeQuantize(parent1, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+            parent1->set_friendly_name("lastFakeQuantize1");
+        }
+    }
+
+    const auto input2 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+    std::shared_ptr<ngraph::Node> parent2 = input2;
+    {
+        parent2 = ngraph::builder::makeFakeQuantize(input1, precision, 256, {}, { -1.28f / 2.f }, { 1.27f / 2.f }, { -1.28f / 2.f }, { 1.27f / 2.f });
+        parent2->set_friendly_name("fakeQuantizeOnActivations2");
+
+        parent2 = std::make_shared<ngraph::opset1::AvgPool>(
+            parent2,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR);
+        parent2->set_friendly_name("avgPool2");
+
+        if (additionalLayer == "maxpool") {
+            parent2 = std::make_shared<ngraph::opset1::MaxPool>(
+                parent2,
+                Strides{ 1, 1 },
+                Shape{ 1, 1 },
+                Shape{ 0, 0 },
+                Shape{ 2, 2 },
+                op::RoundingType::FLOOR);
+            parent2->set_friendly_name("maxPool2");
+        }
+
+        if (addFQ) {
+            parent2 = ngraph::builder::makeFakeQuantize(parent1, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+            parent2->set_friendly_name("lastFakeQuantize2");
+        }
+    }
+    auto parent = std::dynamic_pointer_cast<ngraph::Node>(std::make_shared<opset1::Concat>(ngraph::OutputVector{ parent1, parent2 }, 1));
+    parent->set_friendly_name("concat");
+
+    {
+        const size_t outputChannels = 9ul;
+        const size_t inputChannels = 6ul;
+        const auto shape = Shape{ outputChannels, inputChannels, 1, 1 };
+        const auto fakeQuantizeOnWeights = ngraph::builder::makeFakeQuantize(
+            std::make_shared<opset1::Constant>(element::f32, shape, std::vector<float>(1.f, ngraph::shape_size(shape))),
+            precision,
+            255,
+            {outputChannels, 1, 1, 1},
+            std::vector<float>(outputChannels, -1.27f),
+            std::vector<float>(outputChannels, 1.27f),
+            std::vector<float>(outputChannels, -1.27f),
+            std::vector<float>(outputChannels, 1.27f));
+        fakeQuantizeOnWeights->set_friendly_name("fakeQuantizeOnWeights");
+
+        parent = std::make_shared<ngraph::opset1::Convolution>(
+            ngraph::op::TemporaryReplaceOutputType(parent, precision).get(),
+            ngraph::op::TemporaryReplaceOutputType(fakeQuantizeOnWeights, precision).get(),
+            ngraph::Strides{ 1, 1 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::Strides{ 1, 1 });
+
+        parent->set_friendly_name("convolution");
+    }
+
+    parent->set_friendly_name("output");
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(parent) };
+    return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input1, input2 }, "AlignConcatQuantizationParameters");
+}
+
+std::shared_ptr<ngraph::Function> AlignConcatQuantizationParametersFunction::getReference(
+    const ngraph::element::Type precision,
+    const ngraph::element::Type inputPrecision,
+    const ngraph::Shape& inputShape,
+    const bool addFQ,
+    const std::string additionalLayer,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
+    const ngraph::element::Type precisionAfterOperation,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter) {
+    const auto input1 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+    std::shared_ptr<ngraph::Node> parent1 = input1;
+    {
+        FakeQuantizeOnData onData = { 256, {}, { -1.28f }, { 1.27f }, { 0.f }, { 255.f }, ngraph::element::u8};
+        parent1 = makeFakeQuantizeTypeRelaxed(input1, element::f32, onData);
+        ngraph::pass::low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(parent1, element::u8);
+        parent1->set_friendly_name("fakeQuantizeOnActivations1");
+
+        parent1 = std::make_shared<ngraph::opset1::AvgPool>(
+            parent1,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR);
+        parent1->set_friendly_name("avgPool1");
+
+        if (additionalLayer == "maxpool") {
+            parent1 = std::make_shared<ngraph::opset1::MaxPool>(
+                parent1,
+                Strides{ 1, 1 },
+                Shape{ 1, 1 },
+                Shape{ 0, 0 },
+                Shape{ 2, 2 },
+                op::RoundingType::FLOOR);
+            parent1->set_friendly_name("maxPool1");
+        }
+
+        if (addFQ) {
+            parent1 = ngraph::builder::makeFakeQuantize(parent1, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+            parent1->set_friendly_name("lastFakeQuantize1");
+        }
+    }
+
+    const auto input2 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+    std::shared_ptr<ngraph::Node> parent2 = input2;
+    {
+        FakeQuantizeOnData onData = { 256, {}, { -0.64f }, { 0.635f }, { 64.f }, { 192.f }, element::u8};
+        parent2 = makeFakeQuantizeTypeRelaxed(input2, element::f32, onData);
+        ngraph::pass::low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(parent2, element::u8);
+        parent2->set_friendly_name("fakeQuantizeOnActivations2");
+
+        parent2 = std::make_shared<ngraph::opset1::AvgPool>(
+            parent2,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR);
+        parent2->set_friendly_name("avgPool2");
+
+        if (additionalLayer == "maxpool") {
+            parent2 = std::make_shared<ngraph::opset1::MaxPool>(
+                parent2,
+                Strides{ 1, 1 },
+                Shape{ 1, 1 },
+                Shape{ 0, 0 },
+                Shape{ 2, 2 },
+                op::RoundingType::FLOOR);
+            parent2->set_friendly_name("maxPool2");
+        }
+
+        if (addFQ) {
+            parent2 = ngraph::builder::makeFakeQuantize(parent1, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+            parent2->set_friendly_name("lastFakeQuantize2");
+        }
+    }
+    auto parent = std::dynamic_pointer_cast<ngraph::Node>(std::make_shared<opset1::Concat>(ngraph::OutputVector{ parent1, parent2 }, 1));
+    parent->set_friendly_name("concat");
+
+    if (!dequantizationBefore.empty()) {
+        parent = makeDequantization(parent, dequantizationBefore);
+    }
+
+    {
+        const size_t outputChannels = 9ul;
+        const size_t inputChannels = 6ul;
+        const auto shape = Shape{ outputChannels, inputChannels, 1, 1 };
+        const auto onWeights = std::make_shared<opset1::Constant>(
+            element::i8,
+            shape,
+            std::vector<size_t>(outputChannels * inputChannels, 127));
+
+        parent = std::make_shared<ngraph::opset1::Convolution>(
+            ngraph::op::TemporaryReplaceOutputType(parent, precision).get(),
+            ngraph::op::TemporaryReplaceOutputType(onWeights, precision).get(),
+            ngraph::Strides{ 1, 1 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::Strides{ 1, 1 });
+
+        parent->set_friendly_name("convolution");
+    }
+
+    if (!dequantizationAfter.empty()) {
+        parent = makeDequantization(parent, dequantizationAfter);
+    }
+
+    parent->set_friendly_name("output");
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(parent) };
+    return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input1, input2 }, "AlignConcatQuantizationParameters");
+}
+
+}  // namespace subgraph
+}  // namespace builder
+}  // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/avg_pool_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/avg_pool_function.cpp
index ea3bccd1322107..e138ed56709a7c 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/avg_pool_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/avg_pool_function.cpp
@@ -20,7 +20,7 @@ std::shared_ptr<ngraph::Function> AvgPoolFunction::getOriginal(
     const ngraph::element::Type inputPrecision,
     const ngraph::PartialShape& inputShape,
     const bool addFQ,
-    const std::string additionalLayer,
+    const std::vector<std::string>& additionalLayers,
     const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore) {
     const auto input = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, inputShape);
     std::shared_ptr<ngraph::Node> parent = input;
@@ -39,14 +39,22 @@ std::shared_ptr<ngraph::Function> AvgPoolFunction::getOriginal(
         op::RoundingType::FLOOR);
 
     std::shared_ptr<Node> lastLayer = avgPool;
-    if (additionalLayer == "maxpool") {
-        lastLayer = std::make_shared<ngraph::opset1::MaxPool>(
-            lastLayer,
-            Strides{ 1, 1 },
-            Shape{ 1, 1 },
-            Shape{ 0, 0 },
-            Shape{ 2, 2 },
-            op::RoundingType::FLOOR);
+    for (const std::string& additionalLayer : additionalLayers) {
+        if (additionalLayer == "maxpool") {
+            lastLayer = std::make_shared<ngraph::opset1::MaxPool>(
+                lastLayer,
+                Strides{ 1, 1 },
+                Shape{ 1, 1 },
+                Shape{ 0, 0 },
+                Shape{ 2, 2 },
+                op::RoundingType::FLOOR);
+        } else if (additionalLayer == "softmax") {
+            lastLayer = std::make_shared<opset1::Softmax>(lastLayer);
+        } else if (additionalLayer == "convolution") {
+            lastLayer = makeConvolution(lastLayer, precision, false);
+        } else if (additionalLayer == "unsupported_convolution") {
+            lastLayer = makeConvolution(lastLayer, precision, true, element::f32);
+        }
     }
 
     if (addFQ) {
@@ -88,10 +96,11 @@ std::shared_ptr<ngraph::Function> AvgPoolFunction::getReference(
     const ngraph::element::Type inputPrecision,
     const ngraph::PartialShape& inputShape,
     const bool addFQ,
-    const std::string additionalLayer,
+    const std::vector<std::string>& additionalLayers,
     const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
     const ngraph::element::Type precisionAfterOperation,
-    const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter) {
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationEnd) {
     auto input = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, inputShape);
 
     const auto deqBefore = makeDequantization(input, dequantizationBefore);
@@ -108,18 +117,32 @@ std::shared_ptr<ngraph::Function> AvgPoolFunction::getReference(
         outPrecision);
 
     std::shared_ptr<Node> lastLayer = avgPool;
-    if (additionalLayer == "maxpool") {
-        lastLayer = std::make_shared<ngraph::opset1::MaxPool>(
-            lastLayer,
-            Strides{ 1, 1 },
-            Shape{ 1, 1 },
-            Shape{ 0, 0 },
-            Shape{ 2, 2 },
-            op::RoundingType::FLOOR);
+
+    auto deqStructure = dequantizationAfter;
+    deqStructure.multiply.outPrecision = precision;
+    lastLayer = makeDequantization(lastLayer, deqStructure);
+
+    for (const std::string& additionalLayer : additionalLayers) {
+        if (additionalLayer == "maxpool") {
+            lastLayer = std::make_shared<ngraph::opset1::MaxPool>(
+                lastLayer,
+                Strides{ 1, 1 },
+                Shape{ 1, 1 },
+                Shape{ 0, 0 },
+                Shape{ 2, 2 },
+                op::RoundingType::FLOOR);
+        } else if (additionalLayer == "softmax") {
+            lastLayer = std::make_shared<opset1::Softmax>(lastLayer);
+        } else if (additionalLayer == "convolution") {
+            lastLayer = makeConvolution(lastLayer, element::f32, dequantizationAfter.empty());
+        } else if (additionalLayer == "unsupported_convolution") {
+            lastLayer = makeConvolution(lastLayer, precision, true, element::f32);
+        }
     }
-    auto deqAfterStructure = dequantizationAfter;
-    deqAfterStructure.multiply.outPrecision = precision;
-    lastLayer = makeDequantization(lastLayer, deqAfterStructure);
+
+    deqStructure = dequantizationEnd;
+    deqStructure.multiply.outPrecision = precision;
+    lastLayer = makeDequantization(lastLayer, deqStructure);
 
     if (addFQ) {
         lastLayer = ngraph::builder::makeFakeQuantize(
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/builders.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/builders.cpp
index 46583e862267f2..a387627bb0c0d1 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/builders.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/builders.cpp
@@ -16,6 +16,8 @@ namespace ngraph {
 namespace builder {
 namespace subgraph {
 
+    using namespace ngraph::pass::low_precision;
+
 std::shared_ptr<Node> makeDequantization(
     const Output<Node>& data,
     const DequantizationOperations& dequantizationOperations) {
@@ -25,7 +27,7 @@ std::shared_ptr<Node> makeDequantization(
         std::shared_ptr<ngraph::opset1::Convert> convert = dequantizationOperations.convert.addDequantizationAttribute ?
             std::make_shared<ngraph::pass::low_precision::DequantizationConvert>(data, dequantizationOperations.convert.outPrecision) :
             std::make_shared<ngraph::opset1::Convert>(data, dequantizationOperations.convert.outPrecision);
-        ngraph::copy_runtime_info({ data.get_node_shared_ptr(), convert }, convert);
+        NetworkHelper::copyInfo({ data.get_node_shared_ptr(), convert }, convert);
         parent = convert;
     }
 
@@ -123,7 +125,7 @@ std::shared_ptr<Node> makeDequantization(
         if (!dequantizationOperations.subtract.addDequantizationAttribute) {
             ngraph::pass::low_precision::NetworkHelper::cleanRunTimeInfo(subtract);
         }
-        ngraph::copy_runtime_info({ data.get_node_shared_ptr(), subtract }, subtract);
+        NetworkHelper::copyInfo({ data.get_node_shared_ptr(), subtract }, subtract);
 
         if (!dequantizationOperations.subtract.attributes.empty()) {
             auto& rt = subtract->get_rt_info();
@@ -137,7 +139,7 @@ std::shared_ptr<Node> makeDequantization(
 
     if (!dequantizationOperations.multiply.empty()) {
         auto const newMultiply = makeMultiply(parent, dequantizationOperations.multiply);
-        ngraph::copy_runtime_info({ data.get_node_shared_ptr(), newMultiply }, newMultiply);
+        NetworkHelper::copyInfo({ data.get_node_shared_ptr(), newMultiply }, newMultiply);
         parent = newMultiply;
     }
 
@@ -233,11 +235,11 @@ std::shared_ptr<Node> makeTranspose(const Output<Node>& data, const Transpose& t
 }
 
 std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantize(
-    const Output<Node>& input,
+    const Output<Node>& output,
     const ngraph::element::Type precision,
     const FakeQuantizeOnData& fqOnData) {
     return as_type_ptr<ngraph::opset1::FakeQuantize>(ngraph::builder::makeFakeQuantize(
-        input,
+        output,
         precision,
         fqOnData.quantizationLevel,
         fqOnData.constantShape,
@@ -248,11 +250,13 @@ std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantize(
 }
 
 std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantizeTypeRelaxed(
-    const std::shared_ptr<ngraph::Node>& input,
+    const Output<ngraph::Node>& output,
     const ngraph::element::Type precision,
     const FakeQuantizeOnData& fqOnData) {
-    const std::shared_ptr<ngraph::opset1::FakeQuantize> fq = makeFakeQuantize(input, precision, fqOnData);
-    return std::make_shared<ngraph::op::TypeRelaxed<ngraph::opset1::FakeQuantize>>(*fq, fqOnData.outputPrecision);
+    const std::shared_ptr<ngraph::opset1::FakeQuantize> fq = makeFakeQuantize(output, precision, fqOnData);
+    return std::make_shared<ngraph::op::TypeRelaxed<ngraph::opset1::FakeQuantize>>(
+        *fq,
+        fqOnData.outputPrecision == element::undefined ? precision : fqOnData.outputPrecision);
 }
 
 std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantize(
@@ -319,6 +323,12 @@ std::shared_ptr<ngraph::opset1::FakeQuantize> makeFakeQuantize(
         fqOnData.outputHighValues.empty());
 
     auto fq = std::make_shared<ngraph::opset1::FakeQuantize>(input, inputLowNode, inputHighNode, outputLowNode, outputHighNode, fqOnData.quantizationLevel);
+
+    auto& rt = fq->get_rt_info();
+    for (auto& attribute : fqOnData.attributes) {
+        rt[attribute->get_type_info().name] = attribute;
+    }
+
     return fq;
 }
 
@@ -338,6 +348,54 @@ std::shared_ptr<Node> addDequantizationAttribute(const std::shared_ptr<Node>& op
     return op;
 }
 
+void addAttributes(std::vector<std::shared_ptr<ngraph::Node>> nodes, std::vector<std::shared_ptr<Variant>> attributes) {
+    for (const auto& node : nodes) {
+        for (const auto& attribute : attributes) {
+            auto& rt = node->get_rt_info();
+            const std::string typeInfoName = attribute->get_type_info().name;
+            rt[typeInfoName] = attribute;
+        }
+    }
+}
+
+std::shared_ptr<Node> makeConvolution(
+    const std::shared_ptr<Node>& parent,
+    const element::Type precision,
+    const bool weightsWithoutFQ,
+    const element::Type weightsprecision) {
+    const size_t outputChannels = parent->get_output_partial_shape(0)[1].get_length() * 2;
+    const size_t inputChannels = parent->get_output_partial_shape(0)[1].get_length();
+    const auto shape = Shape{ outputChannels, inputChannels, 1, 1 };
+
+    std::shared_ptr<Node> weights;
+    if (weightsWithoutFQ) {
+        weights = std::make_shared<opset1::Constant>(weightsprecision, shape, std::vector<int>(ngraph::shape_size(shape), 100));
+    } else {
+        weights = ngraph::builder::makeFakeQuantize(
+            std::make_shared<opset1::Constant>(precision, shape, std::vector<float>(ngraph::shape_size(shape), 1.f)),
+            precision,
+            255,
+            { outputChannels, 1, 1, 1 },
+            std::vector<float>(outputChannels, -1.27f),
+            std::vector<float>(outputChannels, 1.27f),
+            std::vector<float>(outputChannels, -1.27f),
+            std::vector<float>(outputChannels, 1.27f));
+        weights->set_friendly_name("fakeQuantizeOnWeights");
+    }
+
+    const auto convolution = std::make_shared<ngraph::opset1::Convolution>(
+        ngraph::op::TemporaryReplaceOutputType(parent, precision).get(),
+        ngraph::op::TemporaryReplaceOutputType(weights, precision).get(),
+        ngraph::Strides{ 1, 1 },
+        ngraph::CoordinateDiff{ 0, 0 },
+        ngraph::CoordinateDiff{ 0, 0 },
+        ngraph::Strides{ 1, 1 });
+
+    convolution->set_friendly_name("convolution");
+
+    return convolution;
+}
+
 } // namespace subgraph
 } // namespace builder
 } // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/fake_quantize_on_data.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/fake_quantize_on_data.cpp
index da72c48366142f..2c4f2468fe442e 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/fake_quantize_on_data.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/common/fake_quantize_on_data.cpp
@@ -18,14 +18,16 @@ FakeQuantizeOnData::FakeQuantizeOnData(
     const std::vector<float>& inputHighValues,
     const std::vector<float>& outputLowValues,
     const std::vector<float>& outputHighValues,
-    const ngraph::element::Type outputPrecision) :
+    const ngraph::element::Type outputPrecision,
+    const std::vector<std::shared_ptr<Variant>>& attributes) :
     quantizationLevel(quantizationLevel),
     constantShape(constantShape),
     inputLowValues(inputLowValues),
     inputHighValues(inputHighValues),
     outputLowValues(outputLowValues),
     outputHighValues(outputHighValues),
-    outputPrecision(outputPrecision)
+    outputPrecision(outputPrecision),
+    attributes(attributes)
 {}
 
 FakeQuantizeOnData::~FakeQuantizeOnData() {}
@@ -55,14 +57,16 @@ FakeQuantizeOnDataWithConstant::FakeQuantizeOnDataWithConstant(
     const std::vector<float>& inputHighValues,
     const std::vector<float>& outputLowValues,
     const std::vector<float>& outputHighValues,
-    const ngraph::element::Type outputPrecision) :
+    const ngraph::element::Type outputPrecision,
+    const std::vector<std::shared_ptr<Variant>>& attributes) :
     quantizationLevel(quantizationLevel),
     constantShapes(constantShapes),
     inputLowValues(inputLowValues),
     inputHighValues(inputHighValues),
     outputLowValues(outputLowValues),
     outputHighValues(outputHighValues),
-    outputPrecision(outputPrecision)
+    outputPrecision(outputPrecision),
+    attributes(attributes)
 {}
 
 FakeQuantizeOnDataWithConstant::~FakeQuantizeOnDataWithConstant() {}
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/concat_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/concat_function.cpp
index af132e17b98266..d07034de213756 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/concat_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/concat_function.cpp
@@ -7,7 +7,12 @@
 #include <ngraph/opsets/opset1.hpp>
 #include "ngraph_ops/type_relaxed.hpp"
 #include "low_precision/network_helper.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
 
+#include "ngraph_functions/builders.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
 #include "lpt_ngraph_functions/common/dequantization_operations.hpp"
 #include "lpt_ngraph_functions/common/builders.hpp"
@@ -189,7 +194,6 @@ std::shared_ptr<ngraph::Function> ConcatFunction::getOriginalWithNeighbors(
         results.push_back(std::make_shared<ngraph::opset1::Result>(convolutionNeighbor));
     }
 
-
     std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
         results,
         inputs,
@@ -579,7 +583,9 @@ std::shared_ptr<ngraph::Function> ConcatFunction::getOriginalWithStridedSlice(
         padType);
     maxPool->set_friendly_name("MaxPool");
 
-    const auto result2 = std::make_shared<ngraph::opset1::Result>(maxPool);
+    const std::shared_ptr<Node> convolution = makeConvolution(maxPool, precision, false);
+
+    const auto result2 = std::make_shared<ngraph::opset1::Result>(convolution);
     result2->set_friendly_name("Result_2");
     results.push_back(result2);
 
@@ -697,8 +703,26 @@ std::shared_ptr<ngraph::Function> ConcatFunction::getOriginalWithIntermediateWit
     auto& rtInfo = concat->get_rt_info();
     rtInfo["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat");
 
+    const std::vector<size_t> kernel = { 3, 3 };
+    const std::vector<size_t> stride = { 1, 1 };
+    const std::vector<size_t> padBegin = { 0, 0 };
+    const std::vector<size_t> padEnd = { 0, 0 };
+    const ngraph::op::PadType padType = ngraph::op::PadType::NOTSET;
+    const ngraph::op::RoundingType roundingType = ngraph::op::RoundingType::FLOOR;
+
+    const auto avgPool = std::make_shared<ngraph::opset1::AvgPool>(
+        concat,
+        stride,
+        padBegin,
+        padEnd,
+        kernel,
+        true,
+        roundingType,
+        padType);
+    avgPool->set_friendly_name("avgPool");
+
     ngraph::ResultVector results{
-        std::make_shared<ngraph::opset1::Result>(concat),
+        std::make_shared<ngraph::opset1::Result>(avgPool),
     };
 
     std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
@@ -853,13 +877,22 @@ std::shared_ptr<ngraph::Function> ConcatFunction::get(
     const FakeQuantizeOnDataWithConstant& fqOnData2,
     const DequantizationOperations::Convert& convert2,
     const DequantizationOperations& dequantization2,
+    const std::vector<std::shared_ptr<Variant>>& concatAttributes,
     const ngraph::element::Type precisionAfterOperation,
     const DequantizationOperations& dequantizationAfter,
-    const std::int64_t& axis) {
+    const std::int64_t& axis,
+    const bool addNotPrecisionPreservedOperation) {
     const auto input1 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, inputShape);
     input1->set_friendly_name("input1");
 
-    std::shared_ptr<Node> parent1 = makeFakeQuantizeTypeRelaxed(input1, inputPrecision, fqOnData1);
+    std::shared_ptr<Node> parent1;
+    if (fqOnData1.empty()) {
+        parent1 = input1;
+    } else {
+        std::shared_ptr<Node> fakeQuantize1 = makeFakeQuantizeTypeRelaxed(input1, inputPrecision, fqOnData1);
+        fakeQuantize1->set_friendly_name("fakeQuantize1");
+        parent1 = fakeQuantize1;
+    }
     if (!convert1.empty()) {
         parent1 = std::make_shared<opset1::Convert>(parent1, convert1.outPrecision);
     }
@@ -870,7 +903,14 @@ std::shared_ptr<ngraph::Function> ConcatFunction::get(
     const auto input2 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, inputShape);
     input2->set_friendly_name("input2");
 
-    std::shared_ptr<Node> parent2 = makeFakeQuantizeTypeRelaxed(input2, inputPrecision, fqOnData2);
+    std::shared_ptr<Node> parent2;
+    if (fqOnData2.empty()) {
+        parent2 = input2;
+    } else {
+        std::shared_ptr<Node> fakeQuantize2 = makeFakeQuantizeTypeRelaxed(input2, inputPrecision, fqOnData2);
+        fakeQuantize2->set_friendly_name("fakeQuantize2");
+        parent2 = fakeQuantize2;
+    }
     if (!convert2.empty()) {
         parent2 = std::make_shared<opset1::Convert>(parent2, convert2.outPrecision);
     }
@@ -879,14 +919,156 @@ std::shared_ptr<ngraph::Function> ConcatFunction::get(
     }
 
     const std::shared_ptr<ngraph::opset1::Concat> concat = std::make_shared<ngraph::opset1::Concat>(ngraph::OutputVector{ parent1, parent2 }, axis);
+    concat->set_friendly_name("concat");
+    addAttributes({ concat }, concatAttributes);
 
     auto& rtInfo = concat->get_rt_info();
     rtInfo["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat");
 
     const auto lastDequantization = makeDequantization(concat, dequantizationAfter);
-    lastDequantization->set_friendly_name("output");
 
-    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(lastDequantization) };
+    std::shared_ptr<ngraph::Node> parent = lastDequantization;
+    if (addNotPrecisionPreservedOperation) {
+        auto avgPool = std::make_shared<opset1::AvgPool>(
+            lastDequantization,
+            Strides{1, 1},
+            Shape{1, 1},
+            Shape{1, 1},
+            Shape{2, 2},
+            true,
+            op::RoundingType::FLOOR);
+        parent = avgPool;
+    }
+
+    parent->set_friendly_name("output");
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(parent) };
+    std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
+        results,
+        ngraph::ParameterVector{ input1, input2 },
+        "ConcatTransformation");
+
+    return function;
+}
+
+std::shared_ptr<ngraph::Function> ConcatFunction::get(
+    const ngraph::element::Type inputPrecision,
+    const ngraph::Shape& inputShape1,
+    const FakeQuantizeOnDataWithConstant& fqOnData1,
+    const DequantizationOperations::Convert& convert1,
+    const DequantizationOperations& dequantization1,
+    const bool addReshape1,
+    const ngraph::Shape& inputShape2,
+    const FakeQuantizeOnDataWithConstant& fqOnData2,
+    const DequantizationOperations::Convert& convert2,
+    const DequantizationOperations& dequantization2,
+    const bool addReshape2,
+    const std::vector<std::shared_ptr<Variant>>& concatAttributes,
+    const ngraph::element::Type precisionAfterOperation,
+    const DequantizationOperations& dequantizationAfter,
+    const std::int64_t& axis,
+    const bool addNotPrecisionPreservedOperation) {
+    const auto createReshape = [](const std::shared_ptr<Node>& parent) -> std::shared_ptr<Node> {
+        const auto originalShape = parent->output(0).get_shape();
+        std::vector<int> intermediateShape(originalShape.size());
+        std::fill(intermediateShape.begin(), intermediateShape.end(), 1);
+        intermediateShape[0] = ngraph::shape_size(originalShape);
+
+        const auto reshape1 = std::make_shared<opset1::Reshape>(
+            parent,
+            std::make_shared<opset1::Constant>(element::i32, Shape{ intermediateShape.size() }, intermediateShape),
+            true);
+
+        const auto maxPool = std::make_shared<opset1::MaxPool>(
+            reshape1,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            op::RoundingType::FLOOR);
+
+        const auto reshape2 = std::make_shared<opset1::Reshape>(
+            maxPool,
+            std::make_shared<opset1::Constant>(element::i32, Shape{ originalShape.size() }, originalShape),
+            true);
+
+        return reshape2;
+    };
+
+    const auto input1 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, inputShape1);
+    input1->set_friendly_name("input1");
+
+    std::shared_ptr<Node> parent1;
+    {
+        if (fqOnData1.empty()) {
+            parent1 = input1;
+        } else {
+            std::shared_ptr<Node> fakeQuantize1 = makeFakeQuantizeTypeRelaxed(input1, inputPrecision, fqOnData1);
+            fakeQuantize1->set_friendly_name("fakeQuantize1");
+            parent1 = fakeQuantize1;
+        }
+        if (!convert1.empty()) {
+            parent1 = std::make_shared<opset1::Convert>(parent1, convert1.outPrecision);
+        }
+        if (!dequantization1.empty()) {
+            parent1 = makeDequantization(parent1, dequantization1);
+        }
+        if (addReshape1) {
+            parent1 = createReshape(parent1);
+        }
+    }
+
+    const auto input2 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, inputShape2);
+    input2->set_friendly_name("input2");
+
+    std::shared_ptr<Node> parent2;
+    {
+        if (fqOnData2.empty()) {
+            parent2 = input2;
+        } else {
+            std::shared_ptr<Node> fakeQuantize2 = makeFakeQuantizeTypeRelaxed(input2, inputPrecision, fqOnData2);
+            fakeQuantize2->set_friendly_name("fakeQuantize2");
+            parent2 = fakeQuantize2;
+        }
+        if (!convert2.empty()) {
+            parent2 = std::make_shared<opset1::Convert>(parent2, convert2.outPrecision);
+        }
+        if (!dequantization2.empty()) {
+            parent2 = makeDequantization(parent2, dequantization2);
+        }
+        if (addReshape2) {
+            parent2 = createReshape(parent2);
+        }
+    }
+
+    std::shared_ptr<Node> parent;
+    parent = std::make_shared<ngraph::opset1::Concat>(ngraph::OutputVector{ parent1, parent2 }, axis);
+    parent->set_friendly_name("concat");
+    addAttributes({ parent }, concatAttributes);
+
+    auto& rtInfo = parent->get_rt_info();
+    rtInfo["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat");
+
+    parent = makeConvolution(parent, element::f32, false);
+
+    if (!dequantizationAfter.empty()) {
+        parent = makeDequantization(parent, dequantizationAfter);
+    }
+
+    if (addNotPrecisionPreservedOperation) {
+        auto avgPool = std::make_shared<opset1::AvgPool>(
+            parent,
+            Strides{1, 1},
+            Shape{1, 1},
+            Shape{1, 1},
+            Shape{2, 2},
+            true,
+            op::RoundingType::FLOOR);
+        parent = avgPool;
+    }
+    parent->set_friendly_name("output");
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(parent) };
     std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
         results,
         ngraph::ParameterVector{ input1, input2 },
@@ -1487,7 +1669,9 @@ std::shared_ptr<ngraph::Function> ConcatFunction::getReferenceWithStridedSlice(
 
     const auto dequantizationAfter2 = makeDequantization(maxPool, deqAfter2);
 
-    const auto result2 = std::make_shared<ngraph::opset1::Result>(dequantizationAfter2);
+    const std::shared_ptr<Node> convolution = makeConvolution(dequantizationAfter2, inputPrecision, false);
+
+    const auto result2 = std::make_shared<ngraph::opset1::Result>(convolution);
     result2->set_friendly_name("Result_2");
     results.push_back(result2);
 
@@ -1640,8 +1824,26 @@ std::shared_ptr<ngraph::Function> ConcatFunction::getReferenceWithIntermediateWi
     const auto deqAfter = makeDequantization(concat->output(0), dequantizationAfter);
     deqAfter->set_friendly_name("concat");
 
+    const std::vector<size_t> kernel = { 3, 3 };
+    const std::vector<size_t> stride = { 1, 1 };
+    const std::vector<size_t> padBegin = { 0, 0 };
+    const std::vector<size_t> padEnd = { 0, 0 };
+    const ngraph::op::PadType padType = ngraph::op::PadType::NOTSET;
+    const ngraph::op::RoundingType roundingType = ngraph::op::RoundingType::FLOOR;
+
+    const auto avgPool = std::make_shared<ngraph::opset1::AvgPool>(
+        deqAfter,
+        stride,
+        padBegin,
+        padEnd,
+        kernel,
+        true,
+        roundingType,
+        padType);
+    avgPool->set_friendly_name("avgPool");
+
     ngraph::ResultVector results{
-        std::make_shared<ngraph::opset1::Result>(deqAfter)
+        std::make_shared<ngraph::opset1::Result>(avgPool)
     };
 
     std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/convolution_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/convolution_function.cpp
index 2295010e12bd57..886cfa2e6aad34 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/convolution_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/convolution_function.cpp
@@ -169,8 +169,7 @@ std::shared_ptr<ngraph::Function> ConvolutionFunction::getReferenceWithIncorrect
     ngraph::builder::subgraph::DequantizationOperations dequantizationBefore,
     ngraph::element::Type weightsPrecision,
     std::vector<float> weightsValues,
-    ngraph::builder::subgraph::DequantizationOperations dequantizationAfter,
-    bool isCorrect) {
+    ngraph::builder::subgraph::DequantizationOperations dequantizationAfter) {
     const auto input = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
     input->set_friendly_name("input");
 
@@ -190,12 +189,9 @@ std::shared_ptr<ngraph::Function> ConvolutionFunction::getReferenceWithIncorrect
         std::vector<float>(outputChannelsCount * inputChannelsCount, weightsValues[0]) :
         weightsValues);
 
-    const auto subtract = isCorrect ? nullptr : std::make_shared<DequantizationSubtract>(weights,
-        std::make_shared<ngraph::opset1::Constant>(ngraph::element::f32, Shape{ 1, 1, 1, 1 }, 3.0f));
-
     auto convolutionOriginal = ngraph::opset1::Convolution(
         ngraph::op::TemporaryReplaceOutputType(deqBefore, element::f32).get(),
-        ngraph::op::TemporaryReplaceOutputType(isCorrect ? weights : subtract, element::f32).get(),
+        ngraph::op::TemporaryReplaceOutputType(weights, element::f32).get(),
         ngraph::Strides{ 1, 1 },
         ngraph::CoordinateDiff{ 0, 0 },
         ngraph::CoordinateDiff{ 0, 0 },
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_convolution_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_convolution_function.cpp
index 88b70645bd7f0c..1ae071fd5082ea 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_convolution_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_convolution_function.cpp
@@ -26,6 +26,9 @@ std::shared_ptr<ngraph::Function> FakeQuantizeAndConvolutionFunction::get(
         ngraph::builder::makeFakeQuantize(
             input, precision, fqOnData.quantizationLevel, fqOnData.constantShape,
             fqOnData.inputLowValues, fqOnData.inputHighValues, fqOnData.outputLowValues, fqOnData.outputHighValues);
+    if (fakeQuantizeOnActivations != nullptr) {
+        fakeQuantizeOnActivations->set_friendly_name("fakeQuantizeOnActivations");
+    }
 
     const size_t inputChannelsCount = inputShape[1].get_length();
     const size_t outputChannelsCount = 2 * inputShape[1].get_length();
@@ -34,8 +37,17 @@ std::shared_ptr<ngraph::Function> FakeQuantizeAndConvolutionFunction::get(
         ngraph::Shape{ outputChannelsCount, inputChannelsCount, 1, 1 },
         std::vector<float>(outputChannelsCount * inputChannelsCount, 1));
 
-    const auto convolution = std::make_shared<ngraph::opset1::Convolution>(
+    auto maxPool = std::make_shared<opset1::MaxPool>(
         fqOnData.empty() ? input : fakeQuantizeOnActivations,
+        Strides{ 1, 1 },
+        Shape{ 1, 1 },
+        Shape{ 0, 0 },
+        Shape{ 2, 2 },
+        op::RoundingType::FLOOR);
+    maxPool->set_friendly_name("maxPool");
+
+    const auto convolution = std::make_shared<ngraph::opset1::Convolution>(
+        maxPool, //fqOnData.empty() ? input : fakeQuantizeOnActivations,
         fqOnWeights.empty() ? weights->output(0) :
         ngraph::builder::makeFakeQuantize(
             weights, precision, fqOnWeights.quantizationLevel, fqOnWeights.constantShape,
@@ -44,7 +56,7 @@ std::shared_ptr<ngraph::Function> FakeQuantizeAndConvolutionFunction::get(
         ngraph::CoordinateDiff{ 0, 0 },
         ngraph::CoordinateDiff{ 0, 0 },
         ngraph::Strides{ 1, 1 });
-    convolution->set_friendly_name("output");
+    convolution->set_friendly_name("convolution");
 
     ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(convolution) };
     return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "FakeQuantizeAndConvolutionFunction");
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_two_output_branches_with_convolution_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_two_output_branches_with_convolution_function.cpp
index c2283e33fd45ca..d55623ed4a21be 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_two_output_branches_with_convolution_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_and_two_output_branches_with_convolution_function.cpp
@@ -130,11 +130,11 @@ std::shared_ptr<ngraph::Function> FakeQuantizeAndTwoOutputBranchesWithConvolutio
     if (params.updatePrecisions) {
         replace_node(
             convolution1->get_input_node_shared_ptr(1),
-            ngraph::pass::low_precision::fold<ngraph::opset1::Convert>(convolution1->get_input_node_shared_ptr(1), params.precisionsOnWeights[0]));
+            ngraph::pass::low_precision::fold<ngraph::opset1::Convert>(convolution1->get_input_node_shared_ptr(1), element::i8));
 
         replace_node(
             convolution2->get_input_node_shared_ptr(1),
-            ngraph::pass::low_precision::fold<ngraph::opset1::Convert>(convolution2->get_input_node_shared_ptr(1), params.precisionsOnWeights[0]));
+            ngraph::pass::low_precision::fold<ngraph::opset1::Convert>(convolution2->get_input_node_shared_ptr(1), element::i8));
     }
 
     ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(concat) };
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_function.cpp
index e7ab4fe73ba139..4ec0851d8006bf 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/fake_quantize_function.cpp
@@ -46,9 +46,11 @@ std::shared_ptr<ngraph::Function> FakeQuantizeFunction::getOriginalWithMaxPool(
 }
 
 std::shared_ptr<ngraph::Function> FakeQuantizeFunction::getOriginal(
+    const ngraph::pass::low_precision::LayerTransformation::Params& params,
     const ngraph::element::Type precision,
     const ngraph::PartialShape& inputShape,
-    const FakeQuantizeOnDataWithConstant& fakeQuantizeOnData) {
+    const FakeQuantizeOnDataWithConstant& fakeQuantizeOnData,
+    const bool addNotPrecisionPreservedOperation) {
     const auto input = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
     input->set_friendly_name("input");
 
@@ -57,25 +59,53 @@ std::shared_ptr<ngraph::Function> FakeQuantizeFunction::getOriginal(
     auto& rtInfo = fakeQuantize->get_rt_info();
     rtInfo["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("fakeQuantize");
 
-    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(fakeQuantize) };
+    std::shared_ptr<Node> lastOperation = fakeQuantize;
+    if (addNotPrecisionPreservedOperation) {
+        lastOperation = std::make_shared<opset1::AvgPool>(
+            fakeQuantize,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR);
+    }
+    lastOperation->set_friendly_name("lastOperation");
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(lastOperation) };
     return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "FakeQuantizeFunction");
 }
 
 std::shared_ptr<ngraph::Function> FakeQuantizeFunction::getReference(
+    const ngraph::pass::low_precision::LayerTransformation::Params& params,
     const ngraph::element::Type precision,
     const ngraph::PartialShape& inputShape,
     const bool updatePrecisions,
     const FakeQuantizeOnDataWithConstant& fakeQuantizeOnData,
     const ngraph::element::Type fakeQuantizeOutputPrecision,
-    const ngraph::builder::subgraph::DequantizationOperations& dequantization) {
+    const ngraph::builder::subgraph::DequantizationOperations& dequantization,
+    const bool addNotPrecisionPreservedOperation) {
     const auto input = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
     input->set_friendly_name("input");
 
     auto fakeQuantize = makeFakeQuantizeTypeRelaxed(input, ngraph::element::f32, fakeQuantizeOnData);
-    std::shared_ptr<Node> parent = fakeQuantize;
+
     auto& rtInfo = fakeQuantize->get_rt_info();
     rtInfo["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("fakeQuantize");
 
+    std::shared_ptr<Node> lastOperation = fakeQuantize;
+    if (addNotPrecisionPreservedOperation) {
+        lastOperation = std::make_shared<op::TypeRelaxed<opset1::AvgPool>>(
+            std::vector<element::Type>{element::f32}, std::vector<element::Type>{element::f32},
+            ngraph::op::TemporaryReplaceOutputType(fakeQuantize, element::f32).get(),
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR);
+    }
+
     auto updateDequantization = dequantization;
     if (!updateDequantization.subtract.empty()) {
         updateDequantization.subtract.constantPrecision = element::f32;
@@ -87,17 +117,18 @@ std::shared_ptr<ngraph::Function> FakeQuantizeFunction::getReference(
     updateDequantization.multiply.outPrecision = precision;
     std::shared_ptr<Node> deq;
     if (updatePrecisions) {
-        deq = makeDequantization(fakeQuantize, updateDequantization);
+        deq = makeDequantization(lastOperation, updateDequantization);
         ngraph::pass::low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(fakeQuantize, fakeQuantizeOutputPrecision);
     } else {
         if (precision == element::f32) {
             updateDequantization.convert = {};
         }
-        deq = makeDequantization(fakeQuantize, updateDequantization);
+        deq = makeDequantization(lastOperation, updateDequantization);
         ngraph::pass::low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(fakeQuantize, precision);
     }
 
-    deq->set_friendly_name("fakeQuantize");
+    deq->set_friendly_name("lastOperation");
+
     ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(deq) };
     return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "FakeQuantizeFunction");
 }
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/group_convolution_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/group_convolution_function.cpp
index 6946e6219b1820..f9bc892c8d0121 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/group_convolution_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/group_convolution_function.cpp
@@ -134,14 +134,13 @@ std::shared_ptr<ngraph::Function> GroupConvolutionFunction::getOriginal(
     const size_t groupCount,
     const int groupCalculationDimention,
     const FakeQuantizeOnData& fakeQuantizeOnData,
-    const FakeQuantizeOnWeights& fakeQuantizeOnWeights) {
+    const FakeQuantizeOnWeights& fakeQuantizeOnWeights,
+    const bool addPrecisionPreserved) {
     const auto input = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
 
-    std::shared_ptr<ngraph::Node> fakeQuantizeOnActivations;
-    if (fakeQuantizeOnData.empty()) {
-        fakeQuantizeOnActivations = nullptr;
-    } else {
-        fakeQuantizeOnActivations = std::make_shared<ngraph::opset1::FakeQuantize>(
+    std::shared_ptr<ngraph::Node> parent = input;
+    if (!fakeQuantizeOnData.empty()) {
+        parent = std::make_shared<ngraph::opset1::FakeQuantize>(
             input,
             std::make_shared<Constant>(precision, Shape{ 1, fakeQuantizeOnData.inputLowValues.size(), 1, 1 }, fakeQuantizeOnData.inputLowValues),
             std::make_shared<Constant>(precision, Shape{ 1, fakeQuantizeOnData.inputHighValues.size(), 1, 1 }, fakeQuantizeOnData.inputHighValues),
@@ -150,6 +149,23 @@ std::shared_ptr<ngraph::Function> GroupConvolutionFunction::getOriginal(
             fakeQuantizeOnData.quantizationLevel);
     }
 
+    if (addPrecisionPreserved) {
+        const std::vector<size_t> stride = { 1, 1 };
+        const std::vector<size_t> padBegin = { 0, 0 };
+        const std::vector<size_t> padEnd = { 0, 0 };
+        const ngraph::op::PadType padType = ngraph::op::PadType::NOTSET;
+        const ngraph::op::RoundingType roundingType = ngraph::op::RoundingType::FLOOR;
+        const auto pooling = std::make_shared<ngraph::opset1::MaxPool>(
+            parent,
+            stride,
+            padBegin,
+            padEnd,
+            ngraph::Shape{ 3, 3 },
+            roundingType,
+            padType);
+        parent = pooling;
+    }
+
     // TODO: pass as argument
     //const size_t groupCount = 3ul;
     const size_t outputChannelsCount = outputShape[1];
@@ -169,7 +185,7 @@ std::shared_ptr<ngraph::Function> GroupConvolutionFunction::getOriginal(
         {});
 
     const auto convolution = std::make_shared<ngraph::opset1::GroupConvolution>(
-        fakeQuantizeOnActivations == nullptr ? input : fakeQuantizeOnActivations,
+        parent,
         weights,
         ngraph::Strides{ 1, 1 },
         ngraph::CoordinateDiff{ 0, 0 },
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/markup_avg_pool_precisions_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/markup_avg_pool_precisions_function.cpp
new file mode 100644
index 00000000000000..6cfca22e95330e
--- /dev/null
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/markup_avg_pool_precisions_function.cpp
@@ -0,0 +1,234 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <ngraph/opsets/opset1.hpp>
+#include <ngraph_ops/type_relaxed.hpp>
+
+#include "low_precision/network_helper.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
+
+#include "lpt_ngraph_functions/markup_avg_pool_precisions_function.hpp"
+#include "ngraph_functions/subgraph_builders.hpp"
+
+namespace ngraph {
+namespace builder {
+namespace subgraph {
+
+
+std::shared_ptr<Node> createConvolution(
+    const ngraph::element::Type precision,
+    const ngraph::element::Type inputPrecision,
+    const ngraph::Shape& inputShape,
+    const std::shared_ptr<Node>& parent) {
+    const size_t outputChannels = 6ul;
+    const size_t inputChannels = inputShape[1];
+    const auto shape = Shape{ outputChannels, inputChannels, 1, 1 };
+    const auto fakeQuantizeOnWeights = ngraph::builder::makeFakeQuantize(
+        std::make_shared<opset1::Constant>(element::f32, shape, std::vector<float>(1.f, ngraph::shape_size(shape))),
+        precision,
+        255,
+        { outputChannels, 1, 1, 1 },
+        std::vector<float>(outputChannels, -1.27f),
+        std::vector<float>(outputChannels, 1.27f),
+        std::vector<float>(outputChannels, -1.27f),
+        std::vector<float>(outputChannels, 1.27f));
+    fakeQuantizeOnWeights->set_friendly_name("fakeQuantizeOnWeights");
+
+    auto convolution = std::make_shared<ngraph::opset1::Convolution>(
+        ngraph::op::TemporaryReplaceOutputType(parent, precision).get(),
+        ngraph::op::TemporaryReplaceOutputType(fakeQuantizeOnWeights, precision).get(),
+        ngraph::Strides{ 1, 1 },
+        ngraph::CoordinateDiff{ 0, 0 },
+        ngraph::CoordinateDiff{ 0, 0 },
+        ngraph::Strides{ 1, 1 });
+    convolution->set_friendly_name("convolution");
+
+    return convolution;
+}
+
+std::shared_ptr<ngraph::Function> MarkupAvgPoolPrecisionsFunction::getOriginal(
+    const ngraph::element::Type precision,
+    const ngraph::element::Type inputPrecision,
+    const ngraph::Shape& inputShape,
+    const bool addFQ,
+    const std::string additionalLayer,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
+    // -1 - no Convolution, 2 - on both branches
+    const int convoutionBranch,
+    // -1 - no FakeQuantize, 2 - on both branches
+    const int fakeQuantizeBranch) {
+    std::shared_ptr<ngraph::opset1::Parameter> input1;
+    std::shared_ptr<ngraph::opset1::Parameter> input2;
+    std::shared_ptr<ngraph::Node> parent;
+    {
+        auto createBranch = [](
+            const ngraph::element::Type precision,
+            const std::string& additionalLayer,
+            const std::shared_ptr<ngraph::Node>& parent) -> std::shared_ptr<ngraph::Node> {
+            //auto deqBeforeStructure = dequantizationBefore;
+            //deqBeforeStructure.multiply.outPrecision = precision;
+            // const auto parent = makeDequantization(input, deqBeforeStructure);
+
+            auto newParent = ngraph::builder::makeFakeQuantize(parent, precision, 256, {}, { -1.28 }, { 1.27 }, { -1.28 }, { 1.27 });
+            newParent->set_friendly_name("fakeQuantizeOnActivations");
+
+            //if (additionalLayer == "maxpool") {
+            //    newParent = std::make_shared<ngraph::opset1::MaxPool>(
+            //        newParent,
+            //        Strides{ 1, 1 },
+            //        Shape{ 1, 1 },
+            //        Shape{ 0, 0 },
+            //        Shape{ 2, 2 },
+            //        op::RoundingType::FLOOR);
+            //    newParent->set_friendly_name("maxPool1");
+            //}
+            return newParent;
+        };
+        input1 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+        auto parent1 = createBranch(precision, additionalLayer, input1);
+
+        //input2 = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+        //auto parent2 = createBranch(precision, additionalLayer, input2);
+        //
+        //parent = std::make_shared<ngraph::opset1::Concat>(OutputVector{ parent1, parent2 }, 1ul);
+        parent = parent1;
+    }
+
+    parent = std::make_shared<ngraph::opset1::AvgPool>(
+        parent,
+        Strides{ 1, 1 },
+        Shape{ 1, 1 },
+        Shape{ 0, 0 },
+        Shape{ 2, 2 },
+        true,
+        op::RoundingType::FLOOR);
+    parent->set_friendly_name("avgPool");
+
+    if (additionalLayer == "maxpool") {
+        parent = std::make_shared<ngraph::opset1::MaxPool>(parent, Strides{ 1, 1 }, Shape{ 1, 1 }, Shape{ 0, 0 }, Shape{ 2, 2 }, op::RoundingType::FLOOR);
+        parent->set_friendly_name("maxPool2");
+    }
+
+    std::shared_ptr<ngraph::Node> parent1 = std::make_shared<ngraph::opset1::MaxPool>(
+        parent, Strides{ 1, 1 }, Shape{ 1, 1 }, Shape{ 0, 0 }, Shape{ 2, 2 }, op::RoundingType::FLOOR);
+
+    std::shared_ptr<ngraph::Node> parent2 = std::make_shared<ngraph::opset1::MaxPool>(
+        parent, Strides{ 1, 1 }, Shape{ 1, 1 }, Shape{ 0, 0 }, Shape{ 2, 2 }, op::RoundingType::FLOOR);
+
+    //if (addFQ) {
+    //    parent1 = ngraph::builder::makeFakeQuantize(parent1, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+    //    parent1->set_friendly_name("lastFakeQuantize1");
+
+    //    parent2 = ngraph::builder::makeFakeQuantize(parent2, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+    //    parent2->set_friendly_name("lastFakeQuantize2");
+    //}
+
+    if (convoutionBranch != -1) {
+        if (convoutionBranch != 1) {
+            parent1 = createConvolution(precision, inputPrecision, inputShape, parent1);
+        }
+        if (convoutionBranch != 0) {
+            parent2 = createConvolution(precision, inputPrecision, inputShape, parent2);
+        }
+    }
+
+    if (fakeQuantizeBranch != -1) {
+        if (fakeQuantizeBranch != 1) {
+            parent1 = ngraph::builder::makeFakeQuantize(parent1, precision, 256, {}, { -1.28 }, { 1.27 }, { -1.28 }, { 1.27 });
+            parent1->set_friendly_name("fakeQuantize1");
+        }
+        if (fakeQuantizeBranch != 0) {
+            parent2 = ngraph::builder::makeFakeQuantize(parent2, precision, 256, {}, { -1.28 }, { 1.27 }, { -1.28 }, { 1.27 });
+            parent2->set_friendly_name("fakeQuantize2");
+        }
+    }
+
+    parent2->set_friendly_name("output");
+
+    ngraph::ResultVector results{
+        std::make_shared<ngraph::opset1::Result>(parent1),
+        std::make_shared<ngraph::opset1::Result>(parent2)
+    };
+
+    return std::make_shared<ngraph::Function>(
+        results,
+        (input2 == nullptr) ? ngraph::ParameterVector{ input1 } : ngraph::ParameterVector{ input1, input2 },
+        "MarkupAvgPoolPrecisions");
+}
+
+std::shared_ptr<ngraph::Function> MarkupAvgPoolPrecisionsFunction::getOriginal(
+    const ngraph::element::Type originalFunctionPrecision,
+    const ngraph::Shape& inputShape,
+    const FakeQuantizeOnData& fakeQuantizeOnData) {
+    const auto input = std::make_shared<ngraph::opset1::Parameter>(originalFunctionPrecision, ngraph::Shape(inputShape));
+
+    const auto fakeQuantize = ngraph::builder::makeFakeQuantize(
+        input, originalFunctionPrecision, fakeQuantizeOnData.quantizationLevel, fakeQuantizeOnData.constantShape,
+        fakeQuantizeOnData.inputLowValues, fakeQuantizeOnData.inputHighValues, fakeQuantizeOnData.outputLowValues, fakeQuantizeOnData.outputHighValues);
+
+    const std::shared_ptr<ngraph::Node> avgPool = std::make_shared<ngraph::opset1::AvgPool>(
+        fakeQuantize,
+        Strides{ 1, 1 },
+        Shape{ 1, 1 },
+        Shape{ 0, 0 },
+        Shape{ 2, 2 },
+        true,
+        op::RoundingType::FLOOR);
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(avgPool) };
+    return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "MarkupAvgPoolPrecisions");
+}
+
+std::shared_ptr<ngraph::Function> MarkupAvgPoolPrecisionsFunction::getReference(
+    const ngraph::element::Type precision,
+    const ngraph::element::Type inputPrecision,
+    const ngraph::Shape& inputShape,
+    const bool addFQ,
+    const std::string additionalLayer,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationBefore,
+    const ngraph::element::Type precisionAfterOperation,
+    const ngraph::builder::subgraph::DequantizationOperations& dequantizationAfter) {
+    auto input = std::make_shared<ngraph::opset1::Parameter>(inputPrecision, ngraph::Shape(inputShape));
+
+    const auto deqBefore = makeDequantization(input, dequantizationBefore);
+    auto outPrecision = precisionAfterOperation;
+    const std::shared_ptr<ngraph::Node> avgPool = std::make_shared<ngraph::op::TypeRelaxed<ngraph::opset1::AvgPool>>(
+        opset1::AvgPool(
+            deqBefore,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            true,
+            op::RoundingType::FLOOR),
+        outPrecision);
+
+    std::shared_ptr<Node> lastLayer = avgPool;
+    if (additionalLayer == "maxpool") {
+        lastLayer = std::make_shared<ngraph::opset1::MaxPool>(
+            lastLayer,
+            Strides{ 1, 1 },
+            Shape{ 1, 1 },
+            Shape{ 0, 0 },
+            Shape{ 2, 2 },
+            op::RoundingType::FLOOR);
+    }
+    auto deqAfterStructure = dequantizationAfter;
+    deqAfterStructure.multiply.outPrecision = precision;
+    lastLayer = makeDequantization(lastLayer, deqAfterStructure);
+
+    if (addFQ) {
+        lastLayer = ngraph::builder::makeFakeQuantize(
+            lastLayer, precision, 256, {}, { 0 }, { 255 }, { 0 }, { 255 });
+    }
+
+    lastLayer->set_friendly_name("output");
+
+    ngraph::ResultVector results{ std::make_shared<ngraph::opset1::Result>(lastLayer) };
+    return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "MarkupAvgPoolPrecisions");
+}
+
+}  // namespace subgraph
+}  // namespace builder
+}  // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/precision_propagation_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/precision_propagation_function.cpp
new file mode 100644
index 00000000000000..212e781127be72
--- /dev/null
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/precision_propagation_function.cpp
@@ -0,0 +1,302 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "lpt_ngraph_functions/precision_propagation_function.hpp"
+
+#include <ngraph/opsets/opset1.hpp>
+#include "ngraph_ops/type_relaxed.hpp"
+#include "low_precision/network_helper.hpp"
+#include "low_precision/rt_info/precision_preserved_attribute.hpp"
+#include "low_precision/rt_info/intervals_alignment_attribute.hpp"
+#include "low_precision/rt_info/quantization_alignment_attribute.hpp"
+
+#include "ngraph_functions/builders.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
+#include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
+#include "lpt_ngraph_functions/common/dequantization_operations.hpp"
+#include "lpt_ngraph_functions/common/builders.hpp"
+
+namespace ngraph {
+namespace builder {
+namespace subgraph {
+
+using namespace ngraph::pass;
+
+std::shared_ptr<ngraph::Function> PrecisionPropagationFunction::getOriginalWithNeighbors(
+    const ngraph::element::Type precision,
+    const ngraph::Shape& inputShape,
+    const FakeQuantizeOnData& fqOnData1,
+    const DequantizationOperations::Convert& convert1,
+    const DequantizationOperations& dequantization1,
+    const FakeQuantizeOnData& fqOnData2,
+    const DequantizationOperations::Convert& convert2,
+    const DequantizationOperations& dequantization2,
+    const FakeQuantizeOnData& fqOnData3,
+    const DequantizationOperations::Convert& convert3,
+    const DequantizationOperations& dequantization3) {
+    const auto input1 = std::make_shared<ngraph::opset1::Parameter>(precision, ngraph::Shape(inputShape));
+    std::shared_ptr<Node> parent1;
+    {
+        input1->set_friendly_name("input1");
+        const auto fakeQuantize1 = makeFakeQuantize(input1, precision, fqOnData1);
+        fakeQuantize1->set_friendly_name("fakeQuantize1");
+        parent1 = fakeQuantize1;
+
+        if (!convert1.empty()) {
+            parent1 = std::make_shared<opset1::Convert>(parent1, convert1.outPrecision);
+        }
+        if (!dequantization1.empty()) {
+            parent1 = makeDequantization(parent1, dequantization1);
+        }
+    }
+
+    const auto input2 = std::make_shared<ngraph::opset1::Parameter>(precision, ngraph::Shape(inputShape));
+    std::shared_ptr<Node> parent2;
+    {
+        input2->set_friendly_name("input2");
+        const auto fakeQuantize2 = makeFakeQuantize(input2, precision, fqOnData2);
+        fakeQuantize2->set_friendly_name("fakeQuantize2");
+        parent2 = fakeQuantize2;
+
+        if (!convert2.empty()) {
+            parent2 = std::make_shared<opset1::Convert>(parent2, convert2.outPrecision);
+        }
+        if (!dequantization2.empty()) {
+            parent2 = makeDequantization(parent2, dequantization2);
+        }
+    }
+
+    const auto input3 = std::make_shared<ngraph::opset1::Parameter>(precision, ngraph::Shape(inputShape));
+    std::shared_ptr<Node> parent3;
+    {
+        input3->set_friendly_name("input3");
+        const auto fakeQuantize3 = makeFakeQuantize(input3, precision, fqOnData3);
+        fakeQuantize3->set_friendly_name("fakeQuantize3");
+        parent3 = fakeQuantize3;
+
+        if (!convert3.empty()) {
+            parent3 = std::make_shared<opset1::Convert>(parent3, convert3.outPrecision);
+        }
+        if (!dequantization3.empty()) {
+            parent3 = makeDequantization(parent3, dequantization3);
+        }
+    }
+
+    const auto concat1 = std::make_shared<ngraph::opset1::Concat>(
+        ngraph::OutputVector { parent1->output(0), parent2->output(0) },
+        1ull);
+    concat1->set_friendly_name("concat1");
+
+    auto& rtInfo1 = concat1->get_rt_info();
+    rtInfo1["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat1");
+
+    const auto concat2 = std::make_shared<ngraph::opset1::Concat>(
+        ngraph::OutputVector { parent2->output(0), parent3->output(0) },
+        1ull);
+    concat2->set_friendly_name("concat2");
+
+    auto& rtInfo2 = concat2->get_rt_info();
+    rtInfo2["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat2");
+
+    std::shared_ptr<ngraph::Node> result1 = concat1;
+    std::shared_ptr<ngraph::Node> result2 = concat2;
+    {
+        const std::vector<size_t> kernel = { 3, 3 };
+        const std::vector<size_t> stride = { 1, 1 };
+        const std::vector<size_t> padBegin = { 0, 0 };
+        const std::vector<size_t> padEnd = { 0, 0 };
+        const ngraph::op::PadType padType = ngraph::op::PadType::NOTSET;
+        const ngraph::op::RoundingType roundingType = ngraph::op::RoundingType::FLOOR;
+
+        result2 = std::make_shared<ngraph::opset1::MaxPool>(
+            result2,
+            stride,
+            padBegin,
+            padEnd,
+            kernel,
+            roundingType,
+            padType);
+        result2->set_friendly_name("MaxPool");
+
+        const size_t outputChannels = 9ul;
+        const size_t inputChannels = 6ul;
+        const auto shape = Shape{ outputChannels, inputChannels, 1, 1 };
+        const auto fakeQuantizeOnWeights = ngraph::builder::makeFakeQuantize(
+            std::make_shared<opset1::Constant>(element::f32, shape, std::vector<float>(ngraph::shape_size(shape), 1.f)),
+            precision,
+            255,
+            { outputChannels, 1, 1, 1 },
+            std::vector<float>(outputChannels, -1.27f),
+            std::vector<float>(outputChannels, 1.27f),
+            std::vector<float>(outputChannels, -1.27f),
+            std::vector<float>(outputChannels, 1.27f));
+        fakeQuantizeOnWeights->set_friendly_name("fakeQuantizeOnWeights");
+
+        result2 = std::make_shared<ngraph::opset1::Convolution>(
+            ngraph::op::TemporaryReplaceOutputType(result2, precision).get(),
+            ngraph::op::TemporaryReplaceOutputType(fakeQuantizeOnWeights, precision).get(),
+            ngraph::Strides{ 1, 1 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::Strides{ 1, 1 });
+
+        result2->set_friendly_name("convolution");
+    }
+
+    const ngraph::ResultVector results {
+        std::make_shared<ngraph::opset1::Result>(result1),
+        std::make_shared<ngraph::opset1::Result>(result2)
+    };
+
+    std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
+        results,
+        ngraph::ParameterVector { input1, input2, input3 },
+        "ConcatWithNeighborsTransformation");
+
+    return function;
+}
+
+std::shared_ptr<ngraph::Function> PrecisionPropagationFunction::getReferenceWithNeighbors(
+    const ngraph::element::Type precision,
+    const ngraph::Shape& inputShape,
+    const FakeQuantizeOnData& fqOnData1,
+    const FakeQuantizeOnData& fqOnData2,
+    const FakeQuantizeOnData& fqOnData3,
+    const ngraph::element::Type precisionBeforeOp,
+    const DequantizationOperations& dequantizationBefore,
+    const ngraph::element::Type precisionAfterOperation,
+    const DequantizationOperations& dequantizationOperations1,
+    const DequantizationOperations& dequantizationOperations2) {
+    const auto input1 = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
+    input1->set_friendly_name("input1");
+
+    const auto fakeQuantize1 = makeFakeQuantizeTypeRelaxed(input1, precision, fqOnData1);
+    low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(fakeQuantize1, precisionBeforeOp);
+    fakeQuantize1->set_friendly_name("fakeQuantize1");
+    const auto deqBefore1 = makeDequantization(fakeQuantize1, dequantizationBefore);
+
+    const auto input2 = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
+    input2->set_friendly_name("input2");
+
+    const auto fakeQuantize2 = makeFakeQuantizeTypeRelaxed(input2, precision, fqOnData2);
+    low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(fakeQuantize2, precisionBeforeOp);
+    fakeQuantize2->set_friendly_name("fakeQuantize2");
+    const auto deqBefore2 = makeDequantization(fakeQuantize2, dequantizationBefore);
+
+    const auto input3 = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
+    input3->set_friendly_name("input3");
+
+    const auto fakeQuantize3 = makeFakeQuantizeTypeRelaxed(input3, precision, fqOnData3);
+    low_precision::NetworkHelper::setOutDataPrecisionForTypeRelaxed(fakeQuantize3, precisionBeforeOp);
+    fakeQuantize3->set_friendly_name("fakeQuantize3");
+    const auto deqBefore3 = makeDequantization(fakeQuantize3, dequantizationBefore);
+
+    const auto concat1 = std::make_shared<ngraph::opset1::Concat>(
+        ngraph::OutputVector { deqBefore1, deqBefore2 },
+        1ull);
+    concat1->set_friendly_name("concat1");
+
+    auto& rtInfo1 = concat1->get_rt_info();
+    rtInfo1["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat1");
+
+    const auto concat2 = std::make_shared<ngraph::opset1::Concat>(
+        ngraph::OutputVector { deqBefore2, deqBefore3 },
+        1ull);
+    concat2->set_friendly_name("concat2");
+
+    auto& rtInfo2 = concat2->get_rt_info();
+    rtInfo2["Variant::std::string"] = std::make_shared<VariantWrapper<std::string>>("concat2");
+
+    std::shared_ptr<ngraph::Node> result1 = concat1;
+    std::shared_ptr<ngraph::Node> result2 = concat2;
+    {
+        const std::vector<size_t> kernel = { 3, 3 };
+        const std::vector<size_t> stride = { 1, 1 };
+        const std::vector<size_t> padBegin = { 0, 0 };
+        const std::vector<size_t> padEnd = { 0, 0 };
+        const ngraph::op::PadType padType = ngraph::op::PadType::NOTSET;
+        const ngraph::op::RoundingType roundingType = ngraph::op::RoundingType::FLOOR;
+
+        result2 = std::make_shared<ngraph::opset1::MaxPool>(
+            result2,
+            stride,
+            padBegin,
+            padEnd,
+            kernel,
+            roundingType,
+            padType);
+        result2->set_friendly_name("MaxPool");
+
+        const size_t outputChannels = 9ul;
+        const size_t inputChannels = 6ul;
+
+        {
+            const auto shape = Shape{ 1, inputChannels, 1, 1 };
+            std::shared_ptr<Node> subtractConst = std::make_shared<ngraph::opset1::Constant>(
+                element::u8,
+                shape,
+                std::vector<float>(ngraph::shape_size(shape), 128.f));
+
+            auto subtract = std::make_shared<op::TypeRelaxed<ngraph::pass::low_precision::DequantizationSubtract>>(
+                std::vector<element::Type>{element::f32, element::f32},
+                std::vector<element::Type>{ element::f32 },
+                ngraph::op::TemporaryReplaceOutputType(result2, element::f32).get(),
+                ngraph::op::TemporaryReplaceOutputType(subtractConst, element::f32).get());
+            result2 = subtract;
+        }
+
+        const auto shape = Shape{ outputChannels, inputChannels, 1, 1 };
+        const auto fakeQuantizeOnWeights = std::make_shared<opset1::Constant>(element::i8, shape, std::vector<float>(ngraph::shape_size(shape), 100.f));
+        fakeQuantizeOnWeights->set_friendly_name("fakeQuantizeOnWeights");
+
+        result2 = std::make_shared<ngraph::opset1::Convolution>(
+            ngraph::op::TemporaryReplaceOutputType(result2, precision).get(),
+            ngraph::op::TemporaryReplaceOutputType(fakeQuantizeOnWeights, precision).get(),
+            ngraph::Strides{ 1, 1 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::CoordinateDiff{ 0, 0 },
+            ngraph::Strides{ 1, 1 });
+
+        result2->set_friendly_name("convolution");
+    }
+
+    const std::shared_ptr<ngraph::Node> lastDequantization1 = makeDequantization(result1, dequantizationOperations1);
+    lastDequantization1->set_friendly_name("concat1");
+
+    const std::shared_ptr<ngraph::Node> lastDequantization2 = makeDequantization(result2, dequantizationOperations2);
+    lastDequantization2->set_friendly_name("convolution");
+
+    const ngraph::ResultVector results {
+        std::make_shared<ngraph::opset1::Result>(lastDequantization1),
+        std::make_shared<ngraph::opset1::Result>(lastDequantization2)
+    };
+
+    std::shared_ptr<ngraph::Function> function = std::make_shared<ngraph::Function>(
+        results,
+        ngraph::ParameterVector { input1, input2, input3 },
+        "ConcatWithNeighborsTransformation");
+
+    return function;
+}
+
+std::shared_ptr<Node> PrecisionPropagationFunction::makeMaxPool(const Output<Node>& parent, const std::vector<size_t>& kernel) {
+    const std::vector<size_t> stride = { 1, 1 };
+    const std::vector<size_t> padBegin = { 0, 0 };
+    const std::vector<size_t> padEnd = { 0, 0 };
+    const ngraph::op::PadType padType = ngraph::op::PadType::NOTSET;
+    const ngraph::op::RoundingType roundingType = ngraph::op::RoundingType::FLOOR;
+    const auto pooling = std::make_shared<ngraph::opset1::MaxPool>(
+        parent,
+        stride,
+        padBegin,
+        padEnd,
+        kernel,
+        roundingType,
+        padType);
+    return pooling;
+}
+
+}  // namespace subgraph
+}  // namespace builder
+}  // namespace ngraph
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/transformations_after_split_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/transformations_after_split_function.cpp
index ad8fd6715925ee..16419827f710c3 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/transformations_after_split_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/transformations_after_split_function.cpp
@@ -183,11 +183,13 @@ std::shared_ptr<Node> TransformationsAfterSplitFunction::getLayerByTransformatio
         return makeDequantization(parent, { {element::f32}, {}, { 0.1f } });
     }
     if (transformationName == "FuseSubtractToFakeQuantizeTransformation") {
-        const auto fakeQuantize = makeFakeQuantize(parent, element::f32, { 256, Shape{}, { 0.f }, { 255.f }, { 0.f }, { 127.f } });
+        // INT8 before FakeQuantize, all operations before FakeQuantize have been fused: need to have TypeRelaxed here
+        const auto fakeQuantize = makeFakeQuantizeTypeRelaxed(parent, element::f32, { 256, Shape{}, { 0.f }, { 255.f }, { 0.f }, { 127.f } });
         return makeDequantization(fakeQuantize, { {}, {{ 128.f }, element::f32, {}}, {} });
     }
     if (transformationName == "FuseMultiplyToFakeQuantizeTransformation") {
-        const auto fakeQuantize = makeFakeQuantize(parent, element::f32, { 256, Shape{}, { 0.f }, { 255.f }, { 0.f }, { 127.f } });
+        // INT8 before FakeQuantize, all operations before FakeQuantize have been fused: need to have TypeRelaxed here
+        const auto fakeQuantize = makeFakeQuantizeTypeRelaxed(parent, element::f32, { 256, Shape{}, { 0.f }, { 255.f }, { 0.f }, { 127.f } });
         return makeDequantization(fakeQuantize, { {}, {}, {{ 2.f }, element::f32, {}} });
     }
     if (transformationName == "MultiplyToGroupConvolutionTransformation") {
diff --git a/inference-engine/tests/unit/inference_engine/transformations/low_precision/calclulate_levels_test.cpp b/inference-engine/tests/unit/inference_engine/transformations/low_precision/calclulate_levels_test.cpp
new file mode 100644
index 00000000000000..dded956495af07
--- /dev/null
+++ b/inference-engine/tests/unit/inference_engine/transformations/low_precision/calclulate_levels_test.cpp
@@ -0,0 +1,84 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <ie_blob.h>
+#include <gtest/gtest.h>
+#include "low_precision/network_helper.hpp"
+
+using LPT_CalculateLevelsTestTransformation = ::testing::Test;
+
+namespace {
+
+size_t calculateLevels(
+    const float dataPrecisionMin,
+    const float dataPrecisionMax,
+    const float combinedIntervalLow,
+    const float combinedIntervalHigh,
+    const float minIntervalLow,
+    const float minIntervalHigh) {
+    float dequantizationMul;
+    float dequantizationSub;
+    float updatedOutputLowValue;
+    float updatedOutputHighValue;
+
+    const auto levels = ngraph::pass::low_precision::NetworkHelper::calculateLevels(
+        dataPrecisionMin, dataPrecisionMax,
+        combinedIntervalLow, combinedIntervalHigh,
+        minIntervalLow, minIntervalHigh,
+        dequantizationMul,
+        dequantizationSub,
+        updatedOutputLowValue,
+        updatedOutputHighValue);
+
+    return levels;
+}
+
+} // namespace
+TEST(LPT_CalculateLevelsTestTransformation, calculateLevels_U8_256) {
+    const auto levels = calculateLevels(
+        0.f, ngraph::pass::low_precision::DataPrecision::getMaxValue(256ul),
+        0.f, 2.55f,
+        0.f, 2.55f);
+    ASSERT_EQ(256ul, levels);
+}
+
+TEST(LPT_CalculateLevelsTestTransformation, calculateLevels_I8_256) {
+    const auto levels = calculateLevels(
+        0.f, ngraph::pass::low_precision::DataPrecision::getMaxValue(256ul),
+        -1.28f, 1.27f,
+        -1.28f, 1.27f);
+    ASSERT_EQ(256ul, levels);
+}
+
+TEST(LPT_CalculateLevelsTestTransformation, calculateLevels_U8_128) {
+    const auto levels = calculateLevels(
+        0.f, ngraph::pass::low_precision::DataPrecision::getMaxValue(256ul),
+        0.f, 2.55f,
+        0.f, 2.55f / 2.f);
+    ASSERT_EQ(129ul, levels);
+}
+
+TEST(LPT_CalculateLevelsTestTransformation, calculateLevels_I8_128) {
+    const auto levels = calculateLevels(
+        0.f, ngraph::pass::low_precision::DataPrecision::getMaxValue(256ul),
+        -1.28f, 1.27f,
+        -1.28f / 2.f, 1.27f / 2.f);
+    ASSERT_EQ(129ul, levels);
+}
+
+TEST(LPT_CalculateLevelsTestTransformation, calculateLevels_0) {
+    const auto levels = calculateLevels(
+        0.f, ngraph::pass::low_precision::DataPrecision::getMaxValue(256ul),
+        0.f, 2.55f,
+        0.f, 0.f);
+    ASSERT_EQ(1ul, levels);
+}
+
+TEST(LPT_CalculateLevelsTestTransformation, calculateLevels_3) {
+    const auto levels = calculateLevels(
+        0.f, ngraph::pass::low_precision::DataPrecision::getMaxValue(256ul),
+        0.f, 2.55,
+        0.f, 0.0255f);
+    ASSERT_EQ(4ul, levels);
+}
\ No newline at end of file
diff --git a/ngraph/core/include/ngraph/pass/graph_rewrite.hpp b/ngraph/core/include/ngraph/pass/graph_rewrite.hpp
index c9f11439b44db2..68d4e2fad7f2e6 100644
--- a/ngraph/core/include/ngraph/pass/graph_rewrite.hpp
+++ b/ngraph/core/include/ngraph/pass/graph_rewrite.hpp
@@ -77,6 +77,13 @@ namespace ngraph
                 return node;
             }
 
+            template <typename T>
+            std::shared_ptr<T> register_new_node(const std::shared_ptr<T>& node)
+            {
+                m_new_nodes.push_back(node);
+                return node;
+            }
+
             const std::vector<std::shared_ptr<ngraph::Node>>& get_new_nodes()
             {
                 return m_new_nodes;

From 955c0a6c05076056cea829af52d1696de9a21b09 Mon Sep 17 00:00:00 2001
From: Andrey Sapozhnikov <andrey.sapozhnikov@intel.com>
Date: Mon, 19 Jul 2021 17:46:16 +0300
Subject: [PATCH 03/71] [GNA] KSOFunction test fix (#6678)

* [GNA] KSOFunction test fix

* Lambda for dimensions matching check
---
 .../src/gna_plugin/gna_plugin.cpp             |  5 +-
 .../gna_plugin/optimizer/gna_pass_manager.cpp | 48 +++++++++----------
 .../skip_tests_config.cpp                     |  2 -
 .../eltwise_reshape_activation.cpp            |  3 +-
 4 files changed, 27 insertions(+), 31 deletions(-)

diff --git a/inference-engine/src/gna_plugin/gna_plugin.cpp b/inference-engine/src/gna_plugin/gna_plugin.cpp
index c40b97209e1075..4d565ca0c2d975 100644
--- a/inference-engine/src/gna_plugin/gna_plugin.cpp
+++ b/inference-engine/src/gna_plugin/gna_plugin.cpp
@@ -752,12 +752,14 @@ void GNAPlugin::LoadNetwork(CNNNetwork & _network) {
         passes->registerPass<FuseFQIntoWeightsPass>();
         passes->registerPass<MoveFakeQuantizeLayerIntoQuantParamsPass>();
 
+        passes->registerPass<SubstituteScaleShiftBroadCastPass>();
+        passes->registerPass<BroadcastConstPass>();
+
         passes->registerPass<TransposeWeightsFromNCHWToNHWCPass>();
 
         passes->registerPass<SubstitutePReluPass>();
         passes->registerPass<SubstituteSoftSignPass>();
 
-        passes->registerPass<BroadcastConstPass>();
         passes->registerPass<ReorderMaxPoolPass>();
         passes->registerPass<EltwiseSplitOverChannelsPass>();
         passes->registerPass<InsertSplitAligningFilterPass>();
@@ -775,7 +777,6 @@ void GNAPlugin::LoadNetwork(CNNNetwork & _network) {
 #if GNA_LIB_VER == 2
         passes->registerPass<ForbidActivationFusingPass>();
 #endif
-        passes->registerPass<SubstituteScaleShiftBroadCastPass>();
         passes->registerPass<FuseMultipleIdentitiesPass>();
         passIdx = passes->run(passIdx);
     };
diff --git a/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp b/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
index ae731465025e05..8ab4af9f1083f9 100644
--- a/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
+++ b/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
@@ -1530,16 +1530,7 @@ void SubstituteScaleShiftBroadCastPass::run() {
             continue;
         }
 
-        // only 3d scaleshift supported where number of c is arbitrary
-        auto lastD = reshape_batch ? dataDims[1] : dataDims.back();
-        if (lastD != weightsElements) {
-            THROW_GNA_EXCEPTION << "Unsupported layer: " << l->name
-                                << " should have last dim(" << lastD << ") equal to weights(" << weightsElements << ") length";
-        }
-        if (dataDims.size() == 2) {
-            THROW_GNA_EXCEPTION << "For layer: " << l->name
-                                << " weights size(" << weightsElements<< ") invalid: should match input size of(" << lastD << ")";
-        }
+        // TODO: add broadcasting rules checks
 
         gnalog() << "Substitution ScaleShift broadcast for layer: " << l->name << "\n";
         if (nElements % scaleShift->_weights->size()) {
@@ -2220,6 +2211,17 @@ void TransposeWeightsFromNCHWToNHWCPass::run() {
         }
     };
 
+    auto transpInfoMatchWeightsSize = [](const std::vector<TranspositionInfo> &transpositionInfo, size_t weightsSize, const std::string &layerName) {
+        size_t totalElements = 0;
+        for (auto && transpositionInfoPart : transpositionInfo) {
+            totalElements += transpositionInfoPart.num_transpose_rows * transpositionInfoPart.num_transpose_columns;
+        }
+        if (totalElements != weightsSize) {
+            THROW_GNA_EXCEPTION << layerName << " weights elements from transposition info (" << totalElements
+                                << ") don't match input dimensions (" << weightsSize << ")";
+        }
+    };
+
     for (auto &&l : *pLayers) {
         if (LayerInfo(l).isScaleShift()) {
             std::vector<TranspositionInfo> transpositionInfo;
@@ -2237,6 +2239,10 @@ void TransposeWeightsFromNCHWToNHWCPass::run() {
                 }
                 auto weightable = dynamic_cast<WeightableLayer*>(l.get());
                 IE_ASSERT(weightable != nullptr);
+
+                size_t totalWeights = weightable->_weights->size();
+                transpInfoMatchWeightsSize(transpositionInfo, totalWeights, l->name);
+
                 ConvertTensorFromNCHWToNHWC(weightable->precision.size(), 1, weightable->_weights->size(),
                     weightable->_weights->cbuffer().as<uint8_t*>(), true, transpositionInfo);
                 if (weightable->_biases) {
@@ -2270,14 +2276,9 @@ void TransposeWeightsFromNCHWToNHWCPass::run() {
                         // If we found a split it's not possible to rotate data
                         THROW_GNA_EXCEPTION << l->name << " won't be transposed due to a split before it";
                     }
-                    size_t totalColumns = 0;
-                    for (auto && transpositionInfoPart : transpositionInfo) {
-                        totalColumns += transpositionInfoPart.num_transpose_rows * transpositionInfoPart.num_transpose_columns;
-                    }
-                    if (weightsColumns != totalColumns) {
-                        THROW_GNA_EXCEPTION << l->name << " weights columns from transposition info (" << totalColumns
-                                            << ") don't match input dimensions (" << weightsColumns << ")";
-                    }
+
+                    transpInfoMatchWeightsSize(transpositionInfo, weightsColumns, l->name);
+
                     ConvertTensorFromNCHWToNHWC(precision, weightsRows, weightsColumns, weightable->_weights->cbuffer().as<uint8_t*>(),
                                                 true, transpositionInfo);
                     gnalog() << l->name << " weights rows transposition info:\n";
@@ -2297,14 +2298,9 @@ void TransposeWeightsFromNCHWToNHWCPass::run() {
                         // If we found a concat it's not possible to rotate data
                         THROW_GNA_EXCEPTION << l->name << " won't be transposed due to a concat after it";
                     }
-                    size_t totalRows = 0;
-                    for (const auto& transpositionInfoPart : transpositionInfo) {
-                        totalRows += transpositionInfoPart.num_transpose_rows * transpositionInfoPart.num_transpose_columns;
-                    }
-                    if (weightsRows != totalRows) {
-                        THROW_GNA_EXCEPTION << l->name << " weights rows from transposition info (" << totalRows
-                                            << ") don't match output dimensions (" << weightsRows << ")";
-                    }
+
+                    transpInfoMatchWeightsSize(transpositionInfo, weightsRows, l->name);
+
                     ConvertTensorFromNCHWToNHWC(precision, weightsRows, weightsColumns, weightable->_weights->cbuffer().as<uint8_t*>(),
                                                 false, transpositionInfo);
                     gnalog() << l->name << " weights columns transposition info:\n";
diff --git a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/skip_tests_config.cpp b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/skip_tests_config.cpp
index 589ec41c83dd8d..9d9436db568c5d 100644
--- a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/skip_tests_config.cpp
+++ b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/skip_tests_config.cpp
@@ -44,8 +44,6 @@ std::vector<std::string> disabledTestPatterns() {
         R"(.*ConstantResultSubgraphTest.*inPrc=(U8|I8|I32|U64|I64|BOOL).*)",
         // TODO: Issue 51528
         R"(.*CachingSupport.*_(u8|i16)_.*)",
-        // TODO: Issue 51525
-        R"(.*CachingSupport.*KSOFunction.*)",
         // TODO: Issue 57363 (Param -> Result subgraphs)
         R"(.*smoke_MemoryTest.*LOW_LATENCY.*iteration_count=1_.*)",
         // TODO: Issue 57368 (accuracy)
diff --git a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/eltwise_reshape_activation.cpp b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/eltwise_reshape_activation.cpp
index 8e7af93c892d00..3e97b5b16f6b3d 100644
--- a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/eltwise_reshape_activation.cpp
+++ b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/eltwise_reshape_activation.cpp
@@ -13,7 +13,8 @@ const std::vector<std::vector<std::vector<size_t>>> shapes = {
     {{1, 64}, {64, 1}},
     {{8, 256}, {16, 128}},
     {{6, 384}, {18, 128}},
-    {{8, 2048}, {32, 512}}
+    {{8, 2048}, {32, 512}},
+    {{2, 4, 64, 64}, {1, 8, 64, 64}}
 };
 
 const std::vector<InferenceEngine::Precision> netPrecisions = {

From 48c9eaba565567e95e60f1db497cc5d42ad04342 Mon Sep 17 00:00:00 2001
From: Artyom Anokhov <artyom.anokhov@intel.com>
Date: Mon, 19 Jul 2021 18:38:54 +0300
Subject: [PATCH 04/71] Migrate Deployment Manager tool to Open Source (#6692)

* Migrate Deployment Manager tool to Open Source

* scripts/CMakeLists.txt: Added install rules for deployment manager
---
 scripts/CMakeLists.txt                        |   6 +
 .../deployment_manager/configs/darwin.json    | 106 +++++++
 scripts/deployment_manager/configs/linux.json | 145 +++++++++
 .../deployment_manager/configs/windows.json   | 140 +++++++++
 .../deployment_manager/deployman/config.py    |  97 ++++++
 .../deployment_manager/deployman/logger.py    |  39 +++
 scripts/deployment_manager/deployman/main.py  | 219 +++++++++++++
 scripts/deployment_manager/deployman/ui.py    | 288 ++++++++++++++++++
 .../deployment_manager/deployment_manager.py  |  25 ++
 9 files changed, 1065 insertions(+)
 create mode 100644 scripts/deployment_manager/configs/darwin.json
 create mode 100644 scripts/deployment_manager/configs/linux.json
 create mode 100644 scripts/deployment_manager/configs/windows.json
 create mode 100644 scripts/deployment_manager/deployman/config.py
 create mode 100644 scripts/deployment_manager/deployman/logger.py
 create mode 100644 scripts/deployment_manager/deployman/main.py
 create mode 100644 scripts/deployment_manager/deployman/ui.py
 create mode 100644 scripts/deployment_manager/deployment_manager.py

diff --git a/scripts/CMakeLists.txt b/scripts/CMakeLists.txt
index ac094ce648b46b..a54b5f97f3b93b 100644
--- a/scripts/CMakeLists.txt
+++ b/scripts/CMakeLists.txt
@@ -47,6 +47,12 @@ if(UNIX)
             COMPONENT install_dependencies)
 endif()
 
+# install DeploymentManager
+ie_cpack_add_component(deployment_manager REQUIRED)
+install(DIRECTORY deployment_manager/
+        DESTINATION deployment_tools/tools/deployment_manager
+        COMPONENT deployment_manager)
+
 # install files for demo
 
 ie_cpack_add_component(demo_scripts DEPENDS core)
diff --git a/scripts/deployment_manager/configs/darwin.json b/scripts/deployment_manager/configs/darwin.json
new file mode 100644
index 00000000000000..1ef4e8e443dd64
--- /dev/null
+++ b/scripts/deployment_manager/configs/darwin.json
@@ -0,0 +1,106 @@
+{
+  "version": "0.2",
+  "components": {
+    "setupvars": {
+      "mandatory" : "yes",
+      "files": [
+        "bin"
+      ]
+    },
+    "openvino_license": {
+      "mandatory" : "yes",
+      "files": [
+        "licensing"
+      ]
+    },
+    "ie_core": {
+      "group": ["ie"],
+      "files": [
+        "deployment_tools/inference_engine/version.txt",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine.dylib",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.dylib",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_transformations.dylib",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_preproc.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_ir_reader.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_onnx_reader.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_c_api.dylib",
+        "deployment_tools/inference_engine/lib/intel64/libAutoPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/plugins.xml",
+        "deployment_tools/inference_engine/external/tbb",
+        "deployment_tools/ngraph/lib"
+      ]
+    },
+    "cpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) CPU",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/lib/intel64/libMKLDNNPlugin.so"
+      ]
+    },
+    "vpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Movidius(tm) VPU",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/lib/intel64/libmyriadPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/myriad_compile",
+        "deployment_tools/inference_engine/lib/intel64/myriad_perfcheck",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_legacy.dylib",
+        "deployment_tools/inference_engine/lib/intel64/usb-ma2x8x.mvcmd",
+        "deployment_tools/inference_engine/lib/intel64/pcie-ma2x8x.mvcmd"
+      ]
+    },
+    "opencv": {
+      "ui_name": "OpenCV",
+      "group": ["opencv"],
+      "dependencies" : [],
+      "files": [
+        "opencv/version.txt",
+        "opencv/setupvars.sh",
+        "opencv/lib",
+        "opencv/bin"
+      ]
+    },
+    "python_common": {
+      "group": ["python"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "python/python3",
+        "python/requirements.txt"
+      ]
+    },
+    "python3.6": {
+      "ui_name": "OpenVINO Python API for Python3.6",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.6"
+      ]
+    },
+    "python3.7": {
+      "ui_name": "OpenVINO Python API for Python3.7",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.7"
+      ]
+    },
+    "python3.8": {
+      "ui_name": "OpenVINO Python API for Python3.8",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.8"
+      ]
+    },
+    "python3.9": {
+      "ui_name": "OpenVINO Python API for Python3.9",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.9"
+      ]
+    }
+  }
+}
diff --git a/scripts/deployment_manager/configs/linux.json b/scripts/deployment_manager/configs/linux.json
new file mode 100644
index 00000000000000..e832ab933a0fba
--- /dev/null
+++ b/scripts/deployment_manager/configs/linux.json
@@ -0,0 +1,145 @@
+{
+  "version": "0.2",
+  "components": {
+    "setupvars": {
+      "mandatory" : "yes",
+      "files": [
+        "bin"
+      ]
+    },
+    "openvino_dependencies": {
+      "mandatory" : "yes",
+      "files": [
+        "install_dependencies/install_openvino_dependencies.sh"
+      ]
+    },
+    "openvino_license": {
+      "mandatory" : "yes",
+      "files": [
+        "licensing"
+      ]
+    },
+    "ie_core": {
+      "group": ["ie"],
+      "files": [
+        "deployment_tools/inference_engine/version.txt",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_transformations.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_preproc.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_ir_reader.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_onnx_reader.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_c_api.so",
+        "deployment_tools/inference_engine/lib/intel64/libAutoPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/plugins.xml",
+        "deployment_tools/inference_engine/external/tbb",
+        "deployment_tools/ngraph/lib"
+      ]
+    },
+    "cpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) CPU",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/lib/intel64/libMKLDNNPlugin.so"
+      ]
+    },
+    "gpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Processor Graphics",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/lib/intel64/cache.json",
+        "deployment_tools/inference_engine/lib/intel64/libclDNNPlugin.so",
+        "install_dependencies/install_NEO_OCL_driver.sh"
+      ]
+    },
+    "vpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Movidius(tm) VPU",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/external/97-myriad-usbboot.rules",
+        "deployment_tools/inference_engine/lib/intel64/usb-ma2x8x.mvcmd",
+        "deployment_tools/inference_engine/lib/intel64/pcie-ma2x8x.mvcmd",
+        "deployment_tools/inference_engine/lib/intel64/libmyriadPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/myriad_compile",
+        "deployment_tools/inference_engine/lib/intel64/myriad_perfcheck",
+        "deployment_tools/inference_engine/lib/intel64/vpu_custom_kernels",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_legacy.so",
+        "install_dependencies/install_NCS_udev_rules.sh"
+      ]
+    },
+    "gna": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Gaussian Neural Accelerator",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/external/gna",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_legacy.so",
+        "deployment_tools/inference_engine/lib/intel64/libGNAPlugin.so"
+      ]
+    },
+    "hddl": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Vision Accelerator Design with\n\t   Intel(R) Movidius(tm) VPUs",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/lib/intel64/libHDDLPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_legacy.so",
+        "deployment_tools/inference_engine/external/hddl"
+      ]
+    },
+    "opencv": {
+      "ui_name": "OpenCV",
+      "group": ["opencv"],
+      "dependencies" : [],
+      "files": [
+        "opencv/version.txt",
+        "opencv/setupvars.sh",
+        "opencv/lib",
+        "opencv/bin"
+      ]
+    },
+    "python_common": {
+      "group": ["python"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "python/python3",
+        "python/requirements.txt"
+      ]
+    },
+    "python3.6": {
+      "ui_name": "OpenVINO Python API for Python3.6",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.6"
+      ]
+    },
+    "python3.7": {
+      "ui_name": "OpenVINO Python API for Python3.7",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.7"
+      ]
+    },
+    "python3.8": {
+      "ui_name": "OpenVINO Python API for Python3.8",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.8"
+      ]
+    },
+    "python3.9": {
+      "ui_name": "OpenVINO Python API for Python3.9",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.9"
+      ]
+    }
+  }
+}
diff --git a/scripts/deployment_manager/configs/windows.json b/scripts/deployment_manager/configs/windows.json
new file mode 100644
index 00000000000000..02fec694d38588
--- /dev/null
+++ b/scripts/deployment_manager/configs/windows.json
@@ -0,0 +1,140 @@
+{
+  "version": "0.2",
+  "components": {
+    "setupvars": {
+      "mandatory" : "yes",
+      "files": [
+        "bin"
+      ]
+    },
+    "openvino_license": {
+      "mandatory" : "yes",
+      "files": [
+        "licensing"
+      ]
+    },
+    "ie_core": {
+      "group": ["ie"],
+      "files": [
+        "deployment_tools/inference_engine/version.txt",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_lp_transformations.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_transformations.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_preproc.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_ir_reader.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_onnx_reader.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_c_api.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/AutoPlugin.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/plugins.xml",
+        "deployment_tools/inference_engine/lib/intel64/Release/inference_engine.lib",
+        "deployment_tools/inference_engine/lib/intel64/Release/inference_engine_transformations.lib",
+        "deployment_tools/inference_engine/lib/intel64/Release/inference_engine_c_api.lib",
+        "deployment_tools/inference_engine/external/tbb",
+        "deployment_tools/ngraph/lib"
+      ]
+    },
+    "cpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) CPU",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/bin/intel64/Release/MKLDNNPlugin.dll"
+      ]
+    },
+    "gpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Processor Graphics",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/bin/intel64/Release/cache.json",
+        "deployment_tools/inference_engine/bin/intel64/Release/clDNNPlugin.dll"
+      ]
+    },
+    "vpu": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Movidius(tm) VPU",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/bin/intel64/Release/usb-ma2x8x.mvcmd",
+        "deployment_tools/inference_engine/bin/intel64/Release/pcie-ma2x8x.elf",
+        "deployment_tools/inference_engine/bin/intel64/Release/myriadPlugin.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_legacy.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/myriad_compile.exe",
+        "deployment_tools/inference_engine/bin/intel64/Release/myriad_perfcheck.exe"
+      ]
+    },
+    "gna": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Gaussian Neural Accelerator",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/bin/intel64/Release/gna.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_legacy.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/GNAPlugin.dll"
+      ]
+    },
+    "hddl": {
+      "ui_name": "Inference Engine Runtime for Intel(R) Vision Accelerator Design with\n\t   Intel(R) Movidius(tm) VPUs",
+      "group": ["ie"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "deployment_tools/inference_engine/bin/intel64/Release/HDDLPlugin.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_legacy.dll",
+        "deployment_tools/inference_engine/bin/intel64/Release/hddl_perfcheck.exe",
+        "deployment_tools/inference_engine/external/MovidiusDriver",
+        "deployment_tools/inference_engine/external/hddl"
+      ]
+    },
+    "opencv": {
+      "ui_name": "OpenCV",
+      "group": ["opencv"],
+      "dependencies" : [],
+      "files": [
+        "opencv/version.txt",
+        "opencv/setupvars.bat",
+        "opencv/lib",
+        "opencv/bin"
+      ]
+    },
+    "python_common": {
+      "group": ["python"],
+      "dependencies" : ["ie_core"],
+      "files": [
+        "python/python3",
+        "python/requirements.txt"
+      ]
+    },
+    "python3.6": {
+      "ui_name": "OpenVINO Python API for Python3.6",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.6"
+      ]
+    },
+    "python3.7": {
+      "ui_name": "OpenVINO Python API for Python3.7",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.7"
+      ]
+    },
+    "python3.8": {
+      "ui_name": "OpenVINO Python API for Python3.8",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.8"
+      ]
+    },
+    "python3.9": {
+      "ui_name": "OpenVINO Python API for Python3.9",
+      "group": ["python"],
+      "dependencies" : ["ie_core", "python_common"],
+      "files": [
+        "python/python3.9"
+      ]
+    }
+  }
+}
diff --git a/scripts/deployment_manager/deployman/config.py b/scripts/deployment_manager/deployman/config.py
new file mode 100644
index 00000000000000..91fff2870a0a66
--- /dev/null
+++ b/scripts/deployment_manager/deployman/config.py
@@ -0,0 +1,97 @@
+"""
+ Copyright (c) 2018-2021 Intel Corporation
+
+ Licensed under the Apache License, Version 2.0 (the "License");
+ you may not use this file except in compliance with the License.
+ You may obtain a copy of the License at
+
+      http://www.apache.org/licenses/LICENSE-2.0
+
+ Unless required by applicable law or agreed to in writing, software
+ distributed under the License is distributed on an "AS IS" BASIS,
+ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ See the License for the specific language governing permissions and
+ limitations under the License.
+"""
+
+import os
+import platform
+from shutil import copytree, copy
+import json
+
+
+# class that works with the components from config
+class Component:
+    def __init__(self, name, properties, logger):
+        self.name = name
+        for k, v in properties.items():
+            setattr(self, k, str(v, 'utf-8') if isinstance(v, bytes) else v)
+        self.available = True
+        self.invisible = 'ui_name' not in properties
+        self.selected = False
+        self.logger = logger
+        self.root_dir = os.getenv('INTEL_OPENVINO_DIR',
+                                  os.path.abspath(os.path.join(os.path.dirname(__file__),
+                                                               os.pardir, os.pardir,
+                                                               os.pardir, os.pardir)))
+
+    def is_exist(self):
+        self.logger.debug("Checking {} component...".format(self.name))
+        for obj in self.files:
+            obj = os.path.join(self.root_dir, obj)
+            if not (os.path.isfile(obj) or os.path.isdir(obj)):
+                self.logger.warning("[{}] Missing {}".format(self.name, obj))
+                self.available = False
+                self.selected = False
+                return False
+        return True
+
+    def invert_selection(self):
+        self.selected = not self.selected
+
+    def set_value(self, attr, value):
+        setattr(self, attr, value)
+
+    def copy_files(self, destination):
+        if not self.is_exist():
+            raise FileNotFoundError("Files for component {} not found. "
+                                    "Please check your OpenVINO installation".
+                                    format(self.name))
+        else:
+            if not os.path.exists(destination):
+                os.makedirs(destination)
+            for obj in self.files:
+                src = os.path.join(self.root_dir, obj.strip('\n'))
+                dst = os.path.join(destination, obj.strip('\n'))
+                self.logger.debug("[{}] Copy files:: Processing {}...".format(self.name, src))
+                if not os.path.exists(os.path.dirname(dst)):
+                    os.makedirs(os.path.dirname(dst))
+                if os.path.isdir(src):
+                    copytree(src, dst, symlinks=True)
+                else:
+                    copy(src, dst)
+
+
+class ComponentFactory:
+    @staticmethod
+    def create_component(name, properties, logger):
+        return Component(name, properties, logger)
+
+
+# class that operating with JSON configs
+class ConfigReader:
+    def __init__(self, logger):
+        logger.info("Determining the current OS for config selection...")
+        current_os = platform.system().lower()
+        cfg_path = os.path.join(os.path.dirname(__file__), os.pardir,
+                                "configs/{}.json".format(current_os))
+        if os.path.isfile(cfg_path):
+            logger.info("Loading {}.cfg...".format(current_os))
+            with open(cfg_path, encoding='utf-8') as main_cfg:
+                self.cfg = json.load(main_cfg)
+            self.version = self.cfg['version']
+            self.components = self.cfg['components']
+            logger.info("Successfully loaded.\nConfig version: {}".format(self.version))
+        else:
+            raise RuntimeError("Config can't be found at {}".format(os.path.abspath(cfg_path)))
+
diff --git a/scripts/deployment_manager/deployman/logger.py b/scripts/deployment_manager/deployman/logger.py
new file mode 100644
index 00000000000000..4231d7585f1bc1
--- /dev/null
+++ b/scripts/deployment_manager/deployman/logger.py
@@ -0,0 +1,39 @@
+"""
+ Copyright (c) 2018-2021 Intel Corporation
+
+ Licensed under the Apache License, Version 2.0 (the "License");
+ you may not use this file except in compliance with the License.
+ You may obtain a copy of the License at
+
+      http://www.apache.org/licenses/LICENSE-2.0
+
+ Unless required by applicable law or agreed to in writing, software
+ distributed under the License is distributed on an "AS IS" BASIS,
+ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ See the License for the specific language governing permissions and
+ limitations under the License.
+"""
+
+import logging as log
+
+
+def init_logger(lvl: str):
+    # create logger
+    logger = log.getLogger('DeploymentManager')
+    logger.setLevel(lvl)
+
+    # create console handler and set level to debug
+    ch = log.StreamHandler()
+    ch.setLevel(log.DEBUG)
+
+    # create formatter
+    formatter = log.Formatter('[ %(asctime)s ] %(levelname)s : %(message)s')
+
+    # add formatter to ch
+    ch.setFormatter(formatter)
+
+    # add ch to logger
+    logger.addHandler(ch)
+
+    return logger
+
diff --git a/scripts/deployment_manager/deployman/main.py b/scripts/deployment_manager/deployman/main.py
new file mode 100644
index 00000000000000..c87037244f6337
--- /dev/null
+++ b/scripts/deployment_manager/deployman/main.py
@@ -0,0 +1,219 @@
+"""
+ Copyright (c) 2018-2021 Intel Corporation
+
+ Licensed under the Apache License, Version 2.0 (the "License");
+ you may not use this file except in compliance with the License.
+ You may obtain a copy of the License at
+
+      http://www.apache.org/licenses/LICENSE-2.0
+
+ Unless required by applicable law or agreed to in writing, software
+ distributed under the License is distributed on an "AS IS" BASIS,
+ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ See the License for the specific language governing permissions and
+ limitations under the License.
+"""
+
+__version__ = '0.6'
+
+import os
+import argparse
+import tempfile
+from pathlib import Path
+from typing import List
+
+from deployman.logger import init_logger
+from deployman.config import ConfigReader, ComponentFactory, Component
+from deployman.ui import UserInterface
+
+logger = init_logger('WARNING')
+
+
+# main class
+class DeploymentManager:
+    def __init__(self, args, selected_targets: List[Component], components: List[Component]):
+        self.args = args
+        self.selected_targets = selected_targets
+        self.components = components
+        self.dependencies = []
+        self.mandatory_components = []
+
+    def get_dependencies(self):
+        dependencies_names = []
+        logger.debug("Updating dependencies...")
+        for target in self.selected_targets:
+            if hasattr(target, 'dependencies'):
+                dependencies_names.extend(target.dependencies)
+        # remove duplications
+        dependencies_names = list(dict.fromkeys(dependencies_names))
+        for dependency in dependencies_names:
+            _target: Component
+            for _target in self.components:
+                if _target.name != dependency:
+                    continue
+                if not _target.is_exist():
+                    FileNotFoundError("Dependency {} not available.".format(_target.name))
+                self.dependencies.append(_target)
+
+    def get_mandatory_component(self):
+        for _target in self.components:
+            _target: Component
+            if hasattr(_target, 'mandatory'):
+                if not _target.is_exist():
+                    FileNotFoundError("Mandatory component {} not available.".format(_target.name))
+                self.mandatory_components.append(_target)
+
+    @staticmethod
+    def packing_binaries(archive_name: str, target_dir: str, source_dir: str):
+        logger.info('Archiving deploy package')
+        if os.name == 'posix':
+            archive_path = DeploymentManager.packing_binaries_posix(archive_name, target_dir, source_dir)
+        else:
+            archive_path = DeploymentManager.packing_binaries_windows(archive_name, target_dir, source_dir)
+        logger.setLevel('INFO')
+        logger.info("Deployment archive is ready. "
+                    "You can find it here:\n\t{}".format(os.path.join(target_dir, archive_path)))
+
+    @staticmethod
+    def packing_binaries_posix(archive_name: str, target_dir: str, source_dir: str) -> str:
+        extension = 'tar.gz'
+        archive_file_name = '{}.{}'.format(archive_name, extension)
+        archive_path = os.path.join(target_dir, archive_file_name)
+
+        import tarfile
+        with tarfile.open(archive_path, "w:gz") as tar_pac:
+            total_files_number = DeploymentManager.count_files_number(source_dir)
+            count = 0
+            logger.info('Total number of files to add to the package: {}'.format(total_files_number))
+            for root, dirs, files in os.walk(source_dir):
+                for file in files:
+                    count += 1
+                    full_path = os.path.join(root, file)
+                    if not os.path.isfile(full_path):
+                        continue
+                    relative_path = str(Path(full_path).relative_to(source_dir))
+                    logger.info('Add {} {}/{} file to the package'.format(relative_path,
+                                                                          count,
+                                                                          total_files_number))
+                    tar_pac.add(full_path, arcname=relative_path)
+        return archive_path
+
+    @staticmethod
+    def packing_binaries_windows(archive_name: str, target_dir: str, source_dir: str) -> str:
+        extension = 'zip'
+        archive_file_name = '{}.{}'.format(archive_name, extension)
+        archive_path = os.path.join(target_dir, archive_file_name)
+
+        from zipfile import ZipFile
+        with ZipFile(archive_path, "w") as zip_pac:
+            total_files_number = DeploymentManager.count_files_number(source_dir)
+            count = 0
+            logger.info('Total number of files to add to the package: {}'.format(total_files_number))
+            for root, dirs, files in os.walk(source_dir):
+                for file in files:
+                    count += 1
+                    full_path = os.path.join(root, file)
+                    if not os.path.isfile(full_path):
+                        continue
+                    relative_path = str(Path(full_path).relative_to(source_dir))
+                    logger.info('Add {} {}/{} file to the package'.format(relative_path,
+                                                                          count,
+                                                                          total_files_number))
+                    zip_pac.write(os.path.join(root, file), arcname=relative_path)
+        return archive_path
+
+    @staticmethod
+    def count_files_number(source_dir: str) -> int:
+        total_files_number = 0
+        for root, dirs, files in os.walk(source_dir):
+            total_files_number += len(files)
+        return total_files_number
+
+    def process(self):
+        # get dependencies if have
+        self.get_dependencies()
+        # get mandatory components
+        self.get_mandatory_component()
+
+        logger.info('Collection information for components')
+        with tempfile.TemporaryDirectory() as tmpdirname:
+            for target in self.selected_targets:
+                target: Component
+                target.copy_files(tmpdirname)
+            if self.dependencies:
+                for dependency in self.dependencies:
+                    dependency: Component
+                    dependency.copy_files(tmpdirname)
+            if self.mandatory_components:
+                for target in self.mandatory_components:
+                    target: Component
+                    target.copy_files(tmpdirname)
+            if self.args.user_data and os.path.exists(self.args.user_data):
+                from shutil import copytree
+                logger.info('Storing user data for deploy package ')
+                copytree(self.args.user_data,
+                         os.path.join(
+                             tmpdirname,
+                             os.path.basename(self.args.user_data.rstrip(os.path.sep))),
+                         symlinks=True)
+            self.packing_binaries(self.args.archive_name,
+                                  self.args.output_dir, tmpdirname)
+
+
+def main():
+    # read main config
+    cfg = ConfigReader(logger)
+
+    # here we store all components
+    components = []
+
+    for component in cfg.components:
+        components.append(ComponentFactory.create_component(component,
+                                                            cfg.components[component],
+                                                            logger))
+
+    # list for only available components
+    available_targets = []
+    help_msg = ''
+
+    for component in components:
+        if component.is_exist() and not component.invisible:
+            available_targets.append(component)
+            help_msg += "{} - {}\n".format(component.name, component.ui_name)
+
+    parser = argparse.ArgumentParser(description="", formatter_class=argparse.RawTextHelpFormatter)
+
+    parser.add_argument("--targets", nargs="+", help="List of targets."
+                                                     "Possible values: \n{}".format(help_msg))
+    parser.add_argument("--user_data", type=str, help="Path to user data that will be added to "
+                                                      "the deployment package", default=None)
+    parser.add_argument("--output_dir", type=str, help="Output directory for deployment archive",
+                        default=os.getenv("HOME", os.path.join(os.path.join(
+                            os.path.dirname(__file__), os.pardir))))
+    parser.add_argument("--archive_name", type=str, help="Name for deployment archive",
+                        default="openvino_deploy_package", )
+    parser.add_argument("--version", action="version", version="%(prog)s " + __version__)
+
+    logger.info("Parsing command line arguments")
+    args = parser.parse_args()
+
+    selected_targets = []
+    if not available_targets:
+        exit("No available targets to packaging detected.\n"
+             "Please check your OpenVINO installation.")
+
+    ui = UserInterface(__version__, args, available_targets, logger)
+    if not args.targets:
+        ui.run()
+        selected_targets = ui.get_selected_targets()
+        args = ui.args
+    else:
+        for target in args.targets:
+            target_name = target.lower()
+            if not any(target_name == _target.name.lower() for _target in available_targets):
+                raise ValueError("You input incorrect target. {} is not available.".format(target_name))
+            for _target in available_targets:
+                if _target.name.lower() == target_name:
+                    selected_targets.append(_target)
+    _manager = DeploymentManager(args, selected_targets, components)
+    _manager.process()
diff --git a/scripts/deployment_manager/deployman/ui.py b/scripts/deployment_manager/deployman/ui.py
new file mode 100644
index 00000000000000..f8831de32ab81e
--- /dev/null
+++ b/scripts/deployment_manager/deployman/ui.py
@@ -0,0 +1,288 @@
+"""
+ Copyright (c) 2018-2021 Intel Corporation
+
+ Licensed under the Apache License, Version 2.0 (the "License");
+ you may not use this file except in compliance with the License.
+ You may obtain a copy of the License at
+
+      http://www.apache.org/licenses/LICENSE-2.0
+
+ Unless required by applicable law or agreed to in writing, software
+ distributed under the License is distributed on an "AS IS" BASIS,
+ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ See the License for the specific language governing permissions and
+ limitations under the License.
+"""
+
+import os
+
+
+class Button:
+    def __init__(self, shortcut: str, message: str, action):
+        self.shortcut = str(shortcut)
+        self.message = message
+        self.action = action
+
+    def press(self, *args):
+        self.action(*args)
+
+    def draw(self):
+        print("\t{}. {}".format(self.shortcut, self.message))
+
+
+class ButtonFactory:
+    @staticmethod
+    def create_button(shortcut, message, action):
+        return globals()["Button"](shortcut, message, action)
+
+
+class Controls:
+    def __init__(self, button_map):
+        self.controls = []
+        for btn in button_map:
+            self.controls.append(
+                ButtonFactory.create_button(shortcut=btn["shortcut"],
+                                            message=btn["message"],
+                                            action=btn["action"]))
+
+    def update_button(self, btn, attr, value):
+        for _btn in self.controls:
+            _btn: Button
+            if btn == _btn.shortcut:
+                setattr(_btn, attr, value)
+
+    def get_controls(self):
+        return self.controls
+
+
+# view for User Interface
+class ConsoleMenu:
+    def __init__(self, control_buttons: Controls, user_input_msg: str, hdrs: list, targets=False):
+        self.control_buttons = control_buttons
+        self.targets = targets
+        self.ui_msg = user_input_msg
+        self.headers = hdrs
+
+    @staticmethod
+    def clear():
+        _ = os.system('clear' if os.name == 'posix' else 'cls')
+
+    @staticmethod
+    def print_msg(messages):
+        print("\n".join(messages))
+
+    @staticmethod
+    def br(num: int = 1):
+        print("\n"*num)
+
+    def sync(self, attr, value):
+        setattr(self, attr, value)
+        print(getattr(self, attr))
+
+    def draw(self):
+        self.clear()
+        self.print_msg(self.headers)
+        if self.targets:
+            for target in self.targets:
+                print("\t{}. [{}] {}\n".format(self.targets.index(target) + 1,
+                                               'x' if target.selected else ' ',
+                                               target.ui_name))
+            self.br()
+        for btn in self.control_buttons.get_controls():
+            btn: Button
+            btn.draw()
+        return input(self.ui_msg)
+
+
+# class that operating with User Interface
+class UserInterface:
+    def __init__(self, version, args, targets, logger):
+        self.args = args
+        self.available_targets = targets
+        self.is_running = True
+        self.separator = '-' * 80
+        self.user_input = ''
+        self._active_menu = ''
+        self._active_controls = ''
+        self.us_buttons = ''
+        self.fn_buttons = ''
+        self.version = version
+        self.logger = logger
+
+    def get_selected_targets_uinames(self):
+        return [t.ui_name for t in self.available_targets if t.selected]
+
+    def get_selected_targets(self):
+        return [t for t in self.available_targets if t.selected]
+
+    @staticmethod
+    def print_msg(messages):
+        print("\n".join(messages))
+
+    def print_selections(self):
+        for target in self.available_targets:
+            print("\t{}. [{}] {}\n".format(self.available_targets.index(target) + 1,
+                                           'x' if target.selected else ' ',
+                                           target.ui_name))
+
+    def apply_value_to_targets(self, attr, value):
+        for target in self.available_targets:
+            target.set_value(attr, value)
+
+    def select_deselect_all(self):
+        if any(not target.selected for target in self.available_targets):
+            self.apply_value_to_targets('selected', True)
+        else:
+            self.apply_value_to_targets('selected', False)
+
+    def switch_menu(self, menu: ConsoleMenu, controls):
+        self._active_menu = menu
+        self._active_controls = controls
+
+    def process_user_input(self, buttons):
+        if self.user_input == '':
+            self.user_input = 'g'
+        for button in buttons:
+            if self.user_input == button.shortcut:
+                button.press()
+
+    def update_output_dir(self):
+        try:
+            import readline
+            readline.parse_and_bind("tab: complete")
+            readline.set_completer_delims(' \t\n`~!@#$%^&*()-=+[{]}\\|;:\'",<>?')
+        except ImportError:
+            # Module readline is not available
+            pass
+        self.args.output_dir = input("Please type the full path to the output directory:")
+        self.fn_buttons: Controls
+        self.fn_buttons.update_button('o', 'message', "Change output directory [ {} ] ".format(
+            self.args.output_dir))
+
+    def update_user_data(self):
+        try:
+            import readline
+            readline.parse_and_bind("tab: complete")
+            readline.set_completer_delims(' \t\n`~!@#$%^&*()-=+[{]}\\|;:\'",<>?')
+        except ImportError:
+            # Module readline is not available
+            pass
+        self.args.user_data = input("Please type the full path to the folder with user data:")
+        self.fn_buttons: Controls
+        self.fn_buttons.update_button('u', 'message', "Provide(or change) path to folder with user "
+                                                      "data\n\t   (IRs, models, your application,"
+                                                      " and associated dependencies) "
+                                                      "[ {} ]".format(self.args.user_data))
+
+    def update_archive_name(self):
+        self.args.archive_name = input("Please type name of archive without extension:")
+        self.fn_buttons: Controls
+        self.fn_buttons.update_button('t', 'message', "Change archive name "
+                                                      "[ {} ]".format(self.args.archive_name))
+
+    def dynamic_fn_header_update(self):
+        return ["Deployment Manager\nVersion " + self.version,
+                self.separator, "Review the targets below that will be added "
+                                "into the deployment package.\n"
+                                "If needed, change the output directory or "
+                                "add additional user data from the specific folder.\n",
+                self.separator, "",
+                "\nSelected targets:\n\t - {}".format(
+                    "\n\t - ".join(self.get_selected_targets_uinames())), "\n" * 2]
+
+    def stop(self):
+        self.is_running = False
+
+    def run(self):
+        user_selection_map = [
+            {
+                "shortcut": "a",
+                "message": "Select/deselect all\n",
+                "action": self.select_deselect_all,
+            },
+            {
+                "shortcut": "q",
+                "message": "Cancel and exit",
+                "action": exit
+            }
+        ]
+
+        finalization_map = [
+            {
+                "shortcut": "b",
+                "message": "Back to selection dialog",
+                "action": '',
+            },
+            {
+                "shortcut": "o",
+                "message": "Change output directory [ {} ] ".format(
+                    os.path.realpath(self.args.output_dir)),
+                "action": self.update_output_dir,
+            },
+            {
+                "shortcut": "u",
+                "message": "Provide(or change) path to folder with user data\n\t   (IRs, models, "
+                           "your application, and associated dependencies) "
+                           "[ {} ]".format(self.args.user_data),
+                "action": self.update_user_data,
+            },
+            {
+                "shortcut": "t",
+                "message": "Change archive name [ {} ]".format(self.args.archive_name),
+                "action": self.update_archive_name,
+            },
+            {
+                "shortcut": "g",
+                "message": "Generate package with current selection [ default ]",
+                "action": self.stop,
+            },
+            {
+                "shortcut": "q",
+                "message": "Cancel and exit",
+                "action": exit
+            }
+        ]
+
+        us_hdrs = ["Deployment Manager\nVersion " + self.version,
+                   self.separator]
+        self.us_buttons = Controls(user_selection_map)
+        us_imsg = "\nAdd or remove items by typing the number and hitting \"Enter\"\n" \
+                  "Press \"Enter\" to continue.\n" + self.separator + "\n"
+
+        fn_hdrs = self.dynamic_fn_header_update()
+        self.fn_buttons = Controls(finalization_map)
+        fn_imsg = self.separator + "\nPlease type a selection or press \"Enter\" "
+
+        selection_menu = ConsoleMenu(self.us_buttons, us_imsg, us_hdrs, self.available_targets)
+        finalization_menu = ConsoleMenu(self.fn_buttons, fn_imsg, fn_hdrs)
+
+        checkboxes = []
+        for target in self.available_targets:
+            checkboxes.append(
+                ButtonFactory.create_button(shortcut=self.available_targets.index(target) + 1,
+                                            message='',
+                                            action=target.invert_selection))
+
+        def switch_fmenu():
+            if len(self.get_selected_targets()) > 0:
+                finalization_menu.sync('headers', self.dynamic_fn_header_update())
+                self.switch_menu(finalization_menu, self.fn_buttons.get_controls())
+            else:
+                self.logger.error("Unable to generate package. No components selected.")
+                switch_usmenu()
+
+        next_btn = Button('g', '', switch_fmenu)
+
+        def switch_usmenu():
+            self.switch_menu(selection_menu,
+                             self.us_buttons.get_controls() + checkboxes + [next_btn])
+
+        self.fn_buttons.update_button('b', 'action', switch_usmenu)
+
+        self._active_menu = selection_menu
+        self._active_controls = self.us_buttons.get_controls() + checkboxes + [next_btn]
+        while self.is_running:
+            self.user_input = self._active_menu.draw().lower()
+            self.process_user_input(self._active_controls)
+        return self.available_targets, self.args
+
diff --git a/scripts/deployment_manager/deployment_manager.py b/scripts/deployment_manager/deployment_manager.py
new file mode 100644
index 00000000000000..d6cd24136366d2
--- /dev/null
+++ b/scripts/deployment_manager/deployment_manager.py
@@ -0,0 +1,25 @@
+#!/usr/bin/env python3
+"""
+ Copyright (c) 2018-2021 Intel Corporation
+
+ Licensed under the Apache License, Version 2.0 (the "License");
+ you may not use this file except in compliance with the License.
+ You may obtain a copy of the License at
+
+      http://www.apache.org/licenses/LICENSE-2.0
+
+ Unless required by applicable law or agreed to in writing, software
+ distributed under the License is distributed on an "AS IS" BASIS,
+ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ See the License for the specific language governing permissions and
+ limitations under the License.
+"""
+
+import sys
+
+if sys.version_info[0] < 3 or (sys.version_info[0] == 3 and sys.version_info[1] < 6):
+    exit("Python* 3.6 or higher is required to run the Deployment Manager.")
+
+if __name__ == '__main__':
+    from deployman.main import main
+    sys.exit(main())

From 960ba48e6f6d19c1518d94d12c868c6beb728e63 Mon Sep 17 00:00:00 2001
From: Maxim Vafin <maxim.vafin@intel.com>
Date: Mon, 19 Jul 2021 20:10:00 +0300
Subject: [PATCH 05/71] Rework model loading in FE manager, implement PDPD
 probing (#6358)

* Rework model loading in FE manager, implement PDPD probing

* Fix build

* Fix build

* Fix build

* Fix unicode

* Fix merge issues

* Fix codestyle

* Read frontends path from frontend_manager library location

* Fix codestyle

* Fix FE dependency

* Fix dependencies

* Fix codestyle

* Check if model file exists

* Revert adding model to lfs

* Add test model

* Fix cmake dependencies

* Apply review feedback

* Revert pugixml

* make getFrontendLibraryPath not public API

* Fix codestyle

* Apply fix from Ilya Lavrenov

* Add FE dependency in legacy tests

* Remove not needed dependency

* Better support Unicode

* Fix build

* Fix build

* Fix build

* Add dependency foe deprecated tests

* Fix dependency

* Fix typo

* Revert adding FE dependency to IESharedTests

* Remove relative paths from frontend unit tests

* Apply review feedback

* Fix typo

* Return allow-undefined, since kmb dependecies fail to link

* Fix merge conflict

* Compare functions in reader tests

* Simplify code to load from variants

* Remove supported_by_arguments from public api

* Fix codestyle

* Fix build

* Compare names in reader tests

* Fix wchar in variant

Co-authored-by: Ilya Churaev <ilya.churaev@intel.com>
---
 .../templates/InferenceEngineConfig.cmake.in  |   4 +
 .../src/inference_engine/CMakeLists.txt       |   5 +-
 .../inference_engine/ie_network_reader.cpp    |  23 ++-
 .../inference_engine/CMakeLists.txt           |   5 +
 .../pdpd_reader/models/relu.pdmodel           | Bin 0 -> 7839 bytes
 ...6\227\245\346\234\254\350\252\236.pdmodel" | Bin 0 -> 7839 bytes
 .../pdpd_reader/read_pdpd_model_test.cpp      |  84 +++++++++
 model-optimizer/mo/moc_frontend/pipeline.py   |   2 +-
 .../mock_mo_frontend.cpp                      |   2 +-
 .../mock_mo_frontend.hpp                      |  20 ++-
 .../mock_mo_python_api/mock_mo_python_api.cpp |   1 -
 ngraph/core/include/ngraph/variant.hpp        |  23 +++
 .../include/frontend_manager/frontend.hpp     |  75 ++++----
 .../frontend_manager/frontend_manager.hpp     |  77 ++++----
 .../frontend_manager/src/frontend_manager.cpp |  64 +++----
 .../frontend/frontend_manager/src/utils.cpp   |  68 +++++++
 .../frontend/frontend_manager/src/utils.hpp   |  14 ++
 .../paddlepaddle_frontend/frontend.hpp        |  55 +++---
 .../include/paddlepaddle_frontend/model.hpp   |   4 +-
 ngraph/frontend/paddlepaddle/src/frontend.cpp | 166 ++++++++++++++----
 ngraph/frontend/paddlepaddle/src/model.cpp    | 135 ++++++++++----
 ngraph/frontend/paddlepaddle/src/op/scale.cpp |   8 +-
 .../frontend/paddlepaddle/src/pdpd_utils.hpp  |  51 ++++++
 ngraph/python/src/ngraph/__init__.py          |   1 -
 ngraph/python/src/ngraph/frontend/__init__.py |   1 -
 .../python/src/pyngraph/frontend/frontend.cpp |  11 +-
 .../pyngraph/frontend/frontend_manager.cpp    |  29 ---
 .../pyngraph/frontend/frontend_manager.hpp    |   1 -
 ngraph/python/src/pyngraph/pyngraph.cpp       |   1 -
 .../mock_py_frontend.cpp                      |   2 +-
 .../mock_py_frontend.hpp                      |   9 +-
 .../pyngraph_mock_frontend_api.cpp            |   1 -
 .../tests/test_ngraph/test_frontendmanager.py |  37 +---
 ngraph/test/CMakeLists.txt                    |   1 +
 ngraph/test/frontend/frontend_manager.cpp     |  36 +---
 ngraph/test/frontend/mock_frontend.cpp        |   2 +-
 .../test/frontend/paddlepaddle/basic_api.cpp  |   2 +-
 .../paddlepaddle/cut_specific_model.cpp       |   2 +-
 .../test/frontend/paddlepaddle/load_from.cpp  |   2 +-
 .../frontend/paddlepaddle/partial_shape.cpp   |   2 +-
 .../paddlepaddle/set_element_type.cpp         |   2 +-
 ngraph/test/frontend/shared/src/basic_api.cpp |   6 +-
 .../shared/src/cut_specific_model.cpp         |   6 +-
 ngraph/test/frontend/shared/src/load_from.cpp |  57 +++---
 ngraph/test/frontend/shared/src/op_fuzzy.cpp  |   2 +-
 .../frontend/shared/src/partial_shape.cpp     |   6 +-
 .../frontend/shared/src/set_element_type.cpp  |   6 +-
 ngraph/test/op.cpp                            |   6 +-
 48 files changed, 727 insertions(+), 390 deletions(-)
 create mode 100644 inference-engine/tests/functional/inference_engine/pdpd_reader/models/relu.pdmodel
 create mode 100644 "inference-engine/tests/functional/inference_engine/pdpd_reader/models/\343\201\262\343\202\211\343\201\214\343\201\252\346\227\245\346\234\254\350\252\236.pdmodel"
 create mode 100644 inference-engine/tests/functional/inference_engine/pdpd_reader/read_pdpd_model_test.cpp
 create mode 100644 ngraph/frontend/frontend_manager/src/utils.cpp
 create mode 100644 ngraph/frontend/frontend_manager/src/utils.hpp
 create mode 100644 ngraph/frontend/paddlepaddle/src/pdpd_utils.hpp

diff --git a/cmake/templates/InferenceEngineConfig.cmake.in b/cmake/templates/InferenceEngineConfig.cmake.in
index 261edbf3d730f3..43408483f9af6e 100644
--- a/cmake/templates/InferenceEngineConfig.cmake.in
+++ b/cmake/templates/InferenceEngineConfig.cmake.in
@@ -73,6 +73,10 @@ function(_ie_target_no_deprecation_error)
         else()
             set(flags "-Wno-error=deprecated-declarations")
         endif()
+        if(CMAKE_CROSSCOMPILING)
+            set_target_properties(${ARGV} PROPERTIES
+                                  INTERFACE_LINK_OPTIONS "-Wl,--allow-shlib-undefined")
+        endif()
 
         set_target_properties(${ARGV} PROPERTIES INTERFACE_COMPILE_OPTIONS ${flags})
     endif()
diff --git a/inference-engine/src/inference_engine/CMakeLists.txt b/inference-engine/src/inference_engine/CMakeLists.txt
index aeb0386e85c878..ffbfc0a1a14160 100644
--- a/inference-engine/src/inference_engine/CMakeLists.txt
+++ b/inference-engine/src/inference_engine/CMakeLists.txt
@@ -124,6 +124,7 @@ target_compile_definitions(${TARGET_NAME}_obj PRIVATE IMPLEMENT_INFERENCE_ENGINE
 
 target_include_directories(${TARGET_NAME}_obj SYSTEM PRIVATE $<TARGET_PROPERTY:ngraph::ngraph,INTERFACE_INCLUDE_DIRECTORIES>
                                                              $<TARGET_PROPERTY:pugixml::static,INTERFACE_INCLUDE_DIRECTORIES>
+                                                             $<TARGET_PROPERTY:ngraph::frontend_manager,INTERFACE_INCLUDE_DIRECTORIES>
                                                              $<TARGET_PROPERTY:xbyak,INTERFACE_INCLUDE_DIRECTORIES>)
 
 target_include_directories(${TARGET_NAME}_obj PRIVATE "${CMAKE_CURRENT_SOURCE_DIR}"
@@ -160,7 +161,7 @@ if (TBBBIND_2_4_FOUND)
 endif()
 
 target_link_libraries(${TARGET_NAME} PRIVATE pugixml::static openvino::itt ${CMAKE_DL_LIBS} Threads::Threads
-                                             ngraph inference_engine_transformations)
+                                             ngraph ngraph::frontend_manager inference_engine_transformations)
 
 target_include_directories(${TARGET_NAME} INTERFACE
             $<BUILD_INTERFACE:${PUBLIC_HEADERS_DIR}>
@@ -200,7 +201,7 @@ if(WIN32)
     set_target_properties(${TARGET_NAME}_s PROPERTIES COMPILE_PDB_NAME ${TARGET_NAME}_s)
 endif()
 
-target_link_libraries(${TARGET_NAME}_s PRIVATE openvino::itt ${CMAKE_DL_LIBS} ngraph
+target_link_libraries(${TARGET_NAME}_s PRIVATE openvino::itt ${CMAKE_DL_LIBS} ngraph ngraph::frontend_manager
                                                inference_engine_transformations pugixml::static)
 
 target_compile_definitions(${TARGET_NAME}_s PUBLIC USE_STATIC_IE)
diff --git a/inference-engine/src/inference_engine/ie_network_reader.cpp b/inference-engine/src/inference_engine/ie_network_reader.cpp
index 6043303712dc02..7189a0a098aaa9 100644
--- a/inference-engine/src/inference_engine/ie_network_reader.cpp
+++ b/inference-engine/src/inference_engine/ie_network_reader.cpp
@@ -9,6 +9,7 @@
 #include <file_utils.h>
 #include <ie_reader.hpp>
 #include <ie_ir_version.hpp>
+#include <frontend_manager/frontend_manager.hpp>
 
 #include <fstream>
 #include <istream>
@@ -226,6 +227,26 @@ CNNNetwork details::ReadNetwork(const std::string& modelPath, const std::string&
             return reader->read(modelStream, exts);
         }
     }
+    // Try to load with FrontEndManager
+    static ngraph::frontend::FrontEndManager manager;
+    ngraph::frontend::FrontEnd::Ptr FE;
+    ngraph::frontend::InputModel::Ptr inputModel;
+    if (!binPath.empty()) {
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+        std::wstring weights_path = FileUtils::multiByteCharToWString(binPath.c_str());
+#else
+        std::string weights_path = binPath;
+#endif
+        FE = manager.load_by_model(model_path, weights_path);
+        if (FE) inputModel = FE->load(model_path, weights_path);
+    } else {
+        FE = manager.load_by_model(model_path);
+        if (FE) inputModel = FE->load(model_path);
+    }
+    if (inputModel) {
+        auto ngFunc = FE->convert(inputModel);
+        return CNNNetwork(ngFunc);
+    }
     IE_THROW() << "Unknown model format! Cannot find reader for model format: " << fileExt << " and read the model: " << modelPath <<
                ". Please check that reader library exists in your PATH.";
 }
@@ -248,4 +269,4 @@ CNNNetwork details::ReadNetwork(const std::string& model, const Blob::CPtr& weig
     IE_THROW() << "Unknown model format! Cannot find reader for the model and read it. Please check that reader library exists in your PATH.";
 }
 
-}  // namespace InferenceEngine
\ No newline at end of file
+}  // namespace InferenceEngine
diff --git a/inference-engine/tests/functional/inference_engine/CMakeLists.txt b/inference-engine/tests/functional/inference_engine/CMakeLists.txt
index 80d95d875e3ab7..4154e95ba860f9 100644
--- a/inference-engine/tests/functional/inference_engine/CMakeLists.txt
+++ b/inference-engine/tests/functional/inference_engine/CMakeLists.txt
@@ -55,6 +55,11 @@ if(NGRAPH_ONNX_IMPORT_ENABLE)
     add_dependencies(${TARGET_NAME} inference_engine_onnx_reader)
 endif()
 
+if(NGRAPH_PDPD_FRONTEND_ENABLE)
+    target_compile_definitions(${TARGET_NAME} PRIVATE
+        PDPD_TEST_MODELS="${CMAKE_CURRENT_SOURCE_DIR}/pdpd_reader/models/")
+endif()
+
 ie_faster_build(${TARGET_NAME}
     PCH PRIVATE "precomp.hpp"
 )
diff --git a/inference-engine/tests/functional/inference_engine/pdpd_reader/models/relu.pdmodel b/inference-engine/tests/functional/inference_engine/pdpd_reader/models/relu.pdmodel
new file mode 100644
index 0000000000000000000000000000000000000000..9bb64f2a50d5dce914bbee2b1592af7a08a7c3a6
GIT binary patch
literal 7839
zcmeHMOK%%D5VjIIk?BVirA`eM2o~E0mK<f*vYf^a;uP2deH_{pXi)?R0)p03602Qu
z!{y3Si~zaj(o=syfgTI=@ATS3@BIbskd!PrR+<2@gS3zjGRfs|J`RWTBKmcwFjxG0
z^p`6yqxlw9%}(iD0j=fAODNx>G=$y)^sb>LNuvyJdMZxvW@)K#v0Om;!hG?3ac*s{
zyos)*q(?F1Eh=#=LK^vLlSFh#Q9nVkigNuI2c4Yz(+XNZxd$c7ynxQ%&r~VbFPpx5
z2`z{OhqT9<w0Le~4h9xsKnh^gBeFQ}{<4ggU<6o4sUpp8aX#of&Sxy5j_b!XWW*1N
zBL4k^^6$U=`o1rq(PLcrye&!6@fA&#--7w6pO7$&sQvZZl;gB1S)x+irjjU%wM@KZ
z;MSaoaq2X7Y7XPhUD$sX(R%@M;4dbOSE_+}dnmRI3e7jTsu5_E6<7ZPP`&%NiDv6#
zgGO@??r1cOCz(q39`+yA9FZy8fkygp^AQXwBHL8qkjcGtkb2PTJ*+>f2E9|4pHWz&
zsuM?e%fi*)zS3G8{Fu|AlQ0RrR+O>OW5OG&I^|7j)xBa?(zt7mzBpYvNOcQtRK!wM
zb7-H|96L#?7bh{@(?2&{FA2>!oK8X{iBo)X0<&M-YH)WXh`S+e3Q$8KZ-PSJyuEvG
zq=#EZ<kL_FdA*w;8Li=WL`?m-M_P>gUL@e&_z~OplY#08-tcbwDO2=j0yl}YkFJDo
zB;g;xg-K`#_i>10LXKOv3<iu@oJ1H070p*tl}YZ5=vo<XRyN>-K~NhT-2>gK2JBR@
zwLp&aK*;VSriK;F5h#sm1Zp}MaVlUyWyVIL-q@+X{Cu`Gq(oA%N+H&Ighi58^j*e@
z6kwuat6uN{3?9}B1TyQM0nGYsdlg;;6Rc{8L@Al>9j-S;w0_57Ppd(EDj24o+wSP#
zMp#4=d^AR3HOB+9QE?3}xCdVgPOH`6hcg3J-)-1q1a0C>fr{VIh+0BAW)IpCC`p=h
zAMTDv`?{^L@ky2H9rucHQ|9=Z;DW%J<$QM;T^xEd?Nr?bbRNWOntv^z3)(G$&%9!N
z;xT_*&Kv9g0{v7Te-vg8@||*!b&JM0$f{N$@P*Ev^*Ee++Ab+3IEg$xrNY50;eIvX
zZ>ZUv`{Sj3&`s7On$Lu#x>awCefJj{T8Bmnm7X^HV4g%$QG<l;t!rTGda7~ehwBf(
zB=nz--TUD>L~$?%I|D-zy&-bzd?GS{NOK5iY+bi4<RgT^=Nk9W@uW0rd6Tx(Yi3eX
zuJAs%zHX&Dv9l9?>2z%DRQtBGZB6YM^?%&Doe0Z|2xTcmO5G^rym;Xo9l0;)k!ChA
za6GpEy@;04;<q}B_>S^aNOW17z+;B5blqCRS7aaMd6SH|E66sAx$ARt&prWzo8M<7
zHQl*6_bMvtE+#Dnx@AZJYwkt6Jk_o~zcjO}@04AgB_6ZHW0rVKxbu3WVUx0{iQ$g+
zlaNx>oVr(YOm^yyCmt*596ohDh;w72Dhy)m&guE{)Q5;??9A)+?fRz8m9!TKKGhg)
z$YG50IOedS$MlG!HcVDbYA_2wPNv2G|M25P-SD>+^q~$WUJ*BxmTY)oE2Cxm?=`BB
zKhLU=jae}8TD4?jV@>&Q!tl+ikh3b}L`n2)s*wLuC2nX(JIqE+343Z45=z@=UWD8|
zmd_tyd07#1mZYCq2{K=J_Wa4lpLz5?x(v}DP6qo7ia`3k3}bjE%p>r!TqsN*XC#7w
z99l&4<IWYd+?Etx&E&+45?UG!st)0XY7Lc+9@wDforsh~srdp7;9V}oM^isQt56}0
zC{$KkiK&oJ%m#+=juPRf;81quYP5uY0mB^PS2J)KEp~_uaoUlLcg@fWD!>-FVo&IZ
zMhb>W#M%}iR5J{Y@#a?1rAUZwmS9Ep^<(6gp<F^2+C+7z9QB%6oMx6WkhDpbri^eb
z2@i!G2IiVsB7~J8ERk{cII~cIv#FS1c-^$~uc5UN-j^iX&)`Awq!fT21kh{fm)snJ
z)l<<@Nt9WMzK2%yR}9r@o`UQwmm$rTr9mj)j96mmfj@-(lJzl<?Fvvc32CA_2TWIU
nV67n))S}@%2gjs8B8({M4$PCO85vDrR;GX~hPNoLta$zb*7+7t

literal 0
HcmV?d00001

diff --git "a/inference-engine/tests/functional/inference_engine/pdpd_reader/models/\343\201\262\343\202\211\343\201\214\343\201\252\346\227\245\346\234\254\350\252\236.pdmodel" "b/inference-engine/tests/functional/inference_engine/pdpd_reader/models/\343\201\262\343\202\211\343\201\214\343\201\252\346\227\245\346\234\254\350\252\236.pdmodel"
new file mode 100644
index 0000000000000000000000000000000000000000..9bb64f2a50d5dce914bbee2b1592af7a08a7c3a6
GIT binary patch
literal 7839
zcmeHMOK%%D5VjIIk?BVirA`eM2o~E0mK<f*vYf^a;uP2deH_{pXi)?R0)p03602Qu
z!{y3Si~zaj(o=syfgTI=@ATS3@BIbskd!PrR+<2@gS3zjGRfs|J`RWTBKmcwFjxG0
z^p`6yqxlw9%}(iD0j=fAODNx>G=$y)^sb>LNuvyJdMZxvW@)K#v0Om;!hG?3ac*s{
zyos)*q(?F1Eh=#=LK^vLlSFh#Q9nVkigNuI2c4Yz(+XNZxd$c7ynxQ%&r~VbFPpx5
z2`z{OhqT9<w0Le~4h9xsKnh^gBeFQ}{<4ggU<6o4sUpp8aX#of&Sxy5j_b!XWW*1N
zBL4k^^6$U=`o1rq(PLcrye&!6@fA&#--7w6pO7$&sQvZZl;gB1S)x+irjjU%wM@KZ
z;MSaoaq2X7Y7XPhUD$sX(R%@M;4dbOSE_+}dnmRI3e7jTsu5_E6<7ZPP`&%NiDv6#
zgGO@??r1cOCz(q39`+yA9FZy8fkygp^AQXwBHL8qkjcGtkb2PTJ*+>f2E9|4pHWz&
zsuM?e%fi*)zS3G8{Fu|AlQ0RrR+O>OW5OG&I^|7j)xBa?(zt7mzBpYvNOcQtRK!wM
zb7-H|96L#?7bh{@(?2&{FA2>!oK8X{iBo)X0<&M-YH)WXh`S+e3Q$8KZ-PSJyuEvG
zq=#EZ<kL_FdA*w;8Li=WL`?m-M_P>gUL@e&_z~OplY#08-tcbwDO2=j0yl}YkFJDo
zB;g;xg-K`#_i>10LXKOv3<iu@oJ1H070p*tl}YZ5=vo<XRyN>-K~NhT-2>gK2JBR@
zwLp&aK*;VSriK;F5h#sm1Zp}MaVlUyWyVIL-q@+X{Cu`Gq(oA%N+H&Ighi58^j*e@
z6kwuat6uN{3?9}B1TyQM0nGYsdlg;;6Rc{8L@Al>9j-S;w0_57Ppd(EDj24o+wSP#
zMp#4=d^AR3HOB+9QE?3}xCdVgPOH`6hcg3J-)-1q1a0C>fr{VIh+0BAW)IpCC`p=h
zAMTDv`?{^L@ky2H9rucHQ|9=Z;DW%J<$QM;T^xEd?Nr?bbRNWOntv^z3)(G$&%9!N
z;xT_*&Kv9g0{v7Te-vg8@||*!b&JM0$f{N$@P*Ev^*Ee++Ab+3IEg$xrNY50;eIvX
zZ>ZUv`{Sj3&`s7On$Lu#x>awCefJj{T8Bmnm7X^HV4g%$QG<l;t!rTGda7~ehwBf(
zB=nz--TUD>L~$?%I|D-zy&-bzd?GS{NOK5iY+bi4<RgT^=Nk9W@uW0rd6Tx(Yi3eX
zuJAs%zHX&Dv9l9?>2z%DRQtBGZB6YM^?%&Doe0Z|2xTcmO5G^rym;Xo9l0;)k!ChA
za6GpEy@;04;<q}B_>S^aNOW17z+;B5blqCRS7aaMd6SH|E66sAx$ARt&prWzo8M<7
zHQl*6_bMvtE+#Dnx@AZJYwkt6Jk_o~zcjO}@04AgB_6ZHW0rVKxbu3WVUx0{iQ$g+
zlaNx>oVr(YOm^yyCmt*596ohDh;w72Dhy)m&guE{)Q5;??9A)+?fRz8m9!TKKGhg)
z$YG50IOedS$MlG!HcVDbYA_2wPNv2G|M25P-SD>+^q~$WUJ*BxmTY)oE2Cxm?=`BB
zKhLU=jae}8TD4?jV@>&Q!tl+ikh3b}L`n2)s*wLuC2nX(JIqE+343Z45=z@=UWD8|
zmd_tyd07#1mZYCq2{K=J_Wa4lpLz5?x(v}DP6qo7ia`3k3}bjE%p>r!TqsN*XC#7w
z99l&4<IWYd+?Etx&E&+45?UG!st)0XY7Lc+9@wDforsh~srdp7;9V}oM^isQt56}0
zC{$KkiK&oJ%m#+=juPRf;81quYP5uY0mB^PS2J)KEp~_uaoUlLcg@fWD!>-FVo&IZ
zMhb>W#M%}iR5J{Y@#a?1rAUZwmS9Ep^<(6gp<F^2+C+7z9QB%6oMx6WkhDpbri^eb
z2@i!G2IiVsB7~J8ERk{cII~cIv#FS1c-^$~uc5UN-j^iX&)`Awq!fT21kh{fm)snJ
z)l<<@Nt9WMzK2%yR}9r@o`UQwmm$rTr9mj)j96mmfj@-(lJzl<?Fvvc32CA_2TWIU
nV67n))S}@%2gjs8B8({M4$PCO85vDrR;GX~hPNoLta$zb*7+7t

literal 0
HcmV?d00001

diff --git a/inference-engine/tests/functional/inference_engine/pdpd_reader/read_pdpd_model_test.cpp b/inference-engine/tests/functional/inference_engine/pdpd_reader/read_pdpd_model_test.cpp
new file mode 100644
index 00000000000000..5ec2077da1ef0b
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/pdpd_reader/read_pdpd_model_test.cpp
@@ -0,0 +1,84 @@
+﻿// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+#include <set>
+#include <string>
+#include <fstream>
+
+#include <ie_blob.h>
+#include <ie_core.hpp>
+#include <file_utils.h>
+#include <ngraph/ngraph.hpp>
+#include <ngraph/opsets/opset8.hpp>
+#include "common_test_utils/ngraph_test_utils.hpp"
+
+TEST(PDPD_Reader_Tests, ImportBasicModelToCore) {
+    auto model = std::string(PDPD_TEST_MODELS) + "relu.pdmodel";
+    InferenceEngine::Core ie;
+    auto cnnNetwork = ie.ReadNetwork(model);
+    auto function = cnnNetwork.getFunction();
+
+    const auto inputType = ngraph::element::f32;
+    const auto inputShape = ngraph::Shape{ 3 };
+
+    const auto data = std::make_shared<ngraph::opset8::Parameter>(inputType, inputShape);
+    data->set_friendly_name("x");
+    data->output(0).get_tensor().add_names({ "x" });
+    const auto relu = std::make_shared<ngraph::opset8::Relu>(data->output(0));
+    relu->set_friendly_name("relu_0.tmp_0");
+    relu->output(0).get_tensor().add_names({ "relu_0.tmp_0" });
+    const auto scale = std::make_shared<ngraph::opset8::Constant>(ngraph::element::f32, ngraph::Shape{ 1 }, std::vector<float>{1});
+    const auto bias = std::make_shared<ngraph::opset8::Constant>(ngraph::element::f32, ngraph::Shape{ 1 }, std::vector<float>{0});
+    const auto node_multiply = std::make_shared<ngraph::opset8::Multiply>(relu->output(0), scale);
+    const auto node_add = std::make_shared<ngraph::opset8::Add>(node_multiply, bias);
+    node_add->set_friendly_name("save_infer_model/scale_0.tmp_1");
+    node_add->output(0).get_tensor().add_names({ "save_infer_model/scale_0.tmp_1" });
+    const auto result = std::make_shared<ngraph::opset8::Result>(node_add->output(0));
+    result->set_friendly_name("save_infer_model/scale_0.tmp_1/Result");
+    const auto reference = std::make_shared<ngraph::Function>(
+        ngraph::NodeVector{ result },
+        ngraph::ParameterVector{ data },
+        "RefPDPDFunction");
+    const FunctionsComparator func_comparator = FunctionsComparator::with_default().enable(FunctionsComparator::NAMES);
+    const FunctionsComparator::Result res = func_comparator(function, reference);
+    ASSERT_TRUE(res.valid);
+}
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+TEST(PDPD_Reader_Tests, ImportBasicModelToCoreWstring) {
+    std::string win_dir_path{ PDPD_TEST_MODELS };
+    std::replace(win_dir_path.begin(), win_dir_path.end(), '/', '\\');
+    const std::wstring unicode_win_dir_path = FileUtils::multiByteCharToWString(win_dir_path.c_str());
+    auto model = unicode_win_dir_path + L"ひらがな日本語.pdmodel";
+    InferenceEngine::Core ie;
+    auto cnnNetwork = ie.ReadNetwork(model);
+    auto function = cnnNetwork.getFunction();
+
+    const auto inputType = ngraph::element::f32;
+    const auto inputShape = ngraph::Shape{ 3 };
+
+    const auto data = std::make_shared<ngraph::opset8::Parameter>(inputType, inputShape);
+    data->set_friendly_name("x");
+    data->output(0).get_tensor().add_names({ "x" });
+    const auto relu = std::make_shared<ngraph::opset8::Relu>(data->output(0));
+    relu->set_friendly_name("relu_0.tmp_0");
+    relu->output(0).get_tensor().add_names({ "relu_0.tmp_0" });
+    const auto scale = std::make_shared<ngraph::opset8::Constant>(ngraph::element::f32, ngraph::Shape{ 1 }, std::vector<float>{1});
+    const auto bias = std::make_shared<ngraph::opset8::Constant>(ngraph::element::f32, ngraph::Shape{ 1 }, std::vector<float>{0});
+    const auto node_multiply = std::make_shared<ngraph::opset8::Multiply>(relu->output(0), scale);
+    const auto node_add = std::make_shared<ngraph::opset8::Add>(node_multiply, bias);
+    node_add->set_friendly_name("save_infer_model/scale_0.tmp_1");
+    node_add->output(0).get_tensor().add_names({ "save_infer_model/scale_0.tmp_1" });
+    const auto result = std::make_shared<ngraph::opset8::Result>(node_add->output(0));
+    result->set_friendly_name("save_infer_model/scale_0.tmp_1/Result");
+    const auto reference = std::make_shared<ngraph::Function>(
+        ngraph::NodeVector{ result },
+        ngraph::ParameterVector{ data },
+        "RefPDPDFunction");
+    const FunctionsComparator func_comparator = FunctionsComparator::with_default().enable(FunctionsComparator::NAMES);
+    const FunctionsComparator::Result res = func_comparator(function, reference);
+    ASSERT_TRUE(res.valid);
+}
+#endif
diff --git a/model-optimizer/mo/moc_frontend/pipeline.py b/model-optimizer/mo/moc_frontend/pipeline.py
index 55c1ba96fd6d53..5ddccc15f41a7a 100644
--- a/model-optimizer/mo/moc_frontend/pipeline.py
+++ b/model-optimizer/mo/moc_frontend/pipeline.py
@@ -24,7 +24,7 @@ def moc_pipeline(argv: argparse.Namespace):
         str(fem.get_available_front_ends())))
     log.debug('Initializing new FE for framework {}'.format(argv.framework))
     fe = fem.load_by_framework(argv.framework)
-    input_model = fe.load_from_file(argv.input_model)
+    input_model = fe.load(argv.input_model)
 
     user_shapes, outputs, freeze_placeholder = fe_user_data_repack(
         input_model, argv.placeholder_shapes, argv.placeholder_data_types,
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.cpp b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.cpp
index 66ea0ab35a0208..9ddbba38040770 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.cpp
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.cpp
@@ -25,7 +25,7 @@ extern "C" MOCK_API void* GetFrontEndData()
 {
     FrontEndPluginInfo* res = new FrontEndPluginInfo();
     res->m_name = "mock_mo_ngraph_frontend";
-    res->m_creator = [](FrontEndCapFlags flags) { return std::make_shared<FrontEndMockPy>(flags); };
+    res->m_creator = []() { return std::make_shared<FrontEndMockPy>(); };
 
     return res;
 }
\ No newline at end of file
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp
index d22980794c3a23..ab0de8f3357e7c 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp
@@ -292,11 +292,9 @@ class MOCK_API InputModelMockPy : public InputModel
 /// was called with correct arguments during test execution
 struct MOCK_API FeStat
 {
-    FrontEndCapFlags m_load_flags;
     std::vector<std::string> m_load_paths;
     int m_convert_model = 0;
     // Getters
-    FrontEndCapFlags load_flags() const { return m_load_flags; }
     std::vector<std::string> load_paths() const { return m_load_paths; }
     int convert_model() const { return m_convert_model; }
 };
@@ -309,13 +307,8 @@ class MOCK_API FrontEndMockPy : public FrontEnd
     static FeStat m_stat;
 
 public:
-    FrontEndMockPy(FrontEndCapFlags flags) { m_stat.m_load_flags = flags; }
+    FrontEndMockPy() {}
 
-    InputModel::Ptr load_from_file(const std::string& path) const override
-    {
-        m_stat.m_load_paths.push_back(path);
-        return std::make_shared<InputModelMockPy>();
-    }
 
     std::shared_ptr<ngraph::Function> convert(InputModel::Ptr model) const override
     {
@@ -326,4 +319,15 @@ class MOCK_API FrontEndMockPy : public FrontEnd
     static FeStat get_stat() { return m_stat; }
 
     static void clear_stat() { m_stat = {}; }
+
+protected:
+    InputModel::Ptr load_impl(const std::vector<std::shared_ptr<Variant>>& params) const override
+    {
+        if (params.size() > 0 && is_type<VariantWrapper<std::string>>(params[0]))
+        {
+            auto path = as_type_ptr<VariantWrapper<std::string>>(params[0])->get();
+            m_stat.m_load_paths.push_back(path);
+        }
+        return std::make_shared<InputModelMockPy>();
+    }
 };
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/mock_mo_python_api.cpp b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/mock_mo_python_api.cpp
index d9bbe52ab69b5f..d5b7978932688f 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/mock_mo_python_api.cpp
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/mock_mo_python_api.cpp
@@ -17,7 +17,6 @@ static void register_mock_frontend_stat(py::module m)
     m.def("clear_frontend_statistic", &FrontEndMockPy::clear_stat);
 
     py::class_<FeStat> feStat(m, "FeStat", py::dynamic_attr());
-    feStat.def_property_readonly("load_flags", &FeStat::load_flags);
     feStat.def_property_readonly("load_paths", &FeStat::load_paths);
     feStat.def_property_readonly("convert_model", &FeStat::convert_model);
 }
diff --git a/ngraph/core/include/ngraph/variant.hpp b/ngraph/core/include/ngraph/variant.hpp
index aeb67f79b9e204..d39be393c76321 100644
--- a/ngraph/core/include/ngraph/variant.hpp
+++ b/ngraph/core/include/ngraph/variant.hpp
@@ -75,4 +75,27 @@ namespace ngraph
         {
         }
     };
+
+    template <typename T>
+    inline std::shared_ptr<Variant> make_variant(const T& p)
+    {
+        return std::dynamic_pointer_cast<VariantImpl<T>>(std::make_shared<VariantWrapper<T>>(p));
+    }
+
+    template <size_t N>
+    inline std::shared_ptr<Variant> make_variant(const char (&s)[N])
+    {
+        return std::dynamic_pointer_cast<VariantImpl<std::string>>(
+            std::make_shared<VariantWrapper<std::string>>(s));
+    }
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+    template <size_t N>
+    inline std::shared_ptr<Variant> make_variant(const wchar_t (&s)[N])
+    {
+        return std::dynamic_pointer_cast<VariantImpl<std::wstring>>(
+            std::make_shared<VariantWrapper<std::wstring>>(s));
+    }
+#endif
+
 } // namespace ngraph
diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp
index 97a18112d82959..da54a1f7993a95 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp
@@ -10,6 +10,7 @@
 #include "frontend_manager_defs.hpp"
 #include "input_model.hpp"
 #include "ngraph/function.hpp"
+#include "ngraph/variant.hpp"
 
 namespace ngraph
 {
@@ -26,43 +27,31 @@ namespace ngraph
 
             virtual ~FrontEnd();
 
-            /// \brief Loads an input model by specified model file path
-            /// If model is stored in several files (e.g. model topology and model weights) -
-            /// frontend implementation is responsible to handle this case, generally frontend may
-            /// retrieve other file names from main file
-            /// \param path Main model file path
-            /// \return Loaded input model
-            virtual InputModel::Ptr load_from_file(const std::string& path) const;
-
-            /// \brief Loads an input model by specified number of model files
-            /// This shall be used for cases when client knows all model files (model, weights, etc)
-            /// \param paths Array of model files
-            /// \return Loaded input model
-            virtual InputModel::Ptr load_from_files(const std::vector<std::string>& paths) const;
-
-            /// \brief Loads an input model by already loaded memory buffer
-            /// Memory structure is frontend-defined and is not specified in generic API
-            /// \param model Model memory buffer
-            /// \return Loaded input model
-            virtual InputModel::Ptr load_from_memory(const void* model) const;
-
-            /// \brief Loads an input model from set of memory buffers
-            /// Memory structure is frontend-defined and is not specified in generic API
-            /// \param modelParts Array of model memory buffers
-            /// \return Loaded input model
-            virtual InputModel::Ptr
-                load_from_memory_fragments(const std::vector<const void*>& modelParts) const;
-
-            /// \brief Loads an input model by input stream representing main model file
-            /// \param stream Input stream of main model
-            /// \return Loaded input model
-            virtual InputModel::Ptr load_from_stream(std::istream& stream) const;
-
-            /// \brief Loads an input model by input streams representing all model files
-            /// \param streams Array of input streams for model
-            /// \return Loaded input model
-            virtual InputModel::Ptr
-                load_from_streams(const std::vector<std::istream*>& streams) const;
+            /// \brief Validates if FrontEnd can recognize model with parameters specified.
+            /// Same parameters should be used to load model.
+            /// \param vars Any number of parameters of any type. What kind of parameters
+            /// are accepted is determined by each FrontEnd individually, typically it is
+            /// std::string containing path to the model file. For more information please
+            /// refer to specific FrontEnd documentation.
+            /// \return true if model recognized, false - otherwise.
+            template <typename... Types>
+            inline bool supported(const Types&... vars) const
+            {
+                return supported_impl({make_variant(vars)...});
+            }
+
+            /// \brief Loads an input model by any specified arguments. Each FrontEnd separately
+            /// defines what arguments it can accept.
+            /// \param vars Any number of parameters of any type. What kind of parameters
+            /// are accepted is determined by each FrontEnd individually, typically it is
+            /// std::string containing path to the model file. For more information please
+            /// refer to specific FrontEnd documentation.
+            /// \return Loaded input model.
+            template <typename... Types>
+            inline InputModel::Ptr load(const Types&... vars) const
+            {
+                return load_impl({make_variant(vars)...});
+            }
 
             /// \brief Completely convert and normalize entire function, throws if it is not
             /// possible
@@ -95,8 +84,20 @@ namespace ngraph
             /// \brief Runs normalization passes on function that was loaded with partial conversion
             /// \param function partially converted nGraph function
             virtual void normalize(std::shared_ptr<ngraph::Function> function) const;
+
+        protected:
+            virtual bool
+                supported_impl(const std::vector<std::shared_ptr<Variant>>& variants) const;
+            virtual InputModel::Ptr
+                load_impl(const std::vector<std::shared_ptr<Variant>>& variants) const;
         };
 
+        template <>
+        inline bool FrontEnd::supported(const std::vector<std::shared_ptr<Variant>>& variants) const
+        {
+            return supported_impl(variants);
+        }
+
     } // namespace frontend
 
 } // namespace ngraph
diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager.hpp
index 764931ea9a89b9..2b92a6386b5552 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager.hpp
@@ -8,36 +8,14 @@
 #include <string>
 #include "frontend.hpp"
 #include "frontend_manager_defs.hpp"
+#include "ngraph/variant.hpp"
 
 namespace ngraph
 {
     namespace frontend
     {
-        /// Capabilities for requested FrontEnd
-        /// In general, frontend implementation may be divided into several libraries by capability
-        /// level It will allow faster load of frontend when only limited usage is expected by
-        /// client application as well as binary size can be minimized by removing not needed parts
-        /// from application's package
-        namespace FrontEndCapabilities
-        {
-            /// \brief Just reading and conversion, w/o any modifications; intended to be used in
-            /// Reader
-            static const int FEC_DEFAULT = 0;
-
-            /// \brief Topology cutting capability
-            static const int FEC_CUT = 1;
-
-            /// \brief Query entities by names, renaming and adding new names for operations and
-            /// tensors
-            static const int FEC_NAMES = 2;
-
-            /// \brief Partial model conversion and decoding capability
-            static const int FEC_WILDCARDS = 4;
-        }; // namespace FrontEndCapabilities
-
         // -------------- FrontEndManager -----------------
-        using FrontEndCapFlags = int;
-        using FrontEndFactory = std::function<FrontEnd::Ptr(FrontEndCapFlags fec)>;
+        using FrontEndFactory = std::function<FrontEnd::Ptr()>;
 
         /// \brief Frontend management class, loads available frontend plugins on construction
         /// Allows load of frontends for particular framework, register new and list available
@@ -62,26 +40,22 @@ namespace ngraph
             /// \param framework Framework name. Throws exception if name is not in list of
             /// available frontends
             ///
-            /// \param fec Frontend capabilities. It is recommended to use only
-            /// those capabilities which are needed to minimize load time
-            ///
             /// \return Frontend interface for further loading of models
-            FrontEnd::Ptr
-                load_by_framework(const std::string& framework,
-                                  FrontEndCapFlags fec = FrontEndCapabilities::FEC_DEFAULT);
+            FrontEnd::Ptr load_by_framework(const std::string& framework);
 
-            /// \brief Loads frontend by model file path. Selects and loads appropriate frontend
-            /// depending on model file extension and other file info (header)
+            /// \brief Loads frontend by model fragments described by each FrontEnd documentation.
+            /// Selects and loads appropriate frontend depending on model file extension and other
+            /// file info (header)
             ///
             /// \param framework
             /// Framework name. Throws exception if name is not in list of available frontends
             ///
-            /// \param fec Frontend capabilities. It is recommended to use only those capabilities
-            /// which are needed to minimize load time
-            ///
             /// \return Frontend interface for further loading of model
-            FrontEnd::Ptr load_by_model(const std::string& path,
-                                        FrontEndCapFlags fec = FrontEndCapabilities::FEC_DEFAULT);
+            template <typename... Types>
+            FrontEnd::Ptr load_by_model(const Types&... vars)
+            {
+                return load_by_model_impl({make_variant(vars)...});
+            }
 
             /// \brief Gets list of registered frontends
             std::vector<std::string> get_available_front_ends() const;
@@ -97,6 +71,8 @@ namespace ngraph
         private:
             class Impl;
 
+            FrontEnd::Ptr load_by_model_impl(const std::vector<std::shared_ptr<Variant>>& variants);
+
             std::unique_ptr<Impl> m_impl;
         };
 
@@ -119,4 +95,31 @@ namespace ngraph
 
     } // namespace frontend
 
+    template <>
+    class FRONTEND_API VariantWrapper<std::shared_ptr<std::istream>>
+        : public VariantImpl<std::shared_ptr<std::istream>>
+    {
+    public:
+        static constexpr VariantTypeInfo type_info{"Variant::std::shared_ptr<std::istream>", 0};
+        const VariantTypeInfo& get_type_info() const override { return type_info; }
+        VariantWrapper(const value_type& value)
+            : VariantImpl<value_type>(value)
+        {
+        }
+    };
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+    template <>
+    class FRONTEND_API VariantWrapper<std::wstring> : public VariantImpl<std::wstring>
+    {
+    public:
+        static constexpr VariantTypeInfo type_info{"Variant::std::wstring", 0};
+        const VariantTypeInfo& get_type_info() const override { return type_info; }
+        VariantWrapper(const value_type& value)
+            : VariantImpl<value_type>(value)
+        {
+        }
+    };
+#endif
+
 } // namespace ngraph
diff --git a/ngraph/frontend/frontend_manager/src/frontend_manager.cpp b/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
index 037a2522523dc4..95dfe1ccbdedf5 100644
--- a/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
+++ b/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
@@ -8,6 +8,7 @@
 #include "frontend_manager/frontend_exceptions.hpp"
 #include "frontend_manager/frontend_manager.hpp"
 #include "plugin_loader.hpp"
+#include "utils.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
@@ -23,11 +24,11 @@ class FrontEndManager::Impl
 
     ~Impl() = default;
 
-    FrontEnd::Ptr loadByFramework(const std::string& framework, FrontEndCapFlags fec)
+    FrontEnd::Ptr loadByFramework(const std::string& framework)
     {
         FRONT_END_INITIALIZATION_CHECK(
             m_factories.count(framework), "FrontEnd for Framework ", framework, " is not found");
-        return m_factories[framework](fec);
+        return m_factories[framework]();
     }
 
     std::vector<std::string> availableFrontEnds() const
@@ -42,9 +43,17 @@ class FrontEndManager::Impl
         return keys;
     }
 
-    FrontEnd::Ptr loadByModel(const std::string& path, FrontEndCapFlags fec)
+    FrontEnd::Ptr loadByModel(const std::vector<std::shared_ptr<Variant>>& variants)
     {
-        FRONT_END_NOT_IMPLEMENTED(loadByModel);
+        for (const auto& factory : m_factories)
+        {
+            auto FE = factory.second();
+            if (FE->supported(variants))
+            {
+                return FE;
+            }
+        }
+        return FrontEnd::Ptr();
     }
 
     void registerFrontEnd(const std::string& name, FrontEndFactory creator)
@@ -81,7 +90,7 @@ class FrontEndManager::Impl
         }
         else
         {
-            registerFromDir(".");
+            registerFromDir(getFrontendLibraryPath());
         }
     }
 };
@@ -96,14 +105,15 @@ FrontEndManager& FrontEndManager::operator=(FrontEndManager&&) = default;
 
 FrontEndManager::~FrontEndManager() = default;
 
-FrontEnd::Ptr FrontEndManager::load_by_framework(const std::string& framework, FrontEndCapFlags fec)
+FrontEnd::Ptr FrontEndManager::load_by_framework(const std::string& framework)
 {
-    return m_impl->loadByFramework(framework, fec);
+    return m_impl->loadByFramework(framework);
 }
 
-FrontEnd::Ptr FrontEndManager::load_by_model(const std::string& path, FrontEndCapFlags fec)
+FrontEnd::Ptr
+    FrontEndManager::load_by_model_impl(const std::vector<std::shared_ptr<Variant>>& variants)
 {
-    return m_impl->loadByModel(path, fec);
+    return m_impl->loadByModel(variants);
 }
 
 std::vector<std::string> FrontEndManager::get_available_front_ends() const
@@ -122,37 +132,15 @@ FrontEnd::FrontEnd() = default;
 
 FrontEnd::~FrontEnd() = default;
 
-InputModel::Ptr FrontEnd::load_from_file(const std::string& path) const
-{
-    FRONT_END_NOT_IMPLEMENTED(load_from_file);
-}
-
-InputModel::Ptr FrontEnd::load_from_files(const std::vector<std::string>& paths) const
-{
-    FRONT_END_NOT_IMPLEMENTED(load_from_files);
-}
-
-InputModel::Ptr FrontEnd::load_from_memory(const void* model) const
+bool FrontEnd::supported_impl(const std::vector<std::shared_ptr<Variant>>& variants) const
 {
-    FRONT_END_NOT_IMPLEMENTED(load_from_memory);
+    return false;
 }
 
-InputModel::Ptr
-    FrontEnd::load_from_memory_fragments(const std::vector<const void*>& modelParts) const
+InputModel::Ptr FrontEnd::load_impl(const std::vector<std::shared_ptr<Variant>>& params) const
 {
-    FRONT_END_NOT_IMPLEMENTED(load_from_memory_fragments);
+    FRONT_END_NOT_IMPLEMENTED(load_impl);
 }
-
-InputModel::Ptr FrontEnd::load_from_stream(std::istream& path) const
-{
-    FRONT_END_NOT_IMPLEMENTED(load_from_stream);
-}
-
-InputModel::Ptr FrontEnd::load_from_streams(const std::vector<std::istream*>& paths) const
-{
-    FRONT_END_NOT_IMPLEMENTED(load_from_streams);
-}
-
 std::shared_ptr<ngraph::Function> FrontEnd::convert(InputModel::Ptr model) const
 {
     FRONT_END_NOT_IMPLEMENTED(convert);
@@ -422,3 +410,9 @@ Place::Ptr Place::get_source_tensor(int inputPortIndex) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_source_tensor);
 }
+
+constexpr VariantTypeInfo VariantWrapper<std::shared_ptr<std::istream>>::type_info;
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+constexpr VariantTypeInfo VariantWrapper<std::wstring>::type_info;
+#endif
diff --git a/ngraph/frontend/frontend_manager/src/utils.cpp b/ngraph/frontend/frontend_manager/src/utils.cpp
new file mode 100644
index 00000000000000..e940512e6e7872
--- /dev/null
+++ b/ngraph/frontend/frontend_manager/src/utils.cpp
@@ -0,0 +1,68 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "utils.hpp"
+#include "frontend_manager/frontend_exceptions.hpp"
+#include "plugin_loader.hpp"
+
+#ifndef _WIN32
+#include <dlfcn.h>
+#include <limits.h>
+#include <unistd.h>
+#ifdef ENABLE_UNICODE_PATH_SUPPORT
+#include <codecvt>
+#include <locale>
+#endif
+#else
+#if defined(WINAPI_FAMILY) && !WINAPI_PARTITION_DESKTOP
+#error "Only WINAPI_PARTITION_DESKTOP is supported, because of GetModuleHandleEx[A|W]"
+#endif
+#ifndef NOMINMAX
+#define NOMINMAX
+#endif
+#include <Windows.h>
+#endif
+
+namespace
+{
+    std::string getPathName(const std::string& s)
+    {
+        size_t i = s.rfind(FileSeparator, s.length());
+        if (i != std::string::npos)
+        {
+            return (s.substr(0, i));
+        }
+
+        return {};
+    }
+
+} // namespace
+
+static std::string _getFrontendLibraryPath()
+{
+#ifdef _WIN32
+    CHAR ie_library_path[MAX_PATH];
+    HMODULE hm = NULL;
+    if (!GetModuleHandleExA(GET_MODULE_HANDLE_EX_FLAG_FROM_ADDRESS |
+                                GET_MODULE_HANDLE_EX_FLAG_UNCHANGED_REFCOUNT,
+                            reinterpret_cast<LPSTR>(ngraph::frontend::getFrontendLibraryPath),
+                            &hm))
+    {
+        FRONT_END_INITIALIZATION_CHECK(false, "GetModuleHandle returned ", GetLastError());
+    }
+    GetModuleFileNameA(hm, (LPSTR)ie_library_path, sizeof(ie_library_path));
+    return getPathName(std::string(ie_library_path));
+#elif defined(__APPLE__) || defined(__linux__)
+    Dl_info info;
+    dladdr(reinterpret_cast<void*>(ngraph::frontend::getFrontendLibraryPath), &info);
+    return getPathName(std::string(info.dli_fname)).c_str();
+#else
+#error "Unsupported OS"
+#endif // _WIN32
+}
+
+std::string ngraph::frontend::getFrontendLibraryPath()
+{
+    return _getFrontendLibraryPath();
+}
diff --git a/ngraph/frontend/frontend_manager/src/utils.hpp b/ngraph/frontend/frontend_manager/src/utils.hpp
new file mode 100644
index 00000000000000..26d6f5273c30e4
--- /dev/null
+++ b/ngraph/frontend/frontend_manager/src/utils.hpp
@@ -0,0 +1,14 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <string>
+#include "frontend_manager/frontend_manager_defs.hpp"
+
+namespace ngraph
+{
+    namespace frontend
+    {
+        FRONTEND_API std::string getFrontendLibraryPath();
+    } // namespace frontend
+} // namespace ngraph
diff --git a/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/frontend.hpp b/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/frontend.hpp
index 566ea9dd910cbc..410068b2e26fcc 100644
--- a/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/frontend.hpp
+++ b/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/frontend.hpp
@@ -14,44 +14,33 @@ namespace ngraph
     {
         class PDPD_API FrontEndPDPD : public FrontEnd
         {
-            static std::shared_ptr<Function>
-                convert_model(const std::shared_ptr<InputModelPDPD>& model);
-
         public:
             FrontEndPDPD() = default;
 
-            /**
-             * @brief Reads model from file and deducts file names of weights
-             * @param path path to folder which contains __model__ file or path to .pdmodel file
-             * @return InputModel::Ptr
-             */
-            InputModel::Ptr load_from_file(const std::string& path) const override;
-
-            /**
-             * @brief Reads model and weights from files
-             * @param paths vector containing path to .pdmodel and .pdiparams files
-             * @return InputModel::Ptr
-             */
-            InputModel::Ptr load_from_files(const std::vector<std::string>& paths) const override;
-
-            /**
-             * @brief Reads model from stream
-             * @param model_stream stream containing .pdmodel or __model__ files. Can only be used
-             * if model have no weights
-             * @return InputModel::Ptr
-             */
-            InputModel::Ptr load_from_stream(std::istream& model_stream) const override;
-
-            /**
-             * @brief Reads model from stream
-             * @param paths vector of streams containing .pdmodel and .pdiparams files. Can't be
-             * used in case of multiple weight files
-             * @return InputModel::Ptr
-             */
+            /// \brief Completely convert the remaining, not converted part of a function.
+            /// \param partiallyConverted partially converted nGraph function
+            /// \return fully converted nGraph function
+            std::shared_ptr<Function> convert(InputModel::Ptr model) const override;
+
+        protected:
+            /// \brief Check if FrontEndPDPD can recognize model from given parts
+            /// \param params Can be path to folder which contains __model__ file or path to
+            /// .pdmodel file
+            /// \return InputModel::Ptr
+            bool supported_impl(
+                const std::vector<std::shared_ptr<Variant>>& variants) const override;
+
+            /// \brief Reads model from 1 or 2 given file names or 1 or 2 std::istream containing
+            /// model in protobuf format and weights
+            /// \param params Can contain path to folder with __model__ file or path to .pdmodel
+            /// file or 1 or 2 streams with model and weights
+            /// \return InputModel::Ptr
             InputModel::Ptr
-                load_from_streams(const std::vector<std::istream*>& paths) const override;
+                load_impl(const std::vector<std::shared_ptr<Variant>>& params) const override;
 
-            std::shared_ptr<Function> convert(InputModel::Ptr model) const override;
+        private:
+            static std::shared_ptr<Function>
+                convert_model(const std::shared_ptr<InputModelPDPD>& model);
         };
 
     } // namespace frontend
diff --git a/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/model.hpp b/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/model.hpp
index ddf63fd97e5630..1ab63ef6d10a9b 100644
--- a/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/model.hpp
+++ b/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/model.hpp
@@ -13,7 +13,6 @@ namespace ngraph
     {
         class OpPlacePDPD;
         class TensorPlacePDPD;
-
         class PDPD_API InputModelPDPD : public InputModel
         {
             friend class FrontEndPDPD;
@@ -26,6 +25,9 @@ namespace ngraph
 
         public:
             explicit InputModelPDPD(const std::string& path);
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+            explicit InputModelPDPD(const std::wstring& path);
+#endif
             explicit InputModelPDPD(const std::vector<std::istream*>& streams);
             std::vector<Place::Ptr> get_inputs() const override;
             std::vector<Place::Ptr> get_outputs() const override;
diff --git a/ngraph/frontend/paddlepaddle/src/frontend.cpp b/ngraph/frontend/paddlepaddle/src/frontend.cpp
index 51b87025495887..0995725b10fb24 100644
--- a/ngraph/frontend/paddlepaddle/src/frontend.cpp
+++ b/ngraph/frontend/paddlepaddle/src/frontend.cpp
@@ -2,31 +2,26 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include <algorithm>
-#include <chrono>
 #include <fstream>
 #include <map>
-#include <memory>
-#include <numeric>
 #include <string>
-#include <utility>
 #include <vector>
 
 #include "framework.pb.h"
 
+#include <paddlepaddle_frontend/exceptions.hpp>
 #include <paddlepaddle_frontend/frontend.hpp>
 #include <paddlepaddle_frontend/model.hpp>
 #include <paddlepaddle_frontend/place.hpp>
 
 #include <ngraph/ngraph.hpp>
 #include <ngraph/opsets/opset7.hpp>
+#include <ngraph/variant.hpp>
 
-#include <paddlepaddle_frontend/exceptions.hpp>
 #include "decoder.hpp"
 #include "node_context.hpp"
 #include "op_table.hpp"
-
-#include <functional>
+#include "pdpd_utils.hpp"
 
 #include "frontend_manager/frontend_manager.hpp"
 
@@ -67,8 +62,45 @@ namespace ngraph
                     }
                 }
 
-                return CREATORS_MAP.at(op->type())(
-                    NodeContext(DecoderPDPDProto(op_place), named_inputs));
+                try
+                {
+                    return CREATORS_MAP.at(op->type())(
+                        NodeContext(DecoderPDPDProto(op_place), named_inputs));
+                }
+                catch (...)
+                {
+                    // TODO: define exception types
+                    // In case of partial conversion we need to create generic ngraph op here
+                    return NamedOutputs();
+                }
+            }
+
+            std::istream* variant_to_stream_ptr(const std::shared_ptr<Variant>& variant,
+                                                std::ifstream& ext_stream)
+            {
+                if (is_type<VariantWrapper<std::shared_ptr<std::istream>>>(variant))
+                {
+                    auto m_stream =
+                        as_type_ptr<VariantWrapper<std::shared_ptr<std::istream>>>(variant)->get();
+                    return m_stream.get();
+                }
+                else if (is_type<VariantWrapper<std::string>>(variant))
+                {
+                    const auto& model_path =
+                        as_type_ptr<VariantWrapper<std::string>>(variant)->get();
+                    ext_stream.open(model_path, std::ios::in | std::ifstream::binary);
+                }
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+                else if (is_type<VariantWrapper<std::wstring>>(variant))
+                {
+                    const auto& model_path =
+                        as_type_ptr<VariantWrapper<std::wstring>>(variant)->get();
+                    ext_stream.open(model_path, std::ios::in | std::ifstream::binary);
+                }
+#endif
+                FRONT_END_INITIALIZATION_CHECK(ext_stream && ext_stream.is_open(),
+                                               "Cannot open model file.");
+                return &ext_stream;
             }
 
         } // namespace pdpd
@@ -91,6 +123,7 @@ namespace ngraph
                 const auto& type = inp_place->getElementType();
                 auto param = std::make_shared<Parameter>(type, shape);
                 param->set_friendly_name(var->name());
+                param->output(0).get_tensor().add_names({var->name()});
                 nodes_dict[var->name()] = param;
                 parameter_nodes.push_back(param);
             }
@@ -155,41 +188,102 @@ namespace ngraph
             return std::make_shared<ngraph::Function>(result_nodes, parameter_nodes);
         }
 
-        InputModel::Ptr FrontEndPDPD::load_from_file(const std::string& path) const
+        bool FrontEndPDPD::supported_impl(
+            const std::vector<std::shared_ptr<Variant>>& variants) const
         {
-            return load_from_files({path});
-        }
+            // FrontEndPDPD can only load model specified by one path, one file or two files.
+            if (variants.empty() || variants.size() > 2)
+                return false;
 
-        InputModel::Ptr FrontEndPDPD::load_from_files(const std::vector<std::string>& paths) const
-        {
-            if (paths.size() == 1)
+            // Validating first path, it must contain a model
+            if (is_type<VariantWrapper<std::string>>(variants[0]))
             {
-                // The case when folder with __model__ and weight files is provided or .pdmodel file
-                return std::make_shared<InputModelPDPD>(paths[0]);
+                std::string suffix = ".pdmodel";
+                std::string model_path =
+                    as_type_ptr<VariantWrapper<std::string>>(variants[0])->get();
+                if (!pdpd::endsWith(model_path, suffix))
+                {
+                    model_path += pdpd::get_path_sep<char>() + "__model__";
+                }
+                std::ifstream model_str(model_path, std::ios::in | std::ifstream::binary);
+                // It is possible to validate here that protobuf can read model from the stream,
+                // but it will complicate the check, while it should be as quick as possible
+                return model_str && model_str.is_open();
             }
-            else if (paths.size() == 2)
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+            else if (is_type<VariantWrapper<std::wstring>>(variants[0]))
             {
-                // The case when .pdmodel and .pdparams files are provided
-                std::ifstream model_stream(paths[0], std::ios::in | std::ifstream::binary);
-                FRONT_END_INITIALIZATION_CHECK(model_stream && model_stream.is_open(),
-                                               "Cannot open model file.");
-                std::ifstream weights_stream(paths[1], std::ios::in | std::ifstream::binary);
-                FRONT_END_INITIALIZATION_CHECK(weights_stream && weights_stream.is_open(),
-                                               "Cannot open weights file.");
-                return load_from_streams({&model_stream, &weights_stream});
+                std::wstring suffix = L".pdmodel";
+                std::wstring model_path =
+                    as_type_ptr<VariantWrapper<std::wstring>>(variants[0])->get();
+                if (!pdpd::endsWith(model_path, suffix))
+                {
+                    model_path += pdpd::get_path_sep<wchar_t>() + L"__model__";
+                }
+                std::ifstream model_str(model_path, std::ios::in | std::ifstream::binary);
+                // It is possible to validate here that protobuf can read model from the stream,
+                // but it will complicate the check, while it should be as quick as possible
+                return model_str && model_str.is_open();
             }
-            FRONT_END_INITIALIZATION_CHECK(false, "Model can be loaded either from 1 or 2 files");
-        }
-
-        InputModel::Ptr FrontEndPDPD::load_from_stream(std::istream& model_stream) const
-        {
-            return load_from_streams({&model_stream});
+#endif
+            else if (is_type<VariantWrapper<std::shared_ptr<std::istream>>>(variants[0]))
+            {
+                // Validating first stream, it must contain a model
+                std::shared_ptr<std::istream> p_model_stream =
+                    as_type_ptr<VariantWrapper<std::shared_ptr<std::istream>>>(variants[0])->get();
+                paddle::framework::proto::ProgramDesc fw;
+                return fw.ParseFromIstream(p_model_stream.get());
+            }
+            return false;
         }
 
         InputModel::Ptr
-            FrontEndPDPD::load_from_streams(const std::vector<std::istream*>& streams) const
+            FrontEndPDPD::load_impl(const std::vector<std::shared_ptr<Variant>>& variants) const
         {
-            return std::make_shared<InputModelPDPD>(streams);
+            if (variants.size() == 1)
+            {
+                // The case when folder with __model__ and weight files is provided or .pdmodel file
+                if (is_type<VariantWrapper<std::string>>(variants[0]))
+                {
+                    std::string m_path =
+                        as_type_ptr<VariantWrapper<std::string>>(variants[0])->get();
+                    return std::make_shared<InputModelPDPD>(m_path);
+                }
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+                else if (is_type<VariantWrapper<std::wstring>>(variants[0]))
+                {
+                    std::wstring m_path =
+                        as_type_ptr<VariantWrapper<std::wstring>>(variants[0])->get();
+                    return std::make_shared<InputModelPDPD>(m_path);
+                }
+#endif
+                // The case with only model stream provided and no weights. This means model has
+                // no learnable weights
+                else if (is_type<VariantWrapper<std::shared_ptr<std::istream>>>(variants[0]))
+                {
+                    std::shared_ptr<std::istream> p_model_stream =
+                        as_type_ptr<VariantWrapper<std::shared_ptr<std::istream>>>(variants[0])
+                            ->get();
+                    return std::make_shared<InputModelPDPD>(
+                        std::vector<std::istream*>{p_model_stream.get()});
+                }
+            }
+            else if (variants.size() == 2)
+            {
+                // The case when .pdmodel and .pdparams files are provided
+                std::ifstream model_stream;
+                std::ifstream weights_stream;
+                std::istream* p_model_stream =
+                    pdpd::variant_to_stream_ptr(variants[0], model_stream);
+                std::istream* p_weights_stream =
+                    pdpd::variant_to_stream_ptr(variants[1], weights_stream);
+                if (p_model_stream && p_weights_stream)
+                {
+                    return std::make_shared<InputModelPDPD>(
+                        std::vector<std::istream*>{p_model_stream, p_weights_stream});
+                }
+            }
+            PDPD_THROW("Model can be loaded either from 1 or 2 files/streams");
         }
 
         std::shared_ptr<ngraph::Function> FrontEndPDPD::convert(InputModel::Ptr model) const
@@ -211,6 +305,6 @@ extern "C" PDPD_API void* GetFrontEndData()
 {
     FrontEndPluginInfo* res = new FrontEndPluginInfo();
     res->m_name = "pdpd";
-    res->m_creator = [](FrontEndCapFlags) { return std::make_shared<FrontEndPDPD>(); };
+    res->m_creator = []() { return std::make_shared<FrontEndPDPD>(); };
     return res;
 }
\ No newline at end of file
diff --git a/ngraph/frontend/paddlepaddle/src/model.cpp b/ngraph/frontend/paddlepaddle/src/model.cpp
index f0d8c859623aa1..3315dc7e3a9b96 100644
--- a/ngraph/frontend/paddlepaddle/src/model.cpp
+++ b/ngraph/frontend/paddlepaddle/src/model.cpp
@@ -11,6 +11,12 @@
 #include "decoder.hpp"
 #include "framework.pb.h"
 #include "node_context.hpp"
+#include "pdpd_utils.hpp"
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+#include <codecvt>
+#include <locale>
+#endif
 
 namespace ngraph
 {
@@ -21,7 +27,8 @@ namespace ngraph
         class InputModelPDPD::InputModelPDPDImpl
         {
         public:
-            InputModelPDPDImpl(const std::string& path, const InputModel& input_model);
+            template <typename T>
+            InputModelPDPDImpl(const std::basic_string<T>& path, const InputModel& input_model);
             InputModelPDPDImpl(const std::vector<std::istream*>& streams,
                                const InputModel& input_model);
             std::vector<Place::Ptr> getInputs() const;
@@ -37,7 +44,6 @@ namespace ngraph
             void setElementType(Place::Ptr place, const ngraph::element::Type&);
             void setTensorValue(Place::Ptr place, const void* value);
 
-            std::vector<uint8_t> readWeight(const std::string& name, int64_t len);
             std::vector<std::shared_ptr<OpPlacePDPD>> getOpPlaces() const { return m_op_places; }
             std::map<std::string, std::shared_ptr<TensorPlacePDPD>> getVarPlaces() const
             {
@@ -50,7 +56,9 @@ namespace ngraph
 
         private:
             void loadPlaces();
-            void loadConsts(std::string folder_with_weights, std::istream* weight_stream);
+            template <typename T>
+            void loadConsts(const std::basic_string<T>& folder_with_weights,
+                            std::istream* weight_stream);
 
             std::vector<std::shared_ptr<OpPlacePDPD>> m_op_places;
             std::map<std::string, std::shared_ptr<TensorPlacePDPD>> m_var_places;
@@ -142,16 +150,6 @@ namespace ngraph
 
         namespace pdpd
         {
-            bool endsWith(const std::string& str, const std::string& suffix)
-            {
-                if (str.length() >= suffix.length())
-                {
-                    return (0 ==
-                            str.compare(str.length() - suffix.length(), suffix.length(), suffix));
-                }
-                return false;
-            }
-
             void read_tensor(std::istream& is, char* data, size_t len)
             {
                 std::vector<char> header(16);
@@ -163,16 +161,81 @@ namespace ngraph
                 is.read(data, len);
             }
 
+            template <typename T>
+            std::basic_string<T> get_const_path(const std::basic_string<T>& folder_with_weights,
+                                                const std::string& name)
+            {
+                return folder_with_weights + pdpd::get_path_sep<T>() + name;
+            }
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+            template <>
+            std::basic_string<wchar_t> get_const_path(const std::basic_string<wchar_t>& folder,
+                                                      const std::string& name)
+            {
+                std::wstring_convert<std::codecvt_utf8_utf16<wchar_t>> converter;
+                std::wstring _name = converter.from_bytes(name);
+                return folder + pdpd::get_path_sep<wchar_t>() + _name;
+            }
+#endif
+
+            template <typename T>
+            std::basic_string<T> get_model_path(const std::basic_string<T>& path,
+                                                std::ifstream* weights_stream)
+            {
+                std::string model_file{path};
+                std::string ext = ".pdmodel";
+                if (pdpd::endsWith(model_file, ext))
+                {
+                    std::string params_ext = ".pdiparams";
+                    std::string weights_file{path};
+                    weights_file.replace(weights_file.size() - ext.size(), ext.size(), params_ext);
+                    weights_stream->open(weights_file, std::ios::binary);
+                    // Don't throw error if file isn't opened
+                    // It may mean that model don't have constants
+                }
+                else
+                {
+                    model_file += pdpd::get_path_sep<T>() + "__model__";
+                }
+                return model_file;
+            }
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+            template <>
+            std::basic_string<wchar_t> get_model_path(const std::basic_string<wchar_t>& path,
+                                                      std::ifstream* weights_stream)
+            {
+                std::wstring model_file{path};
+                std::wstring ext = L".pdmodel";
+                if (pdpd::endsWith(model_file, ext))
+                {
+                    std::wstring params_ext = L".pdiparams";
+                    std::wstring weights_file{path};
+                    weights_file.replace(weights_file.size() - ext.size(), ext.size(), params_ext);
+                    weights_stream->open(weights_file, std::ios::binary);
+                    // Don't throw error if file isn't opened
+                    // It may mean that model don't have constants
+                }
+                else
+                {
+                    model_file += pdpd::get_path_sep<wchar_t>() + L"__model__";
+                }
+                return model_file;
+            }
+#endif
         } // namespace pdpd
 
-        void InputModelPDPD::InputModelPDPDImpl::loadConsts(std::string folder_with_weights,
-                                                            std::istream* weight_stream)
+        template <typename T>
+        void InputModelPDPD::InputModelPDPDImpl::loadConsts(
+            const std::basic_string<T>& folder_with_weights, std::istream* weight_stream)
         {
             for (const auto& item : m_var_places)
             {
                 const auto& var_desc = item.second->getDesc();
                 const auto& name = item.first;
-                if (pdpd::endsWith(name, "feed") || pdpd::endsWith(name, "fetch"))
+                if (pdpd::endsWith(name, std::string{"feed"}) ||
+                    pdpd::endsWith(name, std::string{"fetch"}))
                     continue;
                 if (!var_desc->persistable())
                     continue;
@@ -192,7 +255,7 @@ namespace ngraph
                 }
                 else if (!folder_with_weights.empty())
                 {
-                    std::ifstream is(folder_with_weights + "/" + name,
+                    std::ifstream is(pdpd::get_const_path(folder_with_weights, name),
                                      std::ios::in | std::ifstream::binary);
                     FRONT_END_GENERAL_CHECK(is && is.is_open(),
                                             "Cannot open file for constant value.");
@@ -210,35 +273,24 @@ namespace ngraph
             }
         }
 
-        InputModelPDPD::InputModelPDPDImpl::InputModelPDPDImpl(const std::string& path,
+        template <typename T>
+        InputModelPDPD::InputModelPDPDImpl::InputModelPDPDImpl(const std::basic_string<T>& path,
                                                                const InputModel& input_model)
             : m_fw_ptr{std::make_shared<ProgramDesc>()}
             , m_input_model(input_model)
         {
-            std::string ext = ".pdmodel";
-            std::string model_file(path);
-            std::unique_ptr<std::ifstream> weights_stream;
-            if (model_file.length() >= ext.length() &&
-                (0 == model_file.compare(model_file.length() - ext.length(), ext.length(), ext)))
-            {
-                std::string weights_file(path);
-                weights_file.replace(weights_file.size() - ext.size(), ext.size(), ".pdiparams");
-                weights_stream = std::unique_ptr<std::ifstream>(
-                    new std::ifstream(weights_file, std::ios::binary));
-                // Don't throw error if file isn't opened
-                // It may mean that model don't have constants
-            }
-            else
-            {
-                model_file += "/__model__";
-            }
+            std::string empty_str = "";
+            std::ifstream weights_stream;
+            std::ifstream pb_stream(pdpd::get_model_path<T>(path, &weights_stream),
+                                    std::ios::in | std::ifstream::binary);
 
-            std::ifstream pb_stream(model_file, std::ios::binary);
+            FRONT_END_GENERAL_CHECK(pb_stream && pb_stream.is_open(), "Model file doesn't exist");
             FRONT_END_GENERAL_CHECK(m_fw_ptr->ParseFromIstream(&pb_stream),
                                     "Model can't be parsed");
 
             loadPlaces();
-            loadConsts(weights_stream ? "" : path, weights_stream.get());
+            loadConsts(weights_stream && weights_stream.is_open() ? std::basic_string<T>{} : path,
+                       &weights_stream);
         }
 
         InputModelPDPD::InputModelPDPDImpl::InputModelPDPDImpl(
@@ -257,7 +309,7 @@ namespace ngraph
 
             loadPlaces();
             if (streams.size() > 1)
-                loadConsts("", streams[1]);
+                loadConsts(std::string{""}, streams[1]);
         }
 
         std::vector<Place::Ptr> InputModelPDPD::InputModelPDPDImpl::getInputs() const
@@ -367,6 +419,13 @@ namespace ngraph
         {
         }
 
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+        InputModelPDPD::InputModelPDPD(const std::wstring& path)
+            : _impl{std::make_shared<InputModelPDPDImpl>(path, *this)}
+        {
+        }
+#endif
+
         InputModelPDPD::InputModelPDPD(const std::vector<std::istream*>& streams)
             : _impl{std::make_shared<InputModelPDPDImpl>(streams, *this)}
         {
diff --git a/ngraph/frontend/paddlepaddle/src/op/scale.cpp b/ngraph/frontend/paddlepaddle/src/op/scale.cpp
index 27d87e18c205c3..bfc7637dd877c1 100644
--- a/ngraph/frontend/paddlepaddle/src/op/scale.cpp
+++ b/ngraph/frontend/paddlepaddle/src/op/scale.cpp
@@ -32,12 +32,12 @@ namespace ngraph
                     }
                     else
                     {
-                        scale = builder::make_constant(
-                            dtype, Shape{1}, node.get_attribute<float>("scale"));
+                        auto scale_val = node.get_attribute<float>("scale");
+                        scale = ngraph::opset6::Constant::create(dtype, Shape{1}, {scale_val});
                     }
 
-                    bias =
-                        builder::make_constant(dtype, Shape{1}, node.get_attribute<float>("bias"));
+                    auto bias_val = node.get_attribute<float>("bias");
+                    bias = ngraph::opset6::Constant::create(dtype, Shape{1}, {bias_val});
                     auto bias_after_scale = node.get_attribute<bool>("bias_after_scale");
 
                     std::shared_ptr<Node> result_node;
diff --git a/ngraph/frontend/paddlepaddle/src/pdpd_utils.hpp b/ngraph/frontend/paddlepaddle/src/pdpd_utils.hpp
new file mode 100644
index 00000000000000..80170b5edfa10e
--- /dev/null
+++ b/ngraph/frontend/paddlepaddle/src/pdpd_utils.hpp
@@ -0,0 +1,51 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "frontend_manager/frontend_exceptions.hpp"
+
+namespace ngraph
+{
+    namespace frontend
+    {
+        namespace pdpd
+        {
+#ifdef _WIN32
+            const char PATH_SEPARATOR = '\\';
+#if defined(ENABLE_UNICODE_PATH_SUPPORT)
+            const wchar_t WPATH_SEPARATOR = L'\\';
+#endif
+#else
+            const char PATH_SEPARATOR = '/';
+#endif
+
+            template <typename T>
+            inline std::basic_string<T> get_path_sep()
+            {
+                return std::basic_string<T>{PATH_SEPARATOR};
+            }
+
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
+            template <>
+            inline std::basic_string<wchar_t> get_path_sep()
+            {
+                return std::basic_string<wchar_t>{WPATH_SEPARATOR};
+            }
+#endif
+
+            template <typename T>
+            bool endsWith(const std::basic_string<T>& str, const std::basic_string<T>& suffix)
+            {
+                if (str.length() >= suffix.length())
+                {
+                    return (0 ==
+                            str.compare(str.length() - suffix.length(), suffix.length(), suffix));
+                }
+                return false;
+            }
+
+        } // namespace pdpd
+    }     // namespace frontend
+} // namespace ngraph
\ No newline at end of file
diff --git a/ngraph/python/src/ngraph/__init__.py b/ngraph/python/src/ngraph/__init__.py
index 8647878d8dff5f..950a05e4edec41 100644
--- a/ngraph/python/src/ngraph/__init__.py
+++ b/ngraph/python/src/ngraph/__init__.py
@@ -17,7 +17,6 @@
 from ngraph.impl import Node
 from ngraph.impl import PartialShape
 from ngraph.frontend import FrontEnd
-from ngraph.frontend import FrontEndCapabilities
 from ngraph.frontend import FrontEndManager
 from ngraph.frontend import GeneralFailure
 from ngraph.frontend import NotImplementedFailure
diff --git a/ngraph/python/src/ngraph/frontend/__init__.py b/ngraph/python/src/ngraph/frontend/__init__.py
index 0ea21ad7c8827b..72bd47445afd92 100644
--- a/ngraph/python/src/ngraph/frontend/__init__.py
+++ b/ngraph/python/src/ngraph/frontend/__init__.py
@@ -11,7 +11,6 @@
 # main classes
 from _pyngraph import FrontEndManager
 from _pyngraph import FrontEnd
-from _pyngraph import FrontEndCapabilities
 from _pyngraph import InputModel
 from _pyngraph import Place
 
diff --git a/ngraph/python/src/pyngraph/frontend/frontend.cpp b/ngraph/python/src/pyngraph/frontend/frontend.cpp
index ecc736b37f0269..eb723aded423d8 100644
--- a/ngraph/python/src/pyngraph/frontend/frontend.cpp
+++ b/ngraph/python/src/pyngraph/frontend/frontend.cpp
@@ -19,10 +19,11 @@ void regclass_pyngraph_FrontEnd(py::module m)
         m, "FrontEnd", py::dynamic_attr());
     fem.doc() = "ngraph.impl.FrontEnd wraps ngraph::frontend::FrontEnd";
 
-    fem.def("load_from_file",
-            &ngraph::frontend::FrontEnd::load_from_file,
-            py::arg("path"),
-            R"(
+    fem.def(
+        "load",
+        [](ngraph::frontend::FrontEnd& self, const std::string& s) { return self.load(s); },
+        py::arg("path"),
+        R"(
                 Loads an input model by specified model file path.
 
                 Parameters
@@ -32,7 +33,7 @@ void regclass_pyngraph_FrontEnd(py::module m)
 
                 Returns
                 ----------
-                load_from_file : InputModel
+                load : InputModel
                     Loaded input model.
              )");
 
diff --git a/ngraph/python/src/pyngraph/frontend/frontend_manager.cpp b/ngraph/python/src/pyngraph/frontend/frontend_manager.cpp
index 15f5a046a99993..dc0475ee973dab 100644
--- a/ngraph/python/src/pyngraph/frontend/frontend_manager.cpp
+++ b/ngraph/python/src/pyngraph/frontend/frontend_manager.cpp
@@ -38,7 +38,6 @@ void regclass_pyngraph_FrontEndManager(py::module m)
     fem.def("load_by_framework",
             &ngraph::frontend::FrontEndManager::load_by_framework,
             py::arg("framework"),
-            py::arg("capabilities") = ngraph::frontend::FrontEndCapabilities::FEC_DEFAULT,
             R"(
                 Loads frontend by name of framework and capabilities.
 
@@ -47,10 +46,6 @@ void regclass_pyngraph_FrontEndManager(py::module m)
                 framework : str
                     Framework name. Throws exception if name is not in list of available frontends.
 
-                capabilities : int
-                    Frontend capabilities. Default is FrontEndCapabilities.FEC_DEFAULT. It is recommended to use only
-                    those capabilities which are needed to minimize load time.
-
                 Returns
                 ----------
                 load_by_framework : FrontEnd
@@ -58,30 +53,6 @@ void regclass_pyngraph_FrontEndManager(py::module m)
              )");
 }
 
-void regclass_pyngraph_FEC(py::module m)
-{
-    class FeCaps
-    {
-    public:
-        int get_caps() const { return m_caps; }
-
-    private:
-        int m_caps;
-    };
-
-    py::class_<FeCaps, std::shared_ptr<FeCaps>> type(m, "FrontEndCapabilities");
-    // type.doc() = "FrontEndCapabilities";
-    type.attr("DEFAULT") = ngraph::frontend::FrontEndCapabilities::FEC_DEFAULT;
-    type.attr("CUT") = ngraph::frontend::FrontEndCapabilities::FEC_CUT;
-    type.attr("NAMES") = ngraph::frontend::FrontEndCapabilities::FEC_NAMES;
-    type.attr("WILDCARDS") = ngraph::frontend::FrontEndCapabilities::FEC_WILDCARDS;
-
-    type.def(
-        "__eq__",
-        [](const FeCaps& a, const FeCaps& b) { return a.get_caps() == b.get_caps(); },
-        py::is_operator());
-}
-
 void regclass_pyngraph_GeneralFailureFrontEnd(py::module m)
 {
     static py::exception<ngraph::frontend::GeneralFailure> exc(std::move(m), "GeneralFailure");
diff --git a/ngraph/python/src/pyngraph/frontend/frontend_manager.hpp b/ngraph/python/src/pyngraph/frontend/frontend_manager.hpp
index 35caa7e5dd1def..969ddd6859ab88 100644
--- a/ngraph/python/src/pyngraph/frontend/frontend_manager.hpp
+++ b/ngraph/python/src/pyngraph/frontend/frontend_manager.hpp
@@ -9,7 +9,6 @@
 namespace py = pybind11;
 
 void regclass_pyngraph_FrontEndManager(py::module m);
-void regclass_pyngraph_FEC(py::module m);
 void regclass_pyngraph_NotImplementedFailureFrontEnd(py::module m);
 void regclass_pyngraph_InitializationFailureFrontEnd(py::module m);
 void regclass_pyngraph_OpConversionFailureFrontEnd(py::module m);
diff --git a/ngraph/python/src/pyngraph/pyngraph.cpp b/ngraph/python/src/pyngraph/pyngraph.cpp
index 0849de45f58554..c401a683654b8b 100644
--- a/ngraph/python/src/pyngraph/pyngraph.cpp
+++ b/ngraph/python/src/pyngraph/pyngraph.cpp
@@ -51,7 +51,6 @@ PYBIND11_MODULE(_pyngraph, m)
     regclass_pyngraph_OpConversionFailureFrontEnd(m);
     regclass_pyngraph_OpValidationFailureFrontEnd(m);
     regclass_pyngraph_NotImplementedFailureFrontEnd(m);
-    regclass_pyngraph_FEC(m);
     regclass_pyngraph_FrontEndManager(m);
     regclass_pyngraph_FrontEnd(m);
     regclass_pyngraph_InputModel(m);
diff --git a/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.cpp b/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.cpp
index e060da7563cdff..1377e8ba4aaf50 100644
--- a/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.cpp
+++ b/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.cpp
@@ -18,7 +18,7 @@ extern "C" MOCK_API void* GetFrontEndData()
 {
     FrontEndPluginInfo* res = new FrontEndPluginInfo();
     res->m_name = "mock_py";
-    res->m_creator = [](FrontEndCapFlags flags) { return std::make_shared<FrontEndMockPy>(flags); };
+    res->m_creator = []() { return std::make_shared<FrontEndMockPy>(); };
 
     return res;
 }
diff --git a/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp b/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp
index 651e9e53809683..c2654f7d8745ea 100644
--- a/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp
+++ b/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp
@@ -479,7 +479,6 @@ class MOCK_API InputModelMockPy : public InputModel
 
 struct MOCK_API FeStat
 {
-    FrontEndCapFlags m_load_flags;
     std::vector<std::string> m_load_paths;
     int m_convert_model = 0;
     int m_convert = 0;
@@ -487,7 +486,6 @@ struct MOCK_API FeStat
     int m_decode = 0;
     int m_normalize = 0;
     // Getters
-    FrontEndCapFlags load_flags() const { return m_load_flags; }
     std::vector<std::string> load_paths() const { return m_load_paths; }
     int convert_model() const { return m_convert_model; }
     int convert() const { return m_convert; }
@@ -501,11 +499,12 @@ class MOCK_API FrontEndMockPy : public FrontEnd
     mutable FeStat m_stat;
 
 public:
-    FrontEndMockPy(FrontEndCapFlags flags) { m_stat.m_load_flags = flags; }
+    FrontEndMockPy() {}
 
-    InputModel::Ptr load_from_file(const std::string& path) const override
+    InputModel::Ptr load_impl(const std::vector<std::shared_ptr<Variant>>& params) const override
     {
-        m_stat.m_load_paths.push_back(path);
+        if (params.size() > 0 && is_type<VariantWrapper<std::string>>(params[0]))
+            m_stat.m_load_paths.push_back(as_type_ptr<VariantWrapper<std::string>>(params[0])->get());
         return std::make_shared<InputModelMockPy>();
     }
 
diff --git a/ngraph/python/tests/mock/pyngraph_fe_mock_api/pyngraph_mock_frontend_api.cpp b/ngraph/python/tests/mock/pyngraph_fe_mock_api/pyngraph_mock_frontend_api.cpp
index ec87842d417330..1927e04b7a3d49 100644
--- a/ngraph/python/tests/mock/pyngraph_fe_mock_api/pyngraph_mock_frontend_api.cpp
+++ b/ngraph/python/tests/mock/pyngraph_fe_mock_api/pyngraph_mock_frontend_api.cpp
@@ -27,7 +27,6 @@ static void register_mock_frontend_stat(py::module m)
         py::arg("frontend"));
 
     py::class_<FeStat> feStat(m, "FeStat", py::dynamic_attr());
-    feStat.def_property_readonly("load_flags", &FeStat::load_flags);
     feStat.def_property_readonly("load_paths", &FeStat::load_paths);
     feStat.def_property_readonly("convert_model", &FeStat::convert_model);
     feStat.def_property_readonly("convert", &FeStat::convert);
diff --git a/ngraph/python/tests/test_ngraph/test_frontendmanager.py b/ngraph/python/tests/test_ngraph/test_frontendmanager.py
index 7ced949dff2b88..51882091fdae2e 100644
--- a/ngraph/python/tests/test_ngraph/test_frontendmanager.py
+++ b/ngraph/python/tests/test_ngraph/test_frontendmanager.py
@@ -4,7 +4,7 @@
 import pickle
 
 from ngraph import PartialShape
-from ngraph.frontend import FrontEndCapabilities, FrontEndManager, InitializationFailure
+from ngraph.frontend import FrontEndManager, InitializationFailure
 from ngraph.utils.types import get_element_type
 
 import numpy as np
@@ -31,28 +31,9 @@ def test_pickle():
     pickle.dumps(fem)
 
 
-@mock_needed
-def test_load_by_framework_caps():
-    frontEnds = fem.get_available_front_ends()
-    assert frontEnds is not None
-    assert "mock_py" in frontEnds
-    caps = [FrontEndCapabilities.DEFAULT,
-            FrontEndCapabilities.CUT,
-            FrontEndCapabilities.NAMES,
-            FrontEndCapabilities.WILDCARDS,
-            FrontEndCapabilities.CUT | FrontEndCapabilities.NAMES | FrontEndCapabilities.WILDCARDS]
-    for cap in caps:
-        fe = fem.load_by_framework(framework="mock_py", capabilities=cap)
-        stat = get_fe_stat(fe)
-        assert cap == stat.load_flags
-    for i in range(len(caps) - 1):
-        for j in range(i + 1, len(caps)):
-            assert caps[i] != caps[j]
-
-
 def test_load_by_unknown_framework():
     frontEnds = fem.get_available_front_ends()
-    assert not("UnknownFramework" in frontEnds)
+    assert not ("UnknownFramework" in frontEnds)
     try:
         fem.load_by_framework("UnknownFramework")
     except InitializationFailure as exc:
@@ -62,10 +43,10 @@ def test_load_by_unknown_framework():
 
 
 @mock_needed
-def test_load_from_file():
+def test_load():
     fe = fem.load_by_framework(framework="mock_py")
     assert fe is not None
-    model = fe.load_from_file("abc.bin")
+    model = fe.load("abc.bin")
     assert model is not None
     stat = get_fe_stat(fe)
     assert "abc.bin" in stat.load_paths
@@ -75,7 +56,7 @@ def test_load_from_file():
 def test_convert_model():
     fe = fem.load_by_framework(framework="mock_py")
     assert fe is not None
-    model = fe.load_from_file(path="")
+    model = fe.load(path="")
     func = fe.convert(model=model)
     assert func is not None
     stat = get_fe_stat(fe)
@@ -86,7 +67,7 @@ def test_convert_model():
 def test_convert_partially():
     fe = fem.load_by_framework(framework="mock_py")
     assert fe is not None
-    model = fe.load_from_file(path="")
+    model = fe.load(path="")
     func = fe.convert_partially(model=model)
     stat = get_fe_stat(fe)
     assert stat.convert_partially == 1
@@ -99,7 +80,7 @@ def test_convert_partially():
 def test_decode_and_normalize():
     fe = fem.load_by_framework(framework="mock_py")
     assert fe is not None
-    model = fe.load_from_file(path="")
+    model = fe.load(path="")
     func = fe.decode(model=model)
     stat = get_fe_stat(fe)
     assert stat.decode == 1
@@ -113,7 +94,7 @@ def test_decode_and_normalize():
 @mock_needed
 def init_model():
     fe = fem.load_by_framework(framework="mock_py")
-    model = fe.load_from_file(path="")
+    model = fe.load(path="")
     return model
 
 
@@ -379,7 +360,7 @@ def test_model_set_element_type():
 @mock_needed
 def init_place():
     fe = fem.load_by_framework(framework="mock_py")
-    model = fe.load_from_file(path="")
+    model = fe.load(path="")
     place = model.get_place_by_tensor_name(tensorName="")
     return model, place
 
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 78e14870aa5dbf..cab60e4ecca57b 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -631,6 +631,7 @@ install(TARGETS unit-test
         EXCLUDE_FROM_ALL)
 
 ############ FRONTEND ############
+target_include_directories(unit-test PRIVATE ${FRONTEND_INCLUDE_PATH} frontend/shared/include)
 target_link_libraries(unit-test PRIVATE frontend_manager cnpy)
 
 add_subdirectory(frontend)
diff --git a/ngraph/test/frontend/frontend_manager.cpp b/ngraph/test/frontend/frontend_manager.cpp
index af70885d237901..218ecded3adf0a 100644
--- a/ngraph/test/frontend/frontend_manager.cpp
+++ b/ngraph/test/frontend/frontend_manager.cpp
@@ -35,7 +35,7 @@ TEST(FrontEndManagerTest, testAvailableFrontEnds)
 {
     FrontEndManager fem;
     ASSERT_NO_THROW(fem.register_front_end(
-        "mock", [](FrontEndCapFlags fec) { return std::make_shared<FrontEnd>(); }));
+        "mock", []() { return std::make_shared<FrontEnd>(); }));
     auto frontends = fem.get_available_front_ends();
     ASSERT_NE(std::find(frontends.begin(), frontends.end(), "mock"), frontends.end());
     FrontEnd::Ptr fe;
@@ -50,26 +50,6 @@ TEST(FrontEndManagerTest, testAvailableFrontEnds)
     ASSERT_EQ(std::find(frontends.begin(), frontends.end(), "mock"), frontends.end());
 }
 
-TEST(FrontEndManagerTest, testLoadWithFlags)
-{
-    int expFlags = FrontEndCapabilities::FEC_CUT | FrontEndCapabilities::FEC_WILDCARDS |
-                   FrontEndCapabilities::FEC_NAMES;
-    int actualFlags = FrontEndCapabilities::FEC_DEFAULT;
-    FrontEndManager fem;
-    ASSERT_NO_THROW(fem.register_front_end("mock", [&actualFlags](int fec) {
-        actualFlags = fec;
-        return std::make_shared<FrontEnd>();
-    }));
-    auto frontends = fem.get_available_front_ends();
-    ASSERT_NE(std::find(frontends.begin(), frontends.end(), "mock"), frontends.end());
-    FrontEnd::Ptr fe;
-    ASSERT_NO_THROW(fe = fem.load_by_framework("mock", expFlags));
-    ASSERT_TRUE(actualFlags & FrontEndCapabilities::FEC_CUT);
-    ASSERT_TRUE(actualFlags & FrontEndCapabilities::FEC_WILDCARDS);
-    ASSERT_TRUE(actualFlags & FrontEndCapabilities::FEC_NAMES);
-    ASSERT_EQ(expFlags, actualFlags);
-}
-
 TEST(FrontEndManagerTest, testMockPluginFrontEnd)
 {
     std::string fePath = ngraph::file_util::get_directory(
@@ -86,17 +66,13 @@ TEST(FrontEndManagerTest, testMockPluginFrontEnd)
 TEST(FrontEndManagerTest, testDefaultFrontEnd)
 {
     FrontEndManager fem;
-    ASSERT_ANY_THROW(fem.load_by_model(""));
+    FrontEnd::Ptr fe;
+    ASSERT_NO_THROW(fe = fem.load_by_model(""));
+    ASSERT_FALSE(fe);
 
     std::unique_ptr<FrontEnd> fePtr(new FrontEnd()); // to verify base destructor
-    FrontEnd::Ptr fe = std::make_shared<FrontEnd>();
-    ASSERT_ANY_THROW(fe->load_from_file(""));
-    ASSERT_ANY_THROW(fe->load_from_files({"", ""}));
-    ASSERT_ANY_THROW(fe->load_from_memory(nullptr));
-    ASSERT_ANY_THROW(fe->load_from_memory_fragments({nullptr, nullptr}));
-    std::stringstream str;
-    ASSERT_ANY_THROW(fe->load_from_stream(str));
-    ASSERT_ANY_THROW(fe->load_from_streams({&str, &str}));
+    fe = std::make_shared<FrontEnd>();
+    ASSERT_ANY_THROW(fe->load(""));
     ASSERT_ANY_THROW(fe->convert(std::shared_ptr<Function>(nullptr)));
     ASSERT_ANY_THROW(fe->convert(InputModel::Ptr(nullptr)));
     ASSERT_ANY_THROW(fe->convert_partially(nullptr));
diff --git a/ngraph/test/frontend/mock_frontend.cpp b/ngraph/test/frontend/mock_frontend.cpp
index 34c8d420b031fc..bb5fdf105ee092 100644
--- a/ngraph/test/frontend/mock_frontend.cpp
+++ b/ngraph/test/frontend/mock_frontend.cpp
@@ -29,6 +29,6 @@ extern "C" MOCK_API void* GetFrontEndData()
 {
     FrontEndPluginInfo* res = new FrontEndPluginInfo();
     res->m_name = "mock1";
-    res->m_creator = [](FrontEndCapFlags) { return std::make_shared<FrontEndMock>(); };
+    res->m_creator = []() { return std::make_shared<FrontEndMock>(); };
     return res;
 }
\ No newline at end of file
diff --git a/ngraph/test/frontend/paddlepaddle/basic_api.cpp b/ngraph/test/frontend/paddlepaddle/basic_api.cpp
index d191e4fccda3af..a2568000f3184f 100644
--- a/ngraph/test/frontend/paddlepaddle/basic_api.cpp
+++ b/ngraph/test/frontend/paddlepaddle/basic_api.cpp
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../shared/include/basic_api.hpp"
+#include "basic_api.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
diff --git a/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp b/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp
index 3251762b6f9421..04826bce96f4dd 100644
--- a/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp
+++ b/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../shared/include/cut_specific_model.hpp"
+#include "cut_specific_model.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
diff --git a/ngraph/test/frontend/paddlepaddle/load_from.cpp b/ngraph/test/frontend/paddlepaddle/load_from.cpp
index 2950c3d271f4f7..b8865b6df6eca1 100644
--- a/ngraph/test/frontend/paddlepaddle/load_from.cpp
+++ b/ngraph/test/frontend/paddlepaddle/load_from.cpp
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../shared/include/load_from.hpp"
+#include "load_from.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
diff --git a/ngraph/test/frontend/paddlepaddle/partial_shape.cpp b/ngraph/test/frontend/paddlepaddle/partial_shape.cpp
index ddb7213f9ec75f..97989af8ca2ec0 100644
--- a/ngraph/test/frontend/paddlepaddle/partial_shape.cpp
+++ b/ngraph/test/frontend/paddlepaddle/partial_shape.cpp
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../shared/include/partial_shape.hpp"
+#include "partial_shape.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
diff --git a/ngraph/test/frontend/paddlepaddle/set_element_type.cpp b/ngraph/test/frontend/paddlepaddle/set_element_type.cpp
index e53ea790ac869f..10781a0abe6eb5 100644
--- a/ngraph/test/frontend/paddlepaddle/set_element_type.cpp
+++ b/ngraph/test/frontend/paddlepaddle/set_element_type.cpp
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../shared/include/set_element_type.hpp"
+#include "set_element_type.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
diff --git a/ngraph/test/frontend/shared/src/basic_api.cpp b/ngraph/test/frontend/shared/src/basic_api.cpp
index de321326b280cf..e316486e70228e 100644
--- a/ngraph/test/frontend/shared/src/basic_api.cpp
+++ b/ngraph/test/frontend/shared/src/basic_api.cpp
@@ -2,8 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../include/basic_api.hpp"
-#include "../include/utils.hpp"
+#include "basic_api.hpp"
+#include "utils.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
@@ -34,7 +34,7 @@ void FrontEndBasicTest::doLoadFromFile()
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
     ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_feName));
     ASSERT_NE(m_frontEnd, nullptr);
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_file(m_modelFile));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(m_modelFile));
     ASSERT_NE(m_inputModel, nullptr);
 }
 
diff --git a/ngraph/test/frontend/shared/src/cut_specific_model.cpp b/ngraph/test/frontend/shared/src/cut_specific_model.cpp
index 9f8cb64b54188b..a9e7ee1a4ca4e0 100644
--- a/ngraph/test/frontend/shared/src/cut_specific_model.cpp
+++ b/ngraph/test/frontend/shared/src/cut_specific_model.cpp
@@ -2,8 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../include/cut_specific_model.hpp"
-#include "../include/utils.hpp"
+#include "cut_specific_model.hpp"
+#include "utils.hpp"
 #include "ngraph/opsets/opset7.hpp"
 
 using namespace ngraph;
@@ -44,7 +44,7 @@ void FrontEndCutModelTest::doLoadFromFile()
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
     ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_param.m_frontEndName));
     ASSERT_NE(m_frontEnd, nullptr);
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_file(m_param.m_modelName));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(m_param.m_modelName));
     ASSERT_NE(m_inputModel, nullptr);
 }
 
diff --git a/ngraph/test/frontend/shared/src/load_from.cpp b/ngraph/test/frontend/shared/src/load_from.cpp
index 6e1ec73512c26c..937f86f1f0ccf2 100644
--- a/ngraph/test/frontend/shared/src/load_from.cpp
+++ b/ngraph/test/frontend/shared/src/load_from.cpp
@@ -2,9 +2,9 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../include/load_from.hpp"
+#include "load_from.hpp"
 #include <fstream>
-#include "../include/utils.hpp"
+#include "utils.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
@@ -23,18 +23,18 @@ void FrontEndLoadFromTest::SetUp()
     m_param = GetParam();
 }
 
-///////////////////////////////////////////////////////////////////
+///////////////////load from Variants//////////////////////
 
-TEST_P(FrontEndLoadFromTest, testLoadFromFile)
+TEST_P(FrontEndLoadFromTest, testLoadFromFilePath)
 {
+    std::string model_path = m_param.m_modelsPath + m_param.m_file;
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
-    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_param.m_frontEndName));
+    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_model(model_path));
     ASSERT_NE(m_frontEnd, nullptr);
 
-    ASSERT_NO_THROW(m_inputModel =
-                        m_frontEnd->load_from_file(m_param.m_modelsPath + m_param.m_file));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(model_path));
     ASSERT_NE(m_inputModel, nullptr);
 
     std::shared_ptr<ngraph::Function> function;
@@ -42,21 +42,17 @@ TEST_P(FrontEndLoadFromTest, testLoadFromFile)
     ASSERT_NE(function, nullptr);
 }
 
-TEST_P(FrontEndLoadFromTest, testLoadFromFiles)
+TEST_P(FrontEndLoadFromTest, testLoadFromTwoFiles)
 {
+    std::string model_path = m_param.m_modelsPath + m_param.m_files[0];
+    std::string weights_path = m_param.m_modelsPath + m_param.m_files[1];
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
-    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_param.m_frontEndName));
+    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_model(model_path, weights_path));
     ASSERT_NE(m_frontEnd, nullptr);
 
-    auto dir_files = m_param.m_files;
-    for (auto& file : dir_files)
-    {
-        file = m_param.m_modelsPath + file;
-    }
-
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_files(dir_files));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(model_path, weights_path));
     ASSERT_NE(m_inputModel, nullptr);
 
     std::shared_ptr<ngraph::Function> function;
@@ -66,14 +62,16 @@ TEST_P(FrontEndLoadFromTest, testLoadFromFiles)
 
 TEST_P(FrontEndLoadFromTest, testLoadFromStream)
 {
+    auto ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_stream,
+                                                      std::ios::in | std::ifstream::binary);
+    auto is = std::dynamic_pointer_cast<std::istream>(ifs);
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
-    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_param.m_frontEndName));
+    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_model(is));
     ASSERT_NE(m_frontEnd, nullptr);
 
-    std::ifstream is(m_param.m_modelsPath + m_param.m_stream, std::ios::in | std::ifstream::binary);
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_stream(is));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(is));
     ASSERT_NE(m_inputModel, nullptr);
 
     std::shared_ptr<ngraph::Function> function;
@@ -81,23 +79,22 @@ TEST_P(FrontEndLoadFromTest, testLoadFromStream)
     ASSERT_NE(function, nullptr);
 }
 
-TEST_P(FrontEndLoadFromTest, testLoadFromStreams)
+TEST_P(FrontEndLoadFromTest, testLoadFromTwoStreams)
 {
+    auto model_ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_streams[0],
+                                                     std::ios::in | std::ifstream::binary);
+    auto weights_ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_streams[1],
+                                                       std::ios::in | std::ifstream::binary);
+    auto model_is = std::dynamic_pointer_cast<std::istream>(model_ifs);
+    auto weights_is = std::dynamic_pointer_cast<std::istream>(weights_ifs);
+
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
-    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_param.m_frontEndName));
+    ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_model(model_is, weights_is));
     ASSERT_NE(m_frontEnd, nullptr);
 
-    std::vector<std::shared_ptr<std::ifstream>> is_vec;
-    std::vector<std::istream*> is_ptr_vec;
-    for (auto& file : m_param.m_streams)
-    {
-        is_vec.push_back(std::make_shared<std::ifstream>(m_param.m_modelsPath + file,
-                                                         std::ios::in | std::ifstream::binary));
-        is_ptr_vec.push_back(is_vec.back().get());
-    }
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_streams(is_ptr_vec));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(model_is, weights_is));
     ASSERT_NE(m_inputModel, nullptr);
 
     std::shared_ptr<ngraph::Function> function;
diff --git a/ngraph/test/frontend/shared/src/op_fuzzy.cpp b/ngraph/test/frontend/shared/src/op_fuzzy.cpp
index d7fa7ca8784a81..b43dd2946363a8 100644
--- a/ngraph/test/frontend/shared/src/op_fuzzy.cpp
+++ b/ngraph/test/frontend/shared/src/op_fuzzy.cpp
@@ -44,7 +44,7 @@ void FrontEndFuzzyOpTest::doLoadFromFile()
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
     ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_feName));
     ASSERT_NE(m_frontEnd, nullptr);
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_file(m_modelFile));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(m_modelFile));
     ASSERT_NE(m_inputModel, nullptr);
 }
 
diff --git a/ngraph/test/frontend/shared/src/partial_shape.cpp b/ngraph/test/frontend/shared/src/partial_shape.cpp
index e65554b88e215d..bfb63528f3fe85 100644
--- a/ngraph/test/frontend/shared/src/partial_shape.cpp
+++ b/ngraph/test/frontend/shared/src/partial_shape.cpp
@@ -2,8 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../include/partial_shape.hpp"
-#include "../include/utils.hpp"
+#include "partial_shape.hpp"
+#include "utils.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
@@ -42,7 +42,7 @@ void FrontEndPartialShapeTest::doLoadFromFile()
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
     ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_baseParam.m_frontEndName));
     ASSERT_NE(m_frontEnd, nullptr);
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_file(m_partShape.m_modelName));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(m_partShape.m_modelName));
     ASSERT_NE(m_inputModel, nullptr);
 }
 
diff --git a/ngraph/test/frontend/shared/src/set_element_type.cpp b/ngraph/test/frontend/shared/src/set_element_type.cpp
index 1b6b77141ac8a1..647087d611994d 100644
--- a/ngraph/test/frontend/shared/src/set_element_type.cpp
+++ b/ngraph/test/frontend/shared/src/set_element_type.cpp
@@ -2,8 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "../include/set_element_type.hpp"
-#include "../include/utils.hpp"
+#include "set_element_type.hpp"
+#include "utils.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
@@ -35,7 +35,7 @@ void FrontEndElementTypeTest::doLoadFromFile()
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
     ASSERT_NO_THROW(m_frontEnd = m_fem.load_by_framework(m_param.m_frontEndName));
     ASSERT_NE(m_frontEnd, nullptr);
-    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load_from_file(m_param.m_modelName));
+    ASSERT_NO_THROW(m_inputModel = m_frontEnd->load(m_param.m_modelName));
     ASSERT_NE(m_inputModel, nullptr);
 }
 
diff --git a/ngraph/test/op.cpp b/ngraph/test/op.cpp
index af7371db74c9d5..b3f04121a689ae 100644
--- a/ngraph/test/op.cpp
+++ b/ngraph/test/op.cpp
@@ -107,16 +107,16 @@ namespace ngraph
 
 TEST(op, variant)
 {
-    shared_ptr<Variant> var_std_string = make_shared<VariantWrapper<std::string>>("My string");
+    shared_ptr<Variant> var_std_string = make_variant<std::string>("My string");
     ASSERT_TRUE((is_type<VariantWrapper<std::string>>(var_std_string)));
     EXPECT_EQ((as_type_ptr<VariantWrapper<std::string>>(var_std_string)->get()), "My string");
 
-    shared_ptr<Variant> var_int64_t = make_shared<VariantWrapper<int64_t>>(27);
+    shared_ptr<Variant> var_int64_t = make_variant<int64_t>(27);
     ASSERT_TRUE((is_type<VariantWrapper<int64_t>>(var_int64_t)));
     EXPECT_FALSE((is_type<VariantWrapper<std::string>>(var_int64_t)));
     EXPECT_EQ((as_type_ptr<VariantWrapper<int64_t>>(var_int64_t)->get()), 27);
 
-    shared_ptr<Variant> var_ship = make_shared<VariantWrapper<Ship>>(Ship{"Lollipop", 3, 4});
+    shared_ptr<Variant> var_ship = make_variant<Ship>(Ship{"Lollipop", 3, 4});
     ASSERT_TRUE((is_type<VariantWrapper<Ship>>(var_ship)));
     Ship& ship = as_type_ptr<VariantWrapper<Ship>>(var_ship)->get();
     EXPECT_EQ(ship.name, "Lollipop");

From 21bf92d5c862b1af648845c61db9ea516992eca1 Mon Sep 17 00:00:00 2001
From: Szymon Durawa <szymon.durawa@intel.com>
Date: Tue, 20 Jul 2021 09:30:11 +0200
Subject: [PATCH 06/71] Update spec for MVN-1 and MVN-6. (#6554)

* Update spec for MVN-1 and MVN-6.

* Add reduction_axes attribute to MVN-1.

* Fix mean value calculation using ReduceMean.

* Correct reduction_axes attrbute name.

* Restore default value for normalize_variance and eps_mode.

* Remove dafult value for required attributes.

* Correct typeo.
---
 docs/ops/normalization/MVN_1.md | 88 +++++++++++++++++++++++++++------
 docs/ops/normalization/MVN_6.md | 13 +++--
 2 files changed, 78 insertions(+), 23 deletions(-)

diff --git a/docs/ops/normalization/MVN_1.md b/docs/ops/normalization/MVN_1.md
index ef8a37204dd82f..a82c9a9ca40531 100644
--- a/docs/ops/normalization/MVN_1.md
+++ b/docs/ops/normalization/MVN_1.md
@@ -4,57 +4,89 @@
 
 **Category**: *Normalization*
 
-**Short description**: [Reference](http://caffe.berkeleyvision.org/tutorial/layers/mvn.html)
+**Short description**: Calculates mean-variance normalization of the input tensor. Supports two normalization techniques: [Instance/Contrast Normalization](https://arxiv.org/abs/1607.08022) and [Layer Normalization](https://arxiv.org/abs/1607.06450).
 
 **Detailed description**
 
-*MVN* subtracts mean value from the input blob:
+Based on `across_channels` attribute mean value is calculated using one of formulas below:
+
+1. if `true` mean value is calculated using Layer Normalization:
+\f[
+\mu_{n} = \frac{\sum_{c}^{C}\sum_{h}^{H}\sum_{w}^{W} i_{nchw}}{C * H * W}
+\f]
+2. if `false` mean value is calculated using Instance/Contrast Normalization:
 \f[
-o_{i} = i_{i} - \frac{\sum{i_{k}}}{C * H * W}
+\mu_{nc} = \frac{\sum_{h}^{H}\sum_{w}^{W} i_{nchw}}{H * W}
 \f]
-If *normalize_variance* is set to 1, the output blob is divided by variance:
+
+where \f$i_{nchw}\f$ is an input tensor parametrized by \f$n\f$ batches, \f$c\f$ channels and \f$h,w\f$ spatial dimesnions.
+
+If `reduction_axes` attribute is provided mean value is calculated based on formula:
 \f[
-o_{i}=\frac{o_{i}}{\sum \sqrt {o_{k}^2}+\epsilon}
+\mu_{n} = ReduceMean(i_{k}, reduction_axes)
 \f]
 
+Afterwards *MVN* subtracts mean value from the input blob.
+
+If *normalize_variance* is set to `true`, the output blob is divided by variance:
+\f[
+o_{i}=\frac{o_{i}}{\sqrt {\sum {\sigma_{k}^2}+\epsilon}}
+\f]
+
+where \f$\sigma_{k}^2\f$ is the variance calculated based on mean value, \f$\epsilon\f$ is a value added to the variance for numerical stability and corresponds to `epsilon` attribute.
+
 **Attributes**
 
 * *across_channels*
 
-  * **Description**: *across_channels* is a flag that specifies whether mean values are shared across channels. For example, *across_channels* equal to `false` means that mean values are not shared across channels.
+  * **Description**: *across_channels* is a flag that specifies whether mean values are shared across channels. If `true` mean values and variance are calculated for each sample across all channels and spatial dimensions (Layer Normalization), otherwise calculation is done for each sample and for each channel across spatial dimensions (Instance/Contrast Normalization).
   * **Range of values**:
     * `false` - do not share mean values across channels
     * `true` - share mean values across channels
   * **Type**: `boolean`
-  * **Default value**: `false`
-  * **Required**: *no*
+  * **Required**: *yes*
+
+* *reduction_axes*
+
+  * **Description**: 1D tensor of unique elements and type *T_IND* which specifies indices of dimensions in `data` that define normalization slices. Negative value means counting dimensions from the back.
+  * **Range of values**: allowed range of axes is `[-r; r-1]` where `r = rank(data)`, the order cannot be sorted
+  * **Type**: `int`
+  * **Required**: *yes*
 
 * *normalize_variance*
 
   * **Description**: *normalize_variance* is a flag that specifies whether to perform variance normalization.
   * **Range of values**:
-    * `false` -- do not normalize variance
-    * `true` -- normalize variance
+    * `false` - do not normalize variance
+    * `true` - normalize variance
   * **Type**: `boolean`
-  * **Default value**: `false`
-  * **Required**: *no*
+  * **Required**: *yes*
 
 * *eps*
 
   * **Description**: *eps* is the number to be added to the variance to avoid division by zero when normalizing the value. For example, *epsilon* equal to 0.001 means that 0.001 is added to the variance.
   * **Range of values**: a positive floating-point number
-  * **Type**: `float`
+  * **Type**: `double`
   * **Required**: *yes*
 
+*   **Note** Important: it is necessary to use only one of `across_channels` or `reduction_axes` attributes, they cannot be defined together.
+
 **Inputs**
 
-* **1**: 4D or 5D input tensor of any floating-point type. **Required.**
+* **1**: `data` - input tensor of type *T* and arbitrary shape. **Required.**
 
 **Outputs**
 
-* **1**: normalized tensor of the same type and shape as input tensor.
+* **1**: normalized tensor of type *T* and shape as input tensor.
 
-**Example**
+**Types**
+
+* *T*: any floating point type.
+* *T_IND*: `int64` or `int32`.
+
+**Examples**
+
+*Example: with `across_channels` attribute*
 
 ```xml
 <layer ... type="MVN">
@@ -77,3 +109,27 @@ o_{i}=\frac{o_{i}}{\sum \sqrt {o_{k}^2}+\epsilon}
     </output>
 </layer>
 ```
+
+*Example: with `reduction_axes` attribute*
+
+```xml
+<layer ... type="MVN">
+    <data reduction_axes="2,3" eps="1e-9" normalize_variance="true"/>
+    <input>
+        <port id="0">
+            <dim>6</dim>
+            <dim>12</dim>
+            <dim>10</dim>
+            <dim>24</dim>
+        </port>
+    </input>
+    <output>
+        <port id="2">
+            <dim>6</dim>
+            <dim>12</dim>
+            <dim>10</dim>
+            <dim>24</dim>
+        </port>
+    </output>
+</layer>
+```
diff --git a/docs/ops/normalization/MVN_6.md b/docs/ops/normalization/MVN_6.md
index 9de691458c462d..f89cf60e92df7e 100644
--- a/docs/ops/normalization/MVN_6.md
+++ b/docs/ops/normalization/MVN_6.md
@@ -30,8 +30,8 @@ o_{i}=\frac{o_{i}}{\sqrt {\sum {o_{k}^2}}+\epsilon}
 
   * **Description**: *normalize_variance* is a flag that specifies whether to perform variance normalization.
   * **Range of values**:
-    * `false` -- Do not normalize variance
-    * `true` -- Normalize variance
+    * `false` - do not normalize variance
+    * `true` - normalize variance
   * **Type**: `boolean`
   * **Required**: *yes*
 
@@ -46,14 +46,14 @@ o_{i}=\frac{o_{i}}{\sqrt {\sum {o_{k}^2}}+\epsilon}
 
   * **Description**: Choose where to add epsilon.
   * **Range of values**:
-    * `inside_sqrt` -- Add epsilon inside sqrt
-    * `outside_sqrt` -- Add epsilon outside of sqrt
+    * `inside_sqrt` - add epsilon inside sqrt
+    * `outside_sqrt` - add epsilon outside of sqrt
   * **Type**: `string`
   * **Required**: *yes*
 
 **Inputs**
 
-* **1**: `data` - Input tensor to be normalized. Type *T*. **Required.**
+* **1**: `data` - Input tensor to be normalized of type *T* and arbitrary shape. **Required.**
 
 * **2**: `axes` - 1D tensor which specifies indices of dimensions in `data` that define normalization slices. Allowed range of axes is `[-r; r-1]` where `r = rank(data)`, the order can be not sorted. Negative value means counting dimensions from the back. Type *T_IND*. **Required.**
 
@@ -63,8 +63,7 @@ o_{i}=\frac{o_{i}}{\sqrt {\sum {o_{k}^2}}+\epsilon}
 
 **Types**
 
-* *T*: any floating-point type.
-
+* *T*: any floating point type.
 * *T_IND*: `int64` or `int32`.
 
 **Example**

From c2c6fe59daecffb55183e755c1d5d8316416aa0a Mon Sep 17 00:00:00 2001
From: Piotr Szmelczynski <piotr.szmelczynski@intel.com>
Date: Tue, 20 Jul 2021 10:22:22 +0200
Subject: [PATCH 07/71] Revise sign (#6581)

* update docs

* add sign to intActivationTypes

* add RTTI macro

* update backend test

* add type prp test

* add visitor test

* add visitor and type_prop test to CMakeList

* add sign to constants.py

* delete backend tests and create new reference tests

* style fix

* remoove sign backend test from CMakeList

* create reference test for all supported types

* remove boolean type from evaluate method
---
 docs/ops/arithmetic/Sign_1.md                 | 23 +++---
 .../tests/functional/op_reference/sign.cpp    | 80 +++++++++++++++++++
 .../single_layer_tests/activation.cpp         |  1 +
 .../layer_tests_summary/utils/constants.py    |  1 +
 ngraph/core/include/ngraph/op/sign.hpp        |  4 +-
 ngraph/core/src/op/sign.cpp                   |  6 +-
 ngraph/test/CMakeLists.txt                    |  5 +-
 ngraph/test/backend/sign.in.cpp               | 54 -------------
 ngraph/test/type_prop/sign.cpp                |  9 +++
 ngraph/test/visitors/op/sign.cpp              | 11 +++
 10 files changed, 121 insertions(+), 73 deletions(-)
 create mode 100644 docs/template_plugin/tests/functional/op_reference/sign.cpp
 delete mode 100644 ngraph/test/backend/sign.in.cpp
 create mode 100644 ngraph/test/type_prop/sign.cpp
 create mode 100644 ngraph/test/visitors/op/sign.cpp

diff --git a/docs/ops/arithmetic/Sign_1.md b/docs/ops/arithmetic/Sign_1.md
index e68cc51f97f7c7..1aa87097e62136 100644
--- a/docs/ops/arithmetic/Sign_1.md
+++ b/docs/ops/arithmetic/Sign_1.md
@@ -4,33 +4,30 @@
 
 **Category**: Arithmetic unary operation
 
-**Short description**: *Sign* performs element-wise sign operation with given tensor.
+**Short description**: *Sign* performs element-wise sign operation on a given input tensor.
 
-**Attributes**:
+**Detailed description**: *Sign* performs element-wise sign operation on a given input tensor, based on the following mathematical formula:
 
-    No attributes available.
+\f[
+a_{i} = sign(a_{i})
+\f]
+
+**Attributes**: *Sign* operation has no attributes.
 
 **Inputs**
 
-* **1**: An tensor of type *T*. **Required.**
+* **1**: A tensor of type *T* and arbitrary shape. **Required.**
 
 **Outputs**
 
-* **1**: The result of element-wise sign operation. A tensor of type *T* with mapped elements of the input tensor to -1 (if it is negative), 0 (if it is zero), or 1 (if it is positive).
+* **1**: The result of element-wise *Sign* operation. A tensor of type *T* with mapped elements of the input tensor to -1 (if it is negative), 0 (if it is zero), or 1 (if it is positive).
 
 **Types**
 
 * *T*: any numeric type.
 
-*Sign* does the following with the input tensor *a*:
-
-\f[
-a_{i} = sign(a_{i})
-\f]
-
-**Examples**
 
-*Example 1*
+**Example**
 
 ```xml
 <layer ... type="Sign">
diff --git a/docs/template_plugin/tests/functional/op_reference/sign.cpp b/docs/template_plugin/tests/functional/op_reference/sign.cpp
new file mode 100644
index 00000000000000..a5ff9b11978a90
--- /dev/null
+++ b/docs/template_plugin/tests/functional/op_reference/sign.cpp
@@ -0,0 +1,80 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+
+#include <ie_core.hpp>
+#include <ie_ngraph_utils.hpp>
+#include <ngraph/ngraph.hpp>
+#include <shared_test_classes/base/layer_test_utils.hpp>
+#include <tuple>
+
+#include "base_reference_test.hpp"
+
+using namespace ngraph;
+using namespace InferenceEngine;
+
+struct SignParams {
+    template <class IT, class OT>
+    SignParams(const ngraph::PartialShape& shape, const ngraph::element::Type& iType, const ngraph::element::Type& oType, const std::vector<IT>& iValues,
+                  const std::vector<OT>& oValues)
+        : pshape(shape), inType(iType), outType(oType), inputData(CreateBlob(iType, iValues)), refData(CreateBlob(oType, oValues)) {}
+    ngraph::PartialShape pshape;
+    ngraph::element::Type inType;
+    ngraph::element::Type outType;
+    InferenceEngine::Blob::Ptr inputData;
+    InferenceEngine::Blob::Ptr refData;
+};
+
+class ReferenceSignLayerTest : public testing::TestWithParam<SignParams>, public CommonReferenceTest {
+public:
+    void SetUp() override {
+        auto params = GetParam();
+        function = CreateFunction(params.pshape, params.inType);
+        inputData = {params.inputData};
+        refOutData = {params.refData};
+    }
+    static std::string getTestCaseName(const testing::TestParamInfo<SignParams>& obj) {
+        auto param = obj.param;
+        std::ostringstream result;
+        result << "shape=" << param.pshape << "_";
+        result << "iType=" << param.inType << "_";
+        result << "oType=" << param.outType;
+        return result.str();
+    }
+
+private:
+    static std::shared_ptr<Function> CreateFunction(const PartialShape& input_shape, const element::Type& input_type) {
+        const auto in = std::make_shared<op::Parameter>(input_type, input_shape);
+        const auto sign = std::make_shared<op::Sign>(in);
+        return std::make_shared<Function>(NodeVector {sign}, ParameterVector {in});
+    }
+};
+
+TEST_P(ReferenceSignLayerTest, CompareWithHardcodedRefs) {
+    Exec();
+}
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_Sign_With_Hardcoded_Refs, ReferenceSignLayerTest,
+    ::testing::Values(
+        SignParams(ngraph::PartialShape {6}, ngraph::element::f32, ngraph::element::f32,
+                      std::vector<float> {1, -2, 0, -4.8f, 4.8f, -0.0f},
+                      std::vector<float> {1, -1, 0, -1, 1, 0}),
+        SignParams(ngraph::PartialShape {6}, ngraph::element::f16, ngraph::element::f16,
+                      std::vector<float16> {1, -2, 0, -4.8f, 4.8f, -0.0f},
+                      std::vector<float16> {1, -1, 0, -1, 1, 0}),
+        SignParams(ngraph::PartialShape {6}, ngraph::element::u64, ngraph::element::u64,
+                      std::vector<uint64_t> {1, 2, 0, 4, 4, 0},
+                      std::vector<uint64_t> {1, 1, 0, 1, 1, 0}),
+        SignParams(ngraph::PartialShape {6}, ngraph::element::u32, ngraph::element::u32,
+                      std::vector<uint32_t> {1, 2, 0, 4, 4, 0},
+                      std::vector<uint32_t> {1, 1, 0, 1, 1, 0}),
+        SignParams(ngraph::PartialShape {6}, ngraph::element::i32, ngraph::element::i32,
+                      std::vector<int32_t> {1, -2, 0, -4, 4, -0},
+                      std::vector<int32_t> {1, -1, 0, -1, 1, 0}),
+        SignParams(ngraph::PartialShape {6}, ngraph::element::i64, ngraph::element::i64,
+                      std::vector<int64_t> {1, -2, 0, -4, 4, -0},
+                      std::vector<int64_t> {1, -1, 0, -1, 1, 0})),
+    ReferenceSignLayerTest::getTestCaseName);
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
index a1a62dcd2dc39f..08745acac2d741 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
@@ -71,6 +71,7 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> intActivationTy
         {Negative,              {}},
         {Ceiling,               {}},
         {Cos,                   {}},
+        {Sign,                  {}},
         {Sinh,                  {}},
         {Sqrt,                  {}},
         {Tanh,                  {}},
diff --git a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
index d7eaf8a48ebc2b..d22707a1eb4f7f 100644
--- a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
+++ b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
@@ -97,6 +97,7 @@
     'ShapeOf-3',
     'ShuffleChannels-1',
     'Sigmoid-1',
+    'Sign-1',
     'Sin-1',
     'Sinh-1'
     'SoftPlus-4',
diff --git a/ngraph/core/include/ngraph/op/sign.hpp b/ngraph/core/include/ngraph/op/sign.hpp
index 8a984ee7294f40..a3f4b35c8de1e7 100644
--- a/ngraph/core/include/ngraph/op/sign.hpp
+++ b/ngraph/core/include/ngraph/op/sign.hpp
@@ -17,8 +17,8 @@ namespace ngraph
             class NGRAPH_API Sign : public util::UnaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Sign", 0};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 Sign() = default;
                 /// \brief Constructs an elementwise sign operation.
                 ///
diff --git a/ngraph/core/src/op/sign.cpp b/ngraph/core/src/op/sign.cpp
index 9d0e3e27332d9f..3147cf9ba715c3 100644
--- a/ngraph/core/src/op/sign.cpp
+++ b/ngraph/core/src/op/sign.cpp
@@ -12,7 +12,9 @@ using namespace ngraph;
 #include "ngraph/runtime/host_tensor.hpp"
 #include "ngraph/runtime/reference/sign.hpp"
 
-constexpr NodeTypeInfo op::Sign::type_info;
+#include "ngraph/validation_util.hpp"
+
+NGRAPH_RTTI_DEFINITION(op::v0::Sign, "Sign", 0, util::UnaryElementwiseArithmetic);
 
 op::Sign::Sign(const Output<Node>& arg)
     : UnaryElementwiseArithmetic(arg)
@@ -50,7 +52,6 @@ namespace signop
 
         switch (arg0->get_element_type())
         {
-            NGRAPH_TYPE_CASE(evaluate_sign, boolean, arg0, out, count);
             NGRAPH_TYPE_CASE(evaluate_sign, i32, arg0, out, count);
             NGRAPH_TYPE_CASE(evaluate_sign, i64, arg0, out, count);
             NGRAPH_TYPE_CASE(evaluate_sign, u32, arg0, out, count);
@@ -66,6 +67,7 @@ namespace signop
 bool op::Sign::evaluate(const HostTensorVector& outputs, const HostTensorVector& inputs) const
 {
     NGRAPH_OP_SCOPE(v0_Sign_evaluate);
+    NGRAPH_CHECK(validate_host_tensor_vector(outputs, 1) && validate_host_tensor_vector(inputs, 1));
     return signop::evaluate_sign(inputs[0], outputs[0], shape_size(get_output_shape(0)));
 }
 
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index cab60e4ecca57b..e27bcc369652b5 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -156,7 +156,7 @@ set(SRC
     type_prop/lstm_sequence.cpp
     type_prop/loop.cpp
     type_prop/matmul.cpp
-    type_prop/matrix_nms.cpp    
+    type_prop/matrix_nms.cpp
     type_prop/maximum.cpp
     type_prop/max_pool.cpp
     type_prop/minimum.cpp
@@ -207,6 +207,7 @@ set(SRC
     type_prop/selu.cpp
     type_prop/shape_of.cpp
     type_prop/shuffle_channels.cpp
+    type_prop/sign.cpp
     type_prop/sin.cpp
     type_prop/sinh.cpp
     type_prop/softmax.cpp
@@ -302,6 +303,7 @@ set(SRC
     visitors/op/space_to_depth.cpp
     visitors/op/selu.cpp
     visitors/op/shuffle_channels.cpp
+    visitors/op/sign.cpp
     visitors/op/sinh.cpp
     visitors/op/softmax.cpp
     visitors/op/softplus.cpp
@@ -490,7 +492,6 @@ set(MULTI_TEST_SRC
     backend/shape_of.in.cpp
     backend/shuffle_channels.in.cpp
     backend/sigmoid.in.cpp
-    backend/sign.in.cpp
     backend/sin.in.cpp
     backend/sinh.in.cpp
     backend/softmax.in.cpp
diff --git a/ngraph/test/backend/sign.in.cpp b/ngraph/test/backend/sign.in.cpp
deleted file mode 100644
index ae4559b4b4a272..00000000000000
--- a/ngraph/test/backend/sign.in.cpp
+++ /dev/null
@@ -1,54 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <algorithm>
-#include <cinttypes>
-#include <cmath>
-#include <cstdlib>
-#include <random>
-#include <string>
-
-// clang-format off
-#ifdef ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
-#define DEFAULT_FLOAT_TOLERANCE_BITS ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
-#endif
-
-#ifdef ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
-#define DEFAULT_DOUBLE_TOLERANCE_BITS ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
-#endif
-// clang-format on
-
-#include "gtest/gtest.h"
-#include "runtime/backend.hpp"
-#include "ngraph/runtime/tensor.hpp"
-#include "ngraph/ngraph.hpp"
-#include "util/all_close.hpp"
-#include "util/all_close_f.hpp"
-#include "util/ndarray.hpp"
-#include "util/test_control.hpp"
-#include "util/test_tools.hpp"
-
-using namespace std;
-using namespace ngraph;
-
-static string s_manifest = "${MANIFEST}";
-
-NGRAPH_TEST(${BACKEND_NAME}, sign)
-{
-    Shape shape{2, 3};
-    auto A = make_shared<op::Parameter>(element::f32, shape);
-    auto f = make_shared<Function>(make_shared<op::Sign>(A), ParameterVector{A});
-
-    auto backend = runtime::Backend::create("${BACKEND_NAME}");
-
-    // Create some tensors for input/output
-    auto a = backend->create_tensor(element::f32, shape);
-    copy_data(a, vector<float>{1, -2, 0, -4.8f, 4.8f, -0.0f});
-    auto result = backend->create_tensor(element::f32, shape);
-
-    auto handle = backend->compile(f);
-    handle->call_with_validate({result}, {a});
-    EXPECT_TRUE(test::all_close_f(
-        (vector<float>{1, -1, 0, -1, 1, 0}), read_vector<float>(result), MIN_FLOAT_TOLERANCE_BITS));
-}
diff --git a/ngraph/test/type_prop/sign.cpp b/ngraph/test/type_prop/sign.cpp
new file mode 100644
index 00000000000000..a31160547da160
--- /dev/null
+++ b/ngraph/test/type_prop/sign.cpp
@@ -0,0 +1,9 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "unary_ops.hpp"
+
+using Type = ::testing::Types<ngraph::op::Sign>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(type_prop_sign, UnaryOperator, Type);
diff --git a/ngraph/test/visitors/op/sign.cpp b/ngraph/test/visitors/op/sign.cpp
new file mode 100644
index 00000000000000..557b7dc1669ec2
--- /dev/null
+++ b/ngraph/test/visitors/op/sign.cpp
@@ -0,0 +1,11 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "unary_ops.hpp"
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sign, element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
+                               UnaryOperatorVisitor,
+                               Type,
+                               UnaryOperatorTypeName);

From d7e97ee2e40fe3723cd4baffa2c44aacdad8ebc1 Mon Sep 17 00:00:00 2001
From: Alexey Suhov <alexey.suhov@intel.com>
Date: Tue, 20 Jul 2021 13:49:27 +0300
Subject: [PATCH 08/71] Use different cpack name for conda Python API build
 (#6701)

* Add prefix for conda build to cpack name for python api

* use PYTHON_COMPONENT variable
---
 inference-engine/ie_bridges/python/CMakeLists.txt    | 12 +++++++-----
 .../src/openvino/inference_engine/CMakeLists.txt     |  6 +++---
 .../openvino/offline_transformations/CMakeLists.txt  |  8 ++++----
 3 files changed, 14 insertions(+), 12 deletions(-)

diff --git a/inference-engine/ie_bridges/python/CMakeLists.txt b/inference-engine/ie_bridges/python/CMakeLists.txt
index 7b93a4291a2d3a..15d248379d7e84 100644
--- a/inference-engine/ie_bridges/python/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/CMakeLists.txt
@@ -43,12 +43,14 @@ else()
 endif()
 
 if(ENABLE_CONDA_FOLDER)
+    set(PYTHON_COMPONENT conda_${PYTHON_VERSION})
     if(WIN32)
         set(PYTHON_BRIDGE_OUTPUT_DIRECTORY ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/$<CONFIG>/python_api/Conda/${PYTHON_VERSION}/openvino)
     else()
         set(PYTHON_BRIDGE_OUTPUT_DIRECTORY ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/python_api/Conda/${PYTHON_VERSION}/openvino)
     endif()
 else()
+    set(PYTHON_COMPONENT ${PYTHON_VERSION})
     if(WIN32)
         set(PYTHON_BRIDGE_OUTPUT_DIRECTORY ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/$<CONFIG>/python_api/${PYTHON_VERSION}/openvino)
     else()
@@ -74,19 +76,19 @@ endif()
 
 # install
 
-ie_cpack_add_component(${PYTHON_VERSION})
+ie_cpack_add_component(${PYTHON_COMPONENT})
 
 install(FILES requirements.txt
         DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}
-        COMPONENT ${PYTHON_VERSION})
+        COMPONENT ${PYTHON_COMPONENT})
 
 install(FILES requirements.txt
         DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}
-        COMPONENT ${PYTHON_VERSION})
+        COMPONENT ${PYTHON_COMPONENT})
 
 install(PROGRAMS src/openvino/__init__.py
         DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}/openvino
-        COMPONENT ${PYTHON_VERSION})
+        COMPONENT ${PYTHON_COMPONENT})
 
 # install Python samples
 
@@ -96,4 +98,4 @@ install(DIRECTORY sample/
         DESTINATION ${IE_CPACK_IE_DIR}/samples/python
         COMPONENT python_samples)
 
-ie_cpack(${PYTHON_VERSION} python_samples)
+ie_cpack(${PYTHON_COMPONENT} python_samples)
diff --git a/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt b/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt
index a236db836d60ae..059f335f5df6b9 100644
--- a/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt
@@ -70,12 +70,12 @@ add_custom_command(TARGET ${TARGET_NAME}
 # install
 
 install(TARGETS ${INSTALLED_TARGETS}
-        RUNTIME DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}/openvino/inference_engine COMPONENT ${PYTHON_VERSION}
-        LIBRARY DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}/openvino/inference_engine COMPONENT ${PYTHON_VERSION})
+        RUNTIME DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}/openvino/inference_engine COMPONENT ${PYTHON_COMPONENT}
+        LIBRARY DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}/openvino/inference_engine COMPONENT ${PYTHON_COMPONENT})
 
 install(PROGRAMS __init__.py
         DESTINATION ${PYTHON_BRIDGE_CPACK_PATH}/${PYTHON_VERSION}/openvino/inference_engine
-        COMPONENT ${PYTHON_VERSION})
+        COMPONENT ${PYTHON_COMPONENT})
 
 add_clang_format_target(${TARGET_NAME}_clang FOR_TARGETS ${TARGET_NAME}
                         EXCLUDE_PATTERNS ".*\\.cxx;.*\\.pxd;.*\\.pyx")
diff --git a/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt b/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt
index 27c9e7bf898257..ba526c3761d851 100644
--- a/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt
@@ -54,12 +54,12 @@ add_custom_command(TARGET ${TARGET_NAME}
 # install
 
 # TODO: use ${PYTHON_VERSION}_dev component below
-# ie_cpack_add_component(${PYTHON_VERSION}_dev DEPENDS ${PYTHON_VERSION})
+# ie_cpack_add_component(${PYTHON_VERSION}_dev DEPENDS ${PYTHON_COMPONENT})
 
 install(TARGETS ${TARGET_NAME}
-        RUNTIME DESTINATION python/${PYTHON_VERSION}/openvino/offline_transformations COMPONENT ${PYTHON_VERSION}
-        LIBRARY DESTINATION python/${PYTHON_VERSION}/openvino/offline_transformations COMPONENT ${PYTHON_VERSION})
+        RUNTIME DESTINATION python/${PYTHON_VERSION}/openvino/offline_transformations COMPONENT ${PYTHON_COMPONENT}
+        LIBRARY DESTINATION python/${PYTHON_VERSION}/openvino/offline_transformations COMPONENT ${PYTHON_COMPONENT})
 
 install(PROGRAMS __init__.py
         DESTINATION python/${PYTHON_VERSION}/openvino/offline_transformations
-        COMPONENT ${PYTHON_VERSION})
+        COMPONENT ${PYTHON_COMPONENT})

From e8f07d8b26bc268537ef6f0c11d80cfa175d09ac Mon Sep 17 00:00:00 2001
From: Rafal Blaczkowski <rafal.blaczkowski@intel.com>
Date: Tue, 20 Jul 2021 14:17:53 +0200
Subject: [PATCH 09/71] Update AZURE - OpenVINO ONNX CI check (#6721)

* experiment

* save

* Undo exeprimental changes
---
 ngraph/python/tests/test_onnx/model_zoo_preprocess.sh | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/ngraph/python/tests/test_onnx/model_zoo_preprocess.sh b/ngraph/python/tests/test_onnx/model_zoo_preprocess.sh
index 5c8496bb35972a..367b7eb70f04a3 100755
--- a/ngraph/python/tests/test_onnx/model_zoo_preprocess.sh
+++ b/ngraph/python/tests/test_onnx/model_zoo_preprocess.sh
@@ -63,7 +63,7 @@ function pull_and_postprocess_onnx_model_zoo() {
     git fetch
     git reset HEAD --hard
 
-    git checkout $ONNX_SHA
+    git checkout -f $ONNX_SHA
 
     echo "Pulling models data via Git LFS for onnx model zoo repository"
     git lfs pull --include="*" --exclude="*.onnx"

From e8fa1aaccb199b3bc5ae944e07edafcdcfb4efb1 Mon Sep 17 00:00:00 2001
From: Dmitrii Khurtin <dmitrii.khurtin@intel.com>
Date: Tue, 20 Jul 2021 15:38:39 +0300
Subject: [PATCH 10/71] fixed crash related to loading model with fq and
 sigmoid (#6644)

* fixed crash related with loading model with fq and sigmoid

* renamed multiple_input.* to multiple_input_fq.*; removed two unnecessary FQ layers from smoke_fq_fusion_with_sigmoid test; moved FQ params to test params
---
 .../src/gna_plugin/gna_plugin.cpp             |   8 +-
 .../gna_plugin/optimizer/gna_pass_manager.cpp |   2 +-
 .../gna/pass_tests/fq_fusion_with_sigmoid.cpp | 101 ++++++++++++++++++
 .../subgraph_tests/multiple_input_fq.cpp      |  26 +++++
 .../subgraph_tests/multiple_input_fq.hpp      |  18 ++++
 .../subgraph/multiple_input_fq.hpp            |  29 +++++
 .../src/subgraph/multiple_input_fq.cpp        |  43 ++++++++
 7 files changed, 223 insertions(+), 4 deletions(-)
 create mode 100644 inference-engine/tests/functional/plugin/gna/pass_tests/fq_fusion_with_sigmoid.cpp
 create mode 100644 inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/multiple_input_fq.cpp
 create mode 100644 inference-engine/tests/functional/plugin/shared/include/subgraph_tests/multiple_input_fq.hpp
 create mode 100644 inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/subgraph/multiple_input_fq.hpp
 create mode 100644 inference-engine/tests/functional/shared_test_classes/src/subgraph/multiple_input_fq.cpp

diff --git a/inference-engine/src/gna_plugin/gna_plugin.cpp b/inference-engine/src/gna_plugin/gna_plugin.cpp
index 4d565ca0c2d975..3c91f18dc3bd7f 100644
--- a/inference-engine/src/gna_plugin/gna_plugin.cpp
+++ b/inference-engine/src/gna_plugin/gna_plugin.cpp
@@ -470,7 +470,6 @@ void GNAPlugin::UpdateInputScaleFromNetwork(InferenceEngine::CNNNetwork & networ
         auto data = input.second->getInputData();
         for (auto && nextToInputLayer : getInputTo(data)) {
             if (!LayerInfo(nextToInputLayer.second).isFakeQuantize()) {
-                inputIdx++;
                 continue;
             }
             // replacing scale factor from this fq layer
@@ -493,6 +492,9 @@ void GNAPlugin::UpdateInputScaleFromNetwork(InferenceEngine::CNNNetwork & networ
                 scaleInput = (fqLayer.getLevels() - 1) / (2 * maxAbsVal);
             }
 
+            IE_ASSERT(config.inputScaleFactors.size() > inputIdx);
+            IE_ASSERT(inputsDesc->inputScaleFactors.size() > inputIdx);
+
             if (!config.inputScaleFactors.empty()) {
                 gnalog() << "Scale factor calculated during model quantization (" << scaleInput
                     << ") will be used instead of user input (" << inputsDesc->inputScaleFactors[inputIdx] << ").\n";
@@ -505,9 +507,9 @@ void GNAPlugin::UpdateInputScaleFromNetwork(InferenceEngine::CNNNetwork & networ
 
             config.inputScaleFactors[inputIdx] = scaleInput;
             inputsDesc->inputScaleFactors[inputIdx] = scaleInput;
-
-            inputIdx++;
         }
+
+        inputIdx++;
     }
 }
 
diff --git a/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp b/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
index 8ab4af9f1083f9..f4e5fc7a9316d9 100644
--- a/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
+++ b/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
@@ -2177,7 +2177,7 @@ void MoveFakeQuantizeLayerIntoQuantParamsPass :: run() {
         }
 
         if (isFQFuseAllowed) {
-            getInputTo(prevData).clear();
+            getInputTo(prevData).erase(l->name);
         }
 
         // Connect all next layers after FQ to the layer that is before FQ
diff --git a/inference-engine/tests/functional/plugin/gna/pass_tests/fq_fusion_with_sigmoid.cpp b/inference-engine/tests/functional/plugin/gna/pass_tests/fq_fusion_with_sigmoid.cpp
new file mode 100644
index 00000000000000..ec3b500b60858e
--- /dev/null
+++ b/inference-engine/tests/functional/plugin/gna/pass_tests/fq_fusion_with_sigmoid.cpp
@@ -0,0 +1,101 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <ie_core.hpp>
+#include "ngraph_functions/builders.hpp"
+#include "common_test_utils/test_constants.hpp"
+#include "shared_test_classes/base/layer_test_utils.hpp"
+
+namespace LayerTestsDefinitions {
+
+typedef std::tuple<
+    std::string,                        // Target device name
+    InferenceEngine::Precision,         // Network precision
+    size_t,                             // level
+    std::pair<float, float>,            // min, max
+    size_t,                             // Input size
+    std::map<std::string, std::string>  // Configuration
+> fqFusionWithSigmoidParams;
+
+class FqFusionWithSigmoidTest : public LayerTestsUtils::LayerTestsCommon,
+    public testing::WithParamInterface<fqFusionWithSigmoidParams> {
+protected:
+    void SetUp() override {
+        InferenceEngine::Precision netPrecision;
+        std::map<std::string, std::string> config;
+        size_t levelFq;
+        std::pair<float, float> minMaxFq;
+        size_t inputSize;
+        std::tie(targetDevice, netPrecision, levelFq, minMaxFq, inputSize, config) = this->GetParam();
+        configuration.insert(config.begin(), config.end());
+        auto ngPrc = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(netPrecision);
+
+        auto input = ngraph::builder::makeParams(ngPrc, {{1, inputSize}});
+        auto constant = ngraph::builder::makeConstant(ngPrc, {1, inputSize}, std::vector<size_t>{1});
+        auto mul1 = ngraph::builder::makeEltwise(input[0], constant, ngraph::helpers::EltwiseTypes::ADD);
+        auto sigmoid1 = std::make_shared<ngraph::opset1::Sigmoid>(mul1);
+        auto mul2 = ngraph::builder::makeEltwise(input[0], sigmoid1, ngraph::helpers::EltwiseTypes::MULTIPLY);
+        auto fake3 = ngraph::builder::makeFakeQuantize(sigmoid1, ngPrc, levelFq,
+            { 1 }, { minMaxFq.first }, { minMaxFq.second }, { minMaxFq.first }, { minMaxFq.second });
+        auto mul3 = ngraph::builder::makeEltwise(mul2, fake3, ngraph::helpers::EltwiseTypes::ADD);
+        auto result = std::make_shared<ngraph::opset7::Result>(mul3);
+        function = std::make_shared<ngraph::Function>(ngraph::ResultVector{result}, input, "fq_fusion_with_sigmoid");
+    }
+public:
+    static std::string getTestCaseName(const testing::TestParamInfo<fqFusionWithSigmoidParams> &obj) {
+        std::string targetDevice;
+        InferenceEngine::Precision netPrecision;
+        size_t levelFq;
+        std::pair<float, float> minMaxFq;
+        size_t inputSize;
+        std::map<std::string, std::string> config;
+        std::tie(targetDevice, netPrecision, levelFq, minMaxFq, inputSize, config) = obj.param;
+        std::ostringstream result;
+        result << "netPrecision=" << netPrecision.name() << "_";
+        result << "IS=" << inputSize << "_";
+        result << "targetDevice=" << targetDevice << "_";
+        result << "levelFq=" << levelFq << "_";
+        result << "(minFq,maxFq)=" << std::to_string(minMaxFq.first) << "_" << std::to_string(minMaxFq.first) << "_";
+        result << "inputSize=" << std::to_string(inputSize);
+        return result.str();
+    }
+}; // class FqFusionWithSigmoidTest
+
+TEST_P(FqFusionWithSigmoidTest, CompareWithRefs) {
+    Run();
+};
+
+const std::vector<InferenceEngine::Precision> netPrecisions = {
+    InferenceEngine::Precision::FP32,
+    InferenceEngine::Precision::FP16
+};
+
+std::vector<size_t> levelFq = {
+    65535
+};
+
+std::vector<std::pair<float, float>> minMaxFq = {
+    {-1, 1},
+    {-5, 5}
+};
+
+std::vector<size_t> input = {
+    64,
+};
+
+std::map<std::string, std::string> additional_config = {
+    {"GNA_DEVICE_MODE", "GNA_SW_EXACT"},
+};
+
+INSTANTIATE_TEST_SUITE_P(smoke_fq_fusion_with_sigmoid, FqFusionWithSigmoidTest,
+    ::testing::Combine(
+        ::testing::Values(CommonTestUtils::DEVICE_GNA),
+        ::testing::ValuesIn(netPrecisions),
+        ::testing::ValuesIn(levelFq),
+        ::testing::ValuesIn(minMaxFq),
+        ::testing::ValuesIn(input),
+        ::testing::Values(additional_config)),
+    FqFusionWithSigmoidTest::getTestCaseName);
+
+} // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/multiple_input_fq.cpp b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/multiple_input_fq.cpp
new file mode 100644
index 00000000000000..b6b2e5dab43782
--- /dev/null
+++ b/inference-engine/tests/functional/plugin/gna/shared_tests_instances/subgraph_tests/multiple_input_fq.cpp
@@ -0,0 +1,26 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <subgraph_tests/multiple_input_fq.hpp>
+#include "common_test_utils/test_constants.hpp"
+
+namespace SubgraphTestsDefinitions {
+namespace {
+std::vector<size_t> input = {
+    64,
+};
+
+std::map<std::string, std::string> additional_config = {
+    {"GNA_DEVICE_MODE", "GNA_SW_EXACT"},
+};
+} // namespace
+
+INSTANTIATE_TEST_SUITE_P(smoke_multiple_input, MultipleInputTest,
+    ::testing::Combine(
+        ::testing::Values(CommonTestUtils::DEVICE_GNA),
+        ::testing::Values(InferenceEngine::Precision::FP32),
+        ::testing::ValuesIn(input),
+        ::testing::Values(additional_config)),
+    MultipleInputTest::getTestCaseName);
+} // namespace SubgraphTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/include/subgraph_tests/multiple_input_fq.hpp b/inference-engine/tests/functional/plugin/shared/include/subgraph_tests/multiple_input_fq.hpp
new file mode 100644
index 00000000000000..da53cc54050b68
--- /dev/null
+++ b/inference-engine/tests/functional/plugin/shared/include/subgraph_tests/multiple_input_fq.hpp
@@ -0,0 +1,18 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#ifndef MULTIPLE_INPUT_HPP
+#define MULTIPLE_INPUT_HPP
+
+#include "shared_test_classes/subgraph/multiple_input_fq.hpp"
+
+namespace SubgraphTestsDefinitions {
+
+TEST_P(MultipleInputTest, CompareWithRefs) {
+    Run();
+};
+
+} // namespace SubgraphTestsDefinitions
+
+#endif // MULTIPLE_INPUT_HPP
diff --git a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/subgraph/multiple_input_fq.hpp b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/subgraph/multiple_input_fq.hpp
new file mode 100644
index 00000000000000..3cd546edca47f5
--- /dev/null
+++ b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/subgraph/multiple_input_fq.hpp
@@ -0,0 +1,29 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#ifndef SUBGRAPH_MULTIPLE_INPUT_HPP
+#define SUBGRAPH_MULTIPLE_INPUT_HPP
+
+#include "common_test_utils/test_common.hpp"
+#include "shared_test_classes/base/layer_test_utils.hpp"
+#include <ie_core.hpp>
+
+namespace SubgraphTestsDefinitions {
+typedef std::tuple<
+    std::string,                        // Target device name
+    InferenceEngine::Precision,         // Network precision
+    size_t,                             // Input size
+    std::map<std::string, std::string>  // Configuration
+> multipleInputParams;
+
+class MultipleInputTest : public LayerTestsUtils::LayerTestsCommon,
+    public testing::WithParamInterface<multipleInputParams> {
+protected:
+    void SetUp() override;
+public:
+    static std::string getTestCaseName(const testing::TestParamInfo<multipleInputParams> &obj);
+};
+} // namespace SubgraphTestsDefinitions
+
+#endif // SUBGRAPH_MULTIPLE_INPUT_HPP
diff --git a/inference-engine/tests/functional/shared_test_classes/src/subgraph/multiple_input_fq.cpp b/inference-engine/tests/functional/shared_test_classes/src/subgraph/multiple_input_fq.cpp
new file mode 100644
index 00000000000000..f2ac77989bf407
--- /dev/null
+++ b/inference-engine/tests/functional/shared_test_classes/src/subgraph/multiple_input_fq.cpp
@@ -0,0 +1,43 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "ngraph_functions/builders.hpp"
+#include "shared_test_classes/subgraph/multiple_input_fq.hpp"
+
+namespace SubgraphTestsDefinitions {
+
+std::string MultipleInputTest::getTestCaseName(const testing::TestParamInfo<multipleInputParams> &obj) {
+    std::string targetDevice;
+    InferenceEngine::Precision netPrecision;
+    size_t inputSize;
+    std::map<std::string, std::string> config;
+    std::tie(targetDevice, netPrecision, inputSize, config) = obj.param;
+    std::ostringstream result;
+    result << "netPrecision=" << netPrecision.name() << "_";
+    result << "IS=" << inputSize << "_";
+    result << "targetDevice=" << targetDevice;
+    return result.str();
+}
+
+void MultipleInputTest::SetUp() {
+    InferenceEngine::Precision netPrecision;
+    std::map<std::string, std::string> config;
+    size_t inputSize;
+    std::tie(targetDevice, netPrecision, inputSize, config) = this->GetParam();
+    configuration.insert(config.begin(), config.end());
+    auto ngPrc = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(netPrecision);
+    auto input = ngraph::builder::makeParams(ngPrc, {{1, inputSize}, {1, inputSize}, {1, inputSize}});
+    auto fake1 = ngraph::builder::makeFakeQuantize(input[0], ngPrc, 255, { 1 }, { -0.5 }, { 0.5 }, { -0.5 }, { 0.5 });
+    auto mul1 = ngraph::builder::makeEltwise(input[0], fake1, ngraph::helpers::EltwiseTypes::ADD);
+    auto fake2 = ngraph::builder::makeFakeQuantize(input[1], ngPrc, 255, { 1 }, { -0.5 }, { 0.5 }, { -0.5 }, { 0.5 });
+    auto mul2 = ngraph::builder::makeEltwise(input[1], fake2, ngraph::helpers::EltwiseTypes::ADD);
+    auto mul3 = ngraph::builder::makeEltwise(mul1, mul2, ngraph::helpers::EltwiseTypes::ADD);
+    auto fake3 = ngraph::builder::makeFakeQuantize(input[2], ngPrc, 255, { 1 }, { -0.5 }, { 0.5 }, { -0.5 }, { 0.5 });
+    auto mul4 = ngraph::builder::makeEltwise(fake3, mul3, ngraph::helpers::EltwiseTypes::ADD);
+    auto result = std::make_shared<ngraph::opset7::Result>(mul4);
+    function = std::make_shared<ngraph::Function>(ngraph::ResultVector{result}, input, "multiple_input");
+}
+
+}  // namespace SubgraphTestsDefinitions
+

From 89e53bb7392069be6bb1d009c2c0ea3731baa51a Mon Sep 17 00:00:00 2001
From: Andrey Somsikov <andrey.somsikov@intel.com>
Date: Tue, 20 Jul 2021 17:26:48 +0300
Subject: [PATCH 11/71] Allow configuring cpack strip from command line (#6712)

Check if CPACK_STRIP_FILES configured before setting it
ON by default. This allows to configre it from command
line when required.
---
 cmake/developer_package/packaging.cmake | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/cmake/developer_package/packaging.cmake b/cmake/developer_package/packaging.cmake
index 4cb21210d4a166..4095a16157c068 100644
--- a/cmake/developer_package/packaging.cmake
+++ b/cmake/developer_package/packaging.cmake
@@ -53,7 +53,9 @@ macro(ie_cpack)
     set(CPACK_PACKAGE_VENDOR "Intel Corporation")
     set(CPACK_VERBATIM_VARIABLES ON)
     set(CPACK_COMPONENTS_ALL ${ARGN})
-    set(CPACK_STRIP_FILES ON)
+    if (NOT DEFINED CPACK_STRIP_FILES)
+        set(CPACK_STRIP_FILES ON)
+    endif()
     set(CPACK_THREADS 8)
 
     string(REPLACE "/" "_" CPACK_PACKAGE_VERSION "${CI_BUILD_NUMBER}")

From f018cbda4d712ce34c407a42b7afcb6fe50daf3f Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Tue, 20 Jul 2021 17:36:31 +0300
Subject: [PATCH 12/71] Updated DM configs; added exec rights (#6707)

---
 scripts/CMakeLists.txt                           | 4 +++-
 scripts/deployment_manager/configs/darwin.json   | 4 +++-
 scripts/deployment_manager/configs/linux.json    | 5 ++++-
 scripts/deployment_manager/configs/windows.json  | 5 ++++-
 scripts/deployment_manager/deployment_manager.py | 0
 5 files changed, 14 insertions(+), 4 deletions(-)
 mode change 100644 => 100755 scripts/deployment_manager/deployment_manager.py

diff --git a/scripts/CMakeLists.txt b/scripts/CMakeLists.txt
index a54b5f97f3b93b..6cf6e02c1c44b9 100644
--- a/scripts/CMakeLists.txt
+++ b/scripts/CMakeLists.txt
@@ -48,10 +48,12 @@ if(UNIX)
 endif()
 
 # install DeploymentManager
+
 ie_cpack_add_component(deployment_manager REQUIRED)
 install(DIRECTORY deployment_manager/
         DESTINATION deployment_tools/tools/deployment_manager
-        COMPONENT deployment_manager)
+        COMPONENT deployment_manager
+        USE_SOURCE_PERMISSIONS)
 
 # install files for demo
 
diff --git a/scripts/deployment_manager/configs/darwin.json b/scripts/deployment_manager/configs/darwin.json
index 1ef4e8e443dd64..215f2716a1dcfd 100644
--- a/scripts/deployment_manager/configs/darwin.json
+++ b/scripts/deployment_manager/configs/darwin.json
@@ -18,13 +18,14 @@
       "files": [
         "deployment_tools/inference_engine/version.txt",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine.dylib",
-        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.dylib",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_transformations.dylib",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_preproc.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_ir_reader.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_onnx_reader.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_c_api.dylib",
         "deployment_tools/inference_engine/lib/intel64/libAutoPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/libHeteroPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/libMultiDevicePlugin.so",
         "deployment_tools/inference_engine/lib/intel64/plugins.xml",
         "deployment_tools/inference_engine/external/tbb",
         "deployment_tools/ngraph/lib"
@@ -35,6 +36,7 @@
       "group": ["ie"],
       "dependencies" : ["ie_core"],
       "files": [
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.dylib",
         "deployment_tools/inference_engine/lib/intel64/libMKLDNNPlugin.so"
       ]
     },
diff --git a/scripts/deployment_manager/configs/linux.json b/scripts/deployment_manager/configs/linux.json
index e832ab933a0fba..7a3d745a78c6fa 100644
--- a/scripts/deployment_manager/configs/linux.json
+++ b/scripts/deployment_manager/configs/linux.json
@@ -24,13 +24,14 @@
       "files": [
         "deployment_tools/inference_engine/version.txt",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine.so",
-        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_transformations.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_preproc.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_ir_reader.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_onnx_reader.so",
         "deployment_tools/inference_engine/lib/intel64/libinference_engine_c_api.so",
         "deployment_tools/inference_engine/lib/intel64/libAutoPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/libHeteroPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/libMultiDevicePlugin.so",
         "deployment_tools/inference_engine/lib/intel64/plugins.xml",
         "deployment_tools/inference_engine/external/tbb",
         "deployment_tools/ngraph/lib"
@@ -41,6 +42,7 @@
       "group": ["ie"],
       "dependencies" : ["ie_core"],
       "files": [
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.so",
         "deployment_tools/inference_engine/lib/intel64/libMKLDNNPlugin.so"
       ]
     },
@@ -51,6 +53,7 @@
       "files": [
         "deployment_tools/inference_engine/lib/intel64/cache.json",
         "deployment_tools/inference_engine/lib/intel64/libclDNNPlugin.so",
+        "deployment_tools/inference_engine/lib/intel64/libinference_engine_lp_transformations.so",
         "install_dependencies/install_NEO_OCL_driver.sh"
       ]
     },
diff --git a/scripts/deployment_manager/configs/windows.json b/scripts/deployment_manager/configs/windows.json
index 02fec694d38588..d47bcff3b6af1b 100644
--- a/scripts/deployment_manager/configs/windows.json
+++ b/scripts/deployment_manager/configs/windows.json
@@ -18,13 +18,14 @@
       "files": [
         "deployment_tools/inference_engine/version.txt",
         "deployment_tools/inference_engine/bin/intel64/Release/inference_engine.dll",
-        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_lp_transformations.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_transformations.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_preproc.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_ir_reader.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_onnx_reader.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_c_api.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/AutoPlugin.dll",
+        "deployment_tools/inference_engine/lib/intel64/Release/HeteroPlugin.dll",
+        "deployment_tools/inference_engine/lib/intel64/Release/MultiDevicePlugin.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/plugins.xml",
         "deployment_tools/inference_engine/lib/intel64/Release/inference_engine.lib",
         "deployment_tools/inference_engine/lib/intel64/Release/inference_engine_transformations.lib",
@@ -38,6 +39,7 @@
       "group": ["ie"],
       "dependencies" : ["ie_core"],
       "files": [
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_lp_transformations.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/MKLDNNPlugin.dll"
       ]
     },
@@ -47,6 +49,7 @@
       "dependencies" : ["ie_core"],
       "files": [
         "deployment_tools/inference_engine/bin/intel64/Release/cache.json",
+        "deployment_tools/inference_engine/bin/intel64/Release/inference_engine_lp_transformations.dll",
         "deployment_tools/inference_engine/bin/intel64/Release/clDNNPlugin.dll"
       ]
     },
diff --git a/scripts/deployment_manager/deployment_manager.py b/scripts/deployment_manager/deployment_manager.py
old mode 100644
new mode 100755

From 1a446b49a2455875ea6e54180d8118b9402bdbd3 Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Tue, 20 Jul 2021 18:13:22 +0300
Subject: [PATCH 13/71] Fixed usage of system protobuf (#6716)

---
 cmake/features.cmake                        |  1 -
 ngraph/frontend/paddlepaddle/CMakeLists.txt | 12 ++------
 thirdparty/CMakeLists.txt                   | 32 +++++++++++++++++++++
 thirdparty/protobuf/CMakeLists.txt          | 26 ++++++++---------
 4 files changed, 47 insertions(+), 24 deletions(-)

diff --git a/cmake/features.cmake b/cmake/features.cmake
index ea32a7a42fe822..49e92b94394c8d 100644
--- a/cmake/features.cmake
+++ b/cmake/features.cmake
@@ -121,7 +121,6 @@ else()
 endif()
 
 ie_dependent_option(NGRAPH_ONNX_IMPORT_ENABLE "Enable ONNX importer" ON "protoc_available" OFF)
-ie_dependent_option(NGRAPH_ONNX_EDITOR_ENABLE "Enable ONNX Editor" ON "NGRAPH_ONNX_IMPORT_ENABLE" OFF)
 ie_dependent_option(NGRAPH_PDPD_FRONTEND_ENABLE "Enable PaddlePaddle FrontEnd" ON "protoc_available" OFF)
 ie_dependent_option(NGRAPH_USE_PROTOBUF_LITE "Compiles and links with protobuf-lite" OFF
     "NGRAPH_ONNX_IMPORT_ENABLE OR NGRAPH_PDPD_FRONTEND_ENABLE" OFF)
diff --git a/ngraph/frontend/paddlepaddle/CMakeLists.txt b/ngraph/frontend/paddlepaddle/CMakeLists.txt
index fb7fa5dadbe97a..a14011039a26c1 100644
--- a/ngraph/frontend/paddlepaddle/CMakeLists.txt
+++ b/ngraph/frontend/paddlepaddle/CMakeLists.txt
@@ -23,12 +23,6 @@ set(PROTO_HDRS)
 # Generate protobuf file on build time for each '.proto' file in src/proto
 file(GLOB proto_files ${CMAKE_CURRENT_SOURCE_DIR}/src/proto/*.proto)
 
-if(CMAKE_CROSSCOMPILING)
-    set(PDPD_PROTOC_EXECUTABLE ${SYSTEM_PROTOC})
-else()
-    set(PDPD_PROTOC_EXECUTABLE $<TARGET_FILE:protoc>)
-endif()
-
 foreach(INFILE ${proto_files})
     get_filename_component(FILE_DIR ${INFILE} DIRECTORY)
     get_filename_component(FILE_WE ${INFILE} NAME_WE)
@@ -37,9 +31,9 @@ foreach(INFILE ${proto_files})
     set(GENERATED_PROTO ${INFILE})
     add_custom_command(
             OUTPUT "${OUTPUT_PB_SRC}" "${OUTPUT_PB_HEADER}"
-            COMMAND ${PDPD_PROTOC_EXECUTABLE} ARGS --cpp_out ${CMAKE_CURRENT_BINARY_DIR} -I ${FILE_DIR} ${FILE_WE}.proto
-            DEPENDS ${PDPD_PROTOC_EXECUTABLE} ${GENERATED_PROTO}
-            COMMENT "Running C++ protocol buffer compiler (${PDPD_PROTOC_EXECUTABLE}) on ${GENERATED_PROTO}"
+            COMMAND ${PROTOC_EXECUTABLE} ARGS --cpp_out ${CMAKE_CURRENT_BINARY_DIR} -I ${FILE_DIR} ${FILE_WE}.proto
+            DEPENDS ${PROTOC_EXECUTABLE} ${GENERATED_PROTO}
+            COMMENT "Running C++ protocol buffer compiler (${PROTOC_EXECUTABLE}) on ${GENERATED_PROTO}"
             VERBATIM
             COMMAND_EXPAND_LISTS)
     list(APPEND PROTO_SRCS "${OUTPUT_PB_SRC}")
diff --git a/thirdparty/CMakeLists.txt b/thirdparty/CMakeLists.txt
index 0f976b6741895f..a65fdb2e56680d 100644
--- a/thirdparty/CMakeLists.txt
+++ b/thirdparty/CMakeLists.txt
@@ -126,15 +126,47 @@ endif()
 
 if(NGRAPH_PDPD_FRONTEND_ENABLE OR NGRAPH_ONNX_IMPORT_ENABLE)
     if(NGRAPH_USE_SYSTEM_PROTOBUF)
+        set(Protobuf_USE_STATIC_LIBS ON)
+        if(VERBOSE_BUILD)
+            set(Protobuf_DEBUG ON)
+        endif()
         find_package(Protobuf REQUIRED)
+        if(NGRAPH_USE_PROTOBUF_LITE)
+            set(Protobuf_LIBRARIES protobuf::libprotobuf-lite)
+        else()
+            set(Protobuf_LIBRARIES protobuf::libprotobuf)
+        endif()
+        set(SYSTEM_PROTOC protobuf::protoc)
+        set(PROTOC_EXECUTABLE ${SYSTEM_PROTOC})
+
+        foreach(target ${SYSTEM_PROTOC} ${Protobuf_LIBRARIES})
+            set_property(TARGET ${target} PROPERTY IMPORTED_GLOBAL TRUE)
+        endforeach()
     else()
         add_subdirectory(protobuf)
     endif()
 
     # forward variables used in the other places
     set(SYSTEM_PROTOC ${SYSTEM_PROTOC} PARENT_SCOPE)
+    set(PROTOC_EXECUTABLE ${PROTOC_EXECUTABLE} PARENT_SCOPE)
     set(Protobuf_LIBRARIES ${Protobuf_LIBRARIES} PARENT_SCOPE)
     set(Protobuf_INCLUDE_DIRS ${Protobuf_INCLUDE_DIRS} PARENT_SCOPE)
+
+    # set public / interface compile options
+    foreach(target IN LISTS Protobuf_LIBRARIES)
+        set(link_type PUBLIC)
+        if(NGRAPH_USE_SYSTEM_PROTOBUF)
+            set(link_type INTERFACE)
+        endif()
+        if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+            target_compile_options(${target} ${link_type} -Wno-undef)
+        endif()
+    endforeach()
+
+    # version checks
+    if(protobuf_VERSION VERSION_LESS "3.9" AND NGRAPH_USE_PROTOBUF_LITE)
+        message(FATAL_ERROR "Minimum supported version of protobuf-lite library is 3.9.0 (provided ${protobuf_VERSION})")
+    endif()
 endif()
 
 #
diff --git a/thirdparty/protobuf/CMakeLists.txt b/thirdparty/protobuf/CMakeLists.txt
index ac9101030224b2..d5d8d5b477205f 100644
--- a/thirdparty/protobuf/CMakeLists.txt
+++ b/thirdparty/protobuf/CMakeLists.txt
@@ -18,11 +18,11 @@ if(CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
 endif()
 
 set(protobuf_BUILD_TESTS OFF CACHE BOOL "Build tests")
+set(protobuf_BUILD_SHARED_LIBS ${BUILD_SHARED_LIBS} CACHE BOOL "Build shared libs" FORCE)
+set(protobuf_WITH_ZLIB OFF CACHE BOOL "Build with zlib support")
 
 # When we build dll libraries. These flags make sure onnx and protobuf build with /MD, not /MT.
 # These two options can't be mixed, because they requires link two imcompatiable runtime.
-set(protobuf_WITH_ZLIB OFF CACHE BOOL "Build with zlib support")
-
 if(NOT DEFINED protobuf_MSVC_STATIC_RUNTIME)
     set(protobuf_MSVC_STATIC_RUNTIME OFF CACHE BOOL "Link protobuf to static runtime libraries" FORCE)
 endif()
@@ -47,10 +47,6 @@ if(CMAKE_CROSSCOMPILING)
     set(protobuf_BUILD_PROTOC_BINARIES OFF CACHE BOOL "Build libprotoc and protoc compiler" FORCE)
 endif()
 
-set(protobuf_BUILD_SHARED_LIBS ${BUILD_SHARED_LIBS} CACHE BOOL "Build shared libs" FORCE)
-set(protobuf_BUILD_TESTS OFF CACHE BOOL "Build tests")
-set(protobuf_WITH_ZLIB OFF CACHE BOOL "Build with zlib support")
-
 add_subdirectory(protobuf/cmake EXCLUDE_FROM_ALL)
 get_directory_property(protobuf_VERSION DIRECTORY protobuf/cmake DEFINITION protobuf_VERSION)
 
@@ -72,10 +68,9 @@ if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
         CXX_VISIBILITY_PRESET default
         C_VISIBILITY_PRESET default
         VISIBILITY_INLINES_HIDDEN OFF)
-    foreach(target libprotobuf libprotobuf-lite)
+    foreach(target IN LISTS Protobuf_LIBRARIES)
         target_compile_options(${target}
-            PRIVATE -Wno-all -Wno-unused-variable
-            PUBLIC -Wno-undef)
+            PRIVATE -Wno-all -Wno-unused-variable)
     endforeach()
 endif()
 
@@ -88,10 +83,6 @@ if(NGRAPH_USE_PROTOBUF_LITE)
         VISIBILITY_INLINES_HIDDEN OFF)
 endif()
 
-if(protobuf_VERSION VERSION_LESS "3.9" AND NGRAPH_USE_PROTOBUF_LITE)
-    message(FATAL_ERROR "Minimum supported version of protobuf-lite library is 3.9.0")
-endif()
-
 if(ENABLE_LTO AND protobuf_VERSION VERSION_GREATER_EQUAL "3.8")
     message(WARNING "Protobuf in version 3.8.0+ can throw runtime exceptions if LTO is enabled.")
 endif()
@@ -101,6 +92,13 @@ if(CMAKE_CROSSCOMPILING AND NOT PROTOC_VERSION VERSION_EQUAL protobuf_VERSION)
 endif()
 
 # forward variables used in the other places
-set(SYSTEM_PROTOC ${SYSTEM_PROTOC} PARENT_SCOPE)
+if(SYSTEM_PROTOC)
+    set(SYSTEM_PROTOC ${SYSTEM_PROTOC} PARENT_SCOPE)
+    set(PROTOC_EXECUTABLE ${SYSTEM_PROTOC} PARENT_SCOPE)
+else()
+    set(PROTOC_EXECUTABLE $<TARGET_FILE:protoc> PARENT_SCOPE)
+endif()
+
+set(protobuf_VERSION ${protobuf_VERSION} PARENT_SCOPE)
 set(Protobuf_LIBRARIES ${Protobuf_LIBRARIES} PARENT_SCOPE)
 set(Protobuf_INCLUDE_DIRS ${Protobuf_INCLUDE_DIRS} PARENT_SCOPE)

From b62d93efffc6a221880b56d3edc045d6bec9a34d Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Tue, 20 Jul 2021 18:59:38 +0300
Subject: [PATCH 14/71] Enabled code style check for tests (#6724)

---
 .github/workflows/code_style.yml                               | 2 +-
 .../mock_mo_ngraph_frontend/mock_mo_frontend.hpp               | 1 -
 .../tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp    | 3 ++-
 ngraph/test/frontend/frontend_manager.cpp                      | 3 +--
 ngraph/test/frontend/shared/src/cut_specific_model.cpp         | 2 +-
 ngraph/test/frontend/shared/src/load_from.cpp                  | 2 +-
 6 files changed, 6 insertions(+), 7 deletions(-)

diff --git a/.github/workflows/code_style.yml b/.github/workflows/code_style.yml
index 607fe2cb64ae1a..7969cf13aa15e9 100644
--- a/.github/workflows/code_style.yml
+++ b/.github/workflows/code_style.yml
@@ -25,7 +25,7 @@ jobs:
         run: |
           mkdir build
           cd build
-          cmake -DENABLE_PYTHON=ON -DENABLE_PROFILING_ITT=ON -DSELECTIVE_BUILD=COLLECT ..
+          cmake -DENABLE_PYTHON=ON -DENABLE_TESTS=ON -DENABLE_PROFILING_ITT=ON -DSELECTIVE_BUILD=COLLECT ..
 
       - name: Check code style
         run: cmake --build build --target clang_format_check_all
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp
index ab0de8f3357e7c..e6b91764a0d169 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/mock_mo_frontend.hpp
@@ -309,7 +309,6 @@ class MOCK_API FrontEndMockPy : public FrontEnd
 public:
     FrontEndMockPy() {}
 
-
     std::shared_ptr<ngraph::Function> convert(InputModel::Ptr model) const override
     {
         m_stat.m_convert_model++;
diff --git a/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp b/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp
index c2654f7d8745ea..d3e09583481769 100644
--- a/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp
+++ b/ngraph/python/tests/mock/mock_py_ngraph_frontend/mock_py_frontend.hpp
@@ -504,7 +504,8 @@ class MOCK_API FrontEndMockPy : public FrontEnd
     InputModel::Ptr load_impl(const std::vector<std::shared_ptr<Variant>>& params) const override
     {
         if (params.size() > 0 && is_type<VariantWrapper<std::string>>(params[0]))
-            m_stat.m_load_paths.push_back(as_type_ptr<VariantWrapper<std::string>>(params[0])->get());
+            m_stat.m_load_paths.push_back(
+                as_type_ptr<VariantWrapper<std::string>>(params[0])->get());
         return std::make_shared<InputModelMockPy>();
     }
 
diff --git a/ngraph/test/frontend/frontend_manager.cpp b/ngraph/test/frontend/frontend_manager.cpp
index 218ecded3adf0a..b190c1e7860fa0 100644
--- a/ngraph/test/frontend/frontend_manager.cpp
+++ b/ngraph/test/frontend/frontend_manager.cpp
@@ -34,8 +34,7 @@ static int set_test_env(const char* name, const char* value)
 TEST(FrontEndManagerTest, testAvailableFrontEnds)
 {
     FrontEndManager fem;
-    ASSERT_NO_THROW(fem.register_front_end(
-        "mock", []() { return std::make_shared<FrontEnd>(); }));
+    ASSERT_NO_THROW(fem.register_front_end("mock", []() { return std::make_shared<FrontEnd>(); }));
     auto frontends = fem.get_available_front_ends();
     ASSERT_NE(std::find(frontends.begin(), frontends.end(), "mock"), frontends.end());
     FrontEnd::Ptr fe;
diff --git a/ngraph/test/frontend/shared/src/cut_specific_model.cpp b/ngraph/test/frontend/shared/src/cut_specific_model.cpp
index a9e7ee1a4ca4e0..c784745900330b 100644
--- a/ngraph/test/frontend/shared/src/cut_specific_model.cpp
+++ b/ngraph/test/frontend/shared/src/cut_specific_model.cpp
@@ -3,8 +3,8 @@
 //
 
 #include "cut_specific_model.hpp"
-#include "utils.hpp"
 #include "ngraph/opsets/opset7.hpp"
+#include "utils.hpp"
 
 using namespace ngraph;
 using namespace ngraph::frontend;
diff --git a/ngraph/test/frontend/shared/src/load_from.cpp b/ngraph/test/frontend/shared/src/load_from.cpp
index 937f86f1f0ccf2..d7a7e666b69999 100644
--- a/ngraph/test/frontend/shared/src/load_from.cpp
+++ b/ngraph/test/frontend/shared/src/load_from.cpp
@@ -63,7 +63,7 @@ TEST_P(FrontEndLoadFromTest, testLoadFromTwoFiles)
 TEST_P(FrontEndLoadFromTest, testLoadFromStream)
 {
     auto ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_stream,
-                                                      std::ios::in | std::ifstream::binary);
+                                               std::ios::in | std::ifstream::binary);
     auto is = std::dynamic_pointer_cast<std::istream>(ifs);
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;

From b0ebea1cda8c0341f131f49e7bc2907ac7e78c5e Mon Sep 17 00:00:00 2001
From: Daria Mityagina <daria.mityagina@intel.com>
Date: Tue, 20 Jul 2021 21:13:52 +0300
Subject: [PATCH 15/71] Abs layer support (#6475)

* [MyriadX] Abs op support
---
 inference-engine/cmake/vpu_dependencies.cmake            | 6 +++---
 .../src/legacy_api/include/legacy/ie_layers.h            | 3 ++-
 .../ngraph/transformations/dynamic_to_static_shape.cpp   | 1 +
 .../graph_transformer/include/vpu/frontend/frontend.hpp  | 1 +
 .../vpu/graph_transformer/include/vpu/model/stage.hpp    | 1 +
 .../src/vpu/graph_transformer/src/frontend/frontend.cpp  | 1 +
 .../src/middleend/passes/merge_eltwise_and_relu.cpp      | 3 ++-
 .../src/vpu/graph_transformer/src/stages/activation.cpp  | 9 +++++++++
 .../src/vpu/graph_transformer/src/stages/eltwise.cpp     | 6 ++++--
 .../single_layer_tests/activation.cpp                    | 1 +
 10 files changed, 25 insertions(+), 7 deletions(-)

diff --git a/inference-engine/cmake/vpu_dependencies.cmake b/inference-engine/cmake/vpu_dependencies.cmake
index d134c29171802c..3ecf93e0fb98cc 100644
--- a/inference-engine/cmake/vpu_dependencies.cmake
+++ b/inference-engine/cmake/vpu_dependencies.cmake
@@ -6,14 +6,14 @@ include_guard(GLOBAL)
 
 set(VPU_SUPPORTED_FIRMWARES usb-ma2x8x pcie-ma2x8x)
 set(VPU_SUPPORTED_FIRMWARES_HASH
-    "420b300d193f7fcfe7e3f9bbec6c247d65b784a500b5cd2effb7cb1ec6e1b209"
-    "bfe3caf270b168b9de18ef88f04bde3907d7d12a679f1fa7cc580423c35db637")
+    "d55a824838accec31733e4d4c45e8774bdd5690da8beefe41360f1983476e3d0"
+    "61797a77b38fc677be4cc63d730e8871bbf169686b88eabb7066b01f9d156129")
 
 #
 # Default packages
 #
 
-set(FIRMWARE_PACKAGE_VERSION 1688)
+set(FIRMWARE_PACKAGE_VERSION 1714)
 set(VPU_CLC_MA2X8X_VERSION "movi-cltools-20.09.2")
 
 #
diff --git a/inference-engine/src/legacy_api/include/legacy/ie_layers.h b/inference-engine/src/legacy_api/include/legacy/ie_layers.h
index e7ea32467a0654..64fa501966a97e 100644
--- a/inference-engine/src/legacy_api/include/legacy/ie_layers.h
+++ b/inference-engine/src/legacy_api/include/legacy/ie_layers.h
@@ -1025,7 +1025,8 @@ class INFERENCE_ENGINE_INTERNAL_CNNLAYER_CLASS(EltwiseLayer): public CNNLayer {
         Logical_OR,
         Logical_XOR,
         Logical_NOT,
-        Mean
+        Mean,
+        Abs,
     };
 
     /**
diff --git a/inference-engine/src/vpu/common/src/ngraph/transformations/dynamic_to_static_shape.cpp b/inference-engine/src/vpu/common/src/ngraph/transformations/dynamic_to_static_shape.cpp
index 4c5601a32e55ad..d338e557e793fa 100644
--- a/inference-engine/src/vpu/common/src/ngraph/transformations/dynamic_to_static_shape.cpp
+++ b/inference-engine/src/vpu/common/src/ngraph/transformations/dynamic_to_static_shape.cpp
@@ -127,6 +127,7 @@ const Transformations& getDefaultTransformations() {
         {ngraph::opset3::Exp::type_info,                   dynamicToStaticUnaryElementwise},
         {ngraph::opset3::Sqrt::type_info,                  dynamicToStaticUnaryElementwise},
         {ngraph::opset3::LogicalNot::type_info,            dynamicToStaticUnaryElementwise},
+        {ngraph::opset3::Abs::type_info,                   dynamicToStaticUnaryElementwise},
         {ngraph::opset5::ScatterElementsUpdate::type_info, dynamicToStaticUnaryElementwise},
         {ngraph::opset3::StridedSlice::type_info,          dynamicToStaticShapeStridedSlice},
         {ngraph::opset3::Squeeze::type_info,               dynamicToStaticShapeSqueeze},
diff --git a/inference-engine/src/vpu/graph_transformer/include/vpu/frontend/frontend.hpp b/inference-engine/src/vpu/graph_transformer/include/vpu/frontend/frontend.hpp
index c09ef094743269..3ca16e6525d20f 100644
--- a/inference-engine/src/vpu/graph_transformer/include/vpu/frontend/frontend.hpp
+++ b/inference-engine/src/vpu/graph_transformer/include/vpu/frontend/frontend.hpp
@@ -162,6 +162,7 @@ class FrontEnd final {
     void parseCeiling(const Model& model, const ie::CNNLayerPtr& layer, const DataVector& inputs, const DataVector& outputs) const;
     void parseRound(const Model& model, const ie::CNNLayerPtr& layer, const DataVector& inputs, const DataVector& outputs) const;
     void parseCTCGreedyDecoderSeqLen(const Model& model, const ie::CNNLayerPtr& layer, const DataVector& inputs, const DataVector& outputs) const;
+    void parseAbs(const Model& model, const ie::CNNLayerPtr& layer, const DataVector& inputs, const DataVector& outputs) const;
 
     //
     // Special layers
diff --git a/inference-engine/src/vpu/graph_transformer/include/vpu/model/stage.hpp b/inference-engine/src/vpu/graph_transformer/include/vpu/model/stage.hpp
index 433c3b9f77da0f..6cd767b13d5bb3 100644
--- a/inference-engine/src/vpu/graph_transformer/include/vpu/model/stage.hpp
+++ b/inference-engine/src/vpu/graph_transformer/include/vpu/model/stage.hpp
@@ -177,6 +177,7 @@ VPU_DECLARE_ENUM(StageType,
     GatherElements = 139,
     Round = 140,
     CTCGreedyDecoderSeqLen = 141,
+    Abs = 142,
 )
 
 //
diff --git a/inference-engine/src/vpu/graph_transformer/src/frontend/frontend.cpp b/inference-engine/src/vpu/graph_transformer/src/frontend/frontend.cpp
index c53a729651c306..ba3888dea284ef 100644
--- a/inference-engine/src/vpu/graph_transformer/src/frontend/frontend.cpp
+++ b/inference-engine/src/vpu/graph_transformer/src/frontend/frontend.cpp
@@ -156,6 +156,7 @@ FrontEnd::FrontEnd(StageBuilder::Ptr stageBuilder, const std::shared_ptr<ie::ICo
         {"ExpGatherElements",                                  LAYER_PARSER(parseGatherElements)},
         {"Round",                                              LAYER_PARSER(parseRound)},
         {"CTCGreedyDecoderSeqLen",                             LAYER_PARSER(parseCTCGreedyDecoderSeqLen)},
+        {"Abs",                                                LAYER_PARSER(parseAbs)}
     }} {
         VPU_THROW_UNLESS(_core != nullptr, "Argument core is null");
     }
diff --git a/inference-engine/src/vpu/graph_transformer/src/middleend/passes/merge_eltwise_and_relu.cpp b/inference-engine/src/vpu/graph_transformer/src/middleend/passes/merge_eltwise_and_relu.cpp
index 6f338edf44378e..92114845b764c5 100644
--- a/inference-engine/src/vpu/graph_transformer/src/middleend/passes/merge_eltwise_and_relu.cpp
+++ b/inference-engine/src/vpu/graph_transformer/src/middleend/passes/merge_eltwise_and_relu.cpp
@@ -69,7 +69,8 @@ void PassImpl::run(const Model& model) {
             eltwiseStage->type() != StageType::Logical_AND    &&
             eltwiseStage->type() != StageType::Logical_OR     &&
             eltwiseStage->type() != StageType::Logical_XOR    &&
-            eltwiseStage->type() != StageType::Logical_NOT) {
+            eltwiseStage->type() != StageType::Logical_NOT    &&
+            eltwiseStage->type() != StageType::Abs) {
             continue;
         }
 
diff --git a/inference-engine/src/vpu/graph_transformer/src/stages/activation.cpp b/inference-engine/src/vpu/graph_transformer/src/stages/activation.cpp
index 7f666964414e59..a9fba166246c77 100644
--- a/inference-engine/src/vpu/graph_transformer/src/stages/activation.cpp
+++ b/inference-engine/src/vpu/graph_transformer/src/stages/activation.cpp
@@ -16,9 +16,18 @@ void FrontEnd::parseLogicalNot(const Model &model, const ie::CNNLayerPtr &layer,
     parseEltwise(model, res, inputs, outputs);
 }
 
+void FrontEnd::parseAbs(const Model &model, const ie::CNNLayerPtr &layer, const DataVector &inputs, const DataVector &outputs) const {
+    LayerParams params = {layer->name, "Eltwise", layer->precision};
+    auto res = std::make_shared<InferenceEngine::EltwiseLayer>(params);
+    res->_operation = InferenceEngine::EltwiseLayer::Abs;
+
+    parseEltwise(model, res, inputs, outputs);
+}
+
 void FrontEnd::parseActivation(const Model& model, const ie::CNNLayerPtr& layer, const DataVector& inputs, const DataVector& outputs) const {
     const ie::details::caseless_map<std::string, LayerParser> activationParsers {
         {"not", LAYER_PARSER(parseLogicalNot)},
+        {"abs", LAYER_PARSER(parseAbs)},
     };
 
     const auto type = layer->GetParamAsString("type");
diff --git a/inference-engine/src/vpu/graph_transformer/src/stages/eltwise.cpp b/inference-engine/src/vpu/graph_transformer/src/stages/eltwise.cpp
index 741b8439281c30..4c055afaacdcd7 100644
--- a/inference-engine/src/vpu/graph_transformer/src/stages/eltwise.cpp
+++ b/inference-engine/src/vpu/graph_transformer/src/stages/eltwise.cpp
@@ -72,6 +72,7 @@ static const std::map<ie::EltwiseLayer::eOperation, std::function<StageType(ie::
         MAP_ELEMENTS(Logical_XOR,   moreThanOneInput),
         MAP_ELEMENTS(Pow,           onlyTwoInputs),
         MAP_ELEMENTS(Floor_mod,     onlyTwoInputs),
+        MAP_ELEMENTS(Abs,           onlyOneInput),
 };
 
 class EltwiseStage final : public StageNode {
@@ -150,7 +151,8 @@ class EltwiseStage final : public StageNode {
                     StageType::Div,
                     StageType::Min,
                     StageType::Logical_NOT,
-                    StageType::Logical_AND
+                    StageType::Logical_AND,
+                    StageType::Abs,
             };
             auto supportedDataTypesInput0 = EnumSet<DataType>{DataType::FP16};
             if (stageTypesWhichSupportS32.count(operation)) {
@@ -264,7 +266,7 @@ void FrontEnd::parseEltwise(const Model& model, const ie::CNNLayerPtr& _layer, c
     DataVector tempInputs(3);
     tempInputs[0] = inputs[0];
 
-    if (stageType == StageType::Logical_NOT)
+    if (stageType == StageType::Logical_NOT || stageType == StageType::Abs)
         tempInputs[1] = model->addFakeData();
     else
         tempInputs[1] = inputs[1];
diff --git a/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/activation.cpp b/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/activation.cpp
index 7fff88eb0bbaa6..b9ea78f7d7db5f 100644
--- a/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/activation.cpp
+++ b/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/activation.cpp
@@ -16,6 +16,7 @@ const std::vector<InferenceEngine::Precision> netPrecisions = {
 };
 
 const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes = {
+        {Abs,                   {}},
         {Sigmoid,               {}},
         {Tanh,                  {}},
         {Relu,                  {}},

From af2989248f3c0e820d40830f1f0cda1ced3c771b Mon Sep 17 00:00:00 2001
From: Patryk Elszkowski <patryk.elszkowski@intel.com>
Date: Wed, 21 Jul 2021 05:31:37 +0200
Subject: [PATCH 16/71] update Acosh spec (#6677)

---
 docs/ops/arithmetic/Acosh_3.md | 22 +++++++++-------------
 1 file changed, 9 insertions(+), 13 deletions(-)

diff --git a/docs/ops/arithmetic/Acosh_3.md b/docs/ops/arithmetic/Acosh_3.md
index 79fde27fbd3c20..9f858924d4e01e 100644
--- a/docs/ops/arithmetic/Acosh_3.md
+++ b/docs/ops/arithmetic/Acosh_3.md
@@ -6,32 +6,28 @@
 
 **Short description**: *Acosh* performs element-wise hyperbolic inverse cosine (arccosh) operation with given tensor.
 
-**Attributes**:
+**Detailed description**:  Operation takes one input tensor and performs the element-wise hyperbolic inverse cosine operation on a given input tensor, based on the following mathematical formula:
 
-    No attributes available.
+\f[
+a_{i} = acosh(a_{i})
+\f]
+
+**Attributes**: *Acosh* operation has no attributes.
 
 **Inputs**
 
-* **1**: A tensor of type *T*. **Required.**
+* **1**: A tensor of type *T* and arbitrary shape. **Required.**
 
 **Outputs**
 
-* **1**: The result of element-wise acosh operation. A tensor of type *T*.
+* **1**: The result of element-wise *Acosh* operation. A tensor of type *T* and the same shape as the input tensor.
 
 **Types**
 
-* *T*: any floating-point type.
-
-*Acosh* does the following with the input tensor *a*:
-
-\f[
-a_{i} = acosh(a_{i})
-\f]
+* *T*: any numeric type.
 
 **Examples**
 
-*Example 1*
-
 ```xml
 <layer ... type="Acosh">
     <input>

From 226cb952aee8024363828721359b0752353f437b Mon Sep 17 00:00:00 2001
From: Jozef Daniecki <jozef.daniecki@intel.com>
Date: Wed, 21 Jul 2021 07:13:40 +0200
Subject: [PATCH 17/71] Select operation revision (#6483)

* Add visitor test.

* Add Serialization SLT.

* Add Select-1 to summarize.py.

* Remove select from evaluates map.

* Remove few Select cases from manifest.

* Fix style.

* Refactor CoordinateTransform usage for NUMPY.

* Refactor CoordinateTransform usage for PDPD.

* Migrate backend tests to template_plugin.

* Revert "Fix style."

This reverts commit 8298c90104a59344d51c83f00d96eb45bfd0ef94.

* Add more template plugin tests.

* Fixes for PDPD broadcasting.

* Align Select type prop tests with PDPP broadcasting to new
implementation.

* Remove ngraph:: from types in tests.
---
 .../tests/functional/op_reference/select.cpp  | 139 ++++++++++++++++++
 .../serialization/single_layer/select.cpp     |  41 ++++++
 .../layer_tests_summary/utils/constants.py    |   1 +
 .../runtime/reference/autobroadcast_binop.hpp |  87 +++++++----
 ngraph/core/src/op/select.cpp                 |  55 ++++---
 ngraph/test/CMakeLists.txt                    |   2 +-
 ngraph/test/backend/select.in.cpp             |  95 ------------
 ngraph/test/runtime/ie/unit_test.manifest     |  10 --
 .../runtime/interpreter/evaluates_map.cpp     |  19 ---
 ngraph/test/type_prop/select.cpp              |   4 +-
 ngraph/test/visitors/op/select.cpp            |  33 +++++
 11 files changed, 311 insertions(+), 175 deletions(-)
 create mode 100644 docs/template_plugin/tests/functional/op_reference/select.cpp
 create mode 100644 inference-engine/tests/functional/inference_engine/serialization/single_layer/select.cpp
 delete mode 100644 ngraph/test/backend/select.in.cpp
 create mode 100644 ngraph/test/visitors/op/select.cpp

diff --git a/docs/template_plugin/tests/functional/op_reference/select.cpp b/docs/template_plugin/tests/functional/op_reference/select.cpp
new file mode 100644
index 00000000000000..c4dec3f8172e83
--- /dev/null
+++ b/docs/template_plugin/tests/functional/op_reference/select.cpp
@@ -0,0 +1,139 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+
+#include <ie_core.hpp>
+#include <ie_ngraph_utils.hpp>
+#include <ngraph/ngraph.hpp>
+#include <shared_test_classes/base/layer_test_utils.hpp>
+#include <tuple>
+
+#include "base_reference_test.hpp"
+
+using namespace ngraph;
+using namespace InferenceEngine;
+
+struct SelectParams {
+    template <class IT, class OT>
+    SelectParams(const element::Type& data_type, const op::AutoBroadcastSpec& broadcast, const PartialShape& select_input_pshape,
+                 const std::vector<char>& select_input, const PartialShape& if_input_pshape, const std::vector<IT>& if_input,
+                 const PartialShape& else_input_pshape, const std::vector<IT>& else_input, const std::vector<OT>& expected_output)
+        : data_type(data_type),
+          broadcast(broadcast),
+          select_input_pshape(select_input_pshape),
+          select_input(CreateBlob(element::boolean, select_input)),
+          if_input_pshape(if_input_pshape),
+          if_input(CreateBlob(data_type, if_input)),
+          else_input_pshape(else_input_pshape),
+          else_input(CreateBlob(data_type, else_input)),
+          expected_output(CreateBlob(data_type, expected_output)) {}
+
+    element::Type data_type;
+    op::AutoBroadcastSpec broadcast;
+    PartialShape select_input_pshape;
+    InferenceEngine::Blob::Ptr select_input;
+    PartialShape if_input_pshape;
+    InferenceEngine::Blob::Ptr if_input;
+    PartialShape else_input_pshape;
+    InferenceEngine::Blob::Ptr else_input;
+    InferenceEngine::Blob::Ptr expected_output;
+};
+
+class ReferenceSelectLayerTest : public testing::TestWithParam<SelectParams>, public CommonReferenceTest {
+public:
+    void SetUp() override {
+        auto params = GetParam();
+        function = CreateFunction(params.data_type, params.broadcast, params.select_input_pshape, params.if_input_pshape, params.else_input_pshape);
+        inputData = {params.select_input, params.if_input, params.else_input};
+        refOutData = {params.expected_output};
+    }
+    static std::string getTestCaseName(const testing::TestParamInfo<SelectParams>& obj) {
+        auto param = obj.param;
+        std::ostringstream result;
+        result << "data_type=" << param.data_type << "_";
+        result << "broadcast=" << param.broadcast.m_type << "_";
+        result << "select_shape=" << param.select_input_pshape << "_";
+        result << "if_shape=" << param.if_input_pshape << "_";
+        result << "else_shape=" << param.else_input_pshape;
+        return result.str();
+    }
+
+private:
+    static std::shared_ptr<Function> CreateFunction(const element::Type& data_type, const op::AutoBroadcastSpec& broadcast,
+                                                    const PartialShape& select_pshape, const PartialShape& if_pshape, const PartialShape& else_pshape) {
+        auto A = std::make_shared<op::Parameter>(element::boolean, select_pshape);
+        auto B = std::make_shared<op::Parameter>(data_type, if_pshape);
+        auto C = std::make_shared<op::Parameter>(data_type, else_pshape);
+        return std::make_shared<Function>(std::make_shared<op::v1::Select>(A, B, C, broadcast), ParameterVector {A, B, C});
+    }
+};
+
+TEST_P(ReferenceSelectLayerTest, CompareWithHardcodedRefs) {
+    Exec();
+}
+
+INSTANTIATE_TEST_SUITE_P(smoke_Select_With_Hardcoded_Refs, ReferenceSelectLayerTest,
+                         ::testing::Values(
+                             // fp32, no brodcasting
+                             SelectParams(element::f32,                                         // if/else/output data type
+                                          op::AutoBroadcastType::NONE,                  // broadcasting type
+                                          PartialShape {2, 2, 2},                       // select shape
+                                          std::vector<char> {0, 1, 1, 0, 0, 1, 0, 1},           // select data
+                                          PartialShape {2, 2, 2},                       // if shape
+                                          std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8},          // if data
+                                          PartialShape {2, 2, 2},                       // else shape
+                                          std::vector<float> {11, 12, 13, 14, 15, 16, 17, 18},  // else data
+                                          std::vector<float> {11, 2, 3, 14, 15, 6, 17, 8}),     // expected output data
+                             // i32, no brodcasting
+                             SelectParams(element::i32,                                         // if/else/output data type
+                                          op::AutoBroadcastType::NONE,                  // broadcasting type
+                                          PartialShape {2, 2, 2},                       // select shape
+                                          std::vector<char> {0, 1, 1, 0, 0, 1, 0, 1},           // select data
+                                          PartialShape {2, 2, 2},                       // if shape
+                                          std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8},          // if data
+                                          PartialShape {2, 2, 2},                       // else shape
+                                          std::vector<float> {11, 12, 13, 14, 15, 16, 17, 18},  // else data
+                                          std::vector<float> {11, 2, 3, 14, 15, 6, 17, 8}),     // expected output data
+                             // fp32, numpy brodcasting
+                             SelectParams(element::f32,                                         // if/else/output data type
+                                          op::AutoBroadcastType::NUMPY,                 // broadcasting type
+                                          PartialShape {4},                             // select shape
+                                          std::vector<char> {0, 1, 1, 0},                       // select data
+                                          PartialShape {4},                             // if shape
+                                          std::vector<float> {1, 2, 3, 4},                      // if data
+                                          PartialShape {2, 4},                          // else shape
+                                          std::vector<float> {11, 12, 13, 14, 15, 16, 17, 18},  // else data
+                                          std::vector<float> {11, 2, 3, 14, 15, 2, 3, 18}),     // expected output data
+                             // i32, numpy brodcasting
+                             SelectParams(element::i32,                                         // if/else/output data type
+                                          op::AutoBroadcastType::NUMPY,                 // broadcasting type
+                                          PartialShape {4},                             // select shape
+                                          std::vector<char> {0, 1, 1, 0},                       // select data
+                                          PartialShape {4},                             // if shape
+                                          std::vector<float> {1, 2, 3, 4},                      // if data
+                                          PartialShape {2, 4},                          // else shape
+                                          std::vector<float> {11, 12, 13, 14, 15, 16, 17, 18},  // else data
+                                          std::vector<float> {11, 2, 3, 14, 15, 2, 3, 18}),     // expected output data
+                             // fp32, pdpd brodcasting
+                             SelectParams(element::f32,                                       // if/else/output data type
+                                          {op::AutoBroadcastType::PDPD, -1},                  // broadcasting type
+                                          PartialShape {2, 4},                        // select shape
+                                          std::vector<char> {0, 0, 0, 0, 0, 1, 1, 1},         // select data
+                                          PartialShape {2, 4},                        // if shape
+                                          std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8},        // if data
+                                          PartialShape {4},                           // else shape
+                                          std::vector<float> {11, 12, 13, 14},                // else data
+                                          std::vector<float> {11, 12, 13, 14, 11, 6, 7, 8}),  // expected output data
+                             // i32, pdpd brodcasting
+                             SelectParams(element::i32,                                        // if/else/output data type
+                                          {op::AutoBroadcastType::PDPD, -1},                   // broadcasting type
+                                          PartialShape {2, 4},                         // select shape
+                                          std::vector<char> {0, 0, 0, 0, 0, 1, 1, 1},          // select data
+                                          PartialShape {2, 4},                         // if shape
+                                          std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8},         // if data
+                                          PartialShape {4},                            // else shape
+                                          std::vector<float> {11, 12, 13, 14},                 // else data
+                                          std::vector<float> {11, 12, 13, 14, 11, 6, 7, 8})),  // expected output data
+                         ReferenceSelectLayerTest::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/serialization/single_layer/select.cpp b/inference-engine/tests/functional/inference_engine/serialization/single_layer/select.cpp
new file mode 100644
index 00000000000000..ad4712a0b0b3ad
--- /dev/null
+++ b/inference-engine/tests/functional/inference_engine/serialization/single_layer/select.cpp
@@ -0,0 +1,41 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "shared_test_classes/single_layer/select.hpp"
+
+#include <vector>
+using namespace LayerTestsDefinitions;
+
+const std::vector<InferenceEngine::Precision> inputPrecision = {
+    InferenceEngine::Precision::I8, InferenceEngine::Precision::I16,
+    InferenceEngine::Precision::I32, InferenceEngine::Precision::FP16,
+    InferenceEngine::Precision::FP32};
+
+const std::vector<std::vector<std::vector<size_t>>> noneShapes = {
+    {{2, 3, 4, 5, 6}, {2, 3, 4, 5, 6}, {2, 3, 4, 5, 6}}};
+
+const auto noneCases = ::testing::Combine(
+    ::testing::ValuesIn(noneShapes), ::testing::ValuesIn(inputPrecision),
+    ::testing::Values(ngraph::op::AutoBroadcastSpec::NONE),
+    ::testing::Values(CommonTestUtils::DEVICE_CPU));
+
+const std::vector<std::vector<std::vector<size_t>>> numpyShapes = {
+    {{5, 1, 2, 1}, {8, 1, 9, 1, 1}, {5, 1, 2, 1}}};
+
+const auto numpyCases = ::testing::Combine(
+    ::testing::ValuesIn(numpyShapes), ::testing::ValuesIn(inputPrecision),
+    ::testing::Values(ngraph::op::AutoBroadcastSpec::NUMPY),
+    ::testing::Values(CommonTestUtils::DEVICE_CPU));
+
+TEST_P(SelectLayerTest, Serialize) {
+    Serialize();
+}
+
+INSTANTIATE_TEST_SUITE_P(smoke_Serialization_SelectLayerTest_none,
+                         SelectLayerTest, noneCases,
+                         SelectLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_SUITE_P(smoke_Serialization_SelectLayerTest_numpy,
+                         SelectLayerTest, numpyCases,
+                         SelectLayerTest::getTestCaseName);
diff --git a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
index d22707a1eb4f7f..fe6cc530fb4e5b 100644
--- a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
+++ b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
@@ -93,6 +93,7 @@
     'Round-5',
     'SpaceToDepth-1',
     'ScatterNDUpdate-4',
+    'Select-1',
     'ShapeOf-1',
     'ShapeOf-3',
     'ShuffleChannels-1',
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/autobroadcast_binop.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/autobroadcast_binop.hpp
index 46604bf3865a71..f34fbbc5254548 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/autobroadcast_binop.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/autobroadcast_binop.hpp
@@ -5,6 +5,7 @@
 #pragma once
 
 #include <cstddef>
+#include <numeric>
 
 #include <utility>
 #include "ngraph/coordinate_transform.hpp"
@@ -439,23 +440,38 @@ namespace ngraph
                                                              arg1_padded_shape[i]}));
                         }
 
-                        NGRAPH_SUPPRESS_DEPRECATED_START
-                        CoordinateTransform arg0_transform(arg0_squeezed_shape);
-                        CoordinateTransform arg1_transform(arg1_squeezed_shape);
-                        CoordinateTransform arg2_transform(arg2_squeezed_shape);
-                        CoordinateTransform output_transform(output_shape);
+                        CoordinateTransformBasic arg0_transform(arg0_squeezed_shape);
+                        CoordinateTransformBasic arg1_transform(arg1_squeezed_shape);
+                        CoordinateTransformBasic arg2_transform(arg2_squeezed_shape);
+                        CoordinateTransformBasic output_transform(output_shape);
+
+                        const auto arg0_strides = row_major_strides(arg0_squeezed_shape);
+                        const auto arg1_strides = row_major_strides(arg1_squeezed_shape);
+                        const auto arg2_strides = row_major_strides(arg2_squeezed_shape);
+                        const auto output_strides = row_major_strides(output_shape);
 
                         for (const Coordinate& output_coord : output_transform)
                         {
-                            Coordinate arg0_coord = reduce(output_coord, arg0_squeezed_axes, false);
-                            Coordinate arg1_coord = reduce(output_coord, arg1_squeezed_axes, false);
-                            Coordinate arg2_coord = reduce(output_coord, arg2_squeezed_axes, false);
-                            out[output_transform.index(output_coord)] =
-                                elementwise_functor(arg0[arg0_transform.index(arg0_coord)],
-                                                    arg1[arg1_transform.index(arg1_coord)],
-                                                    arg2[arg2_transform.index(arg2_coord)]);
+                            const Coordinate arg0_coord =
+                                reduce(output_coord, arg0_squeezed_axes, false);
+                            const Coordinate arg1_coord =
+                                reduce(output_coord, arg1_squeezed_axes, false);
+                            const Coordinate arg2_coord =
+                                reduce(output_coord, arg2_squeezed_axes, false);
+
+                            const size_t arg0_idx = std::inner_product(
+                                arg0_coord.begin(), arg0_coord.end(), arg0_strides.begin(), 0);
+                            const size_t arg1_idx = std::inner_product(
+                                arg1_coord.begin(), arg1_coord.end(), arg1_strides.begin(), 0);
+                            const size_t arg2_idx = std::inner_product(
+                                arg2_coord.begin(), arg2_coord.end(), arg2_strides.begin(), 0);
+                            const size_t output_idx = std::inner_product(output_coord.begin(),
+                                                                         output_coord.end(),
+                                                                         output_strides.begin(),
+                                                                         0);
+                            out[output_idx] =
+                                elementwise_functor(arg0[arg0_idx], arg1[arg1_idx], arg2[arg2_idx]);
                         }
-                        NGRAPH_SUPPRESS_DEPRECATED_END
                     }
                     break;
                 case op::AutoBroadcastType::PDPD:
@@ -475,7 +491,9 @@ namespace ngraph
                         arg0_padded_shape.pop_back();
                     }
 
-                    for (int64_t i = 0; i < axis; ++i)
+                    for (int64_t i = 0;
+                         (i < axis) && (arg0_padded_shape.size() < arg1_shape.size());
+                         ++i)
                     {
                         arg0_padded_shape.insert(arg0_padded_shape.begin(), 1);
                     }
@@ -489,8 +507,9 @@ namespace ngraph
                     {
                         arg2_padded_shape.pop_back();
                     }
-
-                    for (int64_t i = 0; i < axis; ++i)
+                    for (int64_t i = 0;
+                         (i < axis) && (arg2_padded_shape.size() < arg1_shape.size());
+                         ++i)
                     {
                         arg2_padded_shape.insert(arg2_padded_shape.begin(), 1);
                     }
@@ -525,22 +544,34 @@ namespace ngraph
                         }
                     }
 
-                    NGRAPH_SUPPRESS_DEPRECATED_START
-                    CoordinateTransform arg0_transform(arg0_squeezed_shape);
-                    CoordinateTransform arg1_transform(arg1_shape);
-                    CoordinateTransform arg2_transform(arg2_squeezed_shape);
-                    CoordinateTransform output_transform(arg1_shape);
+                    CoordinateTransformBasic arg0_transform(arg0_squeezed_shape);
+                    CoordinateTransformBasic arg1_transform(arg1_shape);
+                    CoordinateTransformBasic arg2_transform(arg2_squeezed_shape);
+                    CoordinateTransformBasic output_transform(arg1_shape);
+
+                    const auto arg0_strides = row_major_strides(arg0_squeezed_shape);
+                    const auto arg2_strides = row_major_strides(arg2_squeezed_shape);
+                    const auto output_strides = row_major_strides(arg1_shape);
 
                     for (const Coordinate& output_coord : output_transform)
                     {
-                        Coordinate arg0_coord = reduce(output_coord, arg0_squeezed_axes, false);
-                        Coordinate arg2_coord = reduce(output_coord, arg2_squeezed_axes, false);
-                        out[output_transform.index(output_coord)] =
-                            elementwise_functor(arg0[arg0_transform.index(arg0_coord)],
-                                                arg1[arg1_transform.index(output_coord)],
-                                                arg2[arg2_transform.index(arg2_coord)]);
+                        const Coordinate arg0_coord =
+                            reduce(output_coord, arg0_squeezed_axes, false);
+                        const Coordinate arg2_coord =
+                            reduce(output_coord, arg2_squeezed_axes, false);
+
+                        const size_t arg0_idx = std::inner_product(
+                            arg0_coord.begin(), arg0_coord.end(), arg0_strides.begin(), 0);
+                        const size_t arg1_idx = std::inner_product(
+                            output_coord.begin(), output_coord.end(), output_strides.begin(), 0);
+                        const size_t arg2_idx = std::inner_product(
+                            arg2_coord.begin(), arg2_coord.end(), arg2_strides.begin(), 0);
+                        const size_t output_idx = std::inner_product(
+                            output_coord.begin(), output_coord.end(), output_strides.begin(), 0);
+
+                        out[output_idx] =
+                            elementwise_functor(arg0[arg0_idx], arg1[arg1_idx], arg2[arg2_idx]);
                     }
-                    NGRAPH_SUPPRESS_DEPRECATED_END
                 }
                 }
             }
diff --git a/ngraph/core/src/op/select.cpp b/ngraph/core/src/op/select.cpp
index 657845b4cc95b5..2295b99be7cd9a 100644
--- a/ngraph/core/src/op/select.cpp
+++ b/ngraph/core/src/op/select.cpp
@@ -45,28 +45,43 @@ void op::v1::Select::validate_and_infer_types()
         element::Type::merge(result_et, get_input_element_type(1), get_input_element_type(2)),
         "Argument 1 and 2 element types must match.");
 
-    PartialShape result_shape = get_input_partial_shape(2);
-    for (int i = 1; i >= 0; i--)
+    PartialShape result_shape;
+    if (get_auto_broadcast().m_type == op::AutoBroadcastType::PDPD)
     {
-        if (get_auto_broadcast().m_type == op::AutoBroadcastType::NONE)
-        {
-            NODE_VALIDATION_CHECK(
-                this,
-                PartialShape::merge_into(result_shape, get_input_partial_shape(i)),
-                "Argument shapes are inconsistent.");
-        }
-        else if (get_auto_broadcast().m_type == op::AutoBroadcastType::NUMPY ||
-                 get_auto_broadcast().m_type == op::AutoBroadcastType::PDPD)
-        {
-            NODE_VALIDATION_CHECK(this,
-                                  PartialShape::broadcast_merge_into(result_shape,
-                                                                     get_input_partial_shape(i),
-                                                                     get_auto_broadcast()),
-                                  "Argument shapes are inconsistent.");
-        }
-        else
+        result_shape = get_input_partial_shape(1); // 'then' tensor
+        NODE_VALIDATION_CHECK(this,
+                              PartialShape::broadcast_merge_into(
+                                  result_shape, get_input_partial_shape(2), get_auto_broadcast()),
+                              "'Else' tensor shape is not broadcastable.");
+        NODE_VALIDATION_CHECK(this,
+                              PartialShape::broadcast_merge_into(
+                                  result_shape, get_input_partial_shape(0), get_auto_broadcast()),
+                              "'Cond' tensor shape is not broadcastable.");
+    }
+    else
+    {
+        result_shape = get_input_partial_shape(2);
+        for (int i = 1; i >= 0; i--)
         {
-            NODE_VALIDATION_CHECK(this, false, "Unsupported auto broadcast specification");
+            if (get_auto_broadcast().m_type == op::AutoBroadcastType::NONE)
+            {
+                NODE_VALIDATION_CHECK(
+                    this,
+                    PartialShape::merge_into(result_shape, get_input_partial_shape(i)),
+                    "Argument shapes are inconsistent.");
+            }
+            else if (get_auto_broadcast().m_type == op::AutoBroadcastType::NUMPY)
+            {
+                NODE_VALIDATION_CHECK(this,
+                                      PartialShape::broadcast_merge_into(result_shape,
+                                                                         get_input_partial_shape(i),
+                                                                         get_auto_broadcast()),
+                                      "Argument shapes are inconsistent.");
+            }
+            else
+            {
+                NODE_VALIDATION_CHECK(this, false, "Unsupported auto broadcast specification");
+            }
         }
     }
     set_output_type(0, result_et, result_shape);
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index e27bcc369652b5..c8a895bda3771a 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -300,6 +300,7 @@ set(SRC
     visitors/op/rnn_cell.cpp
     visitors/op/roi_pooling.cpp
     visitors/op/round.cpp
+    visitors/op/select.cpp
     visitors/op/space_to_depth.cpp
     visitors/op/selu.cpp
     visitors/op/shuffle_channels.cpp
@@ -487,7 +488,6 @@ set(MULTI_TEST_SRC
     backend/round.in.cpp
     backend/scatter_nd_update.in.cpp
     backend/space_to_depth.in.cpp
-    backend/select.in.cpp
     backend/selu.in.cpp
     backend/shape_of.in.cpp
     backend/shuffle_channels.in.cpp
diff --git a/ngraph/test/backend/select.in.cpp b/ngraph/test/backend/select.in.cpp
deleted file mode 100644
index 9da4363e110dfb..00000000000000
--- a/ngraph/test/backend/select.in.cpp
+++ /dev/null
@@ -1,95 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "gtest/gtest.h"
-#include "ngraph/ngraph.hpp"
-#include "ngraph/runtime/tensor.hpp"
-#include "runtime/backend.hpp"
-#include "util/all_close.hpp"
-#include "util/all_close_f.hpp"
-#include "util/ndarray.hpp"
-#include "util/test_control.hpp"
-#include "util/test_tools.hpp"
-
-NGRAPH_SUPPRESS_DEPRECATED_START
-
-using namespace std;
-using namespace ngraph;
-
-static string s_manifest = "${MANIFEST}";
-
-NGRAPH_TEST(${BACKEND_NAME}, select)
-{
-    Shape shape{2, 2, 2};
-    auto A = make_shared<op::Parameter>(element::boolean, shape);
-    auto B = make_shared<op::Parameter>(element::f32, shape);
-    auto C = make_shared<op::Parameter>(element::f32, shape);
-    auto f = make_shared<Function>(make_shared<op::v1::Select>(A, B, C), ParameterVector{A, B, C});
-
-    auto backend = runtime::Backend::create("${BACKEND_NAME}");
-
-    // Create some tensors for input/output
-    auto a = backend->create_tensor(element::boolean, shape);
-    copy_data(a, vector<char>{0, 1, 1, 0, 0, 1, 0, 1});
-    auto b = backend->create_tensor(element::f32, shape);
-    copy_data(b, vector<float>{1, 2, 3, 4, 5, 6, 7, 8});
-    auto c = backend->create_tensor(element::f32, shape);
-    copy_data(c, vector<float>{11, 12, 13, 14, 15, 16, 17, 18});
-    auto result = backend->create_tensor(element::f32, shape);
-
-    auto handle = backend->compile(f);
-    handle->call_with_validate({result}, {a, b, c});
-    EXPECT_TRUE(test::all_close_f((vector<float>{11, 2, 3, 14, 15, 6, 17, 8}),
-                                  read_vector<float>(result),
-                                  MIN_FLOAT_TOLERANCE_BITS));
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, select_v1)
-{
-    auto A = make_shared<op::Parameter>(element::boolean, Shape{4});
-    auto B = make_shared<op::Parameter>(element::f32, Shape{4});
-    auto C = make_shared<op::Parameter>(element::f32, Shape{2, 4});
-    auto f = make_shared<Function>(make_shared<op::v1::Select>(A, B, C), ParameterVector{A, B, C});
-
-    auto backend = runtime::Backend::create("${BACKEND_NAME}");
-
-    // Create some tensors for input/output
-    auto a = backend->create_tensor(element::boolean, Shape{4});
-    copy_data(a, vector<char>{0, 1, 1, 0});
-    auto b = backend->create_tensor(element::f32, Shape{4});
-    copy_data(b, vector<float>{1, 2, 3, 4});
-    auto c = backend->create_tensor(element::f32, Shape{2, 4});
-    copy_data(c, vector<float>{11, 12, 13, 14, 15, 16, 17, 18});
-    auto result = backend->create_tensor(element::f32, Shape{2, 4});
-
-    auto handle = backend->compile(f);
-    handle->call_with_validate({result}, {a, b, c});
-    EXPECT_TRUE(
-        test::all_close_f((vector<float>{11, 2, 3, 14, 15, 2, 3, 18}), read_vector<float>(result)));
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, select_double)
-{
-    Shape shape{2, 2, 2};
-    auto A = make_shared<op::Parameter>(element::boolean, shape);
-    auto B = make_shared<op::Parameter>(element::f64, shape);
-    auto C = make_shared<op::Parameter>(element::f64, shape);
-    auto f = make_shared<Function>(make_shared<op::v1::Select>(A, B, C), ParameterVector{A, B, C});
-
-    auto backend = runtime::Backend::create("${BACKEND_NAME}");
-
-    // Create some tensors for input/output
-    auto a = backend->create_tensor(element::boolean, shape);
-    copy_data(a, vector<char>{0, 1, 1, 0, 0, 1, 0, 1});
-    auto b = backend->create_tensor(element::f64, shape);
-    copy_data(b, vector<double>{1, 2, 3, 4, 5, 6, 7, 8});
-    auto c = backend->create_tensor(element::f64, shape);
-    copy_data(c, vector<double>{11, 12, 13, 14, 15, 16, 17, 18});
-    auto result = backend->create_tensor(element::f64, shape);
-
-    auto handle = backend->compile(f);
-    handle->call_with_validate({result}, {a, b, c});
-    EXPECT_TRUE(test::all_close_f((vector<double>{11, 2, 3, 14, 15, 6, 17, 8}),
-                                  read_vector<double>(result)));
-}
diff --git a/ngraph/test/runtime/ie/unit_test.manifest b/ngraph/test/runtime/ie/unit_test.manifest
index bc65f4700a527a..dbd2f28aea5108 100644
--- a/ngraph/test/runtime/ie/unit_test.manifest
+++ b/ngraph/test/runtime/ie/unit_test.manifest
@@ -141,9 +141,6 @@ onnx_model_argmin_select_last_index
 # Constant has zero dimension that is not allowable
 onnx_dyn_shapes_transpose
 
-# Select layer with name 'y' has 'Mask' input's rank more than broadcasted 'Then' and 'Else' inputs' ranks
-onnx_model_where
-
 # y Incorrect input precision. Only FP32 is supported!
 onnx_model_erf_int32
 
@@ -449,7 +446,6 @@ sum_trivial_in_double
 sum_stable_acc_double
 sum_stable_simple_double
 softmax_axis_3d_double
-select_double
 quantize_clamp_int32
 max_3d_to_scalar_double
 argmin_trivial_in_double
@@ -485,7 +481,6 @@ sigmoid_bprop_n1c1h4
 IE_CPU.onnx_roi_align_f32
 
 # [NOT_IMPLEMENTED] Input image format BOOL is not supported yet...
-select
 not
 logical_xor
 logical_or
@@ -519,9 +514,6 @@ all_2x2x3_eliminate_dims_0_1_2
 all_dynamic_axis
 all_change_axis
 
-# Positive input shape should be the same as negative input shape
-select_v1
-
 # Cannot cast ngraph node Reverse to CNNLayer!
 reverse_1d_0
 reverse_2d_0
@@ -855,8 +847,6 @@ backwards_power
 backwards_relu
 backwards_replace_slice
 backwards_reshape
-backwards_select
-backwards_select_nested
 backwards_sigmoid
 backwards_sign
 backwards_sin
diff --git a/ngraph/test/runtime/interpreter/evaluates_map.cpp b/ngraph/test/runtime/interpreter/evaluates_map.cpp
index 8e29acd20fbfa6..80341055763f99 100644
--- a/ngraph/test/runtime/interpreter/evaluates_map.cpp
+++ b/ngraph/test/runtime/interpreter/evaluates_map.cpp
@@ -66,7 +66,6 @@
 #include <ngraph/runtime/reference/roi_pooling.hpp>
 #include <ngraph/runtime/reference/roll.hpp>
 #include <ngraph/runtime/reference/scatter_nd_update.hpp>
-#include <ngraph/runtime/reference/select.hpp>
 #include <ngraph/runtime/reference/selu.hpp>
 #include <ngraph/runtime/reference/sequences.hpp>
 #include <ngraph/runtime/reference/sign.hpp>
@@ -1607,24 +1606,6 @@ namespace
         return true;
     }
 
-    template <element::Type_t ET>
-    bool evaluate(const shared_ptr<op::v1::Select>& op,
-                  const HostTensorVector& outputs,
-                  const HostTensorVector& inputs)
-    {
-        using T = typename element_type_traits<ET>::value_type;
-
-        runtime::reference::select<T>(inputs[0]->get_data_ptr<const char>(),
-                                      inputs[1]->get_data_ptr<const T>(),
-                                      inputs[2]->get_data_ptr<const T>(),
-                                      outputs[0]->get_data_ptr<T>(),
-                                      op->get_input_shape(0),
-                                      op->get_input_shape(1),
-                                      op->get_input_shape(2),
-                                      op->get_auto_broadcast());
-        return true;
-    }
-
     template <element::Type_t ET>
     bool evaluate(const shared_ptr<op::v1::AvgPool>& op,
                   const HostTensorVector& outputs,
diff --git a/ngraph/test/type_prop/select.cpp b/ngraph/test/type_prop/select.cpp
index 64313c2be1a000..1eea5a5b94c974 100644
--- a/ngraph/test/type_prop/select.cpp
+++ b/ngraph/test/type_prop/select.cpp
@@ -298,13 +298,13 @@ INSTANTIATE_TEST_SUITE_P(
                       SelectParams({{4}, {4}, {2, 4}, {2, 4}},
                                    {element::dynamic, element::dynamic, element::i8, element::i8},
                                    op::AutoBroadcastType::NUMPY),
-                      SelectParams({{2}, {2}, {2, 4}, {2, 4}},
+                      SelectParams({{2}, {2, 4}, {2}, {2, 4}},
                                    {element::boolean, element::f32, element::dynamic, element::f32},
                                    {op::AutoBroadcastType::PDPD, 0}),
                       // TODO: Whats the right behavior here?
                       // SelectParams({{2}, {2, 4}, {2}, {2, 4}}, {element::boolean, element::f32,
                       // element::dynamic, element::f32}, {op::AutoBroadcastType::PDPD, 0}),
-                      SelectParams({{4}, {4}, {2, 4}, {2, 4}},
+                      SelectParams({{4}, {2, 4}, {4}, {2, 4}},
                                    {element::boolean, element::f32, element::dynamic, element::f32},
                                    {op::AutoBroadcastType::PDPD, 1})),
     PrintToDummyParamName());
diff --git a/ngraph/test/visitors/op/select.cpp b/ngraph/test/visitors/op/select.cpp
new file mode 100644
index 00000000000000..4d00ffa5c2e737
--- /dev/null
+++ b/ngraph/test/visitors/op/select.cpp
@@ -0,0 +1,33 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "gtest/gtest.h"
+
+#include "ngraph/ngraph.hpp"
+#include "ngraph/op/util/attr_types.hpp"
+#include "ngraph/opsets/opset1.hpp"
+#include "util/visitor.hpp"
+
+using namespace ngraph;
+using ngraph::test::NodeBuilder;
+using ngraph::test::ValueMap;
+
+TEST(attributes, select)
+{
+    NodeBuilder::get_ops().register_factory<opset1::Select>();
+    auto in_cond = std::make_shared<op::Parameter>(element::boolean, Shape{3, 2});
+    auto in_then = std::make_shared<op::Parameter>(element::f32, Shape{3, 2});
+    auto in_else = std::make_shared<op::Parameter>(element::f32, Shape{3, 2});
+
+    auto auto_broadcast = op::AutoBroadcastType::NUMPY;
+
+    auto select = std::make_shared<opset1::Select>(in_cond, in_then, in_else, auto_broadcast);
+    NodeBuilder builder(select);
+
+    const auto expected_attr_count = 1;
+    EXPECT_EQ(builder.get_value_map_size(), expected_attr_count);
+
+    auto g_select = as_type_ptr<opset1::Select>(builder.create());
+    EXPECT_EQ(g_select->get_autob(), select->get_autob());
+}

From 14bbf7f5e2df64111065c250ffa443453edb1edc Mon Sep 17 00:00:00 2001
From: Maxim Vafin <maxim.vafin@intel.com>
Date: Wed, 21 Jul 2021 08:21:19 +0300
Subject: [PATCH 18/71] Fix node name issue introduced by #5854 (#6709)

* Fix node name issue introduced by #5854

* Compare names in TransposeFuse tests
---
 .../common_optimizations/transpose_sinking.cpp         |  3 ++-
 .../transformations/transpose_sinking_test.cpp         | 10 ++++++++--
 2 files changed, 10 insertions(+), 3 deletions(-)

diff --git a/inference-engine/src/transformations/src/transformations/common_optimizations/transpose_sinking.cpp b/inference-engine/src/transformations/src/transformations/common_optimizations/transpose_sinking.cpp
index 9a52445bf76f02..21211a7be462cb 100644
--- a/inference-engine/src/transformations/src/transformations/common_optimizations/transpose_sinking.cpp
+++ b/inference-engine/src/transformations/src/transformations/common_optimizations/transpose_sinking.cpp
@@ -212,8 +212,9 @@ ngraph::pass::TransposeFuse::TransposeFuse() {
             auto new_order = ngraph::opset7::Constant::create(element::i64, {order2.size()}, order2);
             auto new_transpose = register_new_node<ngraph::opset7::Transpose>(input, new_order);
 
+            new_transpose->set_friendly_name(m.get_match_root()->get_friendly_name());
             ngraph::copy_runtime_info({ transpose1, transpose2 }, new_transpose);
-            ngraph::replace_node(transpose2, new_transpose);
+            ngraph::replace_node(m.get_match_root(), new_transpose);
         }
 
         return true;
diff --git a/inference-engine/tests/functional/inference_engine/transformations/transpose_sinking_test.cpp b/inference-engine/tests/functional/inference_engine/transformations/transpose_sinking_test.cpp
index 9d0c6fdf715dea..64537727295ae1 100644
--- a/inference-engine/tests/functional/inference_engine/transformations/transpose_sinking_test.cpp
+++ b/inference-engine/tests/functional/inference_engine/transformations/transpose_sinking_test.cpp
@@ -239,10 +239,13 @@ TEST(TransformationTests, TransposeFuses) {
         auto input = std::make_shared<ngraph::opset6::Parameter>(ngraph::element::f32, ngraph::Shape{ 1, 2, 640, 20, 2, 2 });
         auto tr1_order = ngraph::opset6::Constant::create(ngraph::element::i64, ngraph::Shape{ 6 }, { 0, 5, 1, 2, 3, 4 });
         auto transpose1 = std::make_shared<ngraph::opset6::Transpose>(input, tr1_order);
+        transpose1->set_friendly_name("transpose1");
         auto tr2_order = ngraph::opset6::Constant::create(ngraph::element::i64, ngraph::Shape{ 6 }, { 0, 1, 3, 4, 2, 5 });
         auto transpose2 = std::make_shared<ngraph::opset6::Transpose>(transpose1, tr2_order);
+        transpose2->set_friendly_name("transpose2");
         auto add_const = ngraph::opset6::Constant::create(ngraph::element::f32, ngraph::Shape{ 1 }, { 1 });
         auto add = std::make_shared<ngraph::opset6::Add>(transpose2, add_const);
+        add->set_friendly_name("add");
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{ add }, ngraph::ParameterVector{ input });
 
@@ -257,12 +260,15 @@ TEST(TransformationTests, TransposeFuses) {
         auto input = std::make_shared<ngraph::opset6::Parameter>(ngraph::element::f32, ngraph::Shape{ 1, 2, 640, 20, 2, 2 });
         auto tr_order = ngraph::opset6::Constant::create(ngraph::element::i64, ngraph::Shape{ 6 }, { 0, 5, 2, 3, 1, 4 });
         auto transpose = std::make_shared<ngraph::opset6::Transpose>(input, tr_order);
+        transpose->set_friendly_name("transpose2");
         auto add_const = ngraph::opset6::Constant::create(ngraph::element::f32, ngraph::Shape{ 1 }, { 1 });
         auto add = std::make_shared<ngraph::opset6::Add>(transpose, add_const);
+        add->set_friendly_name("add");
 
         f_ref = std::make_shared<ngraph::Function>(ngraph::NodeVector{ add }, ngraph::ParameterVector{ input });
     }
 
-    auto res = compare_functions(f, f_ref);
-    ASSERT_TRUE(res.first) << res.second;
+    const FunctionsComparator func_comparator = FunctionsComparator::with_default().enable(FunctionsComparator::NAMES);
+    const FunctionsComparator::Result res = func_comparator(f, f_ref);
+    ASSERT_TRUE(res.valid) << res.message;
 }

From 7d85d610834f5e30066433bd423cd22a67708b0c Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Wed, 21 Jul 2021 11:55:41 +0300
Subject: [PATCH 19/71] Fix for cmake 3.21.x (#6722)

* Fix for cmake 3.21.x

* Removed a lot -Wno-* compile options
---
 cmake/developer_package/compile_flags/sanitizer.cmake | 2 +-
 cmake/developer_package/compile_flags/sdl.cmake       | 2 +-
 cmake/developer_package/features.cmake                | 2 +-
 cmake/developer_package/target_flags.cmake            | 6 ++++++
 inference-engine/src/mkldnn_plugin/CMakeLists.txt     | 3 +--
 ngraph/frontend/onnx/onnx_import/CMakeLists.txt       | 6 ++----
 ngraph/test/CMakeLists.txt                            | 2 +-
 openvino/conditional_compilation/CMakeLists.txt       | 3 +--
 thirdparty/onnx/CMakeLists.txt                        | 2 +-
 thirdparty/protobuf/CMakeLists.txt                    | 4 ++--
 10 files changed, 17 insertions(+), 15 deletions(-)

diff --git a/cmake/developer_package/compile_flags/sanitizer.cmake b/cmake/developer_package/compile_flags/sanitizer.cmake
index ef71780c0f169b..70b2215b664d6d 100644
--- a/cmake/developer_package/compile_flags/sanitizer.cmake
+++ b/cmake/developer_package/compile_flags/sanitizer.cmake
@@ -40,7 +40,7 @@ if (DEFINED SANITIZER_COMPILER_FLAGS)
 
     if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
         set(SANITIZER_LINKER_FLAGS "${SANITIZER_LINKER_FLAGS} -fuse-ld=gold")
-    elseif(CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$" AND NOT WIN32)
+    elseif(OV_COMPILER_IS_CLANG AND NOT WIN32)
         if(CMAKE_CXX_COMPILER_VERSION VERSION_GREATER_EQUAL 8.0)
             set(SANITIZER_LINKER_FLAGS "${SANITIZER_LINKER_FLAGS} -fuse-ld=lld")
         endif()
diff --git a/cmake/developer_package/compile_flags/sdl.cmake b/cmake/developer_package/compile_flags/sdl.cmake
index 10a1e86ad6d48f..7690a9031d864a 100644
--- a/cmake/developer_package/compile_flags/sdl.cmake
+++ b/cmake/developer_package/compile_flags/sdl.cmake
@@ -23,7 +23,7 @@ if (CMAKE_BUILD_TYPE STREQUAL "Release")
             if (NOT ENABLE_SANITIZER)
                 set(IE_C_CXX_FLAGS "${IE_C_CXX_FLAGS} -s")
             endif()
-        elseif(CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+        elseif(OV_COMPILER_IS_CLANG)
             set(IE_C_CXX_FLAGS "${IE_C_CXX_FLAGS} -fstack-protector-all")
         elseif(CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
             if (NOT ENABLE_SANITIZER)
diff --git a/cmake/developer_package/features.cmake b/cmake/developer_package/features.cmake
index 487dea8c7e382a..33e3530bac3359 100644
--- a/cmake/developer_package/features.cmake
+++ b/cmake/developer_package/features.cmake
@@ -58,7 +58,7 @@ ie_option (VERBOSE_BUILD "shows extra information about build" OFF)
 
 ie_option (ENABLE_UNSAFE_LOCATIONS "skip check for MD5 for dependency" OFF)
 
-ie_dependent_option (ENABLE_FUZZING "instrument build for fuzzing" OFF "CMAKE_CXX_COMPILER_ID MATCHES ^(Apple)?Clang$; NOT WIN32" OFF)
+ie_dependent_option (ENABLE_FUZZING "instrument build for fuzzing" OFF "OV_COMPILER_IS_CLANG; NOT WIN32" OFF)
 
 #
 # Check features
diff --git a/cmake/developer_package/target_flags.cmake b/cmake/developer_package/target_flags.cmake
index 181c4dd4187e1b..d4fd9837647005 100644
--- a/cmake/developer_package/target_flags.cmake
+++ b/cmake/developer_package/target_flags.cmake
@@ -55,3 +55,9 @@ endif()
 if(UNIX AND NOT APPLE)
     set(LINUX ON)
 endif()
+
+if(CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+    set(OV_COMPILER_IS_CLANG ON)
+else()
+    set(OV_COMPILER_IS_CLANG OFF)
+endif()
diff --git a/inference-engine/src/mkldnn_plugin/CMakeLists.txt b/inference-engine/src/mkldnn_plugin/CMakeLists.txt
index f2bbc52bdc56bb..6e066a4656c384 100644
--- a/inference-engine/src/mkldnn_plugin/CMakeLists.txt
+++ b/inference-engine/src/mkldnn_plugin/CMakeLists.txt
@@ -34,8 +34,7 @@ ie_mark_target_as_cc(${TARGET_NAME})
 
 if(SELECTIVE_BUILD STREQUAL "ON")
     # After disabling a block of code, some variables might be unused.
-    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU" OR
-       CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+    if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
         target_compile_options(${TARGET_NAME} PRIVATE -Wno-unused-variable)
     endif()
 endif()
diff --git a/ngraph/frontend/onnx/onnx_import/CMakeLists.txt b/ngraph/frontend/onnx/onnx_import/CMakeLists.txt
index 705f7f4d3b0d35..b8eab155d9784c 100644
--- a/ngraph/frontend/onnx/onnx_import/CMakeLists.txt
+++ b/ngraph/frontend/onnx/onnx_import/CMakeLists.txt
@@ -63,10 +63,8 @@ if(NGRAPH_USE_PROTOBUF_LITE)
     target_compile_definitions(onnx_importer PRIVATE NGRAPH_USE_PROTOBUF_LITE)
 endif()
 
-if (CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
-    target_compile_options(onnx_importer PRIVATE -Wno-undef -Wno-reserved-id-macro -Wno-switch-enum
-            -Wno-invalid-offsetof -Wno-shorten-64-to-32 -Wno-unused-macros -Wno-missing-variable-declarations
-            -Wno-unused-private-field -Wno-shadow -Wno-deprecated PUBLIC -Wno-undefined-func-template)
+if(OV_COMPILER_IS_CLANG)
+    target_compile_options(onnx_importer PRIVATE -Wno-undef)
 endif()
 
 install(TARGETS onnx_importer EXPORT ngraphTargets
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index c8a895bda3771a..6fbef735581714 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -618,7 +618,7 @@ if (NGRAPH_ONNX_IMPORT_ENABLE AND NOT NGRAPH_USE_PROTOBUF_LITE)
     target_include_directories(unit-test PRIVATE ${ONNX_IMPORTER_SRC_DIR}/src)
 endif()
 
-if (CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+if (OV_COMPILER_IS_CLANG)
     target_compile_options(unit-test PRIVATE -Wno-undef -Wno-reserved-id-macro)
 endif()
 
diff --git a/openvino/conditional_compilation/CMakeLists.txt b/openvino/conditional_compilation/CMakeLists.txt
index 1db12d4eefbd0a..daadd1c83207b6 100644
--- a/openvino/conditional_compilation/CMakeLists.txt
+++ b/openvino/conditional_compilation/CMakeLists.txt
@@ -25,8 +25,7 @@ elseif(SELECTIVE_BUILD STREQUAL "ON")
 
     target_compile_definitions(${TARGET_NAME} INTERFACE SELECTIVE_BUILD)
 
-    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU"
-        OR CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU" OR OV_COMPILER_IS_CLANG)
         # After disabling a block of code, some variables might be unused.
         target_compile_options(${TARGET_NAME} INTERFACE
                                 -Wno-unused-function
diff --git a/thirdparty/onnx/CMakeLists.txt b/thirdparty/onnx/CMakeLists.txt
index 67ea852f1551c7..7826e944dd843c 100644
--- a/thirdparty/onnx/CMakeLists.txt
+++ b/thirdparty/onnx/CMakeLists.txt
@@ -21,7 +21,7 @@ macro(onnx_set_target_properties)
 
     if(CMAKE_CXX_COMPILER_ID STREQUAL "MSVC")
         target_compile_options(onnx PRIVATE /WX-)
-    elseif(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+    elseif(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
         target_compile_options(onnx PRIVATE -Wno-all)
         target_compile_options(onnx_proto PRIVATE -Wno-all -Wno-unused-variable)
     endif()
diff --git a/thirdparty/protobuf/CMakeLists.txt b/thirdparty/protobuf/CMakeLists.txt
index d5d8d5b477205f..c4d6fe26bc2af6 100644
--- a/thirdparty/protobuf/CMakeLists.txt
+++ b/thirdparty/protobuf/CMakeLists.txt
@@ -13,7 +13,7 @@ if(SUGGEST_OVERRIDE_SUPPORTED)
     set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wno-suggest-override")
 endif()
 
-if(CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+if(OV_COMPILER_IS_CLANG)
     set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wno-inconsistent-missing-override")
 endif()
 
@@ -58,7 +58,7 @@ else()
     set(Protobuf_LIBRARIES libprotobuf)
 endif()
 
-if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
     set(_proto_libs ${Protobuf_LIBRARIES})
     if(TARGET libprotoc)
         list(APPEND _proto_libs libprotoc)

From e7a00e9b311ee30a5dd430af04209713c964e4ec Mon Sep 17 00:00:00 2001
From: Elizaveta Lobanova <elizaveta.lobanova@intel.com>
Date: Wed, 21 Jul 2021 12:48:35 +0300
Subject: [PATCH 20/71] [GNA] Fix Transpose-Conv-Transpose pattern recognition
 for 2d convolution (#6715)

---
 .../src/gna_plugin/gna_graph_patterns.hpp     |  8 +-
 .../remove_permutations_NHWC_to_NCHW_pass.cpp | 74 ++++++++++---------
 2 files changed, 46 insertions(+), 36 deletions(-)

diff --git a/inference-engine/src/gna_plugin/gna_graph_patterns.hpp b/inference-engine/src/gna_plugin/gna_graph_patterns.hpp
index eed44b0ef35324..4c4ceb85d14802 100644
--- a/inference-engine/src/gna_plugin/gna_graph_patterns.hpp
+++ b/inference-engine/src/gna_plugin/gna_graph_patterns.hpp
@@ -65,9 +65,11 @@ inline std::pair<InferenceEngine::CNNLayerPtr, InferenceEngine::CNNLayerPtr> Fin
         if (parent->outData.size() != 1 || InferenceEngine::getInputTo(parent->outData[0]).size() != 1) {
             return std::make_pair(nullptr, nullptr);
         }
-        auto parent_dims = parent->outData[0]->getDims();
-        // Check if the previous layer has all dimensions except one to be equal to 1
-        if (std::count_if(std::begin(parent_dims), std::end(parent_dims), [](size_t dim) { return dim != 1; }) > 1) {
+        // Check if reshape is expected for this pattern:
+        // the previous layer has number of channels > 1 and one of height/width dimensions is also > 1
+        if (GetDataDimSize(parent->outData[0], InferenceEngine::DataDimName::C) != 1 &&
+            (GetDataDimSize(parent->outData[0], InferenceEngine::DataDimName::H) != 1 ||
+             GetDataDimSize(parent->outData[0], InferenceEngine::DataDimName::W) != 1)) {
             return std::make_pair(nullptr, nullptr);
         }
     }
diff --git a/inference-engine/tests/functional/plugin/gna/pass_tests/remove_permutations_NHWC_to_NCHW_pass.cpp b/inference-engine/tests/functional/plugin/gna/pass_tests/remove_permutations_NHWC_to_NCHW_pass.cpp
index 326d2cbb8ef949..dba170e8587e29 100644
--- a/inference-engine/tests/functional/plugin/gna/pass_tests/remove_permutations_NHWC_to_NCHW_pass.cpp
+++ b/inference-engine/tests/functional/plugin/gna/pass_tests/remove_permutations_NHWC_to_NCHW_pass.cpp
@@ -36,6 +36,11 @@ typedef std::tuple<
 
 namespace LayerTestsDefinitions {
 
+std::vector<size_t> GetKernelShape(size_t height, size_t width, size_t kernel_size) {
+    return (height == 1 ? std::vector<size_t>{1, kernel_size} :
+           (width == 1 ? std::vector<size_t>{kernel_size, 1} : std::vector<size_t>{kernel_size, kernel_size}));
+}
+
 class RemovePermutationsNHWCToNCHWPassTest : public testing::WithParamInterface<removePermutationsPassParams>,
                                              public LayerTestsUtils::LayerTestsCommon {
     public:
@@ -82,16 +87,15 @@ class RemovePermutationsNHWCToNCHWPassTest : public testing::WithParamInterface<
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 3, 1, 2 }));
 
             size_t num_out_channels = 12;
-            size_t kernel_size = 8;
-            std::vector<size_t> kernal_shape = (inputShape[1] == 1 ? std::vector<size_t>{1, kernel_size} : std::vector<size_t>{kernel_size, 1});
-            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
+            auto kernel_shape = GetKernelShape(inputShape[1], inputShape[2], 8);
+            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernel_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
                                                           ngraph::op::PadType::VALID, num_out_channels);
 
             auto permute2 = std::make_shared<ngraph::opset1::Transpose>(conv1,
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 2, 3, 1 }));
 
-            size_t out_width = (inputShape[2] - kernal_shape[1]) + 1;
-            size_t out_height = (inputShape[1] - kernal_shape[0]) + 1;
+            size_t out_width = (inputShape[2] - kernel_shape[1]) + 1;
+            size_t out_height = (inputShape[1] - kernel_shape[0]) + 1;
             std::vector<size_t> outFormShapes = { 1, out_width * out_height * num_out_channels };
             auto pattern2 = std::make_shared<ngraph::opset1::Constant>(ngraph::element::Type_t::i64, ngraph::Shape{ 2 }, outFormShapes);
             auto reshape2 = std::make_shared<ngraph::opset1::Reshape>(permute2, pattern2, false);
@@ -132,9 +136,8 @@ class RemovePermutationsNHWCToNCHWPass4DOutputTest : public testing::WithParamIn
         auto permute1 = std::make_shared<ngraph::opset1::Transpose>(params[0],
                              ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 3, 1, 2 }));
 
-        size_t kernal_size = 8;
-        std::vector<size_t> kernal_shape = (inputShape[1] == 1 ? std::vector<size_t>{1, kernal_size} : std::vector<size_t>{kernal_size, 1});
-        auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 }, ngraph::op::PadType::VALID, 12);
+        auto kernel_shape = GetKernelShape(inputShape[1], inputShape[2], 8);
+        auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernel_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 }, ngraph::op::PadType::VALID, 12);
 
         auto permute2 = std::make_shared<ngraph::opset1::Transpose>(conv1,
                              ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 2, 3, 1 }));
@@ -209,18 +212,18 @@ class RemovePermutationsWithPoolAndActTest : public testing::WithParamInterface<
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 3, 1, 2 }));
 
             size_t num_out_channels = 12;
-            size_t kernal_size = 8;
-            auto kernal_shape = (inputShape[1] == 1 ? std::vector<size_t>{1, kernal_size} : std::vector<size_t>{kernal_size, 1});
-            std::vector<float> filter_weights = CommonTestUtils::generate_float_numbers(num_out_channels * inputShape[3] * kernal_size,
+            auto kernel_shape = GetKernelShape(inputShape[1], inputShape[2], 8);
+            std::vector<float> filter_weights = CommonTestUtils::generate_float_numbers(num_out_channels * inputShape[3] *
+                                                                                        kernel_shape[0] * kernel_shape[1],
                                                                                         -0.2f, 0.2f);
-            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
+            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernel_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
                 ngraph::op::PadType::VALID, num_out_channels, false, filter_weights);
             auto pool_kernal_shape = (inputShape[1] == 1 ? std::vector<size_t>{1, 2} : std::vector<size_t>{2, 1});
             auto pool = ngraph::builder::makePooling(conv1, pool_kernal_shape, {0, 0}, {0, 0}, pool_kernal_shape, ngraph::op::RoundingType::FLOOR,
                                                      ngraph::op::PadType::VALID, false, ngraph::helpers::PoolingTypes::MAX);
 
-            size_t out_width = ((inputShape[2] - kernal_shape[1]) + 1) / pool_kernal_shape[1];
-            size_t out_height = ((inputShape[1] - kernal_shape[0]) + 1) / pool_kernal_shape[0];
+            size_t out_width = ((inputShape[2] - kernel_shape[1]) + 1) / pool_kernal_shape[1];
+            size_t out_height = ((inputShape[1] - kernel_shape[0]) + 1) / pool_kernal_shape[0];
 
             auto pool_output = pool;
             if (withActivation) {
@@ -299,21 +302,24 @@ class RemovePermutationsWithTwoConvTest : public testing::WithParamInterface<rem
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 3, 1, 2 }));
 
             size_t num_out_channels = 12;
-            size_t kernal_size = 8;
-            std::vector<size_t> kernal_shape = (inputShape[1] == 1 ? std::vector<size_t>{1, kernal_size} : std::vector<size_t>{kernal_size, 1});
-            std::vector<float> filter_weights_1 = CommonTestUtils::generate_float_numbers(num_out_channels * inputShape[3] * kernal_size,
+            size_t kernel_size = 8;
+            auto kernel_shape1 = GetKernelShape(inputShape[1], inputShape[2], kernel_size);
+            std::vector<float> filter_weights_1 = CommonTestUtils::generate_float_numbers(num_out_channels * inputShape[3] *
+                                                                                          kernel_shape1[0] * kernel_shape1[1],
                                                                                           0.0f, 0.5f);
-            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
+            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernel_shape1, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
                 ngraph::op::PadType::VALID, num_out_channels, false, filter_weights_1);
-            size_t out_width = ((inputShape[2] - kernal_shape[1]) + 1);
-            size_t out_height = ((inputShape[1] - kernal_shape[0]) + 1);
+            size_t out_width = conv1->get_output_shape(0).at(3);
+            size_t out_height = conv1->get_output_shape(0).at(2);
 
-            std::vector<float> filter_weights_2 = CommonTestUtils::generate_float_numbers(num_out_channels * num_out_channels * kernal_size,
+            std::vector<size_t> kernel_shape2 = (out_height == 1 ? std::vector<size_t>{1, kernel_size} : std::vector<size_t>{kernel_size, 1});
+            std::vector<float> filter_weights_2 = CommonTestUtils::generate_float_numbers(num_out_channels * num_out_channels *
+                                                                                          kernel_size,
                                                                                           -0.2f, 0.2f);
-            auto conv2 = ngraph::builder::makeConvolution(conv1, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
+            auto conv2 = ngraph::builder::makeConvolution(conv1, ngPrc, kernel_shape2, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
                 ngraph::op::PadType::VALID, num_out_channels, false, filter_weights_2);
-            out_width = ((out_width - kernal_shape[1]) + 1);
-            out_height = ((out_height - kernal_shape[0]) + 1);
+            out_width = conv2->get_output_shape(0).at(3);
+            out_height = conv2->get_output_shape(0).at(2);
 
             auto permute2 = std::make_shared<ngraph::opset1::Transpose>(conv2,
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 2, 3, 1 }));
@@ -391,11 +397,11 @@ class RemovePermutationsWithEltwiseTest : public testing::WithParamInterface<rem
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 3, 1, 2 }));
 
             size_t num_out_channels = 12;
-            size_t kernal_size = 8;
-            std::vector<size_t> kernal_shape = (inputShape[1] == 1 ? std::vector<size_t>{1, kernal_size} : std::vector<size_t>{kernal_size, 1});
-            std::vector<float> filter_weights_1 = CommonTestUtils::generate_float_numbers(num_out_channels * in_channels * kernal_size,
+            auto kernel_shape = GetKernelShape(inputShape[1], inputShape[2], 8);
+            std::vector<float> filter_weights_1 = CommonTestUtils::generate_float_numbers(num_out_channels * in_channels *
+                                                                                          kernel_shape[0] * kernel_shape[1],
                                                                                           -0.2f, 0.2f);
-            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
+            auto conv1 = ngraph::builder::makeConvolution(permute1, ngPrc, kernel_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
                 ngraph::op::PadType::VALID, num_out_channels, false, filter_weights_1);
 
             auto pattern2 = std::make_shared<ngraph::opset1::Constant>(ngraph::element::Type_t::i64, ngraph::Shape{ 4 }, inputShape);
@@ -403,9 +409,10 @@ class RemovePermutationsWithEltwiseTest : public testing::WithParamInterface<rem
             auto permute2 = std::make_shared<ngraph::opset1::Transpose>(reshape2,
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 3, 1, 2 }));
 
-            std::vector<float> filter_weights_2 = CommonTestUtils::generate_float_numbers(num_out_channels * in_channels * kernal_size,
+            std::vector<float> filter_weights_2 = CommonTestUtils::generate_float_numbers(num_out_channels * in_channels *
+                                                                                          kernel_shape[0] * kernel_shape[1],
                                                                                           -0.2f, 0.2f);
-            auto conv2 = ngraph::builder::makeConvolution(permute2, ngPrc, kernal_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
+            auto conv2 = ngraph::builder::makeConvolution(permute2, ngPrc, kernel_shape, { 1, 1 }, { 0, 0 }, { 0, 0 }, { 1, 1 },
                 ngraph::op::PadType::VALID, num_out_channels, false, filter_weights_2);
 
             auto add = std::make_shared<ngraph::opset1::Add>(conv1, conv2);
@@ -413,8 +420,8 @@ class RemovePermutationsWithEltwiseTest : public testing::WithParamInterface<rem
             auto permute3 = std::make_shared<ngraph::opset1::Transpose>(add,
                 ngraph::opset1::Constant::create(ngraph::element::i64, ngraph::Shape{ 4 }, { 0, 2, 3, 1 }));
 
-            size_t out_width = ((in_width - kernal_shape[1]) + 1);
-            size_t out_height = ((in_height - kernal_shape[0]) + 1);
+            size_t out_width = ((in_width - kernel_shape[1]) + 1);
+            size_t out_height = ((in_height - kernel_shape[0]) + 1);
             std::vector<size_t> outFormShapes = { 1, out_width * out_height * num_out_channels };
             auto pattern3 = std::make_shared<ngraph::opset1::Constant>(ngraph::element::Type_t::i64, ngraph::Shape{ 2 }, outFormShapes);
             auto reshape3 = std::make_shared<ngraph::opset1::Reshape>(permute3, pattern3, false);
@@ -468,7 +475,8 @@ class RemovePermutationsWithEltwiseTest : public testing::WithParamInterface<rem
         {1, 168, 1, 8},
         {1, 32, 1, 1},
         {1, 32, 1, 2},
-        {1, 32, 1, 8}
+        {1, 32, 1, 8},
+        {1, 16, 8, 1}
     };
 
     INSTANTIATE_TEST_SUITE_P(smoke_PermutationPass, RemovePermutationsNHWCToNCHWPassTest,

From 11875c6694adcdd20b8dadb7de199cfd38628b14 Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Wed, 21 Jul 2021 13:06:49 +0300
Subject: [PATCH 21/71] Fixed sanitizer (#6727)

---
 cmake/developer_package/compile_flags/os_flags.cmake | 1 -
 inference-engine/include/gpu/gpu_ocl_wrapper.hpp     | 2 +-
 2 files changed, 1 insertion(+), 2 deletions(-)

diff --git a/cmake/developer_package/compile_flags/os_flags.cmake b/cmake/developer_package/compile_flags/os_flags.cmake
index 7b5cc66d3e3434..868c3455d5daea 100644
--- a/cmake/developer_package/compile_flags/os_flags.cmake
+++ b/cmake/developer_package/compile_flags/os_flags.cmake
@@ -319,7 +319,6 @@ else()
     elseif(LINUX)
         set(CMAKE_SHARED_LINKER_FLAGS "${CMAKE_SHARED_LINKER_FLAGS} -Wl,--gc-sections -Wl,--exclude-libs,ALL")
         set(CMAKE_MODULE_LINKER_FLAGS "${CMAKE_MODULE_LINKER_FLAGS} -Wl,--gc-sections -Wl,--exclude-libs,ALL")
-        set(CMAKE_EXE_LINKER_FLAGS "${CMAKE_EXE_LINKER_FLAGS} -Wl,--gc-sections -Wl,--exclude-libs,ALL")
     endif()
 endif()
 
diff --git a/inference-engine/include/gpu/gpu_ocl_wrapper.hpp b/inference-engine/include/gpu/gpu_ocl_wrapper.hpp
index 85ca2521a76346..496f0974ad51e1 100644
--- a/inference-engine/include/gpu/gpu_ocl_wrapper.hpp
+++ b/inference-engine/include/gpu/gpu_ocl_wrapper.hpp
@@ -39,7 +39,7 @@
 # pragma GCC system_header
 #endif
 
-#include <CL/opencl.hpp>
+#include <CL/cl2.hpp>
 
 #ifdef __GNUC__
 # pragma GCC diagnostic pop

From ecb5499702aa5315f4bcc0cb87a7ab77533c222c Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Wed, 21 Jul 2021 13:56:55 +0300
Subject: [PATCH 22/71] Fixed build with protobuf-lite (#6730)

---
 thirdparty/CMakeLists.txt          | 2 +-
 thirdparty/protobuf/CMakeLists.txt | 2 ++
 2 files changed, 3 insertions(+), 1 deletion(-)

diff --git a/thirdparty/CMakeLists.txt b/thirdparty/CMakeLists.txt
index a65fdb2e56680d..d35947dca9e38b 100644
--- a/thirdparty/CMakeLists.txt
+++ b/thirdparty/CMakeLists.txt
@@ -158,7 +158,7 @@ if(NGRAPH_PDPD_FRONTEND_ENABLE OR NGRAPH_ONNX_IMPORT_ENABLE)
         if(NGRAPH_USE_SYSTEM_PROTOBUF)
             set(link_type INTERFACE)
         endif()
-        if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "^(Apple)?Clang$")
+        if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
             target_compile_options(${target} ${link_type} -Wno-undef)
         endif()
     endforeach()
diff --git a/thirdparty/protobuf/CMakeLists.txt b/thirdparty/protobuf/CMakeLists.txt
index c4d6fe26bc2af6..f3cec9914a16f5 100644
--- a/thirdparty/protobuf/CMakeLists.txt
+++ b/thirdparty/protobuf/CMakeLists.txt
@@ -63,6 +63,8 @@ if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
     if(TARGET libprotoc)
         list(APPEND _proto_libs libprotoc)
         target_compile_options(libprotoc PRIVATE -Wno-all -Wno-unused-variable)
+        # libprotobuf is always built for protoc
+        target_compile_options(libprotobuf PUBLIC -Wno-undef)
     endif()
     set_target_properties(${_proto_libs} PROPERTIES
         CXX_VISIBILITY_PRESET default

From fbd0d8beba2f82bea51754b1b9462605906609ea Mon Sep 17 00:00:00 2001
From: Mikhail Nosov <mikhail.nosov@intel.com>
Date: Wed, 21 Jul 2021 14:18:51 +0300
Subject: [PATCH 23/71] MO: ensure ngraph.frontend is installed (#6698)

MO: when finding IE/nGraph - add search path to beginning of PYTHONPATH, LD_LIBRARY_PATH
---
 model-optimizer/mo/utils/check_ie_bindings.py | 1 +
 model-optimizer/mo/utils/find_ie_version.py   | 6 +++---
 2 files changed, 4 insertions(+), 3 deletions(-)

diff --git a/model-optimizer/mo/utils/check_ie_bindings.py b/model-optimizer/mo/utils/check_ie_bindings.py
index dae7aeb9958b12..fd4732593c1601 100644
--- a/model-optimizer/mo/utils/check_ie_bindings.py
+++ b/model-optimizer/mo/utils/check_ie_bindings.py
@@ -58,6 +58,7 @@ def import_core_modules(silent: bool, path_to_module: str):
 
         import openvino  # pylint: disable=import-error,no-name-in-module
         import ngraph  # pylint: disable=import-error,no-name-in-module
+        import ngraph.frontend  # pylint: disable=import-error,no-name-in-module
 
         if silent:
             return True
diff --git a/model-optimizer/mo/utils/find_ie_version.py b/model-optimizer/mo/utils/find_ie_version.py
index 9251b713ac3cab..59fada431fe58a 100644
--- a/model-optimizer/mo/utils/find_ie_version.py
+++ b/model-optimizer/mo/utils/find_ie_version.py
@@ -26,10 +26,10 @@ def setup_env(module="", libs=[]):
     :param module: path to python module
     :param libs: list with paths to libraries
     """
-    os.environ[python_path_key] = os.pathsep.join([os.environ[python_path_key], module])
-    os.environ[lib_env_key] = os.pathsep.join([os.environ[lib_env_key], *libs])
+    os.environ[python_path_key] = os.pathsep.join([module, os.environ[python_path_key]])
+    os.environ[lib_env_key] = os.pathsep.join([*libs, os.environ[lib_env_key]])
     if not os.getenv("OV_FRONTEND_PATH"):
-        os.environ["OV_FRONTEND_PATH"] = os.pathsep.join([os.environ[lib_env_key], *libs])
+        os.environ["OV_FRONTEND_PATH"] = os.pathsep.join([*libs, os.environ[lib_env_key]])
 
 
 def reset_env():

From dba1fb9adc3cb6423b4a02b68f4e1170cc60d58d Mon Sep 17 00:00:00 2001
From: Jozef Daniecki <jozef.daniecki@intel.com>
Date: Wed, 21 Jul 2021 13:23:56 +0200
Subject: [PATCH 24/71] Revise specification for Select operation (#6488)

* Add types section and refactored input tesnsor description.

* Stylistic changes.

* Marked inputs as 'Required'.
---
 docs/ops/condition/Select_1.md | 17 +++++++++++------
 1 file changed, 11 insertions(+), 6 deletions(-)

diff --git a/docs/ops/condition/Select_1.md b/docs/ops/condition/Select_1.md
index 8f51624961078e..56e5fde8eab790 100644
--- a/docs/ops/condition/Select_1.md
+++ b/docs/ops/condition/Select_1.md
@@ -17,26 +17,31 @@
 
   * **Description**: specifies rules used for auto-broadcasting of input tensors.
   * **Range of values**:
-    * *none* - no auto-broadcasting is allowed, all input shapes should match
-    * *numpy* - numpy broadcasting rules, aligned with ONNX Broadcasting. Description is available in <a href="https://github.com/onnx/onnx/blob/master/docs/Broadcasting.md">ONNX docs</a>.
-  * **Type**: string
+    * *none* - no auto-broadcasting is allowed, all input shapes must match
+    * *numpy* - numpy broadcasting rules, description is available in [Broadcast Rules For Elementwise Operations](../broadcast_rules.md)
+    * *pdpd* - PaddlePaddle-style implicit broadcasting, description is available in [Broadcast Rules For Elementwise Operations](../broadcast_rules.md)
+  * **Type**: `string`
   * **Default value**: "numpy"
   * **Required**: *no*
 
 
 **Inputs**:
 
-* **1**: `cond` tensor with selection mask of type `boolean`. The tensor can be 0D.
+* **1**: `cond` - tensor of type *T_COND* and arbitrary shape with selection mask. **Required**.
 
-* **2**: `then` the tensor with elements to take where the corresponding element in `cond` is true. Arbitrary type that should match type of `else` input tensor.
+* **2**: `then` - tensor of type *T* and arbitrary shape with elements to take where the corresponding element in `cond` is `true`. **Required**.
 
-* **3**: `else` the tensor with elements to take where the corresponding element in `cond` is false. Arbitrary type that should match type of `then` input tensor.
+* **3**: `else` - tensor of type *T* and arbitrary shape with elements to take where the corresponding element in `cond` is `false`. **Required**.
 
 
 **Outputs**:
 
 * **1**: blended output tensor that is tailored from values of inputs tensors `then` and `else` based on `cond` and broadcasting rules. It has the same type of elements as `then` and `else`.
 
+**Types**
+
+* *T_COND*: `boolean` type.
+* *T*: any supported numeric type.
 
 **Example**
 

From 253ff51e691ec9c83562ad9c34de37f221de2540 Mon Sep 17 00:00:00 2001
From: iliya mironov <iliya.mironov@intel.com>
Date: Wed, 21 Jul 2021 14:33:43 +0300
Subject: [PATCH 25/71] Remove split-concat subgraph before pad op (#6506)

* Remove split-concat subgraph before pad op

* Fix unit tests

* Add unit tests for PadNormalizer

* Fix according to review

* add propagation up for Pad

* Fix value propogation

* Remove PadMormolizer

* Refactoring according to review
---
 .../extensions/back/ReverseInputChannels.py   | 61 +++++++++++++++++++
 .../extensions/front/tf/pad_tf_to_pad.py      |  6 --
 .../back/ReverseInputChannels_test.py         | 47 +++++++++++++-
 .../extensions/front/tf/pad_tf_to_pad_test.py |  4 +-
 4 files changed, 107 insertions(+), 11 deletions(-)

diff --git a/model-optimizer/extensions/back/ReverseInputChannels.py b/model-optimizer/extensions/back/ReverseInputChannels.py
index e8dd267d460422..987347ef6c1b11 100644
--- a/model-optimizer/extensions/back/ReverseInputChannels.py
+++ b/model-optimizer/extensions/back/ReverseInputChannels.py
@@ -94,8 +94,38 @@ class ReverseChannelsPropagationDown(BackReplacementPattern):
 
         'Shape': lambda node, rc: ReverseChannelsPropagationDown.pass_rc_through_shape(node, rc),
         'ShapeOf': lambda node, rc: ReverseChannelsPropagationDown.pass_rc_through_shape(node, rc),
+
+        'Pad': lambda node, rc: ReverseChannelsPropagationDown.pass_rc_through(node, rc),
     }
 
+    @staticmethod
+    def pass_rc_through(node: Node, reverse_channels: Node):
+        r"""
+        BEFORE                          AFTER
+
+          previous_op
+              |
+        ReverseChannels  previous_op     previous_op  previous_op
+                     \     /                      \     /
+                       Node                         Node
+                                                     |
+                                              ReverseChannels
+
+        returns boolean value whatever we should continue propagating current ReverseChannels operation down or not
+        """
+        # detaching reverse_channels node from the graph
+        if reverse_channels.is_in_port_connected(0) and reverse_channels.is_out_port_connected(0)\
+                and node.is_out_port_connected(0):
+            reverse_channels.out_port(0).get_connection().set_source(
+                reverse_channels.in_port(0).get_connection().get_source())
+            reverse_channels.in_port(0).disconnect()
+
+            node.out_port(0).get_connection().set_source(reverse_channels.out_port(0))
+            node.out_port(0).disconnect()
+            node.out_port(0).connect(reverse_channels.in_port(0))
+            return True
+        return False
+
     @staticmethod
     def pass_rc_through_conv(node, reverse_channels):
         r"""
@@ -265,8 +295,39 @@ class ReverseChannelsPropagationUp(BackReplacementPattern):
         'Subtract': lambda node, rc: ReverseChannelsPropagationUp.lift_up_through_eltwise(node, rc),
         'Pow': lambda node, rc: ReverseChannelsPropagationUp.lift_up_through_eltwise(node, rc),
         'Convert': lambda node, rc: ReverseChannelsPropagationUp.lift_up_through_eltwise(node, rc),
+
+        'Pad': lambda node, rc: ReverseChannelsPropagationUp.lift_up_through(node, rc),
     }
 
+    @staticmethod
+    def lift_up_through(node: Node, reverse_channels: Node):
+        r"""
+        BEFORE                       AFTER
+
+                                     previous_op
+                                          \
+        previous_op  previous_op       ReverseChannels  previous_op
+                 \     /                           \     /
+                   Node                             Node
+                    |                                |
+              ReverseChannels                      next_op
+                    |
+                 next_op
+
+        returns boolean value whatever we should continue propagating current ReverseChannels operation up or not
+        """
+        if node.is_in_port_connected(0):
+            node_input_port_0 = node.in_port(0)
+            reverse_channels_out_npde = reverse_channels.out_port(0).get_connection().get_destination().node
+            reverse_channels.out_port(0).disconnect()
+
+            src = node_input_port_0.get_connection().get_source()
+            node_input_port_0.get_connection().set_source(reverse_channels.out_port(0))
+            src.connect(reverse_channels.in_port(0))
+            node.out_port(0).get_connection().set_destination(reverse_channels_out_npde.in_port(0))
+            return True
+        return False
+
     @staticmethod
     def lift_up_through_eltwise(node: Node, reverse_channels: Node):
         r"""
diff --git a/model-optimizer/extensions/front/tf/pad_tf_to_pad.py b/model-optimizer/extensions/front/tf/pad_tf_to_pad.py
index 42a8de27cf2840..fb423dab124ba7 100644
--- a/model-optimizer/extensions/front/tf/pad_tf_to_pad.py
+++ b/model-optimizer/extensions/front/tf/pad_tf_to_pad.py
@@ -34,12 +34,6 @@ def find_and_replace_pattern(self, graph: Graph):
                 # the input with fill value is an optional third input in TF
                 if not tfpad.in_port(2).disconnected():
                     tfpad.in_port(2).get_connection().set_destination(new_pad.in_port(3))
-                else:
-                    # create Constant node of proper data type (equal to the data type of the Pad first input)
-                    convert_pad_value = create_op_with_const_inputs(graph, ConvertLike, {0: 0.0},
-                                                                    {'name': original_name + '/pad_value_convert'})
-                    convert_pad_value.in_port(1).connect(new_pad.in_port(0).get_source())
-                    new_pad.in_port(3).connect(convert_pad_value.out_port(0))
 
             # convert TF representation of the pads as [N, 2] to MO representation: [N] and [N]
             transposed_pads = create_op_with_const_inputs(graph, Transpose, {1: int64_array([1, 0])})
diff --git a/model-optimizer/unit_tests/extensions/back/ReverseInputChannels_test.py b/model-optimizer/unit_tests/extensions/back/ReverseInputChannels_test.py
index 057f84010e3247..8ac90c8708fdaf 100644
--- a/model-optimizer/unit_tests/extensions/back/ReverseInputChannels_test.py
+++ b/model-optimizer/unit_tests/extensions/back/ReverseInputChannels_test.py
@@ -3,9 +3,10 @@
 
 import unittest
 
-from extensions.back.ReverseInputChannels import ReverseChannelsPropagationUp
+from extensions.back.ReverseInputChannels import ReverseChannelsPropagationUp, ReverseChannelsPropagationDown
 from mo.graph.graph import Node, Graph
-from unit_tests.utils.graph import build_graph, result, connect, regular_op_with_shaped_data
+from unit_tests.utils.graph import build_graph, result, connect, regular_op_with_shaped_data, valued_const_with_data
+from mo.front.common.partial_infer.utils import int64_array, float32_array
 
 nodes = {
     **regular_op_with_shaped_data('placeholder1', [1, 3, 10, 10], {'type': 'Parameter'}),
@@ -14,10 +15,25 @@
     **regular_op_with_shaped_data('mul', [1, 3, 10, 10], {'type': 'Multiply'}),
     **regular_op_with_shaped_data('reverse_channels', [1, 3, 10, 10], {'type': 'ReverseChannels', 'axis': 1}),
 
+
+    **regular_op_with_shaped_data('pad', [1, 3, 10, 10], {'type': 'Pad'}),
+
     **result('result'),
 }
 
 
+nodes2 = {
+    **regular_op_with_shaped_data('placeholder', [1, 3, 10, 10], {'type': 'Parameter'}),
+
+    **valued_const_with_data('mul_const', float32_array([-127.5, -127.5, -127.5])),
+    **regular_op_with_shaped_data('mul', [1, 3, 10, 10], {'type': 'Multiply'}),
+    **valued_const_with_data('pad_const_1', int64_array([0, 0, 0, 0])),
+    **valued_const_with_data('pad_const_2', int64_array([0, 0, 1, 1])),
+    **regular_op_with_shaped_data('pad', [1, 3, 10, 10], {'type': 'Pad'}),
+    **regular_op_with_shaped_data('reverse_channels', [1, 3, 10, 10], {'type': 'ReverseChannels', 'axis': 1}),
+    **result('result'),
+}
+
 class ReverseInputChannelsTest(unittest.TestCase):
     def check_graph_attrs(self, graph: Graph, parameter_node_names: list):
         for node in graph.get_op_nodes():
@@ -47,3 +63,30 @@ def test_lift_up_through_eltwise(self):
 
         ReverseChannelsPropagationUp.lift_up_through_eltwise(node, reverse_channels)
         self.check_graph_attrs(graph, ['placeholder1', 'placeholder2'])
+
+    def test_lift_up_through(self):
+        graph = build_graph(nodes2, [*connect('placeholder', '0:mul'), *connect('mul_const', '1:mul'),
+                                     *connect('mul', '0:pad'), *connect('pad_const_1', '1:pad'),
+                                     *connect('pad_const_2', '2:pad'), *connect('pad', 'reverse_channels'),
+                                     *connect('reverse_channels', 'result')])
+        self.set_graph_attrs(graph, ['placeholder'])
+
+        node = Node(graph, 'pad')
+        reverse_channels = Node(graph, 'reverse_channels')
+
+        ReverseChannelsPropagationUp.lift_up_through(node, reverse_channels)
+        self.check_graph_attrs(graph, ['placeholder'])
+
+
+    def test_pass_rc_through(self):
+        graph = build_graph(nodes2, [*connect('placeholder', '0:mul'), *connect('mul_const', '1:mul'),
+                                     *connect('mul', 'reverse_channels'),  *connect('reverse_channels', '0:pad'),
+                                     *connect('pad_const_1', '1:pad'), *connect('pad_const_2', '2:pad'),
+                                     *connect('pad', 'result')])
+        self.set_graph_attrs(graph, ['placeholder'])
+
+        node = Node(graph, 'pad')
+        reverse_channels = Node(graph, 'reverse_channels')
+
+        ReverseChannelsPropagationDown.pass_rc_through(node, reverse_channels)
+        self.check_graph_attrs(graph, ['placeholder'])
diff --git a/model-optimizer/unit_tests/extensions/front/tf/pad_tf_to_pad_test.py b/model-optimizer/unit_tests/extensions/front/tf/pad_tf_to_pad_test.py
index a8201d44917b76..e9e47cd2ac0d15 100644
--- a/model-optimizer/unit_tests/extensions/front/tf/pad_tf_to_pad_test.py
+++ b/model-optimizer/unit_tests/extensions/front/tf/pad_tf_to_pad_test.py
@@ -74,9 +74,7 @@ def test_2_inputs(self):
                             {}, nodes_with_edges_only=True)
         graph.get_op_nodes(op='TFPad')[0].add_input_port(2)
 
-        graph_ref = build_graph(nodes_attributes, common_edges + [('pad_fill', 'convert_like', {'in': 0, 'out': 0}),
-                                                                  ('placeholder', 'convert_like', {'in': 1, 'out': 0}),
-                                                                  ('convert_like', 'pad', {'in': 3, 'out': 0})],
+        graph_ref = build_graph(nodes_attributes, common_edges,
                                 {}, nodes_with_edges_only=True)
         self._run_test(graph, graph_ref)
 

From a3bf106b4850ed2888f9ac5b0f0688f5608cdc97 Mon Sep 17 00:00:00 2001
From: iliya mironov <iliya.mironov@intel.com>
Date: Wed, 21 Jul 2021 14:59:14 +0300
Subject: [PATCH 26/71] Add retinanet convert doc (#6342)

* Add retinanet convert doc

* Fix doc

* Update doc

* Fix doc mistakes

* Update doc

* Update doc according to review

* Split some text to several lines

* Update ie_docs

* Update title for ie_docs

* Change tabs to space
---
 .../Convert_RetinaNet_From_Tensorflow.md          | 15 +++++++++++++++
 docs/doxygen/ie_docs.xml                          |  1 +
 2 files changed, 16 insertions(+)
 create mode 100644 docs/MO_DG/prepare_model/convert_model/tf_specific/Convert_RetinaNet_From_Tensorflow.md

diff --git a/docs/MO_DG/prepare_model/convert_model/tf_specific/Convert_RetinaNet_From_Tensorflow.md b/docs/MO_DG/prepare_model/convert_model/tf_specific/Convert_RetinaNet_From_Tensorflow.md
new file mode 100644
index 00000000000000..f02d50499fd857
--- /dev/null
+++ b/docs/MO_DG/prepare_model/convert_model/tf_specific/Convert_RetinaNet_From_Tensorflow.md
@@ -0,0 +1,15 @@
+# Converting RetinaNet Model from TensorFlow* to the Intermediate Representation {#openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_RetinaNet_From_Tensorflow}
+
+This tutorial explains how to convert RetinaNet model to the Intermediate Representation (IR).
+
+[Public RetinaNet model](https://github.com/fizyr/keras-retinanet) does not contain pretrained TensorFlow\* weights. 
+To convert this model to the TensorFlow\* format, you can use [Reproduce Keras* to TensorFlow* Conversion tutorial](https://docs.openvinotoolkit.org/latest/omz_models_model_retinanet_tf.html).
+
+After you convert the model to TensorFlow* format, run the Model Optimizer command below:
+```sh
+python mo.py --input "input_1[1 1333 1333 3]" --input_model retinanet_resnet50_coco_best_v2.1.0.pb --data_type FP32 --transformations_config ./extensions/front/tf/retinanet.json
+```
+
+Where `transformations_config` command-line parameter specifies the configuration json file containing model conversion hints for the Model Optimizer.
+The json file contains some parameters that need to be changed if you train the model yourself. It also contains information on how to match endpoints
+to replace the subgraph nodes. After the model is converted to IR, the output nodes will be replaced with DetectionOutput layer.
diff --git a/docs/doxygen/ie_docs.xml b/docs/doxygen/ie_docs.xml
index 19a87a1e11e97c..7ed795ea5c3720 100644
--- a/docs/doxygen/ie_docs.xml
+++ b/docs/doxygen/ie_docs.xml
@@ -34,6 +34,7 @@ limitations under the License.
                             <tab type="user" title="Converting DeepSpeech Model from TensorFlow" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_DeepSpeech_From_Tensorflow"/>
                             <tab type="user" title="Converting Language Model on One Billion Word Benchmark from TensorFlow" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_lm_1b_From_Tensorflow"/>
                             <tab type="user" title="Converting TensorFlow* Object Detection API Models" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_Object_Detection_API_Models"/>
+                            <tab type="user" title="Converting RetinaNet Model from TensorFlow" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_RetinaNet_From_Tensorflow"/>
                             <tab type="user" title="Converting TensorFlow*-Slim Image Classification Model Library Models" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_Slim_Library_Models"/>
                             <tab type="user" title="Converting CRNN Model from TensorFlow" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_CRNN_From_Tensorflow"/>
                             <tab type="user" title="Converting GNMT from TensorFlow" url="@ref openvino_docs_MO_DG_prepare_model_convert_model_tf_specific_Convert_GNMT_From_Tensorflow"/>

From 37b46de1643a2ba6c3b6a076f81d0a47115ede7e Mon Sep 17 00:00:00 2001
From: Eugeny Volosenkov <eugeny.volosenkov@intel.com>
Date: Wed, 21 Jul 2021 15:52:37 +0300
Subject: [PATCH 27/71] If spec (#6296)

* Add If specification

* Fix spec

* Fix doc

* Fix doc

* Fix Description

* Add detaile description

* Fix IR

* Fix IR

* Fix IR

* Fix IR

* fix doc

* fix doc

* Change internal network to subgraph

* move to condition dir

* Change opset in IR

* Fix comments

* Fix comments

* Fix comments

* Update to master

* fix comments

* fix ci
---
 docs/doxygen/ie_docs.xml   |   1 +
 docs/ops/condition/If_8.md | 226 +++++++++++++++++++++++++++++++++++++
 docs/ops/opset8.md         |   1 +
 3 files changed, 228 insertions(+)
 create mode 100644 docs/ops/condition/If_8.md

diff --git a/docs/doxygen/ie_docs.xml b/docs/doxygen/ie_docs.xml
index 7ed795ea5c3720..184c2ea11ecba6 100644
--- a/docs/doxygen/ie_docs.xml
+++ b/docs/doxygen/ie_docs.xml
@@ -177,6 +177,7 @@ limitations under the License.
                 <tab type="user" title="HSigmoid-5" url="@ref openvino_docs_ops_activation_HSigmoid_5"/>
                 <tab type="user" title="HSwish-4" url="@ref openvino_docs_ops_activation_HSwish_4"/>
                 <tab type="user" title="IDFT-7" url="@ref openvino_docs_ops_signals_IDFT_7"/>
+                <tab type="user" title="If-8" url="@ref openvino_docs_ops_condition_If_8"/>
                 <tab type="user" title="Interpolate-1" url="@ref openvino_docs_ops_image_Interpolate_1"/>
                 <tab type="user" title="Interpolate-4" url="@ref openvino_docs_ops_image_Interpolate_4"/>
                 <tab type="user" title="LRN-1" url="@ref openvino_docs_ops_normalization_LRN_1"/>
diff --git a/docs/ops/condition/If_8.md b/docs/ops/condition/If_8.md
new file mode 100644
index 00000000000000..7de2449b1eada1
--- /dev/null
+++ b/docs/ops/condition/If_8.md
@@ -0,0 +1,226 @@
+## If <a name="If"></a> {#openvino_docs_ops_infrastructure_If_8}
+
+**Versioned name**: *If-8*
+
+**Category**: Infrastructure
+
+**Short description**: *If* operation contains two internal networks(subgraphs) such as `then_body` and `else_body`, 
+and performs one of them depending on `cond` value. If `cond` is  `True`, `then_body` is executed. If `cond` is  `False`, 
+the operation executes the `else_body` subgraph. 
+
+**Detailed description**
+
+*If* must not contain empty subgraphs. Each of them must have at least one operation `Result`. 
+Also the number of outputs from *If* always must be greater than zero and equal to the number of outputs from each subgraph.
+
+**If attributes**:
+
+* **Subgraphs**:
+
+    `then_body`/`else_body` are subgraphs that are executed depending on the `cond` value. 
+    The subgraph is described operation by operation as a typical IR network. 
+    The subgraph has inputs (`Parameter` operations) and outputs (`Result` operations).
+    
+    * **Subgraph's inputs** - inputs to the subgraph which associated with *If* inputs via *port_map*. 
+    The subgraph can have any number of inputs (even zero).
+    
+    * **Subgraph's outputs** - outputs from the subgraph which associated with *If* outputs via *port_map*.
+    The subgraph must contain at least one output. Each *If* output is associated with one output from the subgraph. 
+    Therefore the number of `then_body` outputs is equal to the number of outputs from *If* and 
+    the number of `else_body` outputs.
+    The type of the subgraph output and the type of the associated output from *If* must be equal.
+    
+
+* **Port maps**:
+    
+    *port_map* is a set of rules to map input or output data tensors of *If* operation onto the subgraph data tensors. 
+    The `port_map` entries can be `input` and `output`. Each entry describes a corresponding mapping rule. 
+    *If* has two *port_maps*: `then_port_map` for `then_body` and `else_port_map` for `else_body`.
+
+    * **Port map attributes**:
+
+        * *external_port_id*
+            * **Description**: *external_port_id* is a port ID of *If* operation.
+            * **Range of values**: IDs of the *If* inputs and outputs
+            * **Type**: `unsigned int`
+            * **Default value**: None
+            * **Required**: *yes*
+
+        * *internal_layer_id*
+
+            * **Description**: *internal_layer_id* is a `Parameter` or `Result` operation ID inside 
+            the subgraph to map to.
+            * **Range of values**: IDs of the `Parameter` or `Result` operations in the subgraph
+            * **Type**: `unsigned int`
+            * **Default value**: None
+            * **Required**: *yes* 
+
+**If Inputs**
+
+
+* **cond**: A scalar or 1D tensor with 1 element of `boolean` type specifying which subgraph to execute. 
+`True` value means to execute the `then_body`, `False` - `else_body`. *Required*.
+
+* **Multiple other inputs**: Tensors of different types and shapes. *Optional*.
+
+**If Outputs**
+
+* **Multiple outputs**: Results of execution of one of the subgraph. Tensors of any type and shape.
+
+
+**Body Inputs**
+
+* **Multiple inputs**: Tensors of different types and shapes. *Optional*.
+
+
+**Body Outputs**
+
+* **Multiple outputs**: Results of execution of the subgraph. Tensors of any type and shape.
+
+
+**Examples**
+
+*Example 1: a typical If structure*
+```xml
+    <layer id="6" name="if/cond" type="If" version="opset8">
+        <input>
+            <port id="0"/>
+            <port id="1">
+                <dim>2</dim>
+                <dim>4</dim>
+            </port>
+            <port id="2">
+                <dim>2</dim>
+                <dim>4</dim>
+            </port>
+            <port id="3">
+                <dim>2</dim>
+                <dim>4</dim>
+            </port>
+        </input>
+        <output>
+            <port id="4" names="if/cond/Identity:0,if/cond:0" precision="FP32">
+                <dim>2</dim>
+                <dim>4</dim>
+            </port>
+        </output>
+        <then_port_map>
+            <input external_port_id="1" internal_layer_id="0"/>
+            <input external_port_id="2" internal_layer_id="1"/>
+            <output external_port_id="0" internal_layer_id="3"/>
+        </then_port_map>
+        <else_port_map>
+            <input external_port_id="1" internal_layer_id="0"/>
+            <input external_port_id="3" internal_layer_id="1"/>
+            <output external_port_id="0" internal_layer_id="3"/>
+        </else_port_map>
+        <then_body>
+            <layers>
+                <layer id="0" name="add_x" type="Parameter" version="opset1">
+                    <data element_type="f32" shape="2,4"/>
+                    <output>
+                        <port id="0" names="add_x:0" precision="FP32">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </output>
+                </layer>
+                <layer id="1" name="add_z" type="Parameter" version="opset1">
+                    <data element_type="f32" shape="2,4"/>
+                    <output>
+                        <port id="0" names="add_z:0" precision="FP32">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </output>
+                </layer>
+                <layer id="2" name="Add" type="Add" version="opset1">
+                    <data auto_broadcast="numpy"/>
+                    <input>
+                        <port id="0">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                        <port id="1">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </input>
+                    <output>
+                        <port id="2" names="Add:0" precision="FP32">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </output>
+                </layer>
+                <layer id="3" name="Identity/sink_port_0" type="Result" version="opset1">
+                    <input>
+                        <port id="0">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </input>
+                </layer>
+            </layers>
+            <edges>
+                <edge from-layer="0" from-port="0" to-layer="2" to-port="0"/>
+                <edge from-layer="1" from-port="0" to-layer="2" to-port="1"/>
+                <edge from-layer="2" from-port="2" to-layer="3" to-port="0"/>
+            </edges>
+        </then_body>
+        <else_body>
+            <layers>
+                <layer id="0" name="add_x" type="Parameter" version="opset1">
+                    <data element_type="f32" shape="2,4"/>
+                    <output>
+                        <port id="0" names="add_x:0" precision="FP32">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </output>
+                </layer>
+                <layer id="1" name="add_w" type="Parameter" version="opset1">
+                    <data element_type="f32" shape="2,4"/>
+                    <output>
+                        <port id="0" names="add_w:0" precision="FP32">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </output>
+                </layer>
+                <layer id="2" name="Add" type="Add" version="opset1">
+                    <data auto_broadcast="numpy"/>
+                    <input>
+                        <port id="0">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                        <port id="1">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </input>
+                    <output>
+                        <port id="2" names="Add:0" precision="FP32">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </output>
+                </layer>
+                <layer id="3" name="Identity/sink_port_0" type="Result" version="opset1">
+                    <input>
+                        <port id="0">
+                            <dim>2</dim>
+                            <dim>4</dim>
+                        </port>
+                    </input>
+                </layer>
+            </layers>
+            <edges>
+                <edge from-layer="0" from-port="0" to-layer="2" to-port="0"/>
+                <edge from-layer="1" from-port="0" to-layer="2" to-port="1"/>
+                <edge from-layer="2" from-port="2" to-layer="3" to-port="0"/>
+            </edges>
+        </else_body>
+    </layer>
+```
diff --git a/docs/ops/opset8.md b/docs/ops/opset8.md
index 02e97eab4e42f6..42d815e7c854ef 100644
--- a/docs/ops/opset8.md
+++ b/docs/ops/opset8.md
@@ -79,6 +79,7 @@ declared in `namespace opset8`.
 * [HSigmoid](activation/HSigmoid_5.md)
 * [HSwish](activation/HSwish_4.md)
 * [IDFT](signals/IDFT_7.md)
+* [If](condition/If_8.md)
 * [Interpolate](image/Interpolate_4.md)
 * [Less](comparison/Less_1.md)
 * [LessEqual](comparison/LessEqual_1.md)

From 92fdda500494a7e05f46041f30dd42573c279227 Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Wed, 21 Jul 2021 17:33:36 +0300
Subject: [PATCH 28/71] Removed WAs from CI (#6706)

* Removed WAs from CI

* Updated DM configs; added exec rights

* Fix for cmake 3.21.x

* Removed a lot -Wno-* compile options
---
 .ci/azure/mac.yml | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/.ci/azure/mac.yml b/.ci/azure/mac.yml
index 04d4c16ea23344..90fc812bbaa36c 100644
--- a/.ci/azure/mac.yml
+++ b/.ci/azure/mac.yml
@@ -87,9 +87,6 @@ jobs:
       export PATH="/usr/local/opt/cython/bin:$PATH"
       export CC=gcc
       export CXX=g++
-      # Disable errors with Ninja
-      export CXXFLAGS="-Wno-error=unused-command-line-argument"
-      export CFLAGS="-Wno-error=unused-command-line-argument"
       cmake -GNinja -DVERBOSE_BUILD=ON -DCMAKE_BUILD_TYPE=$(BUILD_TYPE) -DENABLE_PYTHON=ON -DENABLE_TESTS=ON -DENABLE_STRICT_DEPENDENCIES=OFF -DIE_EXTRA_MODULES=$(OPENVINO_CONTRIB_REPO_DIR)/modules $(REPO_DIR)
     workingDirectory: $(BUILD_DIR)
     displayName: 'CMake'

From a3825ba1a5254ef55893358dc8295df93edf0680 Mon Sep 17 00:00:00 2001
From: Evgenya Stepyreva <evgenya.stepyreva@intel.com>
Date: Wed, 21 Jul 2021 18:59:59 +0300
Subject: [PATCH 29/71] Zero point optimization (#6683)

* Zero point optimization

* Expand the equality to zero criteria
---
 .../back/compress_quantized_weights.py        | 49 ++++++++++++-------
 .../back/compress_quantized_weights_test.py   | 34 ++++++++++++-
 2 files changed, 63 insertions(+), 20 deletions(-)

diff --git a/model-optimizer/extensions/back/compress_quantized_weights.py b/model-optimizer/extensions/back/compress_quantized_weights.py
index 62799acc1d1c39..98fbd57f4fd7b2 100644
--- a/model-optimizer/extensions/back/compress_quantized_weights.py
+++ b/model-optimizer/extensions/back/compress_quantized_weights.py
@@ -6,7 +6,8 @@
 import numpy as np
 
 from extensions.ops.Cast import Cast
-from extensions.ops.elementwise import Sub, Div, Mul, Negative
+from extensions.ops.elementwise import Sub, Div, Mul, Negative, Equal
+from extensions.ops.select import Select
 from mo.back.replacement import BackReplacementPattern
 from mo.graph.graph import Graph, Node
 from mo.middle.passes.convert_data_type import data_type_str_to_np, np_data_type_to_destination_type, packed_I4
@@ -70,15 +71,7 @@ class CompressQuantizeWeights(BackReplacementPattern):
             scale = (output_high - output_low) / (input_high - input_low)
                 WARNING: division by zero imposes restriction -- input_high can not be equal to input_low
             zero_point = input_low - output_low / scale
-
-    TODO: steps 5 and 6 are NOT IMPLEMENTED YET
-    TODO: DOES LPT NEED IT???
-    Step 5: Having zero_point == 0 is really beneficial for performance, so we try to fuse Subtract up to the Constant.
-        It is not always possible because of the quantized_dtype possible range of values.
-
-    Step 6: (Optional) From the nature of Subtract and Multiply operations they may be optimized out in cases:
-            zero_point == 0
-            scale == 1
+            NOTE: if scale == 0 than zero_point is equal to zero too (achieved through Select operation)
 
     BENEFITS:
         Such constant data packing reduces IR size (.bin file size)
@@ -186,14 +179,24 @@ def dequantize_data(fake_quantize: Node, dst_type: type, quantized_type: type) -
         descaled_output_low.in_port(0).connect(out_low)
         descaled_output_low.in_port(1).connect(scale.out_port(0))
 
-        shift = Sub(graph, {'name': name + '/zero_point'}).create_node()
+        shift = Sub(graph, {'name': name + '/shift'}).create_node()
         shift.in_port(0).connect(in_low)
         shift.in_port(1).connect(descaled_output_low.out_port(0))
 
+        zero = Const(graph, {'name': name + '/zero', 'value': np.array(0, dtype=dst_type)}).create_node()
+        scale_eq_zero = Equal(graph, {'name': name + '/scale_eq_zero'}).create_node()
+        scale_eq_zero.in_port(0).connect(scale.out_port(0))
+        scale_eq_zero.in_port(1).connect(zero.out_port(0))
+
+        zero_point = Select(graph, {'name': name + '/zero_point'}).create_node()
+        zero_point.in_port(0).connect(scale_eq_zero.out_port(0))
+        zero_point.in_port(1).connect(zero.out_port(0))
+        zero_point.in_port(2).connect(shift.out_port(0))
+
         # DeQuantize(x) == Mul(Sub(x, zero_point), scale)
         sub_zp = Sub(graph, {'name': name + '/minus_zp'}).create_node()
         sub_zp.in_port(0).connect(dequantizing_cast.out_port(0))
-        sub_zp.in_port(1).connect(shift.out_port(0))
+        sub_zp.in_port(1).connect(zero_point.out_port(0))
 
         mul_scale = Mul(graph, {'name': name + '/mulpiply_by_scale'}).create_node()
         mul_scale.in_port(0).connect(sub_zp.out_port(0))
@@ -221,6 +224,12 @@ def replace_pattern(self, graph: Graph, match: Dict[str, Node]):
 
 
 class ZeroPointOptimizer(BackReplacementPattern):
+    r"""
+    Step 1: Having zero_point == 0 is really beneficial for performance, so we try to fuse Subtract up to the Constant.
+        It is not always possible because of the quantized_dtype possible range of values.
+
+    Step 2: From the nature of Subtract operation it may be optimized out if zero_point == 0
+    """
     enabled = True
     force_clean_up = True
 
@@ -249,16 +258,18 @@ def pattern(self):
         )
 
     def replace_pattern(self, graph: Graph, match: Dict[str, Node]):
+        zero_point = match['const_zp'].out_port(0).data.get_value()
+        assert zero_point is not None
+        convert = match['convert']
         sub = match['sub']
-        zero_point = sub.in_port(1).data.get_value()
-        if zero_point is None or np.allclose(zero_point, 0):
+        if np.allclose(zero_point, 0):
+            sub.out_port(0).get_connection().set_source(convert.out_port(0))
             return
 
-        convert = match['convert']
-        dst_type = convert.dst_type
-        weights = convert.in_port(0).data.get_value()
+        weights = match['const'].out_port(0).data.get_value()
         if weights is None or weights.dtype != np.int8:
             return
+        dst_type = convert.dst_type
 
         int8_zero_point = np.round(zero_point).astype(np.int8)
         adj_zero_point = (zero_point - int8_zero_point).astype(dst_type)
@@ -266,8 +277,8 @@ def replace_pattern(self, graph: Graph, match: Dict[str, Node]):
         original = weights.astype(dst_type) - zero_point
         transformed = (weights - int8_zero_point).astype(np.int8) - adj_zero_point
 
-        if not np.allclose(original, transformed) or not np.allclose(adj_zero_point, 0):
+        if not np.allclose(original, transformed) or not np.allclose(adj_zero_point, 0, atol=1.e-04):
             return
 
         match['const_d']['value'] = (weights - int8_zero_point).astype(np.int8)
-        match['const_zp_d']['value'] = np.zeros(adj_zero_point.shape, dst_type)
+        sub.out_port(0).get_connection().set_source(convert.out_port(0))
diff --git a/model-optimizer/unit_tests/extensions/back/compress_quantized_weights_test.py b/model-optimizer/unit_tests/extensions/back/compress_quantized_weights_test.py
index 5e4aa87b525883..45d977beb55da0 100644
--- a/model-optimizer/unit_tests/extensions/back/compress_quantized_weights_test.py
+++ b/model-optimizer/unit_tests/extensions/back/compress_quantized_weights_test.py
@@ -254,10 +254,42 @@ class ZeroPointOptimizerTestClass(unittest.TestCase):
     @generate(*[
         ([-10, 7], [-1], [-9, 8], [0]),
         ([-10, 7], [-0.99999999], [-9, 8], [0]),
+    ])
+    def test_zero_point_optimization(self, weights, zero_point, adj_weights, adj_zero_point):
+        nodes = lambda w, zp: {
+            **valued_const_with_data('weights', np.array(w, dtype=np.int8)),
+            **regular_op_with_shaped_data(
+                'cast', len(w), {'type': 'Convert', 'op': 'Cast', 'infer': Cast.infer, 'dst_type': np.float32}),
+            **valued_const_with_data('zp', np.array(zp, dtype=np.float32)),
+            **regular_op_with_shaped_data(
+                'sub', len(w),
+                {'type': 'Subtract', 'op': 'Sub', 'infer': lambda node: eltwise_infer(node, Sub.operation)}),
+            **result()
+        }
+        edges = [
+            *connect("weights:0", "0:cast"),
+            *connect("cast:0", "0:sub"),
+            *connect("zp:0", "1:sub"),
+            *connect("sub:0", "0:output"),
+        ]
+        graph = build_graph(nodes(weights, zero_point), edges, nodes_with_edges_only=True)
+        ZeroPointOptimizer().find_and_replace_pattern(graph)
+        graph.clean_up()
+
+        graph_ref = build_graph(nodes(adj_weights, adj_zero_point), [
+            *connect("weights:0", "0:cast"),
+            *connect("cast:0", "0:output"),
+        ], nodes_with_edges_only=True)
+        graph_ref.clean_up()
+
+        (flag, resp) = compare_graphs(graph, graph_ref, 'output', check_op_attrs=True)
+        self.assertTrue(flag, resp)
+
+    @generate(*[
         ([-128, 7], [1], [-128, 7], [1]),
         ([127, 7], [-1], [127, 7], [-1]),
     ])
-    def test_zero_point_optimization(self, weights, zero_point, adj_weights, adj_zero_point):
+    def test_negative_zero_point_optimization(self, weights, zero_point, adj_weights, adj_zero_point):
         nodes = lambda w, zp: {
             **valued_const_with_data('weights', np.array(w, dtype=np.int8)),
             **regular_op_with_shaped_data(

From 9f7cf581b860fb3b186c3b9302a71a36d12148bb Mon Sep 17 00:00:00 2001
From: Ivan Tikhonov <ivan.tikhonov@intel.com>
Date: Thu, 22 Jul 2021 01:37:22 +0300
Subject: [PATCH 30/71] DeformableConv: Decrease input_shape and kernal in CPU
 functional tests (#6746)

---
 .../single_layer_tests/deformable_convolution.cpp           | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/deformable_convolution.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/deformable_convolution.cpp
index 437d8737d65bf7..9e9e7796295109 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/deformable_convolution.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/deformable_convolution.cpp
@@ -22,8 +22,8 @@ const std::vector<size_t> groups = {1};
 const std::vector<size_t> defor_groups = {2};
 const std::vector<size_t> numOutChannels = {1, 5};
 const std::vector<size_t> multiple_defor_groups = {4};
-const std::vector<std::vector<size_t>> deform_vals = {{1, 200, 220, 220}};
-const std::vector<std::vector<size_t>> kernel = {{64, 16, 5, 5}};
+const std::vector<std::vector<size_t>> deform_vals = {{1, 72, 64, 64}};
+const std::vector<std::vector<size_t>> kernel = {{16, 16, 3, 3}};
 
 const std::vector<bool> with_bilinear_interpolation_pad = { false, true };
 const std::vector<bool> with_modulated_scalar = { false, true };
@@ -92,7 +92,7 @@ INSTANTIATE_TEST_SUITE_P(
         ::testing::Values(InferenceEngine::Precision::UNSPECIFIED),
         ::testing::Values(InferenceEngine::Layout::ANY),
         ::testing::Values(InferenceEngine::Layout::ANY),
-        ::testing::Values(std::vector<size_t>({1, 16, 224, 224})),
+        ::testing::Values(std::vector<size_t>({1, 16, 66, 66})),
         ::testing::Values(CommonTestUtils::DEVICE_CPU)),
     DeformableConvolutionLayerTest::getTestCaseName);
 

From aecb2b969301875719884a0e04314784984c2d28 Mon Sep 17 00:00:00 2001
From: Mikhail Nosov <mikhail.nosov@intel.com>
Date: Thu, 22 Jul 2021 02:42:34 +0300
Subject: [PATCH 31/71] Static library for ngraph::frontend_manager (#6719)

* Static library for ngraph::frontend_manager

* Static + Shared versions

* Fix CI

* USE_STATIC_FRONTEND_MANAGER macro

* Set USE_STATIC_FRONTEND_MANAGER compile definition as public

* Revert back incorrectly removed line

* Apply more review comments
---
 .../src/inference_engine/CMakeLists.txt       |  9 ++++----
 .../mock_mo_python_api/CMakeLists.txt         |  2 +-
 .../frontend/frontend_manager/CMakeLists.txt  | 23 ++++++++++++-------
 .../frontend_manager_defs.hpp                 |  4 ++++
 ngraph/frontend/paddlepaddle/CMakeLists.txt   |  2 +-
 .../mock_py_ngraph_frontend/CMakeLists.txt    |  2 +-
 .../mock/pyngraph_fe_mock_api/CMakeLists.txt  |  2 +-
 scripts/setupvars/setupvars.bat               |  1 +
 scripts/setupvars/setupvars.sh                |  1 +
 9 files changed, 30 insertions(+), 16 deletions(-)

diff --git a/inference-engine/src/inference_engine/CMakeLists.txt b/inference-engine/src/inference_engine/CMakeLists.txt
index ffbfc0a1a14160..bf3acd4d466475 100644
--- a/inference-engine/src/inference_engine/CMakeLists.txt
+++ b/inference-engine/src/inference_engine/CMakeLists.txt
@@ -120,11 +120,12 @@ ie_faster_build(${TARGET_NAME}_obj
 )
 
 target_compile_definitions(${TARGET_NAME}_obj PRIVATE IMPLEMENT_INFERENCE_ENGINE_API
-                                                      $<TARGET_PROPERTY:ngraph::ngraph,INTERFACE_COMPILE_DEFINITIONS>)
+                                                      $<TARGET_PROPERTY:ngraph::ngraph,INTERFACE_COMPILE_DEFINITIONS>
+                                                      $<TARGET_PROPERTY:ngraph::frontend_manager::static,INTERFACE_COMPILE_DEFINITIONS>)
 
 target_include_directories(${TARGET_NAME}_obj SYSTEM PRIVATE $<TARGET_PROPERTY:ngraph::ngraph,INTERFACE_INCLUDE_DIRECTORIES>
                                                              $<TARGET_PROPERTY:pugixml::static,INTERFACE_INCLUDE_DIRECTORIES>
-                                                             $<TARGET_PROPERTY:ngraph::frontend_manager,INTERFACE_INCLUDE_DIRECTORIES>
+                                                             $<TARGET_PROPERTY:ngraph::frontend_manager::static,INTERFACE_INCLUDE_DIRECTORIES>
                                                              $<TARGET_PROPERTY:xbyak,INTERFACE_INCLUDE_DIRECTORIES>)
 
 target_include_directories(${TARGET_NAME}_obj PRIVATE "${CMAKE_CURRENT_SOURCE_DIR}"
@@ -161,7 +162,7 @@ if (TBBBIND_2_4_FOUND)
 endif()
 
 target_link_libraries(${TARGET_NAME} PRIVATE pugixml::static openvino::itt ${CMAKE_DL_LIBS} Threads::Threads
-                                             ngraph ngraph::frontend_manager inference_engine_transformations)
+                                             ngraph ngraph::frontend_manager::static inference_engine_transformations)
 
 target_include_directories(${TARGET_NAME} INTERFACE
             $<BUILD_INTERFACE:${PUBLIC_HEADERS_DIR}>
@@ -201,7 +202,7 @@ if(WIN32)
     set_target_properties(${TARGET_NAME}_s PROPERTIES COMPILE_PDB_NAME ${TARGET_NAME}_s)
 endif()
 
-target_link_libraries(${TARGET_NAME}_s PRIVATE openvino::itt ${CMAKE_DL_LIBS} ngraph ngraph::frontend_manager
+target_link_libraries(${TARGET_NAME}_s PRIVATE openvino::itt ${CMAKE_DL_LIBS} ngraph ngraph::frontend_manager::static
                                                inference_engine_transformations pugixml::static)
 
 target_compile_definitions(${TARGET_NAME}_s PUBLIC USE_STATIC_IE)
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt
index 1a94414055bf99..48bc37fa38c0fa 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt
@@ -30,7 +30,7 @@ source_group("src" FILES ${PYBIND_FE_SRC})
 
 pybind11_add_module(${PYBIND_FE_NAME} MODULE ${PYBIND_FE_SRC})
 
-target_link_libraries(${PYBIND_FE_NAME} PRIVATE ngraph::ngraph ngraph::frontend_manager)
+target_link_libraries(${PYBIND_FE_NAME} PRIVATE ngraph::ngraph ngraph::frontend_manager::static)
 target_link_libraries(${PYBIND_FE_NAME} PRIVATE ${TARGET_FE_NAME})
 
 add_dependencies(${PYBIND_FE_NAME} ${TARGET_FE_NAME})
diff --git a/ngraph/frontend/frontend_manager/CMakeLists.txt b/ngraph/frontend/frontend_manager/CMakeLists.txt
index d36cf122554074..83069aa16752d0 100644
--- a/ngraph/frontend/frontend_manager/CMakeLists.txt
+++ b/ngraph/frontend/frontend_manager/CMakeLists.txt
@@ -14,11 +14,23 @@ source_group("src" FILES ${LIBRARY_SRC})
 source_group("include" FILES ${LIBRARY_HEADERS})
 source_group("public include" FILES ${LIBRARY_PUBLIC_HEADERS})
 
-# Create shared library
+# Static library
+
+add_library(${TARGET_NAME}_static STATIC ${LIBRARY_SRC} ${LIBRARY_HEADERS} ${LIBRARY_PUBLIC_HEADERS})
+add_library(ngraph::${TARGET_NAME}::static ALIAS ${TARGET_NAME}_static)
+target_link_libraries(${TARGET_NAME}_static PRIVATE ${CMAKE_DL_LIBS} PUBLIC ngraph)
+target_include_directories(${TARGET_NAME}_static PUBLIC ${FRONTEND_INCLUDE_DIR})
+target_include_directories(${TARGET_NAME}_static PRIVATE ${CMAKE_CURRENT_SOURCE_DIR}/src)
+target_compile_definitions(${TARGET_NAME}_static PUBLIC USE_STATIC_FRONTEND_MANAGER)
+
+
+# Shared library - need to recompile object files to export necessary symbols
 
 add_library(${TARGET_NAME} SHARED ${LIBRARY_SRC} ${LIBRARY_HEADERS} ${LIBRARY_PUBLIC_HEADERS})
 add_library(ngraph::${TARGET_NAME} ALIAS ${TARGET_NAME})
-
+target_include_directories(${TARGET_NAME} PUBLIC $<BUILD_INTERFACE:${FRONTEND_INCLUDE_DIR}>
+        $<INSTALL_INTERFACE:${FRONTEND_INSTALL_INCLUDE}>)
+target_include_directories(${TARGET_NAME} PRIVATE ${CMAKE_CURRENT_SOURCE_DIR}/src)
 target_link_libraries(${TARGET_NAME} PRIVATE ${CMAKE_DL_LIBS} PUBLIC ngraph)
 
 add_clang_format_target(${TARGET_NAME}_clang FOR_TARGETS ${TARGET_NAME})
@@ -28,12 +40,7 @@ if(COMMAND ie_add_vs_version_file)
                            FILEDESCRIPTION "Manager of OpenVINO nGraph Frontends")
 endif()
 
-target_include_directories(${TARGET_NAME} PUBLIC $<BUILD_INTERFACE:${FRONTEND_INCLUDE_DIR}>
-                                                 $<INSTALL_INTERFACE:${FRONTEND_INSTALL_INCLUDE}>)
-
-target_include_directories(${TARGET_NAME} PRIVATE ${CMAKE_CURRENT_SOURCE_DIR}/src)
-
-# Installation rules
+# Installation rules for shared version only
 
 install(TARGETS ${TARGET_NAME} EXPORT ngraphTargets
         RUNTIME DESTINATION ${NGRAPH_INSTALL_LIB} COMPONENT ngraph
diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager_defs.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager_defs.hpp
index f7c1f3de86419d..e621c3db7b44d6 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager_defs.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend_manager_defs.hpp
@@ -9,9 +9,13 @@
 // Increment each time when FrontEnd/InputModel/Place interface is changed
 #define OV_FRONTEND_API_VERSION 1
 
+#ifdef USE_STATIC_FRONTEND_MANAGER
+#define FRONTEND_API
+#else
 // Defined if cmake is building the frontend_manager DLL (instead of using it)
 #ifdef frontend_manager_EXPORTS
 #define FRONTEND_API NGRAPH_HELPER_DLL_EXPORT
 #else
 #define FRONTEND_API NGRAPH_HELPER_DLL_IMPORT
 #endif // frontend_manager_EXPORTS
+#endif // USE_STATIC_FRONTEND_MANAGER
\ No newline at end of file
diff --git a/ngraph/frontend/paddlepaddle/CMakeLists.txt b/ngraph/frontend/paddlepaddle/CMakeLists.txt
index a14011039a26c1..cc1a4eba9cea4e 100644
--- a/ngraph/frontend/paddlepaddle/CMakeLists.txt
+++ b/ngraph/frontend/paddlepaddle/CMakeLists.txt
@@ -70,7 +70,7 @@ endif()
 
 link_system_libraries(${TARGET_NAME} PRIVATE ${Protobuf_LIBRARIES})
 
-target_link_libraries(${TARGET_NAME} PUBLIC frontend_manager
+target_link_libraries(${TARGET_NAME} PRIVATE ngraph::frontend_manager::static
                                      PRIVATE ngraph::builder)
 
 add_clang_format_target(${TARGET_NAME}_clang FOR_TARGETS ${TARGET_NAME}
diff --git a/ngraph/python/tests/mock/mock_py_ngraph_frontend/CMakeLists.txt b/ngraph/python/tests/mock/mock_py_ngraph_frontend/CMakeLists.txt
index cbae0eafd0659d..245947d4cac5ed 100644
--- a/ngraph/python/tests/mock/mock_py_ngraph_frontend/CMakeLists.txt
+++ b/ngraph/python/tests/mock/mock_py_ngraph_frontend/CMakeLists.txt
@@ -15,6 +15,6 @@ add_library(${TARGET_FE_NAME} SHARED ${LIBRARY_SRC} ${LIBRARY_HEADERS})
 
 target_include_directories(${TARGET_FE_NAME} PRIVATE ${CMAKE_CURRENT_SOURCE_DIR})
 
-target_link_libraries(${TARGET_FE_NAME} PUBLIC ngraph::frontend_manager)
+target_link_libraries(${TARGET_FE_NAME} PRIVATE ngraph::frontend_manager::static)
 
 add_clang_format_target(${TARGET_FE_NAME}_clang FOR_TARGETS ${TARGET_FE_NAME})
diff --git a/ngraph/python/tests/mock/pyngraph_fe_mock_api/CMakeLists.txt b/ngraph/python/tests/mock/pyngraph_fe_mock_api/CMakeLists.txt
index a371a491dc2b0e..c8300df3d8797e 100644
--- a/ngraph/python/tests/mock/pyngraph_fe_mock_api/CMakeLists.txt
+++ b/ngraph/python/tests/mock/pyngraph_fe_mock_api/CMakeLists.txt
@@ -11,6 +11,6 @@ source_group("src" FILES ${PYBIND_FE_SRC})
 
 pybind11_add_module(${PYBIND_FE_NAME} MODULE ${PYBIND_FE_SRC})
 
-target_link_libraries(${PYBIND_FE_NAME} PRIVATE ${TARGET_FE_NAME})
+target_link_libraries(${PYBIND_FE_NAME} PRIVATE ${TARGET_FE_NAME} ngraph::frontend_manager::static)
 
 add_clang_format_target(${PYBIND_FE_NAME}_clang FOR_TARGETS ${PYBIND_FE_NAME})
diff --git a/scripts/setupvars/setupvars.bat b/scripts/setupvars/setupvars.bat
index f58bc1bd2cb6a1..c7920d3fa332eb 100644
--- a/scripts/setupvars/setupvars.bat
+++ b/scripts/setupvars/setupvars.bat
@@ -68,6 +68,7 @@ set "TBB_DIR=%INTEL_OPENVINO_DIR%\deployment_tools\inference_engine\external\tbb
 if exist %INTEL_OPENVINO_DIR%\deployment_tools\ngraph (
 set "OPENVINO_LIB_PATHS=%INTEL_OPENVINO_DIR%\deployment_tools\ngraph\lib;%OPENVINO_LIB_PATHS%"
 set "ngraph_DIR=%INTEL_OPENVINO_DIR%\deployment_tools\ngraph\cmake"
+set "OV_FRONTEND_PATH=%INTEL_OPENVINO_DIR%\deployment_tools\ngraph\lib;%OV_FRONTEND_PATH%"
 )
 
 :: Compile tool
diff --git a/scripts/setupvars/setupvars.sh b/scripts/setupvars/setupvars.sh
index 880ec2d0633590..199ef0edd9355f 100755
--- a/scripts/setupvars/setupvars.sh
+++ b/scripts/setupvars/setupvars.sh
@@ -68,6 +68,7 @@ fi
 if [ -e "$INSTALLDIR/deployment_tools/ngraph" ]; then
     export LD_LIBRARY_PATH=$INSTALLDIR/deployment_tools/ngraph/lib${LD_LIBRARY_PATH:+:$LD_LIBRARY_PATH}
     export ngraph_DIR=$INSTALLDIR/deployment_tools/ngraph/cmake
+    export OV_FRONTEND_PATH=$INSTALLDIR/deployment_tools/ngraph/lib${OV_FRONTEND_PATH:+:$OV_FRONTEND_PATH}
 fi
 
 if [ -e "$INSTALLDIR/opencv" ]; then

From 1e1e3bfffd8db3a6a76f3beba5dcd52dce7f2926 Mon Sep 17 00:00:00 2001
From: Mateusz Tabaka <mateusz.tabaka@intel.com>
Date: Thu, 22 Jul 2021 06:14:43 +0200
Subject: [PATCH 32/71] =?UTF-8?q?Fix=20NormalizeL2Fusion=20and=20allow=20L?=
 =?UTF-8?q?pNormalization=20to=20be=20fused=20to=20Normal=E2=80=A6=20(#566?=
 =?UTF-8?q?4)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* Fix NormalizeL2Fusion and allow LpNormalization to be fused to NormalizeL2

* apply code format

* use cast_vector<uint64_t>

* use MKLDNNNormalizeL2Node::isSupportedOperation in normalizeL2FusionCallback
---
 .../src/mkldnn_plugin/mkldnn_plugin.cpp       |  9 +++
 .../nodes/mkldnn_normalize_node.cpp           |  2 +-
 .../nodes/mkldnn_normalize_node.h             |  2 +-
 .../normalize_l2_fusion.cpp                   | 20 ++++---
 .../normalize_l2_fusion_test.cpp              | 60 +++++++++----------
 .../builder/include/ngraph/builder/norm.hpp   | 12 +++-
 ngraph/core/builder/src/builder/norm.cpp      | 34 +++++++----
 .../onnx/onnx_import/src/op/lp_norm.cpp       | 19 +-----
 8 files changed, 84 insertions(+), 74 deletions(-)

diff --git a/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp b/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
index 49b89ee339a89f..be9bfa0d1cbc20 100644
--- a/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
+++ b/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
@@ -26,6 +26,7 @@
 #include "transformations/common_optimizations/convert_quantize_dequantize.hpp"
 #include <transformations/common_optimizations/depth_to_space_fusion.hpp>
 #include <transformations/common_optimizations/softmax_fusion.hpp>
+#include <transformations/common_optimizations/normalize_l2_fusion.hpp>
 #include <transformations/op_conversions/convert_depth_to_space.hpp>
 #include <transformations/op_conversions/convert_shuffle_channels3.hpp>
 #include <transformations/op_conversions/convert_space_to_depth.hpp>
@@ -87,6 +88,7 @@
 
 #include "nodes/mkldnn_mvn_node.h"
 #include "nodes/mkldnn_fake_quantize_node.h"
+#include "nodes/mkldnn_normalize_node.h"
 #include "ngraph_transformations/convert_to_cpu_specific_opset.hpp"
 
 #if !defined(__arm__) && !defined(_M_ARM) && !defined(__aarch64__) && !defined(_M_ARM64)
@@ -277,6 +279,13 @@ static void Transformation(CNNNetwork& clonedNetwork, const Config& conf) {
                 return node->input_value(0).get_partial_shape().rank().get_length() > 5;
             });
 
+    auto normalizeL2FusionCallback = [](const_node_ptr &node) -> bool {
+        std::string errorMsg;
+        return !MKLDNNNormalizeL2Node::isSupportedOperation(node, errorMsg);
+    };
+    pass_config->set_callback<ngraph::pass::NormalizeL2FusionWithAdd>(normalizeL2FusionCallback);
+    pass_config->set_callback<ngraph::pass::NormalizeL2FusionWithMax>(normalizeL2FusionCallback);
+
     // List of enabled/disabled transformations
     pass_config->disable<ngraph::pass::ConvertGELU>();
     pass_config->disable<ngraph::pass::ConvertShuffleChannels3>();
diff --git a/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.cpp b/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.cpp
index ff95f416573a25..2da3ae8f330064 100644
--- a/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.cpp
+++ b/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.cpp
@@ -660,7 +660,7 @@ MKLDNNNormalizeL2Node::MKLDNNNormalizeL2Node(const std::shared_ptr<ngraph::Node>
     }
 }
 
-bool MKLDNNNormalizeL2Node::isSupportedOperation(const std::shared_ptr<ngraph::Node>& op, std::string& errorMessage) noexcept {
+bool MKLDNNNormalizeL2Node::isSupportedOperation(const std::shared_ptr<const ngraph::Node>& op, std::string& errorMessage) noexcept {
     try {
         const auto norm = std::dynamic_pointer_cast<const ngraph::op::v0::NormalizeL2>(op);
         if (!norm) {
diff --git a/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.h b/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.h
index bcb7b0d8d491f2..6b6a62bf42c418 100644
--- a/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.h
+++ b/inference-engine/src/mkldnn_plugin/nodes/mkldnn_normalize_node.h
@@ -84,7 +84,7 @@ class MKLDNNNormalizeL2Node : public MKLDNNNode {
         return false;
     }
 
-    static bool isSupportedOperation(const std::shared_ptr<ngraph::Node>& op, std::string& errorMessage) noexcept;
+    static bool isSupportedOperation(const std::shared_ptr<const ngraph::Node>& op, std::string& errorMessage) noexcept;
     bool canFuse(const MKLDNNNodePtr& node) const override;
 
 private:
diff --git a/inference-engine/src/transformations/src/transformations/common_optimizations/normalize_l2_fusion.cpp b/inference-engine/src/transformations/src/transformations/common_optimizations/normalize_l2_fusion.cpp
index 905356b4d5fd7a..22aac2e1c71d33 100644
--- a/inference-engine/src/transformations/src/transformations/common_optimizations/normalize_l2_fusion.cpp
+++ b/inference-engine/src/transformations/src/transformations/common_optimizations/normalize_l2_fusion.cpp
@@ -25,10 +25,10 @@ ngraph::pass::NormalizeL2FusionWithMax::NormalizeL2FusionWithMax() {
     auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
     auto axes = ngraph::pattern::wrap_type<ngraph::opset4::Constant>();
     auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes);
-    auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
     auto eps_const = ngraph::pattern::wrap_type<ngraph::opset4::Constant>();
-    auto sqrt_max_eps = std::make_shared<ngraph::opset4::Maximum>(sqrt, eps_const);
-    auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_max_eps);
+    auto max = std::make_shared<ngraph::opset4::Maximum>(reduce_sum, eps_const);
+    auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(max);
+    auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
     ngraph::matcher_pass_callback matcher_pass_callback = [=](ngraph::pattern::Matcher& m) {
         auto& pattern_to_output = m.get_pattern_value_map();
@@ -52,12 +52,14 @@ ngraph::pass::NormalizeL2FusionWithMax::NormalizeL2FusionWithMax() {
         const auto eps_attr_value = eps_attr->cast_vector<float>()[0];
 
         auto normalize_l2 = std::make_shared<ngraph::opset4::NormalizeL2>(data_input, axes_input, eps_attr_value, op::EpsMode::MAX);
+        if (transformation_callback(normalize_l2))
+            return false;
 
         normalize_l2->set_friendly_name(m.get_match_root()->get_friendly_name());
         ngraph::copy_runtime_info({pattern_to_output.at(pow).get_node_shared_ptr(),
                                    pattern_to_output.at(reduce_sum).get_node_shared_ptr(),
                                    pattern_to_output.at(sqrt).get_node_shared_ptr(),
-                                   pattern_to_output.at(sqrt_max_eps).get_node_shared_ptr(),
+                                   pattern_to_output.at(max).get_node_shared_ptr(),
                                    pattern_to_output.at(divide).get_node_shared_ptr()
                                    },
                                    normalize_l2);
@@ -79,10 +81,10 @@ ngraph::pass::NormalizeL2FusionWithAdd::NormalizeL2FusionWithAdd() {
     auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
     auto axes = ngraph::pattern::wrap_type<ngraph::opset4::Constant>();
     auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes);
-    auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
     auto eps_const = ngraph::pattern::wrap_type<ngraph::opset4::Constant>();
-    auto sqrt_add_eps = std::make_shared<ngraph::opset4::Add>(sqrt, eps_const);
-    auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_add_eps);
+    auto add = std::make_shared<ngraph::opset4::Add>(reduce_sum, eps_const);
+    auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(add);
+    auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
     ngraph::matcher_pass_callback callback = [=](ngraph::pattern::Matcher& m) {
         auto& pattern_to_output = m.get_pattern_value_map();
@@ -106,12 +108,14 @@ ngraph::pass::NormalizeL2FusionWithAdd::NormalizeL2FusionWithAdd() {
         const auto eps_attr_value = op::util::has_constant_value<float>(exp_input, 2.0f);
 
         auto normalize_l2 = std::make_shared<ngraph::opset4::NormalizeL2>(data_input, axes_input, eps_attr_value, op::EpsMode::ADD);
+        if (transformation_callback(normalize_l2))
+            return false;
 
         normalize_l2->set_friendly_name(m.get_match_root()->get_friendly_name());
         ngraph::copy_runtime_info({pattern_to_output.at(pow).get_node_shared_ptr(),
                                    pattern_to_output.at(reduce_sum).get_node_shared_ptr(),
                                    pattern_to_output.at(sqrt).get_node_shared_ptr(),
-                                   pattern_to_output.at(sqrt_add_eps).get_node_shared_ptr(),
+                                   pattern_to_output.at(add).get_node_shared_ptr(),
                                    pattern_to_output.at(divide).get_node_shared_ptr()
                                    },
                                    normalize_l2);
diff --git a/inference-engine/tests/functional/inference_engine/transformations/normalize_l2_fusion_test.cpp b/inference-engine/tests/functional/inference_engine/transformations/normalize_l2_fusion_test.cpp
index 822ff62cfc173a..f1d496013a407c 100644
--- a/inference-engine/tests/functional/inference_engine/transformations/normalize_l2_fusion_test.cpp
+++ b/inference-engine/tests/functional/inference_engine/transformations/normalize_l2_fusion_test.cpp
@@ -27,10 +27,10 @@ TEST(TransformationTests, NormalizeL2FusionWithMax) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{2}, {0, 1});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{}, {eps_value});
-        auto sqrt_max_eps = std::make_shared<ngraph::opset4::Maximum>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_max_eps);
+        auto max = std::make_shared<ngraph::opset4::Maximum>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(max);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
 
@@ -62,10 +62,10 @@ TEST(TransformationTests, NormalizeL2FusionWithMaxIncorrectExp) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{1}, {0});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{}, {eps_value});
-        auto sqrt_max_eps = std::make_shared<ngraph::opset4::Maximum>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_max_eps);
+        auto max = std::make_shared<ngraph::opset4::Maximum>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(max);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
 
@@ -81,10 +81,10 @@ TEST(TransformationTests, NormalizeL2FusionWithMaxIncorrectExp) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{1}, {0});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{}, {eps_value});
-        auto sqrt_max_eps = std::make_shared<ngraph::opset4::Maximum>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_max_eps);
+        auto max = std::make_shared<ngraph::opset4::Maximum>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(max);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f_ref = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
     }
@@ -101,10 +101,10 @@ TEST(TransformationTests, NormalizeL2FusionWithMaxIncorrectEpsValueShape) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{1}, {0});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{2}, {1, 2});
-        auto sqrt_max_eps = std::make_shared<ngraph::opset4::Maximum>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_max_eps);
+        auto max = std::make_shared<ngraph::opset4::Maximum>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(max);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
 
@@ -120,10 +120,10 @@ TEST(TransformationTests, NormalizeL2FusionWithMaxIncorrectEpsValueShape) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{1}, {0});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{2}, {1, 2});
-        auto sqrt_max_eps = std::make_shared<ngraph::opset4::Maximum>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_max_eps);
+        auto max = std::make_shared<ngraph::opset4::Maximum>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(max);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f_ref = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
     }
@@ -141,10 +141,10 @@ TEST(TransformationTests, NormalizeL2FusionWithAdd) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{2}, {0, 1});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f32, ngraph::Shape{1}, {eps_value});
-        auto sqrt_add_eps = std::make_shared<ngraph::opset4::Add>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_add_eps);
+        auto add = std::make_shared<ngraph::opset4::Add>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(add);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
 
@@ -176,10 +176,10 @@ TEST(TransformationTests, NormalizeL2FusionWithAddIncorrectExp) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{2}, {0, 1});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{}, {eps_value});
-        auto sqrt_add_eps = std::make_shared<ngraph::opset4::Add>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_add_eps);
+        auto add = std::make_shared<ngraph::opset4::Add>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(add);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
 
@@ -196,10 +196,10 @@ TEST(TransformationTests, NormalizeL2FusionWithAddIncorrectExp) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{2}, {0, 1});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{}, {eps_value});
-        auto sqrt_add_eps = std::make_shared<ngraph::opset4::Add>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_add_eps);
+        auto add = std::make_shared<ngraph::opset4::Add>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(add);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f_ref = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
     }
@@ -216,10 +216,10 @@ TEST(TransformationTests, NormalizeL2FusionWithAddIncorrectEpsValueShape) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{1}, {0});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{2}, {1, 2});
-        auto sqrt_add_eps = std::make_shared<ngraph::opset4::Add>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_add_eps);
+        auto add = std::make_shared<ngraph::opset4::Add>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(add);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
 
@@ -235,10 +235,10 @@ TEST(TransformationTests, NormalizeL2FusionWithAddIncorrectEpsValueShape) {
         auto pow = std::make_shared<ngraph::opset4::Power>(input, exp);
         auto axes_const = ngraph::opset4::Constant::create(ngraph::element::i64, ngraph::Shape{1}, {0});
         auto reduce_sum = std::make_shared<ngraph::opset4::ReduceSum>(pow, axes_const);
-        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(reduce_sum);
         auto eps_const = ngraph::opset4::Constant::create(ngraph::element::f16, ngraph::Shape{2}, {1, 2});
-        auto sqrt_add_eps = std::make_shared<ngraph::opset4::Add>(sqrt, eps_const);
-        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt_add_eps);
+        auto add = std::make_shared<ngraph::opset4::Add>(reduce_sum, eps_const);
+        auto sqrt = std::make_shared<ngraph::opset4::Sqrt>(add);
+        auto divide = std::make_shared<ngraph::opset4::Divide>(input, sqrt);
 
         f_ref = std::make_shared<ngraph::Function>(ngraph::NodeVector{divide}, ngraph::ParameterVector{input});
     }
diff --git a/ngraph/core/builder/include/ngraph/builder/norm.hpp b/ngraph/core/builder/include/ngraph/builder/norm.hpp
index a4fd9e9e931de6..b687418159baa9 100644
--- a/ngraph/core/builder/include/ngraph/builder/norm.hpp
+++ b/ngraph/core/builder/include/ngraph/builder/norm.hpp
@@ -32,11 +32,13 @@ namespace ngraph
             ///
             /// \param[in]  value           The input tensor.
             /// \param[in]  reduction_axes  The axes along which we calculate norm.
+            /// \param[in]  keep_dims       The flag indicates if axes will be removed or kept.
             ///
             /// \return     L-0 norm of value. The output sub-graph is composed of v1 ops.
             ///
             std::shared_ptr<Node> l0_norm(const Output<Node>& value,
-                                          const Output<Node>& reduction_axes);
+                                          const Output<Node>& reduction_axes,
+                                          bool keep_dims = false);
 
             /// \brief      Calculates L-1 norm of a value.
             ///
@@ -45,12 +47,14 @@ namespace ngraph
             /// \param[in]  value           The input tensor.
             /// \param[in]  reduction_axes  The axes along which we calculate norm.
             /// \param[in]  bias            The bias added to the calculated sum.
+            /// \param[in]  keep_dims       The flag indicates if axes will be removed or kept.
             ///
             /// \return     L-1 norm of value. The output sub-graph is composed of v1 ops.
             ///
             std::shared_ptr<Node> l1_norm(const Output<Node>& value,
                                           const Output<Node>& reduction_axes,
-                                          float bias = 0.f);
+                                          float bias = 0.f,
+                                          bool keep_dims = false);
 
             /// \brief      Calculates L-2 norm of input tensor.
             ///
@@ -77,13 +81,15 @@ namespace ngraph
             /// \param[in]  reduction_axes  The axes along which we calculate norm.
             /// \param[in]  p_norm          The p norm to calculate.
             /// \param[in]  bias            The bias added to the calculated sum.
+            /// \param[in]  keep_dims       The flag indicates if axes will be removed or kept.
             ///
             /// \return     L-p norm of value. The output sub-graph is composed of v1 ops.
             ///
             std::shared_ptr<Node> lp_norm(const Output<Node>& value,
                                           const Output<Node>& reduction_axes,
                                           std::size_t p_norm = 2,
-                                          float bias = 0.f);
+                                          float bias = 0.f,
+                                          bool keep_dims = false);
         } // namespace opset1
     }     // namespace builder
 } // namespace ngraph
diff --git a/ngraph/core/builder/src/builder/norm.cpp b/ngraph/core/builder/src/builder/norm.cpp
index 48ea9b5f2c53e5..db5437f082d42f 100644
--- a/ngraph/core/builder/src/builder/norm.cpp
+++ b/ngraph/core/builder/src/builder/norm.cpp
@@ -29,7 +29,8 @@ namespace ngraph
                 shared_ptr<Node> lp_norm(const Output<Node>& value,
                                          size_t p_norm,
                                          const Output<Node>& reduction_axes,
-                                         float bias)
+                                         float bias,
+                                         bool keep_dims)
                 {
                     // In general "entrywise" lp-norm for matrix `A` is defined as following double
                     // sum:
@@ -40,7 +41,8 @@ namespace ngraph
 
                     // Get inner part of equation: abs_values^p_node, then sum over reduction_axes.
                     shared_ptr<Node> values{make_shared<ngraph::opset1::Power>(abs_values, p_node)};
-                    values = make_shared<ngraph::opset1::ReduceSum>(values, reduction_axes, false);
+                    values =
+                        make_shared<ngraph::opset1::ReduceSum>(values, reduction_axes, keep_dims);
 
                     shared_ptr<Node> bias_node{ngraph::opset1::Constant::create(
                         values->get_element_type(), Shape{}, {bias})};
@@ -58,7 +60,8 @@ namespace ngraph
         }     // namespace detail
 
         shared_ptr<Node> builder::opset1::l0_norm(const Output<Node>& value,
-                                                  const Output<Node>& reduction_axes)
+                                                  const Output<Node>& reduction_axes,
+                                                  bool keep_dims)
         {
             // L0 norm returns number of elements different from zero.
             const shared_ptr<Node> zero_node{
@@ -68,16 +71,18 @@ namespace ngraph
             const shared_ptr<Node> non_zero_values = make_shared<ngraph::opset1::Convert>(
                 make_shared<ngraph::opset1::NotEqual>(value, zero_node), value.get_element_type());
 
-            return make_shared<ngraph::opset1::ReduceSum>(non_zero_values, reduction_axes, false)
+            return make_shared<ngraph::opset1::ReduceSum>(
+                       non_zero_values, reduction_axes, keep_dims)
                 ->add_provenance_group_members_above({value});
         }
 
         shared_ptr<Node> builder::opset1::l1_norm(const Output<Node>& value,
                                                   const Output<Node>& reduction_axes,
-                                                  float bias)
+                                                  float bias,
+                                                  bool keep_dims)
         {
             const shared_ptr<Node> values{make_shared<ngraph::opset1::ReduceSum>(
-                make_shared<ngraph::opset1::Abs>(value), reduction_axes, false)};
+                make_shared<ngraph::opset1::Abs>(value), reduction_axes, keep_dims)};
 
             const shared_ptr<Node> bias_node{
                 ngraph::opset1::Constant::create(values->get_element_type(), Shape{}, {bias})};
@@ -92,8 +97,10 @@ namespace ngraph
                                                   BiasMode bias_mode,
                                                   bool keep_dims)
         {
-            shared_ptr<Node> values{make_shared<ngraph::opset1::ReduceSum>(
-                make_shared<ngraph::opset1::Multiply>(value, value), reduction_axes, keep_dims)};
+            shared_ptr<Node> pow = make_shared<ngraph::opset1::Power>(
+                value, make_shared<ngraph::opset1::Constant>(value.get_element_type(), Shape{}, 2));
+            shared_ptr<Node> values{
+                make_shared<ngraph::opset1::ReduceSum>(pow, reduction_axes, keep_dims)};
 
             shared_ptr<Node> bias_node{
                 ngraph::opset1::Constant::create(values->get_element_type(), Shape{}, {bias})};
@@ -117,27 +124,28 @@ namespace ngraph
         shared_ptr<Node> builder::opset1::lp_norm(const Output<Node>& value,
                                                   const Output<Node>& reduction_axes,
                                                   size_t p_norm,
-                                                  float bias)
+                                                  float bias,
+                                                  bool keep_dims)
         {
             // The number of non-zero elements
             if (p_norm == 0)
             {
-                return opset1::l0_norm(value, reduction_axes);
+                return opset1::l0_norm(value, reduction_axes, keep_dims);
             }
             //  sum of absolute values.
             else if (p_norm == 1)
             {
-                return opset1::l1_norm(value, reduction_axes, bias);
+                return opset1::l1_norm(value, reduction_axes, bias, keep_dims);
             }
             // sqrt of sum of squares - Euclidean norm
             else if (p_norm == 2)
             {
-                return opset1::l2_norm(value, reduction_axes, bias);
+                return opset1::l2_norm(value, reduction_axes, bias, BiasMode::ADD, keep_dims);
             }
             // generic case
             else
             {
-                return detail::opset1::lp_norm(value, p_norm, reduction_axes, bias);
+                return detail::opset1::lp_norm(value, p_norm, reduction_axes, bias, keep_dims);
             }
         }
 
diff --git a/ngraph/frontend/onnx/onnx_import/src/op/lp_norm.cpp b/ngraph/frontend/onnx/onnx_import/src/op/lp_norm.cpp
index b8efda67bfa0d5..3a19d68685be26 100644
--- a/ngraph/frontend/onnx/onnx_import/src/op/lp_norm.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/op/lp_norm.cpp
@@ -30,7 +30,6 @@ namespace ngraph
                     const auto data_shape = data.get_partial_shape();
                     const auto data_rank = data_shape.rank();
 
-                    const auto data_rank_value = data_rank.get_length();
                     const std::int64_t p_norm{node.get_attribute_value<std::int64_t>("p", 2)};
 
                     const std::int64_t axis{node.get_attribute_value<std::int64_t>("axis", -1)};
@@ -46,23 +45,7 @@ namespace ngraph
                     const auto normalize_axis_const =
                         default_opset::Constant::create(element::i64, {}, {normalize_axis});
                     std::shared_ptr<ngraph::Node> norm = ngraph::builder::opset1::lp_norm(
-                        data, normalize_axis_const, static_cast<std::size_t>(p_norm));
-
-                    const auto target_shape = std::make_shared<default_opset::ShapeOf>(data);
-
-                    // Create a default axes order matching the data tensor rank and erase the
-                    // element at the 'normalize_axis' position. The erased element indicates the
-                    // axis
-                    // along which the data should be broadcasted.
-                    std::vector<size_t> axes_values(data_rank_value);
-                    std::iota(axes_values.begin(), axes_values.end(), 0);
-                    axes_values.erase(axes_values.begin() + normalize_axis);
-
-                    const auto axes_mapping = default_opset::Constant::create(
-                        element::i64, Shape{axes_values.size()}, axes_values);
-
-                    norm = std::make_shared<default_opset::Broadcast>(
-                        norm, target_shape, axes_mapping);
+                        data, normalize_axis_const, static_cast<std::size_t>(p_norm), 0.0f, true);
 
                     return {std::make_shared<default_opset::Divide>(data, norm)};
                 }

From 21e678eb78d53dbda25a460449ffd77647104e62 Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Thu, 22 Jul 2021 11:56:40 +0300
Subject: [PATCH 33/71] Fixed ngraph unit-test compilation with protobuf-lite
 (#6734)

---
 ngraph/test/CMakeLists.txt         | 6 +++---
 thirdparty/CMakeLists.txt          | 7 +------
 thirdparty/protobuf/CMakeLists.txt | 4 ++++
 3 files changed, 8 insertions(+), 9 deletions(-)

diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 6fbef735581714..acdabe9fb81ced 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -613,9 +613,6 @@ if (NGRAPH_ONNX_IMPORT_ENABLE AND NOT NGRAPH_USE_PROTOBUF_LITE)
             ${Protobuf_INCLUDE_DIRS})
     target_compile_definitions(unit-test
         PRIVATE $<TARGET_PROPERTY:onnx,INTERFACE_COMPILE_DEFINITIONS>)
-
-    get_target_property(ONNX_IMPORTER_SRC_DIR onnx_importer SOURCE_DIR)
-    target_include_directories(unit-test PRIVATE ${ONNX_IMPORTER_SRC_DIR}/src)
 endif()
 
 if (OV_COMPILER_IS_CLANG)
@@ -623,6 +620,9 @@ if (OV_COMPILER_IS_CLANG)
 endif()
 
 if (NGRAPH_ONNX_IMPORT_ENABLE)
+    get_target_property(ONNX_IMPORTER_SRC_DIR onnx_importer SOURCE_DIR)
+    target_include_directories(unit-test PRIVATE ${ONNX_IMPORTER_SRC_DIR}/src)
+
     target_link_libraries(unit-test PRIVATE onnx_importer)
 endif()
 
diff --git a/thirdparty/CMakeLists.txt b/thirdparty/CMakeLists.txt
index d35947dca9e38b..a0a00af5321a1c 100644
--- a/thirdparty/CMakeLists.txt
+++ b/thirdparty/CMakeLists.txt
@@ -130,7 +130,7 @@ if(NGRAPH_PDPD_FRONTEND_ENABLE OR NGRAPH_ONNX_IMPORT_ENABLE)
         if(VERBOSE_BUILD)
             set(Protobuf_DEBUG ON)
         endif()
-        find_package(Protobuf REQUIRED)
+        find_package(Protobuf 3.9.0 REQUIRED)
         if(NGRAPH_USE_PROTOBUF_LITE)
             set(Protobuf_LIBRARIES protobuf::libprotobuf-lite)
         else()
@@ -162,11 +162,6 @@ if(NGRAPH_PDPD_FRONTEND_ENABLE OR NGRAPH_ONNX_IMPORT_ENABLE)
             target_compile_options(${target} ${link_type} -Wno-undef)
         endif()
     endforeach()
-
-    # version checks
-    if(protobuf_VERSION VERSION_LESS "3.9" AND NGRAPH_USE_PROTOBUF_LITE)
-        message(FATAL_ERROR "Minimum supported version of protobuf-lite library is 3.9.0 (provided ${protobuf_VERSION})")
-    endif()
 endif()
 
 #
diff --git a/thirdparty/protobuf/CMakeLists.txt b/thirdparty/protobuf/CMakeLists.txt
index f3cec9914a16f5..da562377b284b4 100644
--- a/thirdparty/protobuf/CMakeLists.txt
+++ b/thirdparty/protobuf/CMakeLists.txt
@@ -85,6 +85,10 @@ if(NGRAPH_USE_PROTOBUF_LITE)
         VISIBILITY_INLINES_HIDDEN OFF)
 endif()
 
+if(protobuf_VERSION VERSION_LESS "3.9" AND NGRAPH_USE_PROTOBUF_LITE)
+    message(FATAL_ERROR "Minimum supported version of protobuf-lite library is 3.9.0 (provided ${protobuf_VERSION})")
+endif()
+
 if(ENABLE_LTO AND protobuf_VERSION VERSION_GREATER_EQUAL "3.8")
     message(WARNING "Protobuf in version 3.8.0+ can throw runtime exceptions if LTO is enabled.")
 endif()

From 55d9e85dc657a6b93fb35837806f489f8a2a9fcb Mon Sep 17 00:00:00 2001
From: Valentin Dymchishin <valentin.dymchishin@intel.com>
Date: Thu, 22 Jul 2021 12:50:07 +0300
Subject: [PATCH 34/71] [54908] Update MemCheckTests references in nightly
 config (#6713)

* [54908] Update MemCheckTests references for GPU

* [54908] Update MemCheckTests references in nightly config
---
 .../desktop_references_config.xml             | 1254 +++++++++--------
 1 file changed, 630 insertions(+), 624 deletions(-)

diff --git a/tests/stress_tests/.automation/memcheck_tests/nightly_configs/desktop_references_config.xml b/tests/stress_tests/.automation/memcheck_tests/nightly_configs/desktop_references_config.xml
index cf0b073db9a457..69b444db0a1be2 100644
--- a/tests/stress_tests/.automation/memcheck_tests/nightly_configs/desktop_references_config.xml
+++ b/tests/stress_tests/.automation/memcheck_tests/nightly_configs/desktop_references_config.xml
@@ -1,628 +1,634 @@
+<?xml version="1.0"?>
 <attributes>
     <models>
-        # References were collected from DB with next query: {"target_branch": "releases/2020/4", "commit_date": "2020-06-15 13:21:41+00:00"}
-        # and modified on FACTOR = 1.3
-        <!--Models with FP32 precision-->
-        <model device="GPU" path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="create_exenetwork" vmhwm="329206" vmpeak="687460" vmrss="329206" vmsize="687460"/>
-        <model device="CPU" path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="create_exenetwork" vmhwm="30227" vmpeak="1037795" vmrss="30227" vmsize="956035"/>
-        <model device="CPU" path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="infer_request_inference" vmhwm="32110" vmpeak="1137089" vmrss="32110" vmsize="1137089"/>
-        <model device="GPU" path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="infer_request_inference" vmhwm="329435" vmpeak="857864" vmrss="329435" vmsize="772668"/>
-        <model device="CPU" path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="inference_with_streams" vmhwm="28615" vmpeak="1081740" vmrss="28615" vmsize="996944"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="inference_with_streams" vmhwm="399817" vmpeak="2069402" vmrss="399817" vmsize="2069402"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="infer_request_inference" vmhwm="33727" vmpeak="1141301" vmrss="33727" vmsize="1141301"/>
-        <model device="GPU" path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="infer_request_inference" vmhwm="340433" vmpeak="868753" vmrss="340433" vmsize="783556"/>
-        <model device="GPU" path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="create_exenetwork" vmhwm="339934" vmpeak="698349" vmrss="339934" vmsize="698349"/>
-        <model device="CPU" path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="create_exenetwork" vmhwm="34309" vmpeak="962114" vmrss="32546" vmsize="960247"/>
-        <model device="CPU" path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="inference_with_streams" vmhwm="33779" vmpeak="1004010" vmrss="31517" vmsize="1002544"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="inference_with_streams" vmhwm="492107" vmpeak="1703223" vmrss="492107" vmsize="1618026"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="infer_request_inference" vmhwm="1071985" vmpeak="1598854" vmrss="1071985" vmsize="1513657"/>
-        <model device="CPU" path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="create_exenetwork" vmhwm="323060" vmpeak="1302262" vmrss="233859" vmsize="1212931"/>
-        <model device="GPU" path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="create_exenetwork" vmhwm="1071673" vmpeak="1429012" vmrss="1071673" vmsize="1429012"/>
-        <model device="CPU" path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="infer_request_inference" vmhwm="322951" vmpeak="1484464" vmrss="279208" vmsize="1399268"/>
-        <model device="CPU" path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="inference_with_streams" vmhwm="417887" vmpeak="1957191" vmrss="300565" vmsize="1871994"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="inference_with_streams" vmhwm="2370503" vmpeak="3683914" vmrss="2370503" vmsize="3605373"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="create_exenetwork" vmhwm="5488875" vmpeak="5846682" vmrss="5417256" vmsize="5774787"/>
-        <model device="CPU" path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="create_exenetwork" vmhwm="845915" vmpeak="2927428" vmrss="655449" vmsize="2736734"/>
-        <model device="CPU" path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="infer_request_inference" vmhwm="1768228" vmpeak="2992033" vmrss="1768228" vmsize="2821946"/>
-        <model device="GPU" path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="infer_request_inference" vmhwm="5498755" vmpeak="5913622" vmrss="5393434" vmsize="5828425"/>
-        <model device="CPU" path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="inference_with_streams" vmhwm="1866846" vmpeak="4406641" vmrss="1866758" vmsize="4313181"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="create_exenetwork" vmhwm="153509" vmpeak="2130762" vmrss="131820" vmsize="2109010"/>
-        <model device="CPU" path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="infer_request_inference" vmhwm="1157234" vmpeak="2449824" vmrss="1157234" vmsize="2364627"/>
-        <model device="GPU" path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="create_exenetwork" vmhwm="2281832" vmpeak="2638927" vmrss="2207790" vmsize="2564796"/>
-        <model device="GPU" path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="infer_request_inference" vmhwm="2300573" vmpeak="2732880" vmrss="2217467" vmsize="2647684"/>
-        <model device="CPU" path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="inference_with_streams" vmhwm="1089462" vmpeak="3246869" vmrss="1088807" vmsize="3161672"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="inference_with_streams" vmhwm="5567614" vmpeak="6861686" vmrss="5514776" vmsize="6808422"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="142896" vmpeak="1079457" vmrss="112377" vmsize="1048611"/>
-        <model device="CPU" path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="143520" vmpeak="1230450" vmrss="117785" vmsize="1230450"/>
-        <model device="GPU" path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="681803" vmpeak="1209452" vmrss="681803" vmsize="1124255"/>
-        <model device="GPU" path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="684533" vmpeak="1041762" vmrss="684533" vmsize="1041762"/>
-        <model device="CPU" path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="179067" vmpeak="1382435" vmrss="125892" vmsize="1297238"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="1265924" vmpeak="2851456" vmrss="1265924" vmsize="2766259"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="715135" vmpeak="1690878" vmrss="517982" vmsize="1483570"/>
-        <model device="GPU" path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="1670255" vmpeak="2196989" vmrss="1670255" vmsize="2111792"/>
-        <model device="CPU" path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="716154" vmpeak="1690884" vmrss="507525" vmsize="1482078"/>
-        <model device="GPU" path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="1662434" vmpeak="2019430" vmrss="1662434" vmsize="2019430"/>
-        <model device="CPU" path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="939291" vmpeak="2191129" vmrss="540456" vmsize="1740596"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="2969886" vmpeak="4403224" vmrss="2969886" vmsize="4318028"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="813150" vmpeak="2102848" vmrss="554668" vmsize="1737689"/>
-        <model device="CPU" path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="812780" vmpeak="1815288" vmrss="625066" vmsize="1744184"/>
-        <model device="GPU" path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="1357709" vmpeak="1707929" vmrss="1054398" vmsize="1401415"/>
-        <model device="GPU" path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="1357283" vmpeak="1707222" vmrss="1055761" vmsize="1487714"/>
-        <model device="CPU" path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="1077299" vmpeak="2466084" vmrss="643666" vmsize="1962355"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="1436775" vmpeak="3072945" vmrss="1360975" vmsize="2987748"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="infer_request_inference" vmhwm="963482" vmpeak="1895368" vmrss="658283" vmsize="1767693"/>
-        <model device="CPU" path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="create_exenetwork" vmhwm="964272" vmpeak="1895368" vmrss="654877" vmsize="1585792"/>
-        <model device="GPU" path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="infer_request_inference" vmhwm="1677910" vmpeak="2036039" vmrss="1018867" vmsize="1460924"/>
-        <model device="GPU" path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="create_exenetwork" vmhwm="1673422" vmpeak="2031624" vmrss="1013547" vmsize="1371312"/>
-        <model device="?PU" path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="inference_with_streams" vmhwm="1265607" vmpeak="2241304" vmrss="652927" vmsize="1625114"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="inference_with_streams" vmhwm="1507558" vmpeak="3019608" vmrss="1448397" vmsize="2934412"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="1022548" vmpeak="1475224" vmrss="959036" vmsize="1390027"/>
-        <model device="CPU" path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="301511" vmpeak="1258327" vmrss="221260" vmsize="1177727"/>
-        <model device="CPU" path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="300705" vmpeak="1445402" vmrss="235357" vmsize="1360205"/>
-        <model device="GPU" path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="1023994" vmpeak="1370938" vmrss="959743" vmsize="1306188"/>
-        <model device="GPU" path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="inference_with_streams" vmhwm="1846551" vmpeak="3187360" vmrss="1815444" vmsize="3175463"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="inference_with_streams" vmhwm="392667" vmpeak="2049429" vmrss="251591" vmsize="1902295"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="infer_request_inference" vmhwm="321152" vmpeak="1278378" vmrss="258684" vmsize="1194871"/>
-        <model device="CPU" path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="create_exenetwork" vmhwm="321599" vmpeak="1278414" vmrss="232367" vmsize="1189084"/>
-        <model device="GPU" path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="create_exenetwork" vmhwm="957179" vmpeak="1314721" vmrss="957179" vmsize="1314721"/>
-        <model device="GPU" path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="infer_request_inference" vmhwm="942968" vmpeak="1470898" vmrss="942968" vmsize="1385701"/>
-        <model device="CPU" path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="inference_with_streams" vmhwm="413800" vmpeak="1542502" vmrss="270134" vmsize="1463295"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="inference_with_streams" vmhwm="2039102" vmpeak="3333059" vmrss="2039102" vmsize="3333059"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="create_exenetwork" vmhwm="90064" vmpeak="1030208" vmrss="74037" vmsize="1014031"/>
-        <model device="CPU" path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="infer_request_inference" vmhwm="90126" vmpeak="1281170" vmrss="82409" vmsize="1195974"/>
-        <model device="GPU" path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="create_exenetwork" vmhwm="594932" vmpeak="952640" vmrss="594932" vmsize="952640"/>
-        <model device="GPU" path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="infer_request_inference" vmhwm="596081" vmpeak="1120735" vmrss="596081" vmsize="1035538"/>
-        <model device="CPU" path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="inference_with_streams" vmhwm="112148" vmpeak="1364729" vmrss="88597" vmsize="1260885"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="inference_with_streams" vmhwm="1071189" vmpeak="2623758" vmrss="1071189" vmsize="2538562"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="infer_request_inference" vmhwm="645127" vmpeak="1162184" vmrss="645127" vmsize="1076987"/>
-        <model device="CPU" path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="infer_request_inference" vmhwm="130343" vmpeak="1311367" vmrss="111295" vmsize="1226170"/>
-        <model device="GPU" path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="create_exenetwork" vmhwm="640260" vmpeak="988109" vmrss="640260" vmsize="988109"/>
-        <model device="CPU" path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="create_exenetwork" vmhwm="130213" vmpeak="1074086" vmrss="100630" vmsize="1044352"/>
-        <model device="CPU" path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="inference_with_streams" vmhwm="165562" vmpeak="1170213" vmrss="118976" vmsize="1113039"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="inference_with_streams" vmhwm="1061897" vmpeak="2718066" vmrss="1061897" vmsize="2632869"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="create_exenetwork" vmhwm="125866" vmpeak="1110345" vmrss="98670" vmsize="1045501"/>
-        <model device="GPU" path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="create_exenetwork" vmhwm="665277" vmpeak="1012148" vmrss="665277" vmsize="1012148"/>
-        <model device="GPU" path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="infer_request_inference" vmhwm="664773" vmpeak="1181507" vmrss="664773" vmsize="1096310"/>
-        <model device="CPU" path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="infer_request_inference" vmhwm="126630" vmpeak="1222676" vmrss="110188" vmsize="1137479"/>
-        <model device="CPU" path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="inference_with_streams" vmhwm="159863" vmpeak="1179557" vmrss="120094" vmsize="1116970"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="inference_with_streams" vmhwm="1276043" vmpeak="2832518" vmrss="1276043" vmsize="2747321"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="infer_request_inference" vmhwm="290009" vmpeak="1430551" vmrss="266780" vmsize="1430551"/>
-        <model device="GPU" path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="create_exenetwork" vmhwm="1465521" vmpeak="1823016" vmrss="1465521" vmsize="1823016"/>
-        <model device="CPU" path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="create_exenetwork" vmhwm="290888" vmpeak="1281810" vmrss="257852" vmsize="1248598"/>
-        <model device="GPU" path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="infer_request_inference" vmhwm="1462349" vmpeak="1990289" vmrss="1462349" vmsize="1905092"/>
-        <model device="CPU" path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="inference_with_streams" vmhwm="373230" vmpeak="1526402" vmrss="327912" vmsize="1496310"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="inference_with_streams" vmhwm="2571706" vmpeak="3839326" vmrss="2571706" vmsize="3839326"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="infer_request_inference" vmhwm="820570" vmpeak="1338064" vmrss="820570" vmsize="1252867"/>
-        <model device="CPU" path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="create_exenetwork" vmhwm="128388" vmpeak="1033484" vmrss="107822" vmsize="1012533"/>
-        <model device="GPU" path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="create_exenetwork" vmhwm="810825" vmpeak="1168039" vmrss="810825" vmsize="1168039"/>
-        <model device="CPU" path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="infer_request_inference" vmhwm="128403" vmpeak="1194440" vmrss="116745" vmsize="1194440"/>
-        <model device="CPU" path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="inference_with_streams" vmhwm="159099" vmpeak="1159033" vmrss="130140" vmsize="1134010"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="inference_with_streams" vmhwm="1946016" vmpeak="3187470" vmrss="1946016" vmsize="3187470"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="infer_request_inference" vmhwm="3676467" vmpeak="4025216" vmrss="2028057" vmsize="2459688"/>
-        <model device="GPU" path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="create_exenetwork" vmhwm="3663301" vmpeak="4022153" vmrss="2013772" vmsize="2371428"/>
-        <model device="CPU" path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="create_exenetwork" vmhwm="2219448" vmpeak="3182665" vmrss="1490070" vmsize="2453094"/>
-        <model device="CPU" path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="infer_request_inference" vmhwm="2219224" vmpeak="3182665" vmrss="1523537" vmsize="2453885"/>
-        <model device="CPU" path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="inference_with_streams" vmhwm="2948826" vmpeak="4169958" vmrss="1525456" vmsize="2714186"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="inference_with_streams" vmhwm="3215602" vmpeak="4652934" vmrss="2271063" vmsize="3880812"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="538304" vmpeak="895824" vmrss="490417" vmsize="847880"/>
-        <model device="CPU" path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="201552" vmpeak="1170317" vmrss="144762" vmsize="1089290"/>
-        <model device="GPU" path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="541606" vmpeak="1021555" vmrss="494780" vmsize="936358"/>
-        <model device="CPU" path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="200688" vmpeak="1273443" vmrss="159364" vmsize="1273443"/>
-        <model device="CPU" path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="259511" vmpeak="1336649" vmrss="168256" vmsize="1336649"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="584417" vmpeak="1986041" vmrss="559187" vmsize="1986041"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="infer_request_inference" vmhwm="1109373" vmpeak="1637074" vmrss="1109373" vmsize="1551877"/>
-        <model device="GPU" path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="create_exenetwork" vmhwm="1110356" vmpeak="1467570" vmrss="1110356" vmsize="1467570"/>
-        <model device="CPU" path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="infer_request_inference" vmhwm="415594" vmpeak="1390048" vmrss="305515" vmsize="1390048"/>
-        <model device="CPU" path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="create_exenetwork" vmhwm="415412" vmpeak="1326598" vmrss="296753" vmsize="1207601"/>
-        <model device="CPU" path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="inference_with_streams" vmhwm="541132" vmpeak="1595089" vmrss="320346" vmsize="1509892"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="inference_with_streams" vmhwm="2023938" vmpeak="3330626" vmrss="2023938" vmsize="3330626"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="create_exenetwork" vmhwm="182317" vmpeak="1197773" vmrss="164658" vmsize="1111999"/>
-        <model device="CPU" path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="infer_request_inference" vmhwm="182390" vmpeak="1197778" vmrss="173716" vmsize="1112763"/>
-        <model device="GPU" path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="infer_request_inference" vmhwm="1093898" vmpeak="1621344" vmrss="1093898" vmsize="1536147"/>
-        <model device="GPU" path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="create_exenetwork" vmhwm="1094308" vmpeak="1452172" vmrss="1094308" vmsize="1452172"/>
-        <model device="CPU" path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="inference_with_streams" vmhwm="235274" vmpeak="1727637" vmrss="215831" vmsize="1643205"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="inference_with_streams" vmhwm="2337301" vmpeak="3736985" vmrss="2337301" vmsize="3651788"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="680950" vmpeak="1038434" vmrss="520566" vmsize="877874"/>
-        <model device="CPU" path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="271902" vmpeak="1405289" vmrss="206668" vmsize="1320092"/>
-        <model device="GPU" path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="680680" vmpeak="1054289" vmrss="527285" vmsize="969092"/>
-        <model device="CPU" path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="272740" vmpeak="1216732" vmrss="192602" vmsize="1136304"/>
-        <model device="CPU" path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="353579" vmpeak="1835568" vmrss="215035" vmsize="1835568"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="655408" vmpeak="2317697" vmrss="606210" vmsize="2303132"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="4857247" vmpeak="5206427" vmrss="4128420" vmsize="4553484"/>
-        <model device="CPU" path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="1128233" vmpeak="3280191" vmrss="780743" vmsize="2932467"/>
-        <model device="CPU" path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="2099572" vmpeak="3280186" vmrss="2099572" vmsize="2998964"/>
-        <model device="GPU" path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="4859030" vmpeak="5206666" vmrss="4102753" vmsize="4450399"/>
-        <model device="CPU" path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="inference_with_streams" vmhwm="2081170" vmpeak="4946245" vmrss="2081170" vmsize="4710108"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="create_exenetwork" vmhwm="147898" vmpeak="1114651" vmrss="115112" vmsize="1053561"/>
-        <model device="GPU" path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="infer_request_inference" vmhwm="691709" vmpeak="1207856" vmrss="691709" vmsize="1122659"/>
-        <model device="CPU" path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="infer_request_inference" vmhwm="149328" vmpeak="1320654" vmrss="123120" vmsize="1235457"/>
-        <model device="GPU" path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="create_exenetwork" vmhwm="682973" vmpeak="1039568" vmrss="682973" vmsize="1039568"/>
-        <model device="CPU" path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="inference_with_streams" vmhwm="185572" vmpeak="1218791" vmrss="131014" vmsize="1218791"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="inference_with_streams" vmhwm="1432256" vmpeak="2842418" vmrss="1432256" vmsize="2842418"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="infer_request_inference" vmhwm="1976426" vmpeak="2503280" vmrss="1976426" vmsize="2418083"/>
-        <model device="CPU" path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="create_exenetwork" vmhwm="463372" vmpeak="1638936" vmrss="360770" vmsize="1535965"/>
-        <model device="GPU" path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="create_exenetwork" vmhwm="1975246" vmpeak="2332423" vmrss="1975246" vmsize="2332423"/>
-        <model device="CPU" path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="infer_request_inference" vmhwm="464297" vmpeak="1802980" vmrss="400145" vmsize="1717783"/>
-        <model device="CPU" path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="inference_with_streams" vmhwm="611842" vmpeak="1974590" vmrss="454313" vmsize="1890163"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="inference_with_streams" vmhwm="2907169" vmpeak="4184694" vmrss="2907169" vmsize="4099498"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="672250" vmpeak="1199031" vmrss="672250" vmsize="1113834"/>
-        <model device="CPU" path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="143041" vmpeak="1332099" vmrss="121971" vmsize="1246902"/>
-        <model device="GPU" path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="671990" vmpeak="1028981" vmrss="671990" vmsize="1028981"/>
-        <model device="CPU" path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="142844" vmpeak="1097834" vmrss="109626" vmsize="1064325"/>
-        <model device="CPU" path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="inference_with_streams" vmhwm="181038" vmpeak="1742218" vmrss="130988" vmsize="1687233"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="inference_with_streams" vmhwm="1497204" vmpeak="2939086" vmrss="1475812" vmsize="2853890"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="infer_request_inference" vmhwm="1207304" vmpeak="1725323" vmrss="1207304" vmsize="1640126"/>
-        <model device="CPU" path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="create_exenetwork" vmhwm="477682" vmpeak="1454668" vmrss="337610" vmsize="1314164"/>
-        <model device="CPU" path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="infer_request_inference" vmhwm="476954" vmpeak="1581210" vmrss="351046" vmsize="1496014"/>
-        <model device="GPU" path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="create_exenetwork" vmhwm="1210544" vmpeak="1557566" vmrss="1210544" vmsize="1557566"/>
-        <model device="CPU" path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="inference_with_streams" vmhwm="624629" vmpeak="1646897" vmrss="372985" vmsize="1563764"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="inference_with_streams" vmhwm="2292648" vmpeak="3780951" vmrss="2292648" vmsize="3695754"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="create_exenetwork" vmhwm="944112" vmpeak="1291321" vmrss="944112" vmsize="1291321"/>
-        <model device="CPU" path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="infer_request_inference" vmhwm="231592" vmpeak="1403303" vmrss="181334" vmsize="1318106"/>
-        <model device="CPU" path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="create_exenetwork" vmhwm="232299" vmpeak="1191814" vmrss="176898" vmsize="1136148"/>
-        <model device="GPU" path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="infer_request_inference" vmhwm="947564" vmpeak="1465734" vmrss="947564" vmsize="1380537"/>
-        <model device="CPU" path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="inference_with_streams" vmhwm="297190" vmpeak="1286542" vmrss="200688" vmsize="1202661"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="inference_with_streams" vmhwm="2016835" vmpeak="3353256" vmrss="2016835" vmsize="3353256"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="1011462" vmpeak="2969579" vmrss="760396" vmsize="2718393"/>
-        <model device="CPU" path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="1731979" vmpeak="2994170" vmrss="1731979" vmsize="2908973"/>
-        <model device="GPU" path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="infer_request_inference" vmhwm="5038597" vmpeak="5561036" vmrss="5038597" vmsize="5475839"/>
-        <model device="GPU" path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="create_exenetwork" vmhwm="5051202" vmpeak="5408088" vmrss="5051202" vmsize="5408088"/>
-        <model device="CPU" path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="inference_with_streams" vmhwm="1918654" vmpeak="4482935" vmrss="1918654" vmsize="4094844"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="create_exenetwork" vmhwm="312821" vmpeak="1613175" vmrss="229080" vmsize="1529262"/>
-        <model device="GPU" path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="create_exenetwork" vmhwm="2404532" vmpeak="2762448" vmrss="2386540" vmsize="2743967"/>
-        <model device="GPU" path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="infer_request_inference" vmhwm="2408104" vmpeak="2888906" vmrss="2363524" vmsize="2803710"/>
-        <model device="CPU" path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="infer_request_inference" vmhwm="497364" vmpeak="1607845" vmrss="497364" vmsize="1529418"/>
-        <model device="CPU" path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="inference_with_streams" vmhwm="506599" vmpeak="2533133" vmrss="506599" vmsize="2467244"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="inference_with_streams" vmhwm="3445681" vmpeak="4780334" vmrss="3445681" vmsize="4695137"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="97193" vmpeak="1087216" vmrss="76294" vmsize="1012232"/>
-        <model device="GPU" path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="494447" vmpeak="852124" vmrss="494447" vmsize="852124"/>
-        <model device="GPU" path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="491171" vmpeak="1018591" vmrss="491171" vmsize="933394"/>
-        <model device="CPU" path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="97141" vmpeak="1279350" vmrss="81712" vmsize="1194154"/>
-        <model device="CPU" path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="119917" vmpeak="1105894" vmrss="85867" vmsize="1066733"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="742924" vmpeak="2423688" vmrss="742924" vmsize="2423688"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="infer_request_inference" vmhwm="2734373" vmpeak="3261367" vmrss="2734373" vmsize="3176170"/>
-        <model device="GPU" path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="create_exenetwork" vmhwm="2746140" vmpeak="3103349" vmrss="2746140" vmsize="3103349"/>
-        <model device="CPU" path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="infer_request_inference" vmhwm="1114266" vmpeak="2174572" vmrss="828776" vmsize="2056496"/>
-        <model device="CPU" path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="create_exenetwork" vmhwm="1113491" vmpeak="2174577" vmrss="813904" vmsize="1874657"/>
-        <model device="CPU" path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="inference_with_streams" vmhwm="1465505" vmpeak="2714103" vmrss="887780" vmsize="2177796"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="inference_with_streams" vmhwm="3515725" vmpeak="4875182" vmrss="3515725" vmsize="4875182"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="create_exenetwork" vmhwm="476860" vmpeak="1483336" vmrss="339549" vmsize="1345760"/>
-        <model device="GPU" path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="create_exenetwork" vmhwm="1193774" vmpeak="1540479" vmrss="1193774" vmsize="1540479"/>
-        <model device="CPU" path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="infer_request_inference" vmhwm="477490" vmpeak="1483336" vmrss="371966" vmsize="1346592"/>
-        <model device="GPU" path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="infer_request_inference" vmhwm="1214886" vmpeak="1731776" vmrss="1214886" vmsize="1646580"/>
-        <model device="CPU" path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="inference_with_streams" vmhwm="613272" vmpeak="1689064" vmrss="377390" vmsize="1604631"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="inference_with_streams" vmhwm="2554224" vmpeak="3932957" vmrss="2554224" vmsize="3847760"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="create_exenetwork" vmhwm="1678461" vmpeak="2036767" vmrss="1018586" vmsize="1376455"/>
-        <model device="CPU" path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="infer_request_inference" vmhwm="965572" vmpeak="1894677" vmrss="658169" vmsize="1585953"/>
-        <model device="GPU" path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="infer_request_inference" vmhwm="1678918" vmpeak="2036923" vmrss="1019933" vmsize="1461808"/>
-        <model device="CPU" path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="create_exenetwork" vmhwm="964386" vmpeak="1900002" vmrss="654992" vmsize="1590425"/>
-        <model device="CPU" path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="inference_with_streams" vmhwm="1266210" vmpeak="2420974" vmrss="653322" vmsize="1804784"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="inference_with_streams" vmhwm="1508078" vmpeak="2838638" vmrss="1448917" vmsize="2753441"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="988608" vmpeak="1965574" vmrss="720434" vmsize="1841538"/>
-        <model device="CPU" path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="991343" vmpeak="1970904" vmrss="679114" vmsize="1658664"/>
-        <model device="GPU" path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="1711876" vmpeak="2076287" vmrss="1521967" vmsize="1963785"/>
-        <model device="GPU" path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="1711231" vmpeak="2075855" vmrss="1532403" vmsize="1889888"/>
-        <model device="CPU" path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="1310212" vmpeak="2388578" vmrss="742606" vmsize="2149867"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="2324831" vmpeak="3749512" vmrss="2264761" vmsize="3664315"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="292292" vmpeak="1390573" vmrss="230708" vmsize="1328849"/>
-        <model device="GPU" path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="1485442" vmpeak="1881984" vmrss="1365530" vmsize="1796787"/>
-        <model device="CPU" path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="infer_request_inference" vmhwm="392787" vmpeak="1390573" vmrss="392787" vmsize="1389242"/>
-        <model device="GPU" path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="create_exenetwork" vmhwm="1361396" vmpeak="1708865" vmrss="1361396" vmsize="1708865"/>
-        <model device="CPU" path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="522548" vmpeak="1973197" vmrss="522215" vmsize="1855328"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="inference_with_streams" vmhwm="3062794" vmpeak="4477636" vmrss="2942414" vmsize="4356830"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="infer_request_inference" vmhwm="374836" vmpeak="1459000" vmrss="263281" vmsize="1373803"/>
-        <model device="GPU" path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="infer_request_inference" vmhwm="863813" vmpeak="1215136" vmrss="698453" vmsize="1129939"/>
-        <model device="GPU" path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="create_exenetwork" vmhwm="849794" vmpeak="1208750" vmrss="683867" vmsize="1041315"/>
-        <model device="CPU" path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="create_exenetwork" vmhwm="375663" vmpeak="1307919" vmrss="260686" vmsize="1192750"/>
-        <model device="CPU" path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="inference_with_streams" vmhwm="489767" vmpeak="1511754" vmrss="263842" vmsize="1426557"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="inference_with_streams" vmhwm="851198" vmpeak="2605142" vmrss="795626" vmsize="2519946"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="create_exenetwork" vmsize="1046988" vmpeak="1179042" vmrss="307990" vmhwm="439457"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="GPU" path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="create_exenetwork" vmsize="1267775" vmpeak="1279647" vmrss="932672" vmhwm="944626"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="infer_request_inference" vmsize="1321819" vmpeak="1321819" vmrss="374207" vmhwm="439748"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="GPU" path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="infer_request_inference" vmsize="1356565" vmpeak="1441762" vmrss="941418" vmhwm="947060"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="inference_with_streams" vmsize="1621968" vmpeak="1684784" vmrss="380411" vmhwm="574168"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="inference_with_streams" vmsize="3068213" vmpeak="3068213" vmrss="1630309" vmhwm="1630309"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="CPU" path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="create_exenetwork" vmhwm="214182" vmpeak="1067034" vmrss="162011" vmsize="1014452"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="create_exenetwork" vmhwm="642766" vmpeak="975322" vmrss="606226" vmsize="938501"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="infer_request_inference" vmhwm="213876" vmpeak="1180764" vmrss="167460" vmsize="1095567"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="inference_with_streams" vmhwm="275449" vmpeak="1548892" vmrss="173654" vmsize="1444034"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="inference_with_streams" vmhwm="1581096" vmpeak="3063372" vmrss="1581096" vmsize="2978175"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="infer_request_inference" vmhwm="644373" vmpeak="1111749" vmrss="610048" vmsize="1026552"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="GPU" path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="infer_request_inference" vmhwm="1127287" vmpeak="1619753" vmrss="1127287" vmsize="1534556"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="GPU" path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="create_exenetwork" vmhwm="1110293" vmpeak="1441819" vmrss="1110293" vmsize="1441819"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="create_exenetwork" vmhwm="453237" vmpeak="1498151" vmrss="319966" vmsize="1361952"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="infer_request_inference" vmhwm="501009" vmpeak="1543474" vmrss="501009" vmsize="1458277"/> # values from {"target_branch": "releases/2020/2", "commit_date": "2020-05-14 11:19:36+00:00"} and *= 1.3
-        <model device="CPU" path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="inference_with_streams" vmhwm="598702" vmpeak="2144625" vmrss="518195" vmsize="1897833"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model device="GPU" path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="inference_with_streams" vmhwm="2218554" vmpeak="3692936" vmrss="2218554" vmsize="3607739"/> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <!--Models with FP16 precision-->
-        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="774368" vmpeak="856570" vmrss="27856" vmhwm="27856" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="676187" vmpeak="676187" vmrss="326419" vmhwm="326419" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="774768" vmpeak="774768" vmrss="27534" vmhwm="27534" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="761399" vmpeak="846596" vmrss="326102" vmhwm="326102" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="997094" vmpeak="1081891" vmrss="29863" vmhwm="29863" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2163439" vmpeak="2163439" vmrss="446446" vmhwm="446446" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="779688" vmpeak="781554" vmrss="30732" vmhwm="32406" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="686337" vmpeak="686337" vmrss="337142" vmhwm="337142" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="780088" vmpeak="781554" vmrss="31335" vmhwm="31995" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="771544" vmpeak="856741" vmrss="336486" vmhwm="336486" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1003688" vmpeak="1005154" vmrss="31064" vmhwm="33472" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2276934" vmpeak="2276934" vmrss="547066" vmhwm="547066" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1065381" vmpeak="1154712" vmrss="270160" vmhwm="359366" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="918075" vmpeak="918075" vmrss="576534" vmhwm="576534" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1076405" vmpeak="1154613" vmrss="320086" vmhwm="358763" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1009044" vmpeak="1094241" vmrss="581958" vmhwm="581958" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1555153" vmpeak="1629368" vmrss="346091" vmhwm="461931" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3271091" vmpeak="3271091" vmrss="1912060" vmhwm="1912060" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2924776" vmpeak="3108164" vmrss="599336" vmhwm="782584" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="3014091" vmpeak="3014091" vmrss="2663341" vmhwm="2663341" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="3198208" vmpeak="3283404" vmrss="2222818" vmhwm="2222818" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="3071499" vmpeak="3156696" vmrss="2639041" vmhwm="2721045" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="4590846" vmpeak="4864522" vmrss="1963416" vmhwm="1963504" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="7153026" vmpeak="7238238" vmrss="6072497" vmhwm="6156306" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1759586" vmpeak="1777599" vmrss="144970" vmhwm="162162" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1695085" vmpeak="1702792" vmrss="1348172" vmhwm="1356061" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2022254" vmpeak="2107450" vmrss="1042199" vmhwm="1042199" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1776476" vmpeak="1861672" vmrss="1344751" vmhwm="1429053" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="3171922" vmpeak="3257118" vmrss="1098869" vmhwm="1098952" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="5134792" vmpeak="5188055" vmrss="3846195" vmhwm="3899038" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="882190" vmpeak="912797" vmrss="123141" vmhwm="153342" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="762585" vmpeak="762585" vmrss="419967" vmhwm="419967" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="883074" vmpeak="912802" vmrss="128902" vmhwm="154200" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="848452" vmpeak="933649" vmrss="420404" vmhwm="420404" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1132112" vmpeak="1192557" vmrss="141700" vmhwm="194027" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2716984" vmpeak="2802181" vmrss="1221974" vmhwm="1221974" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1378374" vmpeak="1587180" vmrss="605836" vmhwm="814018" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1234464" vmpeak="1234464" vmrss="884899" vmhwm="884899" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1380210" vmpeak="1587149" vmrss="617817" vmhwm="814439" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1319786" vmpeak="1404982" vmrss="885560" vmhwm="885560" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1849338" vmpeak="2250357" vmrss="648830" vmhwm="1049375" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3811698" vmpeak="3811698" vmrss="2550262" vmhwm="2550262" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1503548" vmpeak="1762202" vmrss="680950" vmhwm="939224" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="913322" vmpeak="1017057" vmrss="570211" vmhwm="670888" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1691154" vmpeak="1776351" vmrss="758378" vmhwm="939244" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="961350" vmpeak="1046546" vmrss="534632" vmhwm="672131" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2000788" vmpeak="2323796" vmrss="773489" vmhwm="1207429" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2590172" vmpeak="2590172" vmrss="922043" vmhwm="929947" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1551461" vmpeak="1861038" vmrss="800410" vmhwm="1109804" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1110631" vmpeak="1226820" vmrss="760869" vmhwm="871114" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1552657" vmpeak="1861038" vmrss="803836" vmhwm="1111063" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1196114" vmpeak="1281311" vmrss="761581" vmhwm="871707" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2141859" vmpeak="2395593" vmrss="809166" vmhwm="1421019" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2691062" vmpeak="2776259" vmrss="977262" vmhwm="977262" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1035824" vmpeak="1116086" vmrss="259823" vmhwm="340054" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="891462" vmpeak="891462" vmrss="547424" vmhwm="547424" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1037238" vmpeak="1116076" vmrss="276151" vmhwm="340132" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="977433" vmpeak="1062630" vmrss="548522" vmhwm="548522" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1944160" vmpeak="2090587" vmrss="292708" vmhwm="433789" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3076684" vmpeak="3076684" vmrss="1819604" vmhwm="1819604" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1046744" vmpeak="1136075" vmrss="268034" vmhwm="357234" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="851505" vmpeak="851505" vmrss="509199" vmhwm="509199" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1052776" vmpeak="1135976" vmrss="296550" vmhwm="357115" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="941564" vmpeak="1026760" vmrss="514748" vmhwm="514748" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1508270" vmpeak="1587289" vmrss="316004" vmhwm="458530" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3152177" vmpeak="3233630" vmrss="1798908" vmhwm="1798908" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="840798" vmpeak="992888" vmrss="78468" vmhwm="94452" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="716539" vmpeak="716539" vmrss="374296" vmhwm="374296" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="841547" vmpeak="907696" vmrss="86585" vmhwm="95685" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="801678" vmpeak="886875" vmrss="374145" vmhwm="374145" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1087767" vmpeak="1111848" vmrss="97588" vmhwm="119438" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2517938" vmpeak="2517938" vmrss="1080170" vmhwm="1080170" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1076987" vmpeak="1162184" vmrss="645127" vmhwm="645127"/> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1226170" vmpeak="1311367" vmrss="111295" vmhwm="130343"/> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="988109"  vmpeak="988109" vmrss="640260" vmhwm="640260"/> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1044352" vmpeak="1074086" vmrss="100630" vmhwm="130213"/> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1127542" vmpeak="1184684" vmrss="134685" vmhwm="180518" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2532930" vmpeak="2618127" vmrss="1091636" vmhwm="1091636" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="876257" vmpeak="903994" vmrss="110328" vmhwm="137820" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="762814" vmpeak="762814" vmrss="418844" vmhwm="418844" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="877780" vmpeak="903994" vmrss="122860" vmhwm="137607" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="846804" vmpeak="932001" vmrss="417955" vmhwm="417955" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1130693" vmpeak="1175631" vmrss="133515" vmhwm="172666" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2705227" vmpeak="2705227" vmrss="1230247" vmhwm="1230247" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1158404" vmpeak="1199671" vmrss="284960" vmhwm="316331" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1090169" vmpeak="1090169" vmrss="748040" vmhwm="748040" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1340268" vmpeak="1425465" vmrss="295256" vmhwm="316243" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1174955" vmpeak="1260152" vmrss="748836" vmhwm="748836" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1894422" vmpeak="1978854" vmrss="364556" vmhwm="411538" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3708484" vmpeak="3793680" vmrss="2437198" vmhwm="2437198" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="879824" vmpeak="900775" vmrss="113276" vmhwm="133848" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="865040" vmpeak="865040" vmrss="513879" vmhwm="513879" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="881056" vmpeak="900780" vmrss="122569" vmhwm="134388" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="948448" vmpeak="1033645" vmrss="511222" vmhwm="511222" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1146620" vmpeak="1178491" vmrss="143202" vmhwm="172546" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3153675" vmpeak="3153675" vmrss="1832438" vmhwm="1832438" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2635412" vmpeak="3364982" vmrss="1851948" vmhwm="2581425" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1424566" vmpeak="2058456" vmrss="1075791" vmhwm="1663766" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2636920" vmpeak="3365169" vmrss="1886736" vmhwm="2581181" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1509118" vmpeak="2058446" vmrss="1074777" vmhwm="1663558" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="3078805" vmpeak="4353523" vmrss="1890600" vmhwm="3313570" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3006822" vmpeak="3443497" vmrss="1353014" vmhwm="1749815" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="935646" vmpeak="992565" vmrss="172806" vmhwm="229346" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="710621" vmpeak="710621" vmrss="367286" vmhwm="367286" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="938782" vmpeak="1016953" vmrss="190829" vmhwm="227635" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="795823" vmpeak="881020" vmrss="367759" vmhwm="367759" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1365078" vmpeak="1472234" vmrss="197392" vmhwm="289088" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2194129" vmpeak="2279326" vmrss="503079" vmhwm="503079" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1120262" vmpeak="1238073" vmrss="351130" vmhwm="468384" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="948682" vmpeak="948682" vmrss="606158" vmhwm="606158" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1121733" vmpeak="1238078" vmrss="362247" vmhwm="468681" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1034555" vmpeak="1119752" vmrss="607230" vmhwm="607230" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1570134" vmpeak="1653969" vmrss="380603" vmhwm="601588" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3171064" vmpeak="3256260" vmrss="1892207" vmhwm="1892207" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="967064" vmpeak="989695" vmrss="179519" vmhwm="194818" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="929947" vmpeak="929947" vmrss="587672" vmhwm="587672" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="967839" vmpeak="990693" vmrss="189586" vmhwm="194381" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1016173" vmpeak="1101370" vmrss="589997" vmhwm="589997" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1482457" vmpeak="1566890" vmrss="236246" vmhwm="255314" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3499163" vmpeak="3584360" vmrss="2225158" vmhwm="2225158" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="994411" vmpeak="1074840" vmrss="230219" vmhwm="310507" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="721042" vmpeak="745014" vmrss="379371" vmhwm="402266" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="997183" vmpeak="1074964" vmrss="249085" vmhwm="310112" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="806254" vmpeak="891451" vmrss="378778" vmhwm="401575" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1513642" vmpeak="1513642" vmrss="254410" vmhwm="393842" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2206718" vmpeak="2291915" vmrss="511539" vmhwm="535210" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2932846" vmpeak="3280570" vmrss="912085" vmhwm="1259705" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2849225" vmpeak="2849225" vmrss="2498324" vmhwm="2498324" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="3187501" vmpeak="3280570" vmrss="2252218" vmhwm="2252218" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2961342" vmpeak="3046539" vmrss="2534734" vmhwm="2534734" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="4833608" vmpeak="5373841" vmrss="2295441" vmhwm="2295441" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="7050212" vmpeak="7135408" vmrss="6047886" vmhwm="6047886" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="888565" vmpeak="921616" vmrss="129032" vmhwm="161517" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="898830" vmpeak="898830" vmrss="539156" vmhwm="539156" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="889777" vmpeak="921616" vmrss="134258" vmhwm="160269" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="984022" vmpeak="1069218" vmrss="539583" vmhwm="539583" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1320888" vmpeak="1404920" vmrss="148439" vmhwm="203138" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2982735" vmpeak="3067932" vmrss="1476103" vmhwm="1476103" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1349384" vmpeak="1451600" vmrss="415469" vmhwm="516890" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1366877" vmpeak="1366877" vmrss="1011322" vmhwm="1011322" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1357252" vmpeak="1451595" vmrss="450897" vmhwm="516469" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1452245" vmpeak="1537442" vmrss="1013376" vmhwm="1013376" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1783355" vmpeak="1952100" vmrss="518476" vmhwm="676613" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3918475" vmpeak="3918475" vmrss="2739126" vmhwm="2739126" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="898060" vmpeak="931569" vmrss="122912" vmhwm="155667" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="772272" vmpeak="772272" vmrss="428677" vmhwm="428677" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="899527" vmpeak="931600" vmrss="136900" vmhwm="155006" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="857287" vmpeak="942484" vmrss="428979" vmhwm="428979" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1341402" vmpeak="1468370" vmrss="146406" vmhwm="196976" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2723510" vmpeak="2808707" vmrss="1294716" vmhwm="1294716" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1177810" vmpeak="1311892" vmrss="406213" vmhwm="539843" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1036131" vmpeak="1036131" vmrss="684964" vmhwm="684964" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1179063" vmpeak="1311892" vmrss="420482" vmhwm="540300" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1121608" vmpeak="1206805" vmrss="686036" vmhwm="686036" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1634219" vmpeak="1912861" vmrss="443788" vmhwm="695728" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3383962" vmpeak="3383962" vmrss="2040521" vmhwm="2040521" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="965088" vmpeak="1018685" vmrss="202997" vmhwm="256037" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="916973" vmpeak="916973" vmrss="565890" vmhwm="565890" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="966342" vmpeak="1018622" vmrss="210184" vmhwm="255725" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1004426" vmpeak="1089623" vmrss="568110" vmhwm="568110" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1232332" vmpeak="1330227" vmrss="230911" vmhwm="328224" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3266042" vmpeak="3351238" vmrss="1993747" vmhwm="1993747" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2677183" vmpeak="2885105" vmrss="943675" vmhwm="1151456" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="5057847" vmpeak="5057847" vmrss="4707601" vmhwm="4707601" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2874799" vmpeak="2959996" vmrss="1924265" vmhwm="1924265" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="5137610" vmpeak="5222807" vmrss="4708199" vmhwm="4708199" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="4337824" vmpeak="4413661" vmrss="2072090" vmhwm="2072090" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="11111744" vmpeak="11196941" vmrss="9889755" vmhwm="9889755" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1498104" vmpeak="1582016" vmrss="269760" vmhwm="353418" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1482592" vmpeak="1511125" vmrss="1132164" vmhwm="1160614" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1510641" vmpeak="1582011" vmrss="525532" vmhwm="525532" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1590357" vmpeak="1675554" vmrss="1157743" vmhwm="1160218" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2418052" vmpeak="2503248" vmrss="548646" vmhwm="548646" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="4120417" vmpeak="4120417" vmrss="2880846" vmhwm="2880846" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="839857" vmpeak="860927" vmrss="84468" vmhwm="105367" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="685245" vmpeak="685245" vmrss="343122" vmhwm="343122" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="840772" vmpeak="915699" vmrss="90495" vmhwm="105757" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="770447" vmpeak="855644" vmrss="343064" vmhwm="343064" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1257646" vmpeak="1342078" vmrss="96080" vmhwm="129927" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2387673" vmpeak="2472870" vmrss="735675" vmhwm="735675" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1811336" vmpeak="2111257" vmrss="964756" vmhwm="1264224" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1681128" vmpeak="1681128" vmrss="1326785" vmhwm="1326785" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1812616" vmpeak="2111252" vmrss="979638" vmhwm="1264588" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1767344" vmpeak="1852541" vmrss="1329489" vmhwm="1329489" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2528822" vmpeak="2897705" vmrss="1057877" vmhwm="1635956" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="4243969" vmpeak="4329166" vmrss="3005828" vmhwm="3005828" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1186031" vmpeak="1319214" vmrss="399209" vmhwm="532006" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1073337" vmpeak="1073337" vmrss="722113" vmhwm="722113" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1193857" vmpeak="1319214" vmrss="423550" vmhwm="531601" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1154493" vmpeak="1239690" vmrss="724271" vmhwm="724271" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1671716" vmpeak="1921394" vmrss="447662" vmhwm="682884" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3476746" vmpeak="3476746" vmrss="2232698" vmhwm="2232698" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1550770" vmpeak="1860346" vmrss="800404" vmhwm="1109799" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1110933" vmpeak="1226820" vmrss="761009" vmhwm="871634" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1551966" vmpeak="1860346" vmrss="804024" vmhwm="1110210" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1196114" vmpeak="1281311" vmrss="761742" vmhwm="872180" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1778368" vmpeak="2394542" vmrss="808168" vmhwm="1421617" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2680620" vmpeak="2765817" vmrss="965718" vmhwm="965718" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1634323" vmpeak="1946230" vmrss="830637" vmhwm="1142278" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1208620" vmpeak="1208620" vmrss="866153" vmhwm="866153" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1732083" vmpeak="1946230" vmrss="877739" vmhwm="1142585" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1294254" vmpeak="1379450" vmrss="866398" vmhwm="866398" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2125702" vmpeak="2724066" vmrss="898617" vmhwm="1466467" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3262968" vmpeak="3348165" vmrss="1990310" vmhwm="1990310" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1178403" vmpeak="1240127" vmrss="259662" vmhwm="320377" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1123371" vmpeak="1123371" vmrss="781066" vmhwm="781066" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1419849" vmpeak="1505046" vmrss="482710" vmhwm="482710" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1206202" vmpeak="1291399" vmrss="779105" vmhwm="899714" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1886674" vmpeak="2022612" vmrss="553737" vmhwm="553909" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3526853" vmpeak="3647659" vmrss="2064795" vmhwm="2185164" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1070908" vmpeak="1186078" vmrss="315135" vmhwm="430112" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="841401" vmpeak="869367" vmrss="491472" vmhwm="518762" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1071309" vmpeak="1186078" vmrss="317558" vmhwm="430086" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="926603" vmpeak="1011800" vmrss="491779" vmhwm="518996" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1484033" vmpeak="1532372" vmrss="320080" vmhwm="546962" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2387054" vmpeak="2415020" vmrss="728010" vmhwm="755653" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1191361" vmpeak="1324039" vmrss="369855" vmhwm="501160" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="858031" vmpeak="858031" vmrss="514784" vmhwm="514784" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1199837" vmpeak="1324039" vmrss="437335" vmhwm="502288" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="938215" vmpeak="1023412" vmrss="513234" vmhwm="513234" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1689126" vmpeak="1765894" vmrss="445920" vmhwm="640291" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2809986" vmpeak="2895183" vmrss="1385077" vmhwm="1385077" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="946327" vmpeak="1002055" vmrss="181994" vmhwm="237198" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="862414" vmpeak="862414" vmrss="512699" vmhwm="512699" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="947570" vmpeak="1002055" vmrss="188832" vmhwm="237447" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="948220" vmpeak="1033416" vmrss="514124" vmhwm="514124" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1200212" vmpeak="1306557" vmrss="200720" vmhwm="302702" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2895323" vmpeak="2980520" vmrss="1505530" vmhwm="1505530" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1514874" vmpeak="1651982" vmrss="386032" vmhwm="521081" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1037181" vmpeak="1057316" vmrss="693685" vmhwm="713928" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1344740" vmpeak="1470742" vmrss="570778" vmhwm="570778" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1122388" vmpeak="1207585" vmrss="702613" vmhwm="713845" /> # values from {"commit_id": "af63cb78ee5cbd66bac0d0980db61cb11b5d9995", "commit_date": "2021-03-03 15:44"} and *= 1.3
-        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1965870" vmpeak="2031608" vmrss="586066" vmhwm="667435" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3227504" vmpeak="3312701" vmrss="1727762" vmhwm="1727762" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <!--Models with FP16-INT8 precision-->
-        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="885544" vmpeak="885544" vmrss="129781" vmhwm="129781" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2465132" vmpeak="2635526" vmrss="1446250" vmhwm="1465833" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="893807" vmpeak="893807" vmrss="135714" vmhwm="135714" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2550334" vmpeak="2635531" vmrss="1446759" vmhwm="1446759" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1148123" vmpeak="1196436" vmrss="140686" vmhwm="140686" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2950225" vmpeak="3035422" vmrss="1445251" vmhwm="1445251" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1310088" vmpeak="1395284" vmrss="123276" vmhwm="123276" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2591134" vmpeak="2591134" vmrss="982742" vmhwm="982742" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="792370" vmpeak="792370" vmrss="37861" vmhwm="37861" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1780521" vmpeak="1865718" vmrss="601000" vmhwm="601000" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="792370" vmpeak="792370" vmrss="38230" vmhwm="38230" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1865723" vmpeak="1950920" vmrss="642345" vmhwm="642345" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1019116" vmpeak="1019116" vmrss="38157" vmhwm="38157" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2265614" vmpeak="2265614" vmrss="602170" vmhwm="602170" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="893755" vmpeak="978952" vmrss="131445" vmhwm="131445" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2730733" vmpeak="2730733" vmrss="1729920" vmhwm="1729920" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="902018" vmpeak="902018" vmrss="138096" vmhwm="138096" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2815893" vmpeak="2901090" vmrss="1710623" vmhwm="1710623" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1164332" vmpeak="1241266" vmrss="143431" vmhwm="143431" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3215825" vmpeak="3301022" vmrss="1774479" vmhwm="1774479" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="849404" vmpeak="849404" vmrss="56726" vmhwm="56726" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2459282" vmpeak="2459282" vmrss="1550411" vmhwm="1550411" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="853340" vmpeak="865982" vmrss="68094" vmhwm="68094" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2544484" vmpeak="2544484" vmrss="1566063" vmhwm="1566063" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1133100" vmpeak="1137037" vmrss="80667" vmhwm="80735" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2963313" vmpeak="3048510" vmrss="1648358" vmhwm="1648358" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="2657168" vmpeak="2657168" vmrss="274622" vmhwm="274622" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="5240430" vmpeak="5257673" vmrss="4309396" vmhwm="4326670" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="2674266" vmpeak="2674412" vmrss="1809906" vmhwm="1809906" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="5333328" vmpeak="5418524" vmrss="4324949" vmhwm="4332837" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="4759565" vmpeak="4826260" vmrss="1842708" vmhwm="1842708" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="7976077" vmpeak="8061274" vmrss="6676467" vmhwm="6676467" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="829982" vmpeak="829982" vmrss="55286" vmhwm="55286" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2148983" vmpeak="2195653" vmrss="1118712" vmhwm="1118712" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="826789" vmpeak="826789" vmrss="60543" vmhwm="60543" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2234180" vmpeak="2319376" vmrss="1162678" vmhwm="1162678" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1265264" vmpeak="1350460" vmrss="67761" vmhwm="67766" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2634080" vmpeak="2719277" vmrss="1179495" vmhwm="1179495" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="822744" vmpeak="822744" vmrss="50767" vmhwm="50767" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2588523" vmpeak="2673720" vmrss="1565335" vmhwm="1565335" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="823513" vmpeak="823513" vmrss="52754" vmhwm="52754" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2674105" vmpeak="2674105" vmrss="1543583" vmhwm="1543583" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1079842" vmpeak="1083898" vmrss="60746" vmhwm="60746" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3074006" vmpeak="3074006" vmrss="1621989" vmhwm="1621989" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="782719" vmpeak="782719" vmrss="29837" vmhwm="29837" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1727991" vmpeak="1813188" vmrss="473813" vmhwm="473813" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="782761" vmpeak="782761" vmrss="29926" vmhwm="29926" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1813188" vmpeak="1813188" vmrss="473891" vmhwm="473891" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="922214" vmpeak="922214" vmrss="30581" vmhwm="30581" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2122567" vmpeak="2122567" vmrss="471250" vmhwm="471250" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="802380" vmpeak="802380" vmrss="44153" vmhwm="44153" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1998287" vmpeak="2083484" vmrss="823040" vmhwm="823040" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="802786" vmpeak="802786" vmrss="45354" vmhwm="45354" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2083796" vmpeak="2083796" vmrss="823300" vmhwm="823300" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1035855" vmpeak="1105010" vmrss="47668" vmhwm="47668" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2483379" vmpeak="2568576" vmrss="822302" vmhwm="822302" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="849508" vmpeak="849508" vmrss="47710" vmhwm="47710" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2695232" vmpeak="2695232" vmrss="1728064" vmhwm="1728064" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="849716" vmpeak="866164" vmrss="47840" vmhwm="47840" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2694842" vmpeak="2694842" vmrss="1675128" vmhwm="1675128" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1134499" vmpeak="1134499" vmrss="60236" vmhwm="60236" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3265158" vmpeak="3265158" vmrss="1998344" vmhwm="1998344" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="970314" vmpeak="970314" vmrss="105934" vmhwm="105934" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="3582056" vmpeak="3664590" vmrss="2753639" vmhwm="2753639" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="974849" vmpeak="974849" vmrss="116958" vmhwm="116958" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="3673290" vmpeak="3673290" vmrss="2742667" vmhwm="2742667" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1534561" vmpeak="1619758" vmrss="151304" vmhwm="151320" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="4325380" vmpeak="4410577" vmrss="3104498" vmhwm="3104498" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="983632" vmpeak="983632" vmrss="109252" vmhwm="109252" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="3812941" vmpeak="3960954" vmrss="2980400" vmhwm="2980400" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="988312" vmpeak="988312" vmrss="119958" vmhwm="119958" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="3911720" vmpeak="3961188" vmrss="2996791" vmhwm="2996791" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1558356" vmpeak="1643033" vmrss="157487" vmhwm="157487" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="4676755" vmpeak="4701684" vmrss="3435057" vmhwm="3435057" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="970314" vmpeak="970314" vmrss="106147" vmhwm="106147" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="3587100" vmpeak="3659390" vmrss="2743769" vmhwm="2743769" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="974766" vmpeak="974766" vmrss="117317" vmhwm="117317" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="3668074" vmpeak="3668074" vmrss="2713178" vmhwm="2713178" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1534556" vmpeak="1619581" vmrss="151174" vmhwm="151174" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="4400063" vmpeak="4400063" vmrss="3155687" vmhwm="3155687" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="948370" vmpeak="948370" vmrss="90682" vmhwm="90682" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="3313632" vmpeak="3313632" vmrss="2519296" vmhwm="2519296" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="949925" vmpeak="949925" vmrss="94858" vmhwm="94858" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="3403519" vmpeak="3403519" vmrss="2528307" vmhwm="2528307" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1300166" vmpeak="1300166" vmrss="109844" vmhwm="109844" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="975223" vmpeak="975223" vmrss="105674" vmhwm="105674" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="3494691" vmpeak="3659120" vmrss="2689824" vmhwm="2689824" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="979659" vmpeak="979659" vmrss="117114" vmhwm="117114" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="3671070" vmpeak="3671070" vmrss="2732964" vmhwm="2732964" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1363726" vmpeak="1367870" vmrss="151372" vmhwm="151372" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="4397369" vmpeak="4482566" vmrss="3111362" vmhwm="3111362" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="897639" vmpeak="897639" vmrss="75368" vmhwm="75368" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="906354" vmpeak="906354" vmrss="93522" vmhwm="93522" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1511218" vmpeak="1511218" vmrss="116854" vmhwm="116854" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="875414" vmpeak="875414" vmrss="67059" vmhwm="67059" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2805062" vmpeak="2805062" vmrss="1880018" vmhwm="1880018" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="878077" vmpeak="878077" vmrss="73642" vmhwm="73642" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2890258" vmpeak="2890258" vmrss="1882530" vmhwm="1882530" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1179396" vmpeak="1182053" vmrss="92674" vmhwm="92674" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3306128" vmpeak="3391325" vmrss="2013507" vmhwm="2013507" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="933992" vmpeak="933992" vmrss="113141" vmhwm="113141" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2829632" vmpeak="2914828" vmrss="1889518" vmhwm="1889518" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="949993" vmpeak="949993" vmrss="140363" vmhwm="140363" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2831748" vmpeak="2916945" vmrss="1875369" vmhwm="1875369" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1914915" vmpeak="1983940" vmrss="174584" vmhwm="174584" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3521944" vmpeak="3521944" vmrss="2246774" vmhwm="2246774" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="858566" vmpeak="858566" vmrss="73273" vmhwm="73273" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2346910" vmpeak="2346910" vmrss="1454190" vmhwm="1454190" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="862565" vmpeak="862565" vmrss="86652" vmhwm="86652" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2517304" vmpeak="2517304" vmrss="1446536" vmhwm="1446536" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1320878" vmpeak="1406074" vmrss="98649" vmhwm="98649" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2865995" vmpeak="2865995" vmrss="1462562" vmhwm="1462562" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="977163" vmpeak="977163" vmrss="64308" vmhwm="64308" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2221372" vmpeak="2221372" vmrss="1074704" vmhwm="1074704" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1042324" vmpeak="1042324" vmrss="280685" vmhwm="280685" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2364512" vmpeak="2449709" vmrss="1131036" vmhwm="1131036" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1641416" vmpeak="1726613" vmrss="315650" vmhwm="315770" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3144986" vmpeak="3198592" vmrss="1512544" vmhwm="1512544" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1037618" vmpeak="1051611" vmrss="178412" vmhwm="178412" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2414973" vmpeak="2414973" vmrss="1273100" vmhwm="1273100" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1051081" vmpeak="1051611" vmrss="290862" vmhwm="290862" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2499572" vmpeak="2584769" vmrss="1273074" vmhwm="1273074" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1572313" vmpeak="1583082" vmrss="299561" vmhwm="299561" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3065337" vmpeak="3065337" vmrss="1437290" vmhwm="1437290" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="787612" vmpeak="787612" vmrss="32562" vmhwm="32562" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1815481" vmpeak="1815481" vmrss="604000" vmhwm="604000" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="787612" vmpeak="787612" vmrss="32162" vmhwm="32162" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1900678" vmpeak="1985874" vmrss="601395" vmhwm="601395" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1015294" vmpeak="1096165" vmrss="33872" vmhwm="33872" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2311223" vmpeak="2311223" vmrss="602711" vmhwm="602711" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="841505" vmpeak="841505" vmrss="54293" vmhwm="54293" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2370669" vmpeak="2370669" vmrss="1419111" vmhwm="1419111" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="850766" vmpeak="850766" vmrss="66960" vmhwm="66960" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2452408" vmpeak="2537605" vmrss="1420026" vmhwm="1420026" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1751817" vmpeak="1755754" vmrss="76861" vmhwm="76861" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2892208" vmpeak="2977405" vmrss="1531285" vmhwm="1531285" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="993964" vmpeak="993964" vmrss="228415" vmhwm="228415" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2324618" vmpeak="2324618" vmrss="1278695" vmhwm="1278695" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="996559" vmpeak="996559" vmrss="237660" vmhwm="237660" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2409815" vmpeak="2495012" vmrss="1278576" vmhwm="1278576" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1421212" vmpeak="1421212" vmrss="242694" vmhwm="242694" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2809752" vmpeak="2894949" vmrss="1276932" vmhwm="1296672" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="993964" vmpeak="1101063" vmrss="228228" vmhwm="228228" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2239421" vmpeak="2324618" vmrss="1239388" vmhwm="1239388" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="996600" vmpeak="996600" vmrss="237114" vmhwm="237114" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2324618" vmpeak="2324618" vmrss="1240818" vmhwm="1240818" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1421212" vmpeak="1506408" vmrss="242533" vmhwm="242533" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2724555" vmpeak="2724555" vmrss="1238447" vmhwm="1238447" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="846742" vmpeak="846742" vmrss="90225" vmhwm="90225" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1840477" vmpeak="1925674" vmrss="597381" vmhwm="597381" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="849383" vmpeak="919552" vmrss="95300" vmhwm="95300" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1925684" vmpeak="1925684" vmrss="597448" vmhwm="597448" /> # values from {"commit_id": "ce67c414833cddd447acc7573b99c8ebc6a1591e", "commit_date": "2021-04-21 14:41"} and *= 1.3
-        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1259481" vmpeak="1328984" vmrss="99751" vmhwm="99751" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
-        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2325580" vmpeak="2410777" vmrss="597058" vmhwm="597058" /> # values from {"commit_id": "f4d9d6a8c750d644b065f464548a5770ad8e2728", "commit_date": "2021-04-23 16:12"} and *= 1.3
+        # Values from {"commit_id": "a92a737ba0ce5afd6df2da8d80c8deec7e11b1d9", "commit_date": "2021-07-16 13:30"} and *= 1.3
+        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="991697" vmpeak="1020754" vmrss="92144" vmhwm="92144" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2017256" vmpeak="2041504" vmrss="587386" vmhwm="908013" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1186333" vmpeak="1263267" vmrss="97557" vmhwm="97557" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2102505" vmpeak="2187702" vmrss="592789" vmhwm="910946" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1141389" vmpeak="1141389" vmrss="124134" vmhwm="124134" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-decoder/FP16-INT8/action-recognition-0001-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2198736" vmpeak="2283933" vmrss="592550" vmhwm="911638" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="971843" vmpeak="1007110" vmrss="85384" vmhwm="85384" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2056979" vmpeak="2083208" vmrss="497520" vmhwm="689405" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1153666" vmpeak="1238094" vmrss="88238" vmhwm="88238" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2136165" vmpeak="2221362" vmrss="475378" vmhwm="692338" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1121036" vmpeak="1121806" vmrss="120837" vmhwm="120837" />
+        <model path="intel/action-recognition-0001/action-recognition-0001-encoder/FP16-INT8/action-recognition-0001-encoder.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2232016" vmpeak="2317213" vmrss="451542" vmhwm="686946" />
+        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="904274" vmpeak="904274" vmrss="33446" vmhwm="33446" />
+        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1843992" vmpeak="1869348" vmrss="272173" vmhwm="444511" />
+        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="904295" vmpeak="904295" vmrss="33576" vmhwm="33576" />
+        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1928664" vmpeak="2013861" vmrss="272994" vmhwm="444870" />
+        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1012648" vmpeak="1012648" vmrss="38703" vmhwm="38703" />
+        <model path="intel/age-gender-recognition-retail-0013/FP16-INT8/age-gender-recognition-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2025036" vmpeak="2025036" vmrss="275095" vmhwm="444948" />
+        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="987792" vmpeak="1020614" vmrss="90958" vmhwm="90958" />
+        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2042981" vmpeak="2047141" vmrss="684637" vmhwm="1082634" />
+        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="996054" vmpeak="996054" vmrss="97437" vmhwm="97437" />
+        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2106728" vmpeak="2191924" vmrss="685302" vmhwm="1082931" />
+        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1134510" vmpeak="1134510" vmrss="123999" vmhwm="123999" />
+        <model path="intel/driver-action-recognition-adas-0002/driver-action-recognition-adas-0002-decoder/FP16-INT8/driver-action-recognition-adas-0002-decoder.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2203037" vmpeak="2288234" vmrss="691584" vmhwm="1086186" />
+        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="953472" vmpeak="953472" vmrss="46971" vmhwm="46971" />
+        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1922746" vmpeak="1923162" vmrss="593216" vmhwm="972977" />
+        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="957413" vmpeak="957413" vmrss="53492" vmhwm="53492" />
+        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2018380" vmpeak="2103576" vmrss="583185" vmhwm="947455" />
+        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1108400" vmpeak="1112337" vmrss="68260" vmhwm="68260" />
+        <model path="intel/face-detection-adas-0001/FP16-INT8/face-detection-adas-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2153018" vmpeak="2238215" vmrss="682832" vmhwm="975738" />
+        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="2671302" vmpeak="2671302" vmrss="204802" vmhwm="204802" />
+        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="4467044" vmpeak="4467044" vmrss="3262246" vmhwm="3262246" />
+        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="2869167" vmpeak="2953158" vmrss="1736451" vmhwm="1736451" />
+        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="4556806" vmpeak="4642003" vmrss="3289228" vmhwm="3289228" />
+        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="4667946" vmpeak="4750439" vmrss="1837128" vmhwm="1837128" />
+        <model path="intel/faster-rcnn-resnet101-coco-sparse-60-0001/FP16-INT8/faster-rcnn-resnet101-coco-sparse-60-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="6565946" vmpeak="6651143" vmrss="5227102" vmhwm="5227102" />
+        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="939816" vmpeak="984178" vmrss="46618" vmhwm="46618" />
+        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1939158" vmpeak="1943188" vmrss="485128" vmhwm="767988" />
+        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="941621" vmpeak="941621" vmrss="51168" vmhwm="51168" />
+        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2018276" vmpeak="2103472" vmrss="477120" vmhwm="744447" />
+        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1259580" vmpeak="1344184" vmrss="66222" vmhwm="66222" />
+        <model path="intel/human-pose-estimation-0001/FP16-INT8/human-pose-estimation-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2139228" vmpeak="2224424" vmrss="507405" vmhwm="764634" />
+        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="938875" vmpeak="938875" vmrss="44480" vmhwm="44480" />
+        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1925804" vmpeak="1949838" vmrss="597656" vmhwm="1006558" />
+        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="939666" vmpeak="939666" vmrss="45905" vmhwm="45905" />
+        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2010569" vmpeak="2095766" vmrss="603959" vmhwm="982862" />
+        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1077174" vmpeak="1077944" vmrss="57236" vmhwm="57236" />
+        <model path="intel/image-retrieval-0001/FP16-INT8/image-retrieval-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2110050" vmpeak="2195247" vmrss="605082" vmhwm="977121" />
+        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="898024" vmpeak="898024" vmrss="26774" vmhwm="26774" />
+        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1845022" vmpeak="1871490" vmrss="229418" vmhwm="344151" />
+        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="903156" vmpeak="974376" vmrss="27279" vmhwm="27279" />
+        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1930765" vmpeak="2015962" vmrss="230198" vmhwm="344370" />
+        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1002034" vmpeak="1002034" vmrss="28922" vmhwm="28922" />
+        <model path="intel/landmarks-regression-retail-0009/FP16-INT8/landmarks-regression-retail-0009.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2032295" vmpeak="2117492" vmrss="230531" vmhwm="345342" />
+        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="913338" vmpeak="981167" vmrss="36415" vmhwm="36415" />
+        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1899773" vmpeak="1904687" vmrss="354510" vmhwm="555734" />
+        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="913738" vmpeak="981167" vmrss="41033" vmhwm="41033" />
+        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1984772" vmpeak="1984772" vmrss="379402" vmhwm="580434" />
+        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1030702" vmpeak="1030702" vmrss="46139" vmhwm="46139" />
+        <model path="intel/license-plate-recognition-barrier-0001/FP16-INT8/license-plate-recognition-barrier-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2059610" vmpeak="2144807" vmrss="402916" vmhwm="579800" />
+        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="961485" vmpeak="981120" vmrss="42525" vmhwm="42525" />
+        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1934670" vmpeak="1957597" vmrss="642756" vmhwm="1140750" />
+        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="961500" vmpeak="961500" vmrss="44392" vmhwm="44392" />
+        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2019097" vmpeak="2019097" vmrss="619580" vmhwm="1136980" />
+        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1122565" vmpeak="1122565" vmrss="54464" vmhwm="54464" />
+        <model path="intel/person-attributes-recognition-crossroad-0230/FP16-INT8/person-attributes-recognition-crossroad-0230.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2115266" vmpeak="2115266" vmrss="647426" vmhwm="1134718" />
+        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1074814" vmpeak="1074814" vmrss="88452" vmhwm="88452" />
+        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2743062" vmpeak="2763290" vmrss="1681264" vmhwm="2056142" />
+        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1078911" vmpeak="1078911" vmrss="93225" vmhwm="93225" />
+        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2829013" vmpeak="2914210" vmrss="1684462" vmhwm="2072168" />
+        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1331330" vmpeak="1335474" vmrss="126781" vmhwm="126781" />
+        <model path="intel/person-detection-action-recognition-0005/FP16-INT8/person-detection-action-recognition-0005.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2959158" vmpeak="3044355" vmrss="1721330" vmhwm="2066324" />
+        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1093856" vmpeak="1093856" vmrss="91852" vmhwm="91852" />
+        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="3026670" vmpeak="3046903" vmrss="1968860" vmhwm="2354736" />
+        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1098016" vmpeak="1098016" vmrss="102190" vmhwm="102190" />
+        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="3112090" vmpeak="3197287" vmrss="1981917" vmhwm="2363608" />
+        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1367927" vmpeak="1372072" vmrss="137696" vmhwm="137696" />
+        <model path="intel/person-detection-action-recognition-0006/FP16-INT8/person-detection-action-recognition-0006.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3240198" vmpeak="3240198" vmrss="2008375" vmhwm="2362521" />
+        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1074772" vmpeak="1074772" vmrss="87604" vmhwm="87604" />
+        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2742277" vmpeak="2762510" vmrss="1678019" vmhwm="2070738" />
+        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1078958" vmpeak="1078958" vmrss="93584" vmhwm="93584" />
+        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2822476" vmpeak="2907673" vmrss="1663017" vmhwm="2058227" />
+        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1512357" vmpeak="1597346" vmrss="126666" vmhwm="126666" />
+        <model path="intel/person-detection-action-recognition-teacher-0002/FP16-INT8/person-detection-action-recognition-teacher-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2953698" vmpeak="3038895" vmrss="1709531" vmhwm="2073838" />
+        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1069603" vmpeak="1069603" vmrss="79658" vmhwm="79658" />
+        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2425540" vmpeak="2445773" vmrss="1316775" vmhwm="1781587" />
+        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1069629" vmpeak="1069629" vmrss="80371" vmhwm="80371" />
+        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2511896" vmpeak="2597093" vmrss="1351994" vmhwm="1781400" />
+        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1316905" vmpeak="1316905" vmrss="104332" vmhwm="104332" />
+        <model path="intel/person-detection-asl-0001/FP16-INT8/person-detection-asl-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2607451" vmpeak="2607451" vmrss="1374937" vmhwm="1782138" />
+        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1079280" vmpeak="1079280" vmrss="87469" vmhwm="87469" />
+        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2739271" vmpeak="2759499" vmrss="1667624" vmhwm="2055014" />
+        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1083425" vmpeak="1083425" vmrss="92372" vmhwm="92372" />
+        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2819606" vmpeak="2819606" vmrss="1679277" vmhwm="2052653" />
+        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1341215" vmpeak="1345359" vmrss="127389" vmhwm="127389" />
+        <model path="intel/person-detection-raisinghand-recognition-0001/FP16-INT8/person-detection-raisinghand-recognition-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2951806" vmpeak="3037002" vmrss="1709702" vmhwm="2068190" />
+        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1016345" vmpeak="1016345" vmrss="65041" vmhwm="65041" />
+        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2129472" vmpeak="2134132" vmrss="973185" vmhwm="1436812" />
+        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1024571" vmpeak="1024571" vmrss="84791" vmhwm="84791" />
+        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2228007" vmpeak="2228007" vmrss="987209" vmhwm="1437711" />
+        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1415507" vmpeak="1500704" vmrss="109579" vmhwm="109636" />
+        <model path="intel/person-detection-retail-0002/FP16-INT8/person-detection-retail-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2375094" vmpeak="2460291" vmrss="1038752" vmhwm="1435631" />
+        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="984973" vmpeak="988312" vmrss="57933" vmhwm="57933" />
+        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2046600" vmpeak="2070213" vmrss="776110" vmhwm="1239456" />
+        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="987630" vmpeak="987630" vmrss="60923" vmhwm="60923" />
+        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2131043" vmpeak="2131043" vmrss="773370" vmhwm="1232680" />
+        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1164971" vmpeak="1167628" vmrss="80022" vmhwm="80022" />
+        <model path="intel/person-detection-retail-0013/FP16-INT8/person-detection-retail-0013.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2235350" vmpeak="2235350" vmrss="778523" vmhwm="1235161" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1016012" vmpeak="1016012" vmrss="84682" vmhwm="84682" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2086245" vmpeak="2088216" vmrss="855353" vmhwm="1342120" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1031976" vmpeak="1031976" vmrss="105632" vmhwm="105632" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2190994" vmpeak="2276190" vmrss="866829" vmhwm="1328501" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1235972" vmpeak="1251952" vmrss="149141" vmhwm="149141" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-0078/FP16-INT8/person-vehicle-bike-detection-crossroad-0078.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2334618" vmpeak="2334618" vmrss="939302" vmhwm="1331090" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="958713" vmpeak="958713" vmrss="55172" vmhwm="55172" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1970654" vmpeak="1970654" vmrss="580944" vmhwm="847376" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="962722" vmpeak="962722" vmrss="65306" vmhwm="65306" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2060442" vmpeak="2145639" vmrss="583564" vmhwm="850070" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1115462" vmpeak="1119461" vmrss="83964" vmhwm="83964" />
+        <model path="intel/person-vehicle-bike-detection-crossroad-1016/FP16-INT8/person-vehicle-bike-detection-crossroad-1016.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2205117" vmpeak="2205117" vmrss="637000" vmhwm="843008" />
+        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1106752" vmpeak="1106752" vmrss="61453" vmhwm="61453" />
+        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2191248" vmpeak="2191248" vmrss="620916" vmhwm="620916" />
+        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1171903" vmpeak="1171903" vmrss="293108" vmhwm="293108" />
+        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2341128" vmpeak="2426325" vmrss="675906" vmhwm="675906" />
+        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1664858" vmpeak="1750054" vmrss="328120" vmhwm="329108" />
+        <model path="intel/single-image-super-resolution-1032/FP16-INT8/single-image-super-resolution-1032.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2808405" vmpeak="2862012" vmrss="1053499" vmhwm="1053499" />
+        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1313826" vmpeak="1399023" vmrss="142360" vmhwm="142360" />
+        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2452366" vmpeak="2452366" vmrss="868036" vmhwm="868036" />
+        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1327289" vmpeak="1456114" vmrss="268013" vmhwm="268013" />
+        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2532270" vmpeak="2617466" vmrss="867344" vmhwm="867344" />
+        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1587289" vmpeak="1740538" vmrss="304246" vmhwm="304480" />
+        <model path="intel/unet-camvid-onnx-0001/FP16-INT8/unet-camvid-onnx-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="3006556" vmpeak="3083678" vmrss="1228546" vmhwm="1228546" />
+        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="900432" vmpeak="975312" vmrss="28756" vmhwm="28756" />
+        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1859228" vmpeak="1882197" vmrss="244883" vmhwm="410867" />
+        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="900432" vmpeak="900432" vmrss="29312" vmhwm="29312" />
+        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="1940302" vmpeak="2025498" vmrss="247665" vmhwm="413498" />
+        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1006241" vmpeak="1006241" vmrss="30877" vmhwm="30877" />
+        <model path="intel/vehicle-attributes-recognition-barrier-0039/FP16-INT8/vehicle-attributes-recognition-barrier-0039.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2040506" vmpeak="2040506" vmrss="248866" vmhwm="411886" />
+        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="946394" vmpeak="946394" vmrss="46238" vmhwm="46238" />
+        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1912024" vmpeak="1912497" vmrss="573518" vmhwm="914555" />
+        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="950320" vmpeak="982436" vmrss="54329" vmhwm="54329" />
+        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2004069" vmpeak="2089266" vmrss="560768" vmhwm="867037" />
+        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1094984" vmpeak="1098921" vmrss="68026" vmhwm="68026" />
+        <model path="intel/vehicle-detection-adas-0002/FP16-INT8/vehicle-detection-adas-0002.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2144334" vmpeak="2229531" vmrss="605508" vmhwm="884655" />
+        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1045829" vmpeak="1045829" vmrss="161018" vmhwm="161018" />
+        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2375412" vmpeak="2411536" vmrss="751181" vmhwm="1053364" />
+        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1229524" vmpeak="1229524" vmrss="169993" vmhwm="169993" />
+        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2460582" vmpeak="2545779" vmrss="787394" vmhwm="1060560" />
+        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1416365" vmpeak="1501562" vmrss="241025" vmhwm="241025" />
+        <model path="intel/yolo-v2-ava-0001/FP16-INT8/yolo-v2-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2556434" vmpeak="2641631" vmrss="810035" vmhwm="1051336" />
+        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="1045834" vmpeak="1045834" vmrss="160570" vmhwm="160570" />
+        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="2375386" vmpeak="2411510" vmrss="777675" vmhwm="1048928" />
+        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1048491" vmpeak="1120397" vmrss="169426" vmhwm="169426" />
+        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2460619" vmpeak="2545816" vmrss="778388" vmhwm="1051492" />
+        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1416521" vmpeak="1501718" vmrss="240994" vmhwm="240994" />
+        <model path="intel/yolo-v2-ava-sparse-35-0001/FP16-INT8/yolo-v2-ava-sparse-35-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2556470" vmpeak="2641667" vmrss="793582" vmhwm="1049058" />
+        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="CPU" vmsize="941803" vmpeak="941803" vmrss="69201" vmhwm="69201" />
+        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="create_exenetwork" device="GPU" vmsize="1983768" vmpeak="2007907" vmrss="381274" vmhwm="472711" />
+        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="CPU" vmsize="1125498" vmpeak="1210695" vmrss="73169" vmhwm="73169" />
+        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="infer_request_inference" device="GPU" vmsize="2068965" vmpeak="2068965" vmrss="382564" vmhwm="473543" />
+        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="CPU" vmsize="1072890" vmpeak="1075531" vmrss="98389" vmhwm="98389" />
+        <model path="intel/yolo-v2-tiny-ava-0001/FP16-INT8/yolo-v2-tiny-ava-0001.xml" precision="FP16-INT8" test="inference_with_streams" device="GPU" vmsize="2164817" vmpeak="2250014" vmrss="385455" vmhwm="473413" />
+        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1287322" vmpeak="1287322" vmrss="405485" vmhwm="405485" />
+        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1996836" vmpeak="2081289" vmrss="426134" vmhwm="592046" />
+        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1287722" vmpeak="1287722" vmrss="408948" vmhwm="408948" />
+        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2086104" vmpeak="2171301" vmrss="448952" vmhwm="617328" />
+        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1606805" vmpeak="1691601" vmrss="433867" vmhwm="433867" />
+        <model path="public/Sphereface/FP16/Sphereface.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2175836" vmpeak="2261032" vmrss="406463" vmhwm="568890" />
+        <model path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1138176" vmpeak="1138176" vmrss="255710" vmhwm="255710" />
+        <model path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2148281" vmpeak="2311311" vmrss="564454" vmhwm="796863" />
+        <model path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1319630" vmpeak="1404426" vmrss="259636" vmhwm="259636" />
+        <model path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2235058" vmpeak="2320255" vmrss="543436" vmhwm="767738" />
+        <model path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1554867" vmpeak="1639664" vmrss="376485" vmhwm="376485" />
+        <model path="public/Sphereface/FP32/Sphereface.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2330010" vmpeak="2415207" vmrss="545615" vmhwm="771565" />
+        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1866129" vmpeak="1866129" vmrss="994520" vmhwm="994520" />
+        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2319610" vmpeak="2480446" vmrss="708827" vmhwm="848853" />
+        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1867335" vmpeak="1867335" vmrss="998124" vmhwm="998124" />
+        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2404807" vmpeak="2490004" vmrss="709701" vmhwm="849154" />
+        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1980446" vmpeak="1981231" vmrss="1009444" vmhwm="1009444" />
+        <model path="public/alexnet/FP16/alexnet.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2596864" vmpeak="2682061" vmrss="807097" vmhwm="852155" />
+        <model path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1410427" vmpeak="1410427" vmrss="538699" vmhwm="538699" />
+        <model path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2710333" vmpeak="3100749" vmrss="1079306" vmhwm="1440296" />
+        <model path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1592687" vmpeak="1677483" vmrss="542739" vmhwm="542739" />
+        <model path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2794318" vmpeak="3100702" vmrss="1079868" vmhwm="1441736" />
+        <model path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2097404" vmpeak="2098189" vmrss="855550" vmhwm="855550" />
+        <model path="public/alexnet/FP32/alexnet.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3103984" vmpeak="3196575" vmrss="1297790" vmhwm="1441346" />
+        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2756067" vmpeak="2756067" vmrss="728400" vmhwm="728400" />
+        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="3656920" vmpeak="3656920" vmrss="2576542" vmhwm="2576542" />
+        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="3029384" vmpeak="3029384" vmrss="1885780" vmhwm="1885780" />
+        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="3741670" vmpeak="3826867" vmrss="2550085" vmhwm="2633061" />
+        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="4408804" vmpeak="4494011" vmrss="2004210" vmhwm="2004210" />
+        <model path="public/brain-tumor-segmentation-0001/FP16/brain-tumor-segmentation-0001.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="5380268" vmpeak="5465480" vmrss="4111598" vmhwm="4196514" />
+        <model path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="2514335" vmpeak="2514335" vmrss="485040" vmhwm="485040" />
+        <model path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="5519477" vmpeak="5519477" vmrss="4423853" vmhwm="4423853" />
+        <model path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="2787652" vmpeak="2872849" vmrss="1642518" vmhwm="1642518" />
+        <model path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="5608704" vmpeak="5693901" vmrss="4406594" vmhwm="4482212" />
+        <model path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="4765904" vmpeak="4851111" vmrss="1908644" vmhwm="1908644" />
+        <model path="public/brain-tumor-segmentation-0001/FP32/brain-tumor-segmentation-0001.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="8912529" vmpeak="8997742" vmrss="7661456" vmhwm="7746377" />
+        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1910786" vmpeak="1910786" vmrss="146354" vmhwm="146354" />
+        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2791230" vmpeak="2791230" vmrss="1513553" vmhwm="1513553" />
+        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2173454" vmpeak="2258651" vmrss="1042849" vmhwm="1042849" />
+        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2878990" vmpeak="2964187" vmrss="1505805" vmhwm="1590258" />
+        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="3238690" vmpeak="3323886" vmrss="1112503" vmhwm="1112836" />
+        <model path="public/brain-tumor-segmentation-0002/FP16/brain-tumor-segmentation-0002.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="3918012" vmpeak="4003225" vmrss="2457884" vmhwm="2542716" />
+        <model path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1894162" vmpeak="1894162" vmrss="128939" vmhwm="128939" />
+        <model path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="3650873" vmpeak="3650873" vmrss="2354716" vmhwm="2354716" />
+        <model path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="2156814" vmpeak="2245588" vmrss="1026880" vmhwm="1026880" />
+        <model path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="3731681" vmpeak="3816878" vmrss="2366618" vmhwm="2449782" />
+        <model path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="3228763" vmpeak="3313960" vmrss="1102192" vmhwm="1102805" />
+        <model path="public/brain-tumor-segmentation-0002/FP32/brain-tumor-segmentation-0002.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="5584758" vmpeak="5669970" vmrss="4130126" vmhwm="4215234" />
+        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1863622" vmpeak="1863622" vmrss="992560" vmhwm="992560" />
+        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2320214" vmpeak="2481050" vmrss="708780" vmhwm="851458" />
+        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1864834" vmpeak="1864834" vmrss="996335" vmhwm="996335" />
+        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2405312" vmpeak="2490508" vmrss="707028" vmhwm="850777" />
+        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1979062" vmpeak="2147272" vmrss="1008898" vmhwm="1008898" />
+        <model path="public/caffenet/FP16/caffenet.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2596859" vmpeak="2682056" vmrss="806967" vmhwm="850548" />
+        <model path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1409730" vmpeak="1409730" vmrss="539401" vmhwm="539401" />
+        <model path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2708596" vmpeak="3099012" vmrss="1056333" vmhwm="1442147" />
+        <model path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1410942" vmpeak="1410942" vmrss="542209" vmhwm="542209" />
+        <model path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2794235" vmpeak="3100619" vmrss="1080539" vmhwm="1441460" />
+        <model path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1824440" vmpeak="1825226" vmrss="854365" vmhwm="854365" />
+        <model path="public/caffenet/FP32/caffenet.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3104025" vmpeak="3196616" vmrss="1295985" vmhwm="1441315" />
+        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1222306" vmpeak="1222306" vmrss="302255" vmhwm="302255" />
+        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1982245" vmpeak="1999660" vmrss="625601" vmhwm="1096940" />
+        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1409361" vmpeak="1494558" vmrss="331500" vmhwm="331500" />
+        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2072449" vmpeak="2072449" vmrss="640104" vmhwm="1077991" />
+        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1625124" vmpeak="1710061" vmrss="395668" vmhwm="395668" />
+        <model path="public/ctdet_coco_dlav0_384/FP16/ctdet_coco_dlav0_384.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2232453" vmpeak="2313906" vmrss="710814" vmhwm="1077315" />
+        <model path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1139257" vmpeak="1139257" vmrss="218977" vmhwm="218977" />
+        <model path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2159206" vmpeak="2180484" vmrss="829935" vmhwm="1202359" />
+        <model path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1326312" vmpeak="1411508" vmrss="248024" vmhwm="248024" />
+        <model path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2245817" vmpeak="2331014" vmrss="825203" vmhwm="1206249" />
+        <model path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1580420" vmpeak="1665617" vmrss="350963" vmhwm="351119" />
+        <model path="public/ctdet_coco_dlav0_384/FP32/ctdet_coco_dlav0_384.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2471809" vmpeak="2553262" vmrss="957522" vmhwm="1204455" />
+        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1240943" vmpeak="1240943" vmrss="304064" vmhwm="304064" />
+        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2038566" vmpeak="2087264" vmrss="680274" vmhwm="1115956" />
+        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1432990" vmpeak="1432990" vmrss="355217" vmhwm="355217" />
+        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2132109" vmpeak="2217306" vmrss="693284" vmhwm="1114786" />
+        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1667463" vmpeak="1752327" vmrss="421470" vmhwm="421470" />
+        <model path="public/ctdet_coco_dlav0_512/FP16/ctdet_coco_dlav0_512.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2342012" vmpeak="2420553" vmrss="805828" vmhwm="1105780" />
+        <model path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1157894" vmpeak="1157894" vmrss="220766" vmhwm="220766" />
+        <model path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2254428" vmpeak="2254428" vmrss="912740" vmhwm="1246185" />
+        <model path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1349608" vmpeak="1481355" vmrss="270696" vmhwm="270696" />
+        <model path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2345886" vmpeak="2345886" vmrss="888997" vmhwm="1246304" />
+        <model path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1622353" vmpeak="1707550" vmrss="375980" vmhwm="375980" />
+        <model path="public/ctdet_coco_dlav0_512/FP32/ctdet_coco_dlav0_512.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2678161" vmpeak="2678161" vmrss="1159002" vmhwm="1246637" />
+        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1704944" vmpeak="1704944" vmrss="344167" vmhwm="344167" />
+        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2239671" vmpeak="2239671" vmrss="1230164" vmhwm="1509679" />
+        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1899924" vmpeak="1985120" vmrss="603870" vmhwm="603870" />
+        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2347129" vmpeak="2432326" vmrss="1235364" vmhwm="1524920" />
+        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2518651" vmpeak="2601591" vmrss="628570" vmhwm="628570" />
+        <model path="public/ctpn/FP16/ctpn.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2653326" vmpeak="2738522" vmrss="1462136" vmhwm="1506434" />
+        <model path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1579780" vmpeak="1579780" vmrss="218894" vmhwm="218894" />
+        <model path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2561416" vmpeak="2561416" vmrss="1534660" vmhwm="1656262" />
+        <model path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1774312" vmpeak="1851512" vmrss="478093" vmhwm="478093" />
+        <model path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2645666" vmpeak="2730863" vmrss="1534322" vmhwm="1645165" />
+        <model path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2383867" vmpeak="2454660" vmrss="582306" vmhwm="582306" />
+        <model path="public/ctpn/FP32/ctpn.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3192025" vmpeak="3276665" vmrss="2009014" vmhwm="2009014" />
+        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1136496" vmpeak="1136496" vmrss="174028" vmhwm="174028" />
+        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1970009" vmpeak="2004932" vmrss="781055" vmhwm="1310488" />
+        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1137245" vmpeak="1137245" vmrss="185198" vmhwm="185198" />
+        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2057889" vmpeak="2143086" vmrss="762236" vmhwm="1319926" />
+        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1395742" vmpeak="1396512" vmrss="223568" vmhwm="223589" />
+        <model path="public/densenet-121/FP16/densenet-121.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2188004" vmpeak="2188004" vmrss="816322" vmhwm="1322646" />
+        <model path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1103949" vmpeak="1103949" vmrss="129329" vmhwm="129329" />
+        <model path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2045581" vmpeak="2069397" vmrss="834246" vmhwm="1364038" />
+        <model path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1285767" vmpeak="1370964" vmrss="140966" vmhwm="140966" />
+        <model path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2131896" vmpeak="2217092" vmrss="850460" vmhwm="1368036" />
+        <model path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1370922" vmpeak="1371692" vmrss="202976" vmhwm="203013" />
+        <model path="public/densenet-121/FP32/densenet-121.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2300828" vmpeak="2386025" vmrss="909090" vmhwm="1382570" />
+        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1354662" vmpeak="1354662" vmrss="291246" vmhwm="291246" />
+        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2062034" vmpeak="2107898" vmrss="924513" vmhwm="1447550" />
+        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1355411" vmpeak="1355411" vmrss="302666" vmhwm="302666" />
+        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2152191" vmpeak="2237388" vmrss="900109" vmhwm="1456780" />
+        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1847050" vmpeak="1932247" vmrss="352216" vmhwm="352222" />
+        <model path="public/densenet-169/FP16/densenet-169.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2283476" vmpeak="2283476" vmrss="945224" vmhwm="1453857" />
+        <model path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1207840" vmpeak="1207840" vmrss="203257" vmhwm="203257" />
+        <model path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2155576" vmpeak="2208304" vmrss="1001166" vmhwm="1554956" />
+        <model path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1208584" vmpeak="1208584" vmrss="214489" vmhwm="214489" />
+        <model path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2239140" vmpeak="2239140" vmrss="993444" vmhwm="1555356" />
+        <model path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1811570" vmpeak="1896767" vmrss="316607" vmhwm="316607" />
+        <model path="public/densenet-169/FP32/densenet-169.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2435524" vmpeak="2520720" vmrss="1088292" vmhwm="1564035" />
+        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1019512" vmpeak="1019512" vmrss="108758" vmhwm="108758" />
+        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1955226" vmpeak="1968257" vmrss="672531" vmhwm="1135612" />
+        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1020682" vmpeak="1020682" vmrss="116802" vmhwm="116802" />
+        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2016086" vmpeak="2101283" vmrss="669765" vmhwm="1141275" />
+        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1200732" vmpeak="1201501" vmrss="156202" vmhwm="156202" />
+        <model path="public/efficientnet-b0/FP16/efficientnet-b0.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2135697" vmpeak="2220894" vmrss="657997" vmhwm="1135056" />
+        <model path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1004827" vmpeak="1088048" vmrss="93022" vmhwm="93022" />
+        <model path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1967732" vmpeak="2008494" vmrss="698916" vmhwm="1172537" />
+        <model path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1005960" vmpeak="1005960" vmrss="103516" vmhwm="103516" />
+        <model path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2066838" vmpeak="2152035" vmrss="723502" vmhwm="1159958" />
+        <model path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1188699" vmpeak="1189468" vmrss="143130" vmhwm="143130" />
+        <model path="public/efficientnet-b0/FP32/efficientnet-b0.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2172851" vmpeak="2258048" vmrss="770874" vmhwm="1188517" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2888724" vmpeak="2888724" vmrss="965489" vmhwm="965489" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="5872651" vmpeak="5872651" vmrss="4717414" vmhwm="4717414" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="3086844" vmpeak="3154975" vmrss="1942470" vmhwm="1942470" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="5979355" vmpeak="6064552" vmrss="4755571" vmhwm="4755571" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="4607044" vmpeak="4610559" vmrss="2155514" vmhwm="2155514" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP16/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="9583225" vmpeak="9668422" vmrss="8279850" vmhwm="8279850" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="2632042" vmpeak="2632042" vmrss="670566" vmhwm="670566" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="5374428" vmpeak="5374428" vmrss="4190154" vmhwm="4190154" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="3011106" vmpeak="3088722" vmrss="1648244" vmhwm="1648244" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="5464877" vmpeak="5550074" vmrss="4217454" vmhwm="4217454" />
+        <model path="public/faster_rcnn_inception_resnet_v2_atrous_coco/FP32/faster_rcnn_inception_resnet_v2_atrous_coco.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="4363980" vmpeak="4435730" vmrss="2004262" vmhwm="2004262" />
+        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1020562" vmpeak="1024306" vmrss="119329" vmhwm="119329" />
+        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1904156" vmpeak="1934992" vmrss="474572" vmhwm="807986" />
+        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1202307" vmpeak="1202307" vmrss="124997" vmhwm="124997" />
+        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1988771" vmpeak="2073968" vmrss="482253" vmhwm="819291" />
+        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1194705" vmpeak="1195474" vmrss="166561" vmhwm="166561" />
+        <model path="public/googlenet-v1-tf/FP16/googlenet-v1-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2087311" vmpeak="2087311" vmrss="458333" vmhwm="782272" />
+        <model path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1003256" vmpeak="1008779" vmrss="101306" vmhwm="101306" />
+        <model path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1948325" vmpeak="1987351" vmrss="546041" vmhwm="854984" />
+        <model path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1185074" vmpeak="1270271" vmrss="107614" vmhwm="107614" />
+        <model path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2030236" vmpeak="2115432" vmrss="523603" vmhwm="833918" />
+        <model path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1179198" vmpeak="1179968" vmrss="151647" vmhwm="151647" />
+        <model path="public/googlenet-v1-tf/FP32/googlenet-v1-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2143554" vmpeak="2143554" vmrss="514124" vmhwm="825801" />
+        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1027041" vmpeak="1027041" vmrss="123994" vmhwm="123994" />
+        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2018848" vmpeak="2139269" vmrss="509132" vmhwm="975197" />
+        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1028274" vmpeak="1028274" vmrss="133806" vmhwm="133806" />
+        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2102547" vmpeak="2187744" vmrss="519095" vmhwm="977927" />
+        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1204424" vmpeak="1238369" vmrss="176784" vmhwm="176784" />
+        <model path="public/googlenet-v1/FP16/googlenet-v1.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2203011" vmpeak="2288208" vmrss="598343" vmhwm="1051741" />
+        <model path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1008170" vmpeak="1008170" vmrss="106527" vmhwm="106527" />
+        <model path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1970997" vmpeak="2018832" vmrss="560450" vmhwm="921700" />
+        <model path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1099888" vmpeak="1183915" vmrss="114956" vmhwm="114956" />
+        <model path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2056111" vmpeak="2141308" vmrss="578531" vmhwm="938085" />
+        <model path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1368848" vmpeak="1453644" vmrss="159276" vmhwm="159276" />
+        <model path="public/googlenet-v1/FP32/googlenet-v1.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2170147" vmpeak="2255344" vmrss="600688" vmhwm="922636" />
+        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1090684" vmpeak="1090684" vmrss="181376" vmhwm="181376" />
+        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1970612" vmpeak="2014734" vmrss="579800" vmhwm="950300" />
+        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1091750" vmpeak="1091750" vmrss="189462" vmhwm="189462" />
+        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2054967" vmpeak="2140164" vmrss="548147" vmhwm="932672" />
+        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1296131" vmpeak="1323472" vmrss="252777" vmhwm="252777" />
+        <model path="public/googlenet-v2/FP16/googlenet-v2.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2149940" vmpeak="2235136" vmrss="566914" vmhwm="933862" />
+        <model path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1059411" vmpeak="1059411" vmrss="149765" vmhwm="149765" />
+        <model path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2039741" vmpeak="2109894" vmrss="645907" vmhwm="1041768" />
+        <model path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1060560" vmpeak="1060560" vmrss="156156" vmhwm="156156" />
+        <model path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2124506" vmpeak="2209703" vmrss="647535" vmhwm="1032413" />
+        <model path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1449567" vmpeak="1534364" vmrss="226522" vmhwm="226522" />
+        <model path="public/googlenet-v2/FP32/googlenet-v2.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2226884" vmpeak="2312081" vmrss="659822" vmhwm="1061918" />
+        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1277603" vmpeak="1277603" vmrss="354759" vmhwm="354759" />
+        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2023829" vmpeak="2100358" vmrss="709248" vmhwm="1212140" />
+        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1460087" vmpeak="1545284" vmrss="364660" vmhwm="364660" />
+        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2108137" vmpeak="2193334" vmrss="741785" vmhwm="1220689" />
+        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1559298" vmpeak="1560660" vmrss="489840" vmhwm="489840" />
+        <model path="public/googlenet-v3/FP16/googlenet-v3.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2204576" vmpeak="2289773" vmrss="728457" vmhwm="1216612" />
+        <model path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1207533" vmpeak="1207533" vmrss="284746" vmhwm="284746" />
+        <model path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2204545" vmpeak="2340260" vmrss="852732" vmhwm="1390688" />
+        <model path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1389928" vmpeak="1475125" vmrss="295583" vmhwm="295583" />
+        <model path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2289170" vmpeak="2374366" vmrss="848369" vmhwm="1366565" />
+        <model path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1680666" vmpeak="1770605" vmrss="431324" vmhwm="431324" />
+        <model path="public/googlenet-v3/FP32/googlenet-v3.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2383622" vmpeak="2434140" vmrss="879502" vmhwm="1386756" />
+        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1644281" vmpeak="1644281" vmrss="694304" vmhwm="694304" />
+        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2247502" vmpeak="2375058" vmrss="979690" vmhwm="1670812" />
+        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1827103" vmpeak="1911899" vmrss="706139" vmhwm="706139" />
+        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2313381" vmpeak="2398578" vmrss="991702" vmhwm="1650662" />
+        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2143013" vmpeak="2227810" vmrss="837517" vmhwm="837517" />
+        <model path="public/googlenet-v4-tf/FP16/googlenet-v4-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2421229" vmpeak="2506426" vmrss="1040390" vmhwm="1675710" />
+        <model path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1429204" vmpeak="1429204" vmrss="476585" vmhwm="476585" />
+        <model path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2557022" vmpeak="2771116" vmrss="1247350" vmhwm="1980596" />
+        <model path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1612015" vmpeak="1695449" vmrss="489678" vmhwm="489678" />
+        <model path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2641761" vmpeak="2770398" vmrss="1257432" vmhwm="2000018" />
+        <model path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2034879" vmpeak="2036242" vmrss="729263" vmhwm="729263" />
+        <model path="public/googlenet-v4-tf/FP32/googlenet-v4-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2742147" vmpeak="2870784" vmrss="1351552" vmhwm="1997351" />
+        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1333212" vmpeak="1333212" vmrss="270680" vmhwm="270680" />
+        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2270444" vmpeak="2270444" vmrss="920306" vmhwm="920306" />
+        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1484132" vmpeak="1508936" vmrss="494598" vmhwm="494598" />
+        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2364554" vmpeak="2449751" vmrss="870495" vmhwm="990854" />
+        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1982812" vmpeak="2068008" vmrss="611743" vmhwm="611894" />
+        <model path="public/i3d-rgb-tf/FP16/i3d-rgb-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2796128" vmpeak="2916934" vmrss="1274873" vmhwm="1395160" />
+        <model path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1284634" vmpeak="1284634" vmrss="221514" vmhwm="221514" />
+        <model path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2632203" vmpeak="2632203" vmrss="1283084" vmhwm="1283084" />
+        <model path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1526080" vmpeak="1611277" vmrss="446622" vmhwm="446622" />
+        <model path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2712845" vmpeak="2798042" vmrss="1197237" vmhwm="1316988" />
+        <model path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2132785" vmpeak="2217982" vmrss="579602" vmhwm="579852" />
+        <model path="public/i3d-rgb-tf/FP32/i3d-rgb-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3444448" vmpeak="3565255" vmrss="1943104" vmhwm="2063417" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="3312493" vmpeak="3312493" vmrss="1124588" vmhwm="1124588" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="3757936" vmpeak="3757936" vmrss="2413398" vmhwm="2413398" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="3567012" vmpeak="3645153" vmrss="2452902" vmhwm="2452902" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="3867323" vmpeak="3952520" vmrss="2464243" vmhwm="2464243" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="5164328" vmpeak="5231038" vmrss="2626348" vmhwm="2626348" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP16/mask_rcnn_resnet101_atrous_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="5571659" vmpeak="5656856" vmrss="4054133" vmhwm="4054138" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="2876744" vmpeak="2876744" vmrss="685786" vmhwm="685786" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="4934425" vmpeak="5609838" vmrss="3672682" vmhwm="4177638" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="3493204" vmpeak="3571344" vmrss="2016596" vmhwm="2016596" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="5044150" vmpeak="5617721" vmrss="3713075" vmhwm="4196649" />
+        <model path="public/mask_rcnn_resnet101_atrous_coco/FP32/mask_rcnn_resnet101_atrous_coco.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="4951252" vmpeak="5017812" vmrss="2413538" vmhwm="2413538" />
+        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1035829" vmpeak="1035829" vmrss="132184" vmhwm="132184" />
+        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1901702" vmpeak="1926574" vmrss="480537" vmhwm="811179" />
+        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1037186" vmpeak="1037186" vmrss="145537" vmhwm="145537" />
+        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1994184" vmpeak="2079381" vmrss="458562" vmhwm="799078" />
+        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1366986" vmpeak="1401233" vmrss="158750" vmhwm="158750" />
+        <model path="public/mobilenet-ssd/FP16/mobilenet-ssd.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2089396" vmpeak="2174593" vmrss="471005" vmhwm="804117" />
+        <model path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1021680" vmpeak="1021680" vmrss="117878" vmhwm="117878" />
+        <model path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1947420" vmpeak="1970098" vmrss="487349" vmhwm="796473" />
+        <model path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1023115" vmpeak="1023115" vmrss="131268" vmhwm="131268" />
+        <model path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2028780" vmpeak="2113976" vmrss="477536" vmhwm="795938" />
+        <model path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1353918" vmpeak="1473362" vmrss="145662" vmhwm="145662" />
+        <model path="public/mobilenet-ssd/FP32/mobilenet-ssd.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2149472" vmpeak="2234668" vmrss="522152" vmhwm="796832" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="966716" vmpeak="966716" vmrss="80896" vmhwm="80896" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1866378" vmpeak="1891947" vmrss="354161" vmhwm="524466" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="967844" vmpeak="1005581" vmrss="89518" vmhwm="89518" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1951846" vmpeak="1951846" vmrss="326367" vmhwm="496823" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1109695" vmpeak="1110465" vmrss="115767" vmhwm="115767" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP16/mobilenet-v1-1.0-224-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2052065" vmpeak="2052065" vmrss="332602" vmhwm="494494" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="956857" vmpeak="956857" vmrss="70714" vmhwm="70714" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1896674" vmpeak="1930167" vmrss="359964" vmhwm="548329" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="957647" vmpeak="957647" vmrss="78270" vmhwm="78270" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="1982448" vmpeak="1982448" vmrss="335602" vmhwm="519755" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1099836" vmpeak="1132752" vmrss="105830" vmhwm="105830" />
+        <model path="public/mobilenet-v1-1.0-224-tf/FP32/mobilenet-v1-1.0-224-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2096936" vmpeak="2182133" vmrss="353860" vmhwm="522808" />
+        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1016121" vmpeak="1016121" vmrss="114899" vmhwm="114899" />
+        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1903532" vmpeak="1928175" vmrss="423872" vmhwm="705432" />
+        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1016891" vmpeak="1016891" vmrss="126323" vmhwm="126323" />
+        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1986561" vmpeak="1986561" vmrss="428298" vmhwm="708520" />
+        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1182480" vmpeak="1183249" vmrss="160056" vmhwm="160056" />
+        <model path="public/mobilenet-v2-1.4-224/FP16/mobilenet-v2-1.4-224.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2095542" vmpeak="2180739" vmrss="431589" vmhwm="724750" />
+        <model path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="996309" vmpeak="1005633" vmrss="94083" vmhwm="94083" />
+        <model path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1933781" vmpeak="1964430" vmrss="456898" vmhwm="702426" />
+        <model path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="997084" vmpeak="997084" vmrss="107166" vmhwm="107166" />
+        <model path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2017215" vmpeak="2102412" vmrss="454734" vmhwm="708734" />
+        <model path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1168440" vmpeak="1169209" vmrss="145371" vmhwm="145371" />
+        <model path="public/mobilenet-v2-1.4-224/FP32/mobilenet-v2-1.4-224.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2142561" vmpeak="2142561" vmrss="492315" vmhwm="703684" />
+        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="989924" vmpeak="989924" vmrss="88706" vmhwm="88706" />
+        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1882920" vmpeak="1908389" vmrss="447792" vmhwm="701485" />
+        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="990797" vmpeak="990797" vmrss="97021" vmhwm="97021" />
+        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1970982" vmpeak="2056178" vmrss="403280" vmhwm="699930" />
+        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1132965" vmpeak="1133735" vmrss="108435" vmhwm="108435" />
+        <model path="public/mobilenet-v2/FP16/mobilenet-v2.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2069516" vmpeak="2154713" vmrss="465301" vmhwm="732950" />
+        <model path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="968162" vmpeak="1077648" vmrss="66461" vmhwm="66461" />
+        <model path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1912648" vmpeak="1934119" vmrss="476044" vmhwm="718510" />
+        <model path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="968910" vmpeak="992430" vmrss="75238" vmhwm="75238" />
+        <model path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="1999504" vmpeak="2084700" vmrss="457693" vmhwm="690658" />
+        <model path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1125358" vmpeak="1164862" vmrss="101790" vmhwm="101790" />
+        <model path="public/mobilenet-v2/FP32/mobilenet-v2.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2113342" vmpeak="2198539" vmrss="474572" vmhwm="694558" />
+        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="900104" vmpeak="1061070" vmrss="29915" vmhwm="29915" />
+        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1858521" vmpeak="1884745" vmrss="294855" vmhwm="439420" />
+        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="900504" vmpeak="900504" vmrss="30908" vmhwm="30908" />
+        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1943931" vmpeak="2029128" vmrss="293878" vmhwm="437933" />
+        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1002414" vmpeak="1168414" vmrss="32047" vmhwm="32047" />
+        <model path="public/mtcnn/mtcnn-o/FP16/mtcnn-o.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2039954" vmpeak="2125151" vmrss="294184" vmhwm="437283" />
+        <model path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="898060" vmpeak="898060" vmrss="27092" vmhwm="27092" />
+        <model path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1877002" vmpeak="1899934" vmrss="273171" vmhwm="373313" />
+        <model path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="898461" vmpeak="898461" vmrss="29276" vmhwm="29276" />
+        <model path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="1962100" vmpeak="2047297" vmrss="297538" vmhwm="397456" />
+        <model path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1001873" vmpeak="1081012" vmrss="31730" vmhwm="31730" />
+        <model path="public/mtcnn/mtcnn-o/FP32/mtcnn-o.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2057952" vmpeak="2143148" vmrss="296623" vmhwm="396120" />
+        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="893391" vmpeak="893391" vmrss="26540" vmhwm="26540" />
+        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1871490" vmpeak="1895717" vmrss="286785" vmhwm="382896" />
+        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="893791" vmpeak="893791" vmrss="27773" vmhwm="27773" />
+        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1954758" vmpeak="2039954" vmrss="286015" vmhwm="382257" />
+        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="993314" vmpeak="1070123" vmrss="27118" vmhwm="27118" />
+        <model path="public/mtcnn/mtcnn-r/FP16/mtcnn-r.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2052585" vmpeak="2052585" vmrss="287752" vmhwm="383385" />
+        <model path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="892860" vmpeak="973684" vmrss="26197" vmhwm="26197" />
+        <model path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1878266" vmpeak="1898499" vmrss="262189" vmhwm="337875" />
+        <model path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="893261" vmpeak="893261" vmrss="25828" vmhwm="25828" />
+        <model path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="1963353" vmpeak="1963353" vmrss="260572" vmhwm="336034" />
+        <model path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1456457" vmpeak="1541654" vmrss="28574" vmhwm="28574" />
+        <model path="public/mtcnn/mtcnn-r/FP32/mtcnn-r.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2059200" vmpeak="2144396" vmrss="263166" vmhwm="337578" />
+        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1599889" vmpeak="1672106" vmrss="490141" vmhwm="490141" />
+        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2183006" vmpeak="2263331" vmrss="1087829" vmhwm="1679194" />
+        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1607777" vmpeak="1672086" vmrss="535059" vmhwm="535059" />
+        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2271911" vmpeak="2441426" vmrss="1075698" vmhwm="1672569" />
+        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1955636" vmpeak="1955636" vmrss="584828" vmhwm="584828" />
+        <model path="public/octave-resnext-50-0.25/FP16/octave-resnext-50-0.25.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2363956" vmpeak="2449153" vmrss="1093731" vmhwm="1675242" />
+        <model path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1363835" vmpeak="1363835" vmrss="317330" vmhwm="317330" />
+        <model path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2331300" vmpeak="2629369" vmrss="1264281" vmhwm="1883414" />
+        <model path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1552657" vmpeak="1637854" vmrss="362700" vmhwm="362700" />
+        <model path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2411021" vmpeak="2625199" vmrss="1169147" vmhwm="1877231" />
+        <model path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1893216" vmpeak="1893216" vmrss="522735" vmhwm="522735" />
+        <model path="public/octave-resnext-50-0.25/FP32/octave-resnext-50-0.25.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2559949" vmpeak="2723084" vmrss="1314658" vmhwm="1875094" />
+        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1114391" vmpeak="1114391" vmrss="202155" vmhwm="202155" />
+        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1995806" vmpeak="2045851" vmrss="683181" vmhwm="1193899" />
+        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1115426" vmpeak="1115426" vmrss="208135" vmhwm="208135" />
+        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2067858" vmpeak="2153054" vmrss="676041" vmhwm="1189921" />
+        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1329666" vmpeak="1330435" vmrss="274991" vmhwm="274991" />
+        <model path="public/se-inception/FP16/se-inception.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2166060" vmpeak="2251256" vmrss="692946" vmhwm="1194798" />
+        <model path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1078386" vmpeak="1078386" vmrss="165084" vmhwm="165084" />
+        <model path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2062039" vmpeak="2137465" vmrss="762621" vmhwm="1302787" />
+        <model path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1079535" vmpeak="1079535" vmrss="169436" vmhwm="169436" />
+        <model path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2143580" vmpeak="2228777" vmrss="776235" vmhwm="1301762" />
+        <model path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1300665" vmpeak="1301435" vmrss="245502" vmhwm="245580" />
+        <model path="public/se-inception/FP32/se-inception.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2243238" vmpeak="2243238" vmrss="790270" vmhwm="1304394" />
+        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2096530" vmpeak="2096530" vmrss="1029132" vmhwm="1029132" />
+        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2468076" vmpeak="2622978" vmrss="1300416" vmhwm="1992411" />
+        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2459880" vmpeak="2459880" vmrss="1043333" vmhwm="1043333" />
+        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2570256" vmpeak="2655452" vmrss="1296074" vmhwm="1986774" />
+        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2810792" vmpeak="2810792" vmrss="1314050" vmhwm="1314050" />
+        <model path="public/se-resnet-152/FP16/se-resnet-152.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2664776" vmpeak="2749973" vmrss="1311289" vmhwm="1996285" />
+        <model path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1758135" vmpeak="1758135" vmrss="751441" vmhwm="751441" />
+        <model path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2957671" vmpeak="3295692" vmrss="1624287" vmhwm="2522130" />
+        <model path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1940307" vmpeak="2025103" vmrss="764056" vmhwm="764056" />
+        <model path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="3047642" vmpeak="3300466" vmrss="1632966" vmhwm="2531656" />
+        <model path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2641943" vmpeak="2725975" vmrss="1146178" vmhwm="1146178" />
+        <model path="public/se-resnet-152/FP32/se-resnet-152.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3143878" vmpeak="3567184" vmrss="1643252" vmhwm="2516659" />
+        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1383584" vmpeak="1383584" vmrss="457600" vmhwm="457600" />
+        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2084934" vmpeak="2169668" vmrss="758685" vmhwm="1308013" />
+        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1384640" vmpeak="1384640" vmrss="470329" vmhwm="470329" />
+        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2170022" vmpeak="2255219" vmrss="766880" vmhwm="1303192" />
+        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1637667" vmpeak="1638436" vmrss="565999" vmhwm="565999" />
+        <model path="public/se-resnet-50/FP16/se-resnet-50.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2265785" vmpeak="2350982" vmrss="777212" vmhwm="1303208" />
+        <model path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1252508" vmpeak="1252508" vmrss="325702" vmhwm="325702" />
+        <model path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2297734" vmpeak="2433704" vmrss="961001" vmhwm="1588095" />
+        <model path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1253657" vmpeak="1253657" vmrss="340074" vmhwm="340074" />
+        <model path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2396368" vmpeak="2481564" vmrss="916255" vmhwm="1553744" />
+        <model path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1748786" vmpeak="1749555" vmrss="496828" vmhwm="496828" />
+        <model path="public/se-resnet-50/FP32/se-resnet-50.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2478444" vmpeak="2563641" vmrss="946140" vmhwm="1581554" />
+        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1380340" vmpeak="1380340" vmrss="441625" vmhwm="441625" />
+        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2151588" vmpeak="2165165" vmrss="822603" vmhwm="1296219" />
+        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1388145" vmpeak="1388145" vmrss="471348" vmhwm="471348" />
+        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2236046" vmpeak="2321243" vmrss="829977" vmhwm="1291544" />
+        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1669938" vmpeak="1730118" vmrss="572187" vmhwm="572187" />
+        <model path="public/se-resnext-50/FP16/se-resnext-50.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2403351" vmpeak="2488548" vmrss="896272" vmhwm="1287598" />
+        <model path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1264551" vmpeak="1264551" vmrss="320252" vmhwm="320252" />
+        <model path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2431223" vmpeak="2431223" vmrss="1133163" vmhwm="1592250" />
+        <model path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1453410" vmpeak="1453410" vmrss="349934" vmhwm="349934" />
+        <model path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2516072" vmpeak="2601268" vmrss="1149501" vmhwm="1568543" />
+        <model path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1782232" vmpeak="1867429" vmrss="501914" vmhwm="501914" />
+        <model path="public/se-resnext-50/FP32/se-resnext-50.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2721986" vmpeak="2721986" vmrss="1246362" vmhwm="1540531" />
+        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1403105" vmpeak="1403105" vmrss="454693" vmhwm="454693" />
+        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2007262" vmpeak="2137163" vmrss="554346" vmhwm="885066" />
+        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1592588" vmpeak="1670728" vmrss="517888" vmhwm="517888" />
+        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2092875" vmpeak="2221367" vmrss="548860" vmhwm="883859" />
+        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1634895" vmpeak="1636268" vmrss="564491" vmhwm="564491" />
+        <model path="public/ssd300/FP16/ssd300.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2219001" vmpeak="2304198" vmrss="606065" vmhwm="885196" />
+        <model path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1237797" vmpeak="1237797" vmrss="283935" vmhwm="283935" />
+        <model path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2266238" vmpeak="2356536" vmrss="805599" vmhwm="1104038" />
+        <model path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1421955" vmpeak="1500096" vmrss="348904" vmhwm="348904" />
+        <model path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2347144" vmpeak="2432341" vmrss="808626" vmhwm="1101146" />
+        <model path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1749966" vmpeak="1835163" vmrss="496121" vmhwm="496121" />
+        <model path="public/ssd300/FP32/ssd300.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2549684" vmpeak="2634881" vmrss="926489" vmhwm="1127599" />
+        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1550010" vmpeak="1550010" vmrss="492325" vmhwm="492325" />
+        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2216978" vmpeak="2246852" vmrss="688391" vmhwm="973408" />
+        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1742150" vmpeak="1742150" vmrss="667882" vmhwm="667882" />
+        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2301826" vmpeak="2387023" vmrss="697866" vmhwm="974745" />
+        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2084888" vmpeak="2170084" vmrss="726590" vmhwm="726590" />
+        <model path="public/ssd512/FP16/ssd512.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2564936" vmpeak="2650133" vmrss="878004" vmhwm="978021" />
+        <model path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1369648" vmpeak="1369648" vmrss="311677" vmhwm="311677" />
+        <model path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2491642" vmpeak="2491642" vmrss="1031742" vmhwm="1177186" />
+        <model path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1561757" vmpeak="1639898" vmrss="487650" vmhwm="487650" />
+        <model path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2582772" vmpeak="2667969" vmrss="1054612" vmhwm="1180384" />
+        <model path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2018057" vmpeak="2096198" vmrss="659510" vmhwm="659510" />
+        <model path="public/ssd512/FP32/ssd512.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3018490" vmpeak="3103687" vmrss="1409787" vmhwm="1409787" />
+        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1044373" vmpeak="1044373" vmrss="138741" vmhwm="138741" />
+        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1909330" vmpeak="1939194" vmrss="533468" vmhwm="874822" />
+        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1045746" vmpeak="1045746" vmrss="150820" vmhwm="150820" />
+        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="1997382" vmpeak="2082579" vmrss="522485" vmhwm="853268" />
+        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1400115" vmpeak="1401488" vmrss="187132" vmhwm="187132" />
+        <model path="public/ssd_mobilenet_v1_coco/FP16/ssd_mobilenet_v1_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2099359" vmpeak="2184556" vmrss="509438" vmhwm="824829" />
+        <model path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1015742" vmpeak="1015742" vmrss="109252" vmhwm="109252" />
+        <model path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1957919" vmpeak="1989608" vmrss="508986" vmhwm="833970" />
+        <model path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1017114" vmpeak="1095520" vmrss="121321" vmhwm="121321" />
+        <model path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2053833" vmpeak="2139030" vmrss="524711" vmhwm="830689" />
+        <model path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1203155" vmpeak="1204528" vmrss="172775" vmhwm="172775" />
+        <model path="public/ssd_mobilenet_v1_coco/FP32/ssd_mobilenet_v1_coco.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2162082" vmpeak="2162082" vmrss="531549" vmhwm="830174" />
+        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1235457" vmpeak="1235457" vmrss="315614" vmhwm="315614" />
+        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1984278" vmpeak="2039928" vmrss="651861" vmhwm="1126507" />
+        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1236830" vmpeak="1236830" vmrss="330236" vmhwm="330236" />
+        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2071986" vmpeak="2157183" vmrss="668376" vmhwm="1117922" />
+        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1434695" vmpeak="1436068" vmrss="377026" vmhwm="377026" />
+        <model path="public/ssd_mobilenet_v2_coco/FP16/ssd_mobilenet_v2_coco.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2168114" vmpeak="2168114" vmrss="674668" vmhwm="1124229" />
+        <model path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1137463" vmpeak="1137463" vmrss="216476" vmhwm="216476" />
+        <model path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2099006" vmpeak="2179741" vmrss="753771" vmhwm="1237007" />
+        <model path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1138836" vmpeak="1138836" vmrss="231826" vmhwm="231826" />
+        <model path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2184249" vmpeak="2269446" vmrss="734739" vmhwm="1210882" />
+        <model path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1393657" vmpeak="1395030" vmrss="336133" vmhwm="336133" />
+        <model path="public/ssd_mobilenet_v2_coco/FP32/ssd_mobilenet_v2_coco.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2291837" vmpeak="2377034" vmrss="792272" vmhwm="1243455" />
+        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="3373182" vmpeak="3373182" vmrss="2465569" vmhwm="2465569" />
+        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2583620" vmpeak="3276847" vmrss="1036204" vmhwm="1596748" />
+        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="3736839" vmpeak="3736839" vmrss="2498802" vmhwm="2498802" />
+        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2669076" vmpeak="3275610" vmrss="1036926" vmhwm="1598308" />
+        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="3525449" vmpeak="3562546" vmrss="2511381" vmhwm="2511381" />
+        <model path="public/vgg19/FP16/vgg19.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2785593" vmpeak="3371560" vmrss="1051133" vmhwm="1599936" />
+        <model path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="2288202" vmpeak="2288202" vmrss="1379575" vmhwm="1379575" />
+        <model path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="3432826" vmpeak="4772851" vmrss="1844731" vmhwm="3145084" />
+        <model path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="2560953" vmpeak="2560953" vmrss="1413224" vmhwm="1413224" />
+        <model path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="3525412" vmpeak="4772742" vmrss="1807083" vmhwm="3145454" />
+        <model path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="3342263" vmpeak="3343033" vmrss="2148088" vmhwm="2148088" />
+        <model path="public/vgg19/FP32/vgg19.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="3642854" vmpeak="4868640" vmrss="1896221" vmhwm="3144700" />
+        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1169786" vmpeak="1169786" vmrss="282750" vmhwm="282750" />
+        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1939444" vmpeak="1992348" vmrss="304751" vmhwm="466450" />
+        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1172428" vmpeak="1172428" vmrss="300622" vmhwm="300622" />
+        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2024640" vmpeak="2109837" vmrss="307346" vmhwm="466934" />
+        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1319708" vmpeak="1435657" vmrss="330574" vmhwm="330574" />
+        <model path="public/yolo-v1-tiny-tf/FP16/yolo-v1-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2127517" vmpeak="2212714" vmrss="317777" vmhwm="466960" />
+        <model path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1075027" vmpeak="1075027" vmrss="187548" vmhwm="187548" />
+        <model path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2028556" vmpeak="2145187" vmrss="418662" vmhwm="562749" />
+        <model path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1077668" vmpeak="1077668" vmrss="205644" vmhwm="205644" />
+        <model path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2113649" vmpeak="2198846" vmrss="422427" vmhwm="564241" />
+        <model path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1284852" vmpeak="1287494" vmrss="290934" vmhwm="290934" />
+        <model path="public/yolo-v1-tiny-tf/FP32/yolo-v1-tiny-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2232469" vmpeak="2240950" vmrss="448557" vmhwm="563076" />
+        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1850664" vmpeak="1850664" vmrss="901706" vmhwm="901706" />
+        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2082522" vmpeak="2247648" vmrss="461983" vmhwm="763126" />
+        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2038134" vmpeak="2123331" vmrss="979648" vmhwm="979648" />
+        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2177286" vmpeak="2262483" vmrss="497452" vmhwm="787300" />
+        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2080462" vmpeak="2086879" vmrss="1023526" vmhwm="1023526" />
+        <model path="public/yolo-v2-tf/FP16/yolo-v2-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2315367" vmpeak="2400564" vmrss="527820" vmhwm="764706" />
+        <model path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1498515" vmpeak="1498515" vmrss="549926" vmhwm="549926" />
+        <model path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2471450" vmpeak="2847457" vmrss="866907" vmhwm="1178996" />
+        <model path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1504932" vmpeak="1504932" vmrss="626033" vmhwm="626033" />
+        <model path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2563236" vmpeak="2846100" vmrss="873059" vmhwm="1177664" />
+        <model path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2313610" vmpeak="2398806" vmrss="893921" vmhwm="893958" />
+        <model path="public/yolo-v2-tf/FP32/yolo-v2-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2767268" vmpeak="2941967" vmrss="1008571" vmhwm="1181902" />
+        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="1110751" vmpeak="1110751" vmrss="223412" vmhwm="223412" />
+        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="1923818" vmpeak="1950629" vmrss="282828" vmhwm="429265" />
+        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="1113762" vmpeak="1113762" vmrss="242008" vmhwm="242008" />
+        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2005879" vmpeak="2091076" vmrss="280706" vmhwm="427741" />
+        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="1237802" vmpeak="1268186" vmrss="249511" vmhwm="249511" />
+        <model path="public/yolo-v2-tiny-tf/FP16/yolo-v2-tiny-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2107586" vmpeak="2192782" vmrss="293467" vmhwm="428490" />
+        <model path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1028014" vmpeak="1030369" vmrss="139328" vmhwm="139328" />
+        <model path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="1983238" vmpeak="2050245" vmrss="357052" vmhwm="495908" />
+        <model path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1212078" vmpeak="1212078" vmrss="158246" vmhwm="158246" />
+        <model path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2068710" vmpeak="2153907" vmrss="357437" vmhwm="495237" />
+        <model path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="1390428" vmpeak="1475624" vmrss="220927" vmhwm="220927" />
+        <model path="public/yolo-v2-tiny-tf/FP32/yolo-v2-tiny-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2187723" vmpeak="2187723" vmrss="404102" vmhwm="495456" />
+        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="create_exenetwork" device="CPU" vmsize="2047505" vmpeak="2047505" vmrss="1096638" vmhwm="1096638" />
+        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="create_exenetwork" device="GPU" vmsize="2301114" vmpeak="2451264" vmrss="806754" vmhwm="1364896" />
+        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="infer_request_inference" device="CPU" vmsize="2054748" vmpeak="2054748" vmrss="1144384" vmhwm="1144384" />
+        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="infer_request_inference" device="GPU" vmsize="2386014" vmpeak="2471211" vmrss="862357" vmhwm="1380303" />
+        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="inference_with_streams" device="CPU" vmsize="2472865" vmpeak="2557843" vmrss="1200310" vmhwm="1200310" />
+        <model path="public/yolo-v3-tf/FP16/yolo-v3-tf.xml" precision="FP16" test="inference_with_streams" device="GPU" vmsize="2510856" vmpeak="2596053" vmrss="952666" vmhwm="1439838" />
+        <model path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="create_exenetwork" device="CPU" vmsize="1619061" vmpeak="1619061" vmrss="668423" vmhwm="668423" />
+        <model path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="create_exenetwork" device="GPU" vmsize="2627606" vmpeak="3083823" vmrss="1242113" vmhwm="1780994" />
+        <model path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="infer_request_inference" device="CPU" vmsize="1807140" vmpeak="1885312" vmrss="715691" vmhwm="715691" />
+        <model path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="infer_request_inference" device="GPU" vmsize="2712080" vmpeak="3083100" vmrss="1226342" vmhwm="1802039" />
+        <model path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="inference_with_streams" device="CPU" vmsize="2497045" vmpeak="2504070" vmrss="1042381" vmhwm="1042381" />
+        <model path="public/yolo-v3-tf/FP32/yolo-v3-tf.xml" precision="FP32" test="inference_with_streams" device="GPU" vmsize="2905910" vmpeak="3180080" vmrss="1353804" vmhwm="1800713" />
     </models>
 </attributes>

From 35fb3f3d7ddfb0fecf0acc01ae08dbc81a6198f0 Mon Sep 17 00:00:00 2001
From: Patryk Elszkowski <patryk.elszkowski@intel.com>
Date: Thu, 22 Jul 2021 11:59:59 +0200
Subject: [PATCH 35/71] Acosh ref impl (#6664)

* minor changes in Op class and add ref impl for acosh

* acosh in new test framework

* add Acosh type test

* add SLT for Acosh

* run more test

* new acosh plugin test

* add visitor test

* fix test utils

* add template test for all supported types in Acosh

* add builder to template tests

* update grn template_plugin test

* update maste to feature branch
---
 .../tests/functional/op_reference/acosh.cpp   | 81 +++++++++++++++++++
 .../op_reference/base_reference_test.cpp      |  4 +
 .../op_reference/base_reference_test.hpp      | 56 +++++++++++++
 .../tests/functional/op_reference/convert.cpp |  1 +
 .../tests/functional/op_reference/grn.cpp     | 37 ++++-----
 .../tests/functional/op_reference/select.cpp  |  9 ++-
 .../tests/functional/op_reference/sign.cpp    | 25 +++---
 .../serialization/single_layer/activation.cpp |  1 +
 .../single_layer_tests/activation.cpp         |  2 +
 .../single_layer_tests/activation.cpp         |  1 +
 .../single_layer/activation.hpp               |  1 +
 .../src/single_layer/activation.cpp           |  6 ++
 .../layer_tests_summary/utils/constants.py    |  1 +
 .../ngraph_functions/utils/ngraph_helpers.hpp |  1 +
 .../ngraph_functions/src/activation.cpp       |  2 +
 ngraph/core/include/ngraph/op/acosh.hpp       |  4 +-
 .../ngraph/runtime/reference/acosh.hpp        | 13 ++-
 ngraph/core/src/op/acosh.cpp                  |  2 +-
 ngraph/test/CMakeLists.txt                    |  2 +-
 ngraph/test/backend/acosh.in.cpp              | 51 ------------
 ngraph/test/runtime/ie/unit_test.manifest     |  1 -
 ngraph/test/type_prop/acosh.cpp               |  9 +++
 ngraph/test/visitors/op/acosh.cpp             | 11 +++
 23 files changed, 230 insertions(+), 91 deletions(-)
 create mode 100644 docs/template_plugin/tests/functional/op_reference/acosh.cpp
 delete mode 100644 ngraph/test/backend/acosh.in.cpp
 create mode 100644 ngraph/test/type_prop/acosh.cpp
 create mode 100644 ngraph/test/visitors/op/acosh.cpp

diff --git a/docs/template_plugin/tests/functional/op_reference/acosh.cpp b/docs/template_plugin/tests/functional/op_reference/acosh.cpp
new file mode 100644
index 00000000000000..e854c98b7e0f7a
--- /dev/null
+++ b/docs/template_plugin/tests/functional/op_reference/acosh.cpp
@@ -0,0 +1,81 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+
+#include <ie_core.hpp>
+#include <ie_ngraph_utils.hpp>
+#include <ngraph/ngraph.hpp>
+#include <shared_test_classes/base/layer_test_utils.hpp>
+#include <vector>
+
+#include "base_reference_test.hpp"
+
+using namespace ngraph;
+
+namespace reference_tests {
+namespace {
+
+struct AcoshParams {
+    Tensor input;
+    Tensor expected;
+};
+
+struct Builder : ParamsBuilder<AcoshParams> {
+    REFERENCE_TESTS_ADD_SET_PARAM(Builder, input);
+    REFERENCE_TESTS_ADD_SET_PARAM(Builder, expected);
+};
+
+class ReferenceAcoshLayerTest : public testing::TestWithParam<AcoshParams>, public CommonReferenceTest {
+public:
+    void SetUp() override {
+        auto params = GetParam();
+        function = CreateFunction(params.input.shape, params.input.type);
+        inputData = {params.input.data};
+        refOutData = {params.expected.data};
+    }
+    static std::string getTestCaseName(const testing::TestParamInfo<AcoshParams>& obj) {
+        auto param = obj.param;
+        std::ostringstream result;
+        result << "shape=" << param.input.shape << "_";
+        result << "type=" << param.input.type;
+        return result.str();
+    }
+
+private:
+    static std::shared_ptr<Function> CreateFunction(const Shape& shape, const element::Type& type) {
+        const auto in = std::make_shared<op::Parameter>(type, shape);
+        const auto acosh = std::make_shared<op::Acosh>(in);
+        return std::make_shared<Function>(NodeVector {acosh}, ParameterVector {in});
+    }
+};
+
+TEST_P(ReferenceAcoshLayerTest, AcoshWithHardcodedRefs) {
+    Exec();
+}
+
+}  // namespace
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_Acosh_With_Hardcoded_Refs, ReferenceAcoshLayerTest,
+    ::testing::Values(Builder {}
+                          .input({{8}, element::f16, std::vector<ngraph::float16> {1.f, 2.f, 3.f, 4.f, 5.f, 10.f, 100.f, 1000.f}})
+                          .expected({{8}, element::f16, std::vector<ngraph::float16> {0., 1.317, 1.763, 2.063, 2.292, 2.993, 5.298, 7.6012}}),
+                      Builder {}
+                          .input({{8}, element::f32, std::vector<float> {1.f, 2.f, 3.f, 4.f, 5.f, 10.f, 100.f, 1000.f}})
+                          .expected({{8}, element::f32, std::vector<float> {0., 1.317, 1.763, 2.063, 2.292, 2.993, 5.298, 7.6012}}),
+                      Builder {}
+                          .input({{8}, element::i32, std::vector<int32_t> {1, 2, 3, 4, 5, 10, 100, 1000}})
+                          .expected({{8}, element::i32, std::vector<int32_t> {0, 1, 2, 2, 2, 3, 5, 8}}),
+                      Builder {}
+                          .input({{8}, element::i64, std::vector<int64_t> {1, 2, 3, 4, 5, 10, 100, 1000}})
+                          .expected({{8}, element::i64, std::vector<int64_t> {0, 1, 2, 2, 2, 3, 5, 8}}),
+                      Builder {}
+                          .input({{8}, element::u32, std::vector<uint32_t> {1, 2, 3, 4, 5, 10, 100, 1000}})
+                          .expected({{8}, element::u32, std::vector<uint32_t> {0, 1, 2, 2, 2, 3, 5, 8}}),
+                      Builder {}
+                          .input({{8}, element::u64, std::vector<uint64_t> {1, 2, 3, 4, 5, 10, 100, 1000}})
+                          .expected({{8}, element::u64, std::vector<uint64_t> {0, 1, 2, 2, 2, 3, 5, 8}})),
+    ReferenceAcoshLayerTest::getTestCaseName);
+}  // namespace reference_tests
diff --git a/docs/template_plugin/tests/functional/op_reference/base_reference_test.cpp b/docs/template_plugin/tests/functional/op_reference/base_reference_test.cpp
index 51af4d2ea1a221..f2d2cf68aa39a2 100644
--- a/docs/template_plugin/tests/functional/op_reference/base_reference_test.cpp
+++ b/docs/template_plugin/tests/functional/op_reference/base_reference_test.cpp
@@ -9,6 +9,8 @@
 
 using namespace InferenceEngine;
 
+namespace reference_tests {
+
 CommonReferenceTest::CommonReferenceTest(): targetDevice("TEMPLATE") {
     core = PluginCache::get().ie(targetDevice);
 }
@@ -171,3 +173,5 @@ void CommonReferenceTest::ValidateBlobs(const InferenceEngine::Blob::Ptr& refBlo
         FAIL() << "Comparator for " << precision << " precision isn't supported";
     }
 }
+
+}  // namespace reference_tests
diff --git a/docs/template_plugin/tests/functional/op_reference/base_reference_test.hpp b/docs/template_plugin/tests/functional/op_reference/base_reference_test.hpp
index 6e3fd942a9e722..de08533405e566 100644
--- a/docs/template_plugin/tests/functional/op_reference/base_reference_test.hpp
+++ b/docs/template_plugin/tests/functional/op_reference/base_reference_test.hpp
@@ -5,8 +5,12 @@
 #include <ie_core.hpp>
 #include <ie_ngraph_utils.hpp>
 #include <ngraph/ngraph.hpp>
+#include <ngraph/shape.hpp>
+#include <ngraph/type/element_type.hpp>
 #include <shared_test_classes/base/layer_test_utils.hpp>
 
+namespace reference_tests {
+
 class CommonReferenceTest {
 public:
     CommonReferenceTest();
@@ -51,3 +55,55 @@ InferenceEngine::Blob::Ptr CreateBlob(const ngraph::element::Type& element_type,
     return blob;
 }
 
+///
+/// Class which should help to build data for single input
+///
+struct Tensor {
+    Tensor() = default;
+
+    Tensor(const ngraph::Shape& shape, ngraph::element::Type type, const InferenceEngine::Blob::Ptr& data): shape {shape}, type {type}, data {data} {}
+
+    template <typename T>
+    Tensor(const ngraph::Shape& shape, ngraph::element::Type type, const std::vector<T>& data_elements)
+        : Tensor {shape, type, CreateBlob(type, data_elements)} {}
+
+    ngraph::Shape shape;
+    ngraph::element::Type type;
+    InferenceEngine::Blob::Ptr data;
+};
+
+///
+/// Class which should helps build test parameters.
+///
+/// e.g.:
+/// struct Params {
+///     Tensor i,o;
+///     int mul;
+/// };
+/// struct TestParamsBuilder : ParamsBuilder<Params>
+///     REFERENCE_TESTS_ADD_SET_PARAM(TestParamsBuilder, i);
+///     REFERENCE_TESTS_ADD_SET_PARAM(TestParamsBuilder, o);
+///     REFERENCE_TESTS_ADD_SET_PARAM(TestParamsBuilder, mul);
+/// };
+///
+/// const Params p = TestParamsBuilder{}
+///                  .i(Tensor{{0}, i32, {1}})
+///                  .o(Tensor{{0}, i32, {1}})
+///                  .mul(10);
+template <typename Params>
+class ParamsBuilder {
+protected:
+    Params params;
+
+public:
+    operator Params() const {
+        return params;
+    }
+};
+#define REFERENCE_TESTS_ADD_SET_PARAM(builder_type, param_to_set) \
+    builder_type& param_to_set(decltype(params.param_to_set) t) { \
+        params.param_to_set = std::move(t);                       \
+        return *this;                                             \
+    }
+
+}  // namespace reference_tests
diff --git a/docs/template_plugin/tests/functional/op_reference/convert.cpp b/docs/template_plugin/tests/functional/op_reference/convert.cpp
index fb32fda4cbbfd8..b8e6f5846f7408 100644
--- a/docs/template_plugin/tests/functional/op_reference/convert.cpp
+++ b/docs/template_plugin/tests/functional/op_reference/convert.cpp
@@ -12,6 +12,7 @@
 
 #include "base_reference_test.hpp"
 
+using namespace reference_tests;
 using namespace ngraph;
 using namespace InferenceEngine;
 
diff --git a/docs/template_plugin/tests/functional/op_reference/grn.cpp b/docs/template_plugin/tests/functional/op_reference/grn.cpp
index 4d003b9b9a2fef..e7fc0c79f6b82b 100644
--- a/docs/template_plugin/tests/functional/op_reference/grn.cpp
+++ b/docs/template_plugin/tests/functional/op_reference/grn.cpp
@@ -12,21 +12,22 @@
 
 #include "base_reference_test.hpp"
 
+using namespace reference_tests;
 using namespace ngraph;
 using namespace InferenceEngine;
 
 namespace {
 struct GrnParams {
     template <class IT>
-    GrnParams(const float bias, const ngraph::PartialShape& shape, const ngraph::element::Type& iType, const std::vector<IT>& iValues,
+    GrnParams(const float bias, const PartialShape& shape, const element::Type& iType, const std::vector<IT>& iValues,
               const std::vector<IT>& oValues)
         : bias(bias), pshape(shape), inType(iType), outType(iType), inputData(CreateBlob(iType, iValues)), refData(CreateBlob(iType, oValues)) {}
     float bias;
-    ngraph::PartialShape pshape;
-    ngraph::element::Type inType;
-    ngraph::element::Type outType;
-    InferenceEngine::Blob::Ptr inputData;
-    InferenceEngine::Blob::Ptr refData;
+    PartialShape pshape;
+    element::Type inType;
+    element::Type outType;
+    Blob::Ptr inputData;
+    Blob::Ptr refData;
 };
 
 class ReferenceGrnLayerTest : public testing::TestWithParam<GrnParams>, public CommonReferenceTest {
@@ -60,21 +61,21 @@ TEST_P(ReferenceGrnLayerTest, CompareWithHardcodedRefs) {
 }
 
 template <element::Type_t IN_ET>
-std::vector<GrnParams> generateGrnParams(const ngraph::element::Type& type) {
+std::vector<GrnParams> generateGrnParams(const element::Type& type) {
     using T = typename element_type_traits<IN_ET>::value_type;
     std::vector<GrnParams> grnParams {
         // bias 1e-6 // 2D // 3D // 4D
-        GrnParams(1e-6, ngraph::PartialShape {3, 4}, type, std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12},
+        GrnParams(1e-6, PartialShape {3, 4}, type, std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12},
                   std::vector<T> {0.182574, 0.365148, 0.547723, 0.730297, 0.379049, 0.454859, 0.530669, 0.606478, 0.426162, 0.473514, 0.520865, 0.568217}),
-        GrnParams(1e-6, ngraph::PartialShape {2, 3, 4}, type,
+        GrnParams(1e-6, PartialShape {2, 3, 4}, type,
                   std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24},
                   std::vector<T> {0.0966737, 0.169031, 0.224231, 0.267261, 0.483368, 0.507093, 0.523205, 0.534522, 0.870063, 0.845154, 0.822179, 0.801784,
                                   0.433574,  0.441836, 0.449215, 0.455842, 0.566982, 0.568075, 0.569005, 0.569803, 0.700389, 0.694314, 0.688796, 0.683763}),
-        GrnParams(1e-6, ngraph::PartialShape {1, 2, 3, 4}, type,
+        GrnParams(1e-6, PartialShape {1, 2, 3, 4}, type,
                   std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24},
                   std::vector<T> {0.0766965, 0.141421, 0.196116, 0.242536, 0.282166, 0.316228, 0.345705, 0.371391, 0.393919, 0.413803, 0.431455, 0.447214,
                                   0.997055,  0.989949, 0.980581, 0.970143, 0.959365, 0.948683, 0.938343, 0.928477, 0.919145, 0.910366, 0.902134, 0.894427}),
-        GrnParams(1e-6, ngraph::PartialShape {2, 2, 3, 4}, type,
+        GrnParams(1e-6, PartialShape {2, 2, 3, 4}, type,
                   std::vector<T> {1,  2,  3,  4,  5,  6,  7,  8,  9,  10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
                                   25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48},
                   std::vector<T> {0.0766965, 0.141421, 0.196116, 0.242536, 0.282166, 0.316228, 0.345705, 0.371391, 0.393919, 0.413803, 0.431455, 0.447214,
@@ -82,17 +83,17 @@ std::vector<GrnParams> generateGrnParams(const ngraph::element::Type& type) {
                                   0.559857,  0.564684, 0.56921,  0.573462, 0.577465, 0.581238, 0.584802, 0.588172, 0.591364, 0.594391, 0.597266, 0.6,
                                   0.828589,  0.825307, 0.822192, 0.819232, 0.816416, 0.813733, 0.811176, 0.808736, 0.806405, 0.804176, 0.802043, 0.8}),
         // bias 100.25 // 2D // 3D // 4D
-        GrnParams(100.25, ngraph::PartialShape {3, 4}, type, std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12},
+        GrnParams(100.25, PartialShape {3, 4}, type, std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12},
                   std::vector<T> {0.0876216, 0.175243, 0.262865, 0.350486, 0.301923, 0.362308, 0.422693, 0.483077, 0.385076, 0.427863, 0.470649, 0.513435}),
-        GrnParams(100.25, ngraph::PartialShape {2, 3, 4}, type,
+        GrnParams(100.25, PartialShape {2, 3, 4}, type,
                   std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24},
                   std::vector<T> {0.0694629, 0.129032, 0.179525, 0.222137, 0.347314, 0.387097, 0.418891, 0.444273, 0.625166, 0.645161, 0.658258, 0.66641,
                                   0.41125,   0.421303, 0.430287, 0.438356, 0.537789, 0.541675, 0.54503,  0.547945, 0.664327, 0.662047, 0.659774, 0.657534}),
-        GrnParams(100.25, ngraph::PartialShape {1, 2, 3, 4}, type,
+        GrnParams(100.25, PartialShape {1, 2, 3, 4}, type,
                   std::vector<T> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24},
                   std::vector<T> {0.0608299, 0.115422, 0.164091, 0.207321, 0.245662, 0.279675, 0.309889, 0.336786, 0.360795, 0.38229,  0.401596, 0.418994,
                                   0.790789,  0.807954, 0.820457, 0.829283, 0.835252, 0.839026, 0.841128, 0.841965, 0.841854, 0.841037, 0.839701, 0.837989f}),
-        GrnParams(100.25, ngraph::PartialShape {2, 2, 3, 4}, type,
+        GrnParams(100.25, PartialShape {2, 2, 3, 4}, type,
                   std::vector<T> {1,  2,  3,  4,  5,  6,  7,  8,  9,  10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
                                   25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48},
                   std::vector<T> {0.0608299, 0.115422, 0.164091, 0.207321, 0.245662, 0.279675, 0.309889, 0.336786, 0.360795, 0.38229,  0.401596, 0.418994,
@@ -103,9 +104,9 @@ std::vector<GrnParams> generateGrnParams(const ngraph::element::Type& type) {
 }
 
 std::vector<GrnParams> generateGrnCombinedParams() {
-    const std::vector<std::vector<GrnParams>> grnTypeParams {generateGrnParams<element::Type_t::bf16>(ngraph::element::bf16),
-                                                             generateGrnParams<element::Type_t::f16>(ngraph::element::f16),
-                                                             generateGrnParams<element::Type_t::f32>(ngraph::element::f32)};
+    const std::vector<std::vector<GrnParams>> grnTypeParams {generateGrnParams<element::Type_t::bf16>(element::bf16),
+                                                             generateGrnParams<element::Type_t::f16>(element::f16),
+                                                             generateGrnParams<element::Type_t::f32>(element::f32)};
     std::vector<GrnParams> combinedParams;
     std::for_each(grnTypeParams.begin(), grnTypeParams.end(), [&](std::vector<GrnParams> params) {
         combinedParams.insert(combinedParams.end(), params.begin(), params.end());
diff --git a/docs/template_plugin/tests/functional/op_reference/select.cpp b/docs/template_plugin/tests/functional/op_reference/select.cpp
index c4dec3f8172e83..0cbc242c61b202 100644
--- a/docs/template_plugin/tests/functional/op_reference/select.cpp
+++ b/docs/template_plugin/tests/functional/op_reference/select.cpp
@@ -12,6 +12,7 @@
 
 #include "base_reference_test.hpp"
 
+using namespace reference_tests;
 using namespace ngraph;
 using namespace InferenceEngine;
 
@@ -33,12 +34,12 @@ struct SelectParams {
     element::Type data_type;
     op::AutoBroadcastSpec broadcast;
     PartialShape select_input_pshape;
-    InferenceEngine::Blob::Ptr select_input;
+    Blob::Ptr select_input;
     PartialShape if_input_pshape;
-    InferenceEngine::Blob::Ptr if_input;
+    Blob::Ptr if_input;
     PartialShape else_input_pshape;
-    InferenceEngine::Blob::Ptr else_input;
-    InferenceEngine::Blob::Ptr expected_output;
+    Blob::Ptr else_input;
+    Blob::Ptr expected_output;
 };
 
 class ReferenceSelectLayerTest : public testing::TestWithParam<SelectParams>, public CommonReferenceTest {
diff --git a/docs/template_plugin/tests/functional/op_reference/sign.cpp b/docs/template_plugin/tests/functional/op_reference/sign.cpp
index a5ff9b11978a90..ca1505cea1368e 100644
--- a/docs/template_plugin/tests/functional/op_reference/sign.cpp
+++ b/docs/template_plugin/tests/functional/op_reference/sign.cpp
@@ -12,19 +12,20 @@
 
 #include "base_reference_test.hpp"
 
+using namespace reference_tests;
 using namespace ngraph;
 using namespace InferenceEngine;
 
 struct SignParams {
     template <class IT, class OT>
-    SignParams(const ngraph::PartialShape& shape, const ngraph::element::Type& iType, const ngraph::element::Type& oType, const std::vector<IT>& iValues,
+    SignParams(const PartialShape& shape, const element::Type& iType, const element::Type& oType, const std::vector<IT>& iValues,
                   const std::vector<OT>& oValues)
         : pshape(shape), inType(iType), outType(oType), inputData(CreateBlob(iType, iValues)), refData(CreateBlob(oType, oValues)) {}
-    ngraph::PartialShape pshape;
-    ngraph::element::Type inType;
-    ngraph::element::Type outType;
-    InferenceEngine::Blob::Ptr inputData;
-    InferenceEngine::Blob::Ptr refData;
+    PartialShape pshape;
+    element::Type inType;
+    element::Type outType;
+    Blob::Ptr inputData;
+    Blob::Ptr refData;
 };
 
 class ReferenceSignLayerTest : public testing::TestWithParam<SignParams>, public CommonReferenceTest {
@@ -59,22 +60,22 @@ TEST_P(ReferenceSignLayerTest, CompareWithHardcodedRefs) {
 INSTANTIATE_TEST_SUITE_P(
     smoke_Sign_With_Hardcoded_Refs, ReferenceSignLayerTest,
     ::testing::Values(
-        SignParams(ngraph::PartialShape {6}, ngraph::element::f32, ngraph::element::f32,
+        SignParams(PartialShape {6}, element::f32, element::f32,
                       std::vector<float> {1, -2, 0, -4.8f, 4.8f, -0.0f},
                       std::vector<float> {1, -1, 0, -1, 1, 0}),
-        SignParams(ngraph::PartialShape {6}, ngraph::element::f16, ngraph::element::f16,
+        SignParams(PartialShape {6}, element::f16, element::f16,
                       std::vector<float16> {1, -2, 0, -4.8f, 4.8f, -0.0f},
                       std::vector<float16> {1, -1, 0, -1, 1, 0}),
-        SignParams(ngraph::PartialShape {6}, ngraph::element::u64, ngraph::element::u64,
+        SignParams(PartialShape {6}, element::u64, element::u64,
                       std::vector<uint64_t> {1, 2, 0, 4, 4, 0},
                       std::vector<uint64_t> {1, 1, 0, 1, 1, 0}),
-        SignParams(ngraph::PartialShape {6}, ngraph::element::u32, ngraph::element::u32,
+        SignParams(PartialShape {6}, element::u32, element::u32,
                       std::vector<uint32_t> {1, 2, 0, 4, 4, 0},
                       std::vector<uint32_t> {1, 1, 0, 1, 1, 0}),
-        SignParams(ngraph::PartialShape {6}, ngraph::element::i32, ngraph::element::i32,
+        SignParams(PartialShape {6}, element::i32, element::i32,
                       std::vector<int32_t> {1, -2, 0, -4, 4, -0},
                       std::vector<int32_t> {1, -1, 0, -1, 1, 0}),
-        SignParams(ngraph::PartialShape {6}, ngraph::element::i64, ngraph::element::i64,
+        SignParams(PartialShape {6}, element::i64, element::i64,
                       std::vector<int64_t> {1, -2, 0, -4, 4, -0},
                       std::vector<int64_t> {1, -1, 0, -1, 1, 0})),
     ReferenceSignLayerTest::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp b/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp
index 355afbaf687576..efe2efaf5ee495 100644
--- a/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp
+++ b/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp
@@ -36,6 +36,7 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes
         {Clamp,                 {{-2.0f, 2.0f}}},
         {Negative,              {}},
         {Acos,                  {}},
+        {Acosh,                 {}},
         {Asin,                  {}},
         {Asinh,                  {}},
         {Atan,                  {}},
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
index 08745acac2d741..98b73bfb1d4818 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
@@ -37,6 +37,7 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes
         {Clamp,                 {{-2.0f, 2.0f}}},
         {Negative,              {}},
         {Acos,                  {}},
+        {Acosh,                  {}},
         {Asin,                  {}},
         {Asinh,                 {}},
         {Atan,                  {}},
@@ -66,6 +67,7 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes
 
 // List of operations that should be tested also with integer precision
 const std::map<ActivationTypes, std::vector<std::vector<float>>> intActivationTypes = {
+        {Acosh,                 {}},
         {Asinh,                 {}},
         {Atan,                  {}},
         {Negative,              {}},
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/activation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/activation.cpp
index 6bbf98451fe69d..78c383353e9b36 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/activation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/activation.cpp
@@ -34,6 +34,7 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes
         {Clamp,                 {{-2.0f, 2.0f}}},
         {Negative,              {}},
         {Acos,                  {}},
+        {Acosh,                 {}},
         {Asin,                  {}},
         {Asinh,                  {}},
         {Atan,                  {}},
diff --git a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/activation.hpp b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/activation.hpp
index 5a9c5226f6f398..7e5ad37d2b9a32 100644
--- a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/activation.hpp
+++ b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/activation.hpp
@@ -39,6 +39,7 @@ static std::map<ngraph::helpers::ActivationTypes, std::string> activationNames =
         {ngraph::helpers::ActivationTypes::Clamp,                 "Clamp"},
         {ngraph::helpers::ActivationTypes::Negative,              "Negative"},
         {ngraph::helpers::ActivationTypes::Acos,                  "Acos"},
+        {ngraph::helpers::ActivationTypes::Acosh,                 "Acosh"},
         {ngraph::helpers::ActivationTypes::Asin,                  "Asin"},
         {ngraph::helpers::ActivationTypes::Asinh,                 "Asinh"},
         {ngraph::helpers::ActivationTypes::Atan,                  "Atan"},
diff --git a/inference-engine/tests/functional/shared_test_classes/src/single_layer/activation.cpp b/inference-engine/tests/functional/shared_test_classes/src/single_layer/activation.cpp
index 5b90cfc2079dd6..e3d4956eee0350 100644
--- a/inference-engine/tests/functional/shared_test_classes/src/single_layer/activation.cpp
+++ b/inference-engine/tests/functional/shared_test_classes/src/single_layer/activation.cpp
@@ -84,6 +84,12 @@ InferenceEngine::Blob::Ptr ActivationLayerTest::GenerateInput(const InferenceEng
             resolution = 32768;
             break;
         }
+        case ngraph::helpers::ActivationTypes::Acosh: {
+            data_start_from = 1;
+            data_range = 200;
+            resolution = 32768;
+            break;
+        }
         case ngraph::helpers::ActivationTypes::Ceiling: {
             data_start_from = -1000;
             data_range = 2000;
diff --git a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
index fe6cc530fb4e5b..d383d0f95c278d 100644
--- a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
+++ b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
@@ -4,6 +4,7 @@
 VERIFIED_OP_REFERENCES = [
     'Abs-1',
     'Acos-1',
+    'Acosh-3',
     'Add-1',
     'Asin-1',
     'Asinh-3',
diff --git a/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/utils/ngraph_helpers.hpp b/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/utils/ngraph_helpers.hpp
index 47405a8e51c4f5..86ba1f04487462 100644
--- a/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/utils/ngraph_helpers.hpp
+++ b/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/utils/ngraph_helpers.hpp
@@ -99,6 +99,7 @@ enum ActivationTypes {
     Clamp,
     Negative,
     Acos,
+    Acosh,
     Asin,
     Asinh,
     Atan,
diff --git a/inference-engine/tests/ngraph_helpers/ngraph_functions/src/activation.cpp b/inference-engine/tests/ngraph_helpers/ngraph_functions/src/activation.cpp
index d8dce877b0f1df..1d784cbe55c567 100644
--- a/inference-engine/tests/ngraph_helpers/ngraph_functions/src/activation.cpp
+++ b/inference-engine/tests/ngraph_helpers/ngraph_functions/src/activation.cpp
@@ -46,6 +46,8 @@ std::shared_ptr<ngraph::Node> makeActivation(const ngraph::Output<Node> &in,
             return std::make_shared<ngraph::op::Negative>(in);
         case ngraph::helpers::ActivationTypes::Acos:
             return std::make_shared<ngraph::op::Acos>(in);
+        case ngraph::helpers::ActivationTypes::Acosh:
+            return std::make_shared<ngraph::op::Acosh>(in);
         case ngraph::helpers::ActivationTypes::Asin:
             return std::make_shared<ngraph::op::Asin>(in);
         case ngraph::helpers::ActivationTypes::Asinh:
diff --git a/ngraph/core/include/ngraph/op/acosh.hpp b/ngraph/core/include/ngraph/op/acosh.hpp
index 6937e8faf970c4..ad9ac7d2821324 100644
--- a/ngraph/core/include/ngraph/op/acosh.hpp
+++ b/ngraph/core/include/ngraph/op/acosh.hpp
@@ -19,8 +19,8 @@ namespace ngraph
             class NGRAPH_API Acosh : public util::UnaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Acosh", 3};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs an Acosh operation.
                 Acosh() = default;
                 /// \brief Constructs an Acosh operation.
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/acosh.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/acosh.hpp
index 7c01940cb802e2..e36da23ab5d10d 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/acosh.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/acosh.hpp
@@ -13,7 +13,8 @@ namespace ngraph
     {
         namespace reference
         {
-            template <typename T>
+            template <typename T,
+                      typename std::enable_if<!std::is_integral<T>::value, bool>::type = true>
             void acosh(const T* arg, T* out, size_t count)
             {
                 for (size_t i = 0; i < count; i++)
@@ -21,6 +22,16 @@ namespace ngraph
                     out[i] = std::acosh(arg[i]);
                 }
             }
+
+            template <typename T,
+                      typename std::enable_if<std::is_integral<T>::value, bool>::type = true>
+            void acosh(const T* arg, T* out, size_t count)
+            {
+                for (size_t i = 0; i < count; i++)
+                {
+                    out[i] = std::roundl(std::acosh(arg[i]));
+                }
+            }
         } // namespace reference
     }     // namespace runtime
 } // namespace ngraph
diff --git a/ngraph/core/src/op/acosh.cpp b/ngraph/core/src/op/acosh.cpp
index cc8d72a8f08d9f..3969cc2e4ee711 100644
--- a/ngraph/core/src/op/acosh.cpp
+++ b/ngraph/core/src/op/acosh.cpp
@@ -14,7 +14,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::v3::Acosh::type_info;
+NGRAPH_RTTI_DEFINITION(op::v3::Acosh, "Acosh", 3, util::UnaryElementwiseArithmetic);
 
 op::v3::Acosh::Acosh(const Output<Node>& arg)
     : UnaryElementwiseArithmetic(arg)
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index acdabe9fb81ced..24d70dece93564 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -230,6 +230,7 @@ set(SRC
     visitors/partial_shape.cpp
     visitors/user_op.cpp
     visitors/value_map.cpp
+    visitors/op/acosh.cpp
     visitors/op/adaptive_avg_pool.cpp
     visitors/op/adaptive_max_pool.cpp
     visitors/op/asinh.cpp
@@ -371,7 +372,6 @@ set(MULTI_TEST_SRC
     backend/abc.in.cpp
     backend/abs.in.cpp
     backend/acos.in.cpp
-    backend/acosh.in.cpp
     backend/adaptive_avg_pool.in.cpp
     backend/adaptive_max_pool.in.cpp
     backend/add.in.cpp
diff --git a/ngraph/test/backend/acosh.in.cpp b/ngraph/test/backend/acosh.in.cpp
deleted file mode 100644
index b3325349241fec..00000000000000
--- a/ngraph/test/backend/acosh.in.cpp
+++ /dev/null
@@ -1,51 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <algorithm>
-#include <cinttypes>
-#include <cmath>
-#include <cstdlib>
-#include <random>
-#include <string>
-
-// clang-format off
-#ifdef ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
-#define DEFAULT_FLOAT_TOLERANCE_BITS ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
-#endif
-
-#ifdef ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
-#define DEFAULT_DOUBLE_TOLERANCE_BITS ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
-#endif
-// clang-format on
-
-#include "gtest/gtest.h"
-#include "ngraph/ngraph.hpp"
-#include "util/engine/test_engines.hpp"
-#include "util/test_case.hpp"
-#include "util/test_control.hpp"
-
-using namespace std;
-using namespace ngraph;
-
-static string s_manifest = "${MANIFEST}";
-using TestEngine = test::ENGINE_CLASS_NAME(${BACKEND_NAME});
-
-NGRAPH_TEST(${BACKEND_NAME}, acosh)
-{
-    Shape shape{11};
-    auto A = make_shared<op::Parameter>(element::f32, shape);
-    auto f = make_shared<Function>(make_shared<op::Acosh>(A), ParameterVector{A});
-
-    vector<float> input{0.f, 1.f, -1.f, 2.f, -2.f, 3.f, -3.f, 4.f, 5.f, 10.f, 100.f};
-    vector<float> expected;
-    for (float f : input)
-    {
-        expected.push_back(std::acosh(f));
-    }
-
-    auto test_case = test::TestCase<TestEngine>(f);
-    test_case.add_input<float>(input);
-    test_case.add_expected_output<float>(shape, expected);
-    test_case.run();
-}
diff --git a/ngraph/test/runtime/ie/unit_test.manifest b/ngraph/test/runtime/ie/unit_test.manifest
index dbd2f28aea5108..3984346f97b353 100644
--- a/ngraph/test/runtime/ie/unit_test.manifest
+++ b/ngraph/test/runtime/ie/unit_test.manifest
@@ -1018,7 +1018,6 @@ IE_CPU.convert_like_dyn_float16_to_int64
 # Operations were removed from opset
 IE_CPU.atanh
 IE_CPU.asinh
-IE_CPU.acosh
 
 # Unsupported collapse op with dynamic shape
 IE_CPU.builder_opset1_collapse_dyn_shape
diff --git a/ngraph/test/type_prop/acosh.cpp b/ngraph/test/type_prop/acosh.cpp
new file mode 100644
index 00000000000000..eac5bec74b0132
--- /dev/null
+++ b/ngraph/test/type_prop/acosh.cpp
@@ -0,0 +1,9 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "unary_ops.hpp"
+
+using Type = ::testing::Types<ngraph::op::Acosh>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(type_prop_acosh, UnaryOperator, Type);
diff --git a/ngraph/test/visitors/op/acosh.cpp b/ngraph/test/visitors/op/acosh.cpp
new file mode 100644
index 00000000000000..413a68710ab3c6
--- /dev/null
+++ b/ngraph/test/visitors/op/acosh.cpp
@@ -0,0 +1,11 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "unary_ops.hpp"
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::Acosh, element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
+                               UnaryOperatorVisitor,
+                               Type,
+                               UnaryOperatorTypeName);

From 6dc771c2e7b6984cc5ee31a04f8f187368e465fa Mon Sep 17 00:00:00 2001
From: Vladimir Paramuzov <vladimir.paramuzov@intel.com>
Date: Thu, 22 Jul 2021 13:29:09 +0300
Subject: [PATCH 36/71] [GPU] Allowed more complex syntax for debug config
 options. Some alignment with CPU (#6682)

---
 cmake/features.cmake                          |  6 +-
 .../src/cldnn_engine/CMakeLists.txt           |  2 +-
 inference-engine/thirdparty/CMakeLists.txt    |  1 -
 .../thirdparty/clDNN/CMakeLists.txt           |  2 +-
 .../clDNN/runtime/debug_configuration.cpp     | 91 ++++++++++++++++---
 5 files changed, 83 insertions(+), 19 deletions(-)

diff --git a/cmake/features.cmake b/cmake/features.cmake
index 49e92b94394c8d..22ddd0a55834eb 100644
--- a/cmake/features.cmake
+++ b/cmake/features.cmake
@@ -112,7 +112,11 @@ ie_dependent_option(ENABLE_TBB_RELEASE_ONLY "Only Release TBB libraries are link
 
 ie_option (ENABLE_SYSTEM_PUGIXML "use the system copy of pugixml" OFF)
 
-ie_option (ENABLE_CPU_DEBUG_CAPS "enable CPU debug capabilities at runtime" OFF)
+ie_option (ENABLE_DEBUG_CAPS "enable OpenVINO debug capabilities at runtime" OFF)
+
+ie_dependent_option (ENABLE_GPU_DEBUG_CAPS "enable GPU debug capabilities at runtime" ON "ENABLE_DEBUG_CAPS" OFF)
+
+ie_dependent_option (ENABLE_CPU_DEBUG_CAPS "enable CPU debug capabilities at runtime" ON "ENABLE_DEBUG_CAPS" OFF)
 
 if(ANDROID OR WINDOWS_STORE OR (MSVC AND (ARM OR AARCH64)))
     set(protoc_available OFF)
diff --git a/inference-engine/src/cldnn_engine/CMakeLists.txt b/inference-engine/src/cldnn_engine/CMakeLists.txt
index e292228c73f664..46dfd5e9fce858 100644
--- a/inference-engine/src/cldnn_engine/CMakeLists.txt
+++ b/inference-engine/src/cldnn_engine/CMakeLists.txt
@@ -12,7 +12,7 @@ if(CMAKE_COMPILER_IS_GNUCC)
     endif()
 endif()
 
-if(GPU_DEBUG_CONFIG)
+if(ENABLE_GPU_DEBUG_CAPS)
   add_definitions(-DGPU_DEBUG_CONFIG=1)
 endif()
 
diff --git a/inference-engine/thirdparty/CMakeLists.txt b/inference-engine/thirdparty/CMakeLists.txt
index deb63c92dd6b99..edbf6e6b4ea09b 100644
--- a/inference-engine/thirdparty/CMakeLists.txt
+++ b/inference-engine/thirdparty/CMakeLists.txt
@@ -24,7 +24,6 @@ if (ENABLE_CLDNN)
         set(CLDNN__INCLUDE_TESTS OFF CACHE BOOL "" FORCE)
     endif()
     set(CLDNN_THREADING "${THREADING}" CACHE STRING "" FORCE)
-    set(GPU_DEBUG_CONFIG OFF CACHE BOOL "Enable debug config feature")
     add_subdirectory(clDNN)
 endif()
 
diff --git a/inference-engine/thirdparty/clDNN/CMakeLists.txt b/inference-engine/thirdparty/clDNN/CMakeLists.txt
index 830c53f104fd41..63cf352000bee6 100644
--- a/inference-engine/thirdparty/clDNN/CMakeLists.txt
+++ b/inference-engine/thirdparty/clDNN/CMakeLists.txt
@@ -20,7 +20,7 @@ else()
     add_definitions(-DCLDNN_THREADING=CLDNN_THREADING_THREADPOOL)
 endif()
 
-if(GPU_DEBUG_CONFIG)
+if(ENABLE_GPU_DEBUG_CAPS)
   add_definitions(-DGPU_DEBUG_CONFIG=1)
 endif()
 
diff --git a/inference-engine/thirdparty/clDNN/runtime/debug_configuration.cpp b/inference-engine/thirdparty/clDNN/runtime/debug_configuration.cpp
index 4f07f5e1f09459..959ca340326da9 100644
--- a/inference-engine/thirdparty/clDNN/runtime/debug_configuration.cpp
+++ b/inference-engine/thirdparty/clDNN/runtime/debug_configuration.cpp
@@ -5,6 +5,8 @@
 #include "cldnn/runtime/debug_configuration.hpp"
 #include <iostream>
 #include <memory>
+#include <vector>
+#include <sstream>
 
 namespace cldnn {
 
@@ -13,24 +15,83 @@ const char *debug_configuration::prefix = "GPU_Debug: ";
 // Default policy is that dump_configuration will override other configuration from IE.
 
 #ifdef GPU_DEBUG_CONFIG
-static void print_option(std::string option_name, std::string option_value) {
+
+template<typename T>
+void print_option(std::string option_name, T option_value) {
     GPU_DEBUG_COUT << "Config " << option_name << " = " << option_value << std::endl;
 }
 
-static void get_int_env(const std::string &var, int &val) {
-    if (const auto env_var = std::getenv(var.c_str())) {
-        val = std::stoi(env_var);
-        print_option(var, std::to_string(val));
+static std::string to_upper_case(const std::string& var) {
+    std::stringstream s;
+
+    for (size_t i = 0; i < var.size(); i++) {
+        if (std::isupper(var[i])) {
+            if (i != 0) {
+                s << "_";
+            }
+            s << var[i];
+        } else {
+            s << static_cast<char>(std::toupper(var[i]));
+        }
     }
+
+    return s.str();
 }
 
-static void get_str_env(const std::string &var, std::string &val) {
-    if (const auto env_var = std::getenv(var.c_str())) {
-        val = env_var;
+static std::vector<std::string> get_possible_option_names(const std::string& var, std::vector<std::string> allowed_option_prefixes) {
+    std::vector<std::string> result;
+
+    for (auto& prefix : allowed_option_prefixes) {
+        result.push_back(prefix + var);
+        result.push_back(prefix + to_upper_case(var));
+    }
+
+    return result;
+}
+
+template <typename T>
+T convert_to(const std::string &str) {
+    std::istringstream ss(str);
+    T res;
+    ss >> res;
+    return res;
+}
+
+template<typename T>
+void get_debug_env_var(const std::string &var, T &val, std::vector<std::string> allowed_option_prefixes) {
+    bool found = false;
+    for (auto o : get_possible_option_names(var, allowed_option_prefixes)) {
+        if (const auto env_var = std::getenv(o.c_str())) {
+            val = convert_to<T>(env_var);
+            found = true;
+        }
+    }
+
+    if (found) {
         print_option(var, val);
     }
 }
 
+template<typename T>
+void get_gpu_debug_env_var(const std::string &var, T &val) {
+    return get_debug_env_var(var, val, {"OV_GPU_"});
+}
+
+template<typename T>
+void get_common_debug_env_var(const std::string &var, T &val) {
+    // The list below should be prioritized from lowest to highest prefix priority
+    // If an option is set several times with different prefixes, version with the highest priority will be actually used.
+    // This may allow to enable global option with some value and override this value for GPU plugin
+    // For example: OV_GPU_Verbose=2 OV_Verbose=1 ./my_app => this->verbose == 2
+    // In that case we enable Verbose (with level = 1) for all OV components that support this option, but for GPU plugin we increase verbose level to 2
+    std::vector<std::string> allowed_option_prefixes = {
+        "OV_",
+        "OV_GPU_"
+    };
+
+    return get_debug_env_var(var, val, allowed_option_prefixes);
+}
+
 #endif
 
 debug_configuration::debug_configuration()
@@ -42,13 +103,13 @@ debug_configuration::debug_configuration()
         , dump_layers(std::string())
         , dump_layers_dst_only(0) {
 #ifdef GPU_DEBUG_CONFIG
-    get_int_env("OV_GPU_Verbose", verbose);
-    get_int_env("OV_GPU_PrintMultiKernelPerf", print_multi_kernel_perf);
-    get_int_env("OV_GPU_DisableUsm", disable_usm);
-    get_str_env("OV_GPU_DumpGraphs", dump_graphs);
-    get_str_env("OV_GPU_DumpLayersPath", dump_layers_path);
-    get_str_env("OV_GPU_DumpLayers", dump_layers);
-    get_int_env("OV_GPU_DumpLayersDstOnly", dump_layers_dst_only);
+    get_common_debug_env_var("Verbose", verbose);
+    get_gpu_debug_env_var("PrintMultiKernelPerf", print_multi_kernel_perf);
+    get_gpu_debug_env_var("DisableUsm", disable_usm);
+    get_gpu_debug_env_var("DumpGraphs", dump_graphs);
+    get_gpu_debug_env_var("DumpLayersPath", dump_layers_path);
+    get_gpu_debug_env_var("DumpLayers", dump_layers);
+    get_gpu_debug_env_var("DumpLayersDstOnly", dump_layers_dst_only);
     if (dump_layers_path.length() > 0 && !disable_usm) {
         disable_usm = 1;
         GPU_DEBUG_COUT << "DisableUsm=1 because of DumpLayersPath" << std::endl;

From abc6a336b1c8ae5de5f9f0cfb0a404b9bc5c984e Mon Sep 17 00:00:00 2001
From: Vladimir Gavrilov <vladimir.gavrilov@intel.com>
Date: Thu, 22 Jul 2021 14:39:54 +0300
Subject: [PATCH 37/71] Fixed processing tags in summarize_graph.py (#6726)

---
 model-optimizer/mo/utils/summarize_graph.py | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/model-optimizer/mo/utils/summarize_graph.py b/model-optimizer/mo/utils/summarize_graph.py
index 2a652ba3a76ad2..29180d8c616965 100644
--- a/model-optimizer/mo/utils/summarize_graph.py
+++ b/model-optimizer/mo/utils/summarize_graph.py
@@ -70,9 +70,10 @@ def summarize_graph(graph_def):
     if argv.input_model and argv.saved_model_dir:
         print("[ ERROR ] Both keys were provided --input_model and --input_dir. Please, provide only one of them")
         sys.exit(1)
-    graph_def, _ = load_tf_graph_def(graph_file_name=argv.input_model, is_binary=not argv.text,
-                                     checkpoint=argv.input_checkpoint,
-                                     model_dir=argv.saved_model_dir, saved_model_tags=argv.saved_model_tags)
+    tags = argv.saved_model_tags.split(",")
+    graph_def, _, _ = load_tf_graph_def(graph_file_name=argv.input_model, is_binary=not argv.text,
+                                        checkpoint=argv.input_checkpoint,
+                                        model_dir=argv.saved_model_dir, saved_model_tags=tags)
     summary = summarize_graph(graph_def)
     print("{} input(s) detected:".format(len(summary['inputs'])))
     for input in summary['inputs']:

From fd3e4a3d455429df9b475f589d067ffe6fc3e3bf Mon Sep 17 00:00:00 2001
From: Paul Youngsoo Ahn <paul.y.ahn@intel.com>
Date: Thu, 22 Jul 2021 22:48:45 +0900
Subject: [PATCH 38/71] [GPU] Enable loop5 (#6427)

---
 .../cldnn_engine/cldnn_primitives_list.hpp    |   2 +-
 .../src/cldnn_engine/ops/loop.cpp             | 227 +++++++++++++++++
 .../single_layer_tests/loop.cpp               |   3 +-
 .../skip_tests_config.cpp                     |   5 +-
 .../plugin/gpu/single_layer_tests/loop.cpp    | 140 ++++++++++
 .../shared_test_classes/single_layer/loop.hpp |   3 +-
 .../src/single_layer/loop.cpp                 |  44 +++-
 .../clDNN/src/impls/common/loop.cpp           | 141 ++++------
 .../thirdparty/clDNN/src/include/loop_inst.h  | 240 ++++++++++++------
 .../thirdparty/clDNN/src/loop.cpp             |  20 +-
 .../thirdparty/clDNN/src/program.cpp          |  11 +-
 .../clDNN/tests/test_cases/loop_gpu_test.cpp  |  15 --
 12 files changed, 651 insertions(+), 200 deletions(-)
 create mode 100644 inference-engine/src/cldnn_engine/ops/loop.cpp
 create mode 100644 inference-engine/tests/functional/plugin/gpu/single_layer_tests/loop.cpp

diff --git a/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp b/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp
index e562447189b6c7..81a055a4a09a5b 100644
--- a/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp
+++ b/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp
@@ -194,11 +194,11 @@ REGISTER_FACTORY(v5, LSTMSequence);
 //REGISTER_FACTORY(v5, NonMaxSuppression); Supported via v5 -> v5 internal conversion
 REGISTER_FACTORY(v5, Round);
 REGISTER_FACTORY(v5, GatherND);
+REGISTER_FACTORY(v5, Loop);
 
 // ----------------------------- Unsupported v5 ops ----------------------------- //
 // REGISTER_FACTORY(v5, BatchNormInference);
 // REGISTER_FACTORY(v5, GRUSequence);
-// REGISTER_FACTORY(v5, Loop);
 // REGISTER_FACTORY(v5, RNNSequence);
 
 // ------------------------------ Supported v6 ops ------------------------------ //
diff --git a/inference-engine/src/cldnn_engine/ops/loop.cpp b/inference-engine/src/cldnn_engine/ops/loop.cpp
new file mode 100644
index 00000000000000..1ac452265b8820
--- /dev/null
+++ b/inference-engine/src/cldnn_engine/ops/loop.cpp
@@ -0,0 +1,227 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+#include "cldnn_program.h"
+#include "cldnn_common_utils.h"
+#include "cldnn_engine.h"
+
+#include <cpp/ie_cnn_network.h>
+
+#include "ngraph/op/loop.hpp"
+#include "ngraph/op/constant.hpp"
+#include "ngraph/op/util/sub_graph_base.hpp"
+#include "transformations/utils/utils.hpp"
+#include "ie_ngraph_utils.hpp"
+
+#include "cldnn/primitives/loop.hpp"
+#include "cldnn/primitives/mutable_data.hpp"
+#include "cldnn/primitives/data.hpp"
+#include "cldnn/primitives/reorder.hpp"
+#include "cldnn/graph/topology.hpp"
+
+#include <vector>
+#include <algorithm>
+
+using Loop = ngraph::op::v5::Loop;
+
+namespace CLDNNPlugin {
+
+template<class DATA_TYPE>
+static DATA_TYPE CreateScalarData(Program &p, const cldnn::primitive_id& id, int64_t num) {
+    auto mem = p.GetEngine().allocate_memory({ cldnn::data_types::i64, cldnn::format::bfyx, { 1, 1, 1, 1 } });
+    cldnn::mem_lock<int64_t> ptr{mem, p.GetEngine().get_program_stream()};
+    *ptr.begin() = num;
+    return {id, mem};
+}
+
+static cldnn::mutable_data CreateAdditionalOutputData(Program &p, const std::shared_ptr<ngraph::Node>& op,
+                                                        const cldnn::primitive_id& id, const cldnn::primitive_id& input,
+                                                        const int32_t output_idx) {
+    const auto precision = DataTypeFromPrecision(op->get_output_element_type(output_idx));
+    const auto format = DefaultFormatForDims(op->get_output_shape(output_idx).size());
+    const auto tensor = CldnnTensorFromIEDims(op->get_output_shape(output_idx));
+    cldnn::layout output_layout = cldnn::layout(precision, format, tensor);
+    auto mem = p.GetEngine().allocate_memory(output_layout);
+    auto md = cldnn::mutable_data(id, {input}, mem); // cldnn::data cannot set dependency
+    return md;
+}
+
+static void UpdateBackedge(std::vector<cldnn::loop::backedge_mapping>& back_edges,
+                            const cldnn::primitive_id& old_primitive_id, const cldnn::primitive_id& new_primitive_id) {
+    for (auto& back_edge : back_edges) {
+        if (back_edge.from == old_primitive_id) {
+            back_edge.from = new_primitive_id;
+        }
+    }
+}
+
+static std::string GetExternalInputName(const int64_t body_parameter_index,
+                                        const std::shared_ptr<Loop>& op) {
+    const auto& loop_input_descs = op->get_input_descriptions();
+    for (const auto& loop_input_desc : loop_input_descs) {
+        if (loop_input_desc->m_body_parameter_index == body_parameter_index) {
+            auto external_node = op->get_input_node_shared_ptr(loop_input_desc->m_input_index);
+            return layer_type_name_ID(external_node);
+        }
+    }
+    return {""};
+}
+
+void CreateLoopOp(Program& p, const std::shared_ptr<Loop>& op) {
+    const std::string layerName = layer_type_name_ID(op);
+    auto inputPrimitives = p.GetInputPrimitiveIDs(op);
+    const auto& loop_input_descs = op->get_input_descriptions();
+    const auto& loop_output_descs = op->get_output_descriptions();
+    const auto& body_inputs = op->get_function()->get_parameters();
+    const auto& body_outputs = op->get_function()->get_results();
+
+    InferenceEngine::CNNNetwork body_network(op->get_function());
+    auto networkInputs = body_network.getInputsInfo();
+    auto networkOutputs = body_network.getOutputsInfo();
+
+    // Set special body ports: current_iteration input , execution condition output
+    auto special_body_ports = op->get_special_body_ports();
+
+    std::string body_current_iteration_id;
+    if (special_body_ports.current_iteration_input_idx >= 0) {
+        auto current_iteration_input = body_inputs.at(special_body_ports.current_iteration_input_idx);
+        body_current_iteration_id = layer_type_name_ID(current_iteration_input);
+        std::string input_name = ngraph::op::util::create_ie_output_name(current_iteration_input);
+        const auto networkInput = networkInputs.at(input_name);
+        auto precision = InferenceEngine::details::convertPrecision(current_iteration_input->get_element_type());
+        networkInput->setPrecision(precision);
+    }
+
+    cldnn::primitive_id body_execution_condition_id;
+    if (special_body_ports.body_condition_output_idx >= 0) {
+        auto body_condition_output = body_outputs.at(special_body_ports.body_condition_output_idx)->get_input_node_shared_ptr(0);
+        body_execution_condition_id = layer_type_name_ID(body_condition_output);
+        std::string output_name = ngraph::op::util::create_ie_output_name(body_condition_output);
+        const auto networkOutput = networkOutputs.at(output_name);
+        networkOutput->setPrecision(InferenceEngine::Precision::I64);
+    }
+
+    // get body topology from ngraph function
+    Program body_program(body_network, p.GetEnginePtr(), p.GetConfig(), true);
+    auto body_topology = *body_program.GetTopology();
+
+    // setup input_primitive_maps/ output_primitive_maps and back_edges
+    std::vector<cldnn::loop::io_primitive_map> input_primitive_maps;
+    std::vector<cldnn::loop::io_primitive_map> output_primitive_maps;
+    std::vector<cldnn::loop::backedge_mapping> back_edges;
+
+    // set input mapping & back edges
+    for (const auto& loop_input_desc : loop_input_descs) {
+        const cldnn::primitive_id& external_id = inputPrimitives.at(loop_input_desc->m_input_index);
+        auto& body_input = body_inputs.at(loop_input_desc->m_body_parameter_index);
+        cldnn::primitive_id internal_id = layer_type_name_ID(body_input);
+
+        // set input mapping
+        if (const auto& sliceInfo =
+            std::dynamic_pointer_cast<Loop::SliceInputDescription>(loop_input_desc)) {
+            // sliced input
+            input_primitive_maps.emplace_back(external_id, internal_id, sliceInfo->m_axis,
+                sliceInfo->m_start, sliceInfo->m_end, sliceInfo->m_stride);
+        } else {
+            // input without slicing
+            input_primitive_maps.emplace_back(external_id, internal_id);
+        }
+
+        // set back edges
+        if (const auto& mergedInput =
+            std::dynamic_pointer_cast<Loop::MergedInputDescription>(loop_input_desc)) {
+            // backedge
+            const auto& to = body_inputs.at(mergedInput->m_body_parameter_index);
+            const auto& from = body_outputs.at(mergedInput->m_body_value_index);
+
+            cldnn::primitive_id to_id = layer_type_name_ID(to);
+            cldnn::primitive_id from_id = layer_type_name_ID(from);
+
+            // reset output data type because the data types of the outputs of the
+            // body topology are always FP32 regardless of ngraph data type
+            {
+                const auto from_prim = body_topology.at(from_id);
+                const auto& to_ngraph_type = to->get_element_type();
+                const auto to_cldnn_type = DataTypeFromPrecision(to_ngraph_type);
+                from_prim->output_data_type = to_cldnn_type;
+            }
+            back_edges.emplace_back(from_id, to_id);
+        }
+    }
+
+    // set trip count, initial execution condition, num iteration primitives
+    // they should be mutable_data to prevent from being optimized out
+    const cldnn::primitive_id trip_count_id = layer_type_name_ID(op->get_input_node_shared_ptr(0));
+    const cldnn::primitive_id execution_condition_id = layer_type_name_ID(op->get_input_node_shared_ptr(1));
+    const int64_t num_iterations = op->get_num_iterations();
+    if (num_iterations < 0) {
+        IE_THROW() << "loop's num_iteration cannot be negative";
+    }
+    const cldnn::primitive_id num_iteration_id = layerName + "_numIteration";
+    {
+        cldnn::mutable_data num_iteration = CreateScalarData<cldnn::mutable_data>(p, num_iteration_id, 0);
+        p.primitivesToIRLayersMap[num_iteration_id] = { op->get_friendly_name() };
+        p.primitiveIDs[num_iteration_id] = num_iteration_id;
+        p.AddPrimitive(num_iteration);
+        p.AddInnerPrimitiveToProfiler(num_iteration_id, layerName, op);
+    }
+
+    // set output mapping
+    for (const auto& loop_output_desc : loop_output_descs) {
+        const uint64_t output_idx = loop_output_desc->m_output_index;
+
+        // Add additional mutable_data for multiple outputs
+        // primitive ID should be <TI primitive ID>.<output_idx> if output_idx > 0
+        // otherwise primitive ID should be equals to TI primitive ID
+        const std::string layerNameWithIndex = layerName + "." + std::to_string(output_idx);
+        std::string external_id;
+        if (output_idx > 0) {
+            cldnn::mutable_data output_data = CreateAdditionalOutputData(p, op, layerNameWithIndex, layerName, output_idx);
+            p.AddPrimitive(output_data);
+            p.AddInnerPrimitiveToProfiler(layerNameWithIndex, layerName, op);
+            p.primitiveIDs[layerNameWithIndex] = layerNameWithIndex;
+            external_id = layerNameWithIndex;
+        } else {
+            p.primitiveIDs[layerNameWithIndex] = layerName;
+            p.primitiveIDs[layerName] = layerName;
+            external_id = layerName;
+        }
+        const auto& body_output = body_outputs.at(loop_output_desc->m_body_value_index);
+        cldnn::primitive_id internal_id = layer_type_name_ID(body_output);
+
+        // update primitive_map
+        if (const auto& concatOutput =
+            std::dynamic_pointer_cast<Loop::ConcatOutputDescription>(loop_output_desc)) {
+            // output which requires concatenation
+            output_primitive_maps.emplace_back(external_id, internal_id, concatOutput->m_axis,
+                concatOutput->m_start, concatOutput->m_end, concatOutput->m_stride);
+        }
+        if (std::dynamic_pointer_cast<Loop::BodyOutputDescription>(loop_output_desc)) {
+            // output which requires no concatenation
+            output_primitive_maps.emplace_back(external_id, internal_id);
+        }
+    }
+
+    const cldnn::loop loopPrimitive(
+        layerName,              /* layer name of this primitive (output id) */
+        inputPrimitives,        /* inputs of this layer */
+        body_topology,          /* body network */
+        trip_count_id,          /* trip_count data in outer network, always same as num_iterations in TI */
+        execution_condition_id, /* initial_execution_condition data in outer network, always true in TI */
+        num_iteration_id,       /* actual number of iteration data in body network */
+        input_primitive_maps,         /* input mappings connecting outer network and inner network */
+        output_primitive_maps,        /* output mappings connecting outer network and inner network */
+        back_edges,             /* back edge mapping */
+        num_iterations,         /* max iteration, i.e. length of iteration axis */
+        body_current_iteration_id,
+        body_execution_condition_id);
+
+    p.AddPrimitive(loopPrimitive);
+    p.AddPrimitiveToProfiler(op);
+}
+
+REGISTER_FACTORY_IMPL(v5, Loop);
+
+}  // namespace CLDNNPlugin
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/loop.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/loop.cpp
index 505d5f7f29d617..afaf4b3db882de 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/loop.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/loop.cpp
@@ -56,7 +56,8 @@ namespace {
                                     Values<int64_t>(7),
                                     Values<InferenceEngine::SizeVector>({2, 1, 4}),
                                     Values<InferenceEngine::Precision>(Precision::FP32, Precision::I32),
-                                    Values(CommonTestUtils::DEVICE_CPU)));
+                                    Values(CommonTestUtils::DEVICE_CPU),
+                                    Values<std::map<std::string, std::string>>({})));
     using namespace testing;
     INSTANTIATE_TEST_SUITE_P(smoke_TrivialLoop, TrivialLoopTest,
                             Combine(
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/skip_tests_config.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/skip_tests_config.cpp
index bbf9fe9b7e8def..a01c38da854b08 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/skip_tests_config.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/skip_tests_config.cpp
@@ -58,6 +58,9 @@ std::vector<std::string> disabledTestPatterns() {
             R"(.*IEClassImportExportTestP.*)",
 
             // TODO: Issue: 59586, NormalizeL2 output mismatch for empty axes case
-            R"(.*NormalizeL2LayerTest.*axes=\(\).*)"
+            R"(.*NormalizeL2LayerTest.*axes=\(\).*)",
+
+            // Not allowed dynamic loop tests on GPU
+            R"(.*smoke_StaticShapeLoop_dynamic_exit.*)"
     };
 }
diff --git a/inference-engine/tests/functional/plugin/gpu/single_layer_tests/loop.cpp b/inference-engine/tests/functional/plugin/gpu/single_layer_tests/loop.cpp
new file mode 100644
index 00000000000000..f5c2853e7696c5
--- /dev/null
+++ b/inference-engine/tests/functional/plugin/gpu/single_layer_tests/loop.cpp
@@ -0,0 +1,140 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <tuple>
+#include <string>
+#include <vector>
+#include <memory>
+#include "single_layer_tests/loop.hpp"
+#include "common_test_utils/test_constants.hpp"
+
+using namespace LayerTestsDefinitions;
+using namespace InferenceEngine;
+
+namespace {
+    std::vector<InferenceEngine::Precision> netPrecisions = {
+        InferenceEngine::Precision::FP32,
+        InferenceEngine::Precision::I32
+    };
+
+    std::map<std::string, std::string> netConfigurations = {
+        {GPUConfigParams::KEY_GPU_ENABLE_LOOP_UNROLLING, PluginConfigParams::NO}
+    };
+
+    static const std::vector<std::tuple<bool, int64_t, int64_t, int64_t>> static_loop_types_axis_0 {
+        //  GCC4.8 limitation: have to specify type of each element in list
+        //                               static_trip_count |  max | dynamic_exit | axis
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true ,  10, -1, 0 },  // n_iter 10, no dynamic exit
+    };
+
+    std::vector<InferenceEngine::SizeVector> inputs_0 = {
+        {1, 4, 2}
+    };
+
+    INSTANTIATE_TEST_CASE_P(smoke_StaticShapeLoop_axis_0, StaticShapeLoopTest,
+                            testing::Combine(
+                            /* unrolling */ testing::ValuesIn(std::vector<bool>{false}),
+                            /* static_continue_cond */ testing::Values(true),
+                            /* args_papck */ testing::ValuesIn(static_loop_types_axis_0),
+                            /* start_value */ testing::Values<int64_t>(0),
+                            /* data_shape */ testing::ValuesIn(inputs_0),
+                            /* data_prc */ testing::ValuesIn(netPrecisions),
+                            /* device */ testing::Values<std::string>(CommonTestUtils::DEVICE_GPU),
+                            /* configuration */ testing::Values<std::map<std::string, std::string>>(netConfigurations)),
+                            StaticShapeLoopTest::getTestCaseName);
+
+    static const std::vector<std::tuple<bool, int64_t, int64_t, int64_t>> static_loop_types_1 {
+        //  GCC4.8 limitation: have to specify type of each element in list
+        //                               static_trip_count |  max | dynamic_exit | axis
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true ,  5, -1,  1 },  // n_iter 5, no dynamic exit
+    };
+
+    std::vector<InferenceEngine::SizeVector> inputs_1 = {
+        {2, 1, 4, 6}
+    };
+
+    INSTANTIATE_TEST_CASE_P(smoke_StaticShapeLoop_axis_1, StaticShapeLoopTest,
+                            testing::Combine(
+                            /* unrolling */ testing::ValuesIn(std::vector<bool>{false}),
+                            /* static_continue_cond */ testing::Values(true),
+                            /* args_papck */ testing::ValuesIn(static_loop_types_1),
+                            /* start_value */ testing::Values<int64_t>(0),
+                            /* data_shape */ testing::ValuesIn(inputs_1),
+                            /* data_prc */ testing::ValuesIn(netPrecisions),
+                            /* device */ testing::Values<std::string>(CommonTestUtils::DEVICE_GPU),
+                            /* configuration */ testing::Values<std::map<std::string, std::string>>(netConfigurations)),
+                            StaticShapeLoopTest::getTestCaseName);
+
+    static const std::vector<std::tuple<bool, int64_t, int64_t, int64_t>> static_loop_types_2 {
+        //  GCC4.8 limitation: have to specify type of each element in list
+        //                               static_trip_count |  max | dynamic_exit | axis
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true ,  10, -1,  2 },  // n_iter 10, no dynamic exit
+    };
+
+    std::vector<InferenceEngine::SizeVector> inputs_2 = {
+        {2, 4, 1, 6}
+    };
+
+    INSTANTIATE_TEST_CASE_P(smoke_StaticShapeLoop_axis_2, StaticShapeLoopTest,
+                            testing::Combine(
+                            /* unrolling */ testing::ValuesIn(std::vector<bool>{false}),
+                            /* static_continue_cond */ testing::Values(true),
+                            /* args_papck */ testing::ValuesIn(static_loop_types_2),
+                            /* start_value */ testing::Values<int64_t>(0),
+                            /* data_shape */ testing::ValuesIn(inputs_2),
+                            /* data_prc */ testing::ValuesIn(netPrecisions),
+                            /* device */ testing::Values<std::string>(CommonTestUtils::DEVICE_GPU),
+                            /* configuration */ testing::Values<std::map<std::string, std::string>>(netConfigurations)),
+                            StaticShapeLoopTest::getTestCaseName);
+
+    static const std::vector<std::tuple<bool, int64_t, int64_t, int64_t>> static_loop_types_no_auto_concat {
+        //  GCC4.8 limitation: have to specify type of each element in list
+        //                               static_trip_count |  max | dynamic_exit | axis
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true ,  10, -1, -1 },  // n_iter 5, no dynamic exit
+    };
+
+    std::vector<InferenceEngine::SizeVector> inputs_no_auto_concat = {
+        {4, 20, 12}
+    };
+
+    INSTANTIATE_TEST_CASE_P(smoke_StaticShapeLoop_no_auto_concat, StaticShapeLoopTest,
+                            testing::Combine(
+                            /* unrolling */ testing::ValuesIn(std::vector<bool>{false}),
+                            /* static_continue_cond */ testing::Values(true),
+                            /* args_papck */ testing::ValuesIn(static_loop_types_no_auto_concat),
+                            /* start_value */ testing::Values<int64_t>(0),
+                            /* data_shape */ testing::ValuesIn(inputs_no_auto_concat),
+                            /* data_prc */ testing::ValuesIn(netPrecisions),
+                            /* device */ testing::Values<std::string>(CommonTestUtils::DEVICE_GPU),
+                            /* configuration */ testing::Values<std::map<std::string, std::string>>(netConfigurations)),
+                            StaticShapeLoopTest::getTestCaseName);
+
+    static const std::vector<std::tuple<bool, int64_t, int64_t, int64_t>> static_loop_types_dynamic_exit {
+        //  GCC4.8 limitation: have to specify type of each element in list
+        //                               static_trip_count |  max | dynamic_exit | axis
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true ,  5,  3,  -1 },  // n_iter 3, dynamic exit on 3
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true ,  5,  7,   1 },  // n_iter 5, dynamic exit not reached
+        std::tuple<bool, int64_t, int64_t, int64_t>{  true , -1,  5,  -1 },  // n_iter 5, inf loop with dynamic exit on 5
+        std::tuple<bool, int64_t, int64_t, int64_t>{ false ,  5,  3,  -1 },  // | same with dynamic trip count
+        std::tuple<bool, int64_t, int64_t, int64_t>{ false ,  5,  7,   1 },  // |
+        std::tuple<bool, int64_t, int64_t, int64_t>{ false , -1,  5,  -1 }   // |
+    };
+
+    std::vector<InferenceEngine::SizeVector> inputs_dynamic_exit = {
+        {4, 1, 2}
+    };
+
+    INSTANTIATE_TEST_CASE_P(smoke_StaticShapeLoop_dynamic_exit, StaticShapeLoopTest,
+                            testing::Combine(
+                            /* unrolling */ testing::ValuesIn(std::vector<bool>{false}),
+                            /* static_continue_cond */ testing::Values(true),
+                            /* args_papck */ testing::ValuesIn(static_loop_types_dynamic_exit),
+                            /* start_value */ testing::Values<int64_t>(0),
+                            /* data_shape */ testing::ValuesIn(inputs_dynamic_exit),
+                            /* data_prc */ testing::ValuesIn(netPrecisions),
+                            /* device */ testing::Values<std::string>(CommonTestUtils::DEVICE_GPU),
+                            /* configuration */ testing::Values<std::map<std::string, std::string>>(netConfigurations)),
+                            StaticShapeLoopTest::getTestCaseName);
+
+}  // namespace
diff --git a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/loop.hpp b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/loop.hpp
index 8d67dfd8fbe100..dfece8f2d32822 100644
--- a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/loop.hpp
+++ b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/loop.hpp
@@ -50,7 +50,8 @@ using StaticShapeLoopParams = typename std::tuple<
         int64_t,
         InferenceEngine::SizeVector,
         InferenceEngine::Precision,
-        std::string
+        std::string,
+        std::map<std::string, std::string>
         >;
 
 /**
diff --git a/inference-engine/tests/functional/shared_test_classes/src/single_layer/loop.cpp b/inference-engine/tests/functional/shared_test_classes/src/single_layer/loop.cpp
index baff5f44e28c07..d72bec251aa858 100644
--- a/inference-engine/tests/functional/shared_test_classes/src/single_layer/loop.cpp
+++ b/inference-engine/tests/functional/shared_test_classes/src/single_layer/loop.cpp
@@ -140,6 +140,47 @@ namespace LayerTestsDefinitions {
         function = std::make_shared<ngraph::Function>(ngraph::ResultVector{result0, result1, result2}, params, "loop");
     }
 
+    std::string StaticShapeLoopTest::getTestCaseName(const testing::TestParamInfo<StaticShapeLoopParams> &obj) {
+        bool unrolling;
+        bool static_iter_num;
+        bool static_continue_cond;
+        int64_t max_iter_num;
+        int64_t dynamic_exit;
+        int64_t axis;
+        int64_t start_value;
+        InferenceEngine::SizeVector data_shape;
+        InferenceEngine::Precision data_prc;
+        std::string targetDevice;
+        auto args_papck = std::tie(static_iter_num, max_iter_num, dynamic_exit, axis);
+        std::map<std::string, std::string> configuration;
+        std::tie(
+            unrolling,
+            static_continue_cond,
+            args_papck,
+            start_value,
+            data_shape,
+            data_prc,
+            targetDevice,
+            configuration) = obj.param;
+
+        std::ostringstream result;
+        result << "unrolling=" << std::to_string(unrolling) << "_";
+        result << "static_iter_num=" << std::to_string(static_iter_num) << "_";
+        result << "static_continue_cond=" << std::to_string(static_continue_cond) << "_";
+        result << "max_iter_num=" << std::to_string(max_iter_num) << "_";
+        result << "dynamic_exit=" << std::to_string(dynamic_exit) << "_";
+        result << "axis=" << std::to_string(axis) << "_";
+        result << "start_value=" << std::to_string(start_value) << "_";
+        result << "max_iter_num=" << std::to_string(max_iter_num) << "_";
+        result << "IS=" << CommonTestUtils::vec2str(data_shape) << "_";
+        result << "netPRC=" << std::to_string(data_prc) << "_";
+        result << "targetDevice=" << targetDevice << "_";
+
+        auto res_str = result.str();
+        std::replace(res_str.begin(), res_str.end(), '-', '_');
+        return res_str;
+    }
+
     void StaticShapeLoopTest::SetUp() {
         SKIP_IF_CURRENT_TEST_IS_DISABLED()
         auto args_papck = std::tie(static_iter_num, max_iter_num, dynamic_exit, axis);
@@ -150,7 +191,8 @@ namespace LayerTestsDefinitions {
             start_value,
             data_shape,
             data_prc,
-            targetDevice) = GetParam();
+            targetDevice,
+            configuration) = GetParam();
 
         const auto prc = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(data_prc);
         const auto ngShape = ngraph::Shape{data_shape};
diff --git a/inference-engine/thirdparty/clDNN/src/impls/common/loop.cpp b/inference-engine/thirdparty/clDNN/src/impls/common/loop.cpp
index fb969c525a247a..3a185f71edacdb 100644
--- a/inference-engine/thirdparty/clDNN/src/impls/common/loop.cpp
+++ b/inference-engine/thirdparty/clDNN/src/impls/common/loop.cpp
@@ -25,73 +25,6 @@ struct loop_impl : typed_primitive_impl<loop> {
     loop_impl(const loop_impl& other) : typed_primitive_impl<loop>(other), node(other.node) {}
     explicit loop_impl(const loop_node& node) : node(node) {}
 
-    // read scala value from data primitive
-    static int64_t read_scalar_value(memory::ptr mem, stream& stream) {
-        int64_t trip_count = 0;
-        const layout& prim_layout = mem->get_layout();
-
-        switch (prim_layout.data_type) {
-        case data_types::u8: {
-            mem_lock<uint8_t> lock_prim_output{mem, stream};
-            trip_count = *lock_prim_output.data();
-            break;
-        }
-        case data_types::i8: {
-            mem_lock<int8_t> lock_prim_output{mem, stream};
-            trip_count = *lock_prim_output.data();
-            break;
-        }
-        case data_types::i32: {
-            mem_lock<int32_t> lock_prim_output{mem, stream};
-            trip_count = *lock_prim_output.data();
-            break;
-        }
-        case data_types::i64: {
-            mem_lock<int64_t> lock_prim_output{mem, stream};
-            trip_count = *lock_prim_output.data();
-            break;
-        }
-        default:
-            assert(false);
-        }
-        return trip_count;
-    }
-
-    static void write_scalar_value(memory::ptr mem, stream& stream, int64_t input) {
-        const layout& prim_layout = mem->get_layout();
-
-        switch (prim_layout.data_type) {
-        case data_types::u8: {
-            assert(input >= std::numeric_limits<uint8_t>::min() &&
-                   input <= std::numeric_limits<uint8_t>::max());
-            mem_lock<uint8_t> lock_prim_output{mem, stream};
-            *lock_prim_output.data() = static_cast<uint8_t>(input);
-            break;
-        }
-        case data_types::i8: {
-            assert(input >= std::numeric_limits<int8_t>::min() &&
-                   input <= std::numeric_limits<int8_t>::max());
-            mem_lock<int8_t> lock_prim_output{mem, stream};
-            *lock_prim_output.data() = static_cast<int8_t>(input);
-            break;
-        }
-        case data_types::i32: {
-            assert(input >= std::numeric_limits<int32_t>::min() &&
-                   input <= std::numeric_limits<int32_t>::max());
-            mem_lock<int32_t> lock_prim_output{mem, stream};
-            *lock_prim_output.data() = static_cast<int32_t>(input);
-            break;
-        }
-        case data_types::i64: {
-            mem_lock<int64_t> lock_prim_output{mem, stream};
-            *lock_prim_output.data() = input;
-            break;
-        }
-        default:
-            assert(false);
-        }
-    }
-
     event::ptr execute_impl(const std::vector<event::ptr>& events, loop_inst& instance) override {
         auto& outer_network = instance.get_network();
         auto& stream = outer_network.get_stream();
@@ -104,29 +37,37 @@ struct loop_impl : typed_primitive_impl<loop> {
             instance.preprocess_output_memory();
             instance.preprocess_input_memory();
             instance.preprocess_backedge_memory();
+
+            // set input data for current_iteration primitive if current_iteration is used
+            if (node.is_current_iteration_used()) {
+                const primitive_id& current_iteration_id = node.get_current_iteration_id();
+                auto current_iteration_prim = body_network->get_primitive(current_iteration_id);
+                auto input_layout_prim = std::dynamic_pointer_cast<input_layout_inst>(current_iteration_prim);
+                if (input_layout_prim == nullptr) {
+                    CLDNN_ERROR_MESSAGE(node.id(), "current_iteration primitive is not input_layout");
+                }
+
+                const auto& backedge_mapping = instance.get_current_iteration_backedge_mapping();
+                input_layout_prim->set_data(backedge_mapping.initial_mem);
+            }
             instance.preproc_memories_done = true;
         }
 
         // read trip_count from outer network
+        bool update_num_iterations = false;
         const primitive_id& trip_count_id = node.get_trip_count_id();
         memory::ptr trip_count_mem = outer_network.get_primitive(trip_count_id)->output_memory_ptr();
-        int64_t trip_count = read_scalar_value(trip_count_mem, stream);
+        int64_t trip_count = loop_node::read_scalar_value(trip_count_mem, stream);
         if (trip_count < 0) {
             const int64_t max_iteration = node.get_max_iteration();
             trip_count = max_iteration;
+            update_num_iterations = true;
         }
 
         // read initial execution condition from outer network
         const primitive_id& initial_execution_id = node.get_initial_execution_id();
         memory::ptr initial_execution_mem = outer_network.get_primitive(initial_execution_id)->output_memory_ptr();
-        int64_t execution_condition = read_scalar_value(initial_execution_mem, stream);
-
-        // shortcut of current_iteration memory in body network (slice of input)
-        memory::ptr current_iteration_mem = nullptr;
-        if (node.is_current_iteration_used()) {
-            const primitive_id& current_iteration_id = node.get_current_iteration_id();
-            current_iteration_mem = body_network->get_primitive(current_iteration_id)->output_memory_ptr();
-        }
+        int64_t execution_condition = loop_node::read_scalar_value(initial_execution_mem, stream);
 
         // shortcut of execution_condition memory in body network
         memory::ptr execution_condition_mem = nullptr;
@@ -135,11 +76,6 @@ struct loop_impl : typed_primitive_impl<loop> {
             execution_condition_mem = body_network->get_primitive(condition_id)->output_memory_ptr();
         }
 
-        int64_t current_iteration = 0;
-        if (node.is_current_iteration_used()) {
-            write_scalar_value(current_iteration_mem, stream, current_iteration);
-        }
-
         const auto& concatenated_input_mem_mappings = instance.concatenated_input_mem_mappings;
         const auto& concatenated_output_mem_mappings = instance.concatenated_output_mem_mappings;
 
@@ -155,12 +91,12 @@ struct loop_impl : typed_primitive_impl<loop> {
         }
 
         std::vector<event::ptr> loop_carried_dep(events.begin(), events.end());
-
-        while (current_iteration < trip_count && execution_condition) {
+        int64_t current_iteration_idx = 0;
+        while (current_iteration_idx < trip_count && execution_condition) {
             // Copy & Set sliced input memory
             for (size_t i = 0; i < concatenated_input_mem_mappings.size(); ++i) {
                 const auto& concatenated_input = concatenated_input_mem_mappings.at(i);
-                memory::ptr mem = concatenated_input.get_sliced_mem(current_iteration);
+                memory::ptr mem = concatenated_input.get_sliced_mem(current_iteration_idx);
                 if (mem) {
                     concatenated_input.sliced_data_prim->set_output_memory(mem);
                 } else {
@@ -170,12 +106,12 @@ struct loop_impl : typed_primitive_impl<loop> {
 
             // Set backedges
             for (const auto& backedge_memory_mapping : instance.backedge_memory_mappings) {
-                backedge_memory_mapping.setup_iteration(current_iteration);
+                backedge_memory_mapping.setup_iteration(current_iteration_idx);
             }
 
             // Set sliced output memory
             for (const auto& concat_output_mem_mapping : concatenated_output_mem_mappings) {
-                concat_output_mem_mapping.setup_concatenated_output_memory(current_iteration);
+                concat_output_mem_mapping.setup_concatenated_output_memory(current_iteration_idx);
             }
 
             // execute body network
@@ -187,17 +123,16 @@ struct loop_impl : typed_primitive_impl<loop> {
                 loop_carried_dep.emplace_back(body_event);
             }
 
-            //TODO: "curreint_iteration primitive and execution_condition is prepared
-            //as they are presented in the ngraph opset document for loop operation.
-            //However they are not being used yet and only TensorIterator which has fixed sequence length is being validated.
-            if (node.is_current_iteration_used()) {
-                write_scalar_value(current_iteration_mem, stream, current_iteration);
-            }
+            //TODO: execution_condition is prepared as they are presented in the
+            //      ngraph opset document for loop operation.
+            // However they are not being used yet and only TensorIterator which
+            // has fixed sequence length is being validated.
             if (node.is_execution_condition_used()) {
-                execution_condition = read_scalar_value(execution_condition_mem, stream);
+                execution_condition = loop_node::read_scalar_value(execution_condition_mem, stream);
             }
+
             // update index & execution condition for the next iteration
-            ++current_iteration;
+            ++current_iteration_idx;
         }
 
         body_network->reset_execution();
@@ -208,9 +143,21 @@ struct loop_impl : typed_primitive_impl<loop> {
             concat_output.restore_concatenated_mem();
         }
 
-        const primitive_id& num_iteration_id = node.get_num_iteration_id();
-        memory::ptr num_actual_iterations_mem = outer_network.get_primitive(num_iteration_id)->output_memory_ptr();
-        write_scalar_value(num_actual_iterations_mem, stream, current_iteration);
+        if (update_num_iterations) {
+            // update num_iterations (actual number of iterations)
+            int64_t actual_iterations = 0;
+            if (node.is_current_iteration_used()) {
+                const auto& backedge_mapping = instance.get_current_iteration_backedge_mapping();
+                auto current_iteration_mem = backedge_mapping.from_primitive->output_memory_ptr();
+                actual_iterations = loop_node::read_scalar_value(current_iteration_mem, stream);
+            } else {
+                actual_iterations = current_iteration_idx;
+            }
+
+            const primitive_id& num_iteration_id = node.get_num_iteration_id();
+            memory::ptr num_actual_iterations_mem = outer_network.get_primitive(num_iteration_id)->output_memory_ptr();
+            loop_node::write_scalar_value(num_actual_iterations_mem, stream, actual_iterations);
+        }
 
         ev->set();
         return ev;
diff --git a/inference-engine/thirdparty/clDNN/src/include/loop_inst.h b/inference-engine/thirdparty/clDNN/src/include/loop_inst.h
index 08e7d416d441ea..54044d26e8b6fc 100644
--- a/inference-engine/thirdparty/clDNN/src/include/loop_inst.h
+++ b/inference-engine/thirdparty/clDNN/src/include/loop_inst.h
@@ -7,7 +7,9 @@
 
 #include "cldnn/primitives/loop.hpp"
 #include "cldnn/primitives/mutable_data.hpp"
+#include "cldnn/primitives/data.hpp"
 #include "cldnn/primitives/input_layout.hpp"
+#include "cldnn/primitives/eltwise.hpp"
 #include "cldnn/runtime/memory.hpp"
 #include "cldnn/runtime/error_handler.hpp"
 
@@ -27,24 +29,10 @@ struct typed_program_node<loop> : public typed_program_node_base<loop> {
 
     std::vector<loop::io_primitive_map> input_primitive_maps;
     std::vector<loop::io_primitive_map> output_primitive_maps;
-    std::vector<cldnn::loop::backedge_mapping> back_edges;
+    mutable std::vector<loop::backedge_mapping> back_edges;
     bool use_current_iteration;
     bool use_execution_condition;
     mutable program_impl::ptr body_program;
-    mutable std::map<primitive_id, memory::ptr> backedge_mem_impls;
-    mutable std::map<primitive_id, std::shared_ptr<mutable_data>> backedge_layers;
-    mutable std::map<primitive_id, std::shared_ptr<memory>> backedge_mem;
-
-    mutable bool output_is_backedge;
-
-    void setup_internal_mutabledata_node(primitive_id md_id, layout md_layout, std::vector<primitive_id> md_inputs_id = {}, uint32_t net_id = 0) const {
-        if (body.get_primitives().count(md_id) == 0) {
-            backedge_mem_impls[md_id] = get_program().get_engine().allocate_memory(md_layout, net_id);
-            backedge_mem[md_id] = backedge_mem_impls[md_id];
-            backedge_layers[md_id] = std::make_shared<mutable_data>(md_id, md_inputs_id, backedge_mem[md_id]);
-            body.add(backedge_layers[md_id]);
-        }
-    }
 
 public:
     typed_program_node(std::shared_ptr<primitive> prim, program_impl& prog) :
@@ -63,7 +51,6 @@ struct typed_program_node<loop> : public typed_program_node_base<loop> {
 
     int64_t get_max_iteration() const { return max_iteration; }
     program_impl::ptr get_body_program() const { return body_program; }
-    bool is_output_working_as_backedge() const { return output_is_backedge; }
     bool is_current_iteration_used() const { return use_current_iteration; }
     bool is_execution_condition_used() const { return use_execution_condition; }
 
@@ -99,19 +86,95 @@ struct typed_program_node<loop> : public typed_program_node_base<loop> {
 
     static size_t convert_to_raw_axis(size_t axis, size_t ndim) {
         // convert between bfyx, bfzyx, bfzyxw and tensor.size.raw
-        assert(axis < ndim);
+        if (axis >= ndim) {
+            throw std::runtime_error("axis should be less than ndim");
+        }
+
         if (axis < 2) {
             return axis;
         }
         return (ndim - 1) - (axis - 2);
     }
 
+    // read scala value from data primitive
+    static int64_t read_scalar_value(memory::ptr mem, stream& stream) {
+        int64_t trip_count = 0;
+        const layout& prim_layout = mem->get_layout();
+
+        switch (prim_layout.data_type) {
+        case data_types::u8: {
+            mem_lock<uint8_t> lock_prim_output{mem, stream};
+            trip_count = *lock_prim_output.data();
+            break;
+        }
+        case data_types::i8: {
+            mem_lock<int8_t> lock_prim_output{mem, stream};
+            trip_count = *lock_prim_output.data();
+            break;
+        }
+        case data_types::i32: {
+            mem_lock<int32_t> lock_prim_output{mem, stream};
+            trip_count = *lock_prim_output.data();
+            break;
+        }
+        case data_types::i64: {
+            mem_lock<int64_t> lock_prim_output{mem, stream};
+            trip_count = *lock_prim_output.data();
+            break;
+        }
+        default:
+            throw std::runtime_error("Invalid data type : " + data_type_traits::name(prim_layout.data_type));
+        }
+        return trip_count;
+    }
+
+    template<typename T>
+    static inline void validate_input_value(int64_t input) {
+        if (input < std::numeric_limits<T>::min() || input > std::numeric_limits<T>::max()) {
+            throw std::runtime_error("Invalid data value : " + std::to_string(input));
+        }
+    }
+
+    static void write_scalar_value(memory::ptr mem, stream& stream, int64_t input) {
+        const layout& prim_layout = mem->get_layout();
+
+        switch (prim_layout.data_type) {
+        case data_types::u8: {
+            validate_input_value<uint8_t>(input);
+            mem_lock<uint8_t> lock_prim_output{mem, stream};
+            lock_prim_output[0] = static_cast<uint8_t>(input);
+            break;
+        }
+        case data_types::i8: {
+            validate_input_value<int8_t>(input);
+            mem_lock<int8_t> lock_prim_output{mem, stream};
+            lock_prim_output[0] = static_cast<int8_t>(input);
+            break;
+        }
+        case data_types::i32: {
+            validate_input_value<int32_t>(input);
+            mem_lock<int32_t> lock_prim_output{mem, stream};
+            lock_prim_output[0] = static_cast<int32_t>(input);
+            break;
+        }
+        case data_types::i64: {
+            mem_lock<int64_t> lock_prim_output{mem, stream};
+            lock_prim_output[0] = input;
+            break;
+        }
+        default:
+            throw std::runtime_error("Invalid data type : " + data_type_traits::name(prim_layout.data_type));
+        }
+    }
+
     layout calc_body_input_layout(const loop::io_primitive_map& inputDesc) const {
         const auto& dependency_list = this->get_dependencies();
         auto input = std::find_if(dependency_list.begin(), dependency_list.end(), [&inputDesc](const program_node* p){
             return p->id() == inputDesc.external_id;
         });
-        assert(input != dependency_list.end());
+        if (input == dependency_list.end()) {
+            throw std::runtime_error("Can't find input from dependency_list");
+        }
         layout calculated_layout = (*input)->get_output_layout();
         auto shape = calculated_layout.size.sizes(calculated_layout.format);
 
@@ -164,6 +227,7 @@ struct typed_program_node<loop> : public typed_program_node_base<loop> {
 
     static bool is_integer(const data_types& data_type) {
         switch (data_type) {
+            case data_types::u8:
             case data_types::i8:
             case data_types::i32:
             case data_types::i64:
@@ -173,54 +237,73 @@ struct typed_program_node<loop> : public typed_program_node_base<loop> {
         }
     }
 
-    void process_single_int_input(const primitive_id& id) const {
+    void process_current_iteration() const {
+        const primitive_id& current_iteration_id = get_current_iteration_id();
+        if (current_iteration_id.empty()) {
+            return;
+        }
+
+        const topology_map& body_topology_map = body.get_primitives();
+        const layout body_input_layout(data_types::i64, format::bfyx, {1, 1, 1, 1});
+
+        // add current_iteration primitive if current_iteration primitive is not exist in body
+        if (body_topology_map.find(current_iteration_id) == body_topology_map.end()) {
+            body.add(std::make_shared<input_layout>(current_iteration_id, body_input_layout));
+        } else {
+            const auto& body_input_prim = body.at(current_iteration_id);
+            const auto input_layout_prim = std::dynamic_pointer_cast<input_layout>(body_input_prim);
+            if (!input_layout_prim) {
+                CLDNN_ERROR_MESSAGE(this->id(), "current_iteration primitive should be cldnn::input_layout");
+            } else {
+                input_layout_prim->change_layout(body_input_layout);
+            }
+        }
+
+        // add incremental data: 1
+        // it is used to update current_iteration in body network
+        const primitive_id increment_value_id = current_iteration_id + "_inc";
+        auto mem = get_program().get_engine().allocate_memory(body_input_layout);
+        auto& stream = get_program().get_stream();
+        write_scalar_value(mem, stream, 1);
+        body.add(std::make_shared<data>(increment_value_id, mem));
+
+        // add eltwise sum updating current_iteration with incremental data
+        const primitive_id updated_currnet_iteration_id = current_iteration_id + "_update";
+        body.add(std::make_shared<eltwise>(updated_currnet_iteration_id,
+            current_iteration_id, increment_value_id, eltwise_mode::sum));
+
+        // set backedge
+        back_edges.emplace_back(updated_currnet_iteration_id, current_iteration_id);
+    }
+
+    void process_single_int_output(const primitive_id& id) const {
+        // add mutable if not exist
         const topology_map& body_topology_map = body.get_primitives();
+        layout body_output_layout(data_types::i64, format::bfyx, {1, 1, 1, 1});
         if (!id.empty()) {
-            // add input_layout if not exist
-            if (body_topology_map.count(id)) {
-                layout body_input_layout(data_types::i32, format::bfyx, {1, 1, 1, 1});
-                body.add(std::make_shared<input_layout>(id, body_input_layout));
+            auto body_output = body_topology_map.find(id);
+            if (body_output == body_topology_map.end()) {
+                auto mem = get_program().get_engine().allocate_memory(body_output_layout);
+                auto md = std::make_shared<data>(id, mem);
+                body.add(md);
             } else {
-                const auto& body_input_prim = body.at(id);
-                CLDNN_ERROR_BOOL(this->id(), "Error while building body program",
-                    body_input_prim->type != input_layout::type_id(),
-                    id + " is not cldnn::input_layout");
-                const auto input_layout_prim = static_cast<const input_layout*>(body_input_prim.get());
-                CLDNN_ERROR_BOOL(this->id(), "Error while building body program",
-                    !static_cast<bool>(input_layout_prim->output_data_type),
-                    "data_type of " + id + " is not specified");
-                CLDNN_ERROR_BOOL(this->id(), "Error while building body program",
-                    !is_integer(*input_layout_prim->output_data_type),
-                    id + " is not integer type");
-                CLDNN_ERROR_BOOL(this->id(), "Error while building body program",
-                    input_layout_prim->layout.count() != 1,
-                    id + " should have 1 element");
+                auto body_output_prim = body.at(body_output->first);
+                auto mem = get_program().get_engine().allocate_memory(body_output_layout);
+                body_output_prim.reset(new mutable_data(body_output->first, mem));
             }
         }
     }
 
     void build_body_program() const {
-        const std::vector<cldnn::program_node *>& deps = get_dependencies();
-        // setup internal inputs
-        const primitive_id& trip_count_id = get_trip_count_id();
-        const primitive_id& initial_execution = get_initial_execution_id();
-        const primitive_id& num_iteration = get_num_iteration_id();
-        for (const cldnn::program_node * dep : deps) {
-            const primitive_id& id = dep->id();
-            if (id == trip_count_id || id == initial_execution || id == num_iteration) {
-                continue;
-            }
+        for (const auto& pm : input_primitive_maps) {
+            layout calculated_layout = calc_body_input_layout(pm);
+            const primitive_id& internal_input_id = pm.internal_id;
 
-            for (const auto& pm : input_primitive_maps) {
-                layout calculated_layout = calc_body_input_layout(pm);
-                const primitive_id& internal_input_id = pm.internal_id;
-
-                // add inputs for body network if not exist
-                if (body.get_primitives().count(internal_input_id) == 0) {
-                    body.add(std::make_shared<input_layout>(internal_input_id, calculated_layout));
-                } else {
-                    body.change_input_layout(internal_input_id, calculated_layout);
-                }
+            // add inputs for body network if not exist
+            if (body.get_primitives().count(internal_input_id) == 0) {
+                body.add(std::make_shared<input_layout>(internal_input_id, calculated_layout));
+            } else {
+                body.change_input_layout(internal_input_id, calculated_layout);
             }
         }
 
@@ -230,39 +313,35 @@ struct typed_program_node<loop> : public typed_program_node_base<loop> {
         }
         std::set<primitive_id> output_names;
         output_names.insert(output_primitive_maps.front().internal_id);
-        const auto& back_edges_list = this->get_primitive()->back_edges;
 
         // add current_iteration_id in body network, condition_id if exist
-        process_single_int_input(get_current_iteration_id());
-        process_single_int_input(get_condition_id());
+        process_current_iteration();
+        process_single_int_output(get_condition_id());
 
         // setup outputs for backedges
-        for (auto& back_edge : back_edges_list) {
+        for (auto& back_edge : back_edges) {
             // check whether the back_edge.to has its corresponding io_primitive_map
             const auto& input_map = std::find_if(input_primitive_maps.begin(), input_primitive_maps.end(),
                 [&](const loop::io_primitive_map& pm) {
                     return pm.internal_id == back_edge.to;
                 });
-            if (input_map == input_primitive_maps.end()) {
+
+            // backedge which is current_iteration does not have
+            // input primitive map because its initial value is always
+            // zero and the value will be set in execute_impl()
+            if (back_edge.to != get_current_iteration_id() && input_map == input_primitive_maps.end()) {
                 std::string msg = "No primitive mapping for backedge (internal_id: " + back_edge.to + ')';
                 CLDNN_ERROR_MESSAGE(this->id(), msg.c_str());
             }
 
-            for (const auto& prim : body.get_primitives()) {
-                if (prim.first != back_edge.from) {
-                    continue;
-                }
-                const auto dependencies_ref = prim.second->dependencies();
-                std::vector<primitive_id> dep_pids(dependencies_ref.size());
-                for (const auto& dep : dependencies_ref) {
-                    dep_pids.emplace_back(dep.get());
-                }
-                setup_internal_mutabledata_node(back_edge.from, calc_body_input_layout(*input_map), dep_pids);
-            }
-
             output_names.insert(back_edge.from);
         }
 
+        // if execution_condition_id is specified, we need to add the id in build_option::outputs
+        if (!get_condition_id().empty()) {
+            output_names.insert(get_condition_id());
+        }
+
         auto opts = get_program().get_options();
         std::vector<primitive_id> output_names_vec(output_names.begin(), output_names.end());
         opts.set_option(build_option::outputs(output_names_vec));
@@ -310,6 +389,7 @@ class typed_primitive_inst<loop> : public typed_primitive_inst_base<loop> {
             from_primitive(from_primitive),
             to_primitive(to_primitive),
             from_mems(from_mems),
+            initial_mem(initial_mem),
             stream(stream),
             type(type),
             total_bytes(initial_mem->get_layout().bytes_count()) {
@@ -396,7 +476,10 @@ class typed_primitive_inst<loop> : public typed_primitive_inst_base<loop> {
             bytes_iteration_initial_offset(initial_offset * bytes_iteration) {}
 
         static int64_t get_batch_size(layout mem_layout, int64_t axis) {
-            assert(axis >= 0);
+            if (axis < 0) {
+                throw std::runtime_error("axis should be positive integer or zero");
+            }
+
             int64_t batch_size = 1;
             for (int64_t i = 0; i < axis; ++i) {
                 batch_size *= mem_layout.size.raw[i];
@@ -472,6 +555,7 @@ class typed_primitive_inst<loop> : public typed_primitive_inst_base<loop> {
     std::vector<concatenated_memory_mapping> concatenated_output_mem_mappings;
 
     static std::string to_string(const loop_node& node);
+    size_t current_iteratoin_backedge_mapping_idx = 0;
 
 public:
     typed_primitive_inst(network_impl& network, const loop_node& node);
@@ -479,6 +563,12 @@ class typed_primitive_inst<loop> : public typed_primitive_inst_base<loop> {
     void preprocess_input_memory();
     void preprocess_output_memory();
     void preprocess_backedge_memory();
+    const backedge_memory_mapping& get_current_iteration_backedge_mapping() const {
+        if (!node.is_current_iteration_used()) {
+            CLDNN_ERROR_MESSAGE(node.id(), "no backedge mapping for current_iteration");
+        }
+        return backedge_memory_mappings.at(current_iteratoin_backedge_mapping_idx);
+    }
 
 private:
     network_impl::ptr body_network;
diff --git a/inference-engine/thirdparty/clDNN/src/loop.cpp b/inference-engine/thirdparty/clDNN/src/loop.cpp
index 9399dfdfa6a144..66de96f6354529 100644
--- a/inference-engine/thirdparty/clDNN/src/loop.cpp
+++ b/inference-engine/thirdparty/clDNN/src/loop.cpp
@@ -279,12 +279,24 @@ void loop_inst::preprocess_backedge_memory() {
     for (const auto& back_edge : back_edges) {
         //find corresponding input of the backedge
         const auto input_map_ptrs = node.find_io_primitive_maps(back_edge.to, false);
-        assert(input_map_ptrs.size() == 1);
-        const auto& input_map = input_map_ptrs.front();
-        auto backedged_sliced_output_mems = get_sliced_mem(back_edge.from);
         const auto backedge_to_prim = body_network->get_primitive(back_edge.to);
         const auto backedge_from_prim = body_network->get_primitive(back_edge.from);
-        memory::ptr initial_mem = get_external_memory(input_map->external_id);
+
+        memory::ptr initial_mem;
+        if (back_edge.to == node.get_current_iteration_id()) {
+            const layout current_iteration_layout = backedge_to_prim->output_memory().get_layout();
+            initial_mem = get_network().get_engine().allocate_memory(current_iteration_layout);
+            auto& stream = get_network().get_stream();
+            loop_node::write_scalar_value(initial_mem, stream, 0);
+            current_iteratoin_backedge_mapping_idx = backedge_memory_mappings.size();
+        } else {
+            if (input_map_ptrs.empty()) {
+                CLDNN_ERROR_MESSAGE(id(), "no input_mapping for backedged input");
+            }
+            initial_mem = get_external_memory(input_map_ptrs.front()->external_id);
+        }
+
+        auto backedged_sliced_output_mems = get_sliced_mem(back_edge.from);
         if (backedged_sliced_output_mems.empty()) {
             // backedge output which does not need concatenation
             // input memory = output memory = loop output memory
diff --git a/inference-engine/thirdparty/clDNN/src/program.cpp b/inference-engine/thirdparty/clDNN/src/program.cpp
index 377e3a2a065e5a..bd62de0435a1af 100644
--- a/inference-engine/thirdparty/clDNN/src/program.cpp
+++ b/inference-engine/thirdparty/clDNN/src/program.cpp
@@ -945,14 +945,17 @@ bool program_impl::extract_and_remove(program_node& node) {
 
     // update primitive_map of loop primitive,
     // if extracted node is input of loop
-    for (const auto user : node.users) {
+    for (const auto& user : node.users) {
         if (user->is_type<loop>()) {
             loop_node& loop = *user;
             loop.update_primitive_map(node.id(), input.id());
         }
-        if (node.dependencies.front()->is_type<loop>()) {
-            loop_node& loop = *node.dependencies.front();
-            loop.update_primitive_map(node.id(), user->id());
+
+        for (auto& dep : node.dependencies) {
+            if (dep->is_type<loop>()) {
+                loop_node& loop = *dep;
+                loop.update_primitive_map(node.id(), user->id());
+            }
         }
     }
     input.users.remove(&node);
diff --git a/inference-engine/thirdparty/clDNN/tests/test_cases/loop_gpu_test.cpp b/inference-engine/thirdparty/clDNN/tests/test_cases/loop_gpu_test.cpp
index 37c0a0309497ac..222b50b9a7e11b 100644
--- a/inference-engine/thirdparty/clDNN/tests/test_cases/loop_gpu_test.cpp
+++ b/inference-engine/thirdparty/clDNN/tests/test_cases/loop_gpu_test.cpp
@@ -90,9 +90,6 @@ TEST(loop_gpu, basic_no_concat)
     EXPECT_EQ(output_layout.size.spatial[0], 4);
     EXPECT_EQ(output_layout.size.spatial[1], 5);
 
-    mem_lock<int32_t> ptr{num_iteration_mem, get_test_stream()};
-    EXPECT_EQ(ptr[0], trip_count);
-
     // value check
     mem_lock<float> output_ptr{output, get_test_stream()};
     EXPECT_EQ(output_ptr.size(), input_data.size());
@@ -164,10 +161,6 @@ TEST(loop_gpu, basic_concat)
     EXPECT_EQ(output_layout.size.spatial[0], 4);
     EXPECT_EQ(output_layout.size.spatial[1], 5);
 
-    mem_lock<int32_t> ptr{num_iteration_mem, get_test_stream()};
-    const int32_t actual_iterations = ptr[0];
-    EXPECT_EQ(actual_iterations, trip_count);
-
     // value check
     mem_lock<float> output_ptr{output, get_test_stream()};
     for (size_t i=0, iend = input_data.size(); i<iend; ++i) {
@@ -303,14 +296,6 @@ TEST(loop_gpu, basic_concat_nested)
     EXPECT_EQ(output_layout.size.spatial[0], 4);
     EXPECT_EQ(output_layout.size.spatial[1], 5);
 
-    // check trip count = actual iteration
-    mem_lock<int64_t> inner_num_iteration_ptr{inner_num_iteration_mem, get_test_stream()};
-    int64_t inner_actual_iterations = inner_num_iteration_ptr[0];
-    EXPECT_EQ(inner_actual_iterations, inner_trip_count);
-    mem_lock<int64_t> num_iteration_ptr{num_iteration_mem, get_test_stream()};
-    int64_t actual_iterations = num_iteration_ptr[0];
-    EXPECT_EQ(actual_iterations, outer_trip_count);
-
     // check output values
     EXPECT_EQ(output_layout.count(), expected.size());
     mem_lock<float> output_ptr{output, get_test_stream()};

From 22273f806936985145eb3a1745c29507bc4ca4a3 Mon Sep 17 00:00:00 2001
From: Mateusz Tabaka <mateusz.tabaka@intel.com>
Date: Thu, 22 Jul 2021 16:26:05 +0200
Subject: [PATCH 39/71] [ONNX] Add ONNX specific FrontEnd classes (#6615)

This change implements a subset of FrontEnd API for ONNX:

Changes:
- move onnx_common, onnx_editor and onnx_import to ngraph/frontend/onnx
- introduce new target 'onnx_frontend_ngraph' located in ngraph/frontend/onnx/frontend
- new target implements subset of FrontEnd, InputModel and Place interfaces
---
 .ci/azure/linux.yml                           |   1 +
 .ci/azure/linux_onnxruntime.yml               |   1 +
 .ci/openvino-onnx/Dockerfile                  |   1 +
 cmake/coverage.cmake                          |  12 +-
 cmake/features.cmake                          |   1 +
 .../include/frontend_manager/frontend.hpp     |   2 +-
 .../include/frontend_manager/input_model.hpp  |  62 +++----
 .../include/frontend_manager/place.hpp        |  47 ++---
 .../frontend_manager/src/frontend_manager.cpp | 101 +++++------
 .../frontend_manager/src/plugin_loader.cpp    |  29 ++--
 .../frontend_manager/src/plugin_loader.hpp    |  28 +--
 .../frontend/frontend_manager/src/utils.cpp   |  16 +-
 .../frontend/frontend_manager/src/utils.hpp   |   2 +-
 ngraph/frontend/onnx/CMakeLists.txt           |   3 +
 ngraph/frontend/onnx/frontend/CMakeLists.txt  |  45 +++++
 .../include/onnx_frontend/frontend.hpp        |  34 ++++
 .../frontend/onnx/frontend/src/frontend.cpp   |  56 ++++++
 .../onnx/frontend/src/input_model.cpp         |  56 ++++++
 .../onnx/frontend/src/input_model.hpp         |  33 ++++
 ngraph/frontend/onnx/frontend/src/place.hpp   |  78 +++++++++
 .../include/onnx_editor/editor.hpp            |   5 +
 .../include/onnx_import/core/model.hpp        |  85 +++++++++
 .../include/onnx_import/core/node.hpp         |   1 -
 .../onnx_import/include/onnx_import/onnx.hpp  |   8 +
 .../onnx_import/utils/onnx_internal.hpp       |  20 ++-
 .../onnx/onnx_import/src/core/attribute.cpp   |   7 +-
 .../onnx/onnx_import/src/core/graph.cpp       | 161 +++++++++---------
 .../onnx/onnx_import/src/core/graph.hpp       |  33 +---
 .../onnx/onnx_import/src/core/model.cpp       |   8 +-
 .../onnx/onnx_import/src/core/model.hpp       |   4 +-
 .../onnx/onnx_import/src/core/node.cpp        |   7 -
 .../onnx/onnx_import/src/core/transform.cpp   |   2 +-
 .../frontend/onnx/onnx_import/src/editor.cpp  |  30 ++--
 ngraph/frontend/onnx/onnx_import/src/onnx.cpp |   9 +-
 .../onnx_import/src/onnx_framework_node.cpp   |   4 +-
 .../onnx_framework_node.hpp                   |  39 +++--
 .../onnx_import/src/utils/onnx_internal.cpp   |  42 +++--
 .../tests/test_frontend/test_frontend_onnx.py |  97 +++++++++++
 .../test_frontendmanager.py                   |   0
 39 files changed, 852 insertions(+), 318 deletions(-)
 create mode 100644 ngraph/frontend/onnx/frontend/CMakeLists.txt
 create mode 100644 ngraph/frontend/onnx/frontend/include/onnx_frontend/frontend.hpp
 create mode 100644 ngraph/frontend/onnx/frontend/src/frontend.cpp
 create mode 100644 ngraph/frontend/onnx/frontend/src/input_model.cpp
 create mode 100644 ngraph/frontend/onnx/frontend/src/input_model.hpp
 create mode 100644 ngraph/frontend/onnx/frontend/src/place.hpp
 create mode 100644 ngraph/frontend/onnx/onnx_import/include/onnx_import/core/model.hpp
 rename ngraph/frontend/onnx/onnx_import/{include/onnx_import => src}/onnx_framework_node.hpp (68%)
 create mode 100644 ngraph/python/tests/test_frontend/test_frontend_onnx.py
 rename ngraph/python/tests/{test_ngraph => test_frontend}/test_frontendmanager.py (100%)

diff --git a/.ci/azure/linux.yml b/.ci/azure/linux.yml
index 7b1ee18d792d74..73bac3bb255f83 100644
--- a/.ci/azure/linux.yml
+++ b/.ci/azure/linux.yml
@@ -109,6 +109,7 @@ jobs:
         -DENABLE_WHEEL=ON
         -DENABLE_TESTS=ON
         -DNGRAPH_ONNX_IMPORT_ENABLE=ON
+        -DNGRAPH_ONNX_FRONTEND_ENABLE=ON
         -DENABLE_FASTER_BUILD=ON
         -DENABLE_STRICT_DEPENDENCIES=OFF
         -DIE_EXTRA_MODULES=$(OPENVINO_CONTRIB_REPO_DIR)/modules
diff --git a/.ci/azure/linux_onnxruntime.yml b/.ci/azure/linux_onnxruntime.yml
index fce8fdddcc4f91..a2bfee8c70ac3e 100644
--- a/.ci/azure/linux_onnxruntime.yml
+++ b/.ci/azure/linux_onnxruntime.yml
@@ -95,6 +95,7 @@ jobs:
         -DENABLE_SAMPLES=OFF
         -DENABLE_SPEECH_DEMO=OFF
         -DNGRAPH_ONNX_IMPORT_ENABLE=ON
+        -DNGRAPH_ONNX_FRONTEND_ENABLE=ON
         -DNGRAPH_DEBUG_ENABLE=OFF
         $(REPO_DIR)
       workingDirectory: $(BUILD_DIR)
diff --git a/.ci/openvino-onnx/Dockerfile b/.ci/openvino-onnx/Dockerfile
index 9b0f48cf66cc3e..315598225627e0 100644
--- a/.ci/openvino-onnx/Dockerfile
+++ b/.ci/openvino-onnx/Dockerfile
@@ -69,6 +69,7 @@ RUN cmake .. \
     -DENABLE_PYTHON=ON \
     -DPYTHON_EXECUTABLE=/usr/bin/python3 \
     -DNGRAPH_ONNX_IMPORT_ENABLE=ON \
+    -DNGRAPH_ONNX_FRONTEND_ENABLE=ON \
     -DNGRAPH_DEBUG_ENABLE=OFF \
     -DCMAKE_INSTALL_PREFIX=/openvino/dist \
     -DNGRAPH_USE_PROTOBUF_LITE=${PROTOBUF_LITE}
diff --git a/cmake/coverage.cmake b/cmake/coverage.cmake
index 60c137337b3173..4d8976e0a80beb 100644
--- a/cmake/coverage.cmake
+++ b/cmake/coverage.cmake
@@ -92,9 +92,15 @@ ie_coverage_genhtml(INFO_FILE "ngraph"
 
 if(NGRAPH_ONNX_IMPORT_ENABLE)
     ie_coverage_extract(INPUT "openvino" OUTPUT "onnx_importer"
-        PATTERNS "${OV_COVERAGE_BASE_DIRECTORY}/ngraph/frontend/onnx_common*"
-                 "${OV_COVERAGE_BASE_DIRECTORY}/ngraph/frontend/onnx_editor*"
-        "${OV_COVERAGE_BASE_DIRECTORY}/ngraph/frontend/onnx_import*")
+        PATTERNS "${OV_COVERAGE_BASE_DIRECTORY}/ngraph/frontend/onnx/onnx_common*"
+        "${OV_COVERAGE_BASE_DIRECTORY}/ngraph/frontend/onnx/onnx_import*")
     ie_coverage_genhtml(INFO_FILE "onnx_importer"
         PREFIX "${OV_COVERAGE_BASE_DIRECTORY}")
 endif()
+
+if(NGRAPH_ONNX_FRONTEND_ENABLE)
+    ie_coverage_extract(INPUT "openvino" OUTPUT "onnx_ngraph_frontend"
+        PATTERNS "${OV_COVERAGE_BASE_DIRECTORY}/ngraph/frontend/onnx/frontend*")
+    ie_coverage_genhtml(INFO_FILE "onnx_ngraph_frontend"
+        PREFIX "${OV_COVERAGE_BASE_DIRECTORY}")
+endif()
diff --git a/cmake/features.cmake b/cmake/features.cmake
index 22ddd0a55834eb..29f7135546c858 100644
--- a/cmake/features.cmake
+++ b/cmake/features.cmake
@@ -125,6 +125,7 @@ else()
 endif()
 
 ie_dependent_option(NGRAPH_ONNX_IMPORT_ENABLE "Enable ONNX importer" ON "protoc_available" OFF)
+ie_dependent_option(NGRAPH_ONNX_FRONTEND_ENABLE "Enable ONNX FrontEnd" OFF "NGRAPH_ONNX_IMPORT_ENABLE" OFF)
 ie_dependent_option(NGRAPH_PDPD_FRONTEND_ENABLE "Enable PaddlePaddle FrontEnd" ON "protoc_available" OFF)
 ie_dependent_option(NGRAPH_USE_PROTOBUF_LITE "Compiles and links with protobuf-lite" OFF
     "NGRAPH_ONNX_IMPORT_ENABLE OR NGRAPH_PDPD_FRONTEND_ENABLE" OFF)
diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp
index da54a1f7993a95..34456d4df7f4b9 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/frontend.hpp
@@ -63,7 +63,7 @@ namespace ngraph
             /// \param partiallyConverted partially converted nGraph function
             /// \return fully converted nGraph function
             virtual std::shared_ptr<ngraph::Function>
-                convert(std::shared_ptr<ngraph::Function> partiallyConverted) const;
+                convert(std::shared_ptr<ngraph::Function> partially_converted) const;
 
             /// \brief Convert only those parts of the model that can be converted leaving others
             /// as-is. Converted parts are not normalized by additional transformations; normalize
diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/input_model.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/input_model.hpp
index 6761e1dda383f2..6ec3f6060fc4d9 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/input_model.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/input_model.hpp
@@ -68,47 +68,47 @@ namespace ngraph
 
             /// \brief Returns a tensor place by a tensor name following framework conventions, or
             /// nullptr if a tensor with this name doesn't exist.
-            /// \param tensorName Name of tensor
+            /// \param tensor_name Name of tensor
             /// \return Tensor place corresponding to specifed tensor name
-            virtual Place::Ptr get_place_by_tensor_name(const std::string& tensorName) const;
+            virtual Place::Ptr get_place_by_tensor_name(const std::string& tensor_name) const;
 
             /// \brief Returns an operation place by an operation name following framework
             /// conventions, or nullptr if an operation with this name doesn't exist. \param
-            /// operationName Name of operation \return Place representing operation
-            virtual Place::Ptr get_place_by_operation_name(const std::string& operationName);
+            /// operation_name Name of operation \return Place representing operation
+            virtual Place::Ptr get_place_by_operation_name(const std::string& operation_name);
 
             /// \brief Returns an input port place by operation name and appropriate port index
-            /// \param operationName Name of operation
-            /// \param outputPortIndex Index of input port for this operation
+            /// \param operation_name Name of operation
+            /// \param output_port_index Index of input port for this operation
             /// \return Place representing input port of operation
             virtual Place::Ptr
-                get_place_by_operation_name_and_input_port(const std::string& operationName,
-                                                           int inputPortIndex);
+                get_place_by_operation_name_and_input_port(const std::string& operation_name,
+                                                           int input_port_index);
 
             /// \brief Returns an output port place by operation name and appropriate port index
-            /// \param operationNameNname of operation
-            /// \param outputPortIndex Index of output port for this operation
+            /// \param operation_name Name of operation
+            /// \param output_port_index Index of output port for this operation
             /// \return Place representing output port of operation
             virtual Place::Ptr
-                get_place_by_operation_name_and_output_port(const std::string& operationName,
-                                                            int outputPortIndex);
+                get_place_by_operation_name_and_output_port(const std::string& operation_name,
+                                                            int output_port_index);
 
             ///// Naming and annotation  /////
 
             /// \brief Sets name for tensor. Overwrites existing names of this place
             /// \param operation Tensor place
-            /// \param newName New name for this tensor
-            virtual void set_name_for_tensor(Place::Ptr tensor, const std::string& newName);
+            /// \param new_name New name for this tensor
+            virtual void set_name_for_tensor(Place::Ptr tensor, const std::string& new_name);
 
             /// \brief Adds new name for tensor
             /// \param operation Tensor place
-            /// \param newName New name to be added to this place
-            virtual void add_name_for_tensor(Place::Ptr tensor, const std::string& newName);
+            /// \param new_name New name to be added to this place
+            virtual void add_name_for_tensor(Place::Ptr tensor, const std::string& new_name);
 
             /// \brief Sets name for operation. Overwrites existing names of this place
             /// \param operation Operation place
-            /// \param newName New name for this operation
-            virtual void set_name_for_operation(Place::Ptr operation, const std::string& newName);
+            /// \param new_name New name for this operation
+            virtual void set_name_for_operation(Place::Ptr operation, const std::string& new_name);
 
             /// \brief Unassign specified name from tensor place(s)
             /// \param name Name of tensor
@@ -120,27 +120,27 @@ namespace ngraph
 
             /// \brief Set name for a particular dimension of a place (e.g. batch dimension)
             /// \param place Model's place
-            /// \param shapeDimIndex Dimension index
-            /// \param dimName Name to assign on this dimension
+            /// \param shape_dim_index Dimension index
+            /// \param dim_name Name to assign on this dimension
             virtual void set_name_for_dimension(Place::Ptr place,
-                                                size_t shapeDimIndex,
-                                                const std::string& dimName);
+                                                size_t shape_dim_index,
+                                                const std::string& dim_name);
 
             ///// Topology Editing  /////
 
             /// \brief Cut immediately before this place and assign this place as new input; prune
             /// all nodes that don't contribute to any output.
             /// \param place New place to be assigned as input
-            /// \param newNameOptional Optional new name assigned to this input place
+            /// \param new_name_optional Optional new name assigned to this input place
             virtual void cut_and_add_new_input(Place::Ptr place,
-                                               const std::string& newNameOptional = "");
+                                               const std::string& new_name_optional = "");
 
             /// \brief Cut immediately after this place and assign this place as new output; prune
             /// all nodes that don't contribute to any output.
             /// \param place New place to be assigned as output
-            /// \param newNameOptional Optional new name assigned to this output place
+            /// \param new_name_optional Optional new name assigned to this output place
             virtual void cut_and_add_new_output(Place::Ptr place,
-                                                const std::string& newNameOptional = "");
+                                                const std::string& new_name_optional = "");
 
             /// \brief Assign this place as new output or add necessary nodes to represent a new
             /// output.
@@ -200,13 +200,13 @@ namespace ngraph
             virtual void set_tensor_value(Place::Ptr place, const void* value);
 
             /// \brief Defines partial value (lower bound and upper bound) for a tensor place
-            /// TODO: more details for minValue and maxValue format; who defines shape?
+            /// TODO: more details for min_value and max_value format; who defines shape?
             /// \param place Tensor place
-            /// \param minValue Lower bound of partial value for tensor place
-            /// \param maxValue Upper bound of partial value for tensor place
+            /// \param min_value Lower bound of partial value for tensor place
+            /// \param max_value Upper bound of partial value for tensor place
             virtual void set_tensor_partial_value(Place::Ptr place,
-                                                  const void* minValue,
-                                                  const void* maxValue);
+                                                  const void* min_value,
+                                                  const void* max_value);
         };
 
     } // namespace frontend
diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp
index 5df561fa0d5e4d..045d93dc4c5d98 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp
@@ -87,12 +87,12 @@ namespace ngraph
             /// \note It can be called for any kind of graph place searching for the first consuming
             /// operations.
             ///
-            /// \param outputPortIndex If place is an operational node it specifies which output
+            /// \param output_port_index If place is an operational node it specifies which output
             /// port should be considered.
             ///
             /// \return A vector with all operation node references that consumes data from this
             /// place
-            virtual std::vector<Ptr> get_consuming_operations(int outputPortIndex) const;
+            virtual std::vector<Ptr> get_consuming_operations(int output_port_index) const;
 
             /// \brief Returns a tensor place that gets data from this place; applicable for
             /// operations, output ports and output edges which have only one output port
@@ -103,11 +103,11 @@ namespace ngraph
             /// \brief Returns a tensor place that gets data from this place; applicable for
             /// operations, output ports and output edges
             ///
-            /// \param outputPortIndex Output port index if the current place is an operation node
+            /// \param output_port_index Output port index if the current place is an operation node
             /// and has multiple output ports
             ///
             /// \return A tensor place which hold the resulting value for this place
-            virtual Ptr get_target_tensor(int outputPortIndex) const;
+            virtual Ptr get_target_tensor(int output_port_index) const;
 
             /// \brief Returns a tensor place that supplies data for this place; applicable for
             /// operations, input ports and input edges which have only one input port
@@ -118,10 +118,10 @@ namespace ngraph
             /// \brief Returns a tensor place that supplies data for this place; applicable for
             /// operations, input ports and input edges
             ///
-            /// \param inputPortIndex Input port index for operational nodes.
+            /// \param input_port_index Input port index for operational nodes.
             ///
             /// \return A tensor place which supplies data for this place
-            virtual Ptr get_source_tensor(int inputPortIndex) const;
+            virtual Ptr get_source_tensor(int input_port_index) const;
 
             /// \brief Get an operation node place that immediately produces data for this place;
             /// applicable if place has only one input port
@@ -131,11 +131,11 @@ namespace ngraph
 
             /// \brief Get an operation node place that immediately produces data for this place
             ///
-            /// \param inputPortIndex If a given place is itself an operation node, this specifies a
-            /// port index
+            /// \param input_port_index If a given place is itself an operation node, this specifies
+            /// a port index
             ///
             /// \return An operation place that produces data for this place
-            virtual Ptr get_producing_operation(int inputPortIndex) const;
+            virtual Ptr get_producing_operation(int input_port_index) const;
 
             /// Returns a port that produces data for this place
             virtual Ptr get_producing_port() const;
@@ -148,28 +148,28 @@ namespace ngraph
 
             /// \brief For operation node returns reference to an input port with specified index
             ///
-            /// \param inputPortIndex Input port index
+            /// \param input_port_index Input port index
             ///
             /// \return Appropriate input port place
-            virtual Ptr get_input_port(int inputPortIndex) const;
+            virtual Ptr get_input_port(int input_port_index) const;
 
             /// \brief For operation node returns reference to an input port with specified name;
             /// applicable if port group has only one input port
             ///
-            /// \param inputName Name of port group
+            /// \param input_name Name of port group
             ///
             /// \return Appropriate input port place
-            virtual Ptr get_input_port(const std::string& inputName) const;
+            virtual Ptr get_input_port(const std::string& input_name) const;
 
             /// \brief For operation node returns reference to an input port with specified name and
             /// index
             ///
-            /// \param inputName Name of port group, each group can have multiple ports
+            /// \param input_name Name of port group, each group can have multiple ports
             ///
-            /// \param inputPortIndex Input port index in a group
+            /// \param input_port_index Input port index in a group
             ///
             /// \return Appropriate input port place
-            virtual Ptr get_input_port(const std::string& inputName, int inputPortIndex) const;
+            virtual Ptr get_input_port(const std::string& input_name, int input_port_index) const;
 
             /// \brief For operation node returns reference to an output port; applicable for
             /// operations with only one output port
@@ -179,28 +179,29 @@ namespace ngraph
 
             /// \brief For operation node returns reference to an output port with specified index
             ///
-            /// \param outputPortIndex Output port index
+            /// \param output_port_index Output port index
             ///
             /// \return Appropriate output port place
-            virtual Ptr get_output_port(int outputPortIndex) const;
+            virtual Ptr get_output_port(int output_port_index) const;
 
             /// \brief For operation node returns reference to an output port with specified name;
             /// applicable if port group has only one output port
             ///
-            /// \param outputName Name of output port group
+            /// \param output_name Name of output port group
             ///
             /// \return Appropriate output port place
-            virtual Ptr get_output_port(const std::string& outputName) const;
+            virtual Ptr get_output_port(const std::string& output_name) const;
 
             /// \brief For operation node returns reference to an output port with specified name
             /// and index
             ///
-            /// \param outputName Name of output port group, each group can have multiple ports
+            /// \param output_name Name of output port group, each group can have multiple ports
             ///
-            /// \param outputPortIndex Output port index
+            /// \param output_port_index Output port index
             ///
             /// \return Appropriate output port place
-            virtual Ptr get_output_port(const std::string& outputName, int outputPortIndex) const;
+            virtual Ptr get_output_port(const std::string& output_name,
+                                        int output_port_index) const;
 
             /// \brief Returns all input ports that consume data flows through this place
             virtual std::vector<Place::Ptr> get_consuming_ports() const;
diff --git a/ngraph/frontend/frontend_manager/src/frontend_manager.cpp b/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
index 95dfe1ccbdedf5..68fcccb0538198 100644
--- a/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
+++ b/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
@@ -16,22 +16,22 @@ using namespace ngraph::frontend;
 //----------- FrontEndManager ---------------------------
 class FrontEndManager::Impl
 {
-    std::vector<PluginHandle> m_loadedLibs; // must be a first class member (destroyed last)
+    std::vector<PluginHandle> m_loaded_libs; // must be a first class member (destroyed last)
     std::map<std::string, FrontEndFactory> m_factories;
 
 public:
-    Impl() { registerPlugins(); }
+    Impl() { register_plugins(); }
 
     ~Impl() = default;
 
-    FrontEnd::Ptr loadByFramework(const std::string& framework)
+    FrontEnd::Ptr load_by_framework(const std::string& framework)
     {
         FRONT_END_INITIALIZATION_CHECK(
             m_factories.count(framework), "FrontEnd for Framework ", framework, " is not found");
         return m_factories[framework]();
     }
 
-    std::vector<std::string> availableFrontEnds() const
+    std::vector<std::string> available_front_ends() const
     {
         std::vector<std::string> keys;
 
@@ -43,7 +43,7 @@ class FrontEndManager::Impl
         return keys;
     }
 
-    FrontEnd::Ptr loadByModel(const std::vector<std::shared_ptr<Variant>>& variants)
+    FrontEnd::Ptr load_by_model(const std::vector<std::shared_ptr<Variant>>& variants)
     {
         for (const auto& factory : m_factories)
         {
@@ -56,41 +56,41 @@ class FrontEndManager::Impl
         return FrontEnd::Ptr();
     }
 
-    void registerFrontEnd(const std::string& name, FrontEndFactory creator)
+    void register_front_end(const std::string& name, FrontEndFactory creator)
     {
         m_factories.insert({name, creator});
     }
 
 private:
-    void registerPlugins()
+    void register_plugins()
     {
-        auto registerFromDir = [&](const std::string& dir) {
+        auto register_from_dir = [&](const std::string& dir) {
             if (!dir.empty())
             {
-                auto plugins = loadPlugins(dir);
+                auto plugins = load_plugins(dir);
                 for (auto& plugin : plugins)
                 {
-                    registerFrontEnd(plugin.m_pluginInfo.m_name, plugin.m_pluginInfo.m_creator);
-                    m_loadedLibs.push_back(std::move(plugin.m_libHandle));
+                    register_front_end(plugin.m_plugin_info.m_name, plugin.m_plugin_info.m_creator);
+                    m_loaded_libs.push_back(std::move(plugin.m_lib_handle));
                 }
             }
         };
-        std::string envPath = ngraph::getenv_string("OV_FRONTEND_PATH");
-        if (!envPath.empty())
+        std::string env_path = ngraph::getenv_string("OV_FRONTEND_PATH");
+        if (!env_path.empty())
         {
             auto start = 0u;
-            auto sepPos = envPath.find(PathSeparator, start);
-            while (sepPos != std::string::npos)
+            auto sep_pos = env_path.find(PathSeparator, start);
+            while (sep_pos != std::string::npos)
             {
-                registerFromDir(envPath.substr(start, sepPos - start));
-                start = sepPos + 1;
-                sepPos = envPath.find(PathSeparator, start);
+                register_from_dir(env_path.substr(start, sep_pos - start));
+                start = sep_pos + 1;
+                sep_pos = env_path.find(PathSeparator, start);
             }
-            registerFromDir(envPath.substr(start, sepPos));
+            register_from_dir(env_path.substr(start, sep_pos));
         }
         else
         {
-            registerFromDir(getFrontendLibraryPath());
+            register_from_dir(get_frontend_library_path());
         }
     }
 };
@@ -107,23 +107,23 @@ FrontEndManager::~FrontEndManager() = default;
 
 FrontEnd::Ptr FrontEndManager::load_by_framework(const std::string& framework)
 {
-    return m_impl->loadByFramework(framework);
+    return m_impl->load_by_framework(framework);
 }
 
 FrontEnd::Ptr
     FrontEndManager::load_by_model_impl(const std::vector<std::shared_ptr<Variant>>& variants)
 {
-    return m_impl->loadByModel(variants);
+    return m_impl->load_by_model(variants);
 }
 
 std::vector<std::string> FrontEndManager::get_available_front_ends() const
 {
-    return m_impl->availableFrontEnds();
+    return m_impl->available_front_ends();
 }
 
 void FrontEndManager::register_front_end(const std::string& name, FrontEndFactory creator)
 {
-    m_impl->registerFrontEnd(name, creator);
+    m_impl->register_front_end(name, creator);
 }
 
 //----------- FrontEnd ---------------------------
@@ -158,7 +158,7 @@ std::shared_ptr<ngraph::Function> FrontEnd::convert_partially(InputModel::Ptr mo
 
 std::shared_ptr<ngraph::Function> FrontEnd::decode(InputModel::Ptr model) const
 {
-    FRONT_END_NOT_IMPLEMENTED(convertDecodingOnly);
+    FRONT_END_NOT_IMPLEMENTED(decode);
 }
 
 void FrontEnd::normalize(std::shared_ptr<ngraph::Function> function) const
@@ -177,39 +177,40 @@ std::vector<Place::Ptr> InputModel::get_outputs() const
     FRONT_END_NOT_IMPLEMENTED(get_outputs);
 }
 
-Place::Ptr InputModel::get_place_by_tensor_name(const std::string& tensorName) const
+Place::Ptr InputModel::get_place_by_tensor_name(const std::string& tensor_name) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_place_by_tensor_name);
 }
 
-Place::Ptr InputModel::get_place_by_operation_name(const std::string& operationName)
+Place::Ptr InputModel::get_place_by_operation_name(const std::string& operation_name)
 {
     FRONT_END_NOT_IMPLEMENTED(get_place_by_operation_name);
 }
 
-Place::Ptr InputModel::get_place_by_operation_name_and_input_port(const std::string& operationName,
-                                                                  int inputPortIndex)
+Place::Ptr InputModel::get_place_by_operation_name_and_input_port(const std::string& operation_name,
+                                                                  int input_port_index)
 {
     FRONT_END_NOT_IMPLEMENTED(get_place_by_operation_name_and_input_port);
 }
 
-Place::Ptr InputModel::get_place_by_operation_name_and_output_port(const std::string& operationName,
-                                                                   int outputPortIndex)
+Place::Ptr
+    InputModel::get_place_by_operation_name_and_output_port(const std::string& operation_name,
+                                                            int output_port_index)
 {
     FRONT_END_NOT_IMPLEMENTED(get_place_by_operation_name_and_output_port);
 }
 
-void InputModel::set_name_for_tensor(Place::Ptr tensor, const std::string& newName)
+void InputModel::set_name_for_tensor(Place::Ptr tensor, const std::string& new_name)
 {
     FRONT_END_NOT_IMPLEMENTED(set_name_for_tensor);
 }
 
-void InputModel::add_name_for_tensor(Place::Ptr tensor, const std::string& newName)
+void InputModel::add_name_for_tensor(Place::Ptr tensor, const std::string& new_name)
 {
     FRONT_END_NOT_IMPLEMENTED(add_name_for_tensor);
 }
 
-void InputModel::set_name_for_operation(Place::Ptr operation, const std::string& newName)
+void InputModel::set_name_for_operation(Place::Ptr operation, const std::string& new_name)
 {
     FRONT_END_NOT_IMPLEMENTED(set_name_for_operation);
 }
@@ -225,18 +226,18 @@ void InputModel::free_name_for_operation(const std::string& name)
 }
 
 void InputModel::set_name_for_dimension(Place::Ptr place,
-                                        size_t shapeDimIndex,
-                                        const std::string& dimName)
+                                        size_t shape_dim_index,
+                                        const std::string& dim_name)
 {
     FRONT_END_NOT_IMPLEMENTED(set_name_for_dimension);
 }
 
-void InputModel::cut_and_add_new_input(Place::Ptr place, const std::string& newNameOptional)
+void InputModel::cut_and_add_new_input(Place::Ptr place, const std::string& new_name_optional)
 {
     FRONT_END_NOT_IMPLEMENTED(cut_and_add_new_input);
 }
 
-void InputModel::cut_and_add_new_output(Place::Ptr place, const std::string& newNameOptional)
+void InputModel::cut_and_add_new_output(Place::Ptr place, const std::string& new_name_optional)
 {
     FRONT_END_NOT_IMPLEMENTED(cut_and_add_new_output);
 }
@@ -289,8 +290,8 @@ void InputModel::set_tensor_value(Place::Ptr place, const void* value)
 }
 
 void InputModel::set_tensor_partial_value(Place::Ptr place,
-                                          const void* minValue,
-                                          const void* maxValue)
+                                          const void* min_value,
+                                          const void* max_value)
 {
     FRONT_END_NOT_IMPLEMENTED(set_tensor_partial_value);
 }
@@ -306,7 +307,7 @@ std::vector<Place::Ptr> Place::get_consuming_operations() const
     FRONT_END_NOT_IMPLEMENTED(get_consuming_operations);
 }
 
-std::vector<Place::Ptr> Place::get_consuming_operations(int outputPortIndex) const
+std::vector<Place::Ptr> Place::get_consuming_operations(int output_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_consuming_operations);
 }
@@ -316,7 +317,7 @@ Place::Ptr Place::get_target_tensor() const
     FRONT_END_NOT_IMPLEMENTED(get_target_tensor);
 }
 
-Place::Ptr Place::get_target_tensor(int outputPortIndex) const
+Place::Ptr Place::get_target_tensor(int output_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_target_tensor);
 }
@@ -326,7 +327,7 @@ Place::Ptr Place::get_producing_operation() const
     FRONT_END_NOT_IMPLEMENTED(get_producing_operation);
 }
 
-Place::Ptr Place::get_producing_operation(int inputPortIndex) const
+Place::Ptr Place::get_producing_operation(int input_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_producing_operation);
 }
@@ -341,17 +342,17 @@ Place::Ptr Place::get_input_port() const
     FRONT_END_NOT_IMPLEMENTED(get_input_port);
 }
 
-Place::Ptr Place::get_input_port(int inputPortIndex) const
+Place::Ptr Place::get_input_port(int input_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_input_port);
 }
 
-Place::Ptr Place::get_input_port(const std::string& inputName) const
+Place::Ptr Place::get_input_port(const std::string& input_name) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_input_port);
 }
 
-Place::Ptr Place::get_input_port(const std::string& inputName, int inputPortIndex) const
+Place::Ptr Place::get_input_port(const std::string& input_name, int input_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_input_port);
 }
@@ -361,17 +362,17 @@ Place::Ptr Place::get_output_port() const
     FRONT_END_NOT_IMPLEMENTED(get_output_port);
 }
 
-Place::Ptr Place::get_output_port(int outputPortIndex) const
+Place::Ptr Place::get_output_port(int output_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_output_port);
 }
 
-Place::Ptr Place::get_output_port(const std::string& outputName) const
+Place::Ptr Place::get_output_port(const std::string& output_name) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_output_port);
 }
 
-Place::Ptr Place::get_output_port(const std::string& outputName, int outputPortIndex) const
+Place::Ptr Place::get_output_port(const std::string& output_name, int output_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_output_port);
 }
@@ -406,7 +407,7 @@ Place::Ptr Place::get_source_tensor() const
     FRONT_END_NOT_IMPLEMENTED(get_source_tensor);
 }
 
-Place::Ptr Place::get_source_tensor(int inputPortIndex) const
+Place::Ptr Place::get_source_tensor(int input_port_index) const
 {
     FRONT_END_NOT_IMPLEMENTED(get_source_tensor);
 }
diff --git a/ngraph/frontend/frontend_manager/src/plugin_loader.cpp b/ngraph/frontend/frontend_manager/src/plugin_loader.cpp
index f42dbbad3a6c96..7ce0e956bab700 100644
--- a/ngraph/frontend/frontend_manager/src/plugin_loader.cpp
+++ b/ngraph/frontend/frontend_manager/src/plugin_loader.cpp
@@ -25,17 +25,17 @@ using namespace ngraph;
 using namespace ngraph::frontend;
 
 #ifdef WIN32
-#define DLOPEN(fileStr) LoadLibrary(TEXT(fileStr.c_str()))
+#define DLOPEN(file_str) LoadLibrary(TEXT(file_str.c_str()))
 #define DLSYM(obj, func) GetProcAddress(obj, func)
 #define DLCLOSE(obj) FreeLibrary(obj)
 #else
-#define DLOPEN(fileStr) dlopen(file.c_str(), RTLD_LAZY)
+#define DLOPEN(file_str) dlopen(file_str.c_str(), RTLD_LAZY)
 #define DLSYM(obj, func) dlsym(obj, func)
 #define DLCLOSE(obj) dlclose(obj)
 #endif
 
 // TODO: change to std::filesystem for C++17
-static std::vector<std::string> listFiles(const std::string& path)
+static std::vector<std::string> list_files(const std::string& path)
 {
     std::vector<std::string> res;
     try
@@ -68,9 +68,9 @@ static std::vector<std::string> listFiles(const std::string& path)
     return res;
 }
 
-std::vector<PluginData> ngraph::frontend::loadPlugins(const std::string& dirName)
+std::vector<PluginData> ngraph::frontend::load_plugins(const std::string& dir_name)
 {
-    auto files = listFiles(dirName);
+    auto files = list_files(dir_name);
     std::vector<PluginData> res;
     for (const auto& file : files)
     {
@@ -80,32 +80,29 @@ std::vector<PluginData> ngraph::frontend::loadPlugins(const std::string& dirName
             continue;
         }
 
-        PluginHandle guard([shared_object, file]() {
-            // std::cout << "Closing plugin library " << file << std::endl;
-            DLCLOSE(shared_object);
-        });
+        PluginHandle guard([shared_object, file]() { DLCLOSE(shared_object); });
 
-        auto infoAddr = reinterpret_cast<void* (*)()>(DLSYM(shared_object, "GetAPIVersion"));
-        if (!infoAddr)
+        auto info_addr = reinterpret_cast<void* (*)()>(DLSYM(shared_object, "GetAPIVersion"));
+        if (!info_addr)
         {
             continue;
         }
-        FrontEndVersion plugInfo{reinterpret_cast<FrontEndVersion>(infoAddr())};
+        FrontEndVersion plug_info{reinterpret_cast<FrontEndVersion>(info_addr())};
 
-        if (plugInfo != OV_FRONTEND_API_VERSION)
+        if (plug_info != OV_FRONTEND_API_VERSION)
         {
             // Plugin has incompatible API version, do not load it
             continue;
         }
 
-        auto creatorAddr = reinterpret_cast<void* (*)()>(DLSYM(shared_object, "GetFrontEndData"));
-        if (!creatorAddr)
+        auto creator_addr = reinterpret_cast<void* (*)()>(DLSYM(shared_object, "GetFrontEndData"));
+        if (!creator_addr)
         {
             continue;
         }
 
         std::unique_ptr<FrontEndPluginInfo> fact{
-            reinterpret_cast<FrontEndPluginInfo*>(creatorAddr())};
+            reinterpret_cast<FrontEndPluginInfo*>(creator_addr())};
 
         res.push_back(PluginData(std::move(guard), std::move(*fact)));
     }
diff --git a/ngraph/frontend/frontend_manager/src/plugin_loader.hpp b/ngraph/frontend/frontend_manager/src/plugin_loader.hpp
index 1ab3fc73baa227..9d01d4f3437689 100644
--- a/ngraph/frontend/frontend_manager/src/plugin_loader.hpp
+++ b/ngraph/frontend/frontend_manager/src/plugin_loader.hpp
@@ -7,11 +7,11 @@
 #include <frontend_manager/frontend_manager.hpp>
 
 #ifdef _WIN32
-const char FileSeparator[] = "\\";
-const char PathSeparator[] = ";";
+static const char FileSeparator[] = "\\";
+static const char PathSeparator[] = ";";
 #else
-const char FileSeparator[] = "/";
-const char PathSeparator[] = ":";
+static const char FileSeparator[] = "/";
+static const char PathSeparator[] = ":";
 #endif // _WIN32
 
 namespace ngraph
@@ -23,8 +23,8 @@ namespace ngraph
         class PluginHandle
         {
         public:
-            PluginHandle(std::function<void()> callOnDestruct)
-                : m_callOnDestruct(callOnDestruct)
+            PluginHandle(std::function<void()> call_on_destruct)
+                : m_call_on_destruct(call_on_destruct)
             {
             }
 
@@ -38,31 +38,31 @@ namespace ngraph
 
             ~PluginHandle()
             {
-                if (m_callOnDestruct)
+                if (m_call_on_destruct)
                 {
-                    m_callOnDestruct();
+                    m_call_on_destruct();
                 }
             }
 
         private:
-            std::function<void()> m_callOnDestruct;
+            std::function<void()> m_call_on_destruct;
         };
 
         struct PluginData
         {
             PluginData(PluginHandle&& h, FrontEndPluginInfo&& info)
-                : m_libHandle(std::move(h))
-                , m_pluginInfo(info)
+                : m_lib_handle(std::move(h))
+                , m_plugin_info(info)
             {
             }
 
             PluginHandle
-                m_libHandle; // Shall be destroyed when plugin is not needed anymore to free memory
-            FrontEndPluginInfo m_pluginInfo;
+                m_lib_handle; // Shall be destroyed when plugin is not needed anymore to free memory
+            FrontEndPluginInfo m_plugin_info;
         };
 
         // Searches for available plugins in a specified directory
-        std::vector<PluginData> loadPlugins(const std::string& dirName);
+        std::vector<PluginData> load_plugins(const std::string& dir_name);
 
     } // namespace frontend
 } // namespace ngraph
diff --git a/ngraph/frontend/frontend_manager/src/utils.cpp b/ngraph/frontend/frontend_manager/src/utils.cpp
index e940512e6e7872..262aa7556127e6 100644
--- a/ngraph/frontend/frontend_manager/src/utils.cpp
+++ b/ngraph/frontend/frontend_manager/src/utils.cpp
@@ -26,7 +26,7 @@
 
 namespace
 {
-    std::string getPathName(const std::string& s)
+    std::string get_path_name(const std::string& s)
     {
         size_t i = s.rfind(FileSeparator, s.length());
         if (i != std::string::npos)
@@ -39,30 +39,30 @@ namespace
 
 } // namespace
 
-static std::string _getFrontendLibraryPath()
+static std::string _get_frontend_library_path()
 {
 #ifdef _WIN32
     CHAR ie_library_path[MAX_PATH];
     HMODULE hm = NULL;
     if (!GetModuleHandleExA(GET_MODULE_HANDLE_EX_FLAG_FROM_ADDRESS |
                                 GET_MODULE_HANDLE_EX_FLAG_UNCHANGED_REFCOUNT,
-                            reinterpret_cast<LPSTR>(ngraph::frontend::getFrontendLibraryPath),
+                            reinterpret_cast<LPSTR>(ngraph::frontend::get_frontend_library_path),
                             &hm))
     {
         FRONT_END_INITIALIZATION_CHECK(false, "GetModuleHandle returned ", GetLastError());
     }
     GetModuleFileNameA(hm, (LPSTR)ie_library_path, sizeof(ie_library_path));
-    return getPathName(std::string(ie_library_path));
+    return get_path_name(std::string(ie_library_path));
 #elif defined(__APPLE__) || defined(__linux__)
     Dl_info info;
-    dladdr(reinterpret_cast<void*>(ngraph::frontend::getFrontendLibraryPath), &info);
-    return getPathName(std::string(info.dli_fname)).c_str();
+    dladdr(reinterpret_cast<void*>(ngraph::frontend::get_frontend_library_path), &info);
+    return get_path_name(std::string(info.dli_fname)).c_str();
 #else
 #error "Unsupported OS"
 #endif // _WIN32
 }
 
-std::string ngraph::frontend::getFrontendLibraryPath()
+std::string ngraph::frontend::get_frontend_library_path()
 {
-    return _getFrontendLibraryPath();
+    return _get_frontend_library_path();
 }
diff --git a/ngraph/frontend/frontend_manager/src/utils.hpp b/ngraph/frontend/frontend_manager/src/utils.hpp
index 26d6f5273c30e4..1c05466bf29024 100644
--- a/ngraph/frontend/frontend_manager/src/utils.hpp
+++ b/ngraph/frontend/frontend_manager/src/utils.hpp
@@ -9,6 +9,6 @@ namespace ngraph
 {
     namespace frontend
     {
-        FRONTEND_API std::string getFrontendLibraryPath();
+        FRONTEND_API std::string get_frontend_library_path();
     } // namespace frontend
 } // namespace ngraph
diff --git a/ngraph/frontend/onnx/CMakeLists.txt b/ngraph/frontend/onnx/CMakeLists.txt
index 3327ff61b08e0e..5bf43f04931165 100644
--- a/ngraph/frontend/onnx/CMakeLists.txt
+++ b/ngraph/frontend/onnx/CMakeLists.txt
@@ -4,3 +4,6 @@
 
 add_subdirectory(onnx_common)
 add_subdirectory(onnx_import)
+if (NGRAPH_ONNX_FRONTEND_ENABLE)
+    add_subdirectory(frontend)
+endif()
diff --git a/ngraph/frontend/onnx/frontend/CMakeLists.txt b/ngraph/frontend/onnx/frontend/CMakeLists.txt
new file mode 100644
index 00000000000000..aab7a150db87c9
--- /dev/null
+++ b/ngraph/frontend/onnx/frontend/CMakeLists.txt
@@ -0,0 +1,45 @@
+# Copyright (C) 2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+#
+
+file(GLOB_RECURSE LIBRARY_SRC ${CMAKE_CURRENT_SOURCE_DIR}/src/*.cpp)
+file(GLOB_RECURSE LIBRARY_PUBLIC_HEADERS ${CMAKE_CURRENT_SOURCE_DIR}/include/*.hpp)
+
+set(ONNX_FRONTEND_INCLUDE_DIR ${CMAKE_CURRENT_SOURCE_DIR}/include)
+
+# Create named folders for the sources within the .vcproj
+# Empty name lists them directly under the .vcproj
+
+source_group("src" FILES ${LIBRARY_SRC})
+source_group("include" FILES ${LIBRARY_HEADERS})
+source_group("public include" FILES ${LIBRARY_PUBLIC_HEADERS})
+
+# Create shared library
+add_library(onnx_ngraph_frontend SHARED ${LIBRARY_SRC} ${LIBRARY_HEADERS} ${LIBRARY_PUBLIC_HEADERS})
+add_library(ngraph::onnx_ngraph_frontend ALIAS onnx_ngraph_frontend)
+
+add_clang_format_target(onnx_ngraph_frontend_clang FOR_TARGETS onnx_ngraph_frontend)
+
+if(COMMAND ie_add_vs_version_file)
+    ie_add_vs_version_file(NAME onnx_ngraph_frontend
+                           FILEDESCRIPTION "nGraph ONNX frontend library")
+endif()
+
+target_link_libraries(onnx_ngraph_frontend PRIVATE onnx_importer frontend_manager)
+
+target_include_directories(onnx_ngraph_frontend PUBLIC $<BUILD_INTERFACE:${ONNX_FRONTEND_INCLUDE_DIR}>
+                                                $<INSTALL_INTERFACE:${FRONTEND_INSTALL_INCLUDE}>)
+
+target_include_directories(onnx_ngraph_frontend PRIVATE ${CMAKE_CURRENT_SOURCE_DIR}/src)
+
+install(TARGETS onnx_ngraph_frontend EXPORT ngraphTargets
+        RUNTIME DESTINATION ${NGRAPH_INSTALL_LIB} COMPONENT ngraph
+        ARCHIVE DESTINATION ${NGRAPH_INSTALL_LIB} COMPONENT ngraph
+        LIBRARY DESTINATION ${NGRAPH_INSTALL_LIB} COMPONENT ngraph)
+
+install(DIRECTORY ${ONNX_FRONTEND_INCLUDE_DIR}/onnx_frontend
+        DESTINATION ${FRONTEND_INSTALL_INCLUDE}
+        COMPONENT ngraph_dev
+        FILES_MATCHING PATTERN "*.hpp")
+
+export(TARGETS onnx_ngraph_frontend NAMESPACE ngraph:: APPEND FILE "${NGRAPH_TARGETS_FILE}")
diff --git a/ngraph/frontend/onnx/frontend/include/onnx_frontend/frontend.hpp b/ngraph/frontend/onnx/frontend/include/onnx_frontend/frontend.hpp
new file mode 100644
index 00000000000000..fdc004365d6672
--- /dev/null
+++ b/ngraph/frontend/onnx/frontend/include/onnx_frontend/frontend.hpp
@@ -0,0 +1,34 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <frontend_manager/frontend.hpp>
+
+#ifdef onnx_ngraph_frontend_EXPORTS
+#define ONNX_FRONTEND_API NGRAPH_HELPER_DLL_EXPORT
+#else
+#define ONNX_FRONTEND_API NGRAPH_HELPER_DLL_IMPORT
+#endif
+
+namespace ngraph
+{
+    namespace frontend
+    {
+        class ONNX_FRONTEND_API FrontEndONNX : public FrontEnd
+        {
+        public:
+            std::shared_ptr<ngraph::Function> convert(InputModel::Ptr model) const override;
+            std::shared_ptr<ngraph::Function>
+                convert(std::shared_ptr<ngraph::Function> partially_converted) const override;
+            std::shared_ptr<ngraph::Function> decode(InputModel::Ptr model) const override;
+
+        protected:
+            InputModel::Ptr
+                load_impl(const std::vector<std::shared_ptr<Variant>>& params) const override;
+        };
+
+    } // namespace frontend
+
+} // namespace ngraph
diff --git a/ngraph/frontend/onnx/frontend/src/frontend.cpp b/ngraph/frontend/onnx/frontend/src/frontend.cpp
new file mode 100644
index 00000000000000..3caa85db68c365
--- /dev/null
+++ b/ngraph/frontend/onnx/frontend/src/frontend.cpp
@@ -0,0 +1,56 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <frontend_manager/frontend_exceptions.hpp>
+#include <frontend_manager/frontend_manager.hpp>
+#include <input_model.hpp>
+#include <onnx_frontend/frontend.hpp>
+#include <onnx_import/onnx.hpp>
+
+using namespace ngraph;
+using namespace ngraph::frontend;
+
+extern "C" ONNX_FRONTEND_API FrontEndVersion GetAPIVersion()
+{
+    return OV_FRONTEND_API_VERSION;
+}
+
+extern "C" ONNX_FRONTEND_API void* GetFrontEndData()
+{
+    FrontEndPluginInfo* res = new FrontEndPluginInfo();
+    res->m_name = "onnx";
+    res->m_creator = []() { return std::make_shared<FrontEndONNX>(); };
+    return res;
+}
+
+InputModel::Ptr FrontEndONNX::load_impl(const std::vector<std::shared_ptr<Variant>>& variants) const
+{
+    NGRAPH_CHECK(variants.size() == 1,
+                 "Only one parameter to load function is expected. Got " +
+                     std::to_string(variants.size()));
+    NGRAPH_CHECK(is_type<VariantWrapper<std::string>>(variants[0]),
+                 "Parameter to load function need to be a std::string");
+    auto path = as_type_ptr<VariantWrapper<std::string>>(variants[0])->get();
+    return std::make_shared<InputModelONNX>(path);
+}
+
+std::shared_ptr<ngraph::Function> FrontEndONNX::convert(InputModel::Ptr model) const
+{
+    auto model_onnx = std::dynamic_pointer_cast<InputModelONNX>(model);
+    NGRAPH_CHECK(model_onnx != nullptr, "Invalid input model");
+    return model_onnx->convert();
+}
+
+std::shared_ptr<ngraph::Function>
+    FrontEndONNX::convert(std::shared_ptr<ngraph::Function> partially_converted) const
+{
+    return onnx_import::convert_decoded_function(partially_converted);
+}
+
+std::shared_ptr<ngraph::Function> FrontEndONNX::decode(InputModel::Ptr model) const
+{
+    auto model_onnx = std::dynamic_pointer_cast<InputModelONNX>(model);
+    NGRAPH_CHECK(model_onnx != nullptr, "Invalid input model");
+    return model_onnx->decode();
+}
diff --git a/ngraph/frontend/onnx/frontend/src/input_model.cpp b/ngraph/frontend/onnx/frontend/src/input_model.cpp
new file mode 100644
index 00000000000000..58ebe098f84b39
--- /dev/null
+++ b/ngraph/frontend/onnx/frontend/src/input_model.cpp
@@ -0,0 +1,56 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <frontend_manager/frontend_exceptions.hpp>
+#include <input_model.hpp>
+#include <place.hpp>
+
+using namespace ngraph;
+using namespace ngraph::frontend;
+
+InputModelONNX::InputModelONNX(const std::string& path)
+    : m_editor(path)
+{
+}
+
+std::vector<Place::Ptr> InputModelONNX::get_inputs() const
+{
+    auto inputs = m_editor.model_inputs();
+    std::vector<Place::Ptr> ret;
+    ret.reserve(inputs.size());
+    for (const auto& input : inputs)
+    {
+        ret.push_back(std::make_shared<PlaceTensorONNX>(input, m_editor));
+    }
+    return ret;
+}
+
+Place::Ptr InputModelONNX::get_place_by_tensor_name(const std::string& tensor_name) const
+{
+    return std::make_shared<PlaceTensorONNX>(tensor_name, m_editor);
+}
+
+void InputModelONNX::set_partial_shape(Place::Ptr place, const ngraph::PartialShape& shape)
+{
+    std::map<std::string, ngraph::PartialShape> m;
+    m[place->get_names()[0]] = shape;
+    m_editor.set_input_shapes(m);
+}
+
+void InputModelONNX::set_element_type(Place::Ptr place, const ngraph::element::Type& type)
+{
+    std::map<std::string, ngraph::element::Type_t> m;
+    m[place->get_names()[0]] = type;
+    m_editor.set_input_types(m);
+}
+
+std::shared_ptr<Function> InputModelONNX::decode()
+{
+    return m_editor.decode();
+}
+
+std::shared_ptr<Function> InputModelONNX::convert()
+{
+    return m_editor.get_function();
+}
diff --git a/ngraph/frontend/onnx/frontend/src/input_model.hpp b/ngraph/frontend/onnx/frontend/src/input_model.hpp
new file mode 100644
index 00000000000000..e1003e3c1bbee5
--- /dev/null
+++ b/ngraph/frontend/onnx/frontend/src/input_model.hpp
@@ -0,0 +1,33 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <frontend_manager/input_model.hpp>
+#include <onnx_editor/editor.hpp>
+
+namespace ngraph
+{
+    namespace frontend
+    {
+        class InputModelONNX : public InputModel
+        {
+        public:
+            InputModelONNX(const std::string& path);
+
+            std::vector<Place::Ptr> get_inputs() const override;
+            Place::Ptr get_place_by_tensor_name(const std::string& tensor_name) const override;
+            void set_partial_shape(Place::Ptr place, const ngraph::PartialShape& shape) override;
+            void set_element_type(Place::Ptr place, const ngraph::element::Type& type) override;
+
+            std::shared_ptr<Function> decode();
+            std::shared_ptr<Function> convert();
+
+        private:
+            onnx_editor::ONNXModelEditor m_editor;
+        };
+
+    } // namespace frontend
+
+} // namespace ngraph
diff --git a/ngraph/frontend/onnx/frontend/src/place.hpp b/ngraph/frontend/onnx/frontend/src/place.hpp
new file mode 100644
index 00000000000000..28bbc558741d38
--- /dev/null
+++ b/ngraph/frontend/onnx/frontend/src/place.hpp
@@ -0,0 +1,78 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <frontend_manager/place.hpp>
+
+namespace ngraph
+{
+    namespace frontend
+    {
+        class PlaceInputEdgeONNX : public Place
+        {
+        public:
+            PlaceInputEdgeONNX(const onnx_editor::InputEdge& edge)
+                : m_edge(edge)
+            {
+            }
+
+        private:
+            onnx_editor::InputEdge m_edge;
+        };
+
+        class PlaceOutputEdgeONNX : public Place
+        {
+        public:
+            PlaceOutputEdgeONNX(const onnx_editor::OutputEdge& edge)
+                : m_edge(edge)
+            {
+            }
+
+        private:
+            onnx_editor::OutputEdge m_edge;
+        };
+
+        class PlaceTensorONNX : public Place
+        {
+        public:
+            PlaceTensorONNX(const std::string& name, const onnx_editor::ONNXModelEditor& editor)
+                : m_name(name)
+                , m_editor(editor)
+            {
+            }
+
+            std::vector<std::string> get_names() const override { return {m_name}; }
+
+            Place::Ptr get_producing_port() const override
+            {
+                return std::make_shared<PlaceOutputEdgeONNX>(m_editor.find_output_edge(m_name));
+            }
+
+            std::vector<Place::Ptr> get_consuming_ports() const override
+            {
+                std::vector<Place::Ptr> ret;
+                auto edges = m_editor.find_output_consumers(m_name);
+                std::transform(edges.begin(),
+                               edges.end(),
+                               std::back_inserter(ret),
+                               [](const onnx_editor::InputEdge& edge) {
+                                   return std::make_shared<PlaceInputEdgeONNX>(edge);
+                               });
+                return ret;
+            }
+
+            Ptr get_input_port(int input_port_index) const override
+            {
+                return std::make_shared<PlaceInputEdgeONNX>(m_editor.find_input_edge(
+                    onnx_editor::EditorNode(m_name), onnx_editor::EditorInput(input_port_index)));
+            }
+
+        private:
+            std::string m_name;
+            const onnx_editor::ONNXModelEditor& m_editor;
+        };
+    } // namespace frontend
+
+} // namespace ngraph
diff --git a/ngraph/frontend/onnx/onnx_import/include/onnx_editor/editor.hpp b/ngraph/frontend/onnx/onnx_import/include/onnx_editor/editor.hpp
index 4f31ab2d323c35..67052da996929f 100644
--- a/ngraph/frontend/onnx/onnx_import/include/onnx_editor/editor.hpp
+++ b/ngraph/frontend/onnx/onnx_import/include/onnx_editor/editor.hpp
@@ -161,6 +161,11 @@ namespace ngraph
             ///
             bool is_correct_and_unambiguous_node(const EditorNode& node) const;
 
+            /// \brief Returns a nGraph function based on edited model
+            ///        decoded to framework nodes
+            ///
+            std::shared_ptr<Function> decode();
+
         private:
             void update_mapper_if_needed() const;
 
diff --git a/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/model.hpp b/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/model.hpp
new file mode 100644
index 00000000000000..82a6e0c4f10f8f
--- /dev/null
+++ b/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/model.hpp
@@ -0,0 +1,85 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <onnx/onnx_pb.h>
+#include <ostream>
+#include <string>
+#include <unordered_map>
+
+#include "onnx_import/core/operator_set.hpp"
+
+namespace ngraph
+{
+    namespace onnx_import
+    {
+        /// \brief      Type of container which stores opset version and domain in ONNX format
+        using OpsetImports =
+            ::google::protobuf::RepeatedPtrField<ONNX_NAMESPACE::OperatorSetIdProto>;
+
+        std::string get_node_domain(const ONNX_NAMESPACE::NodeProto& node_proto);
+
+        std::int64_t get_opset_version(const ONNX_NAMESPACE::ModelProto& model_proto,
+                                       const std::string& domain);
+
+        class Model
+        {
+        public:
+            Model() = delete;
+            explicit Model(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto);
+
+            Model(const Model&) = delete;
+            Model(Model&&) = delete;
+
+            Model& operator=(const Model&) = delete;
+            Model& operator=(Model&&) = delete;
+
+            const std::string& get_producer_name() const { return m_model_proto->producer_name(); }
+            const ONNX_NAMESPACE::GraphProto& get_graph() const { return m_model_proto->graph(); }
+            std::int64_t get_model_version() const { return m_model_proto->model_version(); }
+            const OpsetImports& get_opset_imports() const;
+            const std::string& get_producer_version() const
+            {
+                return m_model_proto->producer_version();
+            }
+
+            /// \brief Access an operator object by its type name and domain name
+            /// The function will return the operator object if it exists, or report an error
+            /// in case of domain or operator absence.
+            /// \param name       type name of the operator object,
+            /// \param domain     domain name of the operator object.
+            /// \return Reference to the operator object.
+            /// \throw error::UnknownDomain    there is no operator set defined for the given
+            ///                                domain,
+            /// \throw error::UnknownOperator  the given operator type name does not exist in
+            ///                                operator set.
+            const Operator& get_operator(const std::string& name, const std::string& domain) const;
+
+            /// \brief Check availability of operator base on NodeProto.
+            /// \return `true` if the operator is available, otherwise it returns `false`.
+            bool is_operator_available(const ONNX_NAMESPACE::NodeProto& node_proto) const;
+
+            /// \brief      Enable operators from provided domain to use by this model.
+            ///
+            /// \note       This function makes visible all currently registered in provided domain
+            ///             operators for use in this model.
+            ///
+            /// \param[in]  domain  The domain name.
+            ///
+            void enable_opset_domain(const std::string& domain);
+
+        private:
+            const std::shared_ptr<ONNX_NAMESPACE::ModelProto> m_model_proto;
+            std::unordered_map<std::string, OperatorSet> m_opset;
+        };
+
+        inline std::ostream& operator<<(std::ostream& outs, const Model& model)
+        {
+            return (outs << "<Model: " << model.get_producer_name() << ">");
+        }
+
+    } // namespace onnx_import
+
+} // namespace ngraph
diff --git a/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/node.hpp b/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/node.hpp
index 097c100e28f8de..1fefd73bada578 100644
--- a/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/node.hpp
+++ b/ngraph/frontend/onnx/onnx_import/include/onnx_import/core/node.hpp
@@ -58,7 +58,6 @@ namespace ngraph
             Node& operator=(const Node&) = delete;
 
             OutputVector get_ng_inputs() const;
-            OutputVector get_ng_nodes() const;
             const std::string& domain() const;
             const std::string& op_type() const;
             const std::string& get_name() const;
diff --git a/ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx.hpp b/ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx.hpp
index 04e6be0cdd527a..39b923328c123f 100644
--- a/ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx.hpp
+++ b/ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx.hpp
@@ -72,6 +72,14 @@ namespace ngraph
         /// \return    An nGraph function that represents a single output from the created graph.
         ONNX_IMPORTER_API
         std::shared_ptr<Function> import_onnx_model(const std::string& file_path);
+
+        /// \brief     Converts a nGraph function (onnx model decoded to function with
+        /// ONNXFrameworkNode(s))
+        ///            to a complete function with actual compute operations
+        ///
+        /// \return    A nGraph function.
+        ONNX_IMPORTER_API
+        std::shared_ptr<Function> convert_decoded_function(std::shared_ptr<Function> function);
     } // namespace onnx_import
 
 } // namespace ngraph
diff --git a/ngraph/frontend/onnx/onnx_import/include/onnx_import/utils/onnx_internal.hpp b/ngraph/frontend/onnx/onnx_import/include/onnx_import/utils/onnx_internal.hpp
index 92df626cd24e6b..006fcc561e6c36 100644
--- a/ngraph/frontend/onnx/onnx_import/include/onnx_import/utils/onnx_internal.hpp
+++ b/ngraph/frontend/onnx/onnx_import/include/onnx_import/utils/onnx_internal.hpp
@@ -36,8 +36,24 @@ namespace ngraph
             ///
             /// \return     An nGraph function that represents a single output from the created
             /// graph.
-            std::shared_ptr<Function> import_onnx_model(ONNX_NAMESPACE::ModelProto& model_proto,
-                                                        const std::string& model_path);
+            std::shared_ptr<Function>
+                import_onnx_model(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto,
+                                  const std::string& model_path);
+
+            /// \brief      Decode ONNX model to nGraph function with ONNXFrameworkNode(s)
+            ///
+            /// \param[in]  model_proto Reference to a GraphProto object.
+            /// \param[in]  model_path  The path to the imported onnx model.
+            ///                         It is required if the imported model uses data saved in
+            ///                         external files.
+            ///
+            /// \return     A nGraph function with ONNXFrameworkNodes
+            ONNX_IMPORTER_API
+            std::shared_ptr<Function>
+                decode_to_framework_nodes(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto,
+                                          const std::string& model_path);
+
+            std::shared_ptr<Function> convert_decoded_function(std::shared_ptr<Function> function);
         } // namespace detail
     }     // namespace onnx_import
 } // namespace ngraph
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/attribute.cpp b/ngraph/frontend/onnx/onnx_import/src/core/attribute.cpp
index 1fd61931de9629..204959b2fac9b1 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/attribute.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/attribute.cpp
@@ -4,8 +4,8 @@
 
 #include "core/attribute.hpp"
 #include "core/graph.hpp"
-#include "core/model.hpp"
 #include "ngraph/log.hpp"
+#include "onnx_import/core/model.hpp"
 
 namespace ngraph
 {
@@ -18,15 +18,14 @@ namespace ngraph
                 throw error::attribute::InvalidData{m_attribute_proto->type()};
             }
 
-            auto model_proto = common::make_unique<ONNX_NAMESPACE::ModelProto>();
+            auto model_proto = std::make_shared<ONNX_NAMESPACE::ModelProto>();
 
             const auto& graph = m_attribute_proto->g();
             model_proto->mutable_graph()->CopyFrom(graph);
 
             // set opset version and domain from the parent graph
             model_proto->mutable_opset_import()->CopyFrom(parent_graph.get_opset_imports());
-            auto model = common::make_unique<Model>(std::move(model_proto));
-            return Subgraph{std::move(model), parent_graph};
+            return Subgraph{model_proto, parent_graph};
         }
 
     } // namespace onnx_import
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp b/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp
index 569d3849774859..1b1bdcaf8e6953 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp
@@ -9,12 +9,14 @@
 
 #include "core/graph.hpp"
 #include "core/null_node.hpp"
+#include "core/value_info.hpp"
+#include "default_opset.hpp"
 #include "exceptions.hpp"
 #include "ngraph/log.hpp"
 #include "ngraph/node.hpp"
 #include "ngraph/provenance.hpp"
+#include "onnx_framework_node.hpp"
 #include "onnx_import/core/node.hpp"
-#include "onnx_import/onnx_framework_node.hpp"
 #include "utils/common.hpp"
 #include "utils/provenance_tag.hpp"
 
@@ -51,15 +53,62 @@ namespace ngraph
                 std::string domain = get_node_domain(node_proto);
                 return (domain.empty() ? "" : domain + ".") + node_proto.op_type();
             }
+
+            void add_provenance_tag_to_initializer(const Tensor& tensor,
+                                                   std::shared_ptr<default_opset::Constant> node)
+            {
+                if (!ngraph::get_provenance_enabled())
+                {
+                    return;
+                }
+
+                const std::string tag =
+                    detail::build_input_provenance_tag(tensor.get_name(), tensor.get_shape());
+
+                node->add_provenance_tag(tag);
+            }
+
+            void add_provenance_tag_to_input(const ValueInfo& input,
+                                             std::shared_ptr<ngraph::Node> node)
+            {
+                if (!ngraph::get_provenance_enabled())
+                {
+                    return;
+                }
+
+                const std::string tag =
+                    detail::build_input_provenance_tag(input.get_name(), input.get_shape());
+
+                node->add_provenance_tag(tag);
+            }
+
+            void add_provenance_tags(const Node& onnx_node, const OutputVector& ng_node_vector)
+            {
+                if (!ngraph::get_provenance_enabled())
+                {
+                    return;
+                }
+
+                const auto tag = detail::build_op_provenance_tag(onnx_node);
+                const auto ng_inputs = onnx_node.get_ng_inputs();
+
+                ngraph::traverse_nodes(
+                    as_node_vector(ng_node_vector),
+                    [&tag](std::shared_ptr<ngraph::Node> ng_node) {
+                        ng_node->add_provenance_tag(tag);
+                    },
+                    as_node_vector(ng_inputs));
+            }
         } // namespace detail
 
-        Graph::Graph(std::unique_ptr<Model>&& model)
-            : Graph(std::move(model), common::make_unique<GraphCache>())
+        Graph::Graph(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto)
+            : Graph(model_proto, common::make_unique<GraphCache>())
         {
         }
 
-        Graph::Graph(std::unique_ptr<Model>&& model, std::unique_ptr<GraphCache>&& cache)
-            : m_model{std::move(model)}
+        Graph::Graph(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto,
+                     std::unique_ptr<GraphCache>&& cache)
+            : m_model{common::make_unique<Model>(model_proto)}
             , m_cache{std::move(cache)}
         {
             std::map<std::string, Tensor> initializers;
@@ -96,7 +145,7 @@ namespace ngraph
                     }
 
                     initializers.emplace(initializer_tensor.name(), tensor);
-                    add_provenance_tag_to_initializer(tensor, ng_constant);
+                    detail::add_provenance_tag_to_initializer(tensor, ng_constant);
                     m_cache->emplace_node(initializer_tensor.name(), std::move(ng_constant));
                 }
             }
@@ -104,26 +153,18 @@ namespace ngraph
             // Process all ONNX graph inputs, convert them to nGraph nodes and store in cache
             for (const auto& input : m_model->get_graph().input())
             {
-                m_inputs.emplace_back(input);
-
                 // Check if a Constant node was already created from an initializer
                 if (m_cache->contains(input.name()))
                 {
                     continue;
                 }
 
-                const auto value_info = m_inputs.back();
+                ValueInfo value_info{input};
                 auto ng_node = value_info.get_ng_node(m_parameters, initializers);
-                add_provenance_tag_to_input(value_info, ng_node);
+                detail::add_provenance_tag_to_input(value_info, ng_node);
                 m_cache->emplace_node(input.name(), std::move(ng_node));
             }
 
-            // Process all graph outputs
-            for (const auto& output : m_model->get_graph().output())
-            {
-                m_outputs.emplace_back(output);
-            }
-
             // Verify that ONNX graph contains only nodes of available operator types
             std::map<std::string, std::reference_wrapper<const ONNX_NAMESPACE::NodeProto>>
                 unknown_operators;
@@ -163,19 +204,13 @@ namespace ngraph
             // Process ONNX graph nodes, convert to nGraph nodes
             for (const auto& node_proto : m_model->get_graph().node())
             {
-                m_nodes.emplace_back(node_proto, *this);
-                const Node& node{m_nodes.back()};
+                const Node node{node_proto, *this};
                 if (node.has_subgraph())
                 {
                     auto subgraph = node.get_subgraph();
                     auto body_func = subgraph->convert();
                 }
-                OutputVector ng_nodes{node.get_ng_nodes()};
-                set_friendly_names(node, ng_nodes);
-                for (std::size_t i{0}; i < node.get_outputs_size(); ++i)
-                {
-                    m_cache->emplace_node(node.output(i), std::move(ng_nodes.at(i)));
-                }
+                OutputVector ng_nodes{make_ng_nodes(node)};
             }
         }
 
@@ -186,11 +221,14 @@ namespace ngraph
                 if ((*param_it)->get_output_target_inputs(0).size() == 0)
                 {
                     const auto& name = (*param_it)->get_friendly_name();
-                    auto out_it = std::find_if(
-                        m_outputs.begin(), m_outputs.end(), [&name](const ValueInfo& info) {
-                            return info.get_name() == name;
-                        });
-                    if (out_it == m_outputs.end())
+                    const auto& onnx_outputs = m_model->get_graph().output();
+                    auto out_it =
+                        std::find_if(onnx_outputs.begin(),
+                                     onnx_outputs.end(),
+                                     [&name](const ONNX_NAMESPACE::ValueInfoProto& output) -> bool {
+                                         return output.name() == name;
+                                     });
+                    if (out_it == onnx_outputs.end())
                     {
                         m_cache->remove_node(name);
                         param_it = m_parameters.erase(param_it);
@@ -213,8 +251,7 @@ namespace ngraph
             // Process ONNX graph nodes, convert to nGraph nodes
             for (const auto& node_proto : m_model->get_graph().node())
             {
-                m_nodes.emplace_back(node_proto, *this);
-                const Node& node{m_nodes.back()};
+                const Node node{node_proto, *this};
                 std::shared_ptr<frontend::ONNXFrameworkNode> framework_node;
                 if (node.has_subgraph())
                 {
@@ -223,12 +260,13 @@ namespace ngraph
                     auto inputs = node.get_ng_inputs();
                     for (const auto& input : subgraph->get_inputs_from_parent())
                         inputs.push_back(input);
-                    framework_node =
-                        std::make_shared<ngraph::frontend::ONNXSubgraphFrameworkNode>(node, inputs);
+                    framework_node = std::make_shared<ngraph::frontend::ONNXSubgraphFrameworkNode>(
+                        shared_from_this(), node, inputs);
                 }
                 else
                 {
-                    framework_node = std::make_shared<ngraph::frontend::ONNXFrameworkNode>(node);
+                    framework_node = std::make_shared<ngraph::frontend::ONNXFrameworkNode>(
+                        shared_from_this(), node);
                 }
                 OutputVector ng_nodes{framework_node->outputs()};
                 set_friendly_names(node, ng_nodes);
@@ -245,9 +283,10 @@ namespace ngraph
         std::shared_ptr<Function> Graph::create_function()
         {
             auto function = std::make_shared<Function>(get_ng_outputs(), m_parameters, get_name());
+            const auto& onnx_outputs = m_model->get_graph().output();
             for (std::size_t i{0}; i < function->get_output_size(); ++i)
             {
-                function->get_output_op(i)->set_friendly_name(m_outputs.at(i).get_name());
+                function->get_output_op(i)->set_friendly_name(onnx_outputs.Get(i).name());
             }
             return function;
         }
@@ -307,7 +346,7 @@ namespace ngraph
                 std::rethrow_exception(std::current_exception());
             }
             set_friendly_names(onnx_node, ng_node_vector);
-            add_provenance_tags(onnx_node, ng_node_vector);
+            detail::add_provenance_tags(onnx_node, ng_node_vector);
 
             for (std::size_t i{0}; i < onnx_node.get_outputs_size(); ++i)
             {
@@ -340,58 +379,14 @@ namespace ngraph
             }
         }
 
-        void Graph::add_provenance_tag_to_initializer(
-            const Tensor& tensor, std::shared_ptr<default_opset::Constant> node) const
-        {
-            if (!ngraph::get_provenance_enabled())
-            {
-                return;
-            }
-
-            const std::string tag =
-                detail::build_input_provenance_tag(tensor.get_name(), tensor.get_shape());
-
-            node->add_provenance_tag(tag);
-        }
-
-        void Graph::add_provenance_tag_to_input(const ValueInfo& input,
-                                                std::shared_ptr<ngraph::Node> node) const
-        {
-            if (!ngraph::get_provenance_enabled())
-            {
-                return;
-            }
-
-            const std::string tag =
-                detail::build_input_provenance_tag(input.get_name(), input.get_shape());
-
-            node->add_provenance_tag(tag);
-        }
-
-        void Graph::add_provenance_tags(const Node& onnx_node,
-                                        const OutputVector& ng_node_vector) const
-        {
-            if (!ngraph::get_provenance_enabled())
-            {
-                return;
-            }
-
-            const auto tag = detail::build_op_provenance_tag(onnx_node);
-            const auto ng_inputs = onnx_node.get_ng_inputs();
-
-            ngraph::traverse_nodes(
-                as_node_vector(ng_node_vector),
-                [&tag](std::shared_ptr<ngraph::Node> ng_node) { ng_node->add_provenance_tag(tag); },
-                as_node_vector(ng_inputs));
-        }
-
         const OpsetImports& Graph::get_opset_imports() const
         {
             return m_model->get_opset_imports();
         }
 
-        Subgraph::Subgraph(std::unique_ptr<Model>&& model, const Graph& parent_graph)
-            : Graph(std::move(model), common::make_unique<GraphCache>())
+        Subgraph::Subgraph(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto,
+                           const Graph& parent_graph)
+            : Graph(model_proto, common::make_unique<GraphCache>())
             , m_parent_graph_cache(&parent_graph.get_graph_cache())
         {
         }
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/graph.hpp b/ngraph/frontend/onnx/onnx_import/src/core/graph.hpp
index 33c2be5d4d20e8..fea67c3e146dc0 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/graph.hpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/graph.hpp
@@ -10,20 +10,18 @@
 #include <vector>
 
 #include "core/graph_cache.hpp"
-#include "core/model.hpp"
-#include "core/value_info.hpp"
-#include "default_opset.hpp"
 #include "ngraph/op/parameter.hpp"
+#include "onnx_import/core/model.hpp"
 #include "onnx_import/core/operator_set.hpp"
 
 namespace ngraph
 {
     namespace onnx_import
     {
-        class Graph
+        class Graph : public std::enable_shared_from_this<Graph>
         {
         public:
-            Graph(std::unique_ptr<Model>&& model);
+            Graph(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto);
             Graph() = delete;
 
             Graph(const Graph&) = delete;
@@ -31,35 +29,24 @@ namespace ngraph
 
             Graph& operator=(const Graph&) = delete;
             Graph& operator=(Graph&&) = default;
-            virtual std::shared_ptr<Function> convert();
             std::shared_ptr<Function> decode();
-            const std::vector<Node>& get_nodes() const { return m_nodes; }
-            const std::vector<ValueInfo>& get_inputs() const { return m_inputs; }
-            const std::vector<ValueInfo>& get_outputs() const { return m_outputs; }
+            virtual std::shared_ptr<Function> convert();
             OutputVector get_ng_outputs() const;
+            const std::string& get_name() const { return m_model->get_graph().name(); }
+            const GraphCache& get_graph_cache() const;
             const ParameterVector& get_ng_parameters() const { return m_parameters; }
             virtual Output<ngraph::Node> get_ng_node_from_cache(const std::string& name) const;
-            const std::string& get_name() const { return m_model->get_graph().name(); }
             OutputVector make_ng_nodes(const Node& onnx_node) const;
-            const GraphCache& get_graph_cache() const;
             const OpsetImports& get_opset_imports() const;
             virtual ~Graph() = default;
 
         protected:
-            Graph(std::unique_ptr<Model>&& model, std::unique_ptr<GraphCache>&& cache);
+            Graph(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model,
+                  std::unique_ptr<GraphCache>&& cache);
 
             void set_friendly_names(const Node& onnx_node,
                                     const OutputVector& ng_node_vector) const;
 
-            void add_provenance_tag_to_initializer(
-                const Tensor& initializer, std::shared_ptr<default_opset::Constant> node) const;
-
-            void add_provenance_tag_to_input(const ValueInfo& input,
-                                             std::shared_ptr<ngraph::Node> node) const;
-
-            void add_provenance_tags(const Node& onnx_node,
-                                     const OutputVector& ng_node_vector) const;
-
         protected:
             virtual void decode_to_framework_nodes();
             void convert_to_ngraph_nodes();
@@ -72,8 +59,6 @@ namespace ngraph
 
         private:
             std::vector<Node> m_nodes;
-            std::vector<ValueInfo> m_inputs;
-            std::vector<ValueInfo> m_outputs;
         };
 
         /// \brief      Representation of ONNX subgraph. It is used for example by ONNX Loop op.
@@ -86,7 +71,7 @@ namespace ngraph
             ///
             /// \param[in]  model          The ONNX model object.
             /// \param[in]  parent_graph   The reference to the parent graph.
-            Subgraph(std::unique_ptr<Model>&& model, const Graph& parent_graph);
+            Subgraph(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model, const Graph& parent_graph);
 
             /// \brief      Return nodes which are on the edge the subgraph and the parent graph.
             /// \return     Vector of edge nodes from parent scope.
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/model.cpp b/ngraph/frontend/onnx/onnx_import/src/core/model.cpp
index 2ddd3edac02e7a..c7c0993eda1ccd 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/model.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/model.cpp
@@ -4,9 +4,9 @@
 
 #include <onnx/onnx_pb.h>
 
-#include "core/model.hpp"
 #include "ngraph/log.hpp"
-#include "onnx_import/onnx_framework_node.hpp"
+#include "onnx_framework_node.hpp"
+#include "onnx_import/core/model.hpp"
 #include "ops_bridge.hpp"
 
 namespace ngraph
@@ -32,8 +32,8 @@ namespace ngraph
             throw ngraph_error("Couldn't find operator set's version for domain: " + domain + ".");
         }
 
-        Model::Model(std::unique_ptr<ONNX_NAMESPACE::ModelProto>&& model_proto)
-            : m_model_proto{std::move(model_proto)}
+        Model::Model(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto)
+            : m_model_proto{model_proto}
         {
             // Walk through the elements of opset_import field and register operator sets
             // for each domain. An exception UnknownDomain() will raise if the domain is
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/model.hpp b/ngraph/frontend/onnx/onnx_import/src/core/model.hpp
index 993dfb97e1a97a..82a6e0c4f10f8f 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/model.hpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/model.hpp
@@ -28,7 +28,7 @@ namespace ngraph
         {
         public:
             Model() = delete;
-            explicit Model(std::unique_ptr<ONNX_NAMESPACE::ModelProto>&& model_proto);
+            explicit Model(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto);
 
             Model(const Model&) = delete;
             Model(Model&&) = delete;
@@ -71,7 +71,7 @@ namespace ngraph
             void enable_opset_domain(const std::string& domain);
 
         private:
-            const std::unique_ptr<ONNX_NAMESPACE::ModelProto> m_model_proto;
+            const std::shared_ptr<ONNX_NAMESPACE::ModelProto> m_model_proto;
             std::unordered_map<std::string, OperatorSet> m_opset;
         };
 
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/node.cpp b/ngraph/frontend/onnx/onnx_import/src/core/node.cpp
index b6f2797263b384..fbdcd8d216407f 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/node.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/node.cpp
@@ -53,7 +53,6 @@ namespace ngraph
             }
 
             const std::vector<Attribute>& attributes() const;
-            OutputVector get_ng_nodes(const Node& node) const;
             OutputVector get_ng_inputs() const;
 
             const std::string& domain() const;
@@ -172,11 +171,6 @@ namespace ngraph
             return get_subgraph_from_attribute(name);
         }
 
-        OutputVector Node::Impl::get_ng_nodes(const Node& node) const
-        {
-            return m_graph->make_ng_nodes(node);
-        }
-
         OutputVector Node::Impl::get_ng_inputs() const
         {
             OutputVector result;
@@ -232,7 +226,6 @@ namespace ngraph
         }
 
         OutputVector Node::get_ng_inputs() const { return m_pimpl->get_ng_inputs(); }
-        OutputVector Node::get_ng_nodes() const { return m_pimpl->get_ng_nodes(*this); }
         const std::string& Node::domain() const { return m_pimpl->domain(); }
         const std::string& Node::op_type() const { return m_pimpl->op_type(); }
         const std::string& Node::get_description() const { return m_pimpl->description(); }
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/transform.cpp b/ngraph/frontend/onnx/onnx_import/src/core/transform.cpp
index 119a602ef30bd4..30ce7d78b83503 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/transform.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/transform.cpp
@@ -5,8 +5,8 @@
 #include <onnx/defs/function.h>
 #include <onnx/defs/schema.h>
 
-#include "core/model.hpp"
 #include "core/transform.hpp"
+#include "onnx_import/core/model.hpp"
 
 #include "ngraph/file_util.hpp"
 #include "ops_bridge.hpp"
diff --git a/ngraph/frontend/onnx/onnx_import/src/editor.cpp b/ngraph/frontend/onnx/onnx_import/src/editor.cpp
index c4568edbf9c5a8..ef33fad5fcda7a 100644
--- a/ngraph/frontend/onnx/onnx_import/src/editor.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/editor.cpp
@@ -187,19 +187,20 @@ namespace
 /// \brief A helper class used to hold the ModelProto object as its field
 struct onnx_editor::ONNXModelEditor::Impl
 {
-    ONNX_NAMESPACE::ModelProto m_model_proto;
+    std::shared_ptr<ONNX_NAMESPACE::ModelProto> m_model_proto;
     EdgeMapper m_edge_mapper;
     bool m_is_mapper_updated = false;
 
     Impl() = delete;
 
     Impl(const std::string& model_path)
-        : m_model_proto{onnx_common::parse_from_file(model_path)}
+        : m_model_proto{std::make_shared<ONNX_NAMESPACE::ModelProto>(
+              onnx_common::parse_from_file(model_path))}
     {
     }
 
-    void infer_shapes() { ONNX_NAMESPACE::shape_inference::InferShapes(m_model_proto); }
-    void remove_shape_inference_info() { m_model_proto.mutable_graph()->clear_value_info(); }
+    void infer_shapes() { ONNX_NAMESPACE::shape_inference::InferShapes(*m_model_proto.get()); }
+    void remove_shape_inference_info() { m_model_proto->mutable_graph()->clear_value_info(); }
 };
 
 onnx_editor::ONNXModelEditor::ONNXModelEditor(const std::string& model_path)
@@ -222,7 +223,7 @@ void onnx_editor::ONNXModelEditor::serialize(const std::string& out_file_path) c
         throw ngraph_error("Could not open the file: " + out_file_path);
     };
 
-    if (!m_pimpl->m_model_proto.SerializeToOstream(&out_file))
+    if (!m_pimpl->m_model_proto->SerializeToOstream(&out_file))
     {
         throw ngraph_error("Could not serialize the model to: " + out_file_path);
     }
@@ -235,7 +236,7 @@ void onnx_editor::ONNXModelEditor::serialize(const std::string& out_file_path) c
 void onnx_editor::ONNXModelEditor::set_input_types(
     const std::map<std::string, element::Type_t>& input_types)
 {
-    auto* onnx_graph = m_pimpl->m_model_proto.mutable_graph();
+    auto* onnx_graph = m_pimpl->m_model_proto->mutable_graph();
 
     for (const auto& input_desc : input_types)
     {
@@ -256,7 +257,7 @@ void onnx_editor::ONNXModelEditor::set_input_types(
 void onnx_editor::ONNXModelEditor::set_input_shapes(
     const std::map<std::string, ngraph::PartialShape>& input_shapes)
 {
-    auto* onnx_graph = m_pimpl->m_model_proto.mutable_graph();
+    auto* onnx_graph = m_pimpl->m_model_proto->mutable_graph();
 
     for (const auto& input_desc : input_shapes)
     {
@@ -283,7 +284,7 @@ void onnx_editor::ONNXModelEditor::cut_graph_fragment(const std::vector<InputEdg
 
     m_pimpl->infer_shapes();
 
-    SubgraphExtractor editor{*(m_pimpl->m_model_proto.mutable_graph())};
+    SubgraphExtractor editor{*(m_pimpl->m_model_proto->mutable_graph())};
     editor.add_new_inputs(inputs);
     editor.add_new_outputs(outputs);
     editor.extract_subgraph(outputs);
@@ -294,7 +295,7 @@ void onnx_editor::ONNXModelEditor::cut_graph_fragment(const std::vector<InputEdg
 
 std::vector<std::string> onnx_editor::ONNXModelEditor::model_inputs() const
 {
-    const auto& graph = m_pimpl->m_model_proto.graph();
+    const auto& graph = m_pimpl->m_model_proto->graph();
 
     std::vector<std::string> inputs_and_initializers;
     inputs_and_initializers.reserve(graph.input_size() + graph.initializer_size());
@@ -314,7 +315,7 @@ std::vector<std::string> onnx_editor::ONNXModelEditor::model_inputs() const
 
 std::string onnx_editor::ONNXModelEditor::model_string() const
 {
-    return m_pimpl->m_model_proto.SerializeAsString();
+    return m_pimpl->m_model_proto->SerializeAsString();
 }
 
 std::shared_ptr<Function> onnx_editor::ONNXModelEditor::get_function() const
@@ -325,7 +326,7 @@ std::shared_ptr<Function> onnx_editor::ONNXModelEditor::get_function() const
 void onnx_editor::ONNXModelEditor::set_input_values(
     const std::map<std::string, std::shared_ptr<ngraph::op::Constant>>& input_values)
 {
-    auto onnx_graph = m_pimpl->m_model_proto.mutable_graph();
+    auto onnx_graph = m_pimpl->m_model_proto->mutable_graph();
 
     for (const auto& input : input_values)
     {
@@ -354,7 +355,7 @@ void onnx_editor::ONNXModelEditor::update_mapper_if_needed() const
 {
     if (!m_pimpl->m_is_mapper_updated)
     {
-        m_pimpl->m_edge_mapper = EdgeMapper(m_pimpl->m_model_proto.graph());
+        m_pimpl->m_edge_mapper = EdgeMapper(m_pimpl->m_model_proto->graph());
     }
     m_pimpl->m_is_mapper_updated = true;
 }
@@ -391,3 +392,8 @@ bool onnx_editor::ONNXModelEditor::is_correct_and_unambiguous_node(const EditorN
     update_mapper_if_needed();
     return m_pimpl->m_edge_mapper.is_correct_and_unambiguous_node(node);
 }
+
+std::shared_ptr<Function> onnx_editor::ONNXModelEditor::decode()
+{
+    return onnx_import::detail::decode_to_framework_nodes(m_pimpl->m_model_proto, m_model_path);
+}
diff --git a/ngraph/frontend/onnx/onnx_import/src/onnx.cpp b/ngraph/frontend/onnx/onnx_import/src/onnx.cpp
index 09f6623611d4eb..39beac60108b06 100644
--- a/ngraph/frontend/onnx/onnx_import/src/onnx.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/onnx.cpp
@@ -19,8 +19,8 @@ namespace ngraph
         std::shared_ptr<Function> import_onnx_model(std::istream& stream,
                                                     const std::string& model_path)
         {
-            ONNX_NAMESPACE::ModelProto model_proto{onnx_common::parse_from_istream(stream)};
-
+            auto model_proto = std::make_shared<ONNX_NAMESPACE::ModelProto>(
+                onnx_common::parse_from_istream(stream));
             return detail::import_onnx_model(model_proto, model_path);
         }
 
@@ -58,6 +58,11 @@ namespace ngraph
                 op_name, version, domain == "ai.onnx" ? "" : domain);
         }
 
+        std::shared_ptr<Function> convert_decoded_function(std::shared_ptr<Function> function)
+        {
+            return detail::convert_decoded_function(function);
+        }
+
     } // namespace onnx_import
 
 } // namespace ngraph
diff --git a/ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.cpp b/ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.cpp
index bf52a1a2c0b8a0..c9432d84bfc82b 100644
--- a/ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.cpp
@@ -14,7 +14,7 @@
 // limitations under the License.
 //*****************************************************************************
 
-#include <onnx_import/onnx_framework_node.hpp>
+#include <onnx_framework_node.hpp>
 
 namespace ngraph
 {
@@ -25,7 +25,7 @@ namespace ngraph
         std::shared_ptr<Node>
             ONNXFrameworkNode::clone_with_new_inputs(const OutputVector& inputs) const
         {
-            return std::make_shared<ONNXFrameworkNode>(m_node, inputs);
+            return std::make_shared<ONNXFrameworkNode>(m_graph, m_node, inputs);
         }
 
         NGRAPH_RTTI_DEFINITION(ONNXSubgraphFrameworkNode, "ONNXSubgraphFrameworkNode", 1);
diff --git a/ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx_framework_node.hpp b/ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.hpp
similarity index 68%
rename from ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx_framework_node.hpp
rename to ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.hpp
index bfa902a5ac449c..7a5269e65986f2 100644
--- a/ngraph/frontend/onnx/onnx_import/include/onnx_import/onnx_framework_node.hpp
+++ b/ngraph/frontend/onnx/onnx_import/src/onnx_framework_node.hpp
@@ -17,6 +17,8 @@
 #pragma once
 
 #include <core/graph.hpp>
+#include <ngraph/function.hpp>
+#include <ngraph/graph_util.hpp>
 #include <ngraph/visibility.hpp>
 #include <ngraph_ops/framework_node.hpp>
 #include <onnx_import/core/node.hpp>
@@ -41,19 +43,32 @@ namespace ngraph
         public:
             NGRAPH_RTTI_DECLARATION;
 
-            ONNXFrameworkNode(const onnx_import::Node& node)
+            ONNXFrameworkNode(std::shared_ptr<onnx_import::Graph> graph,
+                              const onnx_import::Node& node)
                 : FrameworkNode(node.get_ng_inputs(), node.get_outputs_size())
                 , m_node(node)
+                , m_graph(graph)
             {
             }
 
-            ONNXFrameworkNode(const onnx_import::Node& node, const OutputVector& inputs)
+            ONNXFrameworkNode(std::shared_ptr<onnx_import::Graph> graph,
+                              const onnx_import::Node& node,
+                              const OutputVector& inputs)
                 : FrameworkNode(inputs, node.get_outputs_size())
                 , m_node(node)
+                , m_graph(graph)
             {
             }
 
-            const onnx_import::Node& get_onnx_node() const { return m_node; }
+            OutputVector get_ng_nodes() const
+            {
+                OutputVector ng_nodes{m_graph->make_ng_nodes(m_node)};
+                if (ng_nodes.size() > get_output_size())
+                {
+                    ng_nodes.resize(get_output_size());
+                }
+                return ng_nodes;
+            }
 
             virtual std::shared_ptr<Node>
                 clone_with_new_inputs(const OutputVector& inputs) const override;
@@ -68,8 +83,11 @@ namespace ngraph
                 return true;
             }
 
-        private:
+        protected:
             onnx_import::Node m_node;
+
+        private:
+            std::shared_ptr<onnx_import::Graph> m_graph;
         };
 
         class ONNXSubgraphFrameworkNode : public ONNXFrameworkNode
@@ -77,19 +95,18 @@ namespace ngraph
         public:
             NGRAPH_RTTI_DECLARATION;
 
-            ONNXSubgraphFrameworkNode(const onnx_import::Node& node, const OutputVector& inputs)
-                : ONNXFrameworkNode(node, inputs)
+            ONNXSubgraphFrameworkNode(std::shared_ptr<onnx_import::Graph> graph,
+                                      const onnx_import::Node& node,
+                                      const OutputVector& inputs)
+                : ONNXFrameworkNode(graph, node, inputs)
             {
             }
 
-            void infer_inputs_from_parent()
-            {
-                get_onnx_node().get_subgraph()->infer_inputs_from_parent();
-            }
+            void infer_inputs_from_parent() { m_node.get_subgraph()->infer_inputs_from_parent(); }
 
             std::shared_ptr<Function> get_subgraph_body() const
             {
-                auto subgraph = get_onnx_node().get_subgraph();
+                auto subgraph = m_node.get_subgraph();
                 return std::make_shared<Function>(subgraph->get_ng_outputs(),
                                                   subgraph->get_ng_parameters(),
                                                   subgraph->get_name());
diff --git a/ngraph/frontend/onnx/onnx_import/src/utils/onnx_internal.cpp b/ngraph/frontend/onnx/onnx_import/src/utils/onnx_internal.cpp
index 8e60171a198c91..689eef00cc3f35 100644
--- a/ngraph/frontend/onnx/onnx_import/src/utils/onnx_internal.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/utils/onnx_internal.cpp
@@ -5,10 +5,10 @@
 #include <onnx/onnx_pb.h>
 
 #include "core/graph.hpp"
-#include "core/model.hpp"
 #include "core/null_node.hpp"
 #include "core/transform.hpp"
-#include "onnx_import/onnx_framework_node.hpp"
+#include "onnx_framework_node.hpp"
+#include "onnx_import/core/model.hpp"
 #include "onnx_import/utils/onnx_internal.hpp"
 
 namespace ngraph
@@ -61,7 +61,7 @@ namespace ngraph
                 }
             }
 
-            void convert_decoded_function(std::shared_ptr<Function> function)
+            std::shared_ptr<Function> convert_decoded_function(std::shared_ptr<Function> function)
             {
                 for (const auto& node : function->get_ordered_ops())
                 {
@@ -75,12 +75,7 @@ namespace ngraph
                             subgraph_node->infer_inputs_from_parent();
                             convert_decoded_function(subgraph_node->get_subgraph_body());
                         }
-                        const auto& onnx_node = raw_node->get_onnx_node();
-                        OutputVector ng_nodes{onnx_node.get_ng_nodes()};
-                        if (ng_nodes.size() > raw_node->get_output_size())
-                        {
-                            ng_nodes.resize(raw_node->get_output_size());
-                        }
+                        auto ng_nodes = raw_node->get_ng_nodes();
                         replace_node(raw_node, ng_nodes);
                     }
                     else
@@ -90,22 +85,37 @@ namespace ngraph
                         node->revalidate_and_infer_types();
                     }
                 }
-                remove_dangling_parameters(function);
-                remove_dangling_results(function);
+                detail::remove_dangling_parameters(function);
+                detail::remove_dangling_results(function);
+
+                return function;
             }
 
-            std::shared_ptr<Function> import_onnx_model(ONNX_NAMESPACE::ModelProto& model_proto,
-                                                        const std::string& model_path)
+            void apply_transformations(ONNX_NAMESPACE::ModelProto& model_proto,
+                                       const std::string& model_path)
             {
                 transform::expand_onnx_functions(model_proto);
                 transform::fixup_legacy_operators(model_proto);
                 transform::update_external_data_paths(model_proto, model_path);
+            }
 
-                auto p_model_proto = common::make_unique<ONNX_NAMESPACE::ModelProto>(model_proto);
-                auto model = common::make_unique<Model>(std::move(p_model_proto));
-                Graph graph{std::move(model)};
+            std::shared_ptr<Function>
+                import_onnx_model(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto,
+                                  const std::string& model_path)
+            {
+                apply_transformations(*model_proto, model_path);
+                Graph graph{model_proto};
                 return graph.convert();
             }
+
+            std::shared_ptr<Function>
+                decode_to_framework_nodes(std::shared_ptr<ONNX_NAMESPACE::ModelProto> model_proto,
+                                          const std::string& model_path)
+            {
+                apply_transformations(*model_proto, model_path);
+                auto graph = std::make_shared<Graph>(model_proto);
+                return graph->decode();
+            }
         } // namespace detail
     }     // namespace onnx_import
 } // namespace ngraph
diff --git a/ngraph/python/tests/test_frontend/test_frontend_onnx.py b/ngraph/python/tests/test_frontend/test_frontend_onnx.py
new file mode 100644
index 00000000000000..1dbe6a34ae637c
--- /dev/null
+++ b/ngraph/python/tests/test_frontend/test_frontend_onnx.py
@@ -0,0 +1,97 @@
+# Copyright (C) 2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
+import os
+import onnx
+import numpy as np
+from onnx.helper import make_graph, make_model, make_tensor_value_info
+import pytest
+
+from ngraph.frontend import FrontEndManager
+from tests.runtime import get_runtime
+
+
+def create_onnx_model():
+    add = onnx.helper.make_node("Add", inputs=["x", "y"], outputs=["z"])
+    const_tensor = onnx.helper.make_tensor("const_tensor", onnx.TensorProto.FLOAT, (2, 2), [0.5, 1, 1.5, 2.0])
+    const_node = onnx.helper.make_node("Constant", [], outputs=["const_node"],
+                                       value=const_tensor, name="const_node")
+    mul = onnx.helper.make_node("Mul", inputs=["z", "const_node"], outputs=["out"])
+    input_tensors = [
+        make_tensor_value_info("x", onnx.TensorProto.FLOAT, (2, 2)),
+        make_tensor_value_info("y", onnx.TensorProto.FLOAT, (2, 2)),
+    ]
+    output_tensors = [make_tensor_value_info("out", onnx.TensorProto.FLOAT, (2, 2))]
+    graph = make_graph([add, const_node, mul], "graph", input_tensors, output_tensors)
+    return make_model(graph, producer_name="ngraph ONNX Importer")
+
+
+def run_function(function, *inputs, expected):
+    runtime = get_runtime()
+    computation = runtime.computation(function)
+    actual = computation(*inputs)
+    assert len(actual) == len(expected)
+    for i in range(len(actual)):
+        np.testing.assert_allclose(expected[i], actual[i], rtol=1e-3, atol=1e-6)
+
+
+fem = FrontEndManager()
+onnx_model_filename = "model.onnx"
+
+
+def setup_module():
+    onnx.save_model(create_onnx_model(), onnx_model_filename)
+
+
+def teardown_module():
+    os.remove(onnx_model_filename)
+
+
+def skip_if_onnx_frontend_is_disabled():
+    front_ends = fem.get_available_front_ends()
+    if "onnx" not in front_ends:
+        pytest.skip()
+
+
+def test_convert():
+    skip_if_onnx_frontend_is_disabled()
+
+    fe = fem.load_by_framework(framework="onnx")
+    assert fe
+
+    model = fe.load(onnx_model_filename)
+    assert model
+
+    function = fe.convert(model)
+    assert function
+
+    a = np.array([[1, 2], [3, 4]], dtype=np.float32)
+    b = np.array([[2, 3], [4, 5]], dtype=np.float32)
+    expected = np.array([[1.5, 5], [10.5, 18]], dtype=np.float32)
+    run_function(function, a, b, expected=[expected])
+
+
+def test_decode_and_convert():
+    skip_if_onnx_frontend_is_disabled()
+
+    fe = fem.load_by_framework(framework="onnx")
+    assert fe
+
+    model = fe.load(onnx_model_filename)
+    assert model
+
+    decoded_function = fe.decode(model)
+    assert decoded_function
+    for op in decoded_function.get_ordered_ops():
+        assert op.get_type_name() in ["Parameter", "Constant", "ONNXFrameworkNode",
+                                      "ONNXSubgraphFrameworkNode", "Result"]
+
+    function = fe.convert(decoded_function)
+    assert function
+    for op in function.get_ordered_ops():
+        assert op.get_type_name() not in ["ONNXFrameworkNode", "ONNXSubgraphFrameworkNode"]
+
+    a = np.array([[1, 2], [3, 4]], dtype=np.float32)
+    b = np.array([[2, 3], [4, 5]], dtype=np.float32)
+    expected = np.array([[1.5, 5], [10.5, 18]], dtype=np.float32)
+    run_function(function, a, b, expected=[expected])
diff --git a/ngraph/python/tests/test_ngraph/test_frontendmanager.py b/ngraph/python/tests/test_frontend/test_frontendmanager.py
similarity index 100%
rename from ngraph/python/tests/test_ngraph/test_frontendmanager.py
rename to ngraph/python/tests/test_frontend/test_frontendmanager.py

From 4e4442d99ec21a197bee9c3070b7da07e9f6c386 Mon Sep 17 00:00:00 2001
From: Mikhail Nosov <mikhail.nosov@intel.com>
Date: Thu, 22 Jul 2021 19:11:02 +0300
Subject: [PATCH 40/71] PDPD frontend - support of protobuf_lite (#6747)

---
 ngraph/frontend/paddlepaddle/src/proto/framework.proto | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/ngraph/frontend/paddlepaddle/src/proto/framework.proto b/ngraph/frontend/paddlepaddle/src/proto/framework.proto
index baaecb55d06ee3..8a8dbc0df52906 100644
--- a/ngraph/frontend/paddlepaddle/src/proto/framework.proto
+++ b/ngraph/frontend/paddlepaddle/src/proto/framework.proto
@@ -11,10 +11,13 @@ distributed under the License is distributed on an "AS IS" BASIS,
 WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 See the License for the specific language governing permissions and
 limitations under the License. */
+// Modification Copyright (C) 2021 Intel Corporation
 
 syntax = "proto2";
 package paddle.framework.proto;
 
+option optimize_for = LITE_RUNTIME; // Added by Intel Corporation 2021
+
 // Any incompatible changes to ProgramDesc and its dependencies should
 // raise the version defined version.h.
 //

From df264e682a516c27a100ecad786bfcc7859641ac Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Thu, 22 Jul 2021 19:13:43 +0300
Subject: [PATCH 41/71] Protobuf lite (#6758)

* Compilation with protobuf-lite for PDPD FE
---
 cmake/features.cmake                        | 4 ++--
 ngraph/frontend/paddlepaddle/CMakeLists.txt | 2 +-
 thirdparty/CMakeLists.txt                   | 8 +++++---
 thirdparty/protobuf/CMakeLists.txt          | 1 +
 4 files changed, 9 insertions(+), 6 deletions(-)

diff --git a/cmake/features.cmake b/cmake/features.cmake
index 29f7135546c858..b7e23ee9226747 100644
--- a/cmake/features.cmake
+++ b/cmake/features.cmake
@@ -38,8 +38,6 @@ ie_dependent_option (ENABLE_PYTHON "enables ie python bridge build" OFF "PYTHONL
 find_package(PythonInterp 3 QUIET)
 ie_dependent_option (ENABLE_DOCS "Build docs using Doxygen" OFF "PYTHONINTERP_FOUND" OFF)
 
-ie_option (ENABLE_SYSTEM_PUGIXML "use the system copy of pugixml" OFF)
-
 #
 # Inference Engine specific options
 #
@@ -129,6 +127,8 @@ ie_dependent_option(NGRAPH_ONNX_FRONTEND_ENABLE "Enable ONNX FrontEnd" OFF "NGRA
 ie_dependent_option(NGRAPH_PDPD_FRONTEND_ENABLE "Enable PaddlePaddle FrontEnd" ON "protoc_available" OFF)
 ie_dependent_option(NGRAPH_USE_PROTOBUF_LITE "Compiles and links with protobuf-lite" OFF
     "NGRAPH_ONNX_IMPORT_ENABLE OR NGRAPH_PDPD_FRONTEND_ENABLE" OFF)
+ie_dependent_option(NGRAPH_USE_SYSTEM_PROTOBUF "Use system protobuf" OFF
+    "NGRAPH_ONNX_IMPORT_ENABLE OR NGRAPH_PDPD_FRONTEND_ENABLE" OFF)
 ie_dependent_option(NGRAPH_UNIT_TEST_ENABLE "Enables ngraph unit tests" ON "ENABLE_TESTS;NOT ANDROID" OFF)
 ie_dependent_option(NGRAPH_UNIT_TEST_BACKENDS_ENABLE "Control the building of unit tests using backends" ON
     "NGRAPH_UNIT_TEST_ENABLE" OFF)
diff --git a/ngraph/frontend/paddlepaddle/CMakeLists.txt b/ngraph/frontend/paddlepaddle/CMakeLists.txt
index cc1a4eba9cea4e..198d0f2124351c 100644
--- a/ngraph/frontend/paddlepaddle/CMakeLists.txt
+++ b/ngraph/frontend/paddlepaddle/CMakeLists.txt
@@ -68,7 +68,7 @@ if(COMMAND ie_add_vs_version_file)
                            FILEDESCRIPTION "FrontEnd to load and convert PaddlePaddle file format")
 endif()
 
-link_system_libraries(${TARGET_NAME} PRIVATE ${Protobuf_LIBRARIES})
+link_system_libraries(${TARGET_NAME} PRIVATE ${Protobuf_LITE_LIBRARIES})
 
 target_link_libraries(${TARGET_NAME} PRIVATE ngraph::frontend_manager::static
                                      PRIVATE ngraph::builder)
diff --git a/thirdparty/CMakeLists.txt b/thirdparty/CMakeLists.txt
index a0a00af5321a1c..8991c636e37063 100644
--- a/thirdparty/CMakeLists.txt
+++ b/thirdparty/CMakeLists.txt
@@ -131,15 +131,16 @@ if(NGRAPH_PDPD_FRONTEND_ENABLE OR NGRAPH_ONNX_IMPORT_ENABLE)
             set(Protobuf_DEBUG ON)
         endif()
         find_package(Protobuf 3.9.0 REQUIRED)
+        set(Protobuf_LITE_LIBRARIES protobuf::libprotobuf-lite)
         if(NGRAPH_USE_PROTOBUF_LITE)
-            set(Protobuf_LIBRARIES protobuf::libprotobuf-lite)
+            set(Protobuf_LIBRARIES ${Protobuf_LITE_LIBRARIES})
         else()
             set(Protobuf_LIBRARIES protobuf::libprotobuf)
         endif()
         set(SYSTEM_PROTOC protobuf::protoc)
         set(PROTOC_EXECUTABLE ${SYSTEM_PROTOC})
 
-        foreach(target ${SYSTEM_PROTOC} ${Protobuf_LIBRARIES})
+        foreach(target ${SYSTEM_PROTOC} ${Protobuf_LIBRARIES} ${Protobuf_LITE_LIBRARIES})
             set_property(TARGET ${target} PROPERTY IMPORTED_GLOBAL TRUE)
         endforeach()
     else()
@@ -150,10 +151,11 @@ if(NGRAPH_PDPD_FRONTEND_ENABLE OR NGRAPH_ONNX_IMPORT_ENABLE)
     set(SYSTEM_PROTOC ${SYSTEM_PROTOC} PARENT_SCOPE)
     set(PROTOC_EXECUTABLE ${PROTOC_EXECUTABLE} PARENT_SCOPE)
     set(Protobuf_LIBRARIES ${Protobuf_LIBRARIES} PARENT_SCOPE)
+    set(Protobuf_LITE_LIBRARIES ${Protobuf_LITE_LIBRARIES} PARENT_SCOPE)
     set(Protobuf_INCLUDE_DIRS ${Protobuf_INCLUDE_DIRS} PARENT_SCOPE)
 
     # set public / interface compile options
-    foreach(target IN LISTS Protobuf_LIBRARIES)
+    foreach(target IN LISTS Protobuf_LITE_LIBRARIES Protobuf_LIBRARIES)
         set(link_type PUBLIC)
         if(NGRAPH_USE_SYSTEM_PROTOBUF)
             set(link_type INTERFACE)
diff --git a/thirdparty/protobuf/CMakeLists.txt b/thirdparty/protobuf/CMakeLists.txt
index da562377b284b4..5c5cb3c2fbec6b 100644
--- a/thirdparty/protobuf/CMakeLists.txt
+++ b/thirdparty/protobuf/CMakeLists.txt
@@ -106,5 +106,6 @@ else()
 endif()
 
 set(protobuf_VERSION ${protobuf_VERSION} PARENT_SCOPE)
+set(Protobuf_LITE_LIBRARIES libprotobuf-lite PARENT_SCOPE)
 set(Protobuf_LIBRARIES ${Protobuf_LIBRARIES} PARENT_SCOPE)
 set(Protobuf_INCLUDE_DIRS ${Protobuf_INCLUDE_DIRS} PARENT_SCOPE)

From 1ebdcb1d7187ad3e8f5099dce0bca5981338e967 Mon Sep 17 00:00:00 2001
From: Maxim Vafin <maxim.vafin@intel.com>
Date: Thu, 22 Jul 2021 19:21:32 +0300
Subject: [PATCH 42/71] Fix reading constants in paddlepaddle frontend (#6755)

---
 ngraph/frontend/paddlepaddle/src/model.cpp | 27 +++++++++++++++++-----
 1 file changed, 21 insertions(+), 6 deletions(-)

diff --git a/ngraph/frontend/paddlepaddle/src/model.cpp b/ngraph/frontend/paddlepaddle/src/model.cpp
index 3315dc7e3a9b96..c3076a78378e1e 100644
--- a/ngraph/frontend/paddlepaddle/src/model.cpp
+++ b/ngraph/frontend/paddlepaddle/src/model.cpp
@@ -150,7 +150,7 @@ namespace ngraph
 
         namespace pdpd
         {
-            void read_tensor(std::istream& is, char* data, size_t len)
+            bool read_tensor(std::istream& is, char* data, size_t len)
             {
                 std::vector<char> header(16);
                 is.read(&header[0], 16);
@@ -159,6 +159,9 @@ namespace ngraph
                 std::vector<char> dims_struct(dims_len);
                 is.read(&dims_struct[0], dims_len);
                 is.read(data, len);
+                if (is.gcount() != len)
+                    return false;
+                return true;
             }
 
             template <typename T>
@@ -248,9 +251,10 @@ namespace ngraph
                 const auto& data_length = shape_size(shape) * type.size();
                 std::vector<uint8_t> tensor_data(data_length);
 
+                bool read_succeed = false;
                 if (weight_stream)
                 {
-                    pdpd::read_tensor(
+                    read_succeed = pdpd::read_tensor(
                         *weight_stream, reinterpret_cast<char*>(&tensor_data[0]), data_length);
                 }
                 else if (!folder_with_weights.empty())
@@ -259,13 +263,18 @@ namespace ngraph
                                      std::ios::in | std::ifstream::binary);
                     FRONT_END_GENERAL_CHECK(is && is.is_open(),
                                             "Cannot open file for constant value.");
-                    pdpd::read_tensor(is, reinterpret_cast<char*>(&tensor_data[0]), data_length);
+                    read_succeed = pdpd::read_tensor(
+                        is, reinterpret_cast<char*>(&tensor_data[0]), data_length);
                 }
                 else
                 {
                     FRONT_END_GENERAL_CHECK(
                         false, "Either folder with weights or stream must be provided.");
                 }
+                FRONT_END_GENERAL_CHECK(read_succeed,
+                                        "File containing constant with name ",
+                                        name,
+                                        " wasn't successfully read.");
 
                 auto const_node = opset7::Constant::create(type, shape, &tensor_data[0]);
                 const_node->set_friendly_name(name);
@@ -289,8 +298,14 @@ namespace ngraph
                                     "Model can't be parsed");
 
             loadPlaces();
-            loadConsts(weights_stream && weights_stream.is_open() ? std::basic_string<T>{} : path,
-                       &weights_stream);
+            if (weights_stream && weights_stream.is_open())
+            {
+                loadConsts(std::basic_string<T>{}, &weights_stream);
+            }
+            else
+            {
+                loadConsts(path, nullptr);
+            }
         }
 
         InputModelPDPD::InputModelPDPDImpl::InputModelPDPDImpl(
@@ -309,7 +324,7 @@ namespace ngraph
 
             loadPlaces();
             if (streams.size() > 1)
-                loadConsts(std::string{""}, streams[1]);
+                loadConsts(std::string(), streams[1]);
         }
 
         std::vector<Place::Ptr> InputModelPDPD::InputModelPDPDImpl::getInputs() const

From 8ba64b14c57b3eea61f9f51dd23a3d35121c98b9 Mon Sep 17 00:00:00 2001
From: Daria Mityagina <daria.mityagina@intel.com>
Date: Thu, 22 Jul 2021 19:56:55 +0300
Subject: [PATCH 43/71] [VPU]  Added support for 2 axis for MVN layer -
 duplicate (#6748)

* [VPU]Added support for 2 axis for MVN layer

Co-authored-by: Polina <polina.brzezinskaya@intel.com>
---
 inference-engine/cmake/vpu_dependencies.cmake            | 6 +++---
 .../src/vpu/graph_transformer/src/stages/mvn.cpp         | 9 +++++++--
 .../shared_tests_instances/single_layer_tests/mvn.cpp    | 2 ++
 3 files changed, 12 insertions(+), 5 deletions(-)

diff --git a/inference-engine/cmake/vpu_dependencies.cmake b/inference-engine/cmake/vpu_dependencies.cmake
index 3ecf93e0fb98cc..e6ec3799a3ccf8 100644
--- a/inference-engine/cmake/vpu_dependencies.cmake
+++ b/inference-engine/cmake/vpu_dependencies.cmake
@@ -6,14 +6,14 @@ include_guard(GLOBAL)
 
 set(VPU_SUPPORTED_FIRMWARES usb-ma2x8x pcie-ma2x8x)
 set(VPU_SUPPORTED_FIRMWARES_HASH
-    "d55a824838accec31733e4d4c45e8774bdd5690da8beefe41360f1983476e3d0"
-    "61797a77b38fc677be4cc63d730e8871bbf169686b88eabb7066b01f9d156129")
+    "54a732b5fb17a0124652bc5113fa628c718a5af40621bca309471cb5ffd9271b"
+    "5750b2831c77ef54b8e243d3840c5ed1c9509681d55aee7e369d558cef628735")
 
 #
 # Default packages
 #
 
-set(FIRMWARE_PACKAGE_VERSION 1714)
+set(FIRMWARE_PACKAGE_VERSION 1717)
 set(VPU_CLC_MA2X8X_VERSION "movi-cltools-20.09.2")
 
 #
diff --git a/inference-engine/src/vpu/graph_transformer/src/stages/mvn.cpp b/inference-engine/src/vpu/graph_transformer/src/stages/mvn.cpp
index ecd1ad965f68fc..2a757ab26e144e 100644
--- a/inference-engine/src/vpu/graph_transformer/src/stages/mvn.cpp
+++ b/inference-engine/src/vpu/graph_transformer/src/stages/mvn.cpp
@@ -48,10 +48,12 @@ class MVNStage final : public StageNode {
     void serializeParamsImpl(BlobSerializer& serializer) const override {
         auto normalize = attrs().get<int>("normalize");
         auto across_channels = attrs().get<int>("across_channels");
+        auto across_width = attrs().get<int>("across_width");
         auto eps = attrs().get<float>("eps");
 
         serializer.append(static_cast<int32_t>(normalize));
         serializer.append(static_cast<int32_t>(across_channels));
+        serializer.append(static_cast<int32_t>(across_width));
         serializer.append(static_cast<float>(eps));
     }
 
@@ -88,11 +90,13 @@ void FrontEnd::parseMVN(const Model& model, const ie::CNNLayerPtr& layer, const
     for (int i = 0; i < indicesSize; i++) {
         axes.insert(getDimFromAxis(ndims, indicesPtr[i]));
     }
+    const auto width = axes.count(Dim::W);
 
-    VPU_THROW_UNLESS(!axes.count(Dim::N) && axes.count(Dim::H) && axes.count(Dim::W),
+    VPU_THROW_UNLESS(!axes.count(Dim::N) && width,
                      "Unsupported combination of indices in layer \"%s\". "
-                     "Only across channel and full batch supported.", layer->name);
+                     "Only across channel, width and full batch supported.", layer->name);
     const auto acrossChannels = axes.count(Dim::C) != 0;
+    const auto acrossWidth = width == 1 && axes.count(Dim::H) == 0;
 
     const auto normVariance = layer->GetParamAsBool("normalize_variance");
     const auto eps = layer->GetParamAsFloat("eps");
@@ -104,6 +108,7 @@ void FrontEnd::parseMVN(const Model& model, const ie::CNNLayerPtr& layer, const
     auto stage = model->addNewStage<MVNStage>(layer->name, StageType::MVN, layer, inputs, outputs);
     stage->attrs().set<int>("normalize", normVariance);
     stage->attrs().set<int>("across_channels", acrossChannels);
+    stage->attrs().set<int>("across_width", acrossWidth);
     stage->attrs().set<float>("eps", eps);
 }
 
diff --git a/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/mvn.cpp b/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/mvn.cpp
index 2c78d5c6698a36..998a202b85721e 100644
--- a/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/mvn.cpp
+++ b/inference-engine/tests/functional/plugin/myriad/shared_tests_instances/single_layer_tests/mvn.cpp
@@ -15,6 +15,8 @@ const std::vector<std::vector<int>> indices_4D = {
 };
 
 const std::vector<std::vector<int>> indices_3D = {
+        {2},
+        {0, 2},
         {1, 2},     // equivalent MVN-1 across_channel=0
         {0, 1, 2}   // equivalent MVN-1 across_channel=1
 };

From e1bffcc36c6b6a1692e1be5bc87cd034ed6d367f Mon Sep 17 00:00:00 2001
From: iliya mironov <iliya.mironov@intel.com>
Date: Thu, 22 Jul 2021 21:12:44 +0300
Subject: [PATCH 44/71] Add json validate (#6449)

* Add json validate

* Fix json schema

* Fix schema loader

* Add unit test

* Update bom file

* Update all requarments

* Update dev requarments

* Update requrments

* Update path to schema

* Update schema

* Add some unit tests

* Move schema to root dir

* Update schema path in bom file

* Fix unit test

* Fix bom

* Change path to schema

* update setup

* Fix setup

* Fix mo args test

* Refactoring some code

* Refactoring according to review

* Update sort imports

* Remove id attribute from schema

* Refactoring validator

* Fix according to review

* Move schema from json to dict. Update unit tests.

* Fix BOM file

* Update bom file
---
 model-optimizer/automation/package_BOM.txt    |   1 +
 .../mo/utils/custom_replacement_config.py     |  34 +++--
 model-optimizer/mo/utils/json_schema.py       | 129 ++++++++++++++++++
 model-optimizer/requirements.txt              |   1 +
 model-optimizer/requirements_caffe.txt        |   1 +
 model-optimizer/requirements_dev.txt          |   1 +
 model-optimizer/requirements_kaldi.txt        |   1 +
 model-optimizer/requirements_mxnet.txt        |   1 +
 model-optimizer/requirements_onnx.txt         |   1 +
 model-optimizer/requirements_tf.txt           |   1 +
 model-optimizer/requirements_tf2.txt          |   1 +
 .../utils/custom_replacement_config_test.py   |  40 ++++++
 tests/stress_tests/scripts/requirements.txt   |   1 +
 13 files changed, 204 insertions(+), 9 deletions(-)
 create mode 100644 model-optimizer/mo/utils/json_schema.py
 create mode 100644 model-optimizer/unit_tests/mo/utils/custom_replacement_config_test.py

diff --git a/model-optimizer/automation/package_BOM.txt b/model-optimizer/automation/package_BOM.txt
index 4adb1e22aa2e2d..939f75b685d292 100644
--- a/model-optimizer/automation/package_BOM.txt
+++ b/model-optimizer/automation/package_BOM.txt
@@ -1070,6 +1070,7 @@ mo/utils/ir_reader/extenders/topk_extender.py
 mo/utils/ir_reader/extenders/variadic_split_extender.py
 mo/utils/ir_reader/layer_to_class.py
 mo/utils/ir_reader/restore_graph.py
+mo/utils/json_schema.py
 mo/utils/logger.py
 mo/utils/model_analysis.py
 mo/utils/pipeline_config.py
diff --git a/model-optimizer/mo/utils/custom_replacement_config.py b/model-optimizer/mo/utils/custom_replacement_config.py
index 32f7b6808f563b..47176e36e4ac18 100644
--- a/model-optimizer/mo/utils/custom_replacement_config.py
+++ b/model-optimizer/mo/utils/custom_replacement_config.py
@@ -1,6 +1,7 @@
 # Copyright (C) 2018-2021 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 
+import fastjsonschema as json_validate
 import json
 import logging as log
 import os
@@ -9,7 +10,8 @@
 from mo.graph.graph import Node, Graph
 from mo.utils.error import Error
 from mo.utils.graph import nodes_matching_name_pattern, sub_graph_between_nodes
-from mo.utils.utils import refer_to_faq_msg
+from mo.utils.json_schema import schema_dict
+from mo.utils.utils import get_mo_root_dir, refer_to_faq_msg
 
 
 class CustomReplacementDescriptor(object):
@@ -297,12 +299,12 @@ def update_custom_replacement_attributes(self, graph: Graph):
                 log.debug("Node {} doesn't have output edges. Consider it output".format(node_name))
                 output_tensors.add((generate_pattern_for_node(graph, pattern, node_name), 0))
 
-        if not self.has('inputs'):
+        if not self.has('inputs') or len(self._replacement_desc['inputs']) == 0:
             self._replacement_desc['inputs'] = [[{'node': desc[0], 'port': desc[1]} for desc in inp]
                                                 for inp in sorted(input_nodes_mapping.values())]
             log.debug('Updated inputs of sub-graph for instance "{}"'.format(self.instances))
 
-        if not self.has('outputs'):
+        if not self.has('outputs') or len(self._replacement_desc['outputs']) == 0:
             self._replacement_desc['outputs'] = [{'node': node, 'port': port} for node, port in sorted(output_tensors)]
             log.debug('Updated outputs of sub-graph for instance "{}"'.format(self.instances))
 
@@ -342,13 +344,8 @@ def parse_custom_replacement_config_file(file_name: str):
     if not os.path.exists(file_name):
         raise Error("Custom replacements configuration file '{}' does not exist. ".format(file_name) +
                     refer_to_faq_msg(69))
-    try:
-        with open(file_name, 'r') as f:
-            data = json.load(f)
-    except Exception as exc:
-        raise Error("Failed to parse custom replacements configuration file '{}': {}. ".format(file_name, exc) +
-                    refer_to_faq_msg(70)) from exc
 
+    data = load_and_validate_json_config(file_name)
     result = list()
     validation_errors = list()
     for attrs in data:
@@ -394,3 +391,22 @@ def generate_pattern_for_node(graph: Graph, sub_graph_pattern: str, node_name: s
 
     raise RuntimeError('The pattern that uniquely identifies node "{}" using sub-graph pattern "{}" has not been found'.
                        format(node_name, sub_graph_pattern))
+
+
+def load_and_validate_json_config(config_file_name: str):
+    """
+    Reads and validate custom replacement configuration file config_file_name.
+    :param config_file_name: name of the file to read from.
+    :return: A dictionary serialized from json config file.
+    """
+
+    try:
+        with open(config_file_name, 'r') as f:
+            json_config = json.load(f)
+            validator = json_validate.compile(schema_dict)
+            validator(json_config)
+    except Exception as e:
+        raise Error("Failed to parse custom replacements configuration file '{}': {}. ".format(config_file_name, e) +
+                    refer_to_faq_msg(70)) from e
+
+    return json_config
diff --git a/model-optimizer/mo/utils/json_schema.py b/model-optimizer/mo/utils/json_schema.py
new file mode 100644
index 00000000000000..a201818eb72719
--- /dev/null
+++ b/model-optimizer/mo/utils/json_schema.py
@@ -0,0 +1,129 @@
+# Copyright (C) 2018-2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
+schema_dict = {
+    "definitions": {},
+    "$schema": "http://json-schema.org/draft-07/schema#",
+    "title": "Root",
+    "type": "array",
+    "default": [],
+    "items": {
+        "$id": "#root/items",
+        "title": "Items",
+        "type": "object",
+        "required": [
+            "id",
+            "match_kind"
+        ],
+        "properties": {
+            "custom_attributes": {
+                "$id": "#root/items/custom_attributes",
+                "title": "Custom_attributes",
+                "type": "object",
+                "properties": {
+                }
+            },
+            "id": {
+                "$id": "#root/items/id",
+                "title": "Id",
+                "type": "string",
+                "pattern": "^.*$",
+                "minLength": 1
+            },
+            "inputs": {
+                "$id": "#root/items/inputs",
+                "title": "Inputs",
+                "type": "array",
+                "default": [],
+                "items": {
+                    "$id": "#root/items/inputs/items",
+                    "title": "Items",
+                    "type": "array",
+                    "default": [],
+                    "items": {
+                        "$id": "#root/items/inputs/items/items",
+                        "title": "Items",
+                        "type": "object",
+                        "properties": {
+                            "node": {
+                                "$id": "#root/items/inputs/items/items/node",
+                                "title": "Node",
+                                "type": "string",
+                                "default": "",
+                                "pattern": "^.*$"
+                            },
+                            "port": {
+                                "$id": "#root/items/inputs/items/items/port",
+                                "title": "Port",
+                                "type": "integer",
+                                "default": 0
+                            }
+                        },
+                        "required": ["node", "port"]
+                    }
+
+                }
+            },
+            "instances": {
+                "$id": "#root/items/instances",
+                "title": "Instances",
+                "type": ["array", "object"],
+                "items": {
+                    "$id": "#root/items/instances/items",
+                    "title": "Items",
+                    "type": "string",
+                    "default": "",
+                    "pattern": "^.*$"
+                }
+            },
+            "match_kind": {
+                "$id": "#root/items/match_kind",
+                "title": "Match_kind",
+                "type": "string",
+                "enum": ["points", "scope", "general"],
+                "default": "points",
+                "pattern": "^.*$"
+            },
+            "outputs": {
+                "$id": "#root/items/outputs",
+                "title": "Outputs",
+                "type": "array",
+                "default": [],
+                "items": {
+                    "$id": "#root/items/outputs/items",
+                    "title": "Items",
+                    "type": "object",
+                    "properties": {
+                        "node": {
+                            "$id": "#root/items/outputs/items/node",
+                            "title": "Node",
+                            "type": "string",
+                            "default": "",
+                            "pattern": "^.*$"
+                        },
+                        "port": {
+                            "$id": "#root/items/outputs/items/port",
+                            "title": "Port",
+                            "type": "integer",
+                            "default": 0
+                        }
+                    },
+                    "required": ["node", "port"]
+                }
+
+            },
+            "include_inputs_to_sub_graph": {
+                "$id": "#root/items/include_inputs_to_sub_graph",
+                "title": "Include_inputs_to_sub_graph",
+                "type": "boolean",
+                "default": False
+            },
+            "include_outputs_to_sub_graph": {
+                "$id": "#root/items/include_outputs_to_sub_graph",
+                "title": "Include_outputs_to_sub_graph",
+                "type": "boolean",
+                "default": False
+            }
+        }
+    }
+}
diff --git a/model-optimizer/requirements.txt b/model-optimizer/requirements.txt
index cc0ec363dc3e19..b54ca23344b580 100644
--- a/model-optimizer/requirements.txt
+++ b/model-optimizer/requirements.txt
@@ -8,3 +8,4 @@ onnx>=1.8.1
 defusedxml>=0.7.1
 urllib3>=1.26.4
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_caffe.txt b/model-optimizer/requirements_caffe.txt
index 6dd20d0ec83707..d1eef645f44490 100644
--- a/model-optimizer/requirements_caffe.txt
+++ b/model-optimizer/requirements_caffe.txt
@@ -3,3 +3,4 @@ numpy>=1.16.6,<1.20
 protobuf>=3.15.6
 defusedxml>=0.7.1
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_dev.txt b/model-optimizer/requirements_dev.txt
index a1c72e7eeb0ab5..67640a482294cd 100644
--- a/model-optimizer/requirements_dev.txt
+++ b/model-optimizer/requirements_dev.txt
@@ -6,3 +6,4 @@ test-generator==0.1.1
 defusedxml>=0.5.0
 requests>=2.20.0
 pytest>=6.2.4
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_kaldi.txt b/model-optimizer/requirements_kaldi.txt
index dfbdea1a50a2b0..1068d95240cb7b 100644
--- a/model-optimizer/requirements_kaldi.txt
+++ b/model-optimizer/requirements_kaldi.txt
@@ -2,3 +2,4 @@ networkx~=2.5
 numpy>=1.16.6,<1.20
 defusedxml>=0.7.1
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_mxnet.txt b/model-optimizer/requirements_mxnet.txt
index 1fc809413292f1..61897faa5003da 100644
--- a/model-optimizer/requirements_mxnet.txt
+++ b/model-optimizer/requirements_mxnet.txt
@@ -5,3 +5,4 @@ numpy>=1.16.6,<1.20
 defusedxml>=0.7.1
 urllib3>=1.26.4
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_onnx.txt b/model-optimizer/requirements_onnx.txt
index 0997041cfcc4b0..a6415939ccda25 100644
--- a/model-optimizer/requirements_onnx.txt
+++ b/model-optimizer/requirements_onnx.txt
@@ -3,3 +3,4 @@ networkx~=2.5
 numpy>=1.16.6,<1.20
 defusedxml>=0.7.1
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_tf.txt b/model-optimizer/requirements_tf.txt
index 6d75cff9fa95e7..11eee1b8af1abe 100644
--- a/model-optimizer/requirements_tf.txt
+++ b/model-optimizer/requirements_tf.txt
@@ -4,3 +4,4 @@ networkx~=2.5
 numpy>=1.16.6,<1.19
 defusedxml>=0.7.1
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/requirements_tf2.txt b/model-optimizer/requirements_tf2.txt
index 02d71d2585d0e3..760999011abc68 100644
--- a/model-optimizer/requirements_tf2.txt
+++ b/model-optimizer/requirements_tf2.txt
@@ -3,3 +3,4 @@ networkx~=2.5
 numpy>=1.16.6,<1.20
 defusedxml>=0.7.1
 requests>=2.25.1
+fastjsonschema~=2.15.1
diff --git a/model-optimizer/unit_tests/mo/utils/custom_replacement_config_test.py b/model-optimizer/unit_tests/mo/utils/custom_replacement_config_test.py
new file mode 100644
index 00000000000000..3407ca5816e1b9
--- /dev/null
+++ b/model-optimizer/unit_tests/mo/utils/custom_replacement_config_test.py
@@ -0,0 +1,40 @@
+# Copyright (C) 2018-2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
+import os
+import unittest
+from fnmatch import fnmatch
+from generator import generator, generate
+
+from mo.utils.custom_replacement_config import load_and_validate_json_config
+from mo.utils.error import Error
+from mo.utils.utils import get_mo_root_dir
+
+
+def get_json_configs(mo_root_dir):
+    config_path = os.path.join(mo_root_dir, 'extensions', 'front')
+    pattern = "*.json"
+    config_files_list = []
+    for path, subdirs, files in os.walk(config_path):
+        for name in files:
+            if fnmatch(name, pattern):
+                config_files_list.append((os.path.join(path, name),))
+    return config_files_list
+
+@generator
+class TestSchema(unittest.TestCase):
+    base_dir = get_mo_root_dir()
+    schema_file = os.path.join(base_dir, 'mo', 'utils', 'schema.json')
+    transformation_configs = get_json_configs(base_dir)
+    test_json1 = '[{"id": "", "match_kind": "general", "custom_attributes": {}}]'
+    test_json2 = '[{"id": "someid", "match_kind": "abc", "custom_attributes": {}}]'
+
+    @generate(*transformation_configs)
+    def test_schema_file(self, transformation_config):
+        self.assertTrue(load_and_validate_json_config(transformation_config))
+
+    def test_schema_id_empty(self):
+        self.assertRaises(Error, load_and_validate_json_config, self.test_json1)
+
+    def test_schema_match_kind_wrong(self):
+        self.assertRaises(Error, load_and_validate_json_config, self.test_json2)
diff --git a/tests/stress_tests/scripts/requirements.txt b/tests/stress_tests/scripts/requirements.txt
index 8fe0104b0ae4e0..5d067c9229777f 100644
--- a/tests/stress_tests/scripts/requirements.txt
+++ b/tests/stress_tests/scripts/requirements.txt
@@ -1,5 +1,6 @@
 pymongo
 Jinja2
 PyYAML
+fastjsonschema~=2.15.1
 
 h5py<3.0.0 # WA for OMZ Keras models. Details: https://github.com/openvinotoolkit/open_model_zoo/issues/1806
\ No newline at end of file

From fefe7f41762cb697a7f06f3ac27145bdea97ce22 Mon Sep 17 00:00:00 2001
From: Edward Shogulin <edward.shogulin@intel.com>
Date: Thu, 22 Jul 2021 21:17:23 +0100
Subject: [PATCH 45/71] [LPT] FakeQuantize folding extending (#6708)

* [LPT] ConvolutionBackpropData fix FQ weights folding

* [LPT] Fixed test to reproduce the bug

* [LPT] fold FakeQuantize

* [LPT] Function tests refactoring

* refactoring

* [LPT] functional test quick fix

* [LPT] dynamic shapes support

Co-authored-by: Zinoviev, Vladimir <vladimir.zinoviev@intel.com>
---
 .../multiply_to_group_convolution.hpp         |   1 +
 .../src/convolution_backprop_data.cpp         |  10 +-
 .../src/fold_fake_quantize.cpp                |  10 +-
 .../src/multiply_to_group_convolution.cpp     |  46 ++++++--
 .../src/mkldnn_plugin/mkldnn_plugin.cpp       |   3 +
 ...nvolution_backprop_data_transformation.cpp |  48 +++++++--
 .../convolution_transformation.cpp            |   2 +-
 .../group_convolution_transformation.cpp      |   2 +-
 .../mat_mul_with_constant_transformation.cpp  |   2 +-
 .../simple_low_precision_transformer.cpp      |  10 +-
 .../simple_low_precision_transformer.hpp      |   8 +-
 ...ly_to_group_convolution_transformation.cpp | 100 ++++++++++++++++--
 ...ly_to_group_convolution_transformation.cpp |  52 +++++++--
 ...ly_to_group_convolution_transformation.hpp |  12 ++-
 ...ly_to_group_convolution_transformation.cpp |  29 +++--
 ...multiply_to_group_convolution_function.hpp |   5 +-
 ...multiply_to_group_convolution_function.cpp |  29 +++--
 17 files changed, 307 insertions(+), 62 deletions(-)

diff --git a/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp b/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp
index f25ba9c9284fc6..5e6bd900d8ea9e 100644
--- a/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp
+++ b/inference-engine/src/low_precision_transformations/include/low_precision/multiply_to_group_convolution.hpp
@@ -25,6 +25,7 @@ class LP_TRANSFORMATIONS_API MultiplyToGroupConvolutionTransformation : public L
     bool isPrecisionPreserved(std::shared_ptr<Node> layer) const noexcept override;
     bool isQuantized(const std::shared_ptr<const Node>& layer) const noexcept override;
     static bool canBeTransformedToGroupConvolution(const std::shared_ptr<const Node>& layer) noexcept;
+    static bool isDynamicOrScalar(const std::shared_ptr<const Node>& node);
 
     void setGroupSize(const size_t groupSize);
     size_t getGroupSize() const;
diff --git a/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp b/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp
index cd8661143d7f47..54e010d3a84a7b 100644
--- a/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp
+++ b/inference-engine/src/low_precision_transformations/src/convolution_backprop_data.cpp
@@ -72,7 +72,15 @@ bool ConvolutionBackpropDataTransformation::transform(TransformationContext &con
                          NetworkHelper::getDequantization(reshapeFromWeights);
         if (dequantization.empty()) {
             const auto fqOnWeights = getFakeQuantizeOnWeights(convolutionBackpropData);
-            std::shared_ptr<ngraph::Node> resultConstant = NetworkHelper::fold_fake_quantize(fqOnWeights);
+            auto constantShape = fqOnWeights->input(1).get_partial_shape();
+            if (constantShape.is_dynamic() || constantShape.rank().is_dynamic()) {
+                return false;
+            }
+
+            std::shared_ptr<ngraph::Node> resultConstant = NetworkHelper::fold_fake_quantize(
+                fqOnWeights,
+                false,
+                (constantShape.rank().get_length() < 2) || constantShape[1] != 1ul ? 1ul : 0ul);
             if (reshapeFromWeights != nullptr) {
                 resultConstant = fold_reshape<opset1::Reshape>(
                         resultConstant,
diff --git a/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp b/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp
index 4981f66a7d4f9d..7984d946f865ac 100644
--- a/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp
+++ b/inference-engine/src/low_precision_transformations/src/fold_fake_quantize.cpp
@@ -42,7 +42,15 @@ bool FoldFakeQuantizeTransformation::transform(TransformationContext& context, n
         return false;
     }
 
-    const auto resultConstant = NetworkHelper::fold_fake_quantize(fakeQuantize, false);
+    const auto constantShape = fakeQuantize->input(1).get_partial_shape();
+    if (constantShape.is_dynamic() || constantShape.rank().is_dynamic()) {
+        return false;
+    }
+
+    std::shared_ptr<ngraph::Node> resultConstant = NetworkHelper::fold_fake_quantize(
+        fakeQuantize,
+        false,
+        (constantShape.rank().get_length() < 2) || constantShape[1] != 1ul ? 1ul : 0ul);
     if (is_type<opset1::Constant>(resultConstant)) {
         replace_node(fakeQuantize, resultConstant);
         return true;
diff --git a/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp b/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp
index 7f06ea3a32e878..9b4a6147b61c07 100644
--- a/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp
+++ b/inference-engine/src/low_precision_transformations/src/multiply_to_group_convolution.cpp
@@ -47,6 +47,9 @@ bool MultiplyToGroupConvolutionTransformation::transform(TransformationContext&
     }
 
     auto dequantization = NetworkHelper::getDequantization(multiply, inputIndex);
+    if (dequantization.data.get_node() == nullptr) {
+        return false;
+    }
     if (dequantization.subtractConvert != nullptr) {
         dequantization = NetworkHelper::foldDequantization(multiply, inputIndex);
     }
@@ -176,12 +179,6 @@ bool MultiplyToGroupConvolutionTransformation::canBeTransformed(const Transforma
         return false;
     }
 
-    const auto dequantization = NetworkHelper::getDequantization(operation, inputIndex);
-
-    if (dequantization.empty()) {
-        return false;
-    }
-
     for (size_t i = 2; i < constShape.size(); ++i) {
         if (constShape[i] != 1) {
             return false;
@@ -189,9 +186,13 @@ bool MultiplyToGroupConvolutionTransformation::canBeTransformed(const Transforma
     }
 
     if (updatePrecisions && restrictions.size() > 0) {
-        const element::Type parentPrecision = dequantization.data.get_element_type();
-
         const auto& availablePreisions = restrictions[0].second;
+        if (availablePreisions.empty()) {
+            return false;
+        }
+
+        const auto dequantization = NetworkHelper::getDequantization(operation, inputIndex);
+        const element::Type parentPrecision = dequantization.data.get_element_type();
         if (std::find(availablePreisions.begin(), availablePreisions.end(), parentPrecision) == availablePreisions.end()) {
             return false;
         }
@@ -221,6 +222,35 @@ bool MultiplyToGroupConvolutionTransformation::canBeTransformedToGroupConvolutio
     return (pShape.rank().get_length() == 4ul) || (pShape.rank().get_length() == 5ul);
 }
 
+bool MultiplyToGroupConvolutionTransformation::isDynamicOrScalar(const std::shared_ptr<const Node>& node) {
+    auto getConstantIndex = [](const std::shared_ptr<const Node>& node) -> int {
+        if (is_type<opset1::Constant>(node->get_input_node_shared_ptr(1))) {
+            return 1;
+        }
+        if (is_type<opset1::Constant>(node->get_input_node_shared_ptr(0))) {
+            return 0;
+        }
+        return -1;
+    };
+
+    const int constantIndex = getConstantIndex(node);
+    if (constantIndex == -1) {
+        return false;
+    }
+
+    const Input<const Node> constantInput = node->input(constantIndex);
+    const auto shape = constantInput.get_partial_shape();
+    if (shape.is_dynamic() || shape.rank().is_dynamic()) {
+        return true;
+    }
+
+    if (std::all_of(shape.begin(), shape.end(), [](const Dimension& dimension) { return dimension == 1ul; })) {
+        return true;
+    }
+
+    return false;
+}
+
 void MultiplyToGroupConvolutionTransformation::setGroupSize(const size_t groupSize) {
     this->groupSize = groupSize;
 }
diff --git a/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp b/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
index be9bfa0d1cbc20..59a29ebf40ae8f 100644
--- a/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
+++ b/inference-engine/src/mkldnn_plugin/mkldnn_plugin.cpp
@@ -357,6 +357,9 @@ static void Transformation(CNNNetwork& clonedNetwork, const Config& conf) {
         lptManager.get_pass_config()->set_callback<ngraph::pass::low_precision::ConvolutionBackpropDataTransformation>([](const_node_ptr& node) -> bool {
             return LayerTransformation::isAsymmetricQuantization(node) || WeightableLayerTransformation::isAsymmetricOnWeights(node);
         });
+        lptManager.get_pass_config()->set_callback<ngraph::pass::low_precision::MultiplyToGroupConvolutionTransformation>([](const_node_ptr& node) -> bool {
+            return MultiplyToGroupConvolutionTransformation::isDynamicOrScalar(node);
+        });
         lptManager.run_passes(nGraphFunc);
     }
 
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp
index 70ea890c92cd2b..50802fbba211c3 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_backprop_data_transformation.cpp
@@ -24,6 +24,13 @@ using namespace testing;
 using namespace ngraph;
 using namespace ngraph::pass;
 
+using const_node_ptr = const std::shared_ptr<const ngraph::Node>;
+using callback_function_type = std::function<bool(const_node_ptr&)>;
+
+bool empty_callback(const std::shared_ptr<const ngraph::Node>& node) {
+    return false;
+}
+
 class ConvolutionBackpropDataTransformationTestValues {
 public:
     class Actual {
@@ -33,26 +40,31 @@ class ConvolutionBackpropDataTransformationTestValues {
         builder::subgraph::FakeQuantizeOnWeights fakeQuantizeOnWeights;
         builder::subgraph::DequantizationOperations dequantizationOnWeights;
         std::shared_ptr<ngraph::opset1::Constant> weights;
+        callback_function_type callback;
 
         Actual() = default;
         Actual(
             const ngraph::element::Type& precisionBeforeDequantization,
             const ngraph::builder::subgraph::DequantizationOperations& dequantizationOnActivations,
             const builder::subgraph::FakeQuantizeOnWeights& fakeQuantizeOnWeights,
-            const std::shared_ptr<ngraph::opset1::Constant>& weights) :
+            const std::shared_ptr<ngraph::opset1::Constant>& weights,
+            const callback_function_type& callback = empty_callback) :
                 precisionBeforeDequantization(precisionBeforeDequantization),
                 dequantizationOnActivations(dequantizationOnActivations),
                 fakeQuantizeOnWeights(fakeQuantizeOnWeights),
-                weights(weights) {}
+                weights(weights),
+                callback(callback) {}
         Actual(
             const  ngraph::element::Type& precisionBeforeDequantization,
             const  ngraph::builder::subgraph::DequantizationOperations& dequantizationOnActivations,
             const  builder::subgraph::DequantizationOperations& dequantizationOnWeights,
-            const std::shared_ptr<ngraph::opset1::Constant>& weights) :
+            const std::shared_ptr<ngraph::opset1::Constant>& weights,
+            const callback_function_type& callback = empty_callback) :
             precisionBeforeDequantization(precisionBeforeDequantization),
             dequantizationOnActivations(dequantizationOnActivations),
             dequantizationOnWeights(dequantizationOnWeights),
-            weights(weights) {}
+            weights(weights),
+            callback(callback) {}
     };
 
     class Expected {
@@ -124,10 +136,11 @@ class ConvolutionBackpropDataTransformation : public LayerTransformation, public
                 actualWeights);
 
         SimpleLowPrecisionTransformer transform;
-        transform.add<ngraph::pass::low_precision::ConvolutionBackpropDataTransformation, ngraph::opset1::Convolution>(testValues.params);
+        transform.add<low_precision::ConvolutionBackpropDataTransformation, opset1::ConvolutionBackpropData>(testValues.params);
+        transform.get_pass_config()->set_callback<low_precision::ConvolutionBackpropDataTransformation>(testValues.actual.callback);
         transform.transform(actualFunction);
 
-        std::shared_ptr<Node> refWeights = pass::low_precision::fold<opset1::Broadcast>(
+        std::shared_ptr<Node> refWeights = low_precision::fold<opset1::Broadcast>(
                 testValues.expected.weights,
                 opset1::Constant::create(
                         element::i64,
@@ -179,7 +192,7 @@ class ConvolutionBackpropDataTransformation : public LayerTransformation, public
 
 TEST_P(ConvolutionBackpropDataTransformation, CompareFunctions) {
     actualFunction->validate_nodes_and_infer_types();
-    auto res = compare_functions(referenceFunction, actualFunction, true, true, true);
+    auto res = compare_functions(referenceFunction, actualFunction, true, true, false);
     ASSERT_TRUE(res.first) << res.second;
 }
 
@@ -455,6 +468,27 @@ const std::vector<ConvolutionBackpropDataTransformationTestValues> testValues =
             true
         }
     },
+    //  issue #59593: subtract on activations, non-asymmetric
+    {
+        LayerTransformation::createParamsU8I8(),
+        // ActualValues
+        {
+            ngraph::element::u8,
+            {{ngraph::element::f32}, {128.f}, {0.01f}},
+            { 255ul, Shape({ 1, 2, 1, 1 }), { 0.f }, { 254.f }, { 0.f }, { 25.4f } },
+            op::Constant::create(ngraph::element::i8, ngraph::Shape{}, std::vector<float>{ 2.f }),
+            low_precision::LayerTransformation::isAsymmetricQuantization
+        },
+        // ExpectedValues
+        {
+            ngraph::element::u8,
+            {{ngraph::element::f32}, {128.f}, {0.01f}},
+            {},
+            {},
+            op::Constant::create(ngraph::element::f32, ngraph::Shape{}, std::vector<float>{ 2.f }),
+            false // weights are not folded because of callback returning true
+        }
+    },
 };
 
 INSTANTIATE_TEST_SUITE_P(
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp
index db43dbccb2746b..d8f35b7bca5293 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/convolution_transformation.cpp
@@ -71,7 +71,7 @@ class ConvolutionTransformation : public LayerTransformation, public testing::Wi
         SimpleLowPrecisionTransformer transform;
         transform.add<ngraph::pass::low_precision::ConvolutionTransformation, ngraph::opset1::Convolution>(testValues.params);
         if (testValues.params.supportAsymmetricQuantization == false) {
-            transform.set_callback<ngraph::pass::low_precision::ConvolutionTransformation>(
+            transform.get_pass_config()->set_callback<ngraph::pass::low_precision::ConvolutionTransformation>(
                 [](const std::shared_ptr<const ngraph::Node>& node) -> bool {
                     return ngraph::pass::low_precision::LayerTransformation::isAsymmetricQuantization(node);
                 });
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp
index 025bd3bb69493e..469a5b06d56446 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/group_convolution_transformation.cpp
@@ -84,7 +84,7 @@ class GroupConvolutionTransformation : public LayerTransformation, public testin
         SimpleLowPrecisionTransformer transform;
         transform.add<ngraph::pass::low_precision::GroupConvolutionTransformation, ngraph::opset1::GroupConvolution>(testValues.params);
         if (testValues.params.supportAsymmetricQuantization == false) {
-            transform.set_callback<ngraph::pass::low_precision::GroupConvolutionTransformation>(
+            transform.get_pass_config()->set_callback<ngraph::pass::low_precision::GroupConvolutionTransformation>(
                 [](const std::shared_ptr<const ngraph::Node>& node) -> bool {
                     return ngraph::pass::low_precision::LayerTransformation::isAsymmetricQuantization(node);
                 });
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp
index 608ffa4399ba5a..f8144420e42d95 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/mat_mul_with_constant_transformation.cpp
@@ -105,7 +105,7 @@ class MatMulWithConstantTransformation : public LayerTransformation, public test
         SimpleLowPrecisionTransformer transformer;
         transformer.add<ngraph::pass::low_precision::MatMulTransformation, ngraph::opset1::MatMul>(testValues.params);
         if (testValues.params.support3DTensorOnActivations == false) {
-            transformer.set_callback<ngraph::pass::low_precision::MatMulTransformation>(
+            transformer.get_pass_config()->set_callback<ngraph::pass::low_precision::MatMulTransformation>(
                 [](const std::shared_ptr<const ngraph::Node>& node) -> bool {
                     return ngraph::pass::low_precision::MatMulTransformation::is3DTensorOnActivations(node);
                 });
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp
index 180bdb070d5b5d..652764b631266c 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.cpp
@@ -21,9 +21,10 @@ using namespace ngraph::pass;
 SimpleLowPrecisionTransformer::SimpleLowPrecisionTransformer(
     const std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>& precisionRestrictions,
     const std::vector<ngraph::pass::low_precision::OperationPerTensorQuantizationRestriction>& quantizationRestrictions) {
+    auto passConfig = get_pass_config();
 
     // TODO: use one pass manager
-    markup = std::make_shared<ngraph::pass::Manager>();
+    markup = std::make_shared<ngraph::pass::Manager>(passConfig);
     markup->register_pass<ngraph::pass::low_precision::MarkupCanBeQuantized>();
     markup->register_pass<ngraph::pass::low_precision::MarkupPrecisions>(precisionRestrictions);
     markup->register_pass<ngraph::pass::low_precision::MarkupPerTensorQuantization>(quantizationRestrictions);
@@ -32,15 +33,20 @@ SimpleLowPrecisionTransformer::SimpleLowPrecisionTransformer(
     markup->register_pass<ngraph::pass::low_precision::AlignQuantizationIntervals>();
     markup->register_pass<ngraph::pass::low_precision::AlignQuantizationParameters>();
 
-    common = std::make_shared<ngraph::pass::Manager>();
+    common = std::make_shared<ngraph::pass::Manager>(passConfig);
     commonGraphRewrite = common->register_pass<ngraph::pass::GraphRewrite>();
     cleanup = common->register_pass<ngraph::pass::GraphRewrite>();
 }
 
 void SimpleLowPrecisionTransformer::transform(std::shared_ptr<ngraph::Function>& function) {
+    run_on_function(function);
+}
+
+bool SimpleLowPrecisionTransformer::run_on_function(std::shared_ptr<ngraph::Function> function) {
     ngraph::pass::low_precision::TypeRelaxedReplacer pass;
     pass.run_on_function(function);
 
     markup->run_passes(function);
     common->run_passes(function);
+    return true;
 }
diff --git a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp
index 7439d06bedd071..1eba06488ac1ce 100644
--- a/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp
+++ b/inference-engine/tests/functional/inference_engine/lp_transformations/simple_low_precision_transformer.hpp
@@ -14,7 +14,7 @@
 #include "low_precision/common/operation_precision_restriction.hpp"
 #include "low_precision/common/operation_per_tensor_quantization_restriction.hpp"
 
-class SimpleLowPrecisionTransformer {
+class SimpleLowPrecisionTransformer : public ngraph::pass::FunctionPass{
 public:
     SimpleLowPrecisionTransformer(
         const std::vector<ngraph::pass::low_precision::OperationPrecisionRestriction>& precisionRestrictions = {},
@@ -25,12 +25,8 @@ class SimpleLowPrecisionTransformer {
         commonGraphRewrite->add_matcher<T>(TestTransformationParams::toParams(params));
     }
 
-    template <class T>
-    void set_callback(const std::function<bool(const std::shared_ptr<const ::ngraph::Node>)>& callback) {
-        common->get_pass_config()->set_callback<T>(callback);
-    }
-
     void transform(std::shared_ptr<ngraph::Function>& function);
+    bool run_on_function(std::shared_ptr<ngraph::Function> f) override;
 
     std::shared_ptr<ngraph::pass::Manager> markup;
     std::shared_ptr<ngraph::pass::Manager> common;
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
index 10f45879810315..99e423b1ffec4a 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
@@ -12,14 +12,47 @@ const std::vector<element::Type> precisions = {
     element::f32
 };
 
-const std::vector< ngraph::PartialShape > inputShapes = {
-    { 1ul, 4ul, 16ul, 16ul }, { 1ul, 4ul, 16ul, 16ul, 16ul }
+namespace shape4d {
+const std::vector<ngraph::PartialShape> inputShapes = {
+    { 1ul, 3ul, 16ul, 16ul },
+    { 4ul, 3ul, 16ul, 16ul }
 };
 
-const std::vector<builder::subgraph::FakeQuantizeOnData> fqOnData = {
-    { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
-    { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 10.f }, { 25.5f } },
-    { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { -12.8f }, { 12.7f } }
+const std::vector<MultiplyToGroupConvolutionTransformationParam> params = {
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // Multiply with scalar is not transformed to GroupConvolution
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{4.f}, element::f32, Shape{1, 1, 1, 1}},
+        "output/GroupConvolution",
+        ""
+    },
+    // Multiply with scalar is not transformed to GroupConvolution
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{4.f}, element::f32, Shape{}},
+        "output/GroupConvolution",
+        ""
+    },
+    // Zero point
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { -1.28f }, { 1.27f }, { -1.28f }, { 1.27f } },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // Zero point
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { -1.28f }, { 1.27f / 2.f }, { -1.28f }, { 1.27f / 2.f} },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    }
 };
 
 INSTANTIATE_TEST_SUITE_P(smoke_LPT, MultiplyToGroupConvolutionTransformation,
@@ -27,6 +60,59 @@ INSTANTIATE_TEST_SUITE_P(smoke_LPT, MultiplyToGroupConvolutionTransformation,
         ::testing::ValuesIn(precisions),
         ::testing::ValuesIn(inputShapes),
         ::testing::Values(CommonTestUtils::DEVICE_CPU),
-        ::testing::ValuesIn(fqOnData)),
+        ::testing::ValuesIn(params)),
     MultiplyToGroupConvolutionTransformation::getTestCaseName);
+}  // namespace shape4d
+
+namespace shape5d {
+const std::vector<ngraph::PartialShape> inputShapes = {
+    { 1ul, 3ul, 16ul, 16ul, 16ul },
+    { 4ul, 3ul, 16ul, 16ul, 16ul }
+};
+
+const std::vector<MultiplyToGroupConvolutionTransformationParam> params = {
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // Multiply with scalar is not transformed to GroupConvolution
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{4.f}, element::f32, Shape{1, 1, 1, 1, 1}},
+        "output/GroupConvolution",
+        ""
+    },
+    // Multiply with scalar is not transformed to GroupConvolution
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{4.f}, element::f32, Shape{}},
+        "output/GroupConvolution",
+        ""
+    },
+    // Zero point
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { -1.28f }, { 1.27f }, { -1.28f }, { 1.27f } },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // Zero point
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { -1.28f }, { 1.27f / 2.f }, { -1.28f }, { 1.27f / 2.f} },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    }
+};
+
+INSTANTIATE_TEST_SUITE_P(smoke_LPT, MultiplyToGroupConvolutionTransformation,
+     ::testing::Combine(
+         ::testing::ValuesIn(precisions),
+         ::testing::ValuesIn(inputShapes),
+         ::testing::Values(CommonTestUtils::DEVICE_CPU),
+         ::testing::ValuesIn(params)),
+     MultiplyToGroupConvolutionTransformation::getTestCaseName);
+}  // namespace shape5d
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
index cee4583f67a78b..daf97124452880 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
@@ -9,18 +9,50 @@ using namespace InferenceEngine::details;
 
 namespace {
 const std::vector<element::Type> precisions = {
-    element::f32,
-    element::f16
+    element::f32
 };
 
-const std::vector<ngraph::PartialShape>inputShapes = {
-    { 1ul, 4ul, 16ul, 16ul }, { 1ul, 4ul, 16ul, 16ul, 16ul }
+namespace shape4d {
+const std::vector<ngraph::PartialShape> inputShapes = {
+    { 1ul, 3ul, 16ul, 16ul },
+    { 4ul, 3ul, 16ul, 16ul }
 };
 
-const std::vector<builder::subgraph::FakeQuantizeOnData> fqOnData = {
-    { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
-    { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 10.f }, { 25.5f } },
-    { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { -12.8f }, { 12.7f } }
+const std::vector<MultiplyToGroupConvolutionTransformationParam> params = {
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // Multiply with scalar is transformed to GroupConvolution
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{4.f}, element::f32, Shape{1, 1, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // multiply with scalar is transformed to groupconvolution
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { 0.f }, { 25.5f }, { 0.f }, { 25.5f } },
+        {{4.f}, element::f32, Shape{}},
+        "output/GroupConvolution",
+        "U8"
+    },
+    // zero point
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { -1.28f }, { 1.27f }, { -1.28f }, { 1.27f } },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1}},
+        "output/GroupConvolution",
+        "I8"
+    },
+    // zero point
+    {
+        { 256ul, ngraph::Shape { 1, 1, 1, 1 }, { -1.28f }, { 1.27f / 2.f }, { -1.28f }, { 1.27f / 2.f} },
+        {{1.f, 2.f, 3.f}, element::f32, Shape{1, 3, 1, 1}},
+        "output/GroupConvolution",
+        "U8"
+    }
 };
 
 INSTANTIATE_TEST_SUITE_P(smoke_LPT, MultiplyToGroupConvolutionTransformation,
@@ -28,6 +60,8 @@ INSTANTIATE_TEST_SUITE_P(smoke_LPT, MultiplyToGroupConvolutionTransformation,
         ::testing::ValuesIn(precisions),
         ::testing::ValuesIn(inputShapes),
         ::testing::Values(CommonTestUtils::DEVICE_GPU),
-        ::testing::ValuesIn(fqOnData)),
+        ::testing::ValuesIn(params)),
     MultiplyToGroupConvolutionTransformation::getTestCaseName);
+}  // namespace shape4d
+
 }  // namespace
diff --git a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_to_group_convolution_transformation.hpp b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_to_group_convolution_transformation.hpp
index 29827eeb0d9cf3..898bce4db4c715 100644
--- a/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_to_group_convolution_transformation.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/low_precision_transformations/multiply_to_group_convolution_transformation.hpp
@@ -8,6 +8,7 @@
 #include <memory>
 
 #include "shared_test_classes/base/low_precision_transformations/layer_transformation.hpp"
+#include "lpt_ngraph_functions/common/constant.hpp"
 #include "lpt_ngraph_functions/common/dequantization_operations.hpp"
 #include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
 
@@ -15,11 +16,19 @@ using namespace ngraph;
 
 namespace LayerTestsDefinitions {
 
+class MultiplyToGroupConvolutionTransformationParam {
+public:
+    builder::subgraph::FakeQuantizeOnData fqOnData;
+    builder::subgraph::Constant constant;
+    std::string layerName;
+    std::string expectedKernelType;
+};
+
 typedef std::tuple <
     element::Type,
     PartialShape,
     std::string,
-    builder::subgraph::FakeQuantizeOnData> MultiplyToGroupConvolutionTransformationParams;
+    MultiplyToGroupConvolutionTransformationParam> MultiplyToGroupConvolutionTransformationParams;
 
 class MultiplyToGroupConvolutionTransformation :
     public testing::WithParamInterface<MultiplyToGroupConvolutionTransformationParams>,
@@ -29,6 +38,7 @@ class MultiplyToGroupConvolutionTransformation :
 
 protected:
     void SetUp() override;
+    void Run() override;
 };
 
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
index 9368fa9877daa2..5260bbfcc11add 100644
--- a/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
+++ b/inference-engine/tests/functional/plugin/shared/src/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
@@ -26,24 +26,41 @@ std::string MultiplyToGroupConvolutionTransformation::getTestCaseName(testing::T
     ngraph::element::Type precision;
     ngraph::PartialShape shape;
     auto params = LayerTestsUtils::LayerTransformationParamsNGraphFactory::createParamsU8I8();
-    builder::subgraph::FakeQuantizeOnData fqOnData;
-    std::tie(precision, shape, targetDevice, fqOnData) = obj.param;
+    MultiplyToGroupConvolutionTransformationParam param;
+    std::tie(precision, shape, targetDevice, param) = obj.param;
 
     std::ostringstream result;
-    result << getTestCaseNameByParams(precision, shape, targetDevice, params) << "_" << fqOnData;
+    result << getTestCaseNameByParams(precision, shape, targetDevice, params) << "_" <<
+        param.fqOnData << "_" <<
+        param.constant << "_" <<
+        param.layerName << "_" <<
+        param.expectedKernelType;
     return result.str();
 }
 
 void MultiplyToGroupConvolutionTransformation::SetUp() {
     ngraph::PartialShape shape;
     ngraph::element::Type precision;
-    builder::subgraph::FakeQuantizeOnData fqOnData;
-    std::tie(precision, shape, targetDevice, fqOnData) = this->GetParam();
+    MultiplyToGroupConvolutionTransformationParam param;
+    std::tie(precision, shape, targetDevice, param) = this->GetParam();
 
     function = ngraph::builder::subgraph::MultiplyToGroupConvolutionFunction::getOriginal(
         precision,
         shape,
-        fqOnData);
+        param.fqOnData,
+        param.constant);
+}
+
+void MultiplyToGroupConvolutionTransformation::Run() {
+    LayerTestsCommon::Run();
+
+    const auto param = std::get<3>(GetParam());
+    const auto actualPrecision = getRuntimePrecision(param.layerName);
+    auto expectedPrecision = param.expectedKernelType;
+    if (expectedPrecision == "FP32" && std::get<0>(GetParam()) == ngraph::element::f16) {
+        expectedPrecision = "FP16";
+    }
+    EXPECT_EQ(actualPrecision, expectedPrecision);
 }
 
 TEST_P(MultiplyToGroupConvolutionTransformation, CompareWithRefImpl) {
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/multiply_to_group_convolution_function.hpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/multiply_to_group_convolution_function.hpp
index 0c366a5637fd25..e5e4410793db2e 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/multiply_to_group_convolution_function.hpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/include/lpt_ngraph_functions/multiply_to_group_convolution_function.hpp
@@ -9,6 +9,8 @@
 #include <ngraph/op/constant.hpp>
 #include <ngraph/opsets/opset1.hpp>
 
+#include "lpt_ngraph_functions/common/constant.hpp"
+#include "lpt_ngraph_functions/common/fake_quantize_on_data.hpp"
 #include "lpt_ngraph_functions/common/dequantization_operations.hpp"
 
 namespace ngraph {
@@ -26,7 +28,8 @@ class MultiplyToGroupConvolutionFunction {
     static std::shared_ptr<ngraph::Function> getOriginal(
         const ngraph::element::Type precision,
         const ngraph::PartialShape& inputShape,
-        const FakeQuantizeOnData& fqOnData);
+        const FakeQuantizeOnData& fqOnData,
+        const Constant& constant);
 
     static std::shared_ptr<ngraph::Function> getReference(
         const ngraph::PartialShape& inputShape,
diff --git a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/multiply_to_group_convolution_function.cpp b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/multiply_to_group_convolution_function.cpp
index e86d74ee7c7048..da6a9baf2d48dd 100644
--- a/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/multiply_to_group_convolution_function.cpp
+++ b/inference-engine/tests/ngraph_helpers/lpt_ngraph_functions/src/multiply_to_group_convolution_function.cpp
@@ -38,18 +38,27 @@ std::shared_ptr<ngraph::Function> MultiplyToGroupConvolutionFunction::getOrigina
 std::shared_ptr<ngraph::Function> MultiplyToGroupConvolutionFunction::getOriginal(
     const ngraph::element::Type precision,
     const ngraph::PartialShape& inputShape,
-    const FakeQuantizeOnData& fqOnData) {
+    const FakeQuantizeOnData& fqOnData,
+    const Constant& constant) {
     const auto input = std::make_shared<ngraph::opset1::Parameter>(precision, inputShape);
-    const auto fakeQuantizeOnActivations = makeFakeQuantize(input, precision, fqOnData);
-    const auto reshape = std::make_shared<ngraph::opset1::Reshape>(
-        fakeQuantizeOnActivations,
-        std::make_shared<ngraph::opset1::Constant>(element::i32, Shape{ static_cast<size_t>(inputShape.rank().get_length()) }, inputShape.to_shape()),
-        true);
-    reshape->set_friendly_name("output");
+    const auto fakeQuantize = makeFakeQuantize(input, precision, fqOnData);
 
-    ngraph::ResultVector results{
-        std::make_shared<ngraph::opset1::Result>(reshape)
-    };
+    const auto rank = inputShape.rank();
+    assert(rank.is_static());
+    const size_t size = rank.get_length() - 2;
+    const auto maxPool = std::make_shared<opset1::MaxPool>(
+        fakeQuantize,
+        Strides(size, 1),
+        Shape(size, 1),
+        Shape(size, 0),
+        Shape(size, 2));
+
+    const auto multiply = std::make_shared<ngraph::opset1::Multiply>(
+        maxPool,
+        std::make_shared<ngraph::opset1::Constant>(constant.outPrecision, constant.shape, constant.values));
+    multiply->set_friendly_name("output");
+
+    ngraph::ResultVector results{std::make_shared<ngraph::opset1::Result>(multiply)};
     return std::make_shared<ngraph::Function>(results, ngraph::ParameterVector{ input }, "MultiplyToGroupConvolutionFunction");
 }
 

From 8b196fd78a9eb783eee76d73f08e14e5184a2f48 Mon Sep 17 00:00:00 2001
From: Alexey Suhov <alexey.suhov@intel.com>
Date: Thu, 22 Jul 2021 23:40:00 +0300
Subject: [PATCH 46/71] [cpack] Install compiled vpu custom kernels (#6766)

---
 inference-engine/src/vpu/CMakeLists.txt | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/inference-engine/src/vpu/CMakeLists.txt b/inference-engine/src/vpu/CMakeLists.txt
index 959ad02186c000..3a11a33509736c 100644
--- a/inference-engine/src/vpu/CMakeLists.txt
+++ b/inference-engine/src/vpu/CMakeLists.txt
@@ -20,6 +20,9 @@ if(ENABLE_MYRIAD)
         install(DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/custom_kernels/
                 DESTINATION ${IE_CPACK_LIBRARY_PATH}/vpu_custom_kernels
                 COMPONENT myriad)
+        install(DIRECTORY ${CMAKE_LIBRARY_OUTPUT_DIRECTORY}/vpu_custom_kernels/
+                DESTINATION ${IE_CPACK_LIBRARY_PATH}/vpu_custom_kernels
+                COMPONENT myriad)
         install(DIRECTORY ${VPU_CLC_MA2X8X_ROOT}/
                 DESTINATION deployment_tools/tools/cl_compiler
                 COMPONENT myriad

From 22b9431a14c56009898c4f9983825a35f0491d31 Mon Sep 17 00:00:00 2001
From: Andrey Somsikov <andrey.somsikov@intel.com>
Date: Thu, 22 Jul 2021 23:52:50 +0300
Subject: [PATCH 47/71] Add install target to fuzz tests (#6761)

---
 tests/fuzz/src/CMakeLists.txt | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/tests/fuzz/src/CMakeLists.txt b/tests/fuzz/src/CMakeLists.txt
index b9400d9e7e1d7d..d701b20da7c45b 100644
--- a/tests/fuzz/src/CMakeLists.txt
+++ b/tests/fuzz/src/CMakeLists.txt
@@ -19,4 +19,7 @@ foreach(test_source ${tests})
     target_link_libraries(${test_name} PRIVATE IE::inference_engine cnpy zlib)
 
     add_dependencies(fuzz ${test_name})
+
+    install(TARGETS ${test_name}
+            RUNTIME DESTINATION tests COMPONENT tests EXCLUDE_FROM_ALL)
 endforeach()

From f328eeced62b13533ec55d110ef784b7e147726e Mon Sep 17 00:00:00 2001
From: Eugeny Volosenkov <eugeny.volosenkov@intel.com>
Date: Fri, 23 Jul 2021 07:03:25 +0300
Subject: [PATCH 48/71] MultiSubgraph in nGraph (#6621)

* Add multisubgraph

* Fix format

* Fix clang format

* Fix TensorIterator RTT

* Fix subgraph

* Fix codestyle

* Fix comments

* Fix comments

* Fix coments

* Fix comments

* delete get function

* fix methods

* fix ci

* Fix ci

* fix bugs

* Fix cmake

* Fix ci

* delete virtual function

* delete virtual function

* fix ci

* Fix ci
---
 .../include/ngraph/op/tensor_iterator.hpp     |   6 +-
 .../ngraph/op/util/multi_subgraph_base.hpp    | 366 ++++++++++++++++++
 .../include/ngraph/op/util/sub_graph_base.hpp | 259 +------------
 ngraph/core/src/op/loop.cpp                   |  72 ++--
 ngraph/core/src/op/tensor_iterator.cpp        |  71 ++--
 .../core/src/op/util/multi_subgraph_base.cpp  | 210 ++++++++++
 ngraph/core/src/op/util/sub_graph_base.cpp    | 146 +------
 7 files changed, 701 insertions(+), 429 deletions(-)
 create mode 100644 ngraph/core/include/ngraph/op/util/multi_subgraph_base.hpp
 create mode 100644 ngraph/core/src/op/util/multi_subgraph_base.cpp

diff --git a/ngraph/core/include/ngraph/op/tensor_iterator.hpp b/ngraph/core/include/ngraph/op/tensor_iterator.hpp
index de44f4b638edeb..41e02d43ca94c9 100644
--- a/ngraph/core/include/ngraph/op/tensor_iterator.hpp
+++ b/ngraph/core/include/ngraph/op/tensor_iterator.hpp
@@ -30,13 +30,11 @@ namespace ngraph
                 std::shared_ptr<Node>
                     clone_with_new_inputs(const OutputVector& new_args) const override;
                 /// \return the body of the iteration
-                std::shared_ptr<Function> get_body() const { return m_body; }
+                std::shared_ptr<Function> get_body() const { return m_bodies[0]; }
                 /// \param body set the body of the iteration
-                void set_body(const std::shared_ptr<Function>& body) { m_body = body; }
+                void set_body(const std::shared_ptr<Function>& body) { set_function(body); }
                 void validate_and_infer_types() override;
                 void revalidate_and_infer_types_for_body_ops();
-                /// \return the body of the iteration
-                std::shared_ptr<Function> get_function() override;
 
             private:
                 void try_to_set_num_iterations_if_no_slice_inputs();
diff --git a/ngraph/core/include/ngraph/op/util/multi_subgraph_base.hpp b/ngraph/core/include/ngraph/op/util/multi_subgraph_base.hpp
new file mode 100644
index 00000000000000..c50b98aa4c757a
--- /dev/null
+++ b/ngraph/core/include/ngraph/op/util/multi_subgraph_base.hpp
@@ -0,0 +1,366 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include <ngraph/op/parameter.hpp>
+#include "ngraph/op/op.hpp"
+
+namespace ngraph
+{
+    namespace op
+    {
+        namespace util
+        {
+            /// \brief Abstract base class for sub-graph based ops, i.e ops that have some
+            /// sub-graphs
+            ///
+            class NGRAPH_API MultiSubGraphOp : public Op
+            {
+            public:
+                NGRAPH_RTTI_DECLARATION;
+                /// \brief Abstract class describes a connection between a MultiSubGraphOp input and
+                /// the body.
+                class InputDescription
+                {
+                protected:
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      input_index           Position of the MultiSubGraphOp input
+                    /// \param      body_parameter_index  Body parameter to receive input
+                    ///
+                    InputDescription(uint64_t input_index, uint64_t body_parameter_index);
+                    InputDescription() = default;
+
+                public:
+                    using type_info_t = DiscreteTypeInfo;
+                    virtual ~InputDescription() = default;
+                    virtual std::shared_ptr<InputDescription> copy() const = 0;
+
+                    virtual const type_info_t& get_type_info() const = 0;
+
+                    uint64_t m_input_index{0};
+                    uint64_t m_body_parameter_index{0};
+                };
+
+                /// \brief Abstract class describes how a MultiSubGraphOp output is produced from
+                /// the body.
+                class OutputDescription
+                {
+                protected:
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      body_value_index  A body value that produces the output
+                    /// \param      output_index      The MultiSubGraphOp output index
+                    ///
+                    OutputDescription(uint64_t body_value_index, uint64_t output_index);
+                    OutputDescription() = default;
+
+                public:
+                    using type_info_t = DiscreteTypeInfo;
+                    virtual ~OutputDescription() = default;
+                    virtual std::shared_ptr<OutputDescription> copy() const = 0;
+                    virtual const type_info_t& get_type_info() const = 0;
+
+                    uint64_t m_body_value_index{0};
+                    uint64_t m_output_index{0};
+                };
+
+                ///
+                /// \brief      Describes a body input formed from slices of an input to
+                ///             MultiSubGraphOp.
+                ///
+                class NGRAPH_API SliceInputDescription : public InputDescription
+                {
+                public:
+                    NGRAPH_RTTI_DECLARATION;
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      input_index           Position of the MultiSubGraphOp input
+                    /// \param      body_parameter_index  Body parameter position to receive input
+                    /// \param      start                 First index for slices
+                    /// \param      stride                Step amount for slices
+                    /// \param      part_size             Width of slices
+                    /// \param      end                   Last index for slices
+                    /// \param      axis                  Axis being sliced
+                    ///
+                    SliceInputDescription(uint64_t input_index,
+                                          uint64_t body_parameter_index,
+                                          int64_t start,
+                                          int64_t stride,
+                                          int64_t part_size,
+                                          int64_t end,
+                                          int64_t axis);
+                    SliceInputDescription() = default;
+                    std::shared_ptr<InputDescription> copy() const override;
+                    int64_t m_start{0};
+                    int64_t m_stride{0};
+                    int64_t m_part_size{0};
+                    int64_t m_end{0};
+                    int64_t m_axis{0};
+                };
+
+                ///
+                /// \brief      Describes a body input initialized from a MultiSubGraphOp input
+                ///             on the first iteration, and then a body output thereafter.
+                ///
+                class NGRAPH_API MergedInputDescription : public InputDescription
+                {
+                public:
+                    NGRAPH_RTTI_DECLARATION;
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      input_index           Position of the MultiSubGraphOp input
+                    ///                                   supplying a value to body_parameter for
+                    ///                                   the initial iteration.
+                    /// \param      body_parameter_index  Body parameter position to receive input.
+                    /// \param      body_value_index      Body value to supply body_parameter for
+                    /// successive
+                    ///                                   iterations.
+                    ///
+                    MergedInputDescription(uint64_t input_index,
+                                           uint64_t body_parameter_index,
+                                           uint64_t body_value_index);
+                    MergedInputDescription() = default;
+                    std::shared_ptr<InputDescription> copy() const override;
+                    uint64_t m_body_value_index{0};
+                };
+
+                /// \brief Produces an output by concatenating an output from each iteration
+                class NGRAPH_API ConcatOutputDescription : public OutputDescription
+                {
+                public:
+                    NGRAPH_RTTI_DECLARATION;
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      body_value_index  A body value that produces the output
+                    /// \param      output_index      The MultiSubGraphOp output index
+                    /// \param      start             First index for slices
+                    /// \param      stride            Step amount for slices
+                    /// \param      part_size         Width of slices
+                    /// \param      end               Last index for slices
+                    /// \param      axis              Axis being sliced
+                    ///
+                    ConcatOutputDescription(uint64_t body_value_index,
+                                            uint64_t output_index,
+                                            int64_t start,
+                                            int64_t stride,
+                                            int64_t part_size,
+                                            int64_t end,
+                                            int64_t axis);
+                    ConcatOutputDescription() = default;
+
+                    std::shared_ptr<OutputDescription> copy() const override;
+                    int64_t m_start{0};
+                    int64_t m_stride{0};
+                    int64_t m_part_size{0};
+                    int64_t m_end{0};
+                    int64_t m_axis{0};
+                };
+
+                /// \brief Produces an input
+                class NGRAPH_API InvariantInputDescription : public InputDescription
+                {
+                public:
+                    NGRAPH_RTTI_DECLARATION;
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      input_index           Position of the MultiSubGraphOp input
+                    /// \param      body_parameter_index  Body parameter to receive input
+                    ///
+                    InvariantInputDescription(uint64_t input_index, uint64_t body_parameter_index);
+                    InvariantInputDescription() = default;
+                    std::shared_ptr<InputDescription> copy() const override;
+                };
+
+                /// \brief Produces an output from a specific iteration
+                class NGRAPH_API BodyOutputDescription : public MultiSubGraphOp::OutputDescription
+                {
+                public:
+                    NGRAPH_RTTI_DECLARATION;
+                    ///
+                    /// \brief      Constructs a new instance.
+                    ///
+                    /// \param      body_value_index  A body value that produces the output
+                    /// \param      output_index      The SubGraphOp output index
+                    /// \param      iteration         which iteration (typically -1, final) will
+                    ///                               supply the value
+                    ///
+                    BodyOutputDescription(uint64_t body_value_index,
+                                          uint64_t output_index,
+                                          int64_t iteration = -1);
+                    BodyOutputDescription() = default;
+                    std::shared_ptr<MultiSubGraphOp::OutputDescription> copy() const override;
+                    int64_t m_iteration{0};
+                };
+                using MultiSubgraphInputDescriptionPtr =
+                    std::shared_ptr<MultiSubGraphOp::InputDescription>;
+                using MultiSubgraphOutputDescriptionPtr =
+                    std::shared_ptr<MultiSubGraphOp::OutputDescription>;
+                using MultiSubgraphInputDescriptionVector =
+                    std::vector<MultiSubgraphInputDescriptionPtr>;
+                using MultiSubgraphOutputDescriptionVector =
+                    std::vector<MultiSubgraphOutputDescriptionPtr>;
+
+                /// \brief     Gets internal sub-graph by index in MultiSubGraphOp
+                ///
+                /// \param     index sub-graph's index in op
+                /// \return pointer to ngraph::Function with sub-graph
+                virtual const std::shared_ptr<Function>& get_function(int index) const
+                {
+                    return m_bodies[index];
+                };
+                /// \brief     Adds sub-graph to MultiSubGraphOp
+                ///
+                /// \param index   index of new sub-graph
+                /// \param func    func new sub_graph as ngraph::Function
+                virtual void set_function(int index, const std::shared_ptr<Function>& func)
+                {
+                    m_bodies[index] = func;
+                }
+                /// \brief     Gets vector with connections beewtwen operation inputs
+                /// and internal sub-graph parameters
+                ///
+                /// \param index   index of internal sub-graph
+                /// \return vector of input descriptions
+                const MultiSubgraphInputDescriptionVector& get_input_descriptions(int index) const
+                {
+                    return m_input_descriptions[index];
+                }
+                /// \brief     Gets vector with connections beewtwen operation inputs
+                /// and internal sub-graph parameters
+                ///
+                /// \param index   index of internal sub-graph
+                /// \return vector of input descriptions
+                MultiSubgraphInputDescriptionVector& get_input_descriptions(int index)
+                {
+                    return m_input_descriptions[index];
+                }
+                /// \brief     Gets vector with connections beewtwen operation outputs
+                /// and internal sub-graph results
+                ///
+                /// \param index   index of internal sub-graph
+                /// \return vector of output descriptions
+                const MultiSubgraphOutputDescriptionVector& get_output_descriptions(int index) const
+                {
+                    return m_output_descriptions[index];
+                }
+                /// \brief     Gets vector with connections beewtwen operation outputs
+                /// and internal sub-graph results
+                ///
+                /// \param index   index of internal sub-graph
+                /// \return vector of output descriptions
+                MultiSubgraphOutputDescriptionVector& get_output_descriptions(int index)
+                {
+                    return m_output_descriptions[index];
+                }
+                /// \brief     Sets vector with connections beewtwen operation inputs
+                /// and internal sub-graph parameters
+                ///
+                /// \param index   index of internal sub-graph
+                /// \param inputs  vector of input descriptions
+                void set_input_descriptions(int index,
+                                            const MultiSubgraphInputDescriptionVector& inputs)
+                {
+                    m_input_descriptions[index] = inputs;
+                }
+
+                /// \brief     Sets vector with connections beewtwen operation outputs
+                /// and internal sub-graph results
+                ///
+                /// \param index   index of internal sub-graph
+                /// \param outputs vector of input descriptions
+                void set_output_descriptions(int index,
+                                             const MultiSubgraphOutputDescriptionVector& outputs)
+                {
+                    m_output_descriptions[index] = outputs;
+                }
+
+                ///
+                /// \brief     Set input decriptions for MultiSubGraphOp input.
+                ///
+                /// \param      value              The value supplied as an input to the block.
+                /// \param      bodies_parameters  vector of bodies parameters.
+                virtual void set_invariant_inputs(const Output<Node>& value,
+                                                  const ParameterVector& bodies_parameters);
+                ///
+                /// \brief     Set output decriptions for MultiSubGraphOp output.
+                ///
+                /// \param      bodies_results  vector of bodies results for one output.
+                /// \return     value           Output node for bodies_results.
+                virtual Output<Node> set_body_outputs(const ResultVector& bodies_results);
+
+                MultiSubGraphOp(const MultiSubGraphOp&) = delete;
+                MultiSubGraphOp(MultiSubGraphOp&&) = default;
+
+                MultiSubGraphOp& operator=(const MultiSubGraphOp&) = delete;
+                MultiSubGraphOp& operator=(MultiSubGraphOp&&) = default;
+
+            protected:
+                // Find an input corresponding to value, adding one if necessary.
+                Input<Node> input_for_value(const Output<Node>& value);
+
+                MultiSubGraphOp(size_t number_of_bodies);
+                MultiSubGraphOp() = default;
+                MultiSubGraphOp(const OutputVector& args, size_t number_of_bodies);
+                explicit MultiSubGraphOp(const OutputVector& args);
+
+                std::vector<std::shared_ptr<Function>> m_bodies;
+                std::vector<MultiSubgraphInputDescriptionVector> m_input_descriptions;
+                std::vector<MultiSubgraphOutputDescriptionVector> m_output_descriptions;
+            };
+            using MultiSubgraphInputDescriptionPtr =
+                util::MultiSubGraphOp::MultiSubgraphInputDescriptionPtr;
+            using MultiSubgraphOutputDescriptionPtr =
+                util::MultiSubGraphOp::MultiSubgraphOutputDescriptionPtr;
+            using MultiSubgraphInputDescriptionVector =
+                util::MultiSubGraphOp::MultiSubgraphInputDescriptionVector;
+            using MultiSubgraphOutputDescriptionVector =
+                util::MultiSubGraphOp::MultiSubgraphOutputDescriptionVector;
+
+        } // namespace util
+    }     // namespace op
+
+    template <>
+    class NGRAPH_API AttributeAdapter<
+        std::vector<std::shared_ptr<ngraph::op::util::MultiSubGraphOp::InputDescription>>>
+        : public DirectValueAccessor<
+              std::vector<std::shared_ptr<ngraph::op::util::MultiSubGraphOp::InputDescription>>>
+    {
+    public:
+        AttributeAdapter(
+            std::vector<std::shared_ptr<ngraph::op::util::MultiSubGraphOp::InputDescription>>&
+                value)
+            : DirectValueAccessor<std::vector<
+                  std::shared_ptr<ngraph::op::util::MultiSubGraphOp::InputDescription>>>(value)
+        {
+        }
+
+        NGRAPH_RTTI_DECLARATION;
+    };
+
+    template <>
+    class NGRAPH_API AttributeAdapter<
+        std::vector<std::shared_ptr<ngraph::op::util::MultiSubGraphOp::OutputDescription>>>
+        : public DirectValueAccessor<
+              std::vector<std::shared_ptr<ngraph::op::util::MultiSubGraphOp::OutputDescription>>>
+    {
+    public:
+        AttributeAdapter(
+            std::vector<std::shared_ptr<ngraph::op::util::MultiSubGraphOp::OutputDescription>>&
+                value)
+            : DirectValueAccessor<std::vector<
+                  std::shared_ptr<ngraph::op::util::MultiSubGraphOp::OutputDescription>>>(value)
+        {
+        }
+
+        NGRAPH_RTTI_DECLARATION;
+    };
+} // namespace ngraph
diff --git a/ngraph/core/include/ngraph/op/util/sub_graph_base.hpp b/ngraph/core/include/ngraph/op/util/sub_graph_base.hpp
index a44c830b78c6c9..44701e382e5ba3 100644
--- a/ngraph/core/include/ngraph/op/util/sub_graph_base.hpp
+++ b/ngraph/core/include/ngraph/op/util/sub_graph_base.hpp
@@ -5,7 +5,7 @@
 #pragma once
 
 #include <ngraph/op/parameter.hpp>
-#include "ngraph/op/op.hpp"
+#include "ngraph/op/util/multi_subgraph_base.hpp"
 
 namespace ngraph
 {
@@ -13,226 +13,46 @@ namespace ngraph
     {
         namespace util
         {
-            /// \brief Abstract base class for sub-graph based ops, i.e ops that have sub-graph
+            /// \brief Abstract base class for sub-graph based ops, i.e ops that have only one
+            /// sub-graph
             ///
-            class NGRAPH_API SubGraphOp : public Op
+            class NGRAPH_API SubGraphOp : public MultiSubGraphOp
             {
             public:
                 NGRAPH_RTTI_DECLARATION;
-                /// \brief Describes a connection between a SubGraphOp input and the body.
-                class InputDescription
-                {
-                protected:
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      input_index           Position of the SubGraphOp input
-                    /// \param      body_parameter_index  Body parameter to receive input
-                    ///
-                    InputDescription(uint64_t input_index, uint64_t body_parameter_index);
-                    InputDescription() = default;
-
-                public:
-                    using type_info_t = DiscreteTypeInfo;
-                    virtual ~InputDescription() = default;
-                    virtual std::shared_ptr<InputDescription> copy() const = 0;
-
-                    virtual const type_info_t& get_type_info() const = 0;
-
-                    uint64_t m_input_index{0};
-                    uint64_t m_body_parameter_index{0};
-                };
 
-                ///
-                /// \brief      Describes a body input formed from slices of an input to
-                ///             SubGraphOp.
-                ///
-                class NGRAPH_API SliceInputDescription : public InputDescription
+                virtual const std::shared_ptr<Function>& get_function() const
                 {
-                public:
-                    static constexpr type_info_t type_info{"SliceInputDescription", 0};
-                    const type_info_t& get_type_info() const override { return type_info; }
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      input_index           Position of the SubGraphOp input
-                    /// \param      body_parameter_index  Body parameter position to receive input
-                    /// \param      start                 First index for slices
-                    /// \param      stride                Step amount for slices
-                    /// \param      part_size             Width of slices
-                    /// \param      end                   Last index for slices
-                    /// \param      axis                  Axis being sliced
-                    ///
-                    SliceInputDescription(uint64_t input_index,
-                                          uint64_t body_parameter_index,
-                                          int64_t start,
-                                          int64_t stride,
-                                          int64_t part_size,
-                                          int64_t end,
-                                          int64_t axis);
-                    SliceInputDescription() = default;
-                    std::shared_ptr<InputDescription> copy() const override;
-                    int64_t m_start{0};
-                    int64_t m_stride{0};
-                    int64_t m_part_size{0};
-                    int64_t m_end{0};
-                    int64_t m_axis{0};
+                    return m_bodies[0];
                 };
-
-                ///
-                /// \brief      Describes a body input initialized from a SubGraphOp input on
-                ///             the first iteration, and then a body output thereafter.
-                ///
-                class NGRAPH_API MergedInputDescription : public InputDescription
+                virtual void set_function(const std::shared_ptr<Function>& func)
                 {
-                public:
-                    static constexpr type_info_t type_info{"MergedInputDescription", 0};
-                    const type_info_t& get_type_info() const override { return type_info; }
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      input_index           Position of the SubGraphOp input
-                    ///                                   supplying a value to body_parameter for
-                    ///                                   the initial iteration.
-                    /// \param      body_parameter_index  Body parameter position to receive input.
-                    /// \param      body_value_index      Body value to supply body_parameter for
-                    /// successive
-                    ///                                   iterations.
-                    ///
-                    MergedInputDescription(uint64_t input_index,
-                                           uint64_t body_parameter_index,
-                                           uint64_t body_value_index);
-                    MergedInputDescription() = default;
-                    std::shared_ptr<InputDescription> copy() const override;
-                    uint64_t m_body_value_index{0};
+                    m_bodies[0] = func;
                 };
-
-                ///
-                /// \brief      Describes a body input initialized from a SubGraphOp input on
-                ///             the first iteration, and invariant thereafter.
-                ///
-                class NGRAPH_API InvariantInputDescription : public InputDescription
-                {
-                public:
-                    static constexpr type_info_t type_info{"InvariantInputDescription", 0};
-                    const type_info_t& get_type_info() const override { return type_info; }
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      input_index           Position of the SubGraphOp input
-                    /// \param      body_parameter_index  Body parameter to receive input
-                    ///
-                    InvariantInputDescription(uint64_t input_index, uint64_t body_parameter_index);
-                    InvariantInputDescription() = default;
-                    std::shared_ptr<InputDescription> copy() const override;
-                };
-
-                /// \brief Describes how a SubGraphOp output is produced from the body.
-                class OutputDescription
-                {
-                protected:
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      body_value_index  A body value that produces the output
-                    /// \param      output_index      The SubGraphOp output index
-                    ///
-                    OutputDescription(uint64_t body_value_index, uint64_t output_index);
-                    OutputDescription() = default;
-
-                public:
-                    using type_info_t = DiscreteTypeInfo;
-                    virtual ~OutputDescription() = default;
-                    virtual std::shared_ptr<OutputDescription> copy() const = 0;
-                    virtual const type_info_t& get_type_info() const = 0;
-
-                    uint64_t m_body_value_index{0};
-                    uint64_t m_output_index{0};
-                };
-
-                /// \brief Produces an output by concatenating an output from each iteration
-                class NGRAPH_API ConcatOutputDescription : public OutputDescription
-                {
-                public:
-                    static constexpr type_info_t type_info{"ConcatOutputDescription", 0};
-                    const type_info_t& get_type_info() const override { return type_info; }
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      body_value_index  A body value that produces the output
-                    /// \param      output_index      The SubGraphOp output index
-                    /// \param      start             First index for slices
-                    /// \param      stride            Step amount for slices
-                    /// \param      part_size         Width of slices
-                    /// \param      end               Last index for slices
-                    /// \param      axis              Axis being sliced
-                    ///
-                    ConcatOutputDescription(uint64_t body_value_index,
-                                            uint64_t output_index,
-                                            int64_t start,
-                                            int64_t stride,
-                                            int64_t part_size,
-                                            int64_t end,
-                                            int64_t axis);
-                    ConcatOutputDescription() = default;
-
-                    std::shared_ptr<OutputDescription> copy() const override;
-                    int64_t m_start{0};
-                    int64_t m_stride{0};
-                    int64_t m_part_size{0};
-                    int64_t m_end{0};
-                    int64_t m_axis{0};
-                };
-
-                /// \brief Produces an output from a specific iteration
-                class NGRAPH_API BodyOutputDescription : public OutputDescription
-                {
-                public:
-                    static constexpr type_info_t type_info{"BodyOutputDescription", 0};
-                    const type_info_t& get_type_info() const override { return type_info; }
-                    ///
-                    /// \brief      Constructs a new instance.
-                    ///
-                    /// \param      body_value_index  A body value that produces the output
-                    /// \param      output_index      The SubGraphOp output index
-                    /// \param      iteration         which iteration (typically -1, final) will
-                    ///                               supply the value
-                    ///
-                    BodyOutputDescription(uint64_t body_value_index,
-                                          uint64_t output_index,
-                                          int64_t iteration);
-                    BodyOutputDescription() = default;
-                    std::shared_ptr<OutputDescription> copy() const override;
-                    int64_t m_iteration{0};
-                };
-
-                virtual std::shared_ptr<Function> get_function() { return m_body; };
-                virtual std::shared_ptr<const Function> get_function() const { return m_body; };
-                virtual void set_function(const std::shared_ptr<Function>& func) { m_body = func; };
                 /// \return a reference to the input descriptions.
                 const std::vector<std::shared_ptr<InputDescription>>& get_input_descriptions() const
                 {
-                    return m_input_descriptions;
+                    return m_input_descriptions[0];
                 }
                 /// \return a reference to the input descriptions. Can add input descriptions
                 /// before
                 /// validation.
                 std::vector<std::shared_ptr<InputDescription>>& get_input_descriptions()
                 {
-                    return m_input_descriptions;
+                    return m_input_descriptions[0];
                 }
                 /// \return a reference to the output descriptions.
                 const std::vector<std::shared_ptr<OutputDescription>>&
                     get_output_descriptions() const
                 {
-                    return m_output_descriptions;
+                    return m_output_descriptions[0];
                 }
                 /// \return a reference to the output descriptions. Can add output descriptions
                 /// before
                 /// validation.
                 std::vector<std::shared_ptr<OutputDescription>>& get_output_descriptions()
                 {
-                    return m_output_descriptions;
+                    return m_output_descriptions[0];
                 }
 
                 ///
@@ -324,15 +144,13 @@ namespace ngraph
                 // Find an input corresponding to value, adding one if necessary.
                 Input<Node> input_for_value(const Output<Node>& value);
 
-                SubGraphOp() = default;
-
+                SubGraphOp();
                 explicit SubGraphOp(const OutputVector& args);
 
-                std::shared_ptr<Function> m_body;
-                std::vector<std::shared_ptr<op::util::SubGraphOp::InputDescription>>
-                    m_input_descriptions;
-                std::vector<std::shared_ptr<op::util::SubGraphOp::OutputDescription>>
-                    m_output_descriptions;
+            private:
+                using MultiSubGraphOp::get_function;
+
+                using MultiSubGraphOp::set_function;
             };
             using InputDescriptionPtr = std::shared_ptr<util::SubGraphOp::InputDescription>;
             using OutputDescriptionPtr = std::shared_ptr<util::SubGraphOp::OutputDescription>;
@@ -341,47 +159,4 @@ namespace ngraph
         } // namespace util
     }     // namespace op
 
-    template <>
-    class NGRAPH_API AttributeAdapter<
-        std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::InputDescription>>>
-        : public DirectValueAccessor<
-              std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::InputDescription>>>
-    {
-    public:
-        AttributeAdapter(
-            std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::InputDescription>>& value)
-            : DirectValueAccessor<
-                  std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::InputDescription>>>(
-                  value)
-        {
-        }
-
-        static constexpr DiscreteTypeInfo type_info{
-            "AttributeAdapter<std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::"
-            "InputDescription>>>",
-            0};
-        const DiscreteTypeInfo& get_type_info() const override { return type_info; }
-    };
-
-    template <>
-    class NGRAPH_API AttributeAdapter<
-        std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::OutputDescription>>>
-        : public DirectValueAccessor<
-              std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::OutputDescription>>>
-    {
-    public:
-        AttributeAdapter(
-            std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::OutputDescription>>& value)
-            : DirectValueAccessor<
-                  std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::OutputDescription>>>(
-                  value)
-        {
-        }
-
-        static constexpr DiscreteTypeInfo type_info{
-            "AttributeAdapter<std::vector<std::shared_ptr<ngraph::op::util::SubGraphOp::"
-            "OutputDescription>>>",
-            0};
-        const DiscreteTypeInfo& get_type_info() const override { return type_info; }
-    };
 } // namespace ngraph
diff --git a/ngraph/core/src/op/loop.cpp b/ngraph/core/src/op/loop.cpp
index 2941d46d2e2345..b7cc41288100d9 100644
--- a/ngraph/core/src/op/loop.cpp
+++ b/ngraph/core/src/op/loop.cpp
@@ -18,6 +18,7 @@ using namespace ngraph;
 NGRAPH_RTTI_DEFINITION(op::v5::Loop, "Loop", 5);
 
 op::v5::Loop::Loop(const Output<Node>& trip_count, const Output<Node>& execution_condition)
+    : SubGraphOp()
 {
     set_argument(0, trip_count);
     set_argument(1, execution_condition);
@@ -26,9 +27,9 @@ op::v5::Loop::Loop(const Output<Node>& trip_count, const Output<Node>& execution
 bool op::v5::Loop::visit_attributes(AttributeVisitor& visitor)
 {
     NGRAPH_OP_SCOPE(v5_Loop_visit_attributes);
-    visitor.on_attribute("body", m_body);
-    visitor.on_attribute("input_descriptions", m_input_descriptions);
-    visitor.on_attribute("output_descriptions", m_output_descriptions);
+    visitor.on_attribute("body", m_bodies[0]);
+    visitor.on_attribute("input_descriptions", m_input_descriptions[0]);
+    visitor.on_attribute("output_descriptions", m_output_descriptions[0]);
     visitor.on_attribute("special_body_ports", m_special_body_ports);
 
     return true;
@@ -37,9 +38,21 @@ bool op::v5::Loop::visit_attributes(AttributeVisitor& visitor)
 void op::v5::Loop::validate_and_infer_types()
 {
     NGRAPH_OP_SCOPE(v5_Loop_validate_and_infer_types);
+
+    NODE_VALIDATION_CHECK(
+        this, m_bodies.size() == 1, "Number of bodies for loop is greater than 1");
+
+    NODE_VALIDATION_CHECK(this,
+                          m_input_descriptions.size() == 1,
+                          "Loop contains input descriptions for other bodies");
+    NODE_VALIDATION_CHECK(this,
+                          m_output_descriptions.size() == 1,
+                          "Loop contains output descriptions for other bodies");
+
     if (m_special_body_ports.current_iteration_input_idx >= 0)
     {
-        const auto& cur_iter_rank = m_body->get_parameters()
+        const auto& cur_iter_rank = m_bodies[0]
+                                        ->get_parameters()
                                         .at(m_special_body_ports.current_iteration_input_idx)
                                         ->get_partial_shape()
                                         .rank();
@@ -78,8 +91,10 @@ void op::v5::Loop::validate_and_infer_types()
         // special body ports were not set yet, so we can't calculate output shape
         return;
 
-    const auto& body_execution_condition =
-        m_body->get_results().at(m_special_body_ports.body_condition_output_idx)->input_value(0);
+    const auto& body_execution_condition = m_bodies[0]
+                                               ->get_results()
+                                               .at(m_special_body_ports.body_condition_output_idx)
+                                               ->input_value(0);
     const auto& body_condition_rank = body_execution_condition.get_partial_shape().rank();
     if (body_condition_rank.is_static())
     {
@@ -110,7 +125,7 @@ void op::v5::Loop::validate_and_infer_types()
         // Const(true or false) -> Loop (body: Parameter -> execution_condition output)
         for (const auto& desc : get_input_descriptions())
         {
-            if (m_body->get_parameters().at(desc->m_body_parameter_index) == cond_param)
+            if (m_bodies[0]->get_parameters().at(desc->m_body_parameter_index) == cond_param)
             {
                 if (const auto& cond_value =
                         get_constant_from_source(input_value(desc->m_input_index)))
@@ -156,7 +171,7 @@ void op::v5::Loop::validate_and_infer_types()
     // the inputs.
     // When using visit_attributes() no duplication occurs, input_offset shall be decremented.
     size_t input_offset = 2;
-    for (const auto& in_desc : m_input_descriptions)
+    for (const auto& in_desc : m_input_descriptions[0])
     {
         if (in_desc->m_input_index == 0 || in_desc->m_input_index == 1)
         {
@@ -169,18 +184,18 @@ void op::v5::Loop::validate_and_infer_types()
     NODE_VALIDATION_CHECK(this, input_offset >= 0, "External port id 0 or 1 is duplicated.");
 
     NODE_VALIDATION_CHECK(this,
-                          get_input_size() == m_input_descriptions.size() + input_offset,
+                          get_input_size() == m_input_descriptions[0].size() + input_offset,
                           "Number of inputs must be the same as number of input descriptions");
 
     // Input
-    for (const auto& input_description : m_input_descriptions)
+    for (const auto& input_description : m_input_descriptions[0])
     {
         auto index = input_description->m_input_index;
 
         if (auto slice_input_description = as_type_ptr<SliceInputDescription>(input_description))
         {
             auto body_parameter =
-                m_body->get_parameters().at(slice_input_description->m_body_parameter_index);
+                m_bodies[0]->get_parameters().at(slice_input_description->m_body_parameter_index);
             const auto& input_partial_shape =
                 inputs().at(index).get_source_output().get_partial_shape();
             if (input_partial_shape.rank().is_dynamic())
@@ -200,10 +215,10 @@ void op::v5::Loop::validate_and_infer_types()
                      as_type_ptr<MergedInputDescription>(input_description))
         {
             auto body_value =
-                m_body->get_results().at(merged_input_description->m_body_value_index);
+                m_bodies[0]->get_results().at(merged_input_description->m_body_value_index);
 
             auto body_parameter =
-                m_body->get_parameters().at(merged_input_description->m_body_parameter_index);
+                m_bodies[0]->get_parameters().at(merged_input_description->m_body_parameter_index);
 
             auto body_param_partial_shape = body_parameter->get_partial_shape();
             auto input_partial_shape = input(index).get_partial_shape();
@@ -213,8 +228,8 @@ void op::v5::Loop::validate_and_infer_types()
         else if (auto invariant_input_description =
                      as_type_ptr<TensorIterator::InvariantInputDescription>(input_description))
         {
-            auto body_parameter =
-                m_body->get_parameters().at(invariant_input_description->m_body_parameter_index);
+            auto body_parameter = m_bodies[0]->get_parameters().at(
+                invariant_input_description->m_body_parameter_index);
 
             auto body_param_partial_shape = body_parameter->get_partial_shape();
             auto input_partial_shape = input(index).get_partial_shape();
@@ -224,15 +239,15 @@ void op::v5::Loop::validate_and_infer_types()
     }
 
     // Body
-    m_body->validate_nodes_and_infer_types();
+    m_bodies[0]->validate_nodes_and_infer_types();
 
     // Output
-    for (const auto& output_description : m_output_descriptions)
+    for (const auto& output_description : m_output_descriptions[0])
     {
         auto index = output_description->m_output_index;
 
         auto body_value =
-            m_body->get_results().at(output_description->m_body_value_index)->input_value(0);
+            m_bodies[0]->get_results().at(output_description->m_body_value_index)->input_value(0);
 
         if (auto concat_output_description =
                 as_type_ptr<TensorIterator::ConcatOutputDescription>(output_description))
@@ -286,7 +301,7 @@ void op::v5::Loop::validate_and_infer_types()
     }
 
     NODE_VALIDATION_CHECK(this,
-                          get_output_size() == m_output_descriptions.size(),
+                          get_output_size() == m_output_descriptions[0].size(),
                           "Number of outputs must be the same as number of output descriptions");
 }
 
@@ -322,8 +337,12 @@ Output<Node> op::v5::Loop::get_concatenated_slices(const Output<Node>& value,
 bool op::v5::Loop::evaluate(const HostTensorVector& outputs, const HostTensorVector& inputs) const
 {
     NGRAPH_OP_SCOPE(v5_Loop_evaluate);
-    runtime::reference::loop(
-        m_body, m_output_descriptions, m_input_descriptions, m_special_body_ports, outputs, inputs);
+    runtime::reference::loop(m_bodies[0],
+                             m_output_descriptions[0],
+                             m_input_descriptions[0],
+                             m_special_body_ports,
+                             outputs,
+                             inputs);
     return true;
 }
 
@@ -347,20 +366,21 @@ void op::v5::Loop::clone_to(op::v5::Loop& dst, const OutputVector& new_args) con
     dst.m_num_iterations = m_num_iterations;
     dst.m_special_body_ports = m_special_body_ports;
 
-    dst.m_body = clone_function(*get_function());
+    dst.m_bodies[0] = clone_function(*get_function());
 
-    for (auto& input_description : m_input_descriptions)
+    for (auto& input_description : m_input_descriptions[0])
     {
-        dst.m_input_descriptions.push_back(input_description->copy());
+        dst.m_input_descriptions[0].push_back(input_description->copy());
     }
-    for (auto& output_description : m_output_descriptions)
+    for (auto& output_description : m_output_descriptions[0])
     {
-        dst.m_output_descriptions.push_back(output_description->copy());
+        dst.m_output_descriptions[0].push_back(output_description->copy());
     }
     dst.validate_and_infer_types();
 }
 
 op::v5::Loop::Loop(const op::v5::Loop& other)
+    : SubGraphOp()
 {
     other.clone_to(*this, other.input_values());
 }
diff --git a/ngraph/core/src/op/tensor_iterator.cpp b/ngraph/core/src/op/tensor_iterator.cpp
index 6dffdaa77fe96b..0ae86f6052a9c2 100644
--- a/ngraph/core/src/op/tensor_iterator.cpp
+++ b/ngraph/core/src/op/tensor_iterator.cpp
@@ -21,9 +21,9 @@ op::v0::TensorIterator::TensorIterator(const OutputVector& values)
 bool op::v0::TensorIterator::visit_attributes(AttributeVisitor& visitor)
 {
     NGRAPH_OP_SCOPE(v0_TensorIterator_visit_attributes);
-    visitor.on_attribute("body", m_body);
-    visitor.on_attribute("input_descriptions", m_input_descriptions);
-    visitor.on_attribute("output_descriptions", m_output_descriptions);
+    visitor.on_attribute("body", m_bodies[0]);
+    visitor.on_attribute("input_descriptions", m_input_descriptions[0]);
+    visitor.on_attribute("output_descriptions", m_output_descriptions[0]);
 
     return true;
 }
@@ -33,7 +33,7 @@ void op::v0::TensorIterator::revalidate_and_infer_types_for_body_ops()
     std::stack<std::shared_ptr<Node>, std::vector<std::shared_ptr<Node>>> nodes_to_do;
     std::unordered_set<std::shared_ptr<Node>> nodes_done;
 
-    for (const auto& r : m_body->get_results())
+    for (const auto& r : m_bodies[0]->get_results())
     {
         nodes_to_do.push(r);
     }
@@ -75,8 +75,19 @@ void op::v0::TensorIterator::revalidate_and_infer_types_for_body_ops()
 void op::v0::TensorIterator::validate_and_infer_types()
 {
     NGRAPH_OP_SCOPE(v0_TensorIterator_validate_and_infer_types);
+
+    NODE_VALIDATION_CHECK(
+        this, m_bodies.size() == 1, "Number of bodies for loop is greater than 1");
+
+    NODE_VALIDATION_CHECK(this,
+                          m_input_descriptions.size() == 1,
+                          "Loop contains input descriptions for other bodies");
+    NODE_VALIDATION_CHECK(this,
+                          m_output_descriptions.size() == 1,
+                          "Loop contains output descriptions for other bodies");
+
     NODE_VALIDATION_CHECK(this,
-                          get_input_size() == m_input_descriptions.size(),
+                          get_input_size() == m_input_descriptions[0].size(),
                           "Number of inputs must be the same as number of input descriptions");
 
     std::vector<std::shared_ptr<Node>> ends;
@@ -89,15 +100,16 @@ void op::v0::TensorIterator::validate_and_infer_types()
         return value;
     };
 
+    auto body = get_function();
     // Input
-    for (const auto& input_description : m_input_descriptions)
+    for (const auto& input_description : m_input_descriptions[0])
     {
         auto index = input_description->m_input_index;
 
         if (auto slice_input_description = as_type_ptr<SliceInputDescription>(input_description))
         {
             auto body_parameter =
-                m_body->get_parameters().at(slice_input_description->m_body_parameter_index);
+                body->get_parameters().at(slice_input_description->m_body_parameter_index);
             auto input_partial_shape = inputs().at(index).get_source_output().get_partial_shape();
             if (input_partial_shape.is_static())
             {
@@ -125,12 +137,14 @@ void op::v0::TensorIterator::validate_and_infer_types()
         else if (auto merged_input_description =
                      as_type_ptr<MergedInputDescription>(input_description))
         {
-            auto body_value =
-                m_body->get_results().at(merged_input_description->m_body_value_index)->input(0);
+            auto body_value = m_bodies[0]
+                                  ->get_results()
+                                  .at(merged_input_description->m_body_value_index)
+                                  ->input(0);
             ends.push_back(body_value.get_node()->shared_from_this());
 
             auto body_parameter =
-                m_body->get_parameters().at(merged_input_description->m_body_parameter_index);
+                m_bodies[0]->get_parameters().at(merged_input_description->m_body_parameter_index);
 
             auto body_param_partial_shape = body_parameter->get_partial_shape();
             auto input_partial_shape = inputs().at(index).get_source_output().get_partial_shape();
@@ -139,8 +153,8 @@ void op::v0::TensorIterator::validate_and_infer_types()
         else if (auto invariant_input_description =
                      as_type_ptr<InvariantInputDescription>(input_description))
         {
-            auto body_parameter =
-                m_body->get_parameters().at(invariant_input_description->m_body_parameter_index);
+            auto body_parameter = m_bodies[0]->get_parameters().at(
+                invariant_input_description->m_body_parameter_index);
 
             auto body_param_partial_shape = body_parameter->get_partial_shape();
             auto input_partial_shape = inputs().at(index).get_source_output().get_partial_shape();
@@ -154,12 +168,12 @@ void op::v0::TensorIterator::validate_and_infer_types()
     // Output
     try_to_set_num_iterations_if_no_slice_inputs();
 
-    for (const auto& output_description : m_output_descriptions)
+    for (const auto& output_description : m_output_descriptions[0])
     {
         auto index = output_description->m_output_index;
 
         auto body_value =
-            m_body->get_results().at(output_description->m_body_value_index)->input_value(0);
+            m_bodies[0]->get_results().at(output_description->m_body_value_index)->input_value(0);
 
         if (auto concat_output_description =
                 as_type_ptr<ConcatOutputDescription>(output_description))
@@ -207,15 +221,10 @@ void op::v0::TensorIterator::validate_and_infer_types()
     }
 
     NODE_VALIDATION_CHECK(this,
-                          get_output_size() == m_output_descriptions.size(),
+                          get_output_size() == m_output_descriptions[0].size(),
                           "Number of outputs must be the same as number of output descriptions");
 }
 
-std::shared_ptr<Function> op::v0::TensorIterator::get_function()
-{
-    return get_body();
-}
-
 namespace
 {
     template <typename Desc>
@@ -235,7 +244,7 @@ void op::v0::TensorIterator::try_to_set_num_iterations_if_no_slice_inputs()
         return;
     }
 
-    for (const auto& output_description : m_output_descriptions)
+    for (const auto& output_description : m_output_descriptions[0])
     {
         if (auto concat = as_type_ptr<ConcatOutputDescription>(output_description))
         {
@@ -256,14 +265,14 @@ std::shared_ptr<Node>
                  description(),
                  " operation with name ",
                  get_friendly_name());
-    op->set_output_size(m_output_descriptions.size());
+    op->set_output_size(m_output_descriptions[0].size());
 
-    std::vector<::ngraph::element::Type> types(m_body->get_parameters().size());
-    std::vector<::ngraph::PartialShape> new_shapes(m_body->get_parameters().size());
+    std::vector<::ngraph::element::Type> types(m_bodies[0]->get_parameters().size());
+    std::vector<::ngraph::PartialShape> new_shapes(m_bodies[0]->get_parameters().size());
 
     for (size_t input_index = 0; input_index < new_args.size(); ++input_index)
     {
-        for (auto& input_description : m_input_descriptions)
+        for (auto& input_description : m_input_descriptions[0])
         {
             if (input_description->m_input_index == input_index)
             {
@@ -288,19 +297,19 @@ std::shared_ptr<Node>
 
     op->m_num_iterations = m_num_iterations;
     auto func = std::make_shared<Function>(
-        m_body->get_results(), m_body->get_sinks(), m_body->get_parameters());
+        m_bodies[0]->get_results(), m_bodies[0]->get_sinks(), m_bodies[0]->get_parameters());
     auto spec_func =
         specialize_function(func, types, new_shapes, std::vector<void*>(new_args.size(), nullptr));
-    op->m_body = std::make_shared<Function>(
+    op->m_bodies[0] = std::make_shared<Function>(
         spec_func->get_results(), spec_func->get_sinks(), spec_func->get_parameters());
 
-    for (auto& input_description : m_input_descriptions)
+    for (auto& input_description : m_input_descriptions[0])
     {
-        op->m_input_descriptions.push_back(input_description->copy());
+        op->m_input_descriptions[0].push_back(input_description->copy());
     }
-    for (auto& output_description : m_output_descriptions)
+    for (auto& output_description : m_output_descriptions[0])
     {
-        op->m_output_descriptions.push_back(output_description->copy());
+        op->m_output_descriptions[0].push_back(output_description->copy());
     }
     op->validate_and_infer_types();
     return op;
diff --git a/ngraph/core/src/op/util/multi_subgraph_base.cpp b/ngraph/core/src/op/util/multi_subgraph_base.cpp
new file mode 100644
index 00000000000000..0b14f2e20fb8e0
--- /dev/null
+++ b/ngraph/core/src/op/util/multi_subgraph_base.cpp
@@ -0,0 +1,210 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "ngraph/op/util/multi_subgraph_base.hpp"
+#include "ngraph/opsets/opset5.hpp"
+
+#include "ngraph/graph_util.hpp"
+
+using namespace ngraph;
+
+NGRAPH_RTTI_DEFINITION(op::util::MultiSubGraphOp, "MultiSubGraphOp", 0);
+NGRAPH_RTTI_DEFINITION(op::util::MultiSubGraphOp::SliceInputDescription,
+                       "SliceInputDescription",
+                       0);
+NGRAPH_RTTI_DEFINITION(op::util::MultiSubGraphOp::MergedInputDescription,
+                       "MergedInputDescription",
+                       0);
+NGRAPH_RTTI_DEFINITION(op::util::MultiSubGraphOp::InvariantInputDescription,
+                       "InvariantInputDescription",
+                       0);
+NGRAPH_RTTI_DEFINITION(op::util::MultiSubGraphOp::BodyOutputDescription,
+                       "BodyOutputDescription",
+                       0);
+NGRAPH_RTTI_DEFINITION(op::util::MultiSubGraphOp::ConcatOutputDescription,
+                       "ConcatOutputDescription",
+                       0);
+
+op::util::MultiSubGraphOp::InputDescription::InputDescription(uint64_t input_index,
+                                                              uint64_t body_parameter_index)
+    : m_input_index(input_index)
+    , m_body_parameter_index(body_parameter_index)
+{
+}
+
+op::util::MultiSubGraphOp::OutputDescription::OutputDescription(uint64_t body_value_index,
+                                                                uint64_t output_index)
+    : m_body_value_index(body_value_index)
+    , m_output_index(output_index)
+{
+}
+
+op::util::MultiSubGraphOp::SliceInputDescription::SliceInputDescription(
+    uint64_t input_index,
+    uint64_t body_parameter_index,
+    int64_t start,
+    int64_t stride,
+    int64_t part_size,
+    int64_t end,
+    int64_t axis)
+    : InputDescription(input_index, body_parameter_index)
+    , m_start(start)
+    , m_stride(stride)
+    , m_part_size(part_size)
+    , m_end(end)
+    , m_axis(axis)
+{
+}
+
+std::shared_ptr<op::util::MultiSubGraphOp::InputDescription>
+    op::util::MultiSubGraphOp::SliceInputDescription::copy() const
+{
+    return std::make_shared<SliceInputDescription>(
+        m_input_index, m_body_parameter_index, m_start, m_stride, m_part_size, m_end, m_axis);
+}
+
+op::util::MultiSubGraphOp::MergedInputDescription::MergedInputDescription(
+    uint64_t input_index, uint64_t body_parameter_index, uint64_t body_value_index)
+    : InputDescription(input_index, body_parameter_index)
+    , m_body_value_index(body_value_index)
+{
+}
+
+std::shared_ptr<op::util::MultiSubGraphOp::InputDescription>
+    op::util::MultiSubGraphOp::MergedInputDescription::copy() const
+{
+    return std::make_shared<MergedInputDescription>(
+        m_input_index, m_body_parameter_index, m_body_value_index);
+}
+
+op::util::MultiSubGraphOp::ConcatOutputDescription::ConcatOutputDescription(
+    uint64_t body_value_index,
+    uint64_t output_index,
+    int64_t start,
+    int64_t stride,
+    int64_t part_size,
+    int64_t end,
+    int64_t axis)
+    : OutputDescription(body_value_index, output_index)
+    , m_start(start)
+    , m_stride(stride)
+    , m_part_size(part_size)
+    , m_end(end)
+    , m_axis(axis)
+{
+}
+
+std::shared_ptr<op::util::MultiSubGraphOp::OutputDescription>
+    op::util::MultiSubGraphOp::ConcatOutputDescription::copy() const
+{
+    return std::make_shared<ConcatOutputDescription>(
+        m_body_value_index, m_output_index, m_start, m_stride, m_part_size, m_end, m_axis);
+}
+op::util::MultiSubGraphOp::InvariantInputDescription::InvariantInputDescription(
+    uint64_t input_index, uint64_t body_parameter_index)
+    : InputDescription(input_index, body_parameter_index)
+{
+}
+
+std::shared_ptr<op::util::MultiSubGraphOp::InputDescription>
+    op::util::MultiSubGraphOp::InvariantInputDescription::copy() const
+{
+    return std::make_shared<MultiSubGraphOp::InvariantInputDescription>(m_input_index,
+                                                                        m_body_parameter_index);
+}
+
+op::util::MultiSubGraphOp::BodyOutputDescription::BodyOutputDescription(uint64_t body_value_index,
+                                                                        uint64_t output_index,
+                                                                        int64_t iteration)
+    : OutputDescription(body_value_index, output_index)
+    , m_iteration(iteration)
+{
+}
+
+std::shared_ptr<op::util::MultiSubGraphOp::OutputDescription>
+    op::util::MultiSubGraphOp::BodyOutputDescription::copy() const
+{
+    return std::make_shared<BodyOutputDescription>(m_body_value_index, m_output_index, m_iteration);
+}
+
+op::util::MultiSubGraphOp::MultiSubGraphOp(const OutputVector& args)
+    : Op(args)
+{
+}
+
+op::util::MultiSubGraphOp::MultiSubGraphOp(size_t number_of_bodies)
+{
+    m_bodies.resize(number_of_bodies);
+    m_input_descriptions.resize(number_of_bodies);
+    m_output_descriptions.resize(number_of_bodies);
+}
+
+op::util::MultiSubGraphOp::MultiSubGraphOp(const OutputVector& args, size_t number_of_bodies)
+    : MultiSubGraphOp(args)
+{
+    m_bodies.resize(number_of_bodies);
+    m_input_descriptions.resize(number_of_bodies);
+    m_output_descriptions.resize(number_of_bodies);
+}
+
+Input<Node> op::util::MultiSubGraphOp::input_for_value(const Output<Node>& value)
+{
+    auto input_index = get_input_size();
+    set_argument(input_index, value);
+    return Input<Node>(this, input_index);
+}
+
+void op::util::MultiSubGraphOp::set_invariant_inputs(const Output<Node>& value,
+                                                     const ParameterVector& bodies_parameters)
+{
+    auto input_index = input_for_value(value).get_index();
+    for (auto& param : bodies_parameters)
+    {
+        for (size_t body_index = 0; body_index < m_bodies.size(); ++body_index)
+        {
+            auto param_index = m_bodies[body_index]->get_parameter_index(param);
+            if (param_index != -1)
+            {
+                m_input_descriptions[body_index].push_back(
+                    std::make_shared<MultiSubGraphOp::InvariantInputDescription>(input_index,
+                                                                                 param_index));
+            }
+        }
+    }
+}
+
+Output<Node> op::util::MultiSubGraphOp::set_body_outputs(const ResultVector& bodies_results)
+{
+    auto output_index = get_output_size();
+    for (auto& body_result : bodies_results)
+    {
+        for (size_t body_index = 0; body_index < m_bodies.size(); body_index++)
+        {
+            auto body_result_index = m_bodies[body_index]->get_result_index(body_result);
+            if (body_result_index != -1)
+            {
+                m_output_descriptions[body_index].push_back(
+                    std::make_shared<BodyOutputDescription>(body_result_index, output_index));
+            }
+        }
+    }
+    set_output_size(output_index + 1);
+    return Output<Node>(shared_from_this(), output_index);
+}
+
+namespace ngraph
+{
+    NGRAPH_RTTI_DEFINITION(
+        AttributeAdapter<std::vector<std::shared_ptr<op::util::MultiSubGraphOp::InputDescription>>>,
+        "AttributeAdapter<std::vector<std::shared_ptr<ngraph::op::util::"
+        "MultiSubGraphOp::InputDescription>>>",
+        0);
+
+    NGRAPH_RTTI_DEFINITION(
+        AttributeAdapter<
+            std::vector<std::shared_ptr<op::util::MultiSubGraphOp::OutputDescription>>>,
+        "AttributeAdapter<std::vector<std::shared_ptr<ngraph::op::util::"
+        "MultiSubGraphOp::OutputDescription>>>",
+        0);
+} // namespace ngraph
diff --git a/ngraph/core/src/op/util/sub_graph_base.cpp b/ngraph/core/src/op/util/sub_graph_base.cpp
index 916b7cc7c5bafc..7a42ed27daca3b 100644
--- a/ngraph/core/src/op/util/sub_graph_base.cpp
+++ b/ngraph/core/src/op/util/sub_graph_base.cpp
@@ -11,116 +11,13 @@ using namespace ngraph;
 
 NGRAPH_RTTI_DEFINITION(op::util::SubGraphOp, "SubGraphOp", 0);
 
-constexpr DiscreteTypeInfo op::util::SubGraphOp::SliceInputDescription::type_info;
-constexpr DiscreteTypeInfo op::util::SubGraphOp::MergedInputDescription::type_info;
-constexpr DiscreteTypeInfo op::util::SubGraphOp::InvariantInputDescription::type_info;
-
-constexpr DiscreteTypeInfo op::util::SubGraphOp::BodyOutputDescription::type_info;
-constexpr DiscreteTypeInfo op::util::SubGraphOp::ConcatOutputDescription::type_info;
-
-op::util::SubGraphOp::InputDescription::InputDescription(uint64_t input_index,
-                                                         uint64_t body_parameter_index)
-    : m_input_index(input_index)
-    , m_body_parameter_index(body_parameter_index)
-{
-}
-
-op::util::SubGraphOp::SliceInputDescription::SliceInputDescription(uint64_t input_index,
-                                                                   uint64_t body_parameter_index,
-                                                                   int64_t start,
-                                                                   int64_t stride,
-                                                                   int64_t part_size,
-                                                                   int64_t end,
-                                                                   int64_t axis)
-    : InputDescription(input_index, body_parameter_index)
-    , m_start(start)
-    , m_stride(stride)
-    , m_part_size(part_size)
-    , m_end(end)
-    , m_axis(axis)
-{
-}
-
-std::shared_ptr<op::util::SubGraphOp::InputDescription>
-    op::util::SubGraphOp::SliceInputDescription::copy() const
-{
-    return std::make_shared<SliceInputDescription>(
-        m_input_index, m_body_parameter_index, m_start, m_stride, m_part_size, m_end, m_axis);
-}
-
-op::util::SubGraphOp::MergedInputDescription::MergedInputDescription(uint64_t input_index,
-                                                                     uint64_t body_parameter_index,
-                                                                     uint64_t body_value_index)
-    : InputDescription(input_index, body_parameter_index)
-    , m_body_value_index(body_value_index)
-{
-}
-
-std::shared_ptr<op::util::SubGraphOp::InputDescription>
-    op::util::SubGraphOp::MergedInputDescription::copy() const
-{
-    return std::make_shared<MergedInputDescription>(
-        m_input_index, m_body_parameter_index, m_body_value_index);
-}
-
-op::util::SubGraphOp::InvariantInputDescription::InvariantInputDescription(
-    uint64_t input_index, uint64_t body_parameter_index)
-    : InputDescription(input_index, body_parameter_index)
-{
-}
-
-std::shared_ptr<op::util::SubGraphOp::InputDescription>
-    op::util::SubGraphOp::InvariantInputDescription::copy() const
+op::util::SubGraphOp::SubGraphOp()
+    : MultiSubGraphOp(1)
 {
-    return std::make_shared<InvariantInputDescription>(m_input_index, m_body_parameter_index);
-}
-
-op::util::SubGraphOp::OutputDescription::OutputDescription(uint64_t body_value_index,
-                                                           uint64_t output_index)
-    : m_body_value_index(body_value_index)
-    , m_output_index(output_index)
-{
-}
-
-op::util::SubGraphOp::ConcatOutputDescription::ConcatOutputDescription(uint64_t body_value_index,
-                                                                       uint64_t output_index,
-                                                                       int64_t start,
-                                                                       int64_t stride,
-                                                                       int64_t part_size,
-                                                                       int64_t end,
-                                                                       int64_t axis)
-    : OutputDescription(body_value_index, output_index)
-    , m_start(start)
-    , m_stride(stride)
-    , m_part_size(part_size)
-    , m_end(end)
-    , m_axis(axis)
-{
-}
-
-std::shared_ptr<op::util::SubGraphOp::OutputDescription>
-    op::util::SubGraphOp::ConcatOutputDescription::copy() const
-{
-    return std::make_shared<ConcatOutputDescription>(
-        m_body_value_index, m_output_index, m_start, m_stride, m_part_size, m_end, m_axis);
-}
-
-op::util::SubGraphOp::BodyOutputDescription::BodyOutputDescription(uint64_t body_value_index,
-                                                                   uint64_t output_index,
-                                                                   int64_t iteration)
-    : OutputDescription(body_value_index, output_index)
-    , m_iteration(iteration)
-{
-}
-
-std::shared_ptr<op::util::SubGraphOp::OutputDescription>
-    op::util::SubGraphOp::BodyOutputDescription::copy() const
-{
-    return std::make_shared<BodyOutputDescription>(m_body_value_index, m_output_index, m_iteration);
 }
 
 op::util::SubGraphOp::SubGraphOp(const OutputVector& args)
-    : Op(args)
+    : MultiSubGraphOp(args, 1)
 {
 }
 
@@ -128,26 +25,30 @@ void op::util::SubGraphOp::set_merged_input(const std::shared_ptr<Parameter>& bo
                                             const Output<Node>& initial_value,
                                             const Output<Node>& successive_value)
 {
-    m_input_descriptions.push_back(std::make_shared<TensorIterator::MergedInputDescription>(
+    auto body = get_function();
+
+    m_input_descriptions[0].push_back(std::make_shared<TensorIterator::MergedInputDescription>(
         input_for_value(initial_value).get_index(),
-        m_body->get_parameter_index(body_parameter),
-        m_body->get_result_index(successive_value)));
+        body->get_parameter_index(body_parameter),
+        body->get_result_index(successive_value)));
     validate_and_infer_types();
 }
 
 void op::util::SubGraphOp::set_invariant_input(const std::shared_ptr<Parameter>& body_parameter,
                                                const Output<Node>& value)
 {
-    m_input_descriptions.push_back(std::make_shared<TensorIterator::InvariantInputDescription>(
-        input_for_value(value).get_index(), m_body->get_parameter_index(body_parameter)));
+    auto body = get_function();
+    m_input_descriptions[0].push_back(std::make_shared<TensorIterator::InvariantInputDescription>(
+        input_for_value(value).get_index(), body->get_parameter_index(body_parameter)));
     validate_and_infer_types();
 }
 
 Output<Node> op::util::SubGraphOp::get_iter_value(const Output<Node>& body_value, int64_t iteration)
 {
     auto output_index = get_output_size();
-    m_output_descriptions.push_back(std::make_shared<BodyOutputDescription>(
-        m_body->get_result_index(body_value), output_index, iteration));
+    auto body = get_function();
+    m_output_descriptions[0].push_back(std::make_shared<BodyOutputDescription>(
+        body->get_result_index(body_value), output_index, iteration));
     set_output_size(output_index + 1);
     validate_and_infer_types();
     return Output<Node>(shared_from_this(), output_index);
@@ -161,8 +62,9 @@ Output<Node> op::util::SubGraphOp::get_concatenated_slices(const Output<Node>& b
                                                            int64_t axis)
 {
     auto output_index = get_output_size();
-    m_output_descriptions.push_back(std::make_shared<ConcatOutputDescription>(
-        m_body->get_result_index(body_value), output_index, start, stride, part_size, end, axis));
+    auto body = get_function();
+    m_output_descriptions[0].push_back(std::make_shared<ConcatOutputDescription>(
+        body->get_result_index(body_value), output_index, start, stride, part_size, end, axis));
     set_output_size(output_index + 1);
     validate_and_infer_types();
     return Output<Node>(shared_from_this(), output_index);
@@ -176,9 +78,10 @@ void op::util::SubGraphOp::set_sliced_input(const std::shared_ptr<Parameter>& pa
                                             int64_t end,
                                             int64_t axis)
 {
-    m_input_descriptions.push_back(
+    auto body = get_function();
+    m_input_descriptions[0].push_back(
         std::make_shared<SliceInputDescription>(input_for_value(value).get_index(),
-                                                m_body->get_parameter_index(parameter),
+                                                body->get_parameter_index(parameter),
                                                 start,
                                                 stride,
                                                 part_size,
@@ -193,12 +96,3 @@ Input<Node> op::util::SubGraphOp::input_for_value(const Output<Node>& value)
     set_argument(input_index, value);
     return Input<Node>(this, input_index);
 }
-
-namespace ngraph
-{
-    constexpr DiscreteTypeInfo AttributeAdapter<
-        std::vector<std::shared_ptr<op::util::SubGraphOp::InputDescription>>>::type_info;
-
-    constexpr DiscreteTypeInfo AttributeAdapter<
-        std::vector<std::shared_ptr<op::util::SubGraphOp::OutputDescription>>>::type_info;
-} // namespace ngraph

From fa057627ecf00f50e23336caed00f44b5ac1a57b Mon Sep 17 00:00:00 2001
From: Szymon Durawa <szymon.durawa@intel.com>
Date: Fri, 23 Jul 2021 06:47:08 +0200
Subject: [PATCH 49/71] Ref implementation mvn revise (#6600)

* Add visitor and backend tests.

* Add reduction_axes to SLTs, serialization and backend tests.

* Update backend tests.

* Move backend tests to template plugin, remove old ones.

* Apply correct format.

* Add BF16 to SLT, add comment regarding deprecated class.

* Remove BF16 precision as it is not supported in windows, no default values for attributes.

* Reuse Tensor from base_reference_test.hpp
---
 .../tests/functional/op_reference/mvn.cpp     | 254 ++++++++++++++++++
 .../serialization/single_layer/mvn.cpp        |  24 +-
 .../single_layer_tests/mvn.cpp                |  29 +-
 .../plugin/cpu/single_layer_tests/mvn.cpp     |  22 +-
 .../single_layer_tests/mvn.cpp                |   5 +-
 .../shared/include/single_layer_tests/mvn.hpp |   5 +
 .../shared_test_classes/single_layer/mvn.hpp  |  19 ++
 .../src/single_layer/mvn.cpp                  |  41 +++
 .../layer_tests_summary/utils/constants.py    |   1 +
 .../include/ngraph_functions/builders.hpp     |   5 +
 .../ngraph_functions/src/mvn.cpp              |   9 +
 ngraph/core/include/ngraph/op/mvn.hpp         |   8 +-
 ngraph/test/CMakeLists.txt                    |   1 -
 ngraph/test/backend/mvn.in.cpp                | 139 ----------
 ngraph/test/visitors/op/mvn.cpp               |  27 +-
 15 files changed, 425 insertions(+), 164 deletions(-)
 create mode 100644 docs/template_plugin/tests/functional/op_reference/mvn.cpp
 delete mode 100644 ngraph/test/backend/mvn.in.cpp

diff --git a/docs/template_plugin/tests/functional/op_reference/mvn.cpp b/docs/template_plugin/tests/functional/op_reference/mvn.cpp
new file mode 100644
index 00000000000000..5321164807b852
--- /dev/null
+++ b/docs/template_plugin/tests/functional/op_reference/mvn.cpp
@@ -0,0 +1,254 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+
+#include <ie_core.hpp>
+#include <ie_ngraph_utils.hpp>
+#include <ngraph/ngraph.hpp>
+#include <shared_test_classes/base/layer_test_utils.hpp>
+#include <tuple>
+
+#include "base_reference_test.hpp"
+
+using namespace ngraph;
+using namespace InferenceEngine;
+using namespace reference_tests;
+
+// ------------------------------ V0 ------------------------------
+
+struct MVN1Params {
+    MVN1Params(const Tensor& paramInput, const ngraph::AxisSet& paramReductionAxes, const bool paramAcrossChannels, const bool paramNormalizeVariance,
+               const double paramEps, const Tensor& paramExpected)
+        : input(paramInput),
+          reductionAxes(paramReductionAxes),
+          acrossChannels(paramAcrossChannels),
+          normalizeVariance(paramNormalizeVariance),
+          eps(paramEps),
+          expected(paramExpected) {}
+    Tensor input;
+    ngraph::AxisSet reductionAxes;
+    bool acrossChannels;
+    bool normalizeVariance;
+    double eps;
+    Tensor expected;
+};
+
+class ReferenceMVN1LayerTest : public testing::TestWithParam<MVN1Params>, public CommonReferenceTest {
+public:
+    void SetUp() override {
+        auto params = GetParam();
+        function = CreateFunction(params.input, params.reductionAxes, params.acrossChannels, params.normalizeVariance, params.eps);
+        inputData = {params.input.data};
+        refOutData = {params.expected.data};
+    }
+    static std::string getTestCaseName(const testing::TestParamInfo<MVN1Params>& obj) {
+        auto param = obj.param;
+        std::ostringstream result;
+        result << "shape=" << param.input.shape;
+        result << "_iType=" << param.input.type;
+        if (!param.reductionAxes.empty()) {
+            result << "_reductionAccess=" << CommonTestUtils::vec2str(param.reductionAxes.to_vector());
+        } else {
+            result << "_acrossChannels=" << (param.acrossChannels ? "TRUE" : "FALSE");
+        }
+        result << "_normalizeVariance=" << (param.normalizeVariance ? "TRUE" : "FALSE");
+        result << "_eps=" << param.eps;
+        return result.str();
+    }
+
+private:
+    static std::shared_ptr<Function> CreateFunction(const Tensor& input, const ngraph::AxisSet& reductionAxes, const bool acrossChannels,
+                                                    const bool normalizeVariance, const double eps) {
+        const auto in = std::make_shared<op::Parameter>(input.type, input.shape);
+        auto mvn = std::make_shared<op::MVN>(in, acrossChannels, normalizeVariance, eps);
+        if (!reductionAxes.empty()) {
+            mvn = std::make_shared<op::MVN>(in, reductionAxes, normalizeVariance, eps);
+        }
+        return std::make_shared<Function>(NodeVector {mvn}, ParameterVector {in});
+    }
+};
+
+TEST_P(ReferenceMVN1LayerTest, CompareWithHardcodedRefs) {
+    Exec();
+}
+
+const ngraph::AxisSet emptyReductionAxes {};
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_MVN1_With_Hardcoded_Refs, ReferenceMVN1LayerTest,
+    ::testing::Values(
+        // across_channels=false, variance=false
+        MVN1Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   emptyReductionAxes,
+                   false,
+                   false,
+                   1e-9,
+                   Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {-4, -3, -2, -1, 0,  1,  2,  3,  4, -4, -3, -2, -1, 0,
+                                                                                   1,  2,  3,  4,  -4, -3, -2, -1, 0, 1,  2,  3,  4}}),
+        // across_channels=true, variance=false
+        MVN1Params(
+            Tensor {{1, 3, 2, 2}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3}},
+            emptyReductionAxes,
+            true,
+            false,
+            1e-9,
+            Tensor {{1, 3, 2, 2}, ngraph::element::f32, std::vector<float> {-3.25, -2.25, -1.25, -0.25, 0.75, 1.75, 2.75, 3.75, 4.75, -3.25, -2.25, -1.25}}),
+        // across_channels=false, variance=true
+        MVN1Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   emptyReductionAxes,
+                   false,
+                   true,
+                   1e-9,
+                   Tensor {{1, 3, 3, 3},
+                           ngraph::element::f32,
+                           std::vector<float> {-1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934}}),
+        // across_channels=true, variance=true
+        MVN1Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   emptyReductionAxes,
+                   true,
+                   true,
+                   1e-9,
+                   Tensor {{1, 3, 3, 3},
+                           ngraph::element::f32,
+                           std::vector<float> {-1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934}}),
+        // reductionAxes, variance=false
+        MVN1Params(
+            Tensor {{1, 3, 2, 2}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3}},
+            {1, 2, 3},
+            false,
+            false,
+            1e-9,
+            Tensor {{1, 3, 2, 2}, ngraph::element::f32, std::vector<float> {-3.25, -2.25, -1.25, -0.25, 0.75, 1.75, 2.75, 3.75, 4.75, -3.25, -2.25, -1.25}}),
+        // reductionAxes, variance=true
+        MVN1Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   {2, 3},
+                   false,
+                   true,
+                   1e-9,
+                   Tensor {{1, 3, 3, 3},
+                           ngraph::element::f32,
+                           std::vector<float> {-1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934}})),
+    ReferenceMVN1LayerTest::getTestCaseName);
+
+// ------------------------------ V6 ------------------------------
+
+struct MVN6Params {
+    MVN6Params(const Tensor& paramInput, const Tensor& paramReductionAxes, const bool paramNormalizeVariance, const double paramEps,
+               const ngraph::op::MVNEpsMode mode, const Tensor& paramExpected)
+        : input(paramInput),
+          reductionAxes(paramReductionAxes),
+          normalizeVariance(paramNormalizeVariance),
+          eps(paramEps),
+          epsMode(mode),
+          expected(paramExpected) {}
+    Tensor input;
+    Tensor reductionAxes;
+    bool normalizeVariance;
+    double eps;
+    ngraph::op::MVNEpsMode epsMode;
+    Tensor expected;
+};
+
+class ReferenceMVN6LayerTest : public testing::TestWithParam<MVN6Params>, public CommonReferenceTest {
+public:
+    void SetUp() override {
+        auto params = GetParam();
+        function = CreateFunction(params.input, params.reductionAxes, params.normalizeVariance, params.eps, params.epsMode);
+        inputData = {params.input.data};
+        refOutData = {params.expected.data};
+    }
+    static std::string getTestCaseName(const testing::TestParamInfo<MVN6Params>& obj) {
+        auto param = obj.param;
+        std::ostringstream result;
+        result << "shape=" << param.input.shape;
+        result << "_iType=" << param.input.type;
+        result << "_reductionAccess=" << CommonTestUtils::vec2str(param.reductionAxes.shape);
+        result << "_normalizeVariance=" << (param.normalizeVariance ? "TRUE" : "FALSE");
+        result << "_eps=" << param.eps;
+        result << "_eps_mode=" << param.epsMode;
+        return result.str();
+    }
+
+private:
+    static std::shared_ptr<Function> CreateFunction(const Tensor& input, const Tensor& reductionAxes, const bool normalizeVariance, const double eps,
+                                                    const ngraph::op::MVNEpsMode epsMode) {
+        std::vector<int64_t> dataVector(reductionAxes.shape[0]);
+        const auto in = std::make_shared<op::Parameter>(input.type, input.shape);
+        auto mRef = as<InferenceEngine::MemoryBlob>(reductionAxes.data);
+        IE_ASSERT(mRef);
+        const auto refLockMemory = mRef->rmap();
+        const auto refBuffer = refLockMemory.as<const std::uint64_t*>();
+        for (size_t i = 0; i < dataVector.size(); ++i) {
+            dataVector[i] = refBuffer[i];
+        }
+        const auto axes = std::make_shared<op::Constant>(reductionAxes.type, reductionAxes.shape, dataVector);
+        auto mvn = std::make_shared<op::v6::MVN>(in, axes, normalizeVariance, eps, epsMode);
+        return std::make_shared<Function>(NodeVector {mvn}, ParameterVector {in});
+    }
+};
+
+TEST_P(ReferenceMVN6LayerTest, CompareWithHardcodedRefs) {
+    Exec();
+}
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_MVN6_With_Hardcoded_Refs, ReferenceMVN6LayerTest,
+    ::testing::Values(
+        // variance=false, OUTSIDE_SQRT
+        MVN6Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   Tensor {Shape {2}, ngraph::element::i64, std::vector<int64_t> {2, 3}},
+                   false,
+                   1e-9,
+                   ngraph::op::MVNEpsMode::OUTSIDE_SQRT,
+                   Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {-4, -3, -2, -1, 0,  1,  2,  3,  4, -4, -3, -2, -1, 0,
+                                                                                   1,  2,  3,  4,  -4, -3, -2, -1, 0, 1,  2,  3,  4}}),
+        // variance=true, OUTSIDE_SQRT
+        MVN6Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   Tensor {Shape {2}, ngraph::element::i64, std::vector<int64_t> {2, 3}},
+                   true,
+                   1e-9,
+                   ngraph::op::MVNEpsMode::OUTSIDE_SQRT,
+                   Tensor {{1, 3, 3, 3},
+                           ngraph::element::f32,
+                           std::vector<float> {-1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934}}),
+        // variance=true, INSIDE_SQRT
+        MVN6Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float> {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9}},
+                   Tensor {Shape {2}, ngraph::element::i64, std::vector<int64_t> {2, 3}},
+                   true,
+                   1e-9,
+                   ngraph::op::MVNEpsMode::INSIDE_SQRT,
+                   Tensor {{1, 3, 3, 3},
+                           ngraph::element::f32,
+                           std::vector<float> {-1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934}}),
+        // variance=true, another reductionAxes, OUTSIDE_SQRT
+        MVN6Params(Tensor {{1, 3, 3, 3}, ngraph::element::f32, std::vector<float>({1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5,
+                                                                                   6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9})},
+                   Tensor {Shape {3}, ngraph::element::i64, std::vector<int64_t>({1, 2, 3})},
+                   true,
+                   1e-9,
+                   ngraph::op::MVNEpsMode::OUTSIDE_SQRT,
+                   Tensor {{1, 3, 3, 3},
+                           ngraph::element::f32,
+                           std::vector<float> {-1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934,
+                                               -1.5491934, -1.161895, -0.7745967, -0.38729835, 0., 0.38729835, 0.7745967, 1.161895, 1.5491934}})),
+    ReferenceMVN6LayerTest::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/serialization/single_layer/mvn.cpp b/inference-engine/tests/functional/inference_engine/serialization/single_layer/mvn.cpp
index b5a3cf828c79b7..5af5339f4211d5 100644
--- a/inference-engine/tests/functional/inference_engine/serialization/single_layer/mvn.cpp
+++ b/inference-engine/tests/functional/inference_engine/serialization/single_layer/mvn.cpp
@@ -17,22 +17,34 @@ const std::vector<bool> normalizeVariance = {true, false};
 const std::vector<std::vector<size_t>> inputShapes = {{1, 10, 5, 7, 8},
                                                       {1, 3, 8, 9, 49}};
 
+const std::vector<ngraph::AxisSet> axes = {{1, 2, 3}, {2, 3}};
 const std::vector<bool> acrossChannels = {true, false};
+const std::vector<ngraph::AxisSet> emptyReductionAxes = {{}};
+const std::vector<bool> emptyAcrossChannels = {{}};
 
 const std::vector<double> epsilon = {0.000000001};
 
-const auto MvnCases = ::testing::Combine(
+const auto MvnAcrossChannels = ::testing::Combine(
     ::testing::ValuesIn(inputShapes), ::testing::ValuesIn(dataPrecisions),
-    ::testing::ValuesIn(acrossChannels), ::testing::ValuesIn(normalizeVariance),
-    ::testing::ValuesIn(epsilon),
+    ::testing::ValuesIn(emptyReductionAxes), ::testing::ValuesIn(acrossChannels),
+    ::testing::ValuesIn(normalizeVariance), ::testing::ValuesIn(epsilon),
     ::testing::Values(CommonTestUtils::DEVICE_CPU));
 
-TEST_P(MvnLayerTest, Serialize) {
+const auto MvnReductionAxes = ::testing::Combine(
+    ::testing::ValuesIn(inputShapes), ::testing::ValuesIn(dataPrecisions),
+    ::testing::ValuesIn(axes), ::testing::ValuesIn(emptyAcrossChannels),
+    ::testing::ValuesIn(normalizeVariance), ::testing::ValuesIn(epsilon),
+    ::testing::Values(CommonTestUtils::DEVICE_CPU));
+
+TEST_P(Mvn1LayerTest, Serialize) {
     Serialize();
 }
 
-INSTANTIATE_TEST_SUITE_P(smoke_MKLDNN_TestsMVN, MvnLayerTest, MvnCases,
-                        MvnLayerTest::getTestCaseName);
+INSTANTIATE_TEST_SUITE_P(smoke_MKLDNN_TestsMVN_across_channels, Mvn1LayerTest, MvnAcrossChannels,
+                        Mvn1LayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_SUITE_P(smoke_MKLDNN_TestsMVN_reduction_axes, Mvn1LayerTest, MvnReductionAxes,
+                        Mvn1LayerTest::getTestCaseName);
 
 // ------------------- MVN-6 -------------------------------------------------
 
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/mvn.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/mvn.cpp
index 73fdce483efd20..41502bced85b53 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/mvn.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/mvn.cpp
@@ -9,6 +9,9 @@
 
 using namespace LayerTestsDefinitions;
 
+const std::vector<bool> emptyAcrossChannels = {{}};
+const std::vector<ngraph::AxisSet> emptyReductionAxes = {{}};
+
 const std::vector<std::vector<size_t>> inputShapes = {
     {8},
     {1, 16},
@@ -41,23 +44,35 @@ const std::vector<double> epsilon = {
     0.000000001
 };
 
-const auto MvnCases = ::testing::Combine(
+std::vector<InferenceEngine::Precision> dataPrecisions = {
+        InferenceEngine::Precision::FP16,
+        InferenceEngine::Precision::FP32
+};
+
+const auto MvnAcrossChannels = ::testing::Combine(
     ::testing::ValuesIn(inputShapes),
-    ::testing::Values(InferenceEngine::Precision::FP32),
+    ::testing::ValuesIn(dataPrecisions),
+    ::testing::ValuesIn(emptyReductionAxes),
     ::testing::ValuesIn(acrossChannels),
     ::testing::ValuesIn(normalizeVariance),
     ::testing::ValuesIn(epsilon),
     ::testing::Values(CommonTestUtils::DEVICE_CPU)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_MKLDNN_TestsMVN, MvnLayerTest, MvnCases, MvnLayerTest::getTestCaseName);
+const auto MvnReductionAxes = ::testing::Combine(
+    ::testing::ValuesIn(std::vector<std::vector<size_t>>{{1, 10, 5, 17}, {1, 3, 8, 9}}),
+    ::testing::Values(InferenceEngine::Precision::FP32),
+    ::testing::ValuesIn(std::vector<ngraph::AxisSet>{{1, 2, 3}, {2, 3}}),
+    ::testing::ValuesIn(emptyAcrossChannels),
+    ::testing::ValuesIn(normalizeVariance),
+    ::testing::ValuesIn(epsilon),
+    ::testing::Values(CommonTestUtils::DEVICE_CPU)
+);
 
+INSTANTIATE_TEST_SUITE_P(smoke_MKLDNN_TestsMVN_AcrossChannels, Mvn1LayerTest, MvnAcrossChannels, Mvn1LayerTest::getTestCaseName);
 
+INSTANTIATE_TEST_SUITE_P(smoke_MKLDNN_TestsMVN_ReductionAxes, Mvn1LayerTest, MvnReductionAxes, Mvn1LayerTest::getTestCaseName);
 
-std::vector<InferenceEngine::Precision> dataPrecisions = {
-    InferenceEngine::Precision::FP32,
-    InferenceEngine::Precision::FP16
-};
 
 std::vector<InferenceEngine::Precision> idxPrecisions = {
     InferenceEngine::Precision::I32,
diff --git a/inference-engine/tests/functional/plugin/cpu/single_layer_tests/mvn.cpp b/inference-engine/tests/functional/plugin/cpu/single_layer_tests/mvn.cpp
index 6b877960e7f2f6..9a69164baaa169 100644
--- a/inference-engine/tests/functional/plugin/cpu/single_layer_tests/mvn.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/single_layer_tests/mvn.cpp
@@ -13,7 +13,7 @@ using namespace CPUTestUtils;
 namespace CPULayerTestsDefinitions {
 
 typedef std::tuple<
-        LayerTestsDefinitions::mvnParams,
+        LayerTestsDefinitions::mvn1Params,
         CPUSpecificParams,
         fusingSpecificParams,
         Precision, // CNNNetwork input precision
@@ -24,14 +24,14 @@ class MvnLayerCPUTest : public testing::WithParamInterface<MvnLayerCPUTestParamS
                         virtual public LayerTestsUtils::LayerTestsCommon, public CpuTestWithFusing {
 public:
     static std::string getTestCaseName(testing::TestParamInfo<MvnLayerCPUTestParamSet> obj) {
-        LayerTestsDefinitions::mvnParams basicParamsSet;
+        LayerTestsDefinitions::mvn1Params basicParamsSet;
         CPUSpecificParams cpuParams;
         fusingSpecificParams fusingParams;
         Precision inputPrecision, outputPrecision;
         std::tie(basicParamsSet, cpuParams, fusingParams, inputPrecision, outputPrecision) = obj.param;
 
         std::ostringstream result;
-        result << LayerTestsDefinitions::MvnLayerTest::getTestCaseName(testing::TestParamInfo<LayerTestsDefinitions::mvnParams>(
+        result << LayerTestsDefinitions::Mvn1LayerTest::getTestCaseName(testing::TestParamInfo<LayerTestsDefinitions::mvn1Params>(
                 basicParamsSet, 0));
 
         result << "_" << "CNNInpPrc=" << inputPrecision.name();
@@ -45,7 +45,7 @@ class MvnLayerCPUTest : public testing::WithParamInterface<MvnLayerCPUTestParamS
     }
 protected:
     void SetUp() override {
-        LayerTestsDefinitions::mvnParams basicParamsSet;
+        LayerTestsDefinitions::mvn1Params basicParamsSet;
         CPUSpecificParams cpuParams;
         fusingSpecificParams fusingParams;
         std::tie(basicParamsSet, cpuParams, fusingParams, inPrc, outPrc) = this->GetParam();
@@ -55,13 +55,17 @@ class MvnLayerCPUTest : public testing::WithParamInterface<MvnLayerCPUTestParamS
 
         InferenceEngine::SizeVector inputShapes;
         InferenceEngine::Precision netPrecision;
+        ngraph::AxisSet axes;
         bool acrossChanels, normalizeVariance;
         double eps;
-        std::tie(inputShapes, netPrecision, acrossChanels, normalizeVariance, eps, targetDevice) = basicParamsSet;
+        std::tie(inputShapes, netPrecision, axes, acrossChanels, normalizeVariance, eps, targetDevice) = basicParamsSet;
         auto netPrc = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(netPrecision);
         auto param = ngraph::builder::makeParams(netPrc, {inputShapes});
         auto paramOuts = ngraph::helpers::convert2OutputVector(ngraph::helpers::castOps2Nodes<ngraph::op::Parameter>(param));
         auto mvn = ngraph::builder::makeMVN(paramOuts[0], acrossChanels, normalizeVariance, eps);
+        if (!axes.empty()) {
+             mvn = ngraph::builder::makeMVN(paramOuts[0], axes, normalizeVariance, eps);
+        }
 
         selectedType = getPrimitiveType() + "_" + inPrc.name();
 
@@ -128,6 +132,8 @@ const std::vector<double> epsilon = {
         0.000000001
 };
 
+const std::vector<ngraph::AxisSet> emptyReductionAxes = {{}};
+
 std::vector<Precision> inpPrc = {Precision::I8, Precision::BF16, Precision::FP32};
 std::vector<Precision> outPrc = {Precision::BF16, Precision::FP32};
 
@@ -162,6 +168,7 @@ const auto Mvn3D = ::testing::Combine(
         ::testing::Combine(
             ::testing::ValuesIn(inputShapes_3D),
             ::testing::Values(InferenceEngine::Precision::FP32),
+            ::testing::ValuesIn(emptyReductionAxes),
             ::testing::ValuesIn(acrossChannels),
             ::testing::ValuesIn(normalizeVariance),
             ::testing::ValuesIn(epsilon),
@@ -177,6 +184,7 @@ const auto Mvn4D = ::testing::Combine(
         ::testing::Combine(
                 ::testing::ValuesIn(inputShapes_4D),
                 ::testing::Values(InferenceEngine::Precision::FP32),
+                ::testing::ValuesIn(emptyReductionAxes),
                 ::testing::ValuesIn(acrossChannels),
                 ::testing::ValuesIn(normalizeVariance),
                 ::testing::ValuesIn(epsilon),
@@ -192,6 +200,7 @@ const auto Mvn5D = ::testing::Combine(
         ::testing::Combine(
                 ::testing::ValuesIn(inputShapes_5D),
                 ::testing::Values(InferenceEngine::Precision::FP32),
+                ::testing::ValuesIn(emptyReductionAxes),
                 ::testing::ValuesIn(acrossChannels),
                 ::testing::ValuesIn(normalizeVariance),
                 ::testing::ValuesIn(epsilon),
@@ -216,6 +225,7 @@ const auto Mvn1D = ::testing::Combine(
         ::testing::Combine(
                 ::testing::ValuesIn(inputShapes_1D),
                 ::testing::Values(InferenceEngine::Precision::FP32),
+                ::testing::ValuesIn(emptyReductionAxes),
                 ::testing::ValuesIn(acrossChannels),
                 ::testing::ValuesIn(normalizeVariance),
                 ::testing::ValuesIn(epsilon),
@@ -232,6 +242,7 @@ const auto Mvn2D = ::testing::Combine(
         ::testing::Combine(
                 ::testing::ValuesIn(inputShapes_2D),
                 ::testing::Values(InferenceEngine::Precision::FP32),
+                ::testing::ValuesIn(emptyReductionAxes),
                 ::testing::Values(false),
                 ::testing::ValuesIn(normalizeVariance),
                 ::testing::ValuesIn(epsilon),
@@ -248,6 +259,7 @@ const auto Mvn2DTrans = ::testing::Combine(
         ::testing::Combine(
                 ::testing::ValuesIn(inputShapes_2D),
                 ::testing::Values(InferenceEngine::Precision::FP32),
+                ::testing::ValuesIn(emptyReductionAxes),
                 ::testing::Values(true),
                 ::testing::ValuesIn(normalizeVariance),
                 ::testing::ValuesIn(epsilon),
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/mvn.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/mvn.cpp
index a4e83dc98732c4..9c68172b014423 100644
--- a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/mvn.cpp
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/mvn.cpp
@@ -9,6 +9,8 @@
 
 using namespace LayerTestsDefinitions;
 
+const std::vector<ngraph::AxisSet> emptyReductionAxes = {{}};
+
 const std::vector<std::vector<size_t>> inputShapes = {
     {1, 32, 17},
     {1, 37, 9},
@@ -41,13 +43,14 @@ const std::vector<double> epsilon = {
 const auto MvnCases = ::testing::Combine(
     ::testing::ValuesIn(inputShapes),
     ::testing::Values(InferenceEngine::Precision::FP32),
+    ::testing::ValuesIn(emptyReductionAxes),
     ::testing::ValuesIn(acrossChannels),
     ::testing::ValuesIn(normalizeVariance),
     ::testing::ValuesIn(epsilon),
     ::testing::Values(CommonTestUtils::DEVICE_GPU)
 );
 
-INSTANTIATE_TEST_SUITE_P(smoke_CLDNN_TestsMVN, MvnLayerTest, MvnCases, MvnLayerTest::getTestCaseName);
+INSTANTIATE_TEST_SUITE_P(smoke_CLDNN_TestsMVN, Mvn1LayerTest, MvnCases, Mvn1LayerTest::getTestCaseName);
 
 std::vector<InferenceEngine::Precision> dataPrecisions = {
     InferenceEngine::Precision::FP32,
diff --git a/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/mvn.hpp b/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/mvn.hpp
index c0cc301e714cd3..d1a9ff52a108e0 100644
--- a/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/mvn.hpp
+++ b/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/mvn.hpp
@@ -8,10 +8,15 @@
 
 namespace LayerTestsDefinitions {
 
+// DEPRECATED, remove MvnLayerTest when KMB and ARM plugin will switch to use Mvn1LayerTest (#60420)
 TEST_P(MvnLayerTest, CompareWithRefs) {
     Run();
 };
 
+TEST_P(Mvn1LayerTest, CompareWithRefs) {
+    Run();
+};
+
 TEST_P(Mvn6LayerTest, CompareWithRefs) {
     Run();
 };
diff --git a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/mvn.hpp b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/mvn.hpp
index 1fac97f20d2372..747e0940da7fef 100644
--- a/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/mvn.hpp
+++ b/inference-engine/tests/functional/shared_test_classes/include/shared_test_classes/single_layer/mvn.hpp
@@ -11,6 +11,7 @@
 
 namespace LayerTestsDefinitions {
 
+// DEPRECATED, remove MvnLayerTest when KMB and ARM plugin will switch to use Mvn1LayerTest (#60420)
 typedef std::tuple<
         InferenceEngine::SizeVector, // Input shapes
         InferenceEngine::Precision,  // Input precision
@@ -27,6 +28,24 @@ class MvnLayerTest : public testing::WithParamInterface<mvnParams>, virtual publ
     void SetUp() override;
 };
 
+typedef std::tuple<
+        InferenceEngine::SizeVector, // Input shapes
+        InferenceEngine::Precision,  // Input precision
+        ngraph::AxisSet,             // Reduction axes
+        bool,                        // Across channels
+        bool,                        // Normalize variance
+        double,                      // Epsilon
+        std::string                  // Device name
+    > mvn1Params;
+
+class Mvn1LayerTest : public testing::WithParamInterface<mvn1Params>, virtual public LayerTestsUtils::LayerTestsCommon {
+public:
+    static std::string getTestCaseName(const testing::TestParamInfo<mvn1Params>& obj);
+
+protected:
+    void SetUp() override;
+};
+
 typedef std::tuple<
         InferenceEngine::SizeVector, // Input shapes
         InferenceEngine::Precision,  // Data precision
diff --git a/inference-engine/tests/functional/shared_test_classes/src/single_layer/mvn.cpp b/inference-engine/tests/functional/shared_test_classes/src/single_layer/mvn.cpp
index 2ae7af4116b302..d4e2a0c0df8536 100644
--- a/inference-engine/tests/functional/shared_test_classes/src/single_layer/mvn.cpp
+++ b/inference-engine/tests/functional/shared_test_classes/src/single_layer/mvn.cpp
@@ -7,6 +7,7 @@
 
 namespace LayerTestsDefinitions {
 
+// DEPRECATED, remove MvnLayerTest when KMB and ARM plugin will switch to use Mvn1LayerTest (#60420)
 std::string MvnLayerTest::getTestCaseName(const testing::TestParamInfo<mvnParams>& obj) {
     InferenceEngine::SizeVector inputShapes;
     InferenceEngine::Precision inputPrecision;
@@ -38,6 +39,46 @@ void MvnLayerTest::SetUp() {
     function = std::make_shared<ngraph::Function>(results, param, "mvn");
 }
 
+std::string Mvn1LayerTest::getTestCaseName(const testing::TestParamInfo<mvn1Params>& obj) {
+    InferenceEngine::SizeVector inputShapes;
+    InferenceEngine::Precision inputPrecision;
+    ngraph::AxisSet axes;
+    bool acrossChannels, normalizeVariance;
+    double eps;
+    std::string targetDevice;
+    std::tie(inputShapes, inputPrecision, axes, acrossChannels, normalizeVariance, eps, targetDevice) = obj.param;
+    std::ostringstream result;
+    result << "IS=" << CommonTestUtils::vec2str(inputShapes) << "_";
+    result << "Precision=" << inputPrecision.name() << "_";
+    if (!axes.empty()) {
+        result << "ReductionAccess=" << CommonTestUtils::vec2str(axes.to_vector()) << "_";
+    } else {
+        result << "AcrossChannels=" << (acrossChannels ? "TRUE" : "FALSE") << "_";
+    }
+    result << "NormalizeVariance=" << (normalizeVariance ? "TRUE" : "FALSE") << "_";
+    result << "Epsilon=" << eps << "_";
+    result << "TargetDevice=" << targetDevice;
+    return result.str();
+}
+
+void Mvn1LayerTest::SetUp() {
+    InferenceEngine::SizeVector inputShapes;
+    InferenceEngine::Precision inputPrecision;
+    ngraph::AxisSet axes;
+    bool acrossChanels, normalizeVariance;
+    double eps;
+    std::tie(inputShapes, inputPrecision, axes, acrossChanels, normalizeVariance, eps, targetDevice) = this->GetParam();
+    auto inType = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(inputPrecision);
+    auto param = ngraph::builder::makeParams(inType, {inputShapes});
+    auto paramOuts = ngraph::helpers::convert2OutputVector(ngraph::helpers::castOps2Nodes<ngraph::op::Parameter>(param));
+    auto mvn = std::dynamic_pointer_cast<ngraph::op::MVN>(ngraph::builder::makeMVN(paramOuts[0], acrossChanels, normalizeVariance, eps));
+    if (!axes.empty()) {
+        mvn = std::dynamic_pointer_cast<ngraph::op::MVN>(ngraph::builder::makeMVN(paramOuts[0], axes, normalizeVariance, eps));
+    }
+    ngraph::ResultVector results{std::make_shared<ngraph::opset1::Result>(mvn)};
+    function = std::make_shared<ngraph::Function>(results, param, "MVN1");
+}
+
 
 std::string Mvn6LayerTest::getTestCaseName(const testing::TestParamInfo<mvn6Params>& obj) {
     InferenceEngine::SizeVector inputShapes;
diff --git a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
index d383d0f95c278d..60d91f93b49a47 100644
--- a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
+++ b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
@@ -57,6 +57,7 @@
     'LSTMSequence-5',
     'LogSoftmax-5',
     'Loop-5',
+    'MVN-1',
     'MVN-6',
     'Maximum-1',
     'MaxPool-1',
diff --git a/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/builders.hpp b/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/builders.hpp
index d1e94b78f1eb06..55a8f48297823d 100644
--- a/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/builders.hpp
+++ b/inference-engine/tests/ngraph_helpers/ngraph_functions/include/ngraph_functions/builders.hpp
@@ -291,6 +291,11 @@ std::shared_ptr<ngraph::Node> makeMVN(const ngraph::Output<Node> &in,
                                       bool normalizeVariance,
                                       double eps);
 
+std::shared_ptr<ngraph::Node> makeMVN(const ngraph::Output<Node> &in,
+                                      const ngraph::AxisSet &axes,
+                                      bool normalizeVariance,
+                                      double eps);
+
 std::shared_ptr<ngraph::Node> makeMVN6(const Output<Node>& in,
                                        const Output<Node>& axesNode,
                                        bool normalizeVariance,
diff --git a/inference-engine/tests/ngraph_helpers/ngraph_functions/src/mvn.cpp b/inference-engine/tests/ngraph_helpers/ngraph_functions/src/mvn.cpp
index ab65a06c179c34..f4f73e93852a24 100644
--- a/inference-engine/tests/ngraph_helpers/ngraph_functions/src/mvn.cpp
+++ b/inference-engine/tests/ngraph_helpers/ngraph_functions/src/mvn.cpp
@@ -24,6 +24,15 @@ std::shared_ptr<ngraph::Node> makeMVN(const ngraph::Output<Node> &in,
     return mvnNode;
 }
 
+std::shared_ptr<ngraph::Node> makeMVN(const ngraph::Output<Node> &in,
+                                      const ngraph::AxisSet &axes,
+                                      bool normalizeVariance,
+                                      double eps) {
+    auto mvnNode = std::make_shared<ngraph::op::MVN>(in, axes, normalizeVariance, eps);
+
+    return mvnNode;
+}
+
 std::shared_ptr<Node> makeMVN6(const Output<Node>& in,
                                const Output<Node>& axesNode,
                                bool normalizeVariance,
diff --git a/ngraph/core/include/ngraph/op/mvn.hpp b/ngraph/core/include/ngraph/op/mvn.hpp
index cc3ab0bb9d7024..49f9c3a71d82af 100644
--- a/ngraph/core/include/ngraph/op/mvn.hpp
+++ b/ngraph/core/include/ngraph/op/mvn.hpp
@@ -69,7 +69,7 @@ namespace ngraph
                 void set_reduction_axes(AxisSet axes) { m_reduction_axes = axes; }
 
             private:
-                double m_eps = 1e-9;
+                double m_eps;
                 bool m_across_channels;
                 bool m_normalize_variance;
                 AxisSet m_reduction_axes;
@@ -128,9 +128,9 @@ namespace ngraph
                 MVNEpsMode get_eps_mode() const { return m_eps_mode; }
 
             private:
-                bool m_normalize_variance = true;
-                float m_eps = (float)1e-6;
-                MVNEpsMode m_eps_mode = MVNEpsMode::INSIDE_SQRT;
+                bool m_normalize_variance;
+                float m_eps;
+                MVNEpsMode m_eps_mode;
             };
         } // namespace v6
     }     // namespace op
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 24d70dece93564..5cc1197307bd5a 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -451,7 +451,6 @@ set(MULTI_TEST_SRC
     backend/multiple_backends.in.cpp
     backend/multiple_result.in.cpp
     backend/multiply.in.cpp
-    backend/mvn.in.cpp
     backend/negative.in.cpp
     backend/node_name.in.cpp
     backend/normalize_l2.in.cpp
diff --git a/ngraph/test/backend/mvn.in.cpp b/ngraph/test/backend/mvn.in.cpp
deleted file mode 100644
index 2a0dd89b218897..00000000000000
--- a/ngraph/test/backend/mvn.in.cpp
+++ /dev/null
@@ -1,139 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "gtest/gtest.h"
-#include "ngraph/ngraph.hpp"
-#include "util/engine/test_engines.hpp"
-#include "util/test_case.hpp"
-#include "util/test_control.hpp"
-
-NGRAPH_SUPPRESS_DEPRECATED_START
-
-using namespace std;
-using namespace ngraph;
-
-static string s_manifest = "${MANIFEST}";
-using TestEngine = test::ENGINE_CLASS_NAME(${BACKEND_NAME});
-
-NGRAPH_TEST(${BACKEND_NAME}, evaluate_mvn_6_no_variance)
-{
-    auto data = make_shared<op::Parameter>(element::f32, PartialShape{1, 3, 3, 3});
-    auto axes = make_shared<op::Constant>(element::i64, Shape{2}, vector<int64_t>{2, 3});
-
-    auto mvn =
-        make_shared<op::v6::MVN>(data, axes, false, 1e-9, ngraph::op::MVNEpsMode::OUTSIDE_SQRT);
-    auto fun = make_shared<Function>(OutputVector{mvn}, ParameterVector{data});
-    auto test_case = test::TestCase<TestEngine>(fun);
-
-    // clang-format off
-    test_case.add_input<float>({1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9});
-
-    test_case.add_expected_output<float>({-4, -3, -2, -1, 0, 1, 2, 3, 4,
-                                          -4, -3, -2, -1, 0, 1, 2, 3, 4,
-                                          -4, -3, -2, -1, 0, 1, 2, 3, 4});
-    // clang-format on
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, evaluate_mvn_6)
-{
-    auto data = make_shared<op::Parameter>(element::f32, PartialShape{1, 3, 3, 3});
-    auto axes = make_shared<op::Constant>(element::i64, Shape{2}, vector<int64_t>{2, 3});
-
-    auto mvn =
-        make_shared<op::v6::MVN>(data, axes, true, 1e-9, ngraph::op::MVNEpsMode::OUTSIDE_SQRT);
-    auto fun = make_shared<Function>(OutputVector{mvn}, ParameterVector{data});
-    auto test_case = test::TestCase<TestEngine>(fun);
-
-    // clang-format off
-    test_case.add_input<float>({1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9});
-
-    test_case.add_expected_output<float>({-1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934,
-                                          -1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934,
-                                          -1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934});
-    // clang-format on
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, evaluate_mvn_6_inside_sqrt)
-{
-    auto data = make_shared<op::Parameter>(element::f32, PartialShape{1, 3, 3, 3});
-    auto axes = make_shared<op::Constant>(element::i64, Shape{2}, vector<int64_t>{2, 3});
-
-    auto mvn =
-        make_shared<op::v6::MVN>(data, axes, true, 1e-9, ngraph::op::MVNEpsMode::INSIDE_SQRT);
-    auto fun = make_shared<Function>(OutputVector{mvn}, ParameterVector{data});
-    auto test_case = test::TestCase<TestEngine>(fun);
-
-    // clang-format off
-    test_case.add_input<float>({1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9});
-
-    test_case.add_expected_output<float>({-1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934,
-                                          -1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934,
-                                          -1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934});
-    // clang-format on
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, evaluate_mvn_6_across_chanells)
-{
-    auto data = make_shared<op::Parameter>(element::f32, PartialShape{1, 3, 3, 3});
-    auto axes = make_shared<op::Constant>(element::i64, Shape{3}, vector<int64_t>{1, 2, 3});
-
-    auto mvn =
-        make_shared<op::v6::MVN>(data, axes, true, 1e-9, ngraph::op::MVNEpsMode::OUTSIDE_SQRT);
-    auto fun = make_shared<Function>(OutputVector{mvn}, ParameterVector{data});
-    auto test_case = test::TestCase<TestEngine>(fun);
-
-    // clang-format off
-    test_case.add_input<float>(
-        {1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9});
-
-    test_case.add_expected_output<float>({-1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934,
-                                          -1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934,
-                                          -1.5491934, -1.161895, -0.7745967,
-                                          -0.38729835, 0.,        0.38729835,
-                                           0.7745967,  1.161895,  1.5491934});
-    // clang-format on
-    test_case.run();
-}
-
-NGRAPH_TEST(${BACKEND_NAME}, evaluate_mvn_6_across_batch)
-{
-    auto data = make_shared<op::Parameter>(element::f32, PartialShape{2, 3, 2, 2});
-    auto axes = make_shared<op::Constant>(element::i64, Shape{3}, vector<int64_t>{0, 2, 3});
-
-    auto mvn =
-        make_shared<op::v6::MVN>(data, axes, true, 1e-9, ngraph::op::MVNEpsMode::OUTSIDE_SQRT);
-    auto fun = make_shared<Function>(OutputVector{mvn}, ParameterVector{data});
-    auto test_case = test::TestCase<TestEngine>(fun);
-
-    // clang-format off
-    test_case.add_input<float>(
-        {1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3, 4, 5, 6, 7, 8});
-
-    test_case.add_expected_output<float>(
-        {-1.5275252,  -1.0910894, -0.65465367, -0.21821788, 0.21821788,  0.65465367,
-          1.0910894,   1.5275252, -1.5275252,  -1.0910894, -0.65465367, -0.21821788,
-          0.21821788,  0.65465367, 1.0910894,   1.5275252, -1.5275252,  -1.0910894,
-         -0.65465367, -0.21821788, 0.21821788,  0.65465367, 1.0910894,   1.5275252});
-    // clang-format on
-    test_case.run();
-}
diff --git a/ngraph/test/visitors/op/mvn.cpp b/ngraph/test/visitors/op/mvn.cpp
index 0f2bf38ecdce62..7773cca5abab15 100644
--- a/ngraph/test/visitors/op/mvn.cpp
+++ b/ngraph/test/visitors/op/mvn.cpp
@@ -10,6 +10,7 @@
 #include "ngraph/opsets/opset3.hpp"
 #include "ngraph/opsets/opset4.hpp"
 #include "ngraph/opsets/opset5.hpp"
+#include "ngraph/opsets/opset6.hpp"
 
 #include "util/visitor.hpp"
 
@@ -18,7 +19,7 @@ using namespace ngraph;
 using ngraph::test::NodeBuilder;
 using ngraph::test::ValueMap;
 
-TEST(attributes, mvn_op)
+TEST(attributes, mvn_v1_op)
 {
     NodeBuilder::get_ops().register_factory<opset3::MVN>();
     const auto data = make_shared<op::Parameter>(element::i32, Shape{2, 3, 4, 5});
@@ -29,9 +30,33 @@ TEST(attributes, mvn_op)
     op->set_reduction_axes(axes);
     NodeBuilder builder(op);
     const auto g_op = as_type_ptr<opset3::MVN>(builder.create());
+    const auto expected_attr_count = 4;
 
+    EXPECT_EQ(builder.get_value_map_size(), expected_attr_count);
     EXPECT_EQ(g_op->get_reduction_axes(), op->get_reduction_axes());
     EXPECT_EQ(g_op->get_across_channels(), op->get_across_channels());
     EXPECT_EQ(g_op->get_normalize_variance(), op->get_normalize_variance());
     EXPECT_EQ(g_op->get_eps(), op->get_eps());
 }
+
+TEST(attributes, mvn_v6_op)
+{
+    NodeBuilder::get_ops().register_factory<opset6::MVN>();
+    const auto data = make_shared<op::Parameter>(element::i32, Shape{2, 3, 4, 5});
+    auto axes = ngraph::opset6::Constant::create(ngraph::element::i64, ngraph::Shape{ 2 }, { 2, 3 });
+
+    const auto op = make_shared<opset6::MVN>(data,
+                    axes,
+                    false,
+                    0.1,
+                    op::MVNEpsMode::INSIDE_SQRT);
+
+    NodeBuilder builder(op);
+    const auto g_op = as_type_ptr<opset6::MVN>(builder.create());
+    const auto expected_attr_count = 3;
+
+    EXPECT_EQ(builder.get_value_map_size(), expected_attr_count);
+    EXPECT_EQ(g_op->get_eps_mode(), op->get_eps_mode());
+    EXPECT_EQ(g_op->get_normalize_variance(), op->get_normalize_variance());
+    EXPECT_EQ(g_op->get_eps(), op->get_eps());
+}

From ac0f3c5271199fbf56cdcc4411d95c8bd81d5cd1 Mon Sep 17 00:00:00 2001
From: Mikhail Nosov <mikhail.nosov@intel.com>
Date: Fri, 23 Jul 2021 09:14:08 +0300
Subject: [PATCH 50/71] Install 'paddlepaddle' for Azure-Linux CI (#6764)

---
 .ci/azure/linux.yml               | 2 ++
 ngraph/test/requirements_test.txt | 6 ++++++
 2 files changed, 8 insertions(+)
 create mode 100644 ngraph/test/requirements_test.txt

diff --git a/.ci/azure/linux.yml b/.ci/azure/linux.yml
index 73bac3bb255f83..64710f8eeba000 100644
--- a/.ci/azure/linux.yml
+++ b/.ci/azure/linux.yml
@@ -88,6 +88,8 @@ jobs:
       python3 -m pip install -r $(REPO_DIR)/inference-engine/ie_bridges/python/wheel/requirements-dev.txt
       # For running Python API tests
       python3 -m pip install -r $(REPO_DIR)/inference-engine/ie_bridges/python/src/requirements-dev.txt
+      # For running nGraph unit tests dependent on Python frameworks
+      python3 -m pip install -r $(REPO_DIR)/ngraph/test/requirements_test.txt
       # Speed up build
       wget https://github.com/ninja-build/ninja/releases/download/v1.10.0/ninja-linux.zip
       unzip ninja-linux.zip
diff --git a/ngraph/test/requirements_test.txt b/ngraph/test/requirements_test.txt
new file mode 100644
index 00000000000000..f9f5ae3d96c92b
--- /dev/null
+++ b/ngraph/test/requirements_test.txt
@@ -0,0 +1,6 @@
+# PaddlePaddle - generate test models
+paddlepaddle==2.1.0
+gast==0.3.3
+numpy~=1.19.2
+six~=1.15.0
+

From 753fdaee986bea2bf4d47caac4fa49c56c2ff184 Mon Sep 17 00:00:00 2001
From: Ivan Kochin <iv.kochin@gmail.com>
Date: Fri, 23 Jul 2021 10:29:55 +0300
Subject: [PATCH 51/71] Intoduce -latency_percentile flag for the benchmark_app
 tool (#6479)

* Introduce new -latency_percentile flag for benchmark_app

* Fix syntax
---
 .../samples/benchmark_app/README.md           |  1 +
 .../samples/benchmark_app/benchmark_app.hpp   |  8 +++++
 .../samples/benchmark_app/main.cpp            | 30 ++++++++++++++-----
 .../openvino/tools/benchmark/benchmark.py     |  9 ++++--
 .../openvino/tools/benchmark/main.py          | 13 ++++++--
 .../openvino/tools/benchmark/parameters.py    |  2 ++
 6 files changed, 50 insertions(+), 13 deletions(-)

diff --git a/inference-engine/samples/benchmark_app/README.md b/inference-engine/samples/benchmark_app/README.md
index 7c61bc570d518e..2d5076a60c613c 100644
--- a/inference-engine/samples/benchmark_app/README.md
+++ b/inference-engine/samples/benchmark_app/README.md
@@ -95,6 +95,7 @@ Options:
     -layout                     Optional. Prompts how network layouts should be treated by application. For example, "input1[NCHW],input2[NC]" or "[NCHW]" in case of one input size.
     -cache_dir "<path>"         Optional. Enables caching of loaded models to specified directory.
     -load_from_file             Optional. Loads model from file directly without ReadNetwork.
+    -latency_percentile         Optional. Defines the percentile to be reported in latency metric. The valid range is [1, 100]. The default value is 50 (median).
 
   CPU-specific performance options:
     -nstreams "<integer>"       Optional. Number of streams to use for inference on the CPU, GPU or MYRIAD devices
diff --git a/inference-engine/samples/benchmark_app/benchmark_app.hpp b/inference-engine/samples/benchmark_app/benchmark_app.hpp
index af18c908e31b96..a369c2f1055ce1 100644
--- a/inference-engine/samples/benchmark_app/benchmark_app.hpp
+++ b/inference-engine/samples/benchmark_app/benchmark_app.hpp
@@ -56,6 +56,10 @@ static const char infer_num_streams_message[] = "Optional. Number of streams to
                                                 "Also, using nstreams>1 is inherently throughput-oriented option, "
                                                 "while for the best-latency estimations the number of streams should be set to 1.";
 
+/// @brief message for latency percentile settings
+static const char infer_latency_percentile_message[] =
+    "Optional. Defines the percentile to be reported in latency metric. The valid range is [1, 100]. The default value is 50 (median).";
+
 /// @brief message for enforcing of BF16 execution where it is possible
 static const char enforce_bf16_message[] = "Optional. By default floating point operations execution in bfloat16 precision are enforced "
                                            "if supported by platform.\n"
@@ -189,6 +193,9 @@ DEFINE_uint32(nthreads, 0, infer_num_threads_message);
 /// @brief Number of streams to use for inference on the CPU (also affects Hetero cases)
 DEFINE_string(nstreams, "", infer_num_streams_message);
 
+/// @brief The percentile which will be reported in latency metric
+DEFINE_uint32(latency_percentile, 50, infer_latency_percentile_message);
+
 /// @brief Enforces bf16 execution with bfloat16 precision on systems having this capability
 DEFINE_bool(enforcebf16, false, enforce_bf16_message);
 
@@ -278,6 +285,7 @@ static void showUsage() {
     std::cout << "    -layout                   " << layout_message << std::endl;
     std::cout << "    -cache_dir \"<path>\"        " << cache_dir_message << std::endl;
     std::cout << "    -load_from_file           " << load_from_file_message << std::endl;
+    std::cout << "    -latency_percentile       " << infer_latency_percentile_message << std::endl;
     std::cout << std::endl << "  device-specific performance options:" << std::endl;
     std::cout << "    -nstreams \"<integer>\"     " << infer_num_streams_message << std::endl;
     std::cout << "    -nthreads \"<integer>\"     " << infer_num_threads_message << std::endl;
diff --git a/inference-engine/samples/benchmark_app/main.cpp b/inference-engine/samples/benchmark_app/main.cpp
index 2a5252ba443a85..8df3bc2f8e400b 100644
--- a/inference-engine/samples/benchmark_app/main.cpp
+++ b/inference-engine/samples/benchmark_app/main.cpp
@@ -52,6 +52,10 @@ bool ParseAndCheckCommandLine(int argc, char* argv[]) {
         throw std::logic_error("Model is required but not set. Please set -m option.");
     }
 
+    if (FLAGS_latency_percentile > 100 || FLAGS_latency_percentile < 1) {
+        showUsage();
+        throw std::logic_error("The percentile value is incorrect. The applicable values range is [1, 100].");
+    }
     if (FLAGS_api != "async" && FLAGS_api != "sync") {
         throw std::logic_error("Incorrect API. Please set -api option to `sync` or `async` value.");
     }
@@ -100,11 +104,10 @@ static void next_step(const std::string additional_info = "") {
 }
 
 template <typename T>
-T getMedianValue(const std::vector<T>& vec) {
+T getMedianValue(const std::vector<T>& vec, std::size_t percentile) {
     std::vector<T> sortedVec(vec);
     std::sort(sortedVec.begin(), sortedVec.end());
-    return (sortedVec.size() % 2 != 0) ? sortedVec[sortedVec.size() / 2ULL]
-                                       : (sortedVec[sortedVec.size() / 2ULL] + sortedVec[sortedVec.size() / 2ULL - 1ULL]) / static_cast<T>(2.0);
+    return sortedVec[(sortedVec.size() / 100) * percentile];
 }
 
 /**
@@ -624,7 +627,7 @@ int main(int argc, char* argv[]) {
         // wait the latest inference executions
         inferRequestsQueue.waitAll();
 
-        double latency = getMedianValue<double>(inferRequestsQueue.getLatencies());
+        double latency = getMedianValue<double>(inferRequestsQueue.getLatencies(), FLAGS_latency_percentile);
         double totalDuration = inferRequestsQueue.getDurationInMilliseconds();
         double fps = (FLAGS_api == "sync") ? batchSize * 1000.0 / latency : batchSize * 1000.0 * iteration / totalDuration;
 
@@ -634,8 +637,14 @@ int main(int argc, char* argv[]) {
                                                                                          {"total number of iterations", std::to_string(iteration)},
                                                                                      });
             if (device_name.find("MULTI") == std::string::npos) {
+                std::string latency_label;
+                if (FLAGS_latency_percentile == 50) {
+                    latency_label = "latency (ms)";
+                } else {
+                    latency_label = "latency (" + std::to_string(FLAGS_latency_percentile) + " percentile) (ms)";
+                }
                 statistics->addParameters(StatisticsReport::Category::EXECUTION_RESULTS, {
-                                                                                             {"latency (ms)", double_to_string(latency)},
+                                                                                             {latency_label, double_to_string(latency)},
                                                                                          });
             }
             statistics->addParameters(StatisticsReport::Category::EXECUTION_RESULTS, {{"throughput", double_to_string(fps)}});
@@ -684,8 +693,15 @@ int main(int argc, char* argv[]) {
 
         std::cout << "Count:      " << iteration << " iterations" << std::endl;
         std::cout << "Duration:   " << double_to_string(totalDuration) << " ms" << std::endl;
-        if (device_name.find("MULTI") == std::string::npos)
-            std::cout << "Latency:    " << double_to_string(latency) << " ms" << std::endl;
+        if (device_name.find("MULTI") == std::string::npos) {
+            std::cout << "Latency";
+            if (FLAGS_latency_percentile == 50) {
+                std::cout << ":    ";
+            } else {
+                std::cout << " (" << FLAGS_latency_percentile << " percentile):    ";
+            }
+            std::cout << double_to_string(latency) << " ms" << std::endl;
+        }
         std::cout << "Throughput: " << double_to_string(fps) << " FPS" << std::endl;
     } catch (const std::exception& ex) {
         slog::err << ex.what() << slog::endl;
diff --git a/tools/benchmark_tool/openvino/tools/benchmark/benchmark.py b/tools/benchmark_tool/openvino/tools/benchmark/benchmark.py
index 6f3333afdfa675..0f744cf49374d1 100644
--- a/tools/benchmark_tool/openvino/tools/benchmark/benchmark.py
+++ b/tools/benchmark_tool/openvino/tools/benchmark/benchmark.py
@@ -3,7 +3,7 @@
 
 import os
 from datetime import datetime
-from statistics import median
+from math import ceil
 from openvino.inference_engine import IENetwork, IECore, get_version, StatusCode
 
 from .utils.constants import MULTI_DEVICE_NAME, HETERO_DEVICE_NAME, CPU_DEVICE_NAME, GPU_DEVICE_NAME, XML_EXTENSION, BIN_EXTENSION
@@ -11,6 +11,9 @@
 from .utils.utils import get_duration_seconds
 from .utils.statistics_report import StatisticsReport
 
+def percentile(values, percent):
+    return values[ceil(len(values) * percent / 100) - 1]
+
 class Benchmark:
     def __init__(self, device: str, number_infer_requests: int = None, number_iterations: int = None,
                  duration_seconds: int = None, api_type: str = 'async'):
@@ -98,7 +101,7 @@ def first_infer(self, exe_network):
                 raise Exception(f"Wait for all requests is failed with status code {status}!")
         return infer_request.latency
 
-    def infer(self, exe_network, batch_size, progress_bar=None):
+    def infer(self, exe_network, batch_size, latency_percentile, progress_bar=None):
         progress_count = 0
         infer_requests = exe_network.requests
 
@@ -155,7 +158,7 @@ def infer(self, exe_network, batch_size, progress_bar=None):
         for infer_request_id in in_fly:
             times.append(infer_requests[infer_request_id].latency)
         times.sort()
-        latency_ms = median(times)
+        latency_ms = percentile(times, latency_percentile)
         fps = batch_size * 1000 / latency_ms if self.api_type == 'sync' else batch_size * iteration / total_duration_sec
         if progress_bar:
             progress_bar.finish()
diff --git a/tools/benchmark_tool/openvino/tools/benchmark/main.py b/tools/benchmark_tool/openvino/tools/benchmark/main.py
index 0cc0a511848d65..03fae003c07676 100644
--- a/tools/benchmark_tool/openvino/tools/benchmark/main.py
+++ b/tools/benchmark_tool/openvino/tools/benchmark/main.py
@@ -344,7 +344,7 @@ def set_throughput_streams():
                                     [
                                         ('first inference time (ms)', duration_ms)
                                     ])
-        fps, latency_ms, total_duration_sec, iteration = benchmark.infer(exe_network, batch_size, progress_bar)
+        fps, latency_ms, total_duration_sec, iteration = benchmark.infer(exe_network, batch_size, args.latency_percentile, progress_bar)
 
         # ------------------------------------ 11. Dumping statistics report -------------------------------------------
         next_step()
@@ -372,9 +372,13 @@ def set_throughput_streams():
                                           ('total number of iterations', str(iteration)),
                                       ])
             if MULTI_DEVICE_NAME not in device_name:
+                if args.latency_percentile == 50:
+                    latency_prefix = 'latency (ms)'
+                else:
+                    latency_prefix = 'latency (' + args.latency_percentile + ' percentile) (ms)'
                 statistics.add_parameters(StatisticsReport.Category.EXECUTION_RESULTS,
                                           [
-                                              ('latency (ms)', f'{latency_ms:.2f}'),
+                                              (latency_prefix, f'{latency_ms:.2f}'),
                                           ])
 
             statistics.add_parameters(StatisticsReport.Category.EXECUTION_RESULTS,
@@ -388,7 +392,10 @@ def set_throughput_streams():
         print(f'Count:      {iteration} iterations')
         print(f'Duration:   {get_duration_in_milliseconds(total_duration_sec):.2f} ms')
         if MULTI_DEVICE_NAME not in device_name:
-            print(f'Latency:    {latency_ms:.2f} ms')
+            if args.latency_percentile == 50:
+                print(f'Latency:    {latency_ms:.2f} ms')
+            else:
+                print(f'Latency ({args.latency_percentile} percentile):    {latency_ms:.2f} ms')
         print(f'Throughput: {fps:.2f} FPS')
 
         del exe_network
diff --git a/tools/benchmark_tool/openvino/tools/benchmark/parameters.py b/tools/benchmark_tool/openvino/tools/benchmark/parameters.py
index 6e4a1464d4e10f..0c51db1b4916c8 100644
--- a/tools/benchmark_tool/openvino/tools/benchmark/parameters.py
+++ b/tools/benchmark_tool/openvino/tools/benchmark/parameters.py
@@ -84,6 +84,8 @@ def parse_args():
                            'Also, using nstreams>1 is inherently throughput-oriented option, while for the best-latency '
                            'estimations the number of streams should be set to 1. '
                            'See samples README for more details.')
+    args.add_argument('--latency_percentile', type=int, required=False, default=50, choices=range(1,101),
+                      help='Optional. Defines the percentile to be reported in latency metric. The valid range is [1, 100]. The default value is 50 (median).')
     args.add_argument('-enforcebf16', '--enforce_bfloat16', type=str2bool, required=False, default=False, nargs='?', const=True, choices=[True, False],
                       help='Optional. By default floating point operations execution in bfloat16 precision are enforced if supported by platform. '
                            '\'true\'  - enable  bfloat16 regardless of platform support. '

From 252483bb836bd1902ece9a166c9c228409eaf11a Mon Sep 17 00:00:00 2001
From: Ilya Sharikov <ilya.sharikov@intel.com>
Date: Fri, 23 Jul 2021 10:37:35 +0300
Subject: [PATCH 52/71] Common tests library for shared functionality (#6578)

---
 tests/lib/CMakeLists.txt                      |   5 +
 tests/lib/src/CMakeLists.txt                  |  15 ++
 .../ie_utils.cpp => lib/src/common_utils.cpp} |   6 +-
 .../ie_utils.h => lib/src/common_utils.h}     |   4 +-
 tests/stress_tests/common/CMakeLists.txt      |   3 +-
 .../common/ie_pipelines/pipelines.cpp         |   2 +-
 tests/stress_tests/memcheck_tests/tests.cpp   |   2 +-
 tests/stress_tests/memleaks_tests/tests.cpp   |   2 +-
 .../tests_pipelines_full_pipeline.cpp         |   2 +-
 tests/time_tests/src/timetests/CMakeLists.txt |   4 +-
 tests/time_tests/src/timetests/common.h       | 154 ------------------
 .../src/timetests/timetest_infer.cpp          |   2 +-
 .../src/timetests/timetest_infer_cache.cpp    |   2 +-
 13 files changed, 36 insertions(+), 167 deletions(-)
 create mode 100644 tests/lib/CMakeLists.txt
 create mode 100644 tests/lib/src/CMakeLists.txt
 rename tests/{stress_tests/common/ie_utils.cpp => lib/src/common_utils.cpp} (92%)
 rename tests/{stress_tests/common/ie_utils.h => lib/src/common_utils.h} (96%)
 delete mode 100644 tests/time_tests/src/timetests/common.h

diff --git a/tests/lib/CMakeLists.txt b/tests/lib/CMakeLists.txt
new file mode 100644
index 00000000000000..708f2355b9d903
--- /dev/null
+++ b/tests/lib/CMakeLists.txt
@@ -0,0 +1,5 @@
+# Copyright (C) 2018-2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+#
+
+add_subdirectory(src)
diff --git a/tests/lib/src/CMakeLists.txt b/tests/lib/src/CMakeLists.txt
new file mode 100644
index 00000000000000..8a2c8ec7bb054e
--- /dev/null
+++ b/tests/lib/src/CMakeLists.txt
@@ -0,0 +1,15 @@
+# Copyright (C) 2018-2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+#
+
+set (TARGET_NAME "tests_shared_lib")
+
+file (GLOB SRC *.cpp)
+add_library(${TARGET_NAME} STATIC ${SRC})
+
+target_include_directories(${TARGET_NAME} PUBLIC ${CMAKE_CURRENT_SOURCE_DIR})
+
+# Search OpenVINO Inference Engine installed
+find_package(InferenceEngine REQUIRED)
+
+target_link_libraries(${TARGET_NAME} PUBLIC ${InferenceEngine_LIBRARIES})
diff --git a/tests/stress_tests/common/ie_utils.cpp b/tests/lib/src/common_utils.cpp
similarity index 92%
rename from tests/stress_tests/common/ie_utils.cpp
rename to tests/lib/src/common_utils.cpp
index cc1a1041ac9fcb..dcf8ce0baceb4c 100644
--- a/tests/stress_tests/common/ie_utils.cpp
+++ b/tests/lib/src/common_utils.cpp
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "ie_utils.h"
+#include "common_utils.h"
 
 #include <inference_engine.hpp>
 
@@ -32,7 +32,7 @@ void fillBlobs(InferenceEngine::InferRequest inferRequest,
       } else if (item.second->getPrecision() == InferenceEngine::Precision::I32) {
         fillBlobImInfo<int32_t>(inputBlob, batchSize, image_size);
       } else {
-        IE_THROW() << "Input precision is not supported for image info!";
+        throw std::logic_error("Input precision is not supported for image info!");
       }
       continue;
     }
@@ -52,7 +52,7 @@ void fillBlobs(InferenceEngine::InferRequest inferRequest,
     } else if (item.second->getPrecision() == InferenceEngine::Precision::I16) {
       fillBlobRandom<int16_t>(inputBlob);
     } else {
-      IE_THROW() << "Input precision is not supported for " << item.first;
+      throw std::logic_error("Input precision is not supported for " + item.first);
     }
   }
 }
\ No newline at end of file
diff --git a/tests/stress_tests/common/ie_utils.h b/tests/lib/src/common_utils.h
similarity index 96%
rename from tests/stress_tests/common/ie_utils.h
rename to tests/lib/src/common_utils.h
index 7520ed66066459..69f37ce7c094c6 100644
--- a/tests/stress_tests/common/ie_utils.h
+++ b/tests/lib/src/common_utils.h
@@ -57,7 +57,7 @@ inline std::pair<size_t, size_t> getTensorHeightWidth(const InferenceEngine::Ten
     // Regardless of layout, dimensions are stored in fixed order
     return std::make_pair(dims.back(), dims.at(size - 2));
   } else {
-    IE_THROW() << "Tensor does not have height and width dimensions";
+    throw std::logic_error("Tensor does not have height and width dimensions");
   }
 }
 
@@ -111,4 +111,4 @@ void fillBlobImInfo(Blob::Ptr& inputBlob,
  */
 void fillBlobs(InferenceEngine::InferRequest inferRequest,
         const InferenceEngine::ConstInputsDataMap& inputsInfo,
-        const size_t& batchSize);
\ No newline at end of file
+        const size_t& batchSize);
diff --git a/tests/stress_tests/common/CMakeLists.txt b/tests/stress_tests/common/CMakeLists.txt
index 008acb5836477f..2ced4a865caa82 100644
--- a/tests/stress_tests/common/CMakeLists.txt
+++ b/tests/stress_tests/common/CMakeLists.txt
@@ -27,11 +27,12 @@ if(EXISTS "${OpenVINO_SOURCE_DIR}/thirdparty/gflags")
     add_gflags()
 endif()
 
+add_subdirectory("${OpenVINO_SOURCE_DIR}/tests/lib" tests_shared_lib)
 target_link_libraries(${TARGET_NAME}
     PUBLIC
         IE::gtest
         IE::pugixml
-        ${InferenceEngine_LIBRARIES}
         gflags
+        tests_shared_lib
     PRIVATE
         IE::gtest_main)
diff --git a/tests/stress_tests/common/ie_pipelines/pipelines.cpp b/tests/stress_tests/common/ie_pipelines/pipelines.cpp
index 4e6894a7b09591..eccee2bb615be8 100644
--- a/tests/stress_tests/common/ie_pipelines/pipelines.cpp
+++ b/tests/stress_tests/common/ie_pipelines/pipelines.cpp
@@ -4,7 +4,7 @@
 
 #include "pipelines.h"
 #include "../utils.h"
-#include "../ie_utils.h"
+#include "common_utils.h"
 
 #include <iostream>
 #include <string>
diff --git a/tests/stress_tests/memcheck_tests/tests.cpp b/tests/stress_tests/memcheck_tests/tests.cpp
index c8cefc9575650a..a432772dc0fc1f 100644
--- a/tests/stress_tests/memcheck_tests/tests.cpp
+++ b/tests/stress_tests/memcheck_tests/tests.cpp
@@ -4,7 +4,7 @@
 
 #include "tests_utils.h"
 #include "../common/tests_utils.h"
-#include "../common/ie_utils.h"
+#include "common_utils.h"
 #include "../common/managers/thread_manager.h"
 #include "tests_pipelines/tests_pipelines.h"
 
diff --git a/tests/stress_tests/memleaks_tests/tests.cpp b/tests/stress_tests/memleaks_tests/tests.cpp
index 22c1812cb742c4..92bb7982fca8fe 100644
--- a/tests/stress_tests/memleaks_tests/tests.cpp
+++ b/tests/stress_tests/memleaks_tests/tests.cpp
@@ -3,7 +3,7 @@
 //
 
 #include "../common/tests_utils.h"
-#include "../common/ie_utils.h"
+#include "common_utils.h"
 #include "../common/managers/thread_manager.h"
 #include "tests_pipelines/tests_pipelines.h"
 
diff --git a/tests/stress_tests/unittests/tests_pipelines/tests_pipelines_full_pipeline.cpp b/tests/stress_tests/unittests/tests_pipelines/tests_pipelines_full_pipeline.cpp
index 1c5dae1b860e6b..90ccaab8dd816d 100644
--- a/tests/stress_tests/unittests/tests_pipelines/tests_pipelines_full_pipeline.cpp
+++ b/tests/stress_tests/unittests/tests_pipelines/tests_pipelines_full_pipeline.cpp
@@ -3,7 +3,7 @@
 //
 
 #include "tests_pipelines.h"
-#include "../common/ie_utils.h"
+#include "common_utils.h"
 
 #include <string>
 
diff --git a/tests/time_tests/src/timetests/CMakeLists.txt b/tests/time_tests/src/timetests/CMakeLists.txt
index 44711e421c277b..c1bb4f64f56a73 100644
--- a/tests/time_tests/src/timetests/CMakeLists.txt
+++ b/tests/time_tests/src/timetests/CMakeLists.txt
@@ -9,11 +9,13 @@ add_custom_target(time_tests)
 # Test target name is source file name without extension.
 FILE(GLOB tests "*.cpp")
 
+add_subdirectory("${OpenVINO_SOURCE_DIR}/tests/lib" tests_shared_lib)
+
 foreach(test_source ${tests})
     get_filename_component(test_name ${test_source} NAME_WE)
     add_executable(${test_name} ${test_source})
 
-    target_link_libraries(${test_name} PRIVATE IE::inference_engine timetests_helper)
+    target_link_libraries(${test_name} PRIVATE tests_shared_lib timetests_helper)
 
     add_dependencies(time_tests ${test_name})
 
diff --git a/tests/time_tests/src/timetests/common.h b/tests/time_tests/src/timetests/common.h
deleted file mode 100644
index 82ef22eeb93bf5..00000000000000
--- a/tests/time_tests/src/timetests/common.h
+++ /dev/null
@@ -1,154 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#pragma once
-
-using namespace InferenceEngine;
-
-/**
- * @brief Determine if InferenceEngine blob means image or not
- */
-template<typename T>
-static bool isImage(const T &blob) {
-  auto descriptor = blob->getTensorDesc();
-  if (descriptor.getLayout() != InferenceEngine::NCHW) {
-    return false;
-  }
-  auto channels = descriptor.getDims()[1];
-  return channels == 3;
-}
-
-
-/**
- * @brief Determine if InferenceEngine blob means image information or not
- */
-template<typename T>
-static bool isImageInfo(const T &blob) {
-  auto descriptor = blob->getTensorDesc();
-  if (descriptor.getLayout() != InferenceEngine::NC) {
-    return false;
-  }
-  auto channels = descriptor.getDims()[1];
-  return (channels >= 2);
-}
-
-
-/**
- * @brief Return height and width from provided InferenceEngine tensor description
- */
-inline std::pair<size_t, size_t> getTensorHeightWidth(const InferenceEngine::TensorDesc& desc) {
-  const auto& layout = desc.getLayout();
-  const auto& dims = desc.getDims();
-  const auto& size = dims.size();
-  if ((size >= 2) &&
-    (layout == InferenceEngine::Layout::NCHW  ||
-     layout == InferenceEngine::Layout::NHWC  ||
-     layout == InferenceEngine::Layout::NCDHW ||
-     layout == InferenceEngine::Layout::NDHWC ||
-     layout == InferenceEngine::Layout::OIHW  ||
-     layout == InferenceEngine::Layout::GOIHW ||
-     layout == InferenceEngine::Layout::OIDHW ||
-     layout == InferenceEngine::Layout::GOIDHW ||
-     layout == InferenceEngine::Layout::CHW  ||
-     layout == InferenceEngine::Layout::HW)) {
-    // Regardless of layout, dimensions are stored in fixed order
-    return std::make_pair(dims.back(), dims.at(size - 2));
-  } else {
-    IE_THROW() << "Tensor does not have height and width dimensions";
-  }
-}
-
-
-/**
- * @brief Fill InferenceEngine blob with random values
- */
-template<typename T>
-void fillBlobRandom(Blob::Ptr& inputBlob) {
-  MemoryBlob::Ptr minput = as<MemoryBlob>(inputBlob);
-  // locked memory holder should be alive all time while access to its buffer happens
-  auto minputHolder = minput->wmap();
-
-  auto inputBlobData = minputHolder.as<T *>();
-  for (size_t i = 0; i < inputBlob->size(); i++) {
-    auto rand_max = RAND_MAX;
-    inputBlobData[i] = (T) rand() / static_cast<T>(rand_max) * 10;
-  }
-}
-
-
-/**
- * @brief Fill InferenceEngine blob with image information
- */
-template<typename T>
-void fillBlobImInfo(Blob::Ptr& inputBlob,
-          const size_t& batchSize,
-          std::pair<size_t, size_t> image_size) {
-  MemoryBlob::Ptr minput = as<MemoryBlob>(inputBlob);
-  // locked memory holder should be alive all time while access to its buffer happens
-  auto minputHolder = minput->wmap();
-
-  auto inputBlobData = minputHolder.as<T *>();
-  for (size_t b = 0; b < batchSize; b++) {
-    size_t iminfoSize = inputBlob->size()/batchSize;
-    for (size_t i = 0; i < iminfoSize; i++) {
-      size_t index = b*iminfoSize + i;
-      if (0 == i)
-        inputBlobData[index] = static_cast<T>(image_size.first);
-      else if (1 == i)
-        inputBlobData[index] = static_cast<T>(image_size.second);
-      else
-        inputBlobData[index] = 1;
-    }
-  }
-}
-
-
-/**
- * @brief Fill InferRequest blobs with random values or image information
- */
-void fillBlobs(InferenceEngine::InferRequest inferRequest,
-        const InferenceEngine::ConstInputsDataMap& inputsInfo,
-        const size_t& batchSize) {
-  std::vector<std::pair<size_t, size_t>> input_image_sizes;
-  for (const ConstInputsDataMap::value_type& item : inputsInfo) {
-    if (isImage(item.second))
-      input_image_sizes.push_back(getTensorHeightWidth(item.second->getTensorDesc()));
-  }
-
-  for (const ConstInputsDataMap::value_type& item : inputsInfo) {
-    Blob::Ptr inputBlob = inferRequest.GetBlob(item.first);
-    if (isImageInfo(inputBlob) && (input_image_sizes.size() == 1)) {
-      // Fill image information
-      auto image_size = input_image_sizes.at(0);
-      if (item.second->getPrecision() == InferenceEngine::Precision::FP32) {
-        fillBlobImInfo<float>(inputBlob, batchSize, image_size);
-      } else if (item.second->getPrecision() == InferenceEngine::Precision::FP16) {
-        fillBlobImInfo<short>(inputBlob, batchSize, image_size);
-      } else if (item.second->getPrecision() == InferenceEngine::Precision::I32) {
-        fillBlobImInfo<int32_t>(inputBlob, batchSize, image_size);
-      } else {
-        IE_THROW() << "Input precision is not supported for image info!";
-      }
-      continue;
-    }
-    // Fill random
-    if (item.second->getPrecision() == InferenceEngine::Precision::FP32) {
-      fillBlobRandom<float>(inputBlob);
-    } else if (item.second->getPrecision() == InferenceEngine::Precision::FP16) {
-      fillBlobRandom<short>(inputBlob);
-    } else if (item.second->getPrecision() == InferenceEngine::Precision::I32) {
-      fillBlobRandom<int32_t>(inputBlob);
-    } else if (item.second->getPrecision() == InferenceEngine::Precision::U8) {
-      fillBlobRandom<uint8_t>(inputBlob);
-    } else if (item.second->getPrecision() == InferenceEngine::Precision::I8) {
-      fillBlobRandom<int8_t>(inputBlob);
-    } else if (item.second->getPrecision() == InferenceEngine::Precision::U16) {
-      fillBlobRandom<uint16_t>(inputBlob);
-    } else if (item.second->getPrecision() == InferenceEngine::Precision::I16) {
-      fillBlobRandom<int16_t>(inputBlob);
-    } else {
-      IE_THROW() << "Input precision is not supported for " << item.first;
-    }
-  }
-}
\ No newline at end of file
diff --git a/tests/time_tests/src/timetests/timetest_infer.cpp b/tests/time_tests/src/timetests/timetest_infer.cpp
index 1292bcffd08794..83f47f837e1690 100644
--- a/tests/time_tests/src/timetests/timetest_infer.cpp
+++ b/tests/time_tests/src/timetests/timetest_infer.cpp
@@ -5,7 +5,7 @@
 #include <inference_engine.hpp>
 #include <iostream>
 
-#include "common.h"
+#include "common_utils.h"
 #include "timetests_helper/timer.h"
 #include "timetests_helper/utils.h"
 using namespace InferenceEngine;
diff --git a/tests/time_tests/src/timetests/timetest_infer_cache.cpp b/tests/time_tests/src/timetests/timetest_infer_cache.cpp
index 95b733758b7e61..f1c657f6aa463f 100644
--- a/tests/time_tests/src/timetests/timetest_infer_cache.cpp
+++ b/tests/time_tests/src/timetests/timetest_infer_cache.cpp
@@ -5,7 +5,7 @@
 #include <inference_engine.hpp>
 #include <iostream>
 
-#include "common.h"
+#include "common_utils.h"
 #include "timetests_helper/timer.h"
 #include "timetests_helper/utils.h"
 using namespace InferenceEngine;

From 12fb83dc1e6cd128c8e2e32d2524890ff90de16f Mon Sep 17 00:00:00 2001
From: Roman Kazantsev <roman.kazantsev@intel.com>
Date: Fri, 23 Jul 2021 11:01:06 +0300
Subject: [PATCH 53/71] Correct layout for Einsum inputs and output (#6696)

* Fix recovery of output subscript in Einsum implicit mode

Signed-off-by: Roman Kazantsev <roman.kazantsev@intel.com>

* Fix code style

Signed-off-by: Roman Kazantsev <roman.kazantsev@intel.com>

* Correct layout adjustment for Einsum inputs and output

Signed-off-by: Roman Kazantsev <roman.kazantsev@intel.com>

* Correct a comment in the unit-test

Signed-off-by: Roman Kazantsev <roman.kazantsev@intel.com>

* Setup correct transformation dependencies for LayoutChangeForEinsum

Signed-off-by: Roman Kazantsev <roman.kazantsev@intel.com>
---
 model-optimizer/automation/package_BOM.txt    |  2 +-
 .../{back => middle}/LayoutChangeForEinsum.py | 38 ++++++++++----
 model-optimizer/extensions/ops/einsum.py      | 25 ++++++----
 .../LayoutChangeForEinsum_test.py             | 49 +++++++++++++++++--
 4 files changed, 91 insertions(+), 23 deletions(-)
 rename model-optimizer/extensions/{back => middle}/LayoutChangeForEinsum.py (58%)
 rename model-optimizer/unit_tests/extensions/{back => middle}/LayoutChangeForEinsum_test.py (59%)

diff --git a/model-optimizer/automation/package_BOM.txt b/model-optimizer/automation/package_BOM.txt
index 939f75b685d292..e4dc75cb2142e2 100644
--- a/model-optimizer/automation/package_BOM.txt
+++ b/model-optimizer/automation/package_BOM.txt
@@ -29,7 +29,6 @@ extensions/back/GroupedConvWeightsNormalize.py
 extensions/back/insert_compatibility_l2normalization.py
 extensions/back/InterpolateReshape.py
 extensions/back/kaldi_remove_memory_output.py
-extensions/back/LayoutChangeForEinsum.py
 extensions/back/LayoutChangeForGatherND.py
 extensions/back/LeakyReLUMutation.py
 extensions/back/LinearToLinearONNXReplacer.py
@@ -597,6 +596,7 @@ extensions/middle/InsertSelect.py
 extensions/middle/InterpolateSequenceToInterpolate.py
 extensions/middle/L2NormFusing.py
 extensions/middle/LayoutChangeForConstantShapePaths.py
+extensions/middle/LayoutChangeForEinsum.py
 extensions/middle/LeakyReluPattern.py
 extensions/middle/LSTMRNNSequenceToTensorIterator.py
 extensions/middle/MakeKaldiConstReshapable.py
diff --git a/model-optimizer/extensions/back/LayoutChangeForEinsum.py b/model-optimizer/extensions/middle/LayoutChangeForEinsum.py
similarity index 58%
rename from model-optimizer/extensions/back/LayoutChangeForEinsum.py
rename to model-optimizer/extensions/middle/LayoutChangeForEinsum.py
index f45bff54b931c5..aab33d3f0a762b 100644
--- a/model-optimizer/extensions/back/LayoutChangeForEinsum.py
+++ b/model-optimizer/extensions/middle/LayoutChangeForEinsum.py
@@ -1,12 +1,14 @@
 # Copyright (C) 2018-2021 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 
+from extensions.middle.InsertLayoutPropagationTransposes import is_input_data_in_correct_layout, \
+    is_output_data_in_correct_layout
 from extensions.ops.einsum import Einsum
-from mo.back.replacement import BackReplacementPattern
 from mo.graph.graph import Graph
+from mo.middle.replacement import MiddleReplacementPattern
 
 
-class LayoutChangeForEinsum(BackReplacementPattern):
+class LayoutChangeForEinsum(MiddleReplacementPattern):
     """
     The transformation adjusts Einsum equation to NCHW layout.
     Subscripts for tensor of rank greater than three must be adjusted
@@ -19,7 +21,15 @@ class LayoutChangeForEinsum(BackReplacementPattern):
     """
     enabled = True
     force_shape_inference = True
-    graph_condition = [lambda graph: graph.graph['fw'] == 'tf']
+    graph_condition = [lambda graph: graph.graph['layout'] == 'NHWC']
+
+    def run_after(self):
+        from extensions.middle.MarkSubgraphsWithCorrectLayout import MarkSubGraphsWithCorrectLayout
+        return [MarkSubGraphsWithCorrectLayout]
+
+    def run_before(self):
+        from extensions.middle.InsertLayoutPropagationTransposes import InsertLayoutPropagationTranspose
+        return [InsertLayoutPropagationTranspose]
 
     def find_and_replace_pattern(self, graph: Graph):
         import extensions.middle.InsertLayoutPropagationTransposes as InsertTransposes
@@ -31,27 +41,35 @@ def find_and_replace_pattern(self, graph: Graph):
             connected_in_ports = [port for port in einsum.in_ports().values() if not port.disconnected()]
             num_inputs = len(connected_in_ports)
 
-            # compute a mask of inputs of rank greater than 3 that are required original layout (NCHW)
-            # due to presence of ellipsis covering multiple tail dimensions in the corresponding input subscript
+            # check if correct_data_layout attribute is set for inputs and output
+            # this attribute can be set up within MarkSubgraphWithCorrectLayout transformation
+            # for example, when Einsum is located near to MatMul operation in a graph
+            input_correct_layout_mask = []
+            for input_ind in range(num_inputs):
+                input_correct_layout_mask.append(is_input_data_in_correct_layout(einsum, input_ind))
+            is_output_layout_correct = is_output_data_in_correct_layout(einsum, 0)
+
+            # compute a mask of which inputs/output are adjusted to the required layout
+            # if they are not adjusted, it means to require transpose
             input_ranks = [len(einsum.in_port(port_idx).data.get_shape()) for port_idx in range(num_inputs)]
             output_rank = len(einsum.out_port(0).data.get_shape())
-            permuted_equation, is_inputs_permuted, is_output_permuted = Einsum.adjust_equation_with_NCHW_layout(
+            permuted_equation, are_inputs_adjusted, is_output_adjusted = Einsum.adjust_equation_with_NCHW_layout(
                 einsum_name,
                 equation,
                 input_ranks,
-                output_rank)
-            assert len(is_inputs_permuted) == num_inputs
+                output_rank, input_correct_layout_mask, is_output_layout_correct)
+            assert len(are_inputs_adjusted) == num_inputs
 
             # setup adjusted equation
             einsum.equation = permuted_equation
 
             # insert Transpose node to get NHWC layout back (for inputs) that is required due to specifics of equation
             for input_ind in range(num_inputs):
-                if not is_inputs_permuted[input_ind]:
+                if not are_inputs_adjusted[input_ind]:
                     # that means Einsum can only accept input in NHWC layout
                     # so the inserted transpose before the Einsum will convert the layout to NHWC
                     InsertTransposes.insert_transpose(graph, einsum.in_port(input_ind), before_input=True)
-            if not is_output_permuted:
+            if not is_output_adjusted:
                 # that means Einsum can only generate output in NHWC layout
                 # so the inserted transpose followed after the output will convert the layout back into NCHW layout
                 InsertTransposes.insert_transpose(graph, einsum.out_port(0), before_input=False)
diff --git a/model-optimizer/extensions/ops/einsum.py b/model-optimizer/extensions/ops/einsum.py
index a30bb96bdfcb89..a37c60def7c76b 100644
--- a/model-optimizer/extensions/ops/einsum.py
+++ b/model-optimizer/extensions/ops/einsum.py
@@ -137,7 +137,8 @@ def extract_subscript_labels(node_name: str, subscript: str) -> list:
         return labels
 
     @staticmethod
-    def adjust_equation_with_NCHW_layout(node_name: str, equation: str, input_ranks: list, output_rank: int) -> (
+    def adjust_equation_with_NCHW_layout(node_name: str, equation: str, input_ranks: list, output_rank: int,
+                                         input_correct_layout_mask: list, output_correct_layout_mask: bool) -> (
             str, list, bool):
         """
         In order to satisfy NCHW layout, subscripts for tensors with rank greater than three must be adjusted by moving labels
@@ -151,11 +152,13 @@ def adjust_equation_with_NCHW_layout(node_name: str, equation: str, input_ranks:
         :param output_rank: output rank
         :return: adjusted equation, boolean mask for inputs, and boolean flag if output subscript is adjusted
         """
-        is_inputs_permuted = []
+        is_inputs_adjusted = []
         input_subscripts, output_subscript = Einsum.parse_equation(node_name, equation)
         num_inputs = len(input_ranks)
         assert len(input_subscripts) == num_inputs, "The number of inputs must match a number " \
                                                     "of input subscripts"
+        assert len(input_correct_layout_mask) == num_inputs, "The number of inputs must match a number " \
+                                                             "elements in input_correct_layout_mask list"
 
         # permute labels in input subscripts and mark inputs for which inference in NCHW layout is acceptable
         # in case ellipsis covering multiple dimensions in the end, the permutation is impossible
@@ -166,31 +169,35 @@ def adjust_equation_with_NCHW_layout(node_name: str, equation: str, input_ranks:
             input_rank = input_ranks[input_ind]
             labels = Einsum.extract_subscript_labels(node_name, input_subscript)
             num_broadcasted_dims = input_rank - len(labels) + 1
-            if input_rank > 3 and (labels[-1] != "..." or labels[-1] == "..." and num_broadcasted_dims == 1):
-                is_inputs_permuted.append(True)
+            if input_correct_layout_mask[input_ind]:
+                is_inputs_adjusted.append(True)
+            elif input_rank > 3 and (labels[-1] != "..." or labels[-1] == "..." and num_broadcasted_dims == 1):
+                is_inputs_adjusted.append(True)
                 labels.insert(1, labels[-1])
                 del labels[-1]
             else:
-                is_inputs_permuted.append(False)
+                is_inputs_adjusted.append(False)
             permuted_input_subscript = ''.join(labels)
             permuted_input_subscripts.append(permuted_input_subscript)
 
         # perform the same procedure for the output subscript as for the inputs subscripts
         labels = Einsum.extract_subscript_labels(node_name, output_subscript)
         num_broadcasted_dims = output_rank - len(labels) + 1
-        if output_rank > 3 and (labels[-1] != "..." or labels[-1] == "..." and num_broadcasted_dims == 1):
-            is_output_permuted = True
+        if output_correct_layout_mask:
+            is_output_adjusted = True
+        elif output_rank > 3 and (labels[-1] != "..." or labels[-1] == "..." and num_broadcasted_dims == 1):
+            is_output_adjusted = True
             labels.insert(1, labels[-1])
             del labels[-1]
         else:
-            is_output_permuted = False
+            is_output_adjusted = False
         permuted_output_subscript = ''.join(labels)
 
         # concatenate the left and right hands of the resulted equation
         left_hand = ','.join(permuted_input_subscripts)
         right_hand = permuted_output_subscript
         permuted_equation = left_hand + "->" + right_hand
-        return permuted_equation, is_inputs_permuted, is_output_permuted
+        return permuted_equation, is_inputs_adjusted, is_output_adjusted
 
     @staticmethod
     def infer(node: Node):
diff --git a/model-optimizer/unit_tests/extensions/back/LayoutChangeForEinsum_test.py b/model-optimizer/unit_tests/extensions/middle/LayoutChangeForEinsum_test.py
similarity index 59%
rename from model-optimizer/unit_tests/extensions/back/LayoutChangeForEinsum_test.py
rename to model-optimizer/unit_tests/extensions/middle/LayoutChangeForEinsum_test.py
index 45e0f2badabf20..aa908ab04f7304 100644
--- a/model-optimizer/unit_tests/extensions/back/LayoutChangeForEinsum_test.py
+++ b/model-optimizer/unit_tests/extensions/middle/LayoutChangeForEinsum_test.py
@@ -5,7 +5,7 @@
 
 import numpy as np
 
-from extensions.back.LayoutChangeForEinsum import LayoutChangeForEinsum
+from extensions.middle.LayoutChangeForEinsum import LayoutChangeForEinsum
 from mo.front.common.partial_infer.utils import int64_array
 from mo.utils.ir_engine.compare_graphs import compare_graphs
 from unit_tests.utils.graph import build_graph, result, regular_op_with_shaped_data, valued_const_with_data, connect
@@ -47,7 +47,7 @@ def test_layout_change_einsum(self):
                                 # this input does not require additional transpose
                                 # since the corresponding subscript can be adjusted
                                 'placeholder_2_d': {'shape': np.array([3, 8, 5, 7])},
-                                # [3, 5, 10, 12] - NHWC, [3, 12, 5, 10] - NCHW
+                                # [3, 8, 10, 12] - NHWC, [3, 12, 8, 10] - NCHW
                                 # the third input must be transposed to NHWC layout
                                 # since ellipsis covers multiple dimensions in the end
                                 # the corresponding subscript is not changed
@@ -60,7 +60,7 @@ def test_layout_change_einsum(self):
                                 # and additional transpose to NCHW will be inserted
                                 'einsum_d': {'shape': np.array([2, 12, 7, 8, 10])},
                             }, nodes_with_edges_only=True)
-        graph.graph['fw'] = 'tf'
+        graph.graph['layout'] = 'NHWC'
 
         graph_ref = build_graph(nodes_attributes,
                                 [*connect('placeholder_3', '0:transpose_1'),
@@ -80,3 +80,46 @@ def test_layout_change_einsum(self):
         LayoutChangeForEinsum().find_and_replace_pattern(graph)
         (flag, resp) = compare_graphs(graph, graph_ref, 'output', check_op_attrs=True)
         self.assertTrue(flag, resp)
+
+    def test_no_adjustment_layout_einsum(self):
+        graph = build_graph(nodes_attributes,
+                            [*connect('placeholder_1', '0:einsum'),
+                             *connect('placeholder_2', '1:einsum'),
+                             *connect('placeholder_3', '2:einsum'),
+                             *connect('einsum', 'output')],
+                            {  # this input stays as is since it is of a rank equal to 3
+                                'placeholder_1_d': {'shape': np.array([2, 3, 5])},
+                                # [3, 5, 7, 8] - NHWC
+                                # this input does not require additional transpose
+                                # since the corresponding layout is correct
+                                'placeholder_2_d': {'shape': np.array([3, 5, 7, 8])},
+                                # [3, 8, 10, 12] - NHWC
+                                # this input does not require additional transpose
+                                # since the corresponding layout is correct
+                                'placeholder_3_d': {'shape': np.array([3, 8, 10, 12])},
+                                # equation is still for NHWC layout
+                                'einsum': {'equation': "abc,bcde,bc...->ade...",
+                                           'correct_in_data_layout': [0, 1, 2],
+                                           'correct_out_data_layout': [0]},
+                                # [2, 7, 8, 10, 12] - NHWC
+                                # this output does not require additional transpose
+                                # since the corresponding layout is correct
+                                'einsum_d': {'shape': np.array([2, 7, 8, 10, 12])},
+                            }, nodes_with_edges_only=True)
+        graph.graph['layout'] = 'NHWC'
+
+        graph_ref = build_graph(nodes_attributes,
+                                [*connect('placeholder_1', '0:einsum'),
+                                 *connect('placeholder_2', '1:einsum'),
+                                 *connect('placeholder_3', '2:einsum'),
+                                 *connect('einsum', 'output')],
+                                {'placeholder_1_d': {'shape': np.array([2, 3, 5])},
+                                 'placeholder_2_d': {'shape': np.array([3, 5, 7, 8])},
+                                 'placeholder_3_d': {'shape': np.array([3, 8, 10, 12])},
+                                 'einsum': {'equation': "abc,bcde,bc...->ade..."},
+                                 'einsum_d': {'shape': np.array([2, 7, 8, 10, 12])}
+                                 })
+
+        LayoutChangeForEinsum().find_and_replace_pattern(graph)
+        (flag, resp) = compare_graphs(graph, graph_ref, 'output', check_op_attrs=True)
+        self.assertTrue(flag, resp)

From c776ea90d82103a812619a65a37a50bc8c1c8266 Mon Sep 17 00:00:00 2001
From: Anastasia Popova <anastasia.popova@intel.com>
Date: Fri, 23 Jul 2021 14:22:53 +0300
Subject: [PATCH 54/71] Added specification for RandomUniform operation.
 (#6196)

* Added RandomUniform specification.

* Extended description of obtaining float numbers.

* Added description of obtainin float16 and double values.

* Added description of xor symbol.

* Small correction.

* Small corrections.

* Added initial type attribute.

* Corrected IR example, removed unnecessary default values.

* Small correction.

* Added information about type cast between initial and output types.

* Removed initial type attribute.

* Corrected output_type description.

* Corrected minval, maxval description. Corrected IR example.

* Apply suggestions from code review

Co-authored-by: Tatiana Savina <tatiana.savina@intel.com>

* Removed unnecessary paper link.

Co-authored-by: Tatiana Savina <tatiana.savina@intel.com>
---
 docs/doxygen/ie_docs.xml               |   1 +
 docs/ops/generation/RandomUniform_8.md | 231 +++++++++++++++++++++++++
 docs/ops/opset8.md                     |   1 +
 3 files changed, 233 insertions(+)
 create mode 100644 docs/ops/generation/RandomUniform_8.md

diff --git a/docs/doxygen/ie_docs.xml b/docs/doxygen/ie_docs.xml
index 184c2ea11ecba6..99e91e53ed572f 100644
--- a/docs/doxygen/ie_docs.xml
+++ b/docs/doxygen/ie_docs.xml
@@ -221,6 +221,7 @@ limitations under the License.
                 <tab type="user" title="PriorBox-1" url="@ref openvino_docs_ops_detection_PriorBox_1"/>
                 <tab type="user" title="Proposal-1" url="@ref openvino_docs_ops_detection_Proposal_1"/>
                 <tab type="user" title="Proposal-4" url="@ref openvino_docs_ops_detection_Proposal_4"/>
+                <tab type="user" title="RandomUniform-8" url="@ref openvino_docs_ops_generation_RandomUniform_8"/>
                 <tab type="user" title="Range-1" url="@ref openvino_docs_ops_generation_Range_1"/>
                 <tab type="user" title="Range-4" url="@ref openvino_docs_ops_generation_Range_4"/>
                 <tab type="user" title="ReadValue-3" url="@ref openvino_docs_ops_infrastructure_ReadValue_3"/>
diff --git a/docs/ops/generation/RandomUniform_8.md b/docs/ops/generation/RandomUniform_8.md
new file mode 100644
index 00000000000000..4269c82bc6a8aa
--- /dev/null
+++ b/docs/ops/generation/RandomUniform_8.md
@@ -0,0 +1,231 @@
+## RandomUniform <a name="RandomUniform"></a> {#openvino_docs_ops_generation_RandomUniform_8}
+
+**Versioned name**: *RandomUniform-8*
+
+**Category**: Generation
+
+**Short description**: *RandomUniform* operation generates a sequence of random values from a uniform distribution.
+
+**Detailed description**:
+
+*RandomUniform* operation generates random numbers from a uniform distribution in the range `[*minval*, *maxval*)`. 
+The generation algorithm is based on underlying random integer generator that uses Philox algorithm. Philox algorithm 
+is a counter-based pseudo-random generator, which produces uint32 values. Single invocation of Philox algorithm returns 
+four result random values, depending on the given *key* and *counter* values. *Key* and *counter* are initialized 
+with *seed* and *seed2* attributes respectively.
+
+\f[
+key = seed\\
+counter = seed2
+\f]
+
+Link to the original paper [Parallel Random Numbers: As Easy as 1, 2, 3](https://www.thesalmons.org/john/random123/papers/random123sc11.pdf)
+
+The result of Philox is calculated by applying a fixed number of *key* and *counter* updating so-called "rounds". 
+This implementation uses 4x32_10 version of Philox algorithm, where number of rounds = 10.
+
+Suppose we have *n* which determines *n*-th 4 elements of random sequence.
+In each round *key*, *counter* and *n* are splitted to pairs of uint32 values:
+
+\f[
+R = cast\_to\_uint32(value)\\
+L = cast\_to\_uint32(value >> 32),
+\f]
+where *cast\_to\_uint32* - static cast to uint32, *value* - uint64 input value, *L*, *R* - uint32 
+result values, >> - bitwise right shift.
+
+Then *n* and *counter* are updated with the following formula:
+
+\f[
+L'= mullo(R, M)\\
+R' = mulhi(R, M) {\oplus} k {\oplus} L \\
+mulhi(a, b) = floor((a {\times} b) / 2^{32}) \\
+mullo(a, b) = (a {\times} b) \mod 2^{32}
+\f]
+where `{\oplus}` - bitwise xor, *k* = `R_{key}` for updating counter, *k* = `L_{key}` for updating *n*, 
+*M* = `0xD2511F53` for updating *n*, *M* = `0xCD9E8D57` for updating *counter*.
+
+After each round *key* is raised by summing with another pair of const values:
+\f[
+L += 0x9E3779B9 \\
+R += 0xBB67AE85
+\f]
+Values *L'_{n}*, *R'_{n}*, *L'_{counter}*, *R'_{counter}* are resulting four random numbers.
+
+Float values between [0..1) are obtained from 32-bit integers by the following rules.
+
+Float16 is formatted as follows: *sign*(1 bit) *exponent*(5 bits) *mantissa*(10 bits). The value is interpreted 
+using following formula:
+\f[
+(-1)^{sign} * 1, mantissa * 2 ^{exponent - 15}
+\f]
+
+so to obtain float16 values *sign*, *exponent* and *mantissa* are set as follows:
+``` 
+sign = 0
+exponent = 15 - representation of a zero exponent.
+mantissa = 10 right bits from generated uint32 random value.
+``` 
+
+So the resulting float16 value is:
+``` 
+x_uint16 = x // Truncate the upper 16 bits.
+val = ((exponent << 10) | x_uint16 & 0x3ffu) - 1.0,
+```
+where x is uint32 generated random value.
+
+Float32 is formatted as follows: *sign*(1 bit) *exponent*(8 bits) *mantissa*(23 bits). The value is interpreted 
+using following formula:
+\f[
+(-1)^{sign} * 1, mantissa * 2 ^{exponent - 127}
+\f]
+
+so to obtain float values *sign*, *exponent* and *mantissa* are set as follows:
+``` 
+sign = 0
+exponent = 127 - representation of a zero exponent.
+mantissa = 23 right bits from generated uint32 random value.
+``` 
+
+So the resulting float value is:
+``` 
+val = ((exponent << 23) | x & 0x7fffffu) - 1.0,
+```
+where x is uint32 generated random value.
+
+Double is formatted as follows: *sign*(1 bit) *exponent*(11 bits) *mantissa*(52 bits). The value is interpreted 
+using following formula:
+\f[
+(-1)^{sign} * 1, mantissa * 2 ^{exponent - 1023}
+\f]
+
+so to obtain double values *sign*, *exponent* and *mantissa* are set as follows:
+``` 
+sign = 0
+exponent = 1023 - representation of a zero exponent.
+mantissa = 52 right bits from two concatinated uint32 values from random integer generator.
+``` 
+
+So the resulting double is obtained as follows:
+``` 
+mantissa_h = x0 & 0xfffffu;  // upper 20 bits of mantissa
+mantissa_l = x1;             // lower 32 bits of mantissa
+mantissa = (mantissa_h << 32) | mantissa_l;
+val = ((exponent << 52) | mantissa) - 1.0,
+```
+where x0, x1 are uint32 generated random values.
+
+To obtain a value in a specified range each value is processed with the following formulas:
+
+For float values:
+\f[
+result = x * (maxval - minval) + minval,
+\f]
+where *x* is random float or double value between [0..1).
+
+For integer values:
+\f[
+result = x \mod (maxval - minval) + minval,
+\f]
+where *x* is uint32 random value.
+
+
+Example 1. *RandomUniform* output with `seed` = 150, `seed2` = 10, `output_type` = f32:
+
+``` 
+input_shape    = [ 3, 3 ]
+output  = [[0.7011236  0.30539632 0.93931055]
+          [0.9456035   0.11694777 0.50770056]
+          [0.5197197   0.22727466 0.991374  ]]
+```
+
+Example 2. *RandomUniform* output with `seed` = 80, `seed2` = 100, `output_type` = double:
+
+``` 
+input_shape    = [ 2, 2 ]
+
+minval = 2
+
+maxval = 10
+
+output  = [[5.65927959 4.23122376]
+          [2.67008206 2.36423758]]
+```
+
+Example 3. *RandomUniform* output with `seed` = 80, `seed2` = 100, `output_type` = i32:
+
+``` 
+input_shape    = [ 2, 3 ]
+
+minval = 50
+
+maxval = 100
+
+output  = [[65 70 56]
+          [59 82 92]]
+```
+
+**Attributes**:
+
+* *output_type*
+
+    * **Description**: the type of the output. Determines generation algorithm and affects resulting values. 
+      Output numbers generated for different values of *output_type* may not be equal.
+    * **Range of values**: "i32", "i64", "f16", "bf16", "f32", "f64".
+    * **Type**: string
+    * **Required**: *Yes*
+
+* *seed*
+
+    * **Description**: global seed value.
+    * **Range of values**: positive integers
+    * **Type**: `int`
+    * **Required**: *Yes*
+
+* *seed2*
+
+    * **Description**: operational seed value.
+    * **Range of values**: positive integers
+    * **Type**: `int`
+    * **Required**: *Yes*
+
+**Inputs**:
+
+*   **1**: `shape` - 1D tensor of type *T_SHAPE* describing output shape. **Required.**
+
+*   **2**: `minval` - scalar or 1D tensor with 1 element with type specified by the attribute *output_type*, 
+    defines the lower bound on the range of random values to generate (inclusive). **Required.**
+
+*   **3**: `maxval` - scalar or 1D tensor with 1 element with type specified by the attribute *output_type*, 
+    defines the upper bound on the range of random values to generate (exclusive). **Required.**
+
+
+**Outputs**:
+
+* **1**: A tensor with type specified by the attribute *output_type* and shape defined by `shape` input tensor.
+
+**Types**
+
+* *T_SHAPE*: `int32` or `int64`.
+
+*Example 1: IR example.*
+
+```xml
+<layer ... name="RandomUniform" type="RandomUniform">
+    <data output_type="f32" seed="234" seed2="148"/>
+    <input>
+        <port id="0" precision="I32">  <!-- shape value: [2, 3, 10] -->
+            <dim>3</dim>
+        </port>
+        <port id="1" precision="FP32"/> <!-- min value -->
+        <port id="2" precision="FP32"/> <!-- max value -->
+    </input>
+    <output>
+        <port id="3" precision="FP32" names="RandomUniform:0">
+            <dim>2</dim>
+            <dim>3</dim>
+            <dim>10</dim>
+        </port>
+    </output>
+</layer>
+```
diff --git a/docs/ops/opset8.md b/docs/ops/opset8.md
index 42d815e7c854ef..4c71a0bb2fa7fc 100644
--- a/docs/ops/opset8.md
+++ b/docs/ops/opset8.md
@@ -115,6 +115,7 @@ declared in `namespace opset8`.
 * [PriorBox](detection/PriorBox_1.md)
 * [Proposal](detection/Proposal_4.md)
 * [PSROIPooling](detection/PSROIPooling_1.md)
+* [RandomUniform](generation/RandomUniform_8.md)
 * [Range](generation/Range_4.md)
 * [ReLU](activation/ReLU_1.md)
 * [ReadValue](infrastructure/ReadValue_3.md)

From 6e8b0e0ea6198f44d3b0f1dfa1456d40cf2c3d49 Mon Sep 17 00:00:00 2001
From: Ivan Tikhonov <ivan.tikhonov@intel.com>
Date: Fri, 23 Jul 2021 15:22:05 +0300
Subject: [PATCH 55/71] pdpd Place: remaining methods, refactoring, unit tests
 (#6637)

* pdpd Place: remaining methods, refactoring, unit tests

* resolve merge issues

* use references instead of shared_ptr for Var and Op descs

* Add import pdpd fuzz test; To enable collection of pdpd models, cmake NGRAPH_PDPD_FRONTEND_ENABLE key should be set, the models will be generated to pdpd_test_models folder.

* fix ngraph codestyle

* fix review comments

* Add new methods for Place class

* fix implementation, add tests

* Place: Return nullptr instead of throwing an exception

* ngraph codestyle

* revert return nullptr

* fix build

* fix tests

* fix fuzzing tests

* fix fuzzing tests

* fix readme file

* Revert "fix readme file"

This reverts commit d061e69a0dc296d07439120de611ed6e6867fefe.

* Resolve review comments

* ngraph codestyle

Co-authored-by: Somsikov, Andrey <andrey.somsikov@intel.com>
---
 .../include/frontend_manager/place.hpp        |  91 +++-
 .../frontend_manager/src/frontend_manager.cpp |  90 +++-
 .../include/paddlepaddle_frontend/place.hpp   | 165 +++---
 ngraph/frontend/paddlepaddle/src/decoder.cpp  |  12 +-
 ngraph/frontend/paddlepaddle/src/frontend.cpp |  53 +-
 ngraph/frontend/paddlepaddle/src/model.cpp    |  59 ++-
 ngraph/frontend/paddlepaddle/src/place.cpp    | 365 +++++++++++++-
 .../gen_scripts/generate_place_test_model.py  |  54 ++
 ngraph/test/frontend/frontend_manager.cpp     |  56 ++-
 ngraph/test/frontend/paddlepaddle/places.cpp  | 476 ++++++++++++++++++
 tests/fuzz/fuzz-testhelper/tokenizer.h        |  40 ++
 tests/fuzz/scripts/init_corpus.py             |  56 +++
 tests/fuzz/src/CMakeLists.txt                 |   3 +-
 tests/fuzz/src/import_pdpd-fuzzer.cc          |  45 ++
 14 files changed, 1363 insertions(+), 202 deletions(-)
 create mode 100644 ngraph/test/files/paddlepaddle/gen_scripts/generate_place_test_model.py
 create mode 100644 ngraph/test/frontend/paddlepaddle/places.cpp
 create mode 100644 tests/fuzz/fuzz-testhelper/tokenizer.h
 create mode 100755 tests/fuzz/scripts/init_corpus.py
 create mode 100644 tests/fuzz/src/import_pdpd-fuzzer.cc

diff --git a/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp b/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp
index 045d93dc4c5d98..5ffb80664c99c6 100644
--- a/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp
+++ b/ngraph/frontend/frontend_manager/include/frontend_manager/place.hpp
@@ -94,12 +94,62 @@ namespace ngraph
             /// place
             virtual std::vector<Ptr> get_consuming_operations(int output_port_index) const;
 
+            /// \brief Returns references to all operation nodes that consume data from this place
+            /// for specified output port
+            ///
+            /// \note It can be called for any kind of graph place searching for the first consuming
+            /// operations.
+            ///
+            /// \param outputName If a given place is itself an operation node, this specifies name
+            /// of output port group
+            ///
+            /// \return A vector with all operation node references that consumes data from this
+            /// place
+            virtual std::vector<Ptr>
+                get_consuming_operations(const std::string& outputPortName) const;
+
+            /// \brief Returns references to all operation nodes that consume data from this place
+            /// for specified output port
+            ///
+            /// \note It can be called for any kind of graph place searching for the first consuming
+            /// operations.
+            ///
+            /// \param outputName If a given place is itself an operation node, this specifies name
+            /// of output port group, each group can have multiple ports
+            ///
+            /// \param outputPortIndex If place is an operational node it specifies which output
+            /// port should be considered.
+            ///
+            /// \return A vector with all operation node references that consumes data from this
+            /// place
+            virtual std::vector<Ptr> get_consuming_operations(const std::string& outputName,
+                                                              int outputPortIndex) const;
+
             /// \brief Returns a tensor place that gets data from this place; applicable for
             /// operations, output ports and output edges which have only one output port
             ///
             /// \return A tensor place which hold the resulting value for this place
             virtual Ptr get_target_tensor() const;
 
+            /// \brief Returns a tensor place that gets data from this place; applicable for
+            /// operations, output ports and output edges which have only one output port
+            ///
+            /// \param outputName Name of output port group
+            ///
+            /// \return A tensor place which hold the resulting value for this place
+            virtual Ptr get_target_tensor(const std::string& outputName) const;
+
+            /// \brief Returns a tensor place that gets data from this place; applicable for
+            /// operations, output ports and output edges which have only one output port
+            ///
+            /// \param outputName Name of output port group, each group can have multiple ports
+            ///
+            /// \param outputPortIndex Output port index if the current place is an operation node
+            /// and has multiple output ports
+            ///
+            /// \return A tensor place which hold the resulting value for this place
+            virtual Ptr get_target_tensor(const std::string& outputName, int outputPortIndex) const;
+
             /// \brief Returns a tensor place that gets data from this place; applicable for
             /// operations, output ports and output edges
             ///
@@ -123,6 +173,25 @@ namespace ngraph
             /// \return A tensor place which supplies data for this place
             virtual Ptr get_source_tensor(int input_port_index) const;
 
+            /// \brief Returns a tensor place that supplies data for this place; applicable for
+            /// operations, input ports and input edges
+            ///
+            /// \param inputName Name of input port group
+            ///
+            /// \return A tensor place which supplies data for this place
+            virtual Ptr get_source_tensor(const std::string& inputName) const;
+
+            /// \brief Returns a tensor place that supplies data for this place; applicable for
+            /// operations, input ports and input edges
+            ///
+            /// \param inputName If a given place is itself an operation node, this specifies name
+            /// of output port group, each group can have multiple ports
+            ///
+            /// \param inputPortIndex Input port index for operational nodes.
+            ///
+            /// \return A tensor place which supplies data for this place
+            virtual Ptr get_source_tensor(const std::string& inputName, int inputPortIndex) const;
+
             /// \brief Get an operation node place that immediately produces data for this place;
             /// applicable if place has only one input port
             ///
@@ -137,7 +206,27 @@ namespace ngraph
             /// \return An operation place that produces data for this place
             virtual Ptr get_producing_operation(int input_port_index) const;
 
-            /// Returns a port that produces data for this place
+            /// \brief Get an operation node place that immediately produces data for this place
+            ///
+            /// \param inputName If a given place is itself an operation node, this specifies name
+            /// of output port group
+            ///
+            /// \return An operation place that produces data for this place
+            virtual Ptr get_producing_operation(const std::string& inputName) const;
+
+            /// \brief Get an operation node place that immediately produces data for this place
+            ///
+            /// \param inputName If a given place is itself an operation node, this specifies name
+            /// of output port group, each group can have multiple ports
+            ///
+            /// \param inputPortIndex If a given place is itself an operation node, this specifies a
+            /// port index
+            ///
+            /// \return An operation place that produces data for this place
+            virtual Ptr get_producing_operation(const std::string& inputName,
+                                                int inputPortIndex) const;
+
+            /// \brief Returns a port that produces data for this place
             virtual Ptr get_producing_port() const;
 
             /// \brief For operation node returns reference to an input port; applicable if
diff --git a/ngraph/frontend/frontend_manager/src/frontend_manager.cpp b/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
index 68fcccb0538198..0aea5dc7987a6f 100644
--- a/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
+++ b/ngraph/frontend/frontend_manager/src/frontend_manager.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include <frontend_manager/place.hpp>
 #include <ngraph/env_util.hpp>
 #include <ngraph/except.hpp>
 
@@ -169,35 +170,35 @@ void FrontEnd::normalize(std::shared_ptr<ngraph::Function> function) const
 //----------- InputModel ---------------------------
 std::vector<Place::Ptr> InputModel::get_inputs() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_inputs);
+    return {};
 }
 
 std::vector<Place::Ptr> InputModel::get_outputs() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_outputs);
+    return {};
 }
 
 Place::Ptr InputModel::get_place_by_tensor_name(const std::string& tensor_name) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_place_by_tensor_name);
+    return nullptr;
 }
 
 Place::Ptr InputModel::get_place_by_operation_name(const std::string& operation_name)
 {
-    FRONT_END_NOT_IMPLEMENTED(get_place_by_operation_name);
+    return nullptr;
 }
 
 Place::Ptr InputModel::get_place_by_operation_name_and_input_port(const std::string& operation_name,
                                                                   int input_port_index)
 {
-    FRONT_END_NOT_IMPLEMENTED(get_place_by_operation_name_and_input_port);
+    return nullptr;
 }
 
 Place::Ptr
     InputModel::get_place_by_operation_name_and_output_port(const std::string& operation_name,
                                                             int output_port_index)
 {
-    FRONT_END_NOT_IMPLEMENTED(get_place_by_operation_name_and_output_port);
+    return nullptr;
 }
 
 void InputModel::set_name_for_tensor(Place::Ptr tensor, const std::string& new_name)
@@ -304,82 +305,88 @@ std::vector<std::string> Place::get_names() const
 
 std::vector<Place::Ptr> Place::get_consuming_operations() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_consuming_operations);
+    return {};
 }
 
 std::vector<Place::Ptr> Place::get_consuming_operations(int output_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_consuming_operations);
+    return {};
+}
+
+std::vector<Place::Ptr> Place::get_consuming_operations(const std::string& outputPortName,
+                                                        int outputPortIndex) const
+{
+    return {};
 }
 
 Place::Ptr Place::get_target_tensor() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_target_tensor);
+    return nullptr;
 }
 
 Place::Ptr Place::get_target_tensor(int output_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_target_tensor);
+    return nullptr;
 }
 
 Place::Ptr Place::get_producing_operation() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_producing_operation);
+    return nullptr;
 }
 
 Place::Ptr Place::get_producing_operation(int input_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_producing_operation);
+    return nullptr;
 }
 
 Place::Ptr Place::get_producing_port() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_producing_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_input_port() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_input_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_input_port(int input_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_input_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_input_port(const std::string& input_name) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_input_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_input_port(const std::string& input_name, int input_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_input_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_output_port() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_output_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_output_port(int output_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_output_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_output_port(const std::string& output_name) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_output_port);
+    return nullptr;
 }
 
 Place::Ptr Place::get_output_port(const std::string& output_name, int output_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_output_port);
+    return nullptr;
 }
 
 std::vector<Place::Ptr> Place::get_consuming_ports() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_consuming_ports);
+    return {};
 }
 
 bool Place::is_input() const
@@ -404,12 +411,47 @@ bool Place::is_equal_data(Ptr another) const
 
 Place::Ptr Place::get_source_tensor() const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_source_tensor);
+    return nullptr;
 }
 
 Place::Ptr Place::get_source_tensor(int input_port_index) const
 {
-    FRONT_END_NOT_IMPLEMENTED(get_source_tensor);
+    return nullptr;
+}
+
+Place::Ptr Place::get_source_tensor(const std::string& inputName, int inputPortIndex) const
+{
+    return nullptr;
+}
+
+Place::Ptr Place::get_source_tensor(const std::string& inputName) const
+{
+    return nullptr;
+}
+
+Place::Ptr Place::get_target_tensor(const std::string& outputPortName) const
+{
+    return nullptr;
+}
+
+Place::Ptr Place::get_target_tensor(const std::string& outputPortName, int outputPortIndex) const
+{
+    return nullptr;
+}
+
+Place::Ptr Place::get_producing_operation(const std::string& inputName) const
+{
+    return nullptr;
+}
+
+Place::Ptr Place::get_producing_operation(const std::string& inputName, int inputPortIndex) const
+{
+    return nullptr;
+}
+
+std::vector<Place::Ptr> Place::get_consuming_operations(const std::string& outputPortName) const
+{
+    return {};
 }
 
 constexpr VariantTypeInfo VariantWrapper<std::shared_ptr<std::istream>>::type_info;
diff --git a/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/place.hpp b/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/place.hpp
index a9d041dc202896..fbc8f5573bfebd 100644
--- a/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/place.hpp
+++ b/ngraph/frontend/paddlepaddle/include/paddlepaddle_frontend/place.hpp
@@ -44,9 +44,7 @@ namespace ngraph
             ~PlacePDPD() override = default;
 
             bool is_input() const override;
-
             bool is_output() const override;
-
             bool is_equal(Ptr another) const override { return this == another.get(); }
 
             std::vector<std::string> get_names() const override { return m_names; }
@@ -64,16 +62,20 @@ namespace ngraph
             {
             }
 
-            void setOp(const std::weak_ptr<OpPlacePDPD>& op) { m_op = op; }
+            void set_op(const std::weak_ptr<OpPlacePDPD>& op) { m_op = op; }
+            void set_source_tensor(const std::weak_ptr<TensorPlacePDPD>& source_tensor);
 
-            void setSourceTensor(const std::weak_ptr<TensorPlacePDPD>& source_tensor)
-            {
-                m_source_tensor = source_tensor;
-            }
+            // Internal usage
+            std::shared_ptr<TensorPlacePDPD> get_source_tensor_pdpd() const;
+            std::shared_ptr<OpPlacePDPD> get_op();
 
-            std::shared_ptr<TensorPlacePDPD> getSourceTensorPDPD() const;
+            // External usage
+            std::vector<Ptr> get_consuming_operations() const override;
+            Ptr get_producing_operation() const override;
+            Place::Ptr get_source_tensor() const override;
+            Ptr get_producing_port() const override;
 
-            std::shared_ptr<OpPlacePDPD> getOp();
+            bool is_equal_data(Ptr another) const override;
 
         private:
             std::weak_ptr<TensorPlacePDPD> m_source_tensor;
@@ -88,14 +90,17 @@ namespace ngraph
             {
             }
 
-            void setOp(const std::weak_ptr<OpPlacePDPD>& op) { m_op = op; }
+            void set_op(const std::weak_ptr<OpPlacePDPD>& op) { m_op = op; }
+            void set_target_tensor(const std::weak_ptr<TensorPlacePDPD>& target_tensor);
 
-            void setTargetTensor(const std::weak_ptr<TensorPlacePDPD>& target_tensor)
-            {
-                m_target_tensor = target_tensor;
-            }
+            std::shared_ptr<TensorPlacePDPD> get_target_tensor_pdpd() const;
 
-            std::shared_ptr<TensorPlacePDPD> getTargetTensorPDPD() const;
+            // External usage
+            std::vector<Ptr> get_consuming_operations() const override;
+            Place::Ptr get_producing_operation() const override;
+            std::vector<Place::Ptr> get_consuming_ports() const override;
+            Ptr get_target_tensor() const override;
+            bool is_equal_data(Ptr another) const override;
 
         private:
             std::weak_ptr<OpPlacePDPD> m_op;
@@ -106,52 +111,68 @@ namespace ngraph
         {
         public:
             OpPlacePDPD(const InputModel& input_model,
-                        const std::vector<std::string>& names,
-                        const std::shared_ptr<paddle::framework::proto::OpDesc>& op_desc);
+                        const paddle::framework::proto::OpDesc& op_desc,
+                        const std::vector<std::string>& names);
 
             OpPlacePDPD(const InputModel& input_model,
-                        const std::shared_ptr<paddle::framework::proto::OpDesc>& op_desc);
-
-            void addInPort(const std::shared_ptr<InPortPlacePDPD>& input, const std::string& name)
-            {
-                m_input_ports[name].push_back(input);
-            }
+                        const paddle::framework::proto::OpDesc& op_desc);
 
-            void addOutPort(const std::shared_ptr<OutPortPlacePDPD>& output,
-                            const std::string& name)
-            {
-                m_output_ports[name].push_back(output);
-            }
+            void add_in_port(const std::shared_ptr<InPortPlacePDPD>& input,
+                             const std::string& name);
+            void add_out_port(const std::shared_ptr<OutPortPlacePDPD>& output,
+                              const std::string& name);
 
+            // Internal usage
             const std::map<std::string, std::vector<std::shared_ptr<OutPortPlacePDPD>>>&
-                getOutputPorts() const
-            {
-                return m_output_ports;
-            }
-
+                get_output_ports() const;
             const std::map<std::string, std::vector<std::shared_ptr<InPortPlacePDPD>>>&
-                getInputPorts() const
-            {
-                return m_input_ports;
-            }
-
-            std::shared_ptr<OutPortPlacePDPD> getOutputPortPDPD(const std::string& name, int idx)
-            {
-                return m_output_ports[name][idx];
-            }
-
-            std::shared_ptr<InPortPlacePDPD> getInputPortPDPD(const std::string& name, int idx)
-            {
-                return m_input_ports[name][idx];
-            }
+                get_input_ports() const;
+            std::shared_ptr<OutPortPlacePDPD> get_output_port_pdpd(const std::string& outputName,
+                                                                   int outputPortIndex) const;
+            std::shared_ptr<InPortPlacePDPD> get_input_port_pdpd(const std::string& inputName,
+                                                                 int inputPortIndex) const;
+            const paddle::framework::proto::OpDesc& get_desc() const;
+
+            // External API methods
+            std::vector<Place::Ptr> get_consuming_ports() const override;
 
-            const std::shared_ptr<paddle::framework::proto::OpDesc>& getDesc() const
-            {
-                return m_op_desc;
-            }
+            Ptr get_output_port() const override;
+            Ptr get_output_port(int outputPortIndex) const override;
+            Ptr get_output_port(const std::string& outputPortName) const override;
+            Ptr get_output_port(const std::string& outputPortName,
+                                int outputPortIndex) const override;
+
+            Ptr get_input_port() const override;
+            Ptr get_input_port(int inputPortIndex) const override;
+            Ptr get_input_port(const std::string& inputName) const override;
+            Ptr get_input_port(const std::string& inputName, int inputPortIndex) const override;
+
+            std::vector<Ptr> get_consuming_operations() const override;
+            std::vector<Ptr> get_consuming_operations(int outputPortIndex) const override;
+            std::vector<Ptr>
+                get_consuming_operations(const std::string& outputPortName) const override;
+            std::vector<Ptr> get_consuming_operations(const std::string& outputPortName,
+                                                      int outputPortIndex) const override;
+
+            Ptr get_producing_operation() const override;
+            Ptr get_producing_operation(int inputPortIndex) const override;
+            Ptr get_producing_operation(const std::string& inputName) const override;
+            Ptr get_producing_operation(const std::string& inputName,
+                                        int inputPortIndex) const override;
+
+            Ptr get_source_tensor() const override;
+            Ptr get_source_tensor(int inputPortIndex) const override;
+            Ptr get_source_tensor(const std::string& inputName) const override;
+            Ptr get_source_tensor(const std::string& inputName, int inputPortIndex) const override;
+
+            Ptr get_target_tensor() const override;
+            Ptr get_target_tensor(int outputPortIndex) const override;
+            Ptr get_target_tensor(const std::string& outputName) const override;
+            Ptr get_target_tensor(const std::string& outputName,
+                                  int outputPortIndex) const override;
 
         private:
-            std::shared_ptr<paddle::framework::proto::OpDesc> m_op_desc;
+            const paddle::framework::proto::OpDesc& m_op_desc;
             std::map<std::string, std::vector<std::shared_ptr<InPortPlacePDPD>>> m_input_ports;
             std::map<std::string, std::vector<std::shared_ptr<OutPortPlacePDPD>>> m_output_ports;
         };
@@ -161,40 +182,30 @@ namespace ngraph
         public:
             TensorPlacePDPD(const InputModel& input_model,
                             const std::vector<std::string>& names,
-                            const std::shared_ptr<paddle::framework::proto::VarDesc>& var_desc);
+                            const paddle::framework::proto::VarDesc& var_desc);
 
             TensorPlacePDPD(const InputModel& input_model,
-                            const std::shared_ptr<paddle::framework::proto::VarDesc>& var_desc);
+                            const paddle::framework::proto::VarDesc& var_desc);
 
-            void addProducingPort(const std::shared_ptr<OutPortPlacePDPD>& out_port)
-            {
-                m_producing_ports.push_back(out_port);
-            }
+            void add_producing_port(const std::shared_ptr<OutPortPlacePDPD>& out_port);
+            void add_consuming_port(const std::shared_ptr<InPortPlacePDPD>& in_port);
 
-            void addConsumingPort(const std::shared_ptr<InPortPlacePDPD>& in_port)
-            {
-                m_consuming_ports.push_back(in_port);
-            }
+            // Internal usage
+            const PartialShape& get_partial_shape() const { return m_pshape; }
+            const element::Type& get_element_type() const { return m_type; }
+            void set_partial_shape(const PartialShape& pshape) { m_pshape = pshape; }
+            void set_element_type(const element::Type& type) { m_type = type; }
+            const paddle::framework::proto::VarDesc& get_desc() const;
 
+            // External usage
+            Ptr get_producing_operation() const override;
+            std::vector<Place::Ptr> get_consuming_operations() const override;
             std::vector<Place::Ptr> get_consuming_ports() const override;
-
             Ptr get_producing_port() const override;
-
-            const PartialShape& getPartialShape() const { return m_pshape; }
-
-            const element::Type& getElementType() const { return m_type; }
-
-            void setPartialShape(const PartialShape& pshape) { m_pshape = pshape; }
-
-            void setElementType(const element::Type& type) { m_type = type; }
-
-            const std::shared_ptr<paddle::framework::proto::VarDesc>& getDesc() const
-            {
-                return m_var_desc;
-            }
+            bool is_equal_data(Ptr another) const override;
 
         private:
-            std::shared_ptr<paddle::framework::proto::VarDesc> m_var_desc;
+            const paddle::framework::proto::VarDesc& m_var_desc;
             PartialShape m_pshape;
             element::Type m_type;
 
diff --git a/ngraph/frontend/paddlepaddle/src/decoder.cpp b/ngraph/frontend/paddlepaddle/src/decoder.cpp
index 82e35de7902491..1758893b254c2a 100644
--- a/ngraph/frontend/paddlepaddle/src/decoder.cpp
+++ b/ngraph/frontend/paddlepaddle/src/decoder.cpp
@@ -92,7 +92,7 @@ namespace ngraph
         std::vector<pdpd::OutPortName> DecoderPDPDProto::get_output_names() const
         {
             std::vector<std::string> output_names;
-            for (const auto& output : op_place->getDesc()->outputs())
+            for (const auto& output : op_place->get_desc().outputs())
             {
                 output_names.push_back(output.parameter());
             }
@@ -103,9 +103,9 @@ namespace ngraph
             DecoderPDPDProto::get_out_port_type(const std::string& port_name) const
         {
             std::vector<ngraph::element::Type> output_types;
-            for (const auto& out_port : op_place->getOutputPorts().at(port_name))
+            for (const auto& out_port : op_place->get_output_ports().at(port_name))
             {
-                output_types.push_back(out_port->getTargetTensorPDPD()->getElementType());
+                output_types.push_back(out_port->get_target_tensor_pdpd()->get_element_type());
             }
             FRONT_END_GENERAL_CHECK(output_types.size() > 0, "Port has no tensors connected.");
             FRONT_END_GENERAL_CHECK(
@@ -114,13 +114,13 @@ namespace ngraph
             return output_types[0];
         }
 
-        std::string DecoderPDPDProto::get_op_type() const { return op_place->getDesc()->type(); }
+        std::string DecoderPDPDProto::get_op_type() const { return op_place->get_desc().type(); }
 
         std::vector<proto::OpDesc_Attr>
             DecoderPDPDProto::decode_attribute_helper(const std::string& name) const
         {
             std::vector<proto::OpDesc_Attr> attrs;
-            for (const auto& attr : op_place->getDesc()->attrs())
+            for (const auto& attr : op_place->get_desc().attrs())
             {
                 if (attr.name() == name)
                     attrs.push_back(attr);
@@ -129,7 +129,7 @@ namespace ngraph
                                     "An error occurred while parsing the ",
                                     name,
                                     " attribute of ",
-                                    op_place->getDesc()->type(),
+                                    op_place->get_desc().type(),
                                     "node. Unsupported number of attributes. Current number: ",
                                     attrs.size(),
                                     " Expected number: 0 or 1");
diff --git a/ngraph/frontend/paddlepaddle/src/frontend.cpp b/ngraph/frontend/paddlepaddle/src/frontend.cpp
index 0995725b10fb24..84c5e9301d6e3a 100644
--- a/ngraph/frontend/paddlepaddle/src/frontend.cpp
+++ b/ngraph/frontend/paddlepaddle/src/frontend.cpp
@@ -39,22 +39,21 @@ namespace ngraph
                                       const std::shared_ptr<OpPlacePDPD>& op_place,
                                       const std::map<std::string, CreatorFunction>& CREATORS_MAP)
             {
-                const auto& op = op_place->getDesc();
-                // std::cout << "Making node: " << op->type() << std::endl;
+                const auto& op = op_place->get_desc();
 
-                FRONT_END_OP_CONVERSION_CHECK(CREATORS_MAP.find(op->type()) != CREATORS_MAP.end(),
+                FRONT_END_OP_CONVERSION_CHECK(CREATORS_MAP.find(op.type()) != CREATORS_MAP.end(),
                                               "No creator found for ",
-                                              op->type(),
+                                              op.type(),
                                               " node.");
                 pdpd::NamedInputs named_inputs;
-                const auto& input_ports = op_place->getInputPorts();
+                const auto& input_ports = op_place->get_input_ports();
                 for (const auto& name_to_ports : input_ports)
                 {
                     for (const auto& port : name_to_ports.second)
                     {
-                        const auto& var_desc = port->getSourceTensorPDPD()->getDesc();
-                        if (nodes.count(var_desc->name()))
-                            named_inputs[name_to_ports.first].push_back(nodes.at(var_desc->name()));
+                        const auto& var_desc = port->get_source_tensor_pdpd()->get_desc();
+                        if (nodes.count(var_desc.name()))
+                            named_inputs[name_to_ports.first].push_back(nodes.at(var_desc.name()));
                         else
                             // return empty map when not all inputs exist. It usually means that
                             // these nodes are not used because model inputs were overwritten
@@ -64,7 +63,7 @@ namespace ngraph
 
                 try
                 {
-                    return CREATORS_MAP.at(op->type())(
+                    return CREATORS_MAP.at(op.type())(
                         NodeContext(DecoderPDPDProto(op_place), named_inputs));
                 }
                 catch (...)
@@ -118,20 +117,20 @@ namespace ngraph
             for (const auto& _inp_place : model->get_inputs())
             {
                 const auto& inp_place = std::dynamic_pointer_cast<TensorPlacePDPD>(_inp_place);
-                const auto& var = inp_place->getDesc();
-                const auto& shape = inp_place->getPartialShape();
-                const auto& type = inp_place->getElementType();
+                const auto& var = inp_place->get_desc();
+                const auto& shape = inp_place->get_partial_shape();
+                const auto& type = inp_place->get_element_type();
                 auto param = std::make_shared<Parameter>(type, shape);
-                param->set_friendly_name(var->name());
-                param->output(0).get_tensor().add_names({var->name()});
-                nodes_dict[var->name()] = param;
+                param->set_friendly_name(var.name());
+                param->output(0).get_tensor().add_names({var.name()});
+                nodes_dict[var.name()] = param;
                 parameter_nodes.push_back(param);
             }
 
             const auto& op_places = model->getOpPlaces();
             for (const auto& op_place : op_places)
             {
-                const auto& op_type = op_place->getDesc()->type();
+                const auto& op_type = op_place->get_desc().type();
                 if (op_type == "feed" || op_type == "fetch")
                 {
                     // inputs and outputs are stored in the model already
@@ -145,16 +144,16 @@ namespace ngraph
                     // set layer name by the name of first output var
                     if (!named_outputs.empty())
                     {
-                        const auto& first_output_var = op_place->getOutputPorts()
+                        const auto& first_output_var = op_place->get_output_ports()
                                                            .begin()
                                                            ->second.at(0)
-                                                           ->getTargetTensorPDPD()
-                                                           ->getDesc();
+                                                           ->get_target_tensor_pdpd()
+                                                           ->get_desc();
                         auto node = named_outputs.begin()->second[0].get_node_shared_ptr();
-                        node->set_friendly_name(first_output_var->name());
+                        node->set_friendly_name(first_output_var.name());
                     }
 
-                    const auto& out_ports = op_place->getOutputPorts();
+                    const auto& out_ports = op_place->get_output_ports();
                     for (const auto& name_to_outputs : named_outputs)
                     {
                         const auto& ports = out_ports.at(name_to_outputs.first);
@@ -164,12 +163,12 @@ namespace ngraph
                             "the number of outputs of the ngraph node.");
                         for (size_t idx = 0; idx < ports.size(); ++idx)
                         {
-                            const auto& var = ports[idx]->getTargetTensorPDPD()->getDesc();
-                            name_to_outputs.second[idx].get_tensor().set_names({var->name()});
+                            const auto& var = ports[idx]->get_target_tensor_pdpd()->get_desc();
+                            name_to_outputs.second[idx].get_tensor().set_names({var.name()});
                             // if nodes_dict already has node mapped to this tensor name it usually
                             // means that it was overwritten using setTensorValue
-                            if (!nodes_dict.count(var->name()))
-                                nodes_dict[var->name()] = name_to_outputs.second[idx];
+                            if (!nodes_dict.count(var.name()))
+                                nodes_dict[var.name()] = name_to_outputs.second[idx];
                         }
                     }
                 }
@@ -178,8 +177,8 @@ namespace ngraph
             for (const auto& _outp_place : model->get_outputs())
             {
                 const auto& outp_place = std::dynamic_pointer_cast<TensorPlacePDPD>(_outp_place);
-                auto var = outp_place->getDesc();
-                auto input_var_name = var->name();
+                auto var = outp_place->get_desc();
+                auto input_var_name = var.name();
                 auto result = std::make_shared<Result>(nodes_dict.at(input_var_name));
                 result->set_friendly_name(input_var_name + "/Result");
                 result_nodes.push_back(result);
diff --git a/ngraph/frontend/paddlepaddle/src/model.cpp b/ngraph/frontend/paddlepaddle/src/model.cpp
index c3076a78378e1e..0c212e29acff30 100644
--- a/ngraph/frontend/paddlepaddle/src/model.cpp
+++ b/ngraph/frontend/paddlepaddle/src/model.cpp
@@ -80,14 +80,13 @@ namespace ngraph
 
                 for (const auto& var : block.vars())
                 {
-                    m_var_places[var.name()] = std::make_shared<TensorPlacePDPD>(
-                        m_input_model, std::make_shared<VarDesc>(var));
+                    m_var_places[var.name()] =
+                        std::make_shared<TensorPlacePDPD>(m_input_model, var);
                 }
 
                 for (const auto& op : block.ops())
                 {
-                    auto op_place =
-                        std::make_shared<OpPlacePDPD>(m_input_model, std::make_shared<OpDesc>(op));
+                    auto op_place = std::make_shared<OpPlacePDPD>(m_input_model, op);
                     m_op_places.push_back(op_place);
 
                     for (const auto& output : op.outputs())
@@ -98,12 +97,12 @@ namespace ngraph
 
                             // connect out_port and tensor
                             const auto& tensor = m_var_places.at(var_name);
-                            tensor->addProducingPort(out_port);
-                            out_port->setTargetTensor(tensor);
+                            tensor->add_producing_port(out_port);
+                            out_port->set_target_tensor(tensor);
 
                             // connect out_port and op
-                            op_place->addOutPort(out_port, output.parameter());
-                            out_port->setOp(op_place);
+                            op_place->add_out_port(out_port, output.parameter());
+                            out_port->set_op(op_place);
                         }
                     }
 
@@ -115,34 +114,34 @@ namespace ngraph
 
                             // connect in_port and tensor
                             const auto& tensor = m_var_places.at(var_name);
-                            tensor->addConsumingPort(in_port);
-                            in_port->setSourceTensor(tensor);
+                            tensor->add_consuming_port(in_port);
+                            in_port->set_source_tensor(tensor);
 
                             // connect in_port and op
-                            op_place->addInPort(in_port, input.parameter());
-                            in_port->setOp(op_place);
+                            op_place->add_in_port(in_port, input.parameter());
+                            in_port->set_op(op_place);
                         }
                     }
 
                     // Determine outputs and inputs
                     if (op.type() == "feed")
                     {
-                        const auto& place = op_place->getOutputPortPDPD("Out", 0);
+                        const auto& place = op_place->get_output_port_pdpd("Out", 0);
                         const auto& var_place = std::dynamic_pointer_cast<TensorPlacePDPD>(
-                            place->getTargetTensorPDPD());
+                            place->get_target_tensor_pdpd());
                         const auto& tensor_desc =
-                            var_place->getDesc()->type().lod_tensor().tensor();
+                            var_place->get_desc().type().lod_tensor().tensor();
                         const auto& dims = tensor_desc.dims();
 
-                        var_place->setElementType(TYPE_MAP[tensor_desc.data_type()]);
-                        var_place->setPartialShape(
+                        var_place->set_element_type(TYPE_MAP[tensor_desc.data_type()]);
+                        var_place->set_partial_shape(
                             PartialShape(std::vector<Dimension>(dims.begin(), dims.end())));
                         m_inputs.push_back(var_place);
                     }
                     else if (op.type() == "fetch")
                     {
-                        auto place = op_place->getInputPortPDPD("X", 0);
-                        m_outputs.push_back(place->getSourceTensorPDPD());
+                        auto place = op_place->get_input_port_pdpd("X", 0);
+                        m_outputs.push_back(place->get_source_tensor_pdpd());
                     }
                 }
             }
@@ -235,17 +234,17 @@ namespace ngraph
         {
             for (const auto& item : m_var_places)
             {
-                const auto& var_desc = item.second->getDesc();
+                const auto& var_desc = item.second->get_desc();
                 const auto& name = item.first;
                 if (pdpd::endsWith(name, std::string{"feed"}) ||
                     pdpd::endsWith(name, std::string{"fetch"}))
                     continue;
-                if (!var_desc->persistable())
+                if (!var_desc.persistable())
                     continue;
 
-                FRONT_END_GENERAL_CHECK(var_desc->type().type() ==
+                FRONT_END_GENERAL_CHECK(var_desc.type().type() ==
                                         paddle::framework::proto::VarType::LOD_TENSOR);
-                const auto& tensor = var_desc->type().lod_tensor().tensor();
+                const auto& tensor = var_desc.type().lod_tensor().tensor();
                 Shape shape(tensor.dims().cbegin(), tensor.dims().cend());
                 const auto& type = TYPE_MAP[tensor.data_type()];
                 const auto& data_length = shape_size(shape) * type.size();
@@ -355,11 +354,11 @@ namespace ngraph
                 }
                 else if (auto in_port_place = std::dynamic_pointer_cast<InPortPlacePDPD>(place))
                 {
-                    return in_port_place->getSourceTensorPDPD();
+                    return in_port_place->get_source_tensor_pdpd();
                 }
                 else if (auto out_port_place = std::dynamic_pointer_cast<OutPortPlacePDPD>(place))
                 {
-                    return out_port_place->getTargetTensorPDPD();
+                    return out_port_place->get_target_tensor_pdpd();
                 }
                 FRONT_END_GENERAL_CHECK(false, "Cannot cast this Place to TensorPlacePDPD.");
             }
@@ -403,26 +402,26 @@ namespace ngraph
             InputModelPDPD::InputModelPDPDImpl::setPartialShape(Place::Ptr place,
                                                                 const ngraph::PartialShape& p_shape)
         {
-            pdpd::castToTensorPlace(place)->setPartialShape(p_shape);
+            pdpd::castToTensorPlace(place)->set_partial_shape(p_shape);
         }
 
         ngraph::PartialShape
             InputModelPDPD::InputModelPDPDImpl::getPartialShape(Place::Ptr place) const
         {
-            return pdpd::castToTensorPlace(place)->getPartialShape();
+            return pdpd::castToTensorPlace(place)->get_partial_shape();
         }
 
         void InputModelPDPD::InputModelPDPDImpl::setElementType(Place::Ptr place,
                                                                 const ngraph::element::Type& type)
         {
-            pdpd::castToTensorPlace(place)->setElementType(type);
+            pdpd::castToTensorPlace(place)->set_element_type(type);
         }
 
         void InputModelPDPD::InputModelPDPDImpl::setTensorValue(Place::Ptr place, const void* value)
         {
             auto tensor_place = pdpd::castToTensorPlace(place);
-            auto p_shape = tensor_place->getPartialShape();
-            auto type = tensor_place->getElementType();
+            auto p_shape = tensor_place->get_partial_shape();
+            auto type = tensor_place->get_element_type();
             auto constant = opset7::Constant::create(type, p_shape.to_shape(), value);
             auto name = tensor_place->get_names()[0];
             constant->set_friendly_name(name);
diff --git a/ngraph/frontend/paddlepaddle/src/place.cpp b/ngraph/frontend/paddlepaddle/src/place.cpp
index 15c74b7fcc8e8f..25f4063bced95b 100644
--- a/ngraph/frontend/paddlepaddle/src/place.cpp
+++ b/ngraph/frontend/paddlepaddle/src/place.cpp
@@ -25,26 +25,234 @@ bool PlacePDPD::is_output() const
 }
 
 OpPlacePDPD::OpPlacePDPD(const InputModel& input_model,
-                         const std::vector<std::string>& names,
-                         const std::shared_ptr<paddle::framework::proto::OpDesc>& op_desc)
+                         const paddle::framework::proto::OpDesc& op_desc,
+                         const std::vector<std::string>& names)
     : PlacePDPD(input_model, names)
     , m_op_desc(op_desc)
 {
 }
 
 OpPlacePDPD::OpPlacePDPD(const InputModel& input_model,
-                         const std::shared_ptr<paddle::framework::proto::OpDesc>& op_desc)
-    : OpPlacePDPD(input_model, {}, op_desc)
+                         const paddle::framework::proto::OpDesc& op_desc)
+    : OpPlacePDPD(input_model, op_desc, {})
 {
 }
 
+const std::map<std::string, std::vector<std::shared_ptr<OutPortPlacePDPD>>>&
+    OpPlacePDPD::get_output_ports() const
+{
+    return m_output_ports;
+}
+
+const std::map<std::string, std::vector<std::shared_ptr<InPortPlacePDPD>>>&
+    OpPlacePDPD::get_input_ports() const
+{
+    return m_input_ports;
+}
+
+std::shared_ptr<OutPortPlacePDPD> OpPlacePDPD::get_output_port_pdpd(const std::string& outputName,
+                                                                    int outputPortIndex) const
+{
+    FRONT_END_GENERAL_CHECK(outputPortIndex <= m_output_ports.at(outputName).size(),
+                            "outputPortIndex is out of bounds.");
+    return m_output_ports.at(outputName)[outputPortIndex];
+}
+
+std::shared_ptr<InPortPlacePDPD> OpPlacePDPD::get_input_port_pdpd(const std::string& inputName,
+                                                                  int inputPortIndex) const
+{
+    FRONT_END_GENERAL_CHECK(inputPortIndex <= m_input_ports.at(inputName).size(),
+                            "inputPortIndex is out of bounds.");
+    return m_input_ports.at(inputName)[inputPortIndex];
+}
+
+const paddle::framework::proto::OpDesc& OpPlacePDPD::get_desc() const
+{
+    return m_op_desc;
+}
+
+void OpPlacePDPD::add_out_port(const std::shared_ptr<OutPortPlacePDPD>& output,
+                               const std::string& name)
+{
+    m_output_ports[name].push_back(output);
+}
+
+void OpPlacePDPD::add_in_port(const std::shared_ptr<InPortPlacePDPD>& input,
+                              const std::string& name)
+{
+    m_input_ports[name].push_back(input);
+}
+
+Place::Ptr OpPlacePDPD::get_output_port(const std::string& name) const
+{
+    FRONT_END_GENERAL_CHECK(m_output_ports.at(name).size() == 1,
+                            "Only one output port should exist.");
+    return m_output_ports.at(name)[0];
+}
+
+Place::Ptr OpPlacePDPD::get_input_port(const std::string& name) const
+{
+    FRONT_END_GENERAL_CHECK(m_input_ports.at(name).size() == 1,
+                            "Only one input port should exist.");
+    return m_input_ports.at(name)[0];
+}
+
+Place::Ptr OpPlacePDPD::get_input_port(int outputPortIndex) const
+{
+    FRONT_END_GENERAL_CHECK(m_input_ports.size() == 1, "Only one named input port should exist.");
+    return m_input_ports.begin()->second[outputPortIndex];
+}
+
+Place::Ptr OpPlacePDPD::get_output_port(int outputPortIndex) const
+{
+    FRONT_END_GENERAL_CHECK(m_output_ports.size() == 1, "Only one named output port should exist.");
+    return m_output_ports.begin()->second[outputPortIndex];
+}
+
+Place::Ptr OpPlacePDPD::get_output_port() const
+{
+    FRONT_END_GENERAL_CHECK(m_output_ports.size() == 1 &&
+                                m_output_ports.begin()->second.size() == 1,
+                            "Only one output port should exist.");
+    return m_output_ports.begin()->second[0];
+}
+
+Place::Ptr OpPlacePDPD::get_input_port() const
+{
+    FRONT_END_GENERAL_CHECK(m_input_ports.size() == 1 && m_input_ports.begin()->second.size() == 1,
+                            "Only one input port should exist.");
+    return m_input_ports.begin()->second[0];
+}
+
+std::vector<Place::Ptr> OpPlacePDPD::get_consuming_operations() const
+{
+    std::vector<Place::Ptr> consuming_ops;
+    for (const auto& out_port : m_output_ports)
+    {
+        for (const auto& out_port_place : out_port.second)
+        {
+            auto consuming_ops_out = out_port_place->get_consuming_operations();
+            consuming_ops.insert(
+                consuming_ops.end(), consuming_ops_out.begin(), consuming_ops_out.end());
+        }
+    }
+    return consuming_ops;
+}
+
+std::vector<Place::Ptr> OpPlacePDPD::get_consuming_operations(const std::string& outputPortName,
+                                                              int outputPortIndex) const
+{
+    return get_output_port(outputPortName, outputPortIndex)->get_consuming_operations();
+}
+
+std::vector<Place::Ptr> OpPlacePDPD::get_consuming_operations(int outputPortIndex) const
+{
+    return get_output_port(outputPortIndex)->get_consuming_operations();
+}
+
+std::vector<Place::Ptr>
+    OpPlacePDPD::get_consuming_operations(const std::string& outputPortName) const
+{
+    return get_output_port(outputPortName)->get_consuming_operations();
+}
+
+std::vector<Place::Ptr> OpPlacePDPD::get_consuming_ports() const
+{
+    std::vector<Place::Ptr> consuming_ports;
+    for (const auto& out_port : m_output_ports)
+    {
+        for (const auto& out_port_place : out_port.second)
+        {
+            auto consuming_ops_out = out_port_place->get_consuming_ports();
+            consuming_ports.insert(
+                consuming_ports.end(), consuming_ops_out.begin(), consuming_ops_out.end());
+        }
+    }
+    return consuming_ports;
+}
+
+Place::Ptr OpPlacePDPD::get_output_port(const std::string& outputName, int outputPortIndex) const
+{
+    FRONT_END_GENERAL_CHECK(outputPortIndex <= m_output_ports.at(outputName).size(),
+                            "outputPortIndex is Out of bounds.");
+    return m_output_ports.at(outputName)[outputPortIndex];
+}
+
+Place::Ptr OpPlacePDPD::get_input_port(const std::string& inputName, int inputPortIndex) const
+{
+    FRONT_END_GENERAL_CHECK(inputPortIndex <= m_input_ports.at(inputName).size(),
+                            "inputPortIndex is out of bounds.");
+    return m_input_ports.at(inputName)[inputPortIndex];
+}
+
+Place::Ptr OpPlacePDPD::get_source_tensor() const
+{
+    return get_input_port()->get_source_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_source_tensor(const std::string& inputName) const
+{
+    return get_input_port(inputName)->get_source_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_source_tensor(int inputPortIndex) const
+{
+    return get_input_port(inputPortIndex)->get_source_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_source_tensor(const std::string& inputName, int inputPortIndex) const
+{
+    return get_input_port(inputName, inputPortIndex)->get_source_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_target_tensor() const
+{
+    return get_output_port()->get_target_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_target_tensor(const std::string& outputName) const
+{
+    return get_output_port(outputName)->get_target_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_target_tensor(const std::string& outputName, int outputPortIndex) const
+{
+    return get_output_port(outputName, outputPortIndex)->get_target_tensor();
+}
+
+Place::Ptr OpPlacePDPD::get_producing_operation(const std::string& inputName) const
+{
+    return get_input_port(inputName)->get_producing_operation();
+}
+
+Place::Ptr OpPlacePDPD::get_producing_operation(const std::string& inputName,
+                                                int inputPortIndex) const
+{
+    return get_input_port(inputName, inputPortIndex)->get_producing_operation();
+}
+
+Place::Ptr OpPlacePDPD::get_producing_operation() const
+{
+    return get_input_port()->get_producing_operation();
+}
+
+Place::Ptr OpPlacePDPD::get_producing_operation(int inputPortIndex) const
+{
+    return get_input_port(inputPortIndex)->get_producing_operation();
+}
+
+Place::Ptr OpPlacePDPD::get_target_tensor(int outputPortIndex) const
+{
+    return get_output_port(outputPortIndex)->get_target_tensor();
+}
+
 TensorPlacePDPD::TensorPlacePDPD(const InputModel& input_model,
                                  const std::vector<std::string>& names,
-                                 const std::shared_ptr<paddle::framework::proto::VarDesc>& var_desc)
+                                 const paddle::framework::proto::VarDesc& var_desc)
     : PlacePDPD(input_model, names)
     , m_var_desc(var_desc)
 {
-    const auto& var_type = var_desc->type();
+    const auto& var_type = var_desc.type();
     if (var_type.type() == paddle::framework::proto::VarType::LOD_TENSOR)
     {
         const auto& tensor_desc = var_type.lod_tensor().tensor();
@@ -55,8 +263,8 @@ TensorPlacePDPD::TensorPlacePDPD(const InputModel& input_model,
 }
 
 TensorPlacePDPD::TensorPlacePDPD(const InputModel& input_model,
-                                 const std::shared_ptr<paddle::framework::proto::VarDesc>& var_desc)
-    : TensorPlacePDPD(input_model, {var_desc->name()}, var_desc)
+                                 const paddle::framework::proto::VarDesc& var_desc)
+    : TensorPlacePDPD(input_model, {var_desc.name()}, var_desc)
 {
 }
 
@@ -79,7 +287,7 @@ std::vector<Place::Ptr> TensorPlacePDPD::get_consuming_ports() const
 
 Place::Ptr TensorPlacePDPD::get_producing_port() const
 {
-    FRONT_END_GENERAL_CHECK(m_producing_ports.size() > 1, "Only one producing port is supported.");
+    FRONT_END_GENERAL_CHECK(m_producing_ports.size() == 1, "Only one producing port is supported.");
     if (const auto& producing_port = m_producing_ports[0].lock())
     {
         return producing_port;
@@ -87,7 +295,56 @@ Place::Ptr TensorPlacePDPD::get_producing_port() const
     FRONT_END_THROW("Producing Port has expired.");
 }
 
-std::shared_ptr<TensorPlacePDPD> InPortPlacePDPD::getSourceTensorPDPD() const
+void TensorPlacePDPD::add_producing_port(const std::shared_ptr<OutPortPlacePDPD>& out_port)
+{
+    m_producing_ports.push_back(out_port);
+}
+
+void TensorPlacePDPD::add_consuming_port(const std::shared_ptr<InPortPlacePDPD>& in_port)
+{
+    m_consuming_ports.push_back(in_port);
+}
+
+const paddle::framework::proto::VarDesc& TensorPlacePDPD::get_desc() const
+{
+    return m_var_desc;
+}
+
+std::vector<Place::Ptr> TensorPlacePDPD::get_consuming_operations() const
+{
+    std::vector<Place::Ptr> consuming_ops;
+    for (const auto& consuming_port : m_consuming_ports)
+    {
+        if (auto port_ptr = consuming_port.lock())
+        {
+            auto port_consuming_ops = port_ptr->get_consuming_operations();
+            consuming_ops.insert(
+                consuming_ops.end(), port_consuming_ops.begin(), port_consuming_ops.end());
+        }
+        else
+        {
+            FRONT_END_THROW("Port has expired.");
+        }
+    }
+    return consuming_ops;
+}
+
+bool TensorPlacePDPD::is_equal_data(Place::Ptr another) const
+{
+    auto consuming_ports = get_consuming_ports();
+    bool eq_to_consuming_port =
+        std::any_of(consuming_ports.begin(), consuming_ports.end(), [&another](const Ptr& place) {
+            return place->is_equal(another);
+        });
+    return is_equal(another) || get_producing_port()->is_equal(another) || eq_to_consuming_port;
+}
+
+Place::Ptr TensorPlacePDPD::get_producing_operation() const
+{
+    return get_producing_port()->get_producing_operation();
+}
+
+std::shared_ptr<TensorPlacePDPD> InPortPlacePDPD::get_source_tensor_pdpd() const
 {
     if (const auto& tensor = m_source_tensor.lock())
     {
@@ -96,7 +353,7 @@ std::shared_ptr<TensorPlacePDPD> InPortPlacePDPD::getSourceTensorPDPD() const
     FRONT_END_THROW("Source Tensor has expired.");
 }
 
-std::shared_ptr<OpPlacePDPD> InPortPlacePDPD::getOp()
+std::shared_ptr<OpPlacePDPD> InPortPlacePDPD::get_op()
 {
     if (const auto& op = m_op.lock())
     {
@@ -105,7 +362,45 @@ std::shared_ptr<OpPlacePDPD> InPortPlacePDPD::getOp()
     FRONT_END_THROW("Operation has expired.");
 }
 
-std::shared_ptr<TensorPlacePDPD> OutPortPlacePDPD::getTargetTensorPDPD() const
+void InPortPlacePDPD::set_source_tensor(const std::weak_ptr<TensorPlacePDPD>& source_tensor)
+{
+    m_source_tensor = source_tensor;
+}
+
+std::vector<Place::Ptr> InPortPlacePDPD::get_consuming_operations() const
+{
+    if (const auto& consuming_op = m_op.lock())
+    {
+        return {consuming_op};
+    }
+    FRONT_END_THROW("Operation has expired.");
+}
+
+Place::Ptr InPortPlacePDPD::get_source_tensor() const
+{
+    if (const auto& tensor = m_source_tensor.lock())
+    {
+        return tensor;
+    }
+    FRONT_END_THROW("Source Tensor has expired.");
+}
+
+Place::Ptr InPortPlacePDPD::get_producing_port() const
+{
+    return get_source_tensor()->get_producing_port();
+}
+
+bool InPortPlacePDPD::is_equal_data(Place::Ptr another) const
+{
+    return get_source_tensor()->is_equal_data(another);
+}
+
+Place::Ptr InPortPlacePDPD::get_producing_operation() const
+{
+    return get_producing_port()->get_producing_operation();
+}
+
+std::shared_ptr<TensorPlacePDPD> OutPortPlacePDPD::get_target_tensor_pdpd() const
 {
     if (const auto& target_tensor = m_target_tensor.lock())
     {
@@ -113,3 +408,49 @@ std::shared_ptr<TensorPlacePDPD> OutPortPlacePDPD::getTargetTensorPDPD() const
     }
     FRONT_END_THROW("Target Tensor has expired.");
 }
+
+std::vector<Place::Ptr> OutPortPlacePDPD::get_consuming_operations() const
+{
+    if (auto tensor_ptr = m_target_tensor.lock())
+    {
+        return tensor_ptr->get_consuming_operations();
+    }
+    FRONT_END_THROW("Tensor has expired.");
+}
+
+void OutPortPlacePDPD::set_target_tensor(const std::weak_ptr<TensorPlacePDPD>& target_tensor)
+{
+    m_target_tensor = target_tensor;
+}
+
+std::vector<Place::Ptr> OutPortPlacePDPD::get_consuming_ports() const
+{
+    if (auto tensor_ptr = m_target_tensor.lock())
+    {
+        return tensor_ptr->get_consuming_ports();
+    }
+    FRONT_END_THROW("Tensor has expired.");
+}
+
+bool OutPortPlacePDPD::is_equal_data(Place::Ptr another) const
+{
+    return get_target_tensor()->is_equal_data(another);
+}
+
+Place::Ptr OutPortPlacePDPD::get_target_tensor() const
+{
+    if (const auto& target_tensor = m_target_tensor.lock())
+    {
+        return target_tensor;
+    }
+    FRONT_END_THROW("Target Tensor has expired.");
+}
+
+Place::Ptr OutPortPlacePDPD::get_producing_operation() const
+{
+    if (auto op = m_op.lock())
+    {
+        return op;
+    }
+    FRONT_END_THROW("Operation has expired.");
+}
diff --git a/ngraph/test/files/paddlepaddle/gen_scripts/generate_place_test_model.py b/ngraph/test/files/paddlepaddle/gen_scripts/generate_place_test_model.py
new file mode 100644
index 00000000000000..bd37727527468d
--- /dev/null
+++ b/ngraph/test/files/paddlepaddle/gen_scripts/generate_place_test_model.py
@@ -0,0 +1,54 @@
+import numpy as np
+from save_model import saveModel
+import sys
+
+
+def pdpd_rnn_lstm(input_size, hidden_size, layers, direction):
+    import paddle as pdpd
+    pdpd.enable_static()
+    main_program = pdpd.static.Program()
+    startup_program = pdpd.static.Program()
+
+    num_of_directions = 1 if direction == 'forward' else 2
+    with pdpd.static.program_guard(main_program, startup_program):
+
+        rnn = pdpd.nn.LSTM(input_size, hidden_size, layers, direction, name="lstm")
+
+        data = pdpd.static.data(name='x', shape=[4, 3, input_size], dtype='float32')
+        prev_h = pdpd.ones(shape=[layers * num_of_directions, 4, hidden_size], dtype=np.float32, name="const_1")
+        prev_c = pdpd.ones(shape=[layers * num_of_directions, 4, hidden_size], dtype=np.float32, name="const_2")
+
+        y, (h, c) = rnn(data, (prev_h, prev_c))
+        relu_1 = pdpd.nn.functional.relu(c, name="relu_1")
+        relu_2 = pdpd.nn.functional.relu(c, name="relu_2")
+        relu_3 = pdpd.nn.functional.relu(c, name="relu_3")
+
+        cpu = pdpd.static.cpu_places(1)
+        exe = pdpd.static.Executor(cpu[0])
+        exe.run(startup_program)
+
+        outs = exe.run(
+            feed={'x': np.ones([4, 3, input_size]).astype(np.float32)},
+            fetch_list=[y, h, c],
+            program=main_program)
+        saveModel("place_test_model", exe, feedkeys=['x'],
+                  fetchlist=[y, h, c, relu_1, relu_2, relu_3],
+                  inputs=[np.ones([4, 3, input_size]).astype(np.float32)],
+                  outputs=[outs[0], outs[1], outs[2]], target_dir=sys.argv[1])
+        print(outs[0])
+    return outs[0]
+
+
+if __name__ == "__main__":
+
+    testCases = [
+        {
+            'input_size': 2,
+            'hidden_size': 2,
+            'layers': 1,
+            'direction': 'forward',
+        },
+    ]
+
+    for test in testCases:
+        pdpd_rnn_lstm(test['input_size'], test['hidden_size'], test['layers'], test['direction'])
\ No newline at end of file
diff --git a/ngraph/test/frontend/frontend_manager.cpp b/ngraph/test/frontend/frontend_manager.cpp
index b190c1e7860fa0..af2aeee221d993 100644
--- a/ngraph/test/frontend/frontend_manager.cpp
+++ b/ngraph/test/frontend/frontend_manager.cpp
@@ -83,15 +83,15 @@ TEST(FrontEndManagerTest, testDefaultInputModel)
 {
     std::unique_ptr<InputModel> imPtr(new InputModel()); // to verify base destructor
     InputModel::Ptr im = std::make_shared<InputModel>();
-    ASSERT_ANY_THROW(im->get_inputs());
-    ASSERT_ANY_THROW(im->get_outputs());
+    ASSERT_EQ(im->get_inputs(), std::vector<Place::Ptr>{});
+    ASSERT_EQ(im->get_outputs(), std::vector<Place::Ptr>{});
     ASSERT_ANY_THROW(im->override_all_inputs({nullptr}));
     ASSERT_ANY_THROW(im->override_all_outputs({nullptr}));
     ASSERT_ANY_THROW(im->extract_subgraph({nullptr}, {nullptr}));
-    ASSERT_ANY_THROW(im->get_place_by_tensor_name(""));
-    ASSERT_ANY_THROW(im->get_place_by_operation_name(""));
-    ASSERT_ANY_THROW(im->get_place_by_operation_name_and_input_port("", 0));
-    ASSERT_ANY_THROW(im->get_place_by_operation_name_and_output_port("", 0));
+    ASSERT_EQ(im->get_place_by_tensor_name(""), nullptr);
+    ASSERT_EQ(im->get_place_by_operation_name(""), nullptr);
+    ASSERT_EQ(im->get_place_by_operation_name_and_input_port("", 0), nullptr);
+    ASSERT_EQ(im->get_place_by_operation_name_and_output_port("", 0), nullptr);
     ASSERT_ANY_THROW(im->set_name_for_tensor(nullptr, ""));
     ASSERT_ANY_THROW(im->add_name_for_tensor(nullptr, ""));
     ASSERT_ANY_THROW(im->set_name_for_operation(nullptr, ""));
@@ -114,24 +114,32 @@ TEST(FrontEndManagerTest, testDefaultPlace)
     std::unique_ptr<Place> placePtr(new Place()); // to verify base destructor
     Place::Ptr place = std::make_shared<Place>();
     ASSERT_ANY_THROW(place->get_names());
-    ASSERT_ANY_THROW(place->get_consuming_operations());
-    ASSERT_ANY_THROW(place->get_consuming_operations(0));
-    ASSERT_ANY_THROW(place->get_target_tensor());
-    ASSERT_ANY_THROW(place->get_target_tensor(0));
-    ASSERT_ANY_THROW(place->get_source_tensor());
-    ASSERT_ANY_THROW(place->get_source_tensor(0));
-    ASSERT_ANY_THROW(place->get_producing_operation());
-    ASSERT_ANY_THROW(place->get_producing_operation(0));
-    ASSERT_ANY_THROW(place->get_producing_port());
-    ASSERT_ANY_THROW(place->get_input_port());
-    ASSERT_ANY_THROW(place->get_input_port(0));
-    ASSERT_ANY_THROW(place->get_input_port(""));
-    ASSERT_ANY_THROW(place->get_input_port("", 0));
-    ASSERT_ANY_THROW(place->get_output_port());
-    ASSERT_ANY_THROW(place->get_output_port(0));
-    ASSERT_ANY_THROW(place->get_output_port(""));
-    ASSERT_ANY_THROW(place->get_output_port("", 0));
-    ASSERT_ANY_THROW(place->get_consuming_ports());
+    ASSERT_EQ(place->get_consuming_operations(), std::vector<Place::Ptr>{});
+    ASSERT_EQ(place->get_consuming_operations(0), std::vector<Place::Ptr>{});
+    ASSERT_EQ(place->get_consuming_operations(""), std::vector<Place::Ptr>{});
+    ASSERT_EQ(place->get_consuming_operations("", 0), std::vector<Place::Ptr>{});
+    ASSERT_EQ(place->get_target_tensor(), nullptr);
+    ASSERT_EQ(place->get_target_tensor(0), nullptr);
+    ASSERT_EQ(place->get_target_tensor(""), nullptr);
+    ASSERT_EQ(place->get_target_tensor("", 0), nullptr);
+    ASSERT_EQ(place->get_source_tensor(), nullptr);
+    ASSERT_EQ(place->get_source_tensor(""), nullptr);
+    ASSERT_EQ(place->get_source_tensor(0), nullptr);
+    ASSERT_EQ(place->get_source_tensor("", 0), nullptr);
+    ASSERT_EQ(place->get_producing_operation(), nullptr);
+    ASSERT_EQ(place->get_producing_operation(""), nullptr);
+    ASSERT_EQ(place->get_producing_operation(0), nullptr);
+    ASSERT_EQ(place->get_producing_operation("", 0), nullptr);
+    ASSERT_EQ(place->get_producing_port(), nullptr);
+    ASSERT_EQ(place->get_input_port(), nullptr);
+    ASSERT_EQ(place->get_input_port(0), nullptr);
+    ASSERT_EQ(place->get_input_port(""), nullptr);
+    ASSERT_EQ(place->get_input_port("", 0), nullptr);
+    ASSERT_EQ(place->get_output_port(), nullptr);
+    ASSERT_EQ(place->get_output_port(0), nullptr);
+    ASSERT_EQ(place->get_output_port(""), nullptr);
+    ASSERT_EQ(place->get_output_port("", 0), nullptr);
+    ASSERT_EQ(place->get_consuming_ports(), std::vector<Place::Ptr>{});
     ASSERT_ANY_THROW(place->is_input());
     ASSERT_ANY_THROW(place->is_output());
     ASSERT_ANY_THROW(place->is_equal(nullptr));
diff --git a/ngraph/test/frontend/paddlepaddle/places.cpp b/ngraph/test/frontend/paddlepaddle/places.cpp
new file mode 100644
index 00000000000000..a913353d0bec0a
--- /dev/null
+++ b/ngraph/test/frontend/paddlepaddle/places.cpp
@@ -0,0 +1,476 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <frontend/shared/include/utils.hpp>
+#include <frontend_manager/frontend_manager.hpp>
+#include <memory>
+#include "gtest/gtest.h"
+
+using namespace ngraph::frontend;
+
+const std::string model_file = "place_test_model/place_test_model.pdmodel";
+
+/***
+model:
+
+                         [input]
+                            |
+      [const]   [const]   [transpose]
+           \      |       /
+            [ RNN (LSTM) ]
+         /      |          \
+ [transpose] [scale_{1,2}] [relu_{0,1,2}]
+     |          |              |
+  [scale_0]  [out_{1,2}]   [scale_{3,4,5}]
+     |                         |
+  [out_1]                   [out_{3,4,5}]
+
+***/
+
+std::vector<std::string> tensor_names = {
+    "x",
+    "const_1.tmp_0",
+    "const_2.tmp_0",
+    "transpose_0.tmp_0",
+    "transpose_0.tmp_1",
+    "lstm_0.tmp_0",
+    "lstm_0._generated_var_0",
+    "lstm_0.tmp_3",
+    "lstm_0.tmp_1",
+    "lstm_0.tmp_2",
+    "transpose_1.tmp_0",
+    "transpose_1.tmp_1",
+    "relu_1.tmp_0",
+    "relu_2.tmp_0",
+    "relu_3.tmp_0",
+    "save_infer_model/scale_0.tmp_1",
+    "save_infer_model/scale_1.tmp_1",
+    "save_infer_model/scale_2.tmp_1",
+    "save_infer_model/scale_3.tmp_1",
+    "save_infer_model/scale_4.tmp_1",
+    "save_infer_model/scale_5.tmp_1",
+};
+
+TEST(PDPD_Places, check_tensor_names)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    for (const auto& tensor_name : tensor_names)
+    {
+        auto place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(place, nullptr);
+    }
+}
+
+TEST(PDPD_Places, check_input_outputs)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    auto inputs = input_model->get_inputs();
+    auto outputs = input_model->get_outputs();
+
+    EXPECT_EQ(inputs.size(), 1);
+    EXPECT_EQ(outputs.size(), 6);
+
+    auto tensor_place = input_model->get_place_by_tensor_name("x");
+    tensor_place->is_equal(inputs[0]);
+
+    std::vector<std::string> output_names = {"save_infer_model/scale_0.tmp_1",
+                                             "save_infer_model/scale_1.tmp_1",
+                                             "save_infer_model/scale_2.tmp_1",
+                                             "save_infer_model/scale_3.tmp_1",
+                                             "save_infer_model/scale_4.tmp_1",
+                                             "save_infer_model/scale_5.tmp_1"};
+
+    for (const auto& name : output_names)
+    {
+        const auto output_place = input_model->get_place_by_tensor_name(name);
+        auto it =
+            std::find_if(outputs.begin(), outputs.end(), [&output_place](const Place::Ptr& place) {
+                return output_place->is_equal(place);
+            });
+        EXPECT_NE(it, outputs.end());
+    }
+}
+
+// all existed in the model ops have "Out" port
+TEST(PDPD_Places, check_out_port_of_all_ops)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    for (const auto& tensor_name : tensor_names)
+    {
+        auto place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(place, nullptr);
+
+        auto producing_op = place->get_producing_operation();
+        EXPECT_NE(producing_op, nullptr);
+        auto out_port_by_name = producing_op->get_output_port("Out");
+        EXPECT_NE(out_port_by_name, nullptr);
+        auto out_port_by_name_idx = producing_op->get_output_port("Out", 0);
+        EXPECT_NE(out_port_by_name_idx, nullptr);
+
+        EXPECT_TRUE(out_port_by_name->is_equal(out_port_by_name_idx));
+    }
+}
+
+TEST(PDPD_Places, check_in_out_ports_of_model_outputs)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    auto outputs = input_model->get_outputs();
+    for (const auto& output : outputs)
+    {
+        auto producing_op = output->get_producing_operation();
+        EXPECT_NE(producing_op, nullptr);
+
+        auto out_port = producing_op->get_output_port();
+        EXPECT_NE(out_port, nullptr);
+        auto out_port_by_name = producing_op->get_output_port("Out");
+        EXPECT_NE(out_port_by_name, nullptr);
+        auto out_port_by_name_idx = producing_op->get_output_port("Out", 0);
+        EXPECT_NE(out_port_by_name_idx, nullptr);
+
+        EXPECT_TRUE(out_port->is_equal(out_port_by_name));
+        EXPECT_TRUE(out_port->is_equal(out_port_by_name_idx));
+
+        auto in_port = producing_op->get_input_port();
+        EXPECT_NE(in_port, nullptr);
+        auto in_port_by_name = producing_op->get_input_port("X");
+        EXPECT_NE(in_port_by_name, nullptr);
+        auto in_port_by_name_idx = producing_op->get_input_port("X", 0);
+        EXPECT_NE(in_port_by_name_idx, nullptr);
+
+        EXPECT_TRUE(in_port->is_equal(in_port_by_name));
+        EXPECT_TRUE(in_port->is_equal(in_port_by_name_idx));
+    }
+}
+
+TEST(PDPD_Places, check_source_target_tensors_of_model_outputs)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    auto outputs = input_model->get_outputs();
+    for (const auto& output : outputs)
+    {
+        auto producing_op = output->get_producing_operation();
+        EXPECT_NE(producing_op, nullptr);
+
+        auto out = producing_op->get_target_tensor();
+        EXPECT_NE(out, nullptr);
+        auto out_by_name = producing_op->get_target_tensor("Out");
+        EXPECT_NE(out_by_name, nullptr);
+        auto out_by_name_idx = producing_op->get_target_tensor("Out", 0);
+        EXPECT_NE(out_by_name_idx, nullptr);
+
+        EXPECT_TRUE(out->is_equal(out_by_name));
+        EXPECT_TRUE(out->is_equal(out_by_name_idx));
+
+        auto in = producing_op->get_source_tensor();
+        EXPECT_NE(in, nullptr);
+        auto in_by_name = producing_op->get_source_tensor("X");
+        EXPECT_NE(in_by_name, nullptr);
+        auto in_by_name_idx = producing_op->get_source_tensor("X", 0);
+        EXPECT_NE(in_by_name_idx, nullptr);
+
+        EXPECT_TRUE(in->is_equal(in_by_name));
+        EXPECT_TRUE(in->is_equal(in_by_name_idx));
+    }
+}
+
+TEST(PDPD_Places, check_producing_consuming_ops_of_model_outputs)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    auto outputs = input_model->get_outputs();
+    for (const auto& output : outputs)
+    {
+        auto op = output->get_producing_operation();
+        EXPECT_NE(op, nullptr);
+
+        auto out = op->get_consuming_operations();
+        EXPECT_EQ(out.size(), 1);
+        auto out_by_name = op->get_consuming_operations("Out");
+        EXPECT_EQ(out_by_name.size(), 1);
+        auto out_by_name_idx = op->get_consuming_operations("Out", 0);
+        EXPECT_EQ(out_by_name_idx.size(), 1);
+
+        EXPECT_TRUE(out[0]->is_equal(out_by_name[0]));
+        EXPECT_TRUE(out[0]->is_equal(out_by_name_idx[0]));
+
+        auto in = op->get_producing_operation();
+        EXPECT_NE(in, nullptr);
+        auto in_by_name = op->get_producing_operation("X");
+        EXPECT_NE(in_by_name, nullptr);
+        auto in_by_name_idx = op->get_producing_operation("X", 0);
+        EXPECT_NE(in_by_name_idx, nullptr);
+
+        EXPECT_TRUE(in->is_equal(in_by_name));
+        EXPECT_TRUE(in->is_equal(in_by_name_idx));
+    }
+}
+
+// check data flow [ output port -> tensor -> input port ]
+TEST(PDPD_Places, check_data_flow)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    for (const auto& tensor_name : tensor_names)
+    {
+        auto tensor_place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(tensor_place, nullptr);
+
+        auto out_port = tensor_place->get_producing_port();
+        auto in_ports = tensor_place->get_consuming_ports();
+        EXPECT_TRUE(tensor_place->is_equal_data(out_port));
+        EXPECT_TRUE(out_port->is_equal_data(tensor_place));
+        EXPECT_FALSE(out_port->is_equal(tensor_place));
+
+        auto source_tensor = out_port->get_target_tensor();
+        EXPECT_TRUE(source_tensor->is_equal(tensor_place));
+        for (const auto& in_port : in_ports)
+        {
+            EXPECT_TRUE(out_port->is_equal_data(in_port));
+            EXPECT_TRUE(in_port->is_equal_data(out_port));
+
+            EXPECT_TRUE(in_port->is_equal_data(tensor_place));
+            EXPECT_TRUE(tensor_place->is_equal_data(in_port));
+
+            EXPECT_FALSE(in_port->is_equal(out_port));
+            EXPECT_FALSE(in_port->is_equal(tensor_place));
+
+            EXPECT_TRUE(out_port->is_equal(in_port->get_producing_port()));
+            EXPECT_TRUE(tensor_place->is_equal(in_port->get_source_tensor()));
+        }
+    }
+}
+
+// check [ tensor -> input_port
+//                -> input_port_2
+//                -> input_port_N]
+// input_port, input_port_2, ... input_port_N are equal data
+TEST(PDPD_Places, check_tensor_to_multiple_ports)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    for (const auto& tensor_name : tensor_names)
+    {
+        auto tensor_place = input_model->get_place_by_tensor_name(tensor_name);
+        auto inputs_to = tensor_place->get_consuming_ports();
+        for (size_t idx = 0; idx < inputs_to.size(); ++idx)
+        {
+            for (size_t idx_2 = 0; idx_2 < inputs_to.size(); ++idx_2)
+            {
+                EXPECT_TRUE(inputs_to[idx]->is_equal_data(inputs_to[idx_2]));
+                EXPECT_TRUE(inputs_to[idx_2]->is_equal_data(inputs_to[idx]));
+
+                if (idx == idx_2)
+                {
+                    EXPECT_TRUE(inputs_to[idx]->is_equal(inputs_to[idx_2]));
+                }
+                else
+                {
+                    EXPECT_FALSE(inputs_to[idx]->is_equal(inputs_to[idx_2]));
+                }
+            }
+        }
+    }
+}
+
+// consuming ops should be equal for tensor place and producing output port
+TEST(PDPD_Places, check_consuming_ops)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    for (const auto& tensor_name : tensor_names)
+    {
+        auto tensor_place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(tensor_place, nullptr);
+
+        auto consuming_ops_for_tensor = tensor_place->get_consuming_operations();
+        auto out_port = tensor_place->get_producing_port();
+        auto consuming_ops_for_out_port = out_port->get_consuming_operations();
+
+        bool is_permutation =
+            std::is_permutation(consuming_ops_for_out_port.begin(),
+                                consuming_ops_for_out_port.end(),
+                                consuming_ops_for_tensor.begin(),
+                                [](const Place::Ptr& place1, const Place::Ptr& place2) {
+                                    return place1->is_equal(place2);
+                                });
+
+        EXPECT_TRUE(is_permutation);
+
+        auto consuming_ports_for_tensor = tensor_place->get_consuming_ports();
+        std::vector<Place::Ptr> consuming_ops_for_in_ports;
+        for (const auto& port : consuming_ports_for_tensor)
+        {
+            EXPECT_EQ(port->get_consuming_operations().size(), 1);
+            consuming_ops_for_in_ports.push_back(port->get_consuming_operations()[0]);
+        }
+
+        is_permutation =
+            std::is_permutation(consuming_ops_for_in_ports.begin(),
+                                consuming_ops_for_in_ports.end(),
+                                consuming_ops_for_tensor.begin(),
+                                [](const Place::Ptr& place1, const Place::Ptr& place2) {
+                                    return place1->is_equal(place2);
+                                });
+        EXPECT_TRUE(is_permutation);
+    }
+}
+
+TEST(PDPD_Places, check_consuming_ops_2)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    auto it = find(tensor_names.begin(), tensor_names.end(), "lstm_0.tmp_2");
+    EXPECT_NE(it, tensor_names.end());
+
+    auto tensor_place = input_model->get_place_by_tensor_name(*it);
+    auto consuming_ports = tensor_place->get_consuming_ports();
+    auto consuming_ops = tensor_place->get_consuming_operations();
+    EXPECT_EQ(consuming_ports.size(), 4);
+    EXPECT_EQ(consuming_ops.size(), 4);
+
+    for (const auto& consuming_port : consuming_ports)
+    {
+        auto port_consuming_ops = consuming_port->get_consuming_operations();
+        EXPECT_EQ(port_consuming_ops.size(), 1);
+
+        auto in_port = port_consuming_ops[0]->get_input_port();
+        auto in_port_by_name = port_consuming_ops[0]->get_input_port("X");
+        auto in_port_by_name_and_idx = port_consuming_ops[0]->get_input_port("X", 0);
+
+        EXPECT_TRUE(consuming_port->is_equal(in_port) &&
+                    consuming_port->is_equal(in_port_by_name) &&
+                    consuming_port->is_equal(in_port_by_name_and_idx));
+
+        auto op = std::find_if(consuming_ops.begin(),
+                               consuming_ops.end(),
+                               [&port_consuming_ops](const Place::Ptr& place) {
+                                   return place->is_equal(port_consuming_ops[0]);
+                               });
+        EXPECT_NE(op, consuming_ops.end());
+
+        const auto source_tensor = port_consuming_ops[0]->get_source_tensor();
+        EXPECT_TRUE(source_tensor->is_equal(tensor_place));
+        EXPECT_TRUE(source_tensor->is_equal(consuming_port->get_source_tensor()));
+    }
+}
+
+TEST(PDPD_Places, check_producing_ops)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    for (const auto& tensor_name : tensor_names)
+    {
+        auto tensor_place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(tensor_place, nullptr);
+
+        auto producing_op = tensor_place->get_producing_operation();
+        auto consuming_ports = tensor_place->get_consuming_ports();
+        auto producing_port = tensor_place->get_producing_port();
+
+        EXPECT_TRUE(producing_op->is_equal(producing_port->get_producing_operation()));
+        for (const auto& consuming_port : consuming_ports)
+        {
+            EXPECT_TRUE(producing_op->is_equal(consuming_port->get_producing_operation()));
+        }
+    }
+}
+
+TEST(PDPD_Places, check_input_output_ports_dy_idx)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    std::vector<std::string> output_names = {"save_infer_model/scale_0.tmp_1",
+                                             "save_infer_model/scale_1.tmp_1",
+                                             "save_infer_model/scale_2.tmp_1",
+                                             "save_infer_model/scale_3.tmp_1",
+                                             "save_infer_model/scale_4.tmp_1",
+                                             "save_infer_model/scale_5.tmp_1"};
+
+    for (const auto& tensor_name : output_names)
+    {
+        auto tensor_place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(tensor_place, nullptr);
+
+        auto op = tensor_place->get_producing_operation();
+        auto input_port = op->get_input_port(0);
+        EXPECT_NE(input_port, nullptr);
+        auto out_port = op->get_output_port(0);
+        EXPECT_NE(out_port, nullptr);
+    }
+}
+
+TEST(PDPD_Places, check_ops_tensors_by_idx)
+{
+    FrontEndTestUtils::setupTestEnv();
+    auto m_fem = FrontEndManager();
+    auto frontend = m_fem.load_by_framework("pdpd");
+    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+
+    std::vector<std::string> output_names = {"save_infer_model/scale_0.tmp_1",
+                                             "save_infer_model/scale_1.tmp_1",
+                                             "save_infer_model/scale_2.tmp_1",
+                                             "save_infer_model/scale_3.tmp_1",
+                                             "save_infer_model/scale_4.tmp_1",
+                                             "save_infer_model/scale_5.tmp_1"};
+
+    for (const auto& tensor_name : output_names)
+    {
+        auto tensor_place = input_model->get_place_by_tensor_name(tensor_name);
+        EXPECT_NE(tensor_place, nullptr);
+
+        auto op = tensor_place->get_producing_operation();
+        auto prod_op = op->get_producing_operation(0);
+        EXPECT_NE(prod_op, nullptr);
+
+        auto target_tensor = op->get_target_tensor(0);
+        EXPECT_EQ(tensor_place, target_tensor);
+
+        auto source_tensor = op->get_source_tensor(0);
+        EXPECT_NE(source_tensor, nullptr);
+
+        auto consum_op = op->get_consuming_operations(0);
+        EXPECT_EQ(consum_op.size(), 1);
+    }
+}
diff --git a/tests/fuzz/fuzz-testhelper/tokenizer.h b/tests/fuzz/fuzz-testhelper/tokenizer.h
new file mode 100644
index 00000000000000..9741d8297bcc5f
--- /dev/null
+++ b/tests/fuzz/fuzz-testhelper/tokenizer.h
@@ -0,0 +1,40 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <cstdint>
+#include <cstring>
+
+class Tokenizer {
+public:
+  /// Initialize tokenizer with an input and token separator buffers.
+  Tokenizer(const void *str, size_t str_size, const void *separator,
+            size_t separator_size)
+      : str((const uint8_t *)str), str_size(str_size), separator(separator),
+        separator_size(separator_size) {}
+
+  /// Get next token.
+  const void *next(size_t *token_size) {
+    const void *token = this->str;
+    if (this->str_size >= this->separator_size) {
+      for (size_t i = 0; i < this->str_size - this->separator_size; i++)
+        if (0 == memcmp((const uint8_t *)this->str + i, this->separator,
+                        this->separator_size)) {
+          *token_size = this->str_size - this->separator_size;
+          this->str += i + this->separator_size;
+          this->str_size -= i + this->separator_size;
+          return token;
+        }
+    }
+    *token_size = this->str_size;
+    this->str = nullptr;
+    this->str_size = 0;
+    return token;
+  }
+
+private:
+  const uint8_t *str;
+  size_t str_size;
+  const void *separator;
+  size_t separator_size;
+};
diff --git a/tests/fuzz/scripts/init_corpus.py b/tests/fuzz/scripts/init_corpus.py
new file mode 100755
index 00000000000000..e7a6ff66011dc1
--- /dev/null
+++ b/tests/fuzz/scripts/init_corpus.py
@@ -0,0 +1,56 @@
+#!/usr/bin/env python3
+# Copyright (C) 2018-2021 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
+# Sample usage:
+#   ./scripts/init_corpus.py ./pdpd_layer_models/**/*.pdmodel --join pdiparams
+#   mkdir -p corpus && find ./pdpd_layer_models/ -name "*.fuzz" -exec cp \{\} .//import_pdpd-corpus \;
+
+import argparse
+import glob
+import os
+from pathlib import Path
+import shutil
+import sys
+
+
+def globber(paths):
+    """Generator extending paths with wildcards"""
+    for path in paths:
+        # XXX: use non-public `has_magic` here as we'd like to differentiate between glob and normal paths
+        #  i.e. in the case when user specifies "normal" but non-existing path - we'd like to handle it by ourselves
+        if glob.has_magic(path):
+            for resolved in glob.iglob(path, recursive=True):
+                yield resolved
+        else:
+            yield path
+
+
+def main():
+    """ Main entrypoint """
+    parser = argparse.ArgumentParser(
+        description="Join multiple files of the same name to a single *.fuzz file"
+    )
+    parser.add_argument("input", nargs="+", help="A file to add to the corpus")
+    parser.add_argument(
+        "--join",
+        help="Colon separated list of file extensions to concatenate to corpus entry",
+    )
+    args = parser.parse_args()
+
+    for input in globber(args.input):
+        base = os.path.splitext(input)[0]
+        output = f"{base}.fuzz"
+        shutil.copyfile(input, output)
+        if args.join:
+            with open(output, "ab") as output_file:
+                for join in args.join.split(":"):
+                    join = f"{base}.{join}"
+                    if os.path.isfile(join):
+                        with open(join, "rb") as join_file:
+                            output_file.write(bytes("FUZZ_NEXT_FIELD", "utf-8"))
+                            output_file.write(join_file.read())
+
+
+if __name__ == "__main__":
+    sys.exit(main())
diff --git a/tests/fuzz/src/CMakeLists.txt b/tests/fuzz/src/CMakeLists.txt
index d701b20da7c45b..7ae1097443fd19 100644
--- a/tests/fuzz/src/CMakeLists.txt
+++ b/tests/fuzz/src/CMakeLists.txt
@@ -16,7 +16,8 @@ foreach(test_source ${tests})
     get_filename_component(test_name ${test_source} NAME_WE)
     add_fuzzer(${test_name} ${test_source})
 
-    target_link_libraries(${test_name} PRIVATE IE::inference_engine cnpy zlib)
+    target_link_libraries(${test_name} PRIVATE IE::inference_engine cnpy zlib ${NGRAPH_LIBRARIES}
+            ngraph::frontend_manager)
 
     add_dependencies(fuzz ${test_name})
 
diff --git a/tests/fuzz/src/import_pdpd-fuzzer.cc b/tests/fuzz/src/import_pdpd-fuzzer.cc
new file mode 100644
index 00000000000000..848dd1195cb2b0
--- /dev/null
+++ b/tests/fuzz/src/import_pdpd-fuzzer.cc
@@ -0,0 +1,45 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+#include "frontend_manager/frontend_manager.hpp"
+#include "ngraph/ngraph.hpp"
+#include "tokenizer.h"
+#include <string>
+
+#define COUNT_OF(A) (sizeof(A) / sizeof(A[0]))
+const char split_sequence[] = {'F', 'U', 'Z', 'Z', '_', 'N', 'E', 'X',
+                               'T', '_', 'F', 'I', 'E', 'L', 'D'};
+const char *PDPD = "pdpd";
+
+using namespace ngraph;
+using namespace ngraph::frontend;
+
+extern "C" int LLVMFuzzerTestOneInput(const uint8_t *data, size_t size) {
+  /// split input buffer to model and params
+  Tokenizer tokenizer(data, size, split_sequence, sizeof(split_sequence));
+  size_t model_size = 0;
+  const void *model_buf = tokenizer.next(&model_size);
+  size_t params_size = 0;
+  const void *params_buf = tokenizer.next(&params_size);
+
+  try {
+    ngraph::frontend::FrontEndManager frontend_manager = FrontEndManager();
+    ngraph::frontend::FrontEnd::Ptr frontend =
+        frontend_manager.load_by_framework(PDPD);
+    ngraph::frontend::InputModel::Ptr input_model;
+    std::stringstream model;
+    model << std::string((const char *)model_buf, model_size);
+    std::shared_ptr<std::istream> in_model(&model);
+    if (params_buf) {
+      std::stringstream params;
+      params << std::string((const char *)params_buf, params_size);
+      std::shared_ptr<std::istream> in_params(&params);
+      input_model = frontend->load(in_model, in_params);
+    } else
+      input_model = frontend->load(in_model);
+    std::shared_ptr<ngraph::Function> function = frontend->convert(input_model);
+  } catch (const std::exception&) {
+    return 0;  // fail gracefully on expected exceptions
+  }
+  return 0;
+}
\ No newline at end of file

From 25fc647b2fd357ecaa026a06410d37218760048f Mon Sep 17 00:00:00 2001
From: Mikhail Nosov <mikhail.nosov@intel.com>
Date: Fri, 23 Jul 2021 17:42:49 +0300
Subject: [PATCH 56/71] Azure CI: run MO unit tests after OpenVINO build
 (#6772)

---
 .ci/azure/linux.yml                                      | 9 +++++++++
 model-optimizer/CMakeLists.txt                           | 5 +++++
 model-optimizer/unit_tests/mo/frontend_ngraph_test.py    | 4 ++--
 .../mock_mo_ngraph_frontend/CMakeLists.txt               | 8 +++++++-
 .../mock_mo_frontend/mock_mo_python_api/CMakeLists.txt   | 4 ++++
 5 files changed, 27 insertions(+), 3 deletions(-)

diff --git a/.ci/azure/linux.yml b/.ci/azure/linux.yml
index 64710f8eeba000..52c8bbd384029e 100644
--- a/.ci/azure/linux.yml
+++ b/.ci/azure/linux.yml
@@ -90,6 +90,9 @@ jobs:
       python3 -m pip install -r $(REPO_DIR)/inference-engine/ie_bridges/python/src/requirements-dev.txt
       # For running nGraph unit tests dependent on Python frameworks
       python3 -m pip install -r $(REPO_DIR)/ngraph/test/requirements_test.txt
+      # For MO unit tests
+      python3 -m pip install -r $(REPO_DIR)/model-optimizer/requirements.txt
+      python3 -m pip install -r $(REPO_DIR)/model-optimizer/requirements_dev.txt
       # Speed up build
       wget https://github.com/ninja-build/ninja/releases/download/v1.10.0/ninja-linux.zip
       unzip ninja-linux.zip
@@ -152,6 +155,12 @@ jobs:
     workingDirectory: $(BUILD_SAMPLES_DIR)
     displayName: 'Build c samples'
 
+  - script: |
+      export MO_ROOT=$(INSTALL_DIR)/deployment_tools/model_optimizer
+      . $(SETUPVARS) -pyver 3.6 && python3 -m pytest -s $(INSTALL_DIR)/deployment_tools/model_optimizer/unit_tests --junitxml=TEST-ModelOptimizer.xml
+    displayName: 'Model Optimizer UT'
+    continueOnError: false
+
   - script: . $(SETUPVARS) && $(INSTALL_TEST_DIR)/unit-test --gtest_print_time=1 --gtest_filter=-backend_api.config_unsupported:*IE_GPU* --gtest_output=xml:TEST-NGraphUT.xml
     displayName: 'nGraph UT'
     continueOnError: false
diff --git a/model-optimizer/CMakeLists.txt b/model-optimizer/CMakeLists.txt
index 19056e1b60c688..1cb74d6d67a7ad 100644
--- a/model-optimizer/CMakeLists.txt
+++ b/model-optimizer/CMakeLists.txt
@@ -49,3 +49,8 @@ install(DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/unit_tests
         DESTINATION deployment_tools/model_optimizer
         COMPONENT tests
         EXCLUDE_FROM_ALL)
+
+install(DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/automation
+        DESTINATION deployment_tools/model_optimizer
+        COMPONENT tests
+        EXCLUDE_FROM_ALL)
diff --git a/model-optimizer/unit_tests/mo/frontend_ngraph_test.py b/model-optimizer/unit_tests/mo/frontend_ngraph_test.py
index af747b4132868b..aaf24d14b92ff8 100644
--- a/model-optimizer/unit_tests/mo/frontend_ngraph_test.py
+++ b/model-optimizer/unit_tests/mo/frontend_ngraph_test.py
@@ -28,7 +28,7 @@ def test_no_ie_ngraph(self, mock_find):
 def test_frontends():
     setup_env()
     args = [sys.executable, '-m', 'pytest',
-            'frontend_ngraph_test_actual.py', '-s']
+            os.path.join(os.path.dirname(__file__), 'frontend_ngraph_test_actual.py'), '-s']
 
     status = subprocess.run(args, env=os.environ)
     assert not status.returncode
@@ -37,7 +37,7 @@ def test_frontends():
 def test_main_test():
     setup_env()
     args = [sys.executable, '-m', 'pytest',
-            'main_test_actual.py', '-s']
+            os.path.join(os.path.dirname(__file__), 'main_test_actual.py'), '-s']
 
     status = subprocess.run(args, env=os.environ)
     assert not status.returncode
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/CMakeLists.txt b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/CMakeLists.txt
index 96c60d92ed8771..232ca18727e69c 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/CMakeLists.txt
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_ngraph_frontend/CMakeLists.txt
@@ -15,7 +15,13 @@ add_library(${TARGET_FE_NAME} SHARED ${LIBRARY_SRC} ${LIBRARY_HEADERS})
 
 target_include_directories(${TARGET_FE_NAME} PRIVATE ".")
 
-target_link_libraries(${TARGET_FE_NAME} PRIVATE frontend_manager)
+target_link_libraries(${TARGET_FE_NAME} PRIVATE ngraph::frontend_manager::static)
 target_link_libraries(${TARGET_FE_NAME} PUBLIC ngraph PRIVATE ngraph::builder)
 
 add_clang_format_target(${TARGET_FE_NAME}_clang FOR_TARGETS ${TARGET_FE_NAME})
+
+set(NGRAPH_INSTALL_LIB "deployment_tools/ngraph/lib")
+
+install(TARGETS ${TARGET_FE_NAME}
+        RUNTIME DESTINATION ${NGRAPH_INSTALL_LIB} COMPONENT tests EXCLUDE_FROM_ALL
+        LIBRARY DESTINATION ${NGRAPH_INSTALL_LIB} COMPONENT tests EXCLUDE_FROM_ALL)
diff --git a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt
index 48bc37fa38c0fa..750a0fcb4732ae 100644
--- a/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt
+++ b/model-optimizer/unit_tests/mock_mo_frontend/mock_mo_python_api/CMakeLists.txt
@@ -41,3 +41,7 @@ set(CMAKE_LIBRARY_OUTPUT_DIRECTORY ${CMAKE_LIBRARY_OUTPUT_DIRECTORY_OLD})
 set(CMAKE_ARCHIVE_OUTPUT_DIRECTORY ${CMAKE_ARCHIVE_OUTPUT_DIRECTORY_OLD})
 set(CMAKE_COMPILE_PDB_OUTPUT_DIRECTORY ${CMAKE_COMPILE_PDB_OUTPUT_DIRECTORY_OLD})
 set(CMAKE_PDB_OUTPUT_DIRECTORY ${CMAKE_PDB_OUTPUT_DIRECTORY_OLD})
+
+install(TARGETS ${PYBIND_FE_NAME}
+        DESTINATION python/${PYTHON_VERSION}
+        COMPONENT tests EXCLUDE_FROM_ALL)

From d921e7a9c4f53679a6c264ac9fcc7f2e40e365ca Mon Sep 17 00:00:00 2001
From: Andrey Somsikov <andrey.somsikov@intel.com>
Date: Fri, 23 Jul 2021 17:51:17 +0300
Subject: [PATCH 57/71] Enable mistakenly wiped sanitizer instrumentation
 (#6780)

---
 cmake/developer_package/compile_flags/sanitizer.cmake | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/cmake/developer_package/compile_flags/sanitizer.cmake b/cmake/developer_package/compile_flags/sanitizer.cmake
index 70b2215b664d6d..35343b129f3a34 100644
--- a/cmake/developer_package/compile_flags/sanitizer.cmake
+++ b/cmake/developer_package/compile_flags/sanitizer.cmake
@@ -34,7 +34,7 @@ endif()
 # common sanitizer options
 if (DEFINED SANITIZER_COMPILER_FLAGS)
     # ensure sumbols are present
-    set(SANITIZER_COMPILER_FLAGS "-g -fno-omit-frame-pointer")
+    set(SANITIZER_COMPILER_FLAGS "${SANITIZER_COMPILER_FLAGS} -g -fno-omit-frame-pointer")
     # prevent unloading libraries at runtime, so sanitizer can resolve their symbols
     set(SANITIZER_LINKER_FLAGS "${SANITIZER_LINKER_FLAGS} -Wl,-z,nodelete")
 

From 0c1095003280c4d75971d36dc7105f93c6f03328 Mon Sep 17 00:00:00 2001
From: LuweiZhou <luwei.zhou@intel.com>
Date: Mon, 26 Jul 2021 12:15:40 +0800
Subject: [PATCH 58/71] Revise erf OP (#6477)

* Revise Erf OP sepc

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Revise the NGraph Erf OP implment to switch to RTTI.

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Remove the duplicated Erf in the activation type vector.

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Add NGraph visitor API test case.

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Enalbe the Erf visitor API CmakeLists.txt.

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Revise the Erf OP backend test

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Migrate to use the template test.

* Add erf type_prop test.

* Update the license

* Unary Visitor test template fix

-Migrate OP Tanh to use RTTI;
-Remove the using namespace in the header file
-Migrate the Swish and Tanh visitor test to use template code


Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Revert "Unary Visitor test template fix"

This reverts commit b686c933d34316dbc38ae9ba3823dca8e790f5a9.

* Update the doc format.

* Update the document format and description.

Signed-off-by: Luwei Zhou <luwei.zhou@intel.com>

* Add Erf OP into the layer test summary list

* Migrate the Erf backend test into template_plugin infrastructure

* Update the Erf supported input type.

* Remove the boolean type support in erf reference implement.

validate_and_infer_elementwise_arithmetic() will fail with boolean type.

* Update the erf test  with all supported types.

* Update with separate namespace of CommonReferenceTest
---
 docs/ops/arithmetic/Erf_1.md                  | 18 ++--
 .../tests/functional/op_reference/erf.cpp     | 94 +++++++++++++++++++
 .../serialization/single_layer/activation.cpp |  1 -
 .../single_layer_tests/activation.cpp         |  1 -
 .../layer_tests_summary/utils/constants.py    |  1 +
 ngraph/core/include/ngraph/op/erf.hpp         |  8 +-
 ngraph/core/src/op/erf.cpp                    |  4 +-
 ngraph/test/CMakeLists.txt                    |  3 +-
 ngraph/test/backend/erf.in.cpp                | 52 ----------
 ngraph/test/type_prop/erf.cpp                 |  9 ++
 ngraph/test/visitors/op/erf.cpp               | 12 +++
 11 files changed, 133 insertions(+), 70 deletions(-)
 create mode 100644 docs/template_plugin/tests/functional/op_reference/erf.cpp
 delete mode 100644 ngraph/test/backend/erf.in.cpp
 create mode 100644 ngraph/test/type_prop/erf.cpp
 create mode 100644 ngraph/test/visitors/op/erf.cpp

diff --git a/docs/ops/arithmetic/Erf_1.md b/docs/ops/arithmetic/Erf_1.md
index 6b445dafad29bb..52d2d0301cb679 100644
--- a/docs/ops/arithmetic/Erf_1.md
+++ b/docs/ops/arithmetic/Erf_1.md
@@ -4,34 +4,32 @@
 
 **Category**: Arithmetic unary operation
 
-**Short description**: *Erf* calculates the Gauss error function element-wise with given tensor.
+**Short description**: *Erf* performs element-wise Gauss error function (erf) on a given input tensor.
 
 **Detailed Description**
 
-For each element from the input tensor calculates corresponding element in the output tensor with the following formula:
+*Erf* performs element-wise erf operation on a given input tensor, based on the following mathematical formula:
+
 \f[
 erf(x) = \pi^{-1} \int_{-x}^{x} e^{-t^2} dt
 \f]
 
-**Attributes**:
-
-    No attributes available.
+**Attributes**: *Erf* operation has no attributes.
 
 **Inputs**
 
-* **1**: A tensor of type *T*. **Required.**
+* **1**: A tensor of type *T* and arbitrary shape. **Required.**
 
 **Outputs**
 
-* **1**: The result of element-wise operation. A tensor of type *T*.
+* **1**: The result of element-wise *Erf* function applied to the input tensor. A tensor of type *T* and the same shape as the input tensor.
 
 **Types**
 
-* *T*: any supported floating-point type.
+* *T*: any supported numeric type.
 
-**Examples**
 
-*Example 1*
+**Example**
 
 ```xml
 <layer ... type="Erf">
diff --git a/docs/template_plugin/tests/functional/op_reference/erf.cpp b/docs/template_plugin/tests/functional/op_reference/erf.cpp
new file mode 100644
index 00000000000000..bd888a8e03c90f
--- /dev/null
+++ b/docs/template_plugin/tests/functional/op_reference/erf.cpp
@@ -0,0 +1,94 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <gtest/gtest.h>
+
+#include <ie_core.hpp>
+#include <ie_ngraph_utils.hpp>
+#include <limits>
+#include <ngraph/ngraph.hpp>
+#include <shared_test_classes/base/layer_test_utils.hpp>
+#include <tuple>
+
+#include "base_reference_test.hpp"
+
+using namespace reference_tests;
+using namespace ngraph;
+using namespace InferenceEngine;
+
+struct ErfParams {
+    template <class IT>
+    ErfParams(const ngraph::PartialShape& shape, const ngraph::element::Type& iType, const std::vector<IT>& iValues)
+        : pshape(shape), inType(iType), outType(iType), inputData(CreateBlob(iType, iValues)) {
+        std::vector<IT> oValues;
+        std::vector<double> output;
+        for (auto element : iValues)
+            output.push_back(static_cast<double>(element));
+
+        std::transform(output.begin(), output.end(), output.begin(), [](double input) -> double {
+            return std::erf(input);
+        });
+
+        if (std::is_integral<IT>()) {
+            std::transform(output.begin(), output.end(), output.begin(), [](double input) -> double {
+                return std::round(input);
+            });
+        }
+
+        for (auto element : output)
+            oValues.push_back(static_cast<IT>(element));
+        refData = CreateBlob(outType, oValues);
+    }
+    ngraph::PartialShape pshape;
+    ngraph::element::Type inType;
+    ngraph::element::Type outType;
+    InferenceEngine::Blob::Ptr inputData;
+    InferenceEngine::Blob::Ptr refData;
+};
+
+class ReferenceErfLayerTest : public testing::TestWithParam<ErfParams>, public CommonReferenceTest {
+public:
+    void SetUp() override {
+        auto params = GetParam();
+        function = CreateFunction(params.pshape, params.inType, params.outType);
+        inputData = {params.inputData};
+        refOutData = {params.refData};
+    }
+    static std::string getTestCaseName(const testing::TestParamInfo<ErfParams>& obj) {
+        auto param = obj.param;
+        std::ostringstream result;
+        result << "shape=" << param.pshape << "_";
+        result << "iType=" << param.inType << "_";
+        result << "oType=" << param.outType;
+        return result.str();
+    }
+
+private:
+    static std::shared_ptr<Function> CreateFunction(const PartialShape& input_shape, const element::Type& input_type,
+                                                    const element::Type& expected_output_type) {
+        const auto in = std::make_shared<op::Parameter>(input_type, input_shape);
+        const auto erf = std::make_shared<op::Erf>(in);
+        return std::make_shared<Function>(NodeVector {erf}, ParameterVector {in});
+    }
+};
+
+TEST_P(ReferenceErfLayerTest, CompareWithRefs) {
+    Exec();
+}
+
+INSTANTIATE_TEST_SUITE_P(
+    smoke_Erf_With_Hardcoded_Refs, ReferenceErfLayerTest,
+    ::testing::Values(ErfParams(ngraph::PartialShape {2, 5}, ngraph::element::f32,
+                                std::vector<float> {-INFINITY, -4.0f, -3.0f, -2.0f, -1.0f, 0.0f, 1.0f, 2.0f, 3.0f, INFINITY}),
+                      ErfParams(ngraph::PartialShape {2, 5}, ngraph::element::f16,
+                                std::vector<float16> {-INFINITY, -4.0f, -3.0f, -2.0f, -1.0f, 0.0f, 1.0f, 2.0f, 3.0f, INFINITY}),
+                      ErfParams(ngraph::PartialShape {2, 3}, ngraph::element::i32,
+                                std::vector<int32_t> {std::numeric_limits<int32_t>::min(), -2, -1, 1, 2, std::numeric_limits<int32_t>::max()}),
+                      ErfParams(ngraph::PartialShape {2, 3}, ngraph::element::u32,
+                                std::vector<uint32_t> {std::numeric_limits<uint32_t>::min(), 0, 1, 2, 3, std::numeric_limits<uint32_t>::max()}),
+                      ErfParams(ngraph::PartialShape {2, 3}, ngraph::element::i64,
+                                std::vector<int64_t> {std::numeric_limits<int64_t>::min(), -2, -1, 1, 2, std::numeric_limits<int64_t>::max()}),
+                      ErfParams(ngraph::PartialShape {2, 3}, ngraph::element::u64,
+                                std::vector<uint64_t> {std::numeric_limits<uint64_t>::min(), 0, 1, 2, 3, std::numeric_limits<uint64_t>::max()})),
+    ReferenceErfLayerTest::getTestCaseName);
diff --git a/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp b/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp
index efe2efaf5ee495..0b3d4535b9794b 100644
--- a/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp
+++ b/inference-engine/tests/functional/inference_engine/serialization/single_layer/activation.cpp
@@ -59,7 +59,6 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes
         {HSigmoid,              {}},
         {RoundHalfToEven,       {}},
         {RoundHalfAwayFromZero, {}},
-        {Erf,                   {}},
         {GeluErf,               {}},
         {GeluTanh,              {}}
 };
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
index 98b73bfb1d4818..9f0e51396ee078 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/activation.cpp
@@ -59,7 +59,6 @@ const std::map<ActivationTypes, std::vector<std::vector<float>>> activationTypes
         {HSigmoid,              {}},
         {RoundHalfToEven,       {}},
         {RoundHalfAwayFromZero, {}},
-        {Erf,                   {}},
         {GeluErf,               {}},
         {GeluTanh,              {}},
         {Swish,                 {{0.4f}}}
diff --git a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
index 60d91f93b49a47..1a2d136313aede 100644
--- a/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
+++ b/inference-engine/tests/ie_test_utils/functional_test_utils/layer_tests_summary/utils/constants.py
@@ -31,6 +31,7 @@
     'DepthToSpace-1',
     'DetectionOutput-1',
     'Divide-1',
+    'Erf-1',
     'ExperimentalDetectronDetectionOutput-6',
     'ExperimentalDetectronGenerateProposalsSingleImage-6',
     'ExperimentalDetectronPriorGridGenerator-6',
diff --git a/ngraph/core/include/ngraph/op/erf.hpp b/ngraph/core/include/ngraph/op/erf.hpp
index 473914823b49d1..361653d9b6f945 100644
--- a/ngraph/core/include/ngraph/op/erf.hpp
+++ b/ngraph/core/include/ngraph/op/erf.hpp
@@ -12,12 +12,16 @@ namespace ngraph
     {
         namespace v0
         {
+            /// \brief Elementwise erf operation.
             class NGRAPH_API Erf : public util::UnaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Erf", 0};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+                /// \brief Constructs a floor operation.
                 Erf() = default;
+                /// \brief Constructs a floor operation.
+                ///
+                /// \param arg Node that produces the input tensor.
                 Erf(const Output<Node>& arg);
 
                 bool visit_attributes(AttributeVisitor& visitor) override;
diff --git a/ngraph/core/src/op/erf.cpp b/ngraph/core/src/op/erf.cpp
index 90f64dbe9df5cf..3d56d1e0b0af0a 100644
--- a/ngraph/core/src/op/erf.cpp
+++ b/ngraph/core/src/op/erf.cpp
@@ -13,7 +13,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::Erf::type_info;
+NGRAPH_RTTI_DEFINITION(op::v0::Erf, "Erf", 0, util::UnaryElementwiseArithmetic);
 
 bool ngraph::op::v0::Erf::visit_attributes(AttributeVisitor& visitor)
 {
@@ -51,7 +51,6 @@ namespace erfop
 
         switch (arg0->get_element_type())
         {
-            NGRAPH_TYPE_CASE(evaluate_erf, boolean, arg0, out, count);
             NGRAPH_TYPE_CASE(evaluate_erf, i32, arg0, out, count);
             NGRAPH_TYPE_CASE(evaluate_erf, i64, arg0, out, count);
             NGRAPH_TYPE_CASE(evaluate_erf, u32, arg0, out, count);
@@ -75,7 +74,6 @@ bool op::Erf::has_evaluate() const
     NGRAPH_OP_SCOPE(v0_Erf_has_evaluate);
     switch (get_input_element_type(0))
     {
-    case ngraph::element::boolean:
     case ngraph::element::i32:
     case ngraph::element::i64:
     case ngraph::element::u32:
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 5cc1197307bd5a..998ff3617120bd 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -122,6 +122,7 @@ set(SRC
     type_prop/dft.cpp
     type_prop/dyn_reshape.cpp
     type_prop/einsum.cpp
+    type_prop/erf.cpp
     type_prop/exp.cpp
     type_prop/experimental_detectron_generate_proposals.cpp
     type_prop/experimental_detectron_roi_feature_extractor.cpp
@@ -252,6 +253,7 @@ set(SRC
     visitors/op/detection_output.cpp
     visitors/op/einsum.cpp
     visitors/op/elu.cpp
+    visitors/op/erf.cpp
     visitors/op/extractimagepatches.cpp
     visitors/op/fake_quantize.cpp
     visitors/op/floor.cpp
@@ -415,7 +417,6 @@ set(MULTI_TEST_SRC
     backend/strided_slice.in.cpp
     backend/dynamic.in.cpp
     backend/elu.in.cpp
-    backend/erf.in.cpp
     backend/exp.in.cpp
     backend/experimental_detectron_detection_output.in.cpp
     backend/experimental_detectron_prior_grid.in.cpp
diff --git a/ngraph/test/backend/erf.in.cpp b/ngraph/test/backend/erf.in.cpp
deleted file mode 100644
index 7af553ceacb284..00000000000000
--- a/ngraph/test/backend/erf.in.cpp
+++ /dev/null
@@ -1,52 +0,0 @@
-// Copyright (C) 2018-2021 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <algorithm>
-#include <cinttypes>
-#include <cmath>
-#include <cstdlib>
-#include <random>
-#include <string>
-
-// clang-format off
-#ifdef ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
-#define DEFAULT_FLOAT_TOLERANCE_BITS ${BACKEND_NAME}_FLOAT_TOLERANCE_BITS
-#endif
-
-#ifdef ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
-#define DEFAULT_DOUBLE_TOLERANCE_BITS ${BACKEND_NAME}_DOUBLE_TOLERANCE_BITS
-#endif
-// clang-format on
-
-#include "gtest/gtest.h"
-#include "ngraph/ngraph.hpp"
-#include "util/engine/test_engines.hpp"
-#include "util/test_case.hpp"
-#include "util/test_control.hpp"
-
-using namespace std;
-using namespace ngraph;
-
-static string s_manifest = "${MANIFEST}";
-using TestEngine = test::ENGINE_CLASS_NAME(${BACKEND_NAME});
-
-NGRAPH_TEST(${BACKEND_NAME}, erf)
-{
-    Shape shape{8};
-    auto A = make_shared<op::Parameter>(element::f32, shape);
-    auto f = make_shared<Function>(make_shared<op::Erf>(A), ParameterVector{A});
-
-    auto test_case = test::TestCase<TestEngine>(f);
-    test_case.add_input<float>({-4.0f, -3.0f, -2.0f, -1.0f, 0.0f, 1.0f, 2.0f, 3.0f});
-    test_case.add_expected_output<float>(shape,
-                                         {erf(-4.0f),
-                                          erf(-3.0f),
-                                          erf(-2.0f),
-                                          erf(-1.0f),
-                                          erf(0.0f),
-                                          erf(1.0f),
-                                          erf(2.0f),
-                                          erf(3.0f)});
-    test_case.run();
-}
diff --git a/ngraph/test/type_prop/erf.cpp b/ngraph/test/type_prop/erf.cpp
new file mode 100644
index 00000000000000..fb6966276d524f
--- /dev/null
+++ b/ngraph/test/type_prop/erf.cpp
@@ -0,0 +1,9 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "unary_ops.hpp"
+
+using Type = ::testing::Types<ngraph::op::Erf>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(type_prop_erf, UnaryOperator, Type);
diff --git a/ngraph/test/visitors/op/erf.cpp b/ngraph/test/visitors/op/erf.cpp
new file mode 100644
index 00000000000000..e0aab057a85097
--- /dev/null
+++ b/ngraph/test/visitors/op/erf.cpp
@@ -0,0 +1,12 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "unary_ops.hpp"
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Erf, element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_atrribute,
+                               UnaryOperatorVisitor,
+                               Type,
+                               UnaryOperatorTypeName);

From 33dfcd62c2e9553e700917966800a4c3f3de6118 Mon Sep 17 00:00:00 2001
From: Ilya Sharikov <ilya.sharikov@intel.com>
Date: Mon, 26 Jul 2021 09:00:56 +0300
Subject: [PATCH 59/71] Add --verbose option to infer_tool (#6770)

Detailed infer results printing overload output and freeze sea_runtool.
Hiding debug messages by default.
---
 tests/conditional_compilation/tools/infer_tool.py | 10 +++++++---
 1 file changed, 7 insertions(+), 3 deletions(-)

diff --git a/tests/conditional_compilation/tools/infer_tool.py b/tests/conditional_compilation/tools/infer_tool.py
index 9cc705d5c5f85d..9d733b6911cee9 100644
--- a/tests/conditional_compilation/tools/infer_tool.py
+++ b/tests/conditional_compilation/tools/infer_tool.py
@@ -62,10 +62,14 @@ def cli_parser():
     parser.add_argument('-d', dest='device', required=True, help='Target device to infer on')
     parser.add_argument('-r', dest='out_path', required=True,
                         help='Dumps results to the output file')
+    parser.add_argument('-v', '--verbose', dest='verbose', action='store_true',
+                        help='Increase output verbosity')
     args = parser.parse_args()
     ir_path = args.ir_path
     device = args.device
     out_path = args.out_path
+    if args.verbose:
+        log.getLogger().setLevel(log.DEBUG)
     return ir_path, device, out_path
 
 
@@ -74,6 +78,6 @@ def cli_parser():
     results = infer(ir_path=ir_path, device=device)
     np.savez(out_path, **results)
     log.info("Path for inference results: {}".format(out_path))
-    log.info("Inference results:")
-    log.info(results)
-    log.info("SUCCESS!")
+    log.debug("Inference results:")
+    log.debug(results)
+    log.debug("SUCCESS!")

From 9b706711fed8fc2382685bdd44d5dd8b5554b6c1 Mon Sep 17 00:00:00 2001
From: Andrei Molotkov <andrei.molotkov@intel.com>
Date: Mon, 26 Jul 2021 10:02:21 +0300
Subject: [PATCH 60/71] [GPU] Refactoring of pre_replace_deconv pass (#6218)

---
 .../graph_optimizer/pre_replace_deconv.cpp    | 257 ++++++++----------
 .../thirdparty/clDNN/src/program.cpp          |  11 +-
 2 files changed, 114 insertions(+), 154 deletions(-)

diff --git a/inference-engine/thirdparty/clDNN/src/graph_optimizer/pre_replace_deconv.cpp b/inference-engine/thirdparty/clDNN/src/graph_optimizer/pre_replace_deconv.cpp
index ccb00d3726e5b6..bfc02321d0e3f2 100644
--- a/inference-engine/thirdparty/clDNN/src/graph_optimizer/pre_replace_deconv.cpp
+++ b/inference-engine/thirdparty/clDNN/src/graph_optimizer/pre_replace_deconv.cpp
@@ -34,19 +34,13 @@ void pre_replace_deconv::run(program_impl& p) {
 
             auto& deconv_node = node->as<deconvolution>();
             auto& weights_node = deconv_node.weights();
-            auto deconv_prim = node->as<deconvolution>().typed_desc();
+            auto deconv_prim = deconv_node.typed_desc();
             tensor filter_size = weights_node.get_output_layout().size;
-            auto weights = deconv_prim->weights;
-
-            std::vector<primitive_id> weights_vec;
-            for (auto& weights_id : weights)
-                weights_vec.push_back(weights_id);
-
-            for (auto& weights_id : weights_vec) {
-                auto weights_iter = p.nodes_map.find(weights_id);
-                if (weights_iter == p.nodes_map.end())
-                    continue;
-            }
+            auto weights_nodes_id = deconv_prim->weights;
+            auto biases_nodes_id = deconv_prim->bias;
+            auto& input_node = deconv_node.get_dependency(0);
+            const primitive_id deconv_node_id = deconv_node.id();
+            const primitive_id& input_node_id = input_node.id();
 
             // limit optimization to stride = 1
             // iterators shouldn't be used here because of incorrect iterator functionality in mutable_array_ref<>
@@ -55,8 +49,6 @@ void pre_replace_deconv::run(program_impl& p) {
                 unit_stride &= (deconv_prim->stride.spatial[i] == 1);
             }
             if (unit_stride) {
-                primitive_id deconv_id = node->id();
-                auto& input_node = node->get_dependency(0);
                 auto groups = deconv_node.get_groups();
 
                 bool perform_opt = false;
@@ -64,155 +56,132 @@ void pre_replace_deconv::run(program_impl& p) {
                 perform_opt |= cldnn::format::dimension(input_node.get_output_layout().format) == 4 &&
                                (input_node.get_output_layout().data_type == data_types::f32 || input_node.get_output_layout().data_type == data_types::f16) &&
                                !((_lo.get_optimization_attributes().b_fs_yx_fsv16_network || input_node.get_output_layout().format == format::b_fs_yx_fsv16) &&
-                                _lo.is_format_optimized(node->as<deconvolution>(), format::b_fs_yx_fsv16));
+                                _lo.is_format_optimized(deconv_node, format::b_fs_yx_fsv16));
                 // int8/uint8 input
                 perform_opt |= (input_node.get_output_layout().data_type == data_types::i8 || input_node.get_output_layout().data_type == data_types::u8);
 
                 if (!perform_opt)
                     continue;
 
-                primitive_id input_id = deconv_prim->input[0];
 
                 // setting convolution parameters based on deconvolution params
                 auto stride = deconv_prim->stride;
-                auto biases = deconv_prim->bias;
-                std::vector<primitive_id> bias_vec;
-                for (auto& bias_id : biases)
-                    bias_vec.push_back(bias_id);
                 auto input_offset = deconv_prim->input_offset;
                 auto output_padding = deconv_prim->output_padding;
                 auto grouped_weights_shape = deconv_prim->grouped_weights_shape;
 
                 // remove deconvolution node and its connections to weights and biases, rename it and move to the optimized
                 // list
-                p.remove_connection(node->get_dependency(0), *node);
-                for (auto& weights_id : weights_vec) {
+                p.remove_connection(input_node, deconv_node);
+                std::vector<std::shared_ptr<program_node>> weight_connections;
+                for (auto& weights_id : weights_nodes_id) {
                     auto weights_iter = p.nodes_map.find(weights_id);
                     if (weights_iter == p.nodes_map.end())
                         continue;
 
                     auto weights_node_ptr = weights_iter->second;
-                    p.remove_connection(*weights_node_ptr, *node);
+                    weight_connections.push_back(weights_node_ptr);
+                    p.remove_connection(*weights_node_ptr, deconv_node);
                 }
 
                 input_offset.spatial[0] = std::abs(input_offset.spatial[0]) - (filter_size.spatial[0] - 1);
                 input_offset.spatial[1] = std::abs(input_offset.spatial[1]) - (filter_size.spatial[1] - 1);
                 input_offset.spatial[2] = std::abs(input_offset.spatial[2]) - (filter_size.spatial[2] - 1);
 
-                if (!bias_vec.empty()) {
-                    for (auto& bias_id : bias_vec) {
-                        auto bias_iter = p.nodes_map.find(bias_id);
-                        if (bias_iter == p.nodes_map.end())
-                            continue;
+                std::vector<std::shared_ptr<program_node>> bias_connections;
+                for (auto& bias_id : biases_nodes_id) {
+                    auto bias_iter = p.nodes_map.find(bias_id);
+                    if (bias_iter == p.nodes_map.end())
+                        continue;
 
-                        auto bias_id_node_ptr = bias_iter->second;
-                        p.remove_connection(*bias_id_node_ptr, *node);
-                    }
+                    auto bias_id_node_ptr = bias_iter->second;
+                    bias_connections.push_back(bias_id_node_ptr);
+                    p.remove_connection(*bias_id_node_ptr, deconv_node);
                 }
-                auto rename_id = deconv_id + "_tmp";
-                auto was_output = node->is_output();
+                auto was_output = deconv_node.is_output();
                 if (was_output) {
-                    node->set_output(false);
+                    deconv_node.set_output(false);
                     auto& outputs = p.get_outputs();
                     outputs.erase(std::remove(outputs.begin(), outputs.end(), node.get()), outputs.end());
                 }
-                p.rename(*node, rename_id);
+                auto rename_id = deconv_node_id + "_tmp";
+                p.rename(deconv_node, rename_id);
 
                 // create convolution primitive
-                if (!biases.empty()) {
-                    auto conv_prim = std::make_shared<convolution>(deconv_id,
-                                                                   input_id,
-                                                                   weights_vec,
-                                                                   bias_vec,
-                                                                   groups,
-                                                                   stride,
-                                                                   input_offset,
-                                                                   tensor{ 1, 1, 1, 1 },
-                                                                   grouped_weights_shape,
-                                                                   output_padding);
-                    p.get_or_create(conv_prim);
+                std::shared_ptr<convolution> conv_prim;
+                if (!biases_nodes_id.empty()) {
+                    conv_prim = std::make_shared<convolution>(deconv_node_id,
+                                                              input_node_id,
+                                                              weights_nodes_id,
+                                                              biases_nodes_id,
+                                                              groups,
+                                                              stride,
+                                                              input_offset,
+                                                              tensor{ 1, 1, 1, 1 },
+                                                              grouped_weights_shape,
+                                                              output_padding);
                 } else {
-                    auto conv_prim = std::make_shared<convolution>(deconv_id,
-                                                                   input_id,
-                                                                   weights_vec,
-                                                                   groups,
-                                                                   stride,
-                                                                   input_offset,
-                                                                   tensor{ 1, 1, 1, 1 },
-                                                                   grouped_weights_shape,
-                                                                   output_padding);
-                    p.get_or_create(conv_prim);
+                    conv_prim = std::make_shared<convolution>(deconv_node_id,
+                                                              input_node_id,
+                                                              weights_nodes_id,
+                                                              groups,
+                                                              stride,
+                                                              input_offset,
+                                                              tensor{ 1, 1, 1, 1 },
+                                                              grouped_weights_shape,
+                                                              output_padding);
                 }
+                program_node& new_node = p.get_or_create(conv_prim);
 
-                auto conv_node_itr = p.nodes_map.find(deconv_id);
-                if (conv_node_itr == p.nodes_map.end())
-                    continue;
-
-                auto conv_node_ptr = conv_node_itr->second;
-                auto conv_node = &conv_node_ptr->as<convolution>();
-                conv_node->set_transposed(true);
+                auto& conv_node = new_node.as<convolution>();
+                conv_node.set_transposed(true);
 
                 // add connections input->convolution, weights->convolution and bias->convolution
-                p.add_connection(input_node, *conv_node_ptr);
+                p.add_connection(input_node, conv_node);
 
-                for (auto& weights_id : weights_vec) {
-                    auto weights_node_itr = p.nodes_map.find(weights_id);
-                    if (weights_node_itr == p.nodes_map.end())
-                        continue;
-
-                    auto weights_node_ptr = weights_node_itr->second;
-                    p.add_connection(*weights_node_ptr, *conv_node_ptr);
+                for (auto& weight_node : weight_connections) {
+                    p.add_connection(*weight_node, conv_node);
                 }
 
-                if (!bias_vec.empty()) {
-                    for (auto& bias_id : bias_vec) {
-                        auto bias_id_node_itr = p.nodes_map.find(bias_id);
-                        if (bias_id_node_itr == p.nodes_map.end())
-                            continue;
-
-                        auto bias_id_node_ptr = bias_id_node_itr->second;
-                        p.add_connection(*bias_id_node_ptr, *conv_node_ptr);
-                    }
+                for (auto& bias_node : bias_connections) {
+                    p.add_connection(*bias_node, conv_node);
                 }
 
                 auto deconv_node_itr = p.nodes_map.find(rename_id);
                 if (deconv_node_itr != p.nodes_map.end()) {
                     auto deconv_node_ptr = deconv_node_itr->second;
-                    p.replace_all_usages(*deconv_node_ptr, *conv_node_ptr);
+                    p.replace_all_usages(*deconv_node_ptr, conv_node);
                     p.optimized_out.push_back(rename_id);
                     p.nodes_map.erase(rename_id);
                 }
 
                 if (was_output) {
-                    conv_node->set_output(true);
-                    p.get_outputs().push_back(conv_node);
+                    conv_node.set_output(true);
+                    p.get_outputs().push_back(&conv_node);
                 }
 
-                p.mark_if_data_flow(*conv_node);
-                conv_node->recalc_output_layout(true);
+                p.mark_if_data_flow(conv_node);
+                conv_node.recalc_output_layout(true);
 
                 update_processing_order = true;
             // current optimization only available for specific deconvolution parameters
-            } else if (node->is_output() == false &&
-               node->get_output_layout().size.feature[0] == 1 &&
+            } else if (deconv_node.is_output() == false &&
+               deconv_node.get_output_layout().size.feature[0] == 1 &&
                deconv_prim->stride.spatial[0] == 2 && deconv_prim->stride.spatial[1] == 2 &&
                filter_size.spatial[0] == 9 && filter_size.spatial[1] == 9 &&
                deconv_prim->input_offset.spatial[0] == -4 && deconv_prim->input_offset.spatial[1] == -4 &&
-               weights_vec.size() == 1 && deconv_prim->bias.size() == 1 &&
-               node->get_dependency(0).get_output_layout().format == format::bfyx) {
-                primitive_id deconv_id = node->id();
-                auto& input_node = node->get_dependency(0);
-                primitive_id input_id = deconv_prim->input[0];
+               weights_nodes_id.size() == 1 && biases_nodes_id.size() == 1 &&
+               input_node.get_output_layout().format == format::bfyx) {
+                const auto scale_factor = deconv_prim->stride.spatial[0];
 
-                auto scale_factor = deconv_prim->stride.spatial[0];
+                const auto& weight_node_id = weights_nodes_id.front();
+                auto weights_node_ptr = p.nodes_map.find(weight_node_id)->second;
+                const auto& weights_layout = weights_node_ptr->get_output_layout();
+                const auto& weights_data_type = weights_layout.data_type;
 
-                auto cur_weights_node_ptr = p.nodes_map.find(weights_vec[0])->second;
-                auto weights_layout = cur_weights_node_ptr->get_output_layout();
-                auto weights_data_type = weights_layout.data_type;
-
-                auto biases = deconv_prim->bias[0];
-                auto bias_id_node_ptr = p.nodes_map.find(biases)->second;
-                auto bias_data_type = bias_id_node_ptr->get_output_layout().data_type;
+                const auto& bias_node_id = biases_nodes_id.front();
+                auto bias_id_node_ptr = p.nodes_map.find(bias_node_id)->second;
+                const auto& bias_data_type = bias_id_node_ptr->get_output_layout().data_type;
 
                 // enable only for fp32 and fp16
                 if (weights_data_type != data_types::f16 &&
@@ -229,14 +198,13 @@ void pre_replace_deconv::run(program_impl& p) {
 
                 // remove deconvolution node and its connections to weights and biases,
                 // rename it and move to the optimized list
-                p.remove_connection(node->get_dependency(0), *node);
+                p.remove_connection(input_node, deconv_node);
 
-                auto weights_node_ptr = p.nodes_map.find(weights_vec[0])->second;
-                p.remove_connection(*weights_node_ptr, *node);
-                p.remove_connection(*bias_id_node_ptr, *node);
+                p.remove_connection(*weights_node_ptr, deconv_node);
+                p.remove_connection(*bias_id_node_ptr, deconv_node);
 
-                auto rename_id = deconv_id + "_tmp";
-                p.rename(*node, rename_id);
+                auto rename_id = deconv_node_id + "_tmp";
+                p.rename(deconv_node, rename_id);
 
                 // reshape weights
                 int pixel_shuffle_size = scale_factor * scale_factor;
@@ -244,17 +212,18 @@ void pre_replace_deconv::run(program_impl& p) {
                 tensor target_weights_size = { pixel_shuffle_size, filter_size.feature[0], kernel_size, kernel_size };
                 auto target_weights_layout = layout{ weights_layout.data_type, weights_layout.format, target_weights_size };
 
+                const primitive_id weight_replace_node_id = weight_node_id + "_conv_rpl";
                 {
                      memory::ptr data_to_allocate = p.get_engine().allocate_memory(target_weights_layout);
 
                      std::vector<float> weights_vec_float;
 
                      if (weights_data_type == data_types::f16) {
-                         mem_lock<half_t> src{ cur_weights_node_ptr->as<data>().get_attached_memory_ptr(), stream };
+                         mem_lock<half_t> src{ weights_node_ptr->as<data>().get_attached_memory_ptr(), stream };
                          for (uint32_t i = 0; i < weights_layout.size.count(); i++)
                              weights_vec_float.push_back(static_cast<float>(src.data()[i]));
                      } else {
-                         mem_lock<float> src{ cur_weights_node_ptr->as<data>().get_attached_memory_ptr(), stream };
+                         mem_lock<float> src{ weights_node_ptr->as<data>().get_attached_memory_ptr(), stream };
                          for (uint32_t i = 0; i < weights_layout.size.count(); i++)
                              weights_vec_float.push_back(src.data()[i]);
                      }
@@ -278,67 +247,61 @@ void pre_replace_deconv::run(program_impl& p) {
                          throw std::logic_error("Not supported data type.");
                      }
 
-                     auto data_node_weights_replace = std::make_shared<data>(weights_vec[0] + "_conv_rpl", data_to_allocate);
-                     p.get_or_create(data_node_weights_replace);
-                     auto data_node_weights_replace_node_ptr = p.nodes_map.find(weights_vec[0] + "_conv_rpl")->second;
-                     auto& data_node = data_node_weights_replace_node_ptr->as<data>();
+                     auto data_node_weights_replace = std::make_shared<data>(weight_replace_node_id, data_to_allocate);
+                     program_node& weights_replace_node = p.get_or_create(data_node_weights_replace);
+                     auto& data_node = weights_replace_node.as<data>();
                      data_node.set_output_layout(target_weights_layout, false);
                 }
-                float bias = 0;
-
-                if (bias_data_type == data_types::f16) {
-                    mem_lock<half_t> src{ bias_id_node_ptr->as<data>().get_attached_memory_ptr(), stream };
-                    bias = static_cast<float>(src.data()[0]);
-                } else {
-                    mem_lock<float> src{ bias_id_node_ptr->as<data>().get_attached_memory_ptr(), stream };
-                    bias = src.data()[0];
-                }
 
-                auto deconv_id_conv = deconv_id + "_conv";
+                auto deconv_id_conv = deconv_node_id + "_conv";
 
                 // create convolution primitive
                 auto conv_prim = std::make_shared<convolution>(deconv_id_conv,
-                    input_id,
-                    std::vector<primitive_id>{ weights_vec[0] + "_conv_rpl" },
-                    stride,
-                    input_offset,
-                    tensor{ 1, 1, 1, 1 },
-                    grouped_weights_shape,
-                    output_padding);
-                p.get_or_create(conv_prim);
-
-                auto conv_node_itr = p.nodes_map.find(deconv_id_conv);
-                if (conv_node_itr == p.nodes_map.end()) continue;
+                                                               input_node_id,
+                                                               std::vector<primitive_id>{ weight_replace_node_id },
+                                                               stride,
+                                                               input_offset,
+                                                               tensor{ 1, 1, 1, 1 },
+                                                               grouped_weights_shape,
+                                                               output_padding);
+                program_node& created_node = p.get_or_create(conv_prim);
 
-                auto conv_node_ptr = conv_node_itr->second;
-                auto conv_node = &conv_node_ptr->as<convolution>();
+                auto& conv_node = created_node.as<convolution>();
 
                 // add connections input->convolution, weights->convolution and bias->convolution
-                p.add_connection(input_node, *conv_node_ptr);
+                p.add_connection(input_node, conv_node);
 
                 {
-                    auto weights_node_conv_rpl_ptr = p.nodes_map.find(weights_vec[0] + "_conv_rpl")->second;
-                    p.add_connection(*weights_node_conv_rpl_ptr, *conv_node_ptr);
+                    auto weights_node_conv_rpl_ptr = p.nodes_map.find(weight_replace_node_id)->second;
+                    p.add_connection(*weights_node_conv_rpl_ptr, conv_node);
                     p.inputs.push_back(weights_node_conv_rpl_ptr.get());
                 }
 
-                auto pixel_shuffle_prim = std::make_shared<depth_to_space>(deconv_id, deconv_id_conv, 2, depth_to_space_mode::blocks_first);
+                float bias = 0;
+
+                if (bias_data_type == data_types::f16) {
+                    mem_lock<half_t> src{ bias_id_node_ptr->as<data>().get_attached_memory_ptr(), stream };
+                    bias = static_cast<float>(src.data()[0]);
+                } else {
+                    mem_lock<float> src{ bias_id_node_ptr->as<data>().get_attached_memory_ptr(), stream };
+                    bias = src.data()[0];
+                }
+                auto pixel_shuffle_prim = std::make_shared<depth_to_space>(deconv_node_id, deconv_id_conv, 2, depth_to_space_mode::blocks_first);
 
-                p.get_or_create(pixel_shuffle_prim);
-                auto pixel_shuffle_node_ptr = p.nodes_map.find(deconv_id)->second;
-                pixel_shuffle_node_ptr->add_fused_activation(activation_func::linear, { 1, bias });
+                program_node& pixel_shuffle_node = p.get_or_create(pixel_shuffle_prim);
+                pixel_shuffle_node.add_fused_activation(activation_func::linear, { 1, bias });
 
                 // add connections input->convolution, weights->convolution
-                p.add_connection(*conv_node_ptr, *pixel_shuffle_node_ptr);
+                p.add_connection(conv_node, pixel_shuffle_node);
 
                 auto deconv_node_ptr = p.nodes_map.find(rename_id);
                 if (deconv_node_ptr != p.nodes_map.end()) {
-                    p.replace_all_usages(*deconv_node_ptr->second, *pixel_shuffle_node_ptr);
+                    p.replace_all_usages(*deconv_node_ptr->second, pixel_shuffle_node);
                     p.optimized_out.push_back(rename_id);
                     p.nodes_map.erase(rename_id);
                 }
-                p.mark_if_data_flow(*conv_node);
-                conv_node->recalc_output_layout(true);
+                p.mark_if_data_flow(conv_node);
+                conv_node.recalc_output_layout(true);
 
                 update_processing_order = true;
             }
diff --git a/inference-engine/thirdparty/clDNN/src/program.cpp b/inference-engine/thirdparty/clDNN/src/program.cpp
index bd62de0435a1af..ca064db68b7bcb 100644
--- a/inference-engine/thirdparty/clDNN/src/program.cpp
+++ b/inference-engine/thirdparty/clDNN/src/program.cpp
@@ -834,13 +834,10 @@ void program_impl::swap_names(program_node& node1, program_node& node2) {
 }
 
 void program_impl::replace_all_usages(program_node& old_node, program_node& new_node) {
-    const std::list<program_node*> users(old_node.users);
-    auto itr = users.begin();
-    bool end = (itr == users.end());
-    while (!end) {
-        auto& usage = (*itr++);
-        end = (itr == users.end());
-        usage->replace_dependency(old_node, new_node);
+    auto itr = old_node.users.begin();
+    while (itr != old_node.users.end()) {
+        auto user = *(itr++);
+        user->replace_dependency(old_node, new_node);
     }
 }
 

From ea60879a8b2f24dc52276a04ef16f4a142ba8ddb Mon Sep 17 00:00:00 2001
From: Mikhail Nosov <mikhail.nosov@intel.com>
Date: Mon, 26 Jul 2021 10:12:26 +0300
Subject: [PATCH 61/71] PDPD: Install generated PDPD test models as 'test'
 component (#6783)

* Install generated PDPD test models as 'test' component

Needed when test package is installed on another machine which don't have generated models

To search installed models, 'FE_TEST_MODELS' env variable is introduced

* Clang fixes

* Fix PDPD_Places test from latest master
---
 .ci/azure/linux.yml                           |  4 ++-
 ngraph/test/CMakeLists.txt                    | 12 ++++++--
 .../test/frontend/paddlepaddle/basic_api.cpp  | 13 +++++----
 .../paddlepaddle/cut_specific_model.cpp       |  2 +-
 .../test/frontend/paddlepaddle/load_from.cpp  |  2 +-
 .../test/frontend/paddlepaddle/op_fuzzy.cpp   | 13 +++++----
 .../frontend/paddlepaddle/partial_shape.cpp   |  2 +-
 ngraph/test/frontend/paddlepaddle/places.cpp  | 29 ++++++++++---------
 .../paddlepaddle/set_element_type.cpp         |  2 +-
 ngraph/test/frontend/shared/include/utils.hpp | 23 +++++++++++++++
 ngraph/test/frontend/shared/src/basic_api.cpp |  2 +-
 .../shared/src/cut_specific_model.cpp         |  3 +-
 ngraph/test/frontend/shared/src/load_from.cpp | 24 +++++++++------
 ngraph/test/frontend/shared/src/op_fuzzy.cpp  |  2 +-
 .../frontend/shared/src/partial_shape.cpp     |  3 +-
 .../frontend/shared/src/set_element_type.cpp  |  3 +-
 16 files changed, 92 insertions(+), 47 deletions(-)

diff --git a/.ci/azure/linux.yml b/.ci/azure/linux.yml
index 52c8bbd384029e..f61bb85dfb1850 100644
--- a/.ci/azure/linux.yml
+++ b/.ci/azure/linux.yml
@@ -161,7 +161,9 @@ jobs:
     displayName: 'Model Optimizer UT'
     continueOnError: false
 
-  - script: . $(SETUPVARS) && $(INSTALL_TEST_DIR)/unit-test --gtest_print_time=1 --gtest_filter=-backend_api.config_unsupported:*IE_GPU* --gtest_output=xml:TEST-NGraphUT.xml
+  - script: |
+      export FE_TEST_MODELS=$(INSTALL_DIR)/tests
+      . $(SETUPVARS) && $(INSTALL_TEST_DIR)/unit-test --gtest_print_time=1 --gtest_filter=-backend_api.config_unsupported:*IE_GPU* --gtest_output=xml:TEST-NGraphUT.xml
     displayName: 'nGraph UT'
     continueOnError: false
 
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 998ff3617120bd..1ac0ef0f3458b5 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -550,6 +550,8 @@ file(GLOB FRONTEND_SHARED_TESTS_SRC ${CMAKE_CURRENT_SOURCE_DIR}/frontend/shared/
 file(GLOB FRONTEND_SHARED_TESTS_HDR ${CMAKE_CURRENT_SOURCE_DIR}/frontend/shared/include/*.hpp)
 set(SRC ${FRONTEND_SHARED_TESTS_SRC} ${SRC})
 
+add_definitions("-DTEST_MODEL_BUILD_DIR=\"${CMAKE_CURRENT_BINARY_DIR}\"")
+
 # ---- PaddlePaddle FrontEnd testing ------
 if (NGRAPH_PDPD_FRONTEND_ENABLE)
     ie_check_pip_package(paddlepaddle WARNING)
@@ -557,8 +559,9 @@ if (NGRAPH_PDPD_FRONTEND_ENABLE)
     if(paddlepaddle_FOUND)
         file(GLOB FRONTEND_PDPD_TESTS_SRC ${CMAKE_CURRENT_SOURCE_DIR}/frontend/paddlepaddle/*.cpp)
         set(SRC ${FRONTEND_PDPD_TESTS_SRC} ${SRC})
-        set(TEST_PDPD_MODELS ${CMAKE_CURRENT_BINARY_DIR}/pdpd_test_models/)
-        add_definitions("-DTEST_PDPD_MODELS=\"${TEST_PDPD_MODELS}\"")
+        set(PDPD_TEST_MODELS_DIRNAME pdpd_test_models)
+        set(TEST_PDPD_MODELS ${CMAKE_CURRENT_BINARY_DIR}/${PDPD_TEST_MODELS_DIRNAME}/)
+        add_definitions("-DTEST_PDPD_MODELS_DIRNAME=\"${PDPD_TEST_MODELS_DIRNAME}/\"")
     endif()
 endif()
 # ---- End PaddlePaddle FrontEnd testing ------
@@ -658,4 +661,9 @@ if (NGRAPH_PDPD_FRONTEND_ENABLE AND paddlepaddle_FOUND)
     add_custom_target(pdpd_test_models DEPENDS ${OUT_FILES})
     add_dependencies(unit-test pdpd_test_models)
     add_dependencies(unit-test paddlepaddle_ngraph_frontend)
+
+    install(DIRECTORY ${TEST_PDPD_MODELS}
+            DESTINATION tests/${PDPD_TEST_MODELS_DIRNAME}
+            COMPONENT tests
+            EXCLUDE_FROM_ALL)
 endif()
diff --git a/ngraph/test/frontend/paddlepaddle/basic_api.cpp b/ngraph/test/frontend/paddlepaddle/basic_api.cpp
index a2568000f3184f..72db04c2cdc689 100644
--- a/ngraph/test/frontend/paddlepaddle/basic_api.cpp
+++ b/ngraph/test/frontend/paddlepaddle/basic_api.cpp
@@ -20,9 +20,10 @@ static const std::vector<std::string> models{
     std::string("2in_2out_dynbatch/2in_2out_dynbatch.pdmodel"),
 };
 
-INSTANTIATE_TEST_SUITE_P(PDPDBasicTest,
-                         FrontEndBasicTest,
-                         ::testing::Combine(::testing::Values(PDPD),
-                                            ::testing::Values(std::string(TEST_PDPD_MODELS)),
-                                            ::testing::ValuesIn(models)),
-                         FrontEndBasicTest::getTestCaseName);
+INSTANTIATE_TEST_SUITE_P(
+    PDPDBasicTest,
+    FrontEndBasicTest,
+    ::testing::Combine(::testing::Values(PDPD),
+                       ::testing::Values(std::string(TEST_PDPD_MODELS_DIRNAME)),
+                       ::testing::ValuesIn(models)),
+    FrontEndBasicTest::getTestCaseName);
diff --git a/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp b/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp
index 04826bce96f4dd..2222861d823444 100644
--- a/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp
+++ b/ngraph/test/frontend/paddlepaddle/cut_specific_model.cpp
@@ -15,7 +15,7 @@ static CutModelParam getTestData_2in_2out()
 {
     CutModelParam res;
     res.m_frontEndName = PDPD;
-    res.m_modelsPath = std::string(TEST_PDPD_MODELS);
+    res.m_modelsPath = std::string(TEST_PDPD_MODELS_DIRNAME);
     res.m_modelName = "2in_2out/2in_2out.pdmodel";
     res.m_oldInputs = {"inputX1", "inputX2"};
     res.m_newInputs = {"add1.tmp_0"};
diff --git a/ngraph/test/frontend/paddlepaddle/load_from.cpp b/ngraph/test/frontend/paddlepaddle/load_from.cpp
index b8865b6df6eca1..e74aa451166905 100644
--- a/ngraph/test/frontend/paddlepaddle/load_from.cpp
+++ b/ngraph/test/frontend/paddlepaddle/load_from.cpp
@@ -15,7 +15,7 @@ static LoadFromFEParam getTestData()
 {
     LoadFromFEParam res;
     res.m_frontEndName = PDPD;
-    res.m_modelsPath = std::string(TEST_PDPD_MODELS);
+    res.m_modelsPath = std::string(TEST_PDPD_MODELS_DIRNAME);
     res.m_file = "conv2d";
     res.m_files = {"2in_2out/2in_2out.pdmodel", "2in_2out/2in_2out.pdiparams"};
     res.m_stream = "relu/relu.pdmodel";
diff --git a/ngraph/test/frontend/paddlepaddle/op_fuzzy.cpp b/ngraph/test/frontend/paddlepaddle/op_fuzzy.cpp
index dd01cc1e2aefbe..10929bb95bb085 100644
--- a/ngraph/test/frontend/paddlepaddle/op_fuzzy.cpp
+++ b/ngraph/test/frontend/paddlepaddle/op_fuzzy.cpp
@@ -32,9 +32,10 @@ static const std::vector<std::string> models{
     std::string("relu"),
 };
 
-INSTANTIATE_TEST_SUITE_P(PDPDFuzzyOpTest,
-                         FrontEndFuzzyOpTest,
-                         ::testing::Combine(::testing::Values(PDPD),
-                                            ::testing::Values(std::string(TEST_PDPD_MODELS)),
-                                            ::testing::ValuesIn(models)),
-                         PDPDFuzzyOpTest::getTestCaseName);
+INSTANTIATE_TEST_SUITE_P(
+    PDPDFuzzyOpTest,
+    FrontEndFuzzyOpTest,
+    ::testing::Combine(::testing::Values(PDPD),
+                       ::testing::Values(std::string(TEST_PDPD_MODELS_DIRNAME)),
+                       ::testing::ValuesIn(models)),
+    PDPDFuzzyOpTest::getTestCaseName);
diff --git a/ngraph/test/frontend/paddlepaddle/partial_shape.cpp b/ngraph/test/frontend/paddlepaddle/partial_shape.cpp
index 97989af8ca2ec0..13c6b819a5b17b 100644
--- a/ngraph/test/frontend/paddlepaddle/partial_shape.cpp
+++ b/ngraph/test/frontend/paddlepaddle/partial_shape.cpp
@@ -64,7 +64,7 @@ static PartShape getTestShape_conv2d_relu()
 INSTANTIATE_TEST_SUITE_P(PDPDPartialShapeTest,
                          FrontEndPartialShapeTest,
                          ::testing::Combine(::testing::Values(BaseFEParam{
-                                                PDPD, std::string(TEST_PDPD_MODELS)}),
+                                                PDPD, std::string(TEST_PDPD_MODELS_DIRNAME)}),
                                             ::testing::ValuesIn(std::vector<PartShape>{
                                                 getTestShape_2in_2out(),
                                                 getTestShape_conv2d_relu(),
diff --git a/ngraph/test/frontend/paddlepaddle/places.cpp b/ngraph/test/frontend/paddlepaddle/places.cpp
index a913353d0bec0a..e8d94042f4a419 100644
--- a/ngraph/test/frontend/paddlepaddle/places.cpp
+++ b/ngraph/test/frontend/paddlepaddle/places.cpp
@@ -9,7 +9,8 @@
 
 using namespace ngraph::frontend;
 
-const std::string model_file = "place_test_model/place_test_model.pdmodel";
+const std::string model_file =
+    std::string(TEST_PDPD_MODELS_DIRNAME) + "place_test_model/place_test_model.pdmodel";
 
 /***
 model:
@@ -57,7 +58,7 @@ TEST(PDPD_Places, check_tensor_names)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     for (const auto& tensor_name : tensor_names)
     {
@@ -71,7 +72,7 @@ TEST(PDPD_Places, check_input_outputs)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     auto inputs = input_model->get_inputs();
     auto outputs = input_model->get_outputs();
@@ -106,7 +107,7 @@ TEST(PDPD_Places, check_out_port_of_all_ops)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     for (const auto& tensor_name : tensor_names)
     {
@@ -129,7 +130,7 @@ TEST(PDPD_Places, check_in_out_ports_of_model_outputs)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     auto outputs = input_model->get_outputs();
     for (const auto& output : outputs)
@@ -164,7 +165,7 @@ TEST(PDPD_Places, check_source_target_tensors_of_model_outputs)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     auto outputs = input_model->get_outputs();
     for (const auto& output : outputs)
@@ -199,7 +200,7 @@ TEST(PDPD_Places, check_producing_consuming_ops_of_model_outputs)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     auto outputs = input_model->get_outputs();
     for (const auto& output : outputs)
@@ -235,7 +236,7 @@ TEST(PDPD_Places, check_data_flow)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     for (const auto& tensor_name : tensor_names)
     {
@@ -276,7 +277,7 @@ TEST(PDPD_Places, check_tensor_to_multiple_ports)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     for (const auto& tensor_name : tensor_names)
     {
@@ -308,7 +309,7 @@ TEST(PDPD_Places, check_consuming_ops)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     for (const auto& tensor_name : tensor_names)
     {
@@ -353,7 +354,7 @@ TEST(PDPD_Places, check_consuming_ops_2)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     auto it = find(tensor_names.begin(), tensor_names.end(), "lstm_0.tmp_2");
     EXPECT_NE(it, tensor_names.end());
@@ -395,7 +396,7 @@ TEST(PDPD_Places, check_producing_ops)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     for (const auto& tensor_name : tensor_names)
     {
@@ -419,7 +420,7 @@ TEST(PDPD_Places, check_input_output_ports_dy_idx)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     std::vector<std::string> output_names = {"save_infer_model/scale_0.tmp_1",
                                              "save_infer_model/scale_1.tmp_1",
@@ -446,7 +447,7 @@ TEST(PDPD_Places, check_ops_tensors_by_idx)
     FrontEndTestUtils::setupTestEnv();
     auto m_fem = FrontEndManager();
     auto frontend = m_fem.load_by_framework("pdpd");
-    auto input_model = frontend->load(TEST_PDPD_MODELS + model_file);
+    auto input_model = frontend->load(FrontEndTestUtils::make_model_path(model_file));
 
     std::vector<std::string> output_names = {"save_infer_model/scale_0.tmp_1",
                                              "save_infer_model/scale_1.tmp_1",
diff --git a/ngraph/test/frontend/paddlepaddle/set_element_type.cpp b/ngraph/test/frontend/paddlepaddle/set_element_type.cpp
index 10781a0abe6eb5..1c25018b94be62 100644
--- a/ngraph/test/frontend/paddlepaddle/set_element_type.cpp
+++ b/ngraph/test/frontend/paddlepaddle/set_element_type.cpp
@@ -15,7 +15,7 @@ static SetTypeFEParam getTestData_relu()
 {
     SetTypeFEParam res;
     res.m_frontEndName = PDPD;
-    res.m_modelsPath = std::string(TEST_PDPD_MODELS);
+    res.m_modelsPath = std::string(TEST_PDPD_MODELS_DIRNAME);
     res.m_modelName = "relu/relu.pdmodel";
     return res;
 }
diff --git a/ngraph/test/frontend/shared/include/utils.hpp b/ngraph/test/frontend/shared/include/utils.hpp
index 44f2f52ade5fa1..1b373d747d34fd 100644
--- a/ngraph/test/frontend/shared/include/utils.hpp
+++ b/ngraph/test/frontend/shared/include/utils.hpp
@@ -4,8 +4,10 @@
 
 #pragma once
 
+#include <fstream>
 #include <string>
 #include "backend.hpp"
+#include "ngraph/env_util.hpp"
 #include "ngraph/file_util.hpp"
 
 // Helper functions
@@ -46,4 +48,25 @@ namespace FrontEndTestUtils
             ngraph::runtime::Backend::get_backend_shared_library_search_directory());
         set_test_env("OV_FRONTEND_PATH", fePath.c_str());
     }
+
+    inline bool exists(const std::string& file)
+    {
+        std::ifstream str(file, std::ios::in | std::ifstream::binary);
+        return str.is_open();
+    }
+
+    inline std::string make_model_path(const std::string& modelsRelativePath)
+    {
+        // First try build path
+        auto res = std::string(TEST_MODEL_BUILD_DIR) + "/" + modelsRelativePath;
+        if (exists(res))
+        {
+            return res;
+        }
+        else
+        {
+            // Install case: if model file does not exist, use base path from env variable
+            return std::string(ngraph::getenv_string("FE_TEST_MODELS")) + "/" + modelsRelativePath;
+        }
+    }
 } // namespace FrontEndTestUtils
\ No newline at end of file
diff --git a/ngraph/test/frontend/shared/src/basic_api.cpp b/ngraph/test/frontend/shared/src/basic_api.cpp
index e316486e70228e..8fc3c57ab2d3f5 100644
--- a/ngraph/test/frontend/shared/src/basic_api.cpp
+++ b/ngraph/test/frontend/shared/src/basic_api.cpp
@@ -25,7 +25,7 @@ void FrontEndBasicTest::SetUp()
 void FrontEndBasicTest::initParamTest()
 {
     std::tie(m_feName, m_pathToModels, m_modelFile) = GetParam();
-    m_modelFile = m_pathToModels + m_modelFile;
+    m_modelFile = FrontEndTestUtils::make_model_path(m_pathToModels + m_modelFile);
 }
 
 void FrontEndBasicTest::doLoadFromFile()
diff --git a/ngraph/test/frontend/shared/src/cut_specific_model.cpp b/ngraph/test/frontend/shared/src/cut_specific_model.cpp
index c784745900330b..5edf87fae6571f 100644
--- a/ngraph/test/frontend/shared/src/cut_specific_model.cpp
+++ b/ngraph/test/frontend/shared/src/cut_specific_model.cpp
@@ -34,7 +34,8 @@ void FrontEndCutModelTest::SetUp()
 void FrontEndCutModelTest::initParamTest()
 {
     m_param = GetParam();
-    m_param.m_modelName = m_param.m_modelsPath + m_param.m_modelName;
+    m_param.m_modelName =
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_modelName);
 }
 
 void FrontEndCutModelTest::doLoadFromFile()
diff --git a/ngraph/test/frontend/shared/src/load_from.cpp b/ngraph/test/frontend/shared/src/load_from.cpp
index d7a7e666b69999..67c2b0888f3a44 100644
--- a/ngraph/test/frontend/shared/src/load_from.cpp
+++ b/ngraph/test/frontend/shared/src/load_from.cpp
@@ -27,7 +27,8 @@ void FrontEndLoadFromTest::SetUp()
 
 TEST_P(FrontEndLoadFromTest, testLoadFromFilePath)
 {
-    std::string model_path = m_param.m_modelsPath + m_param.m_file;
+    std::string model_path =
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_file);
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
@@ -44,8 +45,10 @@ TEST_P(FrontEndLoadFromTest, testLoadFromFilePath)
 
 TEST_P(FrontEndLoadFromTest, testLoadFromTwoFiles)
 {
-    std::string model_path = m_param.m_modelsPath + m_param.m_files[0];
-    std::string weights_path = m_param.m_modelsPath + m_param.m_files[1];
+    std::string model_path =
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_files[0]);
+    std::string weights_path =
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_files[1]);
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
     ASSERT_NO_THROW(frontends = m_fem.get_available_front_ends());
@@ -62,8 +65,9 @@ TEST_P(FrontEndLoadFromTest, testLoadFromTwoFiles)
 
 TEST_P(FrontEndLoadFromTest, testLoadFromStream)
 {
-    auto ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_stream,
-                                               std::ios::in | std::ifstream::binary);
+    auto ifs = std::make_shared<std::ifstream>(
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_stream),
+        std::ios::in | std::ifstream::binary);
     auto is = std::dynamic_pointer_cast<std::istream>(ifs);
     std::vector<std::string> frontends;
     FrontEnd::Ptr fe;
@@ -81,10 +85,12 @@ TEST_P(FrontEndLoadFromTest, testLoadFromStream)
 
 TEST_P(FrontEndLoadFromTest, testLoadFromTwoStreams)
 {
-    auto model_ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_streams[0],
-                                                     std::ios::in | std::ifstream::binary);
-    auto weights_ifs = std::make_shared<std::ifstream>(m_param.m_modelsPath + m_param.m_streams[1],
-                                                       std::ios::in | std::ifstream::binary);
+    auto model_ifs = std::make_shared<std::ifstream>(
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_streams[0]),
+        std::ios::in | std::ifstream::binary);
+    auto weights_ifs = std::make_shared<std::ifstream>(
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_streams[1]),
+        std::ios::in | std::ifstream::binary);
     auto model_is = std::dynamic_pointer_cast<std::istream>(model_ifs);
     auto weights_is = std::dynamic_pointer_cast<std::istream>(weights_ifs);
 
diff --git a/ngraph/test/frontend/shared/src/op_fuzzy.cpp b/ngraph/test/frontend/shared/src/op_fuzzy.cpp
index b43dd2946363a8..50a973cd9eee2d 100644
--- a/ngraph/test/frontend/shared/src/op_fuzzy.cpp
+++ b/ngraph/test/frontend/shared/src/op_fuzzy.cpp
@@ -35,7 +35,7 @@ void FrontEndFuzzyOpTest::SetUp()
 void FrontEndFuzzyOpTest::initParamTest()
 {
     std::tie(m_feName, m_pathToModels, m_modelFile) = GetParam();
-    m_modelFile = m_pathToModels + m_modelFile;
+    m_modelFile = FrontEndTestUtils::make_model_path(m_pathToModels + m_modelFile);
 }
 
 void FrontEndFuzzyOpTest::doLoadFromFile()
diff --git a/ngraph/test/frontend/shared/src/partial_shape.cpp b/ngraph/test/frontend/shared/src/partial_shape.cpp
index bfb63528f3fe85..a35c54680e5294 100644
--- a/ngraph/test/frontend/shared/src/partial_shape.cpp
+++ b/ngraph/test/frontend/shared/src/partial_shape.cpp
@@ -32,7 +32,8 @@ void FrontEndPartialShapeTest::SetUp()
 void FrontEndPartialShapeTest::initParamTest()
 {
     std::tie(m_baseParam, m_partShape) = GetParam();
-    m_partShape.m_modelName = m_baseParam.m_modelsPath + m_partShape.m_modelName;
+    m_partShape.m_modelName =
+        FrontEndTestUtils::make_model_path(m_baseParam.m_modelsPath + m_partShape.m_modelName);
 }
 
 void FrontEndPartialShapeTest::doLoadFromFile()
diff --git a/ngraph/test/frontend/shared/src/set_element_type.cpp b/ngraph/test/frontend/shared/src/set_element_type.cpp
index 647087d611994d..5cfbdce990b4d9 100644
--- a/ngraph/test/frontend/shared/src/set_element_type.cpp
+++ b/ngraph/test/frontend/shared/src/set_element_type.cpp
@@ -25,7 +25,8 @@ void FrontEndElementTypeTest::SetUp()
 void FrontEndElementTypeTest::initParamTest()
 {
     m_param = GetParam();
-    m_param.m_modelName = m_param.m_modelsPath + m_param.m_modelName;
+    m_param.m_modelName =
+        FrontEndTestUtils::make_model_path(m_param.m_modelsPath + m_param.m_modelName);
 }
 
 void FrontEndElementTypeTest::doLoadFromFile()

From 16d0c28314c103672f09ab0e6b0e749e191a4cbf Mon Sep 17 00:00:00 2001
From: iliya mironov <iliya.mironov@intel.com>
Date: Mon, 26 Jul 2021 11:39:44 +0300
Subject: [PATCH 62/71] Add check if fastjsonschema installed (#6775)

---
 .../mo/utils/custom_replacement_config.py           | 13 +++++++++----
 1 file changed, 9 insertions(+), 4 deletions(-)

diff --git a/model-optimizer/mo/utils/custom_replacement_config.py b/model-optimizer/mo/utils/custom_replacement_config.py
index 47176e36e4ac18..f36c21c3dd2756 100644
--- a/model-optimizer/mo/utils/custom_replacement_config.py
+++ b/model-optimizer/mo/utils/custom_replacement_config.py
@@ -1,7 +1,6 @@
 # Copyright (C) 2018-2021 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 
-import fastjsonschema as json_validate
 import json
 import logging as log
 import os
@@ -399,12 +398,18 @@ def load_and_validate_json_config(config_file_name: str):
     :param config_file_name: name of the file to read from.
     :return: A dictionary serialized from json config file.
     """
-
     try:
         with open(config_file_name, 'r') as f:
             json_config = json.load(f)
-            validator = json_validate.compile(schema_dict)
-            validator(json_config)
+            try:
+                import fastjsonschema as json_validate
+
+                validator = json_validate.compile(schema_dict)
+                validator(json_config)
+            except ModuleNotFoundError as e:
+                log.error("Module 'fastjsonschema' for json validation not installed. Please update requirements.",
+                          extra={'is_warning': True})
+
     except Exception as e:
         raise Error("Failed to parse custom replacements configuration file '{}': {}. ".format(config_file_name, e) +
                     refer_to_faq_msg(70)) from e

From feb1eaef051f63c6467defdd4181b4e6de551691 Mon Sep 17 00:00:00 2001
From: Andrey Somsikov <andrey.somsikov@intel.com>
Date: Mon, 26 Jul 2021 11:54:39 +0300
Subject: [PATCH 63/71] Fix file handle leak in cnpy (#6380)

* Fix file handle leak in cnpy


Co-authored-by: Roman Donchenko <roman.donchenko@intel.com>
---
 thirdparty/cnpy/cnpy.cpp | 34 +++++++++++++++++++++-------------
 1 file changed, 21 insertions(+), 13 deletions(-)

diff --git a/thirdparty/cnpy/cnpy.cpp b/thirdparty/cnpy/cnpy.cpp
index ed277deb5fec23..ea89bea9c088b2 100644
--- a/thirdparty/cnpy/cnpy.cpp
+++ b/thirdparty/cnpy/cnpy.cpp
@@ -12,6 +12,10 @@
 #include<stdexcept>
 #include <regex>
 
+#define assert_throw(expression)         \
+    if (!(expression))                   \
+        throw std::runtime_error(#expression)
+
 char cnpy::BigEndianTest() {
     int x = 1;
     return (((char *)&x)[0]) ? '<' : '>';
@@ -93,10 +97,10 @@ void cnpy::parse_npy_header(unsigned char* buffer,size_t& word_size, std::vector
     bool littleEndian = false;
     if (loc1 < header.size())
         littleEndian = (header[loc1] == '<' || header[loc1] == '|' ? true : false);
-    assert(littleEndian);
+    assert_throw(littleEndian);
 
     //char type = header[loc1+1];
-    //assert(type == map_type(T));
+    //assert_throw(type == map_type(T));
 
     std::string str_ws = header.substr(loc1+2);
     loc2 = str_ws.find("'");
@@ -116,7 +120,7 @@ void cnpy::parse_npy_header(FILE* fp, size_t& word_size, std::vector<size_t>& sh
     else {
         header = "";
     }
-    assert(header[header.size()-1] == '\n');
+    assert_throw(header[header.size()-1] == '\n');
 
     size_t loc1, loc2;
 
@@ -153,10 +157,10 @@ void cnpy::parse_npy_header(FILE* fp, size_t& word_size, std::vector<size_t>& sh
     bool littleEndian = false;
     if (loc1 < header.size())
         littleEndian = (header[loc1] == '<' || header[loc1] == '|' ? true : false);
-    assert(littleEndian);
+    assert_throw(littleEndian);
 
     //char type = header[loc1+1];
-    //assert(type == map_type(T));
+    //assert_throw(type == map_type(T));
 
     std::string str_ws = header.substr(loc1+2);
     loc2 = str_ws.find("'");
@@ -180,10 +184,10 @@ void cnpy::parse_zip_footer(FILE* fp, uint16_t& nrecs, size_t& global_header_siz
     global_header_offset = *(uint32_t*) &footer[16];
     comment_len = *(uint16_t*) &footer[20];
 
-    assert(disk_no == 0);
-    assert(disk_start == 0);
-    assert(nrecs_on_disk == nrecs);
-    assert(comment_len == 0);
+    assert_throw(disk_no == 0);
+    assert_throw(disk_start == 0);
+    assert_throw(nrecs_on_disk == nrecs);
+    assert_throw(comment_len == 0);
 }
 
 cnpy::NpyArray load_the_npy_file(FILE* fp) {
@@ -356,11 +360,15 @@ cnpy::NpyArray cnpy::npy_load(std::string fname) {
 
     if(!fp) throw std::runtime_error("npy_load: Unable to open file "+fname);
 
-    NpyArray arr = load_the_npy_file(fp);
+    try {
+        NpyArray arr = load_the_npy_file(fp);
+        fclose(fp);
+        return arr;
+    } catch (...) {
+        fclose(fp);
+        throw;
+    }
 
-    fclose(fp);
-    return arr;
 }
 
 
-

From b907c3b84f1dbe9beecf777b14fc97e428819320 Mon Sep 17 00:00:00 2001
From: Evgenya Stepyreva <evgenya.stepyreva@intel.com>
Date: Mon, 26 Jul 2021 12:00:13 +0300
Subject: [PATCH 64/71] set_output_type speedup (#6754)

* set_output_type speedup

* style

* Final optimization

* Removed extra include, removed unnecessary lock_guard

* Typo

* Apply suggestions from code review

Co-authored-by: Mikhail Nosov <mikhail.nosov@intel.com>

* Update ngraph/core/include/ngraph/descriptor/tensor.hpp

Co-authored-by: Mikhail Nosov <mikhail.nosov@intel.com>

Co-authored-by: Mikhail Nosov <mikhail.nosov@intel.com>
---
 .../core/include/ngraph/descriptor/tensor.hpp | 26 +++++++++++++------
 ngraph/core/src/descriptor/tensor.cpp         | 25 +++++++++---------
 ngraph/core/src/node.cpp                      |  2 +-
 3 files changed, 31 insertions(+), 22 deletions(-)

diff --git a/ngraph/core/include/ngraph/descriptor/tensor.hpp b/ngraph/core/include/ngraph/descriptor/tensor.hpp
index 381e528e531858..4dc14e57068e38 100644
--- a/ngraph/core/include/ngraph/descriptor/tensor.hpp
+++ b/ngraph/core/include/ngraph/descriptor/tensor.hpp
@@ -4,7 +4,9 @@
 
 #pragma once
 
+#include <atomic>
 #include <memory>
+#include <mutex>
 #include <string>
 #include <unordered_set>
 
@@ -74,16 +76,24 @@ namespace ngraph
         protected:
             element::Type m_element_type;
 
-            // TODO(amprocte): For now we are maintaining both m_shape and m_partial_shape fields,
-            //    with m_shape possibly being invalid (get_shape will throw an exception if it
-            //    is). This is because get_shape() returns a const reference. I think ideally we
-            //    should refactor so that get_shape returns by value.
-            Shape m_shape;
+            // TODO: remove along with get_shape
+            // Initially there was ngraph::Shape m_shape only available to keep shape information.
+            // Support for dynamic shapes required transition to ngraph::PartialShape.
+            // To smoothly transition to ngraph::PartialShape we introduced m_partial_shape
+            // and kept m_shape in sync with m_partial_shape. Synchronization point was placed
+            // in set_partial_shape which dramatically affected performance of ngraph::Function
+            // validation. Since we have started the transition to ngraph::PartialShape and reduced
+            // ngraph::Shape usage the only user of m_shape was get_shape method with signature:
+            // const Shape& descriptor::Tensor::get_shape() const
+            // It was decided to move m_shape and m_partial_shape synchronization point there and
+            // to keep methods signature backward compatible.
+            mutable std::mutex shape_mutex;
+            mutable std::atomic_bool m_shape_changed;
+            mutable Shape m_shape;
+            // TODO: end
+
             PartialShape m_partial_shape;
-            Node* m_node{nullptr};
             HostTensorPtr m_lower_value, m_upper_value;
-            size_t m_node_output_number{0};
-
             std::string m_name;
             std::unordered_set<std::string> m_names;
         };
diff --git a/ngraph/core/src/descriptor/tensor.cpp b/ngraph/core/src/descriptor/tensor.cpp
index 1d8335fee080dc..f1da2fbdd52c79 100644
--- a/ngraph/core/src/descriptor/tensor.cpp
+++ b/ngraph/core/src/descriptor/tensor.cpp
@@ -4,7 +4,6 @@
 
 #include "ngraph/descriptor/tensor.hpp"
 #include "ngraph/node.hpp"
-#include "ngraph/runtime/host_tensor.hpp"
 
 using namespace ngraph;
 using namespace std;
@@ -13,9 +12,9 @@ descriptor::Tensor::Tensor(const element::Type& element_type,
                            const PartialShape& pshape,
                            const std::string& name)
     : m_element_type(element_type)
-    , m_shape(pshape.is_static() ? pshape.to_shape() : Shape{})
     , m_partial_shape(pshape)
     , m_name(name)
+    , m_shape_changed(true)
 {
 }
 
@@ -24,10 +23,8 @@ descriptor::Tensor::Tensor(const element::Type& element_type,
                            Node* node,
                            size_t node_output_number)
     : m_element_type(element_type)
-    , m_shape(pshape.is_static() ? pshape.to_shape() : Shape{})
     , m_partial_shape(pshape)
-    , m_node(node)
-    , m_node_output_number(node_output_number)
+    , m_shape_changed(true)
 {
 }
 
@@ -46,14 +43,7 @@ void descriptor::Tensor::set_element_type(const element::Type& element_type)
 void descriptor::Tensor::set_partial_shape(const PartialShape& partial_shape)
 {
     m_partial_shape = partial_shape;
-    if (m_partial_shape.is_static())
-    {
-        m_shape = m_partial_shape.to_shape();
-    }
-    else
-    {
-        m_shape = Shape{};
-    }
+    m_shape_changed = true;
 }
 
 void descriptor::Tensor::invalidate_values()
@@ -82,6 +72,15 @@ const Shape& descriptor::Tensor::get_shape() const
 {
     if (m_partial_shape.is_static())
     {
+        if (m_shape_changed.load(std::memory_order_relaxed))
+        {
+            std::lock_guard<std::mutex> guard(shape_mutex);
+            if (m_shape_changed) // double check after mutex lock
+            {
+                m_shape = m_partial_shape.to_shape();
+                m_shape_changed = false;
+            }
+        }
         return m_shape;
     }
     else
diff --git a/ngraph/core/src/node.cpp b/ngraph/core/src/node.cpp
index 8d23c8f65bbb7e..d600333e900c71 100644
--- a/ngraph/core/src/node.cpp
+++ b/ngraph/core/src/node.cpp
@@ -210,7 +210,7 @@ descriptor::Output& Node::get_output_descriptor(size_t position)
             make_shared<descriptor::Tensor>(element::dynamic, PartialShape::dynamic(), this, i);
         m_outputs.emplace_back(this, i, tensor_descriptor);
     }
-    return m_outputs.at(position);
+    return m_outputs[position];
 }
 
 void Node::set_argument(size_t position, const Output<Node>& argument)

From 83a3e083a173734a083b7fa30432cec9c63e7b55 Mon Sep 17 00:00:00 2001
From: Gleb Kazantaev <gleb.kazantaev@intel.com>
Date: Mon, 26 Jul 2021 12:33:23 +0300
Subject: [PATCH 65/71] Add more passes to the MOC backend (#6749)

---
 .../src/moc_transformations.cpp                | 18 ++++++++++++++++++
 1 file changed, 18 insertions(+)

diff --git a/inference-engine/src/offline_transformations/src/moc_transformations.cpp b/inference-engine/src/offline_transformations/src/moc_transformations.cpp
index 0b7d66f3743080..71e877bca3e843 100644
--- a/inference-engine/src/offline_transformations/src/moc_transformations.cpp
+++ b/inference-engine/src/offline_transformations/src/moc_transformations.cpp
@@ -18,6 +18,13 @@
 #include <transformations/common_optimizations/convert_quantize_dequantize.hpp>
 #include <transformations/common_optimizations/pad_fusion.hpp>
 #include <transformations/common_optimizations/simplify_shape_of_sub_graph.hpp>
+#include <transformations/op_conversions/convert_scatter_elements_to_scatter.hpp>
+#include <transformations/common_optimizations/clamp_fusion.hpp>
+#include <transformations/common_optimizations/mvn_fusion.hpp>
+#include <transformations/common_optimizations/dilated_convolution_converter.hpp>
+#include <transformations/common_optimizations/binarize_weights.hpp>
+#include <transformations/common_optimizations/conv_to_binary_conv.hpp>
+#include <transformations/common_optimizations/eliminate_unsqueeze_gather.hpp>
 
 NGRAPH_RTTI_DEFINITION(ngraph::pass::MOCTransformations, "MOCTransformations", 0);
 
@@ -38,16 +45,27 @@ bool ngraph::pass::MOCTransformations::run_on_function(std::shared_ptr<ngraph::F
     manager.register_pass<ngraph::pass::ConvertQuantizeDequantize>();
     manager.register_pass<ngraph::pass::SimplifyShapeOfSubGraph>();
 
+    auto eliminations = manager.register_pass<ngraph::pass::GraphRewrite>();
+    eliminations->add_matcher<ngraph::pass::EliminateUnsqueezeGather>();
+    eliminations->set_name("ngraph::pass::CommonEliminations");
+
     auto common_fusions = manager.register_pass<ngraph::pass::GraphRewrite>();
+    common_fusions->add_matcher<ngraph::pass::ConvertScatterElementsToScatter>();
     common_fusions->add_matcher<ngraph::pass::SoftPlusFusion>();
     common_fusions->add_matcher<ngraph::pass::SoftPlusToMishFusion>();
     common_fusions->add_matcher<ngraph::pass::SwishFusion>();
     common_fusions->add_matcher<ngraph::pass::HSwishFusion>();
     common_fusions->add_matcher<ngraph::pass::HSigmoidFusion>();
+    common_fusions->add_matcher<ngraph::pass::ClampFusion>();
     common_fusions->add_matcher<ngraph::pass::PadFusion>();
+    common_fusions->add_matcher<ngraph::pass::MVNFusion>();
+    common_fusions->add_matcher<ngraph::pass::DilatedConvolutionConverter>();
     common_fusions->add_matcher<ngraph::pass::GeluFusion>();
     common_fusions->set_name("ngraph::pass::CommonFusions");
 
+    manager.register_pass<ngraph::pass::BinarizeWeights>();
+    manager.register_pass<ngraph::pass::ConvToBinaryConv>();
+
     manager.run_passes(f);
 
     // Restore original shapes to the nGraph Function

From 37c619b0b82b93b9fcc08857fa4afd65fc9c129b Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Mon, 26 Jul 2021 12:42:05 +0300
Subject: [PATCH 66/71] Fixed compilation with Intel compiler (#6788)

* Fixed compilation with Intel compiler

* Fixed template containers for VPU

* Fixe one-dnn

* Updated submodule
---
 .../compile_flags/os_flags.cmake              | 36 +++++++++++-----
 docs/template_extension/cpu_kernel.cpp        |  1 +
 docs/template_extension/fft_kernel.cpp        |  1 +
 inference-engine/cmake/ie_parallel.cmake      |  3 ++
 .../ie_bridges/python/CMakeLists.txt          |  7 ++++
 .../openvino/inference_engine/CMakeLists.txt  |  4 +-
 .../offline_transformations/CMakeLists.txt    |  2 +
 .../src/openvino/test_utils/CMakeLists.txt    |  2 +
 inference-engine/samples/CMakeLists.txt       |  8 ++--
 .../src/gna_plugin/backend/dnn_types.h        |  4 +-
 .../gna_plugin/backend/gna_limitations.hpp    |  2 +
 .../hetero_plugin/hetero_infer_request.cpp    |  2 +-
 .../src/inference_engine/CMakeLists.txt       | 11 +++--
 .../inference_engine/cpp/ie_infer_request.cpp |  4 +-
 .../src/inference_engine/ie_core.cpp          |  2 +-
 .../rt_info/intervals_alignment_attribute.cpp |  4 +-
 .../ie_preprocess_gapi_kernels.hpp            |  2 +-
 .../src/transformations/serialize.cpp         |  2 +-
 .../src/vpu/common/CMakeLists.txt             |  2 +-
 .../common/include/vpu/utils/containers.hpp   | 21 +++++++---
 .../options/tiling_cmx_limit_kb.cpp           |  4 +-
 .../src/vpu/graph_transformer/CMakeLists.txt  |  2 +-
 .../src/vpu/myriad_plugin/CMakeLists.txt      |  2 +-
 .../inference_engine/CMakeLists.txt           |  2 +-
 inference-engine/thirdparty/CMakeLists.txt    | 10 +++--
 .../fully_connected_kernel_bf_tiled.cpp       |  4 --
 .../gather/gather_nd_kernel_ref.cpp           |  8 ----
 .../scatter_elements_update_kernel_ref.cpp    |  8 ----
 .../scatter_nd_update_kernel_ref.cpp          |  8 ----
 .../clDNN/runtime/kernels_cache.cpp           |  4 +-
 inference-engine/thirdparty/mkl-dnn           |  2 +-
 .../movidius/XLink/pc/protocols/pcie_host.c   |  9 ----
 .../tools/compile_tool/CMakeLists.txt         |  6 +--
 .../tools/vpu/vpu_compile/CMakeLists.txt      |  6 +--
 .../tools/vpu/vpu_perfcheck/CMakeLists.txt    |  2 +-
 .../ngraph/runtime/reference/convolution.hpp  |  2 +-
 .../reference/convolution_backprop_data.hpp   | 17 ++++----
 .../runtime/reference/ctc_greedy_decoder.hpp  |  2 +-
 .../ngraph/runtime/reference/proposal.hpp     |  2 +-
 .../onnx/onnx_import/src/core/graph.cpp       |  2 +-
 ngraph/test/visitors/user_op.cpp              |  2 +-
 .../conditional_compilation/CMakeLists.txt    |  2 +-
 openvino/itt/CMakeLists.txt                   |  6 +--
 thirdparty/CMakeLists.txt                     | 42 ++++++++++---------
 thirdparty/ocv/opencv_hal_avx512.hpp          |  2 +-
 thirdparty/onnx/CMakeLists.txt                |  8 +---
 thirdparty/protobuf/CMakeLists.txt            | 27 ++++++------
 thirdparty/zlib/CMakeLists.txt                | 17 ++++----
 48 files changed, 164 insertions(+), 164 deletions(-)

diff --git a/cmake/developer_package/compile_flags/os_flags.cmake b/cmake/developer_package/compile_flags/os_flags.cmake
index 868c3455d5daea..0fdbf79e9ec7f2 100644
--- a/cmake/developer_package/compile_flags/os_flags.cmake
+++ b/cmake/developer_package/compile_flags/os_flags.cmake
@@ -68,13 +68,13 @@ function(ie_sse42_optimization_flags flags)
         if(CMAKE_CXX_COMPILER_ID STREQUAL "MSVC")
             # No such option for MSVC 2019
         elseif(CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
-            set(${flags} /arch:SSE4.2 /QxSSE4.2 PARENT_SCOPE)
+            set(${flags} /QxSSE4.2 PARENT_SCOPE)
         else()
             message(WARNING "Unsupported CXX compiler ${CMAKE_CXX_COMPILER_ID}")
         endif()
     else()
         if(CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
-            set(${flags} -msse4.2 -xSSE4.2 PARENT_SCOPE)
+            set(${flags} -xSSE4.2 PARENT_SCOPE)
         else()
             set(${flags} -msse4.2 PARENT_SCOPE)
         endif()
@@ -95,7 +95,7 @@ function(ie_avx2_optimization_flags flags)
         endif()
     else()
         if(CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
-            set(${flags} -march=core-avx2 -xCORE-AVX2 -mtune=core-avx2 PARENT_SCOPE)
+            set(${flags} -xCORE-AVX2 PARENT_SCOPE)
         else()
             set(${flags} -mavx2 -mfma PARENT_SCOPE)
         endif()
@@ -152,6 +152,24 @@ function(ie_arm_neon_optimization_flags flags)
     endif()
 endfunction()
 
+#
+# Disables all warnings for 3rd party targets
+#
+function(ov_disable_all_warnings)
+    foreach(target IN LISTS ARGN)
+        if(CMAKE_CXX_COMPILER_ID STREQUAL "MSVC")
+            target_compile_options(${target} PRIVATE /WX-)
+        elseif(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
+            target_compile_options(${target} PRIVATE -w)
+        elseif(UNIX AND CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+            # 193: zero used for undefined preprocessing identifier "XXX"
+            # 1011: missing return statement at end of non-void function "XXX"
+            # 2415: variable "xxx" of static storage duration was declared but never referenced
+            target_compile_options(${target} PRIVATE -diag-disable=warn,193,1011,2415)
+        endif()
+    endforeach()
+endfunction()
+
 #
 # Enables Link Time Optimization compilation
 #
@@ -286,15 +304,12 @@ else()
     ie_add_compiler_flags(-Wreturn-type)
     ie_add_compiler_flags(-Wunused-variable)
 
-    # Disable noisy warnings
-
     if (CMAKE_CXX_COMPILER_ID STREQUAL "AppleClang")
         ie_add_compiler_flags(-Wswitch)
     elseif(UNIX)
         ie_add_compiler_flags(-Wuninitialized -Winit-self)
         if(CMAKE_CXX_COMPILER_ID STREQUAL "Clang")
-            ie_add_compiler_flags(-Wno-error=switch
-                                  -Winconsistent-missing-override)
+            ie_add_compiler_flags(-Winconsistent-missing-override)
         else()
             ie_add_compiler_flags(-Wmaybe-uninitialized)
             check_cxx_compiler_flag("-Wsuggest-override" SUGGEST_OVERRIDE_SUPPORTED)
@@ -304,10 +319,11 @@ else()
         endif()
     endif()
 
+    # Disable noisy warnings
+
     if(CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
-        ie_add_compiler_flags(-diag-disable=remark)
-        # noisy warnings from Intel Compiler 19.1.1.217 20200306
-        ie_add_compiler_flags(-diag-disable=2196)
+        # 177: function "XXX" was declared but never referenced
+        ie_add_compiler_flags(-diag-disable=remark,177,2196)
     endif()
 
     # Linker flags
diff --git a/docs/template_extension/cpu_kernel.cpp b/docs/template_extension/cpu_kernel.cpp
index aa2486589cbff2..b1d426b15825ce 100644
--- a/docs/template_extension/cpu_kernel.cpp
+++ b/docs/template_extension/cpu_kernel.cpp
@@ -102,6 +102,7 @@ InferenceEngine::StatusCode OpImplementation::init(InferenceEngine::LayerConfig&
             IE_THROW() << "Operation supports only FP32 precisions!";
         }
     } catch (InferenceEngine::Exception& ex) {
+        error = ex.what();
         if (resp) {
             strncpy(resp->msg, error.c_str(), sizeof(resp->msg) - 1);
             resp->msg[sizeof(resp->msg) - 1] = 0;
diff --git a/docs/template_extension/fft_kernel.cpp b/docs/template_extension/fft_kernel.cpp
index 12554a70c75406..3fcf71a8f641b1 100644
--- a/docs/template_extension/fft_kernel.cpp
+++ b/docs/template_extension/fft_kernel.cpp
@@ -66,6 +66,7 @@ InferenceEngine::StatusCode FFTImpl::init(InferenceEngine::LayerConfig& config,
             IE_THROW() << "Operation supports only FP32 precisions!";
         }
     } catch (InferenceEngine::Exception& ex) {
+        error = ex.what();
         if (resp) {
             strncpy(resp->msg, error.c_str(), sizeof(resp->msg) - 1);
             resp->msg[sizeof(resp->msg) - 1] = 0;
diff --git a/inference-engine/cmake/ie_parallel.cmake b/inference-engine/cmake/ie_parallel.cmake
index d33a73a5fa760d..eb844d25b76e02 100644
--- a/inference-engine/cmake/ie_parallel.cmake
+++ b/inference-engine/cmake/ie_parallel.cmake
@@ -29,6 +29,7 @@ function(set_ie_threading_interface_for TARGET_NAME)
         set(TBB_IMPORTED_TARGETS ${TBB_IMPORTED_TARGETS} PARENT_SCOPE)
         set(TBB_VERSION ${TBB_VERSION} PARENT_SCOPE)
         if (NOT TBB_FOUND)
+            set(THREADING "SEQ" PARENT_SCOPE)
             ext_message(WARNING "TBB was not found by the configured TBB_DIR/TBBROOT path.\
                                 SEQ method will be used.")
         endif ()
@@ -95,6 +96,7 @@ function(set_ie_threading_interface_for TARGET_NAME)
             set(IE_THREAD_DEFINE "IE_THREAD_TBB")
             ie_target_link_libraries(${TARGET_NAME} ${LINK_TYPE} ${TBB_IMPORTED_TARGETS})
         else ()
+            set(THREADING "SEQ" PARENT_SCOPE)
             ext_message(WARNING "TBB was not found by the configured TBB_DIR path.\
                                  SEQ method will be used for ${TARGET_NAME}")
         endif ()
@@ -133,6 +135,7 @@ function(set_ie_threading_interface_for TARGET_NAME)
 
         if (NOT OMP_LIBRARIES_RELEASE)
             ext_message(WARNING "Intel OpenMP not found. Intel OpenMP support will be disabled. ${IE_THREAD_DEFINE} is defined")
+            set(THREADING "SEQ" PARENT_SCOPE)
         else ()
             set(IE_THREAD_DEFINE "IE_THREAD_OMP")
 
diff --git a/inference-engine/ie_bridges/python/CMakeLists.txt b/inference-engine/ie_bridges/python/CMakeLists.txt
index 15d248379d7e84..a88b1017a124f4 100644
--- a/inference-engine/ie_bridges/python/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/CMakeLists.txt
@@ -58,6 +58,13 @@ else()
     endif()
 endif()
 
+function(ov_python_disable_intel_warnings target)
+    if(UNIX AND CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+        # 1292: unknown attribute "fallthrough"
+        target_compile_options(${target} PRIVATE -diag-disable=1292)
+    endif()
+endfunction()
+
 set (PYTHON_BRIDGE_SRC_ROOT ${CMAKE_CURRENT_SOURCE_DIR})
 add_subdirectory (src/openvino/inference_engine)
 add_subdirectory (src/openvino/offline_transformations)
diff --git a/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt b/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt
index 059f335f5df6b9..cfab4f2d907f28 100644
--- a/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/src/openvino/inference_engine/CMakeLists.txt
@@ -20,13 +20,15 @@ set_source_files_properties(${PYX_SOURCES} PROPERTIES CYTHON_IS_CXX ON)
 # create target
 
 cython_add_module(${TARGET_NAME} ${SOURCES})
-set(INSTALLED_TARGETS ${TARGET_NAME})
+ov_python_disable_intel_warnings(${TARGET_NAME})
 
+set(INSTALLED_TARGETS ${TARGET_NAME})
 list(REMOVE_ITEM PYX_SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/ie_api.pyx")
 
 foreach(PYX_FILE IN LISTS PYX_SOURCES)
     get_filename_component(PYX_NAME "${PYX_FILE}" NAME_WE)
     cython_add_module(${PYX_NAME} ${PYX_FILE})
+    ov_python_disable_intel_warnings(${PYX_NAME})
     add_dependencies(${TARGET_NAME} ${PYX_NAME})
     target_include_directories(${PYX_NAME} PRIVATE "${CMAKE_CURRENT_SOURCE_DIR}")
     target_link_libraries(${PYX_NAME} PRIVATE ${InferenceEngine_LIBRARIES})
diff --git a/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt b/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt
index ba526c3761d851..512b1662be525c 100644
--- a/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/src/openvino/offline_transformations/CMakeLists.txt
@@ -20,7 +20,9 @@ set_source_files_properties(${CMAKE_CURRENT_SOURCE_DIR}/offline_transformations_
 # create target
 
 cython_add_module(${TARGET_NAME} ${SOURCES})
+
 add_dependencies(${TARGET_NAME} ie_api)
+ov_python_disable_intel_warnings(${TARGET_NAME})
 
 if(COMMAND ie_add_vs_version_file)
     ie_add_vs_version_file(NAME ${TARGET_NAME}
diff --git a/inference-engine/ie_bridges/python/src/openvino/test_utils/CMakeLists.txt b/inference-engine/ie_bridges/python/src/openvino/test_utils/CMakeLists.txt
index 8367f941d9f793..9d3e1e0ffc082d 100644
--- a/inference-engine/ie_bridges/python/src/openvino/test_utils/CMakeLists.txt
+++ b/inference-engine/ie_bridges/python/src/openvino/test_utils/CMakeLists.txt
@@ -20,7 +20,9 @@ set_source_files_properties(${CMAKE_CURRENT_SOURCE_DIR}/test_utils_api.pyx
 # create target
 
 cython_add_module(${TARGET_NAME} ${SOURCES})
+
 add_dependencies(${TARGET_NAME} ie_api)
+ov_python_disable_intel_warnings(${TARGET_NAME})
 
 if(COMMAND ie_add_vs_version_file)
     ie_add_vs_version_file(NAME ${TARGET_NAME}
diff --git a/inference-engine/samples/CMakeLists.txt b/inference-engine/samples/CMakeLists.txt
index aef11e16f47bf8..c06336ec8f4e47 100644
--- a/inference-engine/samples/CMakeLists.txt
+++ b/inference-engine/samples/CMakeLists.txt
@@ -76,6 +76,10 @@ else()
         set (CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Werror") #treating warnings as errors
     endif()
 
+    if (CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+        set (CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -diag-disable:177")
+    endif()
+
     set (CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wall")
     set (CMAKE_C_FLAGS "${CMAKE_C_FLAGS} -Wall")
     if (APPLE)
@@ -135,10 +139,6 @@ if(EXISTS "${CMAKE_CURRENT_SOURCE_DIR}/thirdparty/cnpy")
     add_subdirectory(thirdparty/cnpy EXCLUDE_FROM_ALL)
 endif()
 
-if (CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
-    set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wall")
-endif()
-
 if(EXISTS "${CMAKE_CURRENT_SOURCE_DIR}/common/utils")
     add_subdirectory(common/utils)
 endif()
diff --git a/inference-engine/src/gna_plugin/backend/dnn_types.h b/inference-engine/src/gna_plugin/backend/dnn_types.h
index d08d9346d35c89..0b00b41ec830d7 100644
--- a/inference-engine/src/gna_plugin/backend/dnn_types.h
+++ b/inference-engine/src/gna_plugin/backend/dnn_types.h
@@ -227,7 +227,7 @@ OvGnaType OvGnaTypeIntFromBytes(T bytesPerElement) {
     return r->second;
 }
 
-static std::string OvGnaTypeToString(OvGnaType type) {
+inline std::string OvGnaTypeToString(OvGnaType type) {
     static const std::map<OvGnaType, std::string> typeToString = {
         {OvGnaTypeInt8, "OvGnaTypeInt8"},
         {OvGnaTypeInt16, "OvGnaTypeInt16"},
@@ -241,7 +241,7 @@ static std::string OvGnaTypeToString(OvGnaType type) {
     return r->second;
 }
 
-static std::string OvGnaModeToString(OvGnaMode mode) {
+inline std::string OvGnaModeToString(OvGnaMode mode) {
     static const std::map<OvGnaMode, std::string> modeToString = {
         {OvGnaModeDefault, "OvGnaModeDefault"},
         {OvGnaModeDisabled, "OvGnaModeDisabled"},
diff --git a/inference-engine/src/gna_plugin/backend/gna_limitations.hpp b/inference-engine/src/gna_plugin/backend/gna_limitations.hpp
index 90af04519291a6..41a8178ea4e017 100644
--- a/inference-engine/src/gna_plugin/backend/gna_limitations.hpp
+++ b/inference-engine/src/gna_plugin/backend/gna_limitations.hpp
@@ -87,6 +87,8 @@ class Validator {
 
     static void ThrowIfNotEmpty(const std::string prefix, const std::string error);
 public:
+    Validator() = default;
+
     void ValidateCnn2D(std::string name, const uint32_t inHeight, const uint32_t inWidth,
         const uint32_t inChannels, const uint32_t kH, const uint32_t kW, const uint32_t kN,
         const uint32_t strideH, const uint32_t strideW, OvGnaType inPrecision) const;
diff --git a/inference-engine/src/hetero_plugin/hetero_infer_request.cpp b/inference-engine/src/hetero_plugin/hetero_infer_request.cpp
index 7171363e7830f2..2b8d2f4f261667 100644
--- a/inference-engine/src/hetero_plugin/hetero_infer_request.cpp
+++ b/inference-engine/src/hetero_plugin/hetero_infer_request.cpp
@@ -77,7 +77,7 @@ void HeteroInferRequest::SetBlob(const std::string& name, const InferenceEngine:
             if (findInputAndOutputBlobByName(name, foundInput, foundOutput)) {
                 r->SetBlob(name, data, foundInput->getPreProcess());
             }
-        } catch (const InferenceEngine::NotFound& ex) {}
+        } catch (const InferenceEngine::NotFound&) {}
     }
 }
 
diff --git a/inference-engine/src/inference_engine/CMakeLists.txt b/inference-engine/src/inference_engine/CMakeLists.txt
index bf3acd4d466475..e31f7c3bf5aba2 100644
--- a/inference-engine/src/inference_engine/CMakeLists.txt
+++ b/inference-engine/src/inference_engine/CMakeLists.txt
@@ -229,7 +229,14 @@ list(APPEND core_components ngraph)
 list(APPEND PATH_VARS "IE_INCLUDE_DIR" "IE_NGRAPH_DIR"
                       "IE_PARALLEL_CMAKE")
 
-if((THREADING STREQUAL "TBB" OR THREADING STREQUAL "TBB_AUTO") AND TBBROOT MATCHES ${TEMP})
+# define variables for InferenceEngineConfig.cmake
+if(THREADING MATCHES "^(TBB|TBB_AUTO)$")
+    set(IE_TBB_DIR "${TBB_DIR}")
+    list(APPEND PATH_VARS "IE_TBB_DIR")
+endif()
+
+# install only downloaded TBB, system one is not installed
+if(THREADING MATCHES "^(TBB|TBB_AUTO)$" AND TBBROOT MATCHES ${TEMP})
     ie_cpack_add_component(tbb REQUIRED)
     list(APPEND core_components tbb)
 
@@ -249,8 +256,6 @@ if((THREADING STREQUAL "TBB" OR THREADING STREQUAL "TBB_AUTO") AND TBBROOT MATCH
             COMPONENT tbb)
 
     set(IE_TBB_DIR_INSTALL "external/tbb/cmake")
-    set(IE_TBB_DIR "${TBB_DIR}")
-    list(APPEND PATH_VARS "IE_TBB_DIR")
 
     install(FILES "${TBB}/cmake/TBBConfig.cmake"
                   "${TBB}/cmake/TBBConfigVersion.cmake"
diff --git a/inference-engine/src/inference_engine/cpp/ie_infer_request.cpp b/inference-engine/src/inference_engine/cpp/ie_infer_request.cpp
index 9e68666b7a36f6..f94a3b6ba1c162 100644
--- a/inference-engine/src/inference_engine/cpp/ie_infer_request.cpp
+++ b/inference-engine/src/inference_engine/cpp/ie_infer_request.cpp
@@ -127,7 +127,7 @@ void InferRequest::SetCompletionCallbackImpl(std::function<void(InferRequest, St
                 statusCode = [&] {
                     try {
                         std::rethrow_exception(exceptionPtr);
-                    } CATCH_IE_EXCEPTIONS_RETURN catch (const std::exception& ex) {
+                    } CATCH_IE_EXCEPTIONS_RETURN catch (const std::exception&) {
                         return GENERAL_ERROR;
                     } catch (...) {
                         return UNEXPECTED;
@@ -148,7 +148,7 @@ void InferRequest::SetCompletionCallbackImpl(IInferRequest::CompletionCallback c
                 statusCode = [&] {
                     try {
                         std::rethrow_exception(exceptionPtr);
-                    } CATCH_IE_EXCEPTIONS_RETURN catch (const std::exception& ex) {
+                    } CATCH_IE_EXCEPTIONS_RETURN catch (const std::exception&) {
                         return GENERAL_ERROR;
                     } catch (...) {
                         return UNEXPECTED;
diff --git a/inference-engine/src/inference_engine/ie_core.cpp b/inference-engine/src/inference_engine/ie_core.cpp
index 3c101ea42713ed..e62674d1a4675d 100644
--- a/inference-engine/src/inference_engine/ie_core.cpp
+++ b/inference-engine/src/inference_engine/ie_core.cpp
@@ -325,7 +325,7 @@ class Core::Impl : public ICore, public std::enable_shared_from_this<ICore> {
                               plugin.ImportNetwork(networkStream, config);
                 networkIsImported = true;
             });
-        } catch (const HeaderException& ex) {
+        } catch (const HeaderException&) {
             // For these exceptions just remove old cache and set that import didn't work
             cacheManager->removeCacheEntry(blobId);
             networkIsImported = false;
diff --git a/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp b/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp
index e20fed518e4bad..cb786a8af36e05 100644
--- a/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp
+++ b/inference-engine/src/low_precision_transformations/src/rt_info/intervals_alignment_attribute.cpp
@@ -161,8 +161,8 @@ void VariantWrapper<IntervalsAlignmentAttributePtr>::merge(
 
         resultSharedValue->preferablePrecisions.insert(sharedValue->preferablePrecisions.begin(), sharedValue->preferablePrecisions.end());
 
-        const auto resultSize = abs(resultSharedValue->minInterval.high - resultSharedValue->minInterval.low);
-        const auto size = abs(sharedValue->minInterval.high - sharedValue->minInterval.low);
+        const auto resultSize = std::abs(resultSharedValue->minInterval.high - resultSharedValue->minInterval.low);
+        const auto size = std::abs(sharedValue->minInterval.high - sharedValue->minInterval.low);
         if (resultSize > size) {
             resultSharedValue->minInterval = sharedValue->minInterval;
 
diff --git a/inference-engine/src/preprocessing/ie_preprocess_gapi_kernels.hpp b/inference-engine/src/preprocessing/ie_preprocess_gapi_kernels.hpp
index ffefeed06f0c2b..3af55071aa9c89 100644
--- a/inference-engine/src/preprocessing/ie_preprocess_gapi_kernels.hpp
+++ b/inference-engine/src/preprocessing/ie_preprocess_gapi_kernels.hpp
@@ -349,7 +349,7 @@ template <typename typelist, typename default_t, typename pred_t, typename type_
 namespace {
 struct cv_type_id {
     template <typename type>
-    const int operator()(type_to_type<type>) { return cv_type_to_depth<type>::depth; }
+    int operator()(type_to_type<type>) { return cv_type_to_depth<type>::depth; }
 };
 
 }  // namespace
diff --git a/inference-engine/src/transformations/src/transformations/serialize.cpp b/inference-engine/src/transformations/src/transformations/serialize.cpp
index 93f9c24e4b81bb..68214a5c543a97 100644
--- a/inference-engine/src/transformations/src/transformations/serialize.cpp
+++ b/inference-engine/src/transformations/src/transformations/serialize.cpp
@@ -851,7 +851,7 @@ bool pass::Serialize::run_on_function(std::shared_ptr<ngraph::Function> f) {
 
         try {
             serializeFunc(xml_file, bin_file);
-        } catch (const ngraph::CheckFailure& e) {
+        } catch (const ngraph::CheckFailure&) {
             // optimization decission was made to create .bin file upfront and
             // write to it directly instead of buffering its content in memory,
             // hence we need to delete it here in case of failure
diff --git a/inference-engine/src/vpu/common/CMakeLists.txt b/inference-engine/src/vpu/common/CMakeLists.txt
index 71c727b631ab0f..d8b55be48257e8 100644
--- a/inference-engine/src/vpu/common/CMakeLists.txt
+++ b/inference-engine/src/vpu/common/CMakeLists.txt
@@ -15,7 +15,7 @@ function(add_common_target TARGET_NAME STATIC_IE)
         UNITY
     )
 
-    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
+    if(CMAKE_COMPILER_IS_GNUCXX)
         # TODO: enable some day and fix all warnings
 #        target_compile_options(${TARGET_NAME} PRIVATE "-Wall")
         target_compile_options(${TARGET_NAME} PRIVATE "-Werror=unused-function")
diff --git a/inference-engine/src/vpu/common/include/vpu/utils/containers.hpp b/inference-engine/src/vpu/common/include/vpu/utils/containers.hpp
index 745613c977ece8..ada40a74d84498 100644
--- a/inference-engine/src/vpu/common/include/vpu/utils/containers.hpp
+++ b/inference-engine/src/vpu/common/include/vpu/utils/containers.hpp
@@ -11,24 +11,33 @@
 
 namespace vpu {
 
-template<class Key, class Value, template<class...> class Map>
-inline std::vector<Key> getKeys(const Map<Key, Value>& map) {
+template <template <typename, typename...> class Map,
+          typename Key,
+          typename Value,
+          typename... AddParams>
+inline std::vector<Key> getKeys(const Map<Key, Value, AddParams...>& map) {
     auto keys = std::vector<Key>{};
     keys.reserve(map.size());
     std::transform(map.cbegin(), map.cend(), std::back_inserter(keys), [](const std::pair<Key, Value>& entry) { return entry.first; });
     return keys;
 }
 
-template<class Key, class Value, template<class...> class Map>
-inline std::vector<Value> getValues(const Map<Key, Value>& map) {
+template <template <typename, typename...> class Map,
+          typename Key,
+          typename Value,
+          typename... AddParams>
+inline std::vector<Value> getValues(const Map<Key, Value, AddParams...>& map) {
     auto values = std::vector<Value>{};
     values.reserve(map.size());
     std::transform(map.cbegin(), map.cend(), std::back_inserter(values), [](const std::pair<Key, Value>& entry) { return entry.second; });
     return values;
 }
 
-template<class Key, class Value, template<class...> class Map>
-inline Map<Value, Key> inverse(const Map<Key, Value>& map) {
+template <template <typename, typename...> class Map,
+          typename Key,
+          typename Value,
+          typename... AddParams>
+inline Map<Value, Key> inverse(const Map<Key, Value, AddParams...>& map) {
     auto inverted = Map<Value, Key>{};
     for (const auto& entry : map) {
         const auto& insertion = inverted.emplace(entry.second, entry.first);
diff --git a/inference-engine/src/vpu/common/src/configuration/options/tiling_cmx_limit_kb.cpp b/inference-engine/src/vpu/common/src/configuration/options/tiling_cmx_limit_kb.cpp
index 3982b5eb3fd8b2..84160dcec1ae0f 100644
--- a/inference-engine/src/vpu/common/src/configuration/options/tiling_cmx_limit_kb.cpp
+++ b/inference-engine/src/vpu/common/src/configuration/options/tiling_cmx_limit_kb.cpp
@@ -18,7 +18,7 @@ void TilingCMXLimitKBOption::validate(const std::string& value) {
     int intValue;
     try {
         intValue = std::stoi(value);
-    } catch (const std::exception& e) {
+    } catch (const std::exception&) {
         VPU_THROW_FORMAT(R"(unexpected {} option value "{}", must be a number)", key(), value);
     }
 
@@ -54,7 +54,7 @@ TilingCMXLimitKBOption::value_type TilingCMXLimitKBOption::parse(const std::stri
     int intValue;
     try {
         intValue = std::stoi(value);
-    } catch (const std::exception& e) {
+    } catch (const std::exception&) {
         VPU_THROW_FORMAT(R"(unexpected {} option value "{}", must be a number)", key(), value);
     }
 
diff --git a/inference-engine/src/vpu/graph_transformer/CMakeLists.txt b/inference-engine/src/vpu/graph_transformer/CMakeLists.txt
index dd7de66f5c3fd9..8fdae7418b4174 100644
--- a/inference-engine/src/vpu/graph_transformer/CMakeLists.txt
+++ b/inference-engine/src/vpu/graph_transformer/CMakeLists.txt
@@ -20,7 +20,7 @@ function(add_graph_transformer_target TARGET_NAME STATIC_IE)
     set(TBB_IMPORTED_TARGETS ${TBB_IMPORTED_TARGETS} PARENT_SCOPE)
     set(TBB_VERSION ${TBB_VERSION} PARENT_SCOPE)
 
-    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
+    if(CMAKE_COMPILER_IS_GNUCXX)
         # TODO: enable some day and fix all warnings
 #        target_compile_options(${TARGET_NAME} PRIVATE "-Wall")
         target_compile_options(${TARGET_NAME} PRIVATE "-Werror=unused-function")
diff --git a/inference-engine/src/vpu/myriad_plugin/CMakeLists.txt b/inference-engine/src/vpu/myriad_plugin/CMakeLists.txt
index b2a18d15de3a7a..66e15697baaa07 100644
--- a/inference-engine/src/vpu/myriad_plugin/CMakeLists.txt
+++ b/inference-engine/src/vpu/myriad_plugin/CMakeLists.txt
@@ -23,7 +23,7 @@ target_include_directories(${TARGET_NAME}
     PRIVATE
         "${CMAKE_CURRENT_SOURCE_DIR}")
 
-if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
+if(CMAKE_COMPILER_IS_GNUCXX)
     target_compile_options(${TARGET_NAME}
         PRIVATE
             -Wall)
diff --git a/inference-engine/tests/functional/inference_engine/CMakeLists.txt b/inference-engine/tests/functional/inference_engine/CMakeLists.txt
index 4154e95ba860f9..b745a2c3cdf018 100644
--- a/inference-engine/tests/functional/inference_engine/CMakeLists.txt
+++ b/inference-engine/tests/functional/inference_engine/CMakeLists.txt
@@ -214,7 +214,7 @@ ie_headers_compilation_with_custom_flags(TEST_SUFFIX Cxx17
 if(UNIX)
     if(CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
         ie_headers_compilation_with_custom_flags(TEST_SUFFIX WarningsAreErrors
-                                                 FLAGS -Werror-all -Werror -Wall)
+                                                 FLAGS -Wremarks -Wcheck -Werror-all -Werror -Wall)
     else()
         ie_headers_compilation_with_custom_flags(TEST_SUFFIX Pedantic FLAGS -Wpedantic)
     endif()
diff --git a/inference-engine/thirdparty/CMakeLists.txt b/inference-engine/thirdparty/CMakeLists.txt
index edbf6e6b4ea09b..7a3ee97b789187 100644
--- a/inference-engine/thirdparty/CMakeLists.txt
+++ b/inference-engine/thirdparty/CMakeLists.txt
@@ -41,12 +41,14 @@ function(ie_add_mkldnn)
         set(OpenMP_cmake_included ON) ## to skip "omp simd" inside a code. Lead to some crashes inside NDK LLVM..
     endif()
 
+    if(SUGGEST_OVERRIDE_SUPPORTED)
+        # xbyak compilation fails
+        set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wno-suggest-override")
+    endif()
     if(CMAKE_COMPILER_IS_GNUCXX)
         ie_add_compiler_flags(-Wno-undef)
-        if(SUGGEST_OVERRIDE_SUPPORTED)
-            # xbyak compilation fails
-            set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wno-suggest-override")
-        endif()
+    elseif(UNIX AND CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+        set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -diag-disable=10121")
     endif()
 
     add_subdirectory(mkl-dnn EXCLUDE_FROM_ALL)
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/fully_connected/fully_connected_kernel_bf_tiled.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/fully_connected/fully_connected_kernel_bf_tiled.cpp
index 8906a1bf38dceb..498a1ed2d2d72c 100644
--- a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/fully_connected/fully_connected_kernel_bf_tiled.cpp
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/fully_connected/fully_connected_kernel_bf_tiled.cpp
@@ -118,10 +118,6 @@ struct TuneParamsSelector {
         return result;
     }
 
-    tune_params Default(functional_case fun) {
-        return Default(fun(params));
-    }
-
     static bool VerifyTuneParams(const fully_connected_params& params, const tune_params& tparams);
 
     const fully_connected_params& params;
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_nd_kernel_ref.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_nd_kernel_ref.cpp
index 4ffd87439a0143..e4ce4e9740a979 100644
--- a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_nd_kernel_ref.cpp
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_nd_kernel_ref.cpp
@@ -32,14 +32,6 @@ ParamsKey GatherNDKernelRef::GetSupportedKey() const {
     return k;
 }
 
-static inline std::string GetOrderString(std::vector<std::string>& order) {
-    std::string order_str = order[0];
-    for (size_t i = 1; i < order.size(); i++)
-        order_str += ", " + order[i];
-
-    return order_str;
-}
-
 static inline std::vector<std::string> GetDefaultOrder(size_t size) {
     std::vector<std::string> default_order;
     if (size <= 4) {
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_elements_update_kernel_ref.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_elements_update_kernel_ref.cpp
index 20645fb0f82741..50027615a04e47 100644
--- a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_elements_update_kernel_ref.cpp
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_elements_update_kernel_ref.cpp
@@ -55,14 +55,6 @@ ParamsKey ScatterElementsUpdateKernelRef::GetSupportedKey() const {
     return k;
 }
 
-static inline std::string GetOrderString(std::vector<std::string>& order) {
-    std::string order_str = order[0];
-    for (size_t i = 1; i < order.size(); i++)
-        order_str += ", " + order[i];
-
-    return order_str;
-}
-
 static inline std::vector<std::string> GetDefaultOrder(size_t size) {
     std::vector<std::string> default_order;
     if (size <= 4) {
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_nd_update_kernel_ref.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_nd_update_kernel_ref.cpp
index a3803a38db79da..d625cd414df1d6 100644
--- a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_nd_update_kernel_ref.cpp
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/scatter_update/scatter_nd_update_kernel_ref.cpp
@@ -32,14 +32,6 @@ ParamsKey ScatterNDUpdateKernelRef::GetSupportedKey() const {
     return k;
 }
 
-static inline std::string GetOrderString(std::vector<std::string>& order) {
-    std::string order_str = order[0];
-    for (size_t i = 1; i < order.size(); i++)
-        order_str += ", " + order[i];
-
-    return order_str;
-}
-
 static inline std::vector<std::string> GetDefaultOrder(size_t size) {
     std::vector<std::string> default_order;
     if (size <= 4) {
diff --git a/inference-engine/thirdparty/clDNN/runtime/kernels_cache.cpp b/inference-engine/thirdparty/clDNN/runtime/kernels_cache.cpp
index ed1353697673ea..3e8f3034de2068 100644
--- a/inference-engine/thirdparty/clDNN/runtime/kernels_cache.cpp
+++ b/inference-engine/thirdparty/clDNN/runtime/kernels_cache.cpp
@@ -55,7 +55,7 @@
 namespace {
 std::mutex cacheAccessMutex;
 
-#ifdef ENABLE_UNICODE_PATH_SUPPORT
+#if defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
 std::wstring multiByteCharToWString(const char* str) {
 #ifdef _WIN32
     int strSize = static_cast<int>(std::strlen(str));
@@ -69,7 +69,7 @@ std::wstring multiByteCharToWString(const char* str) {
     return result;
 #endif  // _WIN32
 }
-#endif  // ENABLE_UNICODE_PATH_SUPPORT
+#endif  // defined(ENABLE_UNICODE_PATH_SUPPORT) && defined(_WIN32)
 
 static std::vector<unsigned char> loadBinaryFromFile(std::string path) {
     std::lock_guard<std::mutex> lock(cacheAccessMutex);
diff --git a/inference-engine/thirdparty/mkl-dnn b/inference-engine/thirdparty/mkl-dnn
index d8304554b2caff..8840c3faf6c4e1 160000
--- a/inference-engine/thirdparty/mkl-dnn
+++ b/inference-engine/thirdparty/mkl-dnn
@@ -1 +1 @@
-Subproject commit d8304554b2caff2ba4e906ff8fcb6efc3b425f7c
+Subproject commit 8840c3faf6c4e1131c5408e8d6795093d4f4a815
diff --git a/inference-engine/thirdparty/movidius/XLink/pc/protocols/pcie_host.c b/inference-engine/thirdparty/movidius/XLink/pc/protocols/pcie_host.c
index 2ef75094a693cb..6a12be70ddab92 100644
--- a/inference-engine/thirdparty/movidius/XLink/pc/protocols/pcie_host.c
+++ b/inference-engine/thirdparty/movidius/XLink/pc/protocols/pcie_host.c
@@ -81,15 +81,6 @@ enum mx_fw_status {
 };
 /**         MXLK data end       */
 
-#if !(defined(_WIN32) || defined(_WIN64))
-static inline void timeout_to_timeval(unsigned int timeout_ms,
-                                      struct timeval *timeval)
-{
-    timeval->tv_sec = timeout_ms / 1000;
-    timeval->tv_usec = (timeout_ms - (timeval->tv_sec * 1000)) * 1000;
-}
-#endif
-
 static inline void sleepForSeconds(const unsigned int seconds) {
 #if (!defined(_WIN32) && !defined(_WIN64))
     sleep(seconds);
diff --git a/inference-engine/tools/compile_tool/CMakeLists.txt b/inference-engine/tools/compile_tool/CMakeLists.txt
index 3d18ea94596a3e..704b05cfcdeeeb 100644
--- a/inference-engine/tools/compile_tool/CMakeLists.txt
+++ b/inference-engine/tools/compile_tool/CMakeLists.txt
@@ -15,10 +15,8 @@ target_include_directories(${TARGET_NAME} SYSTEM PRIVATE
     ${IE_MAIN_SOURCE_DIR}/src/vpu/common/include
 )
 
-if (CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
-    target_compile_options(${TARGET_NAME} PRIVATE
-        "-Wall"
-    )
+if (CMAKE_COMPILER_IS_GNUCXX)
+    target_compile_options(${TARGET_NAME} PRIVATE -Wall)
 endif()
 
 target_link_libraries(${TARGET_NAME} PRIVATE
diff --git a/inference-engine/tools/vpu/vpu_compile/CMakeLists.txt b/inference-engine/tools/vpu/vpu_compile/CMakeLists.txt
index 1282fab00883e5..c590bc0e5b0469 100644
--- a/inference-engine/tools/vpu/vpu_compile/CMakeLists.txt
+++ b/inference-engine/tools/vpu/vpu_compile/CMakeLists.txt
@@ -10,10 +10,8 @@ file(GLOB SRCS
 
 add_executable(${TARGET_NAME} ${SRCS})
 
-if (CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
-    target_compile_options(${TARGET_NAME} PRIVATE
-        "-Wall"
-    )
+if (CMAKE_COMPILER_IS_GNUCXX)
+    target_compile_options(${TARGET_NAME} PRIVATE -Wall)
 endif()
 
 target_link_libraries(${TARGET_NAME} PRIVATE
diff --git a/inference-engine/tools/vpu/vpu_perfcheck/CMakeLists.txt b/inference-engine/tools/vpu/vpu_perfcheck/CMakeLists.txt
index 58915e56c77055..89b7cabd25335c 100644
--- a/inference-engine/tools/vpu/vpu_perfcheck/CMakeLists.txt
+++ b/inference-engine/tools/vpu/vpu_perfcheck/CMakeLists.txt
@@ -8,7 +8,7 @@ function(add_perfcheck_target TARGET_NAME PLUGIN_NAME)
     add_executable(${TARGET_NAME} ${SOURCES})
 
     # TODO: enable some day and fix all warnings
-#    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
+#    if(CMAKE_COMPILER_IS_GNUCXX)
 #        target_compile_options(${TARGET_NAME}
 #            PRIVATE
 #                "-Wall")
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/convolution.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/convolution.hpp
index adee512d975c2b..9c32cd73da9acf 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/convolution.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/convolution.hpp
@@ -145,7 +145,7 @@ namespace ngraph
                     }
                 }
 
-                void extend_to_3D(ConvolutionParams& p, Shape& in_shape, Shape& filter_shape)
+                inline void extend_to_3D(ConvolutionParams& p, Shape& in_shape, Shape& filter_shape)
                 {
                     int spatial_rank = in_shape.size() - 2;
                     if (spatial_rank < 3)
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/convolution_backprop_data.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/convolution_backprop_data.hpp
index 1c755198163a7a..93edbd6acc3f0f 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/convolution_backprop_data.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/convolution_backprop_data.hpp
@@ -125,14 +125,15 @@ namespace ngraph
                     }
                 }
 
-                void validate_convolution_backprop_parameters(const Shape& in_shape,
-                                                              const Shape& f_shape,
-                                                              const Shape& out_shape,
-                                                              const Strides& strides,
-                                                              const Strides& dilations,
-                                                              const CoordinateDiff& pads_begin,
-                                                              const CoordinateDiff& pads_end,
-                                                              const CoordinateDiff& output_padding)
+                inline void
+                    validate_convolution_backprop_parameters(const Shape& in_shape,
+                                                             const Shape& f_shape,
+                                                             const Shape& out_shape,
+                                                             const Strides& strides,
+                                                             const Strides& dilations,
+                                                             const CoordinateDiff& pads_begin,
+                                                             const CoordinateDiff& pads_end,
+                                                             const CoordinateDiff& output_padding)
                 {
                     // this implementation supports 1D, 2D and 3D convolutions
                     NGRAPH_CHECK(in_shape.size() >= 3 && in_shape.size() <= 5,
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/ctc_greedy_decoder.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/ctc_greedy_decoder.hpp
index 2e41850ed162bd..275913c3485ab8 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/ctc_greedy_decoder.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/ctc_greedy_decoder.hpp
@@ -37,7 +37,7 @@ namespace ngraph
                 // information are set to -1
 
                 std::vector<T> tmp_out(shape_size(out_shape));
-                std::fill(tmp_out.begin(), tmp_out.end(), static_cast<T>(-1.0));
+                std::fill(tmp_out.begin(), tmp_out.end(), static_cast<T>(-1));
 
                 for (unsigned int batch_ind = 0; batch_ind < batch_size; batch_ind++)
                 {
diff --git a/ngraph/core/reference/include/ngraph/runtime/reference/proposal.hpp b/ngraph/core/reference/include/ngraph/runtime/reference/proposal.hpp
index a8a3e3647d3c76..0fa61c883f24c4 100644
--- a/ngraph/core/reference/include/ngraph/runtime/reference/proposal.hpp
+++ b/ngraph/core/reference/include/ngraph/runtime/reference/proposal.hpp
@@ -22,7 +22,7 @@ namespace ngraph
                     T score;
                 };
 
-                static std::vector<float> generate_anchors(const op::ProposalAttrs& attrs,
+                inline std::vector<float> generate_anchors(const op::ProposalAttrs& attrs,
                                                            const unsigned int anchor_count)
                 {
                     std::vector<float> anchors(4 * anchor_count);
diff --git a/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp b/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp
index 1b1bdcaf8e6953..c844e89ede16e8 100644
--- a/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp
+++ b/ngraph/frontend/onnx/onnx_import/src/core/graph.cpp
@@ -327,7 +327,7 @@ namespace ngraph
             {
                 ng_node_vector = ng_node_factory(onnx_node);
             }
-            catch (const ::ngraph::onnx_import::error::OnnxNodeValidationFailure& exc)
+            catch (const ::ngraph::onnx_import::error::OnnxNodeValidationFailure&)
             {
                 // Do nothing OnnxNodeValidationFailure exception already has ONNX node information.
                 throw;
diff --git a/ngraph/test/visitors/user_op.cpp b/ngraph/test/visitors/user_op.cpp
index b48194f3877f41..48ea1c8de10516 100644
--- a/ngraph/test/visitors/user_op.cpp
+++ b/ngraph/test/visitors/user_op.cpp
@@ -172,7 +172,7 @@ class Oracle : public op::Op
 
     TuringModel get_turing_model() const { return m_turing_model; }
     const element::Type get_element_type() const { return m_element_type; }
-    const element::Type_t get_element_type_t() const { return m_element_type_t; }
+    element::Type_t get_element_type_t() const { return m_element_type_t; }
     const string& get_val_string() const { return m_val_string; }
     bool get_val_bool() const { return m_val_bool; }
     bool get_val_float() const { return m_val_float; }
diff --git a/openvino/conditional_compilation/CMakeLists.txt b/openvino/conditional_compilation/CMakeLists.txt
index daadd1c83207b6..6c786d401a28a7 100644
--- a/openvino/conditional_compilation/CMakeLists.txt
+++ b/openvino/conditional_compilation/CMakeLists.txt
@@ -25,7 +25,7 @@ elseif(SELECTIVE_BUILD STREQUAL "ON")
 
     target_compile_definitions(${TARGET_NAME} INTERFACE SELECTIVE_BUILD)
 
-    if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU" OR OV_COMPILER_IS_CLANG)
+    if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
         # After disabling a block of code, some variables might be unused.
         target_compile_options(${TARGET_NAME} INTERFACE
                                 -Wno-unused-function
diff --git a/openvino/itt/CMakeLists.txt b/openvino/itt/CMakeLists.txt
index e9f880b8ce7fd1..d45b9857ada43a 100644
--- a/openvino/itt/CMakeLists.txt
+++ b/openvino/itt/CMakeLists.txt
@@ -26,10 +26,8 @@ if(TARGET ittnotify)
     endif()
 endif()
 
-if (CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
-    target_compile_options(${TARGET_NAME} PRIVATE
-        "-Wall"
-    )
+if (CMAKE_COMPILER_IS_GNUCXX)
+    target_compile_options(${TARGET_NAME} PRIVATE -Wall)
 endif()
 
 target_include_directories(${TARGET_NAME} PUBLIC ${CMAKE_CURRENT_SOURCE_DIR}/include)
diff --git a/thirdparty/CMakeLists.txt b/thirdparty/CMakeLists.txt
index 8991c636e37063..5816387edd2f29 100644
--- a/thirdparty/CMakeLists.txt
+++ b/thirdparty/CMakeLists.txt
@@ -64,6 +64,7 @@ function(add_gflags)
     set(BUILD_SHARED_LIBS OFF)
 
     add_subdirectory(gflags EXCLUDE_FROM_ALL)
+
     set_target_properties(gflags_nothreads_static PROPERTIES FOLDER thirdparty)
     openvino_developer_export_targets(COMPONENT openvino_common TARGETS gflags)
 endfunction()
@@ -76,12 +77,6 @@ add_gflags()
 
 function(add_gtest_libraries)
     set(gtest_force_shared_crt ON CACHE BOOL "disable static CRT for google test")
-    if (UNIX)
-        ie_add_compiler_flags(-Wno-undef)
-        if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
-            ie_add_compiler_flags(-Wno-deprecated-copy)
-        endif()
-    endif()
 
     set(BUILD_SHARED_LIBS OFF)
     set(INSTALL_GTEST OFF CACHE BOOL "" FORCE)
@@ -93,25 +88,32 @@ function(add_gtest_libraries)
     get_target_property(gmock_include_dirs gtest INTERFACE_INCLUDE_DIRECTORIES)
     set_target_properties(gmock PROPERTIES INTERFACE_SYSTEM_INCLUDE_DIRECTORIES "${gmock_include_dirs};${gmock_SOURCE_DIR}/include")
 
+    set(gtest_targets gtest gtest_main gmock gmock_main)
+
+    foreach(target IN LISTS gtest_targets)
     # If we have specified /Z7 option, remove -Zi option which comes from gtest
-    if (WIN32)
-        set(gtest_targets "gtest;gtest_main;gmock;gmock_main")
-        foreach(target_name ${gtest_targets})
-            if(TARGET "${target_name}")
-                get_target_property(_target_cxx_flags ${target_name} COMPILE_OPTIONS)
-                if(_target_cxx_flags)
-                    if(CMAKE_CXX_FLAGS_DEBUG MATCHES ".+/Z7.+" OR CMAKE_CXX_FLAGS_RELWITHDEBINFO MATCHES ".+/Z7.+")
-                        string(REPLACE "-Zi" " " _target_cxx_flags ${_target_cxx_flags})
-                        message(STATUS "Removing -Zi flag from target " ${target_name})
-                        set_target_properties(${target_name} PROPERTIES COMPILE_OPTIONS "${_target_cxx_flags}")
-                    endif()
+        if (CMAKE_CXX_COMPILER_ID STREQUAL "MSVC")
+            get_target_property(_target_cxx_flags ${target} COMPILE_OPTIONS)
+            if(_target_cxx_flags)
+                if(CMAKE_CXX_FLAGS_DEBUG MATCHES ".+/Z7.+" OR CMAKE_CXX_FLAGS_RELWITHDEBINFO MATCHES ".+/Z7.+")
+                    string(REPLACE "-Zi" " " _target_cxx_flags ${_target_cxx_flags})
+                    message(STATUS "Removing -Zi flag from target " ${target})
+                    set_target_properties(${target} PROPERTIES COMPILE_OPTIONS "${_target_cxx_flags}")
                 endif()
             endif()
-        endforeach()
-    endif()
+        elseif(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG OR
+            CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+            target_compile_options(${target} PRIVATE -Wno-undef)
+            if(CMAKE_COMPILER_IS_GNUCXX)
+                target_compile_options(${target} PRIVATE -Wno-deprecated-copy)
+            endif()
+        endif()
+        ov_disable_all_warnings(${target})
+    endforeach()
+
     set_target_properties(gtest gtest_main gmock gmock_main
                           PROPERTIES FOLDER thirdparty)
-    
+
     openvino_developer_export_targets(COMPONENT inference_engine_tests
                                       TARGETS gmock gmock_main gtest gtest_main)
 endfunction()
diff --git a/thirdparty/ocv/opencv_hal_avx512.hpp b/thirdparty/ocv/opencv_hal_avx512.hpp
index 7e49ea3f40dff5..bf9f7a3664bdb7 100644
--- a/thirdparty/ocv/opencv_hal_avx512.hpp
+++ b/thirdparty/ocv/opencv_hal_avx512.hpp
@@ -3257,7 +3257,7 @@ static inline void v_set(v_uint8x64& val_0, v_uint8x64& val_1,
                                   *reinterpret_cast<int64_t*>(&tmp[4 * (*(mapsx + x + 3 * shift + 7))]));
 }
 
-#if defined(__GNUC__)
+#if defined(__GNUC__) && !defined(__INTEL_COMPILER)
 
 int _mm512_cvtsi512_si32(__m512i a)
 {
diff --git a/thirdparty/onnx/CMakeLists.txt b/thirdparty/onnx/CMakeLists.txt
index 7826e944dd843c..1196ab8dac0ddd 100644
--- a/thirdparty/onnx/CMakeLists.txt
+++ b/thirdparty/onnx/CMakeLists.txt
@@ -19,13 +19,7 @@ macro(onnx_set_target_properties)
     target_include_directories(onnx SYSTEM PRIVATE "${Protobuf_INCLUDE_DIRS}")
     target_include_directories(onnx_proto SYSTEM PRIVATE "${Protobuf_INCLUDE_DIRS}")
 
-    if(CMAKE_CXX_COMPILER_ID STREQUAL "MSVC")
-        target_compile_options(onnx PRIVATE /WX-)
-    elseif(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
-        target_compile_options(onnx PRIVATE -Wno-all)
-        target_compile_options(onnx_proto PRIVATE -Wno-all -Wno-unused-variable)
-    endif()
-
+    ov_disable_all_warnings(onnx onnx_proto)
     target_compile_definitions(onnx PUBLIC ONNX_BUILD_SHARED_LIBS)
 endmacro()
 
diff --git a/thirdparty/protobuf/CMakeLists.txt b/thirdparty/protobuf/CMakeLists.txt
index 5c5cb3c2fbec6b..9ddd64a40854c0 100644
--- a/thirdparty/protobuf/CMakeLists.txt
+++ b/thirdparty/protobuf/CMakeLists.txt
@@ -52,28 +52,25 @@ get_directory_property(protobuf_VERSION DIRECTORY protobuf/cmake DEFINITION prot
 
 set(Protobuf_INCLUDE_DIRS ${CMAKE_CURRENT_SOURCE_DIR}/protobuf/src)
 
+# to hide libprotobuf warnings
+target_include_directories(libprotobuf-lite SYSTEM PRIVATE "${Protobuf_INCLUDE_DIRS}")
+
 if(NGRAPH_USE_PROTOBUF_LITE)
     set(Protobuf_LIBRARIES libprotobuf-lite)
 else()
     set(Protobuf_LIBRARIES libprotobuf)
 endif()
 
-if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG)
-    set(_proto_libs ${Protobuf_LIBRARIES})
-    if(TARGET libprotoc)
-        list(APPEND _proto_libs libprotoc)
-        target_compile_options(libprotoc PRIVATE -Wno-all -Wno-unused-variable)
-        # libprotobuf is always built for protoc
-        target_compile_options(libprotobuf PUBLIC -Wno-undef)
+if(CMAKE_COMPILER_IS_GNUCXX OR OV_COMPILER_IS_CLANG OR
+   CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+    if(protobuf_BUILD_PROTOC_BINARIES)
+        set_target_properties(protoc libprotoc PROPERTIES
+            CXX_VISIBILITY_PRESET default
+            C_VISIBILITY_PRESET default
+            VISIBILITY_INLINES_HIDDEN OFF)
+        list(APPEND _protobuf_libs protoc libprotoc)
     endif()
-    set_target_properties(${_proto_libs} PROPERTIES
-        CXX_VISIBILITY_PRESET default
-        C_VISIBILITY_PRESET default
-        VISIBILITY_INLINES_HIDDEN OFF)
-    foreach(target IN LISTS Protobuf_LIBRARIES)
-        target_compile_options(${target}
-            PRIVATE -Wno-all -Wno-unused-variable)
-    endforeach()
+    ov_disable_all_warnings(${_protobuf_libs} libprotobuf libprotobuf-lite)
 endif()
 
 if(NGRAPH_USE_PROTOBUF_LITE)
diff --git a/thirdparty/zlib/CMakeLists.txt b/thirdparty/zlib/CMakeLists.txt
index 33b9222ec53103..20576c3cc2f4ef 100644
--- a/thirdparty/zlib/CMakeLists.txt
+++ b/thirdparty/zlib/CMakeLists.txt
@@ -2,16 +2,14 @@
 # SPDX-License-Identifier: Apache-2.0
 #
 
-PROJECT(zlib)
-
 if(NOT WIN32)
-    set (CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wno-all")
     set (CMAKE_C_FLAGS "${CMAKE_C_FLAGS} -Wno-all")
-endif()
-
-
-if(CMAKE_C_COMPILER_ID STREQUAL "MSVC")
-    set (CMAKE_C_FLAGS "${CMAKE_C_FLAGS}  /MP /wd4996  /W3")
+    if (CMAKE_CXX_COMPILER_ID STREQUAL "Intel")
+        #266: function "XXX" declared implicitly
+        set (CMAKE_C_FLAGS "${CMAKE_C_FLAGS} -diag-disable=266")
+    endif()
+elseif(CMAKE_C_COMPILER_ID STREQUAL "MSVC")
+    set (CMAKE_C_FLAGS "${CMAKE_C_FLAGS}  /wd4996  /W3")
 endif()
 
 set(TARGET_NAME "zlib")
@@ -49,8 +47,7 @@ set(lib_hdrs
 set(lib_ext_hdrs "zlib/zlib.h" "zlib/zconf.h")
 add_library(${TARGET_NAME} STATIC ${lib_srcs} ${lib_hdrs} ${lib_ext_hdrs})
 
-
 target_include_directories(${TARGET_NAME} PUBLIC "${CMAKE_CURRENT_SOURCE_DIR}/zlib"
                                                  "${CMAKE_CURRENT_SOURCE_DIR}/zlib/..")
 
-set_target_properties(zlib PROPERTIES FOLDER thirdparty)
\ No newline at end of file
+set_target_properties(zlib PROPERTIES FOLDER thirdparty)

From 462c2f9945d54c77909bb2af29d2281443eec651 Mon Sep 17 00:00:00 2001
From: Ilya Churaev <ilya.churaev@intel.com>
Date: Mon, 26 Jul 2021 15:11:31 +0300
Subject: [PATCH 67/71] Avoid replace parameter in reshape method (#6741)

* Avoid replace parameter in reshape method

* Added comment

* Use set_partial_shape()
---
 .../cnn_network_ngraph_impl.cpp               |  7 ++---
 .../inference_engine/ngraph_reshape_tests.cpp | 29 +++++++++++++++++++
 2 files changed, 31 insertions(+), 5 deletions(-)

diff --git a/inference-engine/src/inference_engine/cnn_network_ngraph_impl.cpp b/inference-engine/src/inference_engine/cnn_network_ngraph_impl.cpp
index 1f05ca0098c3da..ba73bcc8917437 100644
--- a/inference-engine/src/inference_engine/cnn_network_ngraph_impl.cpp
+++ b/inference-engine/src/inference_engine/cnn_network_ngraph_impl.cpp
@@ -364,13 +364,10 @@ CNNNetworkNGraphImpl::reshape(const std::map<std::string, ngraph::PartialShape>&
 
     bool parameter_replaced = false;
     for (size_t i = 0; i < params.size(); i++) {
-        const auto& param = params[i];
+        auto& param = params[i];
         if (inputShapes.find(param->get_friendly_name()) == inputShapes.end())
             continue;
-        ::ngraph::PartialShape shape(inputShapes.at(param->get_friendly_name()));
-        auto newParam = std::make_shared<::ngraph::op::Parameter>(param->get_element_type(), shape);
-        newParam->set_friendly_name(param->get_friendly_name());
-        _ngraph_function->replace_parameter(i, newParam);
+        param->set_partial_shape(inputShapes.at(param->get_friendly_name()));
         parameter_replaced = true;
     }
     if (parameter_replaced)
diff --git a/inference-engine/tests/functional/inference_engine/ngraph_reshape_tests.cpp b/inference-engine/tests/functional/inference_engine/ngraph_reshape_tests.cpp
index 03529fd6785deb..8ddefc82d603fb 100644
--- a/inference-engine/tests/functional/inference_engine/ngraph_reshape_tests.cpp
+++ b/inference-engine/tests/functional/inference_engine/ngraph_reshape_tests.cpp
@@ -141,6 +141,35 @@ TEST_F(NGraphReshapeTests, ReshapeSpatialReLU) {
     ASSERT_EQ(ngraph->get_results()[0]->get_shape(), ngraph::Shape({1, 3, 25, 25}));
 }
 
+TEST_F(NGraphReshapeTests, ReshapeSpatialReLUWithoutReplaceParameter) {
+    std::shared_ptr<ngraph::Function> ngraph;
+    {
+        ngraph::PartialShape shape({1, 3, 22, 22});
+        ngraph::element::Type type(ngraph::element::Type_t::f32);
+        auto param = std::make_shared<ngraph::op::Parameter>(type, shape);
+        auto relu = std::make_shared<ngraph::op::Relu>(param);
+        auto result = std::make_shared<ngraph::op::Result>(relu);
+
+        ngraph::ParameterVector params = {param};
+        ngraph::ResultVector results = {result};
+
+        ngraph = std::make_shared<ngraph::Function>(results, params);
+    }
+
+    ASSERT_EQ(ngraph->get_parameters()[0]->get_shape(), ngraph::Shape({1, 3, 22, 22}));
+    ASSERT_EQ(ngraph->get_results()[0]->get_shape(), ngraph::Shape({1, 3, 22, 22}));
+
+    {
+        ngraph->get_parameters()[0]->set_partial_shape({1, 3, 25, 25});
+
+        ngraph->validate_nodes_and_infer_types();
+    }
+
+    ASSERT_EQ(ngraph->get_parameters()[0]->get_shape(), ngraph::Shape({1, 3, 25, 25}));
+    ASSERT_EQ(ngraph->get_results()[0]->get_shape(), ngraph::Shape({1, 3, 25, 25}));
+}
+
+
 TEST_F(NGraphReshapeTests, CNNReshapeSpatialReLU) {
     std::shared_ptr<const ngraph::Function> ngraph;
     {

From 1a92a69515e000da1361e421dbfdeb1b69fdc785 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Dawid=20Ko=C5=BCykowski?= <dawid.kozykowski@intel.com>
Date: Mon, 26 Jul 2021 14:46:31 +0200
Subject: [PATCH 68/71] Refactor visitor tests for UnaryElementwiseArithmetic
 ops  (#6756)

* remove namespace dependencies from header file

* add RVO-exploit string concatenating

* update acosh test

* update erf test
---
 ngraph/test/visitors/op/acosh.cpp     |  3 ++-
 ngraph/test/visitors/op/asinh.cpp     |  2 +-
 ngraph/test/visitors/op/atan.cpp      |  2 +-
 ngraph/test/visitors/op/ceiling.cpp   |  3 ++-
 ngraph/test/visitors/op/cos.cpp       |  3 ++-
 ngraph/test/visitors/op/cosh.cpp      |  3 ++-
 ngraph/test/visitors/op/erf.cpp       |  2 +-
 ngraph/test/visitors/op/floor.cpp     |  4 ++--
 ngraph/test/visitors/op/log.cpp       |  6 ++++--
 ngraph/test/visitors/op/negative.cpp  |  4 ++--
 ngraph/test/visitors/op/result.cpp    |  4 ++--
 ngraph/test/visitors/op/sign.cpp      |  3 ++-
 ngraph/test/visitors/op/sinh.cpp      |  9 +++++----
 ngraph/test/visitors/op/softplus.cpp  |  2 +-
 ngraph/test/visitors/op/sqrt.cpp      |  5 +++--
 ngraph/test/visitors/op/squeeze.cpp   |  5 +++--
 ngraph/test/visitors/op/swish.cpp     |  3 ++-
 ngraph/test/visitors/op/unary_ops.hpp | 24 ++++++++----------------
 18 files changed, 45 insertions(+), 42 deletions(-)

diff --git a/ngraph/test/visitors/op/acosh.cpp b/ngraph/test/visitors/op/acosh.cpp
index 413a68710ab3c6..901e69812b80f0 100644
--- a/ngraph/test/visitors/op/acosh.cpp
+++ b/ngraph/test/visitors/op/acosh.cpp
@@ -3,7 +3,8 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::Acosh, element::f32>>;
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::Acosh, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/asinh.cpp b/ngraph/test/visitors/op/asinh.cpp
index 6e18ede91c8b87..d791ae636eac09 100644
--- a/ngraph/test/visitors/op/asinh.cpp
+++ b/ngraph/test/visitors/op/asinh.cpp
@@ -3,7 +3,7 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::Asinh, element::f32>>;
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::Asinh, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/atan.cpp b/ngraph/test/visitors/op/atan.cpp
index 72b5931c72bb88..ba65d4c286586f 100644
--- a/ngraph/test/visitors/op/atan.cpp
+++ b/ngraph/test/visitors/op/atan.cpp
@@ -4,7 +4,7 @@
 
 #include "unary_ops.hpp"
 
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Atan, element::f32>>;
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Atan, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                               UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/ceiling.cpp b/ngraph/test/visitors/op/ceiling.cpp
index dc4f32d29b6f69..6097e44f50bb6b 100644
--- a/ngraph/test/visitors/op/ceiling.cpp
+++ b/ngraph/test/visitors/op/ceiling.cpp
@@ -3,7 +3,8 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Ceiling, element::f32>>;
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Ceiling, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/cos.cpp b/ngraph/test/visitors/op/cos.cpp
index 6b48a4b8b0ccf2..9da84fe529b93f 100644
--- a/ngraph/test/visitors/op/cos.cpp
+++ b/ngraph/test/visitors/op/cos.cpp
@@ -3,7 +3,8 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Cos, element::f32>>;
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Cos, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/cosh.cpp b/ngraph/test/visitors/op/cosh.cpp
index d44b7701eb3bac..308f9e85deb9d7 100644
--- a/ngraph/test/visitors/op/cosh.cpp
+++ b/ngraph/test/visitors/op/cosh.cpp
@@ -3,7 +3,8 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Cosh, element::f32>>;
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Cosh, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/erf.cpp b/ngraph/test/visitors/op/erf.cpp
index e0aab057a85097..0e14a14d3f3cb8 100644
--- a/ngraph/test/visitors/op/erf.cpp
+++ b/ngraph/test/visitors/op/erf.cpp
@@ -4,7 +4,7 @@
 
 #include "unary_ops.hpp"
 
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Erf, element::f32>>;
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Erf, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_atrribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/floor.cpp b/ngraph/test/visitors/op/floor.cpp
index 6393a8295f2e7b..145c7d8804c780 100644
--- a/ngraph/test/visitors/op/floor.cpp
+++ b/ngraph/test/visitors/op/floor.cpp
@@ -4,8 +4,8 @@
 
 #include "unary_ops.hpp"
 
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Floor, element::f32>,
-                               UnaryOperatorType<ngraph::op::v0::Floor, element::f16>>;
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Floor, ngraph::element::f32>,
+                               UnaryOperatorType<ngraph::op::v0::Floor, ngraph::element::f16>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/log.cpp b/ngraph/test/visitors/op/log.cpp
index f81d40e7302edd..3ac1e04b46ed57 100644
--- a/ngraph/test/visitors/op/log.cpp
+++ b/ngraph/test/visitors/op/log.cpp
@@ -1,9 +1,11 @@
 // Copyright (C) 2021 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
+
 #include "unary_ops.hpp"
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Log, element::f32>,
-                               UnaryOperatorType<ngraph::op::v0::Log, element::f16>>;
+
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Log, ngraph::element::f32>,
+                               UnaryOperatorType<ngraph::op::v0::Log, ngraph::element::f16>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/negative.cpp b/ngraph/test/visitors/op/negative.cpp
index 4880c73c0af5a5..c71cc64cb9973a 100644
--- a/ngraph/test/visitors/op/negative.cpp
+++ b/ngraph/test/visitors/op/negative.cpp
@@ -4,8 +4,8 @@
 
 #include "unary_ops.hpp"
 
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Negative, element::f32>,
-                               UnaryOperatorType<ngraph::op::v0::Negative, element::i32>>;
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Negative, ngraph::element::f32>,
+                               UnaryOperatorType<ngraph::op::v0::Negative, ngraph::element::i32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/result.cpp b/ngraph/test/visitors/op/result.cpp
index 8adbe76321bea2..49a022037785c4 100644
--- a/ngraph/test/visitors/op/result.cpp
+++ b/ngraph/test/visitors/op/result.cpp
@@ -4,8 +4,8 @@
 
 #include "unary_ops.hpp"
 
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Result, element::f32>,
-                               UnaryOperatorType<ngraph::op::v0::Result, element::f16>>;
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Result, ngraph::element::f32>,
+                               UnaryOperatorType<ngraph::op::v0::Result, ngraph::element::f16>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/sign.cpp b/ngraph/test/visitors/op/sign.cpp
index 557b7dc1669ec2..5ef604744ae8cf 100644
--- a/ngraph/test/visitors/op/sign.cpp
+++ b/ngraph/test/visitors/op/sign.cpp
@@ -3,7 +3,8 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sign, element::f32>>;
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sign, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/sinh.cpp b/ngraph/test/visitors/op/sinh.cpp
index db35d185c4a741..0f780a8f3c7cf9 100644
--- a/ngraph/test/visitors/op/sinh.cpp
+++ b/ngraph/test/visitors/op/sinh.cpp
@@ -3,9 +3,10 @@
 //
 
 #include "unary_ops.hpp"
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sinh, element::f32>>;
+
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sinh, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
-                              UnaryOperatorVisitor,
-                              Type,
-                              UnaryOperatorTypeName);
+                               UnaryOperatorVisitor,
+                               Type,
+                               UnaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/softplus.cpp b/ngraph/test/visitors/op/softplus.cpp
index 6f0134b5a8273c..e27c13ecd22257 100644
--- a/ngraph/test/visitors/op/softplus.cpp
+++ b/ngraph/test/visitors/op/softplus.cpp
@@ -4,7 +4,7 @@
 
 #include "unary_ops.hpp"
 
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v4::SoftPlus, element::f32>>;
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v4::SoftPlus, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_atrribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/sqrt.cpp b/ngraph/test/visitors/op/sqrt.cpp
index 7bedbe3d28a701..6bf6e0e286c6d3 100644
--- a/ngraph/test/visitors/op/sqrt.cpp
+++ b/ngraph/test/visitors/op/sqrt.cpp
@@ -3,8 +3,9 @@
 //
 
 #include "unary_ops.hpp"
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sqrt, element::f32>,
-                               UnaryOperatorType<ngraph::op::v0::Sqrt, element::f16>>;
+
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Sqrt, ngraph::element::f32>,
+                               UnaryOperatorType<ngraph::op::v0::Sqrt, ngraph::element::f16>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/squeeze.cpp b/ngraph/test/visitors/op/squeeze.cpp
index 5a14b08864c4d4..5863f255c4e9e7 100644
--- a/ngraph/test/visitors/op/squeeze.cpp
+++ b/ngraph/test/visitors/op/squeeze.cpp
@@ -3,8 +3,9 @@
 //
 
 #include "unary_ops.hpp"
-using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Squeeze, element::f32>,
-                               UnaryOperatorType<ngraph::op::v0::Squeeze, element::f16>>;
+
+using Types = ::testing::Types<UnaryOperatorType<ngraph::op::v0::Squeeze, ngraph::element::f32>,
+                               UnaryOperatorType<ngraph::op::v0::Squeeze, ngraph::element::f16>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_attribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/swish.cpp b/ngraph/test/visitors/op/swish.cpp
index 8bfc74c0e5d8c8..34388a44815c39 100644
--- a/ngraph/test/visitors/op/swish.cpp
+++ b/ngraph/test/visitors/op/swish.cpp
@@ -1,9 +1,10 @@
 // Copyright (C) 2021 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
+
 #include "unary_ops.hpp"
 
-using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v4::Swish, element::f32>>;
+using Type = ::testing::Types<UnaryOperatorType<ngraph::op::v4::Swish, ngraph::element::f32>>;
 
 INSTANTIATE_TYPED_TEST_SUITE_P(visitor_without_atrribute,
                                UnaryOperatorVisitor,
diff --git a/ngraph/test/visitors/op/unary_ops.hpp b/ngraph/test/visitors/op/unary_ops.hpp
index 7bf588b52312b8..29527416a78066 100644
--- a/ngraph/test/visitors/op/unary_ops.hpp
+++ b/ngraph/test/visitors/op/unary_ops.hpp
@@ -4,21 +4,15 @@
 
 #pragma once
 
-#include <vector>
 #include "gtest/gtest.h"
-#include "ngraph/ngraph.hpp"
-
-#include "ngraph/op/util/attr_types.hpp"
 #include "util/visitor.hpp"
 
-using namespace ngraph;
-using ngraph::test::NodeBuilder;
-template <typename T, element::Type_t ELEMENT_TYPE>
+template <typename T, ngraph::element::Type_t ELEMENT_TYPE>
 class UnaryOperatorType
 {
 public:
     using op_type = T;
-    static constexpr element::Type_t element_type = ELEMENT_TYPE;
+    static constexpr ngraph::element::Type_t element_type = ELEMENT_TYPE;
 };
 template <typename T>
 class UnaryOperatorVisitor : public testing::Test
@@ -32,11 +26,9 @@ class UnaryOperatorTypeName
     static std::string GetName(int)
     {
         using OP_Type = typename T::op_type;
-        constexpr element::Type precision(T::element_type);
+        constexpr ngraph::element::Type precision(T::element_type);
         const ngraph::Node::type_info_t typeinfo = OP_Type::get_type_info_static();
-        std::string op_name{typeinfo.name};
-        op_name.append("_");
-        return (op_name.append(precision.get_type_name()));
+        return std::string{typeinfo.name} + "_" + precision.get_type_name();
     }
 };
 
@@ -45,13 +37,13 @@ TYPED_TEST_SUITE_P(UnaryOperatorVisitor);
 TYPED_TEST_P(UnaryOperatorVisitor, No_Attribute_4D)
 {
     using OP_Type = typename TypeParam::op_type;
-    const element::Type_t element_type = TypeParam::element_type;
+    const ngraph::element::Type_t element_type = TypeParam::element_type;
 
-    NodeBuilder::get_ops().register_factory<OP_Type>();
-    const auto A = std::make_shared<op::Parameter>(element_type, PartialShape{2, 2, 2, 2});
+    ngraph::test::NodeBuilder::get_ops().register_factory<OP_Type>();
+    const auto A = std::make_shared<ngraph::op::Parameter>(element_type, ngraph::PartialShape{2, 2, 2, 2});
 
     const auto op_func = std::make_shared<OP_Type>(A);
-    NodeBuilder builder(op_func);
+    ngraph::test::NodeBuilder builder(op_func);
     const auto expected_attr_count = 0;
     EXPECT_EQ(builder.get_value_map_size(), expected_attr_count);
 }

From b4ad7a1755b4799f92ef042bacc719ec3c0c1cbd Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Dawid=20Ko=C5=BCykowski?= <dawid.kozykowski@intel.com>
Date: Mon, 26 Jul 2021 14:49:14 +0200
Subject: [PATCH 69/71] Refactor visitor tests for BinaryElementwiseArithmetic
 ops (#6667)

* add binary_elementwise file

* change binary_elementwise.hpp to binary_ops.hpp

* migrate mod operation test o typed template test

* add tests for remaining binary ops

* remove comment

* fix formatting to match clang-format

* add RVO-exploit string concatenating andbeautify the code

* add validation for attributes number

* add missing visit_attributes() calls

* add missing 4th param to NGRAPH_RTTI_DEFINITION calls

* fix formatting to match clang-format
---
 ngraph/core/include/ngraph/op/broadcast.hpp   |  4 +-
 ngraph/core/include/ngraph/op/bucketize.hpp   |  4 +-
 ngraph/core/include/ngraph/op/cum_sum.hpp     |  4 +-
 ngraph/core/include/ngraph/op/floor_mod.hpp   |  4 +-
 ngraph/core/include/ngraph/op/maximum.hpp     |  4 +-
 ngraph/core/include/ngraph/op/minimum.hpp     |  4 +-
 ngraph/core/include/ngraph/op/mod.hpp         |  4 +-
 ngraph/core/include/ngraph/op/power.hpp       |  4 +-
 ngraph/core/include/ngraph/op/roi_pooling.hpp |  4 +-
 ngraph/core/include/ngraph/op/tanh.hpp        |  4 +-
 .../op/util/binary_elementwise_comparison.hpp |  2 +
 ngraph/core/src/op/broadcast.cpp              |  2 +-
 ngraph/core/src/op/bucketize.cpp              |  2 +-
 ngraph/core/src/op/cum_sum.cpp                |  2 +-
 ngraph/core/src/op/equal.cpp                  |  3 +-
 ngraph/core/src/op/floor_mod.cpp              |  3 +-
 ngraph/core/src/op/greater.cpp                |  2 +-
 ngraph/core/src/op/greater_eq.cpp             |  6 +-
 ngraph/core/src/op/less.cpp                   |  2 +-
 ngraph/core/src/op/less_eq.cpp                |  2 +-
 ngraph/core/src/op/maximum.cpp                |  2 +-
 ngraph/core/src/op/minimum.cpp                |  2 +-
 ngraph/core/src/op/mod.cpp                    |  2 +-
 ngraph/core/src/op/not_equal.cpp              |  3 +-
 ngraph/core/src/op/power.cpp                  |  2 +-
 ngraph/core/src/op/roi_pooling.cpp            |  2 +-
 ngraph/core/src/op/tanh.cpp                   |  2 +-
 .../op/util/binary_elementwise_comparison.cpp |  2 +
 ngraph/test/CMakeLists.txt                    | 16 ++++-
 ngraph/test/visitors/op/add.cpp               | 13 ++++
 ngraph/test/visitors/op/binary_ops.hpp        | 60 +++++++++++++++++++
 ngraph/test/visitors/op/equal.cpp             | 13 ++++
 ngraph/test/visitors/op/floor_mod.cpp         | 13 ++++
 ngraph/test/visitors/op/greater.cpp           | 13 ++++
 ngraph/test/visitors/op/greater_equal.cpp     | 14 +++++
 ngraph/test/visitors/op/less.cpp              | 13 ++++
 ngraph/test/visitors/op/less_equal.cpp        | 13 ++++
 ngraph/test/visitors/op/logical_or.cpp        | 14 +++++
 ngraph/test/visitors/op/logical_xor.cpp       | 34 +++--------
 ngraph/test/visitors/op/maximum.cpp           | 13 ++++
 ngraph/test/visitors/op/minimum.cpp           | 13 ++++
 ngraph/test/visitors/op/mod.cpp               | 33 ++--------
 ngraph/test/visitors/op/multiply.cpp          | 13 ++++
 ngraph/test/visitors/op/not_equal.cpp         | 13 ++++
 ngraph/test/visitors/op/power.cpp             | 13 ++++
 .../test/visitors/op/squared_difference.cpp   | 32 +++-------
 ngraph/test/visitors/op/subtract.cpp          | 13 ++++
 47 files changed, 326 insertions(+), 116 deletions(-)
 create mode 100644 ngraph/test/visitors/op/add.cpp
 create mode 100644 ngraph/test/visitors/op/binary_ops.hpp
 create mode 100644 ngraph/test/visitors/op/equal.cpp
 create mode 100644 ngraph/test/visitors/op/floor_mod.cpp
 create mode 100644 ngraph/test/visitors/op/greater.cpp
 create mode 100644 ngraph/test/visitors/op/greater_equal.cpp
 create mode 100644 ngraph/test/visitors/op/less.cpp
 create mode 100644 ngraph/test/visitors/op/less_equal.cpp
 create mode 100644 ngraph/test/visitors/op/logical_or.cpp
 create mode 100644 ngraph/test/visitors/op/maximum.cpp
 create mode 100644 ngraph/test/visitors/op/minimum.cpp
 create mode 100644 ngraph/test/visitors/op/multiply.cpp
 create mode 100644 ngraph/test/visitors/op/not_equal.cpp
 create mode 100644 ngraph/test/visitors/op/power.cpp
 create mode 100644 ngraph/test/visitors/op/subtract.cpp

diff --git a/ngraph/core/include/ngraph/op/broadcast.hpp b/ngraph/core/include/ngraph/op/broadcast.hpp
index 665668bcab63ae..838115084a0945 100644
--- a/ngraph/core/include/ngraph/op/broadcast.hpp
+++ b/ngraph/core/include/ngraph/op/broadcast.hpp
@@ -20,8 +20,8 @@ namespace ngraph
             class NGRAPH_API Broadcast : public util::BroadcastBase
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Broadcast", 3};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs a broadcast operation.
                 Broadcast() = default;
                 /// \brief Constructs a broadcast operation.
diff --git a/ngraph/core/include/ngraph/op/bucketize.hpp b/ngraph/core/include/ngraph/op/bucketize.hpp
index f45cbd4746e49b..6f6145b797278c 100644
--- a/ngraph/core/include/ngraph/op/bucketize.hpp
+++ b/ngraph/core/include/ngraph/op/bucketize.hpp
@@ -16,8 +16,8 @@ namespace ngraph
             class NGRAPH_API Bucketize : public Op
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Bucketize", 3};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 Bucketize() = default;
                 /// \brief Constructs a Bucketize node
 
diff --git a/ngraph/core/include/ngraph/op/cum_sum.hpp b/ngraph/core/include/ngraph/op/cum_sum.hpp
index 72cfe89225642d..120d134300e7e0 100644
--- a/ngraph/core/include/ngraph/op/cum_sum.hpp
+++ b/ngraph/core/include/ngraph/op/cum_sum.hpp
@@ -60,8 +60,8 @@ namespace ngraph
             class NGRAPH_API CumSum : public Op
             {
             public:
-                static constexpr NodeTypeInfo type_info{"CumSum", 0};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs a cumulative summation operation.
                 CumSum() = default;
 
diff --git a/ngraph/core/include/ngraph/op/floor_mod.hpp b/ngraph/core/include/ngraph/op/floor_mod.hpp
index 9cc1d25557da72..ba8af70fcc4604 100644
--- a/ngraph/core/include/ngraph/op/floor_mod.hpp
+++ b/ngraph/core/include/ngraph/op/floor_mod.hpp
@@ -19,8 +19,8 @@ namespace ngraph
             class NGRAPH_API FloorMod : public util::BinaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"FloorMod", 1};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs an uninitialized addition operation
                 FloorMod()
                     : util::BinaryElementwiseArithmetic(AutoBroadcastSpec::NUMPY){};
diff --git a/ngraph/core/include/ngraph/op/maximum.hpp b/ngraph/core/include/ngraph/op/maximum.hpp
index 154801336e0d00..d4135285600b02 100644
--- a/ngraph/core/include/ngraph/op/maximum.hpp
+++ b/ngraph/core/include/ngraph/op/maximum.hpp
@@ -16,8 +16,8 @@ namespace ngraph
             class NGRAPH_API Maximum : public util::BinaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Maximum", 1};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs a maximum operation.
                 Maximum()
                     : util::BinaryElementwiseArithmetic(AutoBroadcastSpec::NUMPY)
diff --git a/ngraph/core/include/ngraph/op/minimum.hpp b/ngraph/core/include/ngraph/op/minimum.hpp
index 33ef1395e9309a..edf192762186f9 100644
--- a/ngraph/core/include/ngraph/op/minimum.hpp
+++ b/ngraph/core/include/ngraph/op/minimum.hpp
@@ -16,8 +16,8 @@ namespace ngraph
             class NGRAPH_API Minimum : public util::BinaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Minimum", 1};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs a minimum operation.
                 Minimum()
                     : util::BinaryElementwiseArithmetic(AutoBroadcastSpec::NUMPY)
diff --git a/ngraph/core/include/ngraph/op/mod.hpp b/ngraph/core/include/ngraph/op/mod.hpp
index 4b9851be6b6758..50d351c3358300 100644
--- a/ngraph/core/include/ngraph/op/mod.hpp
+++ b/ngraph/core/include/ngraph/op/mod.hpp
@@ -17,8 +17,8 @@ namespace ngraph
             class NGRAPH_API Mod : public util::BinaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Mod", 0};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs a Mod node.
                 Mod()
                     : util::BinaryElementwiseArithmetic(AutoBroadcastSpec::NUMPY)
diff --git a/ngraph/core/include/ngraph/op/power.hpp b/ngraph/core/include/ngraph/op/power.hpp
index 0d800f538e5a02..3fbd29a29945c3 100644
--- a/ngraph/core/include/ngraph/op/power.hpp
+++ b/ngraph/core/include/ngraph/op/power.hpp
@@ -31,8 +31,8 @@ namespace ngraph
             class NGRAPH_API Power : public util::BinaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Power", 1};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 Power()
                     : util::BinaryElementwiseArithmetic(AutoBroadcastSpec::NUMPY)
                 {
diff --git a/ngraph/core/include/ngraph/op/roi_pooling.hpp b/ngraph/core/include/ngraph/op/roi_pooling.hpp
index 2fcf3443639bb8..d1dc8fbd5e67b5 100644
--- a/ngraph/core/include/ngraph/op/roi_pooling.hpp
+++ b/ngraph/core/include/ngraph/op/roi_pooling.hpp
@@ -15,8 +15,8 @@ namespace ngraph
             class NGRAPH_API ROIPooling : public Op
             {
             public:
-                static constexpr NodeTypeInfo type_info{"ROIPooling", 0};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 ROIPooling() = default;
                 /// \brief Constructs a ROIPooling operation
                 ///
diff --git a/ngraph/core/include/ngraph/op/tanh.hpp b/ngraph/core/include/ngraph/op/tanh.hpp
index b67849ed20cdb3..61dec52f2138ad 100644
--- a/ngraph/core/include/ngraph/op/tanh.hpp
+++ b/ngraph/core/include/ngraph/op/tanh.hpp
@@ -16,8 +16,8 @@ namespace ngraph
             class NGRAPH_API Tanh : public util::UnaryElementwiseArithmetic
             {
             public:
-                static constexpr NodeTypeInfo type_info{"Tanh", 0};
-                const NodeTypeInfo& get_type_info() const override { return type_info; }
+                NGRAPH_RTTI_DECLARATION;
+
                 /// \brief Constructs a hyperbolic tangent operation.
                 ///
                 /// \param arg Node that produces the input tensor.
diff --git a/ngraph/core/include/ngraph/op/util/binary_elementwise_comparison.hpp b/ngraph/core/include/ngraph/op/util/binary_elementwise_comparison.hpp
index 64ca2502b418d0..e94a3c5a6b4b3d 100644
--- a/ngraph/core/include/ngraph/op/util/binary_elementwise_comparison.hpp
+++ b/ngraph/core/include/ngraph/op/util/binary_elementwise_comparison.hpp
@@ -55,6 +55,8 @@ namespace ngraph
                                             const AutoBroadcastSpec& autob = AutoBroadcastSpec());
 
             public:
+                NGRAPH_RTTI_DECLARATION;
+
                 void validate_and_infer_types() override;
 
                 const AutoBroadcastSpec& get_autob() const override { return m_autob; }
diff --git a/ngraph/core/src/op/broadcast.cpp b/ngraph/core/src/op/broadcast.cpp
index 819937202037cf..1e775be5fa3a68 100644
--- a/ngraph/core/src/op/broadcast.cpp
+++ b/ngraph/core/src/op/broadcast.cpp
@@ -17,7 +17,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::v3::Broadcast::type_info;
+NGRAPH_RTTI_DEFINITION(op::v3::Broadcast, "Broadcast", 3, op::util::BroadcastBase);
 
 op::v3::Broadcast::Broadcast(const Output<Node>& arg,
                              const Output<Node>& target_shape,
diff --git a/ngraph/core/src/op/bucketize.cpp b/ngraph/core/src/op/bucketize.cpp
index 4ee5270bab2942..fbe7f3ae7f3ac2 100644
--- a/ngraph/core/src/op/bucketize.cpp
+++ b/ngraph/core/src/op/bucketize.cpp
@@ -8,7 +8,7 @@
 using namespace ngraph;
 using namespace std;
 
-constexpr NodeTypeInfo op::v3::Bucketize::type_info;
+NGRAPH_RTTI_DEFINITION(op::v3::Bucketize, "Bucketize", 3);
 
 op::v3::Bucketize::Bucketize(const Output<Node>& data,
                              const Output<Node>& buckets,
diff --git a/ngraph/core/src/op/cum_sum.cpp b/ngraph/core/src/op/cum_sum.cpp
index f8a7286eb86da6..00ad8c631ab448 100644
--- a/ngraph/core/src/op/cum_sum.cpp
+++ b/ngraph/core/src/op/cum_sum.cpp
@@ -12,7 +12,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::v0::CumSum::type_info;
+NGRAPH_RTTI_DEFINITION(op::v0::CumSum, "CumSum", 0);
 
 op::v0::CumSum::CumSum(const Output<Node>& arg,
                        const Output<Node>& axis,
diff --git a/ngraph/core/src/op/equal.cpp b/ngraph/core/src/op/equal.cpp
index d70abc1537caad..e9f8b57ec55248 100644
--- a/ngraph/core/src/op/equal.cpp
+++ b/ngraph/core/src/op/equal.cpp
@@ -51,7 +51,7 @@ namespace equal
 
 //------------------------------- v1 -------------------------------------------
 
-NGRAPH_RTTI_DEFINITION(op::v1::Equal, "Equal", 1);
+NGRAPH_RTTI_DEFINITION(op::v1::Equal, "Equal", 1, op::util::BinaryElementwiseComparison);
 
 op::v1::Equal::Equal(const Output<Node>& arg0,
                      const Output<Node>& arg1,
@@ -94,5 +94,6 @@ bool op::v1::Equal::has_evaluate() const
 bool op::v1::Equal::visit_attributes(AttributeVisitor& visitor)
 {
     NGRAPH_OP_SCOPE(v1_Equal_visit_attributes);
+    BinaryElementwiseComparison::visit_attributes(visitor);
     return true;
 }
diff --git a/ngraph/core/src/op/floor_mod.cpp b/ngraph/core/src/op/floor_mod.cpp
index 3ccb7a295246d1..23b840981461dc 100644
--- a/ngraph/core/src/op/floor_mod.cpp
+++ b/ngraph/core/src/op/floor_mod.cpp
@@ -10,7 +10,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::v1::FloorMod::type_info;
+NGRAPH_RTTI_DEFINITION(op::v1::FloorMod, "FloorMod", 1, op::util::BinaryElementwiseArithmetic);
 
 op::v1::FloorMod::FloorMod(const Output<Node>& arg0,
                            const Output<Node>& arg1,
@@ -97,5 +97,6 @@ bool op::v1::FloorMod::has_evaluate() const
 bool op::v1::FloorMod::visit_attributes(AttributeVisitor& visitor)
 {
     NGRAPH_OP_SCOPE(v1_FloorMod_visit_attributes);
+    BinaryElementwiseArithmetic::visit_attributes(visitor);
     return true;
 }
diff --git a/ngraph/core/src/op/greater.cpp b/ngraph/core/src/op/greater.cpp
index bbc28493346861..fc3333472fbc4a 100644
--- a/ngraph/core/src/op/greater.cpp
+++ b/ngraph/core/src/op/greater.cpp
@@ -51,7 +51,7 @@ namespace greaterop
 
 //-------------------------------------- v1 ------------------------------------
 
-NGRAPH_RTTI_DEFINITION(op::v1::Greater, "Greater", 1);
+NGRAPH_RTTI_DEFINITION(op::v1::Greater, "Greater", 1, op::util::BinaryElementwiseComparison);
 
 op::v1::Greater::Greater(const Output<Node>& arg0,
                          const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/greater_eq.cpp b/ngraph/core/src/op/greater_eq.cpp
index 3db1d4155a5c88..11c099dcc5df11 100644
--- a/ngraph/core/src/op/greater_eq.cpp
+++ b/ngraph/core/src/op/greater_eq.cpp
@@ -51,7 +51,10 @@ namespace greater_equalop
 
 //---------------------------------- v1 ----------------------------------------
 
-NGRAPH_RTTI_DEFINITION(op::v1::GreaterEqual, "GreaterEqual", 1);
+NGRAPH_RTTI_DEFINITION(op::v1::GreaterEqual,
+                       "GreaterEqual",
+                       1,
+                       op::util::BinaryElementwiseComparison);
 
 op::v1::GreaterEqual::GreaterEqual(const Output<Node>& arg0,
                                    const Output<Node>& arg1,
@@ -95,5 +98,6 @@ bool op::v1::GreaterEqual::has_evaluate() const
 bool op::v1::GreaterEqual::visit_attributes(AttributeVisitor& visitor)
 {
     NGRAPH_OP_SCOPE(v1_GreaterEqual_visit_attributes);
+    BinaryElementwiseComparison::visit_attributes(visitor);
     return true;
 }
diff --git a/ngraph/core/src/op/less.cpp b/ngraph/core/src/op/less.cpp
index d9b4e8dfeb986b..af0131f0d8bee9 100644
--- a/ngraph/core/src/op/less.cpp
+++ b/ngraph/core/src/op/less.cpp
@@ -51,7 +51,7 @@ namespace lessop
 
 // ----------------------------- v1 --------------------------------------------
 
-NGRAPH_RTTI_DEFINITION(op::v1::Less, "Less", 1);
+NGRAPH_RTTI_DEFINITION(op::v1::Less, "Less", 1, op::util::BinaryElementwiseComparison);
 
 op::v1::Less::Less(const Output<Node>& arg0,
                    const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/less_eq.cpp b/ngraph/core/src/op/less_eq.cpp
index 3528090de462ea..9e00e738929ddc 100644
--- a/ngraph/core/src/op/less_eq.cpp
+++ b/ngraph/core/src/op/less_eq.cpp
@@ -12,7 +12,7 @@ using namespace ngraph;
 
 // ---------------------------------- v1 ---------------------------------------
 
-NGRAPH_RTTI_DEFINITION(op::v1::LessEqual, "LessEqual", 1);
+NGRAPH_RTTI_DEFINITION(op::v1::LessEqual, "LessEqual", 1, op::util::BinaryElementwiseComparison);
 
 op::v1::LessEqual::LessEqual(const Output<Node>& arg0,
                              const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/maximum.cpp b/ngraph/core/src/op/maximum.cpp
index 0733759c2b5e72..7d06d67b35635b 100644
--- a/ngraph/core/src/op/maximum.cpp
+++ b/ngraph/core/src/op/maximum.cpp
@@ -58,7 +58,7 @@ namespace maximumop
 
 // ------------------------------------ v1 -------------------------------------
 
-constexpr NodeTypeInfo op::v1::Maximum::type_info;
+NGRAPH_RTTI_DEFINITION(op::v1::Maximum, "Maximum", 1, op::util::BinaryElementwiseArithmetic);
 
 op::v1::Maximum::Maximum(const Output<Node>& arg0,
                          const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/minimum.cpp b/ngraph/core/src/op/minimum.cpp
index bd0ff3f79f633c..cfa7abeffaf289 100644
--- a/ngraph/core/src/op/minimum.cpp
+++ b/ngraph/core/src/op/minimum.cpp
@@ -56,7 +56,7 @@ namespace minimumop
 
 // ------------------------------ v1 -------------------------------------------
 
-constexpr NodeTypeInfo op::v1::Minimum::type_info;
+NGRAPH_RTTI_DEFINITION(op::v1::Minimum, "Minimum", 1, op::util::BinaryElementwiseArithmetic);
 
 op::v1::Minimum::Minimum(const Output<Node>& arg0,
                          const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/mod.cpp b/ngraph/core/src/op/mod.cpp
index 8f3703c829fbf4..12b323e6ebdd48 100644
--- a/ngraph/core/src/op/mod.cpp
+++ b/ngraph/core/src/op/mod.cpp
@@ -10,7 +10,7 @@ using namespace ngraph;
 
 // ------------------------------ v1 -------------------------------------------
 
-constexpr NodeTypeInfo op::v1::Mod::type_info;
+NGRAPH_RTTI_DEFINITION(op::v1::Mod, "Mod", 1, op::util::BinaryElementwiseArithmetic);
 
 op::v1::Mod::Mod(const Output<Node>& arg0,
                  const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/not_equal.cpp b/ngraph/core/src/op/not_equal.cpp
index a53ea2ee74f9ff..1e079c361631f4 100644
--- a/ngraph/core/src/op/not_equal.cpp
+++ b/ngraph/core/src/op/not_equal.cpp
@@ -51,7 +51,7 @@ namespace not_equalop
 
 // ----------------------------------- v1 --------------------------------------
 
-NGRAPH_RTTI_DEFINITION(op::v1::NotEqual, "NotEqual", 1);
+NGRAPH_RTTI_DEFINITION(op::v1::NotEqual, "NotEqual", 1, op::util::BinaryElementwiseComparison);
 
 op::v1::NotEqual::NotEqual(const Output<Node>& arg0,
                            const Output<Node>& arg1,
@@ -95,5 +95,6 @@ bool op::v1::NotEqual::has_evaluate() const
 bool op::v1::NotEqual::visit_attributes(AttributeVisitor& visitor)
 {
     NGRAPH_OP_SCOPE(v1_NotEqual_visit_attributes);
+    BinaryElementwiseComparison::visit_attributes(visitor);
     return true;
 }
diff --git a/ngraph/core/src/op/power.cpp b/ngraph/core/src/op/power.cpp
index 10695c755b5708..1a52c959cd8694 100644
--- a/ngraph/core/src/op/power.cpp
+++ b/ngraph/core/src/op/power.cpp
@@ -54,7 +54,7 @@ namespace power
 
 // ------------------------------ v1 -------------------------------------------
 
-constexpr NodeTypeInfo op::v1::Power::type_info;
+NGRAPH_RTTI_DEFINITION(op::v1::Power, "Power", 1, op::util::BinaryElementwiseArithmetic);
 
 op::v1::Power::Power(const Output<Node>& arg0,
                      const Output<Node>& arg1,
diff --git a/ngraph/core/src/op/roi_pooling.cpp b/ngraph/core/src/op/roi_pooling.cpp
index 2aac3d9f786ffb..3d287a6581c00d 100644
--- a/ngraph/core/src/op/roi_pooling.cpp
+++ b/ngraph/core/src/op/roi_pooling.cpp
@@ -8,7 +8,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::ROIPooling::type_info;
+NGRAPH_RTTI_DEFINITION(op::ROIPooling, "ROIPooling", 0);
 
 op::ROIPooling::ROIPooling(const Output<Node>& input,
                            const Output<Node>& coords,
diff --git a/ngraph/core/src/op/tanh.cpp b/ngraph/core/src/op/tanh.cpp
index c251f1c63a50f6..e392507475b15c 100644
--- a/ngraph/core/src/op/tanh.cpp
+++ b/ngraph/core/src/op/tanh.cpp
@@ -14,7 +14,7 @@
 using namespace std;
 using namespace ngraph;
 
-constexpr NodeTypeInfo op::Tanh::type_info;
+NGRAPH_RTTI_DEFINITION(op::v0::Tanh, "Tanh", 0, op::util::UnaryElementwiseArithmetic);
 
 op::Tanh::Tanh(const Output<Node>& arg)
     : UnaryElementwiseArithmetic(arg)
diff --git a/ngraph/core/src/op/util/binary_elementwise_comparison.cpp b/ngraph/core/src/op/util/binary_elementwise_comparison.cpp
index e8b878c3ed7d39..3fd5ee8d3bc728 100644
--- a/ngraph/core/src/op/util/binary_elementwise_comparison.cpp
+++ b/ngraph/core/src/op/util/binary_elementwise_comparison.cpp
@@ -10,6 +10,8 @@
 using namespace std;
 using namespace ngraph;
 
+NGRAPH_RTTI_DEFINITION(op::util::BinaryElementwiseComparison, "BinaryElementwiseComparison", 0);
+
 op::util::BinaryElementwiseComparison::BinaryElementwiseComparison(const AutoBroadcastSpec& autob)
     : m_autob(autob)
 {
diff --git a/ngraph/test/CMakeLists.txt b/ngraph/test/CMakeLists.txt
index 1ac0ef0f3458b5..917be3ceb5f63f 100644
--- a/ngraph/test/CMakeLists.txt
+++ b/ngraph/test/CMakeLists.txt
@@ -234,6 +234,7 @@ set(SRC
     visitors/op/acosh.cpp
     visitors/op/adaptive_avg_pool.cpp
     visitors/op/adaptive_max_pool.cpp
+    visitors/op/add.cpp
     visitors/op/asinh.cpp
     visitors/op/atan.cpp
     visitors/op/batch_norm.cpp
@@ -253,16 +254,23 @@ set(SRC
     visitors/op/detection_output.cpp
     visitors/op/einsum.cpp
     visitors/op/elu.cpp
+    visitors/op/equal.cpp
     visitors/op/erf.cpp
     visitors/op/extractimagepatches.cpp
     visitors/op/fake_quantize.cpp
+    visitors/op/floor_mod.cpp
     visitors/op/floor.cpp
     visitors/op/gather.cpp
     visitors/op/gelu.cpp
+    visitors/op/greater_equal.cpp
+    visitors/op/greater.cpp
     visitors/op/grn.cpp
     visitors/op/group_conv.cpp
     visitors/op/interpolate.cpp
+    visitors/op/less_equal.cpp
+    visitors/op/less.cpp
     visitors/op/log.cpp
+    visitors/op/logical_or.cpp
     visitors/op/logical_xor.cpp
     visitors/op/lrn.cpp
     visitors/op/lstm_cell.cpp
@@ -270,17 +278,22 @@ set(SRC
     visitors/op/matmul.cpp
     visitors/op/matrix_nms.cpp
     visitors/op/max_pool.cpp
+    visitors/op/maximum.cpp
+    visitors/op/minimum.cpp
     visitors/op/mish.cpp
     visitors/op/mod.cpp
     visitors/op/multiclass_nms.cpp
+    visitors/op/multiply.cpp
     visitors/op/mvn.cpp
     visitors/op/negative.cpp
     visitors/op/non_max_suppression.cpp
     visitors/op/non_zero.cpp
     visitors/op/normalize_l2.cpp
+    visitors/op/not_equal.cpp
     visitors/op/one_hot.cpp
     visitors/op/pad.cpp
     visitors/op/parameter.cpp
+    visitors/op/power.cpp
     visitors/op/prior_box.cpp
     visitors/op/prior_box_clustered.cpp
     visitors/op/proposal.cpp
@@ -314,10 +327,11 @@ set(SRC
     visitors/op/space_to_batch.cpp
     visitors/op/space_to_depth.cpp
     visitors/op/split.cpp
+    visitors/op/sqrt.cpp
     visitors/op/squared_difference.cpp
     visitors/op/squeeze.cpp
-    visitors/op/sqrt.cpp
     visitors/op/strided_slice.cpp
+    visitors/op/subtract.cpp
     visitors/op/swish.cpp
     visitors/op/tanh.cpp
     visitors/op/topk.cpp
diff --git a/ngraph/test/visitors/op/add.cpp b/ngraph/test/visitors/op/add.cpp
new file mode 100644
index 00000000000000..1f13a33c1ba279
--- /dev/null
+++ b/ngraph/test/visitors/op/add.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Add, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/binary_ops.hpp b/ngraph/test/visitors/op/binary_ops.hpp
new file mode 100644
index 00000000000000..6c94d5c4596730
--- /dev/null
+++ b/ngraph/test/visitors/op/binary_ops.hpp
@@ -0,0 +1,60 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "gtest/gtest.h"
+#include "util/visitor.hpp"
+
+template <typename T, ngraph::element::Type_t ELEMENT_TYPE>
+class BinaryOperatorType
+{
+public:
+    using op_type = T;
+    static constexpr ngraph::element::Type_t element_type = ELEMENT_TYPE;
+};
+
+template <typename T>
+class BinaryOperatorVisitor : public testing::Test
+{
+};
+
+class BinaryOperatorTypeName
+{
+public:
+    template <typename T>
+    static std::string GetName(int)
+    {
+        using OP_Type = typename T::op_type;
+        constexpr ngraph::element::Type precision(T::element_type);
+        const ngraph::Node::type_info_t typeinfo = OP_Type::get_type_info_static();
+        return std::string{typeinfo.name} + "_" + precision.get_type_name();
+    }
+};
+
+TYPED_TEST_SUITE_P(BinaryOperatorVisitor);
+
+TYPED_TEST_P(BinaryOperatorVisitor, Auto_Broadcast)
+{
+    using OP_Type = typename TypeParam::op_type;
+    const ngraph::element::Type_t element_type = TypeParam::element_type;
+
+    ngraph::test::NodeBuilder::get_ops().register_factory<OP_Type>();
+    const auto A =
+        std::make_shared<ngraph::op::Parameter>(element_type, ngraph::PartialShape{1, 2, 3});
+    const auto B =
+        std::make_shared<ngraph::op::Parameter>(element_type, ngraph::PartialShape{3, 2, 1});
+
+    auto auto_broadcast = ngraph::op::AutoBroadcastType::NUMPY;
+
+    const auto op_func = std::make_shared<OP_Type>(A, B, auto_broadcast);
+    ngraph::test::NodeBuilder builder(op_func);
+    const auto g_op_func = ngraph::as_type_ptr<OP_Type>(builder.create());
+
+    const auto expected_attr_count = 1;
+    EXPECT_EQ(builder.get_value_map_size(), expected_attr_count);
+    EXPECT_EQ(op_func->get_autob(), g_op_func->get_autob());
+}
+
+REGISTER_TYPED_TEST_SUITE_P(BinaryOperatorVisitor, Auto_Broadcast);
diff --git a/ngraph/test/visitors/op/equal.cpp b/ngraph/test/visitors/op/equal.cpp
new file mode 100644
index 00000000000000..af23535c866821
--- /dev/null
+++ b/ngraph/test/visitors/op/equal.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Equal, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/floor_mod.cpp b/ngraph/test/visitors/op/floor_mod.cpp
new file mode 100644
index 00000000000000..9a1b9e2a98b77e
--- /dev/null
+++ b/ngraph/test/visitors/op/floor_mod.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::FloorMod, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/greater.cpp b/ngraph/test/visitors/op/greater.cpp
new file mode 100644
index 00000000000000..71362c489f88f0
--- /dev/null
+++ b/ngraph/test/visitors/op/greater.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Greater, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/greater_equal.cpp b/ngraph/test/visitors/op/greater_equal.cpp
new file mode 100644
index 00000000000000..fb12a162ee0db2
--- /dev/null
+++ b/ngraph/test/visitors/op/greater_equal.cpp
@@ -0,0 +1,14 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type =
+    ::testing::Types<BinaryOperatorType<ngraph::opset1::GreaterEqual, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/less.cpp b/ngraph/test/visitors/op/less.cpp
new file mode 100644
index 00000000000000..91ac6c742f1a8f
--- /dev/null
+++ b/ngraph/test/visitors/op/less.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Less, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/less_equal.cpp b/ngraph/test/visitors/op/less_equal.cpp
new file mode 100644
index 00000000000000..33bb954532eed6
--- /dev/null
+++ b/ngraph/test/visitors/op/less_equal.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::LessEqual, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/logical_or.cpp b/ngraph/test/visitors/op/logical_or.cpp
new file mode 100644
index 00000000000000..fe1ca37811128d
--- /dev/null
+++ b/ngraph/test/visitors/op/logical_or.cpp
@@ -0,0 +1,14 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type =
+    ::testing::Types<BinaryOperatorType<ngraph::opset1::LogicalOr, ngraph::element::boolean>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/logical_xor.cpp b/ngraph/test/visitors/op/logical_xor.cpp
index 80f0085b094648..b30bfba4857939 100644
--- a/ngraph/test/visitors/op/logical_xor.cpp
+++ b/ngraph/test/visitors/op/logical_xor.cpp
@@ -2,33 +2,13 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "gtest/gtest.h"
-
-#include "ngraph/ngraph.hpp"
-#include "ngraph/op/util/attr_types.hpp"
+#include "binary_ops.hpp"
 #include "ngraph/opsets/opset1.hpp"
-#include "ngraph/opsets/opset3.hpp"
-#include "ngraph/opsets/opset4.hpp"
-#include "ngraph/opsets/opset5.hpp"
-
-#include "util/visitor.hpp"
-
-using namespace std;
-using namespace ngraph;
-using ngraph::test::NodeBuilder;
-using ngraph::test::ValueMap;
-
-TEST(attributes, logical_xor_op)
-{
-    NodeBuilder::get_ops().register_factory<opset1::LogicalXor>();
-    auto x1 = make_shared<op::Parameter>(element::boolean, Shape{200});
-    auto x2 = make_shared<op::Parameter>(element::boolean, Shape{200});
-
-    auto auto_broadcast = op::AutoBroadcastType::NUMPY;
 
-    auto logical_xor = make_shared<opset1::LogicalXor>(x1, x2, auto_broadcast);
-    NodeBuilder builder(logical_xor);
-    auto g_logical_xor = as_type_ptr<opset1::LogicalXor>(builder.create());
+using Type =
+    ::testing::Types<BinaryOperatorType<ngraph::opset1::LogicalXor, ngraph::element::boolean>>;
 
-    EXPECT_EQ(g_logical_xor->get_autob(), logical_xor->get_autob());
-}
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/maximum.cpp b/ngraph/test/visitors/op/maximum.cpp
new file mode 100644
index 00000000000000..26b748e019ba1a
--- /dev/null
+++ b/ngraph/test/visitors/op/maximum.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Maximum, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/minimum.cpp b/ngraph/test/visitors/op/minimum.cpp
new file mode 100644
index 00000000000000..f2c4d164280029
--- /dev/null
+++ b/ngraph/test/visitors/op/minimum.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Minimum, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/mod.cpp b/ngraph/test/visitors/op/mod.cpp
index dce8ef15a0740b..bae485b02d6996 100644
--- a/ngraph/test/visitors/op/mod.cpp
+++ b/ngraph/test/visitors/op/mod.cpp
@@ -2,33 +2,12 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "gtest/gtest.h"
-
-#include "ngraph/ngraph.hpp"
-#include "ngraph/op/util/attr_types.hpp"
+#include "binary_ops.hpp"
 #include "ngraph/opsets/opset1.hpp"
-#include "ngraph/opsets/opset3.hpp"
-#include "ngraph/opsets/opset4.hpp"
-#include "ngraph/opsets/opset5.hpp"
-
-#include "util/visitor.hpp"
-
-using namespace std;
-using namespace ngraph;
-using ngraph::test::NodeBuilder;
-using ngraph::test::ValueMap;
-
-TEST(attributes, mod_op)
-{
-    NodeBuilder::get_ops().register_factory<opset1::Mod>();
-    auto A = make_shared<op::Parameter>(element::f32, Shape{1, 2});
-    auto B = make_shared<op::Parameter>(element::f32, Shape{2, 1});
-
-    auto auto_broadcast = op::AutoBroadcastType::NUMPY;
 
-    auto mod = make_shared<opset1::Mod>(A, B, auto_broadcast);
-    NodeBuilder builder(mod);
-    auto g_mod = as_type_ptr<opset1::Mod>(builder.create());
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Mod, ngraph::element::f32>>;
 
-    EXPECT_EQ(g_mod->get_autob(), mod->get_autob());
-}
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/multiply.cpp b/ngraph/test/visitors/op/multiply.cpp
new file mode 100644
index 00000000000000..f60e2b5ebb10b6
--- /dev/null
+++ b/ngraph/test/visitors/op/multiply.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Multiply, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/not_equal.cpp b/ngraph/test/visitors/op/not_equal.cpp
new file mode 100644
index 00000000000000..93b3fc2eae408d
--- /dev/null
+++ b/ngraph/test/visitors/op/not_equal.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::NotEqual, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/power.cpp b/ngraph/test/visitors/op/power.cpp
new file mode 100644
index 00000000000000..24c25b3d64c369
--- /dev/null
+++ b/ngraph/test/visitors/op/power.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Power, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/squared_difference.cpp b/ngraph/test/visitors/op/squared_difference.cpp
index cf2a7e0981e96e..6ebc06579a4bc6 100644
--- a/ngraph/test/visitors/op/squared_difference.cpp
+++ b/ngraph/test/visitors/op/squared_difference.cpp
@@ -2,31 +2,13 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "gtest/gtest.h"
-
-#include "ngraph/ngraph.hpp"
-#include "ngraph/op/util/attr_types.hpp"
+#include "binary_ops.hpp"
 #include "ngraph/opsets/opset1.hpp"
-#include "ngraph/opsets/opset3.hpp"
-#include "ngraph/opsets/opset4.hpp"
-#include "ngraph/opsets/opset5.hpp"
-
-#include "util/visitor.hpp"
-
-using namespace std;
-using namespace ngraph;
-using ngraph::test::NodeBuilder;
-using ngraph::test::ValueMap;
 
-TEST(attributes, squared_difference_op)
-{
-    NodeBuilder::get_ops().register_factory<opset1::SquaredDifference>();
-    auto x1 = make_shared<op::Parameter>(element::i32, Shape{200});
-    auto x2 = make_shared<op::Parameter>(element::i32, Shape{200});
-    auto auto_broadcast = op::AutoBroadcastType::NUMPY;
-    auto squared_difference = make_shared<opset1::SquaredDifference>(x1, x2, auto_broadcast);
-    NodeBuilder builder(squared_difference);
-    auto g_squared_difference = as_type_ptr<opset1::SquaredDifference>(builder.create());
+using Type =
+    ::testing::Types<BinaryOperatorType<ngraph::opset1::SquaredDifference, ngraph::element::f32>>;
 
-    EXPECT_EQ(g_squared_difference->get_autob(), squared_difference->get_autob());
-}
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);
diff --git a/ngraph/test/visitors/op/subtract.cpp b/ngraph/test/visitors/op/subtract.cpp
new file mode 100644
index 00000000000000..a2aa158c076fbf
--- /dev/null
+++ b/ngraph/test/visitors/op/subtract.cpp
@@ -0,0 +1,13 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "binary_ops.hpp"
+#include "ngraph/opsets/opset1.hpp"
+
+using Type = ::testing::Types<BinaryOperatorType<ngraph::opset1::Subtract, ngraph::element::f32>>;
+
+INSTANTIATE_TYPED_TEST_SUITE_P(visitor_with_auto_broadcast,
+                               BinaryOperatorVisitor,
+                               Type,
+                               BinaryOperatorTypeName);

From f5666fb3e16d7ada4955c7640e9fbb16383747af Mon Sep 17 00:00:00 2001
From: Yunji Kim <yunji.kim@intel.com>
Date: Mon, 26 Jul 2021 23:52:27 +0900
Subject: [PATCH 70/71] [GPU] Add new operation GatherElements to IE clDNN
 plugin (#6676)

---
 .../cldnn_engine/cldnn_primitives_list.hpp    |    1 +
 .../src/cldnn_engine/ops/gather_elements.cpp  |   66 +
 .../single_layer_tests/gather_elements.cpp    |    5 +-
 .../single_layer_tests/gather_elements.cpp    |  227 ++++
 .../single_layer_tests/gather_elements.hpp    |   15 +
 .../src/single_layer/gather_elements.cpp      |    3 -
 .../api/cldnn/primitives/gather_elements.hpp  |   58 +
 .../kernel_selector/common/common_types.h     |    1 +
 .../gather/gather_elements_kernel_ref.cpp     |  154 +++
 .../gather/gather_elements_kernel_ref.h       |   45 +
 .../gather_elements_kernel_selector.cpp       |   27 +
 .../gather/gather_elements_kernel_selector.h  |   35 +
 .../core/cl_kernels/gather_elements_ref.cl    |   86 ++
 .../core/kernel_selector_common.cpp           |    2 +
 .../thirdparty/clDNN/src/gather_elements.cpp  |   62 +
 .../prepare_primitive_fusing.cpp              |    9 +
 .../clDNN/src/impls/ocl/gather_elements.cpp   |   86 ++
 .../clDNN/src/impls/ocl/register.cpp          |    1 +
 .../clDNN/src/impls/ocl/register.hpp          |    2 +
 .../clDNN/src/include/gather_elements_inst.h  |   49 +
 .../src/include/kernel_selector_helper.h      |    1 +
 .../tests/test_cases/fusings_gpu_test.cpp     |  226 ++++
 .../test_cases/gather_elements_gpu_test.cpp   | 1141 +++++++++++++++++
 23 files changed, 2296 insertions(+), 6 deletions(-)
 create mode 100644 inference-engine/src/cldnn_engine/ops/gather_elements.cpp
 create mode 100644 inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/gather_elements.cpp
 create mode 100644 inference-engine/tests/functional/plugin/shared/include/single_layer_tests/gather_elements.hpp
 create mode 100644 inference-engine/thirdparty/clDNN/api/cldnn/primitives/gather_elements.hpp
 create mode 100644 inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.cpp
 create mode 100644 inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.h
 create mode 100644 inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.cpp
 create mode 100644 inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.h
 create mode 100644 inference-engine/thirdparty/clDNN/kernel_selector/core/cl_kernels/gather_elements_ref.cl
 create mode 100644 inference-engine/thirdparty/clDNN/src/gather_elements.cpp
 create mode 100644 inference-engine/thirdparty/clDNN/src/impls/ocl/gather_elements.cpp
 create mode 100644 inference-engine/thirdparty/clDNN/src/include/gather_elements_inst.h
 create mode 100644 inference-engine/thirdparty/clDNN/tests/test_cases/gather_elements_gpu_test.cpp

diff --git a/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp b/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp
index 81a055a4a09a5b..0c0ddf7e637050 100644
--- a/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp
+++ b/inference-engine/src/cldnn_engine/cldnn_primitives_list.hpp
@@ -204,6 +204,7 @@ REGISTER_FACTORY(v5, Loop);
 // ------------------------------ Supported v6 ops ------------------------------ //
 REGISTER_FACTORY(v6, CTCGreedyDecoderSeqLen);
 REGISTER_FACTORY(v6, MVN);
+REGISTER_FACTORY(v6, GatherElements);
 
 // ------------------------------ Supported v7 ops ------------------------------ //
 REGISTER_FACTORY(v7, Gather);
diff --git a/inference-engine/src/cldnn_engine/ops/gather_elements.cpp b/inference-engine/src/cldnn_engine/ops/gather_elements.cpp
new file mode 100644
index 00000000000000..d61382807506c1
--- /dev/null
+++ b/inference-engine/src/cldnn_engine/ops/gather_elements.cpp
@@ -0,0 +1,66 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "cldnn_program.h"
+#include "cldnn_common_utils.h"
+
+#include "ngraph/op/gather_elements.hpp"
+#include "ngraph/op/constant.hpp"
+
+#include "cldnn/primitives/gather_elements.hpp"
+
+namespace CLDNNPlugin {
+
+static cldnn::gather_elements::gather_elements_axis GetGatherAxis(int axis, unsigned rank) {
+    if (axis < 0)
+        axis += rank;
+    if (axis < 0 || axis >= rank)
+        IE_THROW() << "GatherElements axis is not correspond to number of dimensions";
+
+    // Difference in dimension ordering between IE and clDNN,
+    // reverse spatial dimensions after batch and feature.
+    unsigned cldnn_axis = axis;
+    if (axis >= 2) {
+        auto spatial_axis = axis - 2;
+        // Default and minimum number of dimensions is 4
+        auto spatial_size = std::max(rank, 4u) - 2;
+        cldnn_axis = spatial_size - spatial_axis - 1 + 2;
+    }
+
+    switch (cldnn_axis) {
+        case 0: return cldnn::gather_elements::gather_elements_axis::along_b;
+        case 1: return cldnn::gather_elements::gather_elements_axis::along_f;
+        case 2: return cldnn::gather_elements::gather_elements_axis::along_x;
+        case 3: return cldnn::gather_elements::gather_elements_axis::along_y;
+        case 4: return cldnn::gather_elements::gather_elements_axis::along_z;
+        case 5: return cldnn::gather_elements::gather_elements_axis::along_w;
+        default: IE_THROW() << "Unsupported GatherElements axis: " << axis;
+    }
+    return cldnn::gather_elements::gather_elements_axis::along_f;  // shouldn't get here
+}
+
+void CreateGatherElementsOp(Program& p, const std::shared_ptr<ngraph::op::v6::GatherElements>& op) {
+    p.ValidateInputs(op, {2});
+    auto inputPrimitives = p.GetInputPrimitiveIDs(op);
+    std::string layerName = layer_type_name_ID(op);
+
+    size_t rank = op->get_input_shape(0).size();
+    int32_t axis = static_cast<int32_t>(op->get_axis());
+
+    auto outLayout = DefaultFormatForDims(op->get_output_shape(0).size());
+
+    auto primitive = cldnn::gather_elements(layerName,
+                                            inputPrimitives[0],
+                                            inputPrimitives[1],
+                                            outLayout,
+                                            CldnnTensorFromIEDims(op->get_output_shape(0)),
+                                            GetGatherAxis(axis, rank));
+
+    p.AddPrimitive(primitive);
+    p.AddPrimitiveToProfiler(op);
+}
+
+REGISTER_FACTORY_IMPL(v6, GatherElements);
+
+}  // namespace CLDNNPlugin
diff --git a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/gather_elements.cpp b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/gather_elements.cpp
index 1ad8bbd0d4c335..0220364af315f8 100644
--- a/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/gather_elements.cpp
+++ b/inference-engine/tests/functional/plugin/cpu/shared_tests_instances/single_layer_tests/gather_elements.cpp
@@ -4,7 +4,8 @@
 
 #include <vector>
 
-#include "shared_test_classes/single_layer/gather_elements.hpp"
+#include "single_layer_tests/gather_elements.hpp"
+#include "common_test_utils/test_constants.hpp"
 
 using namespace LayerTestsDefinitions;
 
@@ -16,8 +17,6 @@ const std::vector<InferenceEngine::Precision> dPrecisions = {
         InferenceEngine::Precision::I32,
         InferenceEngine::Precision::I64,
         InferenceEngine::Precision::I16,
-        InferenceEngine::Precision::U8,
-        InferenceEngine::Precision::I8
 };
 const std::vector<InferenceEngine::Precision> iPrecisions = {
         InferenceEngine::Precision::I32,
diff --git a/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/gather_elements.cpp b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/gather_elements.cpp
new file mode 100644
index 00000000000000..cbc4e9fed4fc5f
--- /dev/null
+++ b/inference-engine/tests/functional/plugin/gpu/shared_tests_instances/single_layer_tests/gather_elements.cpp
@@ -0,0 +1,227 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <vector>
+#include <ngraph/opsets/opset6.hpp>
+
+#include "single_layer_tests/gather_elements.hpp"
+#include "common_test_utils/test_constants.hpp"
+
+using namespace LayerTestsDefinitions;
+using namespace ngraph::opset6;
+
+namespace {
+
+const std::vector<InferenceEngine::Precision> inputPrecisions = {
+        InferenceEngine::Precision::FP32,
+        InferenceEngine::Precision::FP16,
+        InferenceEngine::Precision::I32,
+};
+
+const std::vector<InferenceEngine::Precision> idxPrecisions = {
+        InferenceEngine::Precision::I32,
+        InferenceEngine::Precision::I64,
+};
+
+INSTANTIATE_TEST_CASE_P(smoke_set1, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>({2, 2})),
+        ::testing::Values(std::vector<size_t>({2, 2})),
+        ::testing::ValuesIn(std::vector<int>({-1, 0, 1})),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_set2, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>({2, 2, 1})),
+        ::testing::Values(std::vector<size_t>({4, 2, 1})),
+        ::testing::ValuesIn(std::vector<int>({0, -3})),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_set3, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>({2, 2, 3, 5})),
+        ::testing::Values(std::vector<size_t>({2, 2, 3, 7})),
+        ::testing::Values(3, -1),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_set4, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>({3, 2, 3, 8})),
+        ::testing::Values(std::vector<size_t>({2, 2, 3, 8})),
+        ::testing::Values(0, -4),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_set5, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>({3, 2, 3, 4, 8})),
+        ::testing::Values(std::vector<size_t>({3, 2, 3, 5, 8})),
+        ::testing::Values(3, -2),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank4axis0, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{7, 7, 8, 4}),
+        ::testing::Values(std::vector<size_t>{2, 7, 8, 4}),
+        ::testing::Values(0),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank4axis1, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{6, 1, 8, 4}),
+        ::testing::Values(std::vector<size_t>{6, 8, 8, 4}),
+        ::testing::Values(1, -3),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank4axis2, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{6, 7, 4, 4}),
+        ::testing::Values(std::vector<size_t>{6, 7, 2, 4}),
+        ::testing::Values(2, -2),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank4axis3, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{6, 5, 8, 7}),
+        ::testing::Values(std::vector<size_t>{6, 5, 8, 7}),
+        ::testing::Values(3, -1),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank5axis0, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{2, 3, 9, 4, 9}),
+        ::testing::Values(std::vector<size_t>{1, 3, 9, 4, 9}),
+        ::testing::Values(0),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank5axis1, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{2, 3, 5, 4, 7}),
+        ::testing::Values(std::vector<size_t>{2, 9, 5, 4, 7}),
+        ::testing::Values(1, -4),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank5axis2, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{1, 2, 6, 8, 9}),
+        ::testing::Values(std::vector<size_t>{1, 2, 6, 8, 9}),
+        ::testing::Values(2, -3),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank5axis3, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{2, 2, 4, 7, 7}),
+        ::testing::Values(std::vector<size_t>{2, 2, 4, 3, 7}),
+        ::testing::Values(3, -2),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank5axis4, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{1, 3, 9, 3, 2}),
+        ::testing::Values(std::vector<size_t>{1, 3, 9, 3, 9}),
+        ::testing::Values(4, -1),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank6axis0, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{3, 3, 2, 4, 4, 3}),
+        ::testing::Values(std::vector<size_t>{7, 3, 2, 4, 4, 3}),
+        ::testing::Values(0),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank6axis1, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{1, 6, 2, 3, 5, 9}),
+        ::testing::Values(std::vector<size_t>{1, 6, 2, 3, 5, 9}),
+        ::testing::Values(1, -5),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank6axis2, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{2, 3, 9, 7, 2, 1}),
+        ::testing::Values(std::vector<size_t>{2, 3, 5, 7, 2, 1}),
+        ::testing::Values(2, -4),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank6axis3, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{1, 3, 4, 5, 1, 3}),
+        ::testing::Values(std::vector<size_t>{1, 3, 4, 4, 1, 3}),
+        ::testing::Values(3, -3),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank6axis4, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{1, 3, 2, 4, 3, 3}),
+        ::testing::Values(std::vector<size_t>{1, 3, 2, 4, 6, 3}),
+        ::testing::Values(4, -2),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+INSTANTIATE_TEST_CASE_P(smoke_GatherElements_rank6axis5, GatherElementsLayerTest,
+    ::testing::Combine(
+        ::testing::Values(std::vector<size_t>{2, 1, 7, 8, 1, 6}),
+        ::testing::Values(std::vector<size_t>{2, 1, 7, 8, 1, 5}),
+        ::testing::Values(5, -1),
+        ::testing::ValuesIn(inputPrecisions),
+        ::testing::ValuesIn(idxPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GPU)),
+    GatherElementsLayerTest::getTestCaseName);
+
+}  // namespace
diff --git a/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/gather_elements.hpp b/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/gather_elements.hpp
new file mode 100644
index 00000000000000..eea88d4abf3183
--- /dev/null
+++ b/inference-engine/tests/functional/plugin/shared/include/single_layer_tests/gather_elements.hpp
@@ -0,0 +1,15 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "shared_test_classes/single_layer/gather_elements.hpp"
+
+namespace LayerTestsDefinitions {
+
+TEST_P(GatherElementsLayerTest, CompareWithRefs) {
+    Run();
+}
+
+}  // namespace LayerTestsDefinitions
diff --git a/inference-engine/tests/functional/shared_test_classes/src/single_layer/gather_elements.cpp b/inference-engine/tests/functional/shared_test_classes/src/single_layer/gather_elements.cpp
index af5832302aa0be..d559e04a53d2c1 100644
--- a/inference-engine/tests/functional/shared_test_classes/src/single_layer/gather_elements.cpp
+++ b/inference-engine/tests/functional/shared_test_classes/src/single_layer/gather_elements.cpp
@@ -48,7 +48,4 @@ void GatherElementsLayerTest::SetUp() {
     function = std::make_shared<ngraph::Function>(results, params, "gatherEl");
 }
 
-TEST_P(GatherElementsLayerTest, CompareWithRefs) {
-    Run();
-}
 }  // namespace LayerTestsDefinitions
diff --git a/inference-engine/thirdparty/clDNN/api/cldnn/primitives/gather_elements.hpp b/inference-engine/thirdparty/clDNN/api/cldnn/primitives/gather_elements.hpp
new file mode 100644
index 00000000000000..d6d0ca9fdb24f9
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/api/cldnn/primitives/gather_elements.hpp
@@ -0,0 +1,58 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+#pragma once
+#include "primitive.hpp"
+
+namespace cldnn {
+/// @addtogroup cpp_api C++ API
+/// @{
+/// @addtogroup cpp_topology Network Topology
+/// @{
+/// @addtogroup cpp_primitives Primitives
+/// @{
+
+/// @brief
+/// @details
+struct gather_elements : public primitive_base<gather_elements> {
+    CLDNN_DECLARE_PRIMITIVE(gather_elements)
+
+    enum gather_elements_axis {
+        along_b,
+        along_f,
+        along_x,
+        along_y,
+        along_z,
+        along_w
+    };
+
+    /// @brief Constructs gather_elements primitive.
+    /// @param id This primitive id.
+    /// @param data Input data primitive id.
+    /// @param indices Input indexes primitive id.
+    /// @param output_format Output format.
+    /// @param output_shape Output shape.
+    /// @param axis Gathering axis.
+    gather_elements(const primitive_id& id,
+                    const primitive_id& data,
+                    const primitive_id& indices,
+                    const format& output_format,
+                    const tensor& output_shape,
+                    const gather_elements_axis axis,
+                    const padding& output_padding = padding())
+        : primitive_base(id, {data, indices}, output_padding), output_format(output_format), output_shape(output_shape), axis(axis) {}
+
+    /// @brief Gather Elements output format
+    format output_format;
+    /// @brief Gather Elements output shape
+    tensor output_shape;
+
+    /// @brief Which axis to gather on.
+    gather_elements_axis axis;
+};
+/// @}
+/// @}
+/// @}
+}  // namespace cldnn
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/common/common_types.h b/inference-engine/thirdparty/clDNN/kernel_selector/common/common_types.h
index 7a072d998d4789..dbe6bd7004c672 100644
--- a/inference-engine/thirdparty/clDNN/kernel_selector/common/common_types.h
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/common/common_types.h
@@ -48,6 +48,7 @@ enum class KernelType {
     ONE_HOT,
     GATHER,
     GATHER_ND,
+    GATHER_ELEMENTS,
     SCATTER_UPDATE,
     SCATTER_ND_UPDATE,
     SCATTER_ELEMENTS_UPDATE,
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.cpp
new file mode 100644
index 00000000000000..eb01e12a12f0ee
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.cpp
@@ -0,0 +1,154 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "gather_elements_kernel_ref.h"
+#include "kernel_selector_utils.h"
+#include <string>
+#include <vector>
+
+namespace kernel_selector {
+static size_t GetGatherElementsChannelIndex(const gather_elements_params& params) {
+    Tensor::DataChannelName name = Tensor::DataChannelName::X;
+
+    size_t inputSize = params.inputs[0].GetDims().size();
+
+    switch (params.axis) {
+        case GatherAxis::X:
+            return inputSize - 1;
+        case GatherAxis::Y:
+            return inputSize - 2;
+        case GatherAxis::Z:
+            return inputSize - 3;
+        case GatherAxis::W:
+            return 2;
+        case GatherAxis::FEATURE:
+            return 1;
+        case GatherAxis::BATCH:
+            return 0;
+        default:
+            break;
+    }
+
+    return DataTensor::Channelndex(params.output.GetLayout(), name);
+}
+
+ParamsKey GatherElementsKernelRef::GetSupportedKey() const {
+    ParamsKey k;
+    k.EnableInputDataType(Datatype::F16);
+    k.EnableInputDataType(Datatype::F32);
+    k.EnableInputDataType(Datatype::INT32);
+    k.EnableOutputDataType(Datatype::F16);
+    k.EnableOutputDataType(Datatype::F32);
+    k.EnableOutputDataType(Datatype::INT32);
+    k.EnableInputLayout(DataLayout::bfyx);
+    k.EnableOutputLayout(DataLayout::bfyx);
+    k.EnableInputLayout(DataLayout::bfzyx);
+    k.EnableOutputLayout(DataLayout::bfzyx);
+    k.EnableInputLayout(DataLayout::bfwzyx);
+    k.EnableOutputLayout(DataLayout::bfwzyx);
+    k.EnableTensorOffset();
+    k.EnableTensorPitches();
+    k.EnableBatching();
+    k.EnableDifferentTypes();
+    return k;
+}
+
+static inline std::vector<std::string> GetDefaultOrder(size_t size) {
+    std::vector<std::string> default_order;
+    if (size <= 4) {
+        default_order = { "b", "f", "y", "x" };
+    } else if (size == 5) {
+        default_order = { "b", "f", "z", "y", "x" };
+    } else if (size == 6) {
+        default_order = { "b", "f", "w", "z", "y", "x" };
+    }
+
+    return default_order;
+}
+
+CommonDispatchData GatherElementsKernelRef::SetDefault(const gather_elements_params& params, const optional_params&) const {
+    CommonDispatchData dispatchData;
+
+    const auto& output = params.output;
+
+    switch (params.inputs[1].GetLayout()) {
+    case DataLayout::bfyx:
+        dispatchData.gws = {output.X().v, output.Y().v, output.Feature().v * output.Batch().v};
+        break;
+
+    case DataLayout::bfzyx:
+        dispatchData.gws = {output.X().v, output.Y().v * output.Z().v, output.Feature().v * output.Batch().v};
+        break;
+
+    case DataLayout::bfwzyx:
+        dispatchData.gws = {output.X().v * output.Y().v, output.Z().v * output.W().v, output.Feature().v * output.Batch().v};
+        break;
+
+    default:
+        throw std::invalid_argument("Unsupported data layout for gather elements primitive");
+        break;
+    }
+
+    dispatchData.lws = GetOptimalLocalWorkGroupSizes(dispatchData.gws, params.engineInfo);
+
+    return dispatchData;
+}
+
+JitConstants GatherElementsKernelRef::GetJitConstants(const gather_elements_params& params) const {
+    JitConstants jit = MakeBaseParamsJitConstants(params);
+
+    jit.AddConstant(MakeJitConstant("AXIS", GetGatherElementsChannelIndex(params)));
+
+    if (!params.fused_ops.empty()) {
+        std::vector<std::string> idx_order = GetDefaultOrder(params.inputs[0].GetDims().size());
+        FusedOpsConfiguration conf = { "", idx_order, "val", params.inputs[0].GetDType() };
+        jit.Merge(MakeFusedOpsJitConstants(params, { conf }));
+    }
+
+    return jit;
+}
+
+bool GatherElementsKernelRef::Validate(const Params& p, const optional_params& o) const {
+    if (p.GetType() != KernelType::GATHER_ELEMENTS || o.GetType() != KernelType::GATHER_ELEMENTS) {
+        return false;
+    }
+
+    const gather_elements_params& params = static_cast<const gather_elements_params&>(p);
+    auto input_dims = params.inputs[0].LogicalDims();
+    auto indices_dims = params.inputs[1].LogicalDims();
+
+    if (input_dims.size() != indices_dims.size()) {
+        return false;
+    }
+
+    for (auto& fused_op : params.fused_ops) {
+        if (!IsFusedPrimitiveSupported(fused_op))
+            return false;
+    }
+
+    return true;
+}
+
+KernelsData GatherElementsKernelRef::GetKernelsData(const Params& params, const optional_params& options) const {
+    if (!Validate(params, options)) {
+        return {};
+    }
+
+    KernelData kd = KernelData::Default<gather_elements_params>(params);
+    gather_elements_params& newParams = *static_cast<gather_elements_params*>(kd.params.get());
+
+    auto dispatchData = SetDefault(newParams, options);
+    auto cldnn_jit = GetJitConstants(newParams);
+
+    auto entry_point = GetEntryPoint(kernelName, newParams.layerID, params, options);
+    auto jit = CreateJit(kernelName, cldnn_jit, entry_point);
+    auto& kernel = kd.kernels[0];
+    FillCLKernelData(kernel, dispatchData, params.engineInfo, kernelName, jit, entry_point, "", false, false, 2, GetFusedPrimitiveInputsCount(params));
+    return { kd };
+}
+
+KernelsPriority GatherElementsKernelRef::GetKernelsPriority(const Params& /*params*/, const optional_params& /*options*/) const {
+    return DONT_USE_IF_HAVE_SOMETHING_ELSE;
+}
+}  // namespace kernel_selector
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.h b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.h
new file mode 100644
index 00000000000000..8eec4ae96326fa
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_ref.h
@@ -0,0 +1,45 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "kernel_base_opencl.h"
+
+namespace kernel_selector {
+////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
+// gather_elements_params
+////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
+struct gather_elements_params : public base_params {
+    gather_elements_params() : base_params(KernelType::GATHER_ELEMENTS), axis(GatherAxis::BATCH) {}
+
+    GatherAxis axis;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
+// gather_elements_optional_params
+////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
+struct gather_elements_optional_params : optional_params {
+    gather_elements_optional_params() : optional_params(KernelType::GATHER_ELEMENTS) {}
+};
+
+class GatherElementsKernelRef : public KernelBaseOpenCL {
+public:
+    GatherElementsKernelRef() : KernelBaseOpenCL("gather_elements_ref") {}
+    virtual ~GatherElementsKernelRef() {}
+    virtual JitConstants GetJitConstants(const gather_elements_params& params) const;
+    virtual CommonDispatchData SetDefault(const gather_elements_params& params, const optional_params&) const;
+    KernelsData GetKernelsData(const Params& params, const optional_params& options) const override;
+    KernelsPriority GetKernelsPriority(const Params& params, const optional_params& options) const override;
+    ParamsKey GetSupportedKey() const override;
+    std::vector<FusedOpType> GetSupportedFusedOps() const override {
+        return { FusedOpType::QUANTIZE,
+                 FusedOpType::SCALE,
+                 FusedOpType::ACTIVATION,
+                 FusedOpType::ELTWISE };
+    }
+
+protected:
+    bool Validate(const Params& p, const optional_params& o) const override;
+};
+}  // namespace kernel_selector
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.cpp
new file mode 100644
index 00000000000000..3a451cf574add9
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.cpp
@@ -0,0 +1,27 @@
+/*
+// Copyright (c) 2021 Intel Corporation
+//
+// Licensed under the Apache License, Version 2.0 (the "License");
+// you may not use this file except in compliance with the License.
+// You may obtain a copy of the License at
+//
+//      http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+*/
+
+#include "gather_elements_kernel_selector.h"
+#include "gather_elements_kernel_ref.h"
+
+namespace kernel_selector {
+
+gather_elements_kernel_selector::gather_elements_kernel_selector() { Attach<GatherElementsKernelRef>(); }
+
+KernelsData gather_elements_kernel_selector::GetBestKernels(const Params& params, const optional_params& options) const {
+    return GetNaiveBestKernel(params, options, KernelType::GATHER_ELEMENTS);
+}
+}  // namespace kernel_selector
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.h b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.h
new file mode 100644
index 00000000000000..333298a45de53d
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/actual_kernels/gather/gather_elements_kernel_selector.h
@@ -0,0 +1,35 @@
+/*
+// Copyright (c) 2021 Intel Corporation
+//
+// Licensed under the Apache License, Version 2.0 (the "License");
+// you may not use this file except in compliance with the License.
+// You may obtain a copy of the License at
+//
+//      http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+*/
+
+#pragma once
+
+#include "kernel_selector.h"
+
+namespace kernel_selector {
+class gather_elements_kernel_selector : public kernel_selector_base {
+public:
+    static gather_elements_kernel_selector& Instance() {
+        static gather_elements_kernel_selector instance_;
+        return instance_;
+    }
+
+    gather_elements_kernel_selector();
+
+    virtual ~gather_elements_kernel_selector() {}
+
+    KernelsData GetBestKernels(const Params& params, const optional_params& options) const override;
+};
+}  // namespace kernel_selector
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/cl_kernels/gather_elements_ref.cl b/inference-engine/thirdparty/clDNN/kernel_selector/core/cl_kernels/gather_elements_ref.cl
new file mode 100644
index 00000000000000..d03c1c85b13aa2
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/cl_kernels/gather_elements_ref.cl
@@ -0,0 +1,86 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "include/data_types.cl"
+#include "include/fetch_data.cl"
+
+#define GET_OUTPUT_INDEX(prefix, idx_order) CAT(prefix, _GET_INDEX)(idx_order)
+
+KERNEL(gather_elements_ref)(const __global INPUT0_TYPE* data,
+                   const __global INPUT1_TYPE* indices,
+                   __global OUTPUT_TYPE* output
+#if HAS_FUSED_OPS_DECLS
+                   , FUSED_OPS_DECLS
+#endif
+)
+{
+    const uint dim0 = get_global_id(0);
+    const uint dim1 = get_global_id(1);
+    const uint dim2 = get_global_id(2);
+
+    // Calculate indice index
+#if INPUT1_DIMS == 4
+    #define ORDER b,f,y,x
+    const uint x = dim0;
+    const uint y = dim1;
+#elif INPUT1_DIMS == 5
+    #define ORDER b,f,z,y,x
+    const uint x = dim0;
+    const uint y = dim1 % OUTPUT_SIZE_Y;
+    const uint z = dim1 / OUTPUT_SIZE_Y;
+#else
+    #define ORDER b,f,w,z,y,x
+    const uint x = dim0 % OUTPUT_SIZE_X;
+    const uint y = dim0 / OUTPUT_SIZE_X;
+    const uint z = dim1 % OUTPUT_SIZE_Z;
+    const uint w = dim1 / OUTPUT_SIZE_Z;
+#endif
+    const uint f = dim2 % OUTPUT_FEATURE_NUM;
+    const uint b = dim2 / OUTPUT_FEATURE_NUM;
+
+    const int out_idx = GET_OUTPUT_INDEX(INPUT1, ORDER);
+
+#if INPUT1_DIMS == 4
+    size_t data_shape[4] = {INPUT0_BATCH_NUM, INPUT0_FEATURE_NUM, INPUT0_SIZE_Y, INPUT0_SIZE_X};
+    size_t indices_shape[4] = {INPUT1_BATCH_NUM, INPUT1_FEATURE_NUM, INPUT1_SIZE_Y, INPUT1_SIZE_X};
+#elif INPUT1_DIMS == 5
+    size_t data_shape[5] = {INPUT0_BATCH_NUM, INPUT0_FEATURE_NUM, INPUT0_SIZE_Z, INPUT0_SIZE_Y, INPUT0_SIZE_X};
+    size_t indices_shape[5] = {INPUT1_BATCH_NUM, INPUT1_FEATURE_NUM, INPUT1_SIZE_Z, INPUT1_SIZE_Y, INPUT1_SIZE_X};
+#else
+    size_t data_shape[6] = {INPUT0_BATCH_NUM, INPUT0_FEATURE_NUM, INPUT0_SIZE_W, INPUT0_SIZE_Z, INPUT0_SIZE_Y, INPUT0_SIZE_X};
+    size_t indices_shape[6] = {INPUT1_BATCH_NUM, INPUT1_FEATURE_NUM, INPUT1_SIZE_W, INPUT1_SIZE_Z, INPUT1_SIZE_Y, INPUT1_SIZE_X};
+#endif
+
+    size_t max_inner_sum = 1, max_outer_sum = 1, outer_sum_inc_data = 1, outer_sum_inc_indices = 1;
+    for (size_t i = AXIS + 1; i < INPUT1_DIMS; i++)
+        max_inner_sum *= indices_shape[i];
+
+    for (int i = 0; i < AXIS; i++)
+        max_outer_sum *= indices_shape[i];
+
+    for (size_t i = AXIS; i < INPUT1_DIMS; i++) {
+        outer_sum_inc_data *= data_shape[i];
+    }
+    max_outer_sum *= outer_sum_inc_data;
+
+    for (size_t i = AXIS; i < INPUT1_DIMS; i++) {
+        outer_sum_inc_indices *= indices_shape[i];
+    }
+
+    size_t outer_sum = (out_idx / outer_sum_inc_indices) * outer_sum_inc_data;
+    size_t inner_sum = out_idx % max_inner_sum;
+
+    uint idx = outer_sum + max_inner_sum * indices[out_idx] + inner_sum;
+    INPUT0_TYPE val = data[idx];
+
+#if HAS_FUSED_OPS
+    FUSED_OPS;
+    output[out_idx] = TO_OUTPUT_TYPE(FUSED_OPS_RESULT);
+#else
+    output[out_idx] = ACTIVATION(val, ACTIVATION_PARAMS);
+#endif
+}
+
+#undef ORDER
+#undef GET_OUTPUT_INDEX
diff --git a/inference-engine/thirdparty/clDNN/kernel_selector/core/kernel_selector_common.cpp b/inference-engine/thirdparty/clDNN/kernel_selector/core/kernel_selector_common.cpp
index deeb31e350e890..35c2115e5ac9e3 100644
--- a/inference-engine/thirdparty/clDNN/kernel_selector/core/kernel_selector_common.cpp
+++ b/inference-engine/thirdparty/clDNN/kernel_selector/core/kernel_selector_common.cpp
@@ -402,6 +402,8 @@ std::string toString(GatherAxis a) {
     switch (a) {
         case GatherAxis::X:       return "X";
         case GatherAxis::Y:       return "Y";
+        case GatherAxis::Z:       return "Z";
+        case GatherAxis::W:       return "W";
         case GatherAxis::FEATURE: return "FEATURE";
         case GatherAxis::BATCH:   return "BATCH";
         default: return "";
diff --git a/inference-engine/thirdparty/clDNN/src/gather_elements.cpp b/inference-engine/thirdparty/clDNN/src/gather_elements.cpp
new file mode 100644
index 00000000000000..7a3a920aa6277e
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/src/gather_elements.cpp
@@ -0,0 +1,62 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "gather_elements_inst.h"
+
+#include "primitive_type_base.h"
+#include "cldnn/runtime/error_handler.hpp"
+#include "json_object.h"
+#include <string>
+
+namespace cldnn {
+primitive_type_id gather_elements::type_id() {
+    static primitive_type_base<gather_elements> instance;
+    return &instance;
+}
+
+layout gather_elements_inst::calc_output_layout(gather_elements_node const& node) {
+    auto op = node.get_primitive();
+
+    auto input_layout_origin = node.input(0).get_output_layout();
+    auto indices_layout_origin = node.input(1).get_output_layout();
+
+    auto input_layout = input_layout_origin.size.sizes(input_layout_origin.format);
+    auto indices_layout = indices_layout_origin.size.sizes(indices_layout_origin.format);
+
+    if (node.has_fused_primitives()) {
+        input_layout_origin.data_type = node.get_fused_output_layout().data_type;
+    }
+
+    auto output_type = indices_layout_origin.data_type;
+    auto output_format = op->output_format;
+    auto output_shape = op->output_shape;
+
+    // calculate initial output shape
+    return layout(output_type, output_format, output_shape);
+}
+
+std::string gather_elements_inst::to_string(gather_elements_node const& node) {
+    auto desc = node.get_primitive();
+    auto node_info = node.desc_to_json();
+    auto& input = node.input();
+
+    std::stringstream primitive_description;
+
+    json_composite gather_elements_info;
+    gather_elements_info.add("input id", input.id());
+    gather_elements_info.add("input shape", node.input(0).get_output_layout().size.to_string());
+    gather_elements_info.add("indices shape", node.input(1).get_output_layout().size.to_string());
+    gather_elements_info.add("output format", calc_output_layout(node).format);
+    gather_elements_info.add("output shape", calc_output_layout(node).size.to_string());
+    gather_elements_info.add("axis", desc->axis);
+
+    node_info->add("gather_elements info", gather_elements_info);
+    node_info->dump(primitive_description);
+
+    return primitive_description.str();
+}
+
+gather_elements_inst::typed_primitive_inst(network_impl& network, gather_elements_node const& node) : parent(network, node) {}
+
+}  // namespace cldnn
diff --git a/inference-engine/thirdparty/clDNN/src/graph_optimizer/prepare_primitive_fusing.cpp b/inference-engine/thirdparty/clDNN/src/graph_optimizer/prepare_primitive_fusing.cpp
index ffabb96f2e40bf..7b82fb54e3c409 100644
--- a/inference-engine/thirdparty/clDNN/src/graph_optimizer/prepare_primitive_fusing.cpp
+++ b/inference-engine/thirdparty/clDNN/src/graph_optimizer/prepare_primitive_fusing.cpp
@@ -32,6 +32,7 @@
 #include "space_to_depth_inst.h"
 #include "gather_inst.h"
 #include "gather_nd_inst.h"
+#include "gather_elements_inst.h"
 #include "scatter_update_inst.h"
 #include "scatter_nd_update_inst.h"
 #include "scatter_elements_update_inst.h"
@@ -200,6 +201,7 @@ void prepare_primitive_fusing::fuse_activations(program_impl &p) {
                  !input.is_type<space_to_batch>() && !input.is_type<gather>() && !input.is_type<scatter_update>() && !input.is_type<shuffle_channels>() &&
                  !input.is_type<scatter_nd_update>() &&
                  !input.is_type<gather_nd>() &&
+                 !input.is_type<gather_elements>() &&
                  !input.is_type<strided_slice>() && !input.is_type<cum_sum>() && !input.is_type<reverse_sequence>() &&
                  !input.is_type<embedding_bag>() && !input.is_type<extract_image_patches>() &&
                  !input.is_type<fused_conv_eltwise>() && !input.is_type<activation>()))
@@ -609,6 +611,8 @@ void prepare_primitive_fusing::fuse_simple_primitives(program_impl &p) {
 
             should_fuse |= input_data.is_type<gather_nd>();
 
+            should_fuse |= input_data.is_type<gather_elements>();
+
             should_fuse |= input_data.is_type<scatter_update>();
 
             should_fuse |= input_data.is_type<scatter_nd_update>();
@@ -677,6 +681,8 @@ void prepare_primitive_fusing::fuse_simple_primitives(program_impl &p) {
 
             should_fuse |= input_data.is_type<gather_nd>();
 
+            should_fuse |= input_data.is_type<gather_elements>();
+
             should_fuse |= input_data.is_type<scatter_update>();
 
             should_fuse |= input_data.is_type<scatter_nd_update>();
@@ -767,6 +773,8 @@ void prepare_primitive_fusing::fuse_simple_primitives(program_impl &p) {
 
             should_fuse |= input_data.is_type<gather_nd>() && quantize_node.get_scale_shift_opt();
 
+            should_fuse |= input_data.is_type<gather_elements>() && quantize_node.get_scale_shift_opt();
+
             should_fuse |= input_data.is_type<scatter_update>() && quantize_node.get_scale_shift_opt();
 
             should_fuse |= input_data.is_type<scatter_nd_update>() && quantize_node.get_scale_shift_opt();
@@ -829,6 +837,7 @@ void prepare_primitive_fusing::fuse_simple_primitives(program_impl &p) {
                                       (parents[i]->is_type<eltwise>() && eltwise_supports_fusings(parents[i]->as<eltwise>())) ||
                                       (parents[i]->is_type<scale>()) ||
                                       (parents[i]->is_type<gather_nd>()) ||
+                                      (parents[i]->is_type<gather_elements>()) ||
                                       (parents[i]->is_type<scatter_nd_update>()) ||
                                       (parents[i]->is_type<scatter_elements_update>()) ||
                                       (parents[i]->is_type<pooling>() && pooling_supports_fusings(parents[i]->as<pooling>())) ||
diff --git a/inference-engine/thirdparty/clDNN/src/impls/ocl/gather_elements.cpp b/inference-engine/thirdparty/clDNN/src/impls/ocl/gather_elements.cpp
new file mode 100644
index 00000000000000..968eb6bbb7db6c
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/src/impls/ocl/gather_elements.cpp
@@ -0,0 +1,86 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "gather_elements_inst.h"
+#include "primitive_base.hpp"
+#include "impls/implementation_map.hpp"
+#include "kernel_selector_helper.h"
+#include "gather/gather_elements_kernel_selector.h"
+#include "gather/gather_elements_kernel_ref.h"
+#include "cldnn/runtime/error_handler.hpp"
+
+using namespace cldnn;
+
+namespace cldnn {
+namespace ocl {
+kernel_selector::gather_elements_axis convert_axis(gather_elements::gather_elements_axis axis) {
+    switch (axis) {
+        case gather_elements::along_x:
+            return kernel_selector::gather_elements_axis::X;
+        case gather_elements::along_y:
+            return kernel_selector::gather_elements_axis::Y;
+        case gather_elements::along_z:
+            return kernel_selector::gather_elements_axis::Z;
+        case gather_elements::along_w:
+            return kernel_selector::gather_elements_axis::W;
+        case gather_elements::along_f:
+            return kernel_selector::gather_elements_axis::FEATURE;
+        case gather_elements::along_b:
+            return kernel_selector::gather_elements_axis::BATCH;
+        default:
+            return kernel_selector::gather_elements_axis::BATCH;
+    }
+}
+
+struct gather_elements_impl : typed_primitive_impl_ocl<gather_elements> {
+    using parent = typed_primitive_impl_ocl<gather_elements>;
+    using parent::parent;
+
+    std::unique_ptr<primitive_impl> clone() const override {
+        return make_unique<gather_elements_impl>(*this);
+    }
+
+public:
+    static primitive_impl* create(const gather_elements_node& arg) {
+        auto gather_elements_params = get_default_params<kernel_selector::gather_elements_params>(arg);
+        auto gather_elements_optional_params =
+            get_default_optional_params<kernel_selector::gather_elements_optional_params>(arg.get_program());
+
+        gather_elements_params.axis = convert_axis(arg.get_primitive()->axis);
+
+        gather_elements_params.inputs.push_back(convert_data_tensor(arg.input(1).get_output_layout()));
+
+        auto& kernel_selector = kernel_selector::gather_elements_kernel_selector::Instance();
+        auto best_kernels = kernel_selector.GetBestKernels(gather_elements_params, gather_elements_optional_params);
+
+        CLDNN_ERROR_BOOL(arg.id(),
+                         "Best_kernel.empty()",
+                         best_kernels.empty(),
+                         "Cannot find a proper kernel with this arguments");
+
+        auto gather_elements = new gather_elements_impl(arg, best_kernels[0]);
+
+        return gather_elements;
+    }
+};
+
+namespace detail {
+
+attach_gather_elements_impl::attach_gather_elements_impl() {
+    implementation_map<gather_elements>::add(impl_types::ocl, gather_elements_impl::create, {
+        std::make_tuple(data_types::f32, format::bfyx),
+        std::make_tuple(data_types::f16, format::bfyx),
+        std::make_tuple(data_types::i32, format::bfyx),
+        std::make_tuple(data_types::f32, format::bfzyx),
+        std::make_tuple(data_types::f16, format::bfzyx),
+        std::make_tuple(data_types::i32, format::bfzyx),
+        std::make_tuple(data_types::f32, format::bfwzyx),
+        std::make_tuple(data_types::f16, format::bfwzyx),
+        std::make_tuple(data_types::i32, format::bfwzyx),
+    });
+}
+
+}  // namespace detail
+}  // namespace ocl
+}  // namespace cldnn
diff --git a/inference-engine/thirdparty/clDNN/src/impls/ocl/register.cpp b/inference-engine/thirdparty/clDNN/src/impls/ocl/register.cpp
index c62b64de62dff8..86a423a84713e6 100644
--- a/inference-engine/thirdparty/clDNN/src/impls/ocl/register.cpp
+++ b/inference-engine/thirdparty/clDNN/src/impls/ocl/register.cpp
@@ -30,6 +30,7 @@ void register_implementations() {
     REGISTER_OCL(eltwise);
     REGISTER_OCL(fully_connected);
     REGISTER_OCL(gather);
+    REGISTER_OCL(gather_elements);
     REGISTER_OCL(gather_nd);
     REGISTER_OCL(gemm);
     REGISTER_OCL(lrn);
diff --git a/inference-engine/thirdparty/clDNN/src/impls/ocl/register.hpp b/inference-engine/thirdparty/clDNN/src/impls/ocl/register.hpp
index 036162ed8d82fb..dcd58574e52558 100644
--- a/inference-engine/thirdparty/clDNN/src/impls/ocl/register.hpp
+++ b/inference-engine/thirdparty/clDNN/src/impls/ocl/register.hpp
@@ -22,6 +22,7 @@
 #include "cldnn/primitives/fully_connected.hpp"
 #include "cldnn/primitives/gather.hpp"
 #include "cldnn/primitives/gather_nd.hpp"
+#include "cldnn/primitives/gather_elements.hpp"
 #include "cldnn/primitives/gemm.hpp"
 #include "cldnn/primitives/lrn.hpp"
 #include "cldnn/primitives/lstm.hpp"
@@ -94,6 +95,7 @@ REGISTER_OCL(embed);
 REGISTER_OCL(fully_connected);
 REGISTER_OCL(gather);
 REGISTER_OCL(gather_nd);
+REGISTER_OCL(gather_elements);
 REGISTER_OCL(gemm);
 REGISTER_OCL(lrn);
 REGISTER_OCL(lstm_gemm);
diff --git a/inference-engine/thirdparty/clDNN/src/include/gather_elements_inst.h b/inference-engine/thirdparty/clDNN/src/include/gather_elements_inst.h
new file mode 100644
index 00000000000000..ebefc9c032dea6
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/src/include/gather_elements_inst.h
@@ -0,0 +1,49 @@
+/*
+// Copyright (c) 2021 Intel Corporation
+//
+// Licensed under the Apache License, Version 2.0 (the "License");
+// you may not use this file except in compliance with the License.
+// You may obtain a copy of the License at
+//
+//      http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+*/
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+#pragma once
+#include "cldnn/primitives/gather_elements.hpp"
+#include "primitive_inst.h"
+#include <string>
+
+namespace cldnn {
+template <>
+struct typed_program_node<gather_elements> : public typed_program_node_base<gather_elements> {
+    using parent = typed_program_node_base<gather_elements>;
+
+public:
+    using parent::parent;
+
+    program_node& input(size_t index = 0) const { return get_dependency(index); }
+};
+
+using gather_elements_node = typed_program_node<gather_elements>;
+
+template <>
+class typed_primitive_inst<gather_elements> : public typed_primitive_inst_base<gather_elements> {
+    using parent = typed_primitive_inst_base<gather_elements>;
+
+public:
+    static layout calc_output_layout(gather_elements_node const& node);
+    static std::string to_string(gather_elements_node const& node);
+
+public:
+    typed_primitive_inst(network_impl& network, gather_elements_node const& desc);
+};
+
+using gather_elements_inst = typed_primitive_inst<gather_elements>;
+}  // namespace cldnn
diff --git a/inference-engine/thirdparty/clDNN/src/include/kernel_selector_helper.h b/inference-engine/thirdparty/clDNN/src/include/kernel_selector_helper.h
index f97f74ebbbcda8..719824cb4ccafc 100644
--- a/inference-engine/thirdparty/clDNN/src/include/kernel_selector_helper.h
+++ b/inference-engine/thirdparty/clDNN/src/include/kernel_selector_helper.h
@@ -72,6 +72,7 @@ using shape_calculation_mode = kernel_selector::ShapeCalculationMode;
 using interpolate_axis = kernel_selector::InterpolateAxis;
 using border_type = kernel_selector::BorderType;
 using gather_axis = kernel_selector::GatherAxis;
+using gather_elements_axis = kernel_selector::GatherAxis;
 using scatter_update_axis = kernel_selector::ScatterUpdateAxis;
 using reduce_mode = kernel_selector::ReduceMode;
 using cum_sum_axis = kernel_selector::CumSumAxis;
diff --git a/inference-engine/thirdparty/clDNN/tests/test_cases/fusings_gpu_test.cpp b/inference-engine/thirdparty/clDNN/tests/test_cases/fusings_gpu_test.cpp
index 0fea8be6648aa4..fb51f20a7ce107 100644
--- a/inference-engine/thirdparty/clDNN/tests/test_cases/fusings_gpu_test.cpp
+++ b/inference-engine/thirdparty/clDNN/tests/test_cases/fusings_gpu_test.cpp
@@ -18,6 +18,7 @@
 #include <cldnn/primitives/permute.hpp>
 #include <cldnn/primitives/gather.hpp>
 #include <cldnn/primitives/gather_nd.hpp>
+#include <cldnn/primitives/gather_elements.hpp>
 #include <cldnn/primitives/scatter_update.hpp>
 #include <cldnn/primitives/scatter_nd_update.hpp>
 #include <cldnn/primitives/scatter_elements_update.hpp>
@@ -8413,3 +8414,228 @@ INSTANTIATE_TEST_SUITE_P(fusings_gpu, gather_nd_activation_scale_eltwise,
         gather_nd_test_params{ CASE_GATHER_ND_FP32_6D_3, 2, 5 },
         gather_nd_test_params{ CASE_GATHER_ND_FP32_6D_4, 2, 5 },
 }));
+
+
+
+/* ----------------------------------------------------------------------------------------------------- */
+/* ------------------------------------------ GatherElements cases ------------------------------------- */
+/* ----------------------------------------------------------------------------------------------------- */
+struct gather_elements_test_params {
+    data_types data_type;
+
+    format input_format;
+    tensor input_shape;
+
+    format indices_format;
+    tensor indices_shape;
+
+    format output_format;
+    tensor output_shape;
+
+    cldnn::gather_elements::gather_elements_axis axis;
+
+    data_types default_type;
+    format default_format;
+
+    size_t expected_fused_primitives;
+    size_t expected_not_fused_primitives;
+};
+
+#define CASE_GATHER_ELEMENTS_FP16_4D_1 data_types::f16, format::bfyx, {3, 7, 9, 8}, format::bfyx, {3, 7, 9, 8}, format::bfyx, {3, 7, 9, 8}, cldnn::gather_elements::gather_elements_axis::along_y, data_types::f16, format::bfyx
+#define CASE_GATHER_ELEMENTS_FP16_4D_2 data_types::f16, format::bfyx, {3, 2, 8, 3}, format::bfyx, {2, 2, 8, 3}, format::bfyx, {2, 2, 8, 3}, cldnn::gather_elements::gather_elements_axis::along_b, data_types::f16, format::bfyx
+#define CASE_GATHER_ELEMENTS_FP16_4D_3 data_types::f16, format::bfyx, {1, 3, 2, 9}, format::bfyx, {1, 3, 5, 9}, format::bfyx, {1, 3, 5, 9}, cldnn::gather_elements::gather_elements_axis::along_x, data_types::f16, format::bfyx
+
+#define CASE_GATHER_ELEMENTS_FP16_5D_1 data_types::f16, format::bfzyx, {3, 2, 5, 2, 3}, format::bfzyx, {3, 2, 2, 2, 3}, format::bfzyx, {3, 2, 2, 2, 3}, cldnn::gather_elements::gather_elements_axis::along_x, data_types::f16, format::bfzyx
+#define CASE_GATHER_ELEMENTS_FP16_5D_2 data_types::f16, format::bfzyx, {5, 4, 7, 4, 4}, format::bfzyx, {5, 4, 7, 4, 3}, format::bfzyx, {5, 4, 7, 4, 3}, cldnn::gather_elements::gather_elements_axis::along_z, data_types::f16, format::bfzyx
+
+#define CASE_GATHER_ELEMENTS_FP16_6D_1 data_types::f16, format::bfwzyx, {5, 4, 6, 7, 8, 2}, format::bfwzyx, {5, 2, 6, 7, 8, 2}, format::bfwzyx, {5, 2, 6, 7, 8, 2}, cldnn::gather_elements::gather_elements_axis::along_f, data_types::f16, format::bfwzyx
+#define CASE_GATHER_ELEMENTS_FP16_6D_2 data_types::f16, format::bfwzyx, {2, 1, 2, 3, 2, 1}, format::bfwzyx, {2, 1, 2, 3, 2, 3}, format::bfwzyx, {2, 1, 2, 3, 2, 3}, cldnn::gather_elements::gather_elements_axis::along_w, data_types::f16, format::bfwzyx
+#define CASE_GATHER_ELEMENTS_FP16_6D_3 data_types::f16, format::bfwzyx, {2, 2, 3, 4, 4, 2}, format::bfwzyx, {2, 2, 6, 4, 4, 2}, format::bfwzyx, {2, 2, 6, 4, 4, 2}, cldnn::gather_elements::gather_elements_axis::along_x, data_types::f16, format::bfwzyx
+
+
+#define CASE_GATHER_ELEMENTS_FP32_4D_1 data_types::f32, format::bfyx, {3, 7, 9, 8}, format::bfyx, {3, 7, 9, 8}, format::bfyx, {3, 7, 9, 8}, cldnn::gather_elements::gather_elements_axis::along_y, data_types::f32, format::bfyx
+#define CASE_GATHER_ELEMENTS_FP32_4D_2 data_types::f32, format::bfyx, {3, 2, 8, 3}, format::bfyx, {2, 2, 8, 3}, format::bfyx, {2, 2, 8, 3}, cldnn::gather_elements::gather_elements_axis::along_b, data_types::f32, format::bfyx
+#define CASE_GATHER_ELEMENTS_FP32_4D_3 data_types::f32, format::bfyx, {1, 3, 2, 9}, format::bfyx, {1, 3, 5, 9}, format::bfyx, {1, 3, 5, 9}, cldnn::gather_elements::gather_elements_axis::along_x, data_types::f32, format::bfyx
+
+#define CASE_GATHER_ELEMENTS_FP32_5D_1 data_types::f32, format::bfzyx, {3, 2, 5, 2, 3}, format::bfzyx, {3, 2, 2, 2, 3}, format::bfzyx, {3, 2, 2, 2, 3}, cldnn::gather_elements::gather_elements_axis::along_x, data_types::f32, format::bfzyx
+#define CASE_GATHER_ELEMENTS_FP32_5D_2 data_types::f32, format::bfzyx, {5, 4, 7, 4, 4}, format::bfzyx, {5, 4, 7, 4, 3}, format::bfzyx, {5, 4, 7, 4, 3}, cldnn::gather_elements::gather_elements_axis::along_z, data_types::f32, format::bfzyx
+
+#define CASE_GATHER_ELEMENTS_FP32_6D_1 data_types::f32, format::bfwzyx, {5, 4, 6, 7, 8, 2}, format::bfwzyx, {5, 2, 6, 7, 8, 2}, format::bfwzyx, {5, 2, 6, 7, 8, 2}, cldnn::gather_elements::gather_elements_axis::along_f, data_types::f32, format::bfwzyx
+#define CASE_GATHER_ELEMENTS_FP32_6D_2 data_types::f32, format::bfwzyx, {2, 1, 2, 3, 2, 1}, format::bfwzyx, {2, 1, 2, 3, 2, 3}, format::bfwzyx, {2, 1, 2, 3, 2, 3}, cldnn::gather_elements::gather_elements_axis::along_w, data_types::f32, format::bfwzyx
+#define CASE_GATHER_ELEMENTS_FP32_6D_3 data_types::f32, format::bfwzyx, {2, 2, 3, 4, 4, 2}, format::bfwzyx, {2, 2, 6, 4, 4, 2}, format::bfwzyx, {2, 2, 6, 4, 4, 2}, cldnn::gather_elements::gather_elements_axis::along_x, data_types::f32, format::bfwzyx
+
+class GatherElementsPrimitiveFusingTest : public ::BaseFusingTest<gather_elements_test_params> {
+public:
+    void execute(gather_elements_test_params& p) {
+        auto input_prim = get_mem(get_input_layout(p));
+        network network_not_fused(this->engine, this->topology_non_fused, bo_not_fused);
+        network network_fused(this->engine, this->topology_fused, bo_fused);
+        network_fused.set_input_data("input", input_prim);
+        network_not_fused.set_input_data("input", input_prim);
+        compare(network_not_fused, network_fused, p);
+    }
+
+    size_t get_axis_dim(gather_elements_test_params& p) {
+        switch (p.axis) {
+            case cldnn::gather_elements::gather_elements_axis::along_x:
+                return p.input_shape.spatial[0];
+            case cldnn::gather_elements::gather_elements_axis::along_y:
+                return p.input_shape.spatial[1];
+            case cldnn::gather_elements::gather_elements_axis::along_z:
+                return p.input_shape.spatial[2];
+            case cldnn::gather_elements::gather_elements_axis::along_w:
+                return p.input_shape.spatial[3];
+            case cldnn::gather_elements::gather_elements_axis::along_f:
+                return p.input_shape.feature[0];
+            case cldnn::gather_elements::gather_elements_axis::along_b:
+                return p.input_shape.batch[0];
+            default:
+                return 1;
+        }
+    }
+
+    layout get_input_layout(gather_elements_test_params& p) {
+        return layout{ p.data_type, p.input_format, p.input_shape };
+    }
+
+    layout get_indices_layout(gather_elements_test_params& p) {
+        return layout{ p.data_type, p.indices_format, p.indices_shape };
+    }
+
+    layout get_output_layout(gather_elements_test_params& p) {
+        return layout{ p.data_type, p.output_format, p.output_shape };
+    }
+
+    layout get_per_channel_layout(gather_elements_test_params& p) {
+        return layout{ p.default_type, p.default_format, tensor{1, p.output_shape.feature[0], 1, 1} };
+    }
+};
+
+class gather_elements_quantize : public GatherElementsPrimitiveFusingTest {};
+TEST_P(gather_elements_quantize, basic) {
+    auto p = GetParam();
+    create_topologies(input_layout("input", get_input_layout(p)),
+        data("gather_elements_indices", get_mem(get_indices_layout(p), 0, static_cast<int>(get_axis_dim(p))-1)),
+        data("in_lo", get_mem(get_per_channel_layout(p), min_random, 0)),
+        data("in_hi", get_mem(get_per_channel_layout(p), 1, max_random)),
+        data("out_lo", get_mem(get_single_element_layout(p), -127)),
+        data("out_hi", get_mem(get_single_element_layout(p), 127)),
+        gather_elements("gather_elements_prim", "input", "gather_elements_indices", p.output_format, p.output_shape, p.axis),
+        quantize("quantize", "gather_elements_prim", "in_lo", "in_hi", "out_lo", "out_hi", 255, data_types::i8),
+        reorder("reorder_bfyx", "quantize", p.default_format, data_types::f32)
+    );
+    tolerance = 1.f;
+    execute(p);
+}
+
+INSTANTIATE_TEST_SUITE_P(fusings_gpu, gather_elements_quantize,
+    ::testing::ValuesIn(std::vector<gather_elements_test_params>{
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_1, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_2, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_3, 2, 3 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_5D_1, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_5D_2, 2, 3 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_1, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_2, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_3, 2, 3 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_1, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_2, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_3, 2, 3 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_5D_1, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_5D_2, 2, 3 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_1, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_2, 2, 3 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_3, 2, 3 },
+}));
+
+
+class gather_elements_scale_activation : public GatherElementsPrimitiveFusingTest {};
+TEST_P(gather_elements_scale_activation, basic) {
+    auto p = GetParam();
+    create_topologies(input_layout("input", get_input_layout(p)),
+        data("gather_elements_indices", get_mem(get_indices_layout(p), 0, static_cast<int>(get_axis_dim(p))-1)),
+        data("scale_data", get_mem(get_per_channel_layout(p), -10, 10)),
+        gather_elements("gather_elements_prim", "input", "gather_elements_indices", p.output_format, p.output_shape, p.axis),
+        activation("activation", "gather_elements_prim", activation_func::abs),
+        scale("scale", "activation", "scale_data"),
+        reorder("reorder_bfyx", "scale", p.default_format, data_types::f32)
+    );
+
+    tolerance = 1e-5f;
+    execute(p);
+}
+
+INSTANTIATE_TEST_SUITE_P(fusings_gpu, gather_elements_scale_activation,
+    ::testing::ValuesIn(std::vector<gather_elements_test_params>{
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_1, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_2, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_3, 2, 4 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_5D_1, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_5D_2, 2, 4 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_1, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_2, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_3, 2, 4 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_1, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_2, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_3, 2, 4 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_5D_1, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_5D_2, 2, 4 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_1, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_2, 2, 4 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_3, 2, 4 },
+}));
+
+
+class gather_elements_activation_scale_eltwise : public GatherElementsPrimitiveFusingTest {};
+TEST_P(gather_elements_activation_scale_eltwise, basic) {
+    auto p = GetParam();
+
+    create_topologies(input_layout("input", get_input_layout(p)),
+        data("gather_elements_indices", get_mem(get_indices_layout(p), 0, static_cast<int>(get_axis_dim(p))-1)),
+        data("scale_data", get_mem(get_per_channel_layout(p), 1.0f / 255)),
+        data("eltwise_data", get_mem(get_output_layout(p))),
+        gather_elements("gather_elements_prim", "input", "gather_elements_indices", p.output_format, p.output_shape, p.axis),
+        activation("activation", "gather_elements_prim", activation_func::abs),
+        scale("scale", "activation", "scale_data"),
+        eltwise("eltwise", { "scale", "eltwise_data" }, eltwise_mode::sum, p.data_type),
+        reorder("reorder_bfyx", "eltwise", p.default_format, data_types::f32)
+    );
+
+    tolerance = 1e-5f;
+    execute(p);
+}
+
+INSTANTIATE_TEST_SUITE_P(fusings_gpu, gather_elements_activation_scale_eltwise,
+    ::testing::ValuesIn(std::vector<gather_elements_test_params>{
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_1, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_2, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_4D_3, 2, 5 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_5D_1, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_5D_2, 2, 5 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_1, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_2, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP16_6D_3, 2, 5 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_1, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_2, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_4D_3, 2, 5 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_5D_1, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_5D_2, 2, 5 },
+
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_1, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_2, 2, 5 },
+        gather_elements_test_params{ CASE_GATHER_ELEMENTS_FP32_6D_3, 2, 5 },
+}));
diff --git a/inference-engine/thirdparty/clDNN/tests/test_cases/gather_elements_gpu_test.cpp b/inference-engine/thirdparty/clDNN/tests/test_cases/gather_elements_gpu_test.cpp
new file mode 100644
index 00000000000000..034f9f6699ada5
--- /dev/null
+++ b/inference-engine/thirdparty/clDNN/tests/test_cases/gather_elements_gpu_test.cpp
@@ -0,0 +1,1141 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "test_utils.h"
+
+#include <cldnn/primitives/input_layout.hpp>
+#include <cldnn/primitives/gather_elements.hpp>
+#include <cldnn/runtime/memory.hpp>
+#include <cldnn/graph/topology.hpp>
+#include <cldnn/graph/network.hpp>
+
+#include <cstddef>
+#include <gtest/gtest.h>
+
+using namespace cldnn;
+using namespace ::tests;
+
+inline void DoTest(engine& engine,
+    const cldnn::memory::ptr& input0, // data
+    const cldnn::memory::ptr& input1, // indices
+    const std::vector<float>& expected_results,
+    const tensor& output_tensor,
+    const cldnn::gather_elements::gather_elements_axis axis) {
+    topology topology;
+    topology.add(input_layout("InputData", input0->get_layout()));
+    topology.add(input_layout("InputIndices", input1->get_layout()));
+    topology.add(
+        gather_elements("gather_elements", "InputData", "InputIndices", input1->get_layout().format, output_tensor, axis)
+    );
+
+    network network(engine, topology);
+
+    network.set_input_data("InputData", input0);
+    network.set_input_data("InputIndices", input1);
+    auto outputs = network.execute();
+    auto output = outputs.at("gather_elements").get_memory();
+    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
+
+    for (size_t i = 0; i < expected_results.size(); ++i) {
+        EXPECT_EQ(expected_results[i], float16_to_float32(output_ptr[i]));
+    }
+}
+
+TEST(gather_elements_gpu_fp16, d3283_i2283_a0) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_b;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfyx, { 3, 2, 8, 3 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfyx, { 2, 2, 8, 3 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), FLOAT16(5), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(4), FLOAT16(0), FLOAT16(4), FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(7), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(8), FLOAT16(3), FLOAT16(6), FLOAT16(8), FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), FLOAT16(5), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(10), FLOAT16(0), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(10), FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(0), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(0), FLOAT16(7), FLOAT16(9), FLOAT16(6), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(5), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(9), FLOAT16(2), FLOAT16(4), FLOAT16(5), FLOAT16(5), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(6), FLOAT16(8), FLOAT16(0), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(9), FLOAT16(1), FLOAT16(2), FLOAT16(7), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(0), FLOAT16(4), FLOAT16(0), FLOAT16(7), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(9), FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(10), FLOAT16(6), FLOAT16(1), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(4), FLOAT16(2), FLOAT16(4), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(1), FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(9), FLOAT16(0), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(5), FLOAT16(6), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(3), FLOAT16(5), FLOAT16(5), FLOAT16(4), FLOAT16(4), FLOAT16(7), FLOAT16(8), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(7), FLOAT16(9), FLOAT16(8), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(0), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(9), FLOAT16(2), FLOAT16(4), FLOAT16(5), FLOAT16(2), FLOAT16(3), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(4), FLOAT16(0), FLOAT16(5), FLOAT16(0), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(2), FLOAT16(0), FLOAT16(4), FLOAT16(2), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(3), FLOAT16(0), FLOAT16(4), FLOAT16(10), FLOAT16(7), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(9), FLOAT16(3), FLOAT16(0), FLOAT16(7), FLOAT16(6), FLOAT16(8), FLOAT16(8), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(7), FLOAT16(3), FLOAT16(3), FLOAT16(10), FLOAT16(6), FLOAT16(1), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(2, 2, 8, 3), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d2235_i2235_a3) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_x;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfyx, { 2, 2, 3, 5 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfyx, { 2, 2, 3, 5 } }); // indices
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(7), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(8), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(10), FLOAT16(0), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2),
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(5), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(0), FLOAT16(9), FLOAT16(0), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(7), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(8), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(8), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(3), FLOAT16(3), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(3), FLOAT16(3), 
+        FLOAT16(9), FLOAT16(9), FLOAT16(0),
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(2, 2, 3, 5), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d1329_i1359_an1) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_x;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfyx, { 1, 3, 2, 9 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfyx, { 1, 3, 5, 9 } }); // indices
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), 
+        FLOAT16(8), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(7), 
+        FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), 
+        FLOAT16(1), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(8), 
+        FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(0), 
+        FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), 
+        FLOAT16(8), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(3), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(5), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(0), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(7), FLOAT16(7), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(5), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(5), FLOAT16(0), FLOAT16(0), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(4), FLOAT16(7), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(5), FLOAT16(9), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(1), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(8), FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(3), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(8), FLOAT16(6), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(10), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(10), FLOAT16(2), FLOAT16(2), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(9), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(4), FLOAT16(2), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(8), FLOAT16(8), FLOAT16(5), FLOAT16(8), 
+        FLOAT16(3), FLOAT16(3), FLOAT16(2), FLOAT16(3), FLOAT16(3), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(1, 3, 5, 9), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d12853_i12923_a3) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_y;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfzyx, { 1, 2, 8, 5, 3 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfzyx, { 1, 2, 8, 2, 3 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), FLOAT16(5), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(4), FLOAT16(0), FLOAT16(4), FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(7), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(8), FLOAT16(3), FLOAT16(6), FLOAT16(8), FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), FLOAT16(5), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(10), FLOAT16(0), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(10), FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(0), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(0), FLOAT16(7), FLOAT16(9), FLOAT16(6), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(5), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(9), FLOAT16(2), FLOAT16(4), FLOAT16(5), FLOAT16(5), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(6), FLOAT16(8), FLOAT16(0), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(9), FLOAT16(1), FLOAT16(2), FLOAT16(7), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(0), FLOAT16(4), FLOAT16(0), FLOAT16(7), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(9), FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(10), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), FLOAT16(6), FLOAT16(2), FLOAT16(5), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(3), FLOAT16(6), FLOAT16(1), FLOAT16(7), FLOAT16(6), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(5), FLOAT16(4), FLOAT16(2), FLOAT16(0), FLOAT16(9), FLOAT16(4), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), FLOAT16(9), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(8), FLOAT16(5), FLOAT16(3), FLOAT16(4), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(2), FLOAT16(7), FLOAT16(9), FLOAT16(2), FLOAT16(9), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(8), FLOAT16(5), FLOAT16(10), FLOAT16(6), FLOAT16(4), FLOAT16(9), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(10), FLOAT16(10), FLOAT16(9), FLOAT16(3), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(1), FLOAT16(4), FLOAT16(6), FLOAT16(9), FLOAT16(4), FLOAT16(8), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(8), FLOAT16(7), FLOAT16(8), FLOAT16(0), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(7), FLOAT16(5), FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(10), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(4), FLOAT16(10), FLOAT16(2), FLOAT16(4), FLOAT16(3), FLOAT16(5), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(2), FLOAT16(4), FLOAT16(3), FLOAT16(4), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(4), FLOAT16(2), FLOAT16(4), FLOAT16(2), FLOAT16(1), FLOAT16(3), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(4), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(3), FLOAT16(4), FLOAT16(4), FLOAT16(1), FLOAT16(0), FLOAT16(3), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(0), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(4), FLOAT16(3), FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(3), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(3), FLOAT16(3), FLOAT16(4), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(3), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(3), FLOAT16(3), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(4), FLOAT16(0), FLOAT16(4), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(0), FLOAT16(8), FLOAT16(7), FLOAT16(6), FLOAT16(2), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(4), FLOAT16(5), FLOAT16(9), FLOAT16(2), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(0), FLOAT16(10), FLOAT16(5), FLOAT16(3), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(10), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(2), FLOAT16(4), FLOAT16(5), FLOAT16(6), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(1), FLOAT16(9), FLOAT16(8), FLOAT16(9), FLOAT16(1), FLOAT16(5), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(3), FLOAT16(6), FLOAT16(1), FLOAT16(7), FLOAT16(6), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(0), FLOAT16(6), FLOAT16(2), FLOAT16(7), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(8), FLOAT16(5), FLOAT16(0), FLOAT16(9), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(7), FLOAT16(5), FLOAT16(3), FLOAT16(9), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(7), FLOAT16(4), FLOAT16(8), FLOAT16(5), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(7), FLOAT16(10), FLOAT16(0), FLOAT16(9), FLOAT16(4), FLOAT16(5), FLOAT16(5), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(1, 2, 8, 2, 3), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d25441_i22441_an4) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_f;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfzyx, { 2, 5, 4, 4, 1 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfzyx, { 2, 2, 4, 4, 1 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(7), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(7), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(10), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(0), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(9), FLOAT16(6), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(3), FLOAT16(5), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(9), FLOAT16(2), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(6), FLOAT16(8), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(7), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(6), FLOAT16(10), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), FLOAT16(6), 
+        FLOAT16(2), FLOAT16(5), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(3), FLOAT16(6), 
+        FLOAT16(1), FLOAT16(7), FLOAT16(6), FLOAT16(8), 
+
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(2), FLOAT16(4), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(1), FLOAT16(3), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(4), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(3), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(1), FLOAT16(0), FLOAT16(3), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(0), FLOAT16(2), FLOAT16(4), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(2), FLOAT16(0), FLOAT16(10), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(1), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(8), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(5), FLOAT16(7), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(6), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(6), FLOAT16(5), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(6), FLOAT16(6), 
+        FLOAT16(1), FLOAT16(5), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(6), FLOAT16(4), FLOAT16(1), FLOAT16(6), 
+        FLOAT16(2), FLOAT16(6), FLOAT16(5), FLOAT16(7), 
+        FLOAT16(1), FLOAT16(9), FLOAT16(2), FLOAT16(6), 
+        FLOAT16(6), FLOAT16(5), FLOAT16(10), FLOAT16(8), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(2, 2, 4, 4, 1), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d32843_i12843_a0) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_b;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfzyx, { 3, 2, 8, 4, 3 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfzyx, { 1, 2, 8, 4, 3 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), FLOAT16(5), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(4), FLOAT16(0), FLOAT16(4), FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(7), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(8), FLOAT16(3), FLOAT16(6), FLOAT16(8), FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), FLOAT16(5), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(10), FLOAT16(0), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(10), FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(0), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(0), FLOAT16(7), FLOAT16(9), FLOAT16(6), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(5), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(9), FLOAT16(2), FLOAT16(4), FLOAT16(5), FLOAT16(5), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(6), FLOAT16(8), FLOAT16(0), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(9), FLOAT16(1), FLOAT16(2), FLOAT16(7), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(0), FLOAT16(4), FLOAT16(0), FLOAT16(7), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(9), FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(10), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), FLOAT16(6), FLOAT16(2), FLOAT16(5), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(3), FLOAT16(6), FLOAT16(1), FLOAT16(7), FLOAT16(6), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(5), FLOAT16(4), FLOAT16(2), FLOAT16(0), FLOAT16(9), FLOAT16(4), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), FLOAT16(9), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(8), FLOAT16(5), FLOAT16(3), FLOAT16(4), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(2), FLOAT16(7), FLOAT16(9), FLOAT16(2), FLOAT16(9), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(8), FLOAT16(5), FLOAT16(10), FLOAT16(6), FLOAT16(4), FLOAT16(9), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(10), FLOAT16(10), FLOAT16(9), FLOAT16(3), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(1), FLOAT16(4), FLOAT16(6), FLOAT16(9), FLOAT16(4), FLOAT16(8), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(8), FLOAT16(7), FLOAT16(8), FLOAT16(0), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(7), FLOAT16(5), FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(10), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(4), FLOAT16(10), FLOAT16(2), FLOAT16(4), FLOAT16(3), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(4), FLOAT16(5), FLOAT16(8), FLOAT16(4), FLOAT16(2), FLOAT16(10), FLOAT16(1), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(0), FLOAT16(0), FLOAT16(8), FLOAT16(8), FLOAT16(3), FLOAT16(4), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(9), FLOAT16(7), FLOAT16(9), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(6), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(4), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(7), FLOAT16(3), FLOAT16(8), FLOAT16(8), FLOAT16(4), FLOAT16(3), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(10), FLOAT16(2), FLOAT16(9), FLOAT16(1), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(1), FLOAT16(9), FLOAT16(1), FLOAT16(10), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(6), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(6), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(2), FLOAT16(3), FLOAT16(7), FLOAT16(1), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(3), FLOAT16(7), FLOAT16(1), FLOAT16(1), FLOAT16(5), FLOAT16(9), 
+        FLOAT16(8), FLOAT16(6), FLOAT16(8), FLOAT16(3), FLOAT16(1), FLOAT16(5), FLOAT16(3), FLOAT16(6), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(2), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(0), FLOAT16(4), FLOAT16(2), FLOAT16(7), FLOAT16(7), FLOAT16(5), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(5), FLOAT16(10), FLOAT16(3), FLOAT16(5), FLOAT16(5), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(6), FLOAT16(10), FLOAT16(1), FLOAT16(7), FLOAT16(3), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(3), FLOAT16(7), FLOAT16(6), FLOAT16(10), FLOAT16(2), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(9), FLOAT16(7), FLOAT16(5), FLOAT16(8), FLOAT16(0), FLOAT16(1), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(6), FLOAT16(8), FLOAT16(10), FLOAT16(7), FLOAT16(3), FLOAT16(8), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(5), FLOAT16(0), FLOAT16(1), FLOAT16(9), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(6), FLOAT16(5), FLOAT16(0), FLOAT16(5), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(6), FLOAT16(7), FLOAT16(7), FLOAT16(5), FLOAT16(3), FLOAT16(8), FLOAT16(4), 
+        FLOAT16(7), FLOAT16(3), FLOAT16(0), FLOAT16(1), FLOAT16(5), FLOAT16(8), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(7), FLOAT16(3), FLOAT16(0), FLOAT16(5), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(1), FLOAT16(3), FLOAT16(9), FLOAT16(7), FLOAT16(6), FLOAT16(7), FLOAT16(3), 
+        FLOAT16(0), FLOAT16(10), FLOAT16(5), FLOAT16(0), FLOAT16(9), FLOAT16(0), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(7), FLOAT16(5), FLOAT16(0), FLOAT16(1), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(3), FLOAT16(6), FLOAT16(6), FLOAT16(1), FLOAT16(6), FLOAT16(10), FLOAT16(3), FLOAT16(9), 
+        FLOAT16(10), FLOAT16(2), FLOAT16(2), FLOAT16(4), FLOAT16(8), FLOAT16(9), FLOAT16(2), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(2), FLOAT16(7), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(6), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(6), FLOAT16(4), FLOAT16(0), FLOAT16(7), FLOAT16(4), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(10), FLOAT16(0), FLOAT16(0), FLOAT16(5), FLOAT16(8), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(3), FLOAT16(8), FLOAT16(5), FLOAT16(8), FLOAT16(7), FLOAT16(7), FLOAT16(8), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(6), FLOAT16(7), FLOAT16(6), FLOAT16(4), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(7), FLOAT16(1), FLOAT16(8), FLOAT16(1), FLOAT16(0), FLOAT16(7), FLOAT16(1), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(6), FLOAT16(10), FLOAT16(0), FLOAT16(6), FLOAT16(7), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(8), FLOAT16(0), FLOAT16(4), FLOAT16(10), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(8), FLOAT16(2), FLOAT16(1), FLOAT16(4), FLOAT16(10), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(5), FLOAT16(1), FLOAT16(5), FLOAT16(1), FLOAT16(9), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(3), FLOAT16(7), FLOAT16(6), FLOAT16(9), FLOAT16(8), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(10), FLOAT16(6), FLOAT16(3), FLOAT16(5), FLOAT16(5), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(4), FLOAT16(5), FLOAT16(3), FLOAT16(1), FLOAT16(2), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(9), FLOAT16(2), FLOAT16(7), FLOAT16(2), FLOAT16(4), FLOAT16(0), FLOAT16(5), 
+
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(8), FLOAT16(5), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(9), FLOAT16(0), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(7), FLOAT16(9), FLOAT16(5), FLOAT16(8), FLOAT16(6), FLOAT16(4), 
+        FLOAT16(8), FLOAT16(5), FLOAT16(8), FLOAT16(1), FLOAT16(4), FLOAT16(7), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(5), FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(8), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(1), FLOAT16(3), FLOAT16(9), FLOAT16(7), FLOAT16(0), FLOAT16(6), FLOAT16(3), 
+        FLOAT16(9), FLOAT16(10), FLOAT16(5), FLOAT16(0), FLOAT16(9), FLOAT16(3), FLOAT16(4), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(10), FLOAT16(5), FLOAT16(0), FLOAT16(5), FLOAT16(3), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(6), FLOAT16(2), FLOAT16(9), FLOAT16(10), FLOAT16(10), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(2), FLOAT16(2), FLOAT16(4), FLOAT16(0), FLOAT16(0), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(7), FLOAT16(7), FLOAT16(9), FLOAT16(6), FLOAT16(4), FLOAT16(6), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(2), FLOAT16(10), FLOAT16(2), FLOAT16(7), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(9), FLOAT16(2), FLOAT16(4), FLOAT16(10), FLOAT16(5), FLOAT16(3), FLOAT16(2), 
+        FLOAT16(3), FLOAT16(6), FLOAT16(5), FLOAT16(0), FLOAT16(5), FLOAT16(8), FLOAT16(7), FLOAT16(8), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(2), FLOAT16(9), FLOAT16(6), FLOAT16(1), FLOAT16(7), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(3), FLOAT16(7), FLOAT16(0), FLOAT16(7), FLOAT16(5), FLOAT16(9), 
+        FLOAT16(8), FLOAT16(3), FLOAT16(10), FLOAT16(3), FLOAT16(1), FLOAT16(5), FLOAT16(4), FLOAT16(6), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(6), FLOAT16(4), FLOAT16(4), FLOAT16(10), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(2), FLOAT16(1), FLOAT16(7), FLOAT16(7), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(1), FLOAT16(5), FLOAT16(10), FLOAT16(3), FLOAT16(1), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(3), FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(8), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(3), FLOAT16(3), FLOAT16(5), FLOAT16(10), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(9), FLOAT16(7), FLOAT16(5), FLOAT16(3), FLOAT16(4), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(6), FLOAT16(8), FLOAT16(2), FLOAT16(7), FLOAT16(3), FLOAT16(5), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(1, 2, 8, 4, 3), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d223442_i226442_a5) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_x;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfwzyx, { 2, 2, 3, 4, 4, 2 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfwzyx, { 2, 2, 6, 4, 4, 2 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(7), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(8), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(10), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(10), 
+        FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(10), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(9), FLOAT16(6), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(3), FLOAT16(3), 
+        FLOAT16(5), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(9), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(8), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(7), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(3), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(3), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(1), FLOAT16(7), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(6), 
+        FLOAT16(10), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), 
+        FLOAT16(6), FLOAT16(2), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(10), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(3), FLOAT16(6), 
+        FLOAT16(1), FLOAT16(7), FLOAT16(6), 
+        FLOAT16(8), FLOAT16(2), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(4), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(1), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(8), 
+        FLOAT16(10), FLOAT16(7), FLOAT16(2), 
+        FLOAT16(7), FLOAT16(9), FLOAT16(2), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(10), FLOAT16(6), 
+        FLOAT16(4), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(3), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(9), FLOAT16(4), 
+        FLOAT16(8), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(8), FLOAT16(7), FLOAT16(8), 
+        FLOAT16(0), FLOAT16(9), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(9), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(4), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(3), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(8), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(10), FLOAT16(1), FLOAT16(6), 
+        FLOAT16(6), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(2), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(6), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(7), FLOAT16(3), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(9), FLOAT16(1), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(1), FLOAT16(9), 
+        FLOAT16(1), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(6), FLOAT16(7), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(6), FLOAT16(0), FLOAT16(6), 
+        FLOAT16(2), FLOAT16(3), FLOAT16(7), 
+        FLOAT16(1), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(3), 
+        FLOAT16(7), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(8), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(1), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(3), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(6), 
+        FLOAT16(10), FLOAT16(1), FLOAT16(7), 
+        FLOAT16(3), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(3), 
+        FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(9), FLOAT16(7), FLOAT16(5), 
+        FLOAT16(8), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(3), FLOAT16(8), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(2), FLOAT16(5), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(5), FLOAT16(4), FLOAT16(10), FLOAT16(5), 
+        FLOAT16(0), FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(0), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(7), FLOAT16(7), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(9), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(8), FLOAT16(8), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(0), FLOAT16(3), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(6), FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(8), FLOAT16(6), 
+        FLOAT16(4), FLOAT16(10), FLOAT16(2), FLOAT16(10), FLOAT16(2), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(6), FLOAT16(9), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(5), FLOAT16(3), FLOAT16(3), FLOAT16(5), FLOAT16(3), FLOAT16(5), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(1), FLOAT16(3), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(9), FLOAT16(0), FLOAT16(10), FLOAT16(9), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(3), FLOAT16(5), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(2), FLOAT16(0), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(0), FLOAT16(5), FLOAT16(4), FLOAT16(4), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(3), FLOAT16(5), FLOAT16(5), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(10), FLOAT16(0), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(8), FLOAT16(9), FLOAT16(8), FLOAT16(9), FLOAT16(8), FLOAT16(9), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(0), FLOAT16(7), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(8), FLOAT16(9), FLOAT16(6), FLOAT16(8), FLOAT16(8), FLOAT16(6), 
+        FLOAT16(9), FLOAT16(9), FLOAT16(7), FLOAT16(10), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(2), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(6), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(9), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(4), FLOAT16(4), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(8), FLOAT16(8), FLOAT16(6), FLOAT16(6), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(5), FLOAT16(10), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(9), FLOAT16(9), FLOAT16(8), FLOAT16(9), 
+        FLOAT16(9), FLOAT16(6), FLOAT16(6), FLOAT16(1), FLOAT16(9), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(1), FLOAT16(7), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(3), FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(0), FLOAT16(4), FLOAT16(4), FLOAT16(7), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(3), FLOAT16(3), FLOAT16(3), FLOAT16(9), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(1), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(1), FLOAT16(1), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(6), FLOAT16(10), FLOAT16(6), FLOAT16(10), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(1), FLOAT16(10), FLOAT16(1), FLOAT16(10), FLOAT16(1), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(5), FLOAT16(6), FLOAT16(2), FLOAT16(2), FLOAT16(6), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(1), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(6), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(6), FLOAT16(7), FLOAT16(7), FLOAT16(6), 
+        FLOAT16(8), FLOAT16(5), FLOAT16(5), FLOAT16(8), FLOAT16(8), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(1), FLOAT16(9), FLOAT16(4), FLOAT16(9), FLOAT16(9), FLOAT16(4), 
+        FLOAT16(1), FLOAT16(4), FLOAT16(1), FLOAT16(4), FLOAT16(4), FLOAT16(10), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(9), FLOAT16(1), FLOAT16(9), FLOAT16(1), 
+        FLOAT16(4), FLOAT16(4), FLOAT16(0), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(8), FLOAT16(1), FLOAT16(1), FLOAT16(1), FLOAT16(5), FLOAT16(8), 
+        FLOAT16(3), FLOAT16(4), FLOAT16(3), FLOAT16(3), FLOAT16(3), FLOAT16(8), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(7), FLOAT16(10), FLOAT16(10), FLOAT16(2), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(9), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(9), FLOAT16(9), FLOAT16(9), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(6), FLOAT16(6), FLOAT16(5), FLOAT16(10), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(9), FLOAT16(7), FLOAT16(7), FLOAT16(9), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(7), FLOAT16(10), FLOAT16(7), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(3), FLOAT16(9), FLOAT16(3), FLOAT16(9), FLOAT16(3), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(1), FLOAT16(4), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(9), FLOAT16(9), FLOAT16(9), FLOAT16(4), FLOAT16(6), FLOAT16(6), 
+        FLOAT16(9), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(7), FLOAT16(9), 
+        FLOAT16(8), FLOAT16(8), FLOAT16(7), FLOAT16(8), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(5), FLOAT16(7), FLOAT16(7), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(2), FLOAT16(9), FLOAT16(2), FLOAT16(9), FLOAT16(9), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(1), FLOAT16(5), FLOAT16(9), 
+        FLOAT16(4), FLOAT16(10), FLOAT16(2), FLOAT16(10), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(3), FLOAT16(4), FLOAT16(3), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(4), FLOAT16(8), FLOAT16(8), FLOAT16(2), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(1), FLOAT16(10), FLOAT16(6), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(6), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(3), FLOAT16(8), FLOAT16(8), FLOAT16(3), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(4), FLOAT16(7), FLOAT16(4), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(9), FLOAT16(2), FLOAT16(7), FLOAT16(9), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(0), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(3), FLOAT16(7), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(8), FLOAT16(8), 
+        FLOAT16(3), FLOAT16(0), FLOAT16(3), FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(10), FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(9), FLOAT16(4), FLOAT16(1), FLOAT16(1), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(6), FLOAT16(1), FLOAT16(6), FLOAT16(9), FLOAT16(6), FLOAT16(1), 
+        FLOAT16(10), FLOAT16(2), FLOAT16(1), FLOAT16(10), FLOAT16(1), FLOAT16(10), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(1), FLOAT16(2), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(8), FLOAT16(6), FLOAT16(6), FLOAT16(8), FLOAT16(6), FLOAT16(6), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(6), FLOAT16(6), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(7), FLOAT16(3), FLOAT16(3), FLOAT16(2), FLOAT16(7), FLOAT16(3), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(1), FLOAT16(5), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(6), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(8), FLOAT16(8), FLOAT16(5), FLOAT16(9), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(8), FLOAT16(6), FLOAT16(6), FLOAT16(6), 
+        FLOAT16(3), FLOAT16(5), FLOAT16(3), FLOAT16(5), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(6), FLOAT16(5), FLOAT16(4), FLOAT16(5), FLOAT16(6), FLOAT16(5), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(4), FLOAT16(4), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(3), FLOAT16(0), FLOAT16(4), FLOAT16(3), FLOAT16(4), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(2), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(7), FLOAT16(8), FLOAT16(7), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(10), FLOAT16(10), FLOAT16(10), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(3), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(7), FLOAT16(7), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(1), FLOAT16(7), FLOAT16(1), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(5), FLOAT16(3), FLOAT16(5), 
+        FLOAT16(0), FLOAT16(9), FLOAT16(3), FLOAT16(9), FLOAT16(0), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(6), FLOAT16(6), FLOAT16(10), FLOAT16(10), FLOAT16(6), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), FLOAT16(10), FLOAT16(10), FLOAT16(10), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(7), FLOAT16(7), FLOAT16(5), FLOAT16(9), 
+        FLOAT16(0), FLOAT16(8), FLOAT16(0), FLOAT16(1), FLOAT16(1), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(7), FLOAT16(4), FLOAT16(4), FLOAT16(4), FLOAT16(4), 
+        FLOAT16(8), FLOAT16(10), FLOAT16(8), FLOAT16(6), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(3), FLOAT16(3), FLOAT16(7), FLOAT16(8), FLOAT16(3), FLOAT16(8), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(2, 2, 6, 4, 4, 2), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d124251_i124221_an3) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_z;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfwzyx, { 1, 2, 4, 2, 5, 1 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfwzyx, { 1, 2, 4, 2, 2, 1 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(0), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(10), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(7), FLOAT16(10), FLOAT16(8), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(10), FLOAT16(4), 
+        FLOAT16(2), FLOAT16(10), FLOAT16(7), FLOAT16(8), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(3), FLOAT16(3), FLOAT16(1), 
+        FLOAT16(5), FLOAT16(9), FLOAT16(10), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(5), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(0), FLOAT16(5), FLOAT16(4), 
+        FLOAT16(3), FLOAT16(10), FLOAT16(5), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(0), FLOAT16(8), FLOAT16(8), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(2), FLOAT16(4), FLOAT16(3), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(3), FLOAT16(1), FLOAT16(4), FLOAT16(2), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(1), FLOAT16(3), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), FLOAT16(4), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), FLOAT16(4), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(0), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(6), FLOAT16(2), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(2), FLOAT16(0), FLOAT16(5), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(5), FLOAT16(0), 
+        FLOAT16(10), FLOAT16(5), FLOAT16(3), FLOAT16(4), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(10), FLOAT16(5), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(5), FLOAT16(8), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(1, 2, 4, 2, 2, 1), axis);
+}
+
+TEST(gather_elements_gpu_fp16, d233113_i233115_a2) {
+    auto& engine = get_test_engine();
+
+    auto axis = cldnn::gather_elements::gather_elements_axis::along_w;
+    auto input0 = engine.allocate_memory({ data_types::f16, format::bfwzyx, { 2, 3, 3, 1, 1, 3 } }); // data
+    auto input1 = engine.allocate_memory({ data_types::f16, format::bfwzyx, { 2, 3, 3, 1, 1, 5 } }); // indices
+
+    set_values(input0, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(5), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(9), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(7), FLOAT16(0), 
+        FLOAT16(4), FLOAT16(0), FLOAT16(4), 
+        FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(7), 
+        FLOAT16(10), FLOAT16(8), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(9), 
+        FLOAT16(2), FLOAT16(4), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(2), FLOAT16(3), 
+    });
+
+    set_values(input1, {
+        FLOAT16(0), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(2), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(1), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(1), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(2), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(0), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(0), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(2), FLOAT16(0), FLOAT16(2), 
+    });
+
+    std::vector<float> expected_results = {
+        FLOAT16(0), FLOAT16(5), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(7), FLOAT16(8), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(1), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(1), FLOAT16(2), 
+        FLOAT16(9), FLOAT16(7), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(0), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(9), FLOAT16(4), FLOAT16(0), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(5), 
+        FLOAT16(7), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(6), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(0), FLOAT16(1), 
+        FLOAT16(4), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(9), FLOAT16(5), FLOAT16(1), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(3), 
+        FLOAT16(10), FLOAT16(8), FLOAT16(3), 
+        FLOAT16(0), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(0), FLOAT16(4), FLOAT16(7), 
+        FLOAT16(7), FLOAT16(4), FLOAT16(3), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(4), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(4), FLOAT16(2), FLOAT16(10), 
+        FLOAT16(7), FLOAT16(8), FLOAT16(10), 
+        FLOAT16(6), FLOAT16(8), FLOAT16(7), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(9), 
+        FLOAT16(0), FLOAT16(2), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(4), FLOAT16(3), 
+        FLOAT16(0), FLOAT16(6), FLOAT16(8), 
+        FLOAT16(5), FLOAT16(6), FLOAT16(3), 
+    };
+
+    DoTest(engine, input0, input1, expected_results, tensor(2, 3, 3, 1, 1, 5), axis);
+}

From 477a1ae04f7412071bfa1a5416a8f672287d26e9 Mon Sep 17 00:00:00 2001
From: Ilya Lavrenov <ilya.lavrenov@intel.com>
Date: Mon, 26 Jul 2021 20:25:39 +0300
Subject: [PATCH 71/71] Fixed compilation for Android w/o PDPD (#6801)

---
 .../tests/functional/inference_engine/CMakeLists.txt       | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/inference-engine/tests/functional/inference_engine/CMakeLists.txt b/inference-engine/tests/functional/inference_engine/CMakeLists.txt
index b745a2c3cdf018..1ab76d3c7982c8 100644
--- a/inference-engine/tests/functional/inference_engine/CMakeLists.txt
+++ b/inference-engine/tests/functional/inference_engine/CMakeLists.txt
@@ -31,7 +31,11 @@ set(DEPENDENCIES
 )
 
 if (NOT NGRAPH_ONNX_IMPORT_ENABLE OR NGRAPH_USE_PROTOBUF_LITE)
-    set(EXCLUDED_SOURCE_PATHS "${CMAKE_CURRENT_SOURCE_DIR}/onnx_reader")
+    list(APPEND EXCLUDED_SOURCE_PATHS "${CMAKE_CURRENT_SOURCE_DIR}/onnx_reader")
+endif()
+
+if (NOT NGRAPH_PDPD_FRONTEND_ENABLE)
+    list(APPEND EXCLUDED_SOURCE_PATHS "${CMAKE_CURRENT_SOURCE_DIR}/pdpd_reader")
 endif()
 
 addIeTargetTest(
@@ -58,6 +62,7 @@ endif()
 if(NGRAPH_PDPD_FRONTEND_ENABLE)
     target_compile_definitions(${TARGET_NAME} PRIVATE
         PDPD_TEST_MODELS="${CMAKE_CURRENT_SOURCE_DIR}/pdpd_reader/models/")
+    add_dependencies(${TARGET_NAME} paddlepaddle_ngraph_frontend)
 endif()
 
 ie_faster_build(${TARGET_NAME}