[CPU] Unified memory descriptor (openvinotoolkit#6328)

andrei-cv · Aug 30, 2021 · 88d1e91 · 88d1e91
1 parent 029b418
commit 88d1e91
Show file tree

Hide file tree

Showing 129 changed files with 3,993 additions and 3,719 deletions.
diff --git a/inference-engine/include/ie_layouts.h b/inference-engine/include/ie_layouts.h
@@ -304,6 +304,14 @@ class INFERENCE_ENGINE_API_CLASS(TensorDesc) {
      */
     static Layout getLayoutByDims(const SizeVector& dims);
 
+    /**
+     * @brief Returns the standard layout for the specified tensor rank
+     *
+     * @param rank of the requested layout
+     * @return the standard memory layout
+     */
+    static Layout getLayoutByRank(size_t rank);
+
 private:
     /**
      * Memory layout

diff --git a/inference-engine/src/inference_engine/ie_layouts.cpp b/inference-engine/src/inference_engine/ie_layouts.cpp
@@ -161,8 +161,8 @@ bool TensorDesc::operator!=(const TensorDesc& rhs) const {
     return !(*this == rhs);
 }
 
-Layout TensorDesc::getLayoutByDims(const SizeVector& dims) {
-    switch (dims.size()) {
+Layout TensorDesc::getLayoutByRank(size_t rank) {
+    switch (rank) {
     case 0:
         return Layout::SCALAR;
     case 1:
@@ -180,6 +180,10 @@ Layout TensorDesc::getLayoutByDims(const SizeVector& dims) {
     }
 }
 
+Layout TensorDesc::getLayoutByDims(const SizeVector& dims) {
+    return getLayoutByRank(dims.size());
+}
+
 size_t TensorDesc::offset(const SizeVector& v) const {
     if (layout == Layout::ANY) IE_THROW() << "Cannot calculate offset for any format!";
 

diff --git a/inference-engine/src/mkldnn_plugin/cpu_blocked_memory_desc.cpp b/inference-engine/src/mkldnn_plugin/cpu_blocked_memory_desc.cpp
@@ -0,0 +1,247 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "cpu_blocked_memory_desc.h"
+#include "mkldnn_memory.h"
+#include "utils/cpu_utils.hpp"
+
+using namespace MKLDNNPlugin;
+
+BlockedMemoryDesc::BlockedMemoryDesc(InferenceEngine::Precision prc, const std::vector<size_t>& dims) : MemoryDesc(dims, Blocked) , precision(prc) {
+    order.resize(dims.size());
+    std::iota(order.begin(), order.end(), 0);
+    blockedDims = dims;
+    offsetPadding = 0;
+    offsetPaddingToData.resize(dims.size(), 0);
+    strides.resize(order.size());
+    strides[strides.size() - 1] = 1;
+    for (size_t i = 2; i <= order.size(); i++) {
+        strides[strides.size() - i] = strides[strides.size() - (i - 1)] * blockedDims[blockedDims.size() - (i - 1)];
+    }
+}
+
+BlockedMemoryDesc::BlockedMemoryDesc(InferenceEngine::Precision prc, const std::vector<size_t>& dims, const std::vector<size_t>& blockedDims,
+                  const std::vector<size_t>& order, size_t offsetPadding, const std::vector<size_t>& offsetPaddingToData,
+                  const std::vector<size_t>& strides) : MemoryDesc(dims, Blocked), precision(prc) {
+    if (std::any_of(order.begin(), order.end(), [](size_t val) { return val == Shape::UNDEFINED_DIM; })) {
+        IE_THROW() << "BlockedMemoryDesc do not support undefined order.";
+    }
+
+    if (std::any_of(blockedDims.begin() + dims.size(), blockedDims.end(), [](size_t val) { return val == Shape::UNDEFINED_DIM; })) {
+        IE_THROW() << "BlockedMemoryDesc doesn't support undefined blockedDims.";
+    }
+
+    this->order = order;
+    this->blockedDims = blockedDims;
+    this->offsetPadding = offsetPadding;
+
+    if (offsetPaddingToData.empty() && !order.empty()) {
+        this->offsetPaddingToData.resize(order.size());
+        this->offsetPaddingToData[order.size() - 1] = 0;
+        for (size_t i = 2; i <= order.size(); i++) {
+            this->offsetPaddingToData[order.size() - i] = 0;
+        }
+    } else {
+        this->offsetPaddingToData = offsetPaddingToData;
+    }
+
+    if (strides.empty() && !order.empty()) {
+        if (std::any_of(this->blockedDims.begin(), this->blockedDims.end(), [](size_t val) { return val == Shape::UNDEFINED_DIM; })) {
+            this->strides.resize(order.size(), Shape::UNDEFINED_DIM);
+        } else {
+            this->strides.resize(order.size());
+            this->strides[order.size() - 1] = 1;
+            for (size_t i = 2; i <= order.size(); i++) {
+                this->strides[order.size() - i] = this->strides[order.size() - (i - 1)] * this->blockedDims[blockedDims.size() - (i - 1)];
+            }
+        }
+    } else {
+        this->strides = strides;
+    }
+
+    if (!everyone_is(this->order.size(), this->blockedDims.size(), this->offsetPaddingToData.size(), this->strides.size())) {
+        IE_THROW() << "Order, blocked dims, offset padding to data and strides must have equals size";
+    }
+}
+
+bool BlockedMemoryDesc::isDefined() const {
+    bool defined = true;
+    defined = defined && std::none_of(blockedDims.cbegin(), blockedDims.cend(), [](size_t val) { return val == Shape::UNDEFINED_DIM; });
+    defined = defined && std::none_of(strides.cbegin(), strides.cend(), [](size_t val) { return val == Shape::UNDEFINED_DIM; });
+    defined = defined && std::none_of(order.cbegin(), order.cend(), [](size_t val) { return val == Shape::UNDEFINED_DIM; });
+    defined = defined && std::none_of(offsetPaddingToData.cbegin(), offsetPaddingToData.cend(), [](size_t val) { return val == Shape::UNDEFINED_DIM; });
+    defined = defined && offsetPadding != Shape::UNDEFINED_DIM;
+
+    return defined;
+}
+
+bool BlockedMemoryDesc::isCompatible(const MemoryDesc& rhs) const {
+    const MemoryDesc* pRhs = &rhs;
+    if (auto blockingDesc = dynamic_cast<const BlockedMemoryDesc*>(pRhs)) {
+        return isCompatible(*blockingDesc);
+    } else if (auto mkldnnDesc = dynamic_cast<const MKLDNNMemoryDesc*>(pRhs)) {
+        return mkldnnDesc->isCompatible(*this);
+    } else {
+        return false;
+    }
+}
+
+bool BlockedMemoryDesc::isCompatible(const BlockedMemoryDesc& rhs) const {
+    if (this->getShape() != rhs.getShape() || this->getPrecision() != rhs.getPrecision())
+        return false;
+
+    if (!dimsEqualWeak(this->getBlockDims(), rhs.getBlockDims())) {
+        return false;
+    }
+
+    if (!dimsEqualWeak(this->getOffsetPaddingToData(), rhs.getOffsetPaddingToData())) {
+        return false;
+    }
+
+    // this check needed to avoid inserting unnecessary reorders if the memory is used in place and the batch size is equal to 1
+    size_t skipAxis = this->getShape().getRank() > 0 && this->getShape().getDims().front() == 1 ? 0 :
+            Shape::UNDEFINED_DIM; //ignore batch axis if batch size == 1
+    if (!dimsEqualWeak(this->getStrides(), rhs.getStrides(), skipAxis)) {
+        return false;
+    }
+
+    if (!dimsEqualWeak(this->getOrder(), rhs.getOrder())) {
+        return false;
+    }
+
+    return dimsEqualWeak(this->getOffsetPadding(), rhs.getOffsetPadding());
+}
+
+bool BlockedMemoryDesc::isCompatible(const MKLDNNMemoryDesc& rhs) const {
+    return rhs.isCompatible(*this);
+}
+
+size_t BlockedMemoryDesc::getMemSizeImp() const {
+    int64_t e_size = getOffsetPadding() + 1;  // size in bytes (from begin of data to last element)
+    for (int j = 0; j < getBlockDims().size(); j++)
+        e_size += (getBlockDims()[j] - 1) * getStrides()[j];
+
+
+    e_size *= getPrecision() == InferenceEngine::Precision::BIN ? 1 : getPrecision().size();
+
+    return e_size;
+}
+
+size_t BlockedMemoryDesc::getOffset(const InferenceEngine::SizeVector& v) const {
+    InferenceEngine::SizeVector off_v = v;
+
+    size_t n_blocked_dims = order.size();
+    if (blockedDims.size() != n_blocked_dims || strides.size() != n_blocked_dims) {
+        IE_THROW() << "Cannot calculate offset. Incorrect primitive descriptor!";
+    }
+    InferenceEngine::SizeVector blockedShift(n_blocked_dims);
+    for (size_t i = 1; i <= n_blocked_dims; i++) {
+        blockedShift[n_blocked_dims - i] = off_v[order[n_blocked_dims - i]] % blockedDims[n_blocked_dims - i];
+        off_v[order[n_blocked_dims - i]] /= blockedDims[n_blocked_dims - i];
+    }
+    size_t offset = getOffsetPadding();
+    for (size_t d = 0; d < n_blocked_dims; ++d) {
+        const size_t p = blockedShift[d] + getOffsetPaddingToData()[d];
+        offset += p * strides[d];
+    }
+    return offset;
+}
+
+size_t BlockedMemoryDesc::getElementOffset(size_t elemNumber) const {
+    // TODO [DS]: rewrite to support dynamic shapes
+    auto& dims = shape.getStaticDims();
+    size_t n_dims = dims.size();
+    InferenceEngine::SizeVector pos(n_dims);
+    for (size_t rd = 1; rd <= n_dims; ++rd) {
+        const size_t d = n_dims - rd;
+        const size_t cur_dim = dims[d];
+        pos[d] = elemNumber % cur_dim;
+        elemNumber /= cur_dim;
+    }
+    return getOffset(pos);
+}
+
+bool BlockedMemoryDesc::hasLayoutType(LayoutType layoutType) const {
+    switch (layoutType) {
+        case LayoutType::ncsp:
+            return isPlainFormat();
+        case LayoutType::nspc:
+            return isTailCFormat();
+        case LayoutType::nCsp8c:
+            return isBlockedCFormat(8);
+        case LayoutType::nCsp16c:
+            return isBlockedCFormat(16);
+        default:
+            return false;
+    }
+}
+
+bool BlockedMemoryDesc::isPlainFormat() const {
+    if (shape.getRank() != order.size()) {
+        return false;
+    }
+    for (size_t i = 0; i < order.size(); ++i) {
+        if (order[i] != i) {
+            return false;
+        }
+    }
+    return true;
+}
+
+bool BlockedMemoryDesc::isBlockedCFormat(size_t blk_size) const {
+    if ((order.size() - shape.getRank()) != 1) {
+        return false;
+    }
+    for (size_t i = 0; i < order.size() - 1; ++i) {
+        if (order[i] != i) {
+            return false;
+        }
+    }
+    if (order.back() != 1) {
+        return false;
+    }
+    if (blockedDims.back() != blk_size) {
+        return false;
+    }
+    return true;
+}
+
+bool BlockedMemoryDesc::isTailCFormat() const {
+    if (shape.getRank() < 3) {
+        return false;
+    }
+    if (shape.getRank() != order.size()) {
+        return false;
+    }
+    if (!std::is_sorted(order.begin(), --order.end())) {
+        return false;
+    }
+    if (order.back() != 1) {
+        return false;
+    }
+    return true;
+}
+
+std::string BlockedMemoryDesc::serializeFormat() const {
+    std::stringstream result;
+    char startLetter = 'a';
+    std::unordered_map<size_t, size_t> mapAxisBlockSize;
+    for (size_t i = shape.getRank(); i < order.size(); ++i) {
+        mapAxisBlockSize.insert({order[i], blockedDims[i]});
+    }
+
+    for (size_t i = 0; i < shape.getRank(); ++i) {
+        char nextLetter = startLetter + order[i];
+        if (mapAxisBlockSize.count(i)) {
+            nextLetter = toupper(nextLetter);
+        }
+        result << nextLetter;
+    }
+
+    for (auto& item : mapAxisBlockSize) {
+        result << item.second << char(startLetter + item.first);
+    }
+
+    return result.str();
+}
diff --git a/inference-engine/src/mkldnn_plugin/cpu_blocked_memory_desc.h b/inference-engine/src/mkldnn_plugin/cpu_blocked_memory_desc.h
@@ -0,0 +1,100 @@
+// Copyright (C) 2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "cpu_memory_desc.h"
+
+namespace MKLDNNPlugin {
+
+class MKLDNNMemoryDesc;
+
+class BlockedMemoryDesc : public MemoryDesc {
+public:
+    BlockedMemoryDesc(InferenceEngine::Precision prc, const std::vector<size_t>& dims);
+
+    BlockedMemoryDesc(InferenceEngine::Precision prc, const std::vector<size_t>& dims, const std::vector<size_t>& blockedDims,
+                      const std::vector<size_t>& order, size_t offsetPadding = 0, const std::vector<size_t>& offsetPaddingToData = {},
+                      const std::vector<size_t>& strides = {});
+
+    MemoryDescPtr clone() const override {
+        return MKLDNNPlugin::make_unique<BlockedMemoryDesc>(*this);
+    }
+
+    bool isDefined() const override;
+
+    bool isCompatible(const MemoryDesc& rhs) const override;
+
+    bool isCompatible(const BlockedMemoryDesc& rhs) const;
+
+    bool isCompatible(const MKLDNNMemoryDesc& rhs) const;
+
+    InferenceEngine::Precision getPrecision() const override {
+        return precision;
+    }
+
+    void setPrecision(InferenceEngine::Precision prc) override {
+        precision = std::move(prc);
+    }
+
+    const std::vector<size_t>& getBlockDims() const {
+        return blockedDims;
+    }
+
+    /**
+     * @brief Returns the vector of order
+     *
+     * @return order
+     */
+    const std::vector<size_t>& getOrder() const {
+        return order;
+    }
+
+    /**
+     * @brief Returns the per-dimension offset vector
+     *
+     * @return offsets
+     */
+    const std::vector<size_t>& getOffsetPaddingToData() const {
+        return offsetPaddingToData;
+    }
+    /**
+     * @brief Returns the offset to the current memory block
+     *
+     * @return offset
+     */
+    size_t getOffsetPadding() const {
+        return offsetPadding;
+    }
+
+    /**
+     * @brief Returns strides for each dimension
+     *
+     * @return strides
+     */
+    const std::vector<size_t>& getStrides() const {
+        return strides;
+    }
+
+    bool hasLayoutType(LayoutType layoutType) const override;
+
+    std::string serializeFormat() const override;
+
+private:
+    size_t getElementOffset(size_t elemNumber) const override;
+    size_t getMemSizeImp() const override;
+    size_t getOffset(const InferenceEngine::SizeVector& v) const;
+    bool isPlainFormat() const;
+    bool isBlockedCFormat(size_t blk_size) const;
+    bool isTailCFormat() const;
+
+private:
+    InferenceEngine::Precision precision;
+    std::vector<size_t> blockedDims;
+    std::vector<size_t> strides;
+    std::vector<size_t> order;
+    std::vector<size_t> offsetPaddingToData;
+    size_t offsetPadding;
+};
+} // namespace MKLDNNPlugin