# merkle承诺

其实merkle承诺的概念相对比较清晰和直接，众所周知的比特币、以太坊等区块链的区块头就是不断生成新的merkle root，提交到区块中，就是所谓的merkle commit，其它的例子还有Filecoin将扇区按32字节一个node，每个32G扇区都会最终提交一个comm_r到区块链中，zcash、tornado cash等零币或者混币的应用中，也会生成凭据的merkle root到区块链里，以便后续消费该凭据处理。这里有一个概念需要澄清，有人说用merkle 承诺可以压缩数据，这是不精确的，首先在后续验证环节，需要同时提交相应的merkle path，这也是一个很大的开销，要么已经保持存到某个位置，要么需要临时计算，例如在Filecoin中，会保存每一层的merkle path在本地文件系统中，其次由于hash是单向的，虽然可以把任意字节信息映射到256位空间，但无法复原，因此不是真正意义上的压缩，只是提供了零知识证明中的succinct特性。<br>

merkle承诺配套需要提供一个hash函数，常用的有sha256，或者sha3等. <br>
同样在stark101中的有一个Merkle 实现 https://github.com/starkware-industries/stark101 <br>
以下只给出核心代码实现，完整代码可以参考原文链接


In [1]:
class MerkleTree(object):
    """
    A simple and naive implementation of an immutable Merkle tree.
    """

    def __init__(self, data):
        assert isinstance(data, list)
        assert len(data) > 0, 'Cannot construct an empty Merkle Tree.'
        num_leaves = 2 ** ceil(log2(len(data)))
        self.data = data + [FieldElement(0)] * (num_leaves - len(data))
        self.height = int(log2(num_leaves))
        self.facts = {}
        self.root = self.build_tree()

    def build_tree(self):
        return self.recursive_build_tree(1)

    def recursive_build_tree(self, node_id):
        if node_id >= len(self.data):
            # A leaf.
            id_in_data = node_id - len(self.data)
            leaf_data = str(self.data[id_in_data])
            h = sha256(leaf_data.encode()).hexdigest()
            self.facts[h] = leaf_data
            return h
        else:
            # An internal node.
            left = self.recursive_build_tree(node_id * 2)
            right = self.recursive_build_tree(node_id * 2 + 1)
            h = sha256((left + right).encode()).hexdigest()
            self.facts[h] = (left, right)
            return h


从密码学承诺的角度来看，merkle树是哈希承诺+树结构的组合，是哈希承诺的变种，同样基于哈希函数的不可逆，随机唯一性等性质来保证满足密码学承诺的性质：

绑定性（binding）：树root是叶子节点集合的承诺，一但公开便不能更改叶子集合。

隐藏性（hiding）：由于在承诺阶段只公布root，不会暴露原始叶子节点信息，在披露打开阶段，只公开路径上哈希值，也不会暴露其他叶子节点信息。

Merkle树如果说有其不足之处的话，当叶子节点的数量级非常大，树层级数变多，在打开验证节点需要的merkle树证明路径也就越长，数据量就越大
![image.png](attachment:image.png)

其主要特点为：

最下面的叶子节点包含存储数据(或哈希值),非叶子节点（包括中间节点和根节点）都是它的两个孩子节点内容的哈希值。
默克尔树逐层记录哈希值的特点，让它具有了一些独特的性质。例如，底层数据的任何变动，都会传递到其父节点，一层层沿着路径一直到树root。这意味root根的值实际上代表了对底层所有数据的“数字摘要”。
进一步地，默克尔树可以推广到多叉树的情形，此时非叶子节点的内容为它所有的孩子节点的内容的哈希值。


有意思的是，merkle承诺可以用在