# 面向 Web2 工程师的 Web3 入门

此文面向 Web2 工程师，介绍以区块链技术为核心的 Web3 相关知识。

## 区块链矿工

Web3 世界言必称“去中心化、分布式、防篡改、抗审查”，其技术核心就是区块链（Blockchain）。

区块链本身的技术原理很简单，身为技术人员，只需要掌握如下知识点：

1. 单向链表: 每一个节点都有一个指向下一个节点的指针，新的节点会被加到链表的尾部。
2. Hash: 一种将任意长度的数据映射为固定长度的数据的方法，可用于数据的校验。

#### Merkle Tree

Hash 虽然已经足以保证数据的完整性，但是当原始数据量较大时，任何更新和校验都需要重算整个数据的 Hash 值，这样效率很低。

而 Merkle Tree 通过将原始数据切片，从而实现高效的部分校验和更新。

![](https://s3.laisky.com/uploads/2024/06/Merkle%20tree.png)

好了，你已经足够了解区块链了😂

![](https://s3.laisky.com/uploads/2024/05/What-Is-Blockchain-Infographic.jpg)

### inside BTC

说起取款链很多人第一反应都是 Bitcoin。Bitcoin 是一种数字货币，而数字货币的具体实现就是：交易。

而这也正是区块链上每一个区块的核心：存储交易记录。

![](https://s3.laisky.com/uploads/2024/05/bitcoin_block_overview.jpeg)

### 矿工与交易者

Web3 和 Web2 世界最大的区别，就是 Web3 中并不会有一个中心化的服务器负责运行整个网络。

Web3 的网络，以区中心分布式节点的方式，运行于世界各地。负责运行这些节点的，就是矿工。

矿工的核心职责，除了维持网络的正常运行和通讯外，最重要的就是尽快响应交易者发来的交易请求，将其打包为新的区块，添加到区块链头部。

### Network Protocol

每一个矿工运行的都是相同的代码，他们互相间是完全对等的（此处暂不考虑质押的情形）。
矿工们所运行的同质化的代码，也就是这个区块链网络的 Protocol。

这个 Protocol 中会详细地定义如何处理交易、如何将交易打包为区块、如何广播区块、如何校验区块、以及如何激励矿工。

比如 BTC 的 protocol 定义，矿工可以在新生成的区块中，通过创建 coinbase trasaction 为自己的账户凭空转入一笔 BTC，这也就是人们俗称的“挖到矿了”。

![](https://s3.laisky.com/uploads/2024/06/coinbase.png)

### 矿工们的竞争

为了尽可能获取更多的利益，矿工们都希望区块链网络能够接受自己的区块作为新的区块链头部。

所以矿工尽可能快和多的打包交易，生成新的区块，然后将这个区块尽可能广的散播出去，如果这个区块被广为接受成为取款链头部的新区块，这名矿工就可以获取挖出新区块所附带的奖励。

当某一个矿工接收到其他矿工发来的区块时，它会根据 Protocol 的规则校验这个区块，如果校验通过，那么它知道自己在本轮竞争中已经落后了。它最明智的选择就是立即停止当前的工作，将收到的区块添加到头部，同时尽最大可能将这个区块广播出去，然后开始新一轮的竞争。

### 分叉

每个矿工都在自顾自的生成自己的区块，然后将其广播出去。即时所有的矿工都是诚实的，由于网络的延迟，还是有可能在不同的区域，有不同的区块都被各自隔阂的矿工们接受成为了新的区块链头部。此时，我们就称网络出现了分叉（Fork）。

这种情况类似于分布式系统中的脑裂（Split Brain）。这种情况不会持续太久，对区块链历史存在歧义的矿工终将相遇，根据 BTC Protocol 的规定，历史最长的链将被认为是正确的链，其他的分叉会被抛弃。那些不幸选择了错误分叉的矿工，相当于白白浪费了自己的算力。

### PoW

既然每生成一个新区块都可以给自己发奖励，那么矿工们肯定会倾向于疯狂生成新的区块。

在 BTC 的协议中也考虑到了这一点，它通过调整挖矿 PoW 的难度，来让区块的生成速率保持在 10 分钟一个。

1992 年的论文 'Pricing via Processing or Combatting Junk Mail' 最早提及了 PoW 的思想。

PoW 的想法最早被应用于反垃圾邮件领域，简而言之，要想保持匿名性的同时防止滥用，最简单的方式就提高发送者的成本。

比如我要求每个发信者，必须在邮件正文以外，再提供一个 nonce 值。且这个 nonce 值需要满足，hash(content + nonce) 的前缀有 N 个 0。

这样，通过约定 N 的大小，就可以控制发送邮件的成本，从而防止滥用。

在 BTC 的每一个区块的 header 中，就存在这么一个 nonce 值。矿工们通过生成这个 nonce 值，使得整个区块的 hash 值满足一定的条件，从而使这个区块能够通过其他节点的校验。

所以 BTC 中的每一个区块，都是在当时历史条件下，一定量算力（十分钟）的证明。前文提到遇到分叉时会选择历史最长的链，这句话其实不正确，准确的说，是选择历史算力最大的链。

#### 51% Attack

通过 PoW 和基于哈希的链表，区块链提供了一种去中心化的信任机制。

但其也不是完全可靠的，如果有人控制了超过全网 51% 的算力，那么他就可以生成任意的区块，并且让这个区块成为网络中的最长链，从而迫使其他节点接受这个链。

### 共识与拜占庭问题

在 Web2 领域，可以使用 RAFT 协议可以用来解决分布式共识。RAFT 的核心在于选主，只有 leader 可以写入数据。而各个节点参与选主的依据，就是自己所持有的数据长度和 term 的大小。

但是 Web2 领域面临的是非拜占庭问题，主要的问题来自于网络的不可靠。而 Web3 领域面临的是拜占庭问题，即每一个节点都可能是恶意的，会提供假数据。

所以无论是 BTC 还是 Ethereum，生成新区块前不需要选主，而是每个节点各自生成新区块，然后通过竞争去抢占合并入链的机会。

### 虚假的分布式与吞吐瓶颈

虽然区块链到处吹嘘去中心化分布式，尤其 Ethereum 还经常自称世界计算机。但实际上，从技术的角度来说，目前的主流区块链的计算能力是很原始和低下的。

虽然每一个节点都是分布式的并行运算，但是它们都是在竞争唯一一个区块上链的份额。所以从最终的链的角度来看，根本不存在任何的并行，有的只是完全串行化的交易记录。

也就是说，目前的区块链网络，无论有多少节点在运行，其真实的计算能力，只有一个独占的线程。而且这个线程没有任何并发，没有任何形式的资源竞争，只有完全序列化的计算。

<video width="960" height="540" controls>
  <source src="https://s3.laisky.com/uploads/2024/06/The%20hyper%20parallel%20computer%20launches%20right%20now.mp4" type="video/mp4">
Your browser does not support the video tag.
</video>

## 钱包与交易者

前文谈论的都是较为底层的 blockchain network protocol 和矿工。

而大部分用户实际上是不需要和这些底层的东西打交道的。每一个 blockchain network，我们称之为 Layer-1 chain，都会定义至少一种 token，用户设立激励机制，维持网络的运转。比如 Bitcoin 网络的 BTC，Ethereum 网络的 ETH。

交易者在 Layer-1 chain 上的任何操作，都需要支付一定量的 token 作为手续费。这颗手续费的去向由 Protocol 规定，可能一部分归矿工，一部分焚毁（burn），一部分收归基建基金。

### 钱包

前文提到，区块链上的每一个区块都是存储交易记录的。而这些交易记录，就是用户在 Layer-1 chain 上的操作。所有的这些操作，如果涉及到资产，那么都需要这个资产的所有者使用自己的私钥签名。

所谓的钱包，其实就是一个管理用户私钥的工具。通过私钥可以生成公钥，而钱包地址，往往就是公钥的哈希值。

所以这些虚拟货币实际上并没有“保存”在钱包里，而是以交易记录的形式存在于区块链的历史记录之中，交易者通过钱包内的私钥，来行使对这些资产的所有权。

![](https://s3.laisky.com/uploads/2024/06/btc-privkey.png)

### 冷钱包与热钱包

每一个私钥，就对应一个钱包地址，也就是区块链上的一个账户。

可以利用简单的几行代码批量生成大量的随机私钥，一般来说一个链上总共允许有 2^256 个账户，远远多于宇宙中离子的数量，基本是无需担心别人恰好碰撞出了你的私钥地址。

私钥决定了所有资产的所有权，所以一定要妥善保管。但是链上的一切操作都需要使用私钥签名，越频繁使用的东西越难保密。所以为了增强安全性，我们会将私钥分类为冷钱包和热钱包。

大量的核心资产，存放在冷钱包中，冷钱包的私钥一般离线存储于安全的地方，如保险箱里的手抄纸，或者固件加密的硬件钱包。而少量频繁操作的资产存放在热钱包中，热钱包的私钥暴露风险会更高一些，但是因为资产量少，损失也会更小。

### 地址与隐私

虽然区块链号称去中心化和匿名，但其实追查资金的流向和身份是一件比传统金融系统更容易的事情，也很难保护用户隐私。

链上的每一笔交易都是公开透明的，可以轻易地追查每一笔资金的流向。所以用户最好常备多个地址，避免让交易地址和提币地址间产生明显的关联。

解除资金关联的的方式一般是通过交易所或混币所。利用交易所提币可以让交易对外人不可见，仅有交易所能够关联你的地址。利用混币所则是可以对所有人都不可见，但是需要支付更高的手续费。

混币所和交易所的核心原理是一致的，就是将很多人的资产汇合进一个地址，再分别转给各自的收款地址，让外人难以追踪每一笔资金的具体流向。

### 账本与交易

虽然交易都记录在区块上，但是不同的协议，记载交易的具体形式仍然存在很大区别。目前最主流的两种交易形式就是 UTXO 和 Account。

#### Account Model

Ethereum 和传统金融（如银行）都采用账户模式，也就是在持久化的数据中，存储账户和余额。这样做的优点是实现简单，但是要追踪每一笔钱的去向就变得比较困难。

比如如果一个内鬼悄悄篡改了某个账户的余额，那么这个账户的所有者是很难察觉的。只能通过频繁和繁复的对账，去监控金额的不一致性。

#### UTXO Model

BTC 采用的是 Unspent Transaction Outputs（UTXOs）模式，每个地址下记录的是尚未消费的入账记录（UTXO），每一个 UTXO 都包含一个金额和其源自的交易（Transaction ID）。

每一个交易都由若干个 inputs 和 outputs 组成，其中 inputs 就是付款方支付的 UTXOs，outputs 就是收款方收到的 UTXOs。
每一笔交易都会销毁输入的 UTXOs 同时诞生一些新的输出的 UTXOs。通过回溯交易历史，每个 UTXO 最终可以追溯到其由矿工挖出时产生的 coinbase 交易（coinbase transaction）。

![](https://s3.laisky.com/uploads/2024/06/btc-utxo.png)

BTC 的每一笔交易的转账费用也通过其中所包含的 UTXO 数量来确定。

因此，作为私人钱包管理者，应该尽量避免持有大量小额 UTXO。
在网络转账费较低的时候，可以通过将小额 UTXO 批量转账给自己的方式，以较低成本将其融合成一个大额的 UTXO。

如果一个 UTXO 的面额小于转账所需的费用，那么这个 UTXO 实际上已经失去了价值，被称为比特币尘埃（bitcoin dust）。

#### Ordinals & Rare Sats

正因为 BTC 采用了 UTXO 而非账本模式，所以实际上 BTC 并不是严格意义上的 FT（Fungible Token）。
每一个 BTC 之间实际上是有区别的，每一个 BTC 都可以回溯到最初的被挖出矿时的 coinbase transaction 的第 n 笔 output。

BTC 的最小单位被称为 Satoshi，1 BTC = 100,000,000 Satoshi，简称为 Sats。通过 UTXO，每一个 Sats 都是独一无二的来源。

根据其来源，可以将 Sats 按照稀有度分类:

![](https://s3.laisky.com/uploads/2024/06/btc-sats-rare.png)

#### Runes & Inscription

BTC 除了可以通过 UTXO 来建议唯一性外，还可以通过其他的一些技术手段来为 BTC 增加一些特殊的属性。
BTC 允许在交易中携带一些和交易无关的自定义数据，根据这些数据不同的存放位置，可将其称为 Runes（符文） 和 Inscription（铭文）。

* Runes: 将自定义数据通过 OP_CODE 存放在交易的 output 中，数据量较小。
* Inscription: 将自定义数据存放在 SegWit 存放在交易的 witness 中，完整性由 segwit 保证，不影响 merkel root，数据量较大。

![](https://s3.laisky.com/uploads/2024/06/ad66bc64-ordinals-12.png)

*Inscription 是 BRC-20 的技术基础*

## Smart Contract