讲到模块化区块链,数据可用性DA是一个绕不过去的主题。无论是 以太坊 大热的EIP-4844提案还是通用的DA层解决方案Celestia. V3 q) v! D( E( M a1 d% v
. A, G0 @7 g9 Q) w- A3 c
, 都跟DA 有着密不可分的关系。 那DA 到底是什么呢?为什么DA 方案能提升区块链网络的性能?
![1671869579420763.jpg 1671869579420763.jpg](https://att.bitmere.com/forum/202212/25/143404gxi878lrl0r0f77z.jpg)
; B2 {, W" w: H) A
在讲DA 之前,我们先来思考一个问题: 怎么确保区块中包含的交易是在链上实际发生的?换种说法,在区块链网络中实际发生的交易是否被真实地包含在区块中呢? DA 即保证数据在链上可用,让区块信息能真实反映实际的链上交易情况。
在区块链网络中通常包含2类节点:全节点和轻客户端。
. Y" i# j1 o+ t
1) 全节点;下载区块中的所有数据进行验证,能够最大程度地保证DA.% [2 L7 r; ~. t6 V% z4 ^0 ~* k
2)轻客户端。只下载区块头进行验证,并假设区块包含的都是有效交易。 这里存在的问题是,恶意的区块生产者可以通过构建一个包含无效交易的区块,去欺骗轻客户端。
![1671869622227511.jpg 1671869622227511.jpg](https://att.bitmere.com/forum/202212/25/143404ozrvrdryvddtbs0t.jpg)
那竟然轻客户端的安全性较差,网络中全部运行全节点不就好了吗? 理想跟现实之间的差距在于成本,运行全节点需要下载全部的区块数据(存储、带宽等要求高)。 因此,除了专业的节点运营商,普通用户没有动力去运行全节点。' i1 v3 u W/ D0 T0 C
1 \* |0 f8 p8 n9 f& S+ k
那轻节客户端还有什么办法可以保证安全性呢? 聪明的开发者想到用欺诈证明解决轻客户端的安全性问题,简单来讲,与轻客户相邻的全节点可以通过发送欺诈证明,告知轻客户端区块无效。 因此,从理论上讲,轻客户端+欺诈证明能实现全节点级别的安全性(前提是至少有一个诚实全节点发送欺诈证明)。
; R7 P5 t& n' u3 ~
![1671869629264713.jpg 1671869629264713.jpg](https://att.bitmere.com/forum/202212/25/143407wj3oukjl51h3p3yk.jpg)
那轻客户端的安全性问题就解决了吗?不。 原因是,恶意区块生产者可以选择扣留一部分数据不发布,此时诚实全节点会发出警告。如下图所示,区块生产者在T3 补全所有区块数据。! K& L" V/ c7 }7 K
' ^" n% q* {; P5 H5 }+ L
![1671869636109019.jpg 1671869636109019.jpg](https://att.bitmere.com/forum/202212/25/143407cw9ewsb1z9vw119a.jpg)
- Z6 Y$ i$ l2 v/ `6 \
因此,欺诈证明并不是有效的解决方案。 选择不发布数据不是唯一可归因错误。比如在T3 阶段,很难去证明到底是恶意区块生产者扣留了部分数据,还是检验节点的恶意误报。
![1671869642619825.jpg 1671869642619825.jpg](https://att.bitmere.com/forum/202212/25/143408a9udpa7f7zzz96f0.jpg)
那么,验证节点对恶意区块的警告行为是否因受到激励? 此时就会面临一个三难困境。 1) 如果激励为正,此时恶意验证节点可以通过发出虚假警报获利; 2) 如果激励等于0,意味着恶意验证者能零成本发起DOS 攻击; 3) 如果激励为负,可能只有为爱发电的节点才愿意做。3 s0 A% K% I( Q7 R. I6 C
![1671869650780740.jpg 1671869650780740.jpg](https://att.bitmere.com/forum/202212/25/143408gu0xzb3bsvszxcvq.jpg)
1 Z0 j# Q$ E4 h4 K4 d# T E {
说了这么多,到底有没有办法可以解决轻客户端的安全性问题?有。 就是我们接下来要讲的数据可用性抽样,即轻客户端只要随机下载一部分数据进行验证,就能确保数据的可用性。 关于DA Sampling 的底层技术实现,此推文不做深入探讨。通过一个简单的场景模拟,简单了解下它的逻辑实现。+ S- w0 a, }$ C! P+ T. | j
' |* E% x7 l. n) D/ E7 M5 ^5 k
场景如下: 现在有2枚硬币:1枚两面都是数字;1枚一面是数字,另外一面是图案。 现在2枚硬币给到你,怎么确认哪枚是两面都是数字的呢?
![1671869661737029.jpg 1671869661737029.jpg](https://att.bitmere.com/forum/202212/25/143413ionnvu2bkppl48np.jpg)
其实很简单,我们只需要无差别地掷硬币记录情况即可。 如果前2次掷的都是数字,意味着这枚硬币有(1-0.5^2)的概率是2面都是数字的那枚。同样地,如果前n次掷的都是数字,此时2面都是数字的概率是(1-0.5^n). 只要重复这个过程20次,上述可能性将变成99.9999%。/ G) B9 }8 V) c! y' u( S. k' ?: W
![1671869668022217.jpg 1671869668022217.jpg](https://att.bitmere.com/forum/202212/25/143413s1hzw4vh1419ezew.jpg)
DAS 的逻辑实现正是基于上述原理。 轻客户端无需下载所有的区块数据,只需要随机下载少量数据进行验证,就能保证数据可用性。 更直观地,如果区块的大小是4MB, 轻客户端进行随机20次1kb的数据抽样。意味着只需要下载0.5%的数据,就能够实现置信水平高达99.9999%的数据可用性。' U8 h" o8 Z2 g1 C( V+ Z# K