讲到模块化区块链,数据可用性DA是一个绕不过去的主题。无论是 以太坊 大热的EIP-4844提案还是通用的DA层解决方案Celestia; Q) H2 I0 c$ d& O
8 f) s2 E0 m( H3 [8 p
, 都跟DA 有着密不可分的关系。 那DA 到底是什么呢?为什么DA 方案能提升区块链网络的性能?

; W5 o' {" C) g& g1 ~. J+ J1 S2 W* h
在讲DA 之前,我们先来思考一个问题: 怎么确保区块中包含的交易是在链上实际发生的?换种说法,在区块链网络中实际发生的交易是否被真实地包含在区块中呢? DA 即保证数据在链上可用,让区块信息能真实反映实际的链上交易情况。, b( ^- o) Q: U& g* E! K; P' W
在区块链网络中通常包含2类节点:全节点和轻客户端。
1) 全节点;下载区块中的所有数据进行验证,能够最大程度地保证DA., i/ N. Z% L7 z1 x& Q4 c
( r* O7 E- o' o( c
2)轻客户端。只下载区块头进行验证,并假设区块包含的都是有效交易。 这里存在的问题是,恶意的区块生产者可以通过构建一个包含无效交易的区块,去欺骗轻客户端。% D, @! W& ^6 X' ?! n6 M( m5 X9 v

那竟然轻客户端的安全性较差,网络中全部运行全节点不就好了吗? 理想跟现实之间的差距在于成本,运行全节点需要下载全部的区块数据(存储、带宽等要求高)。 因此,除了专业的节点运营商,普通用户没有动力去运行全节点。
那轻节客户端还有什么办法可以保证安全性呢? 聪明的开发者想到用欺诈证明解决轻客户端的安全性问题,简单来讲,与轻客户相邻的全节点可以通过发送欺诈证明,告知轻客户端区块无效。 因此,从理论上讲,轻客户端+欺诈证明能实现全节点级别的安全性(前提是至少有一个诚实全节点发送欺诈证明)。: Z8 @/ v5 ^5 w9 Z# X& L

4 C; y5 D e% k* E; h
那轻客户端的安全性问题就解决了吗?不。 原因是,恶意区块生产者可以选择扣留一部分数据不发布,此时诚实全节点会发出警告。如下图所示,区块生产者在T3 补全所有区块数据。

, z& X: O+ r3 {# [& i
因此,欺诈证明并不是有效的解决方案。 选择不发布数据不是唯一可归因错误。比如在T3 阶段,很难去证明到底是恶意区块生产者扣留了部分数据,还是检验节点的恶意误报。

那么,验证节点对恶意区块的警告行为是否因受到激励? 此时就会面临一个三难困境。 1) 如果激励为正,此时恶意验证节点可以通过发出虚假警报获利; 2) 如果激励等于0,意味着恶意验证者能零成本发起DOS 攻击; 3) 如果激励为负,可能只有为爱发电的节点才愿意做。

0 V9 p+ w( `2 w, r
说了这么多,到底有没有办法可以解决轻客户端的安全性问题?有。 就是我们接下来要讲的数据可用性抽样,即轻客户端只要随机下载一部分数据进行验证,就能确保数据的可用性。 关于DA Sampling 的底层技术实现,此推文不做深入探讨。通过一个简单的场景模拟,简单了解下它的逻辑实现。) e! y/ m" O' a& l4 W8 N
场景如下: 现在有2枚硬币:1枚两面都是数字;1枚一面是数字,另外一面是图案。 现在2枚硬币给到你,怎么确认哪枚是两面都是数字的呢?: p/ e4 |+ N0 V; d: M
5 N; y, q5 D; u4 U* F, u

其实很简单,我们只需要无差别地掷硬币记录情况即可。 如果前2次掷的都是数字,意味着这枚硬币有(1-0.5^2)的概率是2面都是数字的那枚。同样地,如果前n次掷的都是数字,此时2面都是数字的概率是(1-0.5^n). 只要重复这个过程20次,上述可能性将变成99.9999%。" }( I& _$ w0 B& S Y& w
. v+ |' T- O5 G7 s

; B- V5 R& O2 u0 ?2 Y" d) `$ o
DAS 的逻辑实现正是基于上述原理。 轻客户端无需下载所有的区块数据,只需要随机下载少量数据进行验证,就能保证数据可用性。 更直观地,如果区块的大小是4MB, 轻客户端进行随机20次1kb的数据抽样。意味着只需要下载0.5%的数据,就能够实现置信水平高达99.9999%的数据可用性。5 e% M$ l6 B, m" N+ f