技术分享——Vite存储层设计详解之stateDB系统设计
一身似水厝
发表于 2022-11-5 17:15:40
123
0
0
* G: N& X+ a b, g# G) a2 S
1.key设计
不管是账户余额还是合约都有唯一的地址,因此可以以地址为key来做空间划分,对于同一个地址的访问更容易实现更高的读写效率。另外为了区分不同数据类型,在地址的前面会有一个字节用来标记key对应的是账户余额还是合约状态,以及其他预定义的数据类型。" y1 r" o+ ^' w7 x; \% M3 r* i
! `" ~7 |% g; g* N. l2 h3 m
stateDB key的具体实现如上图示
key type:key的类型,用来区分账户余额,合约状态,账户余额历史,合约状态历史等
address:状态所属的普通地址或合约地址
user key:对除了账户余额外的其他key type有效4 X+ C+ n7 c5 h% A6 F* x9 P- k
version/sb height:通过快照高度来区分不同版本的状态
2.高度回滚$ R1 u2 |0 A7 U
因为stateDB支持多版本的数据,因此可以实现对历史数据的遍历,这里只保留一个高度窗口内的多个数据版本,满足回滚的需求,同时也能避免数据过度膨胀。" H. ^( g3 o& W5 m+ W9 Y
由于只存储了历史快照数据,没有存储用户在两次快照之间的数据变动的细节信息,所以假如没有引入其他的机制,在数据回滚时,只能回滚到数据的某个历史快照状态,无法回滚到两个快照之间的某个细节状态。举个例子,假如在快照块高度为10000时,用户A1拥有数据k1=v1,在快照块高度为10001时,用户A1的数据变更为k1=v3,假设在快照高度为10000之后,k1的值变换了两次,从v1变化到了v3(v1->v2->v3),这表明在快照块10000与10001之间,用户A1产生了多于1个account block(一个account block会导致一个用户的数据集合发生原子变更),而stateDB只记录了快照块高度为10000和快照块高度为10001是用户A1的两个版本的数据,不会记录两个快照之间的account block产生的数据变动的细节信息,因而在发生数据回滚时,只能回滚到某个历史快照的数据状态。为了解决这个问题,引入了state redo机制,state redo中记录了最近写入的account block产生的数据变化的细节信息,那么在发生较近的数据回滚时,可以回滚到某个account block出现后的数据版本。但是如果发生较远的数据回滚时(如回滚了5000个快照块,实践中这样回滚的概率非常小),state redo机制就不起作用了,启动兜底方案,即只回滚到历史的快照数据版本,同时回滚这个快照块之后的所有account block。# E3 b" y) l" C# I* O/ n
8 b: A7 K1 G4 r4 L" \
3.缓存9 U0 _$ \% y3 [7 l2 Y
合约的更新操作并不会直接写入底层存储,而是会把操作本身依序记录在内存的unsaved数据结构,待合约执行成功后,通过redo操作记录写入stateDB,这个过程和accountBlock写入blockDB是作为一个整体进行操作的。
stateDB为最近读写入的账户余额、内置合约的状态及外置合约的元数据这些常用的数据建立了缓存,方便进行快速的读取。
成为第一个吐槽的人